Текст
                    Московский государственный университет имени М.В. Ломоносова
В.А. Ильин, Г.Д. Ким
ЛИНЕЙНАЯ АЛГЕБРА
И
АНАЛИТИЧЕСКАЯ ГЕОМЕТРИЯ
УЧЕБНИК
3-е издание,
переработанное н дополненное
Учебник удостоен премии Президента Российской Федерации
в области образования
Издательство Проспект
Издательство Московского университета
2007

УДК [512.8+516.0](075.8) ББК 22.12я73 И45 Рецензенты: академик РАН С. М. Никольский, академик РАН В. В. Воеводин Ильин В. А., Ким Г. Д. И45 Линейная алгебра и аналитическая геометрия : учеб. - 3-е изд., пе- рераб. и доп. - М.: ТК Велби, Изд-во Проспект, 2007. - 400 с. ISBN-10 5-482-01216-6 ISBN-13 978-5-482-01216-1 Книга представляет собой учебник по объединенному курсу линейной алгебры и аналитической геометрии, в основу которого легли лекции, читавшиеся авторами в Московском государственном университете им. М. В. Ломоносова. В изложении материала, вполне традиционного по своей тематике, авторы придерживаются тен- денции объединения двух математических дисциплин в одну, добиваясь лаконично- сти геометрических доказательств и наглядности алгебраических абстракций. Наряду с традиционными темами книга содержит сведения из общей алгебры, эле- менты теории множеств, метрических и нормированных пространств. Особое вни- мание уделяется вычислительным аспектам алгебраических методов. Для студентов университетов и вузов, обучающихся по специальностям «Мате- матика», «Прикладная математика», «Информатика». УДК [512.8+516.0](075.8) ББК 22.12я73 Учебное издание Ильин Владимир Александрович, Ким Галина Динховна ЛИНЕЙНАЯ АЛГЕБРА И АНАЛИТИЧЕСКАЯ ГЕОМЕТРИЯ Учебник Художественное оформление серии выполнено Издательством Московского университета и Издательством Проспект по заказу Московского университета. Подписано в печать 01.10.06. Формат 60 х 90 Печать офсетная. Печ. л. 25,0. Тираж 3000 эка. Заказ № 2300. ООО *ТК Велби» 107120, г. Москва, Хлебников пер., д. 7, стр. 2. Отпечатано в полном соответствии с качеством предоставленных диапозитивов в ОАО «Тверской ордена Трудового Красного Знамени полиграфкомбинат детской литературы им. 50-летия СССР*. 170040, г. Тверь, проспект 50 лет Октября, 46. £ 0 В. А. Ильин, Г. Д. Ким, 2007 © ООО «Издательство Проспект». 2007 ISBN-10 5-482-01216-6 © МГУ им. М. В. Ломоносова, художественное 1SBN-13 978-5-482-01216-1 оформление, 2007
Предисловие Уважаемый читатель! Вы открыли одну из книг, изданных в серии «Классический уни- верситетский учебник», посвященной 250-летию Московского уни- верситета. Серия включает свыше 250 учебников и учебных посо- бий, рекомендованных к изданию Учеными советами факультетов, редакционным советом серии и издаваемых к юбилею по решению Ученого совета МГУ. Московский университет всегда славился своими профессорами и преподавателями, воспитавшими не одно поколение студентов, впоследствии внесших заметный вклад в развитие нашей страны, составивших гордость отечественной и мировой науки, культуры и образования. Высокий уровень образования, которое дает Московский универ- ситет, в первую очередь обеспечивается высоким уровнем написан- ных выдающимися учеными и педагогами учебников и учебных по- собий, в которых сочетаются как глубина, так и доступность изла- гаемого материала. В этих книгах аккумулируется бесценный опыт методики и методологии преподавания, который становится достоя- нием не только Московского университета, но и других университе- тов России и всего мира. Издание серии «Классический университетский учебник» нагляд- но демонстрирует тот вклад, который вносит Московский универси- тет в классическое университетское образование в нашей стране и, несомненно, служит его развитию. Решение этой благородной задачи было бы невозможным без активной помощи со стороны издательств, принявших участие в из- дании книг серии «Классический университетский учебник». Мы рас- цениваем это как поддержку ими позиции, которую занимает Мос- ковский университет в вопросах науки и образования. Это служит также свидетельством того, что 250-летний юбилей Московского университета — выдающееся событие в жизни всей нашей страны, мирового образовательного сообщества. £ьао Ректор Московского университета ’ академик РАН, профессор В. А. Садовничий
ОГЛАВЛЕНИЕ Предисловие............................................. 12 Предисловие к третьему изданию.......................... 13 Литература.............................................. 14 Глава I. Матрицы........................................ 15 § 1. Понятие матрицы................................. 15 Терминология и обозначения. Компактная форма записи матрицы. Матрицы специального вида §2, Операции над матрицами............................ 18 Равенство матриц. Линейные операции. Умножение матриц. Транспонирование матрицы. Некоторые свой- ства операций §3 . Элементарные преобразования матриц.............. 22 Приведение матрицы к ступенчатой форме. Приведение к трапециевидной форме. Приведение к треугольной форме. Матрицы элементарных преобразований §4 . Определители.................................... 25 Перестановки. Построение определителя п-го порядка. Простейшие свойства определителя. Миноры и алгебра- ические дополнения. Теорема Лапласа. Разложение опре- делителя по строке (столбцу). Определитель квазитре- уголъной матрицы. Вычисление определителя §5 . Обратная матрица................................ 36 Условие обратимости. Некоторые свойства обратной ма- трицы. Вычисление обратной матрицы. Приведение к диа- гональной форме. Ш-разложение матрицы Глава II. Теоретико-множественные понятия............... 42 §6 . Множества....................................... 42 § 7. Эквивалентность................................. 43 Бинарное отношение. Отношение эквивалентности § 8. Отображения..................................... 46 Определение, простейшие свойства. Произведение отобра- жений. Обратное отображение. Перестановки (подста- новки) п-го порядка § 9. Алгебраические законы........................... 50 Внутренний закон композиции. Обобщенная ассоциатив- ность. Внешний закон композиции
Оглавление 5 Глава III. Геометрические векторы....................... 54 § 10 , Направленные отрезки............................. 55 § 11. Свободный вектор.................................. 57 Определение и терминология. Линейные операции над век- торами § 12. Векторы на прямой, на плоскости и в пространстве.. 60 Глава IV. Введение в теорию линейных пространств........ 62 § 13. Вещественное линейное пространство................ 62 Определение. Примеры. Простейшие свойства линейных пространств § 14. Линейная зависимость.............................. 65 § 15. Геометрический смысл линейной зависимости......... 68 § 16. Ранг матрицы...................................... 70 Ранг матрицы и линейная зависимость. Ранг матрицы и элементарные преобразования. Метод Гаусса вычисления ранга. Эквивалентные матрицы. Скелетное разложение матрицы § 17. Базис и размерность............................... 76 Определения. Примеры. Координаты вектора. Переход к другому базису § 18. Линейное подпространство и линейное многообразие.. 80 Линейное подпространство. Линейное аффинное много- образие Глава V. Векторная алгебра.............................. 83 § 19. Координаты вектора................................ 83 § 20. Координаты точки.................................. 84 Аффинная система координат. Деление отрезка в данном отношении. Прямоугольные координаты §21. Проекции вектора и координаты...................... 86 Проекции вектора на плоскости. Проекции вектора в пространстве § 22. Скалярное произведение............................ 88 Определение и основные свойства. Скалярное произведение в координатах §23. Векторное и смешанное произведения................ 91 Ориентация в вещественном линейном пространстве. Определения и основные свойства. Векторное и смешанное произведения в прямоугольных координатах § 24. Преобразование координат.......................... 95 Преобразование аффинной системы координат. Ортого- нальная матрица. Преобразование прямоугольной декарто- вой системы координат на плоскости. Преобразование пря- моугольной декартовой системы координат в простран- стве
6 Оглавление § 25. Полярные координаты............................101 Полярные координаты на плоскости. Полярные координа- ты в пространстве Глава VI. Системы линейных алгебраических уравнений 104 § 26. Постановка задачи................................104 Терминология. Компактная записи системы. Эквивалент- ность систем § 27. Системы с квадратной невырожденной матрицей. Правило Крамера............................................105 § 28. Системы общего вида..............................106 Совместность системы. Схема исследования совместной системы. Общее решение системы. Однородные системы § 29. Метод Гаусса исследования и решения систем......109 Системы с трапециевидной матрицей. Элементарные преобразования системы уравнений. Приведение системы общего вида к системе с верхней трапециевидной матри- цей § 30. Геометрические свойства решений системы..........112 Линейное подпространство решений однородной системы. Общее решение однородной системы. Линейное многообра- зие решений неоднородной системы. Общее решение неод- нородной системы Глава VII. Алгебраические линии и поверхности первого порядка......................................116 § 31. Понятие об уравнениях линии и поверхности........116 § 32. Уравнения прямой на плоскости и плоскости в пространстве....................................117 Канонические уравнения. Параметрические уравнения. Об- щие уравнения. Уравнения в отрезках. Векторные уравне- ния § 33. Взаимное расположение прямых на плоскости (плоскостей в пространстве).............................................123 Взаимное расположение двух прямых (плоскостей). Пучок прямых (плоскостей) § 34. Полуплоскости и полупространства...................126 §35. Прямая на плоскости (плоскость в пространстве) в прямо- угольной декартовой системе координат.....................128 Расстояние от точки до прямой (до плоскости). Угол между прямыми (между плоскостями) §36. Прямая в пространстве..............................129 Уравнения прямой. Взаимное расположение двух прямых в пространстве. Взаимное расположение прямой и плос- кости. Метрические задачи в прямоугольной декартовой системе координат Глава Vin. Элементы общей алгебры.................135 §37. Группа......................................135
Оглавление 7 § 38. Подгруппа.......................................137 Определение. Примеры. Группа невырожденных верхних (нижних) треугольных матриц. Группа ортогональных матриц. Произведение подмножеств группы. Смежные классы § 39. Конечная группа.................................140 Основные свойства. Симметрическая группа п-го порядка. Знакопеременная группа п-го порядка. Циклическая группа. Порядок элемента § 40. Нормальный делитель.............................144 Определение и свойства. Фактор-группа. Группа вычетов по модулю р § 41. Морфизмы групп..................................145 Изоморфизм. Гомоморфизм § 42. Кольцо..........................................148 Определение, простейшие свойства. Делители нуля. Коль- цо вычетов. Подкольцо §43. Поле............................................151 Определение, простейшие свойства. Расширение поля. Изоморфизм колец и полей. Характеристика поля. Поле вычетов Глава IX. Комплексные числа............................156 § 44. Поле комплексных чисел...........................156 Понятие комплексного числа. Алгебраическая форма ком- плексного числа. Комплексная плоскость. Сопряженная матрица § 45. Тригонометрическая форма комплексного числа.....159 § 46. Возведение в степень и извлечение корня.........162 Возведение в степень. Извлечение корня. Геометрическая интерпретация корней. Группа корней п-й степени из еди- ницы Глава X. Многочлены над произвольным полем.............165 § 47. Кольцо многочленов..............................165 § 48. Деление многочленов.............................168 §49. Корни многочленов...............................170 § 50. Каноническое разложение многочлена над полем комплекс- ных чисел............................................174 §51. Многочлены над полем вещественных чисел.........177 Глава XI. Алгебраические линии второго порядка на плоскости.............................................180 § 52. Эллипс..........................................180 Каноническое уравнение. Директориалъное свойство § 53. Гипербола.......................................184 Каноническое уравнение. Директориалъное свойство
8 Оглавление § 54. Парабола..........................................187 Каноническое уравнение §55. Касательные к эллипсу, гиперболе и параболе.......189 § 56. Оптические свойства эллипса, гиперболы и параболы.190 § 57. Полярные уравнения эллипса, гиперболы и параболы..192 § 58. Общее уравнение линии второго порядка.............193 Компактная запись общего уравнения. Характеристиче- ский многочлен. Преобразования общего уравнения. Метод вращений § 59. Классификация линий второго порядка на плоскости...200 Канонические уравнения. Метод Лагранжа Глава XII. Линейное пространство над произвольным полем...................................................207 § 60. Определение и терминология.......................207 Примеры. Точки в линейном пространстве §61. Линейная зависимость. Ранг и база системы векторов.210 §62. Базис и размерность..............................211 §63. Изоморфизм линейных пространств..................213 §64. Линейные подпространства. Линейная оболочка......214 §65. Сумма и пересечение линейных подпространств......216 §66. Прямая сумма подпространств......................218 Критерии прямой суммы. Дополнительное подпростран- ство § 67. Линейное аффинное многообразие.........;.........220 Параллельные многообразия. Пересечение многообразий. Фактор-пространство Глава XIII. Евклидовы и унитарные пространства............224 § 68. Скалярное произведение...........................224 § 69. Основные метрические понятия.....................226 § 70. Ортогональные векторы............................228 Ортонормированный базис. Процесс ортогонализации. Ортогональная (унитарная) матрица. QR-разложение. Теорема Пифагора и ее обобщение § 71. Матрица Грама......................................232 § 72. Ортогональное дополнение...........................233 Задача о перпендикуляре. Решение задачи о перпендикуляре § 73. Линейное аффинное многообразие в евклидовом (унитар- ном) пространстве.......................................236 §74. Расстояние в евклидовом (унитарном) пространстве.237 § 75. Изометрия........................................239 Глава XIV. Линейные операторы...........................240 § 76. Определение и простейшие свойства................240 Терминология, примеры. Задание линейного оператора
Оглавление 9 § 77. Матрица линейного оператора......................242 Построение матрицы линейного оператора. Координаты вектора и его образа. Матрицы оператора в различных ба- зисах § 78. Линейное пространство операторов..................244 § 79. Умножение линейных операторов.....................245 §80. Образ и ядро линейного оператора..................246 §81. Линейные формы.....................................248 Определение и свойства. Линейные формы и гиперплос- кость Сопряженное пространство. Специальное пред- ставление линейной формы в евклидовом (унитарном) пространстве § 82. Алгебра линейных операторов, действующих в одном прос- транстве .........................................250 § 83. Обратный оператор................................251 Глава XV. Структура линейного оператора в комплекс- ном пространстве......................................254 §84. Инвариантные подпространства.....................254 Примеры. Индуцированный оператор § 85. Собственные значения и собственные векторы.......256 § 86. Характеристический многочлен.....................257 Определение, основные свойства. Собственные векторы линейного оператора в комплексном пространстве. Способ нахождения собственных векторов § 87. Собственное подпространство.......................260 § 88. Операторы простой структуры.......................261 Критерий простой структуры. Матричная формулировка операторных свойств. Жорданова клетка § 89. Треугольная форма матрицы линейного оператора....265 §90. Нильпотентный оператор...........................266 §91. Корневые подпространства.........................269 Корневые векторы. Корневые подпространства. Расщепле- ние линейного оператора. § 92. Жорданова форма..................................273 Канонический базис корневого подпространства. Нумера- ция базиса. Матрица оператора A|.Kaj в каноническом базисе. Жорданов базис и жорданова нормальная форма матрицы оператора. Приведение матрицы к жордановой форме. Аннулирующий многочлен. Минимальный много- член. Некоторые приложения § 93. Вещественный аналог жордановой формы..........280 Инвариантные подпространства минимальной размерно- сти. Вещественный аналог жордановой формы
10 Оглавление Глава XVI. Линейные операторы в унитарных (евклидо- вых) пространствах.......................284 § 94. Сопряженный оператор.........................284 Определение и свойства. Матрицы операторов А и А* в паре ортонормированных базисов. Ядра и образы операто- ров А и А* §95. Сопряжение оператора, действующего в одном простран- стве. Биортогональные базисы......................286 § 96. Нормальный оператор.............................288 Определение и свойства. Нормальный оператор и его ма- трица в унитарном пространстве. Нормальный оператор и его матрица в евклидовом пространстве § 97. Унитарный (ортогональный) оператор..............292 Критерии унитарности. Спектральная характеристи- ка унитарного оператора. Каноническая форма матрицы ортогонального оператора §98. Самосопряженный оператор.........................297 § 99. Знакоопределенные операторы.....................298 § 100. Разложения линейного оператора..................301 Эрмитово разложение. Сингулярная пара базисов и сингу- лярное разложение. Полярное разложение Глава XVII. Билинейные и квадратичные формы.............308 § 101. Билинейные и квадратичные формы в линейном простран- стве....................................................308 Билинейные формы. Квадратичные формы. Канонический вид квадратичной формы § 102. Квадратичные формы в вещественном пространстве...315 Закон инерции. Знакоопределенные квадратичные формы. Общий вид скалярного произведения в вещественном про- странстве §103. Квадратичные формы в комплексном пространстве....318 Полуторалинейные формы. Эрмитовы формы § 104. Квадратичные формы в евклидовом (унитарном) простран- стве...................................................321 Глава XVIII. Геометрия квадратичных форм и поверхно- сти второго порядка....................................325 § 105. Гиперповерхности второго порядка в евклидовом простран- стве....................................................325 Общее уравнение. Приведенные уравнения. Инварианты ги- перповерхности. Классификация гиперповерхностей § 106. Алгебраические поверхности второго порядка......329 Общее уравнение. Приведенные уравнения. Канонические уравнения. Геометрические свойства
Оглавление 11 Глава XIX. Линейные нормированные пространства...........342 § 107- Норма вектора...................................342 Нормы в арифметическом пространстве. Еще о метриче- ском пространстве. Норма и метрика. Нормы в конечно- мерном пространстве § 108. Норма и скалярное произведение..................348 § 109. Эквивалентность норм в конечномерном пространстве.350 Компактность единичной сферы. Эквивалентность норм § ПО. Линейные операторы в нормированных пространствах...352 Непрерывность и ограниченность. Норма оператора. Под- чиненная норма. Спектральная норма §111 . Матричные нормы оператора и нормы матрицы......355 §112 . Экстремальные задачи для самосопряженного оператора .. 357 Вариационные свойства собственных значений. Вариаци- онные свойства сингулярных чисел. Разделение собствен- ных значений §113. Задачи наилучшего приближения в нормированных про- странствах ........................................ 361 Наилучшее приближение. Аппроксимация оператора (матрицы). Расстояние до множества вырожденных матриц § 114. Линейные операторные уравнения .:..............364 Нормальное решение. Псевдорешение. Метод наименьших квадратов. Нормальное псевдорешение Приложение. Проблемы оснований геометрии и обоснования ме- тода координат..........................................370 §1 . Аксиомы элементарной геометрии...................370 § 2. Схема доказательства непротиворечивости геометрии Евклида...........................................382 § 3. Схема доказательства непротиворечивости геометрии Лобачевского..........................................385 §4 . Заключительные замечания о проблемах аксиоматики.387 Предметный указатель....................................388 Указатель обозначений...................................393
ПРЕДИСЛОВИЕ Линейная алгебра является широко используемым аппаратом для всех разделов математики и ее приложений. Особенно возросла ее роль в связи с развитием вычислительной техники и математики. Не будет большим преувеличением утверждать, что любое математиче- ское приложение в вычислительной практике на том или ином этапе сводится к решению алгебраической задачи. Логическая структура линейной алгебры исключительно проста, она основана на небольшом числе удобных в обращении понятий и аксиом. Однако абстрактный характер алгебраических понятий зату- шевывает это ее свойство и затрудняет первоначальный опыт изуче- ния линейной алгебры. Объединение линейной алгебры и аналитиче- ской геометрии в один курс позволяет подчеркнуть геометрическую природу линейной алгебры и сделать ее объекты более наглядными. По существу, линейная алгебра и аналитическая геометрия настолько связаны, что между ними трудно провести четкую грань, “во многих случаях они отличаются друг от друга лишь языком: каждую из этих дисциплин можно понимать как перевод другой” (Ж. Дьедонне). При написании этой книги мы придерживались традиции объеди- нения (переплетения) линейной алгебры и аналитической геометрии, установившейся в системе преподавания на факультете вычислитель- ной математики и кибернетики МГУ им. М.В. Ломоносова. При со- вместном изучении этих дисциплин геометрические представления своей наглядностью делают алгебраические понятия и факты более воспринимаемыми, помогают уяснить, а зачастую и предвидеть не всегда очевидные факты. В свою очередь алгебраический формализм позволяет проводить геометрические исследования более компактно. Авторы использовали ряд методических приемов из учебников, написанных А.Г. Курошем [14], И.М. Гельфандом [б], Н.В. Ефимо- вым [7], Г.Е. Шиловым [17], В.В. Воеводиным [2], А.И. Кострики- ным [12], В.А. Ильиным и Э.Г. Позняком [10]. Нам приятно подчеркнуть благотворное влияние на методические особенности предлагаемой книги идей первого лектора по данному курсу на факультете ВМиК МГУ В.В. Воеводина. Авторы считают своим приятным долгом поблагодарить ректора МГУ В.А. Садовничего и декана факультета ВМиК МГУ Д.П. Косто- марова, оказавших существенную поддержку изданию этой книги, и научного редактора книги Л.В. Крицкова за ценные замечания, спо- собствовавшие ее улучшению. В.А. Ильин, Г.Д. Ким
ПРЕДИСЛОВИЕ К ТРЕТЬЕМУ ИЗДАНИЮ В настоящем издании нам удалось упростить некоторые доказа- тельства. Ряд других доказательств мы излагаем более подробно, ука- зывая возможные обобщения, содержащие существенную дополни- тельную информацию. В текст книги внесены небольшие дополнения, касающиеся общей алгебры, теории точечных пространств, метрических и нормирован- ных пространств, вычислительных основ линейной алгебры, а в конце книги помещено приложение, посвященное проблемам оснований гео- метрии и обоснования метода координат. Наконец, нами исправлены имевшиеся в предыдущем издании опе- чатки и неточности. Мы выражаем благодарность нашим коллегам по кафедре и фа- культету ВМиК МГУ - профессорам Е.Г. Дьяконову, Е.Е. Тыртыш- никову и доцентам Н.И.Ионкину, Л.В. Крицкову, В.С. Панфёрову, Р.В. Разумейко и А.И. Фалину - за полезные обсуждения, способство- вавшие улучшению изложения. С благодарностью мы отмечаем, что труд Л.В.Крицкова по прочтению рукописи вышел за рамки редак- тирования. Мы очень благодарны рецензентам академикам РАН С.М. Николь- скому и В.В. Воеводину, а также ректору МПГУ члену-корреспонденту РАН В.Л. Матросову и доценту МГУ А.И. Камзолову за поддержку этой книги. Мы считаем также нашим приятным долгом выразить глубокую благодарность ректору МГУ академику В.А. Садовничему и декану факультета ВМиК МГУ академику Е.И. Моисееву, стараниями ко- торых эта книга включена в серию “Классический университетский учебник”. Мы очень признательны сотрудникам издательства “Проспект” С.М. Грачеву, Л.В. Рожникову, В.А. Товстоногу, К.В.Хомерики, об- легчившим нам подготовку рукописи к печати. Москва, 2006 г.
ЛИТЕРАТУРА 1. Александров П. С. Курс аналитической геометрии и ли- нейной алгебры. М.: Наука, 1979. 2. Воеводин В. В. Линейная алгебра. М.: Наука, 1980. 3. Воеводин В. В. Вычислительные основы линейной алгебры. М.: Наука, 1980. 4. Воеводин В. В., Кузнецов Ю. А. Матрицы и вычисления. М.: Наука, 1984. 5. Гантмахер Ф. Р. Теория матриц. М.: Наука, 1988. 6. Гельфанд И. М. Лекции по линейной алгебре. М.: Добросвет, 1988. 7. Ефимов Н. В. Высшая геометрия. М.: Наука, 1978. 8. Ефимов Н. В., Розендорн Э. Р. Линейная алгебра и многомерная геометрия. М.: Наука, 1974. 9. Ильин В. А., Позняк Э. Г. Аналитическая геометрия. М.: Физматлит, 2004 (классический университетский учебник). 10. Ильин В. А., Позняк Э. Г. Линейная алгебра. М.: Физ- матлит, 2004 (классический университетский учебник). 11. Ильин В. А., Садовничий В. А., Сендов Бл. X. Математический анализ. Часть I. М.: Проспект и изд-во Моск, ун-та, 2004 (классический университетский учебник). 12. Кострикин А. И. Введение в алгебру. М.: Физматлит, 2004 (классический университетский учебник). 13. К острикин А. И., Манин Ю. И. Линейная алгебра и геометрия. М.: Наука, 1986. 14. Курош А. Г. Курс высшей алгебры. М.: Наука, 1988. 15. Тыртышников Е. Е. Краткий курс численного анализа. М.: ВИНИТИ, 1974. 16. Халмош П. Конечномерные векторные пространства. М.: Физматгиз, 1963. 17. Шилов Г. Е. Математический анализ (конечномерные ли- нейные пространства). М.: Наука, 1969.
Глава I. Матрицы § 1. Понятие матрицы Терминология и обозначения. Пусть т, п € N. Матрицей размера т х п называется совокупность тп чисел, записанных в ви- де прямоугольной таблицы из т строк и п столбцов. При этом сами числа называются элементами матрицы. В первых главах мы будем рассматривать лишь вещественные матрицы, т.е. матрицы с вещественными элементами. В дальнейшем (§43) мы убедимся в том, что все изложенные свойства остаются спра- ведливыми и в общем случае матриц над произвольным полем. Матрицу обозначают прописными латинскими буквами, при этом саму таблицу заключают в скобки (либо круглые, либо квадратные, либо двойные вертикальные): 2 3 4 5 б z Элементы матрицы обозначают строчными латинскими буква- 2 1 2 1 О 1 А= 1 ми, снабженными двумя индексами: - элемент матрицы, располо- женный в г-й строке и j-м столбце (в позиции (i,J)). В этих обозна- чениях матрица размера т х п в общем виде может быть записана следующим образом: аи а12 ... ain д _ «21 «22 «2п _ «ml «m2 • • «тп _ Приведем ряд других обозначений, которыми мы будем пользо- ваться в дальнейшем: RTnxn - множество всех вещественных матриц размера т х п; Л = (aij) - матрица А с элементами в позиции {А};.,- - элемент матрицы А в позиции (i, j); Атхп - матрица А размера т х п. Элементы atJ, где i — j, называются диагональными, а элемен- ты а^, где г j, - внедиагональными. Совокупность диагональных элементов ап,а22, • •, a*k, где к = min(m, п), называется главной диа- гональю матрицы, а совокупность элементов ain, a2in_j, .- ее по- бочной диагональю. Матрица, все элементы которой равны нулю, называется нулевой и обозначается символом О. Отметим, что для каждого размера т х п существует своя нулевая матрица. Матрица размера п х п называется квадратной матрицей п-го порядка. Квадратная матрица называется диагональной, если все ее
16 Глава I. Матрицы внедиагональные элементы равны нулю. Обозначение: diag(au, ..., ann). Диагональная матрица, у которой все диагональные элемен- ты равны между собой, называется скалярной. Скалярная матрица, у которой все диагональные элементы равны 1, называется единичной (тождественной) и обозначается символами I или Е. Отметим, что для каждого порядка п существует своя единичная матрица. Число tr А = an +--1- апп называется следом матрицы А = (a^) G Rnxn. Матрица размера 1 хп называется строчной матрицей, или мат- рицей-строкой, или вектор-строкой. Матрица размера т х 1 назы- вается столбцовой матрицей, или матрицей-столбцом, или вектор- столбцом. Компактная форма записи матрицы. Пусть А = (щД eRmxn. Обозначим г-ю строку и г-й столбец матрицы А символами а' и а,: а' = [ ал а»2 aii a2i ain _ Gmi _ В этих обозначениях матрица А может быть записана более ком- пактно: или А = [ ai а2 ... ап ] . (1.1) Такой формой записи мы нередко будем пользоваться, причем не только лаконичности ради. Матрицы специального вида. Квадратная матрица А = — (atj) € Rnxn называется верхней (правой) треугольной, еслиа^ = О при i > j, и нижней (левой) треугольной, если а^ = 0 ори г < j. Об- щий вид треугольных матриц: чатой, если она обладает следующими свойствами: 1) если г-я строка нулевая, то (г + 1)-я строка также нулевая; 2) если первые ненулевые элементы г-й и (г 4- 1)-й строк располо- жены в столбцах с номерами ki и fc,+ i, то < fci+i- Эти свойства означают, что все нулевые строки являются послед- ними и что все элементы, расположенные слева и под первым ненуле- вым элементом каждой строки, равны нулю. Происхождение назва- ния становится понятным из “рисунка” ступенчатой матрицы:
§ 1. Понятие матрицы 17 (здесь все неотмеченные элементы равны нулю, а заведомо ненулевые элементы помечены знаком *). Если в определении верхней ступенчатой матрицы поменять роля- ми строки и столбцы, то получим определение нижней (левой) сту- пенчатой матрицы. Ступенчатая матрица, у которой ki = г, называется трапециевид- ной. Общий вид трапециевидных матриц: R = L = | Oil «12 - • • «22 ••• &2г «1,г+1 ••• «2,г+1 • • &1п Я2п 0 0 ... 1 Qrr От,г+1 «гп 0 0 ... 0 0 0 0 0 ... 0 0 0 ац 1 о 0 0 0 021 «22 | 0 0 0 °rl «г2 (1гг 0 0 «г+1,1 «г+1,2 Gr+ 1,г 0 0 О-тЪ ^тг 0 0 (1-3) где ац 0 при i — 1,т. До сих пор мы рассматривали матрицы, элементами которых слу- жат числа. Так в основном будет и в дальнейшем. Одно из немногих в этом отношении исключений составляют матрицы, элементами кото- рых являются также матрицы. Остановимся на этом более подробно. Разобьем матрицу А = (aij) € R’nxn системой горизонтальных и вертикальных линий на клетки (блоки). Клеточной (блочной) ма- трицей называется матрица, элементами которой служат эти клетки. Общий вид клеточной матрицы: А =
18 Глава I. Матрицы где Aij - клетка, расположенная в г-й клеточной строке и в j-м кле- точном столбце. Квадратная клеточная матрица А = (А^) с квадрат- ными клетками на главной диагонали называется квазидиагонолъной, если Aij = О при i 7^ j, и квазитреугольной, если А^ — О при i > j (или г < j). Как будет видно из дальнейшего, блочные матрицы по многим характеристикам близки к числовым матрицам (см., например, с. 17, свойство 1). Это продуктивно используется в вычислительной мате- матике для обработки большого объема информации. § 2. Операции над матрицами Равенство матриц. Две матрицы А = (а^) и В = (bij) одина- кового размера т х п называются равными, если аг] = b^, i = 1,т, j — 1,п. Обозначение: А = В. Линейные операции. Суммой матриц А — (а,3) € Rmxn и В = (Ь,Д G й”1**" называется матрица С = (с^) € Rmx,‘, элемен- ты которой определены равенством _ ______ Ctj ~A* b{j, г — 1, т, j — 1, п. Обозначение: С = А + В. Матрица —А = (—ач) € йтх" называется противоположной к матрице А = (а^) G йтпх". Теорема 2.1. Операция сложения матриц обладает следу- ющими свойствами: VA,B,C € Rmxn и О G ЙП1ХП 1) А + В = В + А (сложение матриц коммутативно); 2) (А + В) -г С — А + (В + С) (сложение матриц ассоциативно); 3) А + О = 0 + А = А; 4) А + (-А) = -А + А = О. Доказательство. Эти свойства непосредственно вытекают из определения и доказываются по единой схеме. Докажем свойство 2. Матрицы (А + В) + С и А + (В + С) имеют одинаковый размер т х х п, при этом их элементы, расположенные в одинаковых позициях, равны, так как {(А + В) + C}ij = {А + В}у + {С}^- = (Pij+bij) +cij — aij + 4-сц) = {A}ij + {В + = {A + (В + C)}tj. Разностью матриц A = (ay) € R’nxn и В = (By) € Rmxn называ- ется матрица X = (xij) G йтхп такая, что А = В + X. Обозначение: X — А — В. Очевидно, что для любых матриц А, В G Rmxn существует единственная разность А - В, при этом А-В = А + (~В) = (% -Ьц). Произведением матрицы А = (а1}) G йтхп числ0 q, g R на- зывается матрица С = (су) G Rmxn, элементы которой определены равенством ____ ______ Cij = ctaij, г — 1,т, j — 1, п. Обозначение: С = а А.
§ 2. Операции нал матрицами 19 Теорема 2.2. Операция умножения матрицы на число об- ладает следующими свойствами: ЧА, В 6 R'nxn, Ча,(3 € К 1) 1А = А; 2) (а[3) А = а((ЗА); 3) л(А -ь В) = а А +- аВ (умножение матрицы на число дистри- бутивно относительно сложения матриц); 4) (а + (3)А = аА ф (ЗА (умножение матрицы на число дистри- бутивно относительно сложения чисел); (5)-А = (-1)А. Все эти свойства непосредственно вытекают из определения и про- веряются по той же схеме, что и свойство 2 из теоремы 2.1. Итак, на множестве Rmx" всех вещественных матриц одинакового размера т х п любые две матрицы можно сложить и любую матрицу можно умножить на вещественное число. При этом результаты вы- полнения этих операций также будут матрицами из Rraxn. Обратим внимание на эту особенность множества RmXn, так как в дальнейшем мы неоднократно будем сталкиваться с множествами, наделенными операциями сложения и умножения на число, которые обладают свой- ствами, сформулированными в теоремах 2.1 и 2.2. Операции сложения матриц и умножения матрицы на число по- зволяют однозначно определить матрицу k oj Al + а2А2 + ... + акАк = У, OjAi, i=l называемую линейной комбинацией матриц Ai, А2,..., А*, € Rmxn с коэффициентами оц, а2,..., ак 6 R. Умножение матриц. Произведением матриц А = (ац) € Rmxn и В = (bjj) € Rnxfc называется матрица С = (с^) G Rmxfc, элементы которой определены равенством Cjj = £ г = l,m, j - 1,к. 3=1 Обозначение: С = АВ. Уже из определения следует, что произведение матриц зависит от порядка сомножителей; произведение АВ определено лишь в том слу- чае, когда размеры матриц А и В согласованы специальным образом: число столбцов левой матрицы должно совпадать с числом строк правой. Это означает, что оба произведения АВ и ВА определены тогда и только тогда, когда А и В имеют размеры т х п и п х т соответственно. При этом размеры матриц АВ и В А совпадают лишь при т — п. Следовательно, равенство АВ = ВА возможно лишь для квадратных матриц одинакового порядка. Однако и в этом случае произведение матриц, вообще говоря, может зависеть от порядка со- множителей: /1 1 \ / 1 0 \ , ( 1 0 \ / 1 1 \ \ О 1 J \ 1 1 ) * V 1 1 J \ 0 1 )'
20 Глава I. Матрицы Матрицы А и В, для которых АВ = В А, называются перестано- вочными или коммутирующими. Очевидно, что на множестве Rnxn 1) нулевая и единичная матрицы перестановочны с любой другой матрицей; 2) любые две диагональные матрицы перестановочны. Теорема 2.3. Операция умножения матриц обладает сле- дующими свойствами: 1} (АВ)С = А(ВС) (свойство ассоциативности), 2) а(АВ) = (аА)В = А(аВ), Va е R, 3) А(В + С) = АВ + АС, (А + В)С = АС+ВС (свойство дистри- бутивности), выполненными для любых матриц А, В, С, для которых левые части равенств имеют смысл. Доказательство. Эти свойства проверяются непосредствен- но. Остановимся подробнее на свойстве 1. Так как произведение (ДВ)С' имеет смысл, то размеры матриц А, В и С согласованы со- ответствующим образом. Пусть А = (а^) G Rmxn, В — (bij) € Rnxfc, С = (c,j) € R*xp. Тогда и произведение А(ВС) имеет смысл, при этом размеры обеих матриц (АВ)С и А(ВС) совпадают. Проверим совпаде- ние элементов этих матриц, расположенных в одинаковых позициях. Обозначим АВ = U — (u.ij), ВС = V = (w,j), (АВ)С = S = (sij), А(ВС) — Т — (tij). Тогда для любых i = l,m, j - 1,р sij = uiqcqj = Sg=l (Sr=l airbrq) Cqj, tij ~ 52r=l a<rvrj ~ Sr=l air (Z2q=l t'rqCqj'j Числа Cgj в первой двойной сумме (a{r - во второй) не зависят от индекса суммирования г (соответственно q), т.е. являются общими множителями слагаемых внутренней суммы. Следовательно, cqj (со- ответственно air) можно внести под знак суммирования, так что sij = (12г=1 atr^rgC<?j) = Sr=l airbrqCqj, tij = 52r=l airt>rqCqj^ = 52r=l Sg=l airbrqCqj- Отсюда и из свойств двойной суммы следует, что з^ = tij . Транспонирование матрицы. Пусть Л = (atJ) € Rmxn. Матри- ца Ат = (аГ) € Rnxm называется транспонированной к матрице А, если ___ ________ а-7 = aji, i = 1,п, j = 1,т. Для обозначения транспонированной матрицы используются так- же символы А1 и А'. Переход от матрицы А к АТ называется транспонированием ма- трицы А. Заметим, что при транспонировании матрицы Л ее строки становятся столбцами АТ с теми же номерами, а столбцы - строками. Другими словами, транспонирование - это вращение матрицы в про- странстве на 180° вокруг главной диагонали.
§ 2. Операции над матрицами 21 Теорема 2.4. Операция транспонирования матриц обла- дает следующими свойствами: 1) (А + В)Т = АТ+ ВТ, 2) (аА)т = аАт, Va е R, 3) (АВ)Т = ВТАТ, 4) (Ат)т = А, выполненными для всех матриц А, В, для которых имеют смысл левые части равенств. Доказательство. Проверим свойство 3, остальные непосред- ственно вытекают из определения. Положим А = (а.у) € R771*71, В = (by) € Rnxfc, произведение АВ при этом имеет смысл. Нетруд- но проверить, что произведение ВТАТ также имеет смысл, при этом размеры матриц (АВ)Т и ВТАТ совпадают. Элементы этих матриц, расположенные в одинаковых позициях, равны, так как {(ЛВ)т}у = {AB}jt = t^bsl = £ b^ = {втдт}у. > S=1 S=1 Некоторые свойства операций. Приведем несколько полезных фактов, касающихся операций над матрицами. Доказательство этих свойств предоставляется читателю. 1. Операции сложения, умножения на число и умножения блочных матриц совершаются по тем же правилам, по которым они соверша- ются с обычными числовыми матрицами: а) если блочные матрицы А = (Ду), В = (Btj) имеют одинаковый размер и одинаковым образом разбиты на клетки, то сумме матриц А и В при том же разбиении на клетки отвечает блочная матрица С = (Су) с элементами Су = Aij + BtJ; б) произведению а А отвечает блочная матрица С = (Су) с эле- ментами Cij = a Ajj-, в) если А = (Ду) и В = (By) - блочные матрицы, у которых число столбцов блока Д15 равно числу строк блока BSj при любых г,s, j , то произведению АВ соответствует блочная матрица С = (Су) с элементами Су = У) Ду By. 3 2. Вектор-столбец е, = (0 ... О 10 ... 0)т G Rnxl и вектор-строку е\ = (0 ... 010 ... 0) G Rlxm (у которых все компоненты равны 0, кроме г-й, равной 1) будем называть соответственно i-м единичным столбцом и г-й единичной строкой. Если А = (ay) G то в обозначениях (1.1) Ae.i = ait е'{А = а(. (2.1) 3. Если А — 6 R771’*71, а b1 = (а1а2---«т) и b = = (aj о2 ...,ап)Т - вектор-строка и вектор-столбец соответственно, ТО пт АЬ = a iai, Ь'Д — (2'2) i= 1 t=l
22 Глава I. Матрицы 4. Если А = (cnj) е Rmxn, В = (Ь^) е Rnxfc, то АВ = [ Abi АЬ2 ... АЬк ] , (2-3) т.е. столбцы произведения АВ являются линейными комбинациями столбцов матрицы А, а строки произведения АВ - линейными ком- бинациями строк матрицы В. § 3. Элементарные преобразования матриц Приведение матрицы к ступенчатой форме. Элементарны- ми преобразованиями матрицы называются преобразования следую- щих типов: 1) перестановка двух строк (столбцов) матрицы; 2) умножение строки (столбца) матрицы на число, отличное от нуля; 3) прибавление к одной строке (столбцу) матрицы другой ее строки (соответственно столбца), умноженной на любое число. Теорема 3.1 (об основном процессе). Произвольная не- нулевая матрица конечным числом элементарных преобразований только строк первого и третьего типов может быть приведе- на к верхней ступенчатой форме. Доказательство. Пусть А = (ач) € Rmxn, А О. Процесс приведения этой матрицы к верхней ступенчатой форме состоит в общем случае из k = min(m,n) шагов. Иногда, как это будет видно ниже, он обрывается раньше, давая нужный результат. Первый шаг. а) Так как А / О, то в ней должен быть хотя бы один ненулевой столбец. Пусть ki — номер первого из них. В /ci-м столбце существует хотя бы один ненулевой элемент ац^. Если ан, 0, то переходим к п. "б". Если же ац, = 0, то, поменяв местами 1-ю и г-ю строки (т.е. выполнив элементарное преобразование строк первого типа), получим матрицу ' 0 ... О aifcl ... ain О ... О a2ki ' а?п . О О &тк1 • • • Щпп . в которой ajfc, 0. Хотя при таком переходе элементы матрицы А могли измениться, мы оставили прежние обозначения с тем, чтобы акцентировать внимание лишь на тактической стороне процесса. б) Элемент anti назовем ведущим (главным) элементом первого шага. С его помощью аннулируем все расположенные под ним эле- менты Ai-ro столбца. Для этого из всех строк, начиная со второй,
§ 3. Элементарные преобразования матриц 23 вычтем первую строку, умноженную на azki/^ifcn a3ki/oiki, , Gmki/o-iki соответственно (т.е. выполним элементарные преобразова- ния строк третьего типа). После выполнения первого шага матрица А перейдет в матрицу "О ... О | ац, ai,ki4-i ain О ... О 0 a2,ki + 1 • • • О,2п 1 в которой первая строка является первой строкой строящейся верхней ступенчатой матрицы. Если при этом все строки, начиная со второй, стали нулевыми, то весь процесс заканчивается, так как матрица уже приведена к верхней ступенчатой форме. Если же в этих строках есть хотя бы один ненулевой элемент, т.е. если матрица 41 = a2,fci + l /О, ^2п ^тп . _ +1 то переходим ко второму шагу. Второй шаг. Второй шаг аналогичен первому. Он состоит в приме- нении к матрице 41 процедуры описанного выше первого шага. При этом можно считать, что выполняются элементарные преобразования строк всей матрицы А, так как нулевые элементы этих строк, распо- ложенные в первых /ci столбцах, при элементарных преобразованиях строк не изменяются. В результате второго шага уже и вторая строка матрицы А станет второй строкой строящейся верхней ступенчатой матрицы. Переход к следующему шагу аналогичен уже известному перехо- ду от первого шага ко второму. Повторяя описанные преобразования на следующих шагах, самое большее через k = min(m, п) шагов мы получим требуемый результат. Отметим, что ведущим элементом г-го шага является первый ненулевой элемент i-й строки, т.е. . Описанный здесь процесс будем называть основным процессом приведения матрицы к ступенчатой форме. Приведение к трапециевидной форме. Основной процесс с незначительной модификацией может быть использован и для при- ведения матрицы к верхней трапециевидной форме. Для этого нуж- но привлечь и элементарные преобразования столбцов: переставить в ступенчатой матрице столбцы так, чтобы fc.-й столбец оказался на г-м месте. Итак, произвольная ненулевая матрица элементарными пре- образованиями строк и перестановками столбцов может быть приве- дена к верхней трапециевидной форме. Если в основном процессе поменять ролями строки и столбцы, то матрица А приведется к нижней ступенчатой (трапециевидной) фор- ме. Приведение к треугольной форме. Квадратная матрица с по- мощью основного процесса приводится к треугольной форме.
24 Глава I. Матрицы Замечание. Идеи основного процесса используются во многих компьютер- ных алгоритмах вычислительной алгебры. Выбор ведущего элемента здесь пред- ставляет собой особую проблему, так как от этого зависит точность вычислений. Исследование этой проблемы выходит за рамки данной книги: отметим лишь, что ведущий элемент не должен быть “маленьким”. Именно этим определяется много- образие алгоритмов, реализующих основной процесс, с различными стратегиями выбора ведущего элемента. Матрицы элементарных преобразований. Элементарные пре- образования матрицы просты и удобны в матричных исследованиях. Однако словесное описание выполняемых преобразований весьма уто- мительно как само по себе, так и для его восприятия. Этого можно избежать, если ввести некоторые матрицы специального вида. Матрицами элементарных преобразований называются квадрат- ные матрицы Di, P,j, Lij вида 1 . . а . . . i 1 1 i I . 0.1... 1.0... . 1 1 г i 1 . . 1.0.. • 0 1 • • . 1 1 г j i j а/0, i , V/3 € R, (3.1) i в которых все диагональные элементы, кроме указанных, равны 1, а все внедиагональные элементы, кроме указанных, равны 0.
§ 4. Определители 25 Теорема 3.2. Умножение матрицы А на матрицы эле- ментарных преобразований Рг], Di, Lij справа равносильно элемен- тарным преобразованиям столбцов матрицы А первого, второго и третьего типов соответственно, а умножение слева на матрицы Pij, Dl: ЬГ - аналогичным элементарным преобразованиям строк. Доказательство. Докажем одно из сформулированных утвер- ждений: умножение матрицы А на Li} справа равносильно прибавле- нию к г-му столбцу матрицы А ее j-ro столбца, умноженного на (3. Действительно, пусть • • - ,1п ~ столбцы матрицы L,j. Тогда, как следует из (2.3), (2.2) и (2.1), AL,, = [ Л/i ... А1п ] = {lk = ek при к / г} = — [а 1 ... а, — j А1, j ... Он ] — { Al, — -h 0aj J — — [di ... a{ _ i (a, -j- /3a_,) <2,4-1 ... an]. я Итак, с помощью матриц элементарных преобразований все эле- ментарные преобразования матрицы могут быть записаны весьма ла- конично: PijA, DiA, L?jA,APij, ADi, ALij. В свете доказанной теоремы можно по-иному сформулировать те- орему 3.1: для любой ненулевой матрицы А существуют матрицы элементарных преобразований L±,..., Lk такие, что произведение Lk ... Li А имеет верхнюю ступенчатую форму. § 4. Определители Перестановки. Упорядоченная совокупность чисел од, а2, , ап, в которой 1) аг е {1,2,... , n} , i = l,n; 2) a, £ aj при i j, называется перестановкой из чисел 1,2,..., п. Перестановка 1,2,..., п называется натуральной. Замечание. Аналогично рассматриваются перестановки из п произвольных символов: достаточно перенумеровать эти символы и иметь дело с их номерами 1,2,...,7?. Преобразование перестановки, при котором два ее числа а, и a.j с номерами г j меняются местами, называется транспозицией. Говорят, что два числа а, и в перестановке оц, а2) • • • i <*п обра- зуют инверсию (беспорядок), если большее из них предшествует мень- шему, т.е. если о, > при i < j, и порядок - в противном случае, т.е. если а, < aij при г < j. Перестановка называется четной, если общее число инверсий в ней четно, и нечетной - в противном случае. Общее число инверсий в перестановке aj, о2, •. , ап обозначается символа- ми <t(oi,0*21 • • •,ctn) или а(а). Теорема 4.1. Число всевозможных перестановок из п чи- сел равно п!. 1В § 8 будет дано общее определение перестановки п-го порядка.
26 Глава I. Матрицы Доказательство, Переберем все перестановки из п чисел. В качестве ai можно взять любое из этих чисел. Это дает п возможно- стей. В каждой из них aj уже выбрано и в качестве аг можно выбрать любое из п — 1 оставшихся чисел. Это означает, что число различных способов выбрать ai и аг равно п(п — 1). Продолжая эти рассужде- ния, получим, что число различных способов выбрать ai,a2,... ,ап равно n(n — 1) •... • 2 -1 = п!. Теорема 4.2. Каждая транспозиция меняет четность пе- рестановки. Доказательство. 1. Пусть в перестановке ai,a2,... ,a„ меня- ются местами два соседних числа а; и a,+ i, т.е. ... ,aj,aj+i,... ।—> ... ,а,+ 1,а,,... (здесь многоточия заменяют числа, которые не затрагивались при транспозиции). Очевидно, что в обеих перестановках числа, оставши- еся на местах, составляют одни и те же инверсии друг с другом и с числами ai,ai+i. Если числа а, и a;+i раньше составляли инверсию, то в новой перестановке она пропадает; если же они не составляли инверсию, то теперь появится одна новая инверсия. Таким образом, общее число инверсий в новой перестановке отличается от старой на единицу, т.е. четность при такой транспозиции меняется. 2. Пусть теперь между переставляемыми числами <4 и aj распо- ложено к чисел, т.е. ... ,а<,а>+1,... ,ai+fc, а; ... i—> ... ,aj,a,+i,... ,а,+*:,at... Новую перестановку можно получить из старой, последовательно ме- няя местами соседние числа: а, поменять местами (к -I-1) раз с сосед- ними числами ai+i,ai+21 с*?, а затем aj поменять местами к раз с числами ац.*,,. • • , а;+2, При этом четность перестанов- ки изменится 2к -I- 1 раз. Следовательно, и при такой транспозиции четность перестановки меняется. Теорема 4.3. Все п! перестановок из п чисел могут быть упорядочены так, чтобы каждая последующая отличалась от пре- дыдущей на одну транспозицию, причем начинать это упорядочение можно с любой перестановки. Доказательство. Проведем индукцию по п. Для п = 2 утвер- ждение теоремы легко проверить: (1,2), (2,1) и (2,1), (1,2). Пусть утверждение теоремы верно для п — 1 чисел. Докажем его для п чисел. Пусть первая перестановка имеет вид ai, a2,..., an . а) Сначала упорядочим все перестановки, начинающиеся с Та- ких перестановок (п — 1)*, и по индуктивному предположению они мо- гут быть упорядочены нужным образом, начиная с перестановки aj, a2, • • •, an, так как это сводится к упорядочению перестановок из п — 1 чисел, начиная с а2, аз,..., ап. б) Далее в последней перестановке из этого списка выполним одну транспозицию, поменяв местами числа ai и a2. И снова упорядочим все перестановки, начинающиеся с а2, и т.д.
§ 4. Определители 27 Следствие 1. При п > 2 число четных перестановок равно чи- слу нечетных. Действительно, после упорядочения в списке всех перестановок четные и нечетные перестановки будут чередоваться, а так как п! четно при п > 2, то количества четных и нечетных пере- становок совпадают и равны п!/2. Следствие 2. От каждой перестановки из п чисел можно пе- рейти к любой другой перестановке из этих же чисел с помощью конечного числа транспозиций. Теорема 4.4. Если ai,a2,... ,ап - перестановка из первых п натуральных чисел с числом инверсий з, то после преобразования ее в натуральную перестановку индексные номера 1,2,..., п образу- ют новую перестановку с тем же числом инверсий s. Доказательство. Рассмотрим в перестановке ai,«2, •,а<,... ,о,,... ,ап (4-1) любые ее два числа а, и oj. Числа О{ и о/ образуют либо инверсию (о; > о_у, г < j), либо порядок (о, < Oj, г < j). После преобразования перестановки (4.1) в натуральную числа о, и о7 будут располагаться следующим образом: 1,2,... ,Oj,...,а,,... ,п в случае инверсии, 1,2,... ,Oj,.. -,Oj,... ,п в случае порядка, причем в обоих случаях г < j. Это означает, что числа о, и Oj в пере- становке (4.1) и их индексы i и j в перестановке индексных номеров одновременно образуют либо инверсию, либо порядок. Следователь- но, обе эти перестановки имеют одинаковое число инверсий s. Построение определителя n-го порядка. Пусть А = (atJ) - квадратная матрица n-го порядка. Рассмотрим произведение элемен- тов этой матрицы, взятых по одному из каждой строки и каждого столбца: ^lai&2a2 •• • (4-2) Заметим, что в этом произведении сомножители упорядочены в порядке возрастания номеров строк, при этом номера столбцов ai, а2, , ап образуют перестановку из чисел 1,2, ...,п, так как о, € {1,2,и а, а, при г j Произведений вида (4.2) в матрице А столько, сколько существует перестановок из п чисел, т.е. п! . Определителем квадратной матрицы А = (а^) n-го порядка называется сумма всевозможных произведений aia,a2a3 апа„ элементов матрицы, взятых по одному из каждой строки и каждого столбца, причем если сомножители в этом произведении упорядоче- ны в порядке возрастания номеров строк, то оно берется со знаком
28 Глава I. Матрицы Для обозначения определителя приняты символы |Д|, det Л. Итак, <211 012 • din 021 022 • ^2п И II Оп1 ОП2 • О'ПП a=(ot,a2,....a„) (4-3) где суммирование ведется по всевозможным перестановкам (01,02, ..., ап) из чисел 1,2,..., п. Каждое произведение в сумме (4.3) называется членом определи- теля, а число (-1)“^ - его знаком. Из свойств перестановки следует, что число всевозможных членов определителя n-го порядка равно п! и что при п > 2 число положи- тельных членов равно числу отрицательных и равно п!/2. Определение (4.3) для п = 2 и п = 3 приобретает вид I <121 022 I = “11 “22 - 012021, (4-4) 011 012 013 021 022 023 = ОЦО22ОЗЗ + 012023031 + 013(121032— (4.5) 031 032 033 -013022031 - 012021033 — <111023032- Для запоминания соотношений (4.4) и (4.5) существуют удобные мнемониче- ские правила, дающие схему вычисления положительных и отрицательных членов определителей второго и третьего порядков. соответственно. В этих схемах элементы, входящие в одно произведение, соедине- ны отрезками. Простейшие свойства определителя. 1°. Определитель треугольной матрицы равен произведению диа- гональных элементов. Действительно, если А = (а^) - треугольная (верхняя или ниж- няя, (1.2)) матрица n-го порядка, то все члены определителя этой матрицы, кроме аца^ о.пп, заведомо равны нулю. Поэтому
§ 4. Определители 29 |А| = (-i)^(i.2,...,n) ana22 ann = аг1а22 • ann. 2°. Определитель квадратной матрицы не изменяется при ее транспонировании: |А| = |АТ|. Доказ ател ьство. Определитель матрицы А = (а,-,) € Rnxn со- стоит из членов вида (4.2). Все множители из произведения (4.2) и в матрице АТ находятся в разных строках и разных столбцах. Следо- вательно, |А| и |АТ| состоят из одних и тех же членов. Сравним их знаки. Знак произведения (4.2) как члена |А| опре- деляется четностью перестановки а = (dj,, ап). Определим его знак как члена |АТ|. Имеем п1а1а2а2... апЛп — 2 • аа п- Упорядочим во втором произведении сомножители в порядке возра- стания номеров строк, т.е. так, чтобы номера строк образовали на- туральную перестановку: . а‘ОгП = а1101а‘20г ... а1п0п. Знак произведения (4.2) как члена |АГ| определяется четностью переста- новки 0 — (0i,02, ,0п). Но эта перестановка совпадает с переста- новкой индексных номеров в перестановке а после преобразования ее в натуральную. Согласно теореме 4.4, а(а) = а(0). Таким образом, |А| и |АГ| являются суммами одинаковых слагаемых, т.е. совпа- дают. Следствие 3. В определении (4.3) определителя можно поме- нять ролями строки и столбцы: HI = £ (-l)cr(o,)aQliaa22...aQ„n) о=(а1,...,а„) так как эта сумма равна |АГ|. Из доказанного свойства вытекает и более общий вывод: строки и столбцы матрицы равноправны с точки зрения свойств определителя. Это означает, что свойства определителя, касающиеся строк матри- цы, справедливы и для ее столбцов. Этим обстоятельством мы будем пользоваться в дальнейшем, ограничиваясь в доказательствах теорем только строчным или только столбцовым вариантом. 3°. Если одна из строк (столбцов) матрицы целиком состоит из нулей, то ее определитель равен нулю. Утверждение вытекает непосредственно из определения (4.3) опре- делителя, если учесть, что в каждый член определителя входит мно- жителем элемент из нулевой строки. 4°. При умножении строки (столбца) матрицы на число ее определитель умножается на это число. Утверждение также вытекает из определения определителя, если учесть, что в каждое слагаемое суммы (4.3) это число входит множи- телем ровно один раз и его можно вынести за знак суммы. Заметим, что свойство 4 означает, что общий множитель элементов строки (столбца) матрицы можно выносить за знак определителя. 5°. Если каждый элемент некоторой строки матрицы предста- влен в виде суммы двух слагаемых: a-ik —bk + ck, к = 1,п,
30 Глава I. Матрицы то определитель матрицы можно представить в виде суммы двух Утверждение вытекает из определения (4.3), если учесть, что «1^>; «2» . • • • . - • ^nan = — • • • ^сч • • • ®па„ “Ь ^2л2 • * * ^°ч ‘ ‘ ® Аналогичное свойство справедливо для столбцов. Замечание 1. Свойства 4 и 5 часто объединяют, называя их свойством линейности определителя относительно строк и столб- цов. 6°. При перестановке местами двух строк (столбцов) матрицы ее определитель меняет знак. Доказательство. Пусть в матрице А = (av) G Rnxn переста- вляются г-й и j-й столбцы и В - результат этой перестановки: А — [ai... at... cij... an], В = [ai... <ij ... a,... an]. Очевидно, что определители матриц А и В состоят из одних и тех же членов. Сравним их знаки. Члену аа, i... aaji... aajJ ... аапП в |А| соответствует перестановка at,..., a,,..., aj,... ,ап, а в |В| - перестановка Oj,..., a,,..., a,,..., ап. Эти перестановки отличаются друг от друга одной транспозицией, т.е. имеют разную четность. От- сюда следует, что все члены определителя |А| входят в определитель |£?| с противоположными знаками. Это означает, что |А| = — |В|. Замечание 2. Отметим, что свойство 6 относится к случаю, ко- гда переставляются строки (столбцы) с разными номерами. 7°. Определитель матрицы, имеющей две одинаковые строки (столбца), равен нулю. Утверждение вытекает из свойства 6: достаточно в матрице поме- нять местами одинаковые строки, тогда |А| — -|А| — 0. 8°. Если одна строка (столбец) матрицы является линейной комбинацией других ее строк (столбцов), то определитель матрицы равен нулю. Утверждение вытекает из свойства линейности определителя и свойства 7. 9°. Если к какой-либо строке (столбцу) матрицы прибавить ли- нейную комбинацию других ее строк (столбцов), то ее определитель не изменится. Утверждение вытекает из свойств 5 и 8. Миноры и алгебраические дополнения. Теорема Лапла- са. Пусть А = (aij) G Rmxn и fc G N, I < k < min(m, n). Вы-
§ 4. Определители 31 Jlj2-.-Jk берем в матрице А произвольные к строк и к столбцов с номера- ми ii < iz < ... < ik и ji < jz < < jk соответственно. Эле- менты матрицы Л, находящиеся на пересечении выбранных строк и столбцов, образуют квадратную матрицу к-го порядка. Определитель этой матрицы называется минором к-го порядка матрицы А, распо- ложенным в строках с номерами ii,iz, • - Ак и столбцах с номерами , jk- Для обозначения миноров приняты символы M’JJ* М(<“2'**), Мк, М. Итак, Чиз Jk7’ a»ijj ... a’k ii aii,jk Пусть теперь A = (a4) - квадратная матрица n-го порядка и "" 66 МИНОР> причем к < п. Если в матрице А вычеркнуть строки и столбцы, в которых расположен заданный минор, то остав- шиеся элементы матрицы А образуют квадратную матрицу (п — /с)-го порядка. Определитель этой матрицы называется дополнительным минором к минору Дополнительный минор обозначается символами Af’’*у *,*, М, Ма. Очевидно, что исходный минор явля- ется дополнительным к своему дополнительному минору. Дополни- тельный минор к минору , взятый со знаком (—1)ep=i(,p+Jp)i называется алгебраическим дополнением к минору ' и обозна- чается символом Л*1*2' . Итак, 4’1’2 «к _ (1 \il+>2+- - + ’k+jl+j2 + ...+jk Л7*1,2"Л* AJU3. Jk ' 17 '"jijs - jk- Теорема 4.5 (теорема Лапласа). Пусть А — (aij) е К”хп ut е N, 1 <fc<n-l. Пусть в матрице А выбраны произвольные к строк (или столбцов). Тогда определитель матрицы А равен сумме всевозможных произведений миноров к-го порядка, расположенных в выбранных строках (соответственно столбцах), на их алгебраи- ческие дополнения. Доказательство. Пусть выбраны строки с номерами ij < iz < ... <ik. Следует доказать, что detx= £ («) (J1.J3. .,jk) где суммирование ведется по всевозможным значениям ji,jz^---,jk (1 < ji <J2 < - < jk < n). Для доказательства рассмотрим подробнее правую часть требуе- мого равенства (4.6). Минор AfJ'J2'**, как определитель k-ro поряд- ка, представляет собой сумму произведений к элементов матрицы Л. Точно так же и алгебраическое дополнение Л))'? ' ’Д является суммой произведений п — к элементов матрицы Л. Значит, произведение 2 Лилейная алгебра н аналитическая геометрия
32 Глава I. Матрицы М1'2’- ,к Л 1.2 к Л1,2,...,к Рис. 1 - - 'к' a следователь110, и вся правая часть (4.6) предста- вляет собой сумму произведений п элементов матрицы А. Обозначим эту сумму через S и покажем, что она совпадает с det А как с суммой (4.3) членов определителя с соответствующими знаками. 1. Сначала покажем, что произведение 'л представляет собой не- которую сумму членов det А, причем с теми же знаками, с какими они входят в det А. а) В простейшем случае, когда ми- А — нор Mj'^ ** находится в левом верхнем углу матрицы А (рис. 1), дополнитель- ный минор будет занимать правый ниж- ний угол, при этом он будет совпадать с алгебраическим дополнением, так как (_i)(i+2+-+fc)+(H-2+...+*:) _ । Возьмем произвольный член минора A*: (-l)a(a)a10,1a2o2' ... • akai, и произвольный член дополнительного к нему минора: ( —1) ^ак4-1,/Д + 1аА:4-2,/3>[+2 • • • ап0„ Тогда произведение ^Аг‘7' ‘Д есть сумма произведений вида J2* '*JK Jij* ' 'J* ( —1) ^^П1а,1<12а2 ’ ’ • ^kaitO‘k+l,0h + i ^n0n' В этом произведении все сомножители находятся в разных стро- ках и разных столбцах матрицы А, следовательно, оно будет членом detA. Знак этого члена равен (-1)’(°ь--Д»), где Ц Но по <7(ai,... ,ctfc,^+1, . •., /З'п) = п(а) + сг(0'), так как никакое сц ни с каким /3' не образует инверсий: все оц < к, а все /3' > к. При этом <т(/3') = <т(/3), так как все инверсии и порядки в обеих переста- новках сохраняются. Таким образом, произведение А‘‘‘? представляет собой некоторую сумму членов det А, причем с теми же знаками, с какими они входят в detA. б) Общий случай минора сводится к рассмотренному сле- дующим образом. Будем переставлять ij-ю строку матрицы А после- довательно со всеми предыдущими до тех пор, пока она не займет место первой строки. Затем точно так же будем переставлять г2-ю, ..., г*-ю строки до тех пор, пока они не займут места второй, ..., к-й строк соответственно. Аналогично переставим Ji-й, .., jfc-й столбцы до тех пор, пока они не займут места первого, второго, ..., к-го столбцов. При этом всего будет выполнено (й — 1) + • + (ik — к) -f- (ji — 1) + .- + (j*, — к) — = (й + • • + 2fc) + (ji + • • • + jk) — 2(1 + • - • + к) (4-7)
§4. Определители 33 перестановок строк и столбцов матрицы А. В результате этих пере- становок матрица А преобразуется в матрицу В, в которой рассмат- риваемый минор Mj'** ** матрицы А займет левый верхний угол. Так как при указанных преобразованиях взаимное расположение строк и столбцов дополнительного минора не изменилось, то допол- нительный минор к минору в матрице А останется дополни- тельным к нему и в матрице В. Из п. "а” следует, что произведение -X является суммой членов det В с теми же знаками, с какими они входят в det В. Но, согласно свойству 6 определите- ля и равенству (4.7), det А = (—1)(ч+-+«*)+(л+- -+Ji)det В. Следо- вательно, слагаемые произведения (—l)(‘1+-+l*)+th+-+j*) Л^дХХ вх°Дят в det Л со своими знаками. 2. Из доказанного в п. 1 следует, что вся сумма S представляет собой некоторую сумму членов det А со своими знаками. 3. Покажем теперь, что в сумму S входят все члены det А. Пусть Й|О; (4’8) - произвольный член det А. В этом произведении соберем отдельно сомножители, расположенные в строках с номерами ... , г*: •’ilOi, ai2C42 • ai*a,k • (4-9) Они расположены в различных столбцах с номерами а<,,о,2,... ,а,к. Эти номера однозначно определяются заданием члена (4.8). Обозна- чим через М минор /с-го порядка матрицы А, расположенный в стро- ках с номерами и столбцах с номерами а,,, а,а,..., ailt. Тогда произведение (4.9) будет членом этого минора, а произведение остальных сомножителей (4.8), не вошедших в (4.9), - членом допол- нительного минора М к минору М. Итак, любой член определителя матрицы А может быть получен умножением определенного этим чле- ном минора М на дополнительный к нему минор М. Из доказанного в п. 1 следует, что при умножении минора М на его алгебраическое дополнение получится член (4.8) с его знаком. 4. Осталось доказать, что каждый член det А входит в сумму S ровно один раз и что других слагаемых в этой сумме нет. Для этого достаточно показать, что количество слагаемых в сумме S равно п!. Действительно, минор Л/J)’’";’* состоит из к\ слагаемых, алгебраиче- ское дополнение к нему - из (n — fc)! слагаемых. Значит, произведение "X состоит из fc!(n — /с)! членов определителя матри- цы А. Таких произведений в сумме S столько, сколько существует миноров к-го порядка в строках . ,ik, т.е. столько, сколько существует способов выбрать к столбцов - -,jk из п столбцов матрицы А. Итак, имеется таких произведений, а количество слаг гаемых в сумме S равно С*/г!(п — /с)! = п!.
34 Глава I. Матрицы Разложение определителя по строке (столбцу). Если в те- ореме Лапласа выбрать к = 1 и строку (столбец) с номером г, то минорами первого порядка, расположенными в г-й строке (столбце), будут сами элементы (а-ц). Обозначив через А^ алгебраическое дополнение к элементу a,j, получим из теоремы Лапласа, что п п det А = aij Aij (или det А = а.iAji). (4.10) j=i j=i Представление определителя в виде (4.10) называется разложе- нием определителя по г-й строке (соответственно по i-му столбцу). Итак, определитель матрицы равен сумме всех произведений эле- ментов произвольной ее строки (столбца) на свои алгебраические дополнения. Определитель квазитреугольной матрицы. Теорема 4.6. Определитель квазитреугольной матрицы ра- вен произведению определителей диагональных клеток. Доказательство. Пусть А - верхняя квазитреугольная матри- ца m-го порядка (рис. 2). Применим теорему Лапласа к группе из к столбцов матрицы А, образу- ющих ее первый клеточный столбец. В этих столбцах все миноры А:-го порядка, кроме |Ац|, за- ведомо равны нулю, а алгебра- ическое дополнение к минору |Лц | совпадает с дополнитель- ным минором. Согласно теоре- ме Лапласа отсюда следует, что |А| = |Л11| |Л|, где А - также квазитреугольная матрица, но уже (т — 1)-го порядка, начи- нающаяся с клетки A<ii- Поступая точно так же еще (m — 1) раз, получим, что |Л| — И11| ' 1^22, • • • • • |Лтт|. (4.U) Аналогично получается равенство (4.11) и для нижней квазитре- угольной матрицы. Теорема ^.1 .Определитель произведения квадратных мат- риц равен произведению определителей матриц-сомножителей. Доказательство. Пусть А — (а^), 5 = 0>ij) - квадратные матрицы n-го порядка. Рассмотрим матрицу С вида
§ 4. Определители 35 с = Йц 012 а1п a2i а22 • • &2п &nl &п2 • •• ^пп 0 -1 0 ... 0 0 -1 ... 0 0 0 ... -1 511 512 ... bin &21 ^22 • • - ^2п 5П1 5П2 . - Ъпп С одной стороны, С - квазитреугольная матрица, поэтому соглас- но (4.11) |С| = |А| - |В|. (4.12) С другой стороны, не меняя определителя матрицы С, преобразу- ем ее гак, чтобы клетка А стала нулевой. Сначала аннулируем первую строку матрицы А, для чего прибавим к первой строке матрицы С ее (п + 1)-ю, (п + 2)-ю, ... , 2п-ю строки, умноженные'на flii,ai21 • • - ,ain соответственно. В результате этих преобразований det С остается без изменения, первце п элементов первой строки матрицы С станут ну- левыми, а вторые п элементов заполнятся элементами первой строки матрицы АВ. Теперь в новой матрице выполним аналогичные пре- образования второй строки: ко второй строке матрицы С прибавим ее (п+1)-ю, (п+2)-ю,..., 2п-ю строки, умноженные на 021,022, • • • , °2п соответственно. После этих преобразований определитель матрицы С не изменится, первые п элементов второй строки матрицы С станут нулевыми, а вторые п элементов заполнятся элементами второй стро- ки матрицы АВ. Выполнив аналогичные преобразования с третьей, ... , n-й строкой матрицы С, получим матрицу _ ГО АВ 1 определитель которой равен определителю матрицы С. Переставив в матрице Ci первый и (п + 1)-й столбцы, второй и (п + 2)-й столбцы, ..., n-й и 2п-й столбцы, получим квазитреугольную матрицу Г АВ О 1 определитель которой отличается от определителя матрицы Ci мно- жителем ( —1)п. Таким образом, |С| = |С\| = (—1)П|С2| = |АВ|. Отск>- да и из равенства (4.12) получаем, что |АВ| = [А[ • |В|. (4.13) Вычисление определителя. Многие задачи линейной алгебры связаны с проблемой вычисления определителя.
36 Глава I. Матрицы Было бы весьма затруднительным вычислять определитель исходя из его определения, т.е. вычисляя непосредственно все п! членов и определяя их знаки. Для этого нужно выполнить п!п операций умножения (без учета менее трудоем- кой операции сложения чисел). Так, для п = 100 число умножений превосходит 10163 - с этим не в состоянии справиться даже самые мощные современные ком- пьютеры. Теорема Лапласа позволяет упростить проблему вычисления определителя, сводя ее к вычислению определителей более низких порядков. Однако, как видно из (4.11), (4.12), этот подход существенно эффективен лишь для матриц с большим числом нулевых элементов, сгруппированных специальным образом. Среди различных методов вычисления определителя особое место в приложениях занимает метод Гаусса. Метод Гаусса применяется для решения широкого класса матрич- ных задач. Идея этого метода проста и естественна. Она состоит в том, что: • выделяется тип матрицы, для которой задача решается достав точно просто; • выделяется тип преобразований, которые либо не изменяют ре- шений задачи, либо изменяют их контролируемым образом; • произвольная матрица выделенными преобразованиями приво- дится к выделенному типу, тем самым задача общего вида сводится к более простой. В применении к задаче вычисления определителя эта схема вы- глядит следующим образом: - определитель треугольной матрицы равен произведению диаго- нальных элементов (свойство 1); - элементарные преобразования матрицы либо не изменяют опре- делителя (свойство 9), либо изменяют (свойства 4 и 6), но так, что эти изменения можно легко восстановить; - произвольная квадратная матрица элементарными преобразова- ниями приводится к треугольной форме (теорема 3.1). Метод Гаусса вычисления определителя состоит в приведении мат- рицы элементарными преобразованиями к треугольному виду, вычи- слении определителя получившейся треугольной матрицы и восстано- влении исходного определителя, если использовались элементарные преобразования типов 1 и 2 (§3). Замечание 3. В методе Гаусса вычисления определителя можно использо- вать элементарные преобразования как строк, так и столбцов. Замечание 4. Для вычисления определителя п-го порядка методом Гаусса требуется выполнить + О(п2) операций умножения двух чисел. Теперь для п = 100 определитель может быть вычислен быстрее чем за одну секунду на компьютере с быстродействием 106 арифметических операций в секунду. § 5. Обратная матрица Условие обратимости. Матрица А-1 называется обратной к матрице А, если АА-1 = А-1 А = I. Матрица А, для которой су- ществует обратная матрица, называется обратимой.
§ 5. Обратная матрица 37 Из определения следует, что обратимой может быть лишь ква- дратная матрица, так как равенство АА~1 = А-1 А возможно лишь для квадратных матриц А и А~1 одинакового порядка. Но не ка- т л ( 0 0 \ ждая квадратная матрица обратима. 1ак, матрица А = I j I при умножении справа на любую матрицу дает матрицу с нулевой первой строкой, т.е. ни для какой матрицы В произведение АВ не может совпадать с единичной матрицей I. Выясним, какие свойства матрицы обеспечивают ее обратимость. Квадратная матрица А называется вырожденной (особенной), ес- ли |А| = 0, и невырожденной (неособенной), если | А| z- 0. Пусть А = (atJ) eRnxn. Матрица ’ Ац А21 А12 А 22 . А)п А-_>п А а! АП2 Ann . (5.1) составленная из алгебраических дополнений AtJ к элементам аг] мат- рицы А, называется присоединенной (взаимной) к матрице А. Теорема 5.1 (о фальшивом разложении определите- ля). Сумма произведений элементов одной строки (столбца) мат- рицы на алгебраические дополнения к элементам другой ее строки (соответственно столбца) равна нулю. Доказательство. Пусть А = (а^) е Rnxn. Покажем, что для любых ее двух строк г, j, где г j, п *aisAjS =0. (5-2) з= 1 Рассмотрим вспомогательную матрицу В, которая отличается от А только j-й строкой: на месте j-й строки в В находится г-я строка матрицы А. С одной стороны, det В = 0 (§4, свойство 7). С другой сторо- ны, det В = I2s=i a”AjS. так как в разложении det В по j-й стро- ке алгебраические дополнения к элементам j-й строки матрицы В получаются вычеркиванием j-й строки и поэтому совпадают с ал- гебраическими дополнениями A3S к элементам j-й строки матрицы А. Отсюда следует (5.2). Аналогично доказывается столбцовый вариант теоремы. Доказанную теорему иногда называют теоремой о “чужих” ал- гебраических дополнениях. Напомним, что в этой терминологии умно- жение на “свои” алгебраические дополнения дает разложение (4.10) определителя по строке (столбцу соответственно). Теорема 5.2 (критерий обратимости). Матрица обра- тима тогда и только тогда, когда она не вырождена.
38 Глава I. Матрицы Доказательство. Необходимость. Пусть матрица А обра- тима. Тогда существует обратная матрица А'1 такая, что АЛ-1 = I. Взяв определители от обеих частей этого равенства, согласно (4.13) получим, что | А|• | А~11 = |Г|, т.е. | А|• |А"11 — 1. Следовательно, | А| / 0. Достаточность. Пусть |А| / 0. Покажем, что матрица гН является обратной к матрице А. В самом деле, из разложения опреде- лителя по строке (столбцу) и теоремы 5.1 имеем, что АА = АА = |А|I. Следовательно, Ац|А = ц]АА = Д т.е. Теорема 5.3 (о единственности обратной матрицы). Если А - квадратная матрица и АВ — I (или В А = I), то В — А-1. Доказательство. Из равенства АВ = I следует, что В - ква- дратная матрица и, согласно (4.13), А не вырождена. Следовательно, матрица А обратима и для нее существует обратная матрица А-1. То- гда А-1 = А-1(АВ) = (А-1А)В = IB — В. Таким образом, В = А-1. Аналогично рассматривается случай, когда В А — I. Доказанная теорема устанавливает свойство единственности обратной матрицы, и, более того, из нее следует, что для квадратной матрицы А одного из равенств АА-1 = I или А-1 А = I достаточно, чтобы матрица А-1 была обратной к матрице А. Некоторые свойства обратной матрицы. 1. /-1 = I, так как 11 = 1. 2. |А~11 = 1/|А|, так как |А| |А-1| = 1. 3. (А-1)-1 = А, так как АА-1 = А-1А = I. 4. (Ат)-1 = (А-1)т, так как (А-1)ТАТ = (АА-1)Т = IT = I. 5. (АВ)”1 = В-’А-1, так как (АВ)(В“1А-1) = I. Вычисление обратной матрицы. Соотношение (5.3) дает явный вид обратной матрицы. Оно полезно в теорети- ческих исследованиях и совершенно неэффективно для практического вычисле- ния (разве что для матриц второго порядка) вследствие большого объема требуе- мых вычислений. В самом деле, для получения обратной матрицы к матрице п-го порядка согласно (5.3) требуется вычислить п2 определителей (п — 1)-го порядка и один определитель n-го порядка. В вычислительной математике используют- ся различные дополнительные приемы вычисления обратной матрицы, которые по объему вычислений равносильны вычислению всего лишь двух определителей n-го порядка. Опишем один из них. Теорема 5.4. Произвольная невырожденная матрица эле- ментарными преобразованиями только строк (только столбцов) приводится к единичной матрице. Док азател ьство. Рассмотрим строчный вариант теоремы. Пусть А = (aij) € Rnxn и det А 0. Применим к матрице А основной процесс (теорема 3.1). Так как А - квадратная матрица, то оконча- тельная ступенчатая матрица будет треугольной. Ввиду невырожден- ности исходной матрицы она также будет невырожденной и ее диаго- нальные элементы будут отличны от нуля. Разделив каждую строку
§ 5. Обратная матрица 39 на ее диагональный элемент, т.е. выполнив элементарные преобразо- вания строк, получим треугольную матрицу вида 1 “12 “13 • • • “in О 1 023 • - - “2п О 0 0 ... 1 (5-4) Если представить процесс приведения матрицы к верхней ступен- чатой форме как преобразование матрицы “слева направо” (в таком порядке аннулируются столбцы), то теперь будем выполнять анало- гичные преобразования “справа налево”. На первом шаге с помощью последней строки аннулируем все наддиагональные элементы послед- него столбца, вычитая из первых (п — 1) строк последнюю строку, умноженную на “in,“2n, • • ,“n-i,n соответственно. На втором шаге из первых (п — 2) строк вычитаем (п — 1)-ю строку, умноженную на ai>n-i,“з,п-1, - ;“п-2,п-1 соответственно. Выполнив аналогичные преобразования, через (п — 1) шагов получим единичную матрицу. Отметим, что на каждом шаге изменяются элементы только одно- го аннулируемого столбца. Если в доказательстве поменять ролями строки и столбцы, то получим утверждение столбцового варианта тео- ремы. Доказанная теорема может быть переформулирована в терминах матриц элементарных преобразований (теорема 3.2). Для строчно- го варианта: существуют матрицы элементарных преобразований L\, L2l ... , Lk такие, что LkLk-i •. • LiL^A = I. Отсюда в силу теоремы 5.3 следует, что Л-1 = LfcLk-i... L2L1 или А 1 = L/cLjc-i LzLiI. Это означает, что для получения обратной матрицы достаточно к строкам единичной матрицы I применить те преобразования, ко- торые приводят матрицу А к единичной матрице. Для этого удобно составить расширенную матрицу [Л| У] и над строками этой матрицы выполнить те преобразования, которые матрицу А приводят к еди- ничной; тогда на месте матрицы I окажется обратная матрица Л-1. Итак, Этот метод вычисления обратной матрицы называется методом Жордана или методом Гаусса-Жордана.
40 Глава, I. Матрицы Замечание. Если в расширенных матрицах (5.5) и (5.6) единич- ную матрицу I заменить матрицей В, то вместо матрицы А-1 полу- чим в первом случае матрицу А~1В, а во втором - матрицу ВА-1: А В в преобразования строк I А~1В преобразования столбцов I ВА~1 так как A~lB = LkLk-i • ^Ь^В, BA~l — BL1L2 - Lk- Приведение к диагональной форме. Незначительным измене- нием процесса, описанного в доказательстве теоремы 5.4, можно при- вести квадратную матрицу А общего вида к диагональной форме. Для этого достаточно элементарными преобразованиями строк и столбцов привести матрицу А к верхней трапециевидной форме, разделить ка- ждую ненулевую строку трапециевидной матрицы на свой диагональ- ный элемент, затем с помощью первого столбца аннулировать все над- диагональные элементы первой строки, с помощью второго столбца - все надциагоналъные элементы второй строки, и т. д. Этот же процесс, примененный к прямоугольной матрице, приве- дет ее к форме, называемой прямоугольной диагональной формой: <21 <2п 0 или £(7-разложение матрицы. Из первой части доказательства те- оремы 5.4 следует, что любая невырожденная матрица элементарны- ми преобразованиями строк 1-го и 3-го типов приводится к верхней треугольной форме (5.4). На языке матриц элементарных преобразо- ваний это означает, что существуют нижние треугольные матрицы L1,..., Lk (см.(3.1)), такие, что LkLk-i...LvA = U или A = L^1 ...L^L^U. (5.7) Отметим, что среди матриц Lj,..., Lfc (а следовательно, и среди матриц Lfг,..., *) нижними треугольными являются лишь те, ко- торые соответствуют элементарным преобразованиям строк 3-го типа. Выделим класс невырожденных матриц, для котрых в основном процессе приведения к верхней треугольной форме можно обойтись
§5. Обратная матрица 41 без элементарных преобразований строки 1-го типа (т.е. перестановок строк). Назовем угловым минором порядка к квадратной матрицы А минор Afj j’' т.е. минор, расположенный в строках и столбцах с номерами 1,2,..., к. Пусть в матрице A G Rnxn все угловые миноры Д1, Д2,..., Д^ отличны от нуля. Так как — ац / 0, то элемент ац можно выбрать ведущим элементом первого шага (см. доказательство теоремы 3.1). Кроме того, элементарные преобразования строк 3-го типа, выполняемые на первом шаге, не меняют значения всех угловых миноров матрицы А, поэтому все угловые миноры матрицы Ai, к которой применяются преобразования второго шага, также отличны от нуля. Тем самым, на втором шаге основного процесса также можно обойтись без перестановок строк и т.д. Если все матрицы ..., Lk в (5.7) - нижние треугольные, то и L = LJ"1... 1 _ нижняя треугольная матрица (проверьте!). Таким образом, любая квадратная матрица А, у которой все угло- вые миноры отличны от нуля, может быть представлена в виде А = LU, (5.8) где L - нижняя, U - верхняя треугольная матрицы. Представление (5.8) называется LU-разложением матрицы А.
Глава И. Теоретико-множественные понятия Здесь излагаются первоначальные теоретико-множественные по- нятия, которые будут использоваться в последующих главах. § 6. Множества Под множеством в математике понимается совокупность объек- тов, называемых элементами множества. Как правило, множество обозначается прописной буквой какого-либо алфа- вита, а его элементы - строчными буквами того же или другого алфавита. Для некоторых множеств приняты стандартные обозначения. Так, буквами N, Z, Q, R обозначают соответственно множества всех натуральных, целых, рациональных, вещественных чисел. Множества с конечным числом элементов могут быть описа- ны путем явного перечисления всех их элементов, элементы при этом заключают- ся в фигурные скобки. Например, {0,1,2}- множество остатков от деления целых чисел на число 3. Множество, не содержащее ни одного элемента, называется пу- стым множеством. Мы будем обозначать его символом 0. Множество S называется подмножеством множества X, если име- ет место импликация: х £ S => х G X. Обозначение: S С X. Пустое множество по определению является подмножеством любого множества. Для задания подмножества S С X используется его характеристи- ческое свойство, т.е. свойство, присущее только элементам из S. Так, запись {n = 2k | к € Z} задает множество всех четных чисел. Два множества X и Y называются равными, если каждое из них является подмножеством другого, т.е. X = Y {усХ. (61) Если S С X, причем S 0, S X, то S называется собственным подмножеством множества X. Объединением (суммой или соединением) множеств X и Y называ- ется множество всех элементов, которые принадлежат хота бы одному из множеств X или Y. Обозначение: X U Y. Итак, X U Y = {т| х G X или х G У}. Пересечением множеств X и У называется множество всех эле- ментов, одновременно принадлежащих как X, так и У. Обозначение: ХПУ. Итак, X ПУ = {z|x€X, j 6 У}.
§ 7. Эквивалентность 43 Разностью множеств X и Y называется множество всех элементов из X, которые не содержатся в У. Обозначение: Х\У или X — Y. Итак, Х\У = {х | х 6 X, х У}. Если У С X, то разность Х\У называется дополнением множества У до множества X. Обозначение: У, СУ или С%У. Декартовым произведением множеств X и У называется множе- ство всевозможных упорядоченных пар (х, у), в которых х € X, у € У. Обозначение: X х У. Итак, X х У = {(х, у) | х € X, у 6 У}. Декартово произведение X х X называется декартовым квадра- том множества X и обозначается символом X2. Множество всех пар (х, х), где х € X, называется диагональю декартова квадрата мно- жества X. Примеры. 1. Множество Q всех рациональных чисел можно рас- сматривать как декартово произведение Z х N. 2. Множество декартовых координат всех точек плоскости пред- ставляет собой декартов квадрат R2. 3. Если упорядоченную пару (а, 6) вещественных чисел изобраг жать точкой плоскости с абсциссой а и ординатой Ь, то декартовы произведения X х У и У х X множеств, указанных на рис. 1, изобра- зятся точками соответствующих прямоугольников. § 7. Эквивалентность В математике, в логических рассуждениях, а также в обыденной жизни мы сталкиваемся с необходимостью сравнивать два элемента множества: равенство (и неравенство) двух чисел, равенство матриц, равенство множеств, подобие тре- угольников, эквивалентность уравнений и т.д, Во всех этих случаях между двумя элементами множества определено некоторое отношение, и в каждом случае вве- дено правило, по которому устанавливается, находятся ли заданные два элемента в этом отношении или нет. Несмотря на разнообразие этих отношений, оказывает- ся, что с математической точки зрения они являются конкретными проявлениями одного и того же понятия. Введем его. Бинарное отношение. Говорят, что на множестве X задано би- нарное отношение 7Z, если указано непустое подмножество 1Z декарто- ва квадрата этого множества. Если при этом (х, у) € И, то говорят, что элементы х и у связаны отношением Л, и обозначают символом хЛу.
44 Глава II. Теоретико-множественные понятия Равенство х = у и неравенство х < у действительных чисел, ра- венство матриц А = В, равенство множеств X = Y и пр. - все это примеры бинарных отношений. В самом деле, рассмотрим один из них - отношение " <" на множестве R всех действительных чисел. Пара чисел х, у € R, для которой х < у, является элементом R2. Множество всех таких пар обра- зует подмножество 11 декарто- ва квадрата R2 - на рис. 2 они изображаются точками плоско- сти R2, которые лежат выше прямой у = х. Задание это- го множества 1Z определяет би- нарное отношение на множестве действительных чисел, а отно- шение хНу (т.е. (х,у) € К) есть не что иное, как х < у. Заметим, что бинарное отношение равенства вещественных чисел задается прямой у — х, т.е. диагональю декартова квадрата R2. Бинарное отношение 11 на множестве X называется: • рефлексивным, если xllx, 'ix € X; • симметричным, если имеет место импликация x"R.y => y1Zx; • транзитивным, если имеет место импликация хВ.у, yR.z => xB.z. Отношение эквивалентности. Важным классом бинарных от- ношений являются бинарные отношения, описывающие свойство “схожести”, - отношения эквивалентности. Бинарное отношение £ на множестве X называется отношением эквивалентности, если оно рефлексивно, симметрично и транзитив- но. Если пара элементов х,у € X связана отношением эквивалентно- сти, то говорят, что х и у эквивалентны, и обозначают это символом х ~ у. В конкретных случаях вместо этого символа могут быть ис- пользованы и другие, например х = у, х = у. Отношения эквивалентности играют важную роль в математических исследо- ваниях. Назвав два элемента эквивалентными, мы игнорируем те различия между ними, которые не существенны в рассматриваемой задаче. В каждой конкрет- ной задаче мы различаем или не различаем элементы лишь в отношении тех их свойств, которыми интересуемся в данный момент. Известное правило равенства обыкновенных дробей (pi/Qi = если ptgj = 91Р2) является отношением эквивалентности. Назвав дроби | и | равными, мы игнорируем их несовпадение как дробей и считаем, что они определяют одно и то же рациональное число. Уже этот простейший пример подсказывает, что эквивалентные элементы множества целесообразно объединять в один объект. Пусть на множестве X задано отношение эквивалентности 8 и а е X. Множество всевозможных элементов х G X, эквивалентных а, называется классом эквивалентности, порожденным элементом а. Обозначение: cl (а). Итак, с!(а) = {т е ~ а} . Любой элемент класса эквивалентности называется представителем класса. Теорема 7.1. Класс эквивалентности порождается любым своим представителем, т.е. если Ь е с! (а), то с! (Ь) — cl (а).
§ 7. Эквивалентность 45 Для доказательства равенства этих множеств достаточно показать двустороннее вложение (6.1) их друг в друга. Действительно, с е cl (Ь) => с ~ Ь, но b ~ a => с ~ a => с € cl (а), с € с! (а) => с ~ а, но a ~ b => с ~ b => с € с! (6). Теорема 7.2. Два класса эквивалентности либо не пересе- каются, либо совпадают. Действительно, любые два класса cl (а) и cl (й) либо не пересека- ются, либо имеют хотя бы один общий элемент. Но в последнем случае они совпадают, так как если с 6 cl (а), с € cl (й), то в силу теоремы 7.1 с1(а) = с1(й). Из теоремы 7.2 и очевидного факта, что любой элемент множества содержится в одном из классов эквивалентности (а е с1(а)), следует, что все множество разбивается на непересекающиеся классы экви- валентности. Множество всех классов эквивалентности называется фактор-множеством множества X по отношению эквивалентно- сти £ и обозначается символом Х]£. Как уже отмечалось выше, одни и те же элементы множества, эквивалентные при одном отношении эквивалентности, могут ока- заться неэквивалентными при другом. Все зависит от задачи, а в разных задачах мы можем интересоваться различными свойствами одних и тех же элементов. Проиллюстрируем это на примерах раз- личных отношений эквивалентности на множестве Z целых чисел. Примеры. 1. Положим т ~ п, еслит — п. Это тривиальный пример отношения эквивалентности, сводящегося к простому совпа- дению. Очевидно, что cl (т) = {т} и Z|£ = Z. 2. Положим т ~ п, если тип имеют одинаковую четность. Нетрудно проверить, что это бинарное отношение является отноше- нием эквивалентности. Очевидно, что при таком отношении эквива- лентности все множество Z разбивается на два класса эквивалент- ности: Са = cl (0) = {2k | k G Z} - множество всех четных чисел и Ci = cl (1) = {2к + 11 к 6 Z} - множество всех нечетных чисел. Итак, Z|£ = {Со, Ci}. Такое разбиение множества целых чисел на классы нам знакомо из обыденной жизни, например, деление множества домов улицы на четную и нечетную сторону. 3. Пусть р е N, р > 1. Два целых числа тип называются срав- нимыми по модулю р, если при делении на р они дают одинаковые остатки, т.е. если т — п — рк, где к € Z. Обозначение: т = n(modp). Итак, т = n(modp) <=> т — п = рк, к € Z. (7.1) Положим т ~ п, если т = n(modp). Нетрудно проверить, что бинарное отношение (7.1) является отношением эквивалентности. Найдем классы эквивалентности. Пусть т при делении на р да- ет в остатке г. Очевидно, 0 < г < р — 1. Тогда cl (т) = {п = рк + + г | к G Z} - множество всех целых чисел п, дающих при делении на р остаток г. Так как при делении на р возможно ровно р различных
46 Глава П. Теоретико-множественные понятия остатков: 0,1,... ,р — 1, то количество классов эквивалентности равно р. Обозначения: Ст = {n — pk + r\k 6 Z}, где 0 < г < р — 1, и Zp - фактор-множество множества Z по отношению эквивалентно- сти (7-1). В этих обозначениях Zp = {Со, Ci,..., Cp_i}. Множество Zp называют множеством классов вычетов по модулю р. § 8. Отображения Определения, простейшие свойства. Пусть X, Y - два мно- жества. Отображением f множества X во множество У называется закон, посредством которого произвольному элементу х G X ставится в соответствие однозначно определенный элемент у € У; при этом эле- мент у называется образом элемента х , а элемент х - прообразом эле- мента у. Символически отображение записывается в виде f : X —> У или X -4 У. Запись у = f(x) или х i-> у означает, что элемент х при отображении f переходит в элемент у. Отображение множества X во множество У называют также пре- образованием множества X в Y, или оператором, действующим из множества X во множество У, или функцией, определенной на X со значениями в У. Все эти названия употребляются в одинаковом смысле, и их использование диктуется соображениями удобства или желанием подчеркнуть тот или иной аспект. В случае X = У говорят об отображении в себя. Полным прообразом элемента у € У называется множество1 ГЧг/) = {*£*!/(*) = у}- Образом отображения f называется множество im/ = {у = /(х)|® е X}. Вместо символа im / используется также символ /(X). Отображение / : X —> У называется: • инъективным, если из того, что xi / тг, следует, что /(xj) /(тг), или, другими словами, если уравнение /(х) = у (8.1) при любом у £ У имеет не более одного решения; • сюръективным или отображением на, если im / -- У, или, дру- гими словами, если уравнение (8.1) при любом у € У имеет хотя бы одно решение; • биективным или взаимно однозначным, если оно и инъектив- но, и сюръективно, или, другими словами, если уравнение (8.1) при любом у 6 У имеет, и притом единственное, решение. Примеры. 1. Пусть а € R и R+ - множество всех неотрицатель- ных действительных чисел. Соответствие а •-> |а| определяет три 1 Символ 1 (j/) не следует ассоциировать с обратным отображением (8.5), ко- торое может и не существовать.
§ 8. Отображения 47 различных отображения f : R —> К, д : R >-* R+, h : R+ —> R+. Отображение f не инъективно и не сюръективно, д - не инъективно, но сюръективно, h - биективно. 2. Пусть А € Rnxn. Соответствие А >-> det А определяет отображе- ние f : Rnxn —> R, не инъективное, но сюръективное. 3. Пусть a, b € R. Соответствие (а, b) а+Ъ определяет отображе- ние / : R к R —> R, не инъективное, но сюръективное. Таким образом, операцию сложения чисел можно рассматривать как отображение де- картова квадрата множества R в R. Этим обстоятельством мы вос- пользуемся в дальнейшем. Два отображения f : X —> У и д : X —> У называются равными, если f(x) — g(x), Vi е X. Обозначение: f = д. Тождественным (единичным) отображением на множестве X называется отображение ex : X —> X, которое переводит каждый элемент х € X в себя. Произведение отображений. Произведением (суперпозицией или композицией) отображений g : X —> Y и f : У —> Z называ- ется отображение fg : X —> Z, определенное правилом /<?(*) = /Ш)- Vi € X. (8.2) Таким образом, произведение отображений есть последовательное вы- полнение отображений-сомножителей, причем если символ отображе- ния рассматривать как рецепт для выполнения определенных дей- ствий, то символ произведения fg следует читать справа налево. Заметим, что произведение отображений некоммутативно. Даже в случаях, когда оба произведения fg и gf имеют смысл, произве- дение, вообще говоря, зависит от порядка выполнения отображений. В этом легко убедиться на примере, когда X = У = R, /(i) = i + + 5, 5(1) = |х|. Произведение отображений обладает следующими свойствами. 1. fex = /; eyf = f для любого отображения f : X —> У. Проверка этого свойства предоставляется читателю. 2. Произведение отображений ассоциативно, т.е. если h : X -> У, g : У -> Z, f : Z -> U, то f(gh) = (fg)h. Доказательство. В соответствии с определением равенства отображений нужно просто сравнить значения отображений f(gh) : X -> U и (fg)h : X —> U в произвольной "точке" х 6 X. Согласно определению (8.2) произведения отображений имеем (/(5ft))(i) = f((ff/i)(x)) = /(<?(Л(х))) = (/р)(Л(х)) = ((/р)Л)(х). 3. Произведение инъективных (сюръективных, биективных) отображений инъективно (соответственно сюръективно, биек- тивно). Доказательство. Пусть g : X —> У, f :Y —> Z - инъективные отображения и пусть ij V i2- Тогда из инъективности g следует, что g(ii) / g(x2), а из инъективности f следует, что /(p(ij)) / /(р(хг)), т.е. fg(xi) / fg(x2).
48 Глава II. Теоретико-множественные понятия Пусть теперь f и д сюръективны. Тогда для любого z е Z в силу сюръективности / существует у € Y такой, что z = f(y). Но для этого элемента у в силу сюръективности д существует элемент х € X такой, что у = д(х)- Таким образом, для любого элемента z € Z существует элемент х е X такой, что z = /(у(т)), т.е. z = fg(x). Биективность вытекает из сюръективности и инъективности. Обратное отображение. Пусть / : X —> У. Отображение : Y -> X называется обратным к отображению /, если f~lf = eX, ff~l = eY. (8.3) Заметим, что из этого определения следует, что / - обратное отображение к отображению /-1. Отображение, для которого суще- ствует обратное отображение, называется обратимым. Если выполнено только одно из равенств (8.3), то отбражение /-1 называется соответственно левым или правым обратным. Теорема 8.1 (критерий обратимости). Отображение обратимо тогда и только тогда, когда оно биективно. Лемма. Если g : X —> У, f : У —> X и fg = ех, то g инъектив- но, a f сюръективно. Действительно, если g не инъективно, то существуют элементы Х1,х2 € X такие, что х\ х2, а д(х\) = д(х2). Тогда ii = ex(ii) = = /$(zi) = /(s(^i)) = /(9(^2)) = /9(^2) = ех(х2) = х2. Следова- тельно, д инъективно. Далее, если х - произвольный элемент X, то х = ех(х) = fg(x) = /(у(т)) = /(у), где у = д(х) е У. Это доказывает сюръективность /. Лемма доказана. Доказательство теоремы. Необходимость. Пусть f об- ратимо. Тогда из (8.3) и леммы следует, что f инъективно и сюръек- тивно, т.е. / биективно. Достаточность. Пусть / биективно, тогда для любого у G У существует единственный прообраз х € X. Построим отображение д : У -> X, положив д(у) = х. Тогда для любого у € У имеем (/у)(у) = /(9(у)) = f(x) - У, т.е. /9 = еу, а для любого х & X имеем (у/)(х) = у(/(т)) = у(у) = х, т.е. gf = ех. Таким образом, д = и / обратимо. Отметим еще два свойства обратимых отображений. 1. Обратное отображение единственно, так как если Д-1, /у1 - два обратных отображения к отображению f : X У, то Д-1 = = f^ey = /ГЧ/Я1) = (/Г1/)^1 = eXf^ = /Г1- 2. Произведение обратимых отображений обратимо, при этом (/у)-1 = у-1/-1. Действительно, произведение fg обратимо как произведение биективных отображений, при этом (/<?)(у-1/-1) = = f(99-1)/-1 = //-1 = er, (9-1/-1)(/9) = 9-1(/_1/)9 = 9-19 = ех. Перестановки (подстановки) n-го порядка. Пусть X — конеч- ное множество, состоящее из п элементов. Перенумеруем эти элемен- ты и будем считать, что X = {1,2,... ,п}. При биективном отображе- нии f множества X на себя его элементы преобразуются следующим
§ 8. Отображения 49 образом: /(1) = оц, /(2) = а2, • • -, f(n) = an, где at € {1,2,..., п} и а, / aj при г ф j. Таким образом, оц, а2, - • -, — перестановка из первых п натуральных чисел. Биективное отображение / конечного множества X на себя называется перестановкой (или подстановкой) n-го порядка. Обозначение: (8-4) или / = («!, «2, ап). (8-5) В записи (8.4) отображение / чаще называют подстановкой, а в записи (8.5) - перестановкой. Очевидно, перестановка столбцов в (8.4) дает другую запись той же подстановки: Z/3i 02 ... /Зп\ \71 72 7п/ ’ (8-6) где /31, /32,.. •, 0п и 71,72,..., 7П - перестановки из первых п натураль- ных чисел и 7fc = f(J3k), к — l,n. Подстановка (8.6) называется четной, если перестановки /31,/32,... ... ,/Зп и 71,7г,... ,7п имеют одинаковую четность, т.е. если ст(а) + + сг(/3) - четно, и нечетной в противном случае. Пусть Sn - множество всех подстановок n-го порядка. Произве- дение fg подстановок f,g € Sn снова будет подстановкой из Sn (как произведение биективных отображений) и выполняется по правилу 1 2 ... п \ ./(<?(!)) /(5(2)) ... /(5(п))/’ Подстановка /1 2 V 2 п п называется тождественной, подстановка 7 72 7п /31 02 ••• 0п является обратной к подстановке (8.6).
50 Глава П. Теоретико-множественные понятия § 9. Алгебраические законы Внутренний закон композиции. Внутренним законом компо- зиции (алгебраической операцией) на множестве X называется ото- бражение * : X х X -> X, т.е. закон, посредством которого любой упорядоченной паре элемен- тов a, b € X ставится в соответствие однозначно определенный эле- мент с G X. Тот факт, что (а, Ь) с, записывается символически в виде а * Ь = с. В конкретных случаях вместо символа * используют символы , х, : и др. Примеры. 1. На множестве натуральных чисел N операции сло- жения и умножения чисел являются алгебраическими операциями, так как любые два натуральных числа можно сложить (и умножить), при этом результатом будет также натуральное число. На этом же множестве операции вычитания и деления не являются алгебраическими операциями, так как результаты выполнения этих операций не всегда будут натуральными числами. 2. На множестве вещественных чисел R операции сложения, вы- читания, умножения (но не деления) чисел будут алгебраическими операциями. 3. На множестве ненулевых вещественных чисел R\{0} операции умножения и деления (но не сложения и вычитания) будут алгебраи- ческими операциями. 4. На множестве Rmxn матриц размера т х п, где т =£ п, операции сложения и вычитания (но не умножения) матриц являются алгебра- ическими операциями. 5. На множестве Rnxn квадратных матриц п-го порядка операции сложения, вычитания и умножения матриц - алгебраические опера- ции. 6. На множестве Sn подстановок п-го порядка умножение подста- новок является алгебраической операцией. Алгебраическая операция * на множестве X называется: • коммутативной, если а ♦ b = b * a, Va, b € X, • ассоциативной, если (а * Ь) * с = а * (b * с), Va, b, с G X. Операции сложения и умножения чисел в R коммутативны и ас- социативны. Сложение матриц, как уже отмечалось в §2, также ком- мутативно и ассоциативно. Примером некоммутативной, но ассоци- ативной алгебраической операции могут служить операции умноже- ния матриц в Rnxn и суперпозиции отображений на множестве всех отображений множества X в себя. Обобщенная ассоциативность. Свойство ассоциативности ал- гебраической операции означает, что результат применения операции к трем элементам не зависит от распределения скобок, указывающих на порядок последовательного применения операции к парам элемен-
§ 9. Алгебраические законы 51 тов. Для ассоциативной операции это же верно и для любого конеч- ного числа п элементов. Теорема 9.1. Если алгебраическая операция * на множе- стве X ассоциативна, то результат ее применения к п элементам не зависит от расстановки скобок, лишь бы скобки объединяли па- ры элементов, указывая на порядок последовательного применения операции к двум элементам. Доказательство. Докажем индукцией по п. Для п = 3 оно, очевидно, верно. Пусть утверждение верно для любого к < п, дока- жем его для к = п. Пусть в выражении ai * аг * • • * ап произволь- ным образом расставлены скобки. Заметим, что последним шагом бу- дет всегда выполнение операции над двумя элементами ai ♦ • • • * at и ajt+i * * ап, 1 < к < п — 1. Так как к < п, то оба выражения не зависят от распределения скобок. Осталось показать, что (ai * • • • * a*) * (afc+i ♦ • • • ♦ ап) ~ (ai * • • • * am) ♦ (am+i * • - • * аД где 1 < m < п — 1. Пусть к < т. Обозначим а\ * • • • * а* = а, а^41 * • * ат — б, j ♦ • • * * ап — с. Надо показать, что а * (b * с) = (а * Ь) ♦ с, а это действительно верно. Элемент е € X называется нейтральным элементом множества X относительно алгебраической операции *, если Va 6 X: а*е = е*а = а. Примеры. 1. Очевидно, что число 0 € R является нейтральным элементом относительно операции сложения чисел в R, а матрица О & Rmxn - нейтральным элементом относительно сложения матриц в Rmxn. Операции вычитания чисел и матриц не обладают нейтраль- ными элементами. 2. Также очевидно, что 1 €Йи/€ Rnxn являются нейтральными элементами относительно операций умножения чисел в R и матриц в Rnxn соответственно. Операция умножения на множестве всех чет- ных чисел, являясь алгебраической операцией, не обладает нейтраль- ным элементом. Теорема 9.2. Нейтральный элемент единствен. Доказательство. Действительно, если е! и е2 - два нейтраль- ных элемента, то ej * е2 = ei, так как е2 - нейтральный элемент, и Ci * е2 = е2, так как ej - нейтральный элемент. Значит, ei = е2. Пусть * - алгебраическая операция на множестве X, обладающая нейтральным элементом е. Элемент х' называется симметричным элементом дпя элемента х € X, если х * х' — х' * х = е. Примеры. Очевидно, что любое число а € R. и любая матрица А € Rmxn обладают симметричным элементом относительно опера- ции сложения: ими являются соответственно противоположное число —а и противоположная матрица —А. Что же касается умножения чисел в R и умножения матриц в R"xn, то не каждый элемент обладает симметричным: только йену-
52 Глава П. Теоретико-множественные понятия левое число а € R и невырожденная матрица А € Rnxn имеют сим- метричные элементы: ими являются соответственно обратное число а-1 и обратная матрица А-1 (§5). Теорема 9.3. Симметричный элемент относительно ассо- циативной алгебраической операции единствен. Доказательство. Действительно, если х' и х" - два симметрич- ных элемента к элементу х € X, то х' = х' * е = х' ♦ (х * х") = (х' * х) * х" — е * х" = х". Замечание. В определении нейтрального и симметричного элементов мы считали, что т♦e = e*I = xиx♦т, = 1/*т = е. Но можно рассматривать только равенства 1»е = хих*х' = е (или е« 1 = х и х' » х = е) и говорить о правом нейтральном и правом, симметричном элементах (или о левом нейтральном и левом симметричном). Этим обобщением мы будем иногда пользоваться. Говорят, что алгебраическая операция * на множестве X обладает обратной операцией, если для любых двух элементов a, b G X урав- нения а * х = b и у * а = Ь имеют единственное решение. Наличие обратной операции означает существование двух алгеб- раических операций. Первая ставит в соответствие любой упорядо- ченной паре элементов а, Ъ € X однозначно определенный элемент х € X такой, что а * х = Ь, и называется правой обратной операцией к операции *, а вторая - элемент у € X такой, что у * а = Ь, и назы- вается левой обратной операцией. Но если алгебраическая операция * коммутативна, то х — у и обе операции совпадают и определяют обратную операцию к операции *. Очевидно, вычитание чисел в R и вычитание матриц в Rmxn - операции, обратные к операции сложения в® и Rmxn. Пусть *i и *2 - две алгебраические операции на множестве X. Алгебраическая операция *i называется дистрибутивной справа от- носительно алгебраической операции *2, если (а *2 5) *i с = (а *i с) *2 (5*i с), Уа, b,c е X; дистрибутивной слева, если а *! (Ь *2 с) = (а *i 6) *2 (а *i с), Уа, Ь, с € X; и дистрибутивной, если она дистрибутивна и справа и слева. Пример. Умножение чисел в R (матриц в Rnxn) дистрибутивно относительно сложения в R (Rnxn соответственно). Но сложение не дистрибутивно относительно умножения. Пусть на множестве X задано отношение эквивалентности. Нами уже отме- чалось в §7, что, назвав элементы множества эквивалентными, мы ожидаем, что в одной и той же ситуации они должны проявлять себя одинаково. В первую очередь это относится к алгебраическим операциям, в которых участвуют экви- валентные элементы. Алгебраическая операция * на множестве X называется со- гласованной с отношением эквивалентности ~ на этом множестве, если из того, что Qi ~ a2,bi ~ bj, следует, что щ » bi ~ аг * Ьг, т.е. алгебраическая операция, примененная к эквивалентным элементам, дает эквивалентные результаты. Это заставляет нас при введении тех или иных алгебраических операций проверять выполнение этого требования. Мы не будем останавливаться на этом, а предлага- ем читателю самому убедиться в справедливости данного свойства у всех рассма- триваемых операций.
§ 9. Алгебраические законы 53 Заметим, что в наших рассуждениях, говоря о внутренних законах компо- зиции, мы всюду использовали термин “алгебраическая операция”. Это не слу- чайно. Как правило, термин “внутренний закон композиции” используют в тех случаях, когда наряду с внутренним законом композиции рассматривается и внеш- ний закон композиции. Внешний закон композиции. Пусть X и Р - два множества. Внешним законом композиции на множестве X называется отобра- жение (•) : Р х X X, т.е. закон, посредством которого любому элементу а € Р и любо- му элементу х 6 X ставится в соответствие однозначно определен- ный элемент с G X. Тот факт, что (от, т) ь-> с, обозначается символом с = ах. Умножение матрицы A G Rmxn на число а € R является внеш- ним законом композиции на множестве Rrnxn. Умножение чисел в R можно рассматривать и как внутренний закон композиции, и как внешний. Внешний закон композиции на множестве X называется дистри- бутивным относительно внутреннего закона композиции * в X, если а(а * Ь) = аа * ab, У a G Р, Ча, b & X. Внешний закон композиции на множестве X называется дистрибу- тивным относительно внутреннего закона композиции *' в Р, если (а *' /3)а = аа * /За, Уа,/3 G Р, Уа € X. Умножение матрицы A G Rmxn на число a G R дистрибутивно как относительно сложения матриц, так и относительно сложения чисел, ибо а(А + В) = аА + аВ, (а 4- /3)А = аА + /ЗА.
Глава III. Геометрические векторы Основными объектами геометрических исследований являются точ- ки, прямые и плоскости в пространстве. С математической точки зрения логически безупречным методом введения этих понятий является аксиоматический метод, получивший завершение в трудах Гильберта. Существуют различные версии ак- сиом евклидовой геометрии. Мы оставим в стороне эти исследования, ограничившись ссылкой на Приложение к этой книге и формулиров- ками тех фактов, на которые непосредственно будем опираться. Отрезок [АВ] - это множество, состоящее из точек А и В и всех точек прямой (АВ), которые лежат между точками А и В. Каждому отрезку [АВ] можно по- ставить в соответствие неотрицательное действительное число |АВ|, называемое длиной отрезка [АВ] и удовлетворяющее следующим аксиомам: 1) аксиома тождества: |АВ| > О, VA.B, | АВ) = 0 тогда и только тогда, когда А = В; 2) аксиома симметрии: |АВ| = |ВА|, VA.B; 3) неравенство треугольника: |АВ| < |АС| + |СВ|, VA, В,С, | АВ| = | АС| -I- |СВ| тогда и только тогда, когда точка С лежит на отрезке [АВ]. Длина отрезка [АВ] называется также расстоянием между точками А и В и обозначается символом р(А,В). Любая точка А, лежащая на прямой I, разбивает эту прямую на два луча 1+ и I— с началами в точке А. Эти лучи называются дополнительными друг к другу. Точка А принадлежит обоим лучам. Две точки В А и С / А прямой I принадле- жат одному лучу тогда и только тогда, когда отрезок [ВС| не содержит точки А, и принадлежат дополнительным лучам, если точка А является внутренней точ- кой отрезка [ВС]. Луч с началом в точке А, на котором лежит точка В yt А, обозначается символом [АВ). Два луча, лежащие на одной прямой, называются одинаково направленными (сонаправленными), если их пересечение есть луч, и противоположно направлен- ными, если их пересечение не является лучом. Всякая прямая I, лежащая в плоскости Р, разбивает эту плоскость на две полуплоскости Ру и Р_, про которые говорят, что они определяются прямой I. Прямая I принадлежит каждой из этих полуплоскостей. Две точки В £ / и С £ I плоскости Р лежат в одной полуплоскости, определяемой прямой I, тогда и только тогда, когда [ВС] ПI = Й. Два луча |АВ) и [СВ), лежащие на параллельных несовпадающих прямых, принадлежат некоторой плоскости Р. Лучи [АВ) и [CD) называются одинако- во направленными (сонаправленнымй), если они лежат в одной полуплоскости, определяемой прямой АС, и противоположно направленными, если они лежат в разных полуплоскостях. Обозначение: [АВ) "Tf [CD) и [АВ) Т4 [CD) соответ- ственно. Свойство сонаправленности лучей транзитивно. Пусть Р - некоторая плоскость и А, В, О - три ее различные точки, не лежа- щие на одной прямой. Прямая О А разбивает эту плоскость на две полуплоскости. Точка В расположена в одной из них. Обозначим эту полуплоскость Ру. Анало- гично прямая ОВ разбивает плоскость Р на две полуплоскости. Пусть Р_ - по- луплоскость, в которой лежит точка А. Выпуклым углом между лучами [ОА) и [ОВ) называется пересечение множеств Ру и Р_. Обозначение: ZAOB. Итак,
§10. Направленные отрезки 55 Z.AOB = Р+ П Р_. Величина выпуклого угла АЛОВ называется углом между лучами (ОЛ) и [ОВ). Обозначение: АОВ. Очевидно, 0 < АОВ < тг. По опре- делению угол между сонаправленными лучами равен 0, а между противоположно направленными равен л. §10. Направленные отрезки В А Рис. 1 Упорядоченная пара точек (А, В) называется направленным от- резком с началом в точке А и концом в точке В.Обозначение: А$. Направленный отрезок аА изображается стрелкой, идущей из его начала в его ко- нец (рис. 1). Направленный отрезок А$ называют также связанным вектором, а точку А - точкой его приложения. Если точки А и В различны, то направленный отрезок А$ называется не- нулевым; если же точки А и В совпадают, то направленный отрезок , точнее, аА называется нулевым и обозначается символом вд. Направленный отрезок АЙ называется параллельным прямой I (плоскости В), если либо он нулевой, либо прямая АВ совпадает с прямой I (соответственно лежит в плоскости Р), либо прямая АВ параллельна прямой I (соответственно плоскости В). Обозначение: АЙ || I, АЙ || Р. Направленные отрезки AjB!, А2В2, ..., AkBk называются колли- неарными (компланарными), если существует прямая (соответственно плоскость), которой параллелен каждый из этих отрезков. Длиной направленного отрезка А& называется длина отрезка [АВ]. Обозначение: |АЙ|. Как следует из определения, длина ну- левого и только нулевого направленного отрезка равна нулю. Ненулевые направленные отрезки А^ кСЬ называются одинако- во направленными (сонаправленными), если лучи [АВ) и [СВ) име- ют одинаковое направление, и противоположно направленными, если лучи [АВ) и [СВ) имеют противоположные направления. Обозначение: А$ ft Й и АЙ СЙ соответственно. Направленные отрезки А^ и С13 называются равными, если сере- дины отрезков [АВ] и [ВС] совпадают (рис. 2). Обозначение : АВ = СЙ. Как следует из определения, нуле- вой направленный отрезок равен любому другому нулевому и только нулевому направленному отрезку. Из свойств параллелограмма (рис. 2) следует, что ненулевые на- правленные отрезки АЙ и СЙ , не лежащие на одной прямой, равны тогда и только тогда, когда четырехугольник ABDC — параллело- грамм. Для равных ненулевых отрезков, лежащих на одной прямой,
56 Глава III. Геометрические векторы возможен один из четырех вариантов расположения, изображенных на рис. 2, а и б. ----—.Г) а) [АВ] П [СО] = 0 б) [АВ] П [СВ] / 0 / / А ВОС D А О В Д1^ ^Jc С fD (? A В С , О D А В Рис. 2 Теорема 10.1. Направленные отрезки А$ и ci равны то- гда и только тогда, когда они имеют: 1) одинаковую длину: |А^| = |сД и, в случае |АВ| / О, 2) одинаковое направление: А$ ft d. Утверждение теоремы вытекает непосредственно из определения равенства направленных отрезков (рис. 3). и свойств параллелограмма А В С D 4--------------~- о в Теорема 10.2. Для любого направленного отрезка АВ и лю- бой точки С существует, и притом единственная, точка D такая, что xi = ci. Доказательство. Пусть (рис. 3) точка О - середина [ВС]. Из определения равенства направленных отрезков следует, что D - точка на прямой АО, симметричная точке А относительно точки О. Такая точка определена однозначно. Замечание. Теорему 10.2 формулируют и в других терминах: направлен- ный отрезок можно отложить от любой точки или направленный отрезок можно перенести в любую точку. Теорема 10.3. Отношение равенства направленных отрез- ков является отношением эквивалентности на множестве всех на- правленных отрезков. В самом деле, отношение равенства направленных отрезков явля- ется бинарным отношением, которое обладает свойствами: а) рефлексивности (направленный отрезок равен самому себе); б) симметричности, так как справедливы импликации |А^| = |С^| => |С^| = рЙ|, ХЁ tt ci => ci t? в) транзитивности, так как равенство длин (т.е. чисел) и сонапра- вленность направленных отрезков (т.е. лучей) обладают этим свой- ством.
§11. Свободный вектор 57 Прямая I с заданным на ней направлением называется осью. Ве- личиной направленного отрезка Al-i на оси I называется число (Ю.1) Из определения вытекают следующие факты. 1°. Нулевые направленные отрезки, и только они, имеют нулевую величину. 2°. (А&) = -(В%). Лемма Ш а л я. При любом расположении точек А, В и С на прямой имеет место равенство Доказательство. Если какие-либо две точки совпадают (на- пример, А = В), то утверждение очевидно, так как (A^t) = (А^) + + (Су1). Пусть А,'В, С - различные точки. Тогда возможны только три варианта расположения этих точек: 1) точка С лежит между точками А и В (рис. 4); I *с *в~~ I "с А в Рис. 4 2) точка А лежит между точками В и С; 3) точка В лежит между точками А и С. и Ав тт АС тт Св, откуда следует, что (Ав) — (ЛС) + (Сз втором случае имеем (В(3) = (вЛ) + (А(?) или (АВ) = Третий случай рассматривается аналогично второму. во §11. Свободный вектор Определение и терминология. Известно (теорема 10.3), что отношение равенства направленных отрезков является отношением эквивалентности на множестве направленных отрезков. Оно разбива- ет это множество на непересекающиеся классы эквивалентности (§7). Класс эквивалентности направленных отрезков называется сво- бодным вектором или просто вектором. Векторы обозначают строч- ными латинскими буквами а, Ь. Итак, вектор а = cl (А^) состоит из всех направленных отрезков, равных А$. Так как класс эквива- лентности (§7) порождается любым своим представителем, то вектор а = с! (А^) можно задать любым направленным отрезком d = Ав,
58 Глава Ш. Геометрические векторы т.е. а = cl (С 15). Если вместо направленного отрезка А15 использует- ся направленный отрезок Й = Й, то говорят, что вектор а отло- жен от точки С. Символ а = cl (А^) используется применительно к геометрическому вектору а только в тех ситуациях, когда подчерки- вается отношение этого вектора к классу эквивалентности. Обычно вместо символа а = cl (А^) используется символ а — Al5 , который в зависимости от контекста читается как "вектор а, порожденный направленным отрезком А&" или "вектор а, отложенный от точки А". Длиной вектора а (величиной вектора а на оси) называется длина (соответственно величина) порождающего его направленного отрезка; векторы ai, аг, ..., а^ называются коллинеарными (компланарны- ми), если коллинеарны (соответственно компланарны) порождающие их направленные отрезки; векторы а и b называются одинаково на- правленными (противоположно направленными), если одинаково (со- ответственно противоположно) направлены порождающие их напра- вленные отрезки. Очевидно, что эти определения корректны несмотря на произвол в выборе направленных отрезков. Линейные операции над векторами. Сложение векторов. Сумма векторов а и Ь определяется следующим образом. Отложим вектор а от произвольной точки А, пусть В - конец этого вектора, т.е. а = А^. Затем отложим вектор b от точки В, пусть b = ВС. Суммой а+ b векторов а и b называется вектор, порожденный направленным отрезком А(5 (рис. 1). Рис. 1 Это правило сложения векторов называется правилом треуголь- ника. Очевидно, что этот же вектор а4- b для неколлинеарных векто- ров а и b может быть получен (рис. 2) как диагональ параллелограм-
§11. Свободный вектор 59 ма, построенного на векторах а и Ь. Это правило сложения векторов называется правилом параллелограмма. Теорема 11.1. Операция сложения векторов обладает сле- дующими свойствами: 1) а 4- b = b+a, Va, b (свойство коммутативности); 2) (а+ Ь)+ с = a-f-(b+ с), Va, b, с (свойство ассоциативности); 3) существует такой вектор 0, называемый нулевым вектором, что а+ 0 = 0+ а — a, Va (свойство существования нейтрального элемента); 4) для любого вектора а существует такой вектор — а (называ- емый противоположным вектору а), что а+ (—а) = 0 (свойство существования симметричного элемента). Доказательство. Коммутативность и ассоциативность сложе- ния в случае неколлинеарных векторов а, Ь и с проверяются не- посредственным построением (рис. 3) векторов, входящих в левую и правую части соответствующих равенств. Случай коллинеарных век- торов предлагается рассмотреть читателю. Рис. 3 Свойства 3 и 4 очевидны: нулевым вектором 0 будет класс экви- валентности нулевых направленных отрезков, противоположным век- тору а = А/I будет вектор - а = вХ Разностью векторов b и а называется вектор х такой, что а 4- 4- х = Ь. Обозначение: Ь — а. Теорема 11.2. Для любых векторов а и b существует, и притом единственная, разность b — а. Доказательство. В качестве разности Ь— аможно взять век- тор Ь+ (- а), так как а-f- (Ь-|-(- а)) = а4-((- а)+ Ь) = (а+(-а)) + 4-b=0+b=b. Эта разность единственна, так как если с - еще одна разность, то с — с 4- 0 = (с 4- а) 4- (- а) = b 4- (— а). Замечание. Правило парал- 4- b лелограмма сложения неколлине- а / / арных векторов а и b позволя- / / ет построить и разность b — а — а как другую диагональ параллело- грамма (рис. 4). р .
60 Глава Ш. Геометрические векторы Умножение вектора на число. Произведением вектора а на вещественное число а называется вектор Ь, удовлетворяющий следующим условиям: 1) |Ь| = |а| |а| и, в случае b / О, 2) b ft а, если а > 0, и b fj, а, если а < 0. Обозначение: b = аа. Очевидно, что векторы а и аа колли- неарны и что 0 а — а 0 = 0. Теорема 11.3. Операция умножения вектора на число об- ладает следующими свойствами: для любых векторов а, Ь и чисел а,/3 € R 1) 1- а — а, 2) (а/3) а = а(/3а); . 3) (а + /3) а = а а + /3 а (свойство дистрибутивности умножения на число относительно сложения чисел); а(а+ b) = aa+ab (свойство дистрибутивности умножения на число относительно сложения векторов). Доказательство. Свойство 1 очевидно. Свойства 2 и 3 про- веряются перебором различных вариантов знаков и абсолютных ве- личин чисел а и /3. Свойство 4 вытекает из подобия треугольников (рис. 5). Здесь следует отдельно рассмотреть случай, когда векторы а и b коллинеарны. а( а + Ь) b ab а(а + Ь) (а >0) (а < 0) Рис. 5 § 12. Векторы на прямой, на плоскости и в пространстве До сих пор мы рассматривали свободные векторы в пространстве. Мы определили векторы и операции над ними, исходя из направлен- ных отрезков, начала и концы которых - любые точки простран- ства. Свойства этих операций относились к произвольным векторам пространства. Можно дать такое же определение вектора и операций над ни- ми, оставаясь в пределах некоторой плоскости или даже прямой. При этом оказывается, что все утверждения, изложенные в § 10 и 11, оста- нутся, по существу, неизменными, незначительное изменение коснет-
§12. Векторы на прямой, на плоскости и в пространстве 61 ся лишь их формулировок: в них добавится уточнение, какое именно множество векторов рассматривается. В самом деле, пусть V\, У2 и Уз - множества всех векторов на прямой, на плоскости и в пространстве соответственно. Как следует из определения суммы векторов, если а, Ь € Ух (V? или У3), то а + 4- b G Ух (У2 или У3 соответственно), т.е. операция сложения векторов не выводит за пределы данной прямой (плоскости или пространства). Значит, операция сложения векторов является алгебраической опера- цией (или внутренним законом композиции) на каждом из множеств Ух, V2 или У3 (§9). Аналогично операция умножения вектора на дей- ствительное число является внешним законом композиции на каждом из указанных множеств. Если к этому добавить еще, что каждое из них содержит нулевой вектор 0 и противоположный вектор — а к любому своему вектору а, то теоремы 11.1-11.3 можно отнести к ка- ждому из множеств Ух, У2, Уз- Сформулируем этот итог в виде сле- дующего утверждения. Утверждение. Множество Уп, где n = 1,2,3, всех векторов на прямой (на плоскости или в пространстве) наделено внутренним, законом композиции (называемым сложением) и внешним законом композиции (называемым умножением на число), которые обладают следующими свойствами: для любых а, b, с € Vn и а, (3 € R 1) а 4- b = b + а; 2) (а 4- Ь) 4- с = а 4- (Ь 4- с); 3) 30 6 У„ : а 4- 0 = а, У а € Уп; 4)УабУп 3 (-а) е Vn : а+(-а) = 0; 5) 1- а = а, Уа е Уп; 6) (о/З) а = а((3а); 7) (а -I- /3) а = а а + (3 а; 8) а( а 4- b) = a a 4- а Ь. Отметим, что, прежде чем сделать этот вывод, мы проверили лишь факт наличия законов композиции и справедливость свойств 3 и 4. Очевидно, остальные свойства не нуждаются в проверке. К свойствам 1-8 остается добавить, что операция сложения век- торов на каждом из множеств Ух, У2, V3 обладает обратной операцией, называемой вычитанием. Замечание. Свойства 1-8 говорят о том, что множества У), У2, Уз, будучи, вообще говоря, различными, обладают общими свойства- ми. Такими же свойствами обладает и совсем непохожее на них мно- жество Rmx" матриц размера т х п (§2). Очевидно, это относится и к множеству R всех действительных чисел, если операцию умно- жения чисел рассматривать как внешний закон композиции. Уже эти примеры наводят на мысль о целесообразности общего взгляда на эти множества. В следующей главе мы увидим, что рассмотренные в примерах множества - это лишь частные проявления того круга формальных понятий, который составляет основу линейной алгебры и аналитической геометрии.
Глава IV. Введение в теорию линейных пространств §13. Вещественное линейное пространство Определения. Мы будем рассматривать множества, наделенные двумя законами композиции: внутренним и внешним (§9). Внутрен- ний закон композиции будем называть сложением, а внешний - умно- жением на вещественное число. Согласно этой терминологии на этих множествах указаны два правила: • правило, посредством которого любой упорядоченной паре эле- ментов а, b множества ставится в соответствие однозначно опреде- ленный элемент а + b из этого же множества, называемый суммой элементов а и Ь\ • правило, посредством которого любому вещественному числу а и любому элементу а множества ставится в соответствие однозначно определенный элемент ал этого же множества, называемый произве- дением элемента а на число а. Непустое множество V называется вещественным, линейным, прос- транством 1, если на нем заданы два закона композиции: внутренний закон композиции, подчиненный аксиомам 1) а + b = b + a, Va, b G V (аксиома коммутативности), 2) {а -I- Ь) + с = а + (b + с), Va, b, с € V (аксиома ассоциативности), 3) 3 6 G V : а + 6 = a, Va G V, 4) V а G V 3 (—a) G V: а + (-а) = 6- внешний закон композиции, подчиненный аксиомам 5) 1 а — a, Va € V, 6) (a/3)a = a(/3a), Va,/3 G R, Va G V; и если оба закона связаны между собой аксиомами 7) (a+/3)a = aa+fla, Va,/3 G R, Va G V (аксиома дистрибутивности умножения на число относительно сложения чисел), 8) a(a + 6) = aa + ab, Va Е R,4a,b G V (аксиома дистрибутивности умножения на число относительно сложения элементов V). Линейное пространство называют также векторным прост- ранством. Отметим, что определение линейного пространства не содержит каких-либо конкретных описаний его элементов и операций над ними. Требуется только, что- бы эти операции были определены и подчинялись сформулированным выше вось- ми аксиомам, называемым аксиомами линейного пространства. Это означает, ТВ гл. XII будут рассматриваться линейные пространства общего вида, когда в операции умножения на число участвуют не только вещественные числа. Забегая вперед, отметим, что все результаты данной главы будут справедливы и в общем случае.
§13. Вещественное линейное пространство 63 что каждый раз, когда мы встречаемся с множествами, наделенными операция- ми, удовлетворяющими перечисленным аксиомам, мы вправе считать их линей- ными пространствами и переносить на них все результаты теории линейных пространств. Элементы линейного пространства называются векторами. Ис- пользование этого термина не случайно, геометричность терминоло- гии подчеркивает геометрический характер абстрактных алгебраиче- ских понятий, делает их “наглядными” и помогает уяснить, а зачастую и предвидеть не всегда очевидные факты. Вектор в называется нулевым вектором пространства, а вектор (—а) - противоположным вектору а. Нулевой вектор обозначают также символом О. Разностью векторов b и а линейного пространства V называется вектор х € V такой, что а + х — Ь. Обозначение: b — а. Примеры. 1. Геометрические пространства Vi, V2, V3. Как следует из §12, множества Vi, V2, V3 всех векторов на пря- мой, на плоскости и в пространстве являются вещественными линей- ными пространствами относительно введенных в них операций сло- жения векторов и умножения вектора на действительное число. Эти пространства будем называть геометрическими. Для изображения геометрических пространств Vi, Vj, V3 условимся все век- торы откладывать от одной фиксированной точки О на прямой (на плоскости и в пространстве соответственно). При таком соглашении каждый свободный век- тор будет однозначно определен своим концом. В этом смысле мы будем, говоря о свободном векторе, указывать только его конец. Точку О будем (пока условно) называть началом координат (рис. 1). Рис. 1 2. Пространство вещественных матриц Rrnxn. Как сле- дует из теорем 2.1 и 2.2, множество Rroxn всех вещественных матриц размера т х п является вещественным линейным пространством. 3. Арифмети ческое (координатное) пространство Rn. Пусть R" - множество всевозможных упорядоченных наборов п действи- тельных чисел, называемых арифметическими векторами (или п- мерными векторами). Если арифметические векторы записывать в виде а = (ai,... ,<4), то Rn = {a = (ai,... ,an) | e R,i = l,n}. Два арифметических вектора a = (oj,..., an) и b — (bi,...,bn) называются равными, если a, = 6,, г = l,n. Операции над арифметическими векторами вводятся следующим образом: а + b = (сц + bi,..., сц + bn), аа = (aai,... ,аап), а € R. 3 Линейная алгебра и аналитическая геометрия
64 Глава IV. Введение в теорию линейных пространств Нетрудно проверить, что Rn - вещественное линейное простран- ство относительно введенных операций. Замечание I. Отметим, что Rn - декартова n-я степень множества R всех вещественных чисел. Замечание 2. Иногда из соображений удобства мы будем записывать ариф- метические векторы в виде столбцов. Замечание 3. Арифметическое пространство Rn совпадает с простран- ством матриц Rlxn или Rnxl. 4. Пространства многочленов. Многочленом n-й степени от одной переменной t с вещественными коэффициентами называется выражение вида f(t) — а$ 4- а Л + a^t2 4-(- antn, где а< € R, i = 0, п, причем ап / 0. Число 0 € R по определению считается многочленом с нулевыми коэффициентами и называется нулевым многочленом. Сте- пень нулевого многочлена не определена. Два многочлена /(t) = £л=0 аДк и g(t) = ЬДк называются равными, если п — т и , к — 0, п. Суммой многочленов /(£) — аДк и g(t) = ЬДк называ- ется многочлен h(t) = 52*>о(а* + bk)tk< где недостающие коэффици- енты (а* или 6^) заменяются нулями. Обозначение: /(t) 4- g(t). Произведением многочлена /(t) = £2£=0 на число a G R на- зывается многочлен o/(t) = 52fc=oQafc^- Нетрудно проверить, что множества Мп всех многочленов степени не выше п и множество Мж многочленов всех степеней, пополненные нулевым многочленом, образуют вещественные линейные простран- ства. Простейшие свойства линейных пространств. Следующие свойства линейных пространств являются элементарными следствия- ми из аксиом. 1°. В линейном пространстве существует единственный нуле- вой вектор, так как если 0i и 02 ~ два нулевых вектора, то из аксио- мы 3 следует, что 0i = 4- 02 = #2- Замечание 4. Говоря о единственности нулевого вектора, мы не различаем равные векторы. В атом же смысле следует понимать и другие утверждения о единственности. 2°. Для любого вектора линейного пространства существует единственный противоположный вектор, так как если b и с - два противоположных вектора к вектору а, то, последовательно приме- няя аксиомы 3, 4, 2, получим, что Ь = Ь 4- (а + с) — (Ь 4- а) + с = с. 3°. В линейном пространстве справедливы равенствам 0а = 0, \/а € V и а0 = 0, Vo G R. Доказательство. Для доказательства первого равенства до- статочно проверить, что b + Oa = b,Vb е V. Это соотношение вытекает из следующей цепочки равенств, основанных на аксиомах 2—7: b 4- Од — (Ь + 0) + On — b 4- ((—п) 4- а) 4- 0п = (Ь 4- (—о)) 4- а 4- 0<1 = — <Ь 4- (—ц)) 4- let 4- 0а = (Ь 4- (—о)) 4- (1 4- 0)о — (Ь 4- (—о)) 4- п — — b + ((—п) 4- а) = b 4- 0 — Ь.
§14. Линейная зависимость 65 Второе равенство доказывается с помощью первого и аксиомы 6: если a - произвольный вектор пространства, то а0 = а(0а) = (аО)а = = Оа = 0. 4°. В линейном пространстве из равенства аа = 0 следует, что либо о = О, либо а = 0. В самом деле, как следует из свойства 3°, случай а = 0 возможен, если аа = 0. В случае когда о / 0, на основании свойства 3° и акси- ом 5, 6 получим /1 \ 1, ч 1Л Л а = la — —а I а = — (оса) = —0 = 0. \а ) а а 5°. В линейном пространстве для любого вектора а противопо- ложный вектор может быть получен как произведение: -а = (-1)а. Это утверждение вытекает из аксиом 3—5, 7 и свойства 3°, так как а + (—1)а = 1а 4- (—1)а = (1 — 1)а = Оа = 0. 6°. Для любой пары векторов а и Ь линейного пространства су- ществует, и притом единственная, разность Ъ — а. Доказательство. Вектор 5+(—а) является разностью Ь—а век- торов а и Ь, так как на основании аксиом 1—4 и определения разности имеем а 4- (Ь 4- (—а)) = (а 4- (—а)) -}-b~0-(-b = b. При этом если с - любая другая разность b — а, то из аксиом 2—4 следует, что с = с-г0=с4-(а4- (—а)) = (с 4- а) 4- (—а) =64- (—о)- § 14. Линейная зависимость Пусть ai,a2,... ,ak ~ векторы линейного пространства V и 0ц,о2, ... , Ofc - действительные числа. Вектор oiaj 4- o2a2 4- • • 4- o*afc на- зывается линейной комбинацией векторов ai,a2,... ,аь с коэффици- ентами Oi, о2,..., о*. Если вектор b является линейной комбинацией векторов ai, а2,. -.,а*, то говорят, что вектор Ъ линейно выражается через векторы аь а2, .., afc, при этом представление вектора Ь в виде b — oia! 4-... 4- Ofcafc называют разложением вектора b по векторам а\,а-2,... ,afc. Очевидно, нулевой вектор линейно выражается через любой вектор, так как 0 = Oa, Va € V. Через нулевой вектор не может выражаться ни один ненулевой вектор, так как ав = 0, Vo € R. Линейная комбинация называется тривиальной, если все ее коэф- фициенты равны нулю, и нетривиальной, если среди ее коэффициен- тов хотя бы один отличен от нуля. Очевидно, тривиальная комбинат ция любой системы векторов равна нулевому вектору. Система векторов ai, а2, ... , а* называется линейно зависимой, если существует нетривиальная линейная комбинация этих векторов, равная нулевому вектору, т.е. если существуют числа ai,o2,..., Ofc, одновременно не равные нулю и такие, что oyOi 4- o2a2 4-... 4- Ofcafc = 0, (14.1)
66 Глава IV. Введение в теорию линейных пространств и линейно независимой, если нулевому вектору равна только триви- альная линейная комбинация этих векторов, т.е. если из равенства (14.1) следует, что оч = сиг = ... = а*. = 0. Теорема 14.1. Система из одного вектора линейно зави- сима тогда и только тогда, когда этот вектор нулевой. Доказательство. Линейная зависимость системы из одного век- тора а равносильна тому, что аа — в при некотором а / 0, а это, в свою очередь, равносильно (§13, свойства 3, 4) тому, что а = 0. Теорема 14.2. Система векторов а\,а2,...,ак, где k > 1, линейно зависима тогда и только тогда, когда хотя бы один из век- торов этой системы линейно выражается через другие. Доказательство. Необходимость. Если система век- торов ai,a2,... ,<ц линейно зависима, то существуют числа О], а2, ... , ак, одновременно не равные нулю и такие, что оцсц + о2а2 4-... 4- 0^01 + ... 4- OfeOfc = 9. (14-2) Пусть о, 0. Тогда в силу (14.2) (—ав/а,)ал. Так как к > 1, то для вектора а, существует хотя бы один "другой" вектор системы. Достаточность. Пусть а, = Тогда, перенеся пра- вую часть этого равенства в левую, получим нетривиальную линей- ную комбинацию векторов системы, равную нулевому вектору: -О1Д1 - ... - Oi-iOj-i + la, - Oi+iai+i - ... - акак = 6. Эта теорема дает другое определение линейной зависимости системы век- торов, в которой содержится более одного вектора. Теорема 14.3. Если подсистема системы векторов линей- но зависима, то и вся система линейно зависима. Доказательство. Не ограничивая общности рассуждений, можно считать подсистемой системы векторов ai, a2,..., ая,..., ак ее первые s векторов. Из линейной зависимости ai, a2,..., as следует, что aiai 4- a2a2 + ... + аяаа — 9 для некоторых чисел a-i, о2,..., as, среди которых существует <1, 0. Тогда a^i 4- a2a2 4-... 4- asa3 4- Oa3+i 4- 4-... 4- Oa* = 9, причем a, 0. Следовательно, система векторов ai, a2, ... , as, ... , ак линейно зависима. Теорема 14.4. Любая подсистема линейно независимой си- стемы векторов линейно независима. В самом деле, если бы существовала линейно зависимая под- система, то на основании теоремы 14.3 вся система была бы линейно зависимой. Теорема 14.5. Система векторов ai,a2,... ,ak линейно не- зависима тогда и только тогда, когда любой вектор, являющийся линейной комбинацией этих векторов, имеет единственное разло- жение по этим векторам. Доказательство. Необходимость доказывается от против- ного. Пусть существует вектор Ь, который имеет два различных раз- ложения по векторам ai,a2,..., ak'. Ь — 52*=1оча,-, Ь = 52*=1a'ai,
§14. Линейная зависимость 67 Заа / a'a. Вычитая почленно одно равенство из другого, получим не- тривиальную линейную комбинацию векторов ai,a2,равную нулевому вектору. Отсюда следует линейная зависимость системы векторов ai, а2, - . , а*. Достаточность также доказывается от противного. Пусть си- стема ai,a2,... ,а* линейно зависима, тогда aiai -I- a2a2 4-... 4- a^at = 0 (14 3) для некоторых чисел aj, a2> • • > °‘к, среди которых существует аа / 0. Но, с другой стороны, Oai 4- 0а2 4- ... 4- Otijt = 0. (14.4) Мы получили два различных разложения (14.3) и (14.4) нулевого вектора 6 по векторам ai,a2,... ,а*, что невозможно. Теорема 14.6. Если система векторов aj, a2,..., а*, линей- но независима, а система а\, а2,..., а*,, 6 линейно зависима, то век- тор b линейно выражается через векторы ai,а2,..., а*,. Доказательство. Из линейной зависимости системы векторов ai, а2, ... , at, Ь следует, что aioi + a2a2 4-... 4- afeOfc 4- а^Ь = в (14-5) для некоторых чисел ai,a2,... ,ак,ао, среди которых хотя бы одно отлично от нуля. Если ад = 0, то ненулевой коэффициент as находит- ся среди чисел ai, а2,..., а*,; при этом (14.5) переходит в равенство aioi 4- очаг 4- • - 4- oikOk = 0, где аа / 0, 1 < s < к, которое противоре- чит условию линейной независимости ai, a2,... , а*. Следовательно, ао / 0; отсюда и из (14.5) получаем, что Ъ = (-оц/а0) а,. Примеры. 1. Арифметическое пространство Rn.B ариф- метическом пространстве R” единичные векторы ei = (1,0,0,...,0), е2 = (0,1,0,..., 0), (14.6) еп = (0,0,0,’..., 1) линейно независимы. Это сдедует из того, что линейная комбинация этих векторов с коэффициентами ai,a2,..., ап представляет собой арифметический вектор (вц, а2,..., а:п), который равен нулевому век- тору в = (0,..., 0) тогда и только тогда, когда а, — 0, i = 1, п. 2. Про странство многочленов. Многочлены 1, t,t2,...,tn линейно независимы. Это следует из того, что линейная комбинация этих многочленов с коэффициентами «о, aii • • > Qn представляет со- бой многочлен 52£=О который равен нулевому многочлену тогда и только тогда, когда о^ = 0, к - 0, п.
68 Глава IV. Введение в теорию линейных пространств §15. Геометрический смысл линейной зависимости Будем рассматривать геометрические векторы на прямой, на плос- кости и в пространстве. Выясним, что означает линейная зависимость геометрических векторов. Предварительно докажем два чисто гео- метрических утверждения. Утверждение 1. На прямой (на плоскости и в простран- стве) существует ненулевой вектор (соответственно два неколли- неарных и три некомпланарных вектора). Доказательство. В случае прямой достаточно взять две не- совпадающие точки О н А (рис. 1,а), тогда вектор а = оХ 0. На плоскости достаточно взять три точки О, Ан В, не лежащие на одной прямой (рис. 1,6), тогда векторы а = ОД и Ь = ой неколлинеарны. В пространстве достаточно взять четыре точки О, А, В, С, не лежа- щие в одной плоскости (рис. 1,е), тогда векторы а = О А, Ь = ой и с = ой некомпланарны. Утверждение 2. На прямой (на плоскости и в простран- стве) всякий вектор линейно выражается через любой ненулевой вектор (соответственно любые два неколлинеарных и любые три некомпланарных вектора). Доказательство. 1. Пусть а, b - векторы на прямой и а / 0. Отложим их от одной точки О прямой. Пусть а — оХ, b = ой (рис. 2,а). Если Ь = 0, то Ь — 0а. Если же О, то, взяв _( |О^|/|о1|, аПЬ, -|О^|/|ОЙ|, аПЬ, согласно определению произведения вектора на число получим, что b = о а. 2. Пусть а, Ь, с - векторы плоскости и а, b неколлинеарны (зна- чит, ни один из них не равен 0). Отложим эти векторы от одной точки О плоскости. Пусть а Ь = ой, с = ой (рис. 2,6). Если с - 0, то с = 0 а + ОЬ. Если же с ф 0, то проведем из точки С прямые, параллельные прямым ОВ и О А, до пересечения с прямыми О А и
§ 15. Геометрический смысл линейной зависимости 69 О В соответственно. Пусть Ai, Bi — точки пересечения этих прямых (существование точек пересечения следует из неколлинеарности (9/t и О В). Тогда 0(5 = ОА^+ОВ1. Отсюда и из первой части утверждения получим, что с = аа + /3Ь. 3. Пусть а, b, с, d - векторы пространства и а, Ъ, с некомпла- нарны (значит, попарно неколлинеарны и, тем более, ни один из них не равен 0). Отложим эти векторы от одной точки О. Пусть а = (9/1, b = Оё, с = (9(3, d — 015 (рис. 2,в). Так как векторы (9А, 015, (9(3 попарно неколлинеарны, то получим три плоскости ОВС, О АС и О АВ. Если d = 0, то d = 0a + 0b-f-0c. Если же d 0, то проведем из точки D плоскости, параллельные плоскостям ОВС, О АС и О АВ, до пересечения с прямыми О А, О В и ОС соответственно. Пусть Ai, Bi, Ci - точки пересечения (существование точек пересечения следует из некомпланарности О1, дВ и 0(5). Тогда оЬ = (9А? + <9в! + Ос5- Отсюда и из первой части утверждения получим, что d = aa + /3b + + 7 с. Теорема 15.1. Два вектора линейно зависимы тогда и толь- ко тогда, когда они коллинеарны. Доказательство. Необходимость. Пусть векторы а, b ли- нейно зависимы, тогда в силу теоремы 14.2 один из них линейно выраг жается через другой. Пусть b = аа. Отсюда и из определения про- изведения вектора на число следует коллинеарность а и Ь. Достаточность. Пусть а и b коллинеарны, т.е. параллельны одной прямой. Будем считать, что а 0 (так как если а = 0, то линейная зависимость а, b следует из теорем 14.1 и 14.3). Отложим а, b от одной точки. Тогда они окажутся на одной прямой, при этом, согласно утверждению 2, Ь = а а. В силу теоремы 14.2 отсюда следует линейная зависимость а, Ь. Следствие 1. Любые два (значит, и более) вектора прямой линейно зависимы.
70 Глава IV. Введение в теорию линейных пространств Теорема 15.2. Три вектора линейно зависимы тогда и только тогда, когда они компланарны. Доказательство. Необходимость.Пусть векторы а, Ь, с линейно зависимы, тогда один из них линейно выражается через дру- гие. Пусть с = аа + /ЗЬ. Если а и b коллинеарны, то а, Ь, с кол- линеарны и тем более компланарны. Если же а и b неколлинеарны, то отложим векторы а, Ь, с от одной точки (рис. 2,6). Тогда вектор с, являясь диагональю параллелограмма, построенного на векторах а а и /3 Ь, окажется в той же плоскости, что и а, Ь. Значит, а, Ь, с компланарны. Достаточность. Пусть а, Ь, с компланарны, т.е. параллель- ны одной плоскости. Будем считать, что а, Ь неколлинеарны (так как если а, Ь коллинеарны, то линейная зависимость а, Ь, с следует из линейной зависимости подсистемы). Отложим а, Ь и с от одной точки. Тогда они окажутся в одной плоскости и на основании утвер- ждения 2 имеем с = а а + /3 Ь. В силу теоремы 14.2 отсюда следует, что векторы а, Ь, с линейно зависимы. Следствие 2. Любые три (значит, и более) вектора плоскости линейно зависимы. Теорема 15.3. Любые четыре вектора линейно зависимы. Доказательство. Будем считать, что в четверке векторов а, Ь, с, d векторы а, Ь, с некомпланарны (так как если а, Ь, с ком- планарны, то линейная зависимость а, b, с, d вытекает из линейной зависимости подсистемы). Тогда на основании утверждения 2 имеем d = oa + j3b+7C. В силу теоремы 14.2 отсюда следует, что векторы а, Ь, с, d линейно зависимы. Итак, понятие линейной зависимости является обобщением поня- тий коллинеарности и компланарности геометрических векторов. Трудно не заметить логическое "однообразие" формулировок и доказательств изложенных выше теорем. Мы не старались уходить от повторений, чтобы под- черкнуть, как похожи по своей структуре три различных линейных пространства У1, У2 и Уз - векторов на прямой, на плоскости и в пространстве. Резюмируем полученные результаты. Итак, для п = 1,2,3 в линейном пространстве Уп 1) существует линейно независимая система из п векторов, а любая система из большего числа векторов линейно зависима; 2) существует линейно независимая система из п векторов, а любой вектор пространства Уп линейно выражается через них; 3) максимальное число линейно независимых векторов равно п. Мы выделили общие свойства, характерные для различных линейных прост- ранств У1, У2 и У3. Возникает естественный вопрос, не являются ли они общими для всех линейных пространств. Прежде чем ответить на этот вопрос, обратимся вновь к матрицам. § 16. Ранг матрицы Понятие линейной зависимости векторов тесно связано с понятием матрицы. Если рассматривать строки и столбцы матрицы А б К'пхп как векторы арифмети- ческих пространств R" и Rm, то оказывается, что одна из важнейших характери- стик матрицы определяется свойством линейной зависимости ее строк и столбцов. В свою очередь, эта характеристика будет удобным аппаратом дальнейшего ис- следования линейных пространств.
§16. Ранг матрицы 71 Ранг матрицы и линейная зависимость. Рангом ненулевой матрицы называется максимальный порядок ненулевых миноров этой матрицы. Ранг нулевой матрицы по определению считается равным нулю. Обозначение: rg A, rangA,гА и др. Из определения вытекают следующие факты: 1) ранг матрицы не превосходит ее размеров: если А € Rmxn, то rg А < min(m, п); (161) 2) равенство rg А = г > 0 равносильно выполнению двух условий: а) в матрице А существует ненулевой минор r-го порядка, б) любой минор более высокого порядка равен нулю. Пусть rgA = т > 0. Любой ненулевой минор r-го порядка этой матрицы называется базисным минором, а строки и столбцы, в ко- торых расположен базисный минор, - базисными строками и столб- цами. Разумеется, у матрицы может существовать не один базисный ми- нор, но все они имеют один и тот же порядок, равный рангу этой матрицы. Теорема 16.1 (о базисном миноре). Базисные строки (столбцы) линейно независимы. Любая строка (столбец) является линейной комбинацией базисных строк (столбцов). Доказательство. Докажем столбцовый вариант теоремы. Пусть А = £ Rmxn и rg А = г > 0. Не нарушая общности рас- суждений, будем считать, что базисный минор Мг находится в левом верхнем углу. Тогда базисными столбцами будут первые г столбцов: ,0,2-) • • э Линейная независимость базисных столбцов доказывается от про- тивного. В самом деле, пусть это не так. Тогда на основании теоре- мы 14.2 один из базисных столбцов является линейной комбинацией других базисных столбцов. Но тогда и в миноре МТ один из столбцов будет линейной комбинацией других столбцов и МГ — 0. Это проти- воречит тому, что Мг - базисный минор. Пусть теперь а* - произвольный столбец матрицы А. Покажем, что он является линейной комбинацией столбцов щ, aj,.. ., аг. Бу- дем считать, что k > г (в случае k < г утверждение очевидно, так как ak = Oai 4- ... + 0а*_1 4- a*, 4- 0afc+i 4- ... 4- 0ar). Найдем числа ai,a2, ,ar € R такие, что a^ = 52j=1asas или, в поэлементной записи, Г a-ik = 1 = 1,т. (16.2) Л=1 Для этого составим вспомогательную матрицу а11 . • air aut А, = drl .. Orr ark . ап • Qir ait .
72 Глава IV. Введение в теорию линейных пространств полученную окаймлением минораМг г-й строкой и Jc-м столбцом мат- рицы А. Очевидно, |А»| = 0, i = l,m, так как в случае, когда г < г, матрица Д, содержит две одинаковые строки, а в случае, когда i > г, |Д,| является минором (г + 1)-го порядка матрицы А ранга г. Разло- жив |Д,| по последней строке, получим 0 = алА1+а<2-^2 + - • .+ай-Аг+ + омМг, где А], Л2,. -., Аг, являясь алгебраическими дополнениями к элементам вычеркиваемой строки, не зависят от г. Отсюда, полагая аа = -А,/МГ, s — 1,г, приходим к (16.2). Следствие 1 (необходимое и достаточное условие равенства нулю определителя). Определитель матрицы равен нулю тогда и только тогда, когда какая-либо ее строка (столбец) является ли- нейной комбинацией других ее строк (столбцов). Доказательство. Достаточность доказана в §4 (свойство 8). Необходимость вытекает из теоремы о базисном миноре, так как из равенства | А| = 0 следует, что rg А < п и, значит, в матрице А имеется хотя бы одна небазисная строка (столбец), которая является линейной комбинацией других (т.е. базисных) строк (столбцов). Пусть в линейном пространстве даны две системы векторов. Если каждый вектор одной системы линейно выражается через векторы другой, то говорят, что первая система линейно выражается через вторую. Очевидно, что “линейная выражаемость” обладает свойством транзитивности, т.е. если система векторов <ij,..., а*, линейно выра- жается через bi,..., bn, а система векторов Ь\,..., Ьп - через щ,..., Сщ, то ai,..., at линейно выражается через Ci,..., Ст- Теорема 16.2. Если в линейном пространстве большая си- стема векторов линейно выражается через меньшую, то большая система линейно зависима). Доказательство. Пусть ai,... ,am и bi,...,bn - две системы векторов в линейном пространстве, m > п и a, = г = Г m- Тогда в матрице С = си . Cfnl • • • ^тп . число строк больше числа столбцов. Из (16.1) и условия теоремы сле- дует, что rg С < п < т. Значит, в матрице С существует хотя бы одна небазисная строка (например, г-я), которая линейно выражается через другие строки. Тогда из свойств операций в пространстве Rn следу- ет, что вектор ai линейно выражается через другие векторы системы щ,..., ат. Отсюда и из теоремы 14.2 следует линейная зависимость системы векторов ai,..., ат. Теорема 16.3. Ранг матрицы равен максимальному числу ее линейно независимых строк (столбцов). 1 Теорема представляет собой другую формулировку теоремы, известной как “основная теорема о линейной зависимости” [14).
§16. Ранг матрицы 73 Доказательство. Пусть rgA = г и г > О (случай г = 0 оче- виден). Тогда в матрице А существуют г линейно независимых строк (столбцов) - это ее базисные строки (столбцы). При этом любая си- стема из большего числа строк (столбцов) линейно зависима на осно- вании теорем 16.1, 14.2. Следствие 2. rgA = rgAT. Замечание 1. Теорема 16.3 дает два новых определения ранга матрицы. Теорема 16.4. Если все строки (столбцы) матрицы А ли- нейно выражаются через строки (столбцы) матрицы В, то rgA < rgB. Доказательство. Пусть rgA = г, rgB = s и пусть сц,... ,аг и bi,...,b9 - базисные столбцы матриц А и В. Докажем, что г < з. Пусть г > з, тогда согласно условию теоремы система aj,..., аг ли- нейно выражается через систему столбцов матрицы В, которая, в свою очередь, в силу теоремы 16.1 линейно выражается через систе- му базисных столбцов bi,...', b$. Отсюда следует, что aj,..., аТ линей- но выражается через bj,...,5e, причем г > з. Из теоремы 16.2 вы- текает линейная зависимость ai,... ,аг. Это противоречит тому, что СЦ,..., От - базисные столбцы. Теорема 16.5. Ранг произведения матриц не превосходит рангов сомножителей. Доказательство. Пусть С = АВ. Из (2.3) и (2.2) следует, что строки матрицы С линейно выражаются через строки матрицы В, а столбцы С - через столбцы матрицы А. Отсюда в силу теоремы 16.4 вытекает, что rg С < rg В, rg С < rg А. Ранг матрицы и элементарные преобразования. Теорема 16.6. Ранг матрицы не изменяется при умноже- нии ее на невырожденную матрицу. Доказательство. Пусть С = АР, |Р| 0. Тогда на основа- нии теоремы 16.5 имеем rgC < rgA. С другой стороны, матрица Р обратима (теорема 5.2) и А = СР~1. Снова воспользовавшись теоре- мой 16.5, получим, что rgA < rgC. Оба этих неравенства говорят о том. что rg С = rg А. Аналогично доказывается, что rg QA = rg А, если IQI # о. Теорема 16.7. Элементарные преобразования матрицы не изменяют ее ранга. Доказательство. Это утверждение следует из теоремы 3.2 и невырожденности матриц (3.1) элементарных преобразований (|Р0|=-1, |А|=а^0,|То| = 1)-« Теорема 16.8. Ранг матрицы не изменится, если из си- стемы ее строк (столбцов) вычеркнуть или приписать строку (со- ответственно столбец), которая является линейной комбинацией других строк (соответственно столбцов).
74 Глава IV. Введение в теорию линейных пространств Доказательство. Рассмотрим вариант теоремы, относящийся к вычеркиванию строки. Прежде чем вычеркивать строку, являю- щуюся линейной комбинацией других строк, вычтем из нее эту ли- нейную комбинацию. Тогда вычеркиваемая строка станет нулевой, а ранг матрицы согласно теореме 16.7 не изменится. Затем вычеркнем нулевую строку. При этом ранг матрицы останется прежним, так как нулевая строка не влияет на порядок ее ненулевых миноров. Анало- гично доказываются другие варианты теоремы. Метод Гаусса вычисления ранга. Теоретическую основу это- го метода для решения данной задачи (см. §4) составляют следующие факты: - ранг верхней (нижней) трапециевидной матрицы равен количе- ству ненулевых строк (соответственно столбцов); - элементарные преобразования матрицы не изменяют ее ранга (теорема 16.7); - любая матрица элементарными преобразованиями строк и столб- цов приводится к трапециевидной форме (теорема 3.1). Метод Гаусса вычисления ранга матрицы состоит в приведении этой матрицы элементарными преобразованиями к верхней (нижней) трапециевидной форме и подсчете ее ненулевых строк (столбцов). Отметим, что этот метод почти копирует метод Гаусса вычисления определи- теля, отличие лишь в том, что в данной задаче он реализуется несколько проще, так как никакое элементарное преобразование не изменяет ранга матрицы. Замечание 2. Среди других методов вычисления ранга выделим метод окаймления миноров. Минор Mk+i (к 4- 1)-го порядка называется окаймляющим минор JVfjt к-го порядка, если получается из Mk+i вычеркиванием одной стро- ки и одного столбца. Метод окаймления миноров основан на следующем утвер- ждении (докажите!): если в матрице А существует ненулевой минор Мг г-го порядка, а все окаймляющие его миноры равны нулю, то rg А = г. Метод окайм- ления миноров состоит в поиске такого минора Мг путем перебора. Безусловно, он уступает методу Гаусса из-за большого объема требуемых вычислений, однако в некоторых случаях бывает полезным. Во всяком случае идея окаймления матрицы лежит в основе многих методов вычислительной алгебры. Эквивалентные матрицы. Две матрицы А, В € Rmxn называ- ются эквивалентными, если существуют невырожденные матрицы Р и Q такие, что А = PBQ. Обозначение: А ~ В. Теорема 16.9. Эквивалентность матриц является отно- шением эквивалентности на множестве матриц R’nx”. Доказательство. В самом деле, рефлексивность отношения следует из того, что А = 1тхтА1п<п, VA € Rmx"; симметричность - из того, что если А = PBQ, то В = P~1AQ~l; транзитивность - из того, что если А = PyBQi, В = P2CQ2, то А = P1P2CQ2Q1 = PCQ, где Р = PiP2, Q = Q2Q1 Теорема 16.10. Любая ненулевая матрица А €. Rmxn ран- га г эквивалентна матрице Ir € Rmx" вида
§16. Ранг матрицы 75 ' 1 0 ... О О 1 ... О о О О ... 1 о о (здесь все элементы, кроме первых г диагональных элементов, рав- ных 1, равны 0). Доказательство. Покажем, что матрица А элементарными пре- образованиями строк и столбцов приводится к виду 1Г. В самом деле, строчный вариант основного процесса (§3) приводит ее к верхней сту- пенчатой форме. Если к получившейся матрице применить столбцо- вый вариант основного процесса, то придем к диагональной матрице. Так как элементарные преобразования матрицы не изменяют ее ранга, то ровно г первых диагональных элементов этой матрицы отличны от нуля. Разделив каждую из первых г строк на диагональный элемент, получим матрицу 1Т. На языке матриц элементарных преобразований это означает, что существуют матрицы элементарных преобразо- ваний Qi,--,Qk и Pi,... ,PS такие, что Ir = Qk .. .Q1AP1.. .Ps (теорема 3.2). Положив Q = Qk Qi и Р = Pi - Pa, получим, что 1Г — QAP, где |Q| Ф 0, |Р| / 0 в силу невырожденности матриц элементарных преобразований. Теорема 16.11. Две матрицы А,В € Rmxn эквивалентны тогда и только тогда, когда их ранги совпадают. Доказательство. Необходимость вытекает из определе- ния и теоремы 16.6. Достаточность следует из теоремы 16.10 и транзитивности отношения эквивалентности. Скелетное разложение матрицы. Теореме о базисном миноре можно дать чисто матричную формулировку. Теорема 16.12. Любая матрица А е Rmxn ранга г может быть представлена в виде А = ВС, (16.3) где В е Rmxr, С & Rrxn. Доказательство. Для получения разложения (16.3) достаточ- но взять в качестве столбцов матрицы В базисные столбцы матри- цы А. Так как любой столбец матрицы А является линейной комби- нацией столбцов матрицы В aj = cijbi + ... + Crjbr, j = 1, n, то коэффициенты cij, c^j, . •, Crj образуют j-й столбец матрицы С (j=TJi, см. (2.2), (2.3)).
76 Глава IV. Введение в теорию линейных пространств Представление (16.3) называется скелетным разложением матри- цы А. Отметим, что в скелетном разложении rgB ~ rgC = г, так как rgA < rgB, rg А < rgC. Скелетное разложение можно трактовать и в строчном варианте: строки матрицы С - это базисные строки матрицы А, через которые линейно выражаются все строки матрицы А. Тогда коэфициенты этих линейных комбинаций образуют строки матрицы В. Интересен и матричный вариант скелетного разложения: если Ьг,... ,ЬГ - базисные столбцы, а с\,... ,<4 - базисные строки матри- цы А, то (16.4) i=l т.е. матрица А € RTOXn может быть представлена как сумма г ма- триц размера т х п, являющихся произведением столбца на строку. Это доказывается следующим образом. Если В» € R’nxr - матрица, у которой г-й столбец совпадает с г-м столбцом матрицы В, а все осталь- ные столбцы нулевые, С, € Rrxn - матрица, у которой г-я строка со- впадает с г-й строкой матрицы С, а все остальные строки нулевые, то B = Bi+...+Br, С = (?!+...+Cr, BiCi = b^ BiCj = 0 (i/j) и Г г А = (Bj + ... + Вг){Сг + ... + Сг) = 52 = 52bi^. i=l i= 1 § 17. Базис и размерность Определения. Базисом линейного пространства называется упорядоченная линейно независимая система векторов пространства, через которую линейно выражается любой вектор пространства. Со- гласно этому определению система векторов .., еп линейного про- странства V образует базис V, если • ei,..., еп линейно независима; • для любого вектора х Е V существуют числа xi,...,xn такие, что х = xiei + ... + х„еп. Как показано в §15, любой ненулевой вектор является базисом линейного пространства У) векторов на прямой, любая пара некол- линеарных векторов - базисом пространства Vz векторов плоскости, любая тройка некомпланарных векторов - базисом пространства V-j.
§17. Базис и размерность 77 Теорема 17.1. Система векторов ei,..., еп линейного про- странства является его базисом тогда и только тогда, когда она образует максимальную линейно независимую систему векторов этого пространства. Доказательство. Необходимость. Базис пространства явля- ется максимальной линейно независимой системой векторов в этом пространстве, так как любая большая система векторов линей- но выражается через этот базис (т.е. через меньшую систему) и на основании теоремы 16.2 линейно зависима. Достаточность. Пусть в\,...,еп - максимальная линейно не- зависимая система векторов пространства V, тогда для любого век- тора х е V система векторов ei,... ,еп,х линейно зависима, так как содержит более чем п векторов. Из теоремы 14.6 следует, что вектор х является линейной комбинацией е^,... ,еп. Следовательно, векторы ei,...,еп образуют базис пространства V. Теорема 17.1 дает другое определение базиса. Итак, все базисы одного линейного пространства состоят из одина- кового числа векторов, равного максимальному числу линейно неза- висимых векторов этого пространства. Это означает, что число век- торов базиса является характеристикой не столько базиса, сколько самого пространства. Число векторов базиса называется размерно- стью линейного пространства. Размерность нулевого пространства по определению считается равной нулю. Обозначение: dimV. Из теоремы 17.1 следует, что размерность линейного пространства рав- на максимальному числу линейно независимых векторов этого про- странства. Линейное пространство размерности п, где п - целое не- отрицательное число, называется n-мерным пространством. Любое n-мерное пространство называется конечномерным линейным прост- ранством. Конечномерными пространствами не исчерпываются все линей- ные пространства: не во всяком пространстве можно указать макси- мальное число линейно независимых векторов. Линейное простран- ство называется бесконечномерным. если для любого k € N в нем найдется линейно независимая система из к векторов. Из определе- ния размерности и теоремы 17.1 вытекают следующие утверждения. Утверждение 1. В п-мерном пространстве любые п линейно независимых векторов образуют базис. Утверждение 2. В п-мерном пространстве любая система из s векторов, где s > п, линейно зависима. Примеры. 1. Геометрические пространства Vj, V2, V3. Из результатов §15 следует, что dim Vn = п, где п = 1,2,3. 2. Арифметическое пространство Rn. В пространстве R” единичные векторы (14.6) образуют базис, так как они линейно не- зависимы и, как нетрудно проверить, любой вектор а = (ai,...,a„) пространства R” линейно выражается через них: а = aiej +.. . + апеп. Итак, dimRn — п.
78 Глава IV. Введение в теорию линейных пространств 3. Пр остранство матриц R"1*”. Рассмотрим матрицы Г12, , Е\п, E2i, , Emn, у которых все элементы равны нулю, кроме одного: в матрице Eij элемент в позиции (i, j) равен единице. а) Эти матрицы линейно независимы, так как из того, что m п ^11 £ 52 aijEij = i=1>=1 L aml ^ln = 0, ^mn - следует, что al7 = 0, i = l,m, j = l,n. б) Любая матрица A — (atj) € Rmxn является линейной комбина- цией этих матриц (как видно из п."а"). Следовательно, эти матрицы образуют базис Rmxn и dimRr/lxn = mn. 4. Пространство многочленов Мп. Многочлены l,t,t2, ... , tn образуют базис Мп, так как они линейно независимы (§14), а любой многочлен p(t) = a# 4- ait + ... +'antn € Mn является линей- ной комбинацией этих многочленов с коэффициентами ао,аь... Итак, dim Mn — n 4- 1. 5. Пространство Моо многочленов всех степеней (§13, при- мер 4) бесконечномерно, так как для любого к G N можно указать к линейно независимых многочленов: 1, t, t2,..., tk-1. Координаты вектора. Базис играет большую роль в изучении линейного пространства. С его помощью абстрактные векторы мож- но задавать в виде совокупности чисел, а операции над векторами сводить к операциям над числами. Теорема 17.2. Разложение вектора по базису единствен- но. Это утверждение вытекает из теоремы 14.5. Коэффициенты разложения вектора по базису называются коорди- натами вектора в этом базисе. Из определения базиса и теоремы 17.2 следует, что каждый вектор имеет координаты, при этом два вектора равны тогда и только тогда, когда равны их координаты. Обозначение. Если е,,.,. ,еп - базис пространства и х — 4-... 4~ *Гп^п (171) то будем обозначать через хе вектор-столбец из координат вектора х в этом базисе: Tg = [ ] • (17.2) Столбец хе называют координатным столбцом вектора х в базисе ei,..., еп. Положим е = (ei,e2,... ,еп). (173) Символ е будем понимать как обозначение базиса ej,..., еп и как матрицу-строку (e^ej,... ,еп). В обозначениях (17.2) и (17.3) раз- ложение (17.1) может быть записано как произведение строки е на столбец хе- х - е.хе. (17.4)
§17. Базис и размерность 79 Теорема 17.3. При сложении векторов их координаты в одном базисе складываются, а при умножении вектора на число его координаты умножаются на это число. Доказательство. Пусть х — у — Тогда из аксиом линейного пространства следует, что х + у = и ах = 52”-! axid. Следовательно, (х + у)е = хе + уе и (ах)е = ахе- Переход к другому базису. Пусть е = (ei,e2,... , е^) и f = = (/1, /г, - • > /п) _ Два базиса n-мерного пространства V. Выясним, как меняются координаты вектора при переходе от базиса е к бази- су /• Векторы второго базиса, как векторы пространства V, разлагают- ся по базису е; пусть /1 = СцС1 + С21Й2 + ... + cnien, /2 = С12С1 + С22в2 + . . . + Сп2еп, fn — CjnCi + C2nO2 + Опп^-п- Коэффициенты с^ этих разложений образуют матрицу С = (C.J € Rnxn, (17.6) которая называется матрицей перехода от базиса е к базису f. Обозначение: С или Се_>/. Замечание. Соотношения (17.5) в обозначениях (17.3) и (17.6) могут быть записаны компактно в виде f = еС. (17.7) Теорема 17.4. Матрица перехода к другому базису не вы- рождена. Доказательство. Пусть |С| = 0. Тогда (теорема 16.1, след- ствие) один из столбцов матрицы С является линейной комбинацией других ее столбцов. В силу свойства линейности координат отсюда следует, что один из векторов /1,..., fn линейно выражается через другие векторы этой системы. Это противоречит линейной независи- мости /1, ... , fn- Теорема 17.5. Если С - матрица перехода от базиса е к базису f, то С-1 - матрица перехода от базиса f к базису е. Доказательство. Пусть / = еС. Умножив обе части этого ра- венства на С-1, получим, что е = fC~\ откуда в силу (17-7) следует, что С~1 - матрица перехода от базиса / к базису е. Теорема 17.6. Координаты вектора х в базисах е и f свя- заны между собой соотношением xe = Cxj, (17.8) где С - матрица перехода от базиса е к базису f. Доказательство. Из (17.4) и (17.7) имеем, что х — ехе и х = — fxj — (eC)if — e(Cxf). Отсюда в силу единственности разложения по базису получаем (17.8).
80 Глава IV. Введение в теорию линейных пространств § 18. Линейное подпространство и линейное многообразие Линейное подпространство. Непустое подмножество L прост- ранства V называется линейным подпространством пространства V, если оно само является линейным пространством относительно за- конов композиции, действующих в V. Теорема 18.1. Непустое подмножество L пространства V является линейным подпространством этого пространства то- гда и только тогда, когда имеют место импликации: a,b Е L => а + b 6 L; fig i\ aeL.oeR => aaeL. Доказательство. Необходимость очевидна, так как если L - линейное пространство, то результаты выполнения операций над элементами из L находятся в L. Достаточность. Соотношения (18.1) говорят о том, что опера- ции сложения и умножения на число являются законами композиции в L. Остается проверить, что они подчиняются всем аксиомам ли- нейного пространства. В действительности же необходимо проверить только аксиомы нуля и противоположного элемента, так как выпол- нение остальных аксиом очевидно. Возьмем произвольный элемент а € L, тогда Оа = 0 и (—1)а = —а. Из (18.1) следует, что 6 € L и —а € L. Итак, L - линейное подпространство пространства V Свойства (18.1) называют свойствами замкнутости множества L относительно указанных операций. Примеры. 1. Каждое линейное пространство обладает двумя под- пространствами: нулевым подпространством (состоящим из одного нулевого вектора) и самим пространством. Эти подпространства на- зываются тривиальными. 2. Геометрическое пространство У) векторов на прямой имеет два тривиальных подпространства. Геометрическое пространство V? век- торов на плоскости, кроме тривиальных подпространств, имеет беско- нечно много нетривиальных: каждое из них является пространством всех векторов, концы которых лежат на прямой, проходящей через начало координат (или если отойти от соглашения об откладывании всех векторов от начала координат, то пространством всех векторов, параллельных некоторой прямой). В геометрическом пространстве Уз векторов пространства каждая прямая и каждая плоскость, проходя- щие через начало координат, определяют линейное подпространство. 3. В пространстве многочленов Мп каждое пространство М^, где 0 < к < п, образует линейное подпространство. Линейное аффинное многообразие. Примеры линейных под- пространств в геометрических пространствах дают геометрический образ подпространства как прямой или плоскости, проходящей через
§18. Линейное подпространство и линейное многообразие 81 начало координат. Возникает естественный вопрос, что же будет ана- логом других прямых и плоскостей в произвольном линейном прост- ранстве. Ответим на этот вопрос. Пусть V - линейное пространство, L - некоторое его подпростран- ство, то _ некоторый вектор пространства V. Множество Н всевоз- можных векторов вида то + х, где х € L, называется линейным мно- гообразием (или линейным аффинным многообразием, или линейным точечным многообразием) пространства V, полученным сдвигом подпространства L на вектор xq. Вектор то называется вектором сдвига, а подпространство L — направляющим подпространством ли- нейного многообразия Н. Обозначение: Н = х0 + L. Итак, xQ + L = {tq + € L}. Очевидно, линейное подпространство L является частным случаем линейного многообразия, когда вектор сдвига xq € L. Рис. 1 Пример. Пусть на плоскости V2 задано некоторое подпростран- ство L, т.е. совокупность всех векторов х, концы которых лежат на прямой, проходящей через начало координат. И пусть хо - некоторый фиксированный вектор плоскости (рис. 1). Тогда нетрудно показать, что линейное многообразие Хо 4- L есть множество векторов, концы которых лежат на прямой, полученной из прямой L сдвигом ее на вектор хо- Из определения вытекают следующие факты. 1°. Вектор сдвига xq принадлежит линейному многообразию, так как х0 = хо + 9, 9 G L. 2°. Разность двух векторов линейного многообразия принадле- жит направляющему подпространству, так как если zi — то + я, х е L, z2 = + у, у е L, то zi — г? = х - у е L. Т е о р е м а 18.2. Два линейных многообразия Hi = Ху + Li и Н2 = х2 + L2 совпадают тогда и только тогда, когда Li = L2 = L и з?1 — х2 € L. Доказательство. Необходимость. Пусть Hi = Н2, тогда Ху € Н2 и, в силу свойства 2°, xj — х2 € L2. Покажем, что Lj = L2. Для произвольного вектора х € Li имеем Xi 4-i € Hi. Так как Hi = Н2, то
82 Глава IV. Введение в теорию линейных пространств существует вектор у € L2 такой, что ац +- х = аг2 + у. Таким образом, х = (х2 — ii) + у, где х.2 - xi е L2, у & L2- Отсюда следует, что х е Ь2 и Li С Ь2. Аналогично доказывается, что L2 С L\. Оба вложения говорят о том, что L1 — Ь2. Достаточность. Пусть Li = L2 = L и ii — х2 G L. Тогда для произвольного вектора z G Hi имеем z — Xi + х, где х € L, или z = х2 + (®1 + х е L. Так как Ху — х2 € L и х € L, то (xi — х2) + + х € L, следовательно, z € Я2 и Hi с Я2. Аналогично получаем, что Я2 С Н{. Это означает, что Hi = Я2. Следствие 1. Вектором сдвига может служить любой век- тор линейного многообразия. Действительно, если Xi - произвольный вектор линейного много- образия Н = Xq + L, то Xi — xq € L и Н = Х1 + L. Следствие 2. Линейное многообразие может быть получено сдвигом единственного направляющего подпространства. Это ут- верждение непосредственно вытекает из теоремы. Следствие 2 позволяет переносить некоторые характеристики на- правляющего подпространства на само линейное многообразие. Раз- мерностью линейного многообразия называется размерность его на- правляющего подпространства. Обозначение: dim Я. Линейное многообразие размерности единица называется прямой в линейном пространстве, размерности (п — 1), где п = dimV, - гиперплоско- стью, а размерности k, 1 < к < п — 1,- к-мерной плоскостью. Пример. Из определения следует, что прямая на плоскости V2 и плоскость в пространстве V3 - гиперплоскости в пространствах V2 и V3. Естественно ожидать, что, представляя собой один и тот же объект, они обладают общими свойствами. В этом мы убедимся в по- следующих главах.
Глава V. Векторная алгебра От алгебраического определения координат вектора перейдем к их геометрическому описанию. Рассмотрим линейные пространства Vi, Рг> векторов на прямой, на плоскости и в пространстве. В §15, 17 было доказано, что: • dim Vi = 1, а любой ненулевой вектор ei является базисом Vj, • dim V2 = 2, а любая пара неколлинеарных векторов е2, е2 явля- ется базисом V2, • dim V3 = 3, а любая тройка некомпланарных векторов ех, е2, е3 является базисом V3. При доказательстве теорем §15 практически показано, как нахо- дятся координаты векторов в этих пространствах. Вернемся к этому вопросу. § 19. Координаты вектора 1. Пусть ei - базис Vi и а - произвольный вектор из Vj. Отло- жим эти векторы от одной точки О прямой Vj (§15, рис. 2,а), так что ex = О&, а = О Аг, тогда а = xej, где |oaJ|/|o3|, -|од1|/|д^|, аТТ ег, afj, ev (19-1) Введем на прямой V) направление: пусть положительное напра- вление на прямой совпадает с направлением базисного вектора ei- Тогда согласно (19.1) и (10.1) получим _ (а) 1е1| |ехГ (19-2) Ось, положительное направление которой совпадает с направле- нием вектора е, будем называть осью, определенной вектором е. 2. Пусть , е2 - базис V2 и а - произвольный вектор из V2. От- ложив эти векторы от одной точки О плоскости Ц (§15, рис. 2,6), так что ei = OEi, е2 = ОЕ2, а = и введя направления на прямых OEi и ОЕ2, совпадающие с направлениями базисных векторов ei и е2, получим в соответствии с (19.2), что а — iei + уе2, _ (ОЛ0 _ (ОЛ2) 1 |ei| ’ У |е2| (19.3)
84 Глава V. Векторная алгебра где Ai, А2 - проекции точки А на прямые OEi и 0Е3, параллельные соответственно прямым ОЕ3 и OEi. 3. Пусть ei, е2, eg - базис V3 и а - произвольный вектор из V3. Поступая аналогично (§15, рис. 2,е), получим а = xei + уе2 + ze3, (ол!) (ол^) (ол!) 1 |ei| ’ У |е2| ’ Z |е3| где Л1, Л2, Л3 - проекции точки Л на прямые OEi, ОЕ3 и ОЕ3, параллельные соответственно плоскостям ОЕ2Е3, ОЕ\Е3 и ОЕ\Ез- § 20. Координаты точки Аффинная система координат. Пусть в пространстве V3 (на плоскости V3 или на прямой Ц) зафиксирована некоторая точка О, называемая полюсом. Для любой точки Л вектор гд - О& назы- вается радиус-вектором точки А относительно полюса О. Задание точки ее радиус-вектором определяет, очевидно, биективное отобра- жение. Тот факт, что точка Л имеет радиус-вектор г, обозначают символом Л(г). Если в пространстве V3 зафиксированы точка О и базис е15 е2, е3, то говорят, что в пространстве задана аффинная система координат (или общая декартова система координат) {О; ei, е2, ез}. Точка О называется началом координат; оси, проходящие через начало ко- ординат и определенные векторами ех, е2, ез, называются осями ко- ординат и обозначаются Ох (ось абцисс), Оу (ось ординат), Oz (ось аппликат) соответственно. Плоскость, определяемая осями координат Ох и Оу (Ох и Oz, Оу и Oz), называется координатной плоскостью Оху (Oxz, Oyz соответственно). В этой терминологии аффинная си- стема координат обозначается также символом Oxyz. Координатами точки А в аффинной системе координат {О; е2, е2, ез} называются координаты радиус-вектора гд этой точки в ба- зисе ei, е2, ез- Тот факт, что точка Л имеет координаты x,y,z, обо- значают символом A(x,y,z). Итак, гд = xei + j/e2 -I- ze3 <=> A(x, y, z). (20.1) Замечание1. Из определения следует, что любая точка А прост- ранства в заданной системе координат имеет координаты, причем точки ЛДХ1, у\, zi) и А3(х2, У2, -?2) совпадают тогда и только тогда, когда ц = х2, yi = У2, zi = z2. Замечание 2. Координаты точки Л(х,у, z) определяются соот- ношениями (19.4). При этом, как легко видеть, проекции Л1,А2,Аз точки Л имеют координаты А1(т, 0,0), Л2(0, у, 0), Л3(0,0, z). Аналогично определяются аффинные системы координат {О; е2, е2} на плоскости V2 и {О; ei} на прямой V), а также координаты
§ 20. Координаты точки 85 точки А(х, у) и Л(т) соответственно. При этом имеют место очевид- ные аналоги соотношения (20.1) и обоих замечаний. В дальнейшем все факты будем излагать только в терминах пространства Уз. Замечание 3. В традиционных курсах аналитической геометрии коорди- наты точки вводятся с помощью метода координат, базирующегося на аксиомах геометрии. Это приводит к достаточно сложной аксиоматике (см. Приложение), вообще говоря, практически не использующейся в других разделах математики. Введение координат точки с помощью вектора (т.е. используя векторную аксио- матику линейного пространства) значительно упрощает все исследования, сводя геометрические построения к свойствам вещественных чисел. Теорема 20.1. Если A(xi,yi,zi) и В(х2,У2, - точки пространства, заданные своими координатами в системе ко- ординат {<?; ei, е2, ед}, то вектор а = А^ в базисе ei, е?, ед имеет координаты а = {т2 — Х\,У2 — yi,Z2 — Zi}. -.Л Доказательство. Действитель- но, Л^ = — оА (рис. 1) и, сле- довательно, а — тв — г^. Так как ° /_______________ \ В ГД = {Т1, У1, 21}, ГВ = {Х2,У2, Z2}, ТО в силу свойства линейности коорди- Рис. 1 нат отсюда следует утверждение те- оремы. Деление отрезка в данном отношении. Говорят, что точ- ка М В делит ненулевой отрезок [ЛВ] в отношении А, если Л л! = ХМ^ (рис. 2). м ММ I--И--- I------ I-Н--► ---1--► Л В А=М В А В АВ Рис. 2 Обозначение: (АВМ) = А. Из определения следует, что точка М расположена на прямой АВ, при этом (рис. 2): 1) если М - внутренняя точка отрезка [ЛВ], то А > 0; 2) если М = А, то А = 0; 3) если М расположена вне отрезка [ЛВ], то А < 0. Заметим, что других вариантов расположения точки М не может быть и что ни в одном из возможных вариантов А не равно —1. Теорема 20.2. Пусть А(ri), В(г2), ЛГ(гз) - точки прост- ранства и (АВМ) — А. Тогда гз = ri + Аг2 1 + А (20.2) Доказател ьство. Условие (ЛВМ) — А означает, что или гз - Г! = А( г2 - Гз). Отсюда следует (20.2). А& = ХМ$
86 Глава V. Векторная алгебра Следствие. Соотношение (20.2) в координатной форме имеет следующий вид: для A(xi,yi,Zi), В(х2,У2>^2), М(хз,уз, Z3) 11 + Ах2 У1 + Ау2 + А-гг 13 ~ 1 + А ' Уз~ 1 + А ’ Z3~ 1 + А (20.3) Прямоугольные координаты. Базис ei,..., еп, где п — 1,2,3, называется ортонормированным, если векторы базиса 1) имеют единичную длину и, в случае п > 1, 2) попарно перпендикулярны. Аффинная система координат {О; е^, ег, ез}, соответствующая ортонормированному базису ех, ег, ез, называется прямоугольной декартовой системой координат. §21. Проекции вектора и координаты Проекции вектора на плоскости. Пусть на плоскости Р даны две непараллельные прямые I и L. Проекцией направленно- / го отрезка А& на прямую I / ^^*7 параллельно прямой L называет- / / ся (рис. 1) направленный отре- / Г / зок AiBj, где Ai, Вх - про- О / I екции точек А и В на пря- / At Вг мую I параллельно прямой L. < Обозначение: рт^АВ. Рис- 1 Теорема 21.1. Проекции равных направленных отрезков равны. Доказательство. Пусть АЙ = С15, покажем, что рг^А^ = рг^сб. Введем на плоскости систему координат {О, е15 е2}, где О - точка пересечения прямых I и L, ej - базис на прямой I, е2 - базис на прямой L. Пусть точки А, В, С, D имеют координаты А(хд,з/д), В(хв,Ув), С(хс,ус}, D[xD,yD). Так как а = А& = сЬ, то согласно теореме 20.1 xB-xA=xD-xC- (21.1) Так как точки Ах, В\, С\, Di имеют координаты А^(хА,0), ВДтд, 0), Ci(xc, 0), £>i(xd,0) (§20, замечание 2), то Ь = AiBj = {тд-тд.О}, с = CiDi — [хв — тс,0}. Согласно (21.1) отсюда следует, что Ь = с. Это означает, что AjBi и C\Di порождают один и тот же вектор и поэтому равны.
§ 21. Проекции вектора, и координаты 87 Проекцией вектора а — АВ на прямую I параллельно прямой L называется вектор, порожденный рг^А^. Обозначение: рг[ а. Корректность определения вытекает из теоремы 21.1. Теорема 21.2. Проекция вектора на прямую I параллельно прямой L обладает свойством линейности: 1) prf'(a+ b) — ptf а 4- prf b, Va, Ь, pr^(aa) — а рг^ a, Va, VaGR. Доказательство. Пусть в базисе ei, е2, рассмотренном выше, векторы а, b имеют координаты а = {ai,a2}, Ь = {£>1,£>г}. Тогда pTi а = {ai, 0}, prfL b = {£>1,0} и в силу линейности координат рг^ а + + ptf b = {ai + £>i,0}. С другой стороны, а + b = {ai + £>i, a2 4-£>2} и рг^ (а + b) = {ai +£>i,0}. Следовательно, рг^ (а + b) = prf а+рт^ Ь. Аналогично доказывается второе условие линейности. Замечание 1. Формулы (19.3) для координат вектора а в ба- зисе ei, е2 плоскости V2 могут быть записаны в терминах проекций вектора на ось в виде х - _ (рту а) у~ ы (21-2) где ргх а и ргу а - проекции вектора а на оси, определенные вектора- ми ei и е2 соответственно (т.е. оси координат Ох и Оу), параллельно другой оси (т.е. оси Оу и Ох соответственно). Проекции вектора в пространстве. Пусть в пространстве заданы плоскость тг и не- параллельная ей прямая I. Проекцией направленного отрезка А& на прямую I (на плоскость тг) параллельно плоскости тг (соответственно прямой I) называется (рис. 2^ направленный отрезок А1В1 (Л2В2), где Ai и Bi (Л2 и В2) - проекции точек А и В на прямую I (плоскость тг) парал- лельно плоскости тг (прямой I). Обозначение: Для обеих проекций спргм- ведливо утверждение теоремы 21.1: проекции равных направ- ленных отрезков равны. Доказательство утверждения для проекций в пространстве отличается от доказательства теоремы 21.1 только тем, что система координат {О; ei, е2, ез} состоит из точки О пересече-
88 Глава V. Векторная алгебра ния прямой I с плоскостью тг, базиса ei, ез плоскости тг и базиса ез прямой I. Проекцией вектора а — на прямую I (плоскость л) параллель- но плоскости тг (прямой I) называется вектор, порожденный рг[А^ (рг^).Обозначени е: pr* a, prlv а . Обе проекции вектора обла- дают свойством линейности. Доказательство этого факта повторяет доказательство теоремы 21.2 с той лишь разницей, что рассматрива- ется система координат {О; ei, ез, ез}, упомянутая выше. Замечание 2. Формулы (19.4) для координат вектора а € V$ в базисе ej, ез, ез могут быть записаны в терминах проекций вектора на ось в виде _ (prxa) _ (prva) _ (prza) х~ Ы ’ Ы ' 2_ Ы ’ (21.3) где ргх а, ргу а, ргг а - проекции вектора а на оси, определенные ба- зисными векторами ei, ез, ез (т.е. оси координат Ох, Оу, Oz), парал- лельно координатным плоскостям Oyz, Oxz, Оху соответственно. Теорема 21.3. На плоскости (в пространстве) величина проекции вектора на ось параллельно прямой (соответственно плос- кости) обладает свойством линейности. Утверждение теоремы следует из того, что величины рассматри- ваемых проекций пропорциональны координатам (согласно (21.2) и (21.3)), которые обладают свойством линейности (теорема 17.3). Мы определили три различные проекции вектора. Во всех трех случаях, если I.LL или 11лг, проекции вектора называются ортого- нальными проекциями. § 22. Скалярное произведение Определение и основные свойства. Пусть а и b - ненулевые векторы. Отложим их от одной точки О. Пусть а = О^, Ь = оЗ. Углом между векторами а и Ь называется наименьший угол между лучами [ОЛ) и (ОВ). Обозначение: (а, Ь). Корректность опреде- ления очевидна. Из определения следует, что 0 < (а, Ь) < тг. Скалярным произведением ненулевых векторов а и b называет- ся число, равное произведению длин этих векторов на косинус угла между ними. Если один из векторов а или b нулевой, то скалярное произведение этих векторов по определению считается равным нулю. Обозначение: (а, Ь). Итак, для ненулевых векторов а и b (а, Ь) = | а| -1 b| cos(а, Ь). (22.1) Обозначим через рта b ортогональную проекцию вектора b на ось, определенную вектором а О (рис. 1).
§22. Скалярное произведение 89 Рис. 1 Теорема 22.1. Если а / О, то для любого вектора Ь (a, b) = |а| (ргаЬ) = (а,ргаЬ). (22.2) Доказательство. Утверждение теоремы очевидно для Ъ= О и (а, Ь) = тг/2. Пусть b / О и 93 = (а, Ь) / тг/2. Тогда (рис. 1) |рг.ы = |b|-|eosv| = ( IF 1 1 1 1 1 — |b|cosy>, prabt4- a. Отсюда следует, что (prab) = |b|cos<p и, тем самым, (a, b) = = |a|(prBb). Вторая часть соотношения (22.2) вытекает из первой, так как praprab = prab. Теорема 22.2. Для любых векторов а, Ь, с и числа а € R 1) (а, Ь) = (Ь, а); 2) (а + Ь, с) = (а, с) + (Ь, с); 3) (аа, Ь) = а( а, Ь); 4) (а, а) > 0, причем (а, а) = О тогда и только тогда, когда а = 0. Доказательство. Свойства 1 и 4 очевидны. Докажем свойство 2. Имеем (а+ Ь, с) — (с, а+ Ь) = | с| (ртс( а+ Ь)) — {согласно теоре- ме 21.3} = | с| (ргс а) + | с| (ргс Ь) = (а, с) + (Ь, с). Аналогично про- веряется свойство 3. Следствие 1. Из свойств 1-3 следует, что скалярное произ- ведение линейно и по второму множителю: (a, b -I- с) = (а, Ь) + (а, с), (а, а Ь) — а( а, Ь). Скалярное произведение в координатах. Свойство линейно- сти скалярного произведения позволяет перемножать линейные ком- бинации векторов (т.е. находить их скалярное произведение): , к т \ к т ( ai а»,Д,; bj j = }У^а,^(а<, bj). (22.3) 4=1 j = l ' i=l j=l Это, в частности, означает, что скалярное произведение векторов мо- жет быть вычислено по их координатам, если известна “таблица умно- жения" базисных векторов. Возможность подобного вычисления ска- лярного произведения векторов позволяет определить по известным
90 Глава V. Векторная алгебра координатам длину вектора и угол между векторами, так как | а| = = \/(а> а)’ cos(a> Ь) = (а> Ь)/(1 а1 ' I bD- Задача вычисления скалярного произведения векторов по их ко- ординатам существенно упрощается, если рассматривается ортонор- мированный базис. Векторы а и Ь называются ортогональными, если (а, Ь) — 0. Из определения следует, что векторы а и Ь ортогональ- ны тогда и только тогда, когда либо один из них нулевой, либо они перпендикулярны. В терминах ортогональности векторов ортонорми- рованность базиса ei,..., еп, где n = 1,2,3, означает, что (et, ej) = |j’ (22.4) Теорема 22.3. Скалярное произведение векторов а = =Oj ei +ai2 ег +аз ез и b = ei +/З2 е2 +/3з ез равно сумме попарных произведений координат: з (а, Ь) = £а^ (22.5) «=1 тогда и только тогда, когда ej, ез, вз - ортонормированный базис. Доказательство. Достаточность вытекает из (22.3) и (22.4). Необходимость. Соотношения (22.4) вытекают из (22.5), если учесть, что векторы ei, ез, ез в базисе ei, ез, ез имеют координаты (1,0,0), (0,1,0), (0,0,1) соответственно. Следствие 2. Если векторы а = {04,02,03}, b = {/3j,/З2,/Зз} заданы координатами в ортонормированием базисе, то I.| = cos(aTb) = + °^+ (22.6) Следствие 3. В прямоугольной декартовой системе коорди- нат расстояние р(А,В) между точками A(xi,yx, zi) и В(х2,у2, Z2) находится по формуле р(А,В) - у/(Х2 - хг)2 -I- (у2 - У1)2 + (z2 - Hj)2. Это равенство следует из того, что р(А, В) = |Afl| и = = {12 - Х1, Уз - У1,г2 - Z1}. Направляющие косинусы. Направляющими косинусами век- тора (луча) называются косинусы углов, образованных этим векто- ром (соответственно лучом) с осями координат. Для прямоугольной декартовой системы координат {О; ei, е2, ез} направляющие косину- сы единичного вектора е совпадают с координатами вектора е в ба- зисе ei, ез, ез, так как если е — 04 ei Ч-аз е2 Ч-аз ез, то о* = (е, е*) = — cos(e, е*), k - 1, 2, 3.
§ 23. Векторное и смешанное произведения 91 § 23. Векторное и смешанное произведения Ориентация в вещественном линейном пространстве. В §19 при рас- смотрении оси, определенной ненулевым вектором е, мы фактически ввели ори- ентацию на прямой, назвав положительным то направление, которое совпадает с направлением вектора е. Прежде чем вводить определение ориентации, общее для прямой, плоскости и пространства, снова обратимся к прямой. Каждый не- нулевой вектор е прямой образует базис, и переход от одного базиса к другому осуществляется умножением этого вектора на ненулевое число. Так как это число либо положительно, либо отрицательно, то все базисы на прямой разбиваются ровно на два класса: базисные векторы одного класса имеют одинаковое напра- вление, а любые два базисных вектора разных классов имеют противоположные направления. Тот факт, что базисные векторы относятся к одному классу, на ал- гебраическом языке означает, что они отличаются положительным множите- лем. Именно этим мы и воспользуемся для определения ориентации. Два базиса е = (ej,..., еп) и е' = (e'lt..., е'п) линейного простран- ства V называются одинаково ориентированными, если матрица пе- рехода Се^е- имеет положительный определитель, и противополож- но ориентированными - в противном случае. Замечание 1. Из определения и из свойств определителя следу- ет, что два базиса, получающиеся друг из друга - перестановкой двух их векторов или - умножением какого-либо вектора на отрицательное число, противоположно ориентированы. Теорема 23.1. Отношение одинаковой ориентированности является отношением эквивалентности на множестве всех бази- сов пространства V. Доказательство. Действительно, рефлексивность отноше- ния следует из того, что переход от базиса к самому себе осуще- ствляется с помощью единичной матрицы, симметричность - из те- оремы 17.5 и очевидного факта: \С~11 • |С| > 0, транзитивность - из того, что если е! = еС, е" = e'D, то е" — е(СО), при этом |СО| = = |С| -1£>| > 0. Так как определитель матрицы перехода от одного базиса к друго- му либо положителен, либо отрицателен, то множество всех базисов пространства разбивается отношением одинаковой ориентированно- сти ровно на два непересекающихся класса (класса эквивалентности) так, что всякий базис принадлежит одному и только одному клас- су, два базиса одного класса одинаково ориентированы, а любые два базиса из разных классов противоположно ориентированы. Один из указанных классов называют классом правых (или по- ложительно ориентированных) базисов, а другой - левых (отрица- тельно ориентированных). Каждый из этих двух классов называ- ется ориентацией пространства. Вещественное линейное простран- ство с выбранной на нем ориентацией называется ориентированным пространством. Так как класс эквивалентности порождается любым своим представителем, то для того, чтобы ориентировать линейное пространство, достаточно задать один какой-нибудь базис простран- ства и объявить положительно ориентированными все одноименные с ним базисы.
92 Глава V. Векторная алгебра Класс правых базисов на плоскости Va и в пространстве V3 обычно выбирают следующим образом: - упорядоченную пару неколлинеарных векторов ei, е2 плоскости называют правой (положительно ориентированной), если кратчайший поворот (рис. 1) от ei к еа выполняется против часовой стрелки, и левой (отрицательно ориентиро- ванной) - в противном случае (начала векторов считаются совмещенными); - упорядоченную тройку некомпланарных векторов ei, е2, ез пространства называют правой (положительно ориентированной), если из конца вектора ез (рис. 2) кратчайший поворот от е; к ej виден совершающимся против часовой стрелки, и левой (отрицательно ориентированной) - в противном случае (начала векторов тройки считаются совмещенными). е2 ег Рис. 2 О Практически задание ориентации в геометрических пространствах означает задание направления движения на прямой (слева направо или наоборот), напра- вления вращения на плоскости (против часовой стрелки или наоборот) или винта в пространстве (правого или левого). Определения и основные свойства. Пусть в пространстве V3 выбрана ориентация. Базисы, задающие эту ориентацию, назовем пра- выми (положительными). Векторным произведением ненулевых векторов а и b называется вектор с такой, что: 1) |с| = |а| • | Ь| sin(а, Ь), 2) с ортогонален каждому из векторов а и b и если с / 0, то 3) с направлен так, что упорядоченная тройка а, Ь, с - правая. Если один из векторов а или b нулевой, то векторное произведение считается равным 0. Обозначение: [а, Ь]. Теорема 23.2 (критерий коллинеарности). Векторы а и Ь коллинеарны тогда и только тогда, когда [а, Ь] = 0 . Доказательство. Действительно, векторы а и Ь коллинеар- ны тогда и только тогда, когда либо а = 0, либо b = 0, либо sin( а, Ь) = 0; это равносильно тому, что |[а, Ь]| =0, т.е. [а, Ь] = О.
§ 23. Векторное и смешанное произведения 93 Замечание 2. Из теоремы 23.2 следует, что определение век- торного произведения [ а, Ь] для коллинеарных векторов а и b закан- чивается требованием 1. Если же а и b не коллинеарны, то условия 1 и 2 означают, что: а) |[ а, Ь]| = Sab> где Sab _ площадь параллелограмма, построен- ного на векторах а и Ь; б) вектор [ а, Ь] перпендикулярен плоскости тг( а, Ь), определяемой векторами а и Ь. Теорема 23.3. Векторное произведение антикоммута- тивно, т.е. [a, b] = — [b, a], Va, b. Доказательство. Утверждение теоремы очевидно, если а и b коллинеарны. Пусть а и Ь не коллинеарны, тогда [а, Ь] / О, [Ь, а] 0, при этом |[а, Ъ]| = |[Ь, а]| = 5аь и [а, Ь], [b, aj перпенди- кулярны плоскости тг(а, Ь). Значит, либо [а, Ь] = [Ь, а], либо [а, Ь] = = —[Ь, а]. Но вектор [Ь, а] [а, Ь], так как тройка векторов Ь, а, [Ь, а] - правая (по определению векторного произведения) и, следо- вательно, тройка а, Ь, [Ь, а] - левая (см. замечание 1). Смешанным произведением векторов а, Ь и с называется число, равное скалярному произведению векторного произведения а и b на вектор с. Обозначение: (а, Ь, с). Итак, (а, Ь, с) = ([а, Ъ], с). Теорема 23.4 (критерий компланарности). Векторы а, Ь, с компланарны тогда и только тогда, когда (а, Ь, с) =0. Доказательство. Необходимость. Пусть а, Ь, с компла- нарны. Будем считать, что а и b не коллинеарны и с О (в каждом из этих случаев, очевидно, (а, Ь, с) = 0). Тогда а, Ь, с параллельны плоскости тг(а, Ь), причем [а, Ь)±тг(а, Ь). Следовательно, ([а, Ь], с) = 0. Достаточность. Пусть (а, Ь, с) — 0. Тогда либо |[а, Ь]| = 0, либо | с| =0, либо cosy? = 0, где у? - угол между векторами [а, Ь] и с. Это означает, что либо а и b коллинеарны, либо с — О, ли- бо с параллелен плоскости ?г(а, Ь). Во всех этих случаях а, Ь и с компланарны. Теорема 23.5. Смешанное произведение некомпланарных векторов а, b и с равно по абсолютной величине объему V паралле- лепипеда, построенного на приведенных к общему началу векторах а, Ь, с. При этом V, если а, Ь, с - правая тройка; —V, если а, Ь, с - левая тройка. Доказательство. Из некомпланарности векторов а, Ь и с следует, что а и Ь не коллинеарны и с^ О. Отложив векторы а, Ь, с от одной точки О (рис. 3), получим параллелепипед, ребрами которого являются эти векторы. Обозна- чим через Л высоту параллелепипеда, опущенную из конца вектора с. Тогда V = Sabh. Отсюда и из замечания 2 следует, что V - |[а, Ь]| • |с| |cosy>| = |(а, Ь, с)|. (23.1) (а, Ь, с) =
94 Глава V. Векторная алгебра Рис. 3 Знак (а, Ь, с) определяется только знаком cosy?, но cosy? > О тогда и только тогда, когда век- торы [ а, Ь] и с направлены в одну сторону от плоскости тг(а, Ь), т.е. тогда и только тогда, когда трой- ка а, Ь, с - правая. В силу (23.1) отсюда следует утверждение тео- ремы. Теорема 23.6. Для любых векторов а, Ь, с выполняется равенство ([а, Ь], с) = (а, [Ь, с]). (23.2) Доказательство. Утверждение очевидно для компланарных векторов а, Ь, с (в силу теоремы 23.4). Пусть а, Ь, с - не компла- нарны. Тогда тройки а, Ь, с и Ь, с, а одинаково ориентированы (см. замечание 1). Так как (а, [Ь, с]) — (Ь, с, а), то из теоремы 23.5 следует (23.2). Следствие 1. Для любых векторов а, Ь, с имеют место ра- венства (а, Ь, с) = (Ь, с, а) = (с, а, Ь) = = -(Ь, а, с) = -(а, с, Ь) = —(с, Ь, а). (23.3) Следствие 2. Смешанное произведение линейно по каждому из сомножителей. Это утверждение вытекает из (23.3) и линейно- сти скалярного произведения. Теорема 23.7. Векторное произведение линейно по каждо- му из сомножителей. Доказательство. В силу теоремы 23.3 достаточно показать, что для любых векторов а, Ь, с и любого числа а € R имеют место равенства [a+b, с] = [а, с]+[Ь, с] и [аа, Ь] = о[а, Ь]. Пусть d = [а+ + Ь, с]-[а, с]—[Ь, с]. Тогда (d, d) = (a+b, с, d)-(a, с, d)-(b, с, d). Из линейности смешанного произведения следует, что (d, d) — — (а, с, d) + (b, с, d) — (а, с, d) — (b, с, d) = 0. Это доказывает первое из требуемых равенств. Второе равенство доказывается ана- логично. Векторное и смешанное произведения в прямоугольных координатах. Пусть ei, е3, е3 - ортонормированный базис прост- ранства и пусть ei, е3, е3 - правая тройка. 1. Найдем координаты векторного произведения [а, Ь], если век- торы а = {aj, 02,^3} и b = {61,62,63} заданы своими координатами в базисе ej, е3, е3. Согласно теоремам 23.2 и 23.7 имеем [а, Ь] = [гц е3+ + аг ез + аз е3,6j ei + 62 ез + 63 е3] = 0162[ei, еа] + ai63[ ei, е3] + +а2б1[е2, ei]+a263[e2, ез]+а361[е3, ei)+a362[e3, еа]. Отсюдавсилу
§ 24. Преобразование координат 95 теоремы 23.3 следует, что la, b] = а-2 а3 5г Ь3 [е3, е3] - ai аз Ь1' Ьз [ез, ег] + ai 0.3 5i Ь2 [ei, е3]. Пусть [a, b] = xei + уез + ze3. Тогда, используя равенство (22.4), теоремы 23.3-23.5 и замечание 1 (§23), получаем, что х = ([a, b], ei) = 02 62 аз Ьз (е2, е3, е3) = аг 5г аз Ьз (ei, е2, е3) = а2 62 аз Ьз Аналогично находим у — — Oj а3 51 Ьз z = ?2 . Итак, Oi Ь2 [а, Ь] = а2 а3 Ьз 53 в! - ai а3 51 53 Z Ь2 ез. (23.4) или, в условной записи в виде мнемонического определителя, [а, Ь] = ei е2 е3 ai а2 а3 bi Ьз Ьз (23.5) (имеется в виду разложение этого определителя по первой строке). 2. Из равенств (23.4) и (22.5) непосредственно находится и сме- шанное произведение векторов а — {ai,a2,a3}, b = {51, Ьз,53}, с = = {ci,c2,c3}, заданных своими координатами в ортонормированном базисе: Замечание 3. Если исходный базис ei, ез, е3 отрицательно ориентирован, то (ei, е2, е3) = —1 (теорема 23.5) и, следовательно, в соотношенииях (23.4) - (23.6) следует изменить знаки на противоположные: '«•bi'-ds Й|«-|Й Й 1«+1 й £!«)• | а, Ь] = - ei е2 ез Я1 0.2 0,3 bi Ьз Ьз (а, Ь, с) = — ai оз аз 51 Ьз Ьз С1 С2 с3 § 24. Преобразование координат Преобразование аффинной системы координат. Пусть в пространстве даны две аффинные (общие декартовы) систе- мы координат: {О; ег, ез, е3} и {О'; е/, е2', е3'}- Первую из них бу- дем называть “старой” системой координат, а вторую - “новой”. Пусть 4 Линейная алгебра ы аналитическая геометрия
96 Глава V. Векторная алгебра известно положение новой системы координат относительно старой: О'(а,0,7) и С — (су) - матрица перехода от базиса е к базису е', т.е. е/ = С11 е1 + С21 е2 + С31 ез, — с12 е1 + С22 ба + С32 ез, (24.1) ез' — с13 ех + саз в2 4-С33 ез. Пусть М - произвольная точ- ка пространства. Исследуем, как изменяются ее координаты при переходе к новой системе коорди- нат. Обозначим через (х,у, z) и (z',y',z') координаты точки М в старой и новой системах ко- ординат, через г и г' - радиус-векторы точки М относительно по- люсов О а О' соответственно, а через fq - радиус-вектор точки О' относительно полюса О. Тогда по определению координат точки Ге a 0 . У . Равенство ОМ — 00' 4- О'М означает (рис. 1), что г = г0 4- г'. Перейдя в этом векторном равенстве к равенству координат в базисе е, получаем с учетом (17.8), что a 0 . 7 . х У z или х = a + сцх' 4- С12у' 4- с13г', У = 0 4- c2ii' 4- с22у' 4- с23г', z = 7 4- С31Х1 4- С32У1 4- c33z'. (24.2) Соотношения (24.2) называются формулами преобразования ко- ординат. Эти формулы выражают старые координаты точки через новые. Ортогональная матрица. Вещественная матрица С называется ортогональной, если ССТ = СТС = I. (24.3) Из определения следует, что: 1) С - квадратная матрица; 2) С"1 = С , 3) С-1 - ортогональная матрица; 4) |С| = ±1; 5) матрица С — (Cjj) & Rnxn ортогональна тогда и только тогда, когда ^CtfcCjfc=| 0’ и ^2ckickj = | о’ (24.4) fc=i 1 k=i k 6) произведение ортогональных матриц - ортогональная матрица.
§ 24. Преобразование координат 97 Теорема 24.1. Матрица С = (cjj) перехода от ортонорми- рованного базиса е к е' ортогональна тогда и только тогда, когда е' - ортонормированный базис. Доказательство. Пусть ej, е2, ез и е/, ез', ез' - бази- сы пространства. Из равенств (24.1) следует, что столбцы матрицы перехода С являются координатами векторов е/, ез', е3' в базисе е = (ei,e2, ез). Согласно теореме 22.3 отсюда получаем, что (е', е') = CkiCkj. Следовательно, условие ортонормированности базиса е' равносильно условию (24.4) ортогональности матрицы С. Аналогично рассматривается случай плоскости или прямой. Преобразование прямоугольной декартовой системы коор- динат на плоскости. Пусть {О; ei, ез} и {О'; е/, е2'} - прямо- угольные декартовы системы координат на плоскости, т.е. е = = (е1, ег) и е' = (е/, е2') - ортонормированные базисы и матри- ца перехода С — (с^2) € R2*2 ортогональна. Согласно (24.4) имеем = С11С12 + С21С22 =0, С?2+С^2 = 1. Из первого равенства следует существование такого у, что Си = = cos 92, C21 = sin р. Из второго равенства следует, что ci2 = Л: sin у, С22 = —k cos p. Отсюда и из третьего равенства получим, что к = ±1. Итак, ортогональная матрица второго порядка определяется лишь единственным параметром у, при этом либо cos у — sin у sin у cos у 1. Пусть С — cosy sin у либо С = — sin у cosy cos у sin у sin р — cos р , тогда |С| = 1 и (24.5) е/ = cosy • ei -I- siny e2, e2' — —siny • ei -f-cosy • e2. Умножив скалярно обе части этих равенств на eiи е2, получим (рис. 2,а), что (ei', ej = у, (ег', е2) = | - у, (е2', = | + у, (е2', е2) = у (все углы отсчитываются в направлении кратчайшего поворота от ei к е2). Рис. 2
98 Глава V. Векторная алгебра Это означает, что базисы е и е' одинаково ориентированы и что система координат {О'; ei', ез'} может быть совмещена с {О; ei, ез} путем переноса начала и поворота на угол вокруг начала. При этом формулы преобразования координат имеют вид J г = a + х' cos 9? — у' sin 99, , . {у = /3 + х' sin 4- у' cos <р. \ ) л гг cos 93 sin 9? lz>1 , 2. Пусть С — , тогда С = —1 и J sin 9? — cos у? 1 1 et' = cosy? - ег + sin 93 • ез, ез' — sin 9? ei — cos 92 ез- Поступая аналогично п. 1, получим (рис. 2,6), что (еГ, ei) = <p, (еГ, е2) = (е2', ej) = f - 93, (е2', е2) = тг - 93. В этом случае базисы е и е' противоположно ориентированы и си- стема координат {О'; ех', е2'} не может быть совмещена с {О; ej, е2} путем переноса начала и поворота; после поворота на угол <р нужно выполнить отражение относительно оси ех' (т.е. изменить направле- ние е2'). При этом формулы преобразования координат имеют вид ( х = a + х' cos 95 + у7 sin 9?, |у — (3 + х' sin 9? — у' cos 9?. Заметим, что в обоих случаях положение второго базиса е' = — (е1, е2) относительно первого е = (ei, е2) однозначно определя- ется лишь одним параметром - углом <р. Преобразование прямоугольной декартовой системы ко- ординат в пространстве. Пусть {О; ei, е2, ез} и {О'; e'j, е'2, е^} - прямоугольные декартовы системы координат в пространстве, т. е. е = (е1; е2, ез) и е' = (e'j, е'2, е'3) - ортонормированные базисы и матрица перехода С — (<\,) G R3*3 ортогональна. Аналогично тому, как это было на плоскости, положение второго базиса е' относительно первого е может быть однозначно определено лишь тремя параметра- ми - так называемыми углами Эйлера. Введем эти углы. Будем считать, что обе системы координат одно- именны и имеют общее начало О. Пусть для определенности базисы е и е' образуют правые тройки. Обозначим через Ои ось, совпадающую с линией пересечения ко- ординатной плоскости Оху первой системы координат с координатной плоскостью Ох'у' второй системы и направленную в ту сторону, от- куда кратчайший поворот от оси Oz к оси Oz' виден совершающимся против часовой стрелки (рис. 1). Очевидно, ось Ои перпендикулярна плоскости Ozz'. Пусть теперь ф - угол между осями Ох и Ои, от- считываемый в плоскости Оху от оси Ох в направлении кратчайшего поворота от оси Ох к оси Оу, 6 — угол между осями Oz и Oz', не превосходящий л (так как системы координат одноименны); 9? - угол между осями Ои и Ох', отсчитываемый в плоскости Ох'у' от оси Ои в направлении кратчайшего поворота от оси Ох' к оси Оу'.
§ 24. Преобразование координат 99 Три угла ф, 0 < V» < 2тг, от Ох до Ou в плоскости Оху, в, 0 < в < 7Г, от Oz до Oz' в плоскости Ozz'-, <р, 0 < < 2тг, от Ou до Ох' в плоскости Ох'у' называются углами Эйлера системы координат Ох'у'г1 относительно Oxyz. Если заданы три угла Эйлера, то преобразование первой системы координат Oxyz во вторую Ox'y'z' можно представить в виде после- довательного проведения трех плоских поворотов: 1) поворота плоскости Оху вокруг оси Oz на угол ip, при этом повороте ось Ох совместится с осью Ои, ось Oz останется на месте, а вся система координат Oxyz перейдет в систему координат Ох^у^г^ (рис. 2); 2) поворота плоскости Oy\Z\ вокруг оси Oxi на угол в, при этом повороте ось Ozy совпадет с осью Oz', плоскость Ох^у^ совместит- ся с плоскостью Ох'у', а вся система координат перейдет в систему координат 0x21/2-22 (рис. 3); 3) поворота ПЛОСКОСТИ Ol2j/2 вокруг ОСИ 0Z2 на угол уз, при этом повороте система координат ОтгУг^г совместится с системой коорди- нат Ox'i/z' (рис. 4). Рис. 3 Рис. 4
100 Глава V. Векторная алгебра Каждый из указанных трех поворотов производится в одной из ко- ординатных плоскостей соответствующей системы координат, поэто- му формулы преобразования координат в соответствии с (24.5) будут иметь следующий вид: 1) для первого поворота 'х' if 'cosip — sin ip O’ У У1 , где Ci - sin cos ip 0 ; (24.7) .Z. .21. 0 0 1 2) для второго поворота xf X2‘ '1 0 0 • У1 = c2 У2 , где C2 = 0 cos# - sin# ; (24.8) .21. .22. 0 sin# cos#. 3) для третьего поворота ’^2 'x1' cos<p -simp 0‘ У2 = c3 У' , где C3 = simp cos tp 0 ; (24.9) .22. 0 0 1 Из (24.7)-(24.9) следует, что х У z 'х'~ = С у> , z' где С = С1С2С3 (24.10) сц — cos cos <р — sin ip cos 0 sin p, C12 = — cos sin <p — sin ip cos 0 cos <p, еп = sin ip sin 0, C21 — sin ip cos p + cos ip cos 0 sin С22 — - sin tp sin tp + cos ip cos 0 cos <p, c23 = - cos ip sin 0. C31 = sin# sin <p, C32 = sin 0 cos <p, C33 = cos#. (24.11) Равенство (24.10) в силу ортогональности матриц Ci, С2, С3 дает обрат- ное выражение новых координат через старые х' у' z' = сТс^сТ х1 У z
§ 25. Полярные координаты 101 Соотношения (24.10) и (24.11) получены в предположении, что обе системы координат имеют общее начало. Если же эти системы коор- динат имеют начало в разных точках, но получаются одна из другой параллельным переносом, то равенства (24.10) и (24.11) не меняют своего вида, так как ни направления осей, ни величины углов Эйлера при этом не изменяются. Таким образом, формулы преобразования координат имеют вид (24.2), где величины Ci} определены соотноше- ниями (24.11) через углы Эйлера. Итак, преобразование прямоугольной декартовой системы коор- динат в одноименную систему координат состоит в последовательном проведении параллельного переноса и трех плоских вращений. Если же системы координат Oxyz и Ox'y'z' разноименны (угол 0 больше тг), то после параллельного переноса и поворотов на углы Эй- лера необходимо еще выполнить зеркальное отражение относительно плоскости О'х'у' получившейся системы координат. §25. Полярные координаты Декартовы системы координат - не единственный способ опреде- лять положение точки с помощью чисел и тем самым применять чи- словые расчеты для решения геометрических задач. Для этой цели ис- пользуются и другие типы координатных систем. Опишем некоторые из них. Полярные координаты на плоскости. Полярная система ко- ординат на плоскости состоит из точки О плоскости и исходящего из нее луча I. Точка О называется полюсом, луч I — полярной осью. Обозначение: {ОД} - Задание полярной системы координат позво- ляет однозначно определить положение любой точки плоскости с по- мощью двух чисел (рис. 1): 1) расстояния г от точки М до полюса О и, если М 7^ О, 2) угла уз между лучом [ОМ) и полярной осью I (угол отсчитыва- ется от оси I против часовой стрелки). Рис. 2 Число г называется полярным радиусом точки М, а угол р — по- лярным углом. Упорядоченная пара чисел (г, </?) называется полярны- ми координатами точки М. Обозначение: Л1(г, уз).
102 Глава V. Векторная алгебра Из определения следует, что: 1) г > 0 для любой точки М плоскости и г — 0 <=> М = О; 2) 0 < </? < 2тг для любой точки плоскости, кроме полюса, а для полюса угол не определен; 3) любая точка плоскости, отличная от полюса, имеет полярные координаты, при этом две точки плоскости совпадают тогда и только тогда, когда совпадают их полярные координаты. С каждой полярной системой координат связана некоторая пря- моугольная декартова система координат. В этой системе (рис. 2) на- чало совпадает с полюсом, положительная полуось абсцисс - с по- лярной осью, положительная полуось ординат получается вращени- ем полярной оси на угол тг/2 против часовой стрелки. Полученную таким образом систему координат Оху называют системой коорди- нат, определенной полярной системой координат {О; /}. Очевидно, что такое соответствие между полярными и прямоугольными систе- мами координат биективно. Как легко видеть из рис. 2, прямоугольные координаты (т, у) точ- ки Л/ и ее полярные координаты (г, <р) связаны соотношениями ^/т2 + у2, X X г у/х2,+ у2 ’ (25.1) у = у г у/х2 + у2 Полярные координаты в пространстве. Обобщением поляр- ной системы координат в пространстве являются цилиндрические и сферические системы координат. Пусть в пространстве заданы плоскость тг и перпендикулярная к ней ось Oz. Пусть О - точка пересечения оси Oz и плоскости тг. И та и другая система координат состоят из полярной системы ко- ординат {О;/} плоскости тг и оси Oz. Обозначение: {O;/;z}. Точ- ка О называется полюсом, ось I - полярной осью, ось Oz - зенитной осью. Цилиндрическими координатами точки М, не лежащей на зенит- ной оси, называется упорядоченная тройка чисел (г, <р, z), где (г, - полярные координаты ортогональной проекции Р точки М на плос- кость тг, z — координата на зенитной оси ортогональной проекции Q точки М на зенитную ось (рис. 3). Для точек зенитной оси г = 0 и угол не определен.
§ 25. Полярные координаты 103 Сферическими координатами точ- ки М, не лежащей на зенитной оси, называется (рис. 3) упорядоченная тройка чисел (р,<р,в), где р - рас- стояние от точки М до полюса О, 6 - угол между радиус-вектором ОМ и положительной полуосью Oz (от- считываемый от ОЙ против часо- вой стрелки, если смотреть из поляр- ной оси), ср - полярный угол точки Р. При этом <р называется долготой точки М, в - широтой, р - радиу- сом. Долгота не определена для всех точек зенитной оси, широта не опре- делена для полюса. Рис. 3
Глава VI. Системы линейных алгебраических уравнений § 26. Постановка задачи Терминология. Системой т линейных алгебраических уравне- ний с п неизвестными называется совокупность соотношений ацХ1 + 012X2 + • • + ain^n = 021X1 + 022 X2 + . . . + О2ПХП = 62, < (26.1) . &mlXl "1“ Опг2^2 • ~Ь О’тп^'П — где Ojj, bi (i = 1,т, j = l,n) - заданные вещественные числа, a Xi, ... , хп - неизвестные величины. Числа а^ называются коэффициентами системы, a bi - свободными членами. Упорядоченная совокупность чисел ci,..., Cn € R называется ре- шением системы, если при подстановке этих чисел в систему вместо неизвестных Xi,... ,хп соответственно каждое уравнение обращается в тождество. Система уравнений называется совместной, если она имеет хо- тя бы одно решение, и несовместной, если не имеет ни одного ре- шения. Система уравнений называется определенной, если она имеет единственное решение, и неопределенной, если имеет более одного ре- шения. Исследовать и решить систему - это значит: • установить, совместна ли она или несовместна; • если она совместна, установить, является ли она определенной или неопределенной, при этом: - в случае определенной системы найти единственное ее решение; - в случае неопределенной системы описать множество всех ее решений. Компактная запись системы. Коэффициенты системы образу- ют матрицу А = (aij) G Rmxn, называемую основной матрицей си- стемы, свободные члены образуют столбец b = (Ь\,... ,bm)T € Rm, называемый столбцом свободных членов, а неизвестные — столбец х = (xi,..., хп)Т, называемый столбцом неизвестных. В этих обо- значениях система (26.1) может быть записана в виде Ах = b (26.2)
§ 27. Системы с квадратной невырожденной матрицей 105 или Х1<11 н--|-:гпап = Ь, (26.3) где сц (г = 1,п) - столбцы матрицы А. В записи (26.3) система уравнений приобретает новый смысл: со- вместность системы равносильна тому, что столбец свободных членов является линейной комбинацией столбцов матрицы Л, причем коэф- фициентами линейной комбинации служат компоненты Xi,... ,хп ре- шения. Эквивалентность систем. Две системы линейных алгебраиче- ских уравнений с одинаковым числом неизвестных называются экви- валентными, если множества всех решений этих систем совпадают. Теорема 26.1. Умножение обеих частей системы Ах = Ь слева на невырожденную матрицу приводит ее к эквивалентной си- стеме. Доказательство. Пусть Q € Rmxm и |Q| 0. Рассматривае- мые системы имеют вид Ах = Ь и QAx = Qb. Если с е R" - решение первой системы, то Ас = b и, следовательно, QAc = Qb, откуда сле- дует, что с - решение второй системы. С другой стороны, если с - решение второй системы, то QAc = Qb. Умножив обе части этого то- ждества слева на Q~1, получаем тождество Ас = Ъ, откуда следует, что с - решение первой системы. § 27. Системы с квадратной невырожденной матрицей. Правило Крамера Прежде чем рассматривать системы общего вида, исследуем про- стейший класс систем (26.2), когда число уравнений совпадает с чи- слом неизвестных и |Л| 0. Теорема 27.1. Система линейных алгебраических уравне- ний с квадратной невырожденной матрицей совместна и имеет единственное решение. Доказательство.В силу невырожденности матрицы А для нее существует обратная матрица Л*1. Непосредственной проверкой лег- ко установить, что вектор х = А~1Ь (27.1) является решением системы (26.2). Это решение единственно, так как если у - другое решение системы (26.2), то Ах = Ау. Умножив обе части этого тождества слева на А-1, получим, что х = у. Решение (27.1) может быть записано покомпонентно, если восполь- зоваться явным выражением (5.3) для обратной матрицы. Действи- тельно, х = j-^-Аб или, в соответствии с (5.1), Ан&1 + АцЪ2 + - • • + Anlbn -— -----------------------. г = 1. п. х, =
106 Глава VI. Системы уравнений Эти соотношения в свете свойств определителя означают, что = |Л|/|Л|, г=Т“п, (27.2) где А, получается из матрицы А заменой ее г-го столбца столбцом свободных членов. Формулы (27.2) называются правилом Крамера. Замечание. Правило Крамера дает решение системы в явном виде и в не- котором смысле носит алгоритмический характер. Однако это правило полезно лишь в теоретических исследованиях и противопоказано для практического ис- пользования в приложениях. В самом деле, для решения систем n-го порядка по правилу Крамера требуется вычислить (п +1) определителей n-го порядка, тогда как большинство современных методов решения систем по объему вычислений равносильны вычислению одного определителя. В § 29 мы приведем описание од- ного из таких методов - метода Гаусса. Продолжим теоретическое исследование систем, так как вопрос о решении систем с прямоугольной матрицей или квадратной, но выро- жденной матрицей остается открытым. § 28. Системы общего вида Совместность системы. Пусть теперь Ах = b (28.1) - система общего вида и А — (aij) 6 Rmx". Исследование системы следует начать с вопроса о ее совместности. Для этой цели составим матрицу В, приписав к матрице А столбец свободных членов; В = [А|Ь]. Матрица В называется расширенной матрицей системы (28.1). Теорема 28.1 (теорема Кронекера—Капелли). Система линейных алгебраических уравнений совместна тогда и только то- гда, когда ранг основной матрицы равен рангу расширенной матри- цы. Доказательство. Необходимость. Пусть система (28.1) со- вместна. Тогда из (26.3) следует, что существуют числа Xi,..., хп е R такие, что b = ziai +.. .+xn<in- Следовательно, столбец Ъ является ли- нейной комбинацией столбцов а1(..., ап матрицы А. Из теоремы 16.8 следует, что rg А = rg В. Достаточность. Пусть rgA — rgB = г. Возьмем в матрице А какой-нибудь базисный минор. Так как rgB —т, то он же будет базис- ным минором и матрицы В. Тогда согласно теореме 16.1 о базисном миноре последний столбец матрицы В будет линейной комбинацией базисных столбцов, т.е. столбцов матрицы А. Следовательно, столбец свободных членов системы является линейной комбинацией столбцов матрицы А. Это означает совместность системы. Схема исследования совместной системы. Теорема Кронеке- ра-Капелли устанавливает совместность системы. Перейдем к иссле- дованию совместной системы. Итак, пусть система уравнений
§ 28. Системы общего вида 107 {“и1! + • • - + 4- ai.r+i^r+i 4- • • 4- ainin = bi, Лу-iXi 4-... 4~'ttrr®r 4~ ^r^+i^r+i 4~ • • • 4" ^•rn^'n = by., (♦) 4“ • • • 4" flmr^r 4" 4" • - • 4" Oynn^n = совместна и rgA = rgB — г. He нарушая общности рассуждений, будем считать, что базисный минор матрицы А находится в левом верхнем углу, так что Оц <хг1 O-lr Gyr 7^0. (28.2) Рассмотрим укороченную систему из первых г уравнений системы (*), т.е. из уравнений, коэффициенты которых входят в базисный ми- нор: ацТ1 4- ••• 4- flir^r 4" ai.r+i^r+i 4- --- 4- ainxn = bi, * ........................................ (♦*) . QrjXi 4" 4“ Hy.y.Xy 4“ ^г.г-f-13'Т'Ч-1 + • • ' 4- ’ bf Теорема 28.2. Укороченная система эквивалентна исход- ной системе: (*) ~ (**). Доказательство. Обе системы содержат одинаковое число не- известных. Очевидно, что любое решение системы (*) является реше- нием системы (**). Покажем, что верно и обратное. Действительно, в расширенной матрице В системы (♦) первые г строк являются ба- зисными. Следовательно, все остальные строки согласно теореме о базисном миноре будут линейными комбинациями этих строк. Это означает, что каждое уравнение системы (♦) , начиная с (г 4- 1)-го, бу- дет линейной комбинацией (т.е. следствием) первых г уравнений этой системы. Отсюда вытекает, что каждое решение первых г уравнений системы (*) обращает в тождества все последующие уравнения этой системы. Итак, задача исследования системы (*) упрощена, теперь доста- точно изучить укороченную систему (**). Перейдем к этой задаче. Если г = п, то система (**) имеет единственное решение как си- стема с квадратной невырожденной матрицей (§27). Пусть г < п. Неизвестные ij,... ,хг, коэффициенты при которых входят в базисный минор, назовем главными, а остальные неизвест- ные Тг+ь • • • , хп - свободными. Запишем систему (**) в виде {йцТ1 4- 4- а\гхг = bi — aiir+ixr+i — ... — ainTn, (28.3) flriTi 4" • - 4” aryXj. — b,. r-|.iту*i ... а^^,х^. Придав свободным неизвестным zr+i,... произвольные зна- чения cr+i,...,Cn, получим систему уравнений относительно неиз- вестных Xi,..., хг:
108 Глава VI. Системы уравнений ацХ1 4- ... + flirXr — bi — fli.r+iCr+i — ... — aincn, < ........................................ (***) , “Ь • - * “Ь Grrlr — Or,r-f-1 Gf, г4-1 ‘ с квадратной невырожденной (согласно (28.2)) матрицей. Эта система имеет (§27) единственное решение ci,... ,Сг. Очевидно, что совокуп- ность (сь... ,Cr,cr+i,... ,Сп) является решением системы (**). Теорема 28,3. Придавая свободным неизвестным произ- вольные значения и вычисляя значения главных неизвестных из си- стемы (***) , можно получить все решения системы (**) . Доказательство. Пусть (cj,..., сТ, Ст-ц,..., Сп) - произволь- ное решение системы (**) . Покажем, что оно может быть получе- но указанным путем. Возьмем числа Cr+i,..., Сп в качестве значений для свободных неизвестных тг+ь • • ,хп и будем вычислять значения главных неизвестных, решая систему (***) . Так как (сь..., сг, cr+i, ....Сп) - решение системы (**) , то (ci,...,Cr) - решение системы (***). Но система (***) имеет единственное решение, следовательно, в качестве значений главных неизвестных мы можем получить только числа (ci,..., Ср). Итак, мы нашли правило, которое позволяет получить любое ре- шение системы (**) , а следовательно, и произвольной системы ли- нейных алгебраических уравнений. Теорема 28.4. Система алгебраических уравнений с п не- известными имеет единственное решение тогда и только тогда, когда rgA — rgB = п. Доказательство теоремы фактически содержится в описан- ном выше правиле для получения решения системы. Действительно, если rg А = rg В = п, то, как указано выше, система имеет единствен- ное решение. Если же rgA ' rgB < п, то среди неизвестных будет хотя бы одно свободное неизвестное. Придавая ему произвольные зна- чения, получим бесконечно много решений системы. Общее решение системы. Как указывалось в §26, решить си- стему - значит описать множество всех ее решений. В случае опреде- ленной системы для этого достаточно найти то единственное решение, которым она обладает. В случае же неопределенной системы необхо- димо найти способ, позволяющий описать бесконечное множество ее решений. Один из таких способов состоит в следующем. Решим систему (28.3) относительно главных неизвестных: Xi = /i(xr+1,...,xn), ................................. (28.4) 1Г = fr^v+ll • • • , ХП), где /i,.. .,fr - некоторые однозначно (в силу теоремы 27.1) опреде- ляемые из (28.3) функции. Соотношения (28.4) при произвольных т,+1,.. ., хп описывают множество всех решений системы и называются общим решением си-
§ 29. Метод Гаусса 109 стемы. В отличие от общего, конкретное решение х = (щ, ... , Сп)7, где Ci, i = 1, п, - известные числа, называется частным решением. Однородные системы. Система линейных алгебраических ура- внений с нулевой правой частью называется однородной. Все результаты общей теории справедливы и для этого частного случая, однако здесь имеет место некоторая специфика, на которой мы остановимся подробнее. Из теоремы Кронекера-Капелли следует, что однородная система Ах = 0 (28.5) всегда совместна, так как ранг расширенной матрицы [А|0], очевид- но, равен рангу матрицы А. Впрочем, это видно и непосредственно: однородная система заведомо имеет решение (0,..., 0)т, называемое тривиальным. Согласно общей теории для однородных систем имеют место следующие теоремы. Теорема 28.5. Однородная система (28.5) с п неизвест- ными имеет нетривиальное решение тогда и только тогда, когда rgA < п. Утверждение теоремы следует из теоремы 28.4, так как наличие нетривиального решения для однородной системы равносильно ее не- определенности. Теорема 28.6. Однородная система (28.5) с квадратной матрицей имеет нетривиальное решение тогда и только тогда, когда |А| = 0. §29. Метод Гаусса исследования и решения систем В соответствии с общими принципами метода Гаусса решения матричных задач (§4) укажем тип простейших систем линейных урав- нений, тип эквивалентных преобразований системы, а также покажем, что произвольная система линейных алгебраических уравнений ука- занными преобразованиями приводится к указанному типу. Системы с трапециевидной матрицей. Пусть Ах = Ь (29.1) - систем а с верхней трапециевидной матрицей А. Расширенная мат- рица этой системы имеет вид «и «12 ... air «1,г+1 «1п bi "ДГ- «22 ... a2r «2,г+1 • • • «2п Ьг 0 0 • • | ^rr «г,г+1 - - - «гп ь? , (29.2) 0 0 ... 0 0 0 Ьг+1 0 0 ... 0 0 0 Ьт где оц / 0, г = 1,г.
по Глава VI. Системы уравнений Мы не случайно выбрали системы с верхней трапециевидной мат- рицей. Для таких систем чрезвычайно просто устанавливается со- вместность и достаточно просто находится решение. Теорема 29.1. Система (29.1) с верхней трапециевидной матрицей совместна тогда и только тогда, когда bk = О при к > г. Доказательство. Действительно, ранг трапециевидной мат- рицы А равен числу ненулевых строк, так как минор г-го порядка, расположенный в левом верхнем углу, отличен от нуля, а все миноры более высокого порядка содержат нулевые строки и поэтому равны нулю. Ранг расширенной матрицы (29.2) равен г тогда и только тогда, когда Ьк — 0, к = г + 1,п, так как наличие хотя бы одного ненулево- го элемента bi, где г < i < т, означает наличие ненулевого минора (г + 1)-го порядка: Яц Л12 ... Н1г 61 О 022 - • • а2г 62 О 0 ... агг ЬТ О 0 ... О bi Отсюда на основании теоремы Кронекера-Капелли следует утвержде- ние теоремы. Итак, совместность системы с верхней трапециевидной матрицей устанавливается чисто “визуально”. Пусть теперь система (29.1) совместна. Реализация всех пунктов общей теории исследования и решения совместной системы (§28) для системы (29.1) также проста. 1°. В качестве базисного минора матрицы А всегда можно взять минор, расположенный в левом верхнем углу. 2°. Укороченная система состоит из первых г уравнений. 3°. Если г = п, то система (29.1) станет системой с треугольной матрицей ацХх + аитг + •. + airxr = bi, < 022X2 + - - • + O2r%r = 62, a^fX^. — b,., которая имеет единственное решение (§27); найти его не представляет труда: решая последовательно уравнения системы снизу вверх, мы каждый раз будем иметь дело с уравнением, содержащим только одно неизвестное. 4°. Если г < п, то неизвестные ir+i, • • • ,хп будут свободными и система относительно главных неизвестных примет вид ацТ1 + ... + airxr —bi — а1.г+1Хг+1 - ... - ainxn, < ................................... (29.3) . ОТГХГ = ЬГ Ог,г+1-^г+1 ••• ОгпХп.
§ 29. Метод Гаусса 111 Общее и частное решения исходной системы находятся из системы (29.3) с треугольной матрицей. Элементарные преобразования системы уравнений. Эле- ментарными преобразованиями системы, уравнений называются пре- образования следующих типов: 1) перестановка местами двух уравнений системы; 2) умножение какого-либо уравнения системы на число а / 0; 3) прибавление к одному уравнению системы другого ее уравне- ния, умноженного на любое число /3. Теорема 29.2. Элементарные преобразования системы ли- нейных алгебраических уравнений приводят ее к эквивалентной си- стеме. Доказательство. Элементарные преобразования системы уравнений означают элементарные преобразования строк расширен- ной матрицы В, которые, как известно (§3), равносильны умножению матрицы В слева на матрицы элементарных преобразований. Это, в свою очередь, согласно трактовке (2.3) операции умножения матриц равносильно умножению слева обеих частей системы уравнений на не- вырожденные матрицы элементарных преобразований, что приводит к эквивалентной системе (теорема 26.1). Замечание 1. Рассматриваемые в теореме преобразования относятся то- лько к строкам расширенной матрицы. Очевидно, что элементарные преобразо- вания столбцов расширенной матрицы, вообще говоря, лишены смысла. Однако можно рассматривать элементарные преобразования столбцов основной матрицы А, в частности перестановки ее столбцов, которые означают перенумерацию неиз- вестных системы. Приведение системы общего вида к системе с верхней тра- пециевидной матрицей. Как следует из теоремы 3.1 (и замечания 1 к ней), матрица А системы уравнений (28.1) общего вида элемен- тарными преобразованиями строк и перестановками столбцов приво- дится к верхней трапециевидной форме (1.3). Если используемые при этом элементарные преобразования строк матрицы А применить к строкам всей расширенной матрицы В, то на основании теоремы 29.2 (и замечания к ней) мы придем к такой системе с верхней трапецие- видной матрицей, решения которой отличаются от решений исходной системы только нумерацией неизвестных. Метод Гаусса исследова- ния и решения системы уравнений состоит в приведении ее к системе с верхней трапециевидной матрицей, а затем в исследовании и реше- нии полученной системы. При этом, если в процессе преобразования использовались перестановки столбцов основной матрицы Л, то в по- лученных решениях необходимо восстановить исходную нумерацию неизвестных. Процесс приведения системы к системе с трапециевидной матрицей называ- ется прямым ходом метода Гаусса, а процесс решения системы с треугольной матрицей - обратным ходом. По объему вычислений обратный ход оказывается несущественным в методе Гаусса, так как он требует выполнения О(п2) операций умножения, тогда как для прямого хода требуется выполнить + О(п2) умножений (§4). Таким образом,
112 Глава VI. Системы уравнений метод Гаусса решения системы линейных алгебраических уравнений по объему вычислений равносилен вычислению одного определителя (см. §27, замечание). Замечание 2. В основе метода Гаусса вычисления определителя, вычисле- ния ранга матрицы и решения системы линейных алгебраических уравнений ле- жит один и тот же алгоритм - основной процесс приведения матрицы к ступен- чатой форме. Однако, как отмечалось в §4, 16, 29, реализация этого алгоритма для каждой из этих задач имеет свою специфику. Наиболее "свободно" он реа- лизуется для задачи вычисления ранга матрицы, так как любые элементарные преобразования и строк, и столбцов матрицы не изменяют ее ранга. В задаче вычисления определителя по-прежнему допускаются преобразования как строк, так и столбцов, но уже необходимо следить за изменением определителя, если в преобразованиях участвовали перестановки строк (или столбцов) или умножение строки (столбца) на число а 0 Аккуратнее следует относиться к задаче решения систем уравнений, где допускаются преобразования только строк расширенной матрицы и перестановки столбцов только основной матрицы. § 30. Геометрические свойства решений системы Рассмотрим свойства решений системы линейных уравнений с точки зрения теории линейного пространства. Пусть дана система линейных алгебраических уравнений Ах = Ь (30.1) с матрицей А € RTOXn. Каждое решение этой системы можно рас- сматривать как вектор арифметического пространства Rn. Совокуп- ность всех решений системы (30.1) образует некоторое подмножество пространства Rn. Выясним, какими свойствами оно обладает. Линейное подпространство решений однородной системы. Теорема 30.1. Множество всех решений однородной си- стемы Ах = 0 с п неизвестными является линейным подпростран- ством арифметического пространства Rn. Доказательство. Обозначим L = {ж € Rn|Ai = 0}. Легко проверить, что если х 6 L, у € L, то х + у € L, и, кроме того, если а € R, то ах € L. В силу теоремы 18.1 отсюда следует, что L - линейное подпространство пространства Rn. Эта теорема позволяет "нарисовать" множество решений однородной систе- мы, так как геометрическим образом линейного подпространства являются (§18) прямая и плоскость, проходящие через начало координат. Произвольный базис подпространства решений однородной систе- мы линейных уравнений называется фундаментальной системой ре- шений. Понятно, что фундаментальная система решений существует лишь в том случае, когда однородная система имеет нетривиальное решение. При этом система уравнений может обладать многими фун- даментальными системами решений. Однако все эти системы состоят из одинакового числа векторов, равного максимальному числу линей- но независимых решений однородной системы. Определим это число. Теорема 30.2. Размерность пространства решений одно- родной системы Ах = 0 с п неизвестными равна п —г, где г — rg А.
§ 30. Геометрические свойства решений системы 113 Доказательство. Построим фундаментальную систему реше- ний. Для этого воспользуемся аппаратом свободных неизвестных. Пусть Xi, ..хг - главные неизвестные. Придадим свободным неиз- вестным тг+1, ..., хп следующие п — г наборов решений: (1,0,... ,0), (0,1,..., 0), ..., (0,0,..., 1). Для каждого из этих наборов найдем со- ответствующие значения главных неизвестных. Тем самым найдем п - г решений системы: ei = (еп, с12, ..., cir, 1,0, ...,0)т, 62 = (С21, с22, ..., с2г, 0,1,...,0)т, 6п — г ~ (сп — г,11 Сп—г,2, • - - , ^n~r,rt 0,0,...,!)^. (30.2) Решения ei,..., en_r обладают следующими свойствами. 1. Решения ei,... ,еп_г линейно независимы, так как матрица отличный от нуля), а ранг матрицы согласно теореме 16.3 равен мак- симальному числу линейно независимых строк. 2. Любое решение х = (xi,..., xr,xr+i, - • > хп)т является линей- ной комбинацией ет,..., еп_г, и, более того, х — xr+iei 4-... 4- хпеп . (30.3) Действительно, обозначим у = х — xr+iei — • • • — хпеп_г. Пусть у = (yi,..., уп)Т- Очевидно, что у - решение системы. Найдем его, пользуясь общей теорией решения систем: придадим свободным неиз- вестным значения yr+i,уп. Пользуясь соотношением (30.2), легко показать, что yr+i = • • = уп = 0- Следовательно, укороченная систе- ма будет однородной системой, имеющей единственное и, очевидно, тривиальное решение yi ... = уг = 0. Таким образом, у = 0. Отсюда вытекает (30.3). Из свойств 1 и 2 следует, что ei,... ,еп_г - фунда- ментальная система решений. Построенная фундаментальная система решений называется нор- мальной фундаментальной системой решений. Общий принцип по- строения фундаментальной системы решений следует из теоремы 30.2: так как размерность пространства решений однородной системы равна п — г, то для построения фундаментальной системы решений достаточно найти любые п - г линейно независимых решений (§ 17, утверждение 1). Для этого достаточно свободным неизвестным при- дать п — г линейно независимых наборов значений, т.е. наборов вида
114 Глава VI. Системы уравнений (С1,г+1,---,С1п), , (сп_г>г+1,...,сп_Г1П), для которых С1.Г+1 С-п—гтп /0. (30.4) Cfi—г,г4-1 Если для каждого из этих наборов найти соответствующие значе- ния главных неизвестных, то получим п — г решений системы: €1= (Си, ..., Cjr, С11Г+1, ..., С1п)Т, Сп —г ~ (^П —Г,1, --5 *41—Г, Г' On—г,г4-1’ •••> ^п-г.п) , линейно независимых вследствие (30.4). Общее решение однородной системы. Фундаментальная си- стема решений ei,... ,еп~г однородной системы линейных уравнений позволяет записать любое решение системы в общем виде: х = oiei 4-... + о:п_геп_г , ^Vcti, • -., On-r G R. (30.5) Представление (30.5) решения называется общим решением одно- родной системы уравнений через фундаментальную систему реше- ний (в отличие от общего решения (28.4) через свободные неизвест- ные). Линейное многообразие решений неоднородной системы. Пусть Ах = Ь (30.6) - неоднородная система линейных алгебраических уравнений. Одно- родная система Ах = 0, (30.7) полученная из системы (30.6) заменой свободных членов нулями, на- зывается приведенной однородной системой для системы (30.6). Между решениями обеих систем существует тесная связь. Легко проверить следующие факты. 1°. Сумма решений неоднородной и приведенной однородной си- стем является решением неоднородной системы. 2°. Разность двух решений неоднородной системы является ре- шением приведенной однородной системы. Теорема 30.3. Множество всех решений неоднородной си- стемы является линейным многообразием, полученным сдвигом под- пространства решений приведенной однородной системы на част- ное решение неоднородной системы. Доказательство. Пусть Н - множество всех решений неод- нородной системы (30.6), с - частное его решение и L - множество всех решений приведенной системы (30.7). Покажем, что Н = с+ L. Действительно, если z € Н, то z = с+ (z - с) = с+ х, где х = z - с. Так как х € L (как разность двух решений системы (30.6)), то z € с 4- L и, следовательно, Н С с + L. С другой стороны, если z € с + L, то
§ 30. Геометрические свойства решений системы 115 z = с 4- х, х € L. Значит, z € Н как сумма решений неоднородной и приведенной систем. Следовательно, c + LgHhH=c+L. Общее решение неоднородной системы. Итак, найдя одно (частное) решение неоднородной системы и прибавляя его к каждо- му решению приведенной системы, можно получить все решения не- однородной системы. В силу (30.5) это позволяет записать решение неоднородной системы в общем виде следующим образом: z = с + Ojei + ... + an_ren_r, Vai,..., ctn_r G R, (30.8) где с - частное решение системы (30.6), a ei,...,en_r - фундамен- тальная система решений системы (30.7). Представление (30.8) реше- ния называется общим решением неоднородной системы уравнений через фундаментальную систему решений. Итак, общее решение не- однородной системы есть сумма частного решения неоднородной си- стемы и общего решения приведенной однородной системы. Замечание. В соответствии с теоремой 30.3 геометрическим образом мно- жества всех решений неоднородной системы уравнений служат прямая и плос- кость, не проходящие через начало координат (§18).
Глава VII. Алгебраические линии и поверхности первого порядка §31. Понятие об уравнениях линии и поверхности Пусть Оху и Oxyz - аффинные системы координат на плоскости и в пространстве. Уравнение F(x,y)=0, (31.1) соответственно F(x,y,z) = 0, (31.2) называется уравнением, линии С на плоскости {поверхности к в прос- транстве) в заданной системе координат, если этому уравнению удо- влетворяют координаты всех точек линии £ (поверхности тг), и толь- ко они. Очевидно, что два уравнения в заданной системе координат определяют одну и ту же линию (поверхность) тогда и только тогда, когда они эквивалентны. Алгебраическим одночленом относительно переменных х, у (соот- ветственно х, у, z) с вещественным коэффициентом А называется вы- ражение AxV (Xxpy4zr), (31.3) где р, q, г - целые неотрицательные числа. Если А / 0, то число р + q (соответственно р + q + г) называется степенью одночлена. Алгебра- ическим многочленом относительно переменных х, у (т, у, z) с веще- ственными коэффициентами называется конечная сумма алгебраиче- ских одночленов (31.3). Наибольшая степень одночленов, входящих в многочлен, называется степенью многочлена. Линия на плоскости (поверхность в пространстве) называется ал- гебраической, если в некоторой аффинной системе координат она оп- ределяется уравнением (31.1) (соответственно (31.2)), где F(x, у) (со- ответственно F(x,y,z)) - алгебраический многочлен от переменных х, у (т, у, г) с вещественными коэффициентами. Степень многочлена F(x, у) (соответственно F(x,y,z)) называется порядком линии (по- верхности). Корректность этого определения вытекает из следующей теоремы. Теорема 31.1 (об инвариантности порядка). При пере- ходе от одной аффинной системы координат к другой алгебраическая линия (поверхность) остается алгебраической и порядок ее не изме- няется.
§32. Уравнения прямой на плоскости и плоскости в пространстве 117 Доказательство проведем для линии. Пусть на плоскости в аффинной системе координат Оху линия £ определяется уравнением (31.1), где F(x, у) - алгебраический многочлен степени п. При перехо- де к новой системе координат О'х'у' уравнение (31.1) преобразуется в уравнение F'(x',y') = 0. Покажем, что F'(x',y') - тоже алгебраи- ческий многочлен и его степень п' = п. Для этого в каждый одно- член Ахруч многочлена F(x, у) вместо х и у подставим их выражения через х', у' согласно формулам преобразования координат (§24). То- гда Axpyq = А(сца:' 4- сну' + a)p(c2ix' + с22у' + /3)’. Следовательно, одночлен Ахруч преобразуется в алгебраический многочлен от пере- менных х', у', степень которого не превосходит р + q. При этом мно- гочлен F(x,y) преобразуется в алгебраический многочлен F'(x',y'), степень которого п' < п. Если в этих рассуждениях поменять ролями системы координат, то получим, что п < п', т.е. п' — п. § 32. Уравнения прямой на плоскости и плоскости в пространстве Этот и несколько следующих параграфов посвящены прямой на плоскости и плоскости в пространстве. Мы будем изучать эти поня- тия одновременно, так как у них много общего. И это понятно, ведь и прямая на плоскости, и плоскость в пространстве представляют собой один и тот же объект в линейном пространстве, называемый гиперплоскостью (§18). В тех случаях, когда сходные теоремы име- ют, по существу, одинаковые доказательства, мы будем доказывать только одну из них. В этом параграфе рассматриваются различные типы уравнений прямой на плоскости (плоскости в пространстве), каждый тип уравне- ния определяется тем геометрическим заданием, которое однозначно определяет прямую (плоскость). Канонические уравнения. Ненулевой вектор, коллинеарный прямой, называется ее направляющим вектором. Из аксиом геомет- рии следует, что через любую точку проходит единственная прямая с заданным направляющим вектором. Пусть прямая I с направляю- щим вектором а проходит через точку Мо. Очевидно, точка М лежит на прямой I (рис. 1) тогда и только тогда, когда векторы мол! и а коллинеарны, т.е. ли- нейно зависимы (§15). С учетом условия а О это равносильно тому, что вектор М0М линейно
118 Глава VII. Алгебраические линии и поверхности первого порядка выражается через вектор а: Мол/ = t а, / € R. (32.1) Таким образом, условию (32.1) удовлетворяют все точки М пря- мой I, и только они. Теорема 32.1. На плоскости в аффинной системе коорди- нат Оху уравнение прямой I, проходящей через точку Мо(хо,уо}, с направляющим вектором а = {т, п} имеет вид х - То У - Уо т п = 0 или х-х0 _ у — Уо т п (32.2) (32.3) Доказательство. Пусть точка М имеет координаты (х,у), то- гда Мо1^ — {х — Хо,у — Уо}- Условие (32.1) в силу линейности ко- ординат означает, что в определителе (32.2) первая строка линейно выражается через вторую, а это равносильно равенству (32.2). Итак, уравнению (32.2) удовлетворяют координаты (х,у) всех точек пря- мой I, и только они. Равенство нулю определителя второго порядка равносильно пропорциональности его строк, т.е. условию (32.3). Замечание 1. Уравнение (32.3) означает лишь пропорци- ональность и в случае, когда тп — 0 или п — 0, оно равносильно уравнению х — xq — 0 или у — уо = 0 соответственно. Уравнения (32.2), (32.3) называются каноническими уравнения- ми прямой на плоскости. Следствие 1. Уравнение прямой, проходящей через две различ- ные точки Мо(хо,уо) и Mi(rri,j/i), имеет вид x-xq у-уо = 0 Xi - х0 yi - уо Это следует из того, что вектор MqMi является направляющим вектором прямой. Без принципиальных изменений может быть получено аналогич- ное уравнение плоскости в пространстве. Два неколлинеарных век- тора, параллельных плоскости, называются ее направляющими век- торами. Из аксиом геометрии следует, что через любую точку прохо- дит единственная плоскость с заданными направляющими векторами.
§32. Уравнения прямой на плоскости и плоскости в пространстве 119 Пусть плоскость тг с напра- вляющими векторами pi и рг проходит через точку Mq. Оче- видно, точка М лежит в плос- кости тг тогда и только тогда, когда (рис. 2) векторы Pi, рг компланарны, т.е. ли- р нейно зависимы (§15). ис‘ С учетом условия неколлинеарности векторов pi и р2 это равно- сильно тому, что вектор MqAI линейно выражается через pi и р2: = upi+vp2, u, i> € R. (32-4) Теорема 32.2. В пространстве в аффинной системе ко- ординат Oxyz уравнение плоскости к, проходящей через точ- ку М0(х0,у0, zq), с направляющими векторами pi — и Р2 = {тты, ti2,/с2} имеет вид X — Xq У-Уо 2 - 20 ТП[ 771 kl = 0 ТП2 Tl2 ^2 (32.5) Доказательство теоремы повторяет доказательство теоремы 32.1. Уравнение (32.5) называется каноническим уравнением плоскос- ти. Следствие 2. Уравнение плоскости, проходящей через три точки М0(х0, уо, zq), Mi(xi,yi,zi), М2(т2> У2, £2), не лежащие на од- ной прямой, имеет вид х -х0 у — уо 2=1 — У1 - Уо ^2 -Х0 У2- Уо Z - Zq 21 - 20 22 — 20 = 0. Параметрические уравнения. Этот тип уравнений представля- ет собой другую форму записи условий (32.1) и (32.4). Пусть г = Ол1, го = OMq - радиус-векторы точек М и Mq относительно полюса О. Тогда MqA1 = г — го и условие (32.1) может быть записано в виде г — го + t a, t € R, (32.6) или, в координатной форме, в системе координат Оху: У Xq + tm, уо + tn, t е R. (32.7)
120 Глава VII. Алгебраические линии и поверхности первого порядка Уравнения (32.6), (32.7) называются параметрическими уравне- ниями прямой на плоскости в векторной и координатной формах. Замечание 2. Число t является координатой точки М на пря- мой I в системе координат {Л/q, а}. Аналогично условие (32.4) может быть записано в виде г = го + upi + v р2, m€R, (32.8) или, в координатной форме, в системе координат Oxyz: {х = хо + umi + vni2, У = Уо + ищ + vn2, (32.9) z = zq + uki 4- vk2, и, v € R. Уравнения (32.8), (32.9) называются параметрическими уравне- ниями плоскости в векторной и координатной формах. Замечание 3. Числа и, v являются плоскостными координатами точки М плоскости тг в системе координат {Л/о; pi, рз}. Общие уравнения. Теорема 32.3. Линия на плоскости является прямой то- гда и только тогда, когда она представляет собой алгебраическую линию первого порядка. Доказательство.Необходимость. Пусть I - прямая на плос- кости, проходящая через точку Мо и параллельная ненулевому век- тору а. Пусть Оху - произвольная аффинная система координат и а = {тп, п}, Мо(хд,уа). Тогда прямая I описывается каноническим уравнением (32.2) или, что то же самое, уравнением п(х — хо) — —т(у — уо) = 0, которое, если положить А — п, В = — m, С = — пхо + + туо, может быть записано в виде Ах+ Ву + С = 0. (32.10) Так как вектор а = {т, п} / 0, то по крайней мере один из ко- эффициентов А или В отличен от нуля. Поэтому левая часть уравне- ния (32.10) представляет собой алгебраический многочлен первой сте- пени. Следовательно, любая прямая на плоскости является алгебра- ической линией первого порядка. Достаточность. Пусть в аффинной системе координат Оху ли- ния I определяется уравнением (32.10). Это уравнение имеет частное АС ВС решение ха = ~ лз + д2’ = "^2 + д2’ иб° Ах° + ВУа + С = °- Вычитая последнее равенство из (32.10), получим, что А(х — а:0) + + В(у — уо) = 0 или, что то же самое, х - х0 у — уо -В А = 0.
§ 32. Уравнения прямой на плоскости и плоскости в пространстве 121 В силу теоремы 32.1 это уравнение определяет прямую, проходящую через точку Мо(хо,уо), с направляющим вектором а = {—В, Л}. Уравнение (32.10) называется общим уравнением прямой на плос- кости. Вектор п = (Л, В} называется вектором нормали к прямой относительно уравнения (32.10). Теорема 32.4. Поверхность в пространстве является плоскостью тогда и только тогда, когда она представляет собой алгебраическую поверхность первого порядка. Доказательство теоремы повторяет доказательство теоре- мы 32.3 с той лишь разницей, что уравнение плоскости имеет вид Ax + By + Cz + D = 0, где Л2 + В2 + С2 0, (32.11) AD _ BD _ CD Х° ~ ~ А2 + В2 + С2' Уо~ А2 + В2 + С2' Z°~ А2 + В2 + С2’ а уравнение (32.11) может быть записано в виде х — Хо -В -С У~Уо А 0 z- z0 0 Л = 0, если Л / 0 (случаи В / 0 и С 0 рассматриваются аналогично). Уравнение (32.11) называется общим уравнением плоскости в про- странстве. Вектор п = {Л, В, С} называется вектором нормали к плоскости относительно уравнения (32.11). Общее уравнение прямой (плоскости) называется полным, если все коэффициенты А, В, С (соответственно A,B,C,D) отличны от нуля. Теорема 32.5. В аффинной системе координат Оху на плос- кости (Oxyz в пространстве) вектор а= {тп, п} (соответственно а = {т, п, к}) параллелен прямой (плоскости), заданной общим урав- нением (32.10) (соответственно (32.11),), тогда и только тогда, ко- гда Ат + Вп = 0, (32.12) соответственно Ат + Вп + Ск = 0. (32.13) Доказательство (для прямой). Как следует из доказатель- ства теоремы 32.3, вектор b = {—В, Л} является направляющим век- тором прямой. Это означает, что вектор а параллелен этой прямой то- v. т п л гда и только тогда, когда а коллинеарен Ь, т.е. когда =0 или, что то же самое, Ат 4- Вп = 0. Замечание 4. Левые части условий (32.12), (32.13) можно рассматривать как скалярные произведения вектора нормали п и век- тора а в ортонормированием базисе. Таким образом, в прямоуголь- ной декартовой системе координат вектор нормали п — {Л, В} к
122 Глава VII. Алгебраические линии и поверхности первого порядка прямой (32.10) (соответственно п = {А, В, С} к плоскости (32.11)) перпендикулярен этой прямой (плоскости). Уравнения в отрезках. Полные уравнения (32.10) и (32.11) пря- мой на плоскости и плоскости в пространстве могут быть записаны в следующем виде: х У _ 1 Х + У i 2 - 1 -С/А -С/В И -D/А -D/В -D/C Полагая a = —С/А, b = -С/В (для прямой) и а = —D/А, Ь = -D/B, с — —D/С (для плоскости), получим эквивалентные уравнения называемые уравнениями прямой и соответственно плоскости в отрезках. Числа а, Ь, с в этих уравнениях имеют простой геометриче- ский смысл (рис. 3): они равны величинам отрезков, которые отсекает прямая (плоскость) на осях координат. Векторные уравнения. 1. Параметрическое уравнение (32.6) представляет собой векторное уравнение прямой на плоскости через направляющий вектор. Аналогично параметрическое уравнение (32.8) представляет собой векторное уравнение плоскости в пространстве через направляющие векторы. Оно порождает другие формы векторных уравнений плоско- сти. В самом деле, это уравнение означает компланарность векторов г— го, pi и р2, что согласно критерию компланарности (теорема 23.4) равносильно равенству (г - го, pi, р2) = 0 (32.14) или, в силу линейности смешанного произведения, (г, pi,p2) = D, (32.15) где D - константа, равная (го, plt р2). Уравнения (32.14), (32.15) представляют собой векторные уравне- ния плоскости через смешанное произведение.
§ 33. Взаимное расположение прямых и плоскостей 123 2. Из аксиом геометрии следует, что на плоскости (в пространстве) через заданную точку проходит единственная прямая (соответственно плоскость), перпендикулярная заданному вектору. Теорема 32.6. Уравнение прямой на плоскости (плоскости в пространстве), проходящей через точку Mo(tq) перпендикулярно вектору п, имеет вид (г-го, п) = О (32.16) или, что то же самое, (г, п) = Р, (32.17) где D - константа, равная (го, п). Доказательство. Утверждение теоремы вытекает из того, что точка М(г) лежит на прямой (на плоскости) тогда и только тогда, когда векторы Мол/и п ортогональны. Уравнения (32.16), (32.17) представляют собой векторные уравне- ния прямой на плоскости и плоскости в пространстве через нормали. § 33. Взаимное расположение прямых на плоскости (плоскостей в пространстве) Взаимное расположение двух прямых (плоскостей). Пусть на плоскости (в пространстве) две прямые (две плоскости) заданы общими уравнениями в аффинной системе координат Оху (Oxyz): li : AiX + Biy + Ci = О, A2 + B?^0, г = 1,2, (33.1) и соответственно Xi : AiX + Bty + Ctz + Di = 0, A? + В2 + C2 / 0, i = 1,2. (33.2) Составим матрицы из коэффициентов этих уравнений: Ai Bi о _ Ai Bi Ci A2 B2 ' A2 B2 C2 для прямых и Ai Bi Ci n _ Ai Bi Ci Di A2 B2 C2 ’ A2 b2 c2 d2 (33.3) (33.4) для плоскостей. Очевидно, что в обоих случаях 1 < rgA < 2, 1 < rg В < 2, rg А < rg В. Следовательно, для рангов матриц А и В возможны только следующие три набора значений: rg А rg В 1 2 1 1 2 2 (33.5)
124 Глава VII. Алгебраические линии и поверхности первого порядка Теорема 33.1. Прямые li и 1з на плоскости совпадают то- гда и только тогда, когда Ai _ В\ _ С\ _ А? В'2 Сз параллельны и не совпадают тогда и только тогда, когда у £i. Аз Вз Сз пересекаются тогда и только тогда, когда А , £1 Аз * Вз (33.6) (33.7) (33.8) Доказательство. Рассмотрим систему линейных алгебраичес- ких уравнений А[Х + Bly + Ci = О, (33.9) А3Х + Взу + Сз — О относительно неизвестных х, у. Для этой системы матрицы А и В из (33.3) являются основной и расширенной матрицами соответственно. Согласно (33.5) эта система совместна только в двух случаях: ко- гда rgA = rgB = 1 и rgA = rgB = 2. В случае когда rgA — 1, a rg В = 2, система несовместна. В первом случае решения систе- мы образуют одномерное линейное многообразие (§30), а во втором - нульмерное, т.е. система имеет единственное решение. Перейдем к прямым li и 1з. Совпадение прямых 1\ и I3 означает, что решения системы (33.9) образуют одномерное линейное много- образие, т.е. что rgA = rgB = 1 или, что то же самое, rgB = 1. Это условие равносильно (33.6) в силу теоремы о базисном миноре. Параллельность прямых li и 1з (и их несовпадение) означает, что си- стема (33.9) несовместна, т.е. что rgA = 1, rgB = 2. Это условие равносильно (33.7). Пересекаемость прямых 1\ и I3 означает, что си- стема (33.9) имеет единственное решение, т.е. что rg А = rg В = 2 или, что то же самое, rg А — 2. Это условие равносильно (33.8). Теорема 33.2. Плоскости ттх и тг2 совпадают тогда и толь- ко тогда, когда = Bi =£l = £l. Аз Вз Сз D3 параллельны и не совпадают тогда и только тогда, когда А! = В± = Cl В1 Аз Вз Сз D3 ’
§ 33- Взаимное расположение прямых и плоскостей 125 пересекаются тогда и только тогда, когда коэффициенты Ai, Bi, Су и А2, В2, Сз не пропорциональны. Доказательство теоремы представляет собой естественный аналог доказательства теоремы 33.1 и не содержит принципиальных отличий. Отметим лишь, что в случае, когда rg А = rg В = 1, решения системы образуют двумерное линейное многообразие (т.е. плоскости 7Г1 и тг2 совпадают), а в случае, когда rg.4 — rgB = 2, решения си- стемы образуют одномерное линейное многообразие (т.е. плоскости пересекаются по прямой). Замечание. Теоремам 33.1 и 33.2 можно дать единую форму- лировку в терминах матриц (33.3) и (33.4): прямые /j uZ2 (плоскости TTi U 7Г2) совпадают <=> rgB = l; параллельны и не совпадают <=> rgА — 1, rgB = 2; пересекаются <=> rgA = 2. Пучок прямых (плоскостей). Множество всех прямых плоско- сти, проходящих через данную точку Mq, называется пучком прямых с центром в точке Mq. Обозначение: тг(Мо). Пусть li и 12 - две не- совпадающие прямые пучка л (Mq), заданные уравнениями (33.1) в не- которой аффинной системе координат Оху. Положим F(x, у) = Aix + Bty + Ci, где i — 1,2. Теорема 33.3. Прямая принадлежит пучку л(Мо) тогда и только тогда, когда она определяется уравнением aFi (х, у) + 0F2(x, у) = 0 (33.10) при некоторых а, 0 е R, одновременно не равных нулю. Доказательство. Достаточность очевидна, так как урав- нение (33.10) является в силу условия (33.8) уравнением первой сте- пени и определяет прямую. Она проходит через точку Мо(хо.Уо), по- скольку Г1(г0, у0) = 0 и F2(t0. Уо) = 0. Необходимость. Пусть прямая I € тг(Мо)- Возьмем на этой прямой точку Mi(xi,yi), отличную от точки Мо(хо,уо'). Положим а = А2х^ + В2у1 + С2, 0 = -(Ajii + Biyi + Ci). Поскольку точка Mi не может одновременно лежать на li и Z2 (ибо прямые li и 12 не совпадают), то по крайней мере одно из чисел а или 0 отлично от ну- ля. Тогда уравнение aFi (1, у) + 0F2(x, у) = 0 согласно условию (33.8) является уравнением первой степени и определяет прямую. Очевид- но, она проходит через точки Mq (так как прямые Z2 проходят через Mq) и Mi (согласно выбору а, 0). Следовательно, эта прямая совпадает с I. Итак, любая прямая пучка п(Мо) определяется двумя пересекаю- щимися прямыми li и 12 этого пучка. Каждая пара чисел а, 0, где а2+ -I- 02 0, определяет единственную прямую пучка. Уравнение (33.10) называется уравнением пучка прямых, проходящих через точку пере- сечения прямых (33.1).
126 Глава VII. Алгебраические линии и поверхности первого порядка Множество всех плоскостей пространства, проходящих через пря- мую I, называется пучком плоскостейс осью/.Обоз начен ие: тг(/). Пусть 7Г1 и 7Г2 _ Две пересекающиеся плоскости пучка тг(/), заданные уравнениями (33.2) в некоторой аффинной системе координат Oxyz. Положим F,(x, у, z) = AiX + Biy + Ctz 4- D,, где i = 1,2. Теорема 33.4. Плоскость принадлежит пучку л{1) тогда и только тогда, когда она определяется уравнением aFi(x,y,z) + (№2(1,у, z) — Q (33.11) при некоторых а,/3 ё R, одновременно не равных нулю. Доказательство теоремы, по существу, повторяет доказатель- ство теоремы 33.3. Отметим лишь, что в данном случае Mi - любая точка плоскости, не лежащая на оси I. Уравнение (33.11) называется уравнением пучка плоскостей, про- ходящих через прямую пересечения плоскостей (33.2). § 34. Полуплоскости и полупространства Из аксиом геометрии следует, что каждая прямая I на плоскости разбивает эту плоскость на две полуплоскости, при этом точки Му и М2, не лежащие на прямой I, принадлежат одной полуплоскости, если отрезок [MiМ2] не имеет общих точек с прямой I, в противном случае точки Му и М2 принадлежат разным полуплоскостям. Выясним, как этот геометрический факт описывается в аналитической форме. Пусть прямая I в аффинной системе координат Оху определяется уравнением Ах 4- By 4- С = 0. (34.1) Теорема 34.1. Точки Му(ху, у у) принадлежат разным полуплоскостям относительно прямой I тогда и только то- гда, когда (•Aii 4- Вуу 4- С)(Л®2 4- Ву2 4- С) < 0. (34.2) Доказательство. Предварительно заметим, что точка Мо(хо, уо) является внутренней точкой отрезка [М1М2] тогда и толь- ко тогда, когда МуМо = tMyM2, где 0 < t < 1, т.е. х0 = (1 - t)xy 4- tx2, уо = (1 - t)yi 4- ty2, 0 < t < 1. Точки Му(ху,уу) и М2(х2,у2) принадлежат разным полуплоско- стям тогда и только тогда, когда существует точка Мо(хо,уо), общая для прямой I и отрезка [М1М2], причем Mq является внутренней точ- кой отрезка [MiМ2], т.е. f Azo 4- Вуо 4- С = 0, 1 Хо = (1 - t)xy 4- tx2, Уо = (1 - t)yy +ty2, 0 < t < 1.
§ 34. Полуплоскости и полупространства. 127 С учетом очевидного тождества С = (1 — t)C + tC получим, что точки Л/i и М2 принадлежат разным полуплоскостям тогда и только тогда, когда существует число t такое, что (1 — 4- Вщ 4- С) 4- t(Ax2 И- Ву2 4- В) — 0, 0 < t < 1, или, в обозначениях Axi + Ву\ + С = Fi, Ах2 + Ву2 + С = F2, (1 — t)Ft 4- tF2 ~ 0, 0 < t < 1. Это равносильно тому, что FiF2 < 0. Итак, для координат (т, у) всех точек одной полуплоскости выпол- няется неравенство Ах+Ву+С > 0, адругой — неравенство Ах 4- Ву + 4- С < 0. Полуплоскость, для точек М(х, у) которой Ах + By 4- С > 0, называется положительной полуплоскостью относительно уравне- ния (34.1) прямой I и обозначается символом тт+, а полуплоскость, для точек которой Ах 4- By 4- С < 0, - отрицательной полуплоско- стью и обозначается 7Г_. Теорема 34.2. Вектор нормали п = {А,В} к прямой I: Ах 4- By 4- С — 0, отложенный от любой точки прямой, направлен в сторону положительной полуплоскости. Доказательство. Пусть Мо(хо,уо) - произвольная точка пря- мой I. Отложим вектор и от точки Мо, пусть конец вектора п со- впадает с точкой Mi(xi,yi). Тогда п — {xi - io,yi - уо} = {А,В} и, следовательно, Xi = А + xq, yi = В 4- уо- Подставив координаты ^1,1/1 точки Mi в левую часть уравнения прямой I, получаем, что Атх 4- Byi 4- С — А2 4- В2 4- Axq 4- Вуо + С = А2 + В2 >0, так как Ахо + Вуо 4- С = 0 и п 0. Аналогичные факты имеют место и в пространстве. Плоскость тг : Ах 4- By 4- Cz 4- В — 0 (34.3) разбивает пространство на два полупространства. Теорема 34.3. Точки Mi(x\,y\,zi) и M2(x2,y2,z2) принад- лежат разным полупространствам относительно плоскости к то- гда и только тогда, когда (Axi 4- Ву\ 4- Czi 4- В)(Ат2 4- Ву2 4- Cz2 4- В) < 0. Доказательство теоремы принципиально не отличается от до- казательства теоремы 34.1. Полупространство, для точек М(х, у, г) которого Ах 4- By 4- Cz 4- 4- D > 0, называется положительным полупространством относи- тельно уравнения (34.3) плоскости тг, а полупространство, для точек которого Ах 4- By 4- Cz 4- О < 0, - отрицательным полупростран- ством. Теорема 34.4. Вектор нормали п = {А, В, С} к плоскости к: Ах 4- By 4- Cz 4- D — 0, отложенный от любой точки плоскости, направлен в сторону положительного полупространства. Доказательство теоремы аналогично доказательству теоре- мы 34.2. 5 Линейна* алгебра и аналитическая геометрия
128 Глава VII. Алгебраические линии и поверхности первого порядка § 35. Прямая на плоскости (плоскость в пространстве) в прямоугольной декартовой системе координат Рассматривается прямоугольная декартова система координат Оху на плоскости (Oxyz в пространстве), определенная ортонормиро- ванным базисом ei, ег (ej., ез, ез соответственно). Известно (§32, за- мечание 2), что вектор нормали п = {Л, В} (соответственно п — — {.4, В, С}) перпендикулярен прямой I, заданной уравнением (32.10) (соответственно плоскости тг, заданной уравнением (32.11)). Расстояние от точки до прямой (до плоскости). Теорема 35.1. В прямоугольной декартовой системе ко- ординат Оху расстояние р(Мо,/) от точки Мо(хо,уо) до прямой (32.10) определяется формулой ,,, n l^o + Вуо + С| р(и°'')= ЛР + в’ (35л) Доказательство. Пусть Mq £ I (для точек Mq е I равенство (35.1) очевидно). Опустим из точки Mq перпендикуляр на прямую I, пусть М1(хл,у1) - основание перпендикуляра. Тогда M^Mq = ап и p(M0,l) = IMxMqI = |а| |п| = |а|\/Л2 + В2. (35.2) Найдем а. Так как xq = 24 4- оЛ, уо = у\ 4- аВ, то Axq + Вуо 4- 4- С = Axi 4- Byi 4- С 4- а(А2 4- В2) — а(А2 4- В2). Отсюда а = (Axq 4- 4- Вуо 4- С)/(А2 4- В2). Подставив это значение а в (35.2), получим (35.1). Теорема 35.2. В прямоугольной декартовой системе ко- ординат Oxyz расстояние от точки Mq(xq, уо, zq) до плоскости (32.11) определяется формулой ,,, \ Ихо 4- Вуо 4-Czq 4- D\ pi Мо, л) = --, ---. у/А2 + В2 + С2 Угол между прямыми (между плоскостями). Пусть прямые Z1 и 12 (плоскости Ki и тг2) заданы уравнениями (33.1) (соответственно (33.2)). Вообще говоря, две пересекающиеся прямые li и 12 (плоскости и тгг) образуют два угла, в сумме равные тг. Достаточно определить один их них. Так как векторы нормали щ и п2 перпендикулярны прямым (плоскостям), то угол <р = (пТТл-г) совпадает с одним из углов между прямыми и 12 (между плоскостями лг и л2). Итак, согласно (22.6) угол <р между прямыми (33.1), совпадающий с углом между их нормалями, определяется формулой AjA-2 4- В\В2 cos ip = —, ,—. , ^/А2 + В?^/А2+В2
§ 36. Прямая в пространстве 129 а угол между плоскостями (33.2), совпадающий с углом между их нормалями, - формулой Л] Аг + В\В2 + С\С>2 cos — —, —, . В частности, прямые li и I2 {плоскости tti и тг2) перпендикулярны тогда и только тогда, когда Aj А2 + В1В2 = 0 ( j4j А 2 А В1В2 + Ci(?2 =0). § 36. Прямая в пространстве Уравнения прямой. 1. Векторное уравнение (32.6) прямой на плоскости остается справедливым и для прямой в пространстве, так как и в пространстве прямая однозначно определяется точкой и на- правляющим вектором. Итак (§32), если в пространстве зафиксиро- ван полюс О, то уравнение прямой, проходящей через точку Mq(to), с направляющим вектором а имеет вид г — го + ta, t 6 R. (36.1) Пусть в аффинной системе координат точка Mq имеет координаты (х0, уо, zq), а вектор а = {т, п, /с}. Тогда уравнение (36.1) может быть записано в координатной форме: X — Xq + tm, - У = Уо + tn, , z = zq 4- tk, t € R. (36.2) Уравнения (36.1), (36.2) называются параметрическими уравне- ниями прямой в пространстве в векторной и координатной формах соответствен но. 2. Уравнение (36.1), означающее коллинеарность векторов г— го и а, может быть записано и в терминах пропорциональности координат векторов г — го = {х — xq, у — Уо, z — zq} и а = {m, n, fc} следующим образом: х-хо = у-уо = z-zo т п к Уравнения (36.3) называются каноническими уравнениями пря- мой в пространстве. Так же как и для канонического уравнения (32.3) прямой на плос- кости, уравнения (36.3) говорят лишь о пропорциональности коорди- нат векторов г — го и а. Если, например, т — 0, то уравнения (36.3)
130 Глава VII. Алгебраические линии и поверхности первого порядка переходят в уравнения Если же rn = 0, п = 0, то уравнения (36.3) переходят в уравнения х - х0 = 0, у - уо = 0, т.е. прямая является линией пересечения плоскостей х — Хо = 0 и У - Уо = 0. 3. Для прямой, проходящей через две различные точки Af0(io, уо, zq) и Mi(xi,yi,zi), легко получить уравнения (36.1)-(36.3), так как в качестве направляющего вектора может быть взят вектор а = = MqMi - {li - То, У1 - Уо, Zi - Zq}. 4. Векторное уравнение (36.1) порождает и другие формы вектор- ных уравнений прямой в пространстве. В самом деле, это уравнение означает коллинеарность векторов г — го и а, что согласно критерию коллинеарности (теорема 23.2) равносильно равенству [г - г0, а] = 0 (36.4) или, в силу линейности векторного произведения, [г, а] = М, где М = [го, а]. (36.5) Заметим, что уравнения (36.4) и (36.5) лишены смысла для прямой на плос- кости; по своей структуре они близки к уравнениям (32.14) и (32.15) плоскости в пространстве. 5. Каждая прямая может быть представлена как пересечение двух плоскостей. Практически уравнения (36.3) задают Прямую именно та- ким образом, так как они эквивалентны системе из двух линейных уравнений, каждое из которых определяет плоскость. Дадим общую формулировку этого факта. В аффинной системе координат Oxyz прямая I, являющаяся линией пересечения плоскостей тг, : AiX + В,у + CiZ + .Di = 0, i = 1,2, определяется системой уравнений где ( Atx + Bty + Ciz + £>i = 0, ( А2Х + В2У + C2z + D2 = о, rg Bi Ci в2 с2 = 2. (36.6) (36.7) Ai Л2 Условие (36.7) означает, что плоскости тц и тг2 пересекаются (§33, замечание). Систему (36.6) называют общими уравнениями прямой в пространстве. Важно уметь переходить от одного типа уравнения прямой к дру- гому. Переход от каждого из уравнений (36.1)-(36.5) к любому дру- гому очевиден. Для перехода от уравнений (36.6) к (36-1)—(36.5) не- обходимо найти точку Мо и направляющий вектор а. Координаты
§ 36. Прямая в пространстве 131 точки Л/о можно найти как частное решение системы (36.6). Найдем вектор а. Теорема 36.1. Если в аффинной системе координат Oxyz прямая I задана общими уравнениями (36.6), то вектор а = Bi Су В2 С2 A G А2 С2 (36.8) А А является направляющим вектором этой прямой. Доказательство. Отметим прежде всего, что а^ Ов силу условия (36.7). Далее, вектор а параллелен плоскостям ttj и ттд, так как разложения определителей Л1 В\ С\ А С\ А% В2 С2 А2 В2 С2 А В\ Ci А &2 С2 = 0 и = о по первой строке совпадают с условиями (32.13) параллельности век- тора а плоскостям ttj и тг2. Итак, ненулевой вектор а параллелен каждой из плоскостей тн и л2. Следовательно, он является напра- вляющим вектором линии их пересечения. Замечание 1. Для запоминания координат вектора а может быть использован мнемонический определитель ei Аг А2 а = е2 е3 Bi Ci В2 С2 где ex, е2, е3 - базис, соответствующий системе координат Oxyz. Раз- ложение этого определителя по первой строке совпадает с разложе- нием вектора а по базису ех, ез, е3. Замечание 2. Теорема 36.1 относится к аффинной системе ко- ординат. Очевидно, что в прямоугольной декартовой системе коорди- нат, соответствующей ортонормированному базису ej, е2, е3, век- тор (36.8) может быть получен как векторное произведение [гц, п2] нормалей щ и п2 к плоскостям -яд и л2. Взаимное расположение двух прямых в пространстве. Пусть каждая из прямых Ц, г = 1,2, задана точкой Mi(xi, у±,zj и направляющим вектором aj = {т^тцА} в некоторой аффинной си- стеме координат Oxyz. Положим b = MiM2. Теорема 36.2. Прямые li и Z2 лежат в одной плоскости тогда и только тогда, когда Х2 — Xi mi m2 У2 -У1 ni П2 Z2 ~ Zi ki fc2 = 0. (36.9)
132 Глава VII. Алгебраические линии и поверхности первого порядка Доказательство. Действительно, прямые li и/2 лежат в одной плоскости тогда и только тогда, когда векторы Ь, а;, аг компланар- ны, т.е. линейно зависимы (теорема 15.2). Согласно теореме 14.2 это равносильно тому, что один из них линейно выражается через другие. В силу линейности координат то же относится и к их координатам, что означает (§16, следствие 1) равенство нулю определителя, стро- ками которого являются эти координаты. Замечание 3. В прямоугольной декартовой системе коорди- нат условие (36.9) может быть получено из критерия компланарности векторов b, ai, а2 (теорема 23.4 и соотношение (23.6)). Теорема 36.3. Прямые и 12 совпадают тогда и только тогда, когда rg 1’2 - 2=1 У2 - У1 Т71 £ 71 j ТП2 П2 Z2 - Z1 ki k2 (36.10) параллельны и не совпадают тогда и только тогда, когда rg 7П1 т2 П1 п2 fci fc2 Z2 - Xi 7711 77l2 У2 ~ У1 Щ n2 a2 - Zi ki k2 пересекаются тогда и только тогда, когда = 2, (36.11) rg 7721 Tij 7722 77.2 ki ^2 = rg Х2 — ^1 7П1 m2 У2 - У1 п2 Z2 - Л1 ki /с2 (36.12) 1, rg Доказательство. Условие (36.10) равносильно тому, что век- торы b, ai, а2 коллинеарны; условие (36.11) - тому, что векторы а1; а2 коллинеарны, а векторы b, ai, а2 компланарны, но не коллине- арны; условие (36.12) - тому, что векторы ах, а2 не коллинеарны, а векторы b, ai, а2 компланарны. Отсюда следует утверждение тео- ремы. Взаимное расположение прямой и плоскости. Пусть в прос- транстве в некоторой аффинной системе координат Oxyz заданы плос- кость тг: Ах + By + Cz + D = 0 и прямая I : г = го -I-1 а, где го = {10,2/0, zo}, а = {771,71, А:}. Теорема 36.4. Прямая I лежит в плоскости тг тогда и только тогда, когда ( Ат + Bn + Ск = 0, { Ахо "Ь Ву^ 4- Сzq + D = 0;
§ 36. Прямая в пространстве 133 прямая I параллельна плоскости %, но не лежит в ней тогда и толь- ко тогда, когда Г Ат 4- Bn + Ск = О, ( Ато 4- Вуд 4- Czq 4- D 7^ О; прямая I пересекает плоскость тг тогда и только тогда, когда Ат 4- Вп 4- Ск О. Утверждение теоремы следует из критерия (32.13) параллельно- сти вектора а и плоскости тг. Метрические задачи в прямоугольной декартовой системе координат. Пусть Oxyz - прямоугольная декартова система коорди- нат в пространстве. 1. Углом между двумя прямыми в пространстве называется лю- бой из углов между параллельными им прямыми, проходящими через какую-либо точку пространства. Таким образом, две прямые в прост- ранстве образуют между собой два различных (если они не перпенди- кулярны) угла, в сумме равные тг. Очевидно, что угол между напра- вляющими векторами прямых равен одному из этих углов. Следова- тельно, угол <р между прямыми 1<: г = г, -Ha», i — 1,2, совпадающий с углом между их направляющими векторами а1 = {m,,ni,fci}, вычи- сляется согласно (22.6) по формуле т]7П2 + П1П2 4- klk2 cos<p = —, —, . - - . у/т2 4- n2 + к2 у/т] + п2 А к% 2. Углом между прямой и плоскостью (если они не перпендику- лярны) называется меныпий из углов между этой прямой и ее ортого- нальной проекцией на плоскость. Если же прямая и плоскость перпен- дикулярны, го угол между ними считается равным тг/2. Угол </> между прямой Z: г — tq 4- t а и плоскостью тг: Ах 4- By 4- Cz 4- D — 0 на- ходится как дополнительный к углу между направляющим вектором прямой а = {т,п, fc} и вектором нормали к плоскости п= {Л, В, С} и вычисляется согласно (22.6) по формуле |Лт 4-Вп 4-Cfc| „ . sin о? = , 0 < <д < тг/2. Vm2 + п2 + к2у/А2 + В2 + С2 ~ 3. Расстояние р(М\,1} от точки Г]) до прямой / : г = го 4- ta находится как высота h (рис. 1) параллелограмма, построенного на векторах а и MqA/i, площадь и основание которого известны (§23): |а| Соотношения (23.5), (22.6) позволяют вычислить p(Mi,Z) по из- вестным прямоугольным координатам.
134 Глава VII. Алгебраические линии и поверхности первого порядка Рис. 1 Рис. 2 4. Расстоянием между скрещивающимися прямыми Ц: г = г, + + tai, i = 1,2, называется расстояние между параллельными плос- костями, в которых лежат прямые li и Zj- Это расстояние находится как высота параллелепипеда (рис. 2), построенного на век- торах Mi М2, ai, аз, объем и площадь основания которого известны (§23): Соотношения (23.6), (22.6) позволяют вычислить p(Z15Z2) по из- вестным прямоугольным координатам.
Глава VIII. Элементы общей алгебры В этой главе изучаются фундаментальные для всей алгебры поня- тия группы, кольца и поля. Они дают возможность с общих позиций взглянуть на рассмотренные в предыдущих главах понятия и факты и ввести, кроме того, новые. § 37, Группа Непустое множество G с заданной на нем алгебраической опера- цией * называется группой, если: 1) операция ассоциативна: (а * Ь) * с = а * (6 * с), Va, b, с G G; 2) операция обладает нейтральным элементом e€G:a*e = e*a = = a, Va € G; 3) для любого элемента а € G существует симметричный элемент а! е G : а * а' — а' ♦ а = е. Обозначение: G или {G, *). Условия 1-3 называются аксиома- ми группы. Группа с коммутативной операцией называется комму- тативной или абелевой. О терминологии. Обычно групповую операцию ♦ обозначают специаль- ными символами, чаще всего символами - или +, называя a • Ь (или просто ab) произведением, а a+b - суммой элементов a, b G G. В первом случае нейтральный элемент называют единицей (обозначение: 1), симметричный элемент - обрат- ным (обозначение: а-1), а саму группу G - мультипликативной. Во втором случае нейтральный элемент называют нулем (обозначение: 0), симметрич- ный - противоположным (обозначение: -а), а группу G - аддитивной. Если относительно групповой операции нет никаких оговорок, то обычно исполь- зуют терминологию мультипликативной группы. Как следует из определения, группа - это абстракция множества, наделенного одной алгебраической операцией. Большинство изучен- ных нами множеств являются конкретными проявлениями этого по- нятия, т.е. представляют собой группы. Действительно: а) (Z,+); <Q, +); (R, +); (Кп,+), где n = 1,2,3; (Rmxn,+); лю- бое линейное пространство V - это аддитивные абелевы группы; б) (Q\0, ); (R\0, •) - мультипликативные абелевы группы; в) ({А € R"x"|detA / 0},-); ({А е Rnx"|detA = 1},) - мульти- пликативные неабелевы группы; г) множество S(X) всех биективных отображений f : X —> X - мультипликативная неабелева группа. Из аксиом группы и свойств алгебраической операции (§9) выте- кают следующие факты. 1°. В любой группе существует, и притом единственный, ней- тральный элемент.
136 Глава VIII. Элементы общей алгебры 2°. В любой группе для каждого элемента существует, и притом единственный, симметричный элемент. Аксиомы группы можно несколько ослабить. Убедимся в этом. Пусть G - множество, наделенное алгебраической операцией. Эле- мент en € G такой, что аеп — а для любого а € G, назовем правой единицей множества G, а элемент a~l & G такой, что аа~1 = еп, - правым обратным к элементу а. Теорема 37.1. Множество G с ассоциативной алгебраи- ческой операцией является группой, если оно обладает правой еди- ницей еп и по отношению к ней каждый элемент а € G обладает правым обратным. Доказательство. Пусть а - произвольный элемент множества G и а~1 - правый обратный к нему элемент. Тогда аа~1 = еп — епеп — — еп{аа~х'} — (епа)а~х, т.е. аа~х = (епа)а~х. Умножив обе части последнего равенства справа на правый обратный элемент к элементу а~1, получим, что а = епа. Таким образом, правая единица множества G оказывается и левой единицей, т.е. просто единицей е множества G. Покажем теперь, что правый обратный элемент к элементу а явля- ется и левым обратным, т.е. а~ха = е. Действительно, еа~х = anTe = = а~х(аа~х) — (а~ха)а~х, т.е. еа~х = (a“1a)a“1. Умножив обе части последнего равенства справа на правый обратный элемент к элементу а~х, получим е = а~ха. Следствие. В группе любая правая единица является левой и той единственной единицей, которой эта группа обладает, а любой правый обратный элемент к элементу а группы является левым и тем единственным обратным, которым обладает-элемент а. Теорема 37.2. Множество G с ассоциативной алгебраиче- ской операцией является группой тогда и только тогда, когда эта операция обладает обратной. Доказательство. Необходимость. Пусть G - группа; по- кажем, что уравнения ах = Ь, (37.1) ya = b (37.2) имеют единственное решение для любых a, b € G. Действительно, элемент х = а~хЬ является решением уравнения (37.1), так как ах = — a(a~xb) = (aa~x)b = eb — Ь. Это решение единственно, посколь- ку если х' - любое другое решение (37.1), то ах' = ах и а~х(ах') = = а-Дат). Следовательно, х' — х. Аналогично доказывается утвер- ждение, касающееся уравнения (37.2). Достаточность. Пусть теперь уравнения (37.1), (37.2) при лю- бых a, b € G имеют единственное решение. Покажем, что G - группа. Для этого покажем, что выполнены все условия теоремы 37.1. Действительно, возьмем произвольный элемент а € G. Уравнение ах = а имеет единственное решение. Очевидно, оно играет роль пра- вой единицы для элемента а. Обозначим его е“. Для любого другого
§ 38. Подгруппа 137 элемента Ь € G существует элемент у е G такой, что Ь = ya (т.е. у - решение (37.2)). Тогда b = ya = y(ae%) — (уа)е“ — Ье“. Следова- тельно, Ье“ = b, Wb е G, и е“ = еп - правая единица множества G. Далее, уравнение ах = еп имеет решение, которое, очевидно, являет- ся правым обратным к элементу а по отношению к еп. Отсюда в силу теоремы 37.1 следует, что G - группа. Замечание. Попутно доказано еще одно свойство группы: в груп- пе любая правая (левая) единица для одного элемента является об- щей правой (соответственно левой) единицей. Итак, групповая операция обладает обратной операцией. В адди- тивной группе обратная операция называется вычитанием (справа и слева), а элементы х = Ь + (—а) и у = (—а) + Ь - разностью {право- сторонней и левосторонней соответственно). В абелевой группе обе разности совпадают и обозначаются единым символом b — а. § 38. Подгруппа Определение. Непустое подмножество Н группы G называется подгруппой группы G, если оно само является группой относительно алгебраической операции в G. Примеры. 1. Простейшими подгруппами любой группы являют- ся ее единичный элемент и сама группа. Эти подгруппы называют тривиальными. 2. Множество четных чисел - подгруппа аддитивной группы целых чисел. 3. Множество чисел, кратных р, где р € N, р > 1, - подгруппа аддитивной группы целых чисел. 4. Множество рациональных чисел, отличных от нуля, - подгруппа мультипликативной группы ненулевых действительных чисел. 5. Множество квадратных матриц n-го порядка, определители ко- торых равны единице, - подгруппа мультипликативной группы не- вырожденных матриц n-го порядка. Теорема 38.1. Подмножество Н группы G является под- группой этой группы тогда и только тогда, когда имеют место следующие импликации: 1) a,b G Н => ab € Н; 2) аеН ^а-'еН. Доказательство. Необходимость очевидна, она вытекает из того, что Н - группа. Достаточность. Из первого условия следует, что алгебраиче- ская операция в G является алгебраической операцией и в Н. Что же касается аксиом, то необходимо проверить только аксиому едини- цы. Пусть а € Н\ тогда, согласно условиям 1 и 2, а"1 € И и аа"1 = = е е Н.
138 Глава VIII. Элементы общей алгебры Группа невырожденных верхних (нижних) треугольных матриц. Множество М всех невырожденных верхних треугольных матриц n-го порядка образует мультипликативную группу. В этом можно убедиться, показав, что М — подгруппа мультипликативной группы невырожденных матриц n-го порядка, т.е. проверив все тре- бования теоремы 38.1. В самом деле, а) если А, В - верхние треугольные матрицы, то /с-й столбец ма- трицы АВ является линейной комбинацией первых к столбцов ма- трицы А, поэтому все его элементы, расположенные ниже к-й строки, равны нулю, и, следовательно, АВ - верхняя треугольная матрица; невырожденность АВ очевидна; б) если А - невырожденная верхняя треугольная матрица, то к-й столбец матрицы Л-1 является решением системы уравнений Ах — ек с треугольной матрицей Л, у которой все диагональные элементы от- личны от нуля; решая эту систему “снизу вверх”, получим Хп = о, Tn-I =0,...,2:fc+i =0, т.е. Л-1 - верхняя треугольная матрица; невырожденность Л'1 оче- видна. Группа ортогональных матриц. Множество М всех ортого- нальных матриц Q € Rnx" образует мультипликативную группу, так как а) произведение ортогональных матриц - ортогональная матрица: (Q1Q2)TQ1Q2 = QlQiQiQi = Л Q1Q2(Q1Q2)T = Q1Q2Q2QT = I; б) обратная к ортогональной матрице - ортогональная матрица: Q-l = QT, QT(QT)T = QTQ = I, (QT)TQT = QQT = I, и согласно теореме 38.1 M - подгруппа мультипликативной группы невырожденных матриц. Произведение подмножеств группы. Пусть G - группа, М и N - два ее подмножества. Произведением MN этих подмножеств называется множество всевозможных произведений тп, где т € М, п € N. Итак, MN — {тпп|тп € Af, п € TV}. Очевидно, что имеет место свойство ассоциативности: (MN)K — M(NK}, так как оба этих про- изведения состоят из элементов (тп)к = т(пк), где т € М, п & N, кеК. Если одно из подмножеств состоит только из одного элемента, на- пример М = {тп}, то произведение МN обозначается символом mN, а произведение NM - символом Nm, т.е. в этом контексте нет необ- ходимости отличать элемент от состоящего из одного этого элемента множества.
§ 38. Подгруппа 139 Замечание. Термин “произведение”, используемый здесь, весьма условен, он соответствует терминологии мультипликативной группы, принятой в теории групп. В аддитивной группе, очевидно, MN состоит из сумм т + п элементов подмножеств М и N и обозначается в зависимости от контекста символом M+N. Смежные классы. Пусть Н - подгруппа группы G, а - эле- мент группы G. Множество аН называется левым, смежным классом. группы G по подгруппе Н, порожденным элементом а, а множество На - правым смежным классом. Из определения вытекают следую- щие простейшие свойства смежных классов. Iе. а € аН, a G На, так как подгруппа Н содержит единицу. 2°. Смежный класс состоит из элементов группы, причем лю- бой элемент группы входит в какой-нибудь смежный класс (в силу свойства 1°). 3°. Подгруппа Н является одним из смежных классов (как левых, так и правых), поскольку Н = еН — Не. 4°. В абелевой группе аН = На, 'да € G. Примеры смежных классов содержит следующая таблица. Табли ца С н аН (Z.+) Н = {2fc 1 к 6 Z} mH = Нт = {тп 4- 2k | k € Z} = = {n6Z|n = m(mod2)}. Итак, адди- тивная группа целых чисел разбива- ется на два смежных класса по под- группе четных чисел: это классы всех четных и всех нечетных чисел. (Z,+) Пусть р € N, р > 1. Я = {рк | к е Z) mH = Нт = {n € Z | п = m(modp)} (см. (7.1)). Итак, аддитивная группа целых чисел разбивается на р смеж- ных классов по подгруппе Н чисел, кратных р: Со, С,, ... , Ср_ 1, где Сг - класс вычетов по модулю р. <кп,+) Пусть А 6 Rmxn. Я = {т € Rn| Ах = 0} Положим Аа = Ь.Тогда аН = На = {а + т|Ат = 0} = {г 6 Rn|Ar = Ь]. Итак, смежный класс аддитивной группы К” по подгруппе решений од- нородной системы Ах = 0, порожден- ный элементом а, представляет собой множество всех решений неоднород- ной системы Ах = Ь, частным реше- нием которой является а. (V.+), где V - линейное прост- ранство Пусть L - линей- ное подпространст- во V, H = L Пусть хо € V. Тогда хоН = Нхо = {то + т|т 6 L} - линейное многообра- зие то -f- Я. Теорема 38.2. Смежный класс порождается любым своим элементом. Доказательство. Надо показать, что если g € аН, то аН = дН. Пусть д = ahi, € Н. Тогда для любого элемента h G Н имеем
140 Глава VIII. Элементы общей алгебры ah = ’/г) = gh2, где h2 = h(lh € Я в силу теоремы .38.1. Значит, aH С дН. В то же время gh = a(h\h) = ah2, где h2 = hih € H. Следовательно, дН С аН. и с учетом вложения в другую сторону получаем требуемое равенство. Доказательство проведено для левого смежного класса, но очевидно, что оно может быть использовано и для правого. Теорема 38.3. Любые два левых (правых) смежных класса либо совпадают, либо не пересекаются. Доказательство. Утверждение теоремы вытекает из теоремы 38.2, так как если два смежных класса аН и ЬН имеют общий элемент д, то аН = ЬН = дН. Итак, вся группа разбивается на непересекающиеся левые (пра- вые) смежные классы по подгруппе Н. Это разбиение называется левосторонним (соответственно правосторонним) разложением группы G по подгруппе Н. § 39. Конечная х руппа Основные свойства. Группа, состоящая из конечного числа эле- ментов, называется конечной группой. Число элементов конечной груп- пы называется ее порядком и обозначается символом card G. Беско- нечную группу называют группой бесконечного порядка. Очевидно, что алгебраическая операция в группе конечного порядка может быть представлена “таблицей умножения” ее элементов. Этим мы восполь- зуемся в следующих примерах. 1. Группа из одного элемента состоит только из единицы: G — {е}, при этом алгебраическая операция определяется таблицей е е е 2. Группа из двух элементов G = {е,а} определяется таблицей Здесь аа а, так как иначе элемент а будет единицей для а, т.е. (§37, замечание) общей и единственной единицей е. Поэтому аа — е. 3. Группа из трех элементов G = {е, а, 6} определяется таблицей е а ь е е а ь а а ь е Ъ ь е а
§ 39. Конечная группа 141 Здесь, рассуждая так же, как в примере 2, получаем, что ab / a, ab b,ba a, ba ф b. Следовательно, ab = e = ba. Аналогично aa a, aa e (так как единственным обратным элементу а, как выяснено выше, является элемент Ь). Следовательно, aa — b. Аналогично bb = а. Заметим, что все три рассмотренные группы абелевы. Теорема 39.1 (теорема Лагранжа). Во всякой конечной группе порядок ее подгруппы является делителем порядка самой группы. Доказательство. Пусть cardG = n, card# = к. Рассмотрим левостороннее разложение группы G по подгруппе Н. Оно состоит из всех левых смежных классов аН, где а € G. Каждый класс аН состоит из всех элементов ah, где h € Н. Все элементы ah различны (так как если ahi = 0J12, то a~lahi = a~lah.2 и, значит, hi = h^), поэтому каждый класс аН состоит ровно из к элементов. Общее число смежных классов аН равно т < п. Таким образом, количество всех элементов группы G равно тк, т.е. п = тк. Симметрическая группа n-го порядка. Множество Sn (§8) всех подстановок (перестановок) n-го порядка образует мультипли- кативную группу как множество всех биективных отображений мно- жества на себя. Эта группа называется симметрической группой п-го порядка, ее порядок равен п!. Знакопеременная группа n-го порядка. Множество Ап всех четных подстановок n-го порядка образует мультипликативную груп- пу. Чтобы в этом убедиться, достаточно показать, что Ап — подгруппа симметрической группы Sn. Для этого проверим все условия теоре- мы 38.1. 1. Пусть / = 2 «2 2 ... п\ I € А, 02 ... (Зп) т.е. (01,02, • - •, оп) и (0i,02, • ,0п) - четные перестановки из первых п натуральных чисел. Покажем, что fg е Ап. Для этого запишем f в виде 101 02 0п\ \ 71 72 • • - 7п/ Тогда /1 2 ... п \ fg = \71 72 7и/ где (71,72, - •, 7п) - четная перестановка из первых п натуральных чи- сел, так как имеет одинаковую четность с перестановкой (0\ ,02,..., 0п).
142 Глава УШ. Элементы общей алгебры 2. Очевидно, что если п \ , € Ап, то / Группа Ап называется знакопеременной группой n-го порядка, ее порядок равен у, п > 2. Циклическая группа. Интересным примером подгрупп служат так называемые циклические подгруппы. Пусть а - элемент группы G, п € Z. Определим n-ю степень элемента а следующим образом: ' аа... а, п > О, п 1, П = о, , (a-1)"1, m = —п, п < 0. (39.1) Так как при m > 0 имеем (а 1)тпатп — 1, то из (39.1) следует, что а-тл = (а-1)”1 = (ат)-1. (39.2) В аддитивной группе вместо степеней элемента а говорят о крат- ных элемента а и обозначают символом па. Нетрудно проверить, что для любых m, n G Z anam=an+m, (39.3) (an)m = amn (39.4) (соответственно па + ma — (n + m)a, п(тпа) = (nm)a для аддитивной группы). Теорема 39.2. Множество {а} всех целых степеней эле- мента а группы G образует абелеву группу. Доказательство. Достаточно показать, что {а} - абелева под- группа группы G. Но это следует из теоремы 38.1 с учетом (39.2) и (39.3). Группа {а} называется циклической группой, порожденной эле- ментом а, при этом элемент а называется образующим элементом группы {а}. Очевидно, группа {а} является подгруппой любой другой подгруп- пы группы G, содержащей элемент а. Примером бесконечной циклической группы служит аддитивная группа целых чисел - всякое, число кратно числу 1, т.е. это число является образующим элементом рассматриваемой группы. Мульти- пликативная группа G, состоящая из двух чисел 1 и —1, является циклической группой, порожденной элементом —1. Теорема 39.3. Любая подгруппа циклической группы {а} является циклической.
§ 39. Конечная группа 143 Доказательство. Пусть Н - подгруппа циклической группы {а}, т.е. Н состоит из некоторых целых степеней элемента a: Н = = {afcl, акз,...}. Пусть, далее, т - наименьшее целое положительное число среди к1,кг,.... Очевидно, Н содержит все элементы вида акт, где к 6 Z. Докажем, что в Н не может быть других целых степеней элемента а. Пусть a71 € Н. Разделим п на т: п = тк + г, где т, г е Z, 0 < г < т. Тогда аг = апа~тк. Так как an С К, а~тк ц то ar е это противоречит тому, что т - минимальная положительная степень а, содержащаяся в Н. Порядок элемента. Степени элемента а с различными показаг телями не всегда различны, так в аддитивной группе целых чисел разные кратные нуля совпадают: кО — 10, к / Z; в мультипликативной группе ненулевых вещественных чисел: lfc = I1, к / I. Если все степени элемента а различны, то а называется элементом бесконечного порядка, в противном случае - элементом конечного по- рядка. Теорема 39.4. Если а - элемент конечного порядка, то су- ществует натуральное число п такое, что ап = 1 (в аддитивной группе: па = 0). Доказательство. Пусть а - элемент конечного порядка, т.е. существуют целые числа k, I такие, что ак = а1, к > I. Тогда ak~l = 1 и a” = 1, где п = к — I € N. Наименьшее п € N, для которого ап = 1, называется порядком элемента а. Теорема 39.5. Порядок элемента а группы совпадает с по- рядком циклической подгруппы {а}. Доказательство. Утверждение вытекает из того, что если по- рядок элемента а равен п, то степени о°,а',.. различны, а вся- кая другая степень совпадает с одним из этих элементов. Следствие 1. В конечной группе порядок любого элемента является делителем порядка группы. Следствие 2. Все конечные группы простого порядка являют- ся циклическими. Следствие 3. В конечной группе G порядка п ап = 1, Va € G. Теорема 39.6. Элемент ак является образующим элемен- том циклической группы {а} п-го порядка тогда и только тогда, когда кип взаимно просты. Доказательство. Пусть d = НОД(£,п) и п = dn', к = dk', п' < п, к' < к. Тогда элемент ак будет образующим элементом цикли- ческой группы {а} п-го порядка тогда и только тогда, когда порядок
144 Глава VIII. Элементы общей алгебры элемента ак совпадает с п. Так как (afc)n' = акп' = adk'n' = (ап)к‘ = 1, то порядок элемента ак будет совпадать с п тогда и только тогда, когда п' = п, т.е. тогда и только тогда, когда d = 1. § 40. Нормальный делитель Определения и свойства. Подгруппа Н группы G называется нормальным делителем, если для любого элемента а б G аН = На, (40.1) т.е. если любой левый (правый) смежный класс одновременно явля- ется правым (левым) смежным классом. Очевидно, что в абелевой группе любая подгруппа является нор- мальным делителем. Тривиальные подгруппы в любой группе также являются нормальными делителями: оба разложения по единичной подгруппе совпадают с разложением группы на отдельные элементы, оба разложения по самой группе состоят из одного класса - это сама группа. Укажем критерий нормального делителя для произвольной группы. Элементы а и b группы G называются сопряженными, если суще- ствует элемент с б G такой, что a = с-1Ьс. Теорема 40.1. Подгруппа Н группы G является нормаль- ным делителем тогда и только тогда, когда она вместе с каждым элементом содержит все сопряженные с ним элементы. Доказател ьство. Необходимость. Пусть Н - нормальный делитель, тогда согласно (40.1) Нс С. сН для любого элемента с б G. Это означает, что для любого элемента h б Н существует hi б Н такой, что he = chi, т.е. c~lhc = hi б Н. Достаточность. Возьмем произвольные элементы h б Н, с б G. Тогда c~lhc б Н и chc~l б Н. Это означает, что суще- ствуют элементы hi,h? б Н такие, что с-1/гс = hi, chc~L = hi, или he = chi, ch = hie. Значит, Нс С сН и сН С Нс, т.е. cH = = He. Примером нормального делителя в неабелевой группе является подгруппа матриц с определителем, равным единице, мультиплика- тивной группы невырожденных матриц n-го порядка, так как для эле- ментов этой подгруппы выполнено условие теоремы 40.1: если |Л | = 1, то \С~ 1АС| = |А| = 1 для любой невырожденной матрицы С. Фактор-группа. Из смежных классов по нормальному делителю может быть построена новая группа. Теорема 40.2. Смежные классы по нормальному делителю образуют группу относительно умножения подмножеств группы.
§41. Морфизмы групп 145 Доказательство. Покажем, что произведение смежных клас- сов по нормальному делителю является смежным классом. Действи- тельно, (аН)(ЬН) = { в силу ассоциативности произведения } — — а(НЬ)Н = { так как Н - нормальный делитель } — а(ЬН)Н = = аЬ(ЯЯ) = аЬН. Итак, (аЯ)(ЬЯ) = (аЬ)Я, (40.2) значит, умножение подмножеств группы является алгебраической операцией на множестве смежных классов по нормальному' делителю. Ассоциативность этого умножения уже известна (§38). Нейтральным элементом служит сама подгруппа Я, так как (аН)Н — (аН)(еН) — — (ае)Н = аН, Va € G. Обратным элементом к классу аН является класс а-1Я, так как (аЯ)(а-1Я) = (аа-1)Я — еН = Я. Группа смежных классов группы G по нормальному делителю Я называется фактор-группой группы G по подгруппе Н. Обозначение: G\H. Группа вычетов по модулю р. Вернемся к смежным классам аддитивной группы целых чисел по подгруппе Я чисел, кратных р. Как следует из §38 (пример 2 в таблице), фактор-группа 2|Я состоит ровно из р классов й совпадает с множеством Zp классов вычетов по модулюр (§7, пример 3). Алгебраическую операцию в Zp (т.е. произве- дение смежных классов) будем называть сложением, придерживаясь названия исходной операции в группе целых чисел. Согласно (40.2) суммой смежных классов СД+Сп является класс, который содержит сумму чисел т + п: Ст + Сп=Сг, где г = (пи-n)(modр). (40.3) Итак, Zp - аддитивная группа вычетов по модулю р. §41. Морфизмы групп Изоморфизм. Уже примеры конечных групп (§39) приводят к естественному выводу, что все группы (например, третьего порядка) обнаруживают большое сходство: алгебраические операции в них опи- сываются одной и той же таблицей умножения. Общий подход к вы- явлению различий или, напротив, к отождествлению групп основан на понятии изоморфизма. Две группы Gi и G? с операциями *j и *2 называют изоморфны- ми, если существует биективное отображение f : Gy —» Gz, которое сохраняет групповую операцию, т.е. /(а*16) = /(а) *2/(6), Уа, Ь 6 G\. Обозначение: G\ ~ G2. Само отображение / при этом называют изоморфизмом. Примеры. 1. Аддитивные группы целых чисел и четных чисел изоморфны, так как отображение f (n) = 2n, п € Z, есть изоморфизм. 2. Мультипликативная группа положительных вещественных чи- сел и аддитивная группа всех вещественных чисел изоморфны. В ка- честве изоморфного отображения f можно взять /(а) = In а. Извест-
146 Глава УШ. Элементы общей алгебры ное свойство логарифма Inad = Ina + Ind как раз моделирует условие изоморфизма. Отметим простейшие свойства изоморфизма. 1°. Отношение изоморфизма является отношением эквивалент- ности на множестве всех групп. Действительно, рефлексивность следует из того, что тождествен- ное отображение является изоморфизмом; симметричность - из того, что если / - изоморфизм, то /-1 (которое существует в силу биек- тивности /) также является изоморфизмом, так как /-1(а' *2 d') = = {а' = /(a), b' = /(d) в силу сюръективности /} = /^(/(а) *2 7(d)) = = {ибо f - изоморфизм } — /-1/(а *i Ь) — a *i d = /-1(а') /-1(d'); транзитивность - из того, что суперпозиция изоморфизмов, как легко проверить, также является изоморфизмом. 2°. В изоморфных группах Gi и G2 образ (и прообраз) единицы является единицей. Действительно, если a*ie = e*ia = а, то /(а)*г/(е) = 7(е)*г7(а) — = f(a). Отсюда с учетом того, что элементами /(а) исчерпывается вся группа G2 (в силу сюръективности /), следует, что /(е) = е' - еди- ница в G2. Следовательно, образом единицы е является единица е!. Значит, и прообразом единицы е' является е и, в силу инъективно- сти /, только е. 3°. В изоморфных группах G\ и G2 образ (и прообраз) обратного элемента является обратным элементом, т.е. /(а-1) = (/(а))-1. Доказательство этого факта аналогично доказательству свой- ства 2°, оно опирается на определение обратного элемента. Теорема 41.1 (теорема Кэли). Любая, конечная группа изоморфна некоторой группе перестановок на множестве своих эле- ментов. Доказательство. Пусть G = {go = е, 91,... ,gn-i} - группа п-го порядка. Построим отображение <р группы G на некоторое мно- жество S перестановок множества G, положив <p(g) = (род, gig, ..., gn-ig) для любого g € G. Так как группа G замкнута относи- тельно групповой операции, то gog, gig,... ,gn-i9 € G. Более того, эти произведения различны, так как из равенства g,g = g_,g в силу закона сокращения в группе следует, что g< — pj, т.е. i = j. Следо- вательно, gog, gig, . • •, gn-ig - перестановка элементов go, gi, • •, gn-i группы G, ip(g) - перестановка множества G: (9o 9i 9n-i \ 9o9 919 5n-i9/ и S - некоторое подмножество симметрической группы всех переста- новок множества G. Покажем, что у> - изоморфизм: 1) у - инъективно, так как если g / д' (д' € G), то д>(д) / ‘р(д') (хотя бы потому, что дод / додь так как до = е), т.е. различным элементам из G соответствуют различные перестановки из S;
§41. Морфизмы групп 147 2) ip сохраняет групповую операцию, так как /lx I 9® ‘ ' 9п-1 \ v" \до(дд') ... дАдд') gn-i(gg'y' .. . . / до • • • gi <?n~i \ / до • • д< • - gn—i ч>(д Мд) = , , , \soff - gig gn-ig / удод- -д^д---gn-ig дод gig gn—ig 1 / до gi - gn—i (дод)д' (дгд)д' (gn-ig)g'l \дод gtg- --gn-ig 9® • • • 9i • • • 9n~ I (дод)д' (gig)g' (gn-igW = ч>(дд)- Осталось отметить, что S - группа, т.е. подгруппа группы всех перестановок множества G. Это автоматически вытекает из того, что S - изоморфный образ группы G. Теорема Кэли выделяет семейство Sn,n = 1,2,... симметрических групп, в котором находятся с точностью до изоморфизма все конеч- ные группы. Теорема 41.2. Все бесконечные циклические группы изо- морфны аддитивной группе целых чисел. Доказательство. Если G - бесконечная циклическая группа с образующим элементом а, то соответствие ak I—► к будет взаимно однозначным отображением G —> Z. Изоморфность этого отображения вытекает из (39.3). Следствие. Все бесконечные циклические группы изоморфны между собой. Теорема41.2 выделяет аддитивную группу целых чисел, с которой с точностью до изоморфизма совпадают все бесконечные циклические группы. Для циклических групп конечного порядка такой объект бу- дет выделен в §46. Изоморфное отображение группы G на себя называется автомор- физмом. Несложная проверка показывает, что множество всех авто- морфизмов группы образует группу относительно суперпозиции ото- бражений. Гомоморфизм. Две группы Gi и G2 с операциями *i и *2 на- зывают гомоморфными, если существует сюръективное отображение <р : G\ -> G2, сохраняющее групповую операцию. Само отображение <р называется гомоморфизмом. Отметим простейшие свойства гомоморфизма. В гомоморфных группах
148 Глава VIII. Элементы общей алгебры 1) образом единицы является единица, т.е. <р(е) — е1, где е и е' - единицы групп G\ и Gi, 2) образом обратного элемента является обратный элемент к образу: = (у?(а))-1. Доказательства этих свойств повторяют доказательства аналогич- ных свойств изоморфизма. Отметим лишь, что к гомоморфизму от- носятся только первые части свойств изоморфизма. Пусть <р- гомоморфизм группы Gi на группу Gi. Множество кегу? = {а € (?1|у>(а) = е'} называется ядром гомоморфизма <р. Теорема 41.3. Нормальные делители группы, и только они, являются ядрами гомоморфизмов этой группы. Доказательство. Достаточность. Ядро гомоморфизма у> группы Gi является подгруппой группы Gi, так как для него выпол- нены оба условия теоремы 38.1: 1) если hi, hi kery>, то /i2) = <p(/ix) *2 <p(hi) = e! *2 e' = e', т.е. hi *i hi € kery; 2) если h € kery, то у>(Л.) = e' и, значит, = (e')-1 = e', т.е. /г-1 € kery>. Эта подгруппа является нормальным делителем, так как для нее выполнено условие теоремы 40.1: если h G кегу? и с € G, то у>(с-1 *i h *i с) — <р(с~1) *2 у?(/г) *2 у?(с) = у?(с-1) *2 <р(с) — у>(с-1 +1 с) = = уз(е) = е', т.е. с-1 *i h *i с € кегуз. Необходимость. Пусть Н - нормальный делитель группы G с операцией , покажем, что существует некоторая группа G' и не- который гомоморфизм у> : G —> G', ядром которого является под- группа Н. В качестве группы G' возьмем фактор-группу G\H группы G по нормальному делителю Н. В качестве гомоморфизма возьмем отображение ip : G —> G|H, которое каждому элементу а 6 G ставит в соответствие смежный класс аН, так что у?(а) = аН. Отображе- ние у? является гомоморфизмом, так как y>(ab) = (ab)H = {согласно (40.2)} = (аН)(ЬН) = y>(a)y>(i>), Va, b е G. Ядром этого гомоморфизма служит, очевидно, сам нормальный делитель Н. Построенное отображение у> : G —> G\H называется естествен- ным гомоморфизмом. § 42. Кольцо Определение, простейшие свойства. Перейдем к рассмотре- нию множеств, наделенных двумя алгебраическими операциями. Бу- дем называть одну из этих операций сложением (и обозначать симво- лом +), а другую - умножением (и обозначать символом ). Непустое множество К, наделенное двумя алгебраическими опе- рациями - сложением и умножением, называется кольцом, если эти операции удовлетворяют следующим аксиомам: Va,b,c€ К 1) а + Ь = 6+ а;
§ 42. Кольцо 149 2) (а + b) -f- с = а + (Ь + с); 3) 30 С АГ: а Ч- 0 — 0 4* а — а; 4) Va6 К 3 — а € К : а 4- (-а) = (—а) + а = 0; 5) (ab)c = а(Ъс)-, 6) (а + b)c = ab + Ъс, а(Ъ 4- с) = ab + ас. Кольцо называется коммутативным, если умножение в нем ком- мутативно; кольцо называется кольцом с единицей, если операция умножения обладает нейтральным элементом. Из аксиом кольца сле- дует, что кольцо является аддитивной абелевой группой. Очевидно, множества Z, Q, R образуют коммутативные коль- ца с единицей относительно обычных операций сложения и умно- жения чисел: множество всех четных чисел - коммутативное кольцо без единицы; множество RnXTl вещественных квадратных матриц п-го порядка - некоммутативное кольцо с единицей относительно извест- ных операций сложения и умножения матриц. Отметим простейшие свойства кольца, все они опираются на свой- ства множеств с одной ассоциативной операцией, и в частности, на свойства группы. 1°. Кольцо обладает всеми свойствами аддитивной абелевой груп- пы; в частности, в кольце: а) существует, и притом единственный, нулевой элемент 0; б) для каждого элемента а существует, и притом единственный, противоположный элемент —а; в) для любых элементов а, Ь е К существует, и притом единствен- ное, решение уравнения х + а = Ь; это решение называется разностью элементов Ь и а и обозначается символом Ь — а. Итак, b — а = Ь + (—а). г) определены целые кратные элемента (см. (39.1), (39.2)): ' a 4- a 4- ... 4- а, п > 0, па = п П _ 0, п = 0, . m(-a) = —(ma), m =-n, n < 0. 2°. В кольце умножение дистрибутивно относительно вычита- ния, т.е. a(b — с) = ab — ас, (а — Ь)с — ас — be, Va, Ь, с € К. Это следует из того, что b = (Ь — с) 4- с и ab = а(Ь — с) + ас. 3°. В кольце для любого элемента а: аО — Оа — 0. Это следует из дистрибутивности умножения относительно вычи- тания: аО — a(b — b) = ab — ab = 0. 4°. В кольце для любых элементов а, Ь: (—а)Ь = а(—b) = —аЬ. Это следует из того, что аЬ + (—а)Ь = (а + (—а))Ь = 0Ь = 0. Следствие. (-а)(—Ь) = ab, Va,b € К. 5°. В кольце с единицей для любого элемента а: (-1)а = а(-1) = -а. Это следует из того, что а 4- (— 1)а=1а+(—1)а = (14-(- 1))а=0а=0.
150 Глава УШ. Элементы общей алгебры 6°. В кольце с единицей, содержащем не менее двух элементов: 1/0. Действительно, если 0 = 1, то существует а С К: а / 0, а / 1. Тогда из равенства 0 = 1 следует, что Оа = 1а, т.е. 0 = а, но а / 0. 7°. В кольце с единицей множество обратимых (по умножению) элементов образует мультипликативную группу. Это следует из того, что произведение обратимых элементов обра- тимо, т.е. умножение в кольце является алгебраической операцией на этом множестве. Делители нуля. В кольце, как мы отмечали выше, алгебраиче- ские операции сложения, вычитания и умножения обладают свойства- ми привычных нам операций над числами. Однако кольцо обладает и специфическим свойством, которого нет в числовых множествах. Так, для чисел из равенства аЬ = 0 следует, что одно из чисел а или Ь рав- но нулю. В кольце это может и не выполняться. Например, в кольце матриц второго порядка существуют ненулевые матрицы, произведе- ние которых равно нулю: /1 0 \ / 0 0 \ / 0 0 \ 0 0 J 1 1 J - 0 0 J ' Ненулевые элементы а и b кольца называются делителями нуля, если ab = 0. При этом элемент а называется левым делителем нуля, а эле- мент Ь - правым. Кольцо вычетов. Рассмотрим аддитивную группу Zp = {Co,Cj, ...,Cp-t} вычетов по модулю р (§40). Напомним, что сложение на Zp определено правилом (40.3), т.е. Ст + Сп - это класс, в который входит число т + п. Известно, что Zp - группа относительно так вве- денной операции сложения (§40). Отметим, что это абелева группа, так как числа т + п и п -I- m входят в один и тот же класс. Отметим также, что нулем этой группы является класс Со чисел, кратных р, а противоположным к классу Ст ~ класс „ _ f Со , т = 0, Gm-\Cp_m, m>0. Определим на Zp операцию умножения. Положим СтСп = СТ , где г = mn (modp), т.е. СтСп ~ это класс, в который входит число тп. Эта операция обладает следующими свойствами: 1) CmCn = СпСт, так как СтСп - класс, в который входит пт, а тп = пт', 2) (CmCn)Cfc = Cm(CnCk), так как оба произведения представля- ют собой один и тот же класс, в который входит число (mn)fc — m(nk); 3) существует единица Ci, так как СтС\ - CjCm = Cm; 4) (Cm + Cn)Ck = CmCk + CnCfc, так как обе части равенства представляют собой класс, в который входит число (m -I- п)к — тк + 4- пк-,
§ 43. Поле 151 5) если р - составное число, то в кольце Zp есть делители нуля, так как если р = тпп, где 1 < т < р, 1 < п < р, то Ст,Сп € Zp и СтСп — С’о- Таким образом, Zp - конечное коммутативное кольцо с единицей, которое имеет делители нуля, если р - составное число. Оно называ- ется кольцом, вычетов по .модулю р. Подкольцо. Подкольцом кольца К называется подмножество F этого кольца, которое само является кольцом относительно операций, определенных в К. При этом говорят, что кольцо К является расши- рением кольца F, а кольцо F вложено в кольцо К. Так, кольцо Z целых чисел является расширением кольца Zjt чет- ных чисел и подкольцом кольца Q рациональных чисел. Легко показать, что множество F = {а + Ьх/2 | а, b € Z} является кольцом. Оно вложено в кольцо R. действительных чисел. § 43. Поле Определение, простейшие свойства. Полем называется ком- мутативное кольцо с единицей, содержащее не менее двух элементов, в котором каждый отличный от нуля элемент имеет обратный элемент. Из определения вытекают следующие свойства поля. 1°. Поле обладает всеми свойствами кольца. 2°. В поле нет делителей нуля, так как если ab — 0, а =4 0, то а- г(аЬ) = b = 0. Следствие. Умножение является алгебраической операцией на множестве всех ненулевых элементов поля. 3°. В поле Р множество всех ненулевых элементов образует мультипликативную коммутативную группу, и поэтому в поле: а) существует, и притом единственная, единица, причем 1^0; б) для любого элемента а 0 существует, и притом един- ственный, обратный элемент; в) для любых a,b € Р, а 0, уравнение ах = Ь имеет единствен- ное решение, при этом х = а~*Ь = Ьа~1; этот элемент называется частным от деления Ь на а и обозначается символом — или Ь/а. а 4° . В поле сохраняются все обычные правила обращения с дробя- а с bd ' b d bd' а = ~Ь ’ ми: (X С _1 _1 а) — = — <=> ad — be, так как равенство b а = cd 1 равносильно о d равенству 5(5-1a)d = b(cd-1)d, т.е. ad = be; а с ad ± be ас ас б) 7> ± Л = “ о а , — а а в) — = ~Ь
152 Глава VIII. Элементы общей алгебры Правила “6”, “в” доказываются так же, как и “а”. Тем самым все правила и формулы элементарной алгебры полно- стью сохраняются в любом поле, так как в их основе лежат одни и те же свойства операций сложения, вычитания, умножения и деления. Элементы поля называют числами. Очевидно, множества Q всех рациональных чисел и R всех действительных чисел являются полями. Расширение поля. Подмножество F поля Р называется подпо- лем поля Р, если оно само является полем относительно операций, определенных в Р. При этом говорят, что поле Р является расшире- нием поля F, а поле F вложено в поле Р. Так, поле R действительных чисел является расширением поля рациональных чисел. Еще одно расширение поля рациональных чисел можно получить, рассматривая числа вида а + Ъу/2 с рациональными а и Ь. Легко показать, что множество F = {a + dV2|a,i»GQ} образует поле. Очевидно, что поле Q является его подполем. Любое поле, элементами которого являются действительные числа с операциями сложения и умножения действительных чисел, будем называть числовым полем. Теорема 43.1. Поле рациональных чисел вложено в любое числовое поле. Доказательство. Пусть Р - поле, элементами которого явля- ются числа а € R. Если а 0, то Р содержит частное т.е. число 1. Складывая число 1 с самим собой несколько раз, цы получим, что все натуральные числа п содержатся в Р. С другой стороны, в поле Р должна содержаться разность п — п, т.е. число 0, поэтому в поле Р находятся и результаты вычитания 0 — п, п € N, т.е. все отрицатель- ные числа. Наконец, в поле Р содержатся и частные целых чисел, т.е. вообще все рациональные числа. В заключение отметим, что расширение поля R действительных чисел будет дано в §44. Изоморфизм колец и полей. Среди множества колец (и по- лей) встречаются кольца (соответственно поля), неразличимые с точ- ки зрения свойств действующих в них алгебраических операций. Эта “одинаковость” формализуется понятием изоморфизма. Два кольца К и К' (или два поля Р и Р') называются изоморф- ными, если существует биективное отображение <р: К —> К1 (соответ- ственно tp: Р Р1), сохраняющие операции: <р(а+Ь) = </?(а)+(р(6), у>(а6) = <р(а)<р(5), Va, be К (соответственно Г). Нетрудно показать (§41), что 1) отношение изоморфизма является отношением эквивалентности на множестве всех колец (и полей); 2) в изоморфных кольцах (и полях):
§ 43. Поле 153 а) образ и прообраз нуля есть нуль; б) образ и прообраз противоположного элемента есть противопо- ложный элемент; в) образ и прообраз разности есть разность соответствующих эле- ментов; г) образ и прообраз единицы (в случае кольца, если оно обладает единицей) есть единица; д) образ и прообраз обратного элемента (в случае кольца, если элемент обладает обратным элементом) есть обратный элемент; 3) свойство кольца иметь или не иметь делители нуля сохраняется и в изоморфном кольце. Из перечисленных свойств следует, что кольцо, изоморфное полю, само будет полем. Таким образом, изоморфные кольца (и поля) могут отличаться друг от друга только природой своих элементов, но они тождественны по своим алгебраическим свойствам: всякая теорема, доказанная для некоторого кольца (или поля) бу- дет справедлива ддя всех колец (соответственно полей), с ним изо- морфных, если только доказательство теоремы опиралось лишь на свойства алгебраических операций, но не на индивидуальные особен- ности элементов этого кольца (соответственно поля). Характеристика поля. Существуют поля, в которых некоторое целое кратное 1, т.е. nl — 1 + 1 + ... + 1, равно нулю. Наименьшее натуральное число п, обладающее этим свойством, называется харак- теристикой поля. Если указанное свойство не имеет места ни для какого натурального числа п, то говорят, что такое поле имеет харак- теристику 0. Очевидно, Q.R - поля характеристики 0. Примерами полей характеристики р > 1 служат все конечные по- ля. В самом деле, конечное поле является конечной аддитивной груп- пой, при этом характеристика поля р > 1, так как р совпадает с поряд- ком элемента 1, являющимся делителем порядка самой группы (§39, следствие 1). Теорема 43.2. Характеристикой поля может быть ли- бо 0, либо простое число. Доказательство. Пусть п- характеристика поля и п -состав- ное число, т.е. п = тк, где т, к € N, т < п, к < п. Тогда в силу дистрибутивности 1 + 1 4~ • • + 1 = (1 + 1 + • • + 1) (1 + 1 + ... + 1) — 0. n т k Так как в поле нет делителей нуля, то отсюда следует, что либо J + 1 + ... -г 1 = 0, либо 1 + 1 + ... + 1 = 0, т.е. п - не наименьшее m к натуральное число, обладающее указанным свойством.
154 Глава VIII. Элементы общей алгебры Теорема 43.3. Если Р - поле характеристики р, то для любого элемента а € Р имеет место равенство pa — Q. До к аз ате л ь ст во. В самом деле, из свойства дистрибутивности следует, что pa — а(р 1) = а-0 = 0. Поле вычетов. Кольцо вычетов Zp не будет полем, если р состав- ное, так как в этом случае в кольце Zp есть делители нуля (§42). Теорема 43.4. Если р - простое число и р > 2, то Zp - поле характеристики р. Доказательство. Покажем, что Zp - поле. Так как Zp - ком- мутативное кольцо с единицей (§42), то достаточно показать, что для любого элемента Ст е Zp, т / 0, существует обратный элемент. Для этого рассмотрим все возможные произведения СтСк , где к = 0,р — 1. Этих произведений имеется ровно р (т.е. столько же, сколько элемен- тов в Zp), и все они различны, так как из того, что СтСк = СтСп, к п, следует, что тк = mn(modp) или что тк — тп делится на- цело на р. Следовательно, m(fc - п) делится на р, причем 0 < т < р, 0 < к — п < р. Это означает, что р - составное число. Таким образом, произведения СтСк (к = 0,р - 1) по одному разу пробегают все мно- жество Zp и, значит, одно из них совпадает с С\. Итак, для любого класса Ст, где т / 0, существует класс Ск такой, что СтСк = Ci- Следовательно, Zp - поле. Характеристика этого поля равна р, так как Cj + С± + ... + С\ — Со > С\ -I- Ci 4-... + С\ — Ст Со при р тп т < р. Теорема 43.5. Любое поле характеристики р > 1 с точно- стью до изоморфизма является расширением поля вычетов Zp. Доказательство. В поле характеристики р элементы, крат- ные 1, т.е. элементы вида nl, где п = 0, р — 1, различны. Легко пока- зать, что эти элементы образуют подполе. Оно изоморфно полю выче- тов Zp = {Со,.. , Ср-1}: изоморфизм устанавливается отображением <p(n 1) = Сп, п — 0, р — 1. Следствие. Любое конечное поле с точностью до изоморфизма является расширением некоторого поля вычетов. Замечание. До сих пор при изучении алгебраических объектов мы предполагали, что в их основе лежат вещественные числа: веще- ственные матрицы, вещественные линейные пространства, веществен- ные системы линейных алгебраических уравнений, многочлены с ве- щественными коэффициентами. Все факты, касающиеся этих объек- тов, остаются справедливыми, если вместо поля вещественных чисел рассматривать любое поле. Это легко проверить, так как доказатель- ства таких утверждений опирались лишь на свойства алгебраических операций в поле.
§ 43. Поле 155 В дальнейшем вместо термина “вещественная матрица” будем употреблять термин “матрица над полем Р”, так же как и термины “линейное пространство над полем Р”, “система линейных алгебраи- ческих уравнений над полем Р", “многочлен над полем Р”. Этим замечанием мы воспользуемся уже сейчас для доказатель- ства следующей теоремы. Теорема 43.6. В конечном тюле число элементов п имеет вид п = рт, (43.1) где р - простое, т - натуральное числа. Доказательство. Любое конечное поле является полем харак- теристики р > 1. Так как у изоморфных полей одинаковое число эле- ментов, то согласно теореме 43.5 достаточно показать, что в конечном расширении поля Zp содержится п — рт элементов, где m £ N (оче- видно, р - простое число, так как Zp - поле). Покажем это. Пусть F = {ao,Oi,• • _ расширение поля Zp — {Co,Ci, ... ,Cp-i}. Очевидно, что поле F является линейным пространством над полем Zp. Пусть еj,...,ет - базис пространства F. Тогда F - множество всевозможных линейных комбинаций aiei 4-... 4- omem, а; е Zp, t = l,m. (43.2) Так как для каждого а» возможно р различных значений, то всего элементов вида (43.2) будет рт.
Глава IX. Комплексные числа В этой главе рассматривается новая система чисел, которая явля- ется расширением поля действительных чисел. Подобно известной из элементарной алгебры цепочке расширений N С Z с Q С R, каждое звено которой связано с необходимостью решения той или иной за- дачи, расширение поля действительных чисел связано с проблемой решения квадратных уравнений. Мы расширим поле действительных чисел так, чтобы любое квадратное уравнение, в частности простей- шее из них г2 + 1 =0, имело решение. Прежде чем вводить эти “новые” числа, отметим, что при каждом известном расширении “старые” чи- сла становились частью “новых”, т.е. отождествлялись с некоторым классом новых чисел. Например, натуральное число 5 отождествля- лось с целым числом +5 , или с рациональным числом |, или с дей- ствительным числом 4,9999... § 44. Поле комплексных чисел Понятие комплексного числа. Комплексными числами назы- ваются упорядоченные пары (а, Ь) вещественных чисел, для которых понятия равенства, суммы, произведения и отождествления с веще- ственными числами вводятся согласно следующим правилам (аксио- мам): 1) (a, b) = (с, d) <==> а = с, b = d; 2) (а,Ь) 4- (с,d)I = (а + с, b + d); 3) (а, 6) • (с, d) = (ас —bd, ad+ be)-, 4) пара (а, 0) отождествляется с действительным числом а. Обозначения: z — (a,b), С - множество всех комплексных чисел. Замечание 1. В первых трех аксиомах речь идет об определе- нии разных понятий, поэтому их сопоставление не может привести к каким-либо противоречиям. В несколько другом положении нахо- дится аксиома 4. Дело в том, что понятия равенства, суммы и про- изведения для вещественных чисел уже имеют определенный смысл и они не должны противоречить правилам 1-3. Но, как нетрудно проверить, правила 1-3 для вещественных чисел, как пар специаль- ного вида, совпадают с обычными правилами равенства, сложения и умножения вещественных чисел (проверьте!). Теорема 44.1. Множество С всех комплексных чисел явля- ется полем. Доказательство. Действительно, сложение и умножение явля- ются алгебраическими операциями на множестве С, при этом не- посредственной проверкой легко установить, что они подчиняются
§ 44. Поле комплексных чисел 157 всем аксиомам поля. Отметим лишь, что 0 = (0,0); 1 = (1,0); —z = а b = если 2 = (а,ft) 0. Следствие 1. Для любой пары, комплексных чисел z\ = (а, Ь), 22 — (с, d) существует, и притом единственная, разность z^ — Z2 = = (а — с, b — d). Следствие 2. Для любой пары комплексных чисел zi — (а, Ь), z2 — {c,d) / 0 существует, и притом единственное, частное z\ (ас + bd be — ad Z2 \ с2 + cP ’ с2 + d2 Алгебраическая форма комплексного числа. Введем обозна- чение: г = (0,1). Из аксиом 1-4 непосредственно вытекают следую- щие свойства комплексных чисел. 1°. г2 = —1, так как г2 = (0,1 )(0,1) = (—1,0) = —1. 2°. Любое комплексное число z = (а, 6) может быть записано в виде z = а т Ы, (44.1) так как z = (а, Ь) = (а, 0) + (О, Ь) — (а, 0) + (6,0)(0,1). Форма (44.1) записи комплексного числа z = (а, Ь) называется алгебраической формой числа z, при этом число а называется дей- ствительной частью комплексного числа z = а + Ы и обозначается символом Rez, а b - мнимой частью и обозначается Imz. Для ве- щественных чисел мнимая часть равна нулю. Комплексные числа, у которых действительная часть равна нулю, называются чисто мни- мыми. Очевидно, два комплексных числа равны тогда и только тогда, когда по отдельности равны их действительные и мнимые части. Комплексное число z = а — bi называется сопряженным к числу z = а + Ы. Теорема 44.2. Операция сопряжения комплексного числа обладает следующими свойствами: 1) z = z; 2) z = z <=> z € R; 3) z + z — 2а, Vz = а + Ы ; 4) zz = а2 + Ь2 , \/г — а + Ы; 5) Zj ± z2 = zf ± z^; zTz2 = zT2j; (zi/z2) = z^/zj, z2 / 0 . Все свойства проверяются непосредственно исходя из определе- ния. Замечание 2. Для комплексных чисел, заданных в алгебраиче- ской форме, операции сложения, вычитания, умножения и деления производятся по обычным правилам выполнения этих операций над двучленами а + Ы с учетом того, что г2 = — 1, и последующим приве- дением подобных членов (т.е. отдельно группируются вещественные числа и чисто мнимые). Особенно это удобно для умножения чисел:
158 Глава IX. Комплексные числа если zi = a + bi, Z2 = с + di, то zj Z2 = (a + Ы)(с + di) — ac + adi + + bci — bd = (ac — bd) + (ad + bc)i. Для деления чисел удобно числитель и знаменатель дроби Z1/Z2 предварительно умножить на zj: zj (a + bi) (с — di) Z2 Z2Z2 = {Z2Z2 = c2 + d2 / 0} = ac + bd be - ad c2 + d2 c2 + d21 Комплексная плоскость. Пусть на плоскости выбрана прямо- угольная декартова система координат. Поставим в соответствие каж- дому комплексному числу z = a + Ы точку Nf (рис. 1) этой плоскости с координатами (а, Ь). Очевидно, что это соответствие взаимно одно- значно. Вещественные числа изображаются точками оси абсцисс; на оси ординат располагаются изображения чисто мнимых чисел. Нача- лу координат соответствует число ноль; сопряженные комплексные числа изображаются точками, симметричными относительно оси аб- сцисс (рис.1). комплексные числа, Плоскость, точками которой изображаются называется комплексной плоскостью, ее ось абсцисс - вещественной осью, ось ординат - мнимой осью (в соответствии с наименованием чисел, изображения которых лежат на этих осях). Простое геометрическое истолкование получают на комплекс- ной плоскости операции сложения и вычитания комплексных чисел. Так как каждая точка М(а, Ь) плоскости связана с ее радиус-вектором г = {а, 5}, то комплексное число z = а + bi можно изображать на ком- плексной плоскости радиус-вектором точки M(a,b). При сложении (вычитании) комплексных чисел zi = a + bi и z2 — с + di склады- ваются (вычитаются) координаты радиус-векторов гДа, 6} и г2{с, точек, изображающих эти числа. Поэтому сложение (вычитание) ком- плексных чисел равносильно сложению (вычитанию) радиус-векторов (рис. 2) и может быть выполнено по правилу параллелограмма (§11). Геомегрический смысл умножения и деления комплексных чисел станет ясным из другой формы комплексного числа.
§ 45. Тригонометрическая форма комплексного числа 159 Сопряженная матрица. Пусть А — € Cmxn - матрица размера m х п над полем комплексных чисел. Матрица Ан = (af) размера n х m называется сопряженной к матрице Л, если = aji, i = l,n, j = Очевидно, что Ан = (А)т = (Лг), где А = (aij). Из определения и теоремы 44.2 вытекают следующие свойства сопряженной матрицы: 1) (А + В)н =АН +ВН, 2) (аА)н = аАя, Va € С; 3) (АВ)Н = ВНАН; 4) (Ая)я = Л____ 5) det Ан — det Л; 6) rg Ан = rg Л, выполненные для всех матриц, для которых определены левые части равенств. Замечание 3. Ранее был изложен способ построения поля С комплексных чисел как расширения поля R действительных чисел. Помимо этого способа суще- ствуют и многие другие. Один из них использует сложение и умножение матриц. Опишем его. 1. Множество матриц" вида J над полем действительных чисел обра- зует поле относительно операций сложения и умножения матриц. Обозначим его символом С'. Итак, с' = {[-ь 2. Множество Л' = {[5 2]i*eR} образует подполе поля С. 3. Поле С комплексных чисел изоморфно полю С, изоморфизм строится как отображение <р: С -> С, которое любому комплексному числу z = а + Ы ставит в соответствие матрицу ‘p(z) = Отображение ср переводит все вещественные числа а 6 R в скалярные матрицы ср(а) = [о д]. все мнимые числа Ы, b е R, - в матрицы </>(bi) = q|, в частности <p(i) = [д о] • Таким образом, поле комплексных чисел можно рассматривать и как поле дей- Г а bl ствительных матриц вида l , в котором роль действительных чисел играют Га 01 Г 0 11 матрицы вида q , роль мнимой единицы - матрица q . § 45. Тригонометрическая форма комплексного числа Алгебраическая форма комплексного числа z — а + Ы связана с декартовыми координатами точки М(а, Ь), изображающей это число на комплексной плоскости. Однако положение точки на плоскости од- нозначно определяется и ее полярными координатами (§25): расстоя- нием г от этой точки до начала координат и углом между положи- 6 Линейная алгебра и аналитическая геометрия
160 Глава IX. Комплексные числа тельным направлением оси абсцисс и радиус-вектором точки M(a.b) (рис. 1). В соответствии с этим вводятся следующие характеристики комплексного числа. Модулем комплексного числа z = a -f- bi называется число г = = Ч- Ь2 . Обозначение: |z|. Из определения вытекают следую- щие свойства. 1°. |z| - действительное неотрицательное число, причем |z| = 0 <=> z = 0. 2°. |z| совпадает с полярным радиусом точки М, изображающей это число на комплексной плоскости (рис. 1). 3°. |z| - \/z3. 4°. Модуль вещественного числа совпадает с абсолютной величи- ной этого числа. Аргументом комплексного числа z Ф 0 называется угол у между положительным направлением оси абсцисс и радиус-вектором точ- ки М. (рис. 1), отсчитываемый от оси абсцисс в любом направлении, при этом положительным считается направление против часовой стрелки. Обозначение: argz. Из определения вытекают следу- ющие свойства. 1°. arg z не определен для z — 0, а для z / 0 определен с точностью до слагаемого, кратного 2тг, так как при одном и том же г углы, отличающиеся на слагаемое 2тгк, где к £ Z, определяют одну и ту же точку комплексной плоскости, т.е. одно и то же комплексное число. 2°. arg z отличается от полярного угла точки М тем, что argz имеет бесконечно много значений. 3°. Два комплексных числа z\ и z2 равны тогда и только тогда, когда |zi| = |z2| и, если Izil^O, . argzj = argz2 + 2тгк, к € Z. ' ' ' Теорема 45.1. Любое комплексное число z 0 может быть записано в виде z = r(cos<р + isin <р), (45.2) где г — |z|, = argz .
§ 45. Тригонометрическая форма, комплексного числа 161 Доказательство. Пусть z = a 4- bi. Тогда из соотношений (25.1), связывающих прямоугольные координаты с полярными, сле- дует, что a — т cos <р, b = г sm<p и z = г (cos 4- i sin </>). Форма (45.2) записи комплексного числа называется тригономет- рической формой этого числа. Теорема 45.2. Для любых комплексных чисел zj и z-^ име- ют место неравенства ||*11 - |*2|| < 1*1 ± *з| < |*1| + |*г| • (45.3) Доказательство. Неравенства (45.3) вытекают из правила параллелограмма сложения и вычитания комплексных чисел (§44) и неравенств треугольника (рис. 2: ДОМ2М3, ЛОМ1М2). Это обосно- вание относится к случаю, когда точки О, Mi, М2 не лежат на одной прямой (очевидно, при этом неравенства (45.3) будут строгими). Если же точки О, М\, Мг лежат на одной прямой, то несложный перебор вариантов расположения этих точек приводит к неравенствам (45.3), которые в некоторых из этих вариантов могут обратиться в равен- ства. Неравенства (45.3) называют неравенствами треугольника на комплексной плоскости. Отметим, что теорема 45.2 относится только к модулям; для самих комплексных чисел неравенство не определено. Теорема 45.3. При умножении комплексных чисел их мо- дули умножаются, а аргументы складываются; при делении ком- плексных чисел их модули делятся, а аргументы вычитаются: |*1*г| = |*i||*2|, argZ!Z2 =argzi +argz2; (45.4) — = 1—г, arg— = argzx -argz2, *2^0. (45.5) *21 |*г| *2 Доказательство. Пусть z* = гДсозу»* 4- isin<pk), где k = 1,2. Тогда z\Z2 — rir2((cos</3i cos</?2 — siny?i siny>2) + z(siny?i созс^г + H-cos^i sin^)) — O^cos^i -I- 922) + zsin(sPi 4- ^2)) • Отсюда следует г , n *1 r^coscpi 4-isin^i) cos9?2 — isin9?2 (45.4). Если z2 / 0, то — = —--------—-----г -------—.---- = z2 T2(cos <p2 4-1 sm <£>2) cos y>2 — г sm <£2 = —(cos(<pi - <^2) 4- zsin(ipi - у’г))- Отсюда следует (45.5). r2 Замечание 1. Если один из сомножителей в (45.4) или z\ в (45.5) равен нулю, то теорема относится только к модулям. Замечание 2. Соотношения (45.4) переносятся и на любое число сомножителей (достаточно применить метод математической индук- ции).
162 Глава IX. Комплексные числа § 46. Возведение в степень и извлечение корня Возведение в степень. Пусть n € Z и z € С. Число zn, опреде- ленное равенствами zn = z-z - ...-z при n € N; zn = 1 при n = 0 (в n этом случае предполагается, что z 0); zn = \/zm при m = —n € N, называется п-й степенью числа z. Теорема 46.1. Если z = r(cos<p 4- isin<p), n € Z, mo zn = rn (cos тир 4- i sin nip). (46.1) Доказател ьство. Для n € Nравенство (46.1) вытекает из (45.4). Для n = 0 равенство (46.1) следует из определения: z° = 1 = r°(cos0+ + i sin 0). Если n < 0 и n - -m, m € N, то zn = — = —;------------------r — rn(cosmtp — i sin nup) = zm rm (cos mip _|_ i sm m(p j — rn(cos(—m<p) 4- zsin(-7n<p)) = rn(cosn<p -I- isinn<p). Формула (46.1) называется формулой Муавра. Извлечение корня. Пусть п € N. Корнем п-й степени из ком- плексного числа z называется число а € С такое, что ап — z. Очевидно, что для z = 0 существует единственный корень п-й степени, равный нулю (так как ап — 0 <=> |а|" =0 <=> а — 0). Теорема 46.2. Для ненулевого числа z — r(cos<p + г sin ф) существует ровно п различных корней оц, 012, • •, оп п-й степени: (p + 2zrk . . <p + 2irk\ , ------- ак — фт I cos —-----------I- г sm —-----I , к = 0, n - 1. (46.2) \ n n / Доказательство. Пусть a - корень п-й степени из числа z и а = p(cos# 4- isin#). Тогда о" = z или, в силу (46.1), pn(cosn0 4- 4- island) = r(cos<p 4-isinip). Согласно (45.1) это означает, что рп = г, nd = ip + 2irk, А е Z. Так как р > 0, г > 0, то существует единственный положитель- ный корень п-й степени р из положительного числа г - это арифме- тический корень р = \/г. Таким образом, число а = p(cos 6 4- г sin 6) является корнем п-й степени из числа z тогда и только тогда, когда г- „ <р 4- 2тгА , _ р = у/г, d = ---------------, к е Z, п <р + 2як . . 4- 2кк\ , _ т.е. числа ак = vH c°s-F г sin---- , к € Z, и только они, \ п nJ являются корнями п-й степени из числа z. Числа ак для к — 0, п — 1
§ 46. Возведение в степень и извлечение корня 163 различны, так как их аргументы отличаются самое большее на 2л(п - 1) тт -------- < 2л. Числа at при к > п совпадают с одним из корней п с*о, аь , an- j, так как если k = nq-\-r,0<r<n — 1, то + 2тгк <р + 2nnq + 2тгг + 2тгг „ -------- = ------------ = ---------1- 2irq, qtZ. n n n Следовательно, ak — ar. Геометрическая интерпретация корней. На комплексной плоскости все корни n-й степени из ненулевого числа z расположе- ны на окружности радиуса р — \/|2| и делят эту окружность на п равных частей (так как argot — wgotk-i + 2тг/п). В частности, все корни n-й степени из единицы имеют вид Ek = cos---Ь i sin-, к = 0, n - 1. (46.3) n n Они расположены на единичной окружности и делят ее на п рав- ных частей, начиная с eq = 1. При этом действительных корней может быть либо два, если п четно (е0 и еп/2), либо один, если п не- четно (е?о)- В любом случае недействительных корней четное число, они расположены симметрично относительно действительной оси, т.е. попарно сопряжены. Теорема 46.3. Все корни n-й степени из комплексного чи- сла 2^0 получаются умножением одного из этих корней на все корни n-й степени из единицы. Доказательство. Пусть at, к = 0,п — 1, - корни n-й степени из z = r(cosy> + isin<p), определяемые равенством (46.2). Тогда, со- гласно (45.4) и (46.3), afc£o = afc, afc£i = at+i, •. , ак£п-к = a0,... , vГруппа корней n-й степени из единицы. Рассмотрим множе- ство Нп = {£q,£i, • •, еп-1} всех корней n-й степени из единицы. 1. Нп - абелева мультипликативная группа, как подгруппа муль- типликативной группы ненулевых комплексных чисел (согласно тео- реме 38.1). 2. Н„ - циклическая группа, порожденная корнем £j, так как £fc = ef. Более того, этой группой исчерпываются по существу все конечные циклические группы порядка п (это было обещано в §41). Теорема 46.4. Все циклические группы порядка п изоморф- ны мультипликативной группе корней n-й степени из единицы. Доказательство. Пусть а - образующий элемент циклической группы G. Построим изоморфизм. Каждому элементу afc € G, 0 < к < п, поставим в соответствие корень Ek п-й степени из единицы. Это будет взаимно однозначное отображение группы G на мультипли- кативную группу Нп корней n-й степени из единицы, изоморфность которого следует из (39.3).
164 Глава IX. Комплексные числа Корень Ek называется первообразным корнем, п-й степени из еди- ницы, если он не является корнем из единицы никакой меньшей степе- ни, чем п. Очевидно, для любого п > 2 число ед - первообразный ко- рень. Помимо d могут существовать и другие первообразные корни. Например, при п = 4: — {1, г, —1, —г} и £3 = —г также является первообразным корнем, так как £° = 1, £3 = —г, = — 1, £3 — г. Теорема 46.5. Корень е п-й степени из единицы является первообразным корнем тогда и только тогда, когда его степени Ек, к = 0, п - 1, различны. Доказательство. Необходимость. Пусть Ек = е1 при 0<к<1<п-1. Тогда е1~к — 1, где 1<1-к<п-1. Следо- вательно, £ является корнем из единицы меньшей степени, чем п. Достаточность. Пусть £ - не первообразный корень. Тогда существует к < п такое, что ек = 1 = £° и степени е°, е1, ..., £п-1 не будут различными. Следствие 1. Корень е п-й степени из единицы является пер- вообразным корнем тогда и только тогда, когда он будет образую- щим циклической группы Н всех корней п-й степени из единицы. С л едствие 2. Корень Ek & Н п-й степени из единицы являет- ся первообразным корнем тогда и только тогда, когда кип взаимно просты (см. теорему 39.6). Таким образом, число первообразных корней п-й степени из едини- цы равно числу целых положительных чисел к, меньших п и взаимно простых с ним. Если р - простое число, то первообразными корнями будут все корни, кроме единицы.
Глава X. Многочлены над произвольным полем В §13 и 31 уже упоминались многочлены с вещественными коэффициентами в связи с линейными пространствами, а также в связи с алгебраическими линиями и поверхностями. В этой главе многочлены будут основным объектом изучения. Начнем с алгебраических (формальных) свойств многочленов без учета того, что многочлен является не только формальным выражением, но также и функцией. § 47. Кольцо многочленов Пусть Р - поле. Многочленом (полиномом) n-й степени от пере- менной х над полем Р называется выражение ао + очх + а2х2 Ч--\-апхп, (47.1) где а,, г = 0, п, — фиксированные числа из поля Ри ап 0. Эти числа называются коэффициентами многочлена, а число ап — старшим ко- эффициентом. Число 0 € Р по определению считается многочленом с нулевыми коэффициентами и называется нулевым многочленом. Сте- пень нулевого многочлена не определена. Многочлен обозначается символом f(x) или /n(z), степень много- члена /(т) - символом deg/, множество всех многочленов от пере- менной х над полем Р - символом P[zJ. Итак, Л1) = X akxk е Р[х], deg / = п. к=0 Замечание 1. Выражения z, z2,.... zn не несут смысловой нагрузки (пока), они должны восприниматься как символы. Таким образом, на многочлен (47.1) следует смотреть как на некоторое формальное выражение, вполне определяемое набором своих коэффициентов до,ai,...,ап, где ап 0. Два многочлена f{x),g(x) € Р[х] называются равными, если рав- ны их коэффициенты при одинаковых степенях переменной х. Обозначение: f(x) = g(x). Из определения следует, что нулевой многочлен равен только нулевому многочлену, а для ненулевых мно- гочленов /(z) = Y^k=oakxk и g(x) = ^2k=o^kxk равенство f(x) = g(x) означает, что deg / = degд = п; а, — bi, i = 0, n. (47.2) Равенство многочленов, определенное здесь, означает тождественное равен- ство, и мы будем называть его формальным в отличие от равенства многочленов как функций. В §49 будет доказана равносильность этих определений равенства.
166 Глава X. Многочлены над произвольным полем Введем на множестве Р[т] алгебраические операции. Суммой многочленов /(z) — и 9(х) — 22fc=o^3;fc назы- вается многочлен max(n,s) h(x) = ^2 ckxk> где ck=ak+bk. (47.3) k=0 Здесь недостающие коэффициенты ak или bk заменяются нулями. Обозначение: f{x) + g(x). Из определения вытекают следующие факты. 1°. Для любого многочлена /(z) € P[z] f(x) + 0 = 0+ f(x) = /(z). (47.4) 2°. Для ненулевых многочленов /(z), g(x), /(z) + g(z) deg(/ + g) < max (deg f, deg g). (47.5) 3°. Если /(z),g(z) e P[z], to /(z) + g(z) € P[z], т.е. сложение многочленов является алгебраической операцией на множестве P[z]. Произведением многочленов /(z) = 52*=о и 9(х) — zLfc=o bk%k называется многочлен h(z) = ^2cfczfc, где ск = У2 o,jbj, к = Q,n+я. (47.6) к=0 i+j=k Здесь суммирование в 52i+j=fc ведется по всевозможным индек- сам i и j, для которых i + j = к. Обозначение: /(z)g(z). Из определения вытекают следующие факты. 1°. Произведение ненулевых многочленов не может быть нулевым, при этом deg fg = deg / + deg g. (47.7) 2°. Если /(z),g(z) € P[z], to /(z)p(z) € P[z), т.е. умножение мно- гочленов является алгебраической операцией на множестве P[z]. 3°. Операция умножения многочленов порождает операцию умно- жения многочлена на число из поля Р как частный случай умножения многочленов: если /(z) = акхк и а 6 Р, то o/(z) = ^aafcZ^; (47.8) *=о таким образом, на множестве P[z] определен и внешний закон компо- зиции.
§47. Кольцо многочленов 167 Теорема 47.1. Множество Р[х] всех многочленов над по- лем Р является коммутативным кольцом с единицей и без делите- лей нуля. Доказательство. Проверим все аксиомы кольца (§42). Прежде всего отметим, что Р[х] - аддитивная абелева группа: коммутатив- ность и ассоциативность сложения очевидны (в силу (47.3)), нулем является нулевой многочлен (как отмечено в (47.4)), противополож- ным к многочлену f(x) = SZ=oafca:*’ как легко проверить, является многочлен — /(х) = J2J=O(—afc)xfc. Коммутативность умножения сле- дует из определения. Докажем ассоциативность умножения. Пусть /п(*) = Ek=o akxk> 5a(z) = ELo Ььх>С’№ = E£=o ckxk-Обозначим через Ofc, Pki и &k коэффициенты при xk у многочленов /(x)g(x), g(x)h(x), (/(x)g(x))/i(x) и /(x)(g(x)h.(x)) соответственно. Тогда в си- лу (47-6) 7fc= 52 G*^ = 12 ( 12 arbt)Cj= 52 arbtCP Фс = 52 = 52 (12 )= IL arbtc^ г-i-i—k r+i=k 4+j=i r+t+j = k re. 7^ = <5fc. Отсюда, если учесть, что deg(/g)/i = deg f(gh) = n + s+p, следует равенство (/(x)p(x))/i(x) = /(x)(<?(x)/i(x)). Роль единицы при умножении многочленов играет число 1, рас- сматриваемое как многочлен нулевой степени. Справедливость аксиомы дистрибутивности вытекает из равен- ства, Sl+j=k(ai + bi)ci = Y,i+j=kaicj + E»+j=fckcj> так ка-к левая часть этого равенства является коэффициентом при хк в многочлене (/(х)+р(х))Л(х), а правая часть - коэффициентом при той же степени х в многочлене /(x)/i(x) + p(x)?i(x). Наконец, из (47.7) следует, что в Р[х] нет делителей нуля. Следствие. Множество Р[х] является линейным пространс- твом над полем Р. Это следует из того, что любое кольцо по сло- жению - абелева группа; что же касается внешнего закона компози- ции (47.8), то его дистрибутивность относительно сложения является частным проявлением общего закона дистрибутивности в кольце Р[х), а справедливость других аксиом умножения на число очевидна. Замечание 2. Произведение (47.6) многочленов f(x) и g(z) может быть получено обычным для элементарной алгебры перемножением двух сумм (до + + а^х + • • + anxn)(bo + bi® + • • • + Ь3х‘} с последующей группировкой одночленов одинаковой степени. Это следует из общего закона дистрибутивности и из того, что многочлены /(г) и д(х) можно рассматривать как суммы многочленов. Замечание 3. Кольцо Р[х) не является полем, так как не всякий многочлен f(x) € Р[х) обладает обратным многочленом f~l(x). Действительно, равенство f(x)f~l(x) = 1 с учетом (47.7) означает, что многочлены нулевой степени, и только они, обладают обратными.
168 Глава X. Многочлены над произвольным полем § 48. Деление многочленов Кольцо Р[х] всех многочленов над полем Р по своим свойствам близко к кольцу Z всех целых чисел. Эта аналогия проявляется и в том, что для многочленов, как и для целых чисел, имеют место понятия деления нацело, деления с остатком, делителя, наибольшего общего делителя и др. Теорема 48.1. Для любых двух многочленов /(х), д(х) € Р[х], где д(х) / 0, существует, и притом единственная, пара многочле- нов q(x),r(x) € Р[х] такая, что: f(x)=g(x)q(x)+r(x), , . где либо г(х) — 0, либо deg г < deg g. ' ' ' Доказательство. Докажем первую часть теоремы. Будем счи- тать, что /(х) Д 0, так как в противном случае можно положить q(x) = 0, г(х) = 0. Пусть /(х) = "£2=йакхк, g(x) = ^=obfcxfc, deg/ = n, degg — s. Без ограничения общности считаем, что п > s, так как в противном случае можно взять q(x) = 0 и г(х) = /(х). Применим метод математической индукции по степени п многочлена f(x), считая д(х) фиксированным. 1. Пусть п = 0. Тогда з = 0 и q(x) = aobg1, т(х) = 0. 2. Пусть теперь теорема верна для любого многочлена степени меньшей п. Докажем ее для многочлена /(х) степени п > з. Воспроиз- ведем первый шаг известного из элементарной алгебры алгоритма де- ления многочленов с действительными коэффициентами, т.е. постро- им одночлен ——хп~5 и составим разность о» /Дх) =/(х) - ^хп-д(х). (48.2) Либо многочлен /Дх) равен 0, либо deg/i < п. В первом случае мож- но положить д(х) = -^xn-s, г(х) = 0. Во втором случае для много- Од члена /Дх) по индуктивному предположению найдутся многочлены дДх) и т(х) такие, что /Дх) — g(x)qi(x) 4-г(х), где либо т(х) — 0, либо degr < degg. Тогда, согласно (48.2), /(х) = ^-xn-sg(x) + д(х)дДх) + G + r(x). Положив q(x) = -р-хп~я + дДх), приходим к паре многочленов д(х),г(х) € Р[х], удовлетворяющей условиям (48.1). Остается доказать единственность. Пусть существует еще одна пара многочленов дДх),гДх) 6 Р[х], удовлетворяющая условиям (48.1). Тогда /(х) - g(x)q(x) + г(х) и /(х) = д(х)дДх) 4-гДх), т.е. g(x)(q(x) - qx(x)) = гДх) - г(х). (48.3)
§ 48. Деление многочленов 169 Если ri(i) - г(х) 0, то и q(x) — 91 (т) / 0, при этом степень правой части равенства (48.3) меньше з (в силу (47.5) и (48.1)), а левой части - не меньше з (в силу (47.7)), что невозможно. Следовательно, гДх) — г(х) = 0, а так как в кольце Р[х] нет делителей нуля, то и q(x) — qi(x) — 0. Таким образом, г(т) = ri(z) и q(x) = qi(x). Заметим, что доказанная теорема очень похожа на соответствую- щую теорему о делимости целых чисел. По аналогии с целыми числа- ми многочлен д(х) называется частным (или неполным частным ) от деления /(т) на д(х), а г(х) - остатком от этого деления. Если г(т) = 0, то говорят, что /(т) делится (или нацело делится) на д(х), при этом д(х) называется делителем f(x). Очевидно, делителями лю- бого многочлена f(x) будут все многочлены нулевой степени и все многочлены вида otf(x), где а 0. Многочлен 99(1) называется общим делителем многочленов f(x) и д(т), если он является делителем каждого из них. Очевидно, все мно- гочлены нулевой степени - общие делители любой пары многочленов. Многочлены, не имеющие других общих делителей, кроме многочле- нов нулевой степени, называются взаимно простыми. Многочлен d(x) называется наибольшим общим делителем нену- левых многочленов f(x) и д(х), если: 1) d(x) - общий делитель многочленов f(x) и д(х); 2) d(x) делится на любой общий делитель многочленов f(x) и д(х). Обозначение: НОД(/,д). Очевидно, если d(x) = НОД(/, <7), то ad(x) = НОД (/, д) для любого а ± 0. Теорема 48.2. Для любой пары ненулевых многочленов f(x), д(х) € Р[х] существует наибольший общий делитель. Он опре- делен однозначно с точностью до множителя нулевой степени. Доказательство. Приведем описание алгоритма построения НОД (/,<?), называемого алгоритмом Евклида или алгоритмом по- следовательного деления. Он состоит в следующем. Выполним цепочку делений с остатком согласно теореме 48.1: f(x) = 9(x)qi(x) + n(x), deg 74 < deg <7, 5(т) = ri (x)q2(x) +r2(z), deg 74 < deg 74, ri(x) = r2(x)q2(x) +r3(z), deg 7-3 < deg 74, 74—3(2:) = rfc_2(z)9fc_i(z) -Ык-Дх), degrjt-i < degrfc-j гь-2(х) = rfc_i(x)gfc(x) + rfc(x), , rk-i(x) = rfc(x)gfc+i(z). degrfc < degTfc-x, (48.4) Степени остатков понижаются, поэтому процесс оборвется в тот момент, когда деление выполнится нацело. Пусть гДх) - последний отличный от нуля остаток. Покажем, что г^(х) — НОД (/,5). Действи- тельно, просматривая равенства (48.4) снизу вверх, заключаем, что гДх) является делителем г*._1(х), 74-2(1), • , т-1(т), g(x), f(x), т.е. общим делителем f(x) и д(х). Просматривая равенства (48.4) сверху
170 Глава X. Многочлены над произвольным полем вниз, заключаем, что все остатки г\(х), г?(х), ... , rjt(x) делятся на любой общий делитель f(x) и д(х). Докажем вторую часть теоремы. Положим di(x) — НОД (/,<?), d2(x) = НОД (/,5). Тогда, согласно определению НОД (/,<?), di(x) = = d,2(x)qt(x), di(x) = di(x)q2(x) и, с учетом (47.7), degdi > degd2, deg da > degdi. Следовательно, degdi = deg da и многочлены di(x) и d2(x) отличаются лишь множителем нулевой степени. § 49. Корни многочленов До сих пор мы рассматривали многочлен как формально-алгебраи- ческое выражение. Вместе с тем многочлен /(х) можно рассматри- вать и как функцию от переменной х. Если f(x) = о\хк - многочлен над полем Р, с - некоторое число из поля Р, то число /(с) = 52?=о afcC* называется значением многочлена f(x) при х = с. Известно (из теории функций), что две функции называются рав- ными, если их значения равны при всех значениях переменной. Оче- видно, что если многочлены f(x) и д(х) равны как многочлены (см. (47.2)), то они равны и как функции. Однако обратное утверждение потребует дополнительных исследований и будет доказано позже. По- ка же, забегая вперед, будем иметь в виду, что оба подхода к понятию равенства многочленов совпадают. То же относится и к операциям над многочленами: сложение и умножение многочленов, определенные в §47, превращаются в сложе- ние и умножение функций, так как если <р(х) = f(x) + д(х), •ф(х') = = f(x)g(x), то <^(с) = /(с) 4- д(с), ^(с) = f(c)g(c}, Vc € Р. Корнем многочлена /(х) € Р[х] называется число с € Р такое, что Дс) = 0. Теорема 49.1 (теорема Безу). Остаток от деления мно- гочлена f(x) на х — с равен f(c). Доказательство. Разделим согласно теореме 48.1 многочлен f(x) на многочлен х — с. Тогда f(x) = (х — c)q(x) + г(х), где degr < < deg(x—с) = 1, так что г(х) — г - константа. Рассматривая значения обеих частей этого равенства при х = с, получим, что г = /(с). Следствие . Число с € Р является корнем многочлена f(x) € Р[х] тогда и только тогда, когда многочлен f(x) делится на х — с в кольце Р[х]. Алгебраическая замкнутость поля С. До сих пор все поля мы считали равноправными. Однако в вопросе существования корней многочлена это далеко не так. Поле Р называется алгебраически за- мкнутым, если любой многочлен /(х) € Р[х] степени п > 1 обладает в Р хотя бы одним корнем. Очевидно, что поле действительных чисел R не является алгебраически замкнутым, так как многочлен х2 +1 не имеет действительных корней.
§ 49. Корни многочленов 171 Теорема 49.2 (основная теорема алгебры). Поле С ком- плексных чисел алгебраически замкнуто. Эта теорема называется “основной” по традиции, установившейся с тех времен, когда проблема решения алгебраических уравнений бы- ла главной проблемой в алгебре (впервые теорема доказана Гауссом в 1799 г. для частного случая). Теперь же она относится к числу ря- довых утверждений, хотя и очень важных. Во всяком случае, на ней основана вся дальнейшая теория многочленов. И тем не менее эта те- орема не является чисто алгебраической. Все ее доказательства (а их после Гаусса найдено довольно много) в той или иной мере опираются на другие разделы математики. Мы приведем одно из них, наиболее алгебраическое из доступных нам. Для этого потребуются дополни- тельные понятия и факты. В приводимых ниже леммах, если не оговаривается особо, f(z) = = ао a^z 4----F anzn — многочлен над полем комплексных чисел от комплексной переменной z. Лемма 1. Пусть f(z) = a\z 4- a2z2 4- - • 4- OnZn - многочлен с нулевым свободным членом. Тогда для любого е > 0 найдется <5 > О такое, что для все:? z, для которых \z\ < <5, выполняется неравен- ство |/(z)| < е. Доказательство. Пусть |z| < 1. Тогда в силу (45.4) и (45.3) |/(z)| = |z| |ei + a2z + ••• 4-anzn-1| < |z| (|ai| + |a2| 4-4- |an|). Положим M = |ai] + |a21 + • • • + |an| и возьмем 6 = min(l, e/M). Тогда для всех z, для которых |z| < <5, выполняется неравенство |/(z)| < < |z| - М < е/М М = £. Комплексная функция /(z) от комплексной переменной z назы- вается непрерывной в точке zq, если для любого Е > 0 существует 5 > 0 такое, что для всех z, для которых |z — zq| < <5, выполняется неравенство |/(z) — f (zq) | < е. Лемма 2. Многочлен f(z) = а^ + a\z -I- - • - 4- anzn есть не- прерывная функция во всех точках комплексной плоскости. Доказательство. Пусть zq - произвольное комплексное число. Разложим многочлен /(z) по степеням z - zq: /(z) = со 4-сДг — zq) 4- + -• • + Cn(z - z0)n. Тогда co = /(z0), так что /(z) -/(z0) = ci(z-z0) 4- 4- • • 4- Cn(z — zo)n. Правая часть этого равенства представляет собой многочлен от z — zq с нулевым свободным членом. По лемме 1 для любого е > О найдется б > 0 такое, что |/(z) — f (z0)| < е для всех z, для которых \z - Zol < <5. Лемма 3. Модуль многочлена есть непрерывная функция. Доказательство. Утверждение вытекает из леммы 2 и свойств модуля комплексных чисел (45.3): |/(z) - /(z0)| > ||/(z)| - |/(z0)||. Лемма 4. Если f(z) - многочлен степени п > 1, то для любого М > О существует R > 0 такое, что для всех z, для которых |z| > R, выполняется неравенство |/(z)| > М.
172 Глава X. Многочлены над произвольным полем Доказательство. Пусть f(z) +a^z+-----------banzn. Запишем f(z) в виде /(z) = anzn (1 + ^z-1 + • + —= \ an an J = anzn (H-p(z-1)) , (49.1) где <j(z-1) - многочлен от z~l с нулевым свободным членом. В силу леммы 1 для е = 1/2 найдется <5 > 0 такое, что при \z~11 < 6 имеет ме- сто неравенство |<?(z-1)| < 1/2. Модуль anz" может быть сделан сколь угодно большим, именно при |z| > ^/2М/|ап| будет |апгп| > 2М. Возьмем R = max ( yJlM/\an\, Тогда если |z| > R, то |z-1| < д и |z| > i(/2M/|an|, так что согласно (49.1) |/(z)| = |anz"| |1 + g(z-1)| > |anzn| |1 - ly^”1)] | > 2М(1-|) = М. Число zq = xq + iyo называется пределом последовательности zn — xn + iyn, если для любого е > 0 существует натуральное число N такое, что Izn — zg\ < е для всех п> N. Обозначение: lim zn = zq. п—too Очевидно, что сходимость последовательности комплексных чисел zn равносильна сходимости двух последовательностей действительных чисел: lira хп — xq, Inn уп - Уо- п—too п—too Последовательность zn называется ограниченной, если суще- ствует число R > 0 такое, что \zn | < R. Лемма 5. Из любой ограниченной последовательности zn можно выделить сходящуюся подпоследовательность. Доказательство. Пусть zn = xn+iyn и |zn| < Я; тогда |xn| < R, так что хп - ограниченная последовательность действительных чисел. Из нее согласно теореме Больцано-Вейерштрасса [11] можно выде- лить сходящуюся подпоследовательность хПк —> хо- Рассмотрим соот- ветствующую подпоследовательность мнимых частей уПк. Она огра- ничена, и из нее также можно выделить сходящуюся подпоследова- тельность yntm —> уо- Тогда соответствующая подпоследовательность znkm сходится к z0 = Xg + iy0. Лемма 6. Точная нижняя грань модуля многочлена дости- жима, т.е. существует число zq такое, что |/(zq)| < |/(z)| при всех комплексных г. Доказательство. Рассмотрим множество всевозможных зна- чений модуля многочлена f(z). Так как |/(z) | > 0, то это множество ограничено снизу и, следовательно, имеет точную нижнюю грань. Обозначим ее через т. Тогда для любого натурального числа п можно найти комплексное число zn такое, что |/(zn)| < m+ -. (49.2) п Воспользуемся леммой 4: для М = т + 1 найдем R такое, что при |z| > R будет |/(z)| > М > т + Отсюда и из (49.2) следует, что
§ 49. Корни многочленов 173 |zn| < R- Последовательность zn оказалась ограниченной, и из нее со- гласно лемме 5 можно выделить сходящуюся подпоследовательность znk —> zq- Тогда в силу непрерывности |/(z)| (лемма 3) lim |/(z„k)| = |/(z0)|. (49.3) к-юо С другой стороны, из (49.2) и определения нижней грани имеем т < \f(zn„)| < т + -Т-, поэтому lim |/(znk)| = т. (49.4) кчоо Сопоставляя (49.3) и (49.4), приходим к требуемому равенству |/(z0)| =m. Лемма 7 (лемма Даламбера). Если f(z) - многочлен сте- пени п > 1 и f(zo) / 0, то найдется число zi такое, что |/(21)|<|/(20)|. Доказательство. Разложим многочлен f(z) по степеням z — zq: /(z) = Со + Cj (z - z0) H--k Cn(z - z0)n. (49.5) Очевидно, что co = /(zq) / 0. Пусть q - первый ненулевой коэффи- циент в (49.5) после со (такой коэффициент имеется, так как /(z) не константа). Тогда /(z) = со + c*(z - zQ)k -k cfe+i(z - z0)fc+1 + • • • + Cn(z - zg)n = = co(l + —(z-z0)fc + —(z-zo)fc(^±i(z-zo)-l------k — (z-z0)"-fcj) = \ Co Co Ck Ck ) = Co(l + — (z - z0)fc + —(z - z0)fcp(z - Zo)}, (49.6) x Co Co / где g(z - z0) = Cfc+1 (z - zo) -(-k — (z — z0)n-/c - многочлен от z-zq c Cfc Ck нулевым свободным членом. Согласно лемме 1 для е = 1/2 найдется такое <5, что если |z — zo| < <5, то \g(z - z0)| < 1/2. (49.7) Оценим правую часть (49.6). Пусть — = ft(cos0-kisin0), z-zg = со = r(cosyr + i sin уз). Выберем г так, чтобы Rrk < 1. Для этого нужно взять г < (/1//?. Далее положим в+ktp — тг, т.е. возьмем у> = (тг-0)//с. При таком выборе имеем — (z—zg)k = -Rrk. Теперь положим zi = zq+ со -kr(cosy>-kisinyj) при г < min(6, у/1/R) и уз = (тг—#)/k. Тогда из (49.6)
174 Глава X. Многочлены над произвольным полем следует, что f(zi) = Cq (1 - Rrk — Rrkg(zi - zq)), откуда |/(zi)| = ]cq| |1 - Rrk - Rrkg(zi - z0)| < < |cq| (|1 — Rrk\ + Rrk\g(zi — zq)|) < {в силу выбора г и (49.7)} < < Icol (1 - Rrk + Rrk/2) = |со| (1 - Ят*/2) < |со| = |/(z0)|. Доказательство основной теоремы. Пусть f(z) - произ- вольный многочлен степени n > 1 над полем С от комплексной пере- менной z. Согласно лемме 6 множество всевозможных значений \f (z)| имеет точную нижнюю грань т, которая достигается в некоторой точке zq, так что |/(zq)| = m. Тогда /(zq) = 0, так как в противном случае, если |/(zq)| / 0, то согласно лемме 7 найдется точка zj, для которой |/(<zi)| < |/(zq)| = inf |/(z)|, что невозможно. Таким образом, zq - корень /(z) и поле С комплексных чисел алгебраически замк- нуто. § 50. Каноническое разложение многочлена над полем комплексных чисел Теорема 50.1. Для любого многочлена f(z) = аьгк £ g C[z] степени п > 1 существуют числа ci,cj, . - ,сп 6 С такие, что f(z) = аДг - ci)(z -c2)...(z- сД- (50.1) Это разложение единственно с точностью до порядка сомножите- лей. Доказательство. Из алгебраической замкнутости поля С сле- дует существование корня ci € С многочлена /(z). Тогда в коль- це C[z] многочлен /(z) делится (теорема 49.1) на многочлен z - ci, так что /(z) = (z - ci)/i(z), где /i(z) G C[z], deg/j = n - 1. Если n — 1 > 1, то к многочлену /i(z) также применима основная теорема алгебры и, следовательно, /(z) = (z — cj.)(z -c2)f2(z), где /2(2) € C[z], deg/2 = n —2, c2 e С. Применив эти рассуждения n раз, найдем числа Ci, C2, •. -, Cn G С такие, что /(z) = (z - cj(z - с2)... (z - cn)fn, (50.2) где deg/n = 0 и, следовательно, fn - константа. Сравнив коэффици- енты при zn в обеих частях равенства (50.2), получим, что fn = ап. Тем самым доказано существование разложения (50.1). Докажем его единственность. Пусть существует другое разложе- ние: /(z) = аДг - ф)(г - d2)... (z - dn). (50.3) Каждое число с, из первого разложения встречается среди чи- сел di,..., dn второго разложения, так как в противном случае для Ci dj, j = 1,п, из (50.1) получим, что /(с,) = 0, а из (50.3) - что
§ 50. Каноническое разложение многочлена 175 f(ci) 0. Аналогично каждое число dj встречается в первом разло- жении. Покажем теперь, что если с, — dj, то с, встречается в (50.1) столько же раз, сколько dj в (50.3). Пусть с, равно dj и встречается в (50.1) k раз, а в (50.3) - т раз и пусть к > т. Положим (z — c,)m = y(z). Тогда ¥>(z)(z - с*)*-"1 {J (z-Cj) = y>(z) [J (*-<*,), dj откуда следует, что ^/(z-c^-"* П (z-c’)“ П (г-<Ь))=0. сл da dj Так как в кольце C[z] нет делителей нуля и <p(z) 0, то (Z-С,)*-1 [] (Z-Ca)= [J сл с, da dj Положив в этом равенстве z = с<, придем к противоречию. Итак, к < т. Аналогично показывается, что т < к. Значит, к - т. Теорема 50.2 (о каноническом разложении многочле- на над полем С). Для любого многочлена f(z) — Y^k=aakzk е C[z] степени п > 1 существуют числа щ, с2,.. ., Cm € С, где с, / Cj при i j, и числа ki, к?,..., кт & N, где к^ + кг + • - + кт = п> такие, что f(z) = an(z - c,)kl (z - c2)fc’... (z - cm)*". (50.4) Это разложение единственно с точностью до порядка сомножите- лей. Доказательство. Рассмотрим разложение (50.1) для много- члена f(z). Среди чисел ci,c2,... ,Сп могут быть одинаковые. Будем считать, что сьсг, ...,^ различны, а каждое из Cm+i,... ,с„ равно одному из ci, с2,..., Ст- Объединив одинаковые сомножители в этом разложении, получим /(z) = an(z-ci)kl(z - c2)fcj.. .(z -Cm)1", где Ci / Cj при i j no построению, a fci + k2 +--1- km = n, так как ki + fc2 -I-F km - это число всех сомножителей в (50.1). Единствен- ность разложения следует из теоремы 50.1. Разложение (50.4) называется каноническим разложением много- члена над полем комплексных чисел. Заметим, что числа с,, i = 1,тп, в каноническом разложении (50.4) являются корнями многочлена /(z) (так как /(с,) = 0, t = l,m) и других корней этот многочлен не имеет (так как /(а) / 0 для любого
176 Глава X. Многочлены над произвольным полем числа a / <\, i = l,m). Число ki в каноническом разложении мно- гочлена называется кратностью корня ct. Если ki — 1, то корень с, называется простым, если ki > 1 - кратным. Следствие 1. Любой многочлен f(z) 6 C[z] степени п > 1 имеет ровно п корней, если каждый корень считать столько раз, какова его кратность. Замечание 1. Это утверждение применимо и к многочлену нулевой степени, оно неприменимо лишь к нулевому многочлену, для которого любое число z € С является корнем. Вернемся к вопросу о равносильности двух определений равенства многочленов, о котором шла речь в начале §49. Теорема 50.3. Если два многочлена f(z),g(z) е C[z], сте- пени которых не превосходят п > 1, имеют равные значения при более чем п различных значениях переменной, то они равны. Доказательство. Действительно, многочлен h(z) = f(z) — -g(z) е C[z] имеет более п различных корней. Но deg/i < п, поэтому h(z) = 0. Следствие 2. Два многочлена f(z),g(z) е C[z] равны тогда и только тогда, когда совпадают их значения при всех значениях переменной z. Следствие 3. Многочлен f(z) 6 C[z] степени п > 1 однозначно определяется своими значениями в п 4-1 различных точках. Нетрудно показать, что если многочлен /(z) в точках ai, аз, • ••, an + i, где а; # О] при i / j, принимает значения /(ai), /(аз),.... /(аП4-1), то f( } = f(„ ч (z-ai)...(zr-a<-i)(z-ai+i)...(z-an+1) »=1 ’ (aj - aj). ..(ai - а,-1)(а< - ai+i)... (а4 - an+i) Этот многочлен называется интерполяционным многочленом Лагранжа. Теорема 50.4 (формулы Виета). Если сх,с2,... ,Сп -кор- ни многочлена f(z) - 52Z=oafcZfc, т0 ®п—1/(^1 + С2 + • • + Сп), e^n—z/^n “b(^i^2 С1С3 4- • • 4- CiCn 4" С2С3 4- * * * 4- сп—1Сп), fe/^n = ( — 1) 52 ^2 • 1 *1 <«2<- -<ik ao/fln = (-l^ca.-.Cn. (50.5) Доказательство. Достаточно рассмотреть случай, когда ап — 1, так как многочлены /(г) и (l/an)/(z) имеют одинаковые корни. Применим индукцию по п. Для п = 2 формулы (50.5) явля- ются известными из элементарной алгебры формулами Виета. Пусть для многочленов (п-1)-й степени формулы (50.5) имеют место, дока- жем их для многочлена /(г) = ao4-aiz4-----Fan_izn-14-zn. Согласно (50.1) /(z) = ((z - Ci)(z - C2) •. • (z - Cn-1)) (z - cn) = p(z)(z - Cn),
§51. Многочлены над полем вещественных чисел 177 где g(z) = (z — ci)(z — с2)... (z — Cn-i) - многочлен степени n — 1. Пусть g(z) = bo -F btz -|-F bn_2z"-2 + zn~l, тогда /(z) = (b0 -F biz 4--1- bn_2zn~2 + zn-1)(z - cn) = = boz + biz2 -I-F bn-2zn~1 + zn - (boCn + biCnZ 4-F bn_2CnZn~2+ +cnzn~1) = -b0Cn + (b0 -bjc^zd--F (bn-fc-i -bn-kCn)zn~k + • - + zn и /(z) — ao -F a\z H-F an-kZn~k -I-F zn. Сравним коэффициенты при zn~k и учтем, что для коэффициентов Ь, , г — 0, п — 2 , верны соотношения (50.5), т.е. fyn-l)-k — ( l)fc 52 ZCii • • • Cik j где суммиро- вание в ^2' ведется по всем 1 < й < гз < * • - < < п - 1. Тогда к = ^п — к— 1 Ьп—кСп = tyn— 1)—fc fyn— 1)— (fc— l)^n = = - -cik - = = (-l)fc (52•••<** +CnL4CiJ ' C«*-l) = где суммирование ведется по всем 1 < ii < i2 < • • < ik < n. Замечание 2. Все утверждения этого параграфа имеют место в любом алгебраически замкнутом поле. Формулы Виета примечательны тем, что их правые части предста- вляют собой такие многочлены от переменных Ci, • • ,£„, которые не меняются ни при какой перестановке корней ci,..., с* Такие много- члены называются симметрическими многочленами (или симметри- ческими функциями). Следующие п симметрических многочленов от п неизвестных называются элементарными симметрическими мно- гочленами: < 71 = Xj + Х2 -F • • + Тщ < т2 — xix2 + Х1Х3 + • • • “F Xyi—ixn, < 7n — к — • • • *7<к , «!< •<«* — Х1Х2 • - • • Таким образом, коэффициенты многочлена от одной переменной, имеющего старшим коэффициентом единицу, являются с точностью до знака симметрическими многочленами от его корней. §51. Многочлены над полем вещественных чисел Пусть f(x) = 52£=о акх>с ~ многочлен над полем R степени п, т.е. ак € R, к = 0, п, и ап / 0. Так как RcC, то многочлен f(x) можно рассматривать и как многочлен над полем С. Тогда, как показано в §50, этот многочлен с учетом кратностей имеет п корней (вообще говоря, комплексных).
178 Глава X. Многочлены над произвольным полем Теорема 51.1. Если с - комплексный (и не действитель- ный) корень многочлена f(x) G R[x], то и с является корнем этого многочлена. Доказательство. Если с является корнем многочлена f(x) = = Sk=o akXk, то ао + aic +-1- ancn = 0. Взяв сопряжение от обеих частей этого равенства, получим с учетом теоремы 44.2 и соотношения а*> — к = 0,п, что ао + aicH-1- апсп = 0. Положим <р{х) = [х - с)(х - с) = х2 - (с + с)х + |с|2. Очевидно, у(х) € R[xJ. Теорема 51.2. Если с - комплексный (и не действитель- ный) корень многочлена /(х) € R[x], то в кольце R[x] многочлен f(x) делится на <р(х). Доказательство. Разделим многочлен /(х) на <£>(х) в кольце R[x] согласно (48.1), тогда /(х) = tp(x)q(x) + r(x), где q(x),t(i) g R[x]. Это же разложение можно рассматривать как результат деления /(х) на у>(х) в кольце С[х]. Но в кольце С[х] многочлен /(х) делится нацело на v?(x), так как с и с являются корнями /(х). Отсюда и из единствен- ности результата деления (теорема 48.1) следует, что /(х) = уз(х)д(х), где g(x) € R[x]. Теорема 51.3. Кратности корней с и с многочлена с веще- ственными коэффициентами совпадают. Доказательство. Пусть с и с - корни многочлена /(х) € R[x] кратностей m и к соответственно. Покажем, что к < т. Пусть к > тп. Тогда, согласно теореме 51.2, /(х) = (<р(х))т д(х), где q(x) € R[x]. Но q(c) = 0, а q(c) 7^ 0, что невозможно в силу теоремы 51.1. Зна- чит, к < т. Аналогично можно показать, что т < к. Следовательно, к = т. Следствие. Многочлен с вещественными коэффициентами не- четной степени имеет хотя бы один вещественный корень. Теорема 51.4 (о каноническом разложении многочле- на над полем R), Для любого многочлена /(х) = Y^k=oakxk € R[x] степени п > 1 существуют числа ci,...,Cr G R, где с, ф Cj при i / j; числа Pi,qi,. •. ,ps,qa € R, где (pi,qi) (pj, qj) при i 7^ j; числа ki,..., kr € N и li,..., ls G N, где k, + 2 lj — n, такие, что Г 8 f(.x) = an П(я - Ci)ki JJ(x2 +Pji +qj)li. (51.1) i=i j=i Доказательство. Используем каноническое разложение (50.4) многочлена /(х), рассматривая /(х) как многочлен с комплексными коэффициентами: /(х) = an(x - Ci)fci... (х - cm)fe>", (51.2) где а / Cj при i j н. ki + + km — п. Числа ci,..., Ст являются комплексными корнями /(х). Среди этих корней могут быть и дей- ствительные. Пусть ci,..., Сг - действительные корни, а <>+1,..., Сщ -
§51. Многочлены над полем вещественных чисел 179 комплексные (не действительные). Тогда среди Сг+ь • • •, Cm вместе с каждым корнем Cj находится и сопряженный ему корень с, = Cj, при- чем той же кратности, так что ki = kj = и, следовательно, 21 j = ki+ 4- kj. Объединим в (51.2) пару сомножителей: (i - с})к’(х - Ci)k' = ((z - Cj)(i - Cj))!< = (х2 +PjX 4- где pj — -(cj 4- cj) e R, qj = CjCj € R. Тогда (x - cr+i)... (x- Cm) = (z2 +pix + qi)11 ...(z2 +pax + q,)l‘ и разложение (51.2) перейдет в (51.1), причем fci 4- • • • 4- kT 4- 2(h 4- 4- • • 4- Is) = ki 4- • + kr 4- &r+i 4- • • 4* km = n. Разложение (51.1) называется каноническим разложением много- члена над полем вещественных чисел. Замечание. Теорема 50.3 и ее следствия справедливы и для мно- гочленов с вещественными коэффициентами. В этом можно убедить- ся, если рассматривать их как многочлены с комплексными коэффи- циентами. Формулы Виета справедливы лишь для тех многочленов из R[z], которые имеют полный набор действительных корней.
Глава XL Алгебраические линии второго порядка на плоскости § 52. Эллипс Эллипсом, называется геометрическое место точек М плоскости, для которых сумма расстояний от двух фиксированных точек Fi и F2 плоскости есть постоянное число, большее, чем расстояние между Fi и F2. Это число обозначим через 2а. Точки Fi, F2 называются фоку- сами эллипса, расстояние между ними называется фокусным рассто- янием и обозначается через 2с. Числа п = р(М, Fi) и r2 — р{М, F2) называются фокальными радиусами точки М. Из определения эллипса следует, что точка М плоскости является точкой эллипса тогда и только тогда, когда fi + г2 = 2а, а > с. (52.1) Каноническое уравнение. Запишем условие (52.1) в координат- ной форме. Для этого введем на плоскости прямоугольную декар- тову систему координат Оху, приняв за начало О середину отрезка FiF2, за ось Ох - пря- мую FiF2, ориентированную от х Fi к. F2-, ориентацию на оси Оу выбираем произвольно (рис. 1). Эта система координат называ- ется канонической системой ко- ординат (для данного эллипса). Фокусы Fi и F2 в канонической системе координат имеют коорди- наты (-с, 0) и (с, 0) соответственно. Теорема 52.1. Уравнение эллипса в канонической системе координат имеет вид х2 У2 Ь2 а > Ъ > 0. (52.2) Доказательство. Пусть М(х,у) - точка эллипса (52.1). Тогда условие (52.1) может быть записано через координаты точек Fi, F2, М в виде х/(а: + с)2 + у2 -I- \/(а: - с)2 + у2 —2а, а > с.
§ 52. Эллипс 181 После переноса одного слагаемого в правую часть и возведения в ква- драт получим х2 + 2сх + с2 + у2 = 4а2 — 4а\/(т — с)2 + у2 + х2 - 2сх + с? + у2 или, после очевидных преобразований, ау/ (х — с)2 + у2 = а2 — сх. Еще раз возведем в квадрат: а2х2—2а2хс+а2с2+а2у2 = а4 — 2а2сх+ + с2!2 или х2(а2 — с2) + а2у2 — а2(а2 — с2), где а2 - с? > 0. Разделив обе части уравнения на а2(а2 — с2), придем к уравнению т2 у2 или “Г + тг = 1, где Ь2 = а2 — с2, а > Ь > 0. Таким образом, любая точка М(х, у) элли- пса удовлетворяет уравнению (52.2). Обратное утверждение, вообще говоря, не очевидно, так как при переходе от (52.1) к (52.2) мы два- жды возводили в квадрат обе части уравнений и поэтому на линии, определяемой уравнением (52.2), могут быть и "лишние" точки. По- кажем, что уравнению (52.2) отвечают только точки эллипса (52.1). Пусть точка М(х,у) удовлетворяет уравнению (52.2), тогда / х2\ у2 — Ь2 | 1--т ) и |х| < а. (52.3) \ а ) Найдем фокальные радиусы точки М. Имеем Г] = \/(х + с)2 4- у2 = J х2 + 2сх + с2 +Ь2 jх2 — . M'-?J+2c, + c. + y _ /^V+2cl + o3 _ V а2 V а2 I/ХС \2 IXC I сх — \ (-h а I =--f- а — а Ч-, V ' а / I а I а так как -—- < — = с < а в силу (52.3). Итак, а а Г1=а+-. (52.4) а Аналогично доказывается, что г2 = а - —. (52.5) Из (52.4) и (52.5) следует, что ri + г2 = 2а.
182 Глава XI. Алгебраические линии второго порядка на плоскости Уравнение (52.2) называется каноническим уравнением эллипса. В случае, когда а = Ь (т.е. фокусы совпадают), эллипс превращается в окружность радиуса а с центром в точке О - Fi = F2- Из канонического уравнения вытекают следующие свойства эл- липса. 1°. Координатные оси канонической системы координат (рис. 2) являются осями симметрии эллипса, так как вместе с точкой М(х,у) эллипса точки Mi(-x,у) и ^(х.-у) также принадлежат эллипсу. Начало координат канонической системы координат является цен- тром симметрии эллипса, так как точки М(х, у) и Мз(—х, -у) од- новременно принадлежат эллипсу. Начало координат канонической системы координат называется центром эллипса, числа 2а и 25 - большой и малой осями эллипса, а числа а и b - большой и малой полуосями. 2°. Все точки эллипса лежат в прямоугольнике, ограниченном пря- мыми х — ±а и у = ±6, так как для координат (т, у) точек эллипса |т| < а, |у| < Ъ. Точки Л1(-а,0), Лг(а,0), Bi(0, -5), пересече- ния эллипса с осями координат называются вершинами эллипса. 3°. Исследуем форму эллипса. В силу симметрии достаточно про- вести это исследование лишь для точек I четверти. Здесь уравнение эллипса имеет вид у - -\/а2 - х2, х € [0, а]. Легко показать, что: а а) у(х) непрерывна и убывает от у = Ь до у = 0; б) !/х(0) = 0, у'(а) — оо, следовательно, касательная к эллипсу в точке т = 0 параллельна оси Ох, а в точке х = а - оси Оу; в) у"(х) < 0, следовательно, линия выпукла вверх (рис. 2). Простой способ построения эллипса дается определением эллипса: достаточно нить длиной 2а закрепить концами в точках F\ и Fq, натянуть нить карандашом и передвигать карандаш, держа нить натянутой. Директориальное свойство. Число е = с/а называется эксцен- триситетом эллипса. Из определения следует, что 0 < е < 1, при
§ 52. Эллипс 183 этом или - - \/l - Е2 а (52.6) и, с учетом (52.4), (52.5), П = а + ех, Г2 = а — ех. (52.7) Соотношения (52.6) означают, что чем меньше эксцентриситет, тем эллипс “ближе” к окружности (для окружности е = 0). Для эллипса, не являющегося окружностью, две прямые dj и dj, заданные в канонической системе координат уравнениями , а А а di : х —---, dj : х = —, £ Е называются директрисами эллипса (рис. 3). Директриса d, называется соответствующей фокусу Fi, i = 1,2. Теорема 52.2. Эллипс, не являющийся окружностью, есть геометрическое место точек М плоскости, для которых отношение расстояния от данной точки F к расстоянию до данной прямой d, не проходящей через эту точку, равно данному положительному числу, меньшему 1, т.е. '-^ = е, 0 < е < 1. (52.8) ,d) Доказательство. Пусть p(F,d) — т. Найдем число а > 0, для которого т — - — аг. (52.9) Очевидно, а =------г. Положим 1 — Е2 с — as, Ь2 — а2(1 — £2). (52.10) Введем прямоугольную декартову систему координат Оху, при- нимая за ось Ох прямую, проходящую через точку F, перпендику- лярную прямой d (рис. 4) и ориентированную от F к d; за начало О - точку на оси Ох, расположенную от точки F на расстоянии с по другую сторону от прямой d; ориентация на оси Оу выбирается произвольно. В этой системе координат точка F имеет координаты (с, 0), а пря- мая d определяется уравнением х — а/Е, так как с+т = аг+т = ajs (рис. 4). Условие (52.8) для точки М(х,у) означает, что а/(т - с)2 + у2
184 Глава XI. Алгебраические линии второго порядка на плоскости Возведя обе части в квадрат, получим равносильное уравнение х2 — 2сх + с2 + у2 — х2е2 — 2хае + а2, которое с учетом того, что с = аг, может быть записано в виде (1 - s2)x2 + у2 = а2(1 - а2). Разделив обе части этого уравнения на правую часть, приходим в обо- значениях (52.10) к каноническому уравнению эллипса, эквивалент- ному (52.8): т2 у2 а>Ъ>Ь. а2- о2 Итак, точка М(х,у) принадлежит геометрическому месту точек (52.8) тогда и только тогда, когда она является точкой эллипса, для которого данная точка F является фокусом, прямая d - соответству- ющей директрисой, а число г - эксцентриситетом. Отметим, что до- казательство теоремы как раз и состоит в построении этого эллипса. Его полуоси а и Ь определены равенствами (52.9), (52.10). § 53. Гипербола Гиперболой называется геометрическое место точек М плоскости, для которых абсолютная величина разности расстояний от двух фик- сированных точек Fj и F2 плоскости есть постоянное положительное число, меньшее, чем расстояние между F\n F?- Это число обозначим через 2а. Точки Fi, F2 называются фокусами гиперболы, расстояние между ними называется фокальным расстоянием и обозначается че- рез 2с. Согласно определению а < с. Числа = p(M,Fi), г = 1,2, называются фокальными радиусами точки М. Из определения гиперболы следует, что точка М плоскости явля- ется точкой гиперболы тогда и только тогда, когда |тх - г2| = 2а, а < с. (53.1)
§ 53. Гипербола 185 Каноническое уравнение. Запишем условие (53.1) в координат- ной форме. Поступая так же, как и в случае эллипса, построим кано- ническую систему координат Оху для гиперболы (53.1). Теорема 53.1. Уравнение гиперболы в канонической систе- ме координат имеет вид т2 а2 Ь2 (53.2) Доказательство. Если М(х,у) - точка гиперболы (53.1), то |у/(т + с)2 + у2 - \/(х- с)2 + у2| — 2а, а < с, или \Х(х + с)2 + у2 - у/(х- с)2 4- у2 = ±2а, а < с. Используя те же преобразования, что и для эллипса, придем к урав- нению х2(а2 —-с2) + а2у2 = а2(а2 — с2), а2 - <? < О, или, в обозначениях — Ь2 = а2 — с2, к уравнению (53.2). Таким образом, любая точка М(х, у) гиперболы удовлетворяет уравнению (53.2). Обратное утверждение доказывается так же, как и для эллипса. Здесь |®| > а, поэтому (53.3) Таким образом, в обоих случаях |ri — г2| = 2а. Уравнение (53.2) называется каноническим уравнением гипербо- лы. Отметим простейшие свойства гиперболы, вытекающие из ее ка- нонического уравнения. 1°. Как и в случае эллипса, координатные оси канонической си- стемы координат являются осями симметрии гиперболы, а начало ко- ординат - центром симметрии. Ось Ох пересекает гиперболу в точ- ках Л1(—а, 0), Л2(а, 0) и называется вещественной осью гиперболы. Ось Оу не пересекает гиперболу и называется мнимой осью. Нача- ло координат называется центром гиперболы, числа а > 0, Ь > 0 - вещественной и мнимой полуосями гиперболы. 2°. Все точки гиперболы лежат вне полосы, определяемой прямы- ми х = ±а, так как |т| > а (рис. 1). Это означает, что гипербола состоит из двух отдельных частей, называемых ветвями гиперболы. 3°. Все точки гиперболы лежат в тех вертикальных углах, образо- ванных прямыми у = которые содержат вещественную ось, так как для точек М(х, у) гиперболы у = ±£\Лг2 — а2, т.е. |у| < £|а:|.
186 Глава XI. Алгебраические линии второго порядка на плоскости 4°. Исследуем форму гиперболы. В силу симметрии достаточно провести это исследование лишь в I четверти. Здесь уравнение ги- перболы имеет вид у = — а2, х > а. Легко проверить, что (рис. 1): а) у{х) непрерывна и возрастает на [а, +оо), при этом у (а) — 0 и lim у(х) = -|-оо; х-»+оо б) у'{а) = оо, так что касательная к гиперболе в точке х = а параллельна оси Оу, в) у"(х) < 0, следовательно, линия выпукла вверх; г) если I - прямая, заданная уравнением у = £х, то для всех точек М(х,у) гиперболы lim р{М,1) = 0, так как х->+оо (м г- ~ у! - 1Ьа: ~ ау1 - 1Ьа: ~ - q2I _ ? ’ >/1 + Ь2/а2 у/a2 +Ь2 у/а2 + & а2Ь = /-Л- гл,----/ л - - - -> 0 при X -> +ОО. у/а2 + Ь2(х + у/х2 — а2) Итак, все точки гиперболы с ростом х сколь угодно близко при- ближаются к прямым 11- У = и 12: у = не пересекая их. Прямые li, 12 называются асимптотами гиперболы. Директориалъное свойство. Число е — с/а называется эксцен- триситетом гиперболы. Из определения следует, что е > 1, при этом и, с учетом (53.3), Г ri = -(ет 4- а), ( г2 = —{ех - а) rj = ех 4- а, т2 — ех — а и ддя левой и правой ветвей гиперболы соответственно.
§ 54. Парабола 187 Прямые di и di, заданные в канонической системе координат урав- нениями , a j a ai : X =--, Д2: х = —, £ € называются директрисами гиперболы (рис. 2). Директриса d, называется соответствующей фокусу Ft, г = 1,2. Теорема 53.2. Гипербола есть геометрическое место то- чек М плоскости, для которых отношение расстояния от данной точки F к расстоянию до данной прямой d, не проходящей через эту точку, равно данному числу е > 1, т.е. P(M,F) p(M,d) ’ Доказательство. Так же как и в случае эллипса (теорема 52.2), для данных точки F, прямой d и числа е > 1 строится гипербо- ла, для которой точка F является фокусом, прямая d — соответству- ющей директрисой, чйсло е - эксцентриситетом. Если т = p(F,d), то полуоси гиперболы определяются соотношениями а т = ОЕ----, С = ОЕ £ (53.4) ТПЕ £2 - 1 или а с = ас, Ь2 = п2(е2 — 1). Использование тех же пре- образований, что и при доказательстве теоремы 52.2, завершает до- казательство. § 54. Парабола Параболой называется геометрическое место точек плоскости, для которых расстояние от некоторой фиксированной точки F плоскости равно расстоянию до неко- торой фиксированной прямой d, не проходящей через точ- ку F. Точка F называется фо- кусом параболы, прямая d - ее директрисой. Расстояние от фокуса параболы до ее дирек- трисы называется фокальным параметром параболы и обо- значается через р. Эксцентри- ситет параболы по определе- нию считается равным 1.
188 Глава XI. Алгебраические линии второго порядка на плоскости Каноническое уравнение. Введем на плоскости прямоугольную декартову систему координат Оху, принимая за ось Ох прямую, про- ходящую через точку F перпендикулярно прямой d, ориентирован- ную от прямой d к точке F, за начало О - середину отрезка FD, где D - точка пересечения оси Ох с прямой d; ориентацию на оси Оу выбираем произвольно (рис. 1). Эта система координат называется канонической системой координат для данной параболы. Теорема 54.1. Уравнение параболы в канонической систе- ме координат имеет вид у2 = 2рх, р > 0. (54.1) Доказательство. В канонической системе координат Оху фо- кус F имеет координаты (р/2,0), директриса d определяется урав- нением х = -р/2. Точка М(х, у) является точкой параболы тогда и только тогда, когда p(M,F) — p(M,d), или, что то же самое, ^-^)2 + у2 = р||. Возведя в квадрат обе части уравнения, получим равносильное урав- нение х2 — рх + у2 = х2 4- рх +р2/4 или уравнение (54.1). Уравнение (54.1) называется каноническим уравнением параболы. Следующие свойства параболы (рис. 1) непосредственно вытекают из канонического уравнения. 1°. Ось Ох канонической системы координат является осью сим- метрии параболы. Она называется осью параболы. Начало координат лежит на параболе и называется вершиной параболы. 2°. Все точки параболы расположены в правой полуплоскости от оси Оу, так как х > 0. 3°. Исследуем форму параболы. В силу симметрии достаточно рас- смотреть I четверть. Здесь уравнение параболы имеет вид у = \/2рх, х > 0. Легко проверить, что: а) у(х) непрерывна и возрастает на [0,+оо), причем у(0) = 0 и lim у(х) = +оо; б) j/'(0) = оо, так что касательная к параболе в точке х = 0 парал- лельна оси Оу, в) j/"(0) < 0, следовательно, парабола выпукла вверх (рис. 1). Замечание. Определение параболы, по существу, означает ее директориальное свойство р(М, Г) р(М, d) (54.2) где F - фокус, d - директриса, е - эксцентриситет, которое, как мы видели в §52, 53, имеет место для эллипсов и гипербол. Отличие
§ 55. Касательные к эллипсу, гиперболе и параболе 189 состоит лишь в том, что для эллипсов 0 < е < 1, для парабол е = 1, для гипербол е > 1. Итак, если на плоскости даны прямая d и не при- надлежащая ей точка F, то геометрическое место точек М плоско- сти, удовлетворяющих условию (54.2), является либо эллипсом (если О < £ < 1), либо параболой (если е = 1), либо гиперболой (если е > 1). Эти линии обладают целым рядом других свойств, имеющих “род- ственные” формулировки. § 55. Касательные к эллипсу, гиперболе и параболе Будем считать, что эллипс, гипербола и парабола заданы своими каноническими уравнениями (52.2), (53.2), (54.1). Найдем уравнения касательных к этим линиям. Теорема 55.1. В канонической системе координат уравне- ния касательных к эллипсу, гиперболе и параболе в точке (хо,уо) линии имеют вид ХХО УУо . а2 Ь2 ’ (55.1) хх0 ууо _ . а2 Ь2 ’ (55.2) УУО = р(х + То) (55.3) соответственно. Доказательство. Все три уравнения выводятся по одной схе- ме. Приведем ее для эллипса. Воспользуемся известным из курса маг тематического анализа [11] уравнением касательной в неособой точке (хо,Уо) линии, заданной неявно уравнением F(x,у) — 0. Это уравне- ние имеет вид г;(хо, УоКх ~ *о) + Fy(x0, у0)(у - Уо) = 0, (55.4) где F'x(xo,ya), Fy(xo,yo) ~ частные производные функции F(x,y) в точке (xq, уо). Для эллипса (52.2) уравнение касательной в точке (то, Уо) этого эллипса имеет согласно (55.4) вид ^•(х - х0) + §(у - уо) = 0 а2 сг х2 у2 или, с учетом того, что + 77 = 1, вид (55.1). П* п2
190 Глава XI. Алгебраические линии второго порядка, на плоскости § 56. Оптические свойства эллипса, гиперболы и параболы Здесь речь идет о биссекториальных свойствах касательных к этим линиям. Теорема 56.1. Касательная к эллипсу в произвольной его точке Mq есть биссектриса внешнего угла Мд треугольника F^Mg, где F\, F^ - фокусы эллипса. Доказательство. Рассмотрим касательную (55.1) к эллипсу (52.2) в точке Мд(хд,уд) (рис. 1). Рис. 1 Фокусы Fi(—с, 0), F?(c, 0) расположены по одну сторону от каса- тельной, так как в (55.1), с учетом условий 0 < £ < 1 и |хо| < а, имеем ~с10 _ 1 _ _ £хо _ | _ £до + а < Q а2 а а ’ cxQ _ exp j _ ех0 - а < Q а2 а а Обозначим через Pi и Рг основания перпендикуляров, опущенных из фокусов эллипса на касательную. Утверждение теоремы будет до- казано, если мы покажем, что Z.F2M0P2 — Z.P2M0Q или, что то же самое, AFiMqPi = Z.F2MQP2 (рис. 1). Пусть hi, h2 - расстояния от фокусов до касательной. Тогда hi -(сх0/а2) - 1 _ а + ехд _ 74 h-2 (схо/а2) - 1 а - ех0 т2 ’ следовательно, AF2M0P2 ~ AFiMqPi (так как оба они прямоуголь- ные), поэтому Z.F1M0P1 = Z.F2MgP2- Доказанной теореме можно дать следующую оптическую интер- претацию: если поместить в один из фокусов эллипса источник света, то лучи после отражения от эллипса соберутся в другом фокусе, так как световой луч отразится от эллипса как от касательной, проведен- ной к эллипсу в точке падения луча.
§ 56. Оптические свойства эллипса, гиперболы и параболы 191 Теорема 56.2. Касательная к гиперболе в произвольной ее точке Mq является биссектрисой внутреннего угла Mq треугольни- ка F1F2M0, где Fi, Fz - фокусы гиперболы. Доказательство. Эта теорема доказывается точно так же, как и предыдущая. Отметим лишь одно отличие (не затрагивая очевид- ные): фокусы Fi и Fz расположены по разные стороны от любой ка- сательной (рис. 2). Теореме 56.2 можно дать оптическое истолкование, аналогичное тому, которое было дано для эллипса. Теорема 56.3. Касательная к параболе есть биссектриса угла между фокальным радиусом MqF точки касания Мо и перпен- дикуляром MqD, опущенным из точки Mq на директрису. Доказательство. Из уравнения (55.3) касательной к параболе у1 — 2рх в точке Мо(то,уо) этой параболы сле- дует, что точка А (рис. 3) пере- сечения касательной с осью Ох имеет кординаты (—iq,0). Следовательно, АО = Xq и AF = АО + OF = хо + 4- р/2. С другой стороны, MqF = MqD — MqO + + CD = Xq + р/2. Таким образом, AF = MqF и, зна- чит, ZFAM0 = ZAMqF. Ho AFAMq — ZDMqA, следова- тельно, ADMqA = Эта теорема имеет следующее оптическое истолкование: если в фокусе параболического зеркала поместить источник света, то лучи, отразившись от зеркала, образуют пучок параллельных лучей. Это свойство используется в конструкции зеркальных прожекторов. 7 Линейная алгебра и аналитическая геометрия
192 Глава XI. Алгебраические линии второго порядка на плоскости §57. Полярные уравнения эллипса, гиперболы и параболы Пусть £ - какая-нибудь из трех линий: эллипс, гипербола или парабола, заданная своим каноническим уравнением. Введем полярную систему координат, приняв за полюс фокус F линии (для эллипса F - левый фокус, для правой ветви гиперболы F - правый фокус, а для левой ветви - левый фокус), полярную ось направим в положительную сторону оси Ох канонической системы координат Оху во всех случаях, кроме левой ветви гиперболы, а в этом случае - в отрицательную сторону оси Ох (рис. 1). Рис. 1 Тогда для любой точки М плоскости ее полярный радиус г со- впадает с фокальным радиусом р(М, F). Согласно директориальному свойству линии £ точка М(х,у) принадлежит £ тогда и только тогда, когда (57.1) р(М, d) £' где е - эксцентриситет линии £. Пусть p(F,d) = т, тогда p(M,d) — = МА = rcostp + т и уравнение (57.1) линии может быть записано в виде ИЛИ (57.2) г = (rcos<p + т)е те г —------------ 1 — е cos <р Для параболы е — 1,т — р, где р - фокальный параметр парабо- лы. Следовательно, в выбранной полярной системе координат пара- бола определяется уравнением г=-^- 1 - cos (57.3) Для эллипса и гиперболы число р = ti2 /а называется фокальным параметром. Из (52.9) и (53.4) следует, что число те в (57.2) совпа-
§ 58. Общее уравнение линии второго порядка 193 дает с фокальным параметром р, так как ( с2\ 2 1 л С 1 те = а — ае = а 1 г \ I2 / at2 b2 - —r- = — = p для эллипса и а2 а 2 / с2 Л те = ае — a = a 1 —т — 11- 7 ab2 Ь2 = = — — р для гиперболы. Это позволяет записать уравнение (57.2) в виде Р 1 — е cos ’ (57.4) где р - фокальный параметр линии, а е - ее эксцентриситет. Поскольку для параболы е = 1, уравнение (57.4) совпадает с уравнением (57.3) параболы. Таким образом, эллипс, гипербола и парабола описываются в полярной системе координат единым уравнением (57.4). Замечание. Проведем из фокуса F (рис. 1) прямую, перпендикулярную оси Ох. Эта прямая пересечет линию £ в двух точках N и Ny. Для точки А, как и для любой точки £, справедливо соотношение (57.1), так что p(N,F) p(N,d) е' Но p(N,d) - p(F,d) = тп, следовательно, p(N,F) = me = p. Таким образом, фокальный параметр линии С совпадает с половиной длины хорды NNy. § 58. Общее уравнение линии второго порядка Пусть Оху - аффинная система координат на плоскости. Алгебра- ическая линия второго порядка определяется уравнением F(x,y) = О, где F(x,y) - алгебраический многочлен второй степени от перемен- ных I, у с вещественными коэффициентами (§31). Этот многочлен принято записывать в виде F(x, у) = апх2 + 2а12ту + a22j/2 4- 2а33х + 2a23y 4- а33, где а2у + а22 + а22 0. В соответствии с этим алгебраическая линия второго порядка определяется уравнением ацт2 4- 2ai2xy 4- a22y2 + 2ау3х + 2a23y 4- a33 = 0, aii + ai2 4- a22 0. ( J Уравнение (58.1) называется общим уравнением алгебраической линии второго порядка на плоскости. Группа слагаемых ацх2 4- +2ау2ху + в22У2 (т.е. одночленов второй степени) называется квадра- тичной частью уравнения (58.1) (или группой старших членов),
194 Глава XI. Алгебраические линии второго порядка на плоскости группа слагаемых 2ацх + 2а2зу - линейной частью, азз - свободным членом. Рассмотренные в предыдущих параграфах эллипс, гипербола и парабола, очевидно, представляют собой алгебраические линии вто- рого порядка. Естественно поставить вопрос, какие еще линии явля- ются линиями второго порядка. Чтобы ответить на него, нужно най- ти такую систему координат, в которой уравнение (58.1) принимает наиболее простой вид (как это было в случае эллипса, гиперболы и параболы). Поиском такой системы координат мы и займемся. Компактная запись общего уравнения. Положим а11 а12 . & _ а13 Й12 0,2-2 ’ 0.23 х У X = Матрица А называется матрицей квадратичной части. В этих обозначениях уравнение (58.1) может быть записано в компактной форме: ХТАХ + 2ЬТ X + а33 = О, А = Ат, А / О. (58.2) В этом нетрудно убедиться, выполнив все умножения в левой части (58.2). Введем новую матрицу ац В = ai2 о,12 ахз а21г 0,23 . 0,13 0,23 0.33 . А ьт Ь ' азз Числа Ii = tr A, 12 = |А|, К3 = линии второго порядка, число К2 = В| называются инвариантами 011 <ИЗ , 0.22 0,23 + - по- 0-13 0.33 0.23 0,33 луинвариантом. Далее нам потребуется несколько дополнительных понятий, относящихся к матрицам. Характеристический многочлен. Характеристическим мно- гочленом матрицы А = (а-ц) G Rnxn называется функция /(А), опре- деленная равенством /(А) = |А-ЛГ|. (58.3) Легко проверить, что: а) если п = 2, то /(А) = (-А)2 + аД—А) + ао, где aj = tr А, ао = |А|; (58.4) б) если п = 3, то /(А) = (—А)3 + а2(-А)2 + aj(-A) + ао, где а2 = tr Л, ai = ан ^21 0,12 ац 0.22 а31 а13 0,22 0,23 0.33 0.32 йзз а0 = I Л|. (58.5) Главным минором матрицы называется минор, расположенный в строках и столбцах с одинаковыми номерами. Нетрудно заметить (см.
§ 58. Общее уравнение линии второго порядка 195 (58.4), (58.5)), что коэффициенты характеристического многочлена связаны с главными минорами матрицы: если п = 2, то ai - сумма главных миноров первого порядка, ао — единственный главный минор второго порядка; если п = 3, то аг, <И, ао - суммы главных миноров первого, второго, третьего порядков соответственно. Матрицы А, В € Rnxn называются подобными, если существует невырожденная матрица Q такая, что А = Q~1BQ. (58.6) Теорема 58.1. Характеристические многочлены подобных матриц совпадают. Доказательство. Действительно, если А — Q~lBQ, то |Л - А/| = \Q^BQ - А/| = - Q~lXIQ\ = \Q~\B - A/)Q| - = |B — A/|. Таким образом, при любом значении А характеристиче- ские многочлены матриц А и В принимают одинаковые значения и, следовательно, совпадают. С л ед стене. У подобных матриц второго порядка совпадают следы и определители. У подобных матриц третьего порядка совпа- дают следы, суммы главных миноров второго порядка и определи- тели. Преобразования общего уравнения. Пусть исходная аффин- ная система координат Оху соответствует началу О и базису е = = (ei, ез)- Переход к новой системе координат О'х'у' означает (§24) перенос начала в точку О'(а,0) и преобразование базиса eQ = е' с матрицей перехода Q. При этом старые координаты X = (х,у)Т свя- заны с новыми X' = (х',у')Т формулами преобразования координат: 1) X — а + X’, где а = (а,0)т, в случае переноса начала; 2) X = QX' в случае преобразования базиса. Исследуем особенности преобразования уравнения линии в каждом из этих случаев. Пусть линия £ в системе координат Оху задана сво- им общим уравнением (58.2). Теорема 58.2. При переходе к новому базису е' = eQ общее уравнение (58.2) преобразуется в уравнение Х'ТА'Х' + 2Ь'ТХ' + а33 = 0, (58.7) где А! = QTAQ, b' = QTb; при этом: 1) знаки инвариантов 1%, Кз не изменяются; 2) в случае, когда е и е' - ортонормированные базисы, инвариан- ты li, I2, Кз и полуинвариант К2 не изменяются. Доказательство. Подставим в уравнение (58.2) вместо старых координат X их выражения через новые координаты X': X = QX'. Тогда в новой системе координат Ох'у' линия L определяется урав- нением X'TQTAQX' + 2bTQX' + а33 = О
196 Глава XI. Алгебраические линии второго порядка на плоскости X'T{QTAQ)X' + 2(QTb)TX' + а33 = 0. Это означает, что в новом уравнении квадратичная часть опреде- ляется матрицей А' = QTAQ, (58.8) а линейная часть - столбцом b' = QTb. Таким образом, общее уравне- ние (58.2) линии £ преобразуется в (58.7). Докажем утверждение п.1. Из (58.8) следует, что |Л'| = |QTAQ\ — | А|- • |Q|2, т.е. I2 = 72|Q|2, где |<?| # 0. Следовательно, sgn/2 = sgn/2. Далее, если Q О О 1 QT о 0 1 и IQI = IQTI = IQ|. Матрица В', соответствующая уравнению (58.7), имеет вид В' - А' Ъ' Ь'т йзз QTAQ QTb bTQ йзз QTBQ. Следовательно, |В'| = |В| • |(?|2 = |В| • |Q|2 и К3 = /C3|Q|2. Таким образом, sgn-Кз = sgnK3. Докажем п.2. Если оба базиса е и е' ортонормированы, то матри- ца перехода Q будет ортогональной матрицей (§24) и QT = При этом матрица Q также будет ортогональной, ибо QTQ = QQT = I, и, следовательно, QT = Q-1. Таким образом, A'=Q~l AQ и В' = Q~XBQ, т.е. пары матриц А' и А, В' и В подобны. Отсюда И из теоремы 58.1 (нее следствия) вытекает, что числа Д = 1гЛ, /2 — Щ, Кз — |-В|, К2 = ai —12 (где dj - сумма главных миноров второго порядка ма- трицы В) при переходе к новому базису не изменяются. Замечание. Отметим, что при переходе к новому базису свобод- ный член не изменяется. Теорема 58.3. При переносе начала координат в точку О'(а, (3) общее уравнение (58.2) преобразуется в уравнение Х'ТАХ' + 2УГХ' 4- а‘33 = 0, (58.9) где b' = b + Аа. а33 = атАа 4- 2Ьта 4- а33, а = (а,/3)т, при этом инварианты. 1\, 12, не изменяются. Доказательство. Подставим в уравнение (58.2) X = X' + а. Тогда (Х'Т + ат) А(Х' 4- а) 4- 2bT(X' 4 а) 4- а33 = 0, или Х'т АХ' 4 Х'т Аа + о? AX' 4 атАа 4 2bTX' 4 2Ьта 4 а33 = 0. (58.10) Заметим, что произведение Х'т Аа есть вещественное число и его мож- но заменить результатом транспонирования, так что Х'т Аа = = (Х'тАа)т = атАтX' — {АарX'. Так как А = Ат, то атАХ' —
§ 58. Общее уравнение линии второго порядка 197 = aTATX' — (Аа)тX'. С учетом этих соотношений уравнение (58.10) может быть записано в виде Х'ТАХ' + 2( Аа + Ь)ТХ' + атАа + 2Ьта + а33 = 0. Это означает, что в новом уравнении квадратичная часть остается прежней, линейная часть определяется столбцом Ь' = Аа + 6, свобод- ный член азз равен атАа+2Ьта+азз- Таким образом, уравнение (58.2) линии £ преобразуется в (58.9). Что касается инвариантов, то неизменность Zj и Z2 очевидна, так как матрица квадратичной части А осталась прежней. Докажем, что Кз не изменяется. Имеем <*п ai2 <*13 <312 <*22 <*23 <*13 <*23 <*33 в' = <*11 <*12 <*12 <*22 <*13 + <*<*Ц + 00-12 <*23 + <*<*12 + 00-22 <*13 + <*<*11 + 00-12 <*23 + <*<*12 + 00-22 а33 где <*33 — enft2 + 2а + а2202 + 2ai3a + 2а23/3 + а33 = — <*зз + <3:ai3 + 00,23 + <*(<*13 4- аац + /Заи) + /?(а23 + <*<*12 + 00,22)- Последнее соотношение означает, что матрица В' получена из матри- цы В с помощью элементарных преобразований: если к третьей строке матрицы В прибавить линейную комбинацию первых строк с коэф- фициентами а, 0, а затем к третьему столбцу прибавить такую же линейную комбинацию первых столбцов, то получится матрица В'. Следовательно, К'3 — |В'| = |В| = Кз. Теорема 58.4. Общее уравнение линии второго порядка, за- данное в прямоугольной декартовой системе координат, переходом к другой прямоугольной декартовой системе координат приводится к одному и только одному из следующих типов уравнений: I. Aiz2 + Ajy2 + ао = 0, где А3А2 0; II. А2у2 + 2Ьох = 0, где A25q / 0; (58.11) III. А2у2 + со = 0, где А2 / 0. Доказательство. Пусть Оху - прямоугольная декартова си- стема координат и линия £ задана в этой системе координат общим уравнением (58.1). Шаг 1 (преобразование базиса). Метод вращений. Покажем, что если ай / 0, то поворотом осей можно привести квадратичную часть уравнения (58.1) к сумме квадратов. Действительно, поворот осей на угол <р приводит к новому базису е' = eQ с матрицей перехода (§24)
198 Глава XI. Алгебраические линии второго порядка на плоскости COSp sin. 99 -smy cos p . Очевидно, QTQ = QQT = I, т.е. Q - ортогональ- ная матрица. Согласно теореме 58.2 при переходе к системе координат {О;е'х.ег) матрица квадратичной части А преобразуется в матрицу А' = COS Ip sin р — sin p cos p an ai2 aj2 0.22 cos p — sin p sin p cos p Q = при этом a'i2 = —ai t cos p sin p — sin2 p + a12 cos2 p -I- a22 cos p sin p — = ai2cos2y> - —(<2.ц - a22) sin2y>. Если ctg2$p = (an - a22)/(2ai2), to a'12 = 0. Следовательно, при пово- роте осей на такой угол р квадратичная часть уравнения преобразу- ется в сумму квадратов и уравнение (58.1) в новой системе координат Ох'у' будет иметь вид а'ц2:'2 + a22y/2 + 2a'13rr' + 2a23j/ + азз = 0. (58.12) При этом в силу теоремы 58.2 инварианты Д, I2, Кз и полуинвариант К2 останутся прежними. Метод, использованный здесь, называется методом вращений. Шаг 2 (перенос начала). Дальнейшее упрощение уравнения (58.12) основано на том, что если в нем содержится ненулевой квадрат какой- либо переменной, то переносом начала можно освободиться от этой переменной в первой степени. Действительно, если a'n / 0, то — aii а'ц#'2 4- 2а'13т' = а'п ( х'2 + 013 \ _ ^13_ = J д." = + а'п ( 2Д13 _Л _ —Г~х = аи / “13 1 _ ' Д'2 — > — апа; “11 J а132 а'ц Таким образом, если а'ц / 0, а22 / 0, то переносом начала х"=а/ + ф, у"=у'±^ au a22 уравнение (58.12) преобразуется в уравнение “ит + а222/ "Г о33 — 0, ОцО22 О» а'132 а232 где а33 = азз-----------}—, т е- в уравнение типа I. а11 а22 Пусть один из коэффициентов а'п или а22 равен нулю. Если а'ц = О, а22 0, то переносом начала
§ 58. Общее уравнение линии второго порядка 199 „и _ .ч , а23 х —х , у =у + — а22 уравнение (58.12) преобразуется в уравнение а22у"2 + 2а'13х" + азз = °. а22 / °> (58.13) где а33 = азз — агз2/а22- Случай, когда а'к 0, а22 = 0, сводится к предыдущему переиме- нованием переменных х =у, у =х (58.14) что соответствует переходу к новому базису с матрицей перехода . Нетрудно проверить, что Q - ортогональная матри- ца, поэтому числа Ц, 13, Кз, Кз при таком переходе не изменяются. Очевидно, что новая система координат получена поворотом осей с последующим отряжением одной из осей относительно другой. Итак, дальнейшее преобразование общего уравнения (58.1) сводит- ся к преобразованию уравнения (58.13). Если в этом уравнении а'13 — 0, то уравнение (58.13) относится к уравнению типа III. Если же а'13 / 0, то 2а'13х" + а33 = 2а'13 (х" + а33/(2а'13)) и перено- Q = о 1 1 о сом начала х'" = х" + а^з/(2а'13), у'" = у" уравнение (58.13) приводится к уравнению а22у"'2 + 2а'13х"' = 0, а22а'13 / О, которое относится к типу II. Отметим, что все промежуточные и окончательная системы коор- динат оставались прямоугольными, так как преобразования базиса с помощью ортогональной матрицы перехода сохраняют свойство ор- тонормированности (§24). Итак, переходом к новой прямоугольной системе координат общее уравнение (58.1) приводится к одному из трех указанных типов уравнений. Перейдем к вопросу о единственности. Для этого найдем инвари- анты I?, Кз для каждого из уравнений (58.11). Имеем для уравнения типа I: Ai О А2 для уравнения типа II: О О О А2 ’ Ai 0 0 В = 0 а2 0 0 0 ао О Ьо О а2 о Ьо О о (58.15) (58.16)
200 Глава XI. Алгебраические линии второго порядка, на. плоскости для уравнения типа Ш: А = 0 О О Л2 0 0 о в = о а2 о . о 0 Со (58.17) Следовательно, 1) 12 / 0 для уравнения типа I; 2) 12 = 0, Кз / 0 для уравнения типа II; 3) 12 = 0, Кз = 0 для уравнения типа III. Эти условия взаимно исключают друг друга, и так как общее урав- нение и уравнения (58.11) имеют одинаковые инварианты 12, Кз, то общее уравнение (58.1) приводится только к одному из трех указан- ных типов уравнений. Уравнения (58.11) называются приведенными уравнениями линии второго порядка. Замечание. Особо отметим, что в прямоугольных координатах коэффициенты Ai и Л2 приведенных уравнений являются инвариан- тами линии, так как Ах + А2 — li, AiA2 — 12 (58.18) и, следовательно, Ai и А2 являются корнями характеристического многочлена матрицы Л: А2 - ДА +12 = 0. (58.19) § 59. Классификация линий второго порядка на плоскости Канонические уравнения. Теорема 59.1. Общее уравнение (58.1) линии второго порядка, заданное в прямоугольной декартовой системе координат, определяет одну и только одну из девяти линий, для каждой из ко- торых существует прямоугольная система координат, в которой уравнение этой линии имеет следующий вид: - мнимый эллипс;
§59. Классификация линий второго порядка на плоскости 201 3> ?+&=° I2 у а2 Ь2 6) у2 = 2рх (р > 0) 7) у2 = а2 (а / 0) 8) у2 = -а2 (а / 0) 9) у2-0 - пара мнимых пересекающихся прямых; - гипербола; - пара пересекающихся прямых; - парабола; - пара параллельных прямых; - пара мнимых параллельных прямых; - пара совпадающих прямых. Доказательство. Пусть общее уравнение (58.1) переходом к новой прямоугольной декартовой системе координат преобразова- лось в приведенное уравнение. Рассмотрим все возможные при этом варианты. Если 12 7^ 0, то уравнение (58.1) преобразуется в приведенное урав- нение типа I: Ахх2 + А2у2 + а0 = 0, (59.1) где Л1Л2 / 0. Для этого уравнения согласно (58.15) Л = А] 4-А2, I2 — А] Аг, Аз — АхАгао- (59.2) В зависимости от знаков Ai, Аг, ао уравнение (59.1) может быть записано по-разному. 1. Если А^г > 0, А;а0 < 0, т.е. 12 > 0, 71А3 < 0, (59.3) то простейшие преобразования приводят уравнение (59.1) к равно- 2 2 2 2 ЗГ У , % У , 9 сильному уравнению-----——I------— = 1 или —х- + -rr = 1, где а = —ао/Ai —о^/л2 о* = ——, сг = ——. В этом уравнении можно считать, что а > о > 0, Ау Л2 так как в противном случае достаточно переименовать переменные, как это было сделано в (58.14). Мы получили уравнение 1, известное нам как каноническое уравнение эллипса. 2. Если AiА2 > 0, AjOo > 0, т.е. 72 > 0, 7iA3 > 0, (59.4) то, поступая аналогично, приходим к уравнению 2. Ясно, что нет ни одной точки плоскости, удовлетворяющей это- му уравнению. Принято говорить о нем как об уравнении мнимого эллипса.
202 Глава XI. Алгебраические линии второго порядка на плоскости 3. Если А1А2 >0, ао = 0, т.е. 12 >0, К3 = 0, (59.5) то уравнение (59.1) эквивалентно уравнению 3, где а2 = |Aj| г, 62 = 1А2Г1- Ясно, что только начало координат удовлетворяет этому уравне- нию. Принято говорить о нем как об уравнении пары мнимых пере- секающихся прямых (или вырожденного эллипса). 4. Если А1А2 <0, ао 0, т.е. 12 <0, К3 ± 0, (59.6) то уравнение (59.1) эквивалентно ническое уравнение гиперболы. 5. Если АхАг <0, ао = 0, т.е. уравнению 4. Это известное кано- 12 <0, Кз = 0, (59.7) то уравнение (59.1) эквивалентно уравнению 5. Оно определяет пару Ь пересекающихся прямых у = ±—х. а Рассмотренные линии образуют первую группу линий второ- го порядка на плоскости. Ими исчерпываются все линии, которые определяются приведенными уравнениями типа I, т.е. случаем, когда 6. Если 12 = 0, Кз 0, то уравнение (59.1) преобразуется в при- веденное уравнение типа II: Х2у2 4- 2Ьох — 0, где АгЬо # 0- Для этого уравнения согласно (58.16) Л = Л2, h =0, Кз = -А2Ь2 / 0. Уравнение (59.8) эквивалентно уравнению у2 = 2рх, где р — —Ъо/Х2. В этом уравнении можно считать, что р > 0, так как в противном случае достаточно выполнить отражение оси Ох от- носительно оси Оу: х' = —х, у' = у, что соответствует переходу к новому базису с матрицей перехода Q = ортогональности приводит к ортонормированному базису и не меняет инвариантов. Итак, мы получили уравнение 6, известное как канони- ческое уравнение параболы. Если 12 — 0, Кз = 0, то уравнение (59.1) преобразуется в приве- денное уравнение типа 1П: (59.8) (59.9) -1 0 0 , которая в силу 1 Аг у2 + Со — 0, (59.10)
§ 59. Классификация линий второго порядка на плоскости 203 где Аг 0. Для этого уравнения согласно (58.17) /1 = Л2, 12 =0, К3 = 0, К2 = Л2со. (59.11) Линии этой группы определяются полуинвариантом К2. Как сле- дует из теоремы 58.2, преобразования базиса с помощью ортогональ- ной матрицы перехода не изменяют К2. Лемма. Если 72 — К3 = 0, то полуинвариант К2 не изменя- ется при параллельном переносе. Доказательство леммы. Не изменяя числа К2, преобразуем общее уравнение (58.1) в уравнение (58.12), в котором a'i2 = 0. Для этого уравнения д? _ а'п 0 0 а22 Так как 12 = 0, то а'ца22 = 0. Поэтому одно из чисел а'п или а22 равно нулю. Не изменяя инвариантов, можно считать (см. обсуждение (58.14)), что а'ц = 0. Тогда ’ 0 о . а13 В' = 0 а(3 а22 а23 а2з азз . Но К3 = 0, поэтому azi3 = 0 и уравнение (58.12) имеет вид а'22у'2 + ^а2зУ' + азз — 0, (59.12) при этом ’ 0 0 0 В' = 0 а22 а23 0 ' а23 ®33 . К2 — К2 — о2газз ^гз- (59.13) При параллельном переносе х.' = х" + а, у' — у" + (3 уравнение (59.12) преобразуется в уравнение а'22У"2 + 2(/Зд22 + о.2з)у" + 2/За23 + азз = 0, для которого В" '00 0 0 а22 0а22 Т а2з 0 /За22 Т <12з Дзз* <122/^ -|- 2а23/3 К2 = а22(а33 + о.'22(32 + 2а'23/3) - (/За22 + а'23)2 = а22а33 - а'23. Из (59.13) следует, что К2 = К2. Лемма доказана. Продолжим доказательство теоремы и вернемся к уравнению (59.10). Отметим, что согласно лемме полуинварианты К2 в уравне- ниях (58.1) и (59.10) совпадают.
204 Глава XT. Алгебраические линии второго порядка на плоскости 7. Если A2cq < 0, т.е. К2 < 0, (59.14) то уравнение (59.10) эквивалентно уравнению 7 (где а2 = — cq/X2 > 0), которое определяет пару параллельных прямых: у = а и у = —а. 8. Если А2со > 0, т.е. К2 > 0, (59.15) то уравнение (59.10) эквивалентно уравнению 8 (где а2 = со/А2 > 0). Ясно, что ни одна точка плоскости не удовлетворяет этому уравне- нию. Принято говорить о нем как об уравнении пары мнимых парал- лельных прямых. 9. Если со = 0, т.е. К2 = 0, (59.16) то уравнение (59.10) эквивалентно уравнению 9, которое определяет пару совпадающих прямых, у = 0 и у — 0. Условия (59.3)-(59.7), (59-9), (59.11), (59.14)-(59.16) исчерпывают все варианты линий второго порядка на плоскости и взаимно ис- ключают друг друга. Следовательно, общее уравнение (58.1) опре- деляет одну и только одну из девяти перечисленных линий. Для каждой из этих линий найдена прямоугольная декартова си- стема координат, в которой уравнение линии имеет вид 1-9. Эти урав- нения называют каноническими уравнениями линий второго порядка. Линии, для которых 12 > 0, называются линиями эллиптического типа; 12 < 0 - гиперболического типа; 12 — 0 - параболического типа. Замечание. Если общее уравнение (58.1) линии второго порядка задано в прямоугольной декартовой системе координат, то канониче- ское уравнение линии может быть найдено по инвариантам, так как согласно (58.18) и (58.19) коэффициенты Ai, А2 приведенных уравне- ний являются корнями характеристического многочлена матри- цы А: А2 - ДА + 12 = 0. При этом если Ai < А2, то в силу (59.2), (59.9), (59.11) _ К3 .2 _ К3 _ К2 a°-~h' Результаты проведенных исследований сведены в следующую таб- лицу.
§ 59. Классификация линий второго порядка на плоскости 205 Приведенное уравнение Но- мер Каноническое уравнение линии Название линии Признак линии Aix2 4- А2у2 + = 0t h А1А2 0 1 Р |Н IV + О’ * |*е V “|м о И Эллипс Z2 > 01 ЦК3 <0 2 2 2 — + ^- = -1 а* 6’ Мнимый эллипс Z2 > 0, ЦКз > 0 3 2 2 2-+ =0 Пара мнимых пересекаю- щихся прямых z2 > 0, Кз =0 4 2 2 5_ _ =1 а» 62 Гипербола /2 < 0, Кз # 0 5 — - = 0 а3 Ь2 Пара пересе- кающихся прямых h < 0, К3 =0 Л1<2±2у/-^1 = 0, ЛКз/0 6 у2 = 2pz, Р > о Парабола /2 = 0, Кз / 0 111/2 + у~ = 0, 11 Л / о 7 У2 = а2, а / 0 Пара парал- лельных прямых z2 — 0, Кз = 0i К2 < 0 8 у2 = — д2, а /- 0 Пара мнимых параллель- ных прямых V II II о о-° 9 У2 = 0 Пара совпа- дающих прямых о°° II И И Метод Лагранжа. Теорема 58.4 о приведенных уравнениях оста- ется справедливой и в аффинной системе координат, так как тип при- веденного уравнения определяется только знаками инвариантов 12, Кз, которые в силу теоремы 58.2 сохраняются при преобразованиях аффинной системы координат. Вместо вычисления инвариантов или метода вращений можно использовать метод выделения полных ква- дратов (метод Лагранжа), который состоит в следующем. 1. Пусть в общем уравнении (58.1) дц / 0. Выделим полный ква- драт в группе членов, содержащих переменную х: ацх2 + 2а12ху + 2ai3i = дц \ 2 / \ 2 012 \ ( <112 \ X Ч------у + Д13 I — Дц I --------У + Д13 ) “11 / \ац / Положим I а12 X — X Ч-----У ч- Д13- вы (59.17)
206 Глава XI. Алгебраические линии второго порядка на плоскости Тогда уравнение (58.1) примет вид а^х'2 + а22у2 + 2а23у + а33 = 0. (59.18) Если а22 7^ 0, то положив 1/ = у+ф, (59.19) а22 приводим уравнение (59.18) к уравнению ацх'2 + а22у2 4- а33 = 0, аца22 0, (59.20) которое является приведенным уравнением типа I. Преобразования координат (59.17), (59.19) определяют переход к новому базису с по- мощью матрицы перехода Q12 " Яц 1 и переноса начала. Согласно теоремам 58.2 и 58.3 знаки инвариантов 12, К3 в уравнениях (58.1) и (59.20) совпадают. Если в уравнении (59.18) а22 — 0, то: а) в случае когда а'23 = 0, уравнение (59.18) является приведенным уравнением типа Ш; б) в случае когда а'23 Ф 0, положив 2^23 приводим уравнение (59.18) к уравнению ацт'2 4- 2а'13у' = 0, аца'13 0, которое является приведенным уравнением типа П. 2. Пусть в общем уравнении (58.1) ац = 0, / 0. Поступая так же, как и в п.1 (с точностью до названия переменных), освобождаемся от слагаемого Ча^ху и линейной части (если это возможно) и прихо- дим к приведенным уравнениям, не изменив знаков инвариантов 72, К3. 3. Пусть в общем уравнении (58.1) ац = 0, а22 = 0. Тогда ai2 0. Положив х = х1 -I- у', у = х' — у', (59.21) сводим этот случай к уже рассмотренным. Отметим, что преобразова- ния координат (59.21) отвечают переходу к новому базису с матрицей 1 11 перехода Q — । . Так как приведенные уравнения (58.11) определяются лишь зна- ком инвариантов 12, Кз, то в результате выполненных преобразований общее уравнение (58.1) приведется к одному и только одному из урав- нений (58-11). С помощью метода Лагранжа легко устанавливается тип линии, однако не может быть получено каноническое уравнение.
Глава XII. Линейное пространство над произвольным полем В гл. IV мы рассматривали вещественные линейные пространства. Веществен- ными они назывались потому, что операция умножения на число предусматривала умножение вектора на вещественные числа. В §43 мы уже отмечали, что все свой- ства линейного пространства остаются в силе, если поле вещественных чисел R заменить произвольным полем Р. В этой главе воспроизводится известное опре- деление линейного пространства для случая произвольного поля, напоминаются уже известные факты и рассматриваются новые. § 60. Определение и терминология Пусть дано поле Р. Непустое множество V называется линейным или векторным пространством над полем Р, если на этом множе- стве определены внутренний закон композиции V х V —» V, называ- емый сложением, и внешний закон композиции Р х V —> V, называе- мый умножением на число из поля Р, удовлетворяющие следующим аксиомам: для любых a, b, с € V и а, /3 € Р 1) а-\-Ъ~Ь-\-а~, 2) (а 4- 6) 4- с — а 4- (b -I- с); 3) существует элемент в € V такой, что а + в = в + а = а; 4) для любого элемента a G V существует элемент —a G V такой, что а + (—а) = (—а) + а = в; 5) 1 а — а; 6) а(/3а) = (а/3)а; 7) (а 4- /3)а — аа + [За: 8) а(а 4-6) = аа 4- ab. Линейное пространство над полем R называется вещественным линейным пространством, а над полем С - комплексным. Два вектора х и у линейного пространства называются коллине- арными, если они отличаются лишь числовым множителем, т.е. либо х = ay, а € Р, либо у = [Зх, (3 € Р. Примеры. 1. Арифметическое пространство Рп - линейное прос- транство над полем Р. Как и в случае R”, здесь Рп = {я — (®i,. • •, in)|n € Р, k = l,n} с операциями: если х — (ii,...,in) и у = = (.У1, ---'Un), а € Р, то х + у = (li + У},. ,хп + уп), ах = (aii,...,axn). 2. В частности, арифметическое пространство Сп есть комплекс- ное линейное пространство. В таком пространстве арифметические векторы умножаются на комплексные числа. Однако можно было бы ограничиться умножением только на вещественные числа, при этом
208 Глава ХП. Линейное пространство над произвольным полем результат умножения, несомненно, останется арифметическим век- тором из Сп. Это означает, что внешний закон композиции можно ввести и как умножение на вещественные числа, т.е. как отображе- ние RxCn Сп. Символом Сд будем обозначать множество Сп, в котором внешний закон композиции определен как R х Сп —> С71. Нетрудно проверить, что Cg - вещественное линейное пространство. В частности, само поле С можно рассматривать как вещественное ли- нейное пространство Cr . 3. Аксиомы линейного пространства выявляют алгебраические свойства многих классов функций, часто встречающихся в математи- ческом анализе: например, С[0,1] - множество непрерывных функций на отрезке [0,1]; £>[0,1] - множество всех дифференцируемых функ- ций на отрезке [0,1]; С1 [0,1) - множество всех функций, непрерыв- ных вместе с первой производной на отрезке [0,1]. Хотя у каждого из перечисленных множеств имеются и другие замечательные свойства, все они охватываются единой алгебраической схемой, аксиоматизиру- емой определением линейного пространства. Нетрудно проверить, что эти множества являются вещественными линейными пространства- ми относительно обычных операций сложения функций и умножения функции на число. Линейные пространства функций принято назы- вать функциональными пространствами. Точки в линейном пространстве. В геометрических простран- ствах мы имели дело и с векторами, и с точками: каждая упорядо- ченная пара точек А и В однозначно определяла вектор а = аД каждый вектор а мы могли отложить от любой точки С, и это одно- значно определяло точку D - конец вектора а, отложенного от точки С. Если зафиксировать точку О как начало любого вектора простран- ства, то каждому вектору можно поставить в соответствие точку, ко- торая является его концом. Это приводит к взаимно однозначному соответствию между векторами пространства и точками, т.е. к воз- можности “отождествить” векторы и точки пространства. Обобщение этого факта для произвольного линейного простран- ства приводит к понятию аффинного пространства. Аффинным (или точечно-аффинным) пространством над линей- ным пространством V называется множество S элементов, называе- мых точками, для которого заданы а) линейное пространство V над полем Р и б) отображение v. S х S —> V, ставящее в соответствие каждой упорядоченной паре точек А, В € S вектор v(A, В) € V и удовлетво- ряющее следующим аксиомам: 1) для любой точки А G S и любого вектора а € V существует единственная точка В G S, для которой и(А.В) = а;
§ 60- Определение и терминология 209 2) для любых трех точек А, В, С € S имеет место равенство v(A,B) + v(B,C) = v(A,C). Обозначение: вектор и(Л,В) обозначается символом А&. Таким образом, A^ + В^ = А&. Из аксиом аффинного пространства следует, что а) А& = 0 тогда и только тогда, когда А = В; б) лё = -в1. Размерностью аффинного пространства S называется размерность линейного пространства V. Примеры. 1. Геометрические пространства Vi, V}, Vs являются аффинными пространствами над самими собой. 2. Любое линейное пространство V можно рассматривать как аф- финное пространство над самим собой. Для этого достаточно векторы назвать точками и определить отображение v: V х V —> V следующим образом: и (а, Ь) = а — Ь. (60.1) 3. Любое аффинное пространство S можно рассматривать как ли- нейное. Для этого зафиксируем какую-нибудь точку О пространства S и назовем ее началом. Тогда каждой точке А € S можно поставить в соответствие вектор оХ , называемый радиус-вектором точки А отно- сительно начала О. Множество радиус-векторов всех точек простран- ства S и составляет линейное пространство V. Более того, имеет место Теорема 60.1. Отображение <р: S -ь V, определяемое пра- вилом ___ <р(А) = ОХ, является биекцией, сохраняющей операцию и аффинного простран- ства, т.е. 1?(Л, В) = v(<p(A), <р(В)). (60.2) Доказательство. Биективностьотображения непосредствен- но вытекает из аксиомы 1. Что касается равенства (60.2), то согласно определению (60.1) оно эквивалентно вытекающему из аксиомы 2 ра- венству А$ = О$ -оХ. Теорема60.1 позволяет ‘‘отождествить” аффинные и линейные про- странства. Единственное отличие аффинных пространств от линей- ных состоит в том, что в линейном пространстве имеется единствен- ное начало в - нулевой вектор, в то время как в аффинном простран- стве в качестве начала можно взять произвольную точку.
210 Глава ХП. Линейное пространство над произвольным полем Замечание. В дальнейшем, говоря о линейном пространстве, будем иметь в виду, что его можно рассматривать как аффинное пространство с фиксирован- ным началом. Тогда в нашем распоряжении будут и векторы, и точки, как концы векторов. §61. Линейная зависимость. Ранг и база системы векторов Понятие линейной зависимости и связанные с ней утверждения рассматрива- лись в главе IV (§ 14-16) и относились к вещественным линейным пространствам. Все определения, а также теоремы и их доказательства остаются в силе и в произ- вольном линейном пространстве. Введем новые понятия. В дальнейшем, употре- бляя термин “линейное пространство”, будем иметь в виду линейное пространство над произвольным полем Р, не оговаривая это дополнительно. Будем рассматривать конечные системы ai,...,aic векторов ли- нейного пространства. Линейно независимая подсистема системы векторов, через ко- торую линейно выражается любой вектор системы, называется базой этой системы векторов. Примеры. 1. В системе из нулевых векторов нет ни одной базы, так как любая ее подсистема линейно зависима. 2. Базисные строки матрицы согласно теореме о базисном миноре образуют базу системы строк, рассматриваемых как векторы ариф- метического пространства. Это же относится и к базисным столбцам. 3. В системе трех неколлинеарных векторов плоскости Vj любая пара векторов образует базу. Обратим внимание на то, что в этих примерах система векторов может обладать не единственной базой, но при этом все базы одной системы состоят из одинакового числа векторов. Теорема 61.1. Подсистема системы векторов является базой системы векторов тогда и только тогда, когда образует мак- симальную линейно независимую подсистему. Доказательство. Необходимость. Пусть в системе векто- ров aj,..., а,.,..., а* подсистема щ,..., От образует базу (здесь для упрощения записи в качестве подсистемы взяты первые г векторов, что, как будет видно из доказательства, не нарушает общности рассу- ждений) . Тогда любая большая подсистема будет линейно зависимой в силу теоремы 16.2, так как любой ее вектор линейно выражается через базу а\,...,аг. Таким образом, база образует максимальную линейно независимую подсистему системы векторов. Достаточность. Пусть aj,... ,Ог - максимальная линейно не- зависимая подсистема системы векторов а\,..., аГ,..., а^ . Тогда для любого вектора аг, i = l,k, подсистема ai,...,ar,ai линейно зави- сима (если i < г, то как подсистема, содержащая два одинаковых вектора; если же г > г, то как подсистема из г + 1 > г векторов). В силу теоремы 14.6 вектор а, линейно выражается через aj,..., аг. Таким образом, aj,..., о,- - база.
§ 62. Базис и размерность 211 Следствие 1. Все базы одной системы векторов состоят из одинакового числа векторов, равного максимальному числу линейно независимых векторов системы. Число векторов базы называется рангом системы векторов. Оче- видно, ранг системы векторов равен максимальному числу линейно независимых векторов системы. Обозначение: rg(ai,-..,а„). Две системы векторов линейного пространства называются экви- валентными, если любой вектор каждой из этих систем линейно выра- жается через другую систему. Из определения следует, что база си- стемы векторов эквивалентна самой системе. Теорема 61.2. Если система векторов а\,...,ак линейно выражается через bi,... ,bm , то rg(aj,. - •, a*) < rg(bi,..., fem). Доказател ьство. Пусть ai,... ,аг и b^,... ,bs - базы рассмат- риваемых систем. Из условия теоремы и транзитивности свойства “ли- нейной выражаемости” следует, что база ai,..., От первой системы ли- нейно выражается через базу 6;,..., Ья второй. Тогда г < s, так как в противном случае, если г > s, система сц,... ,Ог была бы линейно зависимой в силу теоремы 16.2. Следствие 2. Ранги эквивалентных систем совпадают. Следствие 3. Эквивалентные линейно независимые системы векторов состоят из одинакового числа векторов. § 62. Базис и размерность Говорят, что система векторов ei,..., еп линейного пространства V порождает пространство V, если любой вектор х € V является линейной комбинацией ej,..., е^ . Упорядоченная система векторов ei,..., еп линейного простран- ства V называется базисом пространства V, если она линейно не- зависима и порождает V. Очевидно, что это определение совпадает с определением базиса, данным в §17 для вещественного линейного пространства. Теорема 62.1. Любые два базиса линейного пространства состоят из одинакового числа векторов. Это утверждение вытекает из эквивалентности двух базисов ли- нейного пространства и следствия 2 (§61). Итак, число векторов базиса не зависит от самого базиса и од- нозначно определяется самим пространством. Ответ на вопрос, что представляет собой это число, дает теорема 17.1, справедливая и в пространстве над произвольным полем. Напомним, что число векторов базиса линейного пространства V называется размерностью пространства V и обозначается символом dimV. Размерность нулевого пространства по определению считает- ся равной нулю. Из теоремы 17.1 следует, что размерность линейного пространства совпадает с максимальным числом линейно независи-
212 Глава XII. Линейное пространство над произвольным полем мых векторов этого пространства. Линейное пространство размерно- сти п, где n € N, называется n-мерным. Нулевое пространство и п-мерные пространства называются конечномерными. Линейное пространство называется бесконечномерным, если для любого числа k € N в пространстве существует к линейно незави- симых векторов. Пример бесконечномерного пространства дан в §17 (пример 5). В курсе линейной алгебры изучаются лишь конечномер- ные линейные пространства. Теорема 62.2 (о неполном базисе). В n-мерном прост- ранстве любую линейно независимую систему из к, где к < п, век- торов можно дополнить до базиса. Доказательство. Пусть в1,...,е* - линейно независимая си- стема векторов пространства V. Так как к < п, то в силу теоре- мы 17.1 система векторов ei,... ,е* не является базисом V и, следова- тельно, не порождает всего пространства V. Пусть вектор € V не является линейной комбинацией ei,...,е*, тогда система векторов й], ... ,efc,e/c+i линейно независима (в силу теоремы 14.6). Если к + 1 = п, то эта система векторов образует базис пространства V; если же к -I-1 < п, то аналогичным образом построим линейно неза- висимую систему из 2 векторов. За п— к таких шагов мы построим искомый базис ei,..., е^,..., еп. Точно так же, как и в §17, определяются координаты вектора в базисе и матрица перехода от одного базиса к другому. При этом все факты, связанные с этими понятиями, остаются в силе и в общем случае, так как их доказательства опираются на те свойства веще- ственных чисел, которые имеют место в любом поле.' Напомним эти факты. 1°. Разложение вектора по базису единственно. 2°. Координаты вектора обладают свойством линейности. 3°. При переходе от базиса е к базису f = eQ координаты вектора х изменяются по следующему закону: хе = Qxf. Примеры. 1. В арифметических пространствах Рп, Rn, Сп еди- ничные векторы (14.6) образуют базис (§17, пример 2). Этот базис принято называть ес7пественным. Координаты любого вектора а = — (ai,...,an) в естественном базисе совпадают с компонентами а\,...,ап этого вектора. 2. В арифметическом пространстве CJJ векторы (14.6), очевидно, не могут быть базисом, так как умножением этих векторов только на вещественные числа нельзя получить любой комплексный арифмети- ческий вектор a = (ац + i$i, -.., an + Д?п), где a^,/3* € R, k = 1,n. Добавим к векторам (14.6) еще п векторов: Д = (г,0,...,0), /2 = (0, г,... ,0)-/„ = (0,0,...,г). Покажем, что система векторов ei,..., еп, Д,..., /п образует ба- зис пространства С£. Действительно, лицейная комбинация этих век- торов с вещественными коэффициентами 0^,(3^ имеет вид
§ 63. Изоморфизм линейных пространств 213 п п + ^0kfk = («1 +i0i,-..,an+i(3n) (62.1) t=l i=l и равна нулевому вектору в = (0,..., 0) тогда и только тогда, когда <^к + i0k — 0, к = 1,п, т.е. 0^ = (Зк = 0, к — 1, п. Следовательно, векторы ei, • •, en, /j,..., линейно независимы. Они порождают все пространство Cg, так как любой вектор (cti + i(3i,...,an + if3n) из Cg согласно (62.1) является линейной комбинацией этих векторов с вещественными коэффициентами 0ц,..., аПУ /Зу,..., /Зп. Итак, dim Cg = 2n. § 63. Изоморфизм линейных пространств Два линейных пространства V) и Vj над общим полем Р называг ются изоморфными, если существует биективное отображение tp : V) —> Vj, которое сохраняет законы композиции, т.е. если для любых векторов ас, у 6 Vj и любого числа a G Р 1) у>(:с + у) = </j(z) +<р(у); 2) tp(ax) = сир(х). Обозначение: Ц = . Само отображение р называется изо- морфизмом линейных пространств. Примеры. 1. Геометрические пространства У), V2, V3 векторов на прямой, на плоскости и в пространстве изоморфны арифметиче- ским пространствам R1, R2 и R3 соответственно. Действительно, по- ставим в соответствие каждому вектору х G Vn набор его коорди- нат в каком-либо базисе е, т.е. арифметический вектор хс € R", где п — 1,2,3. Это соответствие взаимно однозначно и сохраняет законы композиции, так как координаты вектора обладают свойством линей- ности (§17). 2. V2 = CR. 3. Pmxn = Ртп и, в частности, Rmxn = Rmn. Отметим простейшие свойства изоморфных пространств. 1°. Отношение изоморфизма есть отношение эквивалентности на множестве всех линейных пространств над полем Р. 2°. В изоморфных пространствах а) образ (и прообраз) линейной комбинации векторов есть ли- нейная комбинация образов (прообразов) с теми же коэффициента- ми; б) образ (и прообраз) нулевого вектора есть нулевой вектор; в) образ (и прообраз) линейно независимой системы векторов образует линейно независимую систему; г) образ (и прообраз) базиса есть базис. Доказательства этих свойств опираются лишь на определение и элементарные свойства рассматриваемых объектов. Мы предоставля- ем их читателю.
214 Глава XII. Линейное пространство над произвольным полем Несмотря на простоту формулировок, уже эти свойства говорят о том, что изо- морфные линейные пространства, даже самой различной природы, с точки зрения свойств линейного пространства неразличимы. Это позволяет многие свойства ли- нейных пространств изучать на линейных пространствах простой структуры. К этой возможности мы будем неоднократно прибегать, проводя все вычисления в арифметических пространствах, а “рисуя” - в геометрических. Теорема 63.1 (критерий изоморфизма). Два линейных пространства над общим полем изоморфны тогда и только тогда, когда их размерности совпадают. Доказательство. Необходимость вытекает из свойства “г” изоморфных пространств. Достаточность. Пусть Vi и V2 - линейные пространства над полем Р и пусть dim Ц = dim V% = n. Выберем в этих пространствах по базису: пусть ei,..., еп - базис Vi, а /1,..., /п - базис V2. Построим отображение : Vi —> У2, поставив в соответствие каждому вектору х — £2"=1 otid € Vi вектор у = 52"=1 € У2 (т.е. вектор, который имеет те же координаты, что и вектор я). В силу единственности разложения вектора по базису отображение ф биективно. При этом Ф - изоморфизм, так как координаты вектора обладают свойством линейности. Следствие. Любое п-мерное вещественное пространство изо- морфно арифметическому пространству R”, а любое п-мерное ком- плексное пространство - арифметическому пространству Сп. Изоморфизм ф: V —> W, построенный при доказательстве теоре- мы 63.1, определяется двумя базисами ех,..., еп и /j,..., fn этих про- странств и переводит вектор х — х^ек в вектор.у = x^fk, имеющий в базисе /1,..., fn те же координаты, что и вектор х в ба- зисе ei,...,еп. В частности, если ej,...,еп - базис пространства V над полем Р и /1,... ,fn ~ естественный базис арифметического про- странства Рп, то отображение ф: V -> Рп, которое каждому век- тору х = Y^1k=ixkek ставит в соответствие арифметический вектор (ii,... ,хп) пространства Рп, является изоморфизмом. Этот изомор- физм называется координатным изоморфизмом, определенным бази- сом ei,..., еп. Координатный изоморфизм “заменяет” линейное пространство (сколь угодно экзотической природы) конкретным арифметическим пространством и сводит решение многих задач теории линейных про- странств к вычислениям в поле. § 64. Линейные подпространства. Линейная оболочка Напомним определение линейного подпространства, данное в §18 (оно остается неизменным и в случае линейного пространства над произвольным полем). Под- множество L линейного пространства V над полем Р называется линейным под- пространством пространства V, если оно само является линейным простран- ством относительно законов композиции в V . Другое определение линейного под- пространства, эквивалентное этому, устанавливается известной теоремой 18.1, ко- торая имеет место и в общем случае.
§ 64. Линейные подпространства. Линейная оболочка 215 Как было установлено в §30, множество всех решений однородной системы уравнений Ах = 0 (64.1) с п неизвестными образует линейное подпространство арифметического простран- ства Rn (или Рп в общем случае, когда А € pmxny Цр0 это подпространство £ говорят, что оно задано однородной системой (64.1), и записывают в виде L : Ах = 0. (64.2) Другой способ задания линейного подпространства дает понятие линейной оболочки. Пусть ai,..., а* - система векторов линейного пространства V над полем Р. Линейной оболочкой системы векторов ai,..., а* называет- ся множество всевозможных линейных комбинаций этих векторов. Го- ворят также, что линейная оболочка натянута на векторы ау,..., а*. . Обозначение: £(ai,... ,а*). Итак, f к ___ £(ai, .. ,afc) = < а = °4ai I ai € Р, г — 1,Лг > . I i=i J Из определения следует, что каждое конечномерное пространство является линейной оболочкой векторов своего базиса. В частности, линейное подпространство, заданное однородной системой (64.2), яв- ляется линейной оболочкой фундаментальной системы решений (§30). Теорема 64.1. Если ai,...,а^ - векторы линейного прост- ранства V, то £(ai,... , a^) является линейным подпространством пространства V. Это утверждение вытекает из теоремы 18.1, так как для линейной оболочки £(ai,... , a^) обе импликации имеют место. Итак, линейная оболочка £(ai,...,a^j _ это линейное подпрост- ранство, которое порождается векторами щ,..., а* . Теорема 64.2. Дее системы векторов линейного прост- ранства эквивалентны тогда и только тогда, когда их линейные оболочки совпадают. Доказательство. Необходимость. Пусть системы векторов ai,...,at и 61,..., Ьт эквивалентны. Тогда £(ai,...,a*) = = £(6i,..., bm), так как для этих множеств, как легко проверить, имеет место двустороннее вложение. Достаточность очевидна. Следствие!. Линейная оболочка системы векторов совпадает с линейной оболочкой своей базы. Следствие 2. Размерность линейной оболочки системы век- торов равна рангу этой системы: dim £(ai,..., afc) = rg(ai,..., afc). (64.3) Теорема 64.3 (о монотонности размерности). Размер- ность линейного подпространства не превосходит размерности пространства. Подпространство той же размерности, что и все пространство, совпадает с пространством.
216 Глава XII. Линейное пространство над произвольным полем Доказательство. Пусть L - линейное подпространство про- странства V, dimL — к, dim V = п. Тогда к < п, так как в противном случае в n-мерном пространстве V существует к, где к > п, линейно независимых векторов (например, векторы базиса L). Пусть к — п и ei,...,еп - базис L. Так как dimV = п, то векторы ei,...,en образуют базис V (§17, утверждение 1). Таким образом, L = V — = £(еь...,еп). § 65. Сумма и пересечение линейных подпространств Пусть L- линейные подпространства линейного прост- ранства V. Суммой подпространств Li,...,Lk называется множе- ство всевозможных векторов х, представимых в виде х = Х{ + ... -I- хк , (65.1) где Xi е L{, i = 1,к. Обозначение: Li 4-... + £*, или 52i= i Итак, к __ 52 Li = {х = Xi 4- ... + Xk | Xi e Li, i — 1, к} . 1=1 Представление (65.1) вектора x называется разложением вектора х по подпространствам L},... Лк • Пересечением подпространств Li,... ,Lk называется множество Li П ... П Lk = {х € V | х е Li, г = 1, к}. Заметим, что пересечение подпространств не пусто, так как всегда содержит нулевой вектор в пространства. Теорема 65.1. Сумма и пересечение подпространств ли- нейного пространства V являются линейными подпространства- ми пространства V. Это утверждение вытекает из теоремы 18.1, так как для 52i=i и П*=1 Li справедливы обе импликации. Заметим, что каждое из подпространств Li, i = 1,к, а также их пересечение являются линейными подпространствами суммы Li 4- -----1- Lk, а пересечение Li П ... РLk - линейным подпространством каждого из Li, г = 1, к. Теорема 65.2. Сумма линейных подпространств есть ли- нейная оболочка совокупности базисов слагаемых подпространств. Доказательство. Пусть ei,... ,ет, ,9i, , 9г - ба- зисы подпространств Li,Li,..., Lk соответственно. Положим W = = £(ei,... ,em,/i,... ,/3,... ,5i,... ,&). Тогда W = Li + • • 4- Lk, так как для этих множеств, как нетрудно проверить, имеет место дву- стороннее вложение. Следствие. Размерность суммы линейных подпространств рав- на рангу совокупности базисов слагаемых подпространств:
§ 65. Сумма и пересечение линейных подпространств 217 к dim 52 A = rg(eb..., em, Д,..., fs,... ,gi,..., gt). 1=1 Это утверждение вытекает из теоремы 65.2 (с учетом теоре- мы 64.3). Теорема 65.3- Для любых двух линейных подпространств L\ и L2 линейного пространства V имеет место соотношение dim(Li + L2} = dimLi 4- dimL2 — dimLi Г) Т2 (65.2) Доказательство. Рассмотрим сначала случай, когда Li Л ЛТ2 / {#} • Выполним следующее построение. Пусть /1,..., fs - базис L1 П Т2 . Так как Li Л L2 С Lj , Д П Т2 С Т2 , то согласно теореме о неполном базисе векторы Д,..., fa можно дополнить как до бази- са L\ , так и до базиса L2 . Пусть ej,..., em, /1,..., fs - базис Д, а Д,.... Д,<71,... ,<7t _ базис L2 Покажем, что система векторов fs, <7i,..., gt (65.3) образует базис Li +L2 . Действительно, она порождает Li + L2 в силу теоремы 65.2 и, кроме того, она линейно независима, так как если ТП 5 t 52 ciiei + 52 ал+52 = е > (65-4) г=1 г=1 t=l ТО t ms д = 52^ = _52^^_12ал- (65.5) i=l t=l i=l Отсюда следует, что вектор g является вектором как Lj, так и £2, т.е. <7 € Li Л Ь2 и, следовательно, вектор g является линейной комби- нацией векторов Д,... ,f3. Из единственности разложения вектора g по линейно независимой системе векторов .., ет, fi,..., fs следу- ет, что в (65.5) ai = ... = ат = 0. Тогда в (65.4) в силу линейной независимости Д, - •., Д, <71, • , <7t получим, что Д = ... — Д, = 0, = ... = = 0. Таким образом, только тривиальная линейная ком- бинация векторов (65.3) равна нулевому вектору. Итак, векторы (65.3) образуют базис L\ + Т2 и, следовательно, dim(£i + L2) = т + s + t. (65.6) С другой стороны, согласно схеме построения векторов (65.3), dim Lj -i-dim L2 - dimLi ЛТ2 = (m + s') + (s + t) - s = m у s +1. Сравнение этого соотношения с (65.6) дает (65.2). В случае когда Li Л L2 = {0}, доказательство проводится аналогично, только в нем не участвуют векторы Д,..., ft.
218 Глава XU. Линейное пространство над произвольным полем § 66. Прямая сумма подпространств Критерии прямой суммы. Сумма подпространств линейного пространства называется прямой суммой, если разложение каждого вектора в ней по слагаемым подпространствам единственно. Обозначение: Lt® ... ® Lk Теорема 66.1 (критерии прямой суммы). Для подпрос- транств Li,.. • ,Lk конечномерного линейного пространства V сле- дующие утверждения равносильны: 1) сумма подпространств Li,... ,Lk - прямая; 2) совокупность базисов подпространств L\,...,Lk линейно не- зависима; 3) совокупность базисов подпространств Li,... ,Lk образует ба- зис суммы Y^i=\ 4) dim52*=1 Ц = 52*=1 dimlj ; 5) существует вектор а € J2i=i Li, для которого разложение по подпространствам L\,...,Lk единственно; 6) произвольная система ненулевых векторов ai,..., а*, взятых по одному из каждого подпространства L,, г — 1,к, линейно неза- висима; 7) Г1ПГ2 = {0} (для к = 2). Доказательство. 1 => 2. Пусть совокупность ei,...,em, fi,..., fa,... ,gi,... ,gt базисов подпространств Li,..., Lk линейно за- висима и ms t '^OLiei + '^(iifi® ...Л-^^gi^e, (66.1) t—1 i=l i=l где ms t £>?+E#+--+E^/°- (66-2) i=l i=l i=l Положим t Il = Ё aiei , x2 = E 0ifi , - • - , xk = Ё li9i 1=1 i=l_ i=l Отметим, что Xi € Li, i = 1, к, причем среди xi,...,Xk в силу (66.2) и линейной независимости векторов каждого базиса существует вектор Xi в. Тогда соотношение (66.1) может быть записано в виде в — Xi + ... + Xi + ... 4- Хк , Xi в. (66.3) Это дает второе разложение нулевого вектора в (после известного: 0 = 0 + ... + 0 + ... + 0) по подпространствам Li,..., L»,..., Lk- 2 => 1. Пусть Li + ... + Lk - не прямая сумма. Тогда существу- ет вектор Ь из этой суммы, который имеет два разложения по под- пространствам Li,..., Lk’-
§ 66. Прямая сумма подпространств 219 Ь = 61 + ... 4- 4- ... + bk , (66.4) b = b\ + ... + Ь\ + ... + b'k, (66.5) отличающиеся хотя бы одним слагаемым 6, / 6'. Если вычесть из первого равенства второе и разложить каждое слагаемое bj — 6' , j = 1,п, по базису Lj, то получим нетривиальную линейную ком- бинацию базисных векторов пространств £i , равную нулево- му вектору. Эго противоречит линейной независимости совокупности базисов Li,..., Lk 2 <=> 3. Это следует из теоремы 65.2. 3 <==> 4. Эти утверждения отличаются только терминологией. 1 => 5. Это очевидно. 5 => 1. Пусть £i + ... + Lk - не прямая сумма. Тогда существует вектор b из этой суммы, для которого имеют место два различных разложения (66.4) и (66.5). Вычитая (66.5) из (66.4), получим нетри- виальное разложение нулевого вектора (66.3). Если его сложить с раз- ложением вектора а, то получим еще одно разложение вектора а. 1_=> 6. Пусть система векторов ai,...,ak, где а, € Li, а, / б, г = 1, k, линейно зависима. Тогда существуют числа од,..., ак € Р, одновременно не равные нулю (пусть, например, а, 0) и такие, что aiai + .. .4-010,4-.. .4-OfcOfc = в. Это равенство дает второе разложение нулевого вектора, отличное от тривиального (так как о..а, в), что противоречит утверждению 1. 6 => 1. Пусть Li 4-... 4- Lk - не прямая сумма, тогда существует вектор Ь, для которого имеют место два разложения (66.4) и (66.5). Вычитая одно из другого, получим, что а,, 4- а,.. 4-... 4- = в, где aIm = 51тл - b'im, Oim € £im, причем alm / 0 хотя бы для одного тп, m = 1, q. Значит, векторы а,,, а,2,..., а,2 линейно зависимы и, следо- вательно, любая система ненулевых векторов, взятых по одному из каждого Li, i= 1,/с, содержащая эти векторы, линейно зависима (в силу теоремы 14.3). Это противоречит утверждению 6. 4 <=> 7. Это следует из теоремы 65.3. Теорема 66.2. Линейное пространство V является прямой суммой двух своих подпространств Ly и L2 тогда и только тогда, когда: 1) dimV = dimLi 4- dim £2; 2) Li Ct L2 = {б} . Доказательство. Необходимость следует из теоремы 66.1 (утверждения 4 и 7). Достаточность. Из условия 2 следует, что L\ 4- L2 - прямая сумма. Положим L — Li ® L2. Согласно теореме 66.1 (утвержде- ние 4) dim£ = dim Li 4- dim £2. Отсюда в силу условия 1 вытека- ет, что dim£ = dimV. Это означает, что L — V (теорема 64.3), т.е. V = Li ф L2 .
220 Глава XII. Линейное пространство над произвольным полем Дополнительное подпространство. Пусть L - линейное под- пространство пространства V. Подпространство Ls называется до- полнительным подпространством к L (рис. 1), если L © — V. Очевидно, что при этом L - дополнительное подпространство к L6. Рис. 1 Т еорема 66.3. Для любого подпространства L линейного пространства V существует дополнительное подпространство. Доказательство. Будем считать, что L - нетривиальное подпространство (если L = {в}, то Ls = V, а если L — V, то Ls — {fl}). Пусть ei,...,efc - базис L. Дополним его до базиса ej,... ,ek,ek+l,... ,еп всего пространства V . Тогда £(е^+1,... ,еп) = = Ls , так как для подпространства £(efc4i,... ,еп) выполнены все условия теоремы 66.2. Замечание. В случае если L - нетривиальное подпространство, дополнительное подпространство определено неоднозначно. § 67. Линейное аффинное многообразие Линейное аффинное многообразие и связанные с ним понятия были определе- ны в §18. Там же приведены некоторые элементарные утверждения, относящиеся к вещественному линейному пространству. Все они остаются в силе и в линейном пространстве над произвольным полем Р (с очевидной заменой поля R на поле Р). Параллельные многообразия. Линейные многообразия Hi = = 4- Li и Hi - Х2 + Ь2 в линейном пространстве V называются параллельными, если либо Li С Г2, либо L2 С L\ (рис. 1). Теорема 67.1. Если два линейных многообразия с непу- стым пересечением параллельны, то одно из них содержит другое. Доказательство. Пусть линейные аффинные многообразия Л1 = xj -I- Li и Н2 = х2 4- L? параллельны и пусть L,CL2. (67-1) По условию существует вектор Xq € Hi Л Н2 • Так как вектором сдвига может служить любой вектор линейного многообразия (§18), то Hi = xq 4- Li, Н2 = х0 + L2. Отсюда с учетом (67.1) следует, что Hi С Н2 .
§ 67. Линейное аффинное многообразие 221 Сле дствие 1. Если линейные многообразия параллельны, то либо они не пересекаются, либо одно из них содержится в другом. Пересечение многообразий. Теорема 67.2. Непустое пересечение линейных много- образий Hi = Xi + Li, i — l,k, является линейным многообразием с к направляющим подпространством Q L,. i=l к Доказательство. По условию существует вектор то € П к к 1=1 следовательно, Hi = Xq + Li. Тогда Н, = Хо + П Li, так как для i=l 1=1 этих множеств имеет место двустороннее вложение. Теорема 67.3. Всякое к-мерное линейное многообразие в п-мерном пространстве можно задать в виде пересечения п — к гиперплоскостей. Доказател ьство. Пусть Н = xq + L - к-мерное линейное мно- гообразие и ei,...,e* - базис подпространства L. Дополним его до базиса ej,... , Cfc, ejt+i, , еп пространства V. В качестве иско- мых гиперплоскостей можно взять линейные многообразия И, = xq + + Li, i = 1, n — к, где Li — £(ei,..., efc, ek+2, ejt+3,..., en), Z>2 = L{e\,... ,ek, efc+i, ejt+3,... , en), Ln-к = Upl, >^kt^k+1i ^k+2i • i _ j) , т.е. Li - линейная оболочка всех векторов базиса V, кроме е^-ц. Очевидно, что Li Cl £2 П ... П Ln_fc = C(ei,... ,et) = L. В силу теоремы 67.2 отсюда следует, что Н = Нх П Я2 О . • • И Так как dim Li = п — 1, г — 1,п — к, то все Hi - гиперплоскости. Т е о р е м а 67.4. Пересечение линейного многообразия Н — — xq+L с любым подпространством, дополнительным kL, состоит ровно из одного вектора.
222 Глава XII Линейное пространство над произвольным полем Доказательство. Пусть Ls - дополнительное подпространство к L. Так как L ® Ls = V, то для вектора хо имеет место разложение х0 = у + z, где у е L, z € L6 . Тогда z = xq - у € Н, ибо -у € L. Следовательно, z - общий вектор Ls и Н, т.е. z 6 Ls П Н. Покажем, что z - единственный вектор пересечения L& Г\Н. Пусть z' € L5 П Н, тогда так как z е Н, z' € Н, то (§18) z — z' е L, а так как z 6 L6, z' € Ls, то z - z' € Ls. Из того, что Ln Ls = {0} , следует, что z — z' — в, т.е. z = z‘. Фактор-пространство. Пусть V - линейное пространство над полем Р, L - некоторое его линейное подпространство. Рассмотрим множество V|L всех линейных многообразий с направляющим под- пространством L: V\L = {Н — х 4- L | х € V}. Введем на этом множе- стве операции сложения и умножения на число из поля Р. Определим сумму многообразий Н\ = Xi + L, = Х2 4- L по следующему правилу: Н\ 4- Н2 = (xi 4- хг) 4- Г. (67.2) Это определение корректно, так как результат не зависит от вы- бора векторов сдвига многообразий Hi, Н2 Фактически эта опера- ция совпадает с известной операцией сложения смежных классов по нормальному делителю, т.е. с алгебраической операцией в фактор- группе (§40). Таким образом, правило (67.2) определяет внутренний закон композиции на V\L (рис. 2). Определим умножение многообразия Н = xg + L на число а £ Р по следующему правилу: аН = ахо 4- L. (67.3) Проверим корректность этого определения, т.е. что результат не зависит от выбора вектора сдвига хд. Пусть Н = х'а 4- L. Покажем, что ахо 4- L — axg 4- L. (67.4) Для любого элемента axq 4- у, у € L, из левого множества имеем ах0 4- у = а(х'о 4- х0 - Xq) + у = ах'о 4- а(х0 - Xg) 4- у = охд 4- yi, где У1 = а(хо — Хд) 4- у € L, так как хд — Хд 6 L, у е L. Следовательно, ахо 4- Г С охд 4- L. С другой стороны, для элемента из правого мно- жества о:Хд 4- у, у € L, имеем охд 4- у = {хд = хд 4- yi, где yi G L} = = a(x0 4- tn) 4- у = oxg 4- ayi 4- у = ax0 4- У2 , где y2 = aj/i 4- у G L. Следовательно, oxg 4- L C ax0 4- L. Оба вложения доказывают (67.4). Таким образом, правило (67.3) определяет внешний закон компо- зиции на V|L (рис. 3). Теорема 67.5. Множество V\L всех линейных многообра- зий с направляющим подпространством L есть линейное простран- ство относительно законов композиции (67.2), (67.3). Доказательство. Справедливость аксиом группы сложения вы- текает из того, что V\L - фактор-группа. Впрочем, непосредственная
§67. Линейное аффинное многообразие 223 проверка этих аксиом так же проста, как и проверка остальных акси- ом линейного пространства, ее мы предоставляем читателю. Линейное пространство V|L называется фактор-пространством линейного пространства V по подпространству L. Теорема 67.6. Фактор-пространство V\L изоморфно Ls . Доказательство. Если L = {0}, то Ls = У, V\L = V и, следовательно, V|L = Ls. Если L = И, то L6 = {б}, V|L = {в} и V|L = {#}. Пусть 0 < dimL < dimV и Ls - какое-нибудь до- полнительное подпространство к L. Согласно теореме 67.4 в каждом многообразии Н = х + L существует, и притом единственный, вектор z & L6 , так что Н — z+L. Таким образом, V\L — {Н = z+L | z € Ls} . Отображение : Ls —> V\L, которое каждому вектору z € Ls ставит в соответствие линейное аффинное многообразие Н = z + L € V|L, биективно в силу теоремы 67.4, оно сохраняет законы композиции в силу (67.2), (67.3). Таким образом, - изоморфизм. Следствие 2. dimV|L — dimV — dimL. 8 Линейная алгебра и аналитическая геометрия
Глава XIII. Евклидовы и унитарные пространства Линейные пространства, изучавшиеся нами до сих пор, несмотря на абстракт- ный характер, по своим свойствам очень близки к геометрическим пространствам. Однако в них еще не нашли отражение понятия, связанные с измерениями, такие, как длина вектора и угол между векторами. В §22 мы установили, что эти вели- чины тесно связаны с понятием скалярного произведения векторов. Они просто выражаются через скалярное произведение, а само скалярное произведение век- торов оказывается при этом весьма простой с точки зрения алгебры функцией: оно линейно по каждой из двух переменных. Это дает основание при введении метрических понятий в теории линейных пространств отталкиваться от понятия скалярного произведения. В этой главе рассматриваются только вещественные и комплексные простран- ства. Итак, V - линейное пространство над полем Р, где Р - либо R, либо С. § 68. Скалярное произведение Пусть V - вещественное или комплексное линейное пространство. Отображение (, ) : V х V -> Р называется скалярным произведением, если оно удовлетворяет следу- ющим аксиомам: для любых х, у, z 6 V и любого а 6 Р 1) (я, у) = (у,х); 2) (ах, у) = а(х, у); 3) (x + y,z) = (x,z) + (y,z); (68.1) 4) (х,х) > 0 для любого х € V, (х, х) = 0 тогда и только тогда, когда х = 0. Число (х, у) называется скалярным произведением векторов х и у, аксиомы 1-4 называются аксиомами скалярного произведения. Замечание 1. В вещественном случае черта в первой аксиоме может быть опущена. Замечание 2. Аксиома 4 в комплексном случае на пер- вый взгляд кажется парадоксальной, так как для комплексных чисел знак не определен. Однако из первой аксиомы следует, что скалярный квадрат (х, х) есть вещественное число. Вещественное линейное пространство со скалярным произведени- ем называется евклидовым пространством, а комплексное - унитар- ным. Обозначение: Е и U соответственно. Примеры. 1. В геометрических пространствах Vn, где п = 1,2,3, было введено скалярное произведение (22.1) на основании метрики, имеющейся на прямой, на плоскости и в пространстве. Оно удовле- творяет всем аксиомам скалярного произведения (теорема 22.2) и,
§ 68. Скалярное произведение 225 следовательно, является скалярным произведением и в принятом вы- ше смысле. Аксиоматическое определение скалярного произведения говорит о том, что геометрическое правило (22.1) не является един- ственным скалярным произведением в пространствах Vn, п = 1,2,3. 2. В арифметическом пространстве Rn скалярное произведение векторов х = (xi,..., Tn), У = (j/i, • • •, Уп) может быть введено сле- дующим образом: п (®.у) = Х™’ (68.2) г=1 а в арифметическом пространстве Сп - п (х<у) = (б8-3) i=i Для скалярных произведений (68.2) и (68.3) аксиомы (68.1) легко проверяются непосредственно. Скалярные произведения (68.2) и (68.3) называются естествен- ными скалярными 'произведениями в арифметических пространствах Rn и Сп соответственно. Для естественных скалярных произведений может быть использо- вана компактная форма записи: если арифметические векторы х и у записать как столбцы, т.е. х — (xi,..., хп)Т, у = (yi, - - , Уп), то (х,у) - хту = утх в К", (х,у) = хту = унх в Сп. 3. В функциональном пространстве С[0,1] скалярное произведение функций f(x) и д(х) может быть задано так: 1 (f,g) = У f(x)g(x)dx. (68.4) о Справедливость аксиом (68.1) вытекает из свойств определенного ин- теграла [11|. Итак, операции (68.2)-(68.4) определены корректно и превращают пространства Vn , Rn , С[0,1] в евклидовы пространства, а простран- ство Сп - в унитарное. Из определения скалярного произведения вытекают следующие простейшие свойства этой операции. 1°. (х, у -I- z) = (х, у) + (х, z), Vx, y,z G E (U). 2°. (x,ay) = a(x,y), Vx,y € E (U), Va G Ж (соответственно С). 3°. (0,x) = (x,e) = 0, Vx G E (C7). 4°. (x, у) — 0 для любого вектора у G Е (U) тогда и только тогда, когда х = 0.
226 Глава ХШ. Евклидовы и унитарные пространства 5°. Любое подпространство L евклидова (унитарного) простран- ства является евклидовым (соответственно унитарным) пространст- вом. Отметим, что скалярное произведение (т, у) векторов х, у линейно по первому аргументу, а в евклидовом пространстве - линейно по обоим аргументам (свойства 1° и 2°). Теорема 68.1. Для любых векторов х,у G Е (U) имеет место неравенство \(х,у)\2 <(х,х)(у,у) (68.5) или, в другой форме, (т,т) (х,у) (У,х) (у,у) > 0. Доказательство. Будем считать, что х / 6 (для х — в неравен- ство (68.5), очевидно, обращается в равенство). Для любых векторов х,у € Е (U) и любого числа а € R (С), согласно (68.1) и свойствам 1°—4°, имеем 0 < (ат — у, ах — у) = (ат, ат) - (ат, у) - (у, ат) + (у, у) = = |а|2(т, т) - а(т, у) - а(у, т) + (у, у). (68.6) Так как т в, то (т,т) 0. Возьмем а = (у,т)/(т,т). Тогда т (68.6) »«,. О < + (р.у), (т,т)2 (т, т) (т, т) откуда после очевидных преобразований получим (68.5). Неравенство (68.5) называется неравенством Коши-Буняковского. Замечание 3. В евклидовом пространстве неравенство Коши- Буняковского может быть записано в виде (т, у)2 < (т,т)(у, у). Теорема 68.2. Неравенство Коши-Буняковского обраща- ется в равенство тогда и только тогда, когда векторы х и у кол- линеарны. Доказательство этой теоремы фактически содержится в до- казательстве теоремы 68.1. Действительно, если т = 0, то т = Оу. Если же т в, то неравенство (68.6) обращается в равенство тогда и только тогда, когда 0 = (ат — у, ат — у), т.е. когда у = ат. § 69. Основные метрические понятия В евклидовом и унитарном пространствах длиной вектора т назы- вается арифметическое значение квадратного корня из его скалярного квадрата. Обозначение: |т|. Итак, |т| = ^(х,х). Из аксиом скалярного произведения вытекают следующие факты. 1°. Любой вектор т евклидова (и унитарного) пространства имеет длину, при этом |т| > 0, Vi е Е (U) и |т| = 0 <=> т — 0.
§ 69. Основные метрические понятия 227 2°. |ах| = |а||х|, Vz & Е (£7), Vo е R (соответственно С). В новой терминологии неравенство Коши-Буняковского может быть записано следующим образом: |(х,»)| < |х| • |у| - (69.1) Вектор единичной длины называется нормированным. Любой не- нулевой вектор можно нормировать, разделив этот вектор на его дли- ну. По аналогии с элементарной геометрией упорядоченная тройка векторов х, у, х + у рассматривается как треугольник, о котором гово- рят, что он построен на векторах х и у. Точно так же считается, что паралеллограмм, построенный на векторах х и у, имеет диагонали х + у и х - у. Теорема 69.1. В евклидовом (унитарном) пространстве для любых векторов х , у имеют место неравенства ||т|-|1/|| < |х + р| < |х|+ |!/|. (69.2) Доказательство. Имеем |гг -I- у|2 — (х + у,х + у) — (х,х) -Ь + (х, у) + (у, х) + (у, у). Применив к этой сумме числовые неравенства треугольника (которые справедливы как для вещественных, так и для комплексных чисел), с учетом неравенства (69.1) получим, что |х + у|2 < И2 + 2|х| • |у| + |у|2 = (|т| + |у|)2 , |х + у|2 > |х|2 - 2|х| \у\ + |у|2 = (И - |у|)2 • Отсюда следует (69.2). Неравенства (69.2) называются неравенствами треугольника в евклидовом (унитарном) пространстве. Очевидно, эти неравенства переносят известное из элементарной геометрии свойство сторон треугольника на произвольное евклидово (и унитарное) пространство. Точно так же легко проверяемое равен- ство |х + у|2 + |х - у|2 = 2(И2 + |у|2), (69.3) называемое тождеством паралеллограмма, справедливо в евклидо- вом (и унитарном) пространстве. В евклидовом пространстве углом между ненулевыми векторами х и у называется угол , 0 < < л, для которого cosy? = /Т’У). - (69.4) н • м Корректность этого определения следует из неравенства Коши- Буняковского (69.1). В унитарном пространстве понятие угла между векторами не определено. Од- нако и в евклидовом, и в унитарном пространстве можно ввести обобщение поня- тия прямого угла.
228 Глава XIII. Евклидовы и унитарные пространства § 70. Ортогональные векторы Ортонормированный базис. Два вектора х,у € Е (II) назы- ваются ортогональными, если (х, у) = 0. Из свойства 4° скалярного произведения (§68) следует, что нулевой вектор в, и только нулевой, ортогонален любому вектору пространства. В евклидовом пространстве вследствие равенства (69.4) ортогональность век- торов х и у означает, что либо один из них нулевой, либо угол между ними равен тг/2. Пусть L - линейное подпространство евклидова (унитарного) про- странства E(U). Вектор х называется ортогональным подпростран- ству L, если он ортогонален любому вектору у & Г.Обозначение: х ± L. Очевидно, что х ± £(ai,... ,a^) тогда и только тогда, когда х ± а,, i = 1, к. Два подпространства L\ и L2 называются ортогональными, если (х,у) — 0, Ух е Li, у € L2. Обозначение: L\ ± £2- Сумма подпространств 2Ji=1 Li называется ортогональной сум- мой, если ее слагаемые подпространства попарно ортогональны. Система векторов Xi,...,Xfc € Е (U) называется ортогональной системой, если (xj,Xj)=O при i yt j. (70.1) Система векторов xj,..., х^ € Е (II) называется ортонормирован- ной системой, если (xt,Xj) = <fy, где - символ Кронекера, т.е. s«={ i: р»2» Теорема 70.1. Ортогональная система ненулевых векто- ров линейно независима. Доказательство. Пусть xi,...,x* € Е (II) - ортогональная система ненулевых векторов. Умножая обе части равенства aiXi + ... + cuxi + ... + akxk = в (70.3) скалярно на х,, получаем в силу (70.1) а,(х,,х,) = 0, г = 1, к. (70.4) По условию Xj У в, значит, (х,,х*) ^0, ив силу (70.4) все коэф- фициенты линейной комбинации в (70.3) равны нулю. Следовательно, векторы рассматриваемой системы линейно независимы. С л едствие 1. Ортонормированная система векторов линейно независима. Следствие 2. В п-мерном евклидовом (унитарном) простран- стве любая ортонормированная система из п векторов образует базис.
§ 70. Ортогональные векторы 229 Базис, векторы которого образуют ортонормированную систему, называется ортонормированным базисом. В соответствии с (70.2) ei,..., - ортонормированный базис Е (U), если <«..е,) = { J; ‘j): (70S) Теорема 70.2. В евклидовом (унитарном) пространстве координаты х^,.. ,,хп вектора х в базисе е = (ei,... ,еп) вычисля- ются по правилу Xi = (x,ei), г = 1,п, (70.6) тогда и только тогда, когда е - ортонормированный базис. Доказательство. Необходимость. Пусть для любого век- тора х € Е (С) координаты в базисе е вычисляются согласно (70.6). Тогда по этому же правилу вычисляются координаты и базисных век- торов, которые известны, так как е< = 0ei + ... + Ое,-! + 1е, + 0е,+1 + . - + 0еп , г = 1,п. Сравнение координат вектора е< с правилом (70.6) приводит к требу- емым равенствам (70.5). Достаточность. Если е - ортонормированный базис и х = 52j=i TjCj , то свойство линейности скалярного произведения с учетом (70.5) приводит к (70.6). Теорема 70.3. В евклидовом (унитарном) пространстве скалярное произведение векторов х = 52"=i xiet > V — 527=1 > за~ данных своими координатами в базисе е, вычисляется по правилу п (х,у) = 52^57 (70.7) 1=1 тогда и только тогда, когда е - ортонормированный базис. Доказательство. Необходимость. Если скалярное произ- ведение вычисляется согласно (70.7) для любой пары векторов, то это же верно и для пары базисных векторов е, и е7 , координаты которых известны. Применив правило (70.7) к вычислению скалярного произ- ведения векторов Cj и е7 , получим требуемые равенства (70.5). Достаточность. Если е - ортонормированный базис и х = 527=1 х*е* ’ У = 527=1 У’е‘ ’ т0 в СИЛУ свойства линейности ска- лярного произведения имеем (®,у) = (52 ’ 52 Узез ) = 52 52 ^3/7(е<,е,) = £ аД/Г i=l j=l l=lj=l 1=1 Замечание. В евклидовом пространстве черта в равенстве (70.7) может быть опущена: (т, у) = 527=1 Х*У> Скалярное произведение (70.7) может быть записано в компактной форме через координатные столбцы хе и уе векторов х и у в базисе е следующим образом:
230 Глава XIII. Евклидовы и унитарные пространства (х, у) = х^уе = yfхе для евклидова пространства, (х,у) = х^уе = уНх£ для унитарного пространства. До сих пор все базисы линейного пространства были равноправны. С помо- щью любого базиса можно сводить операции сложения векторов и умножения вектора на число к операциям над числами. В евклидовом и унитарном простран- ствах теорема 70.3 отводит ортонормированному базису особую роль: с помощью такого базиса и третья операция - скалярное произведение векторов - сводится к операциям над числами. Возникает естественный вопрос, всегда ли существует ортонормированный базис. Теорема 70.4. В конечномерном евклидовом (унитарном) пространстве существует ортонормированный базис. Доказательство. Пусть dimV = п. Используем индукцию по п. При п = 1 утверждение очевидно: достаточно взять любой вектор f в и положить 61 = f /|/|. Пусть в любом (п — 1)-мерном евклидовом (унитарном) простран- стве существует ортонормированный базис; покажем, что ортонорми- рованный базис существует и в n-мерном пространстве Е (17). Пусть _ базис Е ((7). Линейная оболочка £(fi, • •,/п-1) являет- ся (тг — 1)-мерным пространством, и в нем по индуктивному предпо- ложению существует ортонормированный базис ei,... , en_i. Так как /п 0 = £(ei,...,en_1), то вектор дп = /n-aiei-a^- ... — an_ien_i отличен от нулевого вектора при любых о, € R(C). Выберем коэффициенты аг, i — l,n — 1, из условия ортогонально- сти вектора дп всем векторам 6j,.. , en-i ' 0 = (дп, 6j) = (/п, , i — 1, п — 1, или Qj = (/n, ei), i = 1, п — 1. Тогда, положив еп = дп/\9пI, получим ортонормированный базис ei,..., еп пространства Е (U). Процесс ортогонализации. Доказательство теоремы 70.4, по существу, представляет собой алгоритм последовательного построе- ния ортонормированного базиса по заданному базису Д,..., fn- Первый шаг. Полагая gi = fi, находим ei = <7i/|<7i | • k-й шаг (k > 2). Полагаем 9к = fk~ otiei - а2е2 - ... - a*-i6fc_i, (70.8) где at = (ffe,ei), i = 1, к - 1, и находим ек = дк/\дк\. Через п шагов получим ортонормированный базис ei,...,6n пространства. Описанный алгоритм называется процессом ортогона- лизации Грама-Шмидта. Ортогональная (унитарная) матрица. Матрица U £ Спхп на- зывается унитарной, если UUH = UHU = I,, (70.9) матрица Q G RnKn называется ортогональной, если QQT = QTQ = I. (70.10) Напомним, что в §24 уже рассматривались ортогональные матри- цы в связи с ортонормированным базисом геометрических прост-
§ 70. Ортогональные векторы 231 ранств. В произвольном евклидовом (унитарном) пространстве имеет место то же утверждение. Теорема 70.5. Матрица перехода от ортонормированного базиса е к базису е' евклидова (унитарного) пространства ортого- нальна (унитарна) тогда и только тогда, когда е! ортогональный базис. Доказательство повторяет доказательство теоремы 24.1 с учетом соотношений (70.5), (70.7), (70.9), (70.10). QR-разложение. Процесс ортогонализации Грама-Шмидта, опи- санный в матричной форме, дает еще одну факторизацию матрицы. Пусть А = [щ ... ап] - вещественная или комплексная матрица размера п х п с линейно независимыми столбцами ai,...,an е Rn (соответственно Сп). В результате применения процесса ортогонали- зации к этим столбцам относительно естественного скалярного про- изведения в арифметическом пространстве получатся ортонормиро- ванные столбцы gi,...,gn, которые образуют ортогональную (соот- ветственно унитарную) матрицу Q = [gi... дп]. Сам процесс ортого- нализации означает последовательное умножение матрицы А спра- ва на некоторые матрицы элементарных преобразований. Так как qi €. C(ai, qi, ,qi~i), г = l,n, то на i-м шаге матрица Л*_1 (по- лученная после (г — 1) шагов) умножится справа на матрицу Т 0 ... ои ... 0‘ 1 ... а2> - • • 0 1. так что весь процесс ортогонализации укладывается в матричную схе- му ЛТ1... Ln = Q или AL = Q, где L - верхняя треугольная матрица (как произведение верхних тре- угольных матриц), т.е. A = QR, (70.11) где Q - ортогональная (соответственно унитарная), a R = L~1 - верх- няя треугольная матрицы. Разложение (70.11) называется QR-разложением матрицы А. Если Л - прямоугольная матрица размера т х п с линейно не- зависимыми столбцами, то очевидно, что т > п, а матрица Q бу- дет прямоугольной матрицей размера т х п с ортонормированными столбцами gi,..., qn. Теорема Пифагора и ее обобщение. Если векторы хну орто- гональны, то треугольник, построенный на этих векторах, называют прямоугольным, а вектор х + у - гипотенузой этого треугольника.
232 Глава ХШ. Евклидовы и унитарные пространства Легко проверить, что |х + у|2 = |т|2 + |У|2, (70.12) а, в более общем случае, если х±,..., Xk - попарно ортогональны и 2 = 11 + . . . + Xk, то t и2 = £ы2, (70.13) £=1 Равенство (70.12) называют теоремой Пифагора в евклидовом (и унитарном) пространстве, а равенство (70.13) - ее обобщением. § 71. Матрица Грама Матрицей Грама системы векторов ai, тарного) пространства называется матрица ..., ajt евклидова (уни- G(ai,..., ак) — '(ai,ai) (ai,a2) ... (ai,dk)’ (71-1) .(<ifc,ai) (afc,a2) ... (fik,ak). Определитель матрицы Грама называется определителем Грама. Теорема 71.1. Система векторовai,... ,йк евклидова (уни- тарного) пространства линейно зависима тогда и только тогда, когда det G(ai,...,а*) = 0. Доказательство. Рассмотрим вектор у — $2t=i Q»°*- Так как у € £(ai,... ,ак), то равенство у = в равносильно ортогональности вектора у любому вектору из £(ai,..., а*,), что в свою очередь равно- сильно ортогональности вектора у векторам ai,... ,<ц, т.е. ' а1) + ... + аДа*, ay) =0, ...................................... (71-2) „ ai(ai,afe) + ... + ак(ак,ак) = 0. Линейная зависимость векторов щ,... ,а* означает наличие нетриви- ального набора коэффициентов ..., ак, для которых у — в, т.е. на- личие нетривиального решения однородной системы уравнений (71.2) с матрицей GT(ai,..., а*), а это согласно теореме28.6 означает равен- ство det G(aj.,..., а^) = 0. Матрица А е Спхп называется эрмитовой матрицей, если Ан = А; (71.3) матрица А € Rnx” называется симметрической (или вещественной эрмитовой) матрицей, если АТ = А. (71.4)
§ 72. Ортогональное дополнение 233 Из (71.3) следует, что |А| € R. Таким образом, для эрмитовых матриц (комплексных и вещественных) можно говорить о знаке опре- делителя. Теорема 71.2. Матрица Грама системы векторов евкли- дова (унитарного) пространства эрмитова. Доказательство. Пусть G(aj,..., an) — G — (gij) Из (71.1) следует, что = (a,,a_;), gji = (a^a.,), т.е. gtJ = gji Это означает, что GH = G или, в вещественном случае, GT = G.U Теорема 71.3. Определитель Грама линейно независимой системы векторов в евклидовом (унитарном) пространстве поло- жителен. Доказательство. Пусть aj,... , а*, - линейно независимая си- стема векторов евклидова пространства. Тогда dim£(ai,... ,аь) = к. Выберем ортонормированный базис в1,...,е^ линейной оболочки £(щ,..., at). Составим матрицу 011 012 . Оы Ofc2 Olfc Okfc . столбцами которой являются координаты векторов сц,... , а* в бази- се е = (et,... ,ejt). Тогда, согласно (70.7), (a,,a?) = Ss=i ~ = I2s=i ajsa«i = г = 1,*, j = 1, к. Следовательно, G(a1,...,aJt) = (AKA)T (71.5) и detG(ai,... ,а^) = |det А|2. Таким образом, detG(ai,..., at) > 0. (71-6) По условию система щ,... ,<4- линейно независима, поэтому, согласно теореме 71.1, detG(ab ... , a*) 0. Отсюда с учетом (71.6) следует, что detG(ai,... , at) > 0. Замечание. Равенство (71.5) дает компактную форму записи матрицы Грама; в частности, в вещественном случае G(al,...,ak) = ATA. § 72. Ортогональное дополнение Задача о перпендикуляре. Совокупность всех векторов х € Е (U), ортогональных подпространству L, называется ортогональным дополнением к L. Обозначение: . Теорема 72.1. Ортогональное дополнение к подпростран- ству является линейным подпространством. Доказательство. Пусть у\,у? € М, тогда (yi,x) — (2/2,1) = 0 для любого вектора х € L. Складывая эти равенства, получим, что
234 Глава ХП1. Евклидовы и унитарные пространства (?/1 + 5/2,г) — 0, Vi € L, т.е. гц + г/2 & LL. Аналогично если (у,х) — О, Vi € L, то (ay, х) — 0, т.е. ay G L1. Отсюда на основании теоремы 18.1 следует, что [Л - линейное подпространство. Теорема 72.2. Если L - линейное подпространство E(U), то L®Lr = E(U). (72.1) Доказательство. Утверждение очевидно, если L - тривиаль- ное подпространство. Пусть L - нетривиальное подпространство. Возьмем ei,... ,efc - ортонормированный базис L, е*,+ 1,..., еп - орто- нормированный базис L-1-. Система векторов ei,...,е^,i,... ,e,i ортонормирована и, следовательно, линейно независима (теоре- ма 70.1). Покажем, что она образует базис всего пространства Е (U). Пусть это не так. Тогда существует вектор f пространства, который не является линейной комбинацией ei,...,en. Система векторов ej,... ,еп, / линейно независима, и применение к ней процесса орто- гонализации приводит к вектору en+i, который ортогонален ej,..., еп и, значит, en+i € L1-. С другой стороны, en+i J_ lA , так как en+i ортогонален Cfc+i, ..., en. Следовательно, en_|_i = в. Отсюда согласно (70.8) вытекает линейная зависимость е^,... ,en,f, что противоречит допущению. Таким образом, система векторов ei,..., еп является ба- зисом Е (U) и dim L 4-dim/А = dimE (dimCZ). Так как TnlA = {0} , то согласно теореме 66.2 получаем (72.1). Следствие. Если L - линейное подпространство Е (U), то для любого вектора f G Е (U) существует, и притом единственное, разложение f = 9 + h, (72.2) где g € L, h ± L. Вектор g в разложении (72.2) называется ортогональной проек- цией вектора f на подпространство L, а вектор h — ортогональной составляющей вектора f. Задачу разложения (72.2) вектора на ортогональную проекцию и ортогональную составляющую называют задачей о перпендику- ляре. Этот термин заимствован из геометрии. С разложением (72.2) геометрического вектора мы уже встречались (рис. 1): чтобы полу- чить это разложение, достаточно опустить перпендикуляр из кон- ца вектора / на плоскость L. Имея в виду эту аналогию, ортого- нальную составляющую h в разложении (72.2) называют перпендику- ляром, опущенным из вектора f на подпространство L , а сам вектор f - наклонной к подпространству L. Аналогия с геометрическими векторами состоит не только в назва- нии. Отметим некоторые свойства составляющих g и h в разложении (72.2), которые имеют место и в геометрии: так как |/|2 = (д 4- h,g 4- + h) = (д,д) 4- (h,h), то I/I2 = ы2 + \h\2. (72.3)
§ 72. Ортогональное дополнение 235 \h\<\f\. Последнее неравенство означает, что длина перпендикуляра не пре- восходит длины наклонной. Решение задачи о перпендикуляре. Из теоремы 72.2 следует, что задача о перпендикуляре имеет, и притом единственное, решение. Укажем один из Способов построения этого решения. Пусть L — £(ai,... ,а*.-). Разложение (72.2) равносильно задаче построения векторов у и h таких, что f = 9 + h, 9 = Y,kj=i^aj, ( (f-g,<h)=0,i = l,k, geL, \ f-glL, 9 = «• /г 1 L h = f-g ( h = f-g Итак, задача о перпендикуляре сводится к поиску чисел Xi,..., Xk, для которых к '^Xj(aj,ai) = (f,ai), i = \,k. j=i (72.4) Сравнение этих соотношений с (71.2) говорит о том, что числа Xi,... .,Хк являются решением системы уравнений с матрицей Грама G(ai,...,afc) и правой частью (/, a4), г = 1,к. Эта система всегда имеет решение, так как она равносильна задаче о перпендикуляре. Отметим возможные при этом варианты. 1°. Если ai, •.. ,ац - ортонормированный базис L, то G(ai,..., a*,) = I и систе- ма (72.4) имеет единственное решение = (/,<!,), i = 1, к, при этом g = h=l~A 2°. Если линейно независимы, то detG(aj,... ,a^) ^Ои система (72.4) имеет единственное решение; решив систему (72.4), найдем g = xtai, h = f -g-
236 Глава XIII. Евклидовы и унитарные пространства 3°. Если aj,... ,а^ линейно зависимы, то det G(ai,... ,а*) = 0 и система (72.4) имеет бесконечно много решений, которые соответствуют бесконечному числу раз- ложений вектора g по линейно зависимой системе векторов щ,... , ац,. §73 . Линейное аффинное многообразие в евклидовом (унитарном) пространстве Пусть Н = Хо + L - линейное аффинное многообразие в евклидо- вом (унитарном) пространстве. Вектор а € Я, ортогональный L, на- зывается нормальным вектором линейного многообразия Н (рис. 1). Теорема 73.1. Для любого линейного многообразия в ев- клидовом (унитарном) пространстве существует, и притом един- ственный, нормальный вектор. Доказательство. Рассмотрим линейное многообразие Н = xq 4- + L (рис. 1). Все векторы из Н, ортогональные L, находятся в Н C\Lr, но это пересечение состоит ровно из одного вектора а, так как - дополнительное подпространство к L (теоремы 72.2 и 67.4). Этот век- тор а и будет единственным нормальным вектором для Н. Теорема 73,2. Нормальный вектор линейного многообра- зия совпадает с перпендикуляром, опущенным из любого вектора ли- нейного многообразия на направляющее подпространство. Доказательство. Пусть а - нормальный вектор линейного мно- гообразия Н — хо + L, тогда Н = а + L (§18). Следовательно, любой вектор f € Н (рис. 1) может быть представлен в виде f = a + g, gel. (73.1) Так как а ± L, то соотношение (73.1) совпадает с разложением век- тора f на ортогональную проекцию g и перпендикуляр а. Следствие. Среди всех векторов линейного многообразия нор- мальный вектор имеет наименьшую длину. Уравнение гиперплоскости. Пусть Н = xq + L - гиперплос- кость в Е (£7), т.е. dimL = п — 1, где n = dimL? (dim£7). Тогда L1 - одномерное подпространство и его базис состоит из одного вектора а.
§74. Расстояние в евклидовом (унитарном) пространстве 237 Вектор х € Н тогда и только тогда, когда разность х — xq € L, т.е. когда (т-то,а) = 0. (73.2) Таким образом, уравнению (73.2) удовлетворяют все векторы х гиперплоскости Н, и только они. Уравнение (73.2) может быть запи- сано в равносильной форме: (х,а)—р, (73.3) где р = (tq, a) - фиксированное число для данной гиперплоскости. Уравнению (73.3) можно придать координатную форму: если (xi,...,xn) и (Л1,..., Лп) - координаты векторов х и а в некотором ортонормированном базисе пространства, то уравнение (73.3) равносильно уравнению AiXi + ... + А„хп = р, которое в геометрических пространствах совпадает с общим уравнением прямой на плоскости и плоскости в пространстве § 74. Расстояние в евклидовом (унитарном) пространстве Множество М называется метрическим, пространством, если за- дано отображение р : М х М -> R, которое каждой упорядоченной паре элементов х, у € М ставит в со- ответствие число р(х, у) е R такое, что: 1) р(х, у) > 0, Vi, у € М, р(х, у) - 0 <=> х = у ; 2) р(х, у) = р(у, х), Vi, у G М; 3) р(х, z) < р(х, у) 4- р(у, z), Vx,y,z е М. Число р(х, у) называется расстоянием между х и у; отображение р - метрикой, аксиомы 1-3 - аксиомами метрики (расстояния). Расстоянием между множествами X и У в метрическом прост- ранстве называется число p(X,Y)= inf р(т,У); (74.1) в частности, если X = {т}, то р(т,У) = inf р(х,у) - расстояние между элементом х и множеством У. Примеры метрик. 1. Для действительных (или комплексных) чисел (т.е. М = R или С) хорошо известное расстояние между числа- ми р(х,у) — |i - у| является метрикой. 2. Для арифметических векторов в Rn (или Сп) отображение z n v 1/2 Р^,у) = (Х?1* -&I2) -
238 Глава ХШ. Евклидовы и унитарные пространства как легко проверить, является метрикой. Эту метрику называют есте- ственной. В гл. XIX будут рассмотрены и другие метрики в этих про- странствах. 3. Для любого непустого множества отображение Р(х,у) = 1, х^У, О, т = 0 является метрикой. Это один из примеров дискретной метрики. Мы вернемся к метрическим пространствам в гл. XIX и рассмо- трим новые понятия и факты, относящиеся к ним. Теорема 74.1. В евклидовом (унитарном) пространстве V отображение р: V х V —> R, определенное равенством р(х,у) = \х - у\, (74.2) задает метрику. Доказательство. Действительно, правило (74.2) определяет отображение р : V х V —> R, которое отвечает всем аксиомам метри- ки. Проверка этих аксиом тривиальна, отметим лишь одну из них: p(z,z) = |z-z| = \(x-y) + (y-z)\ < - у\ + |у-z\ = p(x,y)+p(y,z), \/х, y,z € V. Итак, евклидово (унитарное) пространство является метрическим пространством относительно метрики (74.2). В дальнейшем, говоря об евклидовом (унитарном) пространстве как о метрическом, будем иметь в виду именно эту метрику. Теорема 74.2 (о кратчайшем расстоянии). Расстояние между вектором f и линейным подпространством L в евклидовом (унитарном) пространстве равно длине перпендикуляра, опущенно- го из вектора f на L . Доказательство. Пусть f = g + h, где g € L, h € Г1, и у - произвольный вектор из L. Тогда p(J, у) = |/ — у\ = |(g + /i) — у| — \h + + (.9 ~ 2/)I — { в силу (72.3) } = + |<? - ?/|2 . Отсюда следует, что p(f,y) > \h\, Vy € L и p(J,y) = |/i|, если у = g. Это означает, что |Л| = inf р(/, у) = p(f,L). y€L Эта теорема может быть сформулирована и в других терминах, а именно: 1) расстояние между вектором f и подпространством L равно расстоянию между вектором f и его ортогональной проекцией на L; 2) среди всех векторов подпространства L ближе всего к вектору f расположена его ортогональная проекция на L. Теорема 74.3. Пусть Н = xq + L - линейное аффинное мно- гообразие в евклидовом (унитарном) пространстве. Тогда p(f,H)^p(f-x0,L).
§ 75. Изометрия 239 Это утверждение следует из теоремы 74.2 и того, что для любого вектора z — хо + у G Н справедливы равенства p(f,z) = \f — z\ = = К/ - *о) - У\ = Р(/ - *о,!/), где у G L. Теорема 74.4. Пусть Н\ = xi + Li u Н2 = х2 + L2 - линей- ные аффинные многообразия в евклидовом (унитарном) простран- стве. Тогда p(Hr, Н2) = p(xi - х2, ^1 + L2). Это утверждение следует из того, что для любых векторов zj = = si + yi G Ну и z2 = х2 + у2 G Н2 выполняются равенства p(zi, z2) — = 1^1 -Z2\ = |(xt -x2)- (yi -3/2)| = p(si-x2,j/), где у = yi-y2 € (Li + + L2). §75 . Изометрия Два евклидовых (или два унитарных) пространства Vj и V2 назы- ваются изометричными или евклидово изоморфными, если существу- ет биективное отображение <р : Vj —> V2, которое сохраняет законы композиции и скалярное произведение, т.е. если: 1) tp(x + y) =<p(s) +<р(у), Vx,yGVi; 2) tp(ax) = oip(x), Vx G У), Vo G P; 3) (<p(x),^(y)) = (x,y), Vx,j/GVi. Само отображение <p при этом называется изометрией или евкли- довым изоморфизмом. Из определения следует, что изоморфные евклидовы (унитарные) пространства изоморфны как линейные пространства. Теорема 75.1. Два евклидовых (унитарных) пространства изометричны тогда и только тогда, когда равны их размерности. Доказательство. Необходимость вытекает из изоморфиз- ма евклидовых (унитарных) пространств как линейных пространств. Достаточность. Пусть V) и V2 - два евклидовых (два унитар- ных) пространства и пусть dim Ц = dim V2 = n. Выберем в Ц и V2 ортонормированные базисы ei,..., еп и е'г,..., е'п и построим отобраг жение <р • —t V2, положив для каждого вектора х = $27=11‘е» е вектор <р(х) = 52"=i х,е'. Из доказательства теоремы 63.1 следует, что отображение <р - изоморфизм линейных пространств Ц и V2. Оно сохраняет скалярное произведение, так как если х — х.е», у = £2"-! У^{, то согласно (70.7) (s,y) = (<^(1),^)) = E"=ixiyi-
Глава XIV. Линейные операторы В этой главе рассматриваются отображения (§8), которые действу- ют в линейных пространствах. Отображения в отличие от матриц будем обозначать рукописными латинскими буквами (например, Л), образ вектора х - символом Ах. § 76. Определение и простейшие свойства Терминология, примеры. Пусть V и W - линейные простран- ства над общим полем Р. Отображение А : V -> W (76.1) называется линейным отображением пространства V в простран- ство W, если для любых х,у € V, а € Р 1) А(х + у) = Ах + Ау ; 2) Л(ах) = аАх. Линейное отображение (76.1) называют также линейным преобра- зованием пространства V в пространство W или линейным опе- ратором, действующим из пространства V в пространство W . Если V = W, то линейное отображение А : V -> V называют ли- нейным отображением (преобразованием) пространства V в себя, а чаще - линейным оператором, действующим в V-. Если W = Р, то линейное отображение (76.1) называют линейной формой или линейным функционалом в пространстве V . Линейный функционал обозначают строчными латинскими буквами (например, /), при этом образ вектора х - символом f(x). Множество всех линейных операторов, действующих из простран- ства V в пространство W, будем обозначать символом £(V, W). В соответствии с определением равенства отображений (§8) опе- раторы А,В е C(V, PV) равны, если Ах = Вх, \/х € V. Примеры. 1. Пусть Мп - пространство вещественных многочле- нов степени не выше п. Отображение D : Мп —> Мп, определенное правилом Pp(t) = p'(t), (76.2) является линейным и называется оператором дифференцирования. 2. Пусть Моа - пространство всех вещественных многочленов от одной переменной. Отображение t <Sp(£) = р(х) dx, о является линейным и называется оператором интегрирования.
§ 76. Определение и простейшие свойства 241 3. Пусть V — Li ф Ьг • Отображение Р : V —> V, определенное правилом Рт = I] (76.3) для вектора х € V с разложением х = х\ + Х2, где xj € Lj, Тг € ^2 . является линейным и называется оператором проектирования про- странства V на L\ параллельно Отображение 77 : V -> V, определенное правилом Рх = xi — Х2 , (76.4) также является линейным и называется оператором отражения про- странства V относительно Li параллельно Lz- 4. Отображение О : V —) W, которое каждый вектор х е V переводит в нулевой вектор в б W, является линейным и называется нулевым оператором. 5. Отображение Т : V -> V, которое каждый вектор х G V пере- водит в х, является линейным и называется тождественным (еди- ничным) оператором. 6. Изоморфизм <р линейных пространств V и W, очевидно, явля- ется линейным оператором, действующим из V в W. Простейшие свойства. Из определения вытекают следующие свойства линейных операторов. 1°. Линейный оператор переводит нулевой вектор в нулевой век- тор, так как А0\ = Л(0х) = ОЛх = &2 (здесь ву, 62 ~ нулевые векторы пространств V и W соответственно). 2°. Линейный оператор сохраняет линейные комбинации, т.е. пере- водит линейную комбинацию векторов в линейную комбинацию обра- зов с теми же коэффициентами: Л(52*=1 о^т,) = 52*=1 сцАхг. 3°. Линейный оператор сохраняет линейную зависимость, т.е. переводит линейно зависимую систему векторов в линейно зависи- мую. Задание линейного оператора. Свойство 2° говорит о том, что для задания линейного оператора Л G £(V, W) достаточно определить его только на векторах а,... ,вп некоторого базиса пространства V. Зная векторы Aei,...,Aen, можно однозначно найти образ любого вектора х — eV: Ах = £"=1 XiAet G W. Формализуем это рассуждение. Т е о р е м а 76.1. Пусть е±,... ,еп - базис пространства V, а <71, • ,9п ~ произвольные векторы пространства W. Тогда суще- ствует, и притом единственный, линейный оператор A е £(V,W), который переводит векторы ei,...,en в векторы gi,... ,дп соот- ветственно. Доказательство. Построим искомый оператор, положив для каждого вектора х = 52”=1 х^ Е V Ах = хгдг. (76.5)
242 Глава XIV. Линейные операторы Из единственности разложения вектора х по базису следует, что пра- вило (76.5) однозначно определяет образ вектора х, при этом, как легко проверить, Ле, = д^, г = 1,п. Линейность построенного опера- тора вытекает из линейности координат. Оператор А единствен, так как если В - любой другой линейный оператор, переводящий векторы ei,... ,вп в gi,...,дп, то Вх — B(Y, xiei) = 13 ZiBti = 12 xi9i = Ax , Vi € V . i=l i=l i=l Следовательно, В — A - Следствие. Линейные операторы А, В € £(V, W) равны тогда и только тогда, когда они совпадают на векторах базиса V. § 77. Матрица линейного оператора Построение матрицы линейного оператора. Пусть е = — (ej,..., еп) и f = (/j,..., fm) - базисы пространств V и W. Как следует из теоремы 76.1, линейный оператор А € £(V, W) однозначно определяется заданием векторов Лег,..., Аеп. В свою очередь, век- торы Aei ,i — 1,п, однозначно определяются своими координатами в базисе /, т.е. коэффициентами разложений .Aei — flii/i + <121/2 + • • • + Urnlfm 1 Ав2 = <112/1 + <122/2 + . . . + am2fm , Аеп — ainfi 4- <22/1/2 + • - • + атп fm. (77.1) Матрица <111 <212 • ' G-ln <121 <122 <^2п Urnl Hm2 (77.2) называется матрицей оператора А в паре базисов е и f. Для обозна- чения этой матрицы используется также символ (Л)/е. Из единственности разложения вектора по базису следует, что при фиксированных базисах ей/ матрица линейного оператора опреде- лена однозначно. Теорема 77.1. Пусть dimV = n, dimW = т. Тогда су- ществует взаимно однозначное соответствие между линейными операторами из £{V, И7) и матрицами из Ртхп. Доказательство. Построим это соотв'етствие. Зафиксируем ба- зисы е = (ei,..., еп) и f = (/1,..., /т) пространств V и W. Поставим в соответствие каждому линейному оператору А € C(V, TV) его матри- цу А/е в паре базисов ей/. Очевидно, что матрица А/е G рт*п определена однозначно. Докажем биективность построенного таким образом отображения. Действительно, оно:
§ 77. Матрица линейного оператора 243 1) сюръективно, так как любая матрица В = (bij) G являет- ся матрицей линейного оператора из £(V, W), переводящего векторы Cj в векторы bijfi, j — 1,п (в силу теоремы 76.1 такой оператор существует); 2) инъективно, ибо различные операторы из £(V, И7) не совпадают на базисных векторах и, значит, имеют разные матрицы. Доказанная теорема играет важную роль в теории линейных операторов. Она позволяет описывать свойства линейных операторов через известный нам аппарат теории матриц. В дальнейшем мы увидим, что связь между операторами и матри- цами более тесная, чем взаимно однозначное соответствие. Координаты вектора и его образа. Пусть А е £(V, W), е и f - базисы пространств V и W. Теорема 77.2. Если у = Ах, то у} = А}ехе. (77.3) Доказательство. Пусть х = Y^=iXiei' У = Vifi и Д/е = = (а$у). Утверждение (77.3) равносильно соотношениям п yi — aijXj , i = 1, т. (77.4) j=i Докажем их. Имеем у = Ах = Л(53"=1 xjej) — Xj-Aej = {в силу (77.1)} = £"=1^ = E^=i(L"=i aijxi)fi- Из единственно- сти разложения вектора у по базису f следует (77.4). Матрицы оператора в различных базисах. Пусть е и t = еС - два базиса пространства V с матрицей перехода С, a f и з = fD - два базиса пространства W с матрицей перехода D. Одному и тому же линейному оператору А € £(V, IV) в паре базисов ей/ соответствует матрица А/е, а в паре базисов t и s - матрица Ast. Теорема 77.3. Матрицы Aje и Ast линейного оператора А & £(V, И7) в различных парах базисов связаны соотношением Ast = D~lAfeC. (77.5) Доказательство. Для произвольного вектора х € V иегообраг за у = Ах в силу (77.3) имеем У/ Afexe, ys Ast;Xt. (77.6) В свою очередь, согласно (17.8), хе — Cxt, у/ = Dya. Подставив эти соотношения в (77.6), получим, что Dy, = AfeCxt или DAatXt = = AfeCxt. Так как это соотношение имеет место для любых xt, то DAst — AfeC. В силу невырожденности матрицы перехода отсюда следует (77.5). Следствие 1. Матрицы линейного оператора в различных па- рах базисов эквивалентны (§16).
244 Глава XIV. Линейные операторы Следствие 2. Ранг матрицы линейного оператора не зависит от выбора базисов. Имеет место более общее утверждение. Теорема 77.4. Две матрицы А и В над полем Р одина- кового размера т х п эквивалентны тогда и только тогда, когда они являются матрицами одного и того же линейного оператора А € £(V, W), где V и W - линейные пространства над полем Р раз- мерностей пит соответственно. Доказательство. Необходимость. Пусть А,В 6 Ртх" и В = D~lAC. Рассмотрим любые линейные пространства V и W над полем Р такие, что dim V — п, dim W = т. Возьмем в пространстве V произвольный базис е, а в пространстве W - базис f. В силу взаим- но однозначного соответствия между Ртпхп и £(V, IV) (теорема 77.1) существует единственный оператор А € £(V, IV), который в паре ба- зисов ей/ имеет матрицу А. Тогда согласно (77.5) матрица В будет матрицей этого же оператора в паре базисов t = еС из — fD. Достаточность рассмотрена в теореме 77.3. § 78. Линейное пространство операторов На множестве £(V, IT) введем операции сложения операторов и умножения оператора на число а & Р. Суммой линейных операторов А, В € £(V, IV) называется отобра- жение С : V -> W, выполняемое по правилу Сх = Ах 4- Вх, Ух € V. Обозначение: Д 4- В. Итак, (Д + В)х = Ах 4- Вх , Ух € V . (78.1) Произведением линейного оператора А € £(V, IV) на число а € Р называется отображение С : V —> IV, выполняемое по правилу Сх — = аАх, Ух € V. Обозначение; а А. Итак, (аД)х = аАх, Ух е V. Теорема 78.1. Для любых операторов А, В € £(V, IV) и лю- бого числа а € Р A + Be£(V,W), aAe£(V,W). Доказательство. Действительно, для любыхх,?/ € V согласно (78.1) имеем (Д 4- В)(х + у) — А(х + у) + В(х 4- у). В силу линейности А, В и аксиом линейного пространства (Л + В) (х 4- у) — (Ах + Ду) 4- 4- (Вх 4- By) — (Ах 4- Вх) 4- (Ау 4- By) = (Д 4- В)х 4- (Д 4- В)у. Аналогично показывается, что (Д-ьВ)(Ах) = Х((А + В)х) для лю- бых х е V, А € Р. Следовательно, А 4- В е £(V, IV). Точно так же доказывается, что аА е £(V, IV). Следствие 1. Сложение операторов и умножение оператора на число являются внутренним и внешним законами композиции на множестве £(V, IV).
§ 79. Умножение линейных операторов 245 Теорема 78.2. Множество £(V,W) - линейное простран- ство над полем Р относительно введенных выше операций. Доказательство. Достаточно проверить аксиомы линейного пространства, взяв в качестве нулевого элемента нулевое отображение О е £(V, IV), а в качестве противоположного к оператору А отобра- жение -А € £(V, IV), выполняемое по правилу (-Д)т = -Ах, Ух е V. Все аксиомы вытекают из соответствующих аксиом линейного прост- ранства, примененных к V и W, и проверяются по единой схеме. Про- верим, например, ассоциативность. Для любых А, В,С G £(V, W) и любого х G V ((А + В) + С)х = (Л + В)х +Сх = (Ах 4- Вх) +Сх = Ах -I- (Вх + Сх), (А + (В + С))х = Ах + (В + С)х = Ах -I- (Вх + Сх). Таким образом, (А + В) + С = А + (В + С). Л Теорема 78.3. Если dimV = п, dimIV = т, то линейное пространство £(V IV) изоморфно пространству матриц РтУп. Доказательство. Зафиксируем базисы ей/ пространств V и IV. Построим отображение tp : C(V, IV) -> Pmxn, положив </?(Л) = Л/е- Это отображение биективно в силу теоремы 77.1. Покажем, что оно сохраняет законы композиции, т.е. что (А + B)fe = Afe + Bfe , (aA)fe = aAfe. (78.2) Пусть Aje = (a,ij), Bfe = (b^). Тогда, согласно (77.1), Aej = = поэтому (А + В)е, = Aej + Be, = = + bij)fi- В силу определения (77.2) матрицы линейного оператора отсюда следует первое из соотношений (78.2). Аналогично проверяется второе соотношение. Следствие 2. dim£(V, IV) = dimV dim IV . Залсечание. Соотношения (78.2) означают, что при сложении операторов их матрицы складываются, при умножении оператора на число его матрица умно- жается на это же число. §79. Умножение линейных операторов Тот факт, что линейные операторы образуют линейное пространство, исполь- зуется редко. Дело в том, что о линейных операторах можно сказать гораздо больше, используя еще одну операцию - умножение операторов, знакомую по §8 как суперпозиция или композиция отображений. Напомним определение. Пусть V, IV, Z - линейные пространства над полем Р. Произве- дением линейных операторов А € £(V, IV), В G C(W,Z) называет- ся отображение С : V —> Z, выполняемое по правилу Сх — В(Ах), Ух е V. Обозначение: ВА. Итак, (ВА)х — В(Ах), Ух G V. Теорема 79.1. Если А € £(V, IV), В € £(IV,Z), то ВА е € £(V,Z). Доказательство. Линейность оператора В А проверяется не- посредственно: для любых х,у G V и a G Р
246 Глава XIV. Линейные операторы (ВА)(х + у) = В(А(х + у)) = В(Ах + Ау) = = В(Ас) + В(Ау) = ВАх + ВАу, (BA)(ax) = В(А(ах)) = В(а(Ах)) = аВ(Ах) = а(ВАх) = (аВЛ)т. Произведение линейных операторов определено не для любой пары линейных операторов. Однако если это произведение имеет смысл, то: 1) (АВ)С = А(ВС) (ассоциативность); 2)а(ЛВ) = (оЛ)В = Л(аВ); , } 3) (А +В)С = АС + ВС, Uy‘1J А(В + С) = АВ + АС (дистрибутивность). Эти свойства легко проверяются непосредственно. Умножение линейных операторов не обладает свойством коммута- тивности. В самом деле, о коммутативности можно говорить лишь для операторов, действующих в одном пространстве, т.е, для операторов А, В € £(V, V). Но и в этом случае умножение не коммутативно. В этом можно убедиться на простом примере операторов дифференци- рования 2? и интегрирования 6 в пространстве Мж всех вещественных многочленов от одной переменной. Теорема 79.2. При умножении линейных операторов их матрицы умножаются, т.е. если e,f,g - базисы пространств V, W, Z, то (ВА)де = BgfAfe . (79.2) Доказательство. Пусть Afe = (щД, Bgf = (Ьу), (ВЛ)эе = (со), dimV = n, dimW = т, dimZ = к. Тогда в силу (77.1) * BAej =YJcijgi- (79.3) i=l В то же время BAe.j = В(Аед) = B(^7=iavf») = YL™=iasi(Bfs) = 52s=i £л=1 bisgi = a-sjbisgi = 52i=i(52s=i biSaSj}gi- Сравнение этого разложения с (79.3) приводит к равенству Cij = = 52^-! biSaSj, которое означает (79.2). § 80. Образ и ядро линейного оператора Образом линейного оператора А € £(V, W) называется множество im.A = {у G W | Эх € V : Ах - у}, ядром оператора А - множество кегЛ = {т € V | Ах = 6}. Примеры. 1. В пространстве многочленов Мп для оператора диф- ференцирования (76.2): imP = A/n_i, кегР = Мд. 2. Для оператора проектирования (76.3): imp = Li, kerP = L2-
§ 80. Образ и ядро линейного оператора 247 3. Для оператора отражения (76.4): im7£ = V, ker 7?. = {0}. Теорема 80.1. Если А б £(V, IV), mo кег А - линейное под- пространство пространства V, imA - линейное подпространство пространства W. Эти утверждения вытекают из теоремы 18.1, условия которой лег- ко проверяются. Рангом, линейного оператора называется размерность его образа, а дефектом - размерность ядра. Обозначения: rg Д, def А. Итак, rg А — dim im A, def А = dim ker А. Теорема 80.2. Если ..., вп - базис пространства V, то imA = £(Aei,..., Aen). (80.1) Доказательство. Достаточно показать, что для множеств (80.1) имеет место двустороннее вложение: с одной стороны, если у € imA, то у — Ах для некоторого вектора х 6 V, т.е. у = = A (J22=i х»е*) — 522=1 е £(Aej,..., Аеп); с другой стороны, если у € £(Ае1т...', Аеп), то у — 522=1 з^Ае, = А (522=1 х*е<) ~ где х = 522=1 xiei, те- У im А. Теорема 80.3. Ранг линейного оператора равен рангу его матрицы в произвольной паре базисов. Доказательство. Из теоремы 80.2 и равенства (64.3) следует, что rgA = dimimA = dim£(Aei,. ..,Aen) = rg(Aei,...,Aen)- Ранг системы векторов Aej,..., Aen совпадает с рангом системы арифме- тических векторов, составленных из координат этих векторов в базисе f пространства W, т.е. с рангом системы столбцов матрицы А/е. Теорема 80.4 (о ранге и дефекте). Если А € £(V, IV), то rgA + def А = dim V . (80.2) Доказательство. Пусть ker А / {0} и ei,... ,е*, - базис ker А. Дополним его до базиса ei,... , е^-, ek+i, • •, еп пространства V. Со- гласно теореме 80.2, imA = £(Aej,..., Ае*, Aet+i,... ,Aen) = — £(Ае*,+1,..., Аеп). Докажем, что векторы Авк+i, •, Аеп линей- но независимы. Пусть это не так. Тогда для нетривиальной линейной комбинации этих векторов имеют место соотношения а*,+1Аек+1 4- + ... 4- апАеп = в или A(ak+ie*;+i 4-... 4- апеп) = в. Следовательно, ajt+iefc.|.i + ... 4- апеп € ker А. Это означает, что вектор ajc+iefc+1 4- 4-... 4- апеп линейно выражается через ех,..., е*, что невозможно в силу линейной независимости е^,... ,е*, efc+i,. Таким образом, dimimA — п - k, dimker А = к. Отсюда следует (80.2). Пусть ker А — {0}. В этом случае можно применить то же самое доказательство, с той лишь разницей, что теперь ei,... ,еп - произ- вольный базис пространства V.
248 Глава XIV. Линейные операторы Теорема 80.5. Множество всех прообразов вектора у€ im А является линейным многообразием с направляющим подпростран- ством кегЛ. Доказательство. Пусть Хо - один из прообразов вектора у, К = {х € V| Ах = J/} - множество всех прообразов у, Н — xq + ker А. Тогда К = Н, так как для этих множеств имеет место двустороннее вложение: Vx е К х = хо + (х — хо) = х0 + I, где I = х — х0 € ker Л; Vx € Н =?• х = xq +1, I 6 ker Л => Аг = у. Замечание. Теорема 80.5, сформулированная на матричном языке, совпа- дает с теоремой 30.3 о множестве решений неоднородной системы уравнений. Теорема 80.6. Пусть А € £(V, IV), rgA = г, dimV = n, dim W — m. Тогда существуют базисы ей/ пространств V и W, в которых оператор А имеет матрицу Ir 6 ртхп вида ' 1 0 0 ’ 1 О О О в которой все элементы равны нулю, кроме первых г диагональных элементов, равных 1. Доказательство. Возьмем произвольные базисы t и з прост- ранств V и W. Пусть A3t - матрица оператора Л в паре базисов t и s. Тогда, согласно теореме 80.3, rgAat = г. В сиЛу теоремы 16.10 отсюда следует, что матрицы Ast и 1Г эквивалентны. Следовательно (теорема 77.4), они являются матрицами одного линейного оператора. Отсюда вытекает утверждение теоремы. Базисы е и /, в которых оператор Л имеет матрицу' 1Г, называют канонической парой базисов. Теоремой 80.6 решается вопрос о наиболее простой форме матрицы линейно- го оператора, действующего в различных пространствах V и IV. Очевидно, этот вопрос далеко не праздный, так как одному и тому же линейному оператору соот- ветствует целый класс эквивалентных друг другу матриц и выбор самой простой из них упрощает исследование свойств оператора. Остановимся более подробно на одном из частных случаев линей- ных операторов - случае, когда пространство IV совпадает с основным полем Р. § 81. Линейные формы Определение и свойства. Как уже отмечалось в §76, линейное отображение / : V —> Р линейного пространства V над полем Р в это поле называется линейной формой (или линейным функционалом) в пространстве V.
§81. Линейные формы 249 Примеры. 1. Простейшей линейной формой в пространстве V является отображение / : V —> Р, определенное равенством f(x) = О, где 0 е Р. 2. Линейной формой является отображение / : Rn —> R, опреде- ленное следующим правилом: если (zi,..., хп} € Rn, то /(z) = Zj. 3. В пространстве Мп вещественных многочленов степени не выше п линейной формой является отображение f : Мп —> R, определенное правилом: если p(t) & Мп, то /(р) = р(1). Из общей теории линейных операторов следует, что если е i,..., еп - базис пространства V, то линейная форма / € £(V, F) однозначно определяется числами «1 = /(е1)> ctn = /(en)- При этом для произвольного вектора z = z,et в силу линейности / имеем /(z) = ctizi 4-... + апхп . (81-1) Представление (81.1) называется общим видом линейной формы f в базисе ej,..., еп. Числа оч,..., ап называются коэффициентами линейной формы f в базисе ei,..., еп. Линейные формы и гиперплоскость. Теорема 80.5, относяща- яся к линейному оператору общего вида, справедлива и для линейных форм. В терминах линейной формы она означает, что если /(zq) = с, то множество К = {z € V |/ (z) — с} является линейным многообрази- ем Н = zq + L, где L = {z G V|/(z) = 0}. Если / - ненулевая форма, то rg / = 1 и согласно (80.2) dim£ = dimker f = п — 1. Следователь- но, К - гиперплоскость. Этот же факт в координатной форме (81.1) означает, что все решения одного уравнения с п неизвестными 04Z1 + ... + апхп = с образуют гиперплоскость, так что все решения системы линейных ал- гебраических уравнений можно трактовать как пересечение гипер- плоскостей (сравните с теоремой 67.2). Сопряженное пространство. Известно (теорема 78.2), что мно- жество £(V, F) всех линейных форм в линейном пространстве V обра- зует линейное пространство относительно операций сложения и умно- жения на число, введенных в §78 правилами (Л + /г)(а:) = /1(*) + /2(х), (a/)(z) = a/(z). Линейное пространство всех линейных форм на пространстве V называется сопряженным пространством к пространству V. Оно обозначается символом V*. Теорема 81.1. Справедливо равенство dimV* = dimV . Это равенство вытекает из теоремы 78.3 и ее следствия, так как dim Р — 1.
250 Глава XIV. Линейные операторы Следствие. Всякое конечномерное линейное пространство изоморфно своему сопряженному. Это вытекает из теоремы 63.1 об изоморфизме линейных пространств одинаковой размерности. Специальное представление линейной формы в евклидо- вом (унитарном) пространстве. Т еорема 81.2. Для любой линейной формы / в евклидовом (унитарном) пространстве V существует, и притом единствен- ный, вектор h € V такой, что /(т) = (х, h), Vi е V. Доказател ьство. Пусть ei,... ,е„ - ортонормированный базис V и од - коэффициенты линейной формы / в этом базисе. То- гда вектор h = 52"=i <*iei будет искомым в силу (81.1) и (70.7). Един- ственность вектора h следует из того, что если вектор hi удовлетворя- ет требованиям теоремы, то (х, hi) — (х, h), Vx € V, т.е. (х, hi — h) = 0, Vx € V. Так как hi — h 6 V, то отсюда следует, что hi — h — в. и § 82. Алгебра линейных операторов, действующих в одном пространстве Обратимся теперь к линейным операторам, действующим в одном простран- стве. Основной целью наших исследований будет поиск матрицы такого опера- тора, имеющей наиболее простую форму. Однако об этом речь пойдет позже. В ближайших параграфах будут рассматриваться общие вопросы, относящиеся к операторам, действующим в одном пространстве. Пусть V - линейное пространство над полем Р. Рассмотрим мно- жество £(V, V) всех линейных операторов, действующих в простран- стве V. В этом множестве для любых операторов выполнимы не толь- ко сложение и умножение на число, но и умножение операторов друг на друга. Из общей теории линейных операторов вытекают следую- щие факты. 1°. £(V, V) - линейное пространство над полем Р (теорема 78.2). 2°. C(V, V) - некоммутативное кольцо с единицей (см. (79.1)). 3°. Линейное пространство над полем Р, которое является кольцом и удовлетворяет условию 2 из (79.1), называется алгеброй (или линей- ной алгеброй) над полем Р. Размерность линейного пространства при этом называется также размерностью алгебры. Из свойства 1° и (79.1) следует, что C(V,V) - алгебра над полем Р. Отметим, что множество Рпхп квадратных матриц n-го порядка над полем Р также является алгеброй. Примером бесконечномерной алгебры служит кольцо многочленов Р[х]. Может быть построена другая алгебра, в которой нарушена как коммутатив- ность, так и ассоциативность произведения. Примером такой алгебры является множество всех векторов геометрического пространства Vj относительно линей- ных операций над векторами и векторного произведения (§23). 4°. При построении матрицы линейного оператора А € £(V, V) ис- пользуется один базис е пространства V: столбцами этой матрицы
§ 83. Обратный оператор 251 являются коэффициенты разложений векторов Лех,..., Аеп по бази- су ei,... , еп (§77); матрица обозначается символом Ае или (Л)е и называется матрицей оператора А в базисе е. Очевидно, Ае 6 Рпжп. 5°. Линейное пространство £(V, V) изоморфно пространству рпхп и у) — п? (теорема 78.3 и ее следствие). 6°. Как и в любом кольце, оператор A € £(V, V) можно возводить в степень n G N, и если p(t) = аа + a\t 4-... 4- antn - произвольный многочлен над полем Р от переменной t, то однозначно определен оператор р(Л) — oqI 4- йхЛ 4-... 4“ апЛп , (82.1) называемый многочленом от оператора А. Из свойств матрицы ли- нейного оператора следует, что матрицей многочлена (82.1) от опера- тора А является тот же многочлен от матрицы Ае: (р(Л))е = р(Ле). 7°. При переходе от базиса е к базису f = eQ матрица оператора изменяется согласно (77.5) по следующему закону: Af=Q~1AeQ. (82.2) Из (82.2) и (58.6).следует, что одному и тому же линейному опера- тору А & £(V, V) соответствует целый класс матриц, подобных друг другу. 8°. Очевидно, что две матрицы А, В € P"xn no^ognu тогда и только тогда, когда они являются матрицами одного и того же ли- нейного оператора, действующего в п-мерном линейном простран- стве над полем Р (теорема 77.4). 9°. Из (82.2) следует, что все матрицы одного и того же ли- нейного оператора имеют одинаковый определитель. Это означает, что определитель матрицы линейного оператора не зависит от базиса и определяется самим оператором. Определителем линейного опера- тора А € £(V, V) называется определитель матрицы этого оператора в произвольном базисе. Обозначение: det Л. Итак, det Л = det Ле . (82.3) Заметим, что кольцо £(V, V) не является полем хотя бы потому, что оно некоммутативно. К тому же вопрос об обратимости линейных операторов пока остается открытым. § 83. Обратный оператор Напомним определение обратного отображения и некоторые фак- ты (§8) применительно к линейному оператору, действующему в од- ном пространстве. Пусть Л G £(V, V). Отображение Л-1 : V —> V называется обрат- ным оператором к оператору Л, если АА-1 =Л“1Л = 1. (83.1)
252 Глава XIV. Линейные операторы Теорема 83.1. Линейный оператор Л G £(V,V) обратим тогда и только тогда, когда он биективен. Теорема 83.2. Обратный оператор единствен. Исследуем теперь свойства обратимости, относящиеся непосред- ственно к линейным операторам. Т еорема 83.3. Обратный оператор линеен. Доказательство. Пусть A G £(V, V). Покажем, что обратный оператор А~1, если он существует, является линейным оператором, действующим в пространстве V. Действительно, если А обратим, то он биективен и, значит, сюръективен. Это означает, что для любых векторов yi,y2 € V существуют 11,2:2 € V такие, что у\ = Axi, У2 = Ах2- При этом xi = A~lyi, Х2 = А^1уг- Отсюда получим, что A~1(yi + y2) - A-1(Aa:i + Агг) = A-1A(zi + х2) =Xi+x2 =A~1yi + + А~гу2- Аналогично, А-1(ОД1) — A-1(aAEi) — A~lA(axi) — axi = = aA~lyi, Ча G Р. Теорема 83.4. Оператор обратим тогда и только тогда, когда его матрица в произвольном базисе обратима. Доказательство. Пусть А G £(V, V), е - произвольный базис пространства V. Обратимость оператора А означает существование оператора Л-1, удовлетворяющего (83.1). Перейдя в равенстве (83.1) к матрицам операторов в базисе е, получим Ае(А-1)е = (А-1)еАе = 1. Эти равенства совпадают с определением обратной матрицы для мат- рицы Ае. Замечание 1. Попутно показано, что (А-1)е = Ае-1. (83.2) Оператор А € £(V, V) называется невырожденным, если его ядро состоит только из нулевого вектора, т.е. ker А = {0} , (83.3) и вырожденным в противном случае. Теорема 83.5. В конечномерном пространстве V следую- щие утверждения равносильны: для А € £(V, V) 1) АА-1 =2; 4) imA= V; 6) А обратим-, 2) А~1А — 1; 5) detAy^O; 7) А биективен. (83.4) 3) А не вырожден; Доказательство. 1 <=> 2 <=> 5 <=> 6 <=> 7. Пусть е = (ei,... ,еп) - произвольный базис пространства V. В силу свой- ства (79.2) утверждение 1 равносильно матричному равенству
§ 83. Обратный оператор 253 Ле(Л-1)€ = I или, с учетом теоремы 5.3, соотношениям Ле(Ле)-1 = = (Ле)-1Ле = Д эквивалентным (в силу (79.2)) равенствам (83.1) и (в силу теоремы 5.2) условию det /0. (83.5) Это доказывает импликации 1 <=> 5, 1 <=> 2, 1 <=> 6 и, согласно теореме 83.1, 1 <=> 7. 1 <=> 3 <=> 4. Утверждение 1 в сил>г (83.5) равносильно равен- ству TgA = n, (83.6) которое согласно (80.2) эквивалентно тому, что def^ = O. (83.7) Равенство (83.6) означает, что dimim.4 = dimV или, в силу теоре- мы 64.3 о монотонности размерности, что йпЛ = V. Это доказывает импликацию 1 <=> 4. Равенство (83.7) означает, что dim ker Л = 0. Это доказывает импликацию 1 <=> 3. Замечание 2. Теорема 83.5 не верна в бесконечномерном про- странстве. Так, в пространстве всех вещественных многочленов от одной переменной для операторов дифференцирования и инте- грирования 5 имеем 1. DS = Т, но ST> Т; 2. kerS = {в}, однако im<S = {p(t)| р(0) = 0} и не совпадает со всем пространством Мао- Теорема 83.6. Произведение обратимых операторов обра- тимо, при этом {АВ}-1 = B-U-1. Это утверждение уже было доказано в §8 применительно к отобрал жениям общего вида. Следствие 1. Умножение линейных операторов является ал- гебраической операцией на множестве всех обратимых операторов, действующих в пространстве V. Следствие 2. Множество всех обратимых линейных опера- торов из C{V, V) образует неабелеву мультипликативную группу.
Глава XV. Структура линейного оператора в комплексном пространстве Приступим к вопросу о поиске в классе подобных матриц, соответствующих линейному оператору Л € £(V, VQ, матрицы наиболее простого вида. Ответ на этот вопрос совсем прост, когда линейный оператор действует в пространствах V и W, никак не связанных между собой (теорема 80.5). Гораздо интереснее (и сложнее), когда V = W. В первом случае базисы пространств V и W можно было выбирать независимо друг от друга, во втором - необходимо строить базис одного пространства V = W. Мы увидим, к какому разнообразию ответов приводит эта меньшая свобода выбора. Наиболее полные результаты этой главы относятся к случаю, когда V - ком- плексное пространство. § 84. Инвариантные подпространства Пусть V - линейное пространство над полем Р и А € C(V,V). Линейное подпространство L пространства V называется инвариант- ным подпространством относительно оператора А, если для любо- го вектора х из L его образ Ах также лежит в L. Примеры. 1. Тривиальные подпространства {0} и V инвариант- ны относительно любого оператора А € £(V, V). 2. Для любого линейного оператора А инвариантными подпрост- ранствами будут ker Л и im Д, так как если Ах = 0, то Д(Дх) = АО = 0, и если у = Дх, то Ау = Д(Дх) = Arj, где xj — Ах. 3. Для оператора дифференцирования (76.2) в пространстве Мп вещественных многочленов инвариантными подпространствами явля- ются все подпространства Mq, М\,..., Мп-\. Для линейного оператора наличие инвариантных подпространств означает возможность построить базис, в котором его матрица имеет несколько более простую форму, чем матрица общего вида. Теорема 84.1. Пусть А € £(У, V) и L - нетривиальное инвариантное подпространство относительно А. Тогда существу- ет базис пространства V, в котором матрица оператора А имеет квазитреугольную форму. Доказательство. Пусть вх,... ,е* - базис подпространства L. Дополним его до базиса ei,..., еь,е*+1,... ,вп пространства V. Постро- им матрицу оператора А в этом базисе. Из инвариантности L выте- кает, что Двь ... ,Аеь € L и, следовательно, векторы Ае\,... ,Де^-
§ 84. Инвариантные подпространства 255 линейно выражаются только через ej, ... , е*. Таким образом, Xcj = ацв1 4- ... 4- afciCjt, < Лек = aifcfii + • • + а*ке*, -4ejt+i = ai.fc+iei 4- ... 4- ak,k+i^k + • • 4- an,k+ien, (84.1) , -4.^-n — 4" ... 4" 0>kn^k 4" ... 4" a.nnen . Это означает, что матрица Ае имеет вид ан • •• au ai,*+i ^ln А — ajti - • flfcfc Gfc.fc+l fljkn 0 ... 0 flfc+i.fc+i 0 ... 0 Gn.fc+l ^ПП и, следовательно, имеет квазитреугольную форму: (84.2) переход Замечание 1. Верна и теорема, обратная доказанной: от (84.2) к (84.1) очевиден и приводит к тому, что L = £(ej,...,€*,) инвариантно относительно А. Теорема 84.2. Если пространство V является прямой сум- мой нетривиальных подпространств Li,..., Lk, инвариантных от- носительно оператора А € L(V, V), то в пространстве V существу- ет базис, в котором матрица оператора А имеет квазидиагональ- ную форму. Доказательство аналогично доказательству теоремы 84.1. В качестве искомого базиса берется базис е, составленный из базисов слагаемых подпространств (теорема 66.1). Тогда в силу инвариантно- сти подпространств L\,..., Lk матрица Ае имеет вид Ае О (84.3) Замечание 2. Верна и теорема, обратная доказанной. Индуцированный оператор. Рассматривая линейный оператор только на его инвариантном подпространстве, можно получить но- вый оператор. Пусть L - подпространство, инвариантное относитель- но оператора А е £(V, V). Отображение A\L : L -> L, определенное 9 Линейная алгебра и аналитическая геометрия
256 Глава XV. Структура лин. оператора в компл. пространстве равенством (Л|Г)х = Лх, Va: е Г, называется индуцированным оператором, порожденным оператором А или сужением оператора А на подпространство L. В силу линей- ности оператора А индуцированный оператор также является линей- ным. Он совпадает с оператором А на подпространстве L и не опре- делен вне его. Итак, Л|Г € £(L, Г). Замечание 3. Из разложений (84.1) следует, что матрицы Ai, ..., Л*, в (84.3) являются матрицами индуцированных операторов L\,..., Л|Г<к в базисах инвариантных подпространств L\,..., Lk- §85. Собственные значения и собственные векторы Пусть V - линейное пространство над полем Р. Ненулевой вектор х € V называется собственным вектором оператора А € £(V, V), если существует такое число А € Р, что Ах = Хх. (85.1) Число А называется собственным значением оператора А, соответ- ствующим собственному вектору х. Множество всех собственных значений оператора А называется спектром этого оператора. Примеры. 1. В пространстве вещественных многочленов Мп лю- бой многочлен нулевой степени является собственным вектором опера- тора дифференцирования (76.2), ему соответствует собственное зна- чение А — 0. 2. Для оператора проектирования (76.3) любой ненулевой вектор из Lt будет собственным вектором, отвечающим собственному значе- нию А = 1, так как Рх = х, Ух € Lj, а любой ненулевой вектор из L2 будет собственным вектором, отвечающим собственному значению А = 0, так как Рх = Ох, Ух € Гг- Из определения следует, что если х - собственный вектор операг тора А, отвечающий собственному значению А, то любой вектор ах, где а 0, также является собственным вектором оператора А, от- вечающим тому же собственному значению А. Это означает, что лю- бой собственный вектор порождает целое одномерное подпростран- ство собственных векторов, из которого исключен вектор в. Таким образом, в отношении собственных векторов понятие “различные” не имеет содержательного смысла, существеннее ставить вопрос об их линейной независимости. Теорема 85.1. Собственные векторы х^,... ,х^ оператора, отвечающие различным собственным значениям Ai,..., А&, линейно независимы. Доказательство. Применим индукцию по к. Для к = 1 утвер- ждение заведомо верно, так как собственный вектор является нену- левым по определению. Пусть оно верно для любой системы из к — 1
§ 86. Характеристический многочлен 257 векторов. Докажем его для к векторов Х{,... ,хк. Приравняем нуле- вому вектору линейную комбинацию этих векторов: aixi + ... + акхк - 0. (85.2) Под действием оператора А это равенство перейдет в равенство diAiii + ... 4- akXkxk = 0. (85.3) Умножая обе части (85.2) на Хк и вычитая полученное равенство из (85.3), получаем, что Oi(Ai - Хк)ху +... + ak_i(Xk~i - Хк)хк~i = 0. В силу индуктивного предположения отсюда следует, что от — ... = — ak-i = 0. Тогда (85.2) перейдет в равенство акхк — 0. Так как хк 0, то ак = 0. Итак, в (85.2) все коэффициенты равны нулю. Следовательно, х.[,..., хк линейно независимы. Следствие. Линейный оператор, действующий в п-мерном пространстве, не может иметь более чем п различных собствен- ных значений. Не всякий линейный оператор обладает собственными векторами. Например, в геометрической плоскости V? оператор поворота на угол <р, не кратный тг, не имеет ни одного собственного вектора, так как ни один ненулевой вектор после такого поворота не останется коллинеарным самому себе. Выясним вопрос о су- ществовании собственных векторов. § 86. Характеристический многочлен Определение, основные свойства. Это понятие уже встреча- лось в §58 в связи с матрицами второго и третьего порядков. Остано- вимся теперь на нем более подробно. Характеристическим многочленом матрицы A g Pnxn называ- ется функция /(А) = det(A -XI), Хе Р. (86.1) Теорема 86.1. Характеристический многочлен (86.1) матрицы А € рпхп является многочленом п-й степени от пере- менной X над полем Р. Доказательство. Пусть А = (otJ) G РпХп. Тогда ац — А 012 О1П /(А) = 022 — А О2п ОП1 ОП2 опп — А Каждый элемент матрицы А — XI представляет собой многочлен от А степени не выше 1, значит, каждый член det(4 — XI) является мно- гочленом от А степени не выше п. Отсюда следует, что /(А) - мно- гочлен от А, степень которого не превосходит п. Осталось показать, что степень этого многочлена в точности равна п. Действительно, все члены det (Л - XI), отличные от (ац - А)(агг - А)... (апп - А), име- ют степень, не превосходящую п — 2, следовательно, в многочлене /(А) слагаемые, содержащие А”-1 и Ап, определяются только членом
258 Глава XV. Структура лин. оператора в компл. пространстве (86.3) Z1. (оц — А)(й22 — А)... (апп — А), который согласно формулам Виета име- ет вид (—А)” + (ап + 022 + • • + апп)(—А)п-1 + дп_г(А), где ^п_2(А) - многочлен от А степени не выше п — 2. Таким образом, /(А) = ао + Oi(—А) + а2(—А)2 + ... 4- ап_1(—А)п 1 + (—А)п (86.2) является многочленом п-й степени от А над полем Р. Замечание 1. Попутно найден коэффициент an_j характери- стического многочлена (86.2): an_j = оц + ••• + ann. Кроме того, ао = /(0) = det А. Более того, нетрудно показать (используя свойства определите- ля), что an-k равен сумме главных миноров fc-ro порядка матрицы А. Итак, в (86.2): ao = det A, an~i = tr А, an_fc - сумма главных миноров fc-ro порядка матрицы Т еорема 86.2. Характеристические многочлены подобных матриц совпадают. Доказательство теоремы и сама теорема приводятся в §58 (теорема 58.1). Следствие. Все матрицы одного и того же линейного опе- ратора имеют одинаковые характеристические многочлены. Таким образом, характеристический многочлен матрицы линейно- го оператора не зависит от базиса, а определяется самим оператором. Характеристическим многочленом оператора называется функ- ция /(А) = det(A - AZ), A G Р. Из (82.3) следует, что характеристический многочлен оператора со- впадает с характеристическим многочленом матрицы этого оператора в произвольном базисе. Из следствия и второго равенства (86.3) вытекает, что след мат- рицы Ае линейного оператора А не зависит от выбора базиса е. По- этому (как и в §82, п.9) можно ввести понятие следа оператора ра- венством tr А = tr Ае- Теорема 86.3. Характеристический многочлен индуциро- ванного оператора является делителем характеристического мно- гочлена порождающего оператора. Это утверждение следует из (84.2) и замечания 3 из §84. Теорема 86.4. Если V = L\ ф ... ф Lk - прямая сумма подпространств Li,..., Lk, инвариантных относительно опера- тора А € £(V, V), тпо характеристический многочлен /(А) опера- тора А равен произведению характеристических многочленов А(А),.. •, fk(A) индуцированных операторов A[Li,... /(А) = Л(А)...А(А). (86.4)
§ 86. Характеристический многочлен 259 Утверждение является следствием теоремы 84.2. Условие существования собственных векторов линейного опера- тора определяется его характеристическим многочленом. Теорема 86.5. Пусть V - линейное пространство над по- лем Р. Число А € Р является собственным значением оператора А € £(У, V) тогда и только тогда, когда А - корень его характери- стического многочлена. Доказательство. Согласно определению число А является соб- ственным значением оператора А тогда и только тогда, когда суще- ствует вектор х, удовлетворяющий условиям ' Ах = Хх, (Л — Х1)х = в, 1 х / в, <=> < х О, . Ае Р, АеР. Это равносильно вырожденности оператора А — XI при некотором А G Р или, в силу (83.4), условию беЦЛ - XI) = 0 (86.5) при некотором А € Р. Таким образом, число А является собствен- ным значением оператора А тогда и только тогда, когда оно является корнем характеристического многочлена оператора А, принадлежа- щим полю Р. Уравнение (86.5) называется характеристическим уравнением для оператора А. Корни характеристического многочлена называются характери- стическими числами оператора. Согласно теореме 86.5 собственными значениями оператора являются характеристические числа из основ- ного поля, и только они. Собственные векторы линейного оператора в комплекс- ном пространстве. Итак, вопрос о существовании собственных век- торов сводится к вопросу о существовании корней характеристическо- го многочлена, принадлежащих основному полю. Известно, что не во всяком поле многочлены имеют корни. Однако, как показано в §49, в алгебраически замкнутом поле С комплексных чисел любой мно- гочлен степени п > 1 имеет п корней, если каждый корень считать столько раз, какова его кратность. Отсюда в соответствии с теоре- мой 86.5 вытекают следующие утверждения. Т е о р е м а 86.6. Произвольный линейный оператор, дейст- вующий в п-мерном комплексном пространстве, имеет: 1) п собственных значений, если каждое собственное значение считать столько раз, какова его кратность как корня характери- стического многочлена; 2) хотя бы один собственный вектор; 3) на любом своем инвариантном подпространстве хотя бы один собственный вектор.
260 Глава XV. Структура лип. оператора в компл. пространстве Последнее утверждение следует из того, что индуцированный опе- ратор, как и любой оператор, действующий в комплексном простран- стве, имеет собственный вектор, который, очевидно, является соб- ственным вектором основного оператора. Замечание 2. Теорема86.6 остается справедливой в веществен- ном пространстве для тех операторов, чьи характеристические мно- гочлены имеют только вещественные корни. Способ нахождения собственных векторов. Этот способ оп- ределен теоремой 86.5 и состоит в следующем. 1. Строится характеристический многочлен оператора А и нахо- дятся его корни. Те корни, которые принадлежат полю Р, будут соб- ственными значениями оператора. 2. Для каждого найденного собственного значения Aq находятся ненулевые векторы ядра оператора А - A0Z. Они и будут собственны- ми векторами, отвечающими Aq. Если ei,..., еп - базис пространства V, то поиск собственных векторов сводится к решению однородной системы уравнений (Ае — Ао!)те = 0, фундаментальная система ре- шений которой дает полный набор линейно независимых собственных векторов, отвечающих Ао, в координатах относительно базиса е. Замечание 3. Прием, описанный здесь, представляет собой лишь теоретическую основу решения проблемы собственных значе- ний и собственных векторов. Для реальных вычислений он нужда- ется в специальных приемах, так как поиск корней многочлена в об- щем случае (исключая разве что многочлены второй степени) сопря- жен с дополнительными трудностями. Уже для многочленов степени п > 5 задача нахождения корней неразрешима в радикалах (доказано Э.Галуа в 30-х гг. прошлого столетия). Этот результат оказал решаю- щее влияние на развитие вычислительных методов решения пробле- мы собственных значений. Их изложение не входит в нашу задачу, однако отметим, что вычислительные алгоритмы поиска собственных значений, как правило, не связаны с многочленами. В ручных вычислениях иногда удается найти собственные значе- ния, минуя прямое построение характеристического многочлена, если вычислять определитель матрицы А — XI методом выделения линей- ных множителей. Этот метод основан на выполнении элементарных преобразований, формирующих в какой-либо строке (столбце) матри- цы А — XI общий множитель вида А — а, который затем выносится за знак определителя. Это дает корень А = а характеристического многочлена. § 87. Собственное подпространство Пусть Aq - собственное значение оператора А. Множество ИД ={хе V|Ac = Aox} (87.1)
§ 88. Операторы простой структуры 261 называется собственным подпространством оператора А, отвечаю- щим собственному значению Aq. Очевидно, что = кег(_4 — Ао1), поэтому собственное подпрост- ранство является линейным подпространством пространства V. Из (87.1) следует, что собственное подпространство W\o состоит из ну- левого вектора в и всех собственных векторов, отвечающих Ао- Лег- ко проверить, что собственное подпространство инвариантно отно- сительно оператора А. Размерность собственного подпространства W\a называется геометрической кратностью собственного значения Ао, а кратность Ао как корня характеристического многочлена — его алгебраической кратностью. Теорема 87.1. Геометрическая кратность собственного значения не превосходит его алгебраической кратности. Доказательство. Пусть т и s - алгебраическая и геометриче- ская кратности собственного значения Ао оператора А £ £(V, V). Собственное подпространство инвариантно относительно опе- ратора А, следовательно, можно рассматривать индуцированный опе- ратор Д|ИД0. Найдем его характеристический многочлен /ДА). Пусть ei,...,es - базис И\о. Тогда согласно (87.1) матрицей опера- тора А| Wx0 в этом базисе будет диагональная матрица s-го порядка с элементами Aq на главной диагонали. Следовательно, /ДА) = (Aq—А)5. Согласно теореме 86.3, (Aq — A)s является делителем характеристиче- ского многочлена /(А) оператора А, но (Ао — А) входит в характери- стический многочлен /(А) ровно т раз. Значит, з < т. Теорема 87.2. Сумма собственных подпространств опе- ратора, отвечающих различным собственным значениям, является прямой суммой. Доказательство. Пусть Aj,..., Ар - попарно различные собст- венные значения оператора А. Тогда для собственных подпрост- ранств IVaj ,..., выполнено условие прямой суммы (теорема 66.1): любая система ненулевых векторов, взятых по одному из каждого Идк, линейно независима как система собственных векторов, отвеча- ющих различным собственным значениям (теорема 85.1). § 88. Операторы простой структуры Критерии простой структуры. Линейный оператор А € £(V, V) называется оператором простой структуры, если в пространстве V существует базис из собственных векторов опера- тора А. Теорема 88.1. Линейный оператор A G £(V, V) имеет про- стую структуру тогда и только тогда, когда в пространстве V существует базис, в котором он имеет диагональную матрицу. Доказательство. Пусть dim V = п. Согласно определению опе- ратор А имеет простую структуру тогда и только тогда, когда он имеет п линейно независимых собственных векторов ei,...,en. Это
262 Глава XV. Структура лин. оператора в компл. пространстве равносильно существованию базиса ej,..., вл, в котором матрица Ае оператора А имеет вид (88.1) где Ai,..., Ап - собственные значения, соответствующие собственным векторам ei,..., еп. Следствие. В п-мерном пространстве линейный оператор, имеющий п различных собственных значений, является оператором простой структуры. Обратное утверждение не верно. Тождественный оператор имеет простую струк- туру, однако все его собственные значения равны 1. В соответствии с (88.1) оператор простой структуры называют также диагонализуемым оператором. Теорема 88.2. Линейный оператор A G £(V, V) имеет про- стую структуру тогда и только тогда, когда все его собственные подпространства в прямой сумме дают все пространство V: Wx,®...®WXp=V. (88.2) Доказательство. Необходимость. Пусть А имеет простую структуру. Тогда в пространстве V существует базис е\,...,еп, со- стоящий из собственных векторов оператора А. Рассмотрим подпро- странство IVA1 -I-... 4- WAp. Очевидно, оно содержится в V. С другой стороны, каждый вектор базиса ei,...,en принадлежит одному из собственных подпространств, поэтому V С W^. Следовательно, IVA1 + ... + W\p = V. Но эта сумма является прямой в силу теоре- мы 87.2. Достаточность вытекает из критерия прямой суммы (теоре- ма 66.1): совокупность базисов собственных подпространств WAk, к = = 1, р, образует базис V, тем самым пространство V имеет базис из собственных векторов оператора А. Замечание 1. На основании теоремы 66.1 условие (88.2) может быть заменено равносильным условием dim WA1 + ... + dim ЖЛр = dim V. (88.3) Теорема 88.3. Линейный оператор, действующий в комп- лексном пространстве, имеет простую структуру тогда и только тогда, когда для каждого собственного значения этого оператора геометрическая кратность совпадает с алгебраической.
§ 88. Операторы простой структуры 263 Доказательство. Пусть Ai,...,Ap, где А, / Aj при г / j, - все различные_собственные значения оператора А € t(V, V) и пусть mfc и з*, А = 1,р, - алгебраические и геометрические кратности Хк- Так как V - комплексное пространство, то, согласно теореме 86.6, dim V = mi + ... + mp. С другой стороны, 0 < dimW\k = < m*, к = 1,р, поэтому равенство (88.3) возможно тогда и только тогда, когда = mfc, А = 1,р. (88.4) Замечание!. Теорема 88.3 в вещественном пространстве верна для тех операторов, характеристические многочлены которых имеют только вещественные корни. Матричная формулировка операторных свойств. Точно так же, как и для линейных операторов А € £(V, V), определяются соб- ственные значения и собственные векторы квадратной матрицы А € е рпхп. Ненулевой вектор-столбец х € Рп называется собственным вектором матрицы А € рпхп, существует число А € Р такое, что Ах = Хх. При этом число А называется собственным значением матрицы А, соответствующим собственному вектору х. Если е = (ei,..., еп) - произвольный базис пространства V, то для оператора А € £(V, V) имеет место импликация Ах = Ai <=> Л£1е = Aie . (88.5) Это означает, что собственные значения оператора А и его матри- цы в любом базисе е = (ei,..., еп) совпадают, а собственные векторы матрицы Ае являются координатными столбцами собственных век- торов оператора А в этом базисе. Характеристические многочлены оператора и его матрицы совпа- дают по определению, поэтому для квадратных матриц А € рпхп имеют место теоремы 86.5 и 86.6. Эта идентичность свойств оператора и его матрицы, замеченная уже в связи с первыми свойствами оператора (§77), продолжает на- блюдаться. Квадратная матрица A G рпхп называется матрицей простой структуры, если она имеет п линейно независимых собственных век- торов. Из (88.5) следует, что линейный оператор является оператором простой структуры тогда и только тогда, когда его матрица в любом базисе имеет простую структуру. Теорема 88.4 (матричная формулировка теоремы 88.1). Квадратная матрица является матрицей простой струк- туры тогда и только тогда, когда она подобна диагональной.
264 Глава XV. Структура лип. оператора в компл. пространстве Доказательство. Пусть А € Рпхп - заданная матрица. Рас- смотрим произвольное линейное пространство V над полем Р раз- мерности п. Зафиксируем в пространстве V произвольный базис f. Пусть А € £(У, V) - линейный оператор, матрица которого в базисе f совпадает с матрицей А, так что А = А/ (согласно теореме 77.1 такой оператор существует). Матрица А = Af имеет простую струк- туру тогда и только тогда, когда А - оператор простой структуры. В силу теоремы 88.1 это равносильно существованию базиса е, в ко- тором оператор А имеет диагональную матрицу (88.1). Таким обра- зом, матрица А имеет простую структуру тогда и только тогда, ко- гда она и диагональная матрица (88.1) являются матрицами одного оператора. Это равносильно их подобию (§82). Замечание 3. Доказательство теоремы можно схематически изо- бразить в виде лаконичной диаграммы, которой мы неоднократно бу- дем пользоваться: (88.6) Замечание 4. Теорема может быть доказана и на матричном языке. Действительно, матрица А является матрицей простой струк- туры тогда и только тогда, когда она имеет п линейно независимых собственных векторов sj,..., sn & Рп. Это равносильно следующей цепочке равенств: если S = [«i.. . sn] - матрица, столбцами которой являются собственные векторы sj,..., sn, а Л - диагональная матри- ца с собственными значениями Ах,..., Хп на главной диагонали, то Asi — AiS] Азп — Ansn <=> А[«!...sn] = [si...sn]A <=> AS — SA <=> A = SAS~l. Жорданова клетка. Итак, самой простой формой матрицы об- ладают только операторы простой структуры, т.е. операторы, имею- щие полный набор линейно независимых собственных векторов. Как мы уже отмечали, в вещественном пространстве существуют опера- торы, которые не имеют ни одного собственного вектора. И в ком- плексном пространстве не каждый линейный оператор обладает не- обходимым для базиса числом линейно независимых собственных век- торов. Рассмотрим важный пример.
§ 89. Треугольная форма матрицы линейного оператора 265 Матрица Л(А0) = ’ Ао 1 0 ... О 0‘ О Ао 1 ... О О О О О ... Ао 1 О О О ... О Ао (88.7) называется жордановой клеткой к-го порядка. Эта матрица имеет: 1) характеристический многочлен /(А) = (Aq — A)fc ; 2) собственное значение А = Ао алгебраической кратности к; 3) собственные векторы, являющиеся нетривиальными решениями однородной системы уравнений с матрицей Г0 1 0 ... 0 0 1 0 0 1 ... 0 0 В = Л(А0) - A0Z = 0 0 0 ... 0 1 L о 0 0 ... 0 о J ранг которой, очевидно, равен к — 1. Таким образом, матрица Jk(Ao) (или оператор, задаваемый этой матрицей) имеет (теорема 30.2) один линейно независимый собственный вектор (fc — (Л: — 1) = 1) и не может быть матрицей простой структуры. § 89. Треугольная форма матрицы линейного оператора Теорема 89.1. В п-мерном комплексном пространстве V для любого линейного оператора А € £(V, И) существует система п вложенных друг в друга инвариантных подпространств L\,.., ,Ln всех размерностей от 1 до п, т.е. таких, что LiC L2G ... с Ln = V, (89.1) где dimL* = k, k = 1, n. Доказательство. Используем индукцию по п. Для п = 1 утвер- ждение теоремы очевидно. Пусть теорема верна для всех линейных пространств размерности п — 1. Докажем ее для п-мерного простран- ства V, воспользовавшись следующей леммой. Лемма. Линейный оператор, действующий в п-мерном комп- лексном пространстве, обладает инвариантным подпространст- вом размерности п — 1. Доказательство леммы. Линейный оператор А, действую- щий в комплексном пространстве V, имеет собственное значение А (те- орема 86.6). Значит, det (Л — АТ) = 0 и rg(X-AI) < п-1. Следователь- но, dim пп(Д—АТ) < n—1 и в пространстве V существует подпростран- ство L размерности п - 1, которое содержит im(X — АТ). Очевидно,
266 Глава XV. Структура лин. оператора в ком пл. пространстве L инвариантно относительно оператора А — XL. Покажем, что оно ин- вариантно и относительно А. Пусть т € L, тогда (Л — Х£)х — у € L. Отсюда следует, что Ах — Ах + у € L. Лемма доказана. Вернемся к доказательству теоремы. Согласно лемме оператор Л, действующий в тг-мерном комплексном пространстве V, имеет ин- вариантное подпространство Ln-i размерности п — 1. Тогда инду- цированный оператор Д|£п_1 действует в (п - 1)-мерном комплекс- ном пространстве Ln-i и согласно индуктивному предположению для него существует система вложенных инвариантных подпространств Li С ... С Ьп-1 таких, что dlmLfc = k, к = l,n—1. Так как действия операторов А и Д|ГП_1 совпадают, то подпространства Li,...,Ln_i инвариантны относительно оператора А. Остается до- бавить, что Гп_] С Ln = V. Теорема 89.2. Для любого линейного оператора А, дей- ствующего в комплексном пространстве, существует базис, в ко- тором матрица линейного оператора имеет треугольную форму. Доказательство. Согласно теореме 89.1 для оператора А най- дется система инвариантных подпространств Lj,...,Ln таких, что dimLfc = к и Lj С ... С Zn-i С Ln = V. Искомый базис ei,...,en строим так: в качестве ei берем любой базис Lj, в качестве е^, где к > 1, - вектор, дополняющий базис Lk-i до базиса Lk. В силу ин- вариантности подпространств Lk , к — 1,п, матрица Ле имеет верх- нюю треугольную форму. Замечание 1. Перенумерацией построенного базиса в обратном порядке можно получить нижнюю треугольную форму матрицы ли- нейного оператора. Замечание 2. На главной диагонали матрицы Ае расположены собственные значения оператора Д. Теорема 89.3. Любая квадратная комплексная матрица подобна матрице, имеющей треугольную форму. Доказательство теоремы повторяет доказательство теоремы 88.4 и ведется по схеме (88.6). § 90. Нильпотентный оператор Линейный оператор А € £(V, V) называется нильпотентным, если существует число q € N такое, что А4 = О. Наименьшее число q, обладающее этим свойством, называется индексом нильпотентно- сти (высотой) оператора А. Очевидно, что индекс нильпотентности ненулевого оператора удовлетворяет неравенству q > 2. Аналогично определяется нильпотентная матрица А С Р”хп и ее индекс. Примеры. 1. В пространстве вещественных многочленов Мп опе- ратор дифференцирования (76.3) является нильпотентным операто- ром индекса n + 1.
§ 90. Нильпотентный оператор 267 2. Жорданона клетка г0 1 0 . . 0 01 Л(0) = 0 0 1 . . 0 0 0 0 0 . . 0 1 L о 0 0 . . 0 о J является нильпотентной матрицей индекса к. Теорема 90.1. Если А € £(V,V) - нильпотентный опера- тор индекса q и xq € V - вектор, для которого A4~1xq в, то векторы Xq,Axq,...,A‘i 1х0 (90.1) линейно независимы. Доказательство. Рассмотрим равенство agio + сцЛто + • • • + + <хд_ 1Л<?-1то = в. Применяя последовательно операторы Л’-1, Д'7-2, ... , Л к обеим частям этого равенства, получим, что од — Qi = ... = = aq-i = 0. Это доказывает линейную независимость системы век- торов (90.1). Следствие К Индекс нильпотентности не превосходит раз- мерности пространства. Теорема 90.2. В комплексном пространстве линейный оператор нильпотентен тогда и только тогда, когда все его соб- ственные значения равны нулю. Доказательство. Необходимость. Если А - собственное значение нильпотентного оператора А € £( V, V) индекса q и х - соот- ветствующий собственный вектор, то, как нетрудно проверить, имеет место цепочка импликаций Ах = Ах => А2х = А2х =>...=> Ачх = Хчх. Отсюда следует, что Xqx - в. Так как х 0, то А = 0. Достаточность. Рассмотрим базис е комплексного простран- ства V, в котором оператор А имеет верхнюю треугольную матрицу (§89), главная диагональ которой состоит целиком из нулей (§89, за- мечание 2). Итак, <112 0 0 0 <Чз ^23 0 0 а1п <*2п <1п— 1,п о Как нетрудно проверить, при последовательном возведении этой мат- рицы в степени q = 2,3,... ,п нетривиальный треугольник, располо- женный над главной диагональю, перемещается каждый раз на одну диагональ выше, так что (Ле)” = О. Значит, Ап = О. Замечание. Необходимость этого утверждения, как видно из самого доказательства, имеет место и в вещественном пространстве. Прямая сумма операторов. Если V = Li ® L2 ® ® Lp - прямая сумма подпространств Li,L2, • •, Lp, инвариантных относи- тельно линейного оператора А € £(V, V), то оператор А называет-
268 Глава XV. Структура лин. оператора в компл. пространстве ся прямой суммой индуцированных операторов Д|Г1,..., Д|£р. Этот термин мотивирован тем обстоятельством, что для любого вектора х G V с разложением х — Xi + ... + хр, где хк 6 Lk, к = 1,р, имеет место равенство Ах = Ах\ + ... + Ахр = (Д|Г1 )a?i + ... + (Д|£р)а:р. Теорема 90.3. Вырожденный и не нильпотентный линей- ный оператор А € £(V, V) является прямой суммой нильпотентно- го и обратимого операторов, причем это разложение единственно. Доказательство. Для доказательства теоремы необходимо по- казать, что существует единственная пара подпространств Li, Га, ин- вариантных относительно линейного оператора А и таких, что V = = L\®L2, Д|ГХ нильпотентен, Д|Г2 обратим. Существование. Обозначим для к G N №=кегД*, Тк = 1тАк. 1. Покажем, что подпространства Nk строго вложены друг в дру- га до некоторого момента q, начиная с которого все Nk совпадают, т.е. м С N2 с ... С Nq = Nq+l = ... (90.2) а) Вложение Nk С Nk+i очевидно, так как если Акх — в, то Ak+ix = А(Ак) = А0 = 6. б) Пусть Nk = Nk+1, тогда Nk+1 - Nk+2, так как А\+1 С Nk+2, Nk+2 С Nk+i. Второе из этих вложений следует из того, что если х £ Мг+2, то Д*+2а: = 0, т.е, Дк+1(Дх) = 0. Значит, Ах € Nk+i = Nk, откуда Дк(Да:) = в, т.е. Дк+1х — в. Из “ал и “б” следует, что подпространство Nk либо строго вложено в TVfc+i, либо совпадает со всеми последующими ядрами. Так как в конечномерном пространстве размерности подпространств Nk не мо- гут бесконечно возрастать, то наступит момент q, начиная с которого все ядра Nk будут совпадать с Nq. 2. Зафиксируем этот момент q и покажем, что V = Nq®Tq. Действительно, dimV = dimXg + dimTg в силу теоремы 80.4 о ранге и дефекте, при этом Nq A Tq — {0}, так как если у & Nq, у € Tq, то Ачу — 0, у = Aqx, т.е. A2qx — в. Значит, х G N2q — Nq и Aqx = в, откуда следует, что у = в. 3. Подпространства Nq, Tq инвариантны относительно Д, ибо: а) если х £ Nq, то х € X<?+i = Nq, поэтому Aq+1x = в, т.е. Д’(Да;) = 0, следовательно, Ах G Nq; б) если у е Tq, то у = Aqx и Ау = Д9+1а: =Д<!(Да:) = Aqxi, где xi = Ах, следовательно, Ay G Tq. 4. Оператор Д|ХФ - нильпотентный оператор индекса q, так как: a) Aqx = 6 для любого вектора х & Nq, б) существует вектор а:о € Nq такой, что Aq_1xo в, ибо Nq_i / Nq 5. Оператор Д|Т9 обратим, так как его ядро состоит только из нулевого вектора. Действительно, если у & ker Д|Г9, то у € Tq, Ау = 0,
§ 91. Корневые подпространства 269 т.е. у = Ачх и Ач+1х — в. Отсюда следует, что х е Nq+t = Nq, т.е. Ачх = 9 и у = 9. Утверждения пгт. 2-5 доказывают существование искомого раз- ложения: Li — Nq, Lj =Tq. Единственность. Пусть существует другое разложение V = = N ф Т, обладающее всеми свойствами первого. 1. Нильпотентность оператора A\N означает, что Акх = 0, Vi € N, при некотором к € N. Следовательно, N С С Nq и dim N < dim Nq. (90.3) 2. Обратимость оператораЛ|Т означает, что Ш1Л|Т = Т. Следова- тельно, для любого вектора у € Т имеет место представление у = Ayi, где у\ € Т. Используя такое же представление для вектора yi и всех последующих, получаем, что у = Ayi = А2у? = ... — Aqyq. Таким образом, Т С Tq и dimT < dim7,. (90.4) Так как dimN + dimT = dimV = dim/V, + dimT, , то из (90.3), (90.4) следует, что 'N ~ Nq, Т = Tq.U Следствие 2. Оператор А на подпространстве Nq имеет толь- ко нулевые собственные значения, а на подпространстве Tq не име- ет нулевых собственных значений. Это вытекает из доказанной те- оремы с учетом теоремы 90.2 и того, что обратимый оператор не выро- жден. Следствие 3. Для оператора А, действующего в комплекс- ном пространстве V, с характеристическим многочленом /(А) = = det(X - AZ) = (-A)mi (А2 - А)"12... (Ар - А)т<>: а) характеристические многочлены /1(А) и /г (А) операторов и Л|Т9 имеют вид Л(А) = (-А)т‘, /2(А) = (А2 - А)"12... (Ар — А)гп₽; (90.5) 6) при этом dim У, = mi, dimTq = m2 + ... + mp. (90.6) Соотношение (90.5) вытекает из (86.4), если учесть, что /2(0) / 0. Соотношение (90.6) следует из (90.5), так как размерность простран- ства совпадает со степенью характеристического многочлена. §91. Корневые подпространства Теоремой 90.3 осуществляется одновременное расщепление пространства V = = Л'ч ф Тч, характеристического многочлена /(А) = /1(А)/2(А)и самого оператора А на индуцированные операторы X|/Vg и Л|Т9. Такое расщепление направлено на выделение во всем пространстве V максимального подпространства Nq, на
270 Глава XV. Структура лин. оператора в компл. пространстве котором оператор А имеет только пулевые собственные значения. Этот же прием может быть использован и для других собственных значений. Корневые векторы. Пусть Xj - собственное значение оператора А. Вектор х € V называется корневым вектором оператора Д, отве- чающим собственному значению Xj, если (Д—Xjl)kx = 0 при некото- ром k & Z, к > 0. Высотой корневого вектора называется наименьшее к, обладающее указанным свойством. Очевидно, высота нулевого кор- невого вектора (и только нулевого) равна нулю. Отметим простейшие свойства корневых векторов, вытекающие из определения. 1. Корневые векторы высоты 1 являются собственными векто- рами, так как удовлетворяют условиям (Л — Xjl)x = в, х 6. 2. Если х - корневой вектор высоты к > 0, то вектор (А — XjT)x является корневым вектором высоты к — 1. 3. Корневые векторы различных высот линейно независимы. До- казательство этого утверждения аналогично доказательству теоре- мы 90.1. Отсюда следует, что если х - корневой вектор высоты к > 0, то векторы х, (Д — Xjl)x,..., (Д — Xjl)k~lx линейно независимы, следовательно, высота корневого вектора не превосходит размерности пространства. Корневые векторы высоты k > 1 называются присоединенными векторами (fc — 1)-го порядка. Итак, если х - присоединенный вектор (Л-1)-го порядка, то (A-Xjl)kx — 0, (Л-Xjl)k~lx.j^ 0 или, другими словами, (Д — Xjl}k~lx - собственный вектор оператора Д, отвечаю- щий собственному значению Xj. Таким образом, корневой вектор - это либо нулевой вектор, либо собственный вектор, либо присоединенный вектор. Корневые подпространства. Множество всех корневых векто- ров оператора Д, отвечающих собственному значению Xj, называется корневым подпространством оператора А, отвечающим собствен- ному значению Xj. Обозначение: К\.. Итак, = {х е V 13k е Z, к > 0 : (Д - Х31)кх = 0}. (91.1) Опишем структуру корневого подпространства К\.. 1. Сдвиг оператора Д. Рассмотрим оператор В = А — Xjl или, как часто говорят, выполним сдвиг оператора А на Xjl. Лемма 1. Собственные значения операторов А и В связаны соотношением XB = XA-Xj. (91.2) Это утверждение проверяется непосредственно.
§ 91. Корневые подпространства 271 Лемма 2. Если /(А) = (Aj - A)m‘... (Aj - А)'Г. .. (Ар - A)mc- характеристический многочлен оператора А, то /(А) = (Ai - А, - А)"1’... (-А)"У ..(Ар - А, - А)тР (91.3) - характеристический многочлен оператора В. Это утверждение вытекает из леммы 1. Лемма 3. Если подпространство L инвариантно относи- тельно оператора В, то оно инвариантно относительно операто- ра А. В самом деле, если х & L, то Вх € L, т.е. у = (А — Xjl)x € L. Следовательно, Ах = у + XjX € L. 2. Разложение оператора В в прямую сумму нильпотентного и обратимого операторов. Из (91.3) следует, что В - вырожденный (так как имеет нулевое собственное значение), но не нильпотентный (так как имеет ненулевое собственное значение). Следовательно, к опера- тору В применима теорема 90.3 о прямой сумме нильпотентного и обратимого операторов. Согласно этой теореме, если Nx = ker В*, Тд = imB*, то 51 С N2 С . . . С Nq = Nq+l = ... (91.4) V = Nq @Tq, где Nq и Tq инвариантны относительно В, оператор В| „ нильпотентен, а оператор В|т обратим. 3. Структура корневого подпространства. Вернемся к оператору А. Из цепочки вложений (91.4) следует, что а) 51 состоит из корневых векторов оператора А высоты, не пре- восходящей 1, т.е. совпадет с собственным подпространством , от- вечающим собственному значению А?. Таким образом, 5i = WXj (91.5) и, следовательно, dim 5i =Sj, (91.6) где Sj - геометрическая кратность собственного значения Aj; б) 5j состоит из корневых векторов оператора А высоты, не пре- восходящей 2, a Nq состоит из корневых векторов всех высот, т.е. q - максимальная высота корневого вектора, отвечающего собственному значению А7 , и Nq совпадает со всем корневым подпространством Кх,. Таким образом, КХ] = Nq (91.7) и цепочка вложений (91.4) может быть выстроена следующим обра- зом: И<д. =51С^С...С5, = 5,+1 = КАГ (91-8)
272 Глава XV. Структура лин. оператора в компл. пространстве Из свойств подпространства Nq вытекают важные свойства корне- вых подпространств: если характеристический многочлен оператора А имеет вид /(A) = (At-A)^...(A>-A)mj...(Ap-A)mf А, Afc при i ± к, (91-9) то а) подпространство KXj инвариантно относительно оператора А (в силу инвариантности относительно В и леммы 3); б) характеристический многочлен оператора имеет вид Л(А) = (А, - Х)т, (91.10) (это следует из (90.5) и леммы 2); в) dimXxj —nij, (91.11) (это следует из (90.6)). Замечание 1. Из (91.8) следует, что максимальная высота q корневых векторов, отвечающих собственному значению Aj, совпада- ет с индексом нильпотентности оператора А — Xjl и согласно свой- ству 3 не превосходит размерности КХ], т.е. алгебраической кратности собственного значения Xj. Из (91.8) следует также, что собственное подпространство WXj является подпространством корневого подпространства КХ-, так что sj < mj. При этом WXj = КХ] = mj. (91.12) Таким образом, цепочка (91.8) дает еще одно доказательство тео- рем 87.1 и 88.3. Теорема 91.1 (о расщеплении линейного оператора). Если А - линейный оператор, действующий в комплексном простран- стве V и /(A) = (A1-A)m»...(Ap-A)mr, А,/Ак (г / к) - его характеристический многочлен, то пространство V разлага- ется в прямую сумму его корневых подпространств: V = KXi®...®KXp. (91.13) Доказательство. Воспользуемся индукцией по р.Для р = 1, очевидно, V — Кх,. Пусть теорема верна для оператора, имеющего р — 1 различных собственных значений. Докажем ее для оператора А. Выделим корневое подпространство КХр так, как это было сделано в пп. 2 и 3 настоящего параграфа. В соответствии с теоремой 90.3 и соотношением (91.7) имеем V = KXp®Tq.
§ 92. Жорданова форма 273 Обозначим Vi = Tq. Из теоремы 90.3 следует, что подпространство Vi инвариантно относительно оператора А—Хр1, а, следовательно, оно инвариантно и относительно А (лемма 3), при этом (в силу (90.6)) характеристический многочлен оператора Ai = имеет вид Л(А) = (Ai - А)т< .. (Лр_! - А)"Ч А, А, (г / j). Оператор -4] имеет р — 1 различных собственных значений, и для него теорема верна. Если учесть, что корневые подпространства опе- ратора Л1 совпадают с корневыми подпространствами Кх,,..., Кхр_1 оператора А, то Ц = ф ... © и V = Кх, ® ... ф Кхр_г Ф ©Яа,.И Следствие 1. Ненулевые корневые вектора оператора, отве- чающие различным собственным значениям, линейно независимы. Следствие 2. Для любого линейного оператора, действующе- го в комплексном пространстве, существует базис, в котором его матрица имеет квазидиагоналъную форму (согласно теореме 84.2), у которой число диагональных клеток совпадает с числом различ- ных собственных значений, а их размеры - с алгебраическими крат- ностями собственных значений, или, в матричной формулировке, любая квадратная комплексная матрица подобна квазидиагоналъной матрице, обладающей указанным выше свойством. Замечание 2. Разложение (91.13), обладающее всеми свойствами из теоре- мы 91.1, для каждого оператора единственно в силу теоремы 90.3. § 92. Жорданова форма Перейдем к построению базиса, в котором матрица линейного опе- ратора имеет наиболее простую форму. Этим базисом будет сово- купность построенных специальным образом базисов корневых под- пространств. Канонический базис корневого подпространства. Пусть К\. — корневое подпространство оператора А, отвечающее собствен- ному значению Xj. Положим В = А — Xjl, Nk = kerB\ Пк = dim№, Tk = rgBfc. Построим сначала само корневое подпространство Кх,. Для этого согласно (91.8) необходимо найти момент q, начиная с которого все ядра Nk будут совпадать с Nq = Кх}; при этом в силу (91.6), (91.11) имеем rii = Sj < п2 < ... < nq = mj, где Sj и m.j — геометрическая и алгебраическая кратности Xj. Теперь будем строить базис Кх,-. последовательно просматривая подпространства Nq, Nq-i,..., Nj. Ng} Пусть fi,..., ft - векторы, дополняющие произвольный базис Nq-i до базиса Nq. Ясно, что: 1) они будут корневыми векторами высоты q; 2) их количество равно nq — nq-i;
274 Глава XV. Структура, лин. оператора в компл. пространстве 3) tq — Tig Tlq—\ — (Пд Tig—1) (jlq-f-l Tig) — Hg+1 “b ^Пд Tlq —j, так как nq+i = nq; 4) никакая нетривиальная линейная комбинация этих векторов не принадлежит Xg-i (такие векторы будем называть линегто незави- симыми над Nq_i). Nq-i) Построим векторы Вfi,..., Bftq. Эти векторы являются кор- невыми векторами высоты q— 1, и они линейно независимы над Xq_2, так как в противном случае для нетривиального набора чисел Л1, • • •, atq будем иметь Вч~2 '£%=1 ak&fk = в, т.е. Б’-1 ^’=1 otkfk = 6, и 52fc=iQfc/i е что противоречит линейной независимости fi,...,ftq над Nq-i- Дополним эти векторы векторами gi,... ,gt , € Xq-i так, что- бы векторы В fi,..., Bftq ,gi,- - ,gt i дополняли произвольный базис Nq_2 до базиса Xg_i. Ясно, что: 1) они будут корневыми векторами высоты q — 1; 2) их количество равно nq_i — Пд_2‘, 3) tq— 1 = (n.q — 1 Tlq —2) (Пд Tig —1) — Пд + 2Т1д—1 Tlg — 2j 4) они линейно независимы над Nq-2- Ng-2) Аналогично строятся векторы В2 fi,..., B2ftq, Bgi,..., Bgtq_, ,hi,..., htq_2, дополняющие произвольный базис Nq-3 до базиса Nq-2- Для этой системы векторов справедливы те же факты 1-4, что и для векторов, построенных на предыдущих шагах . Выполняя далее такие же построения в подпространствах Х4-з, Ng-4, ..., придем к подпространству Xj. Ni) Здесь строятся векторы Вч~г fi,... ,Bq~l ftq,Bq~2gi,... ,B4~2glq_l,... ,Bvi,... ,Bvt2, которые дополняются векторами iii,..., ut, до базиса Ni. Таким обра- зом, векторы B4~lfi,.. - .. ,Bvit... ,Bvt2,ui, 1) являются собственными векторами; 2) их количество равно щ = тц — по (очевидно, no = def В° = 0); 3) ti = (ni — по) — (пг - nJ = —п.2 + 2п1 - по; 4) они линейно независимы. Полученную за q шагов систему векторов удобно объединить в та- блицу, которую будем называть эюордановой лестницей (см. с. 275). Теорема 92.1. Построенная система векторов образует базис корневого подпространства Kkj. Доказательство. Количество векторов в построенной си- стеме равно размерности пространства Кх}, так как ni + (пг — nJ + + (пз— Пг) + . • . + (Пд — Пд-i) = Пд — dimК\.. Эти векторы линейно не- зависимы, так как если приравнять их линейную комбинацию нулево- му вектору и последовательно применить операторы Вч~1, Bq~2,..., В к обеим частям полученного равенства, то все коэффициенты линей- ной комбинации окажутся равными нулю.
§ 92. Жорданова форма 275 Нумерация базиса. Будем нумеровать векторы построенного ба- зиса по столбцам жордановой лестницы: внутри каждого столбца сни- зу вверх, а сами столбцы в произвольном порядке. Полученный таким образом базис называется каноническим (или жордановым) базисом корневого подпространства Кх,. Матрица оператора в каноническом базисе. 1. Пусть ei,... ,eq - векторы первого столбца жордановой лестницы. Тогда (ei=B’-l/i, ( Ве1=в, < e2 = Bq~2fil 4 Ве2 = еь k &q ~ fl l BCq Gq — l (А - \jT)ei = 6, («4 — Ajl)e2 = ei> , (.4 Ajl)eg — eq—i .4ei = Aj-ei, .4e2 = AjC2 -I- 61, Aeq = Aj eq -|- eq _ i. (92.1) Этой группе векторов канонического базиса соответствуют первые q столбцов матрицы Л|Кд3. в каноническом базисе, которые согласно (92.1) имеют вид Jg(Aj) (92.2) О где Jg(Aj) - клетка Жордана (88.7) q-ro порядка с Xj на главной диа- гонали. Точно так же устроены столбцы матрицы A\Kxj, определяемые векторами второго столбца жордановой лестницы: диагональная клетка имеет тот же вид Jq(Xj), а все остальные элементы равны ну- лю. Таким образом, первая группа из tq столбцов жордановой лест- ницы порождает клетки Жордана q-го порядка с Aj на главной диа- гонали. Число этих клеток равно tq.
276 Глава XV. Структура лян. оператора в компл. пространстве 2. Следующая группа из t9_i столбцов жордановой лестницы опре- деляет клетки на главной диагонали матрицы Число клеток (q — 1)-го порядка равно tg_i. 3. Рассмотрев все столбцы жордановой лестницы, получим матри- цу Aj оператора в каноническом базисе. Из (92.2) и последу- ющих рассуждений вытекает, что Aj - квазидиагональная матрица с клетками Жордана Jfc(Aj) на главной диагонали. Всего этих кле- ток столько, сколько столбцов в жордановой лестнице, т.е. ni или, согласно (91.6), Sj (геометрическая кратность Aj). Таким образом, (-\г ) (92.3) где qi + ... 4- qSj — dim Kki = nij, а число клеток А-го порядка равно числу tk = -nfc_i + 2nfc - nfc+1, к = T“g. Процесс построения канонического базиса, использованный нами, однозначно определяет форму матрицы Aj с точностью до порядка клеток, так как количество всех клеток равно геометрической крат- ности Sj собственного значения Xj, а количество клеток к-го порядка равно числу tfc — — nk-i + 2nfc — п^+1, к = 1, q, или, согласно (80.2), tk = rk-i -2тк +rfc+i, к = 1,5- Пусть теперь оператор -4]^ имеет квазидиагональ ну ю матрицу с клетками Жордана на главной диагонали в некотором другом бази- се. Перенумеруем базис так, чтобы клетки Жордана располагались в порядке убывания размеров. Базисные векторы с новой нумерацией расположим в виде лестницы, столбцы которой (в нумерации снизу вверх) соответствуют одной жордановой клетке матрицы: Г1 Рассмотрим эту лестницу по строкам снизу вверх. Пусть Lx - линейная оболочка векторов нижней строки. Очевидно, Li - линей- ная оболочка собственных векторов оператора А, причем любой соб- ственный вектор является их линейной комбинацией. Следовательно, Li =
§ 92. Жорданова форма 277 Аналогично, если L? - линейная оболочка векторов двух нижних строк лестницы, то L? - линейная оболочка корневых векторов высо- ты к < 2, причем любой корневой вектор высоты к < 2 является их линейной комбинацией. Следовательно, = № и т.д. Таким образом, эта лестница с точностью до порядка столбцов совпадает с жордано- вой лестницей и, значит, форма матрицы Aj не зависит от способа построения базиса. Таким образом, структура клеток Жордана в матрице Aj опре- деляется только оператором А. Порядок клеток определен порядком нумерации столбцов жордановой лестницы. Жорданов базис и жорданова нормальная форма матри- цы оператора. Жордановой матрицей (или матрицей, имеющей жорданову нормальную форму) называется квазидиагональная ма- трица с клетками Жордана на главной диагонали. Жордановым базисом для оператора Л € £(V, V) называется базис пространства V, в котором матрица оператора А имеет жорданову нормальную форму. Канонический базис корневого подпространства Кд^ является жор- дановым базисом для оператора , а матрица Aj - его жорда- новой матрицей. Тем самым решен вопрос о жордановом базисе и жордановой форме матрицы для оператора, имеющего одно корневое подпространство, в частности, для нильпотентного оператора. Решим эту задачу в общем случае. Будем придерживаться преж- них обозначений: mj и Sj - алгебраическая и геометрическая кратно- сти собственного значения Aj, гд = rg(,4 — AjZ)fc. Теорема 92.2. Пусть А £ C(V, V) - линейный оператор, действующий в комплексном пространстве V, и его характеристи- ческий многочлен имеет вид /(А) = (Ai - А)"1' ... (Ар - А)т₽, где A* / Xj при i^j. Тогда в пространстве V существует базис е, в котором матрица оператора А имеет квазидиагональную форму (92.4) где матрицы Aj, j = 1,р, имеют вид (92.3). Доказательство. В соответствии с теоремой 91.1, V — = Кд, ф ... © Кдр. В качестве искомого базиса е возьмем совокуп- ность канонических базисов корневых подпространств Кд,,..., Кдр. Согласно теореме 84.2 матрица Ае имеет вид (92.4), где Aj - матрица оператора Л|Кд, в каноническом базисе K\j. Следовательно, матрица Aj имеет вид (92.3). Таким образом, матрица (92.4) с учетом (92.3) является жордано- вой матрицей для оператора А, а совокупность канонических базисов
278 Глава XV. Структура лин. оператора в компл. пространстве корневых подпространств - жордановым базисом для этого опе- ратора. Замечание!. Жорданова форма матрицы линейного оператора определена однозначно с точностью до порядка клеток Жордана. Докажем это. Пусть в некотором жордановой базисе оператор имеет жорданову матрицу J. Любой диагональный элемент матри- цы J является одним из собственных значений Xj. Рассмотрим часть жорданова базиса, соответствующую всем жордановым клеткам с Xj. Пусть Lj - линейная оболочка этих векторов. Так как (Jfc(Aj)—Ajl)fc = = 0, то Lj С К\} и dim Г, < dimK>r Кроме того, согласно теоре- ме 84.2 (обратная часть) V = L\ ф ... © Lj ф ... ф Lp. Поскольку V - ф ... ф ф ... ф К\р, то dim Lj = dim К>,. и Lj = K\j. Та- ким образом, размер клеток Aj и их количество не зависят от выбора жорданова базиса. Что же касается самих клеток Aj, то их форма, как показано выше, не зависит от способа построения жорданова базиса корневого подпространства К\з. Порядок клеток определен порядком нумерации корневых подпространств и тем порядком, в котором ну- меруются столбцы жордановой лестницы в каноническом базисе K\j. Замечание 2. Для операторов простой структуры, и только для них, жорданова форма совпадает с диагональной, так как кри- терий (88.4) с учетом (91.12) равносилен условию = KXj , j = 17р. (92.5) Приведение матрицы к жордановой форме. В матричной формулировке теорема 92.2 означает, что любая квадратная ком- плексная матрица подобна матрице, имеющей жорданову форму. Это может быть доказано по известной схеме (88.6). Жорданова матрица, подобная матрице А, называется жордано- вой нормальной формой матрицы А. Теорема 92.3. Две матрицы А, В € Спхп подобны тогда и только тогда, когда их жордановы формы совпадают. Это утверждение следует из того, что квадратные матрицы одина- кового порядка над общим полем подобны тогда и только тогда, когда они являются матрицами одного и того же линейного оператора (§82, п. 8°). Привести матрицу А к жордановой нормальной форме - значит найти невырожденную матрицу X и жорданову матрицу J такие, что X~lAX = J. (92.6) Эта задача представляет собой матричную формулировку задачи нахождения жорданова базиса и жордановой формы матрицы линей- ного оператора: если матрицу А рассматривать как матрицу некото- рого оператора Л в некотором базисе е, то равенство (92.6) говорит
§ 92. Жорданова форма 279 (ср. с (82.2)) о том, что X - матрица перехода от базиса е к жорда- новому, т.е. столбцами матрицы X являются координатные столбцы векторов жорданова базиса в базисе е. Теорема 92.4 (теорема Гамильтона-Кэли). Линейный, оператор, действующий в комплексном (или в вещественном) прост- ранстве, является корнем своего характеристического многочлена. Доказательство. 1. Докажем сначала это утверждение для комплексного пространства V. Пусть А € £(V, V) и его характери- стический многочлен имеет вид (91.3). Согласно теореме 91.1, V — = Кх' ф ... Ф К\р и, следовательно, для любого вектора х € V имеет место разложение х = Х] + ... 4- хр, где Xj € j — 1,р. Тогда f(A)x = f(A)xi + ... + f(A)xj + ... + f(A)xp . (92.7) Каждое слагаемое в этом разложении равно нулевому вектору, так как f(A)xj = (AxZ-А)”*1 ... (Х]Х—А)т> ... (ХрТ-А)"1^ — в, ибо операторы в этом произведении перестановочны, a (A — XjI)mjXj = в в силу (91.8). Следовательно, f(A)x —в.^х е V, т.е. /(Л) — О. 2. Пусть V - вещественное линейное пространство. Возьмем какой- либо базис е пространства V, и пусть Ае - матрица оператора А в этом базисе. Для доказательства теоремы достаточно показать, что f(Ae) = О. Рассмотрим любое комплексное пространство У) той же размерности, что и V . Пусть f - произвольный базис V), тогда матри- ца Ае является матрицей оператора В £ £(У1,У)) в базисе /, т.е. Ае = В/. Значит, характеристические многочлены операторов А а В совпадают и, согласно п. 1 доказательства, f(Ae) = О. Аннулирующий многочлен. Минимальный многочлен. Пусть А - линейный оператор, действующий в пространстве V над полем Р. Многочлен f(t) G P[t] называется аннулирующим многочле- ном для оператора А, если f(A) — 0. Теорема Гамильтона-Кэли устанавливает существование аннули- рующего многочлена степени п, где n = dimV. Многочлен m(t) наи- меньшей степени со старшим коэффициентом единица, аннулирую- щий А, называется минимальным многочленом для оператора А. Очевидно, он определен однозначно: если mi(t) и ma(t) - два таких многочлена, то многочлен mi(t) -тг(4) аннулирует А и имеет строго меньшую степень, так что mi(t) — тДО — 0. Теорема 92.5. Минимальный многочлен является делите- лем аннулирующего многочлена. Доказательство. Пусть f(t) и m(t) - аннулирующий и ми- нимальный многочлены для оператора А. Разделим /(£) на m(t): /(t) — m(t)q(t) + r(t), где либо r(t) — 0, либо deg г < degm. Вто- рое невозможно, так как г(А) = f(A) — m(A)q(A) — 0, deg г < degm. Следовательно, r(t) = 0 и m(t) - делитель f(t). Некоторые приложения. 1. Одно из важных приложений жор- дановой формы - вычисление функций от матрицы, в частности, вы- числение больших степеней Ат матрицы А. Экономный способ такого
280 Глава XV. Структура лин. оператора в компл. пространстве вычисления состоит в следующем: матрица А приводится к жордано- вой форме J, так что А = XJX~l и Ат = Х^Х"1. Матрица X вычисляется с помощью матрицы А и не зависит от т, а степень Jm жордановой матрицы J вычислить достаточно про- сто. В самом деле, вычисление Jm сводится к возведению в степень т диагональных клеток матрицы J, т.е. жордановых клеток Д(А;). Заметим, что Л(АД = АД + Л(0), Jfc(0)m = O, т>к, (92.8) и что матрицы Х31 и А(0) коммутируют. 2. С помощью жордановой формы легко вычислить минимальный многочлен. В самом деле, минимальный многочлен для Jfc(Aj) равен (t - A3)fc, так как в силу (92.3) (Jfe(A7) - Х}Г)т = Jfc(0)m,a Л(0)т = 0 при т > к. Минимальный многочлен квазидиагональной матрицы с А^ на главной диагонали равен (t — Aj)*"1", где fcmax _ наибольший размер жордановой клетки с А;. Наконец, минимальный многочлен общей жордановой матрицы (92.4) равен (t-AO^ ,..(i-Ap)4 где к3 - наибольший размер жордановой клетки, отвечающей Х3. § 93. Вещественный аналог жордановой формы Инвариантные подпространства минимальной размерности. Теорема 93.1. У всякого линейного оператора в комплек- сном пространстве существует одномерное инвариантное под- пространство. Доказательство. Утверждение следует из существования соб- ственного вектора для любого оператора, действующего в комплекс- ном пространстве (§86): если е - собственный вектор оператора А, то £(е) - одномерное подпространство, инвариантное относительно А. Теорема 93.2. У всякого линейного оператора в веществен- ном пространстве существует одномерное или двумерное инвари- антное подпространство. Доказательство. Пусть V - вещественное пространство, А € £(V,V), g — (ffb-..,pn) ~ базис V и А - матрица оператора А в базисе д. Характеристический многочлен /(А) оператора А явля- ется многочленом с вещественными коэффициентами, так как /(А) = = det(A - XI), где А е Rnxn. Пусть Ао - корень характеристического многочлена /(А).
§ 93. Вещественный аналог жордановой формы 281 1. Если Aq € R, то Aq - собственное значение оператора А. Тогда линейная оболочка £(е), натянутая на соответствующий собственный вектор е, образует одномерное подпространство, инвариантное отно- сительно оператора А. 2. Если Ао = a + гр, /3 0, то Ао = a — Pi - тоже корень ха- рактеристического многочлена /(А). Рассмотрим А как комплексную матрицу, тогда Ао будет ее собственным значением и если е е Ст - соответствующий собственный вектор, то Ае = Аое. (93.1) Обозначив f = е G Сп и перейдя в (93.1) к сопряжению, получим Af = Xof. Очевидно, ей/- линейно независимы, как собственные векторы, отвечающие различным собственным значениям. Пусть е = (it + iyif... ,тп + iyn)T = х + iy, где х = (i1(..., хп)т, У — (1/11 - ч Уп)Т G Кп- Тогда равенство (93.1) может быть записано в виде А(х + гу) — (а + г/3)(т + iy) или ( Ах = ах — Ру, [Ау = Рх + ау. Векторы х,у - линейно независимы, так как (93.2) а векторы е,/, как указывалось выше, линейно независимы. Тогда если и — v = yi9iy то системе (93.2) соответствует система векторных уравнений Au = au- Pv, , Av = pu + av, где u, v - векторы пространства V, одновременно не равные нулю. Из (93.3) следует, что £(u, v) - инвариантное подпространство. При этом dim £(u, v) = 2. Итак, каждый вещественный корень характеристического много- члена порождает одномерное инвариантное пространство, а каждый комплексный (не вещественный) корень - двумерное инвариантное подпространство. Вещественный аналог жордановой формы. Пусть А - линей- ный оператор, действующий в n-мерном вещественном пространстве. Его характеристический многочлен /(А) - многочлен n-й степени с вещественными коэффициентами.
282 Глава XV. Структура лин. оператора в компл. пространстве Если все корни /(А) вещественны, то к оператору А применима общая теория жордановой формы, т.е. в пространстве V существу- ет базис, в котором матрица оператора Л имеет квазидиагональную форму с вещественными клетками Жордана на главной диагонали. Пусть Ао = а + /9г, / 0 - комплексный корень многочлена /(А), тогда Aq = a — fti также будет корнем /(А), причем той же кратности, что и А. Для исследования простейшей формы матрицы оператора А перейдем, как и в доказательстве теоремы 93.2, на матричный язык: вместо оператора А будем использовать его матрицу А в некотором базисе, вместо векторов - их координатные столбцы в том же базисе. Матрица A £ Rnxn может быть рассмотрена как комплексная ма- трица и согласно общей теории в ее жордановой форме есть клетки с Ао и Ао на главной диагонали. Рассмотрим серию базисных векторов ej,... ,е^ G Сп, порождаю- щую клетку Jfc(Ao). Имеем .Aei = Aoei, < __________________________ Aej = Xoej + ej-i, j = 2,k. Обозначив fj = ej, j — 1, к и перейдя к сопряжению в (93.4), получим Afi = Ao/i, Af} = Xofj + Л-i, 3 = 2,fc. Это означает, что линейно независимые векторы Л, , Д € С” поро- ждают клетку Jk(A0). Таким образом, Л(Ао) и Л(Ао) - клетки оди- накового порядка к и их равное количество. Покажем, что линейная оболочка базисных векторов, порождаю- щих эти клетки, образует инвариантное подпространство £ размер- ности 2к. Представим каждый вектор в виде: = Xj+iyj, где х},у} G Rn. Тогда Л(ц + iyi) - (а + /Зг)(т1 + iyi), --- О A(xj +iy,) = (а + 0i)(xj + iy,) + Xj-i + iyj-i, j = 2, к. ' Ax! - ац - fryi, Ayi = I3xi 4- ayi, Axj = aij - (Зу, + Tj-i, . Ay3 = 0x3 + ay, + yj-i, 3 = 2,к. (93.5) Векторы xi, yi, X2, У 2, • • •, Vk линейно независимы, так как — Л * = ~2Г' X}~ 2
§ 93. Вещественный аналог жордановой формы 283 а линейная независимость в1,...,е*, fi,---,fk следует из линейной независимости корневых векторов, отвечающих различным собствен- ным значениям. Равенства (93.5) означают, что в базисе подпространства L, векто- ры которого имеют координатные столбцы ii, j/i,..., х^, t/k, оператор Л|ь имеет матрицу ’ a 0 1 О -0 a 0 1 a 0 1 О -/3 a 0 1 (93.6) a 0 -0 a порядка 2k. Таким образом, каждый комплексный (не действительный) корень характеристического многочлена /(А) кратности к порождает клетку (93.6) порядка 2к. Теорема 93.3. Для всякого линейного оператора, действу- ющего в вещественном пространстве, существует базис, в котором матрица оператора имеет квазидиаг анальную форму с веществен- ными клетками Жордана и вещественными клетками вида (93.6) на главной диагонали. Доказательство. Для доказательства утверждения нужно взять жорданов базис матрицы А оператора, оставить в нем все векто- ры, порождающие вещественные клетки Жордана, а векторы, поро- ждающие комплексные клетки Jjt(Ao) и <Д(Ао), заменить на векторы с координатными столбцами Xi, у\,..., х^, у к-
Глава XVI. Линейные операторы в унитарных (евклидовых) пространствах § 94. Сопряженный оператор Определения и свойства. В этом параграфе V и W - два простран- ства, оба унитарных или оба евклидовых. Теорема 94.1. Если А, В - линейные операторы из £(V, IV) и (Ах,у) = (Вх,у), Ух eV, у eW, то Л = В. Доказательство. Утверждение вытекает из следующей цепоч- ки простейших импликаций: (Дт, у) — (Вх, у), Ух е V, у € W => (Ах — Вх, у) = 0,Уу е W => => Ах — Вх = д => Ах = Вх, Ух е V => А = В .и Замечание. Очевидно, что из равенства (х, Ay) — (х, By), Ух eW, у eV, также следует, что А = В- Пусть Ае C(V, ИЛ). Отображение А* : W —> V называется сопря- женным оператором к оператору А, если (Ах,у) — (х,А'у), Ух е V , у е W . (94.1) Пример. Пусть А - линейный оператор, действующий в геоме- трическом пространстве V3 по правилу Ах = [х, а], а € V3. Тогда для любого вектора у е V3 (Ах, у) = ([х, а], у) = (х, [а, у]) = (х,-[у,а]) = (х,-Ау), и, с другой стороны, (Ак, у) = (х,А*у). Таким образом, (х,Л*у) — (х,-Ay), Vx, у € V3. Отсюда согласно теореме 94.1 следует, что А* = —А. Теорема 94.2. Сопряженный оператор линеен. Доказательство. Пусть у\,у2 е W, тогда согласно (94.1) (Ах,У! + у2) = (x,A*(yi + у2)). (94.2) С другой стороны, (Ах,у1 + у2) = (Ax,yi) + (Аг,у2) = (х,А*у\) + -I- (х,А*у2) = (x,A*yi + А'у2). Отсюда с учетом (94.2) получим, что (х, A*(yi + у2) — (A*yi + А“у2)) = 0, Ух е V, следовательно, -4*(|/1 +уг) = А* 2/1 +А*у2, yy\,y2eW. (94.3)
§ 94 Сопряженный оператор 285 Аналогично показывается, что А*(ау) — аА*у, Уу 6 Wz, Vo € C(R). (94.4) Свойства (94.3), (94.4) доказывают линейность оператора А*. Теорема 94.3. Для любого оператора А € £(V, W) суще- ствует, и притом единственный, сопряженный оператор. Доказательство. Существование. Пусть ei,...,e„ - ор- тонормированный базис V. Тогда для любого вектора х € V соглас- но (70.6) имеет место разложение х = 52£=1(т, е*,)^. Следовательно, Ах = ^2£=1(т, ек)Авк и в силу (70.7) п (Ах, у) = ^2(т,ек)(Лек,у), Vy G W. (94.5) fc=i Покажем, что оператор В € C(W, V), определенный равенством Vyew, является сопряженным к А. Действительно, из того, что (х, By) = = (x,Y2=\hh •&£><№) = 2/)(ж>е*), и равенства (94.5) сле- дует, что (Ах,у) = (х,Ву), Ух € V, у € W, т.е. В = А*. Единственность вытекает из теоремы 94.1, так как для любых двух операторов В и С, сопряженных к А, имеет место соотношение (я, By) = (Ах, у) — (х,Су), Vz € V, у € W. Теорема 94.4. Операция сопряжения линейного оператора обладает следующими свойствами: 1) (А +В)* = А* + В*, 2) (а А)* = аА*, 3) (АВ)* = В*А’, 4) (А-1)’ = (А’)"1, 5) (А*)’ = А, выполненными для любых операторов, для которых определены ука- занные операции. Доказательство. Все свойства доказываются однотипно. До- кажем свойства 3 и 4. Свойство 3 вытекает из (94.1) и теоремы 94.1, так как (х, (АВ)*у) = (АВх,у) = (Вх,А*у) — (х.,В*А*у), Ух, у. Свой- ство 4 (очевидно, для невырожденных А € £(У, У)) вытекает из свой- ства 3, так как если АА-1 — А-1А = Т, то (А-1)*А* = А*(А-1)* = Т. Это означает, что оператор (А-1)* является обратным к А*. Матрицы операторов А и А* в паре ортонормированных базисов. Пусть V и W - унитарные (евклидовы) пространства раз- мерностей пит соответственно. Теорема 94.5. Матрицы операторов A G £(V) IV) и A* 6 G £(V, W) в паре ортонормированных базисов сопряжены друг другу. Доказательство. Пусть е = (е\,... ,еп) - ортонормирован- ный базис V, / = (fi,..., fm) - ортонормированный базис W. Пусть,
286 Глава XVI. Линейные операторы в унитарном пространстве далее, Afe = (ао), (Д*)е/ = (М- Тогда m п Aej=^2akjfk, j =T7n; A'ft =^bkiek, к = l,m fc=l k=l и G-tj - (94.6) С другой стороны, / П 4 (Aejtfi) = (ey, A*fi) = f j = 6Jt. ' fc=i ' Отсюда и из (94.6) следует, что ач- - Ьц, i — 1,тп, j = 1,п. Таким образом, (Л*)е/ = (А/е)я (соответственно (Л*)е/ = (Л/е)г). (94.7) Следствие. rg А* = rg А. (94.8) Ядра и образы операторов А и А*. Пусть V и W - унитарные (евклидовы) пространства. Теорема 94.6. Для любого оператора А € £(V, W) ker Л = ini± А*, ker А* = im1 А. (94.9) Доказательство. Для любых векторов х 6 ker.4, у € ппЛ* имеем Ах = О, у = А*у\. Значит, (х,у) — (x,A*yi) — (Ax,yi) — 0. Следовательно, ker .4 С пп^Л*. С другой стороны, в силу (80.2) и (94.8) получим dim ker А — dim V — dim im A = dim V — dim im A* = dim im1 A". Теорема 64.3 о монотонности размерности завершает доказательство первого из равенств (94.9). Второе доказывается аналогично. § 95. Сопряжение оператора, действующего в одном пространстве. Биортогональные базисы Здесь и далее (если не будет дополнительных оговорок) будем рассматривать линейные операторы, действующие в одном простран- стве V, унитарном или евклидовом.
§ 95. Сопряжение оператора, действующего в одном пространстве 287 Содержание §94 остается справедливым и для операторов, дей- ствующих в одном пространстве. Исключение составляет лишь тео- рема 94.5: в этом случае базисы ей/ совпадают, и теорема будет относиться к одному ортонормированному базису е. Так, если е - ор- тонормированный базис V, то (Л*)е = (Ае)н (соответственно (Д*)е = (Де)г) (95.1) и как следствие ____ det Л* = detA (95.2) Две системы векторов ц,.. .,Хк и yi,... ,ук в унитарном (евкли- довом) пространстве V называются биорто зональными системами, если (ii, у,} = Jtj, где <5,j - символ Кронекера (см. (70.2)). Каждая из двух биортогональных систем векторов линейно неза- висима. В этом можно убедиться, если приравнять линейную комби- нацию одной системы нулевому вектору и последовательно умножать обе части полученного равенства скалярно на векторы другой системы. Биортогональные системы ei,...,еп и Д,..., /п, образующие ба- зисы пространства V, называют биортогональной парой базисов. Итак, (е‘>Л) = { щ (95.3) Примером биортогональной пары базисов могут служить тройки некомпланарных векторов а, Ь, с и [Ь, с], [с, а], [а, Ь] геометриче- ского пространства V3, для которых (а, Ь, с) = 1. Очевидно, что ортонормированный базис биортогонален самому себе. Теорема 95.1. Для любого базиса ej,..., еп унитарного (ев- клидова) пространства существует, и притом единственный, би- ортогональный базис fi,..., fn- Доказательство. Согласно (95.3) вектор fj, j = 1,п, ортого- нален всем векторам ei,..., еп, кроме е7. Следовательно, /, 6 Lj, где Lj = £-*-(в!,..., ej-1, ej+1, -. , en). Очевидно, dim £, = 1. Если g - ба- зис Lj, то fj = ag. Из (95.3) следует, что (fj,ej) = 1, откуда получаем, что а = l/(g, e_j). Тем самым доказаны существование и единствен- ность векторов fj , j = 1,п, биортогонального базиса. Теорема 95.2. В паре биортогональных базисов е и f уни- тарного (евклидова) пространства V матрицы операторов А и А* связаны соотношением (Л*)/ = (Ае)я. (95.4) Доказательство. Пусть Ае = (atJ), (Л*)/ = (Ьц). Тогда Aej = — И,к=\ак]ек\ A’fi = bkifk- Умножив первое из этих равенств скалярно на ft, получим, что (Aej, ft) = 5Dfc=iakj(e*> А) — aij- 10 Линейная алгебра я аналитическая геометрия
288 Глава XVI. Линейные операторы в унитарном пространстве С другой стороны, (Aej,ft) = (ej,A*fi) = (eJtbkifk) = — 52fc=i^t(ej’ А) = bji- Следовательно, axj = bji, i = l,n, j = l,n. Это равносильно (95.4). Теорема 95.3. Если подпространство L инвариантно от- носительно оператора А, то его ортогональное дополнение 1Л ин- вариантно относительно сопряженного оператора А*. Доказательство. Если х G L, у € Г1, то (Ах,у) — 0, так как по условию теоремы Ах € Г. С другой стороны, (Ах, у) = (х, А*у)- Следовательно, (х,А‘у) = 0, Vi € L и, значит, А*у € Г±. § 96. Нормальный оператор Определение и свойства. Пусть V - унитарное или евклидово пространство. Линейный оператор А € L(V, V) называется нормаль- ным оператором, если АА’ = А-А. Квадратная матрица А (комплексная или вещественная) называ- ется нормальной матрицей, если ААН = АНА. Замечание 1. Из определения и соотношения (95.1) следует, что оператор нормален тогда и только тогда, когда в любом ортонормиро- ванном базисе его матрица нормальна. Теорема 96.1. Собственный вектор нормального оператора, отвечающий собственному значению А, является собственным век- тором сопряженного оператора, отвечающим собственному значе- нию А. Доказательство. Легко проверить, что если А - нормальный оператор, то А - АТ также нормален. Пусть теперь х - собственный вектор оператора А, отвечающий собственному значению А; тогда (Д - АТ)х - в и ((Д - АТ)т, (Д - А1)г) = 0. Согласно (94.1) отсюда следует, что (х, (А — АТ)*(Д — АТ)т) = 0 или, с учетом нормальности оператора А — XL, что (х, (Д — АТ)(Д — AZ)‘i) = 0, т.е. ((Д — АТ)*х, (А — XL)’x) = 0 и (Д - ХЕ)*х = в. Отсюда в силу теоремы 94.4 полу- чаем, что (Д* — А1)х = в, т.е. А*х = Ах. Следствие 1. Если А - нормальный оператор, то кег А = кег А*, (96.1) так как нетривиальные векторы ядра являются собственными век- торами, отвечающими нулевому собственному значению. Следствие 2. Если А - нормальный оператор, то ker А = im1 А, кег Д* — im1 А*. Это следует из (94.9) и (96.1).
§ 96. Нормальный оператор 289 Теорема 96.2. Собственные векторы нормального опера- тора, отвечающие различным собственным значениям, попарно ор- тогональны. Доказательство. Пусть Ах — Хх, Ау — ру, А р. Тогда (Ах, у) = (Хх, у) = Х(х, у). С другой стороны, (Ах, у) = (х, А*у) = { в силу теоремы 96.1 } = (х,ру) = р(х,у). Следовательно, Х(х,у) = р(х,у) и так как А / р, то (х, у) — 0. Нормальный оператор и его матрица в унитарном пространстве. Теорема 96.3 (теорема Шура). Для любого оператора, действующего в унитарном пространстве, существует ортонорми- рованный базис, в котором он имеет треугольную матрицу. Доказательство этой теоремы отличается от доказательства теоремы 89.2 только тем, что на каждом шаге строится ортонормиро- ванный базис инвариантного подпространства. Ортонормированный базис унитарного (евклидова) пространства, в котором матрица линейного оператора имеет треугольную форму, называется базисом Шура для этого оператора. Теорема 96.4 (критерий нормальности). Линейный оператор, действующий в унитарном пространстве, нормален то- гда и только тогда, когда существует ортонормированный базис из собственных векторов этого оператора. Доказательство. Необходимость. Пусть А - нормальный оператор и е - его базис Шура. Тогда Ае = Оц 0 012 022 • О1п • а2п . (Ае)н = Оц О?2 0 . 022 • 0 ' 0 0 0 Опп . О2п и, согласно (95.4) и замечанию 1, Ае(Ае)н = (Де)яАе. Сравнив диа- гональные элементы матриц, расположенных в левой и правой частях последнего соотношения, получим равенства |а11|2 + |а1212 + - • • + |aln|2 — Ial 112, |О22|2 + • • + |<12n|2 — = |й22|2, •, |an-i,n-112 + |ап_11П|2 = |an_iin_j|2, из которых следует, что «12 = «13 = ... = Я1П = о, <223 = <124 = • • - = О2п - 0, . . . , ап-1,п = 0. Следовательно, матрица Ае имеет диагональную форму. Таким обра- зом, базис Шура является ортонормированным базисом из собствен- ных векторов оператора А. Достаточность. Пусть е - ортонормированный базис из соб- ственных векторов оператора А, тогда Ае = ’ Ai о ' О ’ Ап , (Л)н = о 1-<с О 1 1
290 Глава XVI. Линейные операторы в унитарном пространстве Из перестановочности диагональных матриц следует, что Ае - нор- мальная матрица. Это означает (замечание 1), что А - нормальный оператор. Следствие 3. В унитарном, пространстве нормальный опера- тор А и его сопряженный оператор А’ имеют общий ортонормиро- ванный базис из собственных векторов. Теорема 96.5. Если любой собственный вектор оператора А, действующего в унитарном пространстве V, является собствен- ным вектором сопряженного оператора А*, то А - нормальный оператор. Доказательство. Любой оператор, действующий в комплекс- ном пространстве, обладает хотя бы одним собственным вектором (те- орема 86.6). Пусть dimV = п и ei - собственный вектор оператора Д, тогда ei - собственный вектор оператора А‘ и £(ei) инвариантно А*. Согласно теореме 95.3 подпространство Ln_j = £"L(ei) инвари- антно относительно оператора А. В этом подпространстве (в силу теоремы 86.6) существует собственный вектор вг € Ьп-1 оператора А, при этом ез -L ei. Вектор вг также является собственным век- тором Д‘, и по-прежнему £(ег) инвариантно относительно А* и, сле- довательно, Ln-2 = £^(62) (имеется в виду ортогональное дополне- ние £(бг) до Ln-i) инвариантно относительно оператора А. Поступая аналогично, построим ортогональную систему собственных векторов ei,...,еп оператора А. Тогда векторы 6i/|ei|, ... , en/|en| образуют ортонормированный базис пространства V, состоящий из собствен- ных векторов оператора Див силу теоремы 96.4 А - нормальный оператор. Замечание 2. Отметим, что доказанная теорема является об- ратной к теореме 96.1 для случая унитарного пространства. Унитарно подобные матрицы. Подобные комплексные (веще- ственные) матрицы А и В = Q~lAQ называются унитарно (соот- ветственно ортогонально) подобными, если матрица преобразования подобия Q унитарна (соответственно ортогональна), т.е. если QHQ — = QQH = I (соответственно QTQ = QQT = I). Очевидно, что со- отношение подобия для унитарно подобных матриц А и В имеет вид В — QH AQ, а для ортогонально подобных - вид В = QTAQ. Замечание 3. Из теоремы 70.5 и свойства 8° §82 следует, что две комплексные (вещественные) квадратные матрицы одинакового порядка унитарно (соответственно ортогонально) подобны тогда и только тогда, когда они являются матрицами одного и того же оператора в унитарном (соответственно евклидовом) пространстве в ортонор мированных базисах. Теорема 96.6. Квадратная комплексная матрица нормаль- на тогда и только тогда, когда она унитарно подобна диагональ- ной матрице, или, в другой формулировке, квадратная комплексная матрица п-го порядка нормальна тогда и только тогда, когда она имеет ортонормированную систему из п собственных векторов.
§ 96. Нормальный оператор 291 Доказательство может быть проведено по известной схеме (88.6), если использовать ортонормированные базисы е, f и учесть замечание 3. Доказанная теорема представляет собой матричную формулиров- ку теоремы 96.4. Нормальный оператор и его матрица в евклидовом про- странстве. Пусть А - нормальный оператор в евклидовом простран- стве Е. В любом ортонормированием базисе пространства он имеет вещественную нормальную матрицу, а его характеристический мно- гочлен /(А) - многочлен с вещественными коэффициентами. Если все корни многочлена /(А) действительны, то к оператору А применима теорема 96.4, согласно которой существует ортонорми- рованный базис пространства Е, в котором он имеет вещественную диагональную матрицу. Пусть Ад = а + 0г, 0^0- комплексный корень многочлена /(А). Для поиска простейшего вида матрицы оператора А вновь (§93) пе- рейдем на матричный язык: вместо оператора А будем рассматривать его матрицу А в некотором ортонормированием базисе пространства Е, а вместо векторов - их координатные столбцы в этом же бази- се. Скалярное произведение векторов из Е совпадает с естественным скалярным произведением их координатных столбцов из Rn (§68). Матрицу Л_можно рассматривать как комплексную матрицу, тогда Aq — а + (Зг и Ао = а — 0г будут ее собственными значениями, причем одинаковой кратности. Теорема 96.7. Линейный оператор, действующий в евкли- довом пространстве, нормален тогда и только тогда, когда суще- ствует ортонормированный базис пространства, в котором он име- ет квазидиагональную матрицу с вещественными клетками первого порядка и вещественными клетками второго порядка вида (96.2) на главной диагонали. Доказательство. Достаточность проверяется непосред- ственно. Необходимость. Пусть А - нормальный оператор и А € R”xn - его матрица в некотором ортонормированием базисе пространства. Очевидно, что А — нормальная матрица. Согласно теореме 96.6 ма- трица А (если ее рассматривать как комплексную матрицу) имеет ор- тонормированную систему gi,. . ,дп из собственных векторов. Если Ао = а 4- 0i, 0 / 0, - корень характеристического многочлена, то Ао и Aq будут собственными значениями матрицы А одинаковой кратно- сти. Пусть е, f - собственные векторы из gi,..., дп) матрицы А, отве- чающие собственным значениям Ао и Ао соответственно. Если в = х + + гу, где х, у € Rn, то f = х — iy и подпространство £(е,/) = £(х, у) а 0 —0 а ’ /3^0,
292 Глава XVI. Линейные операторы в унитарном пространстве инвариантно относительно А, при этом {Ае = Aqc, 4 , ( Ах = ах — ву, х ° = Лое s . д (96.3) Af = Xof 1 Ay = 0z + ay. ’ Заметим, что векторы ей f ортогональны как собственные векто- ры, отвечающие различным собственным значениям Ао и Ао- Поэтому (х + iy, х - iy) = |х|2 - |у|2 4- 2i(x,y) = 0 <=> I (х,у) = 0. Так как |х| = |у|, то векторы и образуют ортонормированный базис С(х,у), при этом для этих векторов верны соотношения (96.3). Вернемся к оператору А. Если и и и - векторы с координатными столбцами щ и и L = C(u,v), то в силу (96.3) подпространство L инвариантно относительно оператора А и матрица оператора в ортонормированием базисе и, v имеет вид (96.2). Поступая так же с любой другой парой собственных значений А, А, заменяя пары векторов е, f из системы собственных векторов <ц,... ,дп на соответствующие пары и, v и оставляя неизменными век- торы, отвечающие вещественным собственным значениям, получим искомый базис. Теорема 96.7 в матричной формулировке означает, что веществен- ная матрица нормальна тогда и только тогда, когда она ортого- нально подобна квазидиагональной матрице с вещественными клет- ками первого порядка и вещественными клетками второго порядка вида (96.2) на диагонали. §97. Унитарный (ортогональный) оператор Линейный оператор U, действующий в унитарном (евклидовом) пространстве, называется унитарным (соответственно ортогональ- ным) оператором, если U‘U = UU* = Г. Из определения вытекают следующие факты. 1°. Оператор U унитарен (ортогонален) тогда и только тогда, ко- гда в любом ортонормированном базисе он имеет унитарную (соот- ветственно ортогональную) матрицу. 2°. Для унитарного (ортогонального) оператора U справедливы равенства U*=U~\ |detl/| = l. (97.1) 3°. Унитарный (ортогональный) оператор нормален. Линейный оператор U, действующий в унитарном (евклидовом) пространстве V, называется изометричным, если он сохраняет ска- лярное произведение, т.е. если (Ux, Uy) = (х, у), Vx,j/ 6 V.
§97. Унитарный (ортогональный) оператор 293 Теорема 97.1 (критерии унитарности). В конечномер- ном унитарном (евклидовом) пространстве V следующие утвер- ждения равносильны: 1) операторы унитарен (ортогонален); 2) Ы'Ы = Т ; 3) ЫЫ' = 1; 4) оператор Ы изометричен; 5) оператор Ы сохраняет длину, т.е. \Ых\ — |х|, Vx G V; 6) оператор Ы переводит любой ортонормированный базис V в ортонормированный базис; 7) операторы переводит хотя бы один ортонормированный базис V в ортонормированный базис. Доказательство. 1 о 2 о 3. Любое из равенств Ы*Ы = I или ЫЫ* = Т означает невырожденность Ы и существование Ы~1. Умноже- ние обеих частей этих равенств на Ы~1 (справа или слева) приводит к тому, что Ы* = Ы~1. Следовательно, имеют место импликации 2 => 1, 3 => 1. Переход 1 => 2, 1 => 3 очевиден. 1 => 4. Так как- Ы*Ы = Z, то (]Ых,Ыу) = (х,Ы*Ыу) = (х,у), Ух,у 6 V. 4 => 1. Так как (х,Ы*Ыу) = (Ых,Ыу) = (х,у), Ух,у G V, то на основании теоремы 94.1 Ы*Ы = Т. 4 => 5. Это очевидно, так как |7/х| — у/(Ых,Ых) = \/(х,х) = |х|, Vx G V. 5 => 4. Это следует из легко проверяемых соотношений: (х, у) = (|r + у|2 - |х|2 - |у 12)/2 в евклидовом пространстве и (х, у) = (|х + уI2 - |х - у|2 + г|х 4- iy|2 - г|х - iy|2)/4 в унитарном пространстве. 4 => 6. Очевидно, так как (We,,i/ej) = (ei,ej) = 6i}. 6 => 4. Если ej,..., en - ортонормированный базис V и х = £7=1 х*е» > У = 52"=i I6ei > то Ux — £7=1 - Uy = £"=1и так как Ue\, ... , Ыеп - ортонормированный базис, то, согласно (70.7), (Ых,Ыу) — = ^=1ХгУг = (Я,У), УХ,у EV. 6 => 7. Очевидно. 7 => 6. Этот переход фактически доказан в п. 6 => 4. Следствие. Унитарный (ортогональный) оператор на любом инвариантном подпространстве индуцирует унитарный (соответ- ственно ортогональный) оператор, так как сохраняет скалярное про- изведение любой пары векторов этого подпространства. Теорема 97.2. Если подпространство L инвариантно от- носительно унитарного (ортогонального) оператора Ы, то его ор- тогональное дополнение L1- также инвариантно относительно Ы. Доказательство. Пусть у е L1. Покажем, что Ыу е L-1-, т.е. (х,Ыу) — 0, Ух е L. Оператор Ы индуцирует на подпространстве L унитарный (ортогональный) оператор Ы\Ь. Значит, оператор Ы\Ь
294 Глава XVI. Линейные операторы в унитарном пространстве обратим и его образ совпадает со всем подпространством L, т.е. = L (теорема 83-5). Это означает, что для любого вектора х € L существует вектор Xi € L такой, что х = Ых^. Тогда (х,1Ау) — = (Uxi,Uy) = (xi,y) = 0, так как G L, у 6 Lr. Теорема 97.3 (спектральная характеристика унитар- ного оператора). Нормальный оператор в унитарном простран- стве унитарен тогда и только тогда, когда все его собственные значения по модулю равны единице. Доказательство. Необходимость справедлива в унитар- ном и евклидовом пространстве и означает, что все собственные зна- чения унитарного (и ортогонального) оператора 1Л по модулю равны единице. Докажем это. Пусть х - собственный вектор оператора U и Л - отвечающее ему собственное значение. Тогда (Z/т, Их) = (Ат, Хх) — = |А|2(т, х). С другой стороны, (Их,Ux) = (x,U*Ux) = (х, х). Из этих равенств следует, что |А| = 1. Достаточность. Если U - нормальный оператор, то согласно теореме 96.4 в пространстве V существует ортонормированный базис ei,...,en из собственных векторов оператора К. Тогда для любого вектора х = G V имеем Ux — i х*А,е,, где |А»[ — 1, г — 1, п. Отсюда в силу ортонормированности базиса е согласно (70.7) получаем (х,х) = £"=1 |т<|2 и (Z/x,Wx) = |А<|2|т,|2 = 1Х*|2- Следовательно, = |ar|, Vi ё V, и IA - унитарный оператор (теоре- ма 97.1). Каноническая форма матрицы унитарного оператора. Из того, что унитарный оператор нормален и все его собственные значе- ния по модулю равны единице, следует, что в пространстве V суще- ствует ортонормированный базис е, в котором матрица унитарно- го оператора U имеет диагональную форму: о ие = где |А<| = 1, г = 1,п, О или, в матричной формулировке: унитарная матрица унитарно по- добна диагональной матрице, у которой все диагональные элементы по модулю равны единице. Каноническая форма матрицы ортогонального оператора. Пусть Q - ортогональный оператор, действующий в евклидовом прос- транстве Е. Согласно теореме 97.2 (п. “необходимость”) и второму из равенств (97.1) для его собственных значений А и определителя (так как А € R, det Q G R) имеем А = ± 1, det Q = ± 1. (97.2) В любом ортонормированием базисе е оператор Q имеет ортого- нальную матрицу Qe, следовательно, Q;l=Qe- (97.3)
§ 97. Унитарный (ортогональный) оператор 295 Одномерный случай. В одномерном пространстве матрица Qe орто- гонального оператора Q в ортонормированием базисе ei имеет вид Qe = [±1] • (97.4) а /3 -0 а Иными словами, либо Qe = I, либо Qe = —I. Двумерный случай. В двумерном пространстве, согласно теоре- ме 96.7, существует ортонормированный базис е, в котором ортого- нальный оператор Q имеет либо вещественную диагональную матри- цу, либо вещественную матрицу вида чае на диагонали расположены собственные значения оператора Q, т.е. числа 1 или -1. Во втором случае, если Qe — |Qe| = а2 + (З2 = 1. Положив а = cos<p, (3 = - sim/з, получим , /3 ф 0. В первом слу- ai (3 —{3 а , /3 0, то Qe cos р — sin р sin р cos р (97.5) Заметим, что Qe - недиагонализуемая матрица, так как ее характе- ристический многочлен /(А) = A2 — 2cos<p А+1 не имеет вещественных корней (в силу р nk). Таким образом, для любого ортогонального оператора в двумер- ном евклидовом пространстве существует ортонормированный базис, в котором оператор имеет одну из следующих матриц: 1 01 Г1 01 [-1 0 01’0-1’ 0-1 COS р — Sin р sin р cos p (97.6) где p 7^ пк, keL Общий случай. Теорема 97.4. Для любого ортогонального оператора Q в евклидовом пространстве существует ортонормированный базис е, в котором его матрица имеет квазидиагональную форму вида -1 cos</?i — sin <£4 siny>i cosy>j cos <pk — sin <pk sin pk cos<pk (97.7) р ф nk.
296 Глава XVI. Линейные операторы в унитарном пространстве Доказательство. Утверждение теоремы вытекает из теоремы 96.7 с учетом (97.4) и 97.6. Матрица (97.7) называется канонической формой матрицы ор- тогонального оператора. Простым вращением называется оператор в евклидовом простран- стве, который в некотором ортонормированном базисе имеет матрицу вида Г 1 1 О cos 9? — sin tp sin p cos <p 1 О 1 (97.8) Простым отражением называется оператор в евклидовом прос- транстве, который в некотором ортонормированном базисе имеет мат- рицу вида ’ 1 О 1 -1 1 о 1 (97.9) Из определения следует, что простое вращение и простое отраже- ние - ортогональные операторы, так как их матрицы (97.8) и (97.9) в ортонормированном базисе ортогональны. Простое вращение пред- ставляет собой поворот в некоторой двумерной плоскости и оставля- ет неизменным (п — 2)-мерное подпространство, ортогональное этой плоскости. Простое отражение меняет направление всех векторов не- которого одномерного подпространства и оставляет неизменным его (п — 1)-мерное ортогональное дополнение. Теорема 97.5. Всякий ортогональный оператор может быть представлен как композиция некоторого числа простых вра- щений и простых отражений. Это утверждение следует из того, что матрица вида (97.7) может быть представлена в виде произведения некоторого числа матриц ви- да (97.8), (97.9).
§ 98. Самосопряженный оператор 297 § 98. Самосопряженный оператор Линейный оператор А, действующий в унитарном (евклидовом) пространстве, называется самосопряженным, если А = А*. Само- сопряженный оператор в унитарном пространстве называют эрми- товым, а в евклидовом пространстве - симметрическим. Квадратная матрица А (комплексная или вещественная) называ- ется самосопряженной, если А = Ан. Комплексную самосопряжен- ную матрицу называют эрмитовой, а вещественную - симметри- ческой или вещественно-эрмитовой (очевидно, для симметрической матрицы: А = АТ). Из определения вытекают следующие свойства. 1°. Самосопряженный оператор нормален. 2°. Оператор самосопряжен тогда и только тогда, когда в любом ортонормированном базисе он имеет самосопряженную матрицу. 3°. Определитель самосопряженного оператора веществен. 4°. Если подпространство L инвариантно относительно самосо- пряженного оператора А, то также инвариантно относительно Л (теорема 95.4). 5°. Самосопряженный оператор на любом инвариантном подпрос- транстве индуцирует самосопряженный оператор. Теорема 98.1 (спектральная характеристика само- сопряженного оператора). Нормальный оператор в унитарном (евклидовом) пространстве самосопряжен тогда и только тогда, когда все корни его характеристического многочлена вещественны. Доказательство. Необходимость. В унитарном простран- стве это утверждение означает, что все собственные значения эрмитова оператора вещественны, и_вытекает из равенств Ах = Хх и, с уче- том теоремы 96.1, Ах = Хх. Докажем утверждение для евклидова пространства Е. Пусть е - ортонормированный базис Е, тогда Ае - самосопряженная (вещественная) матрица. Рассмотрим произвольное унитарное пространство U той же размерности, что и пространство Е, и в нем произвольный ортонормированный базис /. Тогда матри- це отвечает самосопряженный оператор В € £(U, U), для которого матрица Ае является матрицей в базисе /: Ае = Bj. Следовательно, характеристические многочлены операторов А я В совпадают и по доказанному выше (применительно к оператору В) все корни харак- теристического многочлена оператора А вещественны. Достаточность. Пусть А - нормальный оператор и все корни его характеристического многочлена вещественны. Тогда как в ев- клидовом, так и в унитарном пространстве существует ортонормиро- ванный базис ej,..., еп из собственных векторов оператора А. Если х — 527=1 х‘е« - любой вектор пространства, то Ах = 527=1и А'х = 527=1 = 52?=i так как € R. Следовательно, Ах = А*х, \/х € V, откуда следует, что А = А'.
298 Глава. XVI. Линейные операторы в унитарном пространстве Итак, для самосопряженных операторов основное поле (R или С) не играет такой “роковой” роли, как это было с другими операторами; все утверждения, относящиеся к эрмитовым операторам и матрицам справедливы и для симметрических операторов и матриц. В частности, как следует из теоремы 98.1, нормальный оператор, действующий в унитарном (или евклидовом) пространстве, само- сопряжен тогда и только тогда, когда существует ортонормиро- ванный базис, в котором его матрица имеет вещественную диаго- нальную форму, или, в матричной формулировке: нормальная матри- ца (комплексная или вещественная) является самосопряженной то- гда и только тогда, когда она унитарно (соответственно, ортого- нально) подобна вещественной диагональной матрице. § 99. Знакоопределенные операторы Теорема 99.1. Если в унитарном пространстве V для лю- бого вектора х имеет место равенство (Вх, х) = О, то В — О. Доказательство. Для любых векторов y,z € V имеем (В(у 4- + 2),у+ z) = 0 и (B(iy + z),iy + z) = 0, т.е. (By, у) 4- (Bz, у) 4- (By, z) 4- 4- (Bz, z) = 0, (By, у) i(Bz, у) 4- i(By, z) 4- (Bz, z) = 0 или, с учетом условия теоремы, (Bz, у) 4- (By,z) = 0, — i(Bz,y) 4- i(By,z) = 0. При- бавив к первому равенству второе, умноженное на —г, получим, что (By, z) = 0, Vy, z € V. Следовательно, В = О (теорема 94.1). Теорема 99.2. Линейный оператор А в унитарном прост- ранстве V эрмитов тогда и только тогда, когда (Ar,x)eR, Vi eV. (99.1) Доказательство. Необходимость. Если А - эрмитов опе- ратор, то (Ac,i) = (х,А*х) = (i,Ar), Vi € V; следовательно, (Аг, х) = (Дх, х) и (Ах, х) 6 R, Vi € V. Достаточность. Пусть (Лх,х) € R. Тогда (Дх,х) = (х,Лх) и (Ах, х) = (х,А*х). Отсюда следует, что (х, (Л- А*)х) — 0, Vi е V. Отсюда на основании теоремы 99.1 следует, что А — А*. Замечание. Условие (99.1) формально верно и в евклидовом пространстве, однако лишено смысла, так как справедливо для любых линейных операторов А. Теорема 99.2 позволяет для самосопряженных операторов А го- ворить о знаке числа (Аг, х). Самосопряженный оператор в унитар- ном (евклидовом) пространстве называется положительно опреде- ленным, если (Ах, х) > 0, Vi / 6,
§ 99. Знакоопределенные операторы 299 неотрицательно определенным (отрицательно определенным или неположительно определенным), если (Лт,т) > 0, Vz / в (соответ- ственно (Лт,т) < 0 или (Ах,х) < 0). Обозначение: А > О, А > О, А < О, А < О соответственно. Если е — (ei,..., еп) — ортонормированный базис пространства V, то скалярное произведение (Лх,х) согласно (70.7) может быть запи- сано в виде (Ах,х) = X' Аехе для унитарного пространства, (Ах,х) = х^Аехе для евклидова пространства, или (Ах,х) = (Аехе,хе) (99.2) в естественном скалярном произведении арифметического простран- ства С (в случае унитарного пространства) или R (в случае евклидова пространства). Эрмитова (или симметрическая) матрица А называется положи- тельно определенной, если хнАх >0, х (соответственно хТАх > 0, Vi / в) или если (Ах, х) > 0, х / 9 в естественном скалярном произведении арифметического простран- ства Сп (или Rn). Очевидно, что оператор А положительно определен тогда и толь- ко тогда, когда в любом ортонормированием базисе он имеет положи- тельно определенную матрицу. Теорема 99.3. Самосопряженный оператор А в унитар- ном (и евклидовом) пространстве положительно определен (соот- ветствено А> О, А < О, А < О) тогда и только тогда, когда все его собственные значения А > 0 (X > 0, А < 0, А < 0). Доказательство. Докажем вариант теоремы, относящийся к случаю А > О. Необходимость. Если А > О, то (Ах,х) > 0 для любого вектора х / в. В частности, это верно и для собственного вектора х, поэтому (Ах,х) — (Хх,х) = Х(х,х) > 0, где (х,х) > 0. Значит, А > 0. Достаточность. Если А - самосопряженный оператор, то су- ществует ортонормированный базис из собственных векторов ei,..., еп оператора А. При этом соответствующие собственные значения А, > 0, i = 1, п. Тогда для любого вектора х — 53”=1 9 имеем (Ах,х) = = 5Х1Л«№ > 0- Следствие. Если А> О (или А < О), то оператор А обратим, так как det А = Ai •... • Хп.
300 Глава XVI. Линейные операторы в унитарном пространстве Теорема 99.4. Оператор, обратный к положительно ('от- рицательно ) определенному оператору, положительно (соответст- венно отрицательно) определен. Доказательство. Если А - самосопряженный оператор, то Л-1 - тоже самосопряженный оператор, так как согласно теореме 94.4 (Л-1)* = (Л*)-1 = Л-1. Если А > О (Л < О), то все собственные значения оператора Л-1 положительны (соответственно отрицатель- ны), так как они обратны собственным значениям оператора А. Из теоремы 99.3 следует, что Л-1 > О (Л-1 < О). Теорема 99.5. Для любого неотрицательно (положитель- но) определенного оператора А существует, и притом единствен- ный, неотрицательно (соответственно положительно) определен- ный оператор В такой, что В2 = А. Доказательство. Существование. Построим оператор В. Пусть ei,...,еп - ортонормированный базис пространства из соб- ственных векторов оператора А и Ле, = А,е,, г = 1,п. По условию теоремы А, > 0 (А, > 0), г = 1,п. Положим Bet = , i = 1, п. (99.3) Из (99.3) следует, что оператор В > О (В > О), так как В - нормаль- ный оператор (ибо существует ортонормированный базис ei,...,en из собственных векторов В), при этом он самосопряжен (ибо его соб- ственные значения %/А, € R) и, кроме того, х/А? > 0 (д/А, > 0). Опера- тор В - искомый, так как в силу (99.3) В2е, = А,е, = Ле,, г = 1, п. Единственность. Пусть существует другой оператор С > О (С > О) такой, что С2 = Л. Тогда существует ортонормированный базис /1,... ,/п пространства из собственных векторов оператора С. Если Cfi - mfi, i = 1,п, то Afi - C2fi = p.2fi, г = l,n. Значит, числа д2,..., д2 являются собственными значениями оператора Л и, следовательно, совпадают с числами Aj,..., Ап. Покажем, что Се, = >/А,е,, i = 1, п, (99.4) тем самым в силу (99.3) будет доказано, что С = В. Разложим вектор е, по базису /: п е, = (99.5) fc=i Отметим, что в этом равенстве участвуют собственные векторы е», /1, .-.,/п оператора Л, отвечающие собственным значениям А,, д2, ... , д2. Из линейной независимости собственных векторов, от- вечающих различным собственным значениям, следует, что в разло- жении (99.5) отличными от нуля будут коэффициенты сц лишь при тех fk, которые отвечают собственному значению д£ = А,. Поэтому Се, = = DJLi = V^il2fc=iak/fc = \/А,е,, т.е. выполняются равенства (99.4).
§ 100. Разложения линейного оператора 301 Оператор В называется квадратным корнем из оператора А. В заключение отметим, что в линейной алгебре рассматриваются и операторные (матричные) неравенства: говорят, что для самосопря- женных операторов А и В (матриц Л и В) имеет место неравенство А > В (Л > В), если А — В > 0 (соответственно А — В >0). Анало- гично определяются неравенства А > В, А < В, А < В. §100. Разложения линейного оператора Эрмитово разложение. Линейный оператор А £ £(V, V) в уни- тарном (евклидовом) пространстве V называется косоэрмитовым (соответственно кососимметрическим}, если А* — —А. Квадратная комплексная матрица называется косоэрмитовой, если АИ = —А. Квадратная вещественная матрица называется косо- симметрической, если АТ = —А. Из определения следует, что 1) косоэрмитов (кососимметрический) оператор нормален; 2) оператор А косоэрмитов (кососимметричен) тогда и только то- гда, когда его матрица в любом ортонормированием базисе косоэрми- това (соответственно кососимметрична); 3) все собственные значения косоэрмитова оператора в унитарном пространстве — чисто мнимые (так как если Ах — Хх, то — Ах — Хх, т.е. Л = -А) и следовательно, все корни характеристического много- члена косоэрмитова и кососимметрического операторов - чисто мни- мые; отсюда следует, что 4) кососимметрический оператор не имеет собственных значений. Теорема 100.1. Для любого косоэрмитова оператора А в унитарном пространстве существует эрмитов оператор В та- кой, что А = гВ. Доказательство. Оператор А нормален, следовательно, суще- ствует ортонормированный базис е = (ei,..., еп) пространства из соб- ственных векторов оператора А Если Ах,..., Ап — соответствующие им собственные значения, то Ад, = г/З^, 0k € К, к — 1,п и Ае^ = Положив Век = fikCk, к = 1,п, получим искомый эрмитов опера- тор В. Теорема 100.2. Линейный оператор А в унитарном (ев- клидовом) пространстве может быть представлен, и притом един- ственным образом, в виде суммы А = В + С (100.1) эрмитова (симметрического) оператора В и косоэрмитова (косо- симметрического) оператора С.
302 Глава XVI. Линейные операторы в унитарном пространстве Доказательство. Положим В=|(А + А*), C=^(A-A*). (100.2) А ы Тогда, как легко проверить, В* = В, С* = — С и А = В + С. Единствен- ность такой пары операторов следует из того, что для любой другой пары операторов Bi и Ci таких, что В* = Bi, С* = —Ci и А = Bj 4-Ci, имеем А* = Bi — Ci или |(А + А*) = Bj, |(А - А*) = С\, т.е. в силу (100.2) Bi = B,Ct =С. Разложение (100.1) называется эрмитовым разложением опера- тора А. В силу теоремы 100.1 эрмитово разложение оператора в унитарном пространстве может быть записано в виде А = В + гТ), где В и Т> - эрмитовы операторы. Теорема 100.3. Линейный оператор А € £(V, V) в уни- тарном (евклидовом) пространстве нормален тогда и только то- гда, когда операторы В и С в эрмитовом разложении (100.1) этого оператора перестановочны. Доказательство. Если А — В + С, то А* = В-С » АА* = В2 - -ВС + СВ-С2, Л’Л = В2-СВ+ВС-С2, т.е. АА* -А* А = 2(СВ-ВС). Значит, АА’ = А* А тогда и только тогда, когда СВ = ВС. Сингулярная пара базисов и сингулярное разложение. Пусть V и IV - два унитарных (или два евклидовых) пространства и dim V — п, dim IF = т. Теорема 100.4. Для любого линейного оператора А € € £(V, IV) ранга т существуют положительные числа Pi > р2 > •.. > рг > 0, ортонормированные базисы е = (ej,... ,еп) пространства V и f = (fi,..., fm) пространства W такие, что Pkfk, k = l,r; в, k = г + 1, n, ркек, /c = l,r; в, к = r + 1, т. (100.3) (100.4) Доказател ьство. 1. Рассмотрим операторы А* А и АА*. Заме- тим, что а) А’А 6 C(V, V), АА* 6 C(W, W); б) А’А и АА* - самосопряженные операторы, так как (А’А)* = = А* А и (АА*)* = АА*;
§100. Разложения линейного оператора 303 в) А* А > 0, АА* > 0, так как (А* Ах, х) = (Ах, Ах) > О, Vz 0; (АА*х, х) = (А*х,А*х) >0, Vz 0. 2. Для оператора А* А (в силу п. 1“б”) существует ортонормирован- ный базис ei,..., еп из собственных векторов, причем (в силу п. Г‘в”) соответствующие собственные значения неотрицательны. Пусть rg А* А = t и векторы ei,..., еп пронумерованы так, что первые t соб- ственных значений pf,..., р2 отличны от нуля, причем р? > р| > - - • > Pt, а остальные собственные значения р%+1, . ,р„ равны нулю, т.е. Pfc > 0, к < t, рк = 0, к > t, А*Аек = ркек, k<t, A*Aek = 0, к > t. (100.5) (100.6) 3. Рассмотрим систему векторов Aei, Ле2,... ,Ае„. Заметим, что а) Аек € W, к = 1, п; б) (Аек, Ае.) = (А*Аек, е}) = р2к(ек, е2) = ( J к'’ (1°° 7) (О, j к. Из (100.7) следует, что Aei,... ,Aet - ненулевые попарно ортого- нальные векторы из W, а Аек = 0, к > t. (100.8) Таким образом, векторы AeiAet образуют базис imA, так что t = т. Пусть рк = у/р^, к = 1,п. Тогда рк > 0, к = 1,г и |Лвк| = рк, к — 1, г. Обозначим fk = ~Aek, fc = l,r. Рк (100.9) Из (100.9) и (100.8) следует, что Векторы fi,..., fr образуют ортонормированную систему. Допол- ним их до ортонормированного базиса W-. fr+i, • •, fm-
304 Глава XVI. Линейные операторы в унитарном пространстве Векторы /1э... ,fT, /г+i,.. .,fm являются собственными вектора- ми оператора АА’, отвечающими собственным значениям pf, ..., р2, 0,... ,0, так как / 1 \ 1 п2 AA’fk = АА* ( — Аек ) - —А(А’ Аек} = — Аек = ркАек = p2kfk- \Рк J рк 4. Таким образом, построены ортонормированный базис е = = (ei,..., еп) пространства V из собственных векторов оператора А* А и ортонормированный базис / = (/i, • •, /п) пространства W из собственных векторов оператора АА*. Из (100.10) следует, что опе- ратор А в паре базисов ей/ имеет прямоугольную диагональную матрицу Pi О размера m х п с невозрастающими неотрицательными элементами на диагонали. Согласно (94.7) оператор А* в паре базисов / и е имеет матрицу >1 Рг 0 (Л’)е/ = 0 размера n х т. Отсюда следует, что ... (Рк?к, к<г, *>г. Это соотношение вместе с (100.10) завершает доказательство теоре- мы.
§ 100. Разложения линейного оператора 305 Следствие 1. г = rgA = rgA* — rgA*А = rgАЛ*, Следствие 2. Ненулевые собственные значения операторов А*А и АА* совпадают. Если s — min(m, п), то операторы А*А и АА* имеют еще и s — г общих нулевых собственных значений. Следствие 3. imA = ker А = £(er+i,... ,еп), imA* = £(ei,..., er), ker Л* = £(/r+i,-1/m)- Замечание 1. Очевидно, что теорема 100.4 справедлива и для операторов, действующих в одном пространстве. Числа р\,..., ря (т.е. арифметические значения квадратных кор- ней из общих собственных значений операторов А*А и АА*) называ- ются сингулярными числами оператора А. Векторы ei,..., еп называются правыми сингулярными векторами оператора Л, а векторы fi,...,fm ~ левыми. Теорема 100.5 (матричная формулировка теоре- мы 100.4). Для любой матрицы А € стпУп (Rmxn) ранга г су- ществуют положительные числа pi > рг > ... ~> рТ, унитарные (ортогональные) матрицы С G Cnxn (Rnxn) и D € С”1*"1 (R’nxm) такие, что А = DACH (Л = DACT), (100.12) где 'Рг — прямоугольная диагональная матрица размера т х п. Доказательство можно провести по схеме, аналогичной (88.6). Приведем другое доказательство. Теорема 100.4 означает, что для любой матрицы А существуют положительные числа pj > р2 > . > > рТ > 0 и ортонормированные системы векторов е\,... & Cn(Rn), fi,... ,fm е Cm(Rm) такие, что Aek = • Pkfk, k = l,r- в, k = г + 1, n; PfcCfc, в, k = l,r; k = r + 1, m. (100.13)
306 Глава XVI. Линейные операторы в унитарном пространстве Соотношения (100.13) равносильны матричному равенству Л[в1... еп] — [/{... /т]Л или, в обозначениях С = [ei...e„], D = равенству (100.12). Остается добавить, что матрицы С Е C"xn(Rnxn) и D е CTnxm(Rmxm) _ уНИТарНые (ортогональные) матрицы как ма- трицы с ортонормированными столбцами. Векторы ei,..., е„ и /1, .., из (100.13) называются соответ- ственно правыми и левыми сингулярными векторами матрицы А, числа Pi,P2, • где s = min(m,п), (т.е. арифметические квадрат- ные корни из общих собственных значений матриц Ан А и ААН) - сингулярными числами матрицы А, а соотношение (100.12) - сингу- лярным разложением матрицы А. Полярное разложение. Теорема 100.4 верна и для оператора Л, действующего в одном пространстве V, унитарном или евклидо- вом. Отличие состоит лишь в том, что сингулярные базисы состоят из одинакового числа векторов. Теорема 100.6. Линейный оператор А, действующий в уни- тарном (евклидовом) пространстве, может быть представлен в виде произведения A = BU (100.14) неотрицательного оператора В и унитарного (ортогонального) опе- ратора U. При этом оператор В определен однозначно, а если А обра- тим, то и оператор U определен однозначно. Доказательство. Существование. Пусть е — (ei,...,еп) и / = (/i,..., fn) - сингулярная пара базисов для оператора А. По- ложим Me* — fк, к — 1, п; J _ (100. = Pkfk, к = 1,п. Тогда U — унитарный (ортогональный) оператор, так как он пе- реводит ортонормированный базис е в ортонормированный базис /; В > 0 как нормальный оператор (ибо ортонормированный базис f со- стоит из его собственных векторов), собственные значения которого неотрицательны (уточним, что pi > рг > ... > рг > 0, pr+i = ... = — рп = 0). При этом А = BU, так как согласно (100.3) Ле*, = Pkfk, к — 1,п и согласно (100.15) BUek = Pkfk, к = 1,п. Единственность. Пусть А = BU - разложение (100.14) опе- ратора А. Тогда А* — U* В* и АА* =tB*. Таким образом, В - ква- дратный корень из оператора АА*, который на основании теоремы 99.5 существует и определен однозначно. Если оператор А обратим, то согласно следствию 1 обратим и оператор А*А, поэтому рк ф 0,
§ 100. Разложения линейного оператора 307 к = 1,п, и в силу (100.15) обратим оператор В. Отсюда и из (100.14) следует, что U = В'1 А. Разложение 100.14 называется полярным разложением, оператора. Замечание 2. Для любого оператора А имеет место разложение А = VC, где V - унитарный (ортогональный) оператор, С > 0. Оно может быть получено из полярного разложения сопряженного оператора А' = ВЫ переходом к оператору Л: Л = U* В, где U* = V - унитарный (ортогональный) оператор. Теорема 100.7. Линейный оператор А в унитарном (ев- клидовом) пространстве нормален тогда и только тогда, когда в любом его полярном разложении операторы В иЫ перестановочны. Доказательство. Пусть А = BU - полярное разложение опера- тора А. Тогда АА* = Б2, А* А = U*B2U. Достаточность очевидна, так как если ВЫ ~ UB, то Л*Л - = U*B2U = U*B(BU) = U*B(UB) = U*(BU)B = U*(UB}B = U’UB2 = = В2 = АА*. Необходимость. Если ei,... ,еп -ортонормированныйбазис из собственных векторов А* А, то А* Аек = Ркек , к-1,п. (100.16) С другой стороны, А* А = U*B2U и, значит, U*B2Uek — pfac, т.е. B2Uek = p2kUek , к = Т~п. (100.17) Так как оператор К унитарен, то векторы Ue\,... ,Uen образуют ортонормированный базис, поэтому в соответствии с (99.3) из (100.17) получим ___ BUek = pkUek , к = 1, п. (100.18) С другой стороны, А* А = АА* = В2 и согласно (100.16) В2ек = = ркек или, в соответствии с (99.3), Век = ркек, откуда умножением на 1А слева получим, что UBek = ркЦек , к = Т~п. (100.19) Сравнение равенств (100.18) и (100.19) доказывает, что BU = ЫВ.
Глава XVII. Билинейные и квадратичные формы В §58 была рассмотрена одна из основных задач аналитической геометрии на плоскости - приведение общего уравнения линии второго порядка к каноническо- му виду. Теория квадратичных форм, излагаемая здесь, ставит основной своей целью решение этой и связанных с нею задач в пространстве любой размерности. § 101. Билинейные и квадратичные формы в линейном пространстве Билинейные формы. Пусть V - линейное пространство над по- лем Р1. Отображение А : V х V —> Р называется билинейной формой в пространстве V, если для любых х, у, z € V, а € Р: 1) Л(х + у, z) = Л(т, z) + А(у, z)-y 2) А(ах,у) = aA(x,y)\ , 3) Д(х, у + z) = А(х,у) + Л(х,г); ' ’ ' 4) А(х,ау) - аА(х,у). Билинейная форма называется симметричной, если А(у, х) = = А(х,у), Ух,у € V, и кососимметричной, если .4(1/, х) = —А(х,у), Ух, у eV. Примеры. 1. Скалярное произведение (х,у) в евклидовом прост- ранстве является симметричной билинейной формой. 2. В любом линейном пространстве V, если f(x), д(х) - линейные формы, то функция А(х, у) = f(x)g(y) является симметричной били- нейной формой. 3. В n-мерном пространстве V с базисом ei,...,en отображение А : V х V —> Р, определенное правилом А(х,у) = ^2 aijxiVj> (101.2) i.J=l Ух — 52"= j XiCz, у = 52"= i гДе aij (i’j — 1,^) - фиксированные числа, является билинейной формой (в силу линейности координат). Теорема 101.1. Пусть V - линейное пространство над по- лем Р и ei,...,еп - базис V. Для любых чисел аг] Е Р, i,j — 1,п, существует, и притом единственная, билинейная форма А(х, у) в пространстве V, для которой A(ei,ej) = al}. i,j = 1,п. !В этой главе предполагается, что характеристика основного поля равна нулю.
§101. Билин. и квадр. формы в линейном пространстве 309 Доказательство. Пусть ei,...,en - базис пространства V и ay, г-.] = 1,п, - заданные числа. Отображение (101.2) является били- нейной формой в пространстве V (пример 3), причем A(ei,ej) = i,j = 1,п (так как векторы е, и е; имеют очевидные наборы ко- ординат в базисе ei,... , еп). Покажем, что любая билинейная форма В(х,у) в пространстве V, для которой Б(е;,еД = av, i,j = 1,п, со- впадает с А(х,у). В самом деле, для любых векторов х = £"=1 iiei, У = ЕГ=1 yiei ° СИЛУ (101-1) имеем В(х, у) = В(£7=1 X>e«-Z"=i Узез} = = Е"=1Е”=1^У10(еье1) = £"j=i aijxiyji т.е. В(х,у) = А(х,у), Ух, у е V. Таким образом, в примере 3 приведен самый общий вид билиней- ной формы в 71-мерном пространстве. Представление билинейной формы в виде (101.2) называется об- щим видом билинейной формы в базисе е. Матрица Ле — (а.Д € Рпхп, элементы которой определены равенством аг1 = Afe^ej), i,j = l,n, называется матрицей билинейной формы А(х, у) в базисе е. Как следует из теоремы 101.1, билинейная форма однозначно определяется своим заданием на базисных векторах, при этом матрица билинейной формы пред- ставляет собой таблицу ее значений на парах базисных векторов и в силу (101.2) однозначно определяет значения этой формы для любой пары векторов. Общий вид (101.2) билинейной формы А(х,у) может быть записан в компактной форме: если хе и уе - координатные столбцы векторов х и у в базисе е, то Д(т, у) = х? Аеуе, А(х,у) = yf А^хе. (101.3) Первое из равенств (101.3) проверяется непосредственно, второе ра- венство можно получить транспонированием обеих частей первого. Выражение в правой части равенства (101.2) называется билинейной формой от переменных х i,... ,хп и щ,. .., уп. Правые части равенств (101.3) представля- ют собой компактную запись этой билинейной формы. Теорема 101.2. Существует взаимно однозначное соот- ветствие между множеством всех билинейных форм в п-мерном пространстве V над полем Р и множеством матриц РпУп, Доказательство. Пусть ei,..., еп - базис пространства V. По- ставим в соответствие каждой билинейной форме Л(т, у) ее матрицу А,. & рп-е-п дто соответствие биективно, так как каждая матрица А = (aij) е Рпхп в силу теоремы 101.1 является матрицей били- нейной формы (101.2) и в силу однозначности координат различные билинейные формы имеют разные матрицы. Теорема 101.3. Билинейная форма симметрична (кососим- метрична) тогда и только тогда, когда ее матрица в любом базисе симметрична (соответственно кососимметрична). Доказательство. Необходимость проверяется непосред- ственно. Достаточность. Если А? — Ае то, согласно (101.3), А(х,у) = = у^А^Хе = А(у,х).
310 Глава XVII. Билинейные и квадратичные формы Теорема 101.4. Матрицы билинейной формы А(х,у) е ба- зисах е и f — eQ связаны соотношением Af — QTAeQ. Доказательство. Согласно (101.3), с одной стороны, Л(т, у) = = xjAeye - {хе = Qxj,ye = Qyj} - x}QTAeQyj. С другой сторо- ны, Л(т, у) — x^Ajyj. Отсюда с учетом произвольности х,у следует утверждение теоремы. С л едствие. rg Ае — rg А]. Таким образом, все матрицы одной билинейной формы имеют оди- наковый ранг. Рангом билинейной формы называется ранг ее матрицы в произвольном базисе. Билинейная форма А(х, у) называется выро- жденной, если rg.4(i, у) < dim V, и невырожденной, если rgA(x,y) = = dimV. Теорема 101.5. Билинейная форма А(х, у) вырождена то- гда и только тогда, когда существует вектор х в такой, что А(х,у) =0, Vy € V. (101.4) Доказательство. Пусть «1,...,еп - базис V и Ае = (а^) - ма- трица билинейной формы Л(х, у) в этом базисе. Соотношение (101.4) равносильно системе равенств А(х, ej) = 0, j = 1,п, или, если учесть разложение х = ZXi1*6», системе равенств iM(et,ej) = 0, j = 1,п, т.е. ацТ1 + <221^2 + • • • + aniin = 0, ................................... (101.5) . “Ь а.2п*^2 + . • • + аппхп — 0. Значит, билинейная форма А(х, у) вырождена тогда и только тогда, когда однородная система линейных уравнений (101.5) имеет нетри- виальное решение, т.е. (теорема 28.5) когда rg Ае < п. Квадратичные формы. Пусть А(х, у) - симметричная билиней- ная форма в пространстве V над полем Р. Квадратичной формой на- зывается отображение А : V -> Р, которое каждому вектору х 6 V ставит в соответствие число А(х,х), т.е. сужение симметричной би- линейной формы на диагональ (декартова квадрата V х V). Обозначение: Л(т,х) или Л(т). Билинейная форма Л(х,у) при этом называется полярной билинейной формой к квадратичной форме Л(т,а:). Теорема 101.6. Полярная билинейная форма для любой ква- дратичной формы определена однозначно. Это утверждение вытекает из того, что если А(х, у) - полярная билинейная форма для квадратичной формы А(х,х), то для любых х,у € V А(х,у) = |(Л(т + у,о: + у) - А(х,х) - Л(у,у)). Таким образом, полярная билинейная форма Л(х,у) однозначно восстанавливается по квадратичной форме Л(т,х). Единственность
§101. Билли. и квадр. формы в линейном пространстве 311 полярной билинейной формы А(х, у) позволяет переносить ее харак- теристики на квадратичную форму А(х,х). Матрицей квадратичной формы А(х, х) в базисе е называется матрица полярной к ней билинейной формы А(х, у) в этом базисе. Из свойств билинейной формы вытекают следующие свойства ква- дратичных форм. 1°. Матрица квадратичной формы симметрична. 2°. Существует взаимно однозначное соответствие между квадра- тичными формами в пространстве V и симметрическими матрицами из Рпхп. 3°. Матрицы квадратичной формы в базисах е и f = eQ связаны соотношением Aj = QTAeQ. (101.6) Матрицы А и В, связанные равенством В = QTAQ для некоторой невырожденной матрицы Q, называются конгруэнтными. Нетруд- но проверить, что отношение конгруэнтности является отношением эквивалентности на множестве матриц одинакового порядка. Таким образом, матрицы квадратичной формы А(х, у) в базисах ей/ конгруэнтны, а если е и / - ортонормированные базисы, то эти матрицы подобны. 4°. В базисе е квадратичная форма А(х,х) с матрицей Ае = (ау) может быть записана в следующем виде: Vi — 52"=1 XiCi п А(х,х) = aijiiXj, aij — aji, (101.7) «,j=i или, в компактной форме, А(х,х) = х^Аехе, А^ = Ае. (101.8) Представление квадратичной формы в виде (101.7) или (101.8) называется общим видом квадратичной формы А(х, х) в базисе е. Выражение /(tj,..., xn) — Yh,j=i где называется квадратичной формой от переменных ®i,..., хп. 5°. Рангом квадратичной формы называется ранг ее матрицы в произвольном базисе. Очевидно, rgX(x,;r) = rg.A(:r, у). Квадратичная форма Д(т,х) называется вырожденной, если rg.4(:r,:r) < dimV, и невырожденной, если rg Л(гс, х) = dim V. Канонический вид квадратичной формы. Выбирая подхо- дящим образом базис V, можно менять вид матрицы квадратичной формы и, следовательно, ее общий вид (101.7). Базис е = (ei,...,en) называется каноническим базисом квадра- тичной формы А(х,х), если матрица квадратичной формы в этом базисе диагональна: Ае = diag(Ai,..., Ап).
312 Глава XVII. Билинейные и квадратичные формы В каноническом базисе квадратичная форма А(х, х) соглас- но (101.7) имеет вид Л(т,т) = Aiif -I- . . . + AnZn' который называл ется каноническим видом, квадратичной формы, а числа Ai,...,An - ее каноническими коэффициентами. Канонический вид называют также суммой квадратов. Очевидно, что число ненулевых квадра- тов совпадает с рангом А(х,х). Итак, если е - канонический базис и г = rg А(х, х), то А(х,х) = Ai^i + ... + АгХг, Х/х = '^хгег. (101.9) i=l Теорема 101.7. Для любой квадратичной формы существу- ет канонический базис. Доказательство. Пусть е = (ej,...,еп) - базис V. Квадратич- ная форма А(х,х) с матрицей Ае = (а,3) имеет в этом базисе вид (101.7). Обозначим g(xit..., хп) = QijXiXj. Покажем, что переходом к другому базису квадратичная форма Л(т, х) приводится к каноническому виду. Переход к другому базису f = eQ равносилен преобразованию координат по известному закону хе — Qxj, |Q| 0. В терминах координат утверждение теоремы озна- чает, что любая квадратичная форма g(xi,... ,тп) от переменных Xi,...,xn невырожденным преобразованием координат приводится к сумме квадратов. Это мы и будем доказывать. Будем считать, что Ае / О (если Ае = О, то е - искомый базис). Обозначим через Д& угловые миноры k-vo порядка матрицы Ае, т.е. Д^ = k = 1, п. и положим До — 1- _______ I. Рассмотрим сначала случай, когда Д^ / 0, fc = 1,п — 1. В этом случае процесс приведения к каноническому виду состоит из п — 1 однотипных шагов. Первый шаг основан на том, что Д! 0, т.е. ац 0. Сгруппируем все члены квадратичной формы g(xi,... ,хп), содержащие xj, и вы- делим из них полный квадрат: А(х,х) = д(хг,... ,хп) = ант? + 2 alfexixfe + £”fc=2aikX>xk = / \ 2 / \2 ’ t i V~*n ^lA: \ I \ — А2ц ( Xj 4- / . о I I 2-^i k—2 ^ikXiXk. \ «И / \ Oil / Перейдем к новым координатам: = Xi + > . -хк и Xj = x, при J £ 1, k=2 aH очевидно выполнив при этом невырожденное преобразование коорди- нат с матрицей Qi = 1 —012/ац ... —<2in/au 0 1 ... 0 0 0 ... 1 (101.10)
§101. Билин. и квадр. формы в линейном пространстве 313 Тогда квадратичная форма А(х, х) в новых координатах примет вид Д(х,х) = ацх'2 +h(x2,... , х„), где Л.(х2, • • • ~ квадратичная фор- ма от переменных х2,. ..,х'п. При этом матрица Ai = QfAeQ] ква- дратичной формы А(х,х) в новом базисе будет иметь вид ац 0 ... 0 д _ 0 а22 • • • а2п L 0 <2 ... а'пп . Каждая строка (столбец) матрицы Ль начиная со второй, получе- на из соответствующей строки (соответственно столбца) матрицы Ае вычитанием из нее первой строки (соответственно столбца) матрицы Ае, умноженной на некоторое число, поэтому угловые миноры матри- цы Ai сов падают с Д i,..., Дп. Следовательно, Д1 = а ц, Д 2 = ац а22 и а22 = Д2/Д1 * 0. (101.11) Второй шаг основан на том, что Д2 / 0, т.е. а22 0, и со- стоит в применении действий первого шага к квадратичной форме h(x2,..., х'п\. выделяется полный квадрат среди всех членов, содержа- щих х2, выполняется невырожденное преобразование координат х2 = х2 + Е и xj = xj ПРИ 1 / 2 k=3 а22 и квадратичная форма А(х,х) приводится к виду Л(х, х) — ацх"2 + 4- а'22х22 + v(x2,..., 1"), где v(x2,..., 1") - квадратичная форма от переменных х2,..., х", а ее матрица - к виду Л2 — ац 0 0 0 а22 0 0 0 азз ... О' ... 0 0 0 апЗ <п. По-прежнему угловые Д1, Д21 •. •, Дп, поэтому миноры матрицы Л2 совпадают азз - Д3/Д2 0. (101.12) Повторяя этот процесс, через (п - 1) шагов мы придем к базису, в котором матрица квадратичной формы А(х, х) имеет диагональную форму: Ап-1 = diag(Ai,..., А„), где с учетом (101.11), (101.12) и обо- значения До = 1 ___ А< = Д</Д<_ц г = 1,п. (101.13) Отметим, что каждый шаг (для определенности г-й шаг) процесса начинается с проверки условия Д, 5^ 0, так как только при выполне- нии этого условия можно провести i-й шаг. Метод приведения к каноническому виду, описанный здесь, назы- вается методом Лагранжа.
314 Глава XVII. Билинейные и квадратичные формы II. Пусть теперь среди угловых миноров Aj,..., An_j могут встре- титься нулевые. Модифицируем метод Лагранжа. Опишем г-й шаг. Пусть после (г — 1)-го шага матрица квадратич- ной формы Л(х, я) имеет вид (здесь штрихи опущены для упрощения записи). Будем считать, что С О (равенство С = О означает, что канонический базис уже построен). 1. Если ац 0, то выполним г-й шаг метода Лагранжа. 2. Пусть ait = 0. а) Если среди диагональных элементов матрицы С существует элемент ajj 0, j > г, то перенумеруем переменные (т.е. векторы базиса): х\ — Xj, x'j = xt и xk = Xk при k i,j. Тогда в матрице Л,_1 поменяются местами строки (столбцы) с номерами г и j, поэтому в позиции (г, г) окажется ненулевой элемент a'it = ajj, с помощью которого выполним г-й шаг метода Лагранжа. б) Пусть все диагональные элементы матрицы С равны нулю, тогда в ней существует внедиагональный элемент ак] 0, k,j > г, k j. Это означает, что в квадратичной форме от переменных отсутствуют квадраты но содержится член ви- да 2aitjX/tXj. Перейдем к новым координатам, положив хк = х'к + т', Xj = х'к - x'j и х'а = xs при з к, j. Тогда квадратичная форма будет иметь квадраты хк, т'2 и мы окажемся в ситуации "а". Отметим, что все преобразования координат были невырожденными. Теорема 101.8. Если в матрице квадратичной формы Л(т, х) ранга г первые г угловых миноров отличны от нуля: А*, ф 0, к — 1,?*, то существует базис е, в котором матрица квадратичной формы имеет диагональный вид Ае = diag(Ai,..., Аг, 0,..., 0), где Afc = Afc/Afc_i, k = l,r. (101.14) Доказательство. Напомним, что До = 1. Для квадратичной формы Л(т, х) в условиях теоремы выполнимы первые г шагов ме- тода Лагранжа. После r-го шага матрица Аг квадратичной формы примет вид
§ 102. Квадратичные формы в вещественном пространстве 315 где, согласно (101.13), Ак = Ak/Ak-i, к = l,r, а С - некоторая матри- ца. Так как rgAr = г и А* / 0, к = 1,г, то rgC = 0 и С = О. Следовательно, матрица Аг имеет искомый вид. Соотношения (101.14) называются формулами Якоби. Замечание. Если в матрице квадратичной формы А(х,х) в ба- зисе е угловые миноры Aj,,.., An-i отличны от нуля, то можно про- вести п — 1 шагов стандартного метода Лагранжа. На каждом шаге матрица перехода Qi, i = 1, n - 1, к новому базису согласно (101.10) имеет верхнюю треугольную форму, так что для последнего базиса f имеет место соотношение f = eQiQ2 - Qn-i = eQ, где Q - верхняя треугольная матрица с единичными диагональными элементами. Таким образом, квадратичная форма Д(х, х) треуголь- ным преобразованием координат приводится к каноническому виду с каноническими коэффициентами Afe ________ Ajt = —--, к — 1,п. Ак-1 Теорема 101.9. Квадратичная форма Д(т,х) вырождена тогда и только тогда, когда существует вектор х 6 такой, что А(х, х) = 0. Доказательство. Утверждение теоремы вытекает из теоремы 101.5 и канонического вида (101.9) квадратичной формы ранга г < dim V. § 102. Квадратичные формы в вещественном пространстве Ни канонический базис, ни канонический вид квадратичной фор- мы не определены однозначно. Например, любая перестановка векто- ров канонического базиса приводит вновь к каноническому базису. Что общего у различных канонических видов одной и той же ква- дратичной формы? В (101.9) мы отмечали, что число ненулевых ка- нонических коэффициентов равно рангу квадратичной формы и не зависит от выбора канонического базиса. В вещественном простран- стве можно говорить и о знаках канонических коэффициентов. Пусть квадратичная форма Л(х, х) ранга г в вещественном прост- ранстве V приведена к каноническому виду (101.9). Число к поло- жительных квадратов в (101.9) и число и = г - л называются по- ложительным и отрицательным индексами инерции квадратичной формы А(х, х), их разность а = тг — и называется сигнатурой А(х, х). Корректность определения вытекает из следующей теоремы.
316 Глава XVII. Билинейные и квадратичные формы Теорема 102.1 (закон инерции). Положительный и от- рицательный индексы инерции вещественной квадратичной формы не зависят от выбора канонического базиса. Доказательство. Пусть ей/- канонические базисы квадра- тичной формы А(х, х) ранга г и для х — XiCi = J2"=i х) = + . . + арХр — jхр+ j — ... — агхг, . . Л(х, х) = Ь^ + ... + bqy% - bq+i^+1 - . • - - Ьгу$, где at > О, Ь{ > 0, г = 1,г. Докажем, что р < q. Пусть р > q. Рас- смотрим подпространства Lj = £(щ,... ,ер), L-% — £(fq+\,..., fn). Согласно (65.2), dimLj О L2 = p + (n — q) — dim(Li -I- L2). Так как dim(Li + L2) < n, p > q, to dim Li Г) L2 > 0. Следовательно, су- ществует ненулевой вектор xq G Li О L2. Пусть xq = оце^ + ... + + apep = 0q+ifq+i + ... + 0nfn. Тогда согласно (102.1) Л(х0, io) = аЮ1 + • + ара? = -bq+l^+l - ... - bT(3p. (102.2) Так как xq / в, то + ... + арар > 0, -bq+i/3q+l - ... — ЬТ/3? < 0. Это противоречит (102.2), и, значит, р < q. Аналогично показывается, что q <р. Следовательно, р = q. Обозначим символами Р(Д0, Дх,..., Дк) и И(До, Дь..., Дк) чи- сло совпадений и перемен знаков в последовательности До, Дj,..., Дк. Теорема 102.2 (сигнатурное правило Якоби). Пусть Дк - угловой минор k-го порядка матрицы квадратичной формы -4(х, х) ранга г и Дк / 0. к — 1, г. Тогда л = Р(До, Д1, • •, Дг), р = И(Д0, Д1,..., Дг), где До = 1. Утверждение теоремы вытекает из формул Якоби (101.14), так как > 0, если sgnAj = sgn Д,_1, и А, < 0, если sgn Aj sgn Д<_1. Знакоопределенные квадратичные формы. Квадратичная форма Д(х, х) называется положительно (отрицательно) опреде- ленной, если Л(х,х) > 0 (соответственно Л(х, х) < 0), Vi / 0. Та- кие формы называют знакоопределенными (или знакопостоянными). Квадратичные формы Л(х, х), для которых Л(х, х) >0, Vx € V, или Л(х, х) <0, Vi € V, называются квазизнакопостоянными. Квадра- тичные формы, для которых существуют векторы х и у такие, что А(х, х) > 0, А(у, у) < 0, называются знакопеременными. Из (101.9) и (99.2) следует, что квадратичная форма .4(х, х) по- ложительно определена тогда и только тогда, когда в любом базисе пространства она имеет положительно определенную матрицу (это же, очевидно, относится ко всем знакоопределенным квадратичным формам). Пример. Примером положительно определенной квадратичной формы в вещественном пространстве может служить скалярный ква- драт в евклидовом пространстве, т.е. отображение А : Е —> R, опре- деленное равенством Л(х) = (х,х), Vx € Е. Это следует из того,
§102. Квадратичные формы в вещественном пространстве 317 что скалярное произведение (х, у) является симметричной билиней- ной формой (в силу аксиом 1—3 из (68.1)), а скалярный квадрат - по- ложительно определенной квадратичной формой (в силу аксиомы 4). Теорема 102.3. Квадратичная форма А(х, х) положитель- но (отрицательно) определена тогда и только тогда, когда ее поло- жительный (соответственно отрицательный) индекс инерции со- впадает с размерностью пространства. Доказательство. Докажем сначала вариант теоремы, относя- щийся к положительно определенной форме. Пусть е - канонический базис квадратичной формы Л(х, х) и А1;..., Ап - ее канонические ко- эффициенты. Необходимость. Если А(х,х) > 0, Ух / в, то, в частности, A(et,ei) > 0, i = 1,п. Но А(е±, е^) — А,, следовательно, все канониче- ские коэффициенты положительны и тг = п. Достаточность. Если А, > 0, i = 1,п, то, согласно (101.9), А(х,х) = 53 А,х2 > 0, Ух = 52 / #• • =1 i=l Для доказательства второго утверждения достаточно рассмотреть квадратичную форму —Л(х,х): А(х, х) < 0 <=> —Л(х,х)>0 <=> p = diniV. Следствие. Определитель матрицы положительно определен- ной квадратичной формы положителен, так как если е - канони- ческий базис, то в произвольном базисе /, согласно (101.6), |А/| = = Ах •... - Ап -1<?|2 > 0. Теорема 102.4 (критерий Сильвестра). Квадратичная форма «4(х, х) положительно (отрицательно) определена тогда и только тогда, когда угловые миноры Ak, к = 1,п, ее матрицы в про- извольном базисе положительны (соответственно чередуют знаки, начиная с отрицательного): Д* > О, к — 1,п (Д*Д/;_1 < 0, к = 1,п). Доказательство. Докажем первое утверждение. Необходимость. Пусть А(х, х) - положительно определенная квадратичная форма, Ае - ее матрица в произвольном базисе е = = (ei,... ,еп). Рассмотрим подпространства Lk = £(ei,... , ejt), к = 1, п, и квадратичные формы А(х, х) на Lk- Очевидно, А(х, х) > 0, Vx € Lk, х ± в, и, значит, ее матрица А*; в базисе ех,... ,вк простран- ства Lk имеет положительный определитель |А*;| (следствие из тео- ремы 102.3). Но |Afc| = Д*, к = 1,п, следовательно, Д*, > 0, к — 1,п. Достаточность вытекает из теорем 102.2 и 102.3. Для доказательства второго утверждения рассмотрим квадратич- ную форму — Л(х, х) с угловыми минорами 5к - Отрицательная опре- деленность Л(х,х) равносильна положительности формы_— Л(х,х), т.е. условию 6к > 0, к = 1,п, или (—1)*Дк > 0, к = 1,п. Так как До = 1 > 0, то это условие означает, что Д*Д*_Х < 0, к = 1,п.
318 Глава XVII. Билинейные и квадратичные формы Общий вид скалярного произведения в вещественном про- странстве. Как следует из примера положительно определенной ква- дратичной формы, скалярное произведение в евклидовом простран- стве является билинейной формой, полярной к положительно опреде- ленной квадратичной форме. Оказывается, что такими билинейными формами исчерпываются все скалярные произведения в веществен- ном пространстве. Теорема 102.5. Пусть V - вещественное линейное прост- ранство. Отображение А : V х V —> R есть скалярное произведение в пространстве V тогда и только тогда, когда оно является билиней- ной формой, полярной к положительно определенной квадратичной форме. Доказательство. Необходимость рассмотрена в примере. Достаточность. Пусть А(х,у) - билинейная форма, полярная к положительно определенной квадратичной форме. Тогда отображе- ние А : V х V —> R, определенное правилом (я, у) - А(х,у), Чх,у е V, (102.3) является скалярным произведением, так как оно удовлетворяет всем аксиомам (68.1) скалярного произведения. Представление (102.3), в котором А(х,у) - билинейная форма, полярная к положительно определенной квадратичной форме, назы- вается общим видом скалярного произведения в вещественном про- странстве. Пользуясь общим видом (101.3) билинейной формы в базисе е, ра- венство (102.3) можно записать в виде (*,у) = ylAexe, Vx,yeV, (102.4) где Ае - положительно определенная матрица. Равенство (102.4) дает общий вид скалярного произведения в базисе е вещественного про- странства. Замечание. Матрица билинейной формы, задающей скалярное произведение, совпадает с матрицей Грама базисных векторов: Ае = = G(ei,..., еп). § 103. Квадратичные формы в комплексном пространстве В комплексном пространстве полным аналогом вещественных ква- дратичных форм являются так называемые эрмитовы квадратичные формы. Полуторалинейные формы. Пусть V - комплексное линейное пространство. Отображение А : V х V С называется полуторали- нейной формой, если для любых х, у, z е V, а € С:
§ 103. Квадратичные формы в комплексном пространстве 319 1) А(х + y,z) = А(х, z) + А(у,z); 2) A(ax,y) = aA(x,y)-, 3) Л(т, у + z) = Л(х, у) + Л(т, г); 4) А(х, ay) = aA(x,y). Полуторалинейную форму называют эрмитовой, если А(у, х) — А(х, у), Ух, у €V. Примеры. 1. Скалярное произведение (х,у) в унитарном прост- ранстве является эрмитовой полуторалинейной формой. 2. Примером полуторалинейной формы в n-мерном комплексном пространстве V с базисом ei,... ,вп может служить функция, опре- деленная равенством: Ут — т,е,, у — 52"=1 У№ п А(х,у) = аих<У1’ (103.1) *,j=i где aij (i,j = l,n) — фиксированные комплексные числа. Для полуторалинейных форм имеют место все утверждения, ка- сающиеся билинейных форм, при этом остаются в силе их доказа- тельства. Незначительные изменения носят очевидный характер. В частности: - общий вид полуторалинейной формы в базисе е — (ej,... ,еп) определен равенством (103.1), или, в компактной форме, А(х,у) - х^АеУе или А(х,у) = у? А? хе; - если е и f = eQ - два базиса пространства, то Af = QTAe& — полуторалинейная форма эрмитова тогда и только тогда, когда ее матрица в любом базисе эрмитова. Теорема 103.1. Полуторалинейная форма эрмитова тогда и только тогда, когда Л(т,х) G R, Ут е V. Доказательство. Необходимость очевидна, так как А(х,х) = А(х,х), Vx е V. Достаточность вытекает из равенства А(х, у) = \ (Л(т + у, х + у) - Д(а: - у, х - у)+ +iA(x + iy,x + iy) - гА(х - iy,x - iy)'), Vx, у € V, (103.2) которое справедливо для любой полуторалинейной формы А(х, у). Эрмитовы формы. Пусть А(х, у) - эрмитова полуторалинейная форма в комплексном пространстве V. Эрмитовой квадратичной формой (или, короче, эрмитовой формой) называется отображение 11 Линейная алгебра и аналитическая геометрия
320 Глава XVII. Билинейные и квадратичные формы А : V —> С, которое каждому вектору х € V ставит в соответствие число Л(х, х). Полуторалинейная форма А{х,у) при этом называется полярной полуторалинейной формой к эрмитовой форме А(х,х). Эрмитова квадратичная форма обладает всеми свойствами (с оче- видными изменениями) обычных квадратичных форм (§101). Отме- тим некоторые из них. 1. Полуторалинейная форма, полярная к эрмитовой форме, опре- делена однозначно. Действительно, А(х + у, х + у) = А(х, х) + А(у, у) + А(х, у) + А(х, у), А(х + гу, х + iy) = Л(х, х) + Л(у, у) - гЛ(х, у) + г А(х, у) и так как А(х, х) € R, Ух е V, то |(Л(х 4-1/, х + у) - Л(х,х) - А(у,у)) = ВеА{х,у), (ЮЗ 3) |(Л(х + iy, х + гу) - А(х, х) - Д(у, у)) = 1тЛ(х, у). 2. Матрица эрмитовой квадратичной формы в любом базисе эр- митова: А" = Ае (или А? — Ае). Отсюда следует, что: a) det Ае € R; б) все угловые миноры Д* матрицы Ае действительны: Д* € R, k — 1, п; в) все канонические коэффициенты Ац € R, к = 1,п (так как Afc — А(е^, ед,)). 3. Общий вид эрмитовой квадратичной формы: Ух — 52”=i Xje; п ____ Л(х,х)= 53 % = <7)7 (г, j = l,n), t,j=i или, в компактной форме, Л(х,х) = xf Аех7 = х^А^хе = х^Аехе, где А? = Ае. 4. Если е и / = eQ - два базиса пространства, то A} = QTAeQ. Комплексные матрицы А и В называются эрмитово конгруэнт- ными. если они связаны соотношением В = QTAQ для некоторой невырожденной матрицы Q. Таким образом, матрицы А/ и Ае эрмитово конгруэнтны. 5. Канонический вид эрмитовой квадратичной формы: А(х,х) = Y, Afc|xfc|2, Ух = 52 Xiei, k=l i=l где г = rgA(x,х), А*, е R (fc = T7r). 6. Метод Лагранжа приведения к каноническому виду применим и для эрмитовой формы. Изменение алгоритма, описанного в дока- зательстве теоремы 101.7, состоит лишь в том, что на каждом шаге
§ 104. Квадратичные формы в евклидовом пространстве 321 выделяется полный квадрат модуля (например, на первом шаге: /(ц,...,1п) =ail|xi +Zk=2“I«:|2 + Р(Х2, • • • >*n))- ан 7. Остаются справедливыми и формулы Якоби (101.14). 8. Как следует из теоремы 103.1, эрмитова квадратичная форма принимает только вещественные значения. Это свойство сближает ее с вещественной квадратичной формой (§102). В частности, для эрми- товых квадратичных форм справедливы закон инерции, сигнатурное правило Якоби, критерий Сильвестра. Практически без изменения остаются и доказательства этих фактов. 9. Наконец, отображение А : V х V —> С есть скалярное произ- ведение в комплексном пространстве V тогда и только тогда, когда оно является полуторалинейной формой, полярной к положительно определенной эрмитовой форме. Это утверждение определяет общий вид скалярного произведения в комплексном пространстве: (х,у) = А(х,у), Ух, у eV, где А(х,у) - полуторалинейная форма, полярная к положительно определенной эрмитовой форме, или (х,у) = Х^Аеуе, Ух, у G V, где Ае - положительно определенная матрица. §104. Квадратичные формы в евклидовом (унитарном) пространстве Мы отмечали (§102), что ни канонический базис, ни канониче- ский вид квадратичной формы не определены однозначно; однознач- но лишь число всех ненулевых квадратов (в произвольном линейном пространстве) и число положительных и отрицательных квадратов (в вещественном и комплексном пространстве). В евклидовом простран- стве (в унитарном пространстве для эрмитовых квадратичных форм) положение иное, если рассматривать ортонормированные базисы. Теорема 104.1. Для любой квадратичной формы в евклидо- вом (и унитарном) пространстве V существует ортонормирован- ный базис, в котором она имеет канонический вид. Доказательство. Пусть V - евклидово пространство, е - орто- нормированный базис V, Ае - матрица квадратичной формы А(х, у) в базисе е. Тогда А(х, х) = х^Аехе, где Ае - симметрическая матрица. Известно (§93), что симметрическая матрица ортогонально подобна диагональной матрице Л = diag(Лi,..., Ап), так что Л = QTAeQ, (104.1)
322 Глава XVII. Билинейные и квадратичные формы где Q - ортогональная матрица. Это означает, что в ортонормирова- нием базисе f = eQ матрица А/ = Л - диагональна, а квадратичная форма -4(т, т) имеет канонический вид (т, х) = ^i^i, Vi = У Xj/j. (104.2) t=i t=i Если V - унитарное пространство и е - ортонормированный ба- зис V, то А(х,х) — х^Аехе, где Ае (следовательно, и Ае) - эрмитова матрица. Известно (§93), что эрмитова матрица унитарно подобна ве- щественной диагональной матрице Л = diag(Alt..., Ап), так что Л = QHAeQ = QTAeQ, (104.3) где Q - унитарная матрица. Это означает, что в ортонормированном базисе f = eQ матрица Af = Л - диагональна, а квадратичная форма А(т, т) имеет канонический вид (х,;г) = У2 Ai|zi|2, = (104.4) i=i .=1 Операция построения ортонормированного базиса, в котором ква- дратичная форма имеет канонический вид, называется приведением квадратичной формы к главным осям. Из теоремы 104.1 следует, что любая квадратичная форма приводится к главным осям. Теорема 104.2. Канонические коэффициенты квадратич- ной формы, приведенной к главным осям, определены однозначно. Доказательство. Действительно, соотношения (104.1) и (104.3) говорят о том, что канонические коэффициенты являются собствен- ными значениями матрицы Ае (или Ае в комплексном случае) квадра- тичной формы в ортонормированном базисе е и не зависят от выбора базиса е, так как все матрицы квадратичной формы в ортонорми- рованных базисах подобны и, следовательно, имеют одинаковые соб- ственные значения. Что же касается канонического базиса, то он состоит (как следует из (104.1), (104.3)) из ортонормированной системы собственных век- торов матрицы Ае (или Ае) и определен с той же степенью произвола, с какой определена полная ортонормированная система из собствен- ных векторов матрицы. Теорема 104.3. Для любой квадратичной формы А(х, х) в евклидовом (и унитарном) пространстве V существует, и притом единственный, симметрический (соответственно эрмитов) опера- тор И € £(V, V) такой, что А(х, х) = (Их, х). (104.5)
§ 104. Квадратичные формы в евклидовом пространстве 323 Доказательство. Существование. Если е - ортонорми- рованный базис V и Ас - матрица квадратичной формы Л(т, х) в базисе е, то А(х,х) = х^Аехе (соответственно А(х, х) = х^ Аехе) или в соответствии с (99.2) А(х, х) = (Аехе, хе) (соответственно А(х, т) = (Ас1Ее, З'в))* Если "Н € £(V, V) - линейный оператор, имеющий в базисе е ма- трицу Ае (соответственно Ле), то А(х,х) = (Кт, х), \/х G V. Так как Ае (и Ае) ~ самосопряженная матрица, е - ортонормированный базис, то Д - самосопряженный оператор. Единственность. Если Д j, Дг _ самосопряженные операторы, удовлетворяющие (104.1), то (Д1Х,х) = (К2х,х), Vz € V, или ((Д1 - К2)х, х) - 0, Vz G V. (104.6) Оператор 'Н\—'Н2 самосопряжен, для него существует ортонормиро- ванный базис из собственных векторов, а все собственные значения в силу (104.6) равны нулю. Следовательно, Hi — Нг — О. Теорема 104.4 (о паре квадратичных форм). Для лю- бой пары квадратичных форм А(х,х) и В(х,х) в вещественном (и комплексном) пространстве V, одна из которых положительно определена, существует общий базис, в котором обе квадратичные формы имеют канонический вид. Доказательство. Пусть В(х,х) > 0 и В(х,у) - билинейная (соответственно полуторалинейная) форма, полярная к квадратич- ной форме В(х,х). В соответствии с теоремой 102.5 введем скалярное произведение (102.3). Тогда пространство V станет евклидовым (со- ответственно унитарным) и в нем согласно теореме 104.1 существует ортонормированный базис е^,... ,Cn, в котором квадратичная форма А(х, т) имеет канонический вид, при этом в силу (70.7): для любого вектора х = , x<ei n В(х}х) — (я, я) = |zi|2. (104.7) t=i Замечание. Один из способов поиска общего базиса ei,...,en, в котором формы Л(х,х) и В(х,х) имеют канонический вид, состоит в следующем. Пусть А и В - матрицы квадратичных форм А(х, х) и В(х, х) в некотором базисе f и пусть е = JQ. Тогда QTAQ — Л, где Л = diag(Ai,..., Ап), и QTBQ = I. Следовательно, А = (Q7')-1AQ-1, В = (QT)~xQ~i, B~l = QQT, В-1 А = QKQ~1 и В"1 AQ = QA. Последнее равенство означает, что столбцы матрицы Q (т.е. коор- динаты векторов искомого канонического базиса е в исходном базисе J) являются собственными векторами матрицы В~1 А, отвечающими собственным значениям А1, • • , Ап. Таким образом, канонические коэффициенты А;,..., Ап являются кор- нями уравнения |В-1А — А1| = 0 или, в равносильной записи, уравнения |А-АВ| = 0, (104.8) а векторы канонического базиса - нетривиальными решениями однородной систе- мы уравнений Ах = ХВх. (104-9) Теорема 104.4 обеспечивает существование полного набора вещественных кор- ней уравнения (104.8) и для каждого кратного корня - наличие соответствующего
324 Глава XVII. Билинейные и квадратичные формы числа линейно независимых решений системы (104.9). Вообще говоря, описан- ный алгоритм (как и доказательство теоремы 104.4) решает поставленную задачу в усиленном варианте: положительно определенная форма В(х,х) приводится к каноническому виду с коэффициентами, равными 1. В действительности это не требуется: без существенных изменений приведенный здесь алгоритм применим и для случая, когда QTBQ = diag(m,..., дп). Таким образом, коэффициенты преобразуемых форм не определяются однозначно. Однако, как легко показать, отношения А,/ц< канонических коэффициентов не зависят от способа одновре- менного приведения форм А(х,х) и В(х, х) к каноническому виду. В вычислительной алгебре задачу (104.9) называют обобщенной проблемой собственных значений.
Глава XVIII. Геометрия квадратичных форм и поверхности второго порядка § 105. Гиперповерхности второго порядка в евклидовом пространстве Общее уравнение. Пусть А(х, х) - ненулевая квадратичная фор- ма, д(х) - линейная форма, заданные в евклидовом пространстве Е, и с - вещественная константа. Множество всех векторов х € Е, удо- влетворяющих условию А(х, х) + 2д{х) -I- с = 0, (105.1) называется гиперповерхностью второго порядка в евклидовом прос- транстве Е1. Уравнение (105.1) называется общим уравнением ги- перповерхности второго порядка. Пусть е = (ei,..., еп) - базис пространства Е, А = (а^) 6 Rnxn - матрица квадратичной формы А(х,х) в этом базисе, bi — g(ei),i = l,n, - коэффициенты линейной формы и х = X?=i xiei- Тогда в соответ- ствии с (101.7), (81.1) общее уравнение (105.1) может быть записано в виде п п aijXiXj -I- 2^^biXi + с = 0, = ajj, (105.2) i.j=l 1=1 или, в компактной форме, ХТАХ + 2bT X + с = 0, А = АТ, (105.3) где X = (ib ...,xn)T, b = (Ьь... ,Ьп)т. Приведенные уравнения. Исследование гиперповерхности вто- рого порядка в n-мерном пространстве проводится по той же схеме, по которой исследуются линии второго порядка на плоскости (§58, 59). Отметим основные моменты этого исследования с общих позиций. Пусть е - ортонормированный базис Е и пусть в этом базисе урав- нение гиперповерхности имеет вид (105.2). 1. Приведем квадратичную форму Д(т, х) к главным осям, т.е. найдем ортонормированный базис /, в котором квадратичная форма А(х,х) имеет канонический вид. Отметим, что канонические коэффициенты А^ ..., Ап будут при этом определены однозначно (те- орема 104.2). Не нарушая общности рассуждений, можно считать, что А^ 0 при к < т (где г — rg Д(т, а:)) и Afc = 0 при к > г. 1В случае, когда dim Е = 2, геометрический образ, определяемый уравнени- ем (105.1), называется линией второго порядка. Однако всюду в дальнейшем мы употребляем общий термин "поверхность", не оговаривая особо этот случай.
326 Глава XVIII. Геометрия квадратичных форм При переходе от базиса е к базису f — eQ уравнение (105.2) орто- гональным преобразованием координат (теорема 70.5) преобразуется в уравнение Г п + (105.4) fc=i *=i 2. Пусть a Е Е. Отображение <р : Е —> Е, определенное равенством <р(т) = х + a, Ух Е Е, называется параллельным переносом простран- ства Е на вектор а. Очевидно, im = Е. Если в уравнении (105.4) А*, 0 для некоторого к, то Хкхк 4- + 2Ь'кхк — Хк(хк + Ь'к/Хк)2 - Ьк/Хк. Положив хк = х'к + Ь'к/Хк, мож- но избавиться от переменной хк в первой степени. Выполнение таких преобразований для всех к = 1,г равносильно параллельному перено- су на вектор с координатами (i/j/Ai,..., Ь'г/Хг, 0,..., 0). В результате этого переноса уравнение (105.4) преобразуется в уравнение Х\х"2 + --- + Агт"2 + 2 £ b'kxk+d = 0, к=г+1 (105.5) где d = с - YIk=i Ьк/Хк. 3. Исследуем уравнение (105.5). Возможны два случая: а)Ь;+1 = --=^ = 0; б) ЗЪ'к ^0,к>г. В случае “а” уравнение (105.5) имеет вид xlx,f + -- + xrx,rn+d = о. В случае "б" выполним еще одно ортогональное преобразование ко- ординат. Матрица S этого преобразования строится следующим об- разом. Рассмотрим арифметический вектор (6(.+1,..., b'^) € Rn-r. По условию он ненулевой и его можно нормировать: если а = = (£jt=r+i bfc2)1/21 то вектор si = (b'r+i/ot,..., b'n/a) представляет со- бой ортонормированную систему из одного вектора. Дополним этот вектор до ортонормированного базиса si,S2,..., sn_r пространства Rn-r. В обозначениях з,- — Sin),i = 1, n — г, искомая матри- ца S имеет вид О 1 51(г + 1 - - - о ... ........ sn—г,г+1 • • • $п—г,п
§ 105. Гиперповерхности второго порядка 327 Матрица S ортогональна (так как ее строки ортонормированы), по- этому преобразование базиса с помощью матрицы перехода S при- водит к новому ортонормированному базису. При этом преобразо- вание координат осуществляется по закону х'к = хк при k — 1,г, х'Д1 = о"1 ££=г+1 Ь'кх'{., х'к = 52"=r+l Skixi ПРИ k = г 4 2, п, и при- водит уравнение (105.5) к виду Хух"'2 4-h Хгх"'2 4- 2ax,r"t_1 + с' = 0. В последнем уравнении можно освободиться от свободного члена с/, если выполнить параллельный перенос на вектор, у которого все ко- ординаты, кроме (г 4- 1)-й (равной с'/(2а)), равны нулю. Итак, с помощью параллельного переноса и перехода к новому ортонормированному базису общее уравнение (105.2) приводится к одному из двух типов уравнений: Alii 4--• + Агх^ + ао = 0, А1...Аг/0, (105.6) Х}Х2 4- * • • 4- Хгх2 4~ Ьо*ег+1 0, А;... АГЬ@ 0, (105.7) которые принято называть приведенными уравнениями гиперповерх- ности. Инварианты гиперповерхности. Величины и функции, опре- деляемые коэффициентами общего уравнения (105.2), которые не из- меняются при преобразованиях координат, называются инварианта- ми гиперповерхности относительно этих преобразований. Аппарат инвариантов (как и в случае линий второго порядка на плоскости) позволяет по общему уравнению однозначно найти тип приведенного уравнения и все его коэффициенты. Рассмотрим матрицу (105.8) полученную окаймлением матрицы А квадратичной формы столбцом и строкой из коэффициентов линейной формы и свободным членом с. Теорема 105.1. Характеристические многочлены матриц А и В являются инвариантами гиперповерхности относительно ортогонального преобразования координат. Доказательство. Утверждение теоремы следует из того, что соотношения Af — QTAeQ и В/ = QTBCQ (см. доказательство те- оремы 58.2) в случае ортогональности Q означают подобие матриц Ае н А/, Ве и Bf, а следовательно, и совпадение характеристических многочленов (теорема 86.2). Следствие. Инвариантами гиперповерхности относительно ортогонального преобразования координат являются: а) канонические коэффициенты Ai,..., Ап (как корни характери- стического многочлена матрицы А); А Ь ЬТ с
328 Глава XVIII. Геометрия квадратичных форм б) суммы главных миноров к-го порядка матрицы А, к = 1,п, и, в частности, tr А, det А (как коэффициенты характеристического многочлена); в) числа rgA, rgB. Теорема 105.2. Канонические коэффициенты Ai,...,An и величины trA, detA, det В, rgA, rgB являются инвариантами ги- перповерхности относительно параллельного переноса. Доказательство. Инвариантность канонических коэффициен- тов и величин trA, detA, rgA следует из того, что при параллельном переносе матрица А не изменяется, а инвариантность det В, rgB - из того, что матрица В при параллельном переносе подвергается элемен- тарным преобразованиям (см. доказательство теоремы 58.3). Теорема 105.3. Общее уравнение гиперповерхности второ- го порядка ортогональным преобразованием координат и параллель- ным переносом приводится к одному и только одному из типов при- веденных уравнений. Доказательство. Утверждение следует из того, что для урав- нений типа (105.6) выполняется неравенство rgB < rgA 4- 1, а для (105.7) - равенство rgB — rg А + 2. Классификация гиперповерхностей. Классификация осуще- ствляется на основе приведенных уравнений (105.6) и (105.7). 1. Пусть г = п. Тогда уравнение (105.2) приводится только к урав- нению типа (105-6), которое в этом случае имеет вид АуХ] + • • Т Апт^ -+ ад ~ 0i (105.9) при этом det А = Ai... An, det В = Ai... Апао, ад — det В/ det А. Все коэффициенты в (105.9) определены однозначно вследствие инвари- антности чисел Ai,..., An, detA, det В. В силу закона инерции (те- орема 102.1) число положительных и число отрицательных коэффи- циентов Aj,..., Ап определены однозначно, так что уравнение (105.9) однозначно преобразуется в уравнение г2 т2 xl , т2 _1 4- . . . J. Д _ fc+1 Хп _ 1 9 I ’ ' ' 1 q 9 ’ л -I, “1 ak afc+l an если det В / 0; а в случае, когда det В = 0, - в уравнение (105.10) (105.11) Гиперповерхность, определяемая уравнением (105.10), при к = п называется эллипсоидом, при к = 0 - мнимым эллипсоидом, при 0 < к < п - гиперболоидом. Гиперповерхность, определяемая урав- нением (105.11), называется конусом. 2. Пустьт = п—1. Тогда уравнение (105.2) приводится к уравнению типа (105.6), если det В — 0, и к уравнению (105.7), если det В =4 0. Эти уравнения однозначно преобразуются:
§ 106. Алгебраические поверхности второго порядка 329 в первом случае в уравнение -г2 -г2 т2 -г2 ,_______, _ •cfc+l____________ xn-i _ 7 9 О * * * 0 <4 ak ак+1 «п-1 (105.12) где с = 1, если rg В — п, и с = 0, если rg В = п - 1; во втором случае в уравнение т2 т2 т? Х1 ,_______, _ xfc4-l 7 Т ” ‘ Т о 7 «1 ak ak+l т2 ^ = 2рхп, р > 0. (105.13) Гиперповерхность, определяемая уравнением (105.13), называется параболоидом. 3. Пусть 0 < т < п — 1. Тогда уравнение (105.2) приводится к уравнению типа (105.6), если rgB < г+1, и к уравнению типа (105.7), если rg В = г + 2. Эти уравнения однозначно преобразуются: в первом случае в уравнение т2 т2 xi X2 ,_____, ffc _ Jfc+1 Jr _ 7 ' * г 7 7 ' 7 «1 ak ak+l ar (105.14) где c = 1, если rg В = r + 1, и c = 0, если rg В = r; во втором случае в уравнение т2 т2 X? , -г2 ^ + ••• + 4 --Г1-----------£=2ртг+1, р > 0. (105.15) ai ак ак+1 аг Гиперповерхности, определяемые уравнениями (105.12), (105.14), (105.15), называются цилиндрами. Так как условия, определяющие эти уравнения, взаимно исключа- ют друг друга, то общее уравнение (105.2) определяет одну и только одну из перечисленных поверхностей. § 106. Алгебраические поверхности второго порядка Общее уравнение. Под общим уравнением алгебраической по- верхности второго порядка в системе координат Oxyz пространства понимают уравнение вида Дцт2 + а22р2 + a33z2 + la^xy + 2ai3xz + 2а2зрг + +2bj х + 2b3y + 2Ьз^ + с = 0, (106.1) где не все коэффициенты a,j (i,j = 1,3) равны нулю, a2J = aJt (г, j = = 1,3). Здесь группа членов второго порядка образует квадратич- ную форму от переменных x,y,z (или, в векторной терминологии, от
330 Глава XVIII. Геометрия квадратичных форм радиус-вектора точки (х, у, г)), а группа линейных членов - линейную форму, так что уравнение (106.1) является уравнением гиперповерх- ности второго порядка в евклидовом пространстве V3. Обозначения, соответствующие общей теории гиперповерхностей, в данном случае имеют вид: Х = (т,2/,г)т, 6=(Ь1,62,Ьз)Т, «и <112 . <113 «12 «13 «22 «23 «23 «33 «11 «12 «13 bi «12 «22 «23 62 «13 «23 «33 63 bl Ь2 Ьз С В этих обозначениях общее уравнение (106.1) может быть записано в компактной форме: ХТАХ + 2bT X + с = 0, А = Ат. (106.2) Приведенные уравнения. Пусть общее уравнение (106.1) за- дано в прямоугольной декартовой системе координат. Согласно об- щей теории гиперповерхностей (§105) уравнение (106.1) с помощью ортогонального преобразования координат (т.е. простым вращением и простым отражением) и параллельного переноса (т.е. переноса на- чала) приводится к одному и только одному из двух типов приве- денных уравнений (105.6) и (105.7). В соответствии с общей схемой классификации гиперповерхностей эти уравнения можно разбить на следующие пять простейших уравнений в зависимости от значения г = rg4. 1. При г = 3: Aji2 + A2J/2 + A3Z2 + ао = 0, А1А2А3 0. (106.3) 2. При г = 2: А^а;2 4- Хзу^ + 2Ьог = 0, А1А260 0 (106.4) или А1Х2 + А2у2 + со = 0, AiA2 0. (106.5) 3. При г 1. Ait2 + 2роу - 0, Aipo 0 (106.6) или А12:2 + 9о=О, Ai ± 0. (106.7) Отметим, что все коэффициенты уравнений (106.3)-(106.7) опре- делены однозначно общими инвариантами гиперповерхностей: li = = trX, I3 = det Л, /С4 = det В и специальными инвариантами ал- гебраической поверхности второго порядка: 72 ~ сумма главных ми- норов второго порядка матрицы Л; К2 и Кз - суммы главных миноров второго и третьего порядков матрицы В.
§106. Алгебраические поверхности второго порядка 331 Величины 7г, Аг. Кз ~ инварианты ортогонального преобразова- ния координат, так как являются коэффициентами характеристиче- ских многочленов матриц А, В (докажите!). Однако при параллель- ном переносе величина Кз остается неизменной, только если 12 = /3 = = К4 = 0, а величина К2 - если 12 — I3 = К3 = К4 — 0. В этом несложно убедиться непосредственно аналогично тому, как это было сделано для линии второго порядка (теорема 58.2). Для уравнений (106.3)—(106.7) легко вычислить все инварианты, а именно: (106.3): 1з / 0; (106.4): 1з = 0, К4 / 0; (106.5): 1з = 0, К4 = 0, W0; (106.6): 1з = 0, К4 = 0, 12 = 0, Кз / 0; (106.7): 1з = 0, КА = 0, 12 = 0, Кз = 0, Д / 0. Эти условия необходимы и достаточны для каждого из перечи- сленных уравнений, так как взаимно исключают друг друга. При этом все коэффициенты уравнений определены однозначно, ибо А|, Аг, Аз - корни характеристического уравнения: —А3 + ДА2 — 12Х + I3 = 0; W / W \ V2 if / к \ w Лд / \ лз / лз \ л2 J ;Co = _;po_^__J ;90 = —. Метод вращений. Упрощение общего уравнения алгебраической поверхности второго порядка, проведенное здесь, опиралось на общую теорию гиперповерхностей второго порядка, в основе которой лежит приведение квадратичной формы f = ап? + а22у2 + аззг2 + 2a12iy -I- 2а 132:2 + 2a23yz (106.8) к главным осям. Как следует из теоремы 104.1, каноническими коэф- фициентами при этом будут собственные значения матрицы квадра- тичной формы, а каноническим базисом - ортонормированная систе- ма собственных значений. Один из способов приведения квадратичной формы f к главным осям (как и в случае алгебраической линии второго порядка на плос- кости) основан на поворотах системы координат. Рассмотрим единичную сферу S, заданную уравнением х2 + у2 + + z2 = 1. Такое рассмотрение мотивировано экстремальными свойствами квадратичной формы на единичной сфере, о которых пойдет речь в §112 (см. Замечание). Функция / определена и непрерывна на замкнутом ограниченном множестве S и, следовательно, достигает на этом множестве своего максимального значения ([11]). Пусть Р - точка максимума функции / на сфере S. Выполним поворот системы координат Oxyz вокруг точки О так, чтобы ось Oz' совпала с прямой ОР, а положительное направление — I оси - с направлением вектора ОР. Получим новую прямоугольную
332 Глава XVIII. Геометрия квадратичных форм декартову систему координат Ox'y'z', в которой функция f имеет вид f = а'нт'2 + а22у'2 + a.'33z'2 + 2a'i2x'y' + 2a'l3x'z' + 2a'23y'z', (106.9) сфера S определяется уравнением х'2 + у'2 + z'2 = 1, а точка Р имеет координаты (0,0,1). Согласно выбору системы координат Ox'y'z', максимальное зна- чение функции f достигается при х' = 0,у' = 0, z' = 1. Если в (106.9) положить у’ = 0, z' = 1, то получится функция /1 от одной перемен- ной х'~. fi = а,цХ + 2а13х + азз, которая достигает максимального значения в точке Р, т.е. при х' = 0. Следовательно, dfi dx' откуда а'13 = 0. Аналогично, если в fi положить х' — 0, z‘ — 1, то получим, что a!j3 = 0. Таким образом, в системе координат Ox'y'z' функция /1 имеет вид fi = а'пт'2 + 2a'i2x'y' + a'22z'2 4- a33z'2. (106.10) При повороте системы координат Ox'y'z' вокруг оси Oz' на угол р координаты х', у', z' преобразуются по формулам х' — х" cos р — у” sin р, < у'— х" sinp + у" cosp, = 0, при этом функция f по-прежнему будет иметь вид (106.10), а вы- бором угла р, для которого ctg 2р = (а'п - (как и ПРИ рассмотрении линии второго порядка на плоскости), можно добиться того, чтобы коэффициент а"2 при х"у" стал равным нулю. Таким образом, с помощью двух поворотов системы координат Oxyz можно найти систему координат Ox"y"z", в которой группа старших членов общего уравнения (106.1) не содержит произведений X у , X Z , у Z . Метод, изложенный здесь, называют методом вращений приве- дения квадратичной формы (106.8) от трех переменных к главным осям. Замечание. Идеи этого метода лежат в основе метода вращений нахожде- ния собственных значений и ортонормированной системы собственных векторов симметрической матрицы п-го порядка, эффективно используемого в вычисли- тельной математике.
§ 106. Алгебраические поверхности второго порядка 333 Канонические уравнения. Теорема 106.1. Для. любой алгебраической поверхности второго порядка существует прямоугольная декартова система ко- ординат Oxyz, в которой уравнение этой поверхности имеет один из следующих видов: 1) II СЧ |сч N 1 V + сч | ем + сч 1сч Н 1 е - эллипсоид; 2) + о-|«е Ь3| КЗ 4- Л 1 N кз| КЗ II 1 1 - мнимый эллипсоид; 3) © II + «Ч ICS + сч | ем н 1 е - вырожденный эллипсоид; 4) X2 у2 Z2 F - 1 а2 Ь2 с2 - однополостный гиперболоид; 5) Р I н м| ю + ^14, 1 Г> I О' ы| to II 1 1 - двуполостный гиперболоид; 6) о II еч | сч N 1 U 1 сч |сч л|-о + еч |сч Ы 1 « - конус; 7) X2 у2 ^ + ^=2Z - эллиптический параболоид; 8) xl~yl = 2z а2 Ь2 - гиперболический параболоид; 9) Р 1 н о| to + II 1—‘ - эллиптический цилиндр; Ю) 1 II сч |сч Л 1-0 + сч |сч Н 1 О - мнимый эллиптический цилиндр; И) Р | н кз| КЗ 1 0-1^ КЗ II - гиперболический цилиндр; 12) у2 = 2рх (р > 0) - параболический цилиндр; 13) о I н ю| ю 1 CH'S w| to II О - пара пересекающихся плоскостей; 14) X2 и2 - + ^-=0 а2 Ь2 - пара мнимых пересекающихся плоскостей;
334 Глава XVIII. Геометрия квадратичных форм 15) у2 = а2 (а > 0) - пара параллельных плоскостей; 16) у2 = —а2 (а > 0) - пара мнимых параллельных плоскостей; 17) у2 — 0 - пара совпадающих плоскостей. Доказательство. Будем исходить из уравнений (106.3)- (106.7). Рассмотрим уравнение (106.3). В зависимости от сочетаний знаков Ai, Л2, Аз, ао оно может быть записано по-разному. 1. Пусть знаки чисел Ai, А2, A3 совпадают. При этом: а) если aoAi < 0, то уравнение (106.3) может быть записано как уравнение 1, где а2 = —ао/Ax, Ь2 — —oq/Xi., <? — —ао/Аз; б) если aoAi > 0 - как уравнение 2; в) если ао = 0 - как уравнение 3. 2. Пусть знаки чисел Ах, А2, A3 не совпадают. Не ограничивая общности рассуждений, будем считать, что Ai > 0, Аг > 0, А3 < 0. При этом уравнение (106.3) может быть записано как уравнение 4 (если аоАз > 0), как уравнение 5 (если аоАз < 0) и как уравнение 6 (если ао = 0). Аналогично уравнение (106.4) в зависимости от знаков Ах, Аг мо- жет быть записано (после возможных перенумераций неизвестных и изменения направления одной из осей координат) как уравнение 7 (если А1А2 > 0) и как уравнение 8 (если АхАг < 0). Уравнение (106.5) может быть записано как уравнение 9 (если А1А2 > 0, cqAi < 0), как уравнение 10 (если А1Аг > 0, cqAi > 0), как уравнение 14 (если АхАг > 0, со — 0), как уравнение 11 (если А1А2 < 0, со 0) и как уравнение 13 (если АхАг < 0, cq = 0). Уравнение (106.6) после стандартных преобразований может быть записано как уравнение 12. Уравнение (106.7) может быть записано как уравнение 15 (если до Ах < 0), как уравнение 16 (если до Ах > 0) и как уравнение 17 (если <7о = 0). Таким образом, уравнениями 1-17 исчерпываются все поверхности второго порядка. Уравнения 1-17 называются каноническими уравнениями алгебра- ических поверхностей второго порядка. Геометрические свойства. Канонические уравнения позволяют исследовать геометрические свойства поверхностей. Чтобы предста- вить форму поверхности, проще всего изучить ее сечения плоскостя- ми, параллельными координатным плоскостям. Эллипсоид (рис. 1). Поверхность, определяемая уравнением 1, называется эллипсоидом. Числа а, Ь, с в каноническом уравнении на- зываются полуосями эллипсоида. Как следует из уравнения, коорди- натные плоскости являются плоскостями симметрии, а начало ко- ординат - центром симметрии эллипсоида. Эллипсоид - ограниченная поверхность, заключенная в параллелепипеде |х| < а, |у| < b, |z| < с.
§ 106. Алгебраические поверхности второго порядка. 335 Линии пересечения эллипсоида с любой плоскостью являются поэто- му ограниченными линиями второго порядка, т.е. эллипсами. Мнимый эллипсоид. Нет ни одной точки пространства, ко- ординаты которой удовлетворяют уравнению 2. Принято говорить об этом уравнении как об уравнении мнимого эллипсоида. Вырожденный эллипсоид. Уравнению 3 удовлетворяет то- лько начало координат. Это уравнение принято называть уравнением вырожденного эллипсоида (или мнимого конуса}. Однополостный гиперболоид (рис. 2). Поверхность, опре- деляемая уравнением 4, называется однополостным гиперболоидом. Как следует из канонического уравнения, координатные плоскости являются плоскостями симметрии, а начало координат - центром сим- метрии однополостного гиперболоида. Сечения гиперболоида плоско- стями z = h представляют собой эллипсы с полуосями а(1 +/г2/е2)1,/2, 6(1 + 62/c2)V2, которые неограниченно возрастают при h —> оо. Эл- липс, получающийся при h = 0, называется горловым эллипсом ги- перболоида. Плоскость у = h. пересекает гиперболоид: а) при |/i| < b по гиперболе с полуосями а(1 - /г2/^2)1^2, с(1 + + /г2/^2)1/2, которые убывают от а и с до нуля при |7г| —> Ь; 6) при |/г| = 6 по паре пересекающихся прямых;
336 Глава XVIII. Геометрия квадратичных форм в) при |/г| > b по гиперболе с полуосями с(-1 + Л2/62) 1'/2, а(—1 4- б.2/Ь2)^2, которые неограниченно возрастают при |/i| —> оо. Сечения гиперболоида плоскостями х = h обладают аналогичны- ми свойствами. Важной особенностью однополостного гиперболоида является на- личие прямых, целиком лежащих на этой поверхности. Теорема 106.2. Через каждую точку однополостного ги- перболоида проходят две различные прямые, целиком расположен- ные на этой поверхности. Доказательство. Рассмотрим прямые L и L”, заданные как линии пересечения плоскостей /3(£+$) =«(! + *), и L* : , а2 + 02 / О 72 + д’2 / О- Прямые L и L* целиком лежат на поверхности (чтобы убедиться в этом, достаточно почленно перемножить уравнения плоскостей). При этом через каждую точку Mq(xq, jfo,zo) поверхности проходит един- ственная прямая из семейства L и единственная прямая из семейства L*. Эти прямые (т.е. пары чисел а, 0 и 7, <5) находятся из однородных систем уравнений (»(?-?) =«(!-¥) „ f 7(?-?)=«(! + ¥). I + ?)=»(! + ¥) 1 «Й+ ?) =?(! "И. матрицы которых вырождены (т.е. системы имеют нетривиальные ре- шения) и имеют ранг, равный 1 (т.е. все решения каждой из систем пропорциональны и определяют единственную прямую). Остается до- бавить, что прямые L и L* не совпадают (достаточно проверить не- коллинеарность их направляющих векторов). Прямые, все точки которых лежат на поверхности, называются прямолинейными образующими этой поверхности. Итак, однополост- ный гиперболоид покрыт двумя различными семействами прямоли- нейных образующих (рис. 3). Двуполостный гиперболоид (рис. 4). Поверхность, опреде- ляемая уравнением 5, называется двуполостным гиперболоидом. Как следует из канонического уравнения, координатные плоскости явля- ются плоскостями симметрии, а начало координат - центром сим- метрии двуполостного гиперболоида. Плоскости z — h пересекают этот гиперболоид: а) при |/i| > с по эллипсам, размеры которых неограниченно возра- стают при |А| —> оо; б) при |Л.| — с в единственной точке. В слое между плоскостями z = с и z = — с нет ни одной точки гиперболоида. Таким образом, двуполостный гиперболоид состоит из
§ 106. Алгебраические поверхности второго порядка 337 Рис. 3 Рис. 4 двух симметричных полостей, расположенных в полупространствах Z > С И Z < —с. Плоскости I = fi и у = h пересекают гиперболоид по гиперболам. Конус (рис. 5). Поверхность, определяемая уравнением 6, назы- вается конусом. Как следует из канонического уравнения, координат- ные плоскости являются плоскостями симметрии, а начало коорди- нат - центром симметрии конуса. Плоскости z = h, h / 0, пересекают конус по эллипсам, размеры которых неограниченно возрастают при |/i| —> оо. Прямая, проходя- щая через любую точку Mq(xq, уо, zq) конуса и начало координат, является прямолинейной образующей конуса, так как любая точка этой прямой имеет координаты (xot, yot, zot). Плоскости у = h и х = h, где h ф 0, пересекают конус по гипербо- лам (рис. 6) с полуосями а|й.|/6 и c\h\/a, 6|/i|/а соответственно; плоскости г = 0иу = 0-по парам пересекающихся прямых. Плоскими сечениями конуса являются и параболы (рис. 7). Так, параболой будет сечение конуса плоскостью z = h + cx/a, где /г / О, ибо числа х, у являются на этой плоскости аффинными (не прямо- угольными) координатами, а уравнение линии, высекаемой на ней ко- нусом, имеет в этих координатах вид х2 , У2 (h + cx/a)2 _ a2 b2 с2 Традиционными преобразованиями это уравнение приводится к уравнению параболы , hb2 / ha\ у2 = 2— (х + — - ас \ 2с/ Таким образом, и эллипс, и гипербола, и парабола являются плос- кими сечениями конуса. На этом основании эти линии обычно назы- вают коническими сечениями.
338 Глава XVIII. Геометрия квадратичных форм Эллиптический параболоид (рис. 8). Поверхность, опреде- ляемая уравнением 7, называется эллиптическим параболоидом. Как следует из канонического уравнения, плоскости х = 0 и у = 0 явля- ются плоскостями симметрии. Центра симметрии эллиптический па- раболоид не имеет. Плоскости z = h, h > 0, пересекают параболоид по эллипсам, размеры которых неограниченно возрастают при h —> оо. Плоскости у — h и х — h, пересекают параболоид по параболам, ветви которых направлены вверх. Гиперболический параболоид (рис. 9). Поверхность, оп- ределяемая уравнением 8, называется гиперболическим параболои- дом. Плоскости х = 0 и у — 0 являются плоскостями симметрии. Рис. 8 Рис. 9
§ 106. Алгебраические поверхности второго порядка 339 а Центра симметрии гиперболический параболоид не имеет. Плоскости у = h и х = h пересекают параболоид по параболам, ветви первой параболы направлены вверх, а второй - вниз. Плоскости z = h. пересекают параболоид: I2 у2 при h < 0 по гиперболам------т + тт = 1» где а? = —2a2h, а2 bl bj = -2b2 Ьц х2 у2 б) при h > 0 по гиперболам —у — ту = 1, где a2 = 2a2h, b2 = 2b2/i; а2 в) при h — 0 по паре пересекающихся прямых. Как и однополостный гиперболоид, гиперболический параболоид покрыт двумя различными семействами прямолинейных образующих (рис. 10). Те же рассуждения, что и в случае однополостного гипербо- лоида, показывают, что через любую точку Mq(xo, уо, zo) гиперболи- ческого параболоида проходят две различные прямые, целиком лежа- щие на этой поверхности. Эти прямые определяются плоскостями 2/3=a(j-*), ( а2 + /З2 £ 0 , 72 + <52 # 0, где коэффициенты а, (3, у, 6 находятся из условия, что эти прямые проходят через точку Mo(xq, уо,zo)- Рис. 10 Цилиндрические поверхности. Все остальные поверхно- сти называются цилиндрами. Поверхности, определяемые уравнени- ями 9, 11 и 12, называются соответственно эллиптическим цилин- дром (рис. 11), гиперболическим цилиндром (рис. 12) и параболиче- ским цилиндром (рис. 13). Уравнения этих поверхностей не зависят
340 Глава ХУНТ. Геометрия квадратичных форм от z, поэтому все сечения плоскостями z = h совпадают. Для цилин- дрических поверхностей достаточно найти сечение плоскостью 2 = 0, чтобы выяснить форму поверхности. Отметим, наконец, что прямая, проходящая через точку Mq(xq, Уо, 2о) поверхности и параллельная оси Oz, является прямолинейной образующей, так как любая точка этой прямой имеет координаты (т0, Уо, zo + 0- Нет ни одной точки пространства, координаты которой удовле- творяют уравнению 10. Принято называть его уравнением мнимого эллиптического цилиндра. Уравнение 13 определяет пару пересекаю- щихся плоскостей (рис. 14). Точки поверхности, определяемой уравнением 14, составляют пря- мую. Это уравнение называют уравнением пары мнимых пересекаю- щихся плоскостей (рис. 15). Рис. 14 Рис. 15
§ 106. Алгебраические поверхности второго порядка 341 Поверхности, определяемые уравнениями 15-17, называют соот- ветственно парой параллельных плоскостей (рис. 16), парой мнимых параллельных плоскостей и парой совпадающих плоскостей (рис. 17).
Глава XIX. Линейные нормированные пространства § 107. Норма вектора Пусть V - линейное пространство, вещественное или комплексное. Нормой в линейном пространстве V называется отображение || -1| : V —> R., ставящее в соответствие каждому вектору х 6 V число ||х|| G R и удовлетворяющее аксиомам: Ух, у G V, a 6 R(C) 1) 1И1>о, ||х|| = 0 тогда и только тогда, когда х = 0; 2) ||ах|| = |а| • ||х|| ; 3) ||х + у|| < ||х|| + ||у|| (неравенство треугольника). Линейное пространство V с заданной на нем нормой || || называет- ся линейным нормированным пространством. Число ||х|| называется нормой вектора х. Заметим, что норма || • || (как отображение) определяет функцию /(х) векторного аргумента, принимающую вещественные числовые значения. В дальнейшем эту функцию будем называть функцией нор- мы: /(х) = ||х||, Ух € V. Нормы в арифметическом пространстве. Пусть V — R" (или С”) и х = (xj,..., xn) € V. Положим / п X Ур И„ = EW” ’ <1071) \Jt=l / Теорема 107.1. Функция ||х||р является нормой в арифме- тическом пространстве V. Доказательство. Проверка аксиом нормы для (107.1) нетриви- альна лишь для неравенства треугольника, которое для ||-||р совпадает с классическим неравенством Минковского: \/х^,уь € С, к = 1,п, и Ур > 1 п \ Ур / п х Ур / п X Ур < Еыр +. Еыр ,fc=l / \Jt=l / \fc=l / (107.2) Его вывод опирается на неравенства Юнга и Гёльдера. Лемма 1 (неравенство Юнга). Если числа р и q таковы, чтор,д > 1, р'1 + q~l = 1, то для любых а > О, Ъ > 0 (107.3) аУР6Уч < * + Р <7
§ 107. Норма вектора 343 Доказательство леммы. Для a = 0 или 6 = 0 неравенство очевидно. Для a > 0, Ь > 0 неравенство (107.3) следует из выпуклости логарифмической функции: для любых i|,i2 >0 ln(aa:i 4- Дгг) > alnzi + /31ni2> Va, /3 > 0, a + /3 = 1. Положив в этом неравенстве a = р-1, /3 = q~l, Xi = a, Х2 = Ъ, полу- чим, что /a b\ Ina Ind . <j i/a\ In I - + - >------I-----= ln(al/plr'’), \P 4/ P 9 которое равносильно (107.3). Лемма доказана. Неравенство (107.3) называется неравенством Юнга. Лемма 2 (неравенство Гёльдера). Пусть числаpuq та- ковы, что p,q > 1, р-1 + q~r = 1. Тогда для любых векторов х — = (х1,... ,хп) eV,y = (yi,...,pn) е V 52 I1*! • Ipfcl < fc=l (107.4) Доказательство леммы. Для х = 0 или у = в неравенство очевидно. Пусть х / 0, у ф в. Рассмотрим векторы ~ _ Д ~ _ У Очевидно, ||S||p = 1, ||y||g = 1 и *=Гп. (107.5) Ир llyll<j Применив неравенство Юнга к числам |ач|р, ll/fcl’j получим, что I I- । 1^1₽ . 1^1’ ь i— Xk г/t <-----н-----> fc = i,n. Р ч Сложим эти неравенства: 521**1’15*1 < + => {в силу (107.5)} => jt=i fe=i r k=i 4 => {Piip = нуНч = i} => 52 iifci k=l т.е. выполняется (107.4). Лемма доказана. Неравенство (107.4) называется неравенством Гёльдера.
344 Глава XIX. Линейные нормированные пространства Для доказательства теоремы 107.1 применим числовое неравен- ство |х* + yk| < |ц| + \ук\ к каждому слагаемому в левой части (107.2): п п п 5S(|xjt+yjt|)p = < ^(|zfcl+ll/Jt|)(|zji+j/fc|)p_1 = к=1 fc=l fc=l = |xfc 1 +52Ы-|а:*: + ^|Р * fc=l k=l Применим теперь неравенство Гёльдера к каждой сумме, положив Я 1 = 1~р-1: п / " \ 1/₽ £>*+1/к|)₽< (£ыр) fc=i \k=i / l/« ,fc=l \ i/p р I i/g = {(p-l)g = p} = .*=1 k=i !/Р / n \ VP' Еы₽) + 5>fcip ,к=1 ) \к=1 / \ 1-(1/р) р I k—l Разделив обе части этого неравенства на (52£=1(|хк + yjt|)p) Р , получим (107.2). Нормы ||х||р, р > 1, называются нормами Гёльдера или р-нормами. К нормам Гёльдера относится и норма оо = max |xfc|. 1<Ас<п Легко показать, что это действительно норма и верно соотношение оо = lim ||х||р. Среди норм Гёльдера чаще всего используются первая, вторая и бесконечная нормы: оо = max |xfc|. 1<*<п n / п \ V2 Mli=£kk|; 1Н12=(ЕЫ2) fc=l \k=l / Еще о метрическом пространстве. В §74 рассматривалась ме- трика в евклидовом (и унитарном) пространстве, вводимая через длину: р(т,у) = |х - 1/|, \fx,yeE(U).
§107. Норма вектора 345 Приведем примеры других метрик: 1) М — R или М - С: р(х, у) = [х — у|; 2) М = Rn или М = Cn: р(х,у) = max |xk — yk|; l<fc<n 3) М — С[а, 6] - множество функций, непрерывных на [а, Ь]: p(f,g)= max\f(x)-g(x)\; х€[а,о] 4) М - любое непустое множество: - это одна из дискретных метрик. Введем важные понятия метрического пространства, которыми мы будем пользоваться в дальнейшем. Пусть М - метрическое пространство с метрикой р. Последовательность {х^} С М называется сходящейся к точ- ке a G М, если lim р(х^к\а) — 0. Обозначение: х^ —> а или fc-юо а = lim х^. Последовательность {х^ } С М называется фундамен- к—юс шальной (или последовательностью Коши), если Ve > 0 3N — N(e) : Vm, n > N => р^х^, х^) < е. Метрическое пространство М называется полным, если любая фундаментальная последовательность в нем сходится. Множества В(х0, г) = {х G М | р(х, xq) < г} , В(хо, г) = {х е М | р(х, х0) < г} , S(x0, г) = {х € М | р(х, х0) = г} называются соответственно открытым шаром, замкнутым шаром, сферой с центром в точке хо радиуса г. Множество S С М называется ограниченным, если оно содержится в некотором шаре. Множество S С М называется замкнутым, если для любой схо- дящейся последовательности {х^} С S ее предел содержится в S. Множество S С М называется компактным (или компактом), если из любой последовательности в нем можно выделить подпосле- довательность, сходящуюся к некоторой точке а € S. Вещественная функция f(x), х 6 М (т.е. / : М —> R) называет- ся непрерывной в точке а Е М, если для любой последовательности х(/с1 —> а: /(х^) -> /(а). Норма и метрика. Теорема 107.2. В линейном нормированном пространстве V отображение р : V х V —> R, определенное равенством р(х,у) = ||х - у||, Vx,yeV, (107.6) является метрикой.
346 Глава XIX. Линейные нормированные пространства Аксиомы метрики непосредственно вытекают из аксиом нормы. Таким образом, любое нормированное пространство метризуемо. Обратное не всегда верно. Чтобы по метрике можно было восстано- вить норму, метрика должна обладать дополнительными свойствами. Теорема 107.3. Метрика р в линейном пространстве V (вещественном или комплексном) определяет норму тогда и только тогда, когда для любых x,y,z 6 V и любого а € R (соответствен- но С) 1) р(х, у) = р(х + z, у + г) (инваринатность относительно сдвига); 2) р(ах,ау) — |а|р(т, у) (инвариантность относительно гомотетии). (107.7) Доказательство. Необходимость очевидна, так как если р(т,у) = ||т-j/Ц, то p(x+z, y + z) = ||(x+z) - (j/+z)|| = ||т-у|| = p(x,l/), p(ax,ay) = ||ax - aj/|| = ||a(a: - j/)|] = |a| • Ца: - у|| - |o|p(x, y). Достаточность. Покажем, что метрика р, удовлетворяющая равенствам (107.7), определяет норму. Положим ||т|| = p(z,0), Vx eV. (107.8) Из аксиом метрики следует, что а) ||х|| = р(х,6) > 0, Ут е V, и ||х|| = 0 <=> х = 0; б) ЦотЦ = р(ах,в) = р(ах, ад) = |а|р(х,0) *= |а| - ||т||, Уз: 6 V, Уа € R(C); в) 1|г + у|| = р(* + М) = р(^.-у) < р(х,0) + р(-у,0) = INI + ||у||, Уз:, у eV. U В дальнейшем, говоря о нормированном пространстве как о ме- трическом, мы будем иметь в виду метрику (107.6). Общие понятия метрического пространства специализируются на случай нормированного пространства с нормой || || следующим обра- зом. Сходимость последовательности {з:^} к вектору а называется схо- димостью по норме || • || и означает, что lim \\х^ — а|| = 0. fc—>оо Отсюда и из очевидного неравенства ||Nfc)|| — ||а||| < ||з/*0 — а|| следует, что ||з:(к)|| —> ||а|| при к —> оо. (107.9) Возникает естественный вопрос: может ли одна и та же последова- тельность сходиться по одной норме и не сходиться по другой. Ответ на этот вопрос для конечномерного пространства отрицателен и будет дан в §109.
§ 107. Норма вектора 347 Шары и сфера в метрическом пространстве называются шарами и сферой по норме || • || и означают, что В(х0,т) = {х € М\ ||т - х0|| < г} , _B(xoi г) = {х € М | ||х — хо|| < г} , S(x0, г) = {х G М | ||х - х0|| = г} . На рис. 1 точками плоскости изображены сферы единичного ра- диуса с центром х0 — (0,0) по. нормам || • ||i, || • Цг, || • ||оо в арифме- тическом пространстве R2. Рис.1 Непрерывность вещественной функции /(х) в точке а метрическо- го пространства называется непрерывностью относительно нормы || || и означает, что если ||x^fc' — а|| —> 0 при & —> оо, то f(x^) —> /(а). Нормы в конечномерном пространстве. Нормы Гёльдера рас- сматривают и в любом конечномерном пространстве V (веществен- ном или комплексном): если е = (ei,...,еп) - базис пространства V и Т — i TfcBfc, то / п \1/Р Нх11р = (5ZlXfcl₽ ) и 1И|оо = max |xfc|. (107.10) Справедливость аксиом нормы установлена теоремой 107.1. Норму ||х||2 = (Е l^l2)172 называют также евклидовой или естественной fc=i нормой и обозначают символом ЦхЦ^. Теорема 107.4 (о непрерывности нормы). В конечно- мерном пространстве V любая норма || • || непрерывна относительно нормы || • ||2- Доказательство. Утверждение теоремы означает, что если ||x(fe) — а||з —> 0 при к —> оо, то ||х^*'|| —> ||а||. Пусть е = (ej,... ,еп) - базис пространства V и х = Ek=i хк^к- Из аксиом нормы следует, что ||х|| < 52fc=j l^kl' НМ - {в силу неравенства Коши-Буняковского} < < (Е ы2) 1/2(Е 1Ы2)1/2 = С- ||х||2, где с = (Е НМ2)1/2 > 0 - k=l fc=l к=1
348 Глава XIX. Линейные нормированные пространства константа, не зависящая от х. Итак, существует с > 0 такое, что ||х|| < с||х||2, Vi е V. (107.11) Если —> а по норме || • ||2, то _ а||2 _> Q ПрИ _> qq Так как ||a;W — а|| < c||x^fc) — а||2 (в силу (107.11)), то — а|| —> 0 и ||х(к)|| —> ||а|| при к —> оо. § 108. Норма и скалярное произведение В евклидовом (и унитарном) пространстве V норма может быть введена как длина: ||т|| = |х|, Vrr € V. Справедливость аксиом нор- мы вытекает из свойств скалярного произведения (§68). Эта норма называется евклидовой и обозначается символом || • ||е. Итак, ||т||е = ч/(х, х), Vi 6 V. (108.1) Про евклидову норму говорят, что она порождается скалярным про- изведением. Таким образом, любое скалярное произведение порождает некото- рую норму. Обратное, вообще говоря, не верно. Только норма, обла- дающая дополнительным свойством, порождается скалярным произ- ведением. Теорема 108.1. Ндрма || • || в линейном нормированном про- странстве V порождается некоторым скалярным произведением то- гда и только тогда, когда для нее выполнено равенство |1* + у||2 + 11*-у||2 = 2(|И12 + ||у||2), Vx^eV. (108.2) Доказательство. Необходимость очевидна, так как если ||х|| = |х|, то равенство (108.2) выражает известное тождество парал- лелограмма (69.3). Достаточность. Пусть для нормы || - || в линейном нормиро- ванном пространстве V выполнено равенство (108.2). Построим ска- лярное произведение, которое порождает эту норму. 1. Если V - вещественное пространство, то положим (^2/) = ^(|1* + 2/||2 - IHI2 - 1Ы|2), Vz,2/eV, (108.3) и покажем, что это будет искомым скалярным произведением. Про- верим аксиомы скалярного произведения (68.1). Аксиомы 1 и 4 очевидны. Аксиома 3 означает, что l|z + y + з||2 - ||х + у[|2 - ||z||2 = = (Н*+г||2 - 1И12 - И2) + (Ну + *Н2 - 11у112 - II II2) <=>
§108. Норма и скалярное произведение 349 <=^> ||z4-y4-z||2-||z4-y||2 = ||x4-z||24-||y4-z||2 —(||z||24-||y||2)- ||z||2 <=> {так как ||а:||2 4-||у||2 =-|||т 4-у||2 4 ^||х — у||2} <=> A £t 2||т + у + z||2 + 2||z||2 -2||яг4-z||2 -2||y4-z||2 = ||т4-у||2 - ||т-у||2. (108.4) Для доказательства (108.4) применим равенство (108.2) к вектору х 4- у 4- 2г, рассматривая его как (х 4- у + z) 4- z и как (т 4- z) 4- (у 4- z): ||(х 4- у + z) 4- z||2 4- ||х 4- у||2 = 2||т 4- У 4- z||2 4- 2||z||2, ||(х 4- z) 4- (у 4- z)||2 4- ||т - у||2 = 2||т 4- z||2 4- 2||у 4- z||2. Вычитая из первого равенства второе, получим (108.4). Теперь проверим аксиому 2: докажем, что (ах, у) = а(х, у), \/а е R. (108.5) а) Из доказанной выше аксиомы 3 следует, что (108.5) верно для любого а € N. Из (108.3) следует справедливость (108.5) для а = 0, а из (108.2) и (108.3) - для а = — 1. Поэтому (если еще раз воспользо- ваться аксиомой 3) равенство (108.5) верно для любого а € Z. б) Для рационального а — т/n, пользуясь уже доказанным свой- ством, находим (т \ / 1 \ /1 \ 1m.. I —х, у) — ( т —х, у) = ml — х, у) = m • — (х, у) = —(х, у). \ п / х п / Хп / п п Таким образом, для любого рационального а свойство (108.5) имеет место. в) Произвольное вещественное число а представим как предел по- следовательности рациональных чисел а^- Из непрерывности нормы следует непрерывность по а функции (ах, у), определенной соотноше- нием (108.3), поэтому в равенстве (акХ,у) = ак(х,у) можно перейти к пределу при k оо. Таким образом, построенная в (108.3) функция является скаляр- ным произведением. Поскольку (т,х) = |(4||т||2 - ||х||2 - ||т||2) = ||т||2, это скалярное произведение порождает в пространстве V заданную там норму. 2. Пусть V - комплексное нормированное пространство. Для нор- мы, порожденной скалярным произведением, имеем II* 4- у ||2 = (х, х) 4- (ж, у) 4- (х, у) 4- (у, у) = ||х||2 4- ||у||2 4- 2 Re(x, у), ||т 4-гу||2 = (*,*) +г(х,у) -г(х,у) 4-(у, у) = ||х||2 4- ||гу||2 + 21ш(а;,у).
350 Глава. XIX. Линейные нормированные пространства Следовательно, скалярное произведение, порождающее норму || • || пространства V, можно строить по правилу Re(x,y)= (Цо; + у||2 - ||х|(2 - ||у||2)/2, 1ш(х,1/) = (||х + гу||2 - ||х||2 - ||гу||2)/2. Справедливость аксиом скалярного произведения для (108.6) вытека- ет из п. 1 и вида функций (108.3) и (108.6). Равенство (108.2) называется тождеством параллелограмма в нормированном пространстве. Замечание. Не всякая норма порождается скалярным произ- ведением. Так, из гёльдеровских норм в арифметическом простран- стве только вторая норма || • ||2 удовлетворяет тождеству параллело- грамма. В самом деле, если х = (1,1,0,... ,0), у = (1, -1,0,... ,0), то х + у — (2,0,0,... ,0), х — у = (0,2,0,... ,0) и, следовательно, ||х||Р = НуНр = 2I/p, II1 + l/llp = II1 - j/llp = 2, так что тождество паралелограмма выполняется только для р = 2. Нетрудно проверить, что и бесконечная норма || Цое не порождается никаким скалярным произведением. § 109. Эквивалентность норм в конечномерномерном пространстве Компактность единичной сферы. Обозначим через S2 единич- ную сферу по естественной норме с центром xq = в: S2 = {x& V|||x||2 = 1}. (109.1) Теорема 109.1 (о компактности единичной сферы). Из любой последовательности С S2 можно выделить подпо- следовательность, сходящуюся по норме ||-||2 к некоторому вектору а& S2. Доказательство. Пусть е = (ei,..., еп) - базис пространства и x(fc) = 52"=1 € S2. Тогда l|x(fc)l|2 = 1/2 = 1. Это равенство означает ограниченность координат векторов х^ рас- сматриваемой последовательности: —1 < |т^| < 1. Согласно извест- ной из курса математического анализа теореме Больцано-Вейершт- расса [11, гл. 13], из этой последовательности можно выделить сходя- щуюся по норме ||-||2 подпоследовательность Пусть -> а
§ 109. Эквивалентность норм 351 по норме ||-Цг, т.е. ||—аЦг 0. Тогда ||x^fcml||2 —> ЦаЦг при тп —> оо, и a £ S2. так как ||а||2 = lim ||x(fc’",||2 = 1. m—>ос Следствие 1. Сфера S2 замкнута по норме || ||2. Эквивалентность норм. Две нормы || • ||» и || ||„ в линейном пространстве V называются эквивалентными, если существуют такие числа а > 0, С2 > 0, что для любого вектора х € V выполняются неравенства М. <С1||х||.. и ||х||..<С2||х||.. (109.2) Теорема 109.2. В конечномерном пространстве любые две нормы эквивалентны. Доказательство. Теорема будет доказана, если мы покажем, что любая норма || • || в линейном пространстве V эквивалентна есте- ственной норме || • ||г, или что существуют такие числа ci > 0, С2 > 0, что с2Ы2< И <ci№, Vxev. (Ю9.3) Для х = в неравенства (109.3) справедливы при любых cj > 0, С2 > 0. Пусть х 9 - произвольный ненулевой вектор пространства V, тогда л-лг- €S2. 1И12 Из теорем 107.4 и 109.1 следует, что функция нормы f(x) — ||х|| не- прерывна относительно нормы || • ||2 на единичной сфере S2. Согласно теореме Вейерштрасса [11, гл. 13| она достигает на этой сфере сво- их точных верхней и нижней граней, поэтому существуют векторы х', х" € S2 такие, что 1И1 < р; < м. VxeV. Полагая ci = ||х'||, с2 = ||х"||, получим (109.3). Следствие 2. В конечномерном линейном пространстве из сходимости по одной норме || • ||« следует сходимость по любой дру- гой норме || • ||*», так как ||z(fc) - а||.. < Ci||t(^ -a||.. Сходимость по норме || • ||оо называют покоординатной сходимо- стью, так как неравенство max |x-fc^ - aj < £ равносильно системе неравенств - aj| < £, . Isn*’ - an| < £ и, следовательно, сходимость последовательности х^ —> а по нор- ме II • ||оо равносильна сходимости координат: х) —> a,, i — 1,п. 12 Линейная алгебра к аналитическая геометрия
352 Глава XIX. Линейные нормированные пространства Согласно теореме 109.2, из сходимости х^ —> а по любой норме сле- дует покоординатная сходимость. Следствие 3. В конечномерном, пространстве V единичная сфера S = {х € V | ||х|| = 1} по любой норме является компактом, так как любая норма эквивалентна естественной норме || • ||г, а сфера S% в силу теоремы 109.1 компактна. Замечание. В §§107-109 рассматривались специальные свой- ства вещественных и комплексных линейных пространств, связан- ные с возможностью определить в них понятие предельного пере- хода. Этот материал, по существу являясь элементарным введением в функциональный анализ, дает удобный инструмент для изучения пределов в линейном пространстве, сводя сходимость по норме век- торной последовательности х^ —> а к сходимости числовой последо- вательности Ца:^ - а|| -> 0. Предельный переход в нормированных пространствах, как будет видно из последующего, позволяет строить “приближения” и находить оценки их точности. §110. Линейные операторы в нормированных пространствах Непрерывность и ограниченность. Пусть V и W - линейные нормированные пространства с нормами || • || v и || [| w соответственно. Линейный оператор А € £(V, И7) называется непрерывным в точке х е V, если для любой последовательности } С V, сходящейся к х по норме || || v, последовательность сходится к Ах по норме II ' llw: ||x(fc) - х||v -+ 0 => |[>4x(fc) - Дт||щ 0. Оператор А называется непрерывным в пространстве V, если он не- прерывен для всех х € V. Линейный оператор А € £(V, IV) называется ограниченным, если существует число с > 0 такое, что НАгПи-' < сЦтЦу, Vt е V. (110.1) Теорема 110.1. В конечномерных нормированных прост- ранствах V и W любой линейный оператор А € £(V, IV) ограничен. Доказательство. Пусть ei,...,en - базис пространства V и х = ЕГ=1 TjCi- Тогда согласно аксиомам нормы и неравенству Коши- Буняковского п /п х1/2/" X1/2 11-4х|| < Е N ||Аег|| < £ ||Дег||2 Е*Ы2 = М||х||2, i=l \г=1 J \г=1 / где М = (Е?=1 Н-4е,||2)1/2. Отсюда с учетом (109.3) получим, что ||Аг|| < сЦхЦ, где с = М/с2 > 0.
§110. Линейные операторы в нормированных пространствах 353 Следствие 1. В конечномерных нормированных пространствах V и И7 любой линейный оператор А € £(V, W) непрерывен. Это следует из неравенства - Лх||и/ = М(х^ - х)||ц/ < c||a/fc) - х||ц. Пример неограниченного оператора следует искать в бесконечно- мерном пространстве. Так, если С[0,2] - множество непрерывных и дифференцируемых на [0,2] функций с нормой ||/(т)|| = max |/(т)| хб[0,2] и Т> - оператор дифференцирования: T>f(x) = то для /п(х) = = sin тгт выполнено ||/п(х)|| = 1, вместе с тем ||P/n(z)|| = п. Норма оператора. Пусть V и W - линейные нормированные пространства (оба вещественные или оба комплексные). Линейное пространство £(V,IV), как и любое линейное пространство, можно сделать нормированным, введя на нем норму оператора. Однако для нормы оператора нет той свободы выбора, которая имеет место для векторных норм, так как помимо линейных операций (заложенных в аксиомах векторной нормы) оператор связан с другими оператора- ми еще и операцией умножения; кроме того, оператор действует на векторы и его норма должна быть связана с векторными нормами. Вводя нормы оператора, в той или иной форме принимают во внима- ние операцию умножения операторов и векторные нормы пространств V и W. Норма оператора называется мультипликативной, если выполне- но неравенство ИЖ < И1-ЦВЦ (110.2) для любых операторов А, В, для которых определена операция АВ. Свойство (110.2) называется свойством мультипликативности нормы. Норма оператора называется согласованной с векторными норма- ми || • ||v, || • ||iv пространств V и W, если для любого оператора Ае С(У, W) справедливо неравенство IIAtIIjv < М|| • ||х||и, Vi eV. Замечание 1. В дальнейшем в символе || ||у индекс V будет опускаться, если из контекста ясно, о каком пространстве идет речь. Т еорема 110.2. Собственное значение линейного оператора А е С(У, V) не превосходит по абсолютной величине любую его со- гласованную норму. Доказательство. Если Ах — Ах, то для любой согласованной нормы оператора имеем ||Лт|| = |А| • ||х|| и ||Лх|| < МН ’ Н^П. откуда следует, что |А| < ||Л||. Подчиненная норма. Пусть V, W - конечномерные простран- ства и А е C(V, W). Из теоремы 110.1 следует ограниченность опера- тора А, т.е. существование числа с > 0 такого, что ||Лх|| < с||я:||, Vx eV или, в равносильной формулировке, ||Лт|| /||х|| < с, Vx ф в.
354 Глава XIX. Линейные нормированные пространства Это означает, что числовое множество ЦЛх|| 1И1 х О ограничено сверху и, следовательно, для него существует точная верх- няя грань. Положим м(Л) = 3ирМ. (1Ю.З) Теорема 110.3. Отображение р.(А) является мультипли- кативной нормой в пространстве £(V, W), согласованной с вектор- ными нормами пространств V и IV. Доказательство. Очевидно, что р(Д) > 0 для любого опера- тора A G £(V, IV), при этом равенство р(А) = 0 означает, что ||Дх|| = 0, Vx € V, т.е. Ах = 0, Vx е V или А = О. Аксиомы 2 и 3 вытекают из свойств точной верхней грани. Таким образом, р(Д) - векторная норма в пространстве £(V, IV). Проверим свойство мульти- пликативности. Из (110.3) следует, что ||Дх|| < д(Д)||х||, Vx е V, так что р(А) обладает свойством согласованности с векторными нормами пространств V и W. Отсюда получаем р(АВ) - sup < supp(A)^^- = д(Д) sup = д(Д)д(В).я Х^в Ill'll IhII Х^в Ill'll Норма р(Д) называется нормой оператора А, подчиненной (поро- жденной) векторным нормам пространств V и W. Обозначение: ||Л||. Итак, ||Л|| = sup = sup ||Дх||. НХН ||z||=l Попутно показано, что подчиненная норма - наименьшая из всех согласованных норм, так как является точной верхней гранью мно- жества, а согласованная норма - одной из верхних граней этого мно- жества. Замечание 2. Подчиненная норма определяется не только са- мим оператором, но и векторными нормами пространств V и W. Меняя векторные нормы, можно изменить и норму оператора. Рас- смотрим наиболее часто употребляемые нормы. Спектральная норма. Пусть V, W - евклидовы (унитарные) пространства. Норма линейного оператора А € £(V, IV), порожден- ная евклидовыми нормами вектора, называется спектральной нор- мой. Обозначение: ЦДЦ2. Итак, ||Л||2 = sup ||Лх||е = sup \/(Дх,Лх) ||х||в = 1 (x.z)=l
§111. Матричные нормы оператора и нормы матрицы 355 Теорема 110.4. Спектральная норма оператора равна мак- симальному сингулярному числу этого оператора. Доказательство. Пусть n = dim V, т = dimW и ei,. -., еп - правый сингулярный базис, а р > • • • > pa (s = min(n, m)) - сингуляр- ные числа оператора А (§100), х = £Хх Положим ps+i = ... = = рп = 0, если s < п. Тогда ||Дх||д = (Ах, Ах) = (А*Ах,х) = = E”=i*jej) = 1X1 P11X1N2- Отсюда следует, что ЦЛтЦд < Pi, если ||х||в = 1, и ||Лх||в = Pi, если х = е\ (очевидно, ЦсхЦе = 1). Значит, pi = max ЦЛхЦе = sup ||Аг||е = Ме=1 ||х||в=1 - ||Л||2. Следствие 2. Спектральная норма нормального оператора равна абсолютной величине максимального по модулю собственного значения этого оператора. Теорема 110.5. Сингулярные числа линейного оператора в евклидовом (унитарном) пространстве не изменяются при умно- жении оператора на ортогональный (унитарный) оператор. Доказательство. Пусть В = UAV, где ICU — I, V’V = Т. Тогда В*В — следовательно, матрицы операторов В*В и подобны и их собственные значения совпадают. Следствие 3. Спектральная норма линейного оператора не изменяется при умножении оператора на ортогональный (унитар- ный) оператор. §111. Матричные нормы оператора и нормы матрицы Спектральная норма линейного оператора является, по существу, единственной подчиненной нормой, не связанной явно с базисами прос- транств V и W. Если же в пространствах V и W зафиксированы ба- зисы, то возможность введения операторных норм существенно рас- ширяется. Пусть е = (ех,..., еп) и f = (Д,..., fm) - базисы пространств V и W. Введем в V и W векторную норму || ||р согласно (107.10). Будем считать, что в пространствах V и W введены нормы одинакового ти- па. Обозначим через ||Д||Р норму оператора, подчиненную векторным нормам || • || р, через А = (а,-,) - матрицу оператора А в базисах ей/. Теорема 111.1. Для любого оператора A е C(V, W) Mill = ,max £ |a0 |. i=i
356 Глава XIX. Линейные нормированные пространства Доказательство. Пусть х = J2”=i x3ej, тогда •Дт XjAej — 52 52 ^ijfi = 52 ( 52 ]=1 }=1 1=1 1 = 1 J = 1 Согласно (107.10), m n m n n m ii-Mi = 52£а«л1 < 1252 = 5252iavi- i=i j=i i=i >=i j=i i=i Пусть fc-й столбец матрицы А имеет максимальную столбцовую сумму, т.е. J2i2i 1аД-| = max £2121 |ау|. Тогда из (111.1) следует, l<j<n что ||-4х||1 < 527=1 kjlIXi l°»kl - Iklli 52™i Это означает, что — 52ili loifcl Для любого вектора х, у которого ||x||i — 1, и ||Лх||1 - 22121 laifel Для вектора х = ек (очевидно, ||efc||i - 1). Следо- вательно, 22i2i laifel = SUP Ы1 = 1 Теорема 111.2. Для любого оператора А € £(V, IV) Mlloo= max £ Ы- j = l Доказательство аналогично доказательству теоремы 111.1. Оно предоставляется читателю. Замечание. Векторные нормы || • ||2 пространств V и IV поро- ждают спектральную норму оператора ЦЛЦг, так как норма || • ||2 со- впадает с евклидовой нормой || - ||е, если в пространствах V и W ввести скалярное произведение так, чтобы базисы ей/ слали орто- нормированными. Евклидова норма оператора. Можно строить норму линейного оператора и как норму вектора в линейном пространстве £(V, IV). Одна из таких норм представляет интерес. Евклидовой нормой оператора А называется число (\ ГЛ п \ 52Х2’^|2) • (ш-2) i=i>=i / Корректность этого определения следует из легко проверяемых для ||Д||е аксиом нормы. Как видно из (111.2), евклидова норма оператора легко вычисляе- ма (по сравнению, например, с ЦДЦг)• При этом она обладает многими свойствами подчиненных норм. Перечислим их.
§ 112. Экстремальные задачи для самосопряженного оператора 357 1. Свойство согласованности: ЦАгсЦе < М||е||х||е, так как в си- лу неравенства Коши-Буняковского ЦАгЦ^ = EEi|Ej=i a>jzj|2 < < e,=i (е;=1 ы2е;=1 mi2) = e;=i mi2 miii = 2. Свойство мультипликативности: ЦЛВЦе < М||я11®11я> ибо 1|ЛВ||1 = Е1У2а»*М| У2(Е^ lai*IIMl) < ij k i,j k < E(E i^i2 • E M2) = E m2 E im2 = mihh<. i.j k k i,k j,k 3. Mill = trA*A — trA4*. Эти равенства легко проверяются непосредственно. 4. Mill — Pi + " ' + Pl гДе Pi> • • • ’Ps _ сингулярные числа опера- тора А и s = min(n,m). Это следует из свойства 3 и теоремы 92.2 (следствие). 5- Mlle > М11г в силу теоремы 110.4. 6. MIIe не изменяется при умножении оператора А на ортого- нальные (унитарные) операторы. Это следует из свойства 4 и теоре- мы 110.5. Норма матрицы вводится аналогично норме оператора, по суще- ству, весь §110 относится и к матрицам, с очевидной заменой термина “оператор” на термин “матрица”. Среди норм матрицы А = (a1?) € RmXn (или Cmxn) наиболее упо- требительны следующие нормы: т Mill = /пах У21М; l<J<n *—~ п Mlloo= max Elavl; Ki<m ' " ~ >=1 М||г = максимальному сингулярному числу матрицы А; (, 1/2 m п \ ЕЕы2 • 1=13=1 / § 112. Экстремальные задачи для самосопряженного оператора Под экстремальными задачами понимаются задачи, связанные с нахождением экстремумов функций. Изучение таких задач составля- ет содержание так называемого вариационного исчисления. Большин- ство методов, существующих в вариационном исчислении, связано со специальным видом тех функций, экстремальные значения кото- рых ищутся. В случае самосопряженного оператора в качестве такой функции рассматривается функция
358 Глава XIX. Линейные нормированные пространства = х/ву (Н2.1) называемая отношением Рэлея. Вариационные свойства собственных значений. Пусть А - самосопряженный оператор в евклидовом (унитарном) пространстве V. Построим в пространстве V ортонормированный базис (112.2) из собственных векторов оператора А, отвечающих собственным зна- чениям Ai >А2>- >АП. (112.3) Такой нумерации собственных векторов и собственных значений бу- дем придерживаться всюду в этом параграфе. Под нормой || • || бу- дем понимать евклидову норму || • ||е, так что если х = ^е,, то Ill'll = у/(х,х) = <^=\ Отношение Рэлея может быть записано в виде /(.я) = (Ля, я), ||х|| = 1. (112.4) Теорема 112.1. Для самосопряженного оператора А спра- ведливы равенства Ai = max (Ля, я), An = min (Ля, х). 11*11=1 11*11=1 Доказател ьство. Для любого вектора х = х<е< € V име- ем Ах = 52"=1TiA{ei G V и, с учетом оргонормированности бази- са, (Ля,л) = А{|х,|2. В силу (112.3) отсюда следует, что А[ > > (Ля,я) > Ап, если ||я|| = 1; причем (Ле^ег) = Aj, (Аеп,еп) = Ап и ||ei || = 1, ||en|| = 1- Следовательно, Ai и Ап - наибольшее и наимень- шее значения (Ах, я) на единичной евклидовой сфере. Замечание. Эта теорема дает экстремальные свойства и квадра- тичной формы в евклидовом (унитарном) пространстве: на единичной сфере квадратичная форма Л(я, я) принимает экстремальные значе- ния на тех векторах, которые являются собственными векторами самосопряженного оператора Н (теорема 104.3). Кстати, в терминах квадратичной формы /(ц,... ,хп) от переменных хх,..., хп задача поиска экстремальных значений квадратичной формы представляет собой классическую задачу на условный экстремум. Одним из методов ее решения является метод Лагранжа [11). Теорема 112.2. Если L - линейная оболочка собственных векторов .. ,eik (i\ << ik) из базиса (112.2) самосопряжен- ного оператора А, то А;, = max (Ля, л), А1ь = min (Ля, я). (112.5) ||i|| = L,xeL ||х||=1,х€б
§112. Экстремальные задачи для самосопряженного оператора 359 Доказательство аналогично доказательству теоремы 112.1. Теорема 112.3 (теорема Куранта-Фишера). Для соб- ственных значений самосопряженного оператора Л справедливы соотношения Ак — max min (Ac, г), А* = min max (Ax, x), ( ) t.i-k+i ||i|| = l,iGLn_i + i где максимум (в первом соотношении) берется по всевозможным к-мерным подпространствам Lk, а минимум (во втором соотно- шении) - по всевозможным (п — к + 1) -мерным подпространствам Ln_k+i пространства V. Доказател ьство. Пусть Lk - произвольное fc-мерное подпрост- ранство и (Vn-k+i ~ линейная оболочка собственных векторов еь, , еп из (112.2) оператора А. Так как dimLt 4- dimlPn_t+i = n+ 1, то Lk П Wn-t+i / {0}. Пусть To G Lk П и ||х0|| = 1. Так как To G Wn_fc+i, то из первого равенства (112.5), примененного к под- пространству следует, что /(tq) < А^. С другой стороны, tq G Lk и следовательно, существует вектор з?о G Lk, ||то|| = 1 такой, что /(xq) < Хк- Таким образом, для любого /с-мерного подпростран- ства Lk имеем min f(x) < Ai, M=i, zebk и max min f(x) < A*. (112.7) Lk ||z||=l,ze Lk Равенство в (112.7) достигается для Lk •- £(ei,... ,et). Второе соот- ношение в (112.6) доказывается аналогично. Вариационные свойства сингулярных чисел. Пусть V, W - евклидовы (или унитарные) пространства, dim V - п, dim W = т. В обоих пространствах рассматриваются евклидовы нормы: ||x||js — - у/(х,х). Теорема 112.4. Пусть р\ > ... > ps, s = min(m,n), - син- гулярные числа оператора А е £(V,W). Тогда для любых к, к = 1, s, справедливы соотношения рк — max min ||Ar||, Lk HziHi.xeL* (112.8) Рк = mm max v ’ ||z||=i,xeL„_*+1 где максимум (в первом соотношении) берется по всевозможным к-мерным подпространствам Lk, а минимум (во втором соотно- шении) - по всевозможным (п — к + 1)-мерным подпространствам Ln-k+i пространства V.
360 Глава XIX. Линейные нормированные пространства Доказательство. Известно (§100), что А* А € £(V, V) - само- сопряженный оператор с собственными значениями р\ > ... > pl.. Из теоремы Куранта-Фишера следует, что р? = max min (А*Ах,х), Lk ||r|| = l,x6I.* pl = min max (A'Ax,x}. Ьп-fcfi ||x||= 1 ,z6L„_ fc+1 Отсюда, если учесть, что (Л*Лт,2!) — (Ах,Ах) = ||Ас||2, следует утверждение теоремы. Разделение собственных значений. Главной подматрицей к-го порядка матрицы А называется матрица, составленная из эле- ментов матрицы А, расположенных в к строках и к столбцах с оди- наковыми номерами. Теорема 112.5. Пусть самосопряженная матрица А име- ет собственные значения Ai > .. - > Ап и пусть В - ее главная подматрица (п — 1)-го порядка. Тогда соб- ственные значения р\ > рг > > Мп-1 матрицы В разделяют собственные значения матрицы А, т.е. А1 — Ml — -^2 — • • — Ап—1 — Мп —1 — Ап. (112.9) Доказательство. Без ограничения общности можно считать, что подматрица В находится в левом верхнем углу матрицы А. Ма- трицу А будем рассматривать как матрицу самосопряженного опера- тора А € £(V,V) в некотором ортонормированием базисе gi,... ,gn пространства V, а матрицу В - как матрицу самосопряженного опе- ратора В € £(V, V) в базисе gi,... ,gn-i подпространства V простран- ства V. Очевидно, что для векторов х € V (Вх,х) = (Ах,х). (112.10) Пусть - ортонормированный базис V, состоящий из собственных векторов оператора В, а Д1 > ... > /in-i - соответству- ющие собственные значения. Обозначим Lk — £(fi,...,fk), Ln-k = = £(fk, • •, /п-i)- На основании теоремы 112.2 с учетом (112.10) Рк = min __ (Лд,а’), рк — тах_ (Ах,х). ||z||=l,xeL* ||l|| = l,z€Zn_* Так как Lk - одно из fc-мерных подпространств пространства V, то в силу теоремы Куранта-Фишера Рк < max min (Ах,х) = А*,, т.е. рк < Хк- Lk ||z[|—\,z€Lk
§113. Задачи наилучшего приближения 361 С другой стороны, Ln_fc - одно из подпространств пространства V размерности n-(i + 1) + 1 и в силу теоремы Куранта-Фишера Pk > min max (Аг,я) = Ajt+1, т.е. рк > Ajt-t-i- £n-(k + l>+l 1И1=1.*€Ьп-(к + 1)+1 Таким образом, А*, > рк > Ajt-t-i, к = 1,п — 1. Соотношения (112.9) называются соотношениями разделения соб- ственных значений. Следствие. Если А - матрица (вещественная или комплекс- ная) размера т х п, В - подматрица, состоящая из п — 1 столбцов матрицы А, то для сингулярных чисел pi > ... > рп матрицы А и <71 > ... > <тп-1 матрицы В имеют место соотношения Pi > <71 > Р2 > • • > <7п-1 > Рп- (112.11) Эти неравенства вытекают из соотношений разделения собствен- ных значений самосопряженной матрицы Ан А, для которой матрица ВНВ является главной подматрицей (п- 1)-го порядка. Соотношения (112.11) называются соотношениями разделения сингулярных чисел. §113. Задачи наилучшего приближения в нормированном пространстве Наилучшее приближение. Если V - метрическое пространство, L - его подпространство и f - фиксированный элемент пространства V, то, как известно (§74), величина р(/, L) = inf р(/, х) x&L называется расстоянием от элемента / до множества L или, как гово- рят иначе, отклонением элемента f от множества L. Если существует элемент xq е L такой, что р(/, Ь) = р(/,х0), то элемент Xq называется элементом наилучшего приближения эле- мента f на множестве L. Теорема 113.1 (о наилучшем приближении). Если V - нормированное пространство и L - его конечномерное подпростран- ство, то для любого вектора f € К существует вектор наилучшего приближения на L. Доказательство. Покажем, что для любого вектора f € V существует вектор хо € L такой, что ||/-*о||= inf \\f-x\\.
362 Глава. XIX. Линейные нормированные пространства п Пусть ei,...,en - базис подпространства L и х = 22 То- к=1 п гда ||/ — т|| = ||/ — 22 ||• Требуется найти числа Ai,..., Ап так, fc=i чтобы функция Sp(Ai, ..., Ап) = / - EAfce* Jfc=l принимала наименьшее значение. Заметим прежде всего, что <p(Ai,..., Ап) - непрерывная функция своих аргументов Ai,..., Ап, так как п п МА1,..., А„) - ^Аь.,., Ап)| = 1II/ - Е А*М - II/ - Е А^и I fc=l fc=l <{||a-b||>|H-|l*ll|}< n n (/-ЕА'^-(/-ЕА*м Jt=l fc=l n n < E iA* - Afci • нм ж >A* - A*i • E um- z—' l<A:<n ' fc=l ---- fc=l Пусть p - точная нижняя грань множества значений функции y?(Ai,..., Ап). Рассмотрим новую функцию ^(Ai,..., Ап) — Ем+ к=1 п Эта функция на единичной евклидовой сфере 22 |Ajt|2 — 1 неотри- к=1 цательна, непрерывна и по известной теореме Вейерштрасса [11] она достигает на ней своей точной нижней грани. Пусть = /(V, --,An). Eje=l |Afc| =1 Очевидно, что р > 0. п Рассмотрим все векторы т = 22 ^к^к € Т, для которых к = 1 \V2 1 Е1А*12) >-(р+1 + н/п) = я. к=1 / (113.1)
§113. Задачи н&илучшего приближения 363 Для этих векторов <^(Ах,., Ап) > || ^Afce/еЦ - ||/|| = fc=i Ч(П=1 |А№’"” (П=1 Ы2)1/2 -11/11 > / п \ 1/2 £>*|2 - li/н > р + 1. \к=1 / п Таким образом, для векторов х = 52 Afce*, € L, удовлетворяющих fc=i условию (113.1), 9?(Ai, ..., Ап) = ||/ — т|| > р + 1. Следовательно, желая найти наименьшее значение функции ||/ — х||, можно ограни- п читься рассмотрением только тех векторов х = 52 ^к^к G L, для fc=i п которых |Ajt|2 < R2. Функция ||/ — т|| непрерывна на замкнутом к=1 шаре ЦхЦг < R и по теореме Вейерштрасса [11] существует вектор х0 G L, для которого ||/ — Toll = Р- Замечание. Если V - конечномерное евклидово (или унитарное) пространство, то задача наилучшего приближения вектора / на под- пространстве L решена в §74 для евклидовой нормы: единственным вектором наилучшего приближения вектора / на подпространстве L является ортогональная проекция вектора / на подпространство L. Аппроксимация оператора (матрицы). Теорема 113.2. Пусть V и W - евклидовы (или унитар- ные) пространства иА€ £fV, W). Пусть rg А = г и pi > ... > рТ > О - ненулевые сингулярные числа оператора А. Если к € N, к < г, то min Be£(v,iv),rgB<fc ||А- В||2 = Pk+i. (113.2) До каз ате л ьство. 1. Прежде всего отметим, что в силу согласо- ванности спектральной нормы с евклидовыми векторными нормами ||(А- ВМя < М- В||2 ||Ф- Отсюда следует, что ||Л-В||2 > НЛг-йтЦе, ||ф = 1. (113.3) 2. Пусть ei,..., вп и fi,..., fm - сингулярные базисы для операто- ра А, т.е. Ае, = ptfi, i = ТГг, Aei = в, i> г.
364 Глава XIX. Линейные нормированные пространства 3. Рассмотрим оператор В € £(V, W). Если rgB < к, то def В > > n-к. Пусть L — £(ei,... ,е*+1), тогдакегБПЬ > n—k+k+1-n = 1. Следовательно, существует ненулевой вектор xq € ker В П L. Будем считать, что ЦтоЦв = 1- Так как xq € L, то в силу (112.8) ||Аг0|| > Рк+\- (113.4) Так как xq 6 ker В, то ||Дхо - BioIIe = ||>Ь;о||е- (113.5) Из (113.3)—(113.5) следует, что И - В||2 > pfc+1 (113.6) для любого оператора В, для которого rgB < к. 4. Неравенство (113.6) достигается для оператора В ранга к, опре- деленного равенствами Be, = Pifi, i = 1,/с, Be; — 0, i > к, ибо для оператора А — В максимальным сингулярным числом явля- ется РЛ + 1- Расстояние до множества вырожденных матриц. Теорема 113.3. Спектральное расстояние от заданной не- вырожденной матрицы А до множества вырожденных матриц рав- но ее минимальному сингулярному числу. Доказательство. Действительно, согласно теореме 113.2: Ы ||Д-В||2= inf ||Л - В||2 = Рп. |В|=0 rgB<n-l § 114. Линейные операторные уравнения Рассмотрим проблему решения систем линейных алгебраических уравнений с точки зрения свойств линейного оператора. Пусть V, W - евклидовы (унитарные) пространства, А € C(V, И7), и € W. Уравнение Az = и (114.1) называется линейным операторным уравнением, вектор и - правой частью, вектор z - решением. Очевидно, в матричной записи опера- торное уравнение превращается в систему линейных алгебраических уравнений и, следовательно, все свойства систем уравнений можно переносить на операторные уравнения, и наоборот. Отметим неко- торые из этих свойств в терминах операторных уравнений.
§114. Линейные операторные уравнения 365 Однородное уравнение A’w = 0 (114.2) называется сопряженным к уравнению (114.1). Теорема 114.1 (альтернатива Фредгольма). Либо ос- новное уравнение (114.1) имеет решение при любой правой части и € W, либо сопряженное к нему уравнение имеет нетривиальное решение. Доказательство. Пусть г — rgA, m = dim И7. Возможны два случая: либо г — т, либо г < т. Условие г = т равносильно условию imA =. W, которое означает, что уравнение (114.1) имеет решение при любом и G W. При этом так как rgA = rgA*, то kerA* — {0} и уравнение (114.2) не имеет ненулевого решения. Условие г < т рав- носильно условию def А* > 0, которое означает существование нену- левого вектора w € kerA*, т.е. ненулевого решения (114.2). При этом imA-^ IV и уравнение (114.1) имеет решение не для любого и 6 W. Замечание 1. Альтернатива Фредгольма для оператора А, дей- ствующего в одном пространстве V, означает, что либо основное урав- нение имеет единственное решение при любом и G V, либо сопряжен- ное к нему уравнение имеет нетривиальное решение. Теорема 114.2 (теорема Фредгольма). Операторное уравнение (114.1) имеет решение тогда и только тогда, когда его правая часть ортогональна всем решениям сопряженного уравне- ния. Доказательство. Уравнение (114.1) имеет решение тогда и толь- ко тогда, когда и G imA или, с учетом (95.4), когда и € ker1 А*. Это равносильно ортогональности вектора и всем векторам ker А*, т.е. ре- шениям уравнения (114.2). Нормальное решение. Пусть уравнение (114.1) разрешимо, т.е. имеет хотя бы одно решение. Обозначим через Н множество всех его решений. Нормальным решением уравнения (114.1) называется такое его решение zq, что ||z0||e = inf |И1в- zGH Другими словами, нормальное решение - это решение наименьшей длины. Корректность определения вытекает из следующей теоремы. Теорема 114.3. Для любого разрешимого уравнения (114.1) нормальное решение существует и единственно. Доказательство. Существование. Пусть z - решение урав- нения (114.1). Совокупность Н всех решений этого уравнения явля- ется линейным многообразием Н — z + ker А, так как для множеств Н и z + ker А, как легко показать, имеет место двустороннее вложе- ние. Из свойств линейного многообразия в евклидовом (унитарном) пространстве (теорема 73.1) следует существование и единственность нормального вектора сдвига zq, ортогонального направляющему под- пространству ker А. Причем вектор zq имеет наименьшую длину сре-
366 Глава XIX. Линейные нормированные пространства ди всех решений уравнения (114.1). Таким образом, zq - нормальное решение уравнения (114.1). Единственность. Пусть zj - нормальное решение уравнения (114.1). Тогда Z] 6 Н, т.е. zj = zq + w, где w £ kerЛ, (w,z0) = 0, и 11*1 IIе = ll^olls + ||w|Ie- Так как ||z0||e = НМе, то w = 6 и Zj = z0. Замечание 2. Доказательство теоремы дает правило для отыс- кания нормального решения (теорема 73.2); zq - перпендикуляр, опу- щенный из любого решения z уравнения (114.1) на ker Л. Псевдорешение. Рассматривается уравнение (114.1), не обяза- тельно разрешимое. Вектор г = Az — и называется невязкой вектора z, функция F(z) = ||Дн — z||g - функционалом невязки. Очевидно, вектор z является решением уравнения (114.1) тогда и только тогда, когда его невязка г = 6, т.е. когда ||г||е = 0- Поскольку нулевое значение нормы является наименьшим, решение z можно рас- сматривать как вектор, невязка которого имеет наименьшую норму, или, как принято говорить, минимизирующий функционал невязки. Задача отыскания векторов, минимизирующих функционал невяз- ки, имеет смысл и тогда, когда уравнение (114.1) неразрешимо (на- пример, вследствие погрешностей измерения А и и). В этом случае, если z минимизирует функционал невязки, то расстояние p(Az,u) — = \\Az — u||е минимально и, следовательно, при таком z левая часть уравнения Az “ближе” всего к правой части и. Для многих задач вычислительной математики векторы, минимизирующие функционал невязки, представляют интерес (даже если уравнение (114.1) не раз- пешимо). Для таких задач рассматриваются обобщенные решения. Вектор z+ € V называется псевдорешением уравнения (114.1), если ||Дг+ - u||l = inf ||Аг - а||2£. (114.3) z6 V Другими словами, псевдорешение - это вектор пространства V, ми- нимизирующий функционал невязки. Очевидно, если уравнение (114.1) разрешимо, то псевдорешение совпадает с решением в обычном смысле. Метод наименьших квадратов. Задача поиска псевдорешения возникает, например, тогда, когда некоторая величина Ь находится как линейная комбинация величин tzj,..., ап: Ь ... 4- xna.fi, а коэффициенты при Xj должны быть найдены в результате измере- ния величин aj и соответствующих значений Ь. Если при г-м измере- нии получены значения для величин и значения bi для величины Ь, то нужно составить уравнение Ui^xj 4~ пдТд 4-. • • -j- а{цХп — Ьц m измерений приводят к системе тп уравнений, которая, вообще го- воря, будет несовместной вследствие неизбежных ошибок измерения,
§114. Линейные операторные уравнения 367 а, может быть, еще из-за того, что величина Ь не является в точно- сти линейной комбинацией aj,... ,an, а лишь аппроксимируется ею. Возникает задача определить коэффициенты Xj так, чтобы каждое уравнение удовлетворялось приближенно, но с наименьшей общей по- грешностью. Если за меру погрешности взять функционал невязки, то мы и придем к задаче поиска псевдорешения. Описанный прием называется методом наименьших квадратов. Теорема 114.4. Псевдорешение существует для любого опе- раторного уравнения (114.1). Доказательство. Согласно определению (114.3), ||Лг+—u||e = = inf IIAz - u||e = inf \Az - u| = inf p(Az,u) = inf p(y,u). z€V z€V yGim-A Это означает, что вектор Az+ - это вектор наилучшего приближе- ния вектора и на 1тД. Из теоремы 74.2 следует, что Az+ - ортого- нальная проекция вектора и на ппЛ. Пусть и = g + Л, где g G ппЛ, h ± 1тД. Тогда z+ является решением в обычном смысле уравнения Az=g (114.4) (очевидно, оно имеет решение, так как g € im Л). Уравнение A" Az = А*и (114.5) называется нормальным уравнением для уравнения (114.1). Теорема 114.5. Вектор z+ пространства V является псевдорешением уравнения (114.1) тогда и только тогда, когда z+ - решение нормального уравнения (114.5). Доказательство. Выше было показано, что z+ - псевдоре- шение (114.1) тогда и только тогда, когда z+ - решение в обычном смысле уравнения (114.4). Покажем, что уравнения (114.4) и (114.5) равносильны. Действительно, А*и = А*д, так как и = д + h, где h 6 ппхД = кег Д’. При этом если z - решение (114.4), то Az = д, поэтому A*Az = А'и и z является решением (114.5). Если же z - ре- шение (114.5), то A* Az = А*д или A* (Az - д) = 0. Значит, Az - д е G кегЛ*= im'1 А. Но Az G нпЛ, д е im А, следовательно, Az—д G йпЛ. Отсюда с учетом соотношения Az — д G im1 А, полученного выше, следует, что Az — д = 0, т.е. z является решением (114.4). Нормальное псевдорешение. Псевдорешение наименьшей дли- ны называется нормальным псевдорешением. Из теорем 114.3 и 114.4 следует, что нормальное псевдорешение существует и единственно для любого уравнения (114.1). Сингулярные базисы оператора А позволяют получить явные вы- ражения для псевдорешения и нормального псевдорешения. Пусть rg А = г, ej,..., еп и /),..., fm - сингулярные базисы для оператора А, р\ > ... > рТ > 0 - сингулярные числа. 13 Линейная алгебра и аналитическая геометрия
368 Глава XIX. Линейные нормированные пространства Разложим псевдорешение z+ по базису е^,... ,еп: z+ - aiet + ... + arer + <*r+1 er+1 + ... + anen. (114.6) Так как z+ - решение нормального уравнения (114.5), то, подставив z+ в это уравнение, получим GiPjCi + ... + arprCT = -А*а. (114.7) Из ортонормированности базиса е следует, что ctfcPfc = (Л‘и, Ct) = (к, Аек), к - 1, г. Учитывая, что р2к = (Аек,Аек), к = 1,г, находим (А*и,ек) ак -------5--- Рк (и,Аек) (Аек,Аек)' (114.8) Таким образом, получен общий вид псевдорешения (114.6): п х+ ^^акек, к=1 где ai,..., аг определены соотношением (114.8), a аг+1,..., ап про- извольны. Отсюда следует и общий вид нормального псевдорешения z°: z° = У^акСк, к=1 (114.9) где сц,..., ат определены соотношением (114.8). Соотношения (114.9), (114.8) могут быть записаны по-другому: г° = ^A’h + ... + —A* fr Pl Pr ИЛИ где /Зк - (U,fk) . -Г— д —5—, к = 1, т, так как = Рк Ок _ (u, fk) Рк (Pkfk., Pkfk) Пример. Найдем нормальное псевдорешение системы линейных уравнений X] + т2 = 1, \/2%1 4- у/2%2 — Очевидно, что псевдорешение совпадает с решением в обычном смысле и имеет вид z+ = (i], 1 — Xi)T, Vzj, при этом г° = (1/2,1/2)г
§114. Линейные операторные уравнения 369 - нормальное решение (при Ху = 1/2 вектор z+ имеет наименьшую длину). При вводе в память компьютера данной системы уравнений возможны ошибки представления числа у/2 рациональным числом. Пусть в памяти компьютера система приобрела вид ( xt + х2 = 1, I l,414xi + 1,4142x2 = 1,415. Эта система имеет единственное решение z° — (—4,5)т, так что при- ближенное нормальное решение z° имеет мало общего с точным нор- мальным решением z°: Ц20 — z°Ц2 = 9i/2/2. В 1965 г. академиком А.Н.Тихоновым, организатором факультета ВМиК МГУ им. М.В.Ломоносова, был предложен метод нахождения приближенного нормального решения, устойчивого к малым возму- щениям исходных данных. Этот метод получил название метода ре- гуляризации.
ПРИЛОЖЕНИЕ Проблемы оснований геометрии и обоснования метода координат § 1. Аксиомы элементарной геометрии Будем рассматриватьтри множества объектов любой при- роды: объекты первого множества будем называть точками и обо- значать большими латинскими буквами А, В,С,..объекты второго множества будем называть прямыми и обозначать малыми латински- ми буквами а, 6, с,..., объекты третьего множества будем называть плоскостями и обозначать греческими буквами а,/3,7... . Будем считать, что в рассматриваемых множествах каким-либо способом определены соотношения между объектами, выража- емые тремя терминами: принадлежит, лежит между и конгруэн- тен1. Например, точка А принадлежит прямой а или плоскости а; точка В, принадлежащая прямой а, лежит между принадлежащи- ми той же прямой точками АиС; отрезок прямой а, ограниченный принадлежащими этой прямой точками А и В, конгруэнтен отрезку прямой Ь, ограниченному принадлежащими этой прямой точками С и D. Будем требовать, чтобы указанные соотношения удовлетворяли формулируемым ниже двадцати аксиомам2. Все аксиомы разделяются на пять групп. Группа I содержит восемь аксиом принадлежности. Группа II содержит четыре аксиомы порядка. Группа III содержит пять аксиом конгруэнтности. Группа IV содержит две аксиомы непрерывности. Группа V содержит одну аксиому параллельности. Переходим к формулировке аксиом по группам. Одновременно бу- дем приводить некоторые утвернедсния, вытекающие из формулиру- емых аксиом. Это поможет нам выяснить основные принципы логи- ческого развертывания геометрии и обосновать возможность устано- вления взаимно однозначного соответствия между множеством всех точек прямой и множеством всех вещественных чисел, т.е. обосновать метод координат. 1То есть 'Правей”. 2Во всем остальном как природа самих объектов, так и способ задания соотно- шений между этими объектами являются произвольными.
§1. Аксиомы элементарной геометрии 371 1. Аксиомы принадлежности. I, 1. Каковы бы ни были две точки А и В, существует прямая а, которой принадлежат обе эти точки. I, 2. Каковы бы ни были две различные точки А и В, существует не более одной прямой, которой принадлежат эти точки. I, 3. Каждой прямой а принадлежат по крайней мере две точки. Существуют по крайней мере три точки, не принадлежащие одной прямой. Указанные три аксиомы исчерпывают список аксиом принадлеж- ности планиметрии. Следующие пять аксиом вместе с указанными тремя аксиомами завершают список аксиом принадлежности стерео- метрии. I, 4. Каковы бы ни были три точки А, В иС, не принадлежащие одной прямой, существует плоскость а, которой принадлежат эти три точки. Каждой плоскости принадлежит хотя бы одна точка. I, 5. Каковы бы ни были три точки А, В и С, не принадлежа- щие одной прямой, существует не более одной плоскости, которой принадлежат эти точки. I, 6. Если две принадлежащие прямой а различные точки А и В принадлежат некоторой плоскости а., то каждая принадлежащая прямой а точка принадлежит указанной плоскости. I, 7. Если существует одна точка А, принадлежащая двум плос- костям а и /3, то существует по крайней мере еще одна точка В, принадлежащая этим плоскостям. I, 8. Существуют по крайней мере четыре точки, не принадле- жащие одной плоскости. С целью использования привычной для нас геометрической тер- минологии договоримся отождествлять между собой следующие вы- ражения: 1) “точка А принадлежит прямой а (плоскости а)”; 2) “прямая а (плоскость а) проходит через точку А”, 3) “точка А лежит на прямой а (на плоскости а)”; 4) “точка А является точкой прямой а (плоскости а)” и т.п. С помощью указанных аксиом уже могут быть доказаны некото- рые теоремы. Так, из аксиомы 1,2 непосредственно вытекает следую- щее утверждение. Теорема 1. Две различные прямые не могут иметь больше одной общей точки. Предоставляем читателю доказательство следующих утверждений, вытекающих из аксиом 1,1-8. Теорема 2. Две плоскости либо не имеют общих точек, либо имеют общую прямую, на которой лежат все их общие точки. Теорема 3. Плоскость и не лежащая на ней прямая не могут иметь больше одной общей точки.
372 Приложение. Проблемы оснований геометрии Теорема 4. Через прямую и не лежащую на ней точку или через две различные прямые с общей точкой проходит одна и только одна плоскость. Теорема 5. Каждая плоскость содержит по крайней мере три точки. 2. Аксиомы порядка. II, 1. Если точка В прямой а лежит между точками А и С той же прямой, то А, В и С - различные точки указанной прямой, причем В лежит также и между С и А. II, 2. Каковы бы ни были две различные точки А и С, на опре- деляемой ими прямой существует по крайней мере одна точка В такая, что С лежит между А и В. П, 3. Среди любых трех различных точек одной прямой суще- ствует не более одной точки, лежащей между двумя другими. Сформулированные три аксиомы относятся к расположению гео- метрических объектов на прямой и поэтому называются линейными аксиомами порядка. Формулируемая ниже последняя аксиома поряд- ка относится к расположению геометрических объектов на плоскости. Для того чтобы сформулировать эту аксиому, введем понятие отрезка. Пару различных точек А и В назовем отрезком и будем обозна- чать символом АВ или В А. Точки А и В будем называть концами отрезка АВ. Точки прямой, определяемой А и В, лежащие между А и В, будем называть внутренними точками или просто точка- ми отрезка АВ. Остальные точки указанной прямой будем называть внешними точками отрезка АВ. II, 4 (аксиома Паша). Если А, В и С - три точки, не лежащие на одной прямой, и а - некоторая прямая в плоскости, определяемой этими точками, не содержащая ни одной из указанных точек и про- ходящая через некоторую точку отрезка АВ, то эта прямая про- ходит также либо через некоторую точку отрезка АС, либо через некоторую точку отрезка ВС. Подчеркнем, что из одних аксиом порядка II, 1-4 еще не вытекает, что любой отрезок имеет внутренние точки. Однако, привлекая еще аксиомы принадлежности I, 1-3, можно доказать следующее утвер- ждение. Теорема 6. Каковы бы ни были две различные точки А и В, на прямой, ими определяемой, существует по крайней мере одна точка С, лежащая между А и В. Предлагаем читателю, опираясь на аксиомы 1,1-8 принадлежно- сти и аксиомы II, 1-4 порядка, последовательно доказать следующие утверждения. Теорема 7. Среди любых трех различных точек одной пря- мой всегда существует одна точка, лежащая между двумя дру- гими.
§1. Аксиомы элементарной геометрии 373 Теорема 8. Если точки А, В и С не принадлежат одной прямой и если некоторая прямая а пересекает1 какие-либо два из отрезков АВ, ВС и АС, то эта прямая не пересекает, третий из указанных отрезков. Теорема 9. Если точка В лежит на отрезке АС, а точка С - на отрезке BD, то точки В и С лежат на отрезке AD. Теорема 10. Если точка С лежит на отрезке AD, а точка В - на отрезке АС, то В лежит также на отрезке AD, а С - на отрезке BD. Теорема 11. Между любыми двумя различными точками прямой существует бесконечно много других ее точек. Теорема 12. Пусть каждая из точек С и D лежит между точками А и В. Тогда если М лежит между С и D, то М лежит и между А и В. Теорема 13. Если точки С и D лежат между точками А и В, то все точки отрезка CD принадлежат, отрезку АВ (в этом случае мы будем говорить, что отрезок CD лежит внутри отрезка АВ). Т е о р е м а 14. Если точка С лежит между точками А и В, то: 1) никакая точка отрезка АС не может быть точкой отрезка СВ, 2) каждая отличная от С точка отрезка АВ принадлежит либо отрезку АС, либо отрезку СВ. Указанные утверждения позволяют упорядочить множество точек любой прямой и выбрать на этой прямой направление. Будем говорить, что две различные точки А и В прямой а лежат по разные стороны (по одну сторону) от третьей точки О той же прямой, если точка О лежит (не лежит) между А и В. Из указанных выше утверждений вытекает следующая теорема. Теорема 15. Произвольная точка О каждой прямой а раз- бивает. все остальные точки этой прямой на два непустых класса так, что любые две точки прямой а, принадлежащие одному и то- му же классу, лежит по одну сторону от О, а любые две точки, принадлежащие разным классам, лежат по разные стороны от О. Таким образом, задание на любой прямой двух различных точек О и Е определяет на этой прямой лучили полупрямую ОЕ, обладающую тем свойством, что любая ее точка и точка Е лежат по одну сторону от О. Выбрав на прямой а две различные точки О и Е, мы можем теперь определить порядок следования точек на прямой по следующему пра- вилу: 1) если А и В - любые точки луча ОЕ, то будем говорить, что А предшествует В, если А лежит между О и В; 2) будем говорить, что точка О предшествует любой точке луча ОЕ; 3) будем говорить, что любая точка прямой, не принадлежащая лучу ОЕ, предшествует как точке О, так и любой точке, принадлежащей лучу ОЕ; 4) если А 1 Под термином “прямая пересекает отрезок” мы подразумеваем, что указанная прямая содержит некоторую внутреннюю точку этого отрезка.
374 Приложение. Проблемы оснований геометрии и В - любые точки прямой, не принадлежащие лучу ОЕ, то мы будем говорить, что А предшествует В, если В лежит между А и О. Легко проверить, что для выбранного порядка следования точек прямой а справедливо свойство транзитивности: если А пред- шествует В, а В предшествует С, то А предшествует С. Аксиомы, приведенные выше, позволяют упорядочить и точки, принадлежащие произвольной плоскости о. Предлагаем читателю до- казать следующее утверждение. Теорема 16. Каждая прямая а, принадлежащая плоско- сти а, разделяет не лежащие на ней точки этой плоскости на два непустых класса так, что любые две точки А и В из разных клас- сов определяют отрезок АВ, содержащий точку прямой а, а любые две точки А и А' из одного класса определяют отрезок АА', внутри которого не лежит ни одна точка прямой а. В соответствии с утверждением этой теоремы мы будем говорить, что точки А и А' (одного класса) лежат в плоскости а по одну сто- рону от прямой а, а точки А и В (разных классов) лежат в плоско- сти а по разные стороны от прямой а. 3. Аксиомы конгруэнтности. Ill, 1. Если А и В - две точки на прямой а, А' - точка на той же прямой или на другой прямой а', то по данную от точки А' сто- рону прямой а' найдется, и притом только одна, точка В' такая, что отрезок А'В1 конгруэнтен отрезку АВ. Каждый отрезок АВ конгруэнтен отрезку1 В А. III, 2. Если отрезки А'В' и А"В" конгруэнтны одному и тому же отрезку АВ, то они конгруэнтны и между собой. Ш, 3. Пусть АВ и ВС - два отрезка прямой а, не имеющие общих внутренних точек, А'В' и В'С - два отрезка той же пря- мой или другой прямой а', также не имеющие общих внутренних точек. Тогда если отрезок АВ конгруэнтен отрезку А'В', а отрезок ВС конгруэнтен отрезку В'С', то отрезок АС конгруэнтен отрезку А! С. Сформулированные три аксиомы относятся к конгруэнтности от- резков. Для формулировки двух следующих аксиом нам понадобится понятие угла и его внутренних точек. Пара полупрямых h и к, выходящих из одной и той же точки О и не лежащих на одной прямой, называется углом и обозначается символом Z.(h,k) или Z(fc, h). Если полупрямые h и к задаются двумя своими точками О А и ОВ, то мы будем обозначать угол символом Z.AOB или ZBOA. гИз этой аксиомы вытекает возможность перемещения отрезка АВ вдоль пря- мой, на которой он лежит (с сохранением его длины и направления). Будем го- ворить, что направленный отрезок CD получен в результате перемещения на- правленного отрезка АВ, если отрезок CD конгруэнтен отрезку ЛВ и если либо отрезок AD лежит внутри отрезка ВС, либо отрезок ВС лежит внутри отрез- ка AD
§1. Аксиомы элементарной геометрии 375 В силу теоремы 4 любые два луча би к, составляющие угол Z(/i, к), определяют, и притом единственную, плоскость а. Внутренними точкамиутла /(h, к) будем называть те точки плос- кости а, которые, во-первых, лежат по ту же сторону от прямой, со- держащей луч h, что и любая точка луча к, и, во-вторых, лежат по ту же сторону от прямой, содержащей луч к, что и любая точка луча h. Ill, 4. Пусть даны угол /(h, к) на плоскости а, прямая а! на этой же или на какой-либо другой плоскости а' и задана определен- ная сторона плоскости а1 относительно прямой а'. Пусть h! - луч. прямой а', исходящий из некоторой точки О'. Тогда на плоскости а! существует один и только один луч к' такой, что /(h, к) конгруэн- тен /(h',k'), и при этом все внутренние точки /(h',k‘) лежат по заданную сторону от прямой а'. Каждый угол конгруэнтен самому себе. III, 5. Пусть А, В и С - три точки, не лежащие на одной пря- мой, А', В' и С - другие три точки, также не лежащие на одной прямой. Тогда если отрезок АВ конгруэнтен отрезку А'В', отрезок АС конгруэнтен отрезку А'С и /.ВАС конгруэнтен /В'А'С, то /.АВС конгруэнтен /А' В'С и /АСВ конгруэнтен /А'С'В'. Договоримся теперь о сравнении неконгруэнтных отрезков и углов. Будем говорить, что отрезок АВ больше отрезка А'В', если на пря- мой, определяемой точками А и В, найдется лежащая между этими точками точка С такая, что отрезок АС конгруэнтен отрезку А'В'. Будем говорить, что отрезок АВ меньше отрезка А'В1, если отрезок А1 В' больше отрезка АВ. Тот факт, что отрезок АВ меньше отрезка А'В' (конгруэнтен от- резку А'В'), символически будем записывать так: АВ < А'В' (АВ = А'В'). Будем говорить, что /АОВ больше /А'О'В', если в плоскости, определяемой /АОВ, найдется луч ОС, все точки которого явля- ются внутренними точками /АОВ, такой, что /АОС конгруэнтен /А'О'В'. Будем говорить, что /АОВ меньше/А'О'В', если /А'О'В' больше /АОВ. С помощью аксиом принадлежности, порядка и конгруэнтности можно доказать целый ряд классических теорем элементарной геоме- трии. Сюда относятся: 1) три широко известные теоремы о конгруэнт- ности (равенстве) двух треугольников; 2) теорема о конгруэнтности вертикальных углов; 3) теорема о конгруэнтности всех прямых углов; 4) теорема о единственности перпендикуляра, опущенного из точки на прямую; 5) теорема о единственности перпендикуляра, восставленно- го из данной точки прямой; 6) теорема о внешнем угле треугольника; 7) теорема о сравнении перпендикуляра и наклонной. Предлагаем читателю самому последовательно доказать только что перечисленные теоремы.
376 Приложение. Проблемы оснований геометрии 4. Аксиомы непрерывности. С помощью аксиом принадлеж- ности, порядка и конгруэнтности мы произвели сравнение отрезков, позволяющее заключить, каким из трех знаков <,= или > связаны данные два отрезка. Указанных аксиом, однако, недостаточно: 1) для обоснования воз- можности измерения отрезков, позволяющего поставить в соответ- ствие каждому отрезку определенное вещественное число; 2) для обоснования того, что указанное соответствие является взаимно од- нозначным. Для проведения такого обоснования следует присоединить к акси- омам I, П, III две аксиомы непрерывности. IV, 1 (аксиома Архимеда). Пусть АВ u CD - произвольные отрезки. Тогда на прямой, определяемой точками А и В, существу- ет конечное число точек Л1,А2, • • ,Ап, расположенных так, что точка Ai лежит между А и Л2, точка Л2 лежит между Ai и Лз,..., точка An_i лежит между Лп_2 и Ап, причем отрезки AAi, А1421 • , Ai-Mn конгруэнтны отрезкуСИ иточкаВ лежитмеж- ду А и Ап. IV, 2 (аксиома линейной полноты). Совокупность всех то- чек произвольной прямой а нельзя пополнить новыми объектами (точками) так, чтобы: 1) на пополненной прямой были определены соотношения “лежит между” и “конгруэнтен”, определен порядок следования точек и справедливы аксиомы конгруэнтности III, 1-3 и аксиома Архимеда IV, 1; 2) по отношению к прежним точкам прямой определенные на пополненной прямой соотношения “лежит между" и “конгруэнтен” сохраняли старый смысл. Мы сейчас докажем, что присоединение к аксиомам I, 1-3, II и III, 1-3 аксиомы Архимеда IV, 1 позволяет поставить в соответствие каждой точке произвольной прямой а определенное вещественное чи- сло х, называемое координатой этой точки, а присоединение еще и аксиомы линейной полноты IV, 2 позволяет утверждать, что коорди- наты всех точек прямой а исчерпывают множество всех вещественных чисел. 5. Обоснование метода координат. Прервем на время изложе- ние аксиом геометрии, чтобы на основании уже изложенных аксиом дать обоснование метода координат на прямой. Сначала докажем следующее утверждение. Первая основная теорема. Аксиомы I, 1-3, II, Ш, 1-3 и аксио- ма IV, 1 Архимеда позволяют ввести на любой прямой а координаты так, что выполнены следующие требования: 1°. Каждой точке М прямой а соответствует определенное ве- щественное число х, называемое ее координатой. 2°. Разным точкам соответствуют разные координаты, причем точка М2 лежит между Mi и М3 тогда и только тогда, когда либо Xi < Х2 < Х3, либо х\ > Х2 > Хз (здесь Xi, х2 и тз - координаты точек Mi, М2 и М3 соответственно).
§1. Аксиомы элементарной геометрии 377 3°. Отрезки М\М2 и М[М2 конгруэнтны тогда и только тогда, когда Х2 — Xi = х2 — xj (здесь xi,X2, х^ и х2 - координаты точек Mi, М2, М{ и М2 соответственно). 4°. Если вещественные числа xi и х2 представляют собой коор- динаты некоторых точек, то и вещественное число xi ± Xj пред- ставляет собой координату некоторой точки. Доказательство. Выберем на прямой а произвольную точ- ку О в качестве начала координат и произвольную отличную от О точку Е в качестве точки с координатой единица. Пусть М - произ- вольная точка прямой а. Для определенности предположим, что М лежит с той же стороны от О, что и Е (аксиомы I, 1-3, II и Ш, 1-3 обеспечивают возможность установления порядка следования точек на прямой а. Каковы бы ни были целое положительное число п и це- лое неотрицательное число т, мы можем, откладывая отрезок ОМ в одном и том же направлении последовательно п раз, построить от- резок п ОМ и аналогично построить отрезок т ОЕ (возможность откладывать конгруэнтный отрезок в любом направлении и строить сумму конгруэнтных отрезков, не имеющих общих внутренних точек, вытекает из аксиом I, 1-3, II и Ш, 1-3). В силу только что упомянутых аксиом любые два отрезка мы мо- жем сравнивать. Следовательно, и отрезки п ОМ и т • ОЕ при раз- личных пит будут связаны либо знаком <, либо знаком >. Рассмотрим все возможные рациональные числа т[п. Их можно разбить на два класса, относя к верхнему классу те из них, для кото- рых п ОМ < т • ОЕ, (П.1) и к нижнему классу те, для которых п • ОМ > т ОЕ. (П.2) Убедимся в том, что эти два класса однозначно определяют веще- ственное число х, которое мы и поставим в соответствие точке М и назовем ее координатой. Сначала убедимся в том, что любое рациональное число из верх- него класса больше любого рационального числа из нижнего класса. Приведя любые два рациональных числа из разных классов к обще- му знаменателю и обозначая последний через п, мы из (П.1) и (П.2) получим, что числитель числа из верхнего класса больше числителя числа из нижнего класса. Отсюда и вытекает, что число из верхнего класса больше числа из нижнего класса. Далее заметим, что оба класса не являются пустыми: нижнему классу заведомо принадлежит рациональное число нуль, а для уста- новления непустоты верхнего класса достаточно положить п — 1 и заметить, что аксиома Архимеда IV, 1 гарантирует существование та- кого натурального числа т, что при п = 1 справедливо неравенство (П.1).
378 Приложение. Проблемы оснований геометрии В силу теоремы о точных гранях непустого ограниченного сверху (снизу) множества1 2 существует точная верхняя грань х рациональ- ных чисел нижнего класса и точная нижняя грань х рациональных чисел верхнего класса. Убедимся в том, что эти грани х и х заключены между как угод- но близкими рациональными числами и поэтому совпадают. Доста- точно доказать, что существуют, как угодно близкие числа разных классов, а это вытекает из того, что для как угодно большого номера п найдется номер т такой, что рациональное число (т + 1)/п при- надлежит верхнему классу, а рациональное число т/п принадлежит 2 нижнему классу . Положим теперь х — х = х и поставим вещественное число х в со- ответствие точке М, назвав его координатой этой точки. Требование 1° обосновано. Пусть теперь М\ и М2 - какие угодно две точки, лежащие по ту же сторону от О, что и Е, и такие, что Mi лежит между О и М2, т.е. ОМ2 > О Mi. Докажем, что если х\ и х2 - координаты точек Mi и М2 соответственно, то х2 > ^i- Выберем номер п настолько большим, чтобы разность отрезков ОМ2 и OMi, повторенная п раз, превзошла отрезок ОЕ (это можно сделать в силу все той же аксиомы Архимеда IV, 1). Тогда, обозначая через т наибольшее целое число, для которого п - OMi > т ОЕ, мы получим, что п • OMi < (m + 1) ОЕ, (П.З) и в силу сделанного выше выбора номера п п ОМ2 > (тп + 1) • ОЕ. (П.4) Из (П.З) заключаем, что рациональное число (т + 1)/п относится к верхнему классу по отношению к точке Mi, т.е. (m + l)/n > ц, а из (П.4) заключаем, что то же самое рациональное число (тп + 1)/п относится к нижнему классу по отношению к точке М2. и поэтому Х2 > (тп + 1)/п. Тем самым неравенство т2 > xi доказано. Если теперь мы имеем на прямой а какое угодно число то- чек, идущих в порядке О, Mi, М2, • • , Мп (в сторону3/?), то из толь- ко что доказанного утверждения для координат этих точек получим О < Xi < Х2 < • - - < хп- Тем самым для случая расположения точек по ту же сторону от О, что и Е, требование 2° доказано. Для точек М, лежащих на пря- мой а по другую сторону от О, аналогично вводятся отрицательные 'См. например, основную теорему 2.1 из [11], ч.1. 2Тот факт, что для любого номера п найдется указанный номер т (такой, что справедливо (П.1)), снова вытекает из аксиомы Архимеда IV, 1. 3В дальнейшем эта сторона именуется положительной.
§1. Аксиомы элементарной геометрии 379 координаты и повторением тех же рассуждений мы устанавливаем требования 1° и 2° в общем виде. Для установления требований 3° и 4° мы сначала докажем, что если на прямой а в положительную сторону от О взяты точки Mi, М-2 и М, причем Mi лежит между О и М и отрезки М^М и ОМ2 конгруэнтны, то х — Xi + х2 (здесь х, Xi и х2 - координаты точек М, Му и М2 соответственно). Возьмем из нижних классов, отвечающих координатам Xi и х2, два произвольных рациональных числа, обозначив их (после приведения к общему знаменателю п) соответственно через mi/n и т2/п. Тогда п OMi > mi ОЕ, п ОМ2 > т2 ОЕ. Складывая последние два неравенства, получим п ОМ > (mi + т2) ОЕ. (П.5) Точнее говоря, в левой части (П.5) мы получим сумму п раз отло- женного отрезка OMi и п раз отложенного отрезка ОМ2, но после перегруппировки слагаемых мы и получим п раз повторенную сумму отрезков О Mi и ОМ2, т.е.1 п ОМ. Из неравенства (П.5) заключаем, что рациональное число 4- принадлежит нижнему классу, отвечающему координате х. Аналогично, взяв любые рациональные числа mi/n и т2/п из верхних классов, отвечающих координатам 24 и х2, мы убедимся в том, что рациональное число принадлежит верхнему классу, отвечающему координате х. Но тогда из определения суммы вещественных чисел и из того, что рациональные числа как из верхнего, так и из нижнего классов как угодно точно приближают соответствующую координату, мы по- лучим, что вещественное число х равно сумме х1 + х2. Тем самым нами доказано, что отложить от точки Mi с ко- ординатой Xi (а положительную сторону) отрезок ОМ2 - это все равно, что построить точку М с координатой х, удовлетворяющей условию х = Xi + х2, где х2 > 0 - координата точки М2. Это утверждение мы доказали для случая Xi > 0, но легко рас- пространить его и на общий случай (предоставляем это читателю). Из доказанного утверждения сразу же вытекает требование 4°, а для до- казательства утверждения 3° достаточно заметить, что откладывание данного отрезка равносильно добавлению к координате точки посто- янного слагаемого. Первая основная теорема полностью доказана2. 'То, что в геометрической сумме отрезков мы можем, не меняя суммы, пере- ставлять слагаемые, вытекает из следующих соображений. Достаточно убедиться в возможности перестановки для двух слагаемых, а это непосредственно вытекает из аксиомы III, 3, в формулировке которой ничего не сказано о порядке, в кото- ром “приставляются" друг к другу слагаемые отрезки А'В' и В'С. При любом их порядке сумма А'С конгруэнтна отрезку АС. 2Подчеркнем, что при доказательстве первой основной теоремы аксиомы I, 1-3 и II использовались лишь для установления порядка следования точек на пря- мой.
380 Приложение. Проблемы оснований геометрии Замечание. Особо подчеркнем, что в первой основной теореме не утверждается, что каждому вещественному числу х соответству- ет определенная точка на прямой (т.е. не утверждается, что соот- ветствие между точками прямой и вещественными числами является взаимно однозначным). Мы сейчас увидим, что это невозможно доказать, опираясь только на аксиомы I, 1-3, II, III, 1-2 и IV, 1 и не привлекая аксиому линейной полноты IV, 2. Вторая основная теорема. Пусть справедливы аксиома I, 1-3, II, III, 1-3, IV, 1 и на прямой а введены координаты. Тогда, для того чтобы каждому вещественному числу х отвечала некоторая точка прямой а, т.е. для того чтобы между всеми точками прямой а и всеми вещественными числами существовало взаимно однозначное соответствие, необходимо и достаточно, чтобы была справедлива аксиома линейной полноты IV, 2. Доказательство. Достаточность. Докажем, что если су- ществуют вещественные числа х, которым не отвечает никакая точка прямой а, то аксиома IV, 2 заведомо несправедлива. Пусть существуют указанные вещественные числа х. Каждое из них мы назовем новой точкой и присоединим все новые точки к со- вокупности прежних точек прямой а. На пополненной прямой (назовем ее а) уже каждому веществен- ному числу отвечает точка, и обратно. Определим на а соотношения “лежит между” и “конгруэнтен”. Бу- дем говорить, что точка М2 прямой а лежит между Mi и М3, если либо 11 < Х2 < Дз, либо Xi > Х2 > Х3, Где ПОД Х1, Х2 и Х3 нужно понимать координату соответствующей точки Mi, М2 и М3, если эта точка прежняя, и саму эту точку, если она новая. Очевидно, что в применении к прежним точкам определенное на а соотношение “ле- жит между” сохраняет старый смысл. Будем говорить, что отрезок М\Мз прямой а конгруэнтен отрезку той же прямой М{М~, если хз — Xi = х'2 — xi, где под x\,X3,x'i и х'2 нужно понимать координату соответствующей точки М1,Мз,М{ и М'2, если эта точка прежняя, и саму эту точку, если она новая. Снова очевидно, что в применении к прежним точкам определенное на а соотношение “конгруэнтен" сохраняет старый смысл. Очевидно также, что для точек пополненной прямой а определен порядок следования и справедливы аксиомы конгруэнтности III, 1-3 и аксиома Архимеда IV, 1. Тем самым мы установили возможность пополнения прямой, проти- воречащую аксиоме линейной полноты IV, 2. Достаточность доказана. Необходимость. Докажем, что если аксиома линейной пол- ноты IV, 2 не имеет места, то координаты всех точек прямой а не исчерпывают всех вещественных чисел.
§1. Аксиомы элементарной геометрии 381 Если аксиома IV, 2 не имеет места, то существует пополненная новыми точками прямая а, для всех точек которой определены соот- ношения “лежит между” и “конгруэнтен”, определен порядок следова- ния и справедливы аксиомы конгруэнтности III, 1-3 и аксиома Архи- меда IV, 1. В силу первой основной теоремы на пополненной прямой а можно ввести координаты (в этой теореме аксиомы I, 1-3 и II исполь- зовались лишь в форме возможности установления на данной прямой порядка следования точек). Мы получили, что каждой точке пополненной прямой а отвечает определенное вещественное число, причем разным точкам отвечают различные вещественные числа. Но отсюда следует, что те веществен- ные числа, которые отвечают точкам, производящим пополнение, не будут соответствовать ни одной точке исходной прямой а. Необходи- мость доказана. 6. Аксиома параллельности. Самая последняя аксиома играет в геометрии фундаментальную роль, определяя разделение геометрии на две логически непротиворечивые и взаимно исключающие друг друга системы: евклидову и неевклидову геометрии. В геометрии Евклида эта аксиома формулируется так: V. Пусть а — произвольная прямая и А — точка, лежащая вне прямой а, тогда в плоскости а, определяемой точкой А и прямой а, существует не более одной прямой, проходящей через А и не пере- секающей А. Долгое время геометры выясняли вопрос о том, не является ли аксиома параллельности V следствием всех остальных аксиом I, II, III, IV. Этот вопрос был решен Н.И. Лобачевским1, который доказал, что аксиома V не является следствием аксиом I-IV. По-другому результат Лобачевского можно сформулировать так: если к аксиомам I—IV присоединить утверждение, отрицающее спра- ведливость аксиомы V, то следствия всех этих положений будут составлять логически непротиворечивую систему (неевклидову гео- метрию Лобачевского). Схема доказательства непротиворечивости геометрии Лобачевско- го излагается в §3 настоящего Приложения. Здесь же мы отметим, что систему следствий, вытекающих из од- них только аксиом I—IV, обычно называют абсолютной геометрией. Абсолютная геометрия является общей частью как евклидовой, так и неевклидовой геометрий, ибо все предложения, которые могут быть доказаны только с помощью аксиом I—IV, верны как в геометрии Ев- клида, так и в геометрии Лобачевского (примеры таких предложений читатель найдет в предыдущих пунктах). 'Николай Иванович Лобачевский - великий русский математик (1793-1856).
382 Приложение. Проблемы оснований геометрии § 2. Схема доказательства непротиворечивости геометрии Евклида Наметим схему доказательства непротиворечивости всех пяти групп аксиом геометрии Евклида. Для простоты ограничимся доказательством непротиворечи- вости планиметрии Евклида, т.е. установим непротиворечи- вость системы аксиом I, 1-3, II-V. Для доказательства достаточно построить какую-нибудь конкрет- ную реализацию совокупности объектов, удовлетворяющих всем ука- занным аксиомам. Мы построим так называемую декартову или арифметическую реализацию совокупности объектов, удовлетворяющих аксиомам пла- ниметрии. Тем самым вопрос о непротиворечивости планиметрии Ев- клида будет сведен к вопросу о непротиворечивости арифметики. Назовем точкой любую упорядоченную пару вещественных чисел (т, у), а прямой - отношение трех вещественных чисел1 (u : v : w) при условии, что и2 4- и2 0. Будем говорить, что точка (2, у) принадлежит прямой (и: v : w), если справедливо равенство их + vy + w = 0. (П.6) Докажем справедливость аксиом I, 1-3. Каковы бы ни были две различные точки (xi,j/i) и (х2,У2)> пря- мая2 ((j/i — у?) : (тг — 21) ' (Х1У2 — Х2У1)), как легко убедиться, содер- жит эти точки (аксиома I, 1). Далее из уравнений их\ 4- vyi 4- w = 0, ui2 + УУ2 4- ы = 0 вытекает, что и : и : w = (yi —1/2) - (22 — 2j) : (Х1У2 — 22yi), так что точками (ti, yi) и (22, уг) определяется только одна прямая (и : и : w) (аксиома I, 2). Наконец, справедливость аксиомы I, 3 вытекает из того, что урав- нение (П.6) с двумя неизвестными х и у всегда имеет бесчисленное множество решений и не всякая пара х и у есть решение уравне- ния (П.6). Теперь определим соотношение “лежит между”. Так как и2 4-и2 0, то либо и / 0, либо v 0. Если v 0, то будем говорить, что точка (22, уг) лежит между (xi,yi) и (23,уз), если либо 2i < 22 < Х3, либо Xi > 22 > 23. Если же v — 0 (при этом заведомо и 0), то будем говорить, что точка 'Отношением (u . v : и1) называется совокупность трех вещественных чисел •и, в, w при условии, что при любом А / 0 совокупности u, к, w и Au, Av, Au; рассматриваются как тождественные. 2Так как точки (zi.yi) и (хг.Уг) различны, то (ii — Х2)1 + (ш — yz)2 / 0.
§ 2. Схема доказательства непротиворечивости 383 (12,3/2) лежит между (х-[,у\) и (тз,уз), если либо yi < у2 < уз, либо У1 > У2 > Уз- Справедливость аксиом II, 1-3 проверяется тривиально. Несколько кропотливую проверку аксиомы Паша II, 4 мы опустим. Обратимся теперь к определению соотношения “конгруэнтен”. С этой целью рассмотрим так называемое ортогональное преобразо- вание. Преобразование х' = atx + byy + ci, у'= а2х + Ь2у + с2, (П.7) переводящее произвольную точку (х, у) в определенную точку (д', у'), называется ортогональным, если выполнены соотношения + bj — 1, dj "Ь ^2 = ®i^2 + bib2 — 0. (П.8) Легко доказать, что всякое ортогональное преобразование (П.7), (П.8) можно представить в одной из следующих форм: либо в виде х' = ах — (Зу + Cj, у' = (Зх + ау + с2, (П.9) либо в виде х' = ах + (Зу + Ci, у' — (Зх — ау 4- с2, (П.10) причем в обоих случаях а2 4- (З2, — 1. Преобразования (П.9) и (П. 10) обычно называют ортогональными преобразованиями соответственно первого и второго рода. Пусть даны произвольная прямая (u : v : w) и на ней некоторая точка (zq,уо), так что uxq + ууо 4- w = 0. Легко убедиться в том, что совокупность точек (х,у), где x = xo+vt, у = уо — ut, (П.П) принадлежит прямой (и : v : w) для любого вещественного числа t. Далее ясно, что при t > 0 все указанные точки (т, у) лежат по одну сторону от точки (xq, уо), а при t < 0 эти точки лежат по др^тую сторону от (то, Уо)- Иными словами, уравнения (П. 11) при всевозможных положи- тельных t определяют все точки полупрямой, исходящей из точки (хо,уо) и лежащей на прямой (и : v : w). Эту полупрямую мы будем обозначать символом (то,Уо, у, —и). Оказывается, всякое ортогональное преобразование (как перво- го, так и второго рода) переводит любую полупрямую снова в по- лупрямую. Более точно, справедливо следующее утверждение: орто- гональное преобразование (П.9) или (П.10) переводит полупрямую (т0, Уо, V, — и) в полупрямую (ig, уд, у', — и'), где для случая преобра- зования (П.9) Xq = ах0 - (Зу0 -Ь сх, у'о = (Зх0 4- ау0 + с2, v1 = av 4- 0и, и1 = —(Зу — аи,
384 Приложение. Проблемы оснований геометрии и для случая преобразования (П.10) х'о = ахо + (Зуо + Ci, у'0 = 0хо - ауо + с21 и' = av — 0и, и' — —0v — аи. Теперь назовем отрезок АВ конгруэнтным отрезку А1 В1, если су- ществует ортогональное преобразование, которое переводит точку А в точку А', а точку В в точку В'. Угол Z(/i, fc) назовем конгруэнт- ным углу Z(/i',fc'), если существует ортогональное преобразование, переводящее полупрямую h в полупрямую hf и полупрямую к в полу- прямую к'. Далее нужно перейти к проверке аксиом III, 1-5. Аксиома III, 2 вы- текает из групповых свойств ортогонального преобразования, в силу которых как последовательное проведение двух ортогональных пре- образований, так и преобразование, обратное к ортогональному, снова являются ортогональными преобразованиями. Проверка остальных аксиом группы III требует кропотливой техники и использования ука- занного выше утверждения, и мы ее опустим. Что же касается аксиом непрерывности, то аксиома Архимеда IV, 1 проверяется непосредственно, а справедливость аксиомы полноты IV, 2 вытекает из того, что между всеми точками любой прямой и всеми вещественными числами можно установить взаимно однозначное со- ответствие (см. вторую основную теорему из п. 5 §1). Нам остается еще проверить справедливость аксиомы параллель- ности V. Пусть (и : д : ш) - произвольная прямая и (tq, уо) - точка вне ее, так что uxq + иуо + ш / 0. Пусть (д' : и' : ш') - прямая, проходящая через точку (хо,Уо), не- удовлетворяющая условию u'z0 -I- v'yo + w' = 0. (П.12) Поскольку эта прямая не пересекает прямую (u : и : ги), должна быть несовместна система уравнений и'х + v'y + w' = 0, их 4- vy + w — 0. (ПЛЗ) Из несовместности системы (ПЛЗ) заключаем, что и' : и — и' : и, или, что то же самое, и' = Хи, и' = Хи, где А - некоторое число. Но тогда из (П.12) получим w' = —X{uxo+vyo}, т.е. и' : и' : ш' — и : и : — (их0+иу0). Итак, отношения и' : и1 : ш' однозначно определены, т.е. существует единственная прямая (д' : д' : ш'), проходящая через (то>Уо) и не пересекающая прямую (д : и : ш). Тем самым доказательство непротиворечивости планиметрии Ев- клида завершено. Замечание. Аналогично доказывается непротиворечи- вость стереометрии Евклида. Для этого мы называем
§ 3. Схема доказательства непротиворечивости 385 точкой любую упорядоченную тройку вещественных чисел (т, у, г); прямой - совокупность всех троек (т, у, z), элементы х,у, z которых связаны системой двух линейных уравнений; плоскостью - совокуп- ность всех троек (т, у, г), элементы х, у, z которых удовлетворяют од- ному линейному уравнению. § 3. Схема доказательства непротиворечивости геометрии Лобачевского Для простоты ограничимся доказательством непро- тиворечивости планиметрии Лобачевского, т.е. построим конкретную реализацию совокупности объектов, удо- влетворяющих аксиомам I, 1-3, I-IV и аксиоме, отрицающей справед- ливость аксиомы V. Для построения указанной реализации мы будем опираться на уже установленную нами непротиворечивость планиме- трии Евклида, т.е. сведем вопрос о непротиворечивости планиметрии Лобачевского к вопросу о непротиворечивости планиметрии Евклида. Излагаемая в этом параграфе модель принадлежит А. Пуанкаре1. Рассмотрим на евклидовой плоскости горизонтальную прямую х и опирающуюся на нее верхнюю полуплоскость. Все точки этой верхней полуплоскости мы назовем неевклидовыми точками, а все лежащие в верхней полуплоскости полуокружности с центром на прямой х и все вертикальные полупрямые, исходящие из точек прямой х, назовем неевклидовыми прямыми (кстати, указанные полупрямые удобно рассматривать как полуокружности бесконечно большого радиуса). Между неевклидовыми точками и неевклидовыми прямыми опре- делим соотношения “принадлежит”, “лежит между” и “конгруэнтен” и убедимся в справедливости всех аксиом абсолютной геометрии (т.е. аксиом I, 1-3, II-IV). После этого мы покажем, что в построенной модели справедлива аксиома параллельности Ло- бачевского (т.е. отрицание аксиомы V Евклида). Мы будем говорить, что неевклидова точка А принадлежит не- евклидовой прямой а, если точка верхней полуплоскости А лежит на полуокружности а. Справедливость аксиом I, 1-3 устанавливается тривиально. Так, аксиомы I, 1 и I, 2 эквивалентны утверждению, что через две точ- ки верхней полуплоскости можно провести только одну окружность, имеющую центр на прямой х. Аксиома I, 3 эквивалентна утвержде- нию, что на любой полуокружности имеются по крайней мере две точки и имеется хотя бы одна точка вне этой полуокружности. Перейдем к установлению соотношения “лежит между”. Пусть А, В, С - три точки неевклидовой прямой, изображаемой полуокруж- ностью а. Будем говорить, что точка В (в неевклидовом смысле) 1Анри Пуанкаре - французский математик (1854-1912).
386 Приложение. Проблемы оснований геометрии лежит между А и С, если В на полуокружности а лежит между А и С (в евклидовом смысле). При таком определении соотношения “лежит между” легко устана- вливается справедливость аксиом II, 1-3. Впрочем, порядку следова- ния точек на неевклидовой прямой, изображаемой полуокружностью а, можно придать и более наглядный вид. Проведя из центра О полу- окружности а всевозможные лучи, мы с помощью этих лучей можем взаимно однозначно спроецировать все точки полуокружности а на все точки некоторой прямой у, параллельной х и лежащей выше по- луокружности а. Тогда порядок следования точек неевклидовой прямой а соответ- ствует порядку следования образов этих точек на прямой у. Попут- но докажем, что все точки любой неевклидовой прямой а находятся во взаимно однозначном соответствии с множеством всех веще- ственных чисел. Нам еще следует проверить аксиому II, 4 Паша, но доказатель- ство этой аксиомы является наглядно вполне очевидным, и мы его опустим. Теперь мы перейдем к определению соотношения “конгруэнтен”. В надлежащем его определении и состоит остроумие модели Пуанкаре. Не вдаваясь в детали, остановимся на основных идеях определения этого соотношения. Введем в рассмотрение специальное преобразование евклидовой плоскости, известное под названием инверсии. Пусть фиксирована произвольная окружность радиуса г с центром в точке А. Инверсией относительно указанной окружности называется такое преобразо- вание точек плоскости, при котором любая отличная от А точка плос- кости М переходит в точку М', лежащую на одном с точкой М луче, выходящем из А, и такую, что выполнено условие AM' AM = г2. Назовем неевклидов отрезок АВ конгруэнтным неевклидову от- резку А'В', если существует такая последовательность инверсий, что их произведение отображает евклидову круговую дугу АВ в круго- вую дугу А’В'. Неевклидовым углом будем называть совокупность двух неевкли- довых полупрямых, исходящих из одной точки. Назовем неевклидов угол Z(/i', к') конгруэнтным неевклидову углу Z(/i, к), если существует такая последовательность инверсий, что их произведение отображает стороны первого угла на стороны второго. После принятых определений проверка аксиом конгруэнтности Ш, 1-5 превращается в техническую работу, которую мы можем опу- стить. Проверка аксиомы Архимеда IV, 1 также не вызывает никаких трудностей и использует лишь свойства инверсий. Последняя аксиома абсолютной геометрии - аксиома полноты IV, 2 справедлива вследствие того, что (как это установлено выше) между всеми точками любой “неевклидовой прямой” и всеми вещественны-
§ 4. Заключительные замечания о проблемах аксиоматики 387 ми числами можно установить взаимно однозначное соответствие (см. вторую основную теорему из п. 5 §1). Итак, для рассматриваемой модели справедливы все аксиомы аб- солютной геометрии (I, 1-3, II—IV). Как же обстоит дело с аксиомой параллельности V? Возьмем лю- бую “неевклидову прямую”, изображаемую полуокружностью а, и лю- бую точку А, ей не принадлежащую. Легко проверить, что через точ- ку А проходит бесконечно много различных полуокружностей, имею- щих центры на прямой х и не имеющих общих точек с полуокружно- стью а. Это означает, что в рассматриваемой нами модели справедлива аксиома параллельности Лобачевского. Тем самым мы завершили доказательство непротиворечивости пла- ниметрии Лобачевского и одновременно показали, что аксиома па- раллельности V Евклида не является следствием аксиом I, 1-3, II-IV абсолютной геометрии. § 4. Заключительные замечания о проблемах аксиоматики При изучении любой системы аксиом естественно возникают сле- дующие три проблемы: 1) проблема непротиворечивости системы ак- сиом; 2) проблема минимальности системы аксиом (выясняющая во- прос о том, не является ли каждая из рассматриваемых аксиом след- ствием остальных); 3) проблема полноты системы аксиом (принято систему аксиом называть полной, если между элементами двух любых ее реализации можно установить взаимно однозначное соответствие, сохраняющее установленные между элементами соотношения). В §3 и 4 мы установили непротиворечивость системы аксиом как геометрии Евклида, так и геометрии Лобачевского. Проблема минимальности системы аксиом геометрии является очень трудоемкой и требует обстоятельного исследования. Приме- ром такого исследования является установленный нами факт, что аксиома параллельности V не является следствием остальных аксиом. Полнота системы аксиом геометрии устанавливается посредством введения для любой реализации координатной системы и последую- щего установления взаимно однозначного соответствия (с сохранени- ем всех соотношений) между точками, прямыми и плоскостями дан- ной реализации (в координатной записи) и декартовой реализации, изученной в §2.
Предметный указатель Аксиомы группы 135 - кольца 149 - линейного пространства 62, 207 - нормы 342 - расстояния 227 - скалярного произведения 224 - элементарной геометрии 54, 370 Алгебра над полем Р 250 - линейных операторов 250 Алгебраическая операция 50 - ассоциативная 50 - коммутативная 50 Алгебраическое дополнение 31 Аппроксимация оператора (матрицы) 363 Арифметическое пространство 62, 207 Ассоциативность обобщенная 51 Аффинное пространство 208 База системы векторов 210 Базис 76, 211 - естественный 212 - жорданов 275, 277 - канонический 275 - ортонормированный 86, 90, 229 ~ Шура 289 Базисные строки (столбцы) 71 Базисный минор 71 Безу теорема 170 Билинейная форма 308 — вырожденная 310 — от переменных 309 — полярная 310 — симметричная 308 Билинейной формы матрица 309 — ранг 310 Биортогональная пара базисов 287 Биортогональные системы векто- ров 287 Вариационные свойства сингулярных чисел 359 — собственных значений 358 Ведущий элемент 22 Вектор 57, 63 - единичный 21 - корневой 270 - направляющий 117, 118 - нормали 121 - присоединенный 270 - свободный 57 - собственный 256 Вектор-столбец 16 Вектор-строка 16 Вектора длина 55, 58, 226 - величина 57 - координаты 78, 83 - проекция 86, 87, 234 - разложение по подпространствам 216 Векторное произведение 92 Векторы коллинеарные 58 - компланарные 58, 207 - ортогональные 90, 228 Виета формулы 176 Вращений метод 197, 331 Высота корневого вектора 270 Гамильтона-Кали теорема 279 Гаусса метод 36 Гаусса-Жордана метод 39 Гипербола 184 Гиперболоид 333, 335, 336 Гиперболы асимптоты 186 - ветви 185 - директрисы 187 - каноническое уравнение 185 - полуоси 185 - фокальный параметр 192 - фокусы 184 - эксцентриситет 186 Гиперплоскость 82 Гиперповерхность второго порядка 325 Гомоморфизм групп 147 Грама-Шмидта процесс ортогонализа- ции 230 Группа 135 - абелева 135 - знакопеременная n-го порядка 141 - конечная 140 - невырожденных треугольных матриц 138 - ортогональных матриц 138 - симметрическая n-го порядка 141 - циклическая 142 Декартово произведение 43 Деление отрезка в данном отноше- нии 85 Делители нуля 150 Дополнение множества 43 Дополнительное подпространство 220 Дополнительный минор 31 Евклида алгоритм 169 Евклидово пространство 224 Единичные строки (столбцы) 21 Жордана метод 39 Жорданова клетка 265 - форма 277 Задача о перпендикуляре 234 Закон инерции 316 Закон композиции внутренний 50 — внешний 53 Изометрия 239 Изоморфизм групп 145 - евклидовых (унитарных) прост- ранств 239 - колец 152 - линейных пространств 213 - полей 152
Предметный указатель 389 Инвариантное подпространство 254 Инварианты гиперповерхности вто- рого порядка 327 - линий второго порядка 194 Инверсия 25 Индекс инерции квадратичной фор- мы 315 Индекс нильпотентности 266 Каноническая пара базисов 248 Квадратичная форма 310 — вырожденная 311 — знакоопределенная 316 — положительно определенная 316 — эрмитова 319 Квадратичной формы канонический вид 311 — закон инерции 316 — матрица 311 — приведение к главным осям 322 — ранг 311 — сигнатура 315 Класс вычетов 46 - смежный 139 - эквивалентности 44 Кольцо 148 - вычетов 150 - коммутативное 149 Комплексная плоскость 158 Комплексные числа 156 Комплексного числа алгебраическая форма 157 — аргумент 160 — модуль 160 — тригонометрическая форма 161 Конические сечения 337 Конус 328, 337 Координатный столбец 78 Координаты вектора 78, 83 - точки 84 — полярные 101 — сферические 103 — цилиндрические 102 Корень п-й степени из комплексного числа 162 - из оператора 301 Корень многочлена 170 — первообразный 164 Корневое подпространство 270 Корневой вектор 270 Коши-Буняковского неравенство 226 Крамера правило 106 Кратность корня многочлена 176 - собственного значения алгебраичес- кая 261 ---геометрическая 261 Кронекера-Капелли теорема 106 Кронекера символ 228 Куранта-Фишера теорема 359 Кэли теорема 146 Лагранжа метод 205, 313 - теорема 141 Лапласа теорема 31 Линейная зависимость 65 - комбинация 65 - оболочка 215 - форма 240, 248 Линейное подпространство 80 — инвариантное 254 — корневое 270 — собственное 261 Линейное пространство веществен- ное 62 — арифметическое 62, 207 — бесконечномерное 77 — геометрическое 62 — комплексное 207 — конечномерное 77 — над произвольным полем 207 Линейное многообразие 81 Линейного многообразия вектор сдви- га 81 — направляющее подпространство 81 — нормальный вектор 236 — размерность 82 Линейного оператора дефект 247 — жорданов базис 277 — матрица 242 — образ 246 — определитель 251 — разложение сингулярное 306 — разложение полярное 307 — разложение эрмитово 302 — ранг 247 — сингулярные числа 305 — след 258 — характеристический многочлен 257 — ядро 246 Линейный оператор 240 — вырожденный (невырожден- ный) 252 — дифференцирования 240 — индуцированный 256 — кососимметрический 301 — косоэрмитов 301 — неотрицательно определенный 298 — непрерывный 352 — нильпотентный 266 — нормальный 288 — обратный 251 — ограниченный 352 — ортогональный 292 — отражения 241 — положительно определенный 298 — проектирования 241 — простой структуры 261 — самосопряженный 297 — симметрический 297 — сопряженный 284 — унитарный 292 — эрмитов 297 Линейный функционал 240, 248 Линейных подпространств пересече- ние 216 — сумма 216 ---прямая 218 Линия алгебраическая 116 Линии алгебраической порядок 116 Линии второго порядка на плоскости общее уравнение 193 -------канонические уравнения 200 -------приведенные уравнения 200
390 Предметный указатель Матриц произведение 19 - равенство 18 - сумма 18 Матрица 15 - блочная 17 - вырожденная 37 - Г рама 232 - единичная 16 - квадратная 15 - квазидиагональная 18 - квазитреутольная 18 - кососимметрическая 301 - косоэрмитова 301 - нормальная 288 - нулевая 15 - обратная 36 - ортогональная 96 - перехода к другому базису 79 - положительно определенная 299 - присоединенная 37 - прямоугольная диагональная 40 - простой структуры 263 - самосопряженная 296 - симметрическая 296 - скалярная 16 - сопряженная 159 - столбцовая (строчная) 16 - ступенчатая 16 - транспонированная 20 - трапециевидная 17 - треугольная 16 - унитарная 291 - эрмитова 296 Матрицы главная диагональ 15 - жорданова форма 278 - конгруэнтные 311, 320 - норма 357 - определитель 27 - побочная диагональ 315 - ранг 71 - след 16 - собственное значение 256 - собственный вектор 256 - эквивалентные 74 Матрицы характеристический много- член 194, 257 Матрицы ортогонально (унитарно) подобные 290 - перестановочные (коммутирую- щие) 20 - подобные 195 - элементарных преобразований 24 Матрицы ///-разложение 41 - сингулярное разложение 306 - скелетное разложение 76 - Qfi-разложение 231 Метрика 237 Метрическое пространство 237 Минор 31 - базисный 71 - главный 194 - дополнительный 31 - угловой 41 Многочлен п-й степени 165 - аннулирующий 279 - минимальный 279 - от оператора 251 - симметрический 177 - характеристический 194, 257 Многочлена делитель 169 - каноническое разложение 175, 179 - корень 170 Многочленов деление 168 - наибольший общий делитель 169 - сложение 166 - умножение 166 Множеств декартово произведение 43 - объединение 42 - пересечение 42 - равенство 42 - разность 43 Муавра формула 162 Направленный отрезок 55 Наименьших квадратов метод 367 Направляющие косинусы 90 Неизвестные главные 107 - свободные 107 Нейтральный элемент 51 Неравенства треугольника в евклидо- вом (унитарном пространстве) 227 — на комплексной плоскости 161 Неравенство Гельдера 343 - Минковского 342 - Юнга 342 Нильпотентный оператор 266 Норм эквивалентность 351 Норма вектора 343 - матрицы 357 - евклидова 348 - оператора 354 - подчиненная 354 - согласованная 353 - спектральная 354 Нормы Гельдера 344 Нормальное решение 365 - уравнение 367 Нормальный делитель 144 - оператор 288 Нормированное пространство 342 Обратная операция 52 Общее решение 108, 114, 115 Однородная система 109 Операторное уравнение 364 Операторов алгебра 250 - кольцо 149 - линейное пространство 62, 207 - произведение 245 - сумма 244 — прямая 268 Определитель 27 - Грама 232 Определителя разложение по строке 34 (столбцу) 34 - член 28 Ориентация в вещественном простран- стве 91 Ортогональное дополнение 233 Ортогональные векторы 90, 228 Основная теорема алгебры 171 Основной процесс 23 Отношение бинарное 43
Предметный указатель 391 - эквивалентности 44 Отображение 46 - биективное 46 - инъективное 46 - линейное 240 - обратное 48 - сюръективное 46 - тождественное (единичное) 47 Отображений равенство 47 - произведение (суперпозиция) 47 Пара квадратичных форм 323 Парабола 187 Параболы вершина 188 - директриса 187 - каноническое уравнение 188 - ось 188 - фокальный параметр 187 - фокус 187 - эксцентриситет 187 Параболоид гиперболический 338 - эллиптический 338 Перестановка 25, 49 Перестановки транспозиция 25 - четность 25 Поверхность алгебраическая 116 Поверхности алгебраической второго порядка канонические уравнения 333 -----общее уравнение 329 -----приведенные уравнения 330 Подгруппа 137 Подкольцо 151 Подстановка 49 Подполе 152 Поле 151 - алгебрам чески замкнутое 170 - вычетов по простому модулю 154 Поля характеристика 153 - расширение 152 Полуплоскость 126 Полупространство 126 Порядок группы 139 - элемента. 143 Преобразование линейное 240 Пространство евклидово 224 - линейное 62, 207 - метрическое 237 - нормированное 342 - унитарное 224 Процесс ортогонализации 230 Прямая сумма операторов 268 — подпространств 218 Псевдорешение 366 - нормальное 367 Пучок плоскостей 126 - прямых 125 Радиус-вектор точки 84 Разложение вектора по системе векторов 65 -----подпрост ранствам 216 Размерность алгебры 250 - аффинного пространства 209 - линейного пространства 77 — многообразия 82 Ранг билинейной формы 310 - квадратичной формы 311 - матрицы 71 - оператора 247 - системы векторов 211 Расстояние в метрическом простран- стве 237 - между скрещивающимися прямы- ми 134 - от точки до прямой 128, 133 ------ плоскости 128 Расширение кольца 151 - поля 152 Сильвестра критерий 317 Симметричный элемент 51 Сингулярное разложение 306 Сингулярные векторы 305 - числа 305 Сингулярных чисел разделение 361 Система координат аффинная 84 — общая декартова 84 — прямоугольная декартова 86 Система линейных алгебраических уравнений 104 ------совместная (несовместная) 104 ------определенная (неопределен- ная) 104 Скалярного произведения общий вид 318, 321 Скалярное произведение 88, 224 Смешанное произведение 93 Собственное значение (собственный вектор) 256, 263 - подпространство 261 Собственных значений разделе- ние 361 — экстремальные свойства 358 Сопряженное число 157 - пространство 249 Сопряженные элементы группы 144 Сопряженный оператор 284 Сужение оператора 256 Сфера 345, 347 Сходимость по норме 346 Тождество параллелограмма 227, 350 Углы Эйлера 99 Угол между векторами 88, 227 — прямыми 128, 133 Уравнение операторное 364 - сопряженное 365 Уравнения прямой на плоскости 117-123 — в пространстве 129-130 - плоскости 119-123 Фактор-множество 45 Фактор-группа 145 Фактор-пространство 223 Фредгольма альтернатива 365 - теорема 365 Формулы преобразования коорди- нат 96 Фундаментальная система реше- ний 112
392 Предметный указатель Функционал невязки 366 Характеристика поля 153 Характеристическое уравнение 259 Цилиндр 339 Шаля лемма 57 Шар 345, 347 Шура базис 289 - теорема 289 Эквивалентные матрицы 74 - системы векторов 211 — уравнений 105 Элемент наилучшего приближе- ния 361 Элементарные преобразования матри- цы 22 — системы уравнений 111 Эллипс 180 Эллипса директрисы 183 - каноническое уравнение 182 - оси 182 - полуоси 182 - фокальный параметр 192 - фокусы 180 - эксцентриситет 182 Эллипсоид 334 Ядро гомоморфизма 148 - оператора 246 Якоби сигнатурное правило 316 - формулы 315
УКАЗАТЕЛЬ ОБОЗНАЧЕНИЙ N, Z, Q, R, С - множества натуральных, целых, рациональных, веще- ственных, комплексных чисел. Ат = (а‘; ) - транспонированная матрица к матрице А = (а^). Ан = (а^) - сопряженная матрица к матрице А = (а^). А - присоединенная матрица к матрице А. tr A, tr А - след матрицы А и оператора А соответственно. diag(Ai,..., Ап) - диагональная матрица с элементами Ai,..., Ап на главной диагонали. det A, det А - определитель матрицы А и оператора А соответственно. - минор, расположенный в строках с номерами г'1,... ,ik и столбцах с номерами ji,...,jk- {АВ) - прямая, проходящая через точки А и В. [АВ) - луч с началом в точке А, на котором расположена точка В. (а, Ь) - скалярное произведение векторов а и Ь. [а, Ь] - векторное произведение векторов а и Ь. (а, Ь, с) - смешанное произведение векторов а, Ь и с. prtL а - проекция вектора а на прямую I параллельно прямой L. рг&Ь - ортогональная проекция вектора b на ось, определенную век- тором а. е = (ei,..., еп) - базис линейного пространства, состоящий из векто- рОВ • • • j хе - координатный столбец вектора х в базисе е. G(ai,..., a*,) - матрица Грама системы векторов ai,...,ак- £(ai,..., ак) - линейная оболочка системы векторов ai,... ,а*. Ад - матрица оператора А в паре базисов ей/. £(V,W) - множество всех линейных операторов, действующих из пространства V в пространство W. Для сокращения используются также стандартные логические сим- волы импликации и кванторы: запись А => В читается как “из высказывания А следует выска- зывание В”; запись А <=> В означает эквивалентность высказываний А и В и читается как “для А необходимо и достаточно В” или “А выполнено тогда и только тогда, когда выполнено В”; текст в фигурных скобках в записи А => {• • •} => В содержит комментарии к переходу от высказывания А к высказыванию В; квантор V читается как “для любого”; квантор 3 читается как “существует”.