Текст
                    Московский государственный университет имени М.В. Ломоносова
В.А. Ильин, Г.Д. Ким
ЛИНЕЙНАЯ АЛГЕБРА
И
АНАЛИТИЧЕСКАЯ ГЕОМЕТРИЯ
УЧЕБНИК
3-е издание,
переработанное н дополненное
Учебник удостоен премии Президента Российской Федерации
в области образования
Издательство Проспект
Издательство Московского университета
2007

УДК [512.8+516.0](075.8) ББК 22.12я73 И45 Рецензенты: академик РАН С. М. Никольский, академик РАН В. В. Воеводин Ильин В. А., Ким Г. Д. И45 Линейная алгебра и аналитическая геометрия : учеб. - 3-е изд., пе- рераб. и доп. - М.: ТК Велби, Изд-во Проспект, 2007. - 400 с. ISBN-10 5-482-01216-6 ISBN-13 978-5-482-01216-1 Книга представляет собой учебник по объединенному курсу линейной алгебры и аналитической геометрии, в основу которого легли лекции, читавшиеся авторами в Московском государственном университете им. М. В. Ломоносова. В изложении материала, вполне традиционного по своей тематике, авторы придерживаются тен- денции объединения двух математических дисциплин в одну, добиваясь лаконично- сти геометрических доказательств и наглядности алгебраических абстракций. Наряду с традиционными темами книга содержит сведения из общей алгебры, эле- менты теории множеств, метрических и нормированных пространств. Особое вни- мание уделяется вычислительным аспектам алгебраических методов. Для студентов университетов и вузов, обучающихся по специальностям «Мате- матика», «Прикладная математика», «Информатика». УДК [512.8+516.0](075.8) ББК 22.12я73 Учебное издание Ильин Владимир Александрович, Ким Галина Динховна ЛИНЕЙНАЯ АЛГЕБРА И АНАЛИТИЧЕСКАЯ ГЕОМЕТРИЯ Учебник Художественное оформление серии выполнено Издательством Московского университета и Издательством Проспект по заказу Московского университета. Подписано в печать 01.10.06. Формат 60 х 90 Печать офсетная. Печ. л. 25,0. Тираж 3000 эка. Заказ № 2300. ООО *ТК Велби» 107120, г. Москва, Хлебников пер., д. 7, стр. 2. Отпечатано в полном соответствии с качеством предоставленных диапозитивов в ОАО «Тверской ордена Трудового Красного Знамени полиграфкомбинат детской литературы им. 50-летия СССР*. 170040, г. Тверь, проспект 50 лет Октября, 46. £ 0 В. А. Ильин, Г. Д. Ким, 2007 © ООО «Издательство Проспект». 2007 ISBN-10 5-482-01216-6 © МГУ им. М. В. Ломоносова, художественное 1SBN-13 978-5-482-01216-1 оформление, 2007
Предисловие Уважаемый читатель! Вы открыли одну из книг, изданных в серии «Классический уни- верситетский учебник», посвященной 250-летию Московского уни- верситета. Серия включает свыше 250 учебников и учебных посо- бий, рекомендованных к изданию Учеными советами факультетов, редакционным советом серии и издаваемых к юбилею по решению Ученого совета МГУ. Московский университет всегда славился своими профессорами и преподавателями, воспитавшими не одно поколение студентов, впоследствии внесших заметный вклад в развитие нашей страны, составивших гордость отечественной и мировой науки, культуры и образования. Высокий уровень образования, которое дает Московский универ- ситет, в первую очередь обеспечивается высоким уровнем написан- ных выдающимися учеными и педагогами учебников и учебных по- собий, в которых сочетаются как глубина, так и доступность изла- гаемого материала. В этих книгах аккумулируется бесценный опыт методики и методологии преподавания, который становится достоя- нием не только Московского университета, но и других университе- тов России и всего мира. Издание серии «Классический университетский учебник» нагляд- но демонстрирует тот вклад, который вносит Московский универси- тет в классическое университетское образование в нашей стране и, несомненно, служит его развитию. Решение этой благородной задачи было бы невозможным без активной помощи со стороны издательств, принявших участие в из- дании книг серии «Классический университетский учебник». Мы рас- цениваем это как поддержку ими позиции, которую занимает Мос- ковский университет в вопросах науки и образования. Это служит также свидетельством того, что 250-летний юбилей Московского университета — выдающееся событие в жизни всей нашей страны, мирового образовательного сообщества. £ьао Ректор Московского университета ’ академик РАН, профессор В. А. Садовничий
ОГЛАВЛЕНИЕ Предисловие............................................. 12 Предисловие к третьему изданию.......................... 13 Литература.............................................. 14 Глава I. Матрицы........................................ 15 § 1. Понятие матрицы................................. 15 Терминология и обозначения. Компактная форма записи матрицы. Матрицы специального вида §2, Операции над матрицами............................ 18 Равенство матриц. Линейные операции. Умножение матриц. Транспонирование матрицы. Некоторые свой- ства операций §3 . Элементарные преобразования матриц.............. 22 Приведение матрицы к ступенчатой форме. Приведение к трапециевидной форме. Приведение к треугольной форме. Матрицы элементарных преобразований §4 . Определители.................................... 25 Перестановки. Построение определителя п-го порядка. Простейшие свойства определителя. Миноры и алгебра- ические дополнения. Теорема Лапласа. Разложение опре- делителя по строке (столбцу). Определитель квазитре- уголъной матрицы. Вычисление определителя §5 . Обратная матрица................................ 36 Условие обратимости. Некоторые свойства обратной ма- трицы. Вычисление обратной матрицы. Приведение к диа- гональной форме. Ш-разложение матрицы Глава II. Теоретико-множественные понятия............... 42 §6 . Множества....................................... 42 § 7. Эквивалентность................................. 43 Бинарное отношение. Отношение эквивалентности § 8. Отображения..................................... 46 Определение, простейшие свойства. Произведение отобра- жений. Обратное отображение. Перестановки (подста- новки) п-го порядка § 9. Алгебраические законы........................... 50 Внутренний закон композиции. Обобщенная ассоциатив- ность. Внешний закон композиции
Оглавление 5 Глава III. Геометрические векторы....................... 54 § 10 , Направленные отрезки............................. 55 § 11. Свободный вектор.................................. 57 Определение и терминология. Линейные операции над век- торами § 12. Векторы на прямой, на плоскости и в пространстве.. 60 Глава IV. Введение в теорию линейных пространств........ 62 § 13. Вещественное линейное пространство................ 62 Определение. Примеры. Простейшие свойства линейных пространств § 14. Линейная зависимость.............................. 65 § 15. Геометрический смысл линейной зависимости......... 68 § 16. Ранг матрицы...................................... 70 Ранг матрицы и линейная зависимость. Ранг матрицы и элементарные преобразования. Метод Гаусса вычисления ранга. Эквивалентные матрицы. Скелетное разложение матрицы § 17. Базис и размерность............................... 76 Определения. Примеры. Координаты вектора. Переход к другому базису § 18. Линейное подпространство и линейное многообразие.. 80 Линейное подпространство. Линейное аффинное много- образие Глава V. Векторная алгебра.............................. 83 § 19. Координаты вектора................................ 83 § 20. Координаты точки.................................. 84 Аффинная система координат. Деление отрезка в данном отношении. Прямоугольные координаты §21. Проекции вектора и координаты...................... 86 Проекции вектора на плоскости. Проекции вектора в пространстве § 22. Скалярное произведение............................ 88 Определение и основные свойства. Скалярное произведение в координатах §23. Векторное и смешанное произведения................ 91 Ориентация в вещественном линейном пространстве. Определения и основные свойства. Векторное и смешанное произведения в прямоугольных координатах § 24. Преобразование координат.......................... 95 Преобразование аффинной системы координат. Ортого- нальная матрица. Преобразование прямоугольной декарто- вой системы координат на плоскости. Преобразование пря- моугольной декартовой системы координат в простран- стве
6 Оглавление § 25. Полярные координаты............................101 Полярные координаты на плоскости. Полярные координа- ты в пространстве Глава VI. Системы линейных алгебраических уравнений 104 § 26. Постановка задачи................................104 Терминология. Компактная записи системы. Эквивалент- ность систем § 27. Системы с квадратной невырожденной матрицей. Правило Крамера............................................105 § 28. Системы общего вида..............................106 Совместность системы. Схема исследования совместной системы. Общее решение системы. Однородные системы § 29. Метод Гаусса исследования и решения систем......109 Системы с трапециевидной матрицей. Элементарные преобразования системы уравнений. Приведение системы общего вида к системе с верхней трапециевидной матри- цей § 30. Геометрические свойства решений системы..........112 Линейное подпространство решений однородной системы. Общее решение однородной системы. Линейное многообра- зие решений неоднородной системы. Общее решение неод- нородной системы Глава VII. Алгебраические линии и поверхности первого порядка......................................116 § 31. Понятие об уравнениях линии и поверхности........116 § 32. Уравнения прямой на плоскости и плоскости в пространстве....................................117 Канонические уравнения. Параметрические уравнения. Об- щие уравнения. Уравнения в отрезках. Векторные уравне- ния § 33. Взаимное расположение прямых на плоскости (плоскостей в пространстве).............................................123 Взаимное расположение двух прямых (плоскостей). Пучок прямых (плоскостей) § 34. Полуплоскости и полупространства...................126 §35. Прямая на плоскости (плоскость в пространстве) в прямо- угольной декартовой системе координат.....................128 Расстояние от точки до прямой (до плоскости). Угол между прямыми (между плоскостями) §36. Прямая в пространстве..............................129 Уравнения прямой. Взаимное расположение двух прямых в пространстве. Взаимное расположение прямой и плос- кости. Метрические задачи в прямоугольной декартовой системе координат Глава Vin. Элементы общей алгебры.................135 §37. Группа......................................135
Оглавление 7 § 38. Подгруппа.......................................137 Определение. Примеры. Группа невырожденных верхних (нижних) треугольных матриц. Группа ортогональных матриц. Произведение подмножеств группы. Смежные классы § 39. Конечная группа.................................140 Основные свойства. Симметрическая группа п-го порядка. Знакопеременная группа п-го порядка. Циклическая группа. Порядок элемента § 40. Нормальный делитель.............................144 Определение и свойства. Фактор-группа. Группа вычетов по модулю р § 41. Морфизмы групп..................................145 Изоморфизм. Гомоморфизм § 42. Кольцо..........................................148 Определение, простейшие свойства. Делители нуля. Коль- цо вычетов. Подкольцо §43. Поле............................................151 Определение, простейшие свойства. Расширение поля. Изоморфизм колец и полей. Характеристика поля. Поле вычетов Глава IX. Комплексные числа............................156 § 44. Поле комплексных чисел...........................156 Понятие комплексного числа. Алгебраическая форма ком- плексного числа. Комплексная плоскость. Сопряженная матрица § 45. Тригонометрическая форма комплексного числа.....159 § 46. Возведение в степень и извлечение корня.........162 Возведение в степень. Извлечение корня. Геометрическая интерпретация корней. Группа корней п-й степени из еди- ницы Глава X. Многочлены над произвольным полем.............165 § 47. Кольцо многочленов..............................165 § 48. Деление многочленов.............................168 §49. Корни многочленов...............................170 § 50. Каноническое разложение многочлена над полем комплекс- ных чисел............................................174 §51. Многочлены над полем вещественных чисел.........177 Глава XI. Алгебраические линии второго порядка на плоскости.............................................180 § 52. Эллипс..........................................180 Каноническое уравнение. Директориалъное свойство § 53. Гипербола.......................................184 Каноническое уравнение. Директориалъное свойство
8 Оглавление § 54. Парабола..........................................187 Каноническое уравнение §55. Касательные к эллипсу, гиперболе и параболе.......189 § 56. Оптические свойства эллипса, гиперболы и параболы.190 § 57. Полярные уравнения эллипса, гиперболы и параболы..192 § 58. Общее уравнение линии второго порядка.............193 Компактная запись общего уравнения. Характеристиче- ский многочлен. Преобразования общего уравнения. Метод вращений § 59. Классификация линий второго порядка на плоскости...200 Канонические уравнения. Метод Лагранжа Глава XII. Линейное пространство над произвольным полем...................................................207 § 60. Определение и терминология.......................207 Примеры. Точки в линейном пространстве §61. Линейная зависимость. Ранг и база системы векторов.210 §62. Базис и размерность..............................211 §63. Изоморфизм линейных пространств..................213 §64. Линейные подпространства. Линейная оболочка......214 §65. Сумма и пересечение линейных подпространств......216 §66. Прямая сумма подпространств......................218 Критерии прямой суммы. Дополнительное подпростран- ство § 67. Линейное аффинное многообразие.........;.........220 Параллельные многообразия. Пересечение многообразий. Фактор-пространство Глава XIII. Евклидовы и унитарные пространства............224 § 68. Скалярное произведение...........................224 § 69. Основные метрические понятия.....................226 § 70. Ортогональные векторы............................228 Ортонормированный базис. Процесс ортогонализации. Ортогональная (унитарная) матрица. QR-разложение. Теорема Пифагора и ее обобщение § 71. Матрица Грама......................................232 § 72. Ортогональное дополнение...........................233 Задача о перпендикуляре. Решение задачи о перпендикуляре § 73. Линейное аффинное многообразие в евклидовом (унитар- ном) пространстве.......................................236 §74. Расстояние в евклидовом (унитарном) пространстве.237 § 75. Изометрия........................................239 Глава XIV. Линейные операторы...........................240 § 76. Определение и простейшие свойства................240 Терминология, примеры. Задание линейного оператора
Оглавление 9 § 77. Матрица линейного оператора......................242 Построение матрицы линейного оператора. Координаты вектора и его образа. Матрицы оператора в различных ба- зисах § 78. Линейное пространство операторов..................244 § 79. Умножение линейных операторов.....................245 §80. Образ и ядро линейного оператора..................246 §81. Линейные формы.....................................248 Определение и свойства. Линейные формы и гиперплос- кость Сопряженное пространство. Специальное пред- ставление линейной формы в евклидовом (унитарном) пространстве § 82. Алгебра линейных операторов, действующих в одном прос- транстве .........................................250 § 83. Обратный оператор................................251 Глава XV. Структура линейного оператора в комплекс- ном пространстве......................................254 §84. Инвариантные подпространства.....................254 Примеры. Индуцированный оператор § 85. Собственные значения и собственные векторы.......256 § 86. Характеристический многочлен.....................257 Определение, основные свойства. Собственные векторы линейного оператора в комплексном пространстве. Способ нахождения собственных векторов § 87. Собственное подпространство.......................260 § 88. Операторы простой структуры.......................261 Критерий простой структуры. Матричная формулировка операторных свойств. Жорданова клетка § 89. Треугольная форма матрицы линейного оператора....265 §90. Нильпотентный оператор...........................266 §91. Корневые подпространства.........................269 Корневые векторы. Корневые подпространства. Расщепле- ние линейного оператора. § 92. Жорданова форма..................................273 Канонический базис корневого подпространства. Нумера- ция базиса. Матрица оператора A|.Kaj в каноническом базисе. Жорданов базис и жорданова нормальная форма матрицы оператора. Приведение матрицы к жордановой форме. Аннулирующий многочлен. Минимальный много- член. Некоторые приложения § 93. Вещественный аналог жордановой формы..........280 Инвариантные подпространства минимальной размерно- сти. Вещественный аналог жордановой формы
10 Оглавление Глава XVI. Линейные операторы в унитарных (евклидо- вых) пространствах.......................284 § 94. Сопряженный оператор.........................284 Определение и свойства. Матрицы операторов А и А* в паре ортонормированных базисов. Ядра и образы операто- ров А и А* §95. Сопряжение оператора, действующего в одном простран- стве. Биортогональные базисы......................286 § 96. Нормальный оператор.............................288 Определение и свойства. Нормальный оператор и его ма- трица в унитарном пространстве. Нормальный оператор и его матрица в евклидовом пространстве § 97. Унитарный (ортогональный) оператор..............292 Критерии унитарности. Спектральная характеристи- ка унитарного оператора. Каноническая форма матрицы ортогонального оператора §98. Самосопряженный оператор.........................297 § 99. Знакоопределенные операторы.....................298 § 100. Разложения линейного оператора..................301 Эрмитово разложение. Сингулярная пара базисов и сингу- лярное разложение. Полярное разложение Глава XVII. Билинейные и квадратичные формы.............308 § 101. Билинейные и квадратичные формы в линейном простран- стве....................................................308 Билинейные формы. Квадратичные формы. Канонический вид квадратичной формы § 102. Квадратичные формы в вещественном пространстве...315 Закон инерции. Знакоопределенные квадратичные формы. Общий вид скалярного произведения в вещественном про- странстве §103. Квадратичные формы в комплексном пространстве....318 Полуторалинейные формы. Эрмитовы формы § 104. Квадратичные формы в евклидовом (унитарном) простран- стве...................................................321 Глава XVIII. Геометрия квадратичных форм и поверхно- сти второго порядка....................................325 § 105. Гиперповерхности второго порядка в евклидовом простран- стве....................................................325 Общее уравнение. Приведенные уравнения. Инварианты ги- перповерхности. Классификация гиперповерхностей § 106. Алгебраические поверхности второго порядка......329 Общее уравнение. Приведенные уравнения. Канонические уравнения. Геометрические свойства
Оглавление 11 Глава XIX. Линейные нормированные пространства...........342 § 107- Норма вектора...................................342 Нормы в арифметическом пространстве. Еще о метриче- ском пространстве. Норма и метрика. Нормы в конечно- мерном пространстве § 108. Норма и скалярное произведение..................348 § 109. Эквивалентность норм в конечномерном пространстве.350 Компактность единичной сферы. Эквивалентность норм § ПО. Линейные операторы в нормированных пространствах...352 Непрерывность и ограниченность. Норма оператора. Под- чиненная норма. Спектральная норма §111 . Матричные нормы оператора и нормы матрицы......355 §112 . Экстремальные задачи для самосопряженного оператора .. 357 Вариационные свойства собственных значений. Вариаци- онные свойства сингулярных чисел. Разделение собствен- ных значений §113. Задачи наилучшего приближения в нормированных про- странствах ........................................ 361 Наилучшее приближение. Аппроксимация оператора (матрицы). Расстояние до множества вырожденных матриц § 114. Линейные операторные уравнения .:..............364 Нормальное решение. Псевдорешение. Метод наименьших квадратов. Нормальное псевдорешение Приложение. Проблемы оснований геометрии и обоснования ме- тода координат..........................................370 §1 . Аксиомы элементарной геометрии...................370 § 2. Схема доказательства непротиворечивости геометрии Евклида...........................................382 § 3. Схема доказательства непротиворечивости геометрии Лобачевского..........................................385 §4 . Заключительные замечания о проблемах аксиоматики.387 Предметный указатель....................................388 Указатель обозначений...................................393
ПРЕДИСЛОВИЕ Линейная алгебра является широко используемым аппаратом для всех разделов математики и ее приложений. Особенно возросла ее роль в связи с развитием вычислительной техники и математики. Не будет большим преувеличением утверждать, что любое математиче- ское приложение в вычислительной практике на том или ином этапе сводится к решению алгебраической задачи. Логическая структура линейной алгебры исключительно проста, она основана на небольшом числе удобных в обращении понятий и аксиом. Однако абстрактный характер алгебраических понятий зату- шевывает это ее свойство и затрудняет первоначальный опыт изуче- ния линейной алгебры. Объединение линейной алгебры и аналитиче- ской геометрии в один курс позволяет подчеркнуть геометрическую природу линейной алгебры и сделать ее объекты более наглядными. По существу, линейная алгебра и аналитическая геометрия настолько связаны, что между ними трудно провести четкую грань, “во многих случаях они отличаются друг от друга лишь языком: каждую из этих дисциплин можно понимать как перевод другой” (Ж. Дьедонне). При написании этой книги мы придерживались традиции объеди- нения (переплетения) линейной алгебры и аналитической геометрии, установившейся в системе преподавания на факультете вычислитель- ной математики и кибернетики МГУ им. М.В. Ломоносова. При со- вместном изучении этих дисциплин геометрические представления своей наглядностью делают алгебраические понятия и факты более воспринимаемыми, помогают уяснить, а зачастую и предвидеть не всегда очевидные факты. В свою очередь алгебраический формализм позволяет проводить геометрические исследования более компактно. Авторы использовали ряд методических приемов из учебников, написанных А.Г. Курошем [14], И.М. Гельфандом [б], Н.В. Ефимо- вым [7], Г.Е. Шиловым [17], В.В. Воеводиным [2], А.И. Кострики- ным [12], В.А. Ильиным и Э.Г. Позняком [10]. Нам приятно подчеркнуть благотворное влияние на методические особенности предлагаемой книги идей первого лектора по данному курсу на факультете ВМиК МГУ В.В. Воеводина. Авторы считают своим приятным долгом поблагодарить ректора МГУ В.А. Садовничего и декана факультета ВМиК МГУ Д.П. Косто- марова, оказавших существенную поддержку изданию этой книги, и научного редактора книги Л.В. Крицкова за ценные замечания, спо- собствовавшие ее улучшению. В.А. Ильин, Г.Д. Ким
ПРЕДИСЛОВИЕ К ТРЕТЬЕМУ ИЗДАНИЮ В настоящем издании нам удалось упростить некоторые доказа- тельства. Ряд других доказательств мы излагаем более подробно, ука- зывая возможные обобщения, содержащие существенную дополни- тельную информацию. В текст книги внесены небольшие дополнения, касающиеся общей алгебры, теории точечных пространств, метрических и нормирован- ных пространств, вычислительных основ линейной алгебры, а в конце книги помещено приложение, посвященное проблемам оснований гео- метрии и обоснования метода координат. Наконец, нами исправлены имевшиеся в предыдущем издании опе- чатки и неточности. Мы выражаем благодарность нашим коллегам по кафедре и фа- культету ВМиК МГУ - профессорам Е.Г. Дьяконову, Е.Е. Тыртыш- никову и доцентам Н.И.Ионкину, Л.В. Крицкову, В.С. Панфёрову, Р.В. Разумейко и А.И. Фалину - за полезные обсуждения, способство- вавшие улучшению изложения. С благодарностью мы отмечаем, что труд Л.В.Крицкова по прочтению рукописи вышел за рамки редак- тирования. Мы очень благодарны рецензентам академикам РАН С.М. Николь- скому и В.В. Воеводину, а также ректору МПГУ члену-корреспонденту РАН В.Л. Матросову и доценту МГУ А.И. Камзолову за поддержку этой книги. Мы считаем также нашим приятным долгом выразить глубокую благодарность ректору МГУ академику В.А. Садовничему и декану факультета ВМиК МГУ академику Е.И. Моисееву, стараниями ко- торых эта книга включена в серию “Классический университетский учебник”. Мы очень признательны сотрудникам издательства “Проспект” С.М. Грачеву, Л.В. Рожникову, В.А. Товстоногу, К.В.Хомерики, об- легчившим нам подготовку рукописи к печати. Москва, 2006 г.
ЛИТЕРАТУРА 1. Александров П. С. Курс аналитической геометрии и ли- нейной алгебры. М.: Наука, 1979. 2. Воеводин В. В. Линейная алгебра. М.: Наука, 1980. 3. Воеводин В. В. Вычислительные основы линейной алгебры. М.: Наука, 1980. 4. Воеводин В. В., Кузнецов Ю. А. Матрицы и вычисления. М.: Наука, 1984. 5. Гантмахер Ф. Р. Теория матриц. М.: Наука, 1988. 6. Гельфанд И. М. Лекции по линейной алгебре. М.: Добросвет, 1988. 7. Ефимов Н. В. Высшая геометрия. М.: Наука, 1978. 8. Ефимов Н. В., Розендорн Э. Р. Линейная алгебра и многомерная геометрия. М.: Наука, 1974. 9. Ильин В. А., Позняк Э. Г. Аналитическая геометрия. М.: Физматлит, 2004 (классический университетский учебник). 10. Ильин В. А., Позняк Э. Г. Линейная алгебра. М.: Физ- матлит, 2004 (классический университетский учебник). 11. Ильин В. А., Садовничий В. А., Сендов Бл. X. Математический анализ. Часть I. М.: Проспект и изд-во Моск, ун-та, 2004 (классический университетский учебник). 12. Кострикин А. И. Введение в алгебру. М.: Физматлит, 2004 (классический университетский учебник). 13. К острикин А. И., Манин Ю. И. Линейная алгебра и геометрия. М.: Наука, 1986. 14. Курош А. Г. Курс высшей алгебры. М.: Наука, 1988. 15. Тыртышников Е. Е. Краткий курс численного анализа. М.: ВИНИТИ, 1974. 16. Халмош П. Конечномерные векторные пространства. М.: Физматгиз, 1963. 17. Шилов Г. Е. Математический анализ (конечномерные ли- нейные пространства). М.: Наука, 1969.
Глава I. Матрицы § 1. Понятие матрицы Терминология и обозначения. Пусть т, п € N. Матрицей размера т х п называется совокупность тп чисел, записанных в ви- де прямоугольной таблицы из т строк и п столбцов. При этом сами числа называются элементами матрицы. В первых главах мы будем рассматривать лишь вещественные матрицы, т.е. матрицы с вещественными элементами. В дальнейшем (§43) мы убедимся в том, что все изложенные свойства остаются спра- ведливыми и в общем случае матриц над произвольным полем. Матрицу обозначают прописными латинскими буквами, при этом саму таблицу заключают в скобки (либо круглые, либо квадратные, либо двойные вертикальные): 2 3 4 5 б z Элементы матрицы обозначают строчными латинскими буква- 2 1 2 1 О 1 А= 1 ми, снабженными двумя индексами: - элемент матрицы, располо- женный в г-й строке и j-м столбце (в позиции (i,J)). В этих обозна- чениях матрица размера т х п в общем виде может быть записана следующим образом: аи а12 ... ain д _ «21 «22 «2п _ «ml «m2 • • «тп _ Приведем ряд других обозначений, которыми мы будем пользо- ваться в дальнейшем: RTnxn - множество всех вещественных матриц размера т х п; Л = (aij) - матрица А с элементами в позиции {А};.,- - элемент матрицы А в позиции (i, j); Атхп - матрица А размера т х п. Элементы atJ, где i — j, называются диагональными, а элемен- ты а^, где г j, - внедиагональными. Совокупность диагональных элементов ап,а22, • •, a*k, где к = min(m, п), называется главной диа- гональю матрицы, а совокупность элементов ain, a2in_j, .- ее по- бочной диагональю. Матрица, все элементы которой равны нулю, называется нулевой и обозначается символом О. Отметим, что для каждого размера т х п существует своя нулевая матрица. Матрица размера п х п называется квадратной матрицей п-го порядка. Квадратная матрица называется диагональной, если все ее
16 Глава I. Матрицы внедиагональные элементы равны нулю. Обозначение: diag(au, ..., ann). Диагональная матрица, у которой все диагональные элемен- ты равны между собой, называется скалярной. Скалярная матрица, у которой все диагональные элементы равны 1, называется единичной (тождественной) и обозначается символами I или Е. Отметим, что для каждого порядка п существует своя единичная матрица. Число tr А = an +--1- апп называется следом матрицы А = (a^) G Rnxn. Матрица размера 1 хп называется строчной матрицей, или мат- рицей-строкой, или вектор-строкой. Матрица размера т х 1 назы- вается столбцовой матрицей, или матрицей-столбцом, или вектор- столбцом. Компактная форма записи матрицы. Пусть А = (щД eRmxn. Обозначим г-ю строку и г-й столбец матрицы А символами а' и а,: а' = [ ал а»2 aii a2i ain _ Gmi _ В этих обозначениях матрица А может быть записана более ком- пактно: или А = [ ai а2 ... ап ] . (1.1) Такой формой записи мы нередко будем пользоваться, причем не только лаконичности ради. Матрицы специального вида. Квадратная матрица А = — (atj) € Rnxn называется верхней (правой) треугольной, еслиа^ = О при i > j, и нижней (левой) треугольной, если а^ = 0 ори г < j. Об- щий вид треугольных матриц: чатой, если она обладает следующими свойствами: 1) если г-я строка нулевая, то (г + 1)-я строка также нулевая; 2) если первые ненулевые элементы г-й и (г 4- 1)-й строк располо- жены в столбцах с номерами ki и fc,+ i, то < fci+i- Эти свойства означают, что все нулевые строки являются послед- ними и что все элементы, расположенные слева и под первым ненуле- вым элементом каждой строки, равны нулю. Происхождение назва- ния становится понятным из “рисунка” ступенчатой матрицы:
§ 1. Понятие матрицы 17 (здесь все неотмеченные элементы равны нулю, а заведомо ненулевые элементы помечены знаком *). Если в определении верхней ступенчатой матрицы поменять роля- ми строки и столбцы, то получим определение нижней (левой) сту- пенчатой матрицы. Ступенчатая матрица, у которой ki = г, называется трапециевид- ной. Общий вид трапециевидных матриц: R = L = | Oil «12 - • • «22 ••• &2г «1,г+1 ••• «2,г+1 • • &1п Я2п 0 0 ... 1 Qrr От,г+1 «гп 0 0 ... 0 0 0 0 0 ... 0 0 0 ац 1 о 0 0 0 021 «22 | 0 0 0 °rl «г2 (1гг 0 0 «г+1,1 «г+1,2 Gr+ 1,г 0 0 О-тЪ ^тг 0 0 (1-3) где ац 0 при i — 1,т. До сих пор мы рассматривали матрицы, элементами которых слу- жат числа. Так в основном будет и в дальнейшем. Одно из немногих в этом отношении исключений составляют матрицы, элементами кото- рых являются также матрицы. Остановимся на этом более подробно. Разобьем матрицу А = (aij) € R’nxn системой горизонтальных и вертикальных линий на клетки (блоки). Клеточной (блочной) ма- трицей называется матрица, элементами которой служат эти клетки. Общий вид клеточной матрицы: А =
18 Глава I. Матрицы где Aij - клетка, расположенная в г-й клеточной строке и в j-м кле- точном столбце. Квадратная клеточная матрица А = (А^) с квадрат- ными клетками на главной диагонали называется квазидиагонолъной, если Aij = О при i 7^ j, и квазитреугольной, если А^ — О при i > j (или г < j). Как будет видно из дальнейшего, блочные матрицы по многим характеристикам близки к числовым матрицам (см., например, с. 17, свойство 1). Это продуктивно используется в вычислительной мате- матике для обработки большого объема информации. § 2. Операции над матрицами Равенство матриц. Две матрицы А = (а^) и В = (bij) одина- кового размера т х п называются равными, если аг] = b^, i = 1,т, j — 1,п. Обозначение: А = В. Линейные операции. Суммой матриц А — (а,3) € Rmxn и В = (Ь,Д G й”1**" называется матрица С = (с^) € Rmx,‘, элемен- ты которой определены равенством _ ______ Ctj ~A* b{j, г — 1, т, j — 1, п. Обозначение: С = А + В. Матрица —А = (—ач) € йтх" называется противоположной к матрице А = (а^) G йтпх". Теорема 2.1. Операция сложения матриц обладает следу- ющими свойствами: VA,B,C € Rmxn и О G ЙП1ХП 1) А + В = В + А (сложение матриц коммутативно); 2) (А + В) -г С — А + (В + С) (сложение матриц ассоциативно); 3) А + О = 0 + А = А; 4) А + (-А) = -А + А = О. Доказательство. Эти свойства непосредственно вытекают из определения и доказываются по единой схеме. Докажем свойство 2. Матрицы (А + В) + С и А + (В + С) имеют одинаковый размер т х х п, при этом их элементы, расположенные в одинаковых позициях, равны, так как {(А + В) + C}ij = {А + В}у + {С}^- = (Pij+bij) +cij — aij + 4-сц) = {A}ij + {В + = {A + (В + C)}tj. Разностью матриц A = (ay) € R’nxn и В = (By) € Rmxn называ- ется матрица X = (xij) G йтхп такая, что А = В + X. Обозначение: X — А — В. Очевидно, что для любых матриц А, В G Rmxn существует единственная разность А - В, при этом А-В = А + (~В) = (% -Ьц). Произведением матрицы А = (а1}) G йтхп числ0 q, g R на- зывается матрица С = (су) G Rmxn, элементы которой определены равенством ____ ______ Cij = ctaij, г — 1,т, j — 1, п. Обозначение: С = а А.
§ 2. Операции нал матрицами 19 Теорема 2.2. Операция умножения матрицы на число об- ладает следующими свойствами: ЧА, В 6 R'nxn, Ча,(3 € К 1) 1А = А; 2) (а[3) А = а((ЗА); 3) л(А -ь В) = а А +- аВ (умножение матрицы на число дистри- бутивно относительно сложения матриц); 4) (а + (3)А = аА ф (ЗА (умножение матрицы на число дистри- бутивно относительно сложения чисел); (5)-А = (-1)А. Все эти свойства непосредственно вытекают из определения и про- веряются по той же схеме, что и свойство 2 из теоремы 2.1. Итак, на множестве Rmx" всех вещественных матриц одинакового размера т х п любые две матрицы можно сложить и любую матрицу можно умножить на вещественное число. При этом результаты вы- полнения этих операций также будут матрицами из Rraxn. Обратим внимание на эту особенность множества RmXn, так как в дальнейшем мы неоднократно будем сталкиваться с множествами, наделенными операциями сложения и умножения на число, которые обладают свой- ствами, сформулированными в теоремах 2.1 и 2.2. Операции сложения матриц и умножения матрицы на число по- зволяют однозначно определить матрицу k oj Al + а2А2 + ... + акАк = У, OjAi, i=l называемую линейной комбинацией матриц Ai, А2,..., А*, € Rmxn с коэффициентами оц, а2,..., ак 6 R. Умножение матриц. Произведением матриц А = (ац) € Rmxn и В = (bjj) € Rnxfc называется матрица С = (с^) G Rmxfc, элементы которой определены равенством Cjj = £ г = l,m, j - 1,к. 3=1 Обозначение: С = АВ. Уже из определения следует, что произведение матриц зависит от порядка сомножителей; произведение АВ определено лишь в том слу- чае, когда размеры матриц А и В согласованы специальным образом: число столбцов левой матрицы должно совпадать с числом строк правой. Это означает, что оба произведения АВ и ВА определены тогда и только тогда, когда А и В имеют размеры т х п и п х т соответственно. При этом размеры матриц АВ и В А совпадают лишь при т — п. Следовательно, равенство АВ = ВА возможно лишь для квадратных матриц одинакового порядка. Однако и в этом случае произведение матриц, вообще говоря, может зависеть от порядка со- множителей: /1 1 \ / 1 0 \ , ( 1 0 \ / 1 1 \ \ О 1 J \ 1 1 ) * V 1 1 J \ 0 1 )'
20 Глава I. Матрицы Матрицы А и В, для которых АВ = В А, называются перестано- вочными или коммутирующими. Очевидно, что на множестве Rnxn 1) нулевая и единичная матрицы перестановочны с любой другой матрицей; 2) любые две диагональные матрицы перестановочны. Теорема 2.3. Операция умножения матриц обладает сле- дующими свойствами: 1} (АВ)С = А(ВС) (свойство ассоциативности), 2) а(АВ) = (аА)В = А(аВ), Va е R, 3) А(В + С) = АВ + АС, (А + В)С = АС+ВС (свойство дистри- бутивности), выполненными для любых матриц А, В, С, для которых левые части равенств имеют смысл. Доказательство. Эти свойства проверяются непосредствен- но. Остановимся подробнее на свойстве 1. Так как произведение (ДВ)С' имеет смысл, то размеры матриц А, В и С согласованы со- ответствующим образом. Пусть А = (а^) G Rmxn, В — (bij) € Rnxfc, С = (c,j) € R*xp. Тогда и произведение А(ВС) имеет смысл, при этом размеры обеих матриц (АВ)С и А(ВС) совпадают. Проверим совпаде- ние элементов этих матриц, расположенных в одинаковых позициях. Обозначим АВ = U — (u.ij), ВС = V = (w,j), (АВ)С = S = (sij), А(ВС) — Т — (tij). Тогда для любых i = l,m, j - 1,р sij = uiqcqj = Sg=l (Sr=l airbrq) Cqj, tij ~ 52r=l a<rvrj ~ Sr=l air (Z2q=l t'rqCqj'j Числа Cgj в первой двойной сумме (a{r - во второй) не зависят от индекса суммирования г (соответственно q), т.е. являются общими множителями слагаемых внутренней суммы. Следовательно, cqj (со- ответственно air) можно внести под знак суммирования, так что sij = (12г=1 atr^rgC<?j) = Sr=l airbrqCqj, tij = 52r=l airt>rqCqj^ = 52r=l Sg=l airbrqCqj- Отсюда и из свойств двойной суммы следует, что з^ = tij . Транспонирование матрицы. Пусть Л = (atJ) € Rmxn. Матри- ца Ат = (аГ) € Rnxm называется транспонированной к матрице А, если ___ ________ а-7 = aji, i = 1,п, j = 1,т. Для обозначения транспонированной матрицы используются так- же символы А1 и А'. Переход от матрицы А к АТ называется транспонированием ма- трицы А. Заметим, что при транспонировании матрицы Л ее строки становятся столбцами АТ с теми же номерами, а столбцы - строками. Другими словами, транспонирование - это вращение матрицы в про- странстве на 180° вокруг главной диагонали.
§ 2. Операции над матрицами 21 Теорема 2.4. Операция транспонирования матриц обла- дает следующими свойствами: 1) (А + В)Т = АТ+ ВТ, 2) (аА)т = аАт, Va е R, 3) (АВ)Т = ВТАТ, 4) (Ат)т = А, выполненными для всех матриц А, В, для которых имеют смысл левые части равенств. Доказательство. Проверим свойство 3, остальные непосред- ственно вытекают из определения. Положим А = (а.у) € R771*71, В = (by) € Rnxfc, произведение АВ при этом имеет смысл. Нетруд- но проверить, что произведение ВТАТ также имеет смысл, при этом размеры матриц (АВ)Т и ВТАТ совпадают. Элементы этих матриц, расположенные в одинаковых позициях, равны, так как {(ЛВ)т}у = {AB}jt = t^bsl = £ b^ = {втдт}у. > S=1 S=1 Некоторые свойства операций. Приведем несколько полезных фактов, касающихся операций над матрицами. Доказательство этих свойств предоставляется читателю. 1. Операции сложения, умножения на число и умножения блочных матриц совершаются по тем же правилам, по которым они соверша- ются с обычными числовыми матрицами: а) если блочные матрицы А = (Ду), В = (Btj) имеют одинаковый размер и одинаковым образом разбиты на клетки, то сумме матриц А и В при том же разбиении на клетки отвечает блочная матрица С = (Су) с элементами Су = Aij + BtJ; б) произведению а А отвечает блочная матрица С = (Су) с эле- ментами Cij = a Ajj-, в) если А = (Ду) и В = (By) - блочные матрицы, у которых число столбцов блока Д15 равно числу строк блока BSj при любых г,s, j , то произведению АВ соответствует блочная матрица С = (Су) с элементами Су = У) Ду By. 3 2. Вектор-столбец е, = (0 ... О 10 ... 0)т G Rnxl и вектор-строку е\ = (0 ... 010 ... 0) G Rlxm (у которых все компоненты равны 0, кроме г-й, равной 1) будем называть соответственно i-м единичным столбцом и г-й единичной строкой. Если А = (ay) G то в обозначениях (1.1) Ae.i = ait е'{А = а(. (2.1) 3. Если А — 6 R771’*71, а b1 = (а1а2---«т) и b = = (aj о2 ...,ап)Т - вектор-строка и вектор-столбец соответственно, ТО пт АЬ = a iai, Ь'Д — (2'2) i= 1 t=l
22 Глава I. Матрицы 4. Если А = (cnj) е Rmxn, В = (Ь^) е Rnxfc, то АВ = [ Abi АЬ2 ... АЬк ] , (2-3) т.е. столбцы произведения АВ являются линейными комбинациями столбцов матрицы А, а строки произведения АВ - линейными ком- бинациями строк матрицы В. § 3. Элементарные преобразования матриц Приведение матрицы к ступенчатой форме. Элементарны- ми преобразованиями матрицы называются преобразования следую- щих типов: 1) перестановка двух строк (столбцов) матрицы; 2) умножение строки (столбца) матрицы на число, отличное от нуля; 3) прибавление к одной строке (столбцу) матрицы другой ее строки (соответственно столбца), умноженной на любое число. Теорема 3.1 (об основном процессе). Произвольная не- нулевая матрица конечным числом элементарных преобразований только строк первого и третьего типов может быть приведе- на к верхней ступенчатой форме. Доказательство. Пусть А = (ач) € Rmxn, А О. Процесс приведения этой матрицы к верхней ступенчатой форме состоит в общем случае из k = min(m,n) шагов. Иногда, как это будет видно ниже, он обрывается раньше, давая нужный результат. Первый шаг. а) Так как А / О, то в ней должен быть хотя бы один ненулевой столбец. Пусть ki — номер первого из них. В /ci-м столбце существует хотя бы один ненулевой элемент ац^. Если ан, 0, то переходим к п. "б". Если же ац, = 0, то, поменяв местами 1-ю и г-ю строки (т.е. выполнив элементарное преобразование строк первого типа), получим матрицу ' 0 ... О aifcl ... ain О ... О a2ki ' а?п . О О &тк1 • • • Щпп . в которой ajfc, 0. Хотя при таком переходе элементы матрицы А могли измениться, мы оставили прежние обозначения с тем, чтобы акцентировать внимание лишь на тактической стороне процесса. б) Элемент anti назовем ведущим (главным) элементом первого шага. С его помощью аннулируем все расположенные под ним эле- менты Ai-ro столбца. Для этого из всех строк, начиная со второй,
§ 3. Элементарные преобразования матриц 23 вычтем первую строку, умноженную на azki/^ifcn a3ki/oiki, , Gmki/o-iki соответственно (т.е. выполним элементарные преобразова- ния строк третьего типа). После выполнения первого шага матрица А перейдет в матрицу "О ... О | ац, ai,ki4-i ain О ... О 0 a2,ki + 1 • • • О,2п 1 в которой первая строка является первой строкой строящейся верхней ступенчатой матрицы. Если при этом все строки, начиная со второй, стали нулевыми, то весь процесс заканчивается, так как матрица уже приведена к верхней ступенчатой форме. Если же в этих строках есть хотя бы один ненулевой элемент, т.е. если матрица 41 = a2,fci + l /О, ^2п ^тп . _ +1 то переходим ко второму шагу. Второй шаг. Второй шаг аналогичен первому. Он состоит в приме- нении к матрице 41 процедуры описанного выше первого шага. При этом можно считать, что выполняются элементарные преобразования строк всей матрицы А, так как нулевые элементы этих строк, распо- ложенные в первых /ci столбцах, при элементарных преобразованиях строк не изменяются. В результате второго шага уже и вторая строка матрицы А станет второй строкой строящейся верхней ступенчатой матрицы. Переход к следующему шагу аналогичен уже известному перехо- ду от первого шага ко второму. Повторяя описанные преобразования на следующих шагах, самое большее через k = min(m, п) шагов мы получим требуемый результат. Отметим, что ведущим элементом г-го шага является первый ненулевой элемент i-й строки, т.е. . Описанный здесь процесс будем называть основным процессом приведения матрицы к ступенчатой форме. Приведение к трапециевидной форме. Основной процесс с незначительной модификацией может быть использован и для при- ведения матрицы к верхней трапециевидной форме. Для этого нуж- но привлечь и элементарные преобразования столбцов: переставить в ступенчатой матрице столбцы так, чтобы fc.-й столбец оказался на г-м месте. Итак, произвольная ненулевая матрица элементарными пре- образованиями строк и перестановками столбцов может быть приве- дена к верхней трапециевидной форме. Если в основном процессе поменять ролями строки и столбцы, то матрица А приведется к нижней ступенчатой (трапециевидной) фор- ме. Приведение к треугольной форме. Квадратная матрица с по- мощью основного процесса приводится к треугольной форме.
24 Глава I. Матрицы Замечание. Идеи основного процесса используются во многих компьютер- ных алгоритмах вычислительной алгебры. Выбор ведущего элемента здесь пред- ставляет собой особую проблему, так как от этого зависит точность вычислений. Исследование этой проблемы выходит за рамки данной книги: отметим лишь, что ведущий элемент не должен быть “маленьким”. Именно этим определяется много- образие алгоритмов, реализующих основной процесс, с различными стратегиями выбора ведущего элемента. Матрицы элементарных преобразований. Элементарные пре- образования матрицы просты и удобны в матричных исследованиях. Однако словесное описание выполняемых преобразований весьма уто- мительно как само по себе, так и для его восприятия. Этого можно избежать, если ввести некоторые матрицы специального вида. Матрицами элементарных преобразований называются квадрат- ные матрицы Di, P,j, Lij вида 1 . . а . . . i 1 1 i I . 0.1... 1.0... . 1 1 г i 1 . . 1.0.. • 0 1 • • . 1 1 г j i j а/0, i , V/3 € R, (3.1) i в которых все диагональные элементы, кроме указанных, равны 1, а все внедиагональные элементы, кроме указанных, равны 0.
§ 4. Определители 25 Теорема 3.2. Умножение матрицы А на матрицы эле- ментарных преобразований Рг], Di, Lij справа равносильно элемен- тарным преобразованиям столбцов матрицы А первого, второго и третьего типов соответственно, а умножение слева на матрицы Pij, Dl: ЬГ - аналогичным элементарным преобразованиям строк. Доказательство. Докажем одно из сформулированных утвер- ждений: умножение матрицы А на Li} справа равносильно прибавле- нию к г-му столбцу матрицы А ее j-ro столбца, умноженного на (3. Действительно, пусть • • - ,1п ~ столбцы матрицы L,j. Тогда, как следует из (2.3), (2.2) и (2.1), AL,, = [ Л/i ... А1п ] = {lk = ek при к / г} = — [а 1 ... а, — j А1, j ... Он ] — { Al, — -h 0aj J — — [di ... a{ _ i (a, -j- /3a_,) <2,4-1 ... an]. я Итак, с помощью матриц элементарных преобразований все эле- ментарные преобразования матрицы могут быть записаны весьма ла- конично: PijA, DiA, L?jA,APij, ADi, ALij. В свете доказанной теоремы можно по-иному сформулировать те- орему 3.1: для любой ненулевой матрицы А существуют матрицы элементарных преобразований L±,..., Lk такие, что произведение Lk ... Li А имеет верхнюю ступенчатую форму. § 4. Определители Перестановки. Упорядоченная совокупность чисел од, а2, , ап, в которой 1) аг е {1,2,... , n} , i = l,n; 2) a, £ aj при i j, называется перестановкой из чисел 1,2,..., п. Перестановка 1,2,..., п называется натуральной. Замечание. Аналогично рассматриваются перестановки из п произвольных символов: достаточно перенумеровать эти символы и иметь дело с их номерами 1,2,...,7?. Преобразование перестановки, при котором два ее числа а, и a.j с номерами г j меняются местами, называется транспозицией. Говорят, что два числа а, и в перестановке оц, а2) • • • i <*п обра- зуют инверсию (беспорядок), если большее из них предшествует мень- шему, т.е. если о, > при i < j, и порядок - в противном случае, т.е. если а, < aij при г < j. Перестановка называется четной, если общее число инверсий в ней четно, и нечетной - в противном случае. Общее число инверсий в перестановке aj, о2, •. , ап обозначается символа- ми <t(oi,0*21 • • •,ctn) или а(а). Теорема 4.1. Число всевозможных перестановок из п чи- сел равно п!. 1В § 8 будет дано общее определение перестановки п-го порядка.
26 Глава I. Матрицы Доказательство, Переберем все перестановки из п чисел. В качестве ai можно взять любое из этих чисел. Это дает п возможно- стей. В каждой из них aj уже выбрано и в качестве аг можно выбрать любое из п — 1 оставшихся чисел. Это означает, что число различных способов выбрать ai и аг равно п(п — 1). Продолжая эти рассужде- ния, получим, что число различных способов выбрать ai,a2,... ,ап равно n(n — 1) •... • 2 -1 = п!. Теорема 4.2. Каждая транспозиция меняет четность пе- рестановки. Доказательство. 1. Пусть в перестановке ai,a2,... ,a„ меня- ются местами два соседних числа а; и a,+ i, т.е. ... ,aj,aj+i,... ।—> ... ,а,+ 1,а,,... (здесь многоточия заменяют числа, которые не затрагивались при транспозиции). Очевидно, что в обеих перестановках числа, оставши- еся на местах, составляют одни и те же инверсии друг с другом и с числами ai,ai+i. Если числа а, и a;+i раньше составляли инверсию, то в новой перестановке она пропадает; если же они не составляли инверсию, то теперь появится одна новая инверсия. Таким образом, общее число инверсий в новой перестановке отличается от старой на единицу, т.е. четность при такой транспозиции меняется. 2. Пусть теперь между переставляемыми числами <4 и aj распо- ложено к чисел, т.е. ... ,а<,а>+1,... ,ai+fc, а; ... i—> ... ,aj,a,+i,... ,а,+*:,at... Новую перестановку можно получить из старой, последовательно ме- няя местами соседние числа: а, поменять местами (к -I-1) раз с сосед- ними числами ai+i,ai+21 с*?, а затем aj поменять местами к раз с числами ац.*,,. • • , а;+2, При этом четность перестанов- ки изменится 2к -I- 1 раз. Следовательно, и при такой транспозиции четность перестановки меняется. Теорема 4.3. Все п! перестановок из п чисел могут быть упорядочены так, чтобы каждая последующая отличалась от пре- дыдущей на одну транспозицию, причем начинать это упорядочение можно с любой перестановки. Доказательство. Проведем индукцию по п. Для п = 2 утвер- ждение теоремы легко проверить: (1,2), (2,1) и (2,1), (1,2). Пусть утверждение теоремы верно для п — 1 чисел. Докажем его для п чисел. Пусть первая перестановка имеет вид ai, a2,..., an . а) Сначала упорядочим все перестановки, начинающиеся с Та- ких перестановок (п — 1)*, и по индуктивному предположению они мо- гут быть упорядочены нужным образом, начиная с перестановки aj, a2, • • •, an, так как это сводится к упорядочению перестановок из п — 1 чисел, начиная с а2, аз,..., ап. б) Далее в последней перестановке из этого списка выполним одну транспозицию, поменяв местами числа ai и a2. И снова упорядочим все перестановки, начинающиеся с а2, и т.д.
§ 4. Определители 27 Следствие 1. При п > 2 число четных перестановок равно чи- слу нечетных. Действительно, после упорядочения в списке всех перестановок четные и нечетные перестановки будут чередоваться, а так как п! четно при п > 2, то количества четных и нечетных пере- становок совпадают и равны п!/2. Следствие 2. От каждой перестановки из п чисел можно пе- рейти к любой другой перестановке из этих же чисел с помощью конечного числа транспозиций. Теорема 4.4. Если ai,a2,... ,ап - перестановка из первых п натуральных чисел с числом инверсий з, то после преобразования ее в натуральную перестановку индексные номера 1,2,..., п образу- ют новую перестановку с тем же числом инверсий s. Доказательство. Рассмотрим в перестановке ai,«2, •,а<,... ,о,,... ,ап (4-1) любые ее два числа а, и oj. Числа О{ и о/ образуют либо инверсию (о; > о_у, г < j), либо порядок (о, < Oj, г < j). После преобразования перестановки (4.1) в натуральную числа о, и о7 будут располагаться следующим образом: 1,2,... ,Oj,...,а,,... ,п в случае инверсии, 1,2,... ,Oj,.. -,Oj,... ,п в случае порядка, причем в обоих случаях г < j. Это означает, что числа о, и Oj в пере- становке (4.1) и их индексы i и j в перестановке индексных номеров одновременно образуют либо инверсию, либо порядок. Следователь- но, обе эти перестановки имеют одинаковое число инверсий s. Построение определителя n-го порядка. Пусть А = (atJ) - квадратная матрица n-го порядка. Рассмотрим произведение элемен- тов этой матрицы, взятых по одному из каждой строки и каждого столбца: ^lai&2a2 •• • (4-2) Заметим, что в этом произведении сомножители упорядочены в порядке возрастания номеров строк, при этом номера столбцов ai, а2, , ап образуют перестановку из чисел 1,2, ...,п, так как о, € {1,2,и а, а, при г j Произведений вида (4.2) в матрице А столько, сколько существует перестановок из п чисел, т.е. п! . Определителем квадратной матрицы А = (а^) n-го порядка называется сумма всевозможных произведений aia,a2a3 апа„ элементов матрицы, взятых по одному из каждой строки и каждого столбца, причем если сомножители в этом произведении упорядоче- ны в порядке возрастания номеров строк, то оно берется со знаком
28 Глава I. Матрицы Для обозначения определителя приняты символы |Д|, det Л. Итак, <211 012 • din 021 022 • ^2п И II Оп1 ОП2 • О'ПП a=(ot,a2,....a„) (4-3) где суммирование ведется по всевозможным перестановкам (01,02, ..., ап) из чисел 1,2,..., п. Каждое произведение в сумме (4.3) называется членом определи- теля, а число (-1)“^ - его знаком. Из свойств перестановки следует, что число всевозможных членов определителя n-го порядка равно п! и что при п > 2 число положи- тельных членов равно числу отрицательных и равно п!/2. Определение (4.3) для п = 2 и п = 3 приобретает вид I <121 022 I = “11 “22 - 012021, (4-4) 011 012 013 021 022 023 = ОЦО22ОЗЗ + 012023031 + 013(121032— (4.5) 031 032 033 -013022031 - 012021033 — <111023032- Для запоминания соотношений (4.4) и (4.5) существуют удобные мнемониче- ские правила, дающие схему вычисления положительных и отрицательных членов определителей второго и третьего порядков. соответственно. В этих схемах элементы, входящие в одно произведение, соедине- ны отрезками. Простейшие свойства определителя. 1°. Определитель треугольной матрицы равен произведению диа- гональных элементов. Действительно, если А = (а^) - треугольная (верхняя или ниж- няя, (1.2)) матрица n-го порядка, то все члены определителя этой матрицы, кроме аца^ о.пп, заведомо равны нулю. Поэтому
§ 4. Определители 29 |А| = (-i)^(i.2,...,n) ana22 ann = аг1а22 • ann. 2°. Определитель квадратной матрицы не изменяется при ее транспонировании: |А| = |АТ|. Доказ ател ьство. Определитель матрицы А = (а,-,) € Rnxn со- стоит из членов вида (4.2). Все множители из произведения (4.2) и в матрице АТ находятся в разных строках и разных столбцах. Следо- вательно, |А| и |АТ| состоят из одних и тех же членов. Сравним их знаки. Знак произведения (4.2) как члена |А| опре- деляется четностью перестановки а = (dj,, ап). Определим его знак как члена |АТ|. Имеем п1а1а2а2... апЛп — 2 • аа п- Упорядочим во втором произведении сомножители в порядке возра- стания номеров строк, т.е. так, чтобы номера строк образовали на- туральную перестановку: . а‘ОгП = а1101а‘20г ... а1п0п. Знак произведения (4.2) как члена |АГ| определяется четностью переста- новки 0 — (0i,02, ,0п). Но эта перестановка совпадает с переста- новкой индексных номеров в перестановке а после преобразования ее в натуральную. Согласно теореме 4.4, а(а) = а(0). Таким образом, |А| и |АГ| являются суммами одинаковых слагаемых, т.е. совпа- дают. Следствие 3. В определении (4.3) определителя можно поме- нять ролями строки и столбцы: HI = £ (-l)cr(o,)aQliaa22...aQ„n) о=(а1,...,а„) так как эта сумма равна |АГ|. Из доказанного свойства вытекает и более общий вывод: строки и столбцы матрицы равноправны с точки зрения свойств определителя. Это означает, что свойства определителя, касающиеся строк матри- цы, справедливы и для ее столбцов. Этим обстоятельством мы будем пользоваться в дальнейшем, ограничиваясь в доказательствах теорем только строчным или только столбцовым вариантом. 3°. Если одна из строк (столбцов) матрицы целиком состоит из нулей, то ее определитель равен нулю. Утверждение вытекает непосредственно из определения (4.3) опре- делителя, если учесть, что в каждый член определителя входит мно- жителем элемент из нулевой строки. 4°. При умножении строки (столбца) матрицы на число ее определитель умножается на это число. Утверждение также вытекает из определения определителя, если учесть, что в каждое слагаемое суммы (4.3) это число входит множи- телем ровно один раз и его можно вынести за знак суммы. Заметим, что свойство 4 означает, что общий множитель элементов строки (столбца) матрицы можно выносить за знак определителя. 5°. Если каждый элемент некоторой строки матрицы предста- влен в виде суммы двух слагаемых: a-ik —bk + ck, к = 1,п,
30 Глава I. Матрицы то определитель матрицы можно представить в виде суммы двух Утверждение вытекает из определения (4.3), если учесть, что «1^>; «2» . • • • . - • ^nan = — • • • ^сч • • • ®па„ “Ь ^2л2 • * * ^°ч ‘ ‘ ® Аналогичное свойство справедливо для столбцов. Замечание 1. Свойства 4 и 5 часто объединяют, называя их свойством линейности определителя относительно строк и столб- цов. 6°. При перестановке местами двух строк (столбцов) матрицы ее определитель меняет знак. Доказательство. Пусть в матрице А = (av) G Rnxn переста- вляются г-й и j-й столбцы и В - результат этой перестановки: А — [ai... at... cij... an], В = [ai... <ij ... a,... an]. Очевидно, что определители матриц А и В состоят из одних и тех же членов. Сравним их знаки. Члену аа, i... aaji... aajJ ... аапП в |А| соответствует перестановка at,..., a,,..., aj,... ,ап, а в |В| - перестановка Oj,..., a,,..., a,,..., ап. Эти перестановки отличаются друг от друга одной транспозицией, т.е. имеют разную четность. От- сюда следует, что все члены определителя |А| входят в определитель |£?| с противоположными знаками. Это означает, что |А| = — |В|. Замечание 2. Отметим, что свойство 6 относится к случаю, ко- гда переставляются строки (столбцы) с разными номерами. 7°. Определитель матрицы, имеющей две одинаковые строки (столбца), равен нулю. Утверждение вытекает из свойства 6: достаточно в матрице поме- нять местами одинаковые строки, тогда |А| — -|А| — 0. 8°. Если одна строка (столбец) матрицы является линейной комбинацией других ее строк (столбцов), то определитель матрицы равен нулю. Утверждение вытекает из свойства линейности определителя и свойства 7. 9°. Если к какой-либо строке (столбцу) матрицы прибавить ли- нейную комбинацию других ее строк (столбцов), то ее определитель не изменится. Утверждение вытекает из свойств 5 и 8. Миноры и алгебраические дополнения. Теорема Лапла- са. Пусть А = (aij) G Rmxn и fc G N, I < k < min(m, n). Вы-
§ 4. Определители 31 Jlj2-.-Jk берем в матрице А произвольные к строк и к столбцов с номера- ми ii < iz < ... < ik и ji < jz < < jk соответственно. Эле- менты матрицы Л, находящиеся на пересечении выбранных строк и столбцов, образуют квадратную матрицу к-го порядка. Определитель этой матрицы называется минором к-го порядка матрицы А, распо- ложенным в строках с номерами ii,iz, • - Ак и столбцах с номерами , jk- Для обозначения миноров приняты символы M’JJ* М(<“2'**), Мк, М. Итак, Чиз Jk7’ a»ijj ... a’k ii aii,jk Пусть теперь A = (a4) - квадратная матрица n-го порядка и "" 66 МИНОР> причем к < п. Если в матрице А вычеркнуть строки и столбцы, в которых расположен заданный минор, то остав- шиеся элементы матрицы А образуют квадратную матрицу (п — /с)-го порядка. Определитель этой матрицы называется дополнительным минором к минору Дополнительный минор обозначается символами Af’’*у *,*, М, Ма. Очевидно, что исходный минор явля- ется дополнительным к своему дополнительному минору. Дополни- тельный минор к минору , взятый со знаком (—1)ep=i(,p+Jp)i называется алгебраическим дополнением к минору ' и обозна- чается символом Л*1*2' . Итак, 4’1’2 «к _ (1 \il+>2+- - + ’k+jl+j2 + ...+jk Л7*1,2"Л* AJU3. Jk ' 17 '"jijs - jk- Теорема 4.5 (теорема Лапласа). Пусть А — (aij) е К”хп ut е N, 1 <fc<n-l. Пусть в матрице А выбраны произвольные к строк (или столбцов). Тогда определитель матрицы А равен сумме всевозможных произведений миноров к-го порядка, расположенных в выбранных строках (соответственно столбцах), на их алгебраи- ческие дополнения. Доказательство. Пусть выбраны строки с номерами ij < iz < ... <ik. Следует доказать, что detx= £ («) (J1.J3. .,jk) где суммирование ведется по всевозможным значениям ji,jz^---,jk (1 < ji <J2 < - < jk < n). Для доказательства рассмотрим подробнее правую часть требуе- мого равенства (4.6). Минор AfJ'J2'**, как определитель k-ro поряд- ка, представляет собой сумму произведений к элементов матрицы Л. Точно так же и алгебраическое дополнение Л))'? ' ’Д является суммой произведений п — к элементов матрицы Л. Значит, произведение 2 Лилейная алгебра н аналитическая геометрия
32 Глава I. Матрицы М1'2’- ,к Л 1.2 к Л1,2,...,к Рис. 1 - - 'к' a следователь110, и вся правая часть (4.6) предста- вляет собой сумму произведений п элементов матрицы А. Обозначим эту сумму через S и покажем, что она совпадает с det А как с суммой (4.3) членов определителя с соответствующими знаками. 1. Сначала покажем, что произведение 'л представляет собой не- которую сумму членов det А, причем с теми же знаками, с какими они входят в det А. а) В простейшем случае, когда ми- А — нор Mj'^ ** находится в левом верхнем углу матрицы А (рис. 1), дополнитель- ный минор будет занимать правый ниж- ний угол, при этом он будет совпадать с алгебраическим дополнением, так как (_i)(i+2+-+fc)+(H-2+...+*:) _ । Возьмем произвольный член минора A*: (-l)a(a)a10,1a2o2' ... • akai, и произвольный член дополнительного к нему минора: ( —1) ^ак4-1,/Д + 1аА:4-2,/3>[+2 • • • ап0„ Тогда произведение ^Аг‘7' ‘Д есть сумма произведений вида J2* '*JK Jij* ' 'J* ( —1) ^^П1а,1<12а2 ’ ’ • ^kaitO‘k+l,0h + i ^n0n' В этом произведении все сомножители находятся в разных стро- ках и разных столбцах матрицы А, следовательно, оно будет членом detA. Знак этого члена равен (-1)’(°ь--Д»), где Ц Но по <7(ai,... ,ctfc,^+1, . •., /З'п) = п(а) + сг(0'), так как никакое сц ни с каким /3' не образует инверсий: все оц < к, а все /3' > к. При этом <т(/3') = <т(/3), так как все инверсии и порядки в обеих переста- новках сохраняются. Таким образом, произведение А‘‘‘? представляет собой некоторую сумму членов det А, причем с теми же знаками, с какими они входят в detA. б) Общий случай минора сводится к рассмотренному сле- дующим образом. Будем переставлять ij-ю строку матрицы А после- довательно со всеми предыдущими до тех пор, пока она не займет место первой строки. Затем точно так же будем переставлять г2-ю, ..., г*-ю строки до тех пор, пока они не займут места второй, ..., к-й строк соответственно. Аналогично переставим Ji-й, .., jfc-й столбцы до тех пор, пока они не займут места первого, второго, ..., к-го столбцов. При этом всего будет выполнено (й — 1) + • + (ik — к) -f- (ji — 1) + .- + (j*, — к) — = (й + • • + 2fc) + (ji + • • • + jk) — 2(1 + • - • + к) (4-7)
§4. Определители 33 перестановок строк и столбцов матрицы А. В результате этих пере- становок матрица А преобразуется в матрицу В, в которой рассмат- риваемый минор Mj'** ** матрицы А займет левый верхний угол. Так как при указанных преобразованиях взаимное расположение строк и столбцов дополнительного минора не изменилось, то допол- нительный минор к минору в матрице А останется дополни- тельным к нему и в матрице В. Из п. "а” следует, что произведение -X является суммой членов det В с теми же знаками, с какими они входят в det В. Но, согласно свойству 6 определите- ля и равенству (4.7), det А = (—1)(ч+-+«*)+(л+- -+Ji)det В. Следо- вательно, слагаемые произведения (—l)(‘1+-+l*)+th+-+j*) Л^дХХ вх°Дят в det Л со своими знаками. 2. Из доказанного в п. 1 следует, что вся сумма S представляет собой некоторую сумму членов det А со своими знаками. 3. Покажем теперь, что в сумму S входят все члены det А. Пусть Й|О; (4’8) - произвольный член det А. В этом произведении соберем отдельно сомножители, расположенные в строках с номерами ... , г*: •’ilOi, ai2C42 • ai*a,k • (4-9) Они расположены в различных столбцах с номерами а<,,о,2,... ,а,к. Эти номера однозначно определяются заданием члена (4.8). Обозна- чим через М минор /с-го порядка матрицы А, расположенный в стро- ках с номерами и столбцах с номерами а,,, а,а,..., ailt. Тогда произведение (4.9) будет членом этого минора, а произведение остальных сомножителей (4.8), не вошедших в (4.9), - членом допол- нительного минора М к минору М. Итак, любой член определителя матрицы А может быть получен умножением определенного этим чле- ном минора М на дополнительный к нему минор М. Из доказанного в п. 1 следует, что при умножении минора М на его алгебраическое дополнение получится член (4.8) с его знаком. 4. Осталось доказать, что каждый член det А входит в сумму S ровно один раз и что других слагаемых в этой сумме нет. Для этого достаточно показать, что количество слагаемых в сумме S равно п!. Действительно, минор Л/J)’’";’* состоит из к\ слагаемых, алгебраиче- ское дополнение к нему - из (n — fc)! слагаемых. Значит, произведение "X состоит из fc!(n — /с)! членов определителя матри- цы А. Таких произведений в сумме S столько, сколько существует миноров к-го порядка в строках . ,ik, т.е. столько, сколько существует способов выбрать к столбцов - -,jk из п столбцов матрицы А. Итак, имеется таких произведений, а количество слаг гаемых в сумме S равно С*/г!(п — /с)! = п!.
34 Глава I. Матрицы Разложение определителя по строке (столбцу). Если в те- ореме Лапласа выбрать к = 1 и строку (столбец) с номером г, то минорами первого порядка, расположенными в г-й строке (столбце), будут сами элементы (а-ц). Обозначив через А^ алгебраическое дополнение к элементу a,j, получим из теоремы Лапласа, что п п det А = aij Aij (или det А = а.iAji). (4.10) j=i j=i Представление определителя в виде (4.10) называется разложе- нием определителя по г-й строке (соответственно по i-му столбцу). Итак, определитель матрицы равен сумме всех произведений эле- ментов произвольной ее строки (столбца) на свои алгебраические дополнения. Определитель квазитреугольной матрицы. Теорема 4.6. Определитель квазитреугольной матрицы ра- вен произведению определителей диагональных клеток. Доказательство. Пусть А - верхняя квазитреугольная матри- ца m-го порядка (рис. 2). Применим теорему Лапласа к группе из к столбцов матрицы А, образу- ющих ее первый клеточный столбец. В этих столбцах все миноры А:-го порядка, кроме |Ац|, за- ведомо равны нулю, а алгебра- ическое дополнение к минору |Лц | совпадает с дополнитель- ным минором. Согласно теоре- ме Лапласа отсюда следует, что |А| = |Л11| |Л|, где А - также квазитреугольная матрица, но уже (т — 1)-го порядка, начи- нающаяся с клетки A<ii- Поступая точно так же еще (m — 1) раз, получим, что |Л| — И11| ' 1^22, • • • • • |Лтт|. (4.U) Аналогично получается равенство (4.11) и для нижней квазитре- угольной матрицы. Теорема ^.1 .Определитель произведения квадратных мат- риц равен произведению определителей матриц-сомножителей. Доказательство. Пусть А — (а^), 5 = 0>ij) - квадратные матрицы n-го порядка. Рассмотрим матрицу С вида
§ 4. Определители 35 с = Йц 012 а1п a2i а22 • • &2п &nl &п2 • •• ^пп 0 -1 0 ... 0 0 -1 ... 0 0 0 ... -1 511 512 ... bin &21 ^22 • • - ^2п 5П1 5П2 . - Ъпп С одной стороны, С - квазитреугольная матрица, поэтому соглас- но (4.11) |С| = |А| - |В|. (4.12) С другой стороны, не меняя определителя матрицы С, преобразу- ем ее гак, чтобы клетка А стала нулевой. Сначала аннулируем первую строку матрицы А, для чего прибавим к первой строке матрицы С ее (п + 1)-ю, (п + 2)-ю, ... , 2п-ю строки, умноженные'на flii,ai21 • • - ,ain соответственно. В результате этих преобразований det С остается без изменения, первце п элементов первой строки матрицы С станут ну- левыми, а вторые п элементов заполнятся элементами первой строки матрицы АВ. Теперь в новой матрице выполним аналогичные пре- образования второй строки: ко второй строке матрицы С прибавим ее (п+1)-ю, (п+2)-ю,..., 2п-ю строки, умноженные на 021,022, • • • , °2п соответственно. После этих преобразований определитель матрицы С не изменится, первые п элементов второй строки матрицы С станут нулевыми, а вторые п элементов заполнятся элементами второй стро- ки матрицы АВ. Выполнив аналогичные преобразования с третьей, ... , n-й строкой матрицы С, получим матрицу _ ГО АВ 1 определитель которой равен определителю матрицы С. Переставив в матрице Ci первый и (п + 1)-й столбцы, второй и (п + 2)-й столбцы, ..., n-й и 2п-й столбцы, получим квазитреугольную матрицу Г АВ О 1 определитель которой отличается от определителя матрицы Ci мно- жителем ( —1)п. Таким образом, |С| = |С\| = (—1)П|С2| = |АВ|. Отск>- да и из равенства (4.12) получаем, что |АВ| = [А[ • |В|. (4.13) Вычисление определителя. Многие задачи линейной алгебры связаны с проблемой вычисления определителя.
36 Глава I. Матрицы Было бы весьма затруднительным вычислять определитель исходя из его определения, т.е. вычисляя непосредственно все п! членов и определяя их знаки. Для этого нужно выполнить п!п операций умножения (без учета менее трудоем- кой операции сложения чисел). Так, для п = 100 число умножений превосходит 10163 - с этим не в состоянии справиться даже самые мощные современные ком- пьютеры. Теорема Лапласа позволяет упростить проблему вычисления определителя, сводя ее к вычислению определителей более низких порядков. Однако, как видно из (4.11), (4.12), этот подход существенно эффективен лишь для матриц с большим числом нулевых элементов, сгруппированных специальным образом. Среди различных методов вычисления определителя особое место в приложениях занимает метод Гаусса. Метод Гаусса применяется для решения широкого класса матрич- ных задач. Идея этого метода проста и естественна. Она состоит в том, что: • выделяется тип матрицы, для которой задача решается достав точно просто; • выделяется тип преобразований, которые либо не изменяют ре- шений задачи, либо изменяют их контролируемым образом; • произвольная матрица выделенными преобразованиями приво- дится к выделенному типу, тем самым задача общего вида сводится к более простой. В применении к задаче вычисления определителя эта схема вы- глядит следующим образом: - определитель треугольной матрицы равен произведению диаго- нальных элементов (свойство 1); - элементарные преобразования матрицы либо не изменяют опре- делителя (свойство 9), либо изменяют (свойства 4 и 6), но так, что эти изменения можно легко восстановить; - произвольная квадратная матрица элементарными преобразова- ниями приводится к треугольной форме (теорема 3.1). Метод Гаусса вычисления определителя состоит в приведении мат- рицы элементарными преобразованиями к треугольному виду, вычи- слении определителя получившейся треугольной матрицы и восстано- влении исходного определителя, если использовались элементарные преобразования типов 1 и 2 (§3). Замечание 3. В методе Гаусса вычисления определителя можно использо- вать элементарные преобразования как строк, так и столбцов. Замечание 4. Для вычисления определителя п-го порядка методом Гаусса требуется выполнить + О(п2) операций умножения двух чисел. Теперь для п = 100 определитель может быть вычислен быстрее чем за одну секунду на компьютере с быстродействием 106 арифметических операций в секунду. § 5. Обратная матрица Условие обратимости. Матрица А-1 называется обратной к матрице А, если АА-1 = А-1 А = I. Матрица А, для которой су- ществует обратная матрица, называется обратимой.
§ 5. Обратная матрица 37 Из определения следует, что обратимой может быть лишь ква- дратная матрица, так как равенство АА~1 = А-1 А возможно лишь для квадратных матриц А и А~1 одинакового порядка. Но не ка- т л ( 0 0 \ ждая квадратная матрица обратима. 1ак, матрица А = I j I при умножении справа на любую матрицу дает матрицу с нулевой первой строкой, т.е. ни для какой матрицы В произведение АВ не может совпадать с единичной матрицей I. Выясним, какие свойства матрицы обеспечивают ее обратимость. Квадратная матрица А называется вырожденной (особенной), ес- ли |А| = 0, и невырожденной (неособенной), если | А| z- 0. Пусть А = (atJ) eRnxn. Матрица ’ Ац А21 А12 А 22 . А)п А-_>п А а! АП2 Ann . (5.1) составленная из алгебраических дополнений AtJ к элементам аг] мат- рицы А, называется присоединенной (взаимной) к матрице А. Теорема 5.1 (о фальшивом разложении определите- ля). Сумма произведений элементов одной строки (столбца) мат- рицы на алгебраические дополнения к элементам другой ее строки (соответственно столбца) равна нулю. Доказательство. Пусть А = (а^) е Rnxn. Покажем, что для любых ее двух строк г, j, где г j, п *aisAjS =0. (5-2) з= 1 Рассмотрим вспомогательную матрицу В, которая отличается от А только j-й строкой: на месте j-й строки в В находится г-я строка матрицы А. С одной стороны, det В = 0 (§4, свойство 7). С другой сторо- ны, det В = I2s=i a”AjS. так как в разложении det В по j-й стро- ке алгебраические дополнения к элементам j-й строки матрицы В получаются вычеркиванием j-й строки и поэтому совпадают с ал- гебраическими дополнениями A3S к элементам j-й строки матрицы А. Отсюда следует (5.2). Аналогично доказывается столбцовый вариант теоремы. Доказанную теорему иногда называют теоремой о “чужих” ал- гебраических дополнениях. Напомним, что в этой терминологии умно- жение на “свои” алгебраические дополнения дает разложение (4.10) определителя по строке (столбцу соответственно). Теорема 5.2 (критерий обратимости). Матрица обра- тима тогда и только тогда, когда она не вырождена.
38 Глава I. Матрицы Доказательство. Необходимость. Пусть матрица А обра- тима. Тогда существует обратная матрица А'1 такая, что АЛ-1 = I. Взяв определители от обеих частей этого равенства, согласно (4.13) получим, что | А|• | А~11 = |Г|, т.е. | А|• |А"11 — 1. Следовательно, | А| / 0. Достаточность. Пусть |А| / 0. Покажем, что матрица гН является обратной к матрице А. В самом деле, из разложения опреде- лителя по строке (столбцу) и теоремы 5.1 имеем, что АА = АА = |А|I. Следовательно, Ац|А = ц]АА = Д т.е. Теорема 5.3 (о единственности обратной матрицы). Если А - квадратная матрица и АВ — I (или В А = I), то В — А-1. Доказательство. Из равенства АВ = I следует, что В - ква- дратная матрица и, согласно (4.13), А не вырождена. Следовательно, матрица А обратима и для нее существует обратная матрица А-1. То- гда А-1 = А-1(АВ) = (А-1А)В = IB — В. Таким образом, В = А-1. Аналогично рассматривается случай, когда В А — I. Доказанная теорема устанавливает свойство единственности обратной матрицы, и, более того, из нее следует, что для квадратной матрицы А одного из равенств АА-1 = I или А-1 А = I достаточно, чтобы матрица А-1 была обратной к матрице А. Некоторые свойства обратной матрицы. 1. /-1 = I, так как 11 = 1. 2. |А~11 = 1/|А|, так как |А| |А-1| = 1. 3. (А-1)-1 = А, так как АА-1 = А-1А = I. 4. (Ат)-1 = (А-1)т, так как (А-1)ТАТ = (АА-1)Т = IT = I. 5. (АВ)”1 = В-’А-1, так как (АВ)(В“1А-1) = I. Вычисление обратной матрицы. Соотношение (5.3) дает явный вид обратной матрицы. Оно полезно в теорети- ческих исследованиях и совершенно неэффективно для практического вычисле- ния (разве что для матриц второго порядка) вследствие большого объема требуе- мых вычислений. В самом деле, для получения обратной матрицы к матрице п-го порядка согласно (5.3) требуется вычислить п2 определителей (п — 1)-го порядка и один определитель n-го порядка. В вычислительной математике используют- ся различные дополнительные приемы вычисления обратной матрицы, которые по объему вычислений равносильны вычислению всего лишь двух определителей n-го порядка. Опишем один из них. Теорема 5.4. Произвольная невырожденная матрица эле- ментарными преобразованиями только строк (только столбцов) приводится к единичной матрице. Док азател ьство. Рассмотрим строчный вариант теоремы. Пусть А = (aij) € Rnxn и det А 0. Применим к матрице А основной процесс (теорема 3.1). Так как А - квадратная матрица, то оконча- тельная ступенчатая матрица будет треугольной. Ввиду невырожден- ности исходной матрицы она также будет невырожденной и ее диаго- нальные элементы будут отличны от нуля. Разделив каждую строку
§ 5. Обратная матрица 39 на ее диагональный элемент, т.е. выполнив элементарные преобразо- вания строк, получим треугольную матрицу вида 1 “12 “13 • • • “in О 1 023 • - - “2п О 0 0 ... 1 (5-4) Если представить процесс приведения матрицы к верхней ступен- чатой форме как преобразование матрицы “слева направо” (в таком порядке аннулируются столбцы), то теперь будем выполнять анало- гичные преобразования “справа налево”. На первом шаге с помощью последней строки аннулируем все наддиагональные элементы послед- него столбца, вычитая из первых (п — 1) строк последнюю строку, умноженную на “in,“2n, • • ,“n-i,n соответственно. На втором шаге из первых (п — 2) строк вычитаем (п — 1)-ю строку, умноженную на ai>n-i,“з,п-1, - ;“п-2,п-1 соответственно. Выполнив аналогичные преобразования, через (п — 1) шагов получим единичную матрицу. Отметим, что на каждом шаге изменяются элементы только одно- го аннулируемого столбца. Если в доказательстве поменять ролями строки и столбцы, то получим утверждение столбцового варианта тео- ремы. Доказанная теорема может быть переформулирована в терминах матриц элементарных преобразований (теорема 3.2). Для строчно- го варианта: существуют матрицы элементарных преобразований L\, L2l ... , Lk такие, что LkLk-i •. • LiL^A = I. Отсюда в силу теоремы 5.3 следует, что Л-1 = LfcLk-i... L2L1 или А 1 = L/cLjc-i LzLiI. Это означает, что для получения обратной матрицы достаточно к строкам единичной матрицы I применить те преобразования, ко- торые приводят матрицу А к единичной матрице. Для этого удобно составить расширенную матрицу [Л| У] и над строками этой матрицы выполнить те преобразования, которые матрицу А приводят к еди- ничной; тогда на месте матрицы I окажется обратная матрица Л-1. Итак, Этот метод вычисления обратной матрицы называется методом Жордана или методом Гаусса-Жордана.
40 Глава, I. Матрицы Замечание. Если в расширенных матрицах (5.5) и (5.6) единич- ную матрицу I заменить матрицей В, то вместо матрицы А-1 полу- чим в первом случае матрицу А~1В, а во втором - матрицу ВА-1: А В в преобразования строк I А~1В преобразования столбцов I ВА~1 так как A~lB = LkLk-i • ^Ь^В, BA~l — BL1L2 - Lk- Приведение к диагональной форме. Незначительным измене- нием процесса, описанного в доказательстве теоремы 5.4, можно при- вести квадратную матрицу А общего вида к диагональной форме. Для этого достаточно элементарными преобразованиями строк и столбцов привести матрицу А к верхней трапециевидной форме, разделить ка- ждую ненулевую строку трапециевидной матрицы на свой диагональ- ный элемент, затем с помощью первого столбца аннулировать все над- диагональные элементы первой строки, с помощью второго столбца - все надциагоналъные элементы второй строки, и т. д. Этот же процесс, примененный к прямоугольной матрице, приве- дет ее к форме, называемой прямоугольной диагональной формой: <21 <2п 0 или £(7-разложение матрицы. Из первой части доказательства те- оремы 5.4 следует, что любая невырожденная матрица элементарны- ми преобразованиями строк 1-го и 3-го типов приводится к верхней треугольной форме (5.4). На языке матриц элементарных преобразо- ваний это означает, что существуют нижние треугольные матрицы L1,..., Lk (см.(3.1)), такие, что LkLk-i...LvA = U или A = L^1 ...L^L^U. (5.7) Отметим, что среди матриц Lj,..., Lfc (а следовательно, и среди матриц Lfг,..., *) нижними треугольными являются лишь те, ко- торые соответствуют элементарным преобразованиям строк 3-го типа. Выделим класс невырожденных матриц, для котрых в основном процессе приведения к верхней треугольной форме можно обойтись
§5. Обратная матрица 41 без элементарных преобразований строки 1-го типа (т.е. перестановок строк). Назовем угловым минором порядка к квадратной матрицы А минор Afj j’' т.е. минор, расположенный в строках и столбцах с номерами 1,2,..., к. Пусть в матрице A G Rnxn все угловые миноры Д1, Д2,..., Д^ отличны от нуля. Так как — ац / 0, то элемент ац можно выбрать ведущим элементом первого шага (см. доказательство теоремы 3.1). Кроме того, элементарные преобразования строк 3-го типа, выполняемые на первом шаге, не меняют значения всех угловых миноров матрицы А, поэтому все угловые миноры матрицы Ai, к которой применяются преобразования второго шага, также отличны от нуля. Тем самым, на втором шаге основного процесса также можно обойтись без перестановок строк и т.д. Если все матрицы ..., Lk в (5.7) - нижние треугольные, то и L = LJ"1... 1 _ нижняя треугольная матрица (проверьте!). Таким образом, любая квадратная матрица А, у которой все угло- вые миноры отличны от нуля, может быть представлена в виде А = LU, (5.8) где L - нижняя, U - верхняя треугольная матрицы. Представление (5.8) называется LU-разложением матрицы А.
Глава И. Теоретико-множественные понятия Здесь излагаются первоначальные теоретико-множественные по- нятия, которые будут использоваться в последующих главах. § 6. Множества Под множеством в математике понимается совокупность объек- тов, называемых элементами множества. Как правило, множество обозначается прописной буквой какого-либо алфа- вита, а его элементы - строчными буквами того же или другого алфавита. Для некоторых множеств приняты стандартные обозначения. Так, буквами N, Z, Q, R обозначают соответственно множества всех натуральных, целых, рациональных, вещественных чисел. Множества с конечным числом элементов могут быть описа- ны путем явного перечисления всех их элементов, элементы при этом заключают- ся в фигурные скобки. Например, {0,1,2}- множество остатков от деления целых чисел на число 3. Множество, не содержащее ни одного элемента, называется пу- стым множеством. Мы будем обозначать его символом 0. Множество S называется подмножеством множества X, если име- ет место импликация: х £ S => х G X. Обозначение: S С X. Пустое множество по определению является подмножеством любого множества. Для задания подмножества S С X используется его характеристи- ческое свойство, т.е. свойство, присущее только элементам из S. Так, запись {n = 2k | к € Z} задает множество всех четных чисел. Два множества X и Y называются равными, если каждое из них является подмножеством другого, т.е. X = Y {усХ. (61) Если S С X, причем S 0, S X, то S называется собственным подмножеством множества X. Объединением (суммой или соединением) множеств X и Y называ- ется множество всех элементов, которые принадлежат хота бы одному из множеств X или Y. Обозначение: X U Y. Итак, X U Y = {т| х G X или х G У}. Пересечением множеств X и У называется множество всех эле- ментов, одновременно принадлежащих как X, так и У. Обозначение: ХПУ. Итак, X ПУ = {z|x€X, j 6 У}.
§ 7. Эквивалентность 43 Разностью множеств X и Y называется множество всех элементов из X, которые не содержатся в У. Обозначение: Х\У или X — Y. Итак, Х\У = {х | х 6 X, х У}. Если У С X, то разность Х\У называется дополнением множества У до множества X. Обозначение: У, СУ или С%У. Декартовым произведением множеств X и У называется множе- ство всевозможных упорядоченных пар (х, у), в которых х € X, у € У. Обозначение: X х У. Итак, X х У = {(х, у) | х € X, у 6 У}. Декартово произведение X х X называется декартовым квадра- том множества X и обозначается символом X2. Множество всех пар (х, х), где х € X, называется диагональю декартова квадрата мно- жества X. Примеры. 1. Множество Q всех рациональных чисел можно рас- сматривать как декартово произведение Z х N. 2. Множество декартовых координат всех точек плоскости пред- ставляет собой декартов квадрат R2. 3. Если упорядоченную пару (а, 6) вещественных чисел изобраг жать точкой плоскости с абсциссой а и ординатой Ь, то декартовы произведения X х У и У х X множеств, указанных на рис. 1, изобра- зятся точками соответствующих прямоугольников. § 7. Эквивалентность В математике, в логических рассуждениях, а также в обыденной жизни мы сталкиваемся с необходимостью сравнивать два элемента множества: равенство (и неравенство) двух чисел, равенство матриц, равенство множеств, подобие тре- угольников, эквивалентность уравнений и т.д, Во всех этих случаях между двумя элементами множества определено некоторое отношение, и в каждом случае вве- дено правило, по которому устанавливается, находятся ли заданные два элемента в этом отношении или нет. Несмотря на разнообразие этих отношений, оказывает- ся, что с математической точки зрения они являются конкретными проявлениями одного и того же понятия. Введем его. Бинарное отношение. Говорят, что на множестве X задано би- нарное отношение 7Z, если указано непустое подмножество 1Z декарто- ва квадрата этого множества. Если при этом (х, у) € И, то говорят, что элементы х и у связаны отношением Л, и обозначают символом хЛу.
44 Глава II. Теоретико-множественные понятия Равенство х = у и неравенство х < у действительных чисел, ра- венство матриц А = В, равенство множеств X = Y и пр. - все это примеры бинарных отношений. В самом деле, рассмотрим один из них - отношение " <" на множестве R всех действительных чисел. Пара чисел х, у € R, для которой х < у, является элементом R2. Множество всех таких пар обра- зует подмножество 11 декарто- ва квадрата R2 - на рис. 2 они изображаются точками плоско- сти R2, которые лежат выше прямой у = х. Задание это- го множества 1Z определяет би- нарное отношение на множестве действительных чисел, а отно- шение хНу (т.е. (х,у) € К) есть не что иное, как х < у. Заметим, что бинарное отношение равенства вещественных чисел задается прямой у — х, т.е. диагональю декартова квадрата R2. Бинарное отношение 11 на множестве X называется: • рефлексивным, если xllx, 'ix € X; • симметричным, если имеет место импликация x"R.y => y1Zx; • транзитивным, если имеет место импликация хВ.у, yR.z => xB.z. Отношение эквивалентности. Важным классом бинарных от- ношений являются бинарные отношения, описывающие свойство “схожести”, - отношения эквивалентности. Бинарное отношение £ на множестве X называется отношением эквивалентности, если оно рефлексивно, симметрично и транзитив- но. Если пара элементов х,у € X связана отношением эквивалентно- сти, то говорят, что х и у эквивалентны, и обозначают это символом х ~ у. В конкретных случаях вместо этого символа могут быть ис- пользованы и другие, например х = у, х = у. Отношения эквивалентности играют важную роль в математических исследо- ваниях. Назвав два элемента эквивалентными, мы игнорируем те различия между ними, которые не существенны в рассматриваемой задаче. В каждой конкрет- ной задаче мы различаем или не различаем элементы лишь в отношении тех их свойств, которыми интересуемся в данный момент. Известное правило равенства обыкновенных дробей (pi/Qi = если ptgj = 91Р2) является отношением эквивалентности. Назвав дроби | и | равными, мы игнорируем их несовпадение как дробей и считаем, что они определяют одно и то же рациональное число. Уже этот простейший пример подсказывает, что эквивалентные элементы множества целесообразно объединять в один объект. Пусть на множестве X задано отношение эквивалентности 8 и а е X. Множество всевозможных элементов х G X, эквивалентных а, называется классом эквивалентности, порожденным элементом а. Обозначение: cl (а). Итак, с!(а) = {т е ~ а} . Любой элемент класса эквивалентности называется представителем класса. Теорема 7.1. Класс эквивалентности порождается любым своим представителем, т.е. если Ь е с! (а), то с! (Ь) — cl (а).
§ 7. Эквивалентность 45 Для доказательства равенства этих множеств достаточно показать двустороннее вложение (6.1) их друг в друга. Действительно, с е cl (Ь) => с ~ Ь, но b ~ a => с ~ a => с € cl (а), с € с! (а) => с ~ а, но a ~ b => с ~ b => с € с! (6). Теорема 7.2. Два класса эквивалентности либо не пересе- каются, либо совпадают. Действительно, любые два класса cl (а) и cl (й) либо не пересека- ются, либо имеют хотя бы один общий элемент. Но в последнем случае они совпадают, так как если с 6 cl (а), с € cl (й), то в силу теоремы 7.1 с1(а) = с1(й). Из теоремы 7.2 и очевидного факта, что любой элемент множества содержится в одном из классов эквивалентности (а е с1(а)), следует, что все множество разбивается на непересекающиеся классы экви- валентности. Множество всех классов эквивалентности называется фактор-множеством множества X по отношению эквивалентно- сти £ и обозначается символом Х]£. Как уже отмечалось выше, одни и те же элементы множества, эквивалентные при одном отношении эквивалентности, могут ока- заться неэквивалентными при другом. Все зависит от задачи, а в разных задачах мы можем интересоваться различными свойствами одних и тех же элементов. Проиллюстрируем это на примерах раз- личных отношений эквивалентности на множестве Z целых чисел. Примеры. 1. Положим т ~ п, еслит — п. Это тривиальный пример отношения эквивалентности, сводящегося к простому совпа- дению. Очевидно, что cl (т) = {т} и Z|£ = Z. 2. Положим т ~ п, если тип имеют одинаковую четность. Нетрудно проверить, что это бинарное отношение является отноше- нием эквивалентности. Очевидно, что при таком отношении эквива- лентности все множество Z разбивается на два класса эквивалент- ности: Са = cl (0) = {2k | k G Z} - множество всех четных чисел и Ci = cl (1) = {2к + 11 к 6 Z} - множество всех нечетных чисел. Итак, Z|£ = {Со, Ci}. Такое разбиение множества целых чисел на классы нам знакомо из обыденной жизни, например, деление множества домов улицы на четную и нечетную сторону. 3. Пусть р е N, р > 1. Два целых числа тип называются срав- нимыми по модулю р, если при делении на р они дают одинаковые остатки, т.е. если т — п — рк, где к € Z. Обозначение: т = n(modp). Итак, т = n(modp) <=> т — п = рк, к € Z. (7.1) Положим т ~ п, если т = n(modp). Нетрудно проверить, что бинарное отношение (7.1) является отношением эквивалентности. Найдем классы эквивалентности. Пусть т при делении на р да- ет в остатке г. Очевидно, 0 < г < р — 1. Тогда cl (т) = {п = рк + + г | к G Z} - множество всех целых чисел п, дающих при делении на р остаток г. Так как при делении на р возможно ровно р различных
46 Глава П. Теоретико-множественные понятия остатков: 0,1,... ,р — 1, то количество классов эквивалентности равно р. Обозначения: Ст = {n — pk + r\k 6 Z}, где 0 < г < р — 1, и Zp - фактор-множество множества Z по отношению эквивалентно- сти (7-1). В этих обозначениях Zp = {Со, Ci,..., Cp_i}. Множество Zp называют множеством классов вычетов по модулю р. § 8. Отображения Определения, простейшие свойства. Пусть X, Y - два мно- жества. Отображением f множества X во множество У называется закон, посредством которого произвольному элементу х G X ставится в соответствие однозначно определенный элемент у € У; при этом эле- мент у называется образом элемента х , а элемент х - прообразом эле- мента у. Символически отображение записывается в виде f : X —> У или X -4 У. Запись у = f(x) или х i-> у означает, что элемент х при отображении f переходит в элемент у. Отображение множества X во множество У называют также пре- образованием множества X в Y, или оператором, действующим из множества X во множество У, или функцией, определенной на X со значениями в У. Все эти названия употребляются в одинаковом смысле, и их использование диктуется соображениями удобства или желанием подчеркнуть тот или иной аспект. В случае X = У говорят об отображении в себя. Полным прообразом элемента у € У называется множество1 ГЧг/) = {*£*!/(*) = у}- Образом отображения f называется множество im/ = {у = /(х)|® е X}. Вместо символа im / используется также символ /(X). Отображение / : X —> У называется: • инъективным, если из того, что xi / тг, следует, что /(xj) /(тг), или, другими словами, если уравнение /(х) = у (8.1) при любом у £ У имеет не более одного решения; • сюръективным или отображением на, если im / -- У, или, дру- гими словами, если уравнение (8.1) при любом у € У имеет хотя бы одно решение; • биективным или взаимно однозначным, если оно и инъектив- но, и сюръективно, или, другими словами, если уравнение (8.1) при любом у 6 У имеет, и притом единственное, решение. Примеры. 1. Пусть а € R и R+ - множество всех неотрицатель- ных действительных чисел. Соответствие а •-> |а| определяет три 1 Символ 1 (j/) не следует ассоциировать с обратным отображением (8.5), ко- торое может и не существовать.
§ 8. Отображения 47 различных отображения f : R —> К, д : R >-* R+, h : R+ —> R+. Отображение f не инъективно и не сюръективно, д - не инъективно, но сюръективно, h - биективно. 2. Пусть А € Rnxn. Соответствие А >-> det А определяет отображе- ние f : Rnxn —> R, не инъективное, но сюръективное. 3. Пусть a, b € R. Соответствие (а, b) а+Ъ определяет отображе- ние / : R к R —> R, не инъективное, но сюръективное. Таким образом, операцию сложения чисел можно рассматривать как отображение де- картова квадрата множества R в R. Этим обстоятельством мы вос- пользуемся в дальнейшем. Два отображения f : X —> У и д : X —> У называются равными, если f(x) — g(x), Vi е X. Обозначение: f = д. Тождественным (единичным) отображением на множестве X называется отображение ex : X —> X, которое переводит каждый элемент х € X в себя. Произведение отображений. Произведением (суперпозицией или композицией) отображений g : X —> Y и f : У —> Z называ- ется отображение fg : X —> Z, определенное правилом /<?(*) = /Ш)- Vi € X. (8.2) Таким образом, произведение отображений есть последовательное вы- полнение отображений-сомножителей, причем если символ отображе- ния рассматривать как рецепт для выполнения определенных дей- ствий, то символ произведения fg следует читать справа налево. Заметим, что произведение отображений некоммутативно. Даже в случаях, когда оба произведения fg и gf имеют смысл, произве- дение, вообще говоря, зависит от порядка выполнения отображений. В этом легко убедиться на примере, когда X = У = R, /(i) = i + + 5, 5(1) = |х|. Произведение отображений обладает следующими свойствами. 1. fex = /; eyf = f для любого отображения f : X —> У. Проверка этого свойства предоставляется читателю. 2. Произведение отображений ассоциативно, т.е. если h : X -> У, g : У -> Z, f : Z -> U, то f(gh) = (fg)h. Доказательство. В соответствии с определением равенства отображений нужно просто сравнить значения отображений f(gh) : X -> U и (fg)h : X —> U в произвольной "точке" х 6 X. Согласно определению (8.2) произведения отображений имеем (/(5ft))(i) = f((ff/i)(x)) = /(<?(Л(х))) = (/р)(Л(х)) = ((/р)Л)(х). 3. Произведение инъективных (сюръективных, биективных) отображений инъективно (соответственно сюръективно, биек- тивно). Доказательство. Пусть g : X —> У, f :Y —> Z - инъективные отображения и пусть ij V i2- Тогда из инъективности g следует, что g(ii) / g(x2), а из инъективности f следует, что /(p(ij)) / /(р(хг)), т.е. fg(xi) / fg(x2).
48 Глава II. Теоретико-множественные понятия Пусть теперь f и д сюръективны. Тогда для любого z е Z в силу сюръективности / существует у € Y такой, что z = f(y). Но для этого элемента у в силу сюръективности д существует элемент х € X такой, что у = д(х)- Таким образом, для любого элемента z € Z существует элемент х е X такой, что z = /(у(т)), т.е. z = fg(x). Биективность вытекает из сюръективности и инъективности. Обратное отображение. Пусть / : X —> У. Отображение : Y -> X называется обратным к отображению /, если f~lf = eX, ff~l = eY. (8.3) Заметим, что из этого определения следует, что / - обратное отображение к отображению /-1. Отображение, для которого суще- ствует обратное отображение, называется обратимым. Если выполнено только одно из равенств (8.3), то отбражение /-1 называется соответственно левым или правым обратным. Теорема 8.1 (критерий обратимости). Отображение обратимо тогда и только тогда, когда оно биективно. Лемма. Если g : X —> У, f : У —> X и fg = ех, то g инъектив- но, a f сюръективно. Действительно, если g не инъективно, то существуют элементы Х1,х2 € X такие, что х\ х2, а д(х\) = д(х2). Тогда ii = ex(ii) = = /$(zi) = /(s(^i)) = /(9(^2)) = /9(^2) = ех(х2) = х2. Следова- тельно, д инъективно. Далее, если х - произвольный элемент X, то х = ех(х) = fg(x) = /(у(т)) = /(у), где у = д(х) е У. Это доказывает сюръективность /. Лемма доказана. Доказательство теоремы. Необходимость. Пусть f об- ратимо. Тогда из (8.3) и леммы следует, что f инъективно и сюръек- тивно, т.е. / биективно. Достаточность. Пусть / биективно, тогда для любого у G У существует единственный прообраз х € X. Построим отображение д : У -> X, положив д(у) = х. Тогда для любого у € У имеем (/у)(у) = /(9(у)) = f(x) - У, т.е. /9 = еу, а для любого х & X имеем (у/)(х) = у(/(т)) = у(у) = х, т.е. gf = ех. Таким образом, д = и / обратимо. Отметим еще два свойства обратимых отображений. 1. Обратное отображение единственно, так как если Д-1, /у1 - два обратных отображения к отображению f : X У, то Д-1 = = f^ey = /ГЧ/Я1) = (/Г1/)^1 = eXf^ = /Г1- 2. Произведение обратимых отображений обратимо, при этом (/у)-1 = у-1/-1. Действительно, произведение fg обратимо как произведение биективных отображений, при этом (/<?)(у-1/-1) = = f(99-1)/-1 = //-1 = er, (9-1/-1)(/9) = 9-1(/_1/)9 = 9-19 = ех. Перестановки (подстановки) n-го порядка. Пусть X — конеч- ное множество, состоящее из п элементов. Перенумеруем эти элемен- ты и будем считать, что X = {1,2,... ,п}. При биективном отображе- нии f множества X на себя его элементы преобразуются следующим
§ 8. Отображения 49 образом: /(1) = оц, /(2) = а2, • • -, f(n) = an, где at € {1,2,..., п} и а, / aj при г ф j. Таким образом, оц, а2, - • -, — перестановка из первых п натуральных чисел. Биективное отображение / конечного множества X на себя называется перестановкой (или подстановкой) n-го порядка. Обозначение: (8-4) или / = («!, «2, ап). (8-5) В записи (8.4) отображение / чаще называют подстановкой, а в записи (8.5) - перестановкой. Очевидно, перестановка столбцов в (8.4) дает другую запись той же подстановки: Z/3i 02 ... /Зп\ \71 72 7п/ ’ (8-6) где /31, /32,.. •, 0п и 71,72,..., 7П - перестановки из первых п натураль- ных чисел и 7fc = f(J3k), к — l,n. Подстановка (8.6) называется четной, если перестановки /31,/32,... ... ,/Зп и 71,7г,... ,7п имеют одинаковую четность, т.е. если ст(а) + + сг(/3) - четно, и нечетной в противном случае. Пусть Sn - множество всех подстановок n-го порядка. Произве- дение fg подстановок f,g € Sn снова будет подстановкой из Sn (как произведение биективных отображений) и выполняется по правилу 1 2 ... п \ ./(<?(!)) /(5(2)) ... /(5(п))/’ Подстановка /1 2 V 2 п п называется тождественной, подстановка 7 72 7п /31 02 ••• 0п является обратной к подстановке (8.6).
50 Глава П. Теоретико-множественные понятия § 9. Алгебраические законы Внутренний закон композиции. Внутренним законом компо- зиции (алгебраической операцией) на множестве X называется ото- бражение * : X х X -> X, т.е. закон, посредством которого любой упорядоченной паре элемен- тов a, b € X ставится в соответствие однозначно определенный эле- мент с G X. Тот факт, что (а, Ь) с, записывается символически в виде а * Ь = с. В конкретных случаях вместо символа * используют символы , х, : и др. Примеры. 1. На множестве натуральных чисел N операции сло- жения и умножения чисел являются алгебраическими операциями, так как любые два натуральных числа можно сложить (и умножить), при этом результатом будет также натуральное число. На этом же множестве операции вычитания и деления не являются алгебраическими операциями, так как результаты выполнения этих операций не всегда будут натуральными числами. 2. На множестве вещественных чисел R операции сложения, вы- читания, умножения (но не деления) чисел будут алгебраическими операциями. 3. На множестве ненулевых вещественных чисел R\{0} операции умножения и деления (но не сложения и вычитания) будут алгебраи- ческими операциями. 4. На множестве Rmxn матриц размера т х п, где т =£ п, операции сложения и вычитания (но не умножения) матриц являются алгебра- ическими операциями. 5. На множестве Rnxn квадратных матриц п-го порядка операции сложения, вычитания и умножения матриц - алгебраические опера- ции. 6. На множестве Sn подстановок п-го порядка умножение подста- новок является алгебраической операцией. Алгебраическая операция * на множестве X называется: • коммутативной, если а ♦ b = b * a, Va, b € X, • ассоциативной, если (а * Ь) * с = а * (b * с), Va, b, с G X. Операции сложения и умножения чисел в R коммутативны и ас- социативны. Сложение матриц, как уже отмечалось в §2, также ком- мутативно и ассоциативно. Примером некоммутативной, но ассоци- ативной алгебраической операции могут служить операции умноже- ния матриц в Rnxn и суперпозиции отображений на множестве всех отображений множества X в себя. Обобщенная ассоциативность. Свойство ассоциативности ал- гебраической операции означает, что результат применения операции к трем элементам не зависит от распределения скобок, указывающих на порядок последовательного применения операции к парам элемен-
§ 9. Алгебраические законы 51 тов. Для ассоциативной операции это же верно и для любого конеч- ного числа п элементов. Теорема 9.1. Если алгебраическая операция * на множе- стве X ассоциативна, то результат ее применения к п элементам не зависит от расстановки скобок, лишь бы скобки объединяли па- ры элементов, указывая на порядок последовательного применения операции к двум элементам. Доказательство. Докажем индукцией по п. Для п = 3 оно, очевидно, верно. Пусть утверждение верно для любого к < п, дока- жем его для к = п. Пусть в выражении ai * аг * • • * ап произволь- ным образом расставлены скобки. Заметим, что последним шагом бу- дет всегда выполнение операции над двумя элементами ai ♦ • • • * at и ajt+i * * ап, 1 < к < п — 1. Так как к < п, то оба выражения не зависят от распределения скобок. Осталось показать, что (ai * • • • * a*) * (afc+i ♦ • • • ♦ ап) ~ (ai * • • • * am) ♦ (am+i * • - • * аД где 1 < m < п — 1. Пусть к < т. Обозначим а\ * • • • * а* = а, а^41 * • * ат — б, j ♦ • • * * ап — с. Надо показать, что а * (b * с) = (а * Ь) ♦ с, а это действительно верно. Элемент е € X называется нейтральным элементом множества X относительно алгебраической операции *, если Va 6 X: а*е = е*а = а. Примеры. 1. Очевидно, что число 0 € R является нейтральным элементом относительно операции сложения чисел в R, а матрица О & Rmxn - нейтральным элементом относительно сложения матриц в Rmxn. Операции вычитания чисел и матриц не обладают нейтраль- ными элементами. 2. Также очевидно, что 1 €Йи/€ Rnxn являются нейтральными элементами относительно операций умножения чисел в R и матриц в Rnxn соответственно. Операция умножения на множестве всех чет- ных чисел, являясь алгебраической операцией, не обладает нейтраль- ным элементом. Теорема 9.2. Нейтральный элемент единствен. Доказательство. Действительно, если е! и е2 - два нейтраль- ных элемента, то ej * е2 = ei, так как е2 - нейтральный элемент, и Ci * е2 = е2, так как ej - нейтральный элемент. Значит, ei = е2. Пусть * - алгебраическая операция на множестве X, обладающая нейтральным элементом е. Элемент х' называется симметричным элементом дпя элемента х € X, если х * х' — х' * х = е. Примеры. Очевидно, что любое число а € R. и любая матрица А € Rmxn обладают симметричным элементом относительно опера- ции сложения: ими являются соответственно противоположное число —а и противоположная матрица —А. Что же касается умножения чисел в R и умножения матриц в R"xn, то не каждый элемент обладает симметричным: только йену-
52 Глава П. Теоретико-множественные понятия левое число а € R и невырожденная матрица А € Rnxn имеют сим- метричные элементы: ими являются соответственно обратное число а-1 и обратная матрица А-1 (§5). Теорема 9.3. Симметричный элемент относительно ассо- циативной алгебраической операции единствен. Доказательство. Действительно, если х' и х" - два симметрич- ных элемента к элементу х € X, то х' = х' * е = х' ♦ (х * х") = (х' * х) * х" — е * х" = х". Замечание. В определении нейтрального и симметричного элементов мы считали, что т♦e = e*I = xиx♦т, = 1/*т = е. Но можно рассматривать только равенства 1»е = хих*х' = е (или е« 1 = х и х' » х = е) и говорить о правом нейтральном и правом, симметричном элементах (или о левом нейтральном и левом симметричном). Этим обобщением мы будем иногда пользоваться. Говорят, что алгебраическая операция * на множестве X обладает обратной операцией, если для любых двух элементов a, b G X урав- нения а * х = b и у * а = Ь имеют единственное решение. Наличие обратной операции означает существование двух алгеб- раических операций. Первая ставит в соответствие любой упорядо- ченной паре элементов а, Ъ € X однозначно определенный элемент х € X такой, что а * х = Ь, и называется правой обратной операцией к операции *, а вторая - элемент у € X такой, что у * а = Ь, и назы- вается левой обратной операцией. Но если алгебраическая операция * коммутативна, то х — у и обе операции совпадают и определяют обратную операцию к операции *. Очевидно, вычитание чисел в R и вычитание матриц в Rmxn - операции, обратные к операции сложения в® и Rmxn. Пусть *i и *2 - две алгебраические операции на множестве X. Алгебраическая операция *i называется дистрибутивной справа от- носительно алгебраической операции *2, если (а *2 5) *i с = (а *i с) *2 (5*i с), Уа, b,c е X; дистрибутивной слева, если а *! (Ь *2 с) = (а *i 6) *2 (а *i с), Уа, Ь, с € X; и дистрибутивной, если она дистрибутивна и справа и слева. Пример. Умножение чисел в R (матриц в Rnxn) дистрибутивно относительно сложения в R (Rnxn соответственно). Но сложение не дистрибутивно относительно умножения. Пусть на множестве X задано отношение эквивалентности. Нами уже отме- чалось в §7, что, назвав элементы множества эквивалентными, мы ожидаем, что в одной и той же ситуации они должны проявлять себя одинаково. В первую очередь это относится к алгебраическим операциям, в которых участвуют экви- валентные элементы. Алгебраическая операция * на множестве X называется со- гласованной с отношением эквивалентности ~ на этом множестве, если из того, что Qi ~ a2,bi ~ bj, следует, что щ » bi ~ аг * Ьг, т.е. алгебраическая операция, примененная к эквивалентным элементам, дает эквивалентные результаты. Это заставляет нас при введении тех или иных алгебраических операций проверять выполнение этого требования. Мы не будем останавливаться на этом, а предлага- ем читателю самому убедиться в справедливости данного свойства у всех рассма- триваемых операций.
§ 9. Алгебраические законы 53 Заметим, что в наших рассуждениях, говоря о внутренних законах компо- зиции, мы всюду использовали термин “алгебраическая операция”. Это не слу- чайно. Как правило, термин “внутренний закон композиции” используют в тех случаях, когда наряду с внутренним законом композиции рассматривается и внеш- ний закон композиции. Внешний закон композиции. Пусть X и Р - два множества. Внешним законом композиции на множестве X называется отобра- жение (•) : Р х X X, т.е. закон, посредством которого любому элементу а € Р и любо- му элементу х 6 X ставится в соответствие однозначно определен- ный элемент с G X. Тот факт, что (от, т) ь-> с, обозначается символом с = ах. Умножение матрицы A G Rmxn на число а € R является внеш- ним законом композиции на множестве Rrnxn. Умножение чисел в R можно рассматривать и как внутренний закон композиции, и как внешний. Внешний закон композиции на множестве X называется дистри- бутивным относительно внутреннего закона композиции * в X, если а(а * Ь) = аа * ab, У a G Р, Ча, b & X. Внешний закон композиции на множестве X называется дистрибу- тивным относительно внутреннего закона композиции *' в Р, если (а *' /3)а = аа * /За, Уа,/3 G Р, Уа € X. Умножение матрицы A G Rmxn на число a G R дистрибутивно как относительно сложения матриц, так и относительно сложения чисел, ибо а(А + В) = аА + аВ, (а 4- /3)А = аА + /ЗА.
Глава III. Геометрические векторы Основными объектами геометрических исследований являются точ- ки, прямые и плоскости в пространстве. С математической точки зрения логически безупречным методом введения этих понятий является аксиоматический метод, получивший завершение в трудах Гильберта. Существуют различные версии ак- сиом евклидовой геометрии. Мы оставим в стороне эти исследования, ограничившись ссылкой на Приложение к этой книге и формулиров- ками тех фактов, на которые непосредственно будем опираться. Отрезок [АВ] - это множество, состоящее из точек А и В и всех точек прямой (АВ), которые лежат между точками А и В. Каждому отрезку [АВ] можно по- ставить в соответствие неотрицательное действительное число |АВ|, называемое длиной отрезка [АВ] и удовлетворяющее следующим аксиомам: 1) аксиома тождества: |АВ| > О, VA.B, | АВ) = 0 тогда и только тогда, когда А = В; 2) аксиома симметрии: |АВ| = |ВА|, VA.B; 3) неравенство треугольника: |АВ| < |АС| + |СВ|, VA, В,С, | АВ| = | АС| -I- |СВ| тогда и только тогда, когда точка С лежит на отрезке [АВ]. Длина отрезка [АВ] называется также расстоянием между точками А и В и обозначается символом р(А,В). Любая точка А, лежащая на прямой I, разбивает эту прямую на два луча 1+ и I— с началами в точке А. Эти лучи называются дополнительными друг к другу. Точка А принадлежит обоим лучам. Две точки В А и С / А прямой I принадле- жат одному лучу тогда и только тогда, когда отрезок [ВС| не содержит точки А, и принадлежат дополнительным лучам, если точка А является внутренней точ- кой отрезка [ВС]. Луч с началом в точке А, на котором лежит точка В yt А, обозначается символом [АВ). Два луча, лежащие на одной прямой, называются одинаково направленными (сонаправленными), если их пересечение есть луч, и противоположно направлен- ными, если их пересечение не является лучом. Всякая прямая I, лежащая в плоскости Р, разбивает эту плоскость на две полуплоскости Ру и Р_, про которые говорят, что они определяются прямой I. Прямая I принадлежит каждой из этих полуплоскостей. Две точки В £ / и С £ I плоскости Р лежат в одной полуплоскости, определяемой прямой I, тогда и только тогда, когда [ВС] ПI = Й. Два луча |АВ) и [СВ), лежащие на параллельных несовпадающих прямых, принадлежат некоторой плоскости Р. Лучи [АВ) и [CD) называются одинако- во направленными (сонаправленнымй), если они лежат в одной полуплоскости, определяемой прямой АС, и противоположно направленными, если они лежат в разных полуплоскостях. Обозначение: [АВ) "Tf [CD) и [АВ) Т4 [CD) соответ- ственно. Свойство сонаправленности лучей транзитивно. Пусть Р - некоторая плоскость и А, В, О - три ее различные точки, не лежа- щие на одной прямой. Прямая О А разбивает эту плоскость на две полуплоскости. Точка В расположена в одной из них. Обозначим эту полуплоскость Ру. Анало- гично прямая ОВ разбивает плоскость Р на две полуплоскости. Пусть Р_ - по- луплоскость, в которой лежит точка А. Выпуклым углом между лучами [ОА) и [ОВ) называется пересечение множеств Ру и Р_. Обозначение: ZAOB. Итак,
§10. Направленные отрезки 55 Z.AOB = Р+ П Р_. Величина выпуклого угла АЛОВ называется углом между лучами (ОЛ) и [ОВ). Обозначение: АОВ. Очевидно, 0 < АОВ < тг. По опре- делению угол между сонаправленными лучами равен 0, а между противоположно направленными равен л. §10. Направленные отрезки В А Рис. 1 Упорядоченная пара точек (А, В) называется направленным от- резком с началом в точке А и концом в точке В.Обозначение: А$. Направленный отрезок аА изображается стрелкой, идущей из его начала в его ко- нец (рис. 1). Направленный отрезок А$ называют также связанным вектором, а точку А - точкой его приложения. Если точки А и В различны, то направленный отрезок А$ называется не- нулевым; если же точки А и В совпадают, то направленный отрезок , точнее, аА называется нулевым и обозначается символом вд. Направленный отрезок АЙ называется параллельным прямой I (плоскости В), если либо он нулевой, либо прямая АВ совпадает с прямой I (соответственно лежит в плоскости Р), либо прямая АВ параллельна прямой I (соответственно плоскости В). Обозначение: АЙ || I, АЙ || Р. Направленные отрезки AjB!, А2В2, ..., AkBk называются колли- неарными (компланарными), если существует прямая (соответственно плоскость), которой параллелен каждый из этих отрезков. Длиной направленного отрезка А& называется длина отрезка [АВ]. Обозначение: |АЙ|. Как следует из определения, длина ну- левого и только нулевого направленного отрезка равна нулю. Ненулевые направленные отрезки А^ кСЬ называются одинако- во направленными (сонаправленными), если лучи [АВ) и [СВ) име- ют одинаковое направление, и противоположно направленными, если лучи [АВ) и [СВ) имеют противоположные направления. Обозначение: А$ ft Й и АЙ СЙ соответственно. Направленные отрезки А^ и С13 называются равными, если сере- дины отрезков [АВ] и [ВС] совпадают (рис. 2). Обозначение : АВ = СЙ. Как следует из определения, нуле- вой направленный отрезок равен любому другому нулевому и только нулевому направленному отрезку. Из свойств параллелограмма (рис. 2) следует, что ненулевые на- правленные отрезки АЙ и СЙ , не лежащие на одной прямой, равны тогда и только тогда, когда четырехугольник ABDC — параллело- грамм. Для равных ненулевых отрезков, лежащих на одной прямой,
56 Глава III. Геометрические векторы возможен один из четырех вариантов расположения, изображенных на рис. 2, а и б. ----—.Г) а) [АВ] П [СО] = 0 б) [АВ] П [СВ] / 0 / / А ВОС D А О В Д1^ ^Jc С fD (? A В С , О D А В Рис. 2 Теорема 10.1. Направленные отрезки А$ и ci равны то- гда и только тогда, когда они имеют: 1) одинаковую длину: |А^| = |сД и, в случае |АВ| / О, 2) одинаковое направление: А$ ft d. Утверждение теоремы вытекает непосредственно из определения равенства направленных отрезков (рис. 3). и свойств параллелограмма А В С D 4--------------~- о в Теорема 10.2. Для любого направленного отрезка АВ и лю- бой точки С существует, и притом единственная, точка D такая, что xi = ci. Доказательство. Пусть (рис. 3) точка О - середина [ВС]. Из определения равенства направленных отрезков следует, что D - точка на прямой АО, симметричная точке А относительно точки О. Такая точка определена однозначно. Замечание. Теорему 10.2 формулируют и в других терминах: направлен- ный отрезок можно отложить от любой точки или направленный отрезок можно перенести в любую точку. Теорема 10.3. Отношение равенства направленных отрез- ков является отношением эквивалентности на множестве всех на- правленных отрезков. В самом деле, отношение равенства направленных отрезков явля- ется бинарным отношением, которое обладает свойствами: а) рефлексивности (направленный отрезок равен самому себе); б) симметричности, так как справедливы импликации |А^| = |С^| => |С^| = рЙ|, ХЁ tt ci => ci t? в) транзитивности, так как равенство длин (т.е. чисел) и сонапра- вленность направленных отрезков (т.е. лучей) обладают этим свой- ством.
§11. Свободный вектор 57 Прямая I с заданным на ней направлением называется осью. Ве- личиной направленного отрезка Al-i на оси I называется число (Ю.1) Из определения вытекают следующие факты. 1°. Нулевые направленные отрезки, и только они, имеют нулевую величину. 2°. (А&) = -(В%). Лемма Ш а л я. При любом расположении точек А, В и С на прямой имеет место равенство Доказательство. Если какие-либо две точки совпадают (на- пример, А = В), то утверждение очевидно, так как (A^t) = (А^) + + (Су1). Пусть А,'В, С - различные точки. Тогда возможны только три варианта расположения этих точек: 1) точка С лежит между точками А и В (рис. 4); I *с *в~~ I "с А в Рис. 4 2) точка А лежит между точками В и С; 3) точка В лежит между точками А и С. и Ав тт АС тт Св, откуда следует, что (Ав) — (ЛС) + (Сз втором случае имеем (В(3) = (вЛ) + (А(?) или (АВ) = Третий случай рассматривается аналогично второму. во §11. Свободный вектор Определение и терминология. Известно (теорема 10.3), что отношение равенства направленных отрезков является отношением эквивалентности на множестве направленных отрезков. Оно разбива- ет это множество на непересекающиеся классы эквивалентности (§7). Класс эквивалентности направленных отрезков называется сво- бодным вектором или просто вектором. Векторы обозначают строч- ными латинскими буквами а, Ь. Итак, вектор а = cl (А^) состоит из всех направленных отрезков, равных А$. Так как класс эквива- лентности (§7) порождается любым своим представителем, то вектор а = с! (А^) можно задать любым направленным отрезком d = Ав,
58 Глава Ш. Геометрические векторы т.е. а = cl (С 15). Если вместо направленного отрезка А15 использует- ся направленный отрезок Й = Й, то говорят, что вектор а отло- жен от точки С. Символ а = cl (А^) используется применительно к геометрическому вектору а только в тех ситуациях, когда подчерки- вается отношение этого вектора к классу эквивалентности. Обычно вместо символа а = cl (А^) используется символ а — Al5 , который в зависимости от контекста читается как "вектор а, порожденный направленным отрезком А&" или "вектор а, отложенный от точки А". Длиной вектора а (величиной вектора а на оси) называется длина (соответственно величина) порождающего его направленного отрезка; векторы ai, аг, ..., а^ называются коллинеарными (компланарны- ми), если коллинеарны (соответственно компланарны) порождающие их направленные отрезки; векторы а и b называются одинаково на- правленными (противоположно направленными), если одинаково (со- ответственно противоположно) направлены порождающие их напра- вленные отрезки. Очевидно, что эти определения корректны несмотря на произвол в выборе направленных отрезков. Линейные операции над векторами. Сложение векторов. Сумма векторов а и Ь определяется следующим образом. Отложим вектор а от произвольной точки А, пусть В - конец этого вектора, т.е. а = А^. Затем отложим вектор b от точки В, пусть b = ВС. Суммой а+ b векторов а и b называется вектор, порожденный направленным отрезком А(5 (рис. 1). Рис. 1 Это правило сложения векторов называется правилом треуголь- ника. Очевидно, что этот же вектор а4- b для неколлинеарных векто- ров а и b может быть получен (рис. 2) как диагональ параллелограм-
§11. Свободный вектор 59 ма, построенного на векторах а и Ь. Это правило сложения векторов называется правилом параллелограмма. Теорема 11.1. Операция сложения векторов обладает сле- дующими свойствами: 1) а 4- b = b+a, Va, b (свойство коммутативности); 2) (а+ Ь)+ с = a-f-(b+ с), Va, b, с (свойство ассоциативности); 3) существует такой вектор 0, называемый нулевым вектором, что а+ 0 = 0+ а — a, Va (свойство существования нейтрального элемента); 4) для любого вектора а существует такой вектор — а (называ- емый противоположным вектору а), что а+ (—а) = 0 (свойство существования симметричного элемента). Доказательство. Коммутативность и ассоциативность сложе- ния в случае неколлинеарных векторов а, Ь и с проверяются не- посредственным построением (рис. 3) векторов, входящих в левую и правую части соответствующих равенств. Случай коллинеарных век- торов предлагается рассмотреть читателю. Рис. 3 Свойства 3 и 4 очевидны: нулевым вектором 0 будет класс экви- валентности нулевых направленных отрезков, противоположным век- тору а = А/I будет вектор - а = вХ Разностью векторов b и а называется вектор х такой, что а 4- 4- х = Ь. Обозначение: Ь — а. Теорема 11.2. Для любых векторов а и b существует, и притом единственная, разность b — а. Доказательство. В качестве разности Ь— аможно взять век- тор Ь+ (- а), так как а-f- (Ь-|-(- а)) = а4-((- а)+ Ь) = (а+(-а)) + 4-b=0+b=b. Эта разность единственна, так как если с - еще одна разность, то с — с 4- 0 = (с 4- а) 4- (- а) = b 4- (— а). Замечание. Правило парал- 4- b лелограмма сложения неколлине- а / / арных векторов а и b позволя- / / ет построить и разность b — а — а как другую диагональ параллело- грамма (рис. 4). р .
60 Глава Ш. Геометрические векторы Умножение вектора на число. Произведением вектора а на вещественное число а называется вектор Ь, удовлетворяющий следующим условиям: 1) |Ь| = |а| |а| и, в случае b / О, 2) b ft а, если а > 0, и b fj, а, если а < 0. Обозначение: b = аа. Очевидно, что векторы а и аа колли- неарны и что 0 а — а 0 = 0. Теорема 11.3. Операция умножения вектора на число об- ладает следующими свойствами: для любых векторов а, Ь и чисел а,/3 € R 1) 1- а — а, 2) (а/3) а = а(/3а); . 3) (а + /3) а = а а + /3 а (свойство дистрибутивности умножения на число относительно сложения чисел); а(а+ b) = aa+ab (свойство дистрибутивности умножения на число относительно сложения векторов). Доказательство. Свойство 1 очевидно. Свойства 2 и 3 про- веряются перебором различных вариантов знаков и абсолютных ве- личин чисел а и /3. Свойство 4 вытекает из подобия треугольников (рис. 5). Здесь следует отдельно рассмотреть случай, когда векторы а и b коллинеарны. а( а + Ь) b ab а(а + Ь) (а >0) (а < 0) Рис. 5 § 12. Векторы на прямой, на плоскости и в пространстве До сих пор мы рассматривали свободные векторы в пространстве. Мы определили векторы и операции над ними, исходя из направлен- ных отрезков, начала и концы которых - любые точки простран- ства. Свойства этих операций относились к произвольным векторам пространства. Можно дать такое же определение вектора и операций над ни- ми, оставаясь в пределах некоторой плоскости или даже прямой. При этом оказывается, что все утверждения, изложенные в § 10 и 11, оста- нутся, по существу, неизменными, незначительное изменение коснет-
§12. Векторы на прямой, на плоскости и в пространстве 61 ся лишь их формулировок: в них добавится уточнение, какое именно множество векторов рассматривается. В самом деле, пусть V\, У2 и Уз - множества всех векторов на прямой, на плоскости и в пространстве соответственно. Как следует из определения суммы векторов, если а, Ь € Ух (V? или У3), то а + 4- b G Ух (У2 или У3 соответственно), т.е. операция сложения векторов не выводит за пределы данной прямой (плоскости или пространства). Значит, операция сложения векторов является алгебраической опера- цией (или внутренним законом композиции) на каждом из множеств Ух, V2 или У3 (§9). Аналогично операция умножения вектора на дей- ствительное число является внешним законом композиции на каждом из указанных множеств. Если к этому добавить еще, что каждое из них содержит нулевой вектор 0 и противоположный вектор — а к любому своему вектору а, то теоремы 11.1-11.3 можно отнести к ка- ждому из множеств Ух, У2, Уз- Сформулируем этот итог в виде сле- дующего утверждения. Утверждение. Множество Уп, где n = 1,2,3, всех векторов на прямой (на плоскости или в пространстве) наделено внутренним, законом композиции (называемым сложением) и внешним законом композиции (называемым умножением на число), которые обладают следующими свойствами: для любых а, b, с € Vn и а, (3 € R 1) а 4- b = b + а; 2) (а 4- Ь) 4- с = а 4- (Ь 4- с); 3) 30 6 У„ : а 4- 0 = а, У а € Уп; 4)УабУп 3 (-а) е Vn : а+(-а) = 0; 5) 1- а = а, Уа е Уп; 6) (о/З) а = а((3а); 7) (а -I- /3) а = а а + (3 а; 8) а( а 4- b) = a a 4- а Ь. Отметим, что, прежде чем сделать этот вывод, мы проверили лишь факт наличия законов композиции и справедливость свойств 3 и 4. Очевидно, остальные свойства не нуждаются в проверке. К свойствам 1-8 остается добавить, что операция сложения век- торов на каждом из множеств Ух, У2, V3 обладает обратной операцией, называемой вычитанием. Замечание. Свойства 1-8 говорят о том, что множества У), У2, Уз, будучи, вообще говоря, различными, обладают общими свойства- ми. Такими же свойствами обладает и совсем непохожее на них мно- жество Rmx" матриц размера т х п (§2). Очевидно, это относится и к множеству R всех действительных чисел, если операцию умно- жения чисел рассматривать как внешний закон композиции. Уже эти примеры наводят на мысль о целесообразности общего взгляда на эти множества. В следующей главе мы увидим, что рассмотренные в примерах множества - это лишь частные проявления того круга формальных понятий, который составляет основу линейной алгебры и аналитической геометрии.
Глава IV. Введение в теорию линейных пространств §13. Вещественное линейное пространство Определения. Мы будем рассматривать множества, наделенные двумя законами композиции: внутренним и внешним (§9). Внутрен- ний закон композиции будем называть сложением, а внешний - умно- жением на вещественное число. Согласно этой терминологии на этих множествах указаны два правила: • правило, посредством которого любой упорядоченной паре эле- ментов а, b множества ставится в соответствие однозначно опреде- ленный элемент а + b из этого же множества, называемый суммой элементов а и Ь\ • правило, посредством которого любому вещественному числу а и любому элементу а множества ставится в соответствие однозначно определенный элемент ал этого же множества, называемый произве- дением элемента а на число а. Непустое множество V называется вещественным, линейным, прос- транством 1, если на нем заданы два закона композиции: внутренний закон композиции, подчиненный аксиомам 1) а + b = b + a, Va, b G V (аксиома коммутативности), 2) {а -I- Ь) + с = а + (b + с), Va, b, с € V (аксиома ассоциативности), 3) 3 6 G V : а + 6 = a, Va G V, 4) V а G V 3 (—a) G V: а + (-а) = 6- внешний закон композиции, подчиненный аксиомам 5) 1 а — a, Va € V, 6) (a/3)a = a(/3a), Va,/3 G R, Va G V; и если оба закона связаны между собой аксиомами 7) (a+/3)a = aa+fla, Va,/3 G R, Va G V (аксиома дистрибутивности умножения на число относительно сложения чисел), 8) a(a + 6) = aa + ab, Va Е R,4a,b G V (аксиома дистрибутивности умножения на число относительно сложения элементов V). Линейное пространство называют также векторным прост- ранством. Отметим, что определение линейного пространства не содержит каких-либо конкретных описаний его элементов и операций над ними. Требуется только, что- бы эти операции были определены и подчинялись сформулированным выше вось- ми аксиомам, называемым аксиомами линейного пространства. Это означает, ТВ гл. XII будут рассматриваться линейные пространства общего вида, когда в операции умножения на число участвуют не только вещественные числа. Забегая вперед, отметим, что все результаты данной главы будут справедливы и в общем случае.
§13. Вещественное линейное пространство 63 что каждый раз, когда мы встречаемся с множествами, наделенными операция- ми, удовлетворяющими перечисленным аксиомам, мы вправе считать их линей- ными пространствами и переносить на них все результаты теории линейных пространств. Элементы линейного пространства называются векторами. Ис- пользование этого термина не случайно, геометричность терминоло- гии подчеркивает геометрический характер абстрактных алгебраиче- ских понятий, делает их “наглядными” и помогает уяснить, а зачастую и предвидеть не всегда очевидные факты. Вектор в называется нулевым вектором пространства, а вектор (—а) - противоположным вектору а. Нулевой вектор обозначают также символом О. Разностью векторов b и а линейного пространства V называется вектор х € V такой, что а + х — Ь. Обозначение: b — а. Примеры. 1. Геометрические пространства Vi, V2, V3. Как следует из §12, множества Vi, V2, V3 всех векторов на пря- мой, на плоскости и в пространстве являются вещественными линей- ными пространствами относительно введенных в них операций сло- жения векторов и умножения вектора на действительное число. Эти пространства будем называть геометрическими. Для изображения геометрических пространств Vi, Vj, V3 условимся все век- торы откладывать от одной фиксированной точки О на прямой (на плоскости и в пространстве соответственно). При таком соглашении каждый свободный век- тор будет однозначно определен своим концом. В этом смысле мы будем, говоря о свободном векторе, указывать только его конец. Точку О будем (пока условно) называть началом координат (рис. 1). Рис. 1 2. Пространство вещественных матриц Rrnxn. Как сле- дует из теорем 2.1 и 2.2, множество Rroxn всех вещественных матриц размера т х п является вещественным линейным пространством. 3. Арифмети ческое (координатное) пространство Rn. Пусть R" - множество всевозможных упорядоченных наборов п действи- тельных чисел, называемых арифметическими векторами (или п- мерными векторами). Если арифметические векторы записывать в виде а = (ai,... ,<4), то Rn = {a = (ai,... ,an) | e R,i = l,n}. Два арифметических вектора a = (oj,..., an) и b — (bi,...,bn) называются равными, если a, = 6,, г = l,n. Операции над арифметическими векторами вводятся следующим образом: а + b = (сц + bi,..., сц + bn), аа = (aai,... ,аап), а € R. 3 Линейная алгебра и аналитическая геометрия
64 Глава IV. Введение в теорию линейных пространств Нетрудно проверить, что Rn - вещественное линейное простран- ство относительно введенных операций. Замечание I. Отметим, что Rn - декартова n-я степень множества R всех вещественных чисел. Замечание 2. Иногда из соображений удобства мы будем записывать ариф- метические векторы в виде столбцов. Замечание 3. Арифметическое пространство Rn совпадает с простран- ством матриц Rlxn или Rnxl. 4. Пространства многочленов. Многочленом n-й степени от одной переменной t с вещественными коэффициентами называется выражение вида f(t) — а$ 4- а Л + a^t2 4-(- antn, где а< € R, i = 0, п, причем ап / 0. Число 0 € R по определению считается многочленом с нулевыми коэффициентами и называется нулевым многочленом. Сте- пень нулевого многочлена не определена. Два многочлена /(t) = £л=0 аДк и g(t) = ЬДк называются равными, если п — т и , к — 0, п. Суммой многочленов /(£) — аДк и g(t) = ЬДк называ- ется многочлен h(t) = 52*>о(а* + bk)tk< где недостающие коэффици- енты (а* или 6^) заменяются нулями. Обозначение: /(t) 4- g(t). Произведением многочлена /(t) = £2£=0 на число a G R на- зывается многочлен o/(t) = 52fc=oQafc^- Нетрудно проверить, что множества Мп всех многочленов степени не выше п и множество Мж многочленов всех степеней, пополненные нулевым многочленом, образуют вещественные линейные простран- ства. Простейшие свойства линейных пространств. Следующие свойства линейных пространств являются элементарными следствия- ми из аксиом. 1°. В линейном пространстве существует единственный нуле- вой вектор, так как если 0i и 02 ~ два нулевых вектора, то из аксио- мы 3 следует, что 0i = 4- 02 = #2- Замечание 4. Говоря о единственности нулевого вектора, мы не различаем равные векторы. В атом же смысле следует понимать и другие утверждения о единственности. 2°. Для любого вектора линейного пространства существует единственный противоположный вектор, так как если b и с - два противоположных вектора к вектору а, то, последовательно приме- няя аксиомы 3, 4, 2, получим, что Ь = Ь 4- (а + с) — (Ь 4- а) + с = с. 3°. В линейном пространстве справедливы равенствам 0а = 0, \/а € V и а0 = 0, Vo G R. Доказательство. Для доказательства первого равенства до- статочно проверить, что b + Oa = b,Vb е V. Это соотношение вытекает из следующей цепочки равенств, основанных на аксиомах 2—7: b 4- Од — (Ь + 0) + On — b 4- ((—п) 4- а) 4- 0п = (Ь 4- (—о)) 4- а 4- 0<1 = — <Ь 4- (—ц)) 4- let 4- 0а = (Ь 4- (—о)) 4- (1 4- 0)о — (Ь 4- (—о)) 4- п — — b + ((—п) 4- а) = b 4- 0 — Ь.
§14. Линейная зависимость 65 Второе равенство доказывается с помощью первого и аксиомы 6: если a - произвольный вектор пространства, то а0 = а(0а) = (аО)а = = Оа = 0. 4°. В линейном пространстве из равенства аа = 0 следует, что либо о = О, либо а = 0. В самом деле, как следует из свойства 3°, случай а = 0 возможен, если аа = 0. В случае когда о / 0, на основании свойства 3° и акси- ом 5, 6 получим /1 \ 1, ч 1Л Л а = la — —а I а = — (оса) = —0 = 0. \а ) а а 5°. В линейном пространстве для любого вектора а противопо- ложный вектор может быть получен как произведение: -а = (-1)а. Это утверждение вытекает из аксиом 3—5, 7 и свойства 3°, так как а + (—1)а = 1а 4- (—1)а = (1 — 1)а = Оа = 0. 6°. Для любой пары векторов а и Ь линейного пространства су- ществует, и притом единственная, разность Ъ — а. Доказательство. Вектор 5+(—а) является разностью Ь—а век- торов а и Ь, так как на основании аксиом 1—4 и определения разности имеем а 4- (Ь 4- (—а)) = (а 4- (—а)) -}-b~0-(-b = b. При этом если с - любая другая разность b — а, то из аксиом 2—4 следует, что с = с-г0=с4-(а4- (—а)) = (с 4- а) 4- (—а) =64- (—о)- § 14. Линейная зависимость Пусть ai,a2,... ,ak ~ векторы линейного пространства V и 0ц,о2, ... , Ofc - действительные числа. Вектор oiaj 4- o2a2 4- • • 4- o*afc на- зывается линейной комбинацией векторов ai,a2,... ,аь с коэффици- ентами Oi, о2,..., о*. Если вектор b является линейной комбинацией векторов ai, а2,. -.,а*, то говорят, что вектор Ъ линейно выражается через векторы аь а2, .., afc, при этом представление вектора Ь в виде b — oia! 4-... 4- Ofcafc называют разложением вектора b по векторам а\,а-2,... ,afc. Очевидно, нулевой вектор линейно выражается через любой вектор, так как 0 = Oa, Va € V. Через нулевой вектор не может выражаться ни один ненулевой вектор, так как ав = 0, Vo € R. Линейная комбинация называется тривиальной, если все ее коэф- фициенты равны нулю, и нетривиальной, если среди ее коэффициен- тов хотя бы один отличен от нуля. Очевидно, тривиальная комбинат ция любой системы векторов равна нулевому вектору. Система векторов ai, а2, ... , а* называется линейно зависимой, если существует нетривиальная линейная комбинация этих векторов, равная нулевому вектору, т.е. если существуют числа ai,o2,..., Ofc, одновременно не равные нулю и такие, что oyOi 4- o2a2 4-... 4- Ofcafc = 0, (14.1)
66 Глава IV. Введение в теорию линейных пространств и линейно независимой, если нулевому вектору равна только триви- альная линейная комбинация этих векторов, т.е. если из равенства (14.1) следует, что оч = сиг = ... = а*. = 0. Теорема 14.1. Система из одного вектора линейно зави- сима тогда и только тогда, когда этот вектор нулевой. Доказательство. Линейная зависимость системы из одного век- тора а равносильна тому, что аа — в при некотором а / 0, а это, в свою очередь, равносильно (§13, свойства 3, 4) тому, что а = 0. Теорема 14.2. Система векторов а\,а2,...,ак, где k > 1, линейно зависима тогда и только тогда, когда хотя бы один из век- торов этой системы линейно выражается через другие. Доказательство. Необходимость. Если система век- торов ai,a2,... ,<ц линейно зависима, то существуют числа О], а2, ... , ак, одновременно не равные нулю и такие, что оцсц + о2а2 4-... 4- 0^01 + ... 4- OfeOfc = 9. (14-2) Пусть о, 0. Тогда в силу (14.2) (—ав/а,)ал. Так как к > 1, то для вектора а, существует хотя бы один "другой" вектор системы. Достаточность. Пусть а, = Тогда, перенеся пра- вую часть этого равенства в левую, получим нетривиальную линей- ную комбинацию векторов системы, равную нулевому вектору: -О1Д1 - ... - Oi-iOj-i + la, - Oi+iai+i - ... - акак = 6. Эта теорема дает другое определение линейной зависимости системы век- торов, в которой содержится более одного вектора. Теорема 14.3. Если подсистема системы векторов линей- но зависима, то и вся система линейно зависима. Доказательство. Не ограничивая общности рассуждений, можно считать подсистемой системы векторов ai, a2,..., ая,..., ак ее первые s векторов. Из линейной зависимости ai, a2,..., as следует, что aiai 4- a2a2 + ... + аяаа — 9 для некоторых чисел a-i, о2,..., as, среди которых существует <1, 0. Тогда a^i 4- a2a2 4-... 4- asa3 4- Oa3+i 4- 4-... 4- Oa* = 9, причем a, 0. Следовательно, система векторов ai, a2, ... , as, ... , ак линейно зависима. Теорема 14.4. Любая подсистема линейно независимой си- стемы векторов линейно независима. В самом деле, если бы существовала линейно зависимая под- система, то на основании теоремы 14.3 вся система была бы линейно зависимой. Теорема 14.5. Система векторов ai,a2,... ,ak линейно не- зависима тогда и только тогда, когда любой вектор, являющийся линейной комбинацией этих векторов, имеет единственное разло- жение по этим векторам. Доказательство. Необходимость доказывается от против- ного. Пусть существует вектор Ь, который имеет два различных раз- ложения по векторам ai,a2,..., ak'. Ь — 52*=1оча,-, Ь = 52*=1a'ai,
§14. Линейная зависимость 67 Заа / a'a. Вычитая почленно одно равенство из другого, получим не- тривиальную линейную комбинацию векторов ai,a2,равную нулевому вектору. Отсюда следует линейная зависимость системы векторов ai, а2, - . , а*. Достаточность также доказывается от противного. Пусть си- стема ai,a2,... ,а* линейно зависима, тогда aiai -I- a2a2 4-... 4- a^at = 0 (14 3) для некоторых чисел aj, a2> • • > °‘к, среди которых существует аа / 0. Но, с другой стороны, Oai 4- 0а2 4- ... 4- Otijt = 0. (14.4) Мы получили два различных разложения (14.3) и (14.4) нулевого вектора 6 по векторам ai,a2,... ,а*, что невозможно. Теорема 14.6. Если система векторов aj, a2,..., а*, линей- но независима, а система а\, а2,..., а*,, 6 линейно зависима, то век- тор b линейно выражается через векторы ai,а2,..., а*,. Доказательство. Из линейной зависимости системы векторов ai, а2, ... , at, Ь следует, что aioi + a2a2 4-... 4- afeOfc 4- а^Ь = в (14-5) для некоторых чисел ai,a2,... ,ак,ао, среди которых хотя бы одно отлично от нуля. Если ад = 0, то ненулевой коэффициент as находит- ся среди чисел ai, а2,..., а*,; при этом (14.5) переходит в равенство aioi 4- очаг 4- • - 4- oikOk = 0, где аа / 0, 1 < s < к, которое противоре- чит условию линейной независимости ai, a2,... , а*. Следовательно, ао / 0; отсюда и из (14.5) получаем, что Ъ = (-оц/а0) а,. Примеры. 1. Арифметическое пространство Rn.B ариф- метическом пространстве R” единичные векторы ei = (1,0,0,...,0), е2 = (0,1,0,..., 0), (14.6) еп = (0,0,0,’..., 1) линейно независимы. Это сдедует из того, что линейная комбинация этих векторов с коэффициентами ai,a2,..., ап представляет собой арифметический вектор (вц, а2,..., а:п), который равен нулевому век- тору в = (0,..., 0) тогда и только тогда, когда а, — 0, i = 1, п. 2. Про странство многочленов. Многочлены 1, t,t2,...,tn линейно независимы. Это следует из того, что линейная комбинация этих многочленов с коэффициентами «о, aii • • > Qn представляет со- бой многочлен 52£=О который равен нулевому многочлену тогда и только тогда, когда о^ = 0, к - 0, п.
68 Глава IV. Введение в теорию линейных пространств §15. Геометрический смысл линейной зависимости Будем рассматривать геометрические векторы на прямой, на плос- кости и в пространстве. Выясним, что означает линейная зависимость геометрических векторов. Предварительно докажем два чисто гео- метрических утверждения. Утверждение 1. На прямой (на плоскости и в простран- стве) существует ненулевой вектор (соответственно два неколли- неарных и три некомпланарных вектора). Доказательство. В случае прямой достаточно взять две не- совпадающие точки О н А (рис. 1,а), тогда вектор а = оХ 0. На плоскости достаточно взять три точки О, Ан В, не лежащие на одной прямой (рис. 1,6), тогда векторы а = ОД и Ь = ой неколлинеарны. В пространстве достаточно взять четыре точки О, А, В, С, не лежа- щие в одной плоскости (рис. 1,е), тогда векторы а = О А, Ь = ой и с = ой некомпланарны. Утверждение 2. На прямой (на плоскости и в простран- стве) всякий вектор линейно выражается через любой ненулевой вектор (соответственно любые два неколлинеарных и любые три некомпланарных вектора). Доказательство. 1. Пусть а, b - векторы на прямой и а / 0. Отложим их от одной точки О прямой. Пусть а — оХ, b = ой (рис. 2,а). Если Ь = 0, то Ь — 0а. Если же О, то, взяв _( |О^|/|о1|, аПЬ, -|О^|/|ОЙ|, аПЬ, согласно определению произведения вектора на число получим, что b = о а. 2. Пусть а, Ь, с - векторы плоскости и а, b неколлинеарны (зна- чит, ни один из них не равен 0). Отложим эти векторы от одной точки О плоскости. Пусть а Ь = ой, с = ой (рис. 2,6). Если с - 0, то с = 0 а + ОЬ. Если же с ф 0, то проведем из точки С прямые, параллельные прямым ОВ и О А, до пересечения с прямыми О А и
§ 15. Геометрический смысл линейной зависимости 69 О В соответственно. Пусть Ai, Bi — точки пересечения этих прямых (существование точек пересечения следует из неколлинеарности (9/t и О В). Тогда 0(5 = ОА^+ОВ1. Отсюда и из первой части утверждения получим, что с = аа + /3Ь. 3. Пусть а, b, с, d - векторы пространства и а, Ъ, с некомпла- нарны (значит, попарно неколлинеарны и, тем более, ни один из них не равен 0). Отложим эти векторы от одной точки О. Пусть а = (9/1, b = Оё, с = (9(3, d — 015 (рис. 2,в). Так как векторы (9А, 015, (9(3 попарно неколлинеарны, то получим три плоскости ОВС, О АС и О АВ. Если d = 0, то d = 0a + 0b-f-0c. Если же d 0, то проведем из точки D плоскости, параллельные плоскостям ОВС, О АС и О АВ, до пересечения с прямыми О А, О В и ОС соответственно. Пусть Ai, Bi, Ci - точки пересечения (существование точек пересечения следует из некомпланарности О1, дВ и 0(5). Тогда оЬ = (9А? + <9в! + Ос5- Отсюда и из первой части утверждения получим, что d = aa + /3b + + 7 с. Теорема 15.1. Два вектора линейно зависимы тогда и толь- ко тогда, когда они коллинеарны. Доказательство. Необходимость. Пусть векторы а, b ли- нейно зависимы, тогда в силу теоремы 14.2 один из них линейно выраг жается через другой. Пусть b = аа. Отсюда и из определения про- изведения вектора на число следует коллинеарность а и Ь. Достаточность. Пусть а и b коллинеарны, т.е. параллельны одной прямой. Будем считать, что а 0 (так как если а = 0, то линейная зависимость а, b следует из теорем 14.1 и 14.3). Отложим а, b от одной точки. Тогда они окажутся на одной прямой, при этом, согласно утверждению 2, Ь = а а. В силу теоремы 14.2 отсюда следует линейная зависимость а, Ь. Следствие 1. Любые два (значит, и более) вектора прямой линейно зависимы.
70 Глава IV. Введение в теорию линейных пространств Теорема 15.2. Три вектора линейно зависимы тогда и только тогда, когда они компланарны. Доказательство. Необходимость.Пусть векторы а, Ь, с линейно зависимы, тогда один из них линейно выражается через дру- гие. Пусть с = аа + /ЗЬ. Если а и b коллинеарны, то а, Ь, с кол- линеарны и тем более компланарны. Если же а и b неколлинеарны, то отложим векторы а, Ь, с от одной точки (рис. 2,6). Тогда вектор с, являясь диагональю параллелограмма, построенного на векторах а а и /3 Ь, окажется в той же плоскости, что и а, Ь. Значит, а, Ь, с компланарны. Достаточность. Пусть а, Ь, с компланарны, т.е. параллель- ны одной плоскости. Будем считать, что а, Ь неколлинеарны (так как если а, Ь коллинеарны, то линейная зависимость а, Ь, с следует из линейной зависимости подсистемы). Отложим а, Ь и с от одной точки. Тогда они окажутся в одной плоскости и на основании утвер- ждения 2 имеем с = а а + /3 Ь. В силу теоремы 14.2 отсюда следует, что векторы а, Ь, с линейно зависимы. Следствие 2. Любые три (значит, и более) вектора плоскости линейно зависимы. Теорема 15.3. Любые четыре вектора линейно зависимы. Доказательство. Будем считать, что в четверке векторов а, Ь, с, d векторы а, Ь, с некомпланарны (так как если а, Ь, с ком- планарны, то линейная зависимость а, b, с, d вытекает из линейной зависимости подсистемы). Тогда на основании утверждения 2 имеем d = oa + j3b+7C. В силу теоремы 14.2 отсюда следует, что векторы а, Ь, с, d линейно зависимы. Итак, понятие линейной зависимости является обобщением поня- тий коллинеарности и компланарности геометрических векторов. Трудно не заметить логическое "однообразие" формулировок и доказательств изложенных выше теорем. Мы не старались уходить от повторений, чтобы под- черкнуть, как похожи по своей структуре три различных линейных пространства У1, У2 и Уз - векторов на прямой, на плоскости и в пространстве. Резюмируем полученные результаты. Итак, для п = 1,2,3 в линейном пространстве Уп 1) существует линейно независимая система из п векторов, а любая система из большего числа векторов линейно зависима; 2) существует линейно независимая система из п векторов, а любой вектор пространства Уп линейно выражается через них; 3) максимальное число линейно независимых векторов равно п. Мы выделили общие свойства, характерные для различных линейных прост- ранств У1, У2 и У3. Возникает естественный вопрос, не являются ли они общими для всех линейных пространств. Прежде чем ответить на этот вопрос, обратимся вновь к матрицам. § 16. Ранг матрицы Понятие линейной зависимости векторов тесно связано с понятием матрицы. Если рассматривать строки и столбцы матрицы А б К'пхп как векторы арифмети- ческих пространств R" и Rm, то оказывается, что одна из важнейших характери- стик матрицы определяется свойством линейной зависимости ее строк и столбцов. В свою очередь, эта характеристика будет удобным аппаратом дальнейшего ис- следования линейных пространств.
§16. Ранг матрицы 71 Ранг матрицы и линейная зависимость. Рангом ненулевой матрицы называется максимальный порядок ненулевых миноров этой матрицы. Ранг нулевой матрицы по определению считается равным нулю. Обозначение: rg A, rangA,гА и др. Из определения вытекают следующие факты: 1) ранг матрицы не превосходит ее размеров: если А € Rmxn, то rg А < min(m, п); (161) 2) равенство rg А = г > 0 равносильно выполнению двух условий: а) в матрице А существует ненулевой минор r-го порядка, б) любой минор более высокого порядка равен нулю. Пусть rgA = т > 0. Любой ненулевой минор r-го порядка этой матрицы называется базисным минором, а строки и столбцы, в ко- торых расположен базисный минор, - базисными строками и столб- цами. Разумеется, у матрицы может существовать не один базисный ми- нор, но все они имеют один и тот же порядок, равный рангу этой матрицы. Теорема 16.1 (о базисном миноре). Базисные строки (столбцы) линейно независимы. Любая строка (столбец) является линейной комбинацией базисных строк (столбцов). Доказательство. Докажем столбцовый вариант теоремы. Пусть А = £ Rmxn и rg А = г > 0. Не нарушая общности рас- суждений, будем считать, что базисный минор Мг находится в левом верхнем углу. Тогда базисными столбцами будут первые г столбцов: ,0,2-) • • э Линейная независимость базисных столбцов доказывается от про- тивного. В самом деле, пусть это не так. Тогда на основании теоре- мы 14.2 один из базисных столбцов является линейной комбинацией других базисных столбцов. Но тогда и в миноре МТ один из столбцов будет линейной комбинацией других столбцов и МГ — 0. Это проти- воречит тому, что Мг - базисный минор. Пусть теперь а* - произвольный столбец матрицы А. Покажем, что он является линейной комбинацией столбцов щ, aj,.. ., аг. Бу- дем считать, что k > г (в случае k < г утверждение очевидно, так как ak = Oai 4- ... + 0а*_1 4- a*, 4- 0afc+i 4- ... 4- 0ar). Найдем числа ai,a2, ,ar € R такие, что a^ = 52j=1asas или, в поэлементной записи, Г a-ik = 1 = 1,т. (16.2) Л=1 Для этого составим вспомогательную матрицу а11 . • air aut А, = drl .. Orr ark . ап • Qir ait .
72 Глава IV. Введение в теорию линейных пространств полученную окаймлением минораМг г-й строкой и Jc-м столбцом мат- рицы А. Очевидно, |А»| = 0, i = l,m, так как в случае, когда г < г, матрица Д, содержит две одинаковые строки, а в случае, когда i > г, |Д,| является минором (г + 1)-го порядка матрицы А ранга г. Разло- жив |Д,| по последней строке, получим 0 = алА1+а<2-^2 + - • .+ай-Аг+ + омМг, где А], Л2,. -., Аг, являясь алгебраическими дополнениями к элементам вычеркиваемой строки, не зависят от г. Отсюда, полагая аа = -А,/МГ, s — 1,г, приходим к (16.2). Следствие 1 (необходимое и достаточное условие равенства нулю определителя). Определитель матрицы равен нулю тогда и только тогда, когда какая-либо ее строка (столбец) является ли- нейной комбинацией других ее строк (столбцов). Доказательство. Достаточность доказана в §4 (свойство 8). Необходимость вытекает из теоремы о базисном миноре, так как из равенства | А| = 0 следует, что rg А < п и, значит, в матрице А имеется хотя бы одна небазисная строка (столбец), которая является линейной комбинацией других (т.е. базисных) строк (столбцов). Пусть в линейном пространстве даны две системы векторов. Если каждый вектор одной системы линейно выражается через векторы другой, то говорят, что первая система линейно выражается через вторую. Очевидно, что “линейная выражаемость” обладает свойством транзитивности, т.е. если система векторов <ij,..., а*, линейно выра- жается через bi,..., bn, а система векторов Ь\,..., Ьп - через щ,..., Сщ, то ai,..., at линейно выражается через Ci,..., Ст- Теорема 16.2. Если в линейном пространстве большая си- стема векторов линейно выражается через меньшую, то большая система линейно зависима). Доказательство. Пусть ai,... ,am и bi,...,bn - две системы векторов в линейном пространстве, m > п и a, = г = Г m- Тогда в матрице С = си . Cfnl • • • ^тп . число строк больше числа столбцов. Из (16.1) и условия теоремы сле- дует, что rg С < п < т. Значит, в матрице С существует хотя бы одна небазисная строка (например, г-я), которая линейно выражается через другие строки. Тогда из свойств операций в пространстве Rn следу- ет, что вектор ai линейно выражается через другие векторы системы щ,..., ат. Отсюда и из теоремы 14.2 следует линейная зависимость системы векторов ai,..., ат. Теорема 16.3. Ранг матрицы равен максимальному числу ее линейно независимых строк (столбцов). 1 Теорема представляет собой другую формулировку теоремы, известной как “основная теорема о линейной зависимости” [14).
§16. Ранг матрицы 73 Доказательство. Пусть rgA = г и г > О (случай г = 0 оче- виден). Тогда в матрице А существуют г линейно независимых строк (столбцов) - это ее базисные строки (столбцы). При этом любая си- стема из большего числа строк (столбцов) линейно зависима на осно- вании теорем 16.1, 14.2. Следствие 2. rgA = rgAT. Замечание 1. Теорема 16.3 дает два новых определения ранга матрицы. Теорема 16.4. Если все строки (столбцы) матрицы А ли- нейно выражаются через строки (столбцы) матрицы В, то rgA < rgB. Доказательство. Пусть rgA = г, rgB = s и пусть сц,... ,аг и bi,...,b9 - базисные столбцы матриц А и В. Докажем, что г < з. Пусть г > з, тогда согласно условию теоремы система aj,..., аг ли- нейно выражается через систему столбцов матрицы В, которая, в свою очередь, в силу теоремы 16.1 линейно выражается через систе- му базисных столбцов bi,...', b$. Отсюда следует, что aj,..., аТ линей- но выражается через bj,...,5e, причем г > з. Из теоремы 16.2 вы- текает линейная зависимость ai,... ,аг. Это противоречит тому, что СЦ,..., От - базисные столбцы. Теорема 16.5. Ранг произведения матриц не превосходит рангов сомножителей. Доказательство. Пусть С = АВ. Из (2.3) и (2.2) следует, что строки матрицы С линейно выражаются через строки матрицы В, а столбцы С - через столбцы матрицы А. Отсюда в силу теоремы 16.4 вытекает, что rg С < rg В, rg С < rg А. Ранг матрицы и элементарные преобразования. Теорема 16.6. Ранг матрицы не изменяется при умноже- нии ее на невырожденную матрицу. Доказательство. Пусть С = АР, |Р| 0. Тогда на основа- нии теоремы 16.5 имеем rgC < rgA. С другой стороны, матрица Р обратима (теорема 5.2) и А = СР~1. Снова воспользовавшись теоре- мой 16.5, получим, что rgA < rgC. Оба этих неравенства говорят о том. что rg С = rg А. Аналогично доказывается, что rg QA = rg А, если IQI # о. Теорема 16.7. Элементарные преобразования матрицы не изменяют ее ранга. Доказательство. Это утверждение следует из теоремы 3.2 и невырожденности матриц (3.1) элементарных преобразований (|Р0|=-1, |А|=а^0,|То| = 1)-« Теорема 16.8. Ранг матрицы не изменится, если из си- стемы ее строк (столбцов) вычеркнуть или приписать строку (со- ответственно столбец), которая является линейной комбинацией других строк (соответственно столбцов).
74 Глава IV. Введение в теорию линейных пространств Доказательство. Рассмотрим вариант теоремы, относящийся к вычеркиванию строки. Прежде чем вычеркивать строку, являю- щуюся линейной комбинацией других строк, вычтем из нее эту ли- нейную комбинацию. Тогда вычеркиваемая строка станет нулевой, а ранг матрицы согласно теореме 16.7 не изменится. Затем вычеркнем нулевую строку. При этом ранг матрицы останется прежним, так как нулевая строка не влияет на порядок ее ненулевых миноров. Анало- гично доказываются другие варианты теоремы. Метод Гаусса вычисления ранга. Теоретическую основу это- го метода для решения данной задачи (см. §4) составляют следующие факты: - ранг верхней (нижней) трапециевидной матрицы равен количе- ству ненулевых строк (соответственно столбцов); - элементарные преобразования матрицы не изменяют ее ранга (теорема 16.7); - любая матрица элементарными преобразованиями строк и столб- цов приводится к трапециевидной форме (теорема 3.1). Метод Гаусса вычисления ранга матрицы состоит в приведении этой матрицы элементарными преобразованиями к верхней (нижней) трапециевидной форме и подсчете ее ненулевых строк (столбцов). Отметим, что этот метод почти копирует метод Гаусса вычисления определи- теля, отличие лишь в том, что в данной задаче он реализуется несколько проще, так как никакое элементарное преобразование не изменяет ранга матрицы. Замечание 2. Среди других методов вычисления ранга выделим метод окаймления миноров. Минор Mk+i (к 4- 1)-го порядка называется окаймляющим минор JVfjt к-го порядка, если получается из Mk+i вычеркиванием одной стро- ки и одного столбца. Метод окаймления миноров основан на следующем утвер- ждении (докажите!): если в матрице А существует ненулевой минор Мг г-го порядка, а все окаймляющие его миноры равны нулю, то rg А = г. Метод окайм- ления миноров состоит в поиске такого минора Мг путем перебора. Безусловно, он уступает методу Гаусса из-за большого объема требуемых вычислений, однако в некоторых случаях бывает полезным. Во всяком случае идея окаймления матрицы лежит в основе многих методов вычислительной алгебры. Эквивалентные матрицы. Две матрицы А, В € Rmxn называ- ются эквивалентными, если существуют невырожденные матрицы Р и Q такие, что А = PBQ. Обозначение: А ~ В. Теорема 16.9. Эквивалентность матриц является отно- шением эквивалентности на множестве матриц R’nx”. Доказательство. В самом деле, рефлексивность отношения следует из того, что А = 1тхтА1п<п, VA € Rmx"; симметричность - из того, что если А = PBQ, то В = P~1AQ~l; транзитивность - из того, что если А = PyBQi, В = P2CQ2, то А = P1P2CQ2Q1 = PCQ, где Р = PiP2, Q = Q2Q1 Теорема 16.10. Любая ненулевая матрица А €. Rmxn ран- га г эквивалентна матрице Ir € Rmx" вида
§16. Ранг матрицы 75 ' 1 0 ... О О 1 ... О о О О ... 1 о о (здесь все элементы, кроме первых г диагональных элементов, рав- ных 1, равны 0). Доказательство. Покажем, что матрица А элементарными пре- образованиями строк и столбцов приводится к виду 1Г. В самом деле, строчный вариант основного процесса (§3) приводит ее к верхней сту- пенчатой форме. Если к получившейся матрице применить столбцо- вый вариант основного процесса, то придем к диагональной матрице. Так как элементарные преобразования матрицы не изменяют ее ранга, то ровно г первых диагональных элементов этой матрицы отличны от нуля. Разделив каждую из первых г строк на диагональный элемент, получим матрицу 1Т. На языке матриц элементарных преобразований это означает, что существуют матрицы элементарных преобразо- ваний Qi,--,Qk и Pi,... ,PS такие, что Ir = Qk .. .Q1AP1.. .Ps (теорема 3.2). Положив Q = Qk Qi и Р = Pi - Pa, получим, что 1Г — QAP, где |Q| Ф 0, |Р| / 0 в силу невырожденности матриц элементарных преобразований. Теорема 16.11. Две матрицы А,В € Rmxn эквивалентны тогда и только тогда, когда их ранги совпадают. Доказательство. Необходимость вытекает из определе- ния и теоремы 16.6. Достаточность следует из теоремы 16.10 и транзитивности отношения эквивалентности. Скелетное разложение матрицы. Теореме о базисном миноре можно дать чисто матричную формулировку. Теорема 16.12. Любая матрица А е Rmxn ранга г может быть представлена в виде А = ВС, (16.3) где В е Rmxr, С & Rrxn. Доказательство. Для получения разложения (16.3) достаточ- но взять в качестве столбцов матрицы В базисные столбцы матри- цы А. Так как любой столбец матрицы А является линейной комби- нацией столбцов матрицы В aj = cijbi + ... + Crjbr, j = 1, n, то коэффициенты cij, c^j, . •, Crj образуют j-й столбец матрицы С (j=TJi, см. (2.2), (2.3)).
76 Глава IV. Введение в теорию линейных пространств Представление (16.3) называется скелетным разложением матри- цы А. Отметим, что в скелетном разложении rgB ~ rgC = г, так как rgA < rgB, rg А < rgC. Скелетное разложение можно трактовать и в строчном варианте: строки матрицы С - это базисные строки матрицы А, через которые линейно выражаются все строки матрицы А. Тогда коэфициенты этих линейных комбинаций образуют строки матрицы В. Интересен и матричный вариант скелетного разложения: если Ьг,... ,ЬГ - базисные столбцы, а с\,... ,<4 - базисные строки матри- цы А, то (16.4) i=l т.е. матрица А € RTOXn может быть представлена как сумма г ма- триц размера т х п, являющихся произведением столбца на строку. Это доказывается следующим образом. Если В» € R’nxr - матрица, у которой г-й столбец совпадает с г-м столбцом матрицы В, а все осталь- ные столбцы нулевые, С, € Rrxn - матрица, у которой г-я строка со- впадает с г-й строкой матрицы С, а все остальные строки нулевые, то B = Bi+...+Br, С = (?!+...+Cr, BiCi = b^ BiCj = 0 (i/j) и Г г А = (Bj + ... + Вг){Сг + ... + Сг) = 52 = 52bi^. i=l i= 1 § 17. Базис и размерность Определения. Базисом линейного пространства называется упорядоченная линейно независимая система векторов пространства, через которую линейно выражается любой вектор пространства. Со- гласно этому определению система векторов .., еп линейного про- странства V образует базис V, если • ei,..., еп линейно независима; • для любого вектора х Е V существуют числа xi,...,xn такие, что х = xiei + ... + х„еп. Как показано в §15, любой ненулевой вектор является базисом линейного пространства У) векторов на прямой, любая пара некол- линеарных векторов - базисом пространства Vz векторов плоскости, любая тройка некомпланарных векторов - базисом пространства V-j.
§17. Базис и размерность 77 Теорема 17.1. Система векторов ei,..., еп линейного про- странства является его базисом тогда и только тогда, когда она образует максимальную линейно независимую систему векторов этого пространства. Доказательство. Необходимость. Базис пространства явля- ется максимальной линейно независимой системой векторов в этом пространстве, так как любая большая система векторов линей- но выражается через этот базис (т.е. через меньшую систему) и на основании теоремы 16.2 линейно зависима. Достаточность. Пусть в\,...,еп - максимальная линейно не- зависимая система векторов пространства V, тогда для любого век- тора х е V система векторов ei,... ,еп,х линейно зависима, так как содержит более чем п векторов. Из теоремы 14.6 следует, что вектор х является линейной комбинацией е^,... ,еп. Следовательно, векторы ei,...,еп образуют базис пространства V. Теорема 17.1 дает другое определение базиса. Итак, все базисы одного линейного пространства состоят из одина- кового числа векторов, равного максимальному числу линейно неза- висимых векторов этого пространства. Это означает, что число век- торов базиса является характеристикой не столько базиса, сколько самого пространства. Число векторов базиса называется размерно- стью линейного пространства. Размерность нулевого пространства по определению считается равной нулю. Обозначение: dimV. Из теоремы 17.1 следует, что размерность линейного пространства рав- на максимальному числу линейно независимых векторов этого про- странства. Линейное пространство размерности п, где п - целое не- отрицательное число, называется n-мерным пространством. Любое n-мерное пространство называется конечномерным линейным прост- ранством. Конечномерными пространствами не исчерпываются все линей- ные пространства: не во всяком пространстве можно указать макси- мальное число линейно независимых векторов. Линейное простран- ство называется бесконечномерным. если для любого k € N в нем найдется линейно независимая система из к векторов. Из определе- ния размерности и теоремы 17.1 вытекают следующие утверждения. Утверждение 1. В п-мерном пространстве любые п линейно независимых векторов образуют базис. Утверждение 2. В п-мерном пространстве любая система из s векторов, где s > п, линейно зависима. Примеры. 1. Геометрические пространства Vj, V2, V3. Из результатов §15 следует, что dim Vn = п, где п = 1,2,3. 2. Арифметическое пространство Rn. В пространстве R” единичные векторы (14.6) образуют базис, так как они линейно не- зависимы и, как нетрудно проверить, любой вектор а = (ai,...,a„) пространства R” линейно выражается через них: а = aiej +.. . + апеп. Итак, dimRn — п.
78 Глава IV. Введение в теорию линейных пространств 3. Пр остранство матриц R"1*”. Рассмотрим матрицы Г12, , Е\п, E2i, , Emn, у которых все элементы равны нулю, кроме одного: в матрице Eij элемент в позиции (i, j) равен единице. а) Эти матрицы линейно независимы, так как из того, что m п ^11 £ 52 aijEij = i=1>=1 L aml ^ln = 0, ^mn - следует, что al7 = 0, i = l,m, j = l,n. б) Любая матрица A — (atj) € Rmxn является линейной комбина- цией этих матриц (как видно из п."а"). Следовательно, эти матрицы образуют базис Rmxn и dimRr/lxn = mn. 4. Пространство многочленов Мп. Многочлены l,t,t2, ... , tn образуют базис Мп, так как они линейно независимы (§14), а любой многочлен p(t) = a# 4- ait + ... +'antn € Mn является линей- ной комбинацией этих многочленов с коэффициентами ао,аь... Итак, dim Mn — n 4- 1. 5. Пространство Моо многочленов всех степеней (§13, при- мер 4) бесконечномерно, так как для любого к G N можно указать к линейно независимых многочленов: 1, t, t2,..., tk-1. Координаты вектора. Базис играет большую роль в изучении линейного пространства. С его помощью абстрактные векторы мож- но задавать в виде совокупности чисел, а операции над векторами сводить к операциям над числами. Теорема 17.2. Разложение вектора по базису единствен- но. Это утверждение вытекает из теоремы 14.5. Коэффициенты разложения вектора по базису называются коорди- натами вектора в этом базисе. Из определения базиса и теоремы 17.2 следует, что каждый вектор имеет координаты, при этом два вектора равны тогда и только тогда, когда равны их координаты. Обозначение. Если е,,.,. ,еп - базис пространства и х — 4-... 4~ *Гп^п (171) то будем обозначать через хе вектор-столбец из координат вектора х в этом базисе: Tg = [ ] • (17.2) Столбец хе называют координатным столбцом вектора х в базисе ei,..., еп. Положим е = (ei,e2,... ,еп). (173) Символ е будем понимать как обозначение базиса ej,..., еп и как матрицу-строку (e^ej,... ,еп). В обозначениях (17.2) и (17.3) раз- ложение (17.1) может быть записано как произведение строки е на столбец хе- х - е.хе. (17.4)
§17. Базис и размерность 79 Теорема 17.3. При сложении векторов их координаты в одном базисе складываются, а при умножении вектора на число его координаты умножаются на это число. Доказательство. Пусть х — у — Тогда из аксиом линейного пространства следует, что х + у = и ах = 52”-! axid. Следовательно, (х + у)е = хе + уе и (ах)е = ахе- Переход к другому базису. Пусть е = (ei,e2,... , е^) и f = = (/1, /г, - • > /п) _ Два базиса n-мерного пространства V. Выясним, как меняются координаты вектора при переходе от базиса е к бази- су /• Векторы второго базиса, как векторы пространства V, разлагают- ся по базису е; пусть /1 = СцС1 + С21Й2 + ... + cnien, /2 = С12С1 + С22в2 + . . . + Сп2еп, fn — CjnCi + C2nO2 + Опп^-п- Коэффициенты с^ этих разложений образуют матрицу С = (C.J € Rnxn, (17.6) которая называется матрицей перехода от базиса е к базису f. Обозначение: С или Се_>/. Замечание. Соотношения (17.5) в обозначениях (17.3) и (17.6) могут быть записаны компактно в виде f = еС. (17.7) Теорема 17.4. Матрица перехода к другому базису не вы- рождена. Доказательство. Пусть |С| = 0. Тогда (теорема 16.1, след- ствие) один из столбцов матрицы С является линейной комбинацией других ее столбцов. В силу свойства линейности координат отсюда следует, что один из векторов /1,..., fn линейно выражается через другие векторы этой системы. Это противоречит линейной независи- мости /1, ... , fn- Теорема 17.5. Если С - матрица перехода от базиса е к базису f, то С-1 - матрица перехода от базиса f к базису е. Доказательство. Пусть / = еС. Умножив обе части этого ра- венства на С-1, получим, что е = fC~\ откуда в силу (17-7) следует, что С~1 - матрица перехода от базиса / к базису е. Теорема 17.6. Координаты вектора х в базисах е и f свя- заны между собой соотношением xe = Cxj, (17.8) где С - матрица перехода от базиса е к базису f. Доказательство. Из (17.4) и (17.7) имеем, что х — ехе и х = — fxj — (eC)if — e(Cxf). Отсюда в силу единственности разложения по базису получаем (17.8).
80 Глава IV. Введение в теорию линейных пространств § 18. Линейное подпространство и линейное многообразие Линейное подпространство. Непустое подмножество L прост- ранства V называется линейным подпространством пространства V, если оно само является линейным пространством относительно за- конов композиции, действующих в V. Теорема 18.1. Непустое подмножество L пространства V является линейным подпространством этого пространства то- гда и только тогда, когда имеют место импликации: a,b Е L => а + b 6 L; fig i\ aeL.oeR => aaeL. Доказательство. Необходимость очевидна, так как если L - линейное пространство, то результаты выполнения операций над элементами из L находятся в L. Достаточность. Соотношения (18.1) говорят о том, что опера- ции сложения и умножения на число являются законами композиции в L. Остается проверить, что они подчиняются всем аксиомам ли- нейного пространства. В действительности же необходимо проверить только аксиомы нуля и противоположного элемента, так как выпол- нение остальных аксиом очевидно. Возьмем произвольный элемент а € L, тогда Оа = 0 и (—1)а = —а. Из (18.1) следует, что 6 € L и —а € L. Итак, L - линейное подпространство пространства V Свойства (18.1) называют свойствами замкнутости множества L относительно указанных операций. Примеры. 1. Каждое линейное пространство обладает двумя под- пространствами: нулевым подпространством (состоящим из одного нулевого вектора) и самим пространством. Эти подпространства на- зываются тривиальными. 2. Геометрическое пространство У) векторов на прямой имеет два тривиальных подпространства. Геометрическое пространство V? век- торов на плоскости, кроме тривиальных подпространств, имеет беско- нечно много нетривиальных: каждое из них является пространством всех векторов, концы которых лежат на прямой, проходящей через начало координат (или если отойти от соглашения об откладывании всех векторов от начала координат, то пространством всех векторов, параллельных некоторой прямой). В геометрическом пространстве Уз векторов пространства каждая прямая и каждая плоскость, проходя- щие через начало координат, определяют линейное подпространство. 3. В пространстве многочленов Мп каждое пространство М^, где 0 < к < п, образует линейное подпространство. Линейное аффинное многообразие. Примеры линейных под- пространств в геометрических пространствах дают геометрический образ подпространства как прямой или плоскости, проходящей через
§18. Линейное подпространство и линейное многообразие 81 начало координат. Возникает естественный вопрос, что же будет ана- логом других прямых и плоскостей в произвольном линейном прост- ранстве. Ответим на этот вопрос. Пусть V - линейное пространство, L - некоторое его подпростран- ство, то _ некоторый вектор пространства V. Множество Н всевоз- можных векторов вида то + х, где х € L, называется линейным мно- гообразием (или линейным аффинным многообразием, или линейным точечным многообразием) пространства V, полученным сдвигом подпространства L на вектор xq. Вектор то называется вектором сдвига, а подпространство L — направляющим подпространством ли- нейного многообразия Н. Обозначение: Н = х0 + L. Итак, xQ + L = {tq + € L}. Очевидно, линейное подпространство L является частным случаем линейного многообразия, когда вектор сдвига xq € L. Рис. 1 Пример. Пусть на плоскости V2 задано некоторое подпростран- ство L, т.е. совокупность всех векторов х, концы которых лежат на прямой, проходящей через начало координат. И пусть хо - некоторый фиксированный вектор плоскости (рис. 1). Тогда нетрудно показать, что линейное многообразие Хо 4- L есть множество векторов, концы которых лежат на прямой, полученной из прямой L сдвигом ее на вектор хо- Из определения вытекают следующие факты. 1°. Вектор сдвига xq принадлежит линейному многообразию, так как х0 = хо + 9, 9 G L. 2°. Разность двух векторов линейного многообразия принадле- жит направляющему подпространству, так как если zi — то + я, х е L, z2 = + у, у е L, то zi — г? = х - у е L. Т е о р е м а 18.2. Два линейных многообразия Hi = Ху + Li и Н2 = х2 + L2 совпадают тогда и только тогда, когда Li = L2 = L и з?1 — х2 € L. Доказательство. Необходимость. Пусть Hi = Н2, тогда Ху € Н2 и, в силу свойства 2°, xj — х2 € L2. Покажем, что Lj = L2. Для произвольного вектора х € Li имеем Xi 4-i € Hi. Так как Hi = Н2, то
82 Глава IV. Введение в теорию линейных пространств существует вектор у € L2 такой, что ац +- х = аг2 + у. Таким образом, х = (х2 — ii) + у, где х.2 - xi е L2, у & L2- Отсюда следует, что х е Ь2 и Li С Ь2. Аналогично доказывается, что L2 С L\. Оба вложения говорят о том, что L1 — Ь2. Достаточность. Пусть Li = L2 = L и ii — х2 G L. Тогда для произвольного вектора z G Hi имеем z — Xi + х, где х € L, или z = х2 + (®1 + х е L. Так как Ху — х2 € L и х € L, то (xi — х2) + + х € L, следовательно, z € Я2 и Hi с Я2. Аналогично получаем, что Я2 С Н{. Это означает, что Hi = Я2. Следствие 1. Вектором сдвига может служить любой век- тор линейного многообразия. Действительно, если Xi - произвольный вектор линейного много- образия Н = Xq + L, то Xi — xq € L и Н = Х1 + L. Следствие 2. Линейное многообразие может быть получено сдвигом единственного направляющего подпространства. Это ут- верждение непосредственно вытекает из теоремы. Следствие 2 позволяет переносить некоторые характеристики на- правляющего подпространства на само линейное многообразие. Раз- мерностью линейного многообразия называется размерность его на- правляющего подпространства. Обозначение: dim Я. Линейное многообразие размерности единица называется прямой в линейном пространстве, размерности (п — 1), где п = dimV, - гиперплоско- стью, а размерности k, 1 < к < п — 1,- к-мерной плоскостью. Пример. Из определения следует, что прямая на плоскости V2 и плоскость в пространстве V3 - гиперплоскости в пространствах V2 и V3. Естественно ожидать, что, представляя собой один и тот же объект, они обладают общими свойствами. В этом мы убедимся в по- следующих главах.
Глава V. Векторная алгебра От алгебраического определения координат вектора перейдем к их геометрическому описанию. Рассмотрим линейные пространства Vi, Рг> векторов на прямой, на плоскости и в пространстве. В §15, 17 было доказано, что: • dim Vi = 1, а любой ненулевой вектор ei является базисом Vj, • dim V2 = 2, а любая пара неколлинеарных векторов е2, е2 явля- ется базисом V2, • dim V3 = 3, а любая тройка некомпланарных векторов ех, е2, е3 является базисом V3. При доказательстве теорем §15 практически показано, как нахо- дятся координаты векторов в этих пространствах. Вернемся к этому вопросу. § 19. Координаты вектора 1. Пусть ei - базис Vi и а - произвольный вектор из Vj. Отло- жим эти векторы от одной точки О прямой Vj (§15, рис. 2,а), так что ex = О&, а = О Аг, тогда а = xej, где |oaJ|/|o3|, -|од1|/|д^|, аТТ ег, afj, ev (19-1) Введем на прямой V) направление: пусть положительное напра- вление на прямой совпадает с направлением базисного вектора ei- Тогда согласно (19.1) и (10.1) получим _ (а) 1е1| |ехГ (19-2) Ось, положительное направление которой совпадает с направле- нием вектора е, будем называть осью, определенной вектором е. 2. Пусть , е2 - базис V2 и а - произвольный вектор из V2. От- ложив эти векторы от одной точки О плоскости Ц (§15, рис. 2,6), так что ei = OEi, е2 = ОЕ2, а = и введя направления на прямых OEi и ОЕ2, совпадающие с направлениями базисных векторов ei и е2, получим в соответствии с (19.2), что а — iei + уе2, _ (ОЛ0 _ (ОЛ2) 1 |ei| ’ У |е2| (19.3)
84 Глава V. Векторная алгебра где Ai, А2 - проекции точки А на прямые OEi и 0Е3, параллельные соответственно прямым ОЕ3 и OEi. 3. Пусть ei, е2, eg - базис V3 и а - произвольный вектор из V3. Поступая аналогично (§15, рис. 2,е), получим а = xei + уе2 + ze3, (ол!) (ол^) (ол!) 1 |ei| ’ У |е2| ’ Z |е3| где Л1, Л2, Л3 - проекции точки Л на прямые OEi, ОЕ3 и ОЕ3, параллельные соответственно плоскостям ОЕ2Е3, ОЕ\Е3 и ОЕ\Ез- § 20. Координаты точки Аффинная система координат. Пусть в пространстве V3 (на плоскости V3 или на прямой Ц) зафиксирована некоторая точка О, называемая полюсом. Для любой точки Л вектор гд - О& назы- вается радиус-вектором точки А относительно полюса О. Задание точки ее радиус-вектором определяет, очевидно, биективное отобра- жение. Тот факт, что точка Л имеет радиус-вектор г, обозначают символом Л(г). Если в пространстве V3 зафиксированы точка О и базис е15 е2, е3, то говорят, что в пространстве задана аффинная система координат (или общая декартова система координат) {О; ei, е2, ез}. Точка О называется началом координат; оси, проходящие через начало ко- ординат и определенные векторами ех, е2, ез, называются осями ко- ординат и обозначаются Ох (ось абцисс), Оу (ось ординат), Oz (ось аппликат) соответственно. Плоскость, определяемая осями координат Ох и Оу (Ох и Oz, Оу и Oz), называется координатной плоскостью Оху (Oxz, Oyz соответственно). В этой терминологии аффинная си- стема координат обозначается также символом Oxyz. Координатами точки А в аффинной системе координат {О; е2, е2, ез} называются координаты радиус-вектора гд этой точки в ба- зисе ei, е2, ез- Тот факт, что точка Л имеет координаты x,y,z, обо- значают символом A(x,y,z). Итак, гд = xei + j/e2 -I- ze3 <=> A(x, y, z). (20.1) Замечание1. Из определения следует, что любая точка А прост- ранства в заданной системе координат имеет координаты, причем точки ЛДХ1, у\, zi) и А3(х2, У2, -?2) совпадают тогда и только тогда, когда ц = х2, yi = У2, zi = z2. Замечание 2. Координаты точки Л(х,у, z) определяются соот- ношениями (19.4). При этом, как легко видеть, проекции Л1,А2,Аз точки Л имеют координаты А1(т, 0,0), Л2(0, у, 0), Л3(0,0, z). Аналогично определяются аффинные системы координат {О; е2, е2} на плоскости V2 и {О; ei} на прямой V), а также координаты
§ 20. Координаты точки 85 точки А(х, у) и Л(т) соответственно. При этом имеют место очевид- ные аналоги соотношения (20.1) и обоих замечаний. В дальнейшем все факты будем излагать только в терминах пространства Уз. Замечание 3. В традиционных курсах аналитической геометрии коорди- наты точки вводятся с помощью метода координат, базирующегося на аксиомах геометрии. Это приводит к достаточно сложной аксиоматике (см. Приложение), вообще говоря, практически не использующейся в других разделах математики. Введение координат точки с помощью вектора (т.е. используя векторную аксио- матику линейного пространства) значительно упрощает все исследования, сводя геометрические построения к свойствам вещественных чисел. Теорема 20.1. Если A(xi,yi,zi) и В(х2,У2, - точки пространства, заданные своими координатами в системе ко- ординат {<?; ei, е2, ед}, то вектор а = А^ в базисе ei, е?, ед имеет координаты а = {т2 — Х\,У2 — yi,Z2 — Zi}. -.Л Доказательство. Действитель- но, Л^ = — оА (рис. 1) и, сле- довательно, а — тв — г^. Так как ° /_______________ \ В ГД = {Т1, У1, 21}, ГВ = {Х2,У2, Z2}, ТО в силу свойства линейности коорди- Рис. 1 нат отсюда следует утверждение те- оремы. Деление отрезка в данном отношении. Говорят, что точ- ка М В делит ненулевой отрезок [ЛВ] в отношении А, если Л л! = ХМ^ (рис. 2). м ММ I--И--- I------ I-Н--► ---1--► Л В А=М В А В АВ Рис. 2 Обозначение: (АВМ) = А. Из определения следует, что точка М расположена на прямой АВ, при этом (рис. 2): 1) если М - внутренняя точка отрезка [ЛВ], то А > 0; 2) если М = А, то А = 0; 3) если М расположена вне отрезка [ЛВ], то А < 0. Заметим, что других вариантов расположения точки М не может быть и что ни в одном из возможных вариантов А не равно —1. Теорема 20.2. Пусть А(ri), В(г2), ЛГ(гз) - точки прост- ранства и (АВМ) — А. Тогда гз = ri + Аг2 1 + А (20.2) Доказател ьство. Условие (ЛВМ) — А означает, что или гз - Г! = А( г2 - Гз). Отсюда следует (20.2). А& = ХМ$
86 Глава V. Векторная алгебра Следствие. Соотношение (20.2) в координатной форме имеет следующий вид: для A(xi,yi,Zi), В(х2,У2>^2), М(хз,уз, Z3) 11 + Ах2 У1 + Ау2 + А-гг 13 ~ 1 + А ' Уз~ 1 + А ’ Z3~ 1 + А (20.3) Прямоугольные координаты. Базис ei,..., еп, где п — 1,2,3, называется ортонормированным, если векторы базиса 1) имеют единичную длину и, в случае п > 1, 2) попарно перпендикулярны. Аффинная система координат {О; е^, ег, ез}, соответствующая ортонормированному базису ех, ег, ез, называется прямоугольной декартовой системой координат. §21. Проекции вектора и координаты Проекции вектора на плоскости. Пусть на плоскости Р даны две непараллельные прямые I и L. Проекцией направленно- / го отрезка А& на прямую I / ^^*7 параллельно прямой L называет- / / ся (рис. 1) направленный отре- / Г / зок AiBj, где Ai, Вх - про- О / I екции точек А и В на пря- / At Вг мую I параллельно прямой L. < Обозначение: рт^АВ. Рис- 1 Теорема 21.1. Проекции равных направленных отрезков равны. Доказательство. Пусть АЙ = С15, покажем, что рг^А^ = рг^сб. Введем на плоскости систему координат {О, е15 е2}, где О - точка пересечения прямых I и L, ej - базис на прямой I, е2 - базис на прямой L. Пусть точки А, В, С, D имеют координаты А(хд,з/д), В(хв,Ув), С(хс,ус}, D[xD,yD). Так как а = А& = сЬ, то согласно теореме 20.1 xB-xA=xD-xC- (21.1) Так как точки Ах, В\, С\, Di имеют координаты А^(хА,0), ВДтд, 0), Ci(xc, 0), £>i(xd,0) (§20, замечание 2), то Ь = AiBj = {тд-тд.О}, с = CiDi — [хв — тс,0}. Согласно (21.1) отсюда следует, что Ь = с. Это означает, что AjBi и C\Di порождают один и тот же вектор и поэтому равны.
§ 21. Проекции вектора, и координаты 87 Проекцией вектора а — АВ на прямую I параллельно прямой L называется вектор, порожденный рг^А^. Обозначение: рг[ а. Корректность определения вытекает из теоремы 21.1. Теорема 21.2. Проекция вектора на прямую I параллельно прямой L обладает свойством линейности: 1) prf'(a+ b) — ptf а 4- prf b, Va, Ь, pr^(aa) — а рг^ a, Va, VaGR. Доказательство. Пусть в базисе ei, е2, рассмотренном выше, векторы а, b имеют координаты а = {ai,a2}, Ь = {£>1,£>г}. Тогда pTi а = {ai, 0}, prfL b = {£>1,0} и в силу линейности координат рг^ а + + ptf b = {ai + £>i,0}. С другой стороны, а + b = {ai + £>i, a2 4-£>2} и рг^ (а + b) = {ai +£>i,0}. Следовательно, рг^ (а + b) = prf а+рт^ Ь. Аналогично доказывается второе условие линейности. Замечание 1. Формулы (19.3) для координат вектора а в ба- зисе ei, е2 плоскости V2 могут быть записаны в терминах проекций вектора на ось в виде х - _ (рту а) у~ ы (21-2) где ргх а и ргу а - проекции вектора а на оси, определенные вектора- ми ei и е2 соответственно (т.е. оси координат Ох и Оу), параллельно другой оси (т.е. оси Оу и Ох соответственно). Проекции вектора в пространстве. Пусть в пространстве заданы плоскость тг и не- параллельная ей прямая I. Проекцией направленного отрезка А& на прямую I (на плоскость тг) параллельно плоскости тг (соответственно прямой I) называется (рис. 2^ направленный отрезок А1В1 (Л2В2), где Ai и Bi (Л2 и В2) - проекции точек А и В на прямую I (плоскость тг) парал- лельно плоскости тг (прямой I). Обозначение: Для обеих проекций спргм- ведливо утверждение теоремы 21.1: проекции равных направ- ленных отрезков равны. Доказательство утверждения для проекций в пространстве отличается от доказательства теоремы 21.1 только тем, что система координат {О; ei, е2, ез} состоит из точки О пересече-
88 Глава V. Векторная алгебра ния прямой I с плоскостью тг, базиса ei, ез плоскости тг и базиса ез прямой I. Проекцией вектора а — на прямую I (плоскость л) параллель- но плоскости тг (прямой I) называется вектор, порожденный рг[А^ (рг^).Обозначени е: pr* a, prlv а . Обе проекции вектора обла- дают свойством линейности. Доказательство этого факта повторяет доказательство теоремы 21.2 с той лишь разницей, что рассматрива- ется система координат {О; ei, ез, ез}, упомянутая выше. Замечание 2. Формулы (19.4) для координат вектора а € V$ в базисе ej, ез, ез могут быть записаны в терминах проекций вектора на ось в виде _ (prxa) _ (prva) _ (prza) х~ Ы ’ Ы ' 2_ Ы ’ (21.3) где ргх а, ргу а, ргг а - проекции вектора а на оси, определенные ба- зисными векторами ei, ез, ез (т.е. оси координат Ох, Оу, Oz), парал- лельно координатным плоскостям Oyz, Oxz, Оху соответственно. Теорема 21.3. На плоскости (в пространстве) величина проекции вектора на ось параллельно прямой (соответственно плос- кости) обладает свойством линейности. Утверждение теоремы следует из того, что величины рассматри- ваемых проекций пропорциональны координатам (согласно (21.2) и (21.3)), которые обладают свойством линейности (теорема 17.3). Мы определили три различные проекции вектора. Во всех трех случаях, если I.LL или 11лг, проекции вектора называются ортого- нальными проекциями. § 22. Скалярное произведение Определение и основные свойства. Пусть а и b - ненулевые векторы. Отложим их от одной точки О. Пусть а = О^, Ь = оЗ. Углом между векторами а и Ь называется наименьший угол между лучами [ОЛ) и (ОВ). Обозначение: (а, Ь). Корректность опреде- ления очевидна. Из определения следует, что 0 < (а, Ь) < тг. Скалярным произведением ненулевых векторов а и b называет- ся число, равное произведению длин этих векторов на косинус угла между ними. Если один из векторов а или b нулевой, то скалярное произведение этих векторов по определению считается равным нулю. Обозначение: (а, Ь). Итак, для ненулевых векторов а и b (а, Ь) = | а| -1 b| cos(а, Ь). (22.1) Обозначим через рта b ортогональную проекцию вектора b на ось, определенную вектором а О (рис. 1).
§22. Скалярное произведение 89 Рис. 1 Теорема 22.1. Если а / О, то для любого вектора Ь (a, b) = |а| (ргаЬ) = (а,ргаЬ). (22.2) Доказательство. Утверждение теоремы очевидно для Ъ= О и (а, Ь) = тг/2. Пусть b / О и 93 = (а, Ь) / тг/2. Тогда (рис. 1) |рг.ы = |b|-|eosv| = ( IF 1 1 1 1 1 — |b|cosy>, prabt4- a. Отсюда следует, что (prab) = |b|cos<p и, тем самым, (a, b) = = |a|(prBb). Вторая часть соотношения (22.2) вытекает из первой, так как praprab = prab. Теорема 22.2. Для любых векторов а, Ь, с и числа а € R 1) (а, Ь) = (Ь, а); 2) (а + Ь, с) = (а, с) + (Ь, с); 3) (аа, Ь) = а( а, Ь); 4) (а, а) > 0, причем (а, а) = О тогда и только тогда, когда а = 0. Доказательство. Свойства 1 и 4 очевидны. Докажем свойство 2. Имеем (а+ Ь, с) — (с, а+ Ь) = | с| (ртс( а+ Ь)) — {согласно теоре- ме 21.3} = | с| (ргс а) + | с| (ргс Ь) = (а, с) + (Ь, с). Аналогично про- веряется свойство 3. Следствие 1. Из свойств 1-3 следует, что скалярное произ- ведение линейно и по второму множителю: (a, b -I- с) = (а, Ь) + (а, с), (а, а Ь) — а( а, Ь). Скалярное произведение в координатах. Свойство линейно- сти скалярного произведения позволяет перемножать линейные ком- бинации векторов (т.е. находить их скалярное произведение): , к т \ к т ( ai а»,Д,; bj j = }У^а,^(а<, bj). (22.3) 4=1 j = l ' i=l j=l Это, в частности, означает, что скалярное произведение векторов мо- жет быть вычислено по их координатам, если известна “таблица умно- жения" базисных векторов. Возможность подобного вычисления ска- лярного произведения векторов позволяет определить по известным
90 Глава V. Векторная алгебра координатам длину вектора и угол между векторами, так как | а| = = \/(а> а)’ cos(a> Ь) = (а> Ь)/(1 а1 ' I bD- Задача вычисления скалярного произведения векторов по их ко- ординатам существенно упрощается, если рассматривается ортонор- мированный базис. Векторы а и Ь называются ортогональными, если (а, Ь) — 0. Из определения следует, что векторы а и Ь ортогональ- ны тогда и только тогда, когда либо один из них нулевой, либо они перпендикулярны. В терминах ортогональности векторов ортонорми- рованность базиса ei,..., еп, где n = 1,2,3, означает, что (et, ej) = |j’ (22.4) Теорема 22.3. Скалярное произведение векторов а = =Oj ei +ai2 ег +аз ез и b = ei +/З2 е2 +/3з ез равно сумме попарных произведений координат: з (а, Ь) = £а^ (22.5) «=1 тогда и только тогда, когда ej, ез, вз - ортонормированный базис. Доказательство. Достаточность вытекает из (22.3) и (22.4). Необходимость. Соотношения (22.4) вытекают из (22.5), если учесть, что векторы ei, ез, ез в базисе ei, ез, ез имеют координаты (1,0,0), (0,1,0), (0,0,1) соответственно. Следствие 2. Если векторы а = {04,02,03}, b = {/3j,/З2,/Зз} заданы координатами в ортонормированием базисе, то I.| = cos(aTb) = + °^+ (22.6) Следствие 3. В прямоугольной декартовой системе коорди- нат расстояние р(А,В) между точками A(xi,yx, zi) и В(х2,у2, Z2) находится по формуле р(А,В) - у/(Х2 - хг)2 -I- (у2 - У1)2 + (z2 - Hj)2. Это равенство следует из того, что р(А, В) = |Afl| и = = {12 - Х1, Уз - У1,г2 - Z1}. Направляющие косинусы. Направляющими косинусами век- тора (луча) называются косинусы углов, образованных этим векто- ром (соответственно лучом) с осями координат. Для прямоугольной декартовой системы координат {О; ei, е2, ез} направляющие косину- сы единичного вектора е совпадают с координатами вектора е в ба- зисе ei, ез, ез, так как если е — 04 ei Ч-аз е2 Ч-аз ез, то о* = (е, е*) = — cos(e, е*), k - 1, 2, 3.
§ 23. Векторное и смешанное произведения 91 § 23. Векторное и смешанное произведения Ориентация в вещественном линейном пространстве. В §19 при рас- смотрении оси, определенной ненулевым вектором е, мы фактически ввели ори- ентацию на прямой, назвав положительным то направление, которое совпадает с направлением вектора е. Прежде чем вводить определение ориентации, общее для прямой, плоскости и пространства, снова обратимся к прямой. Каждый не- нулевой вектор е прямой образует базис, и переход от одного базиса к другому осуществляется умножением этого вектора на ненулевое число. Так как это число либо положительно, либо отрицательно, то все базисы на прямой разбиваются ровно на два класса: базисные векторы одного класса имеют одинаковое напра- вление, а любые два базисных вектора разных классов имеют противоположные направления. Тот факт, что базисные векторы относятся к одному классу, на ал- гебраическом языке означает, что они отличаются положительным множите- лем. Именно этим мы и воспользуемся для определения ориентации. Два базиса е = (ej,..., еп) и е' = (e'lt..., е'п) линейного простран- ства V называются одинаково ориентированными, если матрица пе- рехода Се^е- имеет положительный определитель, и противополож- но ориентированными - в противном случае. Замечание 1. Из определения и из свойств определителя следу- ет, что два базиса, получающиеся друг из друга - перестановкой двух их векторов или - умножением какого-либо вектора на отрицательное число, противоположно ориентированы. Теорема 23.1. Отношение одинаковой ориентированности является отношением эквивалентности на множестве всех бази- сов пространства V. Доказательство. Действительно, рефлексивность отноше- ния следует из того, что переход от базиса к самому себе осуще- ствляется с помощью единичной матрицы, симметричность - из те- оремы 17.5 и очевидного факта: \С~11 • |С| > 0, транзитивность - из того, что если е! = еС, е" = e'D, то е" — е(СО), при этом |СО| = = |С| -1£>| > 0. Так как определитель матрицы перехода от одного базиса к друго- му либо положителен, либо отрицателен, то множество всех базисов пространства разбивается отношением одинаковой ориентированно- сти ровно на два непересекающихся класса (класса эквивалентности) так, что всякий базис принадлежит одному и только одному клас- су, два базиса одного класса одинаково ориентированы, а любые два базиса из разных классов противоположно ориентированы. Один из указанных классов называют классом правых (или по- ложительно ориентированных) базисов, а другой - левых (отрица- тельно ориентированных). Каждый из этих двух классов называ- ется ориентацией пространства. Вещественное линейное простран- ство с выбранной на нем ориентацией называется ориентированным пространством. Так как класс эквивалентности порождается любым своим представителем, то для того, чтобы ориентировать линейное пространство, достаточно задать один какой-нибудь базис простран- ства и объявить положительно ориентированными все одноименные с ним базисы.
92 Глава V. Векторная алгебра Класс правых базисов на плоскости Va и в пространстве V3 обычно выбирают следующим образом: - упорядоченную пару неколлинеарных векторов ei, е2 плоскости называют правой (положительно ориентированной), если кратчайший поворот (рис. 1) от ei к еа выполняется против часовой стрелки, и левой (отрицательно ориентиро- ванной) - в противном случае (начала векторов считаются совмещенными); - упорядоченную тройку некомпланарных векторов ei, е2, ез пространства называют правой (положительно ориентированной), если из конца вектора ез (рис. 2) кратчайший поворот от е; к ej виден совершающимся против часовой стрелки, и левой (отрицательно ориентированной) - в противном случае (начала векторов тройки считаются совмещенными). е2 ег Рис. 2 О Практически задание ориентации в геометрических пространствах означает задание направления движения на прямой (слева направо или наоборот), напра- вления вращения на плоскости (против часовой стрелки или наоборот) или винта в пространстве (правого или левого). Определения и основные свойства. Пусть в пространстве V3 выбрана ориентация. Базисы, задающие эту ориентацию, назовем пра- выми (положительными). Векторным произведением ненулевых векторов а и b называется вектор с такой, что: 1) |с| = |а| • | Ь| sin(а, Ь), 2) с ортогонален каждому из векторов а и b и если с / 0, то 3) с направлен так, что упорядоченная тройка а, Ь, с - правая. Если один из векторов а или b нулевой, то векторное произведение считается равным 0. Обозначение: [а, Ь]. Теорема 23.2 (критерий коллинеарности). Векторы а и Ь коллинеарны тогда и только тогда, когда [а, Ь] = 0 . Доказательство. Действительно, векторы а и Ь коллинеар- ны тогда и только тогда, когда либо а = 0, либо b = 0, либо sin( а, Ь) = 0; это равносильно тому, что |[а, Ь]| =0, т.е. [а, Ь] = О.
§ 23. Векторное и смешанное произведения 93 Замечание 2. Из теоремы 23.2 следует, что определение век- торного произведения [ а, Ь] для коллинеарных векторов а и b закан- чивается требованием 1. Если же а и b не коллинеарны, то условия 1 и 2 означают, что: а) |[ а, Ь]| = Sab> где Sab _ площадь параллелограмма, построен- ного на векторах а и Ь; б) вектор [ а, Ь] перпендикулярен плоскости тг( а, Ь), определяемой векторами а и Ь. Теорема 23.3. Векторное произведение антикоммута- тивно, т.е. [a, b] = — [b, a], Va, b. Доказательство. Утверждение теоремы очевидно, если а и b коллинеарны. Пусть а и Ь не коллинеарны, тогда [а, Ь] / О, [Ь, а] 0, при этом |[а, Ъ]| = |[Ь, а]| = 5аь и [а, Ь], [b, aj перпенди- кулярны плоскости тг(а, Ь). Значит, либо [а, Ь] = [Ь, а], либо [а, Ь] = = —[Ь, а]. Но вектор [Ь, а] [а, Ь], так как тройка векторов Ь, а, [Ь, а] - правая (по определению векторного произведения) и, следо- вательно, тройка а, Ь, [Ь, а] - левая (см. замечание 1). Смешанным произведением векторов а, Ь и с называется число, равное скалярному произведению векторного произведения а и b на вектор с. Обозначение: (а, Ь, с). Итак, (а, Ь, с) = ([а, Ъ], с). Теорема 23.4 (критерий компланарности). Векторы а, Ь, с компланарны тогда и только тогда, когда (а, Ь, с) =0. Доказательство. Необходимость. Пусть а, Ь, с компла- нарны. Будем считать, что а и b не коллинеарны и с О (в каждом из этих случаев, очевидно, (а, Ь, с) = 0). Тогда а, Ь, с параллельны плоскости тг(а, Ь), причем [а, Ь)±тг(а, Ь). Следовательно, ([а, Ь], с) = 0. Достаточность. Пусть (а, Ь, с) — 0. Тогда либо |[а, Ь]| = 0, либо | с| =0, либо cosy? = 0, где у? - угол между векторами [а, Ь] и с. Это означает, что либо а и b коллинеарны, либо с — О, ли- бо с параллелен плоскости ?г(а, Ь). Во всех этих случаях а, Ь и с компланарны. Теорема 23.5. Смешанное произведение некомпланарных векторов а, b и с равно по абсолютной величине объему V паралле- лепипеда, построенного на приведенных к общему началу векторах а, Ь, с. При этом V, если а, Ь, с - правая тройка; —V, если а, Ь, с - левая тройка. Доказательство. Из некомпланарности векторов а, Ь и с следует, что а и Ь не коллинеарны и с^ О. Отложив векторы а, Ь, с от одной точки О (рис. 3), получим параллелепипед, ребрами которого являются эти векторы. Обозна- чим через Л высоту параллелепипеда, опущенную из конца вектора с. Тогда V = Sabh. Отсюда и из замечания 2 следует, что V - |[а, Ь]| • |с| |cosy>| = |(а, Ь, с)|. (23.1) (а, Ь, с) =
94 Глава V. Векторная алгебра Рис. 3 Знак (а, Ь, с) определяется только знаком cosy?, но cosy? > О тогда и только тогда, когда век- торы [ а, Ь] и с направлены в одну сторону от плоскости тг(а, Ь), т.е. тогда и только тогда, когда трой- ка а, Ь, с - правая. В силу (23.1) отсюда следует утверждение тео- ремы. Теорема 23.6. Для любых векторов а, Ь, с выполняется равенство ([а, Ь], с) = (а, [Ь, с]). (23.2) Доказательство. Утверждение очевидно для компланарных векторов а, Ь, с (в силу теоремы 23.4). Пусть а, Ь, с - не компла- нарны. Тогда тройки а, Ь, с и Ь, с, а одинаково ориентированы (см. замечание 1). Так как (а, [Ь, с]) — (Ь, с, а), то из теоремы 23.5 следует (23.2). Следствие 1. Для любых векторов а, Ь, с имеют место ра- венства (а, Ь, с) = (Ь, с, а) = (с, а, Ь) = = -(Ь, а, с) = -(а, с, Ь) = —(с, Ь, а). (23.3) Следствие 2. Смешанное произведение линейно по каждому из сомножителей. Это утверждение вытекает из (23.3) и линейно- сти скалярного произведения. Теорема 23.7. Векторное произведение линейно по каждо- му из сомножителей. Доказательство. В силу теоремы 23.3 достаточно показать, что для любых векторов а, Ь, с и любого числа а € R имеют место равенства [a+b, с] = [а, с]+[Ь, с] и [аа, Ь] = о[а, Ь]. Пусть d = [а+ + Ь, с]-[а, с]—[Ь, с]. Тогда (d, d) = (a+b, с, d)-(a, с, d)-(b, с, d). Из линейности смешанного произведения следует, что (d, d) — — (а, с, d) + (b, с, d) — (а, с, d) — (b, с, d) = 0. Это доказывает первое из требуемых равенств. Второе равенство доказывается ана- логично. Векторное и смешанное произведения в прямоугольных координатах. Пусть ei, е3, е3 - ортонормированный базис прост- ранства и пусть ei, е3, е3 - правая тройка. 1. Найдем координаты векторного произведения [а, Ь], если век- торы а = {aj, 02,^3} и b = {61,62,63} заданы своими координатами в базисе ej, е3, е3. Согласно теоремам 23.2 и 23.7 имеем [а, Ь] = [гц е3+ + аг ез + аз е3,6j ei + 62 ез + 63 е3] = 0162[ei, еа] + ai63[ ei, е3] + +а2б1[е2, ei]+a263[e2, ез]+а361[е3, ei)+a362[e3, еа]. Отсюдавсилу
§ 24. Преобразование координат 95 теоремы 23.3 следует, что la, b] = а-2 а3 5г Ь3 [е3, е3] - ai аз Ь1' Ьз [ез, ег] + ai 0.3 5i Ь2 [ei, е3]. Пусть [a, b] = xei + уез + ze3. Тогда, используя равенство (22.4), теоремы 23.3-23.5 и замечание 1 (§23), получаем, что х = ([a, b], ei) = 02 62 аз Ьз (е2, е3, е3) = аг 5г аз Ьз (ei, е2, е3) = а2 62 аз Ьз Аналогично находим у — — Oj а3 51 Ьз z = ?2 . Итак, Oi Ь2 [а, Ь] = а2 а3 Ьз 53 в! - ai а3 51 53 Z Ь2 ез. (23.4) или, в условной записи в виде мнемонического определителя, [а, Ь] = ei е2 е3 ai а2 а3 bi Ьз Ьз (23.5) (имеется в виду разложение этого определителя по первой строке). 2. Из равенств (23.4) и (22.5) непосредственно находится и сме- шанное произведение векторов а — {ai,a2,a3}, b = {51, Ьз,53}, с = = {ci,c2,c3}, заданных своими координатами в ортонормированном базисе: Замечание 3. Если исходный базис ei, ез, е3 отрицательно ориентирован, то (ei, е2, е3) = —1 (теорема 23.5) и, следовательно, в соотношенииях (23.4) - (23.6) следует изменить знаки на противоположные: '«•bi'-ds Й|«-|Й Й 1«+1 й £!«)• | а, Ь] = - ei е2 ез Я1 0.2 0,3 bi Ьз Ьз (а, Ь, с) = — ai оз аз 51 Ьз Ьз С1 С2 с3 § 24. Преобразование координат Преобразование аффинной системы координат. Пусть в пространстве даны две аффинные (общие декартовы) систе- мы координат: {О; ег, ез, е3} и {О'; е/, е2', е3'}- Первую из них бу- дем называть “старой” системой координат, а вторую - “новой”. Пусть 4 Линейная алгебра ы аналитическая геометрия
96 Глава V. Векторная алгебра известно положение новой системы координат относительно старой: О'(а,0,7) и С — (су) - матрица перехода от базиса е к базису е', т.е. е/ = С11 е1 + С21 е2 + С31 ез, — с12 е1 + С22 ба + С32 ез, (24.1) ез' — с13 ех + саз в2 4-С33 ез. Пусть М - произвольная точ- ка пространства. Исследуем, как изменяются ее координаты при переходе к новой системе коорди- нат. Обозначим через (х,у, z) и (z',y',z') координаты точки М в старой и новой системах ко- ординат, через г и г' - радиус-векторы точки М относительно по- люсов О а О' соответственно, а через fq - радиус-вектор точки О' относительно полюса О. Тогда по определению координат точки Ге a 0 . У . Равенство ОМ — 00' 4- О'М означает (рис. 1), что г = г0 4- г'. Перейдя в этом векторном равенстве к равенству координат в базисе е, получаем с учетом (17.8), что a 0 . 7 . х У z или х = a + сцх' 4- С12у' 4- с13г', У = 0 4- c2ii' 4- с22у' 4- с23г', z = 7 4- С31Х1 4- С32У1 4- c33z'. (24.2) Соотношения (24.2) называются формулами преобразования ко- ординат. Эти формулы выражают старые координаты точки через новые. Ортогональная матрица. Вещественная матрица С называется ортогональной, если ССТ = СТС = I. (24.3) Из определения следует, что: 1) С - квадратная матрица; 2) С"1 = С , 3) С-1 - ортогональная матрица; 4) |С| = ±1; 5) матрица С — (Cjj) & Rnxn ортогональна тогда и только тогда, когда ^CtfcCjfc=| 0’ и ^2ckickj = | о’ (24.4) fc=i 1 k=i k 6) произведение ортогональных матриц - ортогональная матрица.
§ 24. Преобразование координат 97 Теорема 24.1. Матрица С = (cjj) перехода от ортонорми- рованного базиса е к е' ортогональна тогда и только тогда, когда е' - ортонормированный базис. Доказательство. Пусть ej, е2, ез и е/, ез', ез' - бази- сы пространства. Из равенств (24.1) следует, что столбцы матрицы перехода С являются координатами векторов е/, ез', е3' в базисе е = (ei,e2, ез). Согласно теореме 22.3 отсюда получаем, что (е', е') = CkiCkj. Следовательно, условие ортонормированности базиса е' равносильно условию (24.4) ортогональности матрицы С. Аналогично рассматривается случай плоскости или прямой. Преобразование прямоугольной декартовой системы коор- динат на плоскости. Пусть {О; ei, ез} и {О'; е/, е2'} - прямо- угольные декартовы системы координат на плоскости, т.е. е = = (е1, ег) и е' = (е/, е2') - ортонормированные базисы и матри- ца перехода С — (с^2) € R2*2 ортогональна. Согласно (24.4) имеем = С11С12 + С21С22 =0, С?2+С^2 = 1. Из первого равенства следует существование такого у, что Си = = cos 92, C21 = sin р. Из второго равенства следует, что ci2 = Л: sin у, С22 = —k cos p. Отсюда и из третьего равенства получим, что к = ±1. Итак, ортогональная матрица второго порядка определяется лишь единственным параметром у, при этом либо cos у — sin у sin у cos у 1. Пусть С — cosy sin у либо С = — sin у cosy cos у sin у sin р — cos р , тогда |С| = 1 и (24.5) е/ = cosy • ei -I- siny e2, e2' — —siny • ei -f-cosy • e2. Умножив скалярно обе части этих равенств на eiи е2, получим (рис. 2,а), что (ei', ej = у, (ег', е2) = | - у, (е2', = | + у, (е2', е2) = у (все углы отсчитываются в направлении кратчайшего поворота от ei к е2). Рис. 2
98 Глава V. Векторная алгебра Это означает, что базисы е и е' одинаково ориентированы и что система координат {О'; ei', ез'} может быть совмещена с {О; ei, ез} путем переноса начала и поворота на угол вокруг начала. При этом формулы преобразования координат имеют вид J г = a + х' cos 9? — у' sin 99, , . {у = /3 + х' sin 4- у' cos <р. \ ) л гг cos 93 sin 9? lz>1 , 2. Пусть С — , тогда С = —1 и J sin 9? — cos у? 1 1 et' = cosy? - ег + sin 93 • ез, ез' — sin 9? ei — cos 92 ез- Поступая аналогично п. 1, получим (рис. 2,6), что (еГ, ei) = <p, (еГ, е2) = (е2', ej) = f - 93, (е2', е2) = тг - 93. В этом случае базисы е и е' противоположно ориентированы и си- стема координат {О'; ех', е2'} не может быть совмещена с {О; ej, е2} путем переноса начала и поворота; после поворота на угол <р нужно выполнить отражение относительно оси ех' (т.е. изменить направле- ние е2'). При этом формулы преобразования координат имеют вид ( х = a + х' cos 95 + у7 sin 9?, |у — (3 + х' sin 9? — у' cos 9?. Заметим, что в обоих случаях положение второго базиса е' = — (е1, е2) относительно первого е = (ei, е2) однозначно определя- ется лишь одним параметром - углом <р. Преобразование прямоугольной декартовой системы ко- ординат в пространстве. Пусть {О; ei, е2, ез} и {О'; e'j, е'2, е^} - прямоугольные декартовы системы координат в пространстве, т. е. е = (е1; е2, ез) и е' = (e'j, е'2, е'3) - ортонормированные базисы и матрица перехода С — (<\,) G R3*3 ортогональна. Аналогично тому, как это было на плоскости, положение второго базиса е' относительно первого е может быть однозначно определено лишь тремя параметра- ми - так называемыми углами Эйлера. Введем эти углы. Будем считать, что обе системы координат одно- именны и имеют общее начало О. Пусть для определенности базисы е и е' образуют правые тройки. Обозначим через Ои ось, совпадающую с линией пересечения ко- ординатной плоскости Оху первой системы координат с координатной плоскостью Ох'у' второй системы и направленную в ту сторону, от- куда кратчайший поворот от оси Oz к оси Oz' виден совершающимся против часовой стрелки (рис. 1). Очевидно, ось Ои перпендикулярна плоскости Ozz'. Пусть теперь ф - угол между осями Ох и Ои, от- считываемый в плоскости Оху от оси Ох в направлении кратчайшего поворота от оси Ох к оси Оу, 6 — угол между осями Oz и Oz', не превосходящий л (так как системы координат одноименны); 9? - угол между осями Ои и Ох', отсчитываемый в плоскости Ох'у' от оси Ои в направлении кратчайшего поворота от оси Ох' к оси Оу'.
§ 24. Преобразование координат 99 Три угла ф, 0 < V» < 2тг, от Ох до Ou в плоскости Оху, в, 0 < в < 7Г, от Oz до Oz' в плоскости Ozz'-, <р, 0 < < 2тг, от Ou до Ох' в плоскости Ох'у' называются углами Эйлера системы координат Ох'у'г1 относительно Oxyz. Если заданы три угла Эйлера, то преобразование первой системы координат Oxyz во вторую Ox'y'z' можно представить в виде после- довательного проведения трех плоских поворотов: 1) поворота плоскости Оху вокруг оси Oz на угол ip, при этом повороте ось Ох совместится с осью Ои, ось Oz останется на месте, а вся система координат Oxyz перейдет в систему координат Ох^у^г^ (рис. 2); 2) поворота плоскости Oy\Z\ вокруг оси Oxi на угол в, при этом повороте ось Ozy совпадет с осью Oz', плоскость Ох^у^ совместит- ся с плоскостью Ох'у', а вся система координат перейдет в систему координат 0x21/2-22 (рис. 3); 3) поворота ПЛОСКОСТИ Ol2j/2 вокруг ОСИ 0Z2 на угол уз, при этом повороте система координат ОтгУг^г совместится с системой коорди- нат Ox'i/z' (рис. 4). Рис. 3 Рис. 4
100 Глава V. Векторная алгебра Каждый из указанных трех поворотов производится в одной из ко- ординатных плоскостей соответствующей системы координат, поэто- му формулы преобразования координат в соответствии с (24.5) будут иметь следующий вид: 1) для первого поворота 'х' if 'cosip — sin ip O’ У У1 , где Ci - sin cos ip 0 ; (24.7) .Z. .21. 0 0 1 2) для второго поворота xf X2‘ '1 0 0 • У1 = c2 У2 , где C2 = 0 cos# - sin# ; (24.8) .21. .22. 0 sin# cos#. 3) для третьего поворота ’^2 'x1' cos<p -simp 0‘ У2 = c3 У' , где C3 = simp cos tp 0 ; (24.9) .22. 0 0 1 Из (24.7)-(24.9) следует, что х У z 'х'~ = С у> , z' где С = С1С2С3 (24.10) сц — cos cos <р — sin ip cos 0 sin p, C12 = — cos sin <p — sin ip cos 0 cos <p, еп = sin ip sin 0, C21 — sin ip cos p + cos ip cos 0 sin С22 — - sin tp sin tp + cos ip cos 0 cos <p, c23 = - cos ip sin 0. C31 = sin# sin <p, C32 = sin 0 cos <p, C33 = cos#. (24.11) Равенство (24.10) в силу ортогональности матриц Ci, С2, С3 дает обрат- ное выражение новых координат через старые х' у' z' = сТс^сТ х1 У z
§ 25. Полярные координаты 101 Соотношения (24.10) и (24.11) получены в предположении, что обе системы координат имеют общее начало. Если же эти системы коор- динат имеют начало в разных точках, но получаются одна из другой параллельным переносом, то равенства (24.10) и (24.11) не меняют своего вида, так как ни направления осей, ни величины углов Эйлера при этом не изменяются. Таким образом, формулы преобразования координат имеют вид (24.2), где величины Ci} определены соотноше- ниями (24.11) через углы Эйлера. Итак, преобразование прямоугольной декартовой системы коор- динат в одноименную систему координат состоит в последовательном проведении параллельного переноса и трех плоских вращений. Если же системы координат Oxyz и Ox'y'z' разноименны (угол 0 больше тг), то после параллельного переноса и поворотов на углы Эй- лера необходимо еще выполнить зеркальное отражение относительно плоскости О'х'у' получившейся системы координат. §25. Полярные координаты Декартовы системы координат - не единственный способ опреде- лять положение точки с помощью чисел и тем самым применять чи- словые расчеты для решения геометрических задач. Для этой цели ис- пользуются и другие типы координатных систем. Опишем некоторые из них. Полярные координаты на плоскости. Полярная система ко- ординат на плоскости состоит из точки О плоскости и исходящего из нее луча I. Точка О называется полюсом, луч I — полярной осью. Обозначение: {ОД} - Задание полярной системы координат позво- ляет однозначно определить положение любой точки плоскости с по- мощью двух чисел (рис. 1): 1) расстояния г от точки М до полюса О и, если М 7^ О, 2) угла уз между лучом [ОМ) и полярной осью I (угол отсчитыва- ется от оси I против часовой стрелки). Рис. 2 Число г называется полярным радиусом точки М, а угол р — по- лярным углом. Упорядоченная пара чисел (г, </?) называется полярны- ми координатами точки М. Обозначение: Л1(г, уз).
102 Глава V. Векторная алгебра Из определения следует, что: 1) г > 0 для любой точки М плоскости и г — 0 <=> М = О; 2) 0 < </? < 2тг для любой точки плоскости, кроме полюса, а для полюса угол не определен; 3) любая точка плоскости, отличная от полюса, имеет полярные координаты, при этом две точки плоскости совпадают тогда и только тогда, когда совпадают их полярные координаты. С каждой полярной системой координат связана некоторая пря- моугольная декартова система координат. В этой системе (рис. 2) на- чало совпадает с полюсом, положительная полуось абсцисс - с по- лярной осью, положительная полуось ординат получается вращени- ем полярной оси на угол тг/2 против часовой стрелки. Полученную таким образом систему координат Оху называют системой коорди- нат, определенной полярной системой координат {О; /}. Очевидно, что такое соответствие между полярными и прямоугольными систе- мами координат биективно. Как легко видеть из рис. 2, прямоугольные координаты (т, у) точ- ки Л/ и ее полярные координаты (г, <р) связаны соотношениями ^/т2 + у2, X X г у/х2,+ у2 ’ (25.1) у = у г у/х2 + у2 Полярные координаты в пространстве. Обобщением поляр- ной системы координат в пространстве являются цилиндрические и сферические системы координат. Пусть в пространстве заданы плоскость тг и перпендикулярная к ней ось Oz. Пусть О - точка пересечения оси Oz и плоскости тг. И та и другая система координат состоят из полярной системы ко- ординат {О;/} плоскости тг и оси Oz. Обозначение: {O;/;z}. Точ- ка О называется полюсом, ось I - полярной осью, ось Oz - зенитной осью. Цилиндрическими координатами точки М, не лежащей на зенит- ной оси, называется упорядоченная тройка чисел (г, <р, z), где (г, - полярные координаты ортогональной проекции Р точки М на плос- кость тг, z — координата на зенитной оси ортогональной проекции Q точки М на зенитную ось (рис. 3). Для точек зенитной оси г = 0 и угол не определен.
§ 25. Полярные координаты 103 Сферическими координатами точ- ки М, не лежащей на зенитной оси, называется (рис. 3) упорядоченная тройка чисел (р,<р,в), где р - рас- стояние от точки М до полюса О, 6 - угол между радиус-вектором ОМ и положительной полуосью Oz (от- считываемый от ОЙ против часо- вой стрелки, если смотреть из поляр- ной оси), ср - полярный угол точки Р. При этом <р называется долготой точки М, в - широтой, р - радиу- сом. Долгота не определена для всех точек зенитной оси, широта не опре- делена для полюса. Рис. 3
Глава VI. Системы линейных алгебраических уравнений § 26. Постановка задачи Терминология. Системой т линейных алгебраических уравне- ний с п неизвестными называется совокупность соотношений ацХ1 + 012X2 + • • + ain^n = 021X1 + 022 X2 + . . . + О2ПХП = 62, < (26.1) . &mlXl "1“ Опг2^2 • ~Ь О’тп^'П — где Ojj, bi (i = 1,т, j = l,n) - заданные вещественные числа, a Xi, ... , хп - неизвестные величины. Числа а^ называются коэффициентами системы, a bi - свободными членами. Упорядоченная совокупность чисел ci,..., Cn € R называется ре- шением системы, если при подстановке этих чисел в систему вместо неизвестных Xi,... ,хп соответственно каждое уравнение обращается в тождество. Система уравнений называется совместной, если она имеет хо- тя бы одно решение, и несовместной, если не имеет ни одного ре- шения. Система уравнений называется определенной, если она имеет единственное решение, и неопределенной, если имеет более одного ре- шения. Исследовать и решить систему - это значит: • установить, совместна ли она или несовместна; • если она совместна, установить, является ли она определенной или неопределенной, при этом: - в случае определенной системы найти единственное ее решение; - в случае неопределенной системы описать множество всех ее решений. Компактная запись системы. Коэффициенты системы образу- ют матрицу А = (aij) G Rmxn, называемую основной матрицей си- стемы, свободные члены образуют столбец b = (Ь\,... ,bm)T € Rm, называемый столбцом свободных членов, а неизвестные — столбец х = (xi,..., хп)Т, называемый столбцом неизвестных. В этих обо- значениях система (26.1) может быть записана в виде Ах = b (26.2)
§ 27. Системы с квадратной невырожденной матрицей 105 или Х1<11 н--|-:гпап = Ь, (26.3) где сц (г = 1,п) - столбцы матрицы А. В записи (26.3) система уравнений приобретает новый смысл: со- вместность системы равносильна тому, что столбец свободных членов является линейной комбинацией столбцов матрицы Л, причем коэф- фициентами линейной комбинации служат компоненты Xi,... ,хп ре- шения. Эквивалентность систем. Две системы линейных алгебраиче- ских уравнений с одинаковым числом неизвестных называются экви- валентными, если множества всех решений этих систем совпадают. Теорема 26.1. Умножение обеих частей системы Ах = Ь слева на невырожденную матрицу приводит ее к эквивалентной си- стеме. Доказательство. Пусть Q € Rmxm и |Q| 0. Рассматривае- мые системы имеют вид Ах = Ь и QAx = Qb. Если с е R" - решение первой системы, то Ас = b и, следовательно, QAc = Qb, откуда сле- дует, что с - решение второй системы. С другой стороны, если с - решение второй системы, то QAc = Qb. Умножив обе части этого то- ждества слева на Q~1, получаем тождество Ас = Ъ, откуда следует, что с - решение первой системы. § 27. Системы с квадратной невырожденной матрицей. Правило Крамера Прежде чем рассматривать системы общего вида, исследуем про- стейший класс систем (26.2), когда число уравнений совпадает с чи- слом неизвестных и |Л| 0. Теорема 27.1. Система линейных алгебраических уравне- ний с квадратной невырожденной матрицей совместна и имеет единственное решение. Доказательство.В силу невырожденности матрицы А для нее существует обратная матрица Л*1. Непосредственной проверкой лег- ко установить, что вектор х = А~1Ь (27.1) является решением системы (26.2). Это решение единственно, так как если у - другое решение системы (26.2), то Ах = Ау. Умножив обе части этого тождества слева на А-1, получим, что х = у. Решение (27.1) может быть записано покомпонентно, если восполь- зоваться явным выражением (5.3) для обратной матрицы. Действи- тельно, х = j-^-Аб или, в соответствии с (5.1), Ан&1 + АцЪ2 + - • • + Anlbn -— -----------------------. г = 1. п. х, =
106 Глава VI. Системы уравнений Эти соотношения в свете свойств определителя означают, что = |Л|/|Л|, г=Т“п, (27.2) где А, получается из матрицы А заменой ее г-го столбца столбцом свободных членов. Формулы (27.2) называются правилом Крамера. Замечание. Правило Крамера дает решение системы в явном виде и в не- котором смысле носит алгоритмический характер. Однако это правило полезно лишь в теоретических исследованиях и противопоказано для практического ис- пользования в приложениях. В самом деле, для решения систем n-го порядка по правилу Крамера требуется вычислить (п +1) определителей n-го порядка, тогда как большинство современных методов решения систем по объему вычислений равносильны вычислению одного определителя. В § 29 мы приведем описание од- ного из таких методов - метода Гаусса. Продолжим теоретическое исследование систем, так как вопрос о решении систем с прямоугольной матрицей или квадратной, но выро- жденной матрицей остается открытым. § 28. Системы общего вида Совместность системы. Пусть теперь Ах = b (28.1) - система общего вида и А — (aij) 6 Rmx". Исследование системы следует начать с вопроса о ее совместности. Для этой цели составим матрицу В, приписав к матрице А столбец свободных членов; В = [А|Ь]. Матрица В называется расширенной матрицей системы (28.1). Теорема 28.1 (теорема Кронекера—Капелли). Система линейных алгебраических уравнений совместна тогда и только то- гда, когда ранг основной матрицы равен рангу расширенной матри- цы. Доказательство. Необходимость. Пусть система (28.1) со- вместна. Тогда из (26.3) следует, что существуют числа Xi,..., хп е R такие, что b = ziai +.. .+xn<in- Следовательно, столбец Ъ является ли- нейной комбинацией столбцов а1(..., ап матрицы А. Из теоремы 16.8 следует, что rg А = rg В. Достаточность. Пусть rgA — rgB = г. Возьмем в матрице А какой-нибудь базисный минор. Так как rgB —т, то он же будет базис- ным минором и матрицы В. Тогда согласно теореме 16.1 о базисном миноре последний столбец матрицы В будет линейной комбинацией базисных столбцов, т.е. столбцов матрицы А. Следовательно, столбец свободных членов системы является линейной комбинацией столбцов матрицы А. Это означает совместность системы. Схема исследования совместной системы. Теорема Кронеке- ра-Капелли устанавливает совместность системы. Перейдем к иссле- дованию совместной системы. Итак, пусть система уравнений
§ 28. Системы общего вида 107 {“и1! + • • - + 4- ai.r+i^r+i 4- • • 4- ainin = bi, Лу-iXi 4-... 4~'ttrr®r 4~ ^r^+i^r+i 4~ • • • 4" ^•rn^'n = by., (♦) 4“ • • • 4" flmr^r 4" 4" • - • 4" Oynn^n = совместна и rgA = rgB — г. He нарушая общности рассуждений, будем считать, что базисный минор матрицы А находится в левом верхнем углу, так что Оц <хг1 O-lr Gyr 7^0. (28.2) Рассмотрим укороченную систему из первых г уравнений системы (*), т.е. из уравнений, коэффициенты которых входят в базисный ми- нор: ацТ1 4- ••• 4- flir^r 4" ai.r+i^r+i 4- --- 4- ainxn = bi, * ........................................ (♦*) . QrjXi 4" 4“ Hy.y.Xy 4“ ^г.г-f-13'Т'Ч-1 + • • ' 4- ’ bf Теорема 28.2. Укороченная система эквивалентна исход- ной системе: (*) ~ (**). Доказательство. Обе системы содержат одинаковое число не- известных. Очевидно, что любое решение системы (*) является реше- нием системы (**). Покажем, что верно и обратное. Действительно, в расширенной матрице В системы (♦) первые г строк являются ба- зисными. Следовательно, все остальные строки согласно теореме о базисном миноре будут линейными комбинациями этих строк. Это означает, что каждое уравнение системы (♦) , начиная с (г 4- 1)-го, бу- дет линейной комбинацией (т.е. следствием) первых г уравнений этой системы. Отсюда вытекает, что каждое решение первых г уравнений системы (*) обращает в тождества все последующие уравнения этой системы. Итак, задача исследования системы (*) упрощена, теперь доста- точно изучить укороченную систему (**). Перейдем к этой задаче. Если г = п, то система (**) имеет единственное решение как си- стема с квадратной невырожденной матрицей (§27). Пусть г < п. Неизвестные ij,... ,хг, коэффициенты при которых входят в базисный минор, назовем главными, а остальные неизвест- ные Тг+ь • • • , хп - свободными. Запишем систему (**) в виде {йцТ1 4- 4- а\гхг = bi — aiir+ixr+i — ... — ainTn, (28.3) flriTi 4" • - 4” aryXj. — b,. r-|.iту*i ... а^^,х^. Придав свободным неизвестным zr+i,... произвольные зна- чения cr+i,...,Cn, получим систему уравнений относительно неиз- вестных Xi,..., хг:
108 Глава VI. Системы уравнений ацХ1 4- ... + flirXr — bi — fli.r+iCr+i — ... — aincn, < ........................................ (***) , “Ь • - * “Ь Grrlr — Or,r-f-1 Gf, г4-1 ‘ с квадратной невырожденной (согласно (28.2)) матрицей. Эта система имеет (§27) единственное решение ci,... ,Сг. Очевидно, что совокуп- ность (сь... ,Cr,cr+i,... ,Сп) является решением системы (**). Теорема 28,3. Придавая свободным неизвестным произ- вольные значения и вычисляя значения главных неизвестных из си- стемы (***) , можно получить все решения системы (**) . Доказательство. Пусть (cj,..., сТ, Ст-ц,..., Сп) - произволь- ное решение системы (**) . Покажем, что оно может быть получе- но указанным путем. Возьмем числа Cr+i,..., Сп в качестве значений для свободных неизвестных тг+ь • • ,хп и будем вычислять значения главных неизвестных, решая систему (***) . Так как (сь..., сг, cr+i, ....Сп) - решение системы (**) , то (ci,...,Cr) - решение системы (***). Но система (***) имеет единственное решение, следовательно, в качестве значений главных неизвестных мы можем получить только числа (ci,..., Ср). Итак, мы нашли правило, которое позволяет получить любое ре- шение системы (**) , а следовательно, и произвольной системы ли- нейных алгебраических уравнений. Теорема 28.4. Система алгебраических уравнений с п не- известными имеет единственное решение тогда и только тогда, когда rgA — rgB = п. Доказательство теоремы фактически содержится в описан- ном выше правиле для получения решения системы. Действительно, если rg А = rg В = п, то, как указано выше, система имеет единствен- ное решение. Если же rgA ' rgB < п, то среди неизвестных будет хотя бы одно свободное неизвестное. Придавая ему произвольные зна- чения, получим бесконечно много решений системы. Общее решение системы. Как указывалось в §26, решить си- стему - значит описать множество всех ее решений. В случае опреде- ленной системы для этого достаточно найти то единственное решение, которым она обладает. В случае же неопределенной системы необхо- димо найти способ, позволяющий описать бесконечное множество ее решений. Один из таких способов состоит в следующем. Решим систему (28.3) относительно главных неизвестных: Xi = /i(xr+1,...,xn), ................................. (28.4) 1Г = fr^v+ll • • • , ХП), где /i,.. .,fr - некоторые однозначно (в силу теоремы 27.1) опреде- ляемые из (28.3) функции. Соотношения (28.4) при произвольных т,+1,.. ., хп описывают множество всех решений системы и называются общим решением си-
§ 29. Метод Гаусса 109 стемы. В отличие от общего, конкретное решение х = (щ, ... , Сп)7, где Ci, i = 1, п, - известные числа, называется частным решением. Однородные системы. Система линейных алгебраических ура- внений с нулевой правой частью называется однородной. Все результаты общей теории справедливы и для этого частного случая, однако здесь имеет место некоторая специфика, на которой мы остановимся подробнее. Из теоремы Кронекера-Капелли следует, что однородная система Ах = 0 (28.5) всегда совместна, так как ранг расширенной матрицы [А|0], очевид- но, равен рангу матрицы А. Впрочем, это видно и непосредственно: однородная система заведомо имеет решение (0,..., 0)т, называемое тривиальным. Согласно общей теории для однородных систем имеют место следующие теоремы. Теорема 28.5. Однородная система (28.5) с п неизвест- ными имеет нетривиальное решение тогда и только тогда, когда rgA < п. Утверждение теоремы следует из теоремы 28.4, так как наличие нетривиального решения для однородной системы равносильно ее не- определенности. Теорема 28.6. Однородная система (28.5) с квадратной матрицей имеет нетривиальное решение тогда и только тогда, когда |А| = 0. §29. Метод Гаусса исследования и решения систем В соответствии с общими принципами метода Гаусса решения матричных задач (§4) укажем тип простейших систем линейных урав- нений, тип эквивалентных преобразований системы, а также покажем, что произвольная система линейных алгебраических уравнений ука- занными преобразованиями приводится к указанному типу. Системы с трапециевидной матрицей. Пусть Ах = Ь (29.1) - систем а с верхней трапециевидной матрицей А. Расширенная мат- рица этой системы имеет вид «и «12 ... air «1,г+1 «1п bi "ДГ- «22 ... a2r «2,г+1 • • • «2п Ьг 0 0 • • | ^rr «г,г+1 - - - «гп ь? , (29.2) 0 0 ... 0 0 0 Ьг+1 0 0 ... 0 0 0 Ьт где оц / 0, г = 1,г.
по Глава VI. Системы уравнений Мы не случайно выбрали системы с верхней трапециевидной мат- рицей. Для таких систем чрезвычайно просто устанавливается со- вместность и достаточно просто находится решение. Теорема 29.1. Система (29.1) с верхней трапециевидной матрицей совместна тогда и только тогда, когда bk = О при к > г. Доказательство. Действительно, ранг трапециевидной мат- рицы А равен числу ненулевых строк, так как минор г-го порядка, расположенный в левом верхнем углу, отличен от нуля, а все миноры более высокого порядка содержат нулевые строки и поэтому равны нулю. Ранг расширенной матрицы (29.2) равен г тогда и только тогда, когда Ьк — 0, к = г + 1,п, так как наличие хотя бы одного ненулево- го элемента bi, где г < i < т, означает наличие ненулевого минора (г + 1)-го порядка: Яц Л12 ... Н1г 61 О 022 - • • а2г 62 О 0 ... агг ЬТ О 0 ... О bi Отсюда на основании теоремы Кронекера-Капелли следует утвержде- ние теоремы. Итак, совместность системы с верхней трапециевидной матрицей устанавливается чисто “визуально”. Пусть теперь система (29.1) совместна. Реализация всех пунктов общей теории исследования и решения совместной системы (§28) для системы (29.1) также проста. 1°. В качестве базисного минора матрицы А всегда можно взять минор, расположенный в левом верхнем углу. 2°. Укороченная система состоит из первых г уравнений. 3°. Если г = п, то система (29.1) станет системой с треугольной матрицей ацХх + аитг + •. + airxr = bi, < 022X2 + - - • + O2r%r = 62, a^fX^. — b,., которая имеет единственное решение (§27); найти его не представляет труда: решая последовательно уравнения системы снизу вверх, мы каждый раз будем иметь дело с уравнением, содержащим только одно неизвестное. 4°. Если г < п, то неизвестные ir+i, • • • ,хп будут свободными и система относительно главных неизвестных примет вид ацТ1 + ... + airxr —bi — а1.г+1Хг+1 - ... - ainxn, < ................................... (29.3) . ОТГХГ = ЬГ Ог,г+1-^г+1 ••• ОгпХп.
§ 29. Метод Гаусса 111 Общее и частное решения исходной системы находятся из системы (29.3) с треугольной матрицей. Элементарные преобразования системы уравнений. Эле- ментарными преобразованиями системы, уравнений называются пре- образования следующих типов: 1) перестановка местами двух уравнений системы; 2) умножение какого-либо уравнения системы на число а / 0; 3) прибавление к одному уравнению системы другого ее уравне- ния, умноженного на любое число /3. Теорема 29.2. Элементарные преобразования системы ли- нейных алгебраических уравнений приводят ее к эквивалентной си- стеме. Доказательство. Элементарные преобразования системы уравнений означают элементарные преобразования строк расширен- ной матрицы В, которые, как известно (§3), равносильны умножению матрицы В слева на матрицы элементарных преобразований. Это, в свою очередь, согласно трактовке (2.3) операции умножения матриц равносильно умножению слева обеих частей системы уравнений на не- вырожденные матрицы элементарных преобразований, что приводит к эквивалентной системе (теорема 26.1). Замечание 1. Рассматриваемые в теореме преобразования относятся то- лько к строкам расширенной матрицы. Очевидно, что элементарные преобразо- вания столбцов расширенной матрицы, вообще говоря, лишены смысла. Однако можно рассматривать элементарные преобразования столбцов основной матрицы А, в частности перестановки ее столбцов, которые означают перенумерацию неиз- вестных системы. Приведение системы общего вида к системе с верхней тра- пециевидной матрицей. Как следует из теоремы 3.1 (и замечания 1 к ней), матрица А системы уравнений (28.1) общего вида элемен- тарными преобразованиями строк и перестановками столбцов приво- дится к верхней трапециевидной форме (1.3). Если используемые при этом элементарные преобразования строк матрицы А применить к строкам всей расширенной матрицы В, то на основании теоремы 29.2 (и замечания к ней) мы придем к такой системе с верхней трапецие- видной матрицей, решения которой отличаются от решений исходной системы только нумерацией неизвестных. Метод Гаусса исследова- ния и решения системы уравнений состоит в приведении ее к системе с верхней трапециевидной матрицей, а затем в исследовании и реше- нии полученной системы. При этом, если в процессе преобразования использовались перестановки столбцов основной матрицы Л, то в по- лученных решениях необходимо восстановить исходную нумерацию неизвестных. Процесс приведения системы к системе с трапециевидной матрицей называ- ется прямым ходом метода Гаусса, а процесс решения системы с треугольной матрицей - обратным ходом. По объему вычислений обратный ход оказывается несущественным в методе Гаусса, так как он требует выполнения О(п2) операций умножения, тогда как для прямого хода требуется выполнить + О(п2) умножений (§4). Таким образом,
112 Глава VI. Системы уравнений метод Гаусса решения системы линейных алгебраических уравнений по объему вычислений равносилен вычислению одного определителя (см. §27, замечание). Замечание 2. В основе метода Гаусса вычисления определителя, вычисле- ния ранга матрицы и решения системы линейных алгебраических уравнений ле- жит один и тот же алгоритм - основной процесс приведения матрицы к ступен- чатой форме. Однако, как отмечалось в §4, 16, 29, реализация этого алгоритма для каждой из этих задач имеет свою специфику. Наиболее "свободно" он реа- лизуется для задачи вычисления ранга матрицы, так как любые элементарные преобразования и строк, и столбцов матрицы не изменяют ее ранга. В задаче вычисления определителя по-прежнему допускаются преобразования как строк, так и столбцов, но уже необходимо следить за изменением определителя, если в преобразованиях участвовали перестановки строк (или столбцов) или умножение строки (столбца) на число а 0 Аккуратнее следует относиться к задаче решения систем уравнений, где допускаются преобразования только строк расширенной матрицы и перестановки столбцов только основной матрицы. § 30. Геометрические свойства решений системы Рассмотрим свойства решений системы линейных уравнений с точки зрения теории линейного пространства. Пусть дана система линейных алгебраических уравнений Ах = Ь (30.1) с матрицей А € RTOXn. Каждое решение этой системы можно рас- сматривать как вектор арифметического пространства Rn. Совокуп- ность всех решений системы (30.1) образует некоторое подмножество пространства Rn. Выясним, какими свойствами оно обладает. Линейное подпространство решений однородной системы. Теорема 30.1. Множество всех решений однородной си- стемы Ах = 0 с п неизвестными является линейным подпростран- ством арифметического пространства Rn. Доказательство. Обозначим L = {ж € Rn|Ai = 0}. Легко проверить, что если х 6 L, у € L, то х + у € L, и, кроме того, если а € R, то ах € L. В силу теоремы 18.1 отсюда следует, что L - линейное подпространство пространства Rn. Эта теорема позволяет "нарисовать" множество решений однородной систе- мы, так как геометрическим образом линейного подпространства являются (§18) прямая и плоскость, проходящие через начало координат. Произвольный базис подпространства решений однородной систе- мы линейных уравнений называется фундаментальной системой ре- шений. Понятно, что фундаментальная система решений существует лишь в том случае, когда однородная система имеет нетривиальное решение. При этом система уравнений может обладать многими фун- даментальными системами решений. Однако все эти системы состоят из одинакового числа векторов, равного максимальному числу линей- но независимых решений однородной системы. Определим это число. Теорема 30.2. Размерность пространства решений одно- родной системы Ах = 0 с п неизвестными равна п —г, где г — rg А.
§ 30. Геометрические свойства решений системы 113 Доказательство. Построим фундаментальную систему реше- ний. Для этого воспользуемся аппаратом свободных неизвестных. Пусть Xi, ..хг - главные неизвестные. Придадим свободным неиз- вестным тг+1, ..., хп следующие п — г наборов решений: (1,0,... ,0), (0,1,..., 0), ..., (0,0,..., 1). Для каждого из этих наборов найдем со- ответствующие значения главных неизвестных. Тем самым найдем п - г решений системы: ei = (еп, с12, ..., cir, 1,0, ...,0)т, 62 = (С21, с22, ..., с2г, 0,1,...,0)т, 6п — г ~ (сп — г,11 Сп—г,2, • - - , ^n~r,rt 0,0,...,!)^. (30.2) Решения ei,..., en_r обладают следующими свойствами. 1. Решения ei,... ,еп_г линейно независимы, так как матрица отличный от нуля), а ранг матрицы согласно теореме 16.3 равен мак- симальному числу линейно независимых строк. 2. Любое решение х = (xi,..., xr,xr+i, - • > хп)т является линей- ной комбинацией ет,..., еп_г, и, более того, х — xr+iei 4-... 4- хпеп . (30.3) Действительно, обозначим у = х — xr+iei — • • • — хпеп_г. Пусть у = (yi,..., уп)Т- Очевидно, что у - решение системы. Найдем его, пользуясь общей теорией решения систем: придадим свободным неиз- вестным значения yr+i,уп. Пользуясь соотношением (30.2), легко показать, что yr+i = • • = уп = 0- Следовательно, укороченная систе- ма будет однородной системой, имеющей единственное и, очевидно, тривиальное решение yi ... = уг = 0. Таким образом, у = 0. Отсюда вытекает (30.3). Из свойств 1 и 2 следует, что ei,... ,еп_г - фунда- ментальная система решений. Построенная фундаментальная система решений называется нор- мальной фундаментальной системой решений. Общий принцип по- строения фундаментальной системы решений следует из теоремы 30.2: так как размерность пространства решений однородной системы равна п — г, то для построения фундаментальной системы решений достаточно найти любые п - г линейно независимых решений (§ 17, утверждение 1). Для этого достаточно свободным неизвестным при- дать п — г линейно независимых наборов значений, т.е. наборов вида
114 Глава VI. Системы уравнений (С1,г+1,---,С1п), , (сп_г>г+1,...,сп_Г1П), для которых С1.Г+1 С-п—гтп /0. (30.4) Cfi—г,г4-1 Если для каждого из этих наборов найти соответствующие значе- ния главных неизвестных, то получим п — г решений системы: €1= (Си, ..., Cjr, С11Г+1, ..., С1п)Т, Сп —г ~ (^П —Г,1, --5 *41—Г, Г' On—г,г4-1’ •••> ^п-г.п) , линейно независимых вследствие (30.4). Общее решение однородной системы. Фундаментальная си- стема решений ei,... ,еп~г однородной системы линейных уравнений позволяет записать любое решение системы в общем виде: х = oiei 4-... + о:п_геп_г , ^Vcti, • -., On-r G R. (30.5) Представление (30.5) решения называется общим решением одно- родной системы уравнений через фундаментальную систему реше- ний (в отличие от общего решения (28.4) через свободные неизвест- ные). Линейное многообразие решений неоднородной системы. Пусть Ах = Ь (30.6) - неоднородная система линейных алгебраических уравнений. Одно- родная система Ах = 0, (30.7) полученная из системы (30.6) заменой свободных членов нулями, на- зывается приведенной однородной системой для системы (30.6). Между решениями обеих систем существует тесная связь. Легко проверить следующие факты. 1°. Сумма решений неоднородной и приведенной однородной си- стем является решением неоднородной системы. 2°. Разность двух решений неоднородной системы является ре- шением приведенной однородной системы. Теорема 30.3. Множество всех решений неоднородной си- стемы является линейным многообразием, полученным сдвигом под- пространства решений приведенной однородной системы на част- ное решение неоднородной системы. Доказательство. Пусть Н - множество всех решений неод- нородной системы (30.6), с - частное его решение и L - множество всех решений приведенной системы (30.7). Покажем, что Н = с+ L. Действительно, если z € Н, то z = с+ (z - с) = с+ х, где х = z - с. Так как х € L (как разность двух решений системы (30.6)), то z € с 4- L и, следовательно, Н С с + L. С другой стороны, если z € с + L, то
§ 30. Геометрические свойства решений системы 115 z = с 4- х, х € L. Значит, z € Н как сумма решений неоднородной и приведенной систем. Следовательно, c + LgHhH=c+L. Общее решение неоднородной системы. Итак, найдя одно (частное) решение неоднородной системы и прибавляя его к каждо- му решению приведенной системы, можно получить все решения не- однородной системы. В силу (30.5) это позволяет записать решение неоднородной системы в общем виде следующим образом: z = с + Ojei + ... + an_ren_r, Vai,..., ctn_r G R, (30.8) где с - частное решение системы (30.6), a ei,...,en_r - фундамен- тальная система решений системы (30.7). Представление (30.8) реше- ния называется общим решением неоднородной системы уравнений через фундаментальную систему решений. Итак, общее решение не- однородной системы есть сумма частного решения неоднородной си- стемы и общего решения приведенной однородной системы. Замечание. В соответствии с теоремой 30.3 геометрическим образом мно- жества всех решений неоднородной системы уравнений служат прямая и плос- кость, не проходящие через начало координат (§18).
Глава VII. Алгебраические линии и поверхности первого порядка §31. Понятие об уравнениях линии и поверхности Пусть Оху и Oxyz - аффинные системы координат на плоскости и в пространстве. Уравнение F(x,y)=0, (31.1) соответственно F(x,y,z) = 0, (31.2) называется уравнением, линии С на плоскости {поверхности к в прос- транстве) в заданной системе координат, если этому уравнению удо- влетворяют координаты всех точек линии £ (поверхности тг), и толь- ко они. Очевидно, что два уравнения в заданной системе координат определяют одну и ту же линию (поверхность) тогда и только тогда, когда они эквивалентны. Алгебраическим одночленом относительно переменных х, у (соот- ветственно х, у, z) с вещественным коэффициентом А называется вы- ражение AxV (Xxpy4zr), (31.3) где р, q, г - целые неотрицательные числа. Если А / 0, то число р + q (соответственно р + q + г) называется степенью одночлена. Алгебра- ическим многочленом относительно переменных х, у (т, у, z) с веще- ственными коэффициентами называется конечная сумма алгебраиче- ских одночленов (31.3). Наибольшая степень одночленов, входящих в многочлен, называется степенью многочлена. Линия на плоскости (поверхность в пространстве) называется ал- гебраической, если в некоторой аффинной системе координат она оп- ределяется уравнением (31.1) (соответственно (31.2)), где F(x, у) (со- ответственно F(x,y,z)) - алгебраический многочлен от переменных х, у (т, у, г) с вещественными коэффициентами. Степень многочлена F(x, у) (соответственно F(x,y,z)) называется порядком линии (по- верхности). Корректность этого определения вытекает из следующей теоремы. Теорема 31.1 (об инвариантности порядка). При пере- ходе от одной аффинной системы координат к другой алгебраическая линия (поверхность) остается алгебраической и порядок ее не изме- няется.
§32. Уравнения прямой на плоскости и плоскости в пространстве 117 Доказательство проведем для линии. Пусть на плоскости в аффинной системе координат Оху линия £ определяется уравнением (31.1), где F(x, у) - алгебраический многочлен степени п. При перехо- де к новой системе координат О'х'у' уравнение (31.1) преобразуется в уравнение F'(x',y') = 0. Покажем, что F'(x',y') - тоже алгебраи- ческий многочлен и его степень п' = п. Для этого в каждый одно- член Ахруч многочлена F(x, у) вместо х и у подставим их выражения через х', у' согласно формулам преобразования координат (§24). То- гда Axpyq = А(сца:' 4- сну' + a)p(c2ix' + с22у' + /3)’. Следовательно, одночлен Ахруч преобразуется в алгебраический многочлен от пере- менных х', у', степень которого не превосходит р + q. При этом мно- гочлен F(x,y) преобразуется в алгебраический многочлен F'(x',y'), степень которого п' < п. Если в этих рассуждениях поменять ролями системы координат, то получим, что п < п', т.е. п' — п. § 32. Уравнения прямой на плоскости и плоскости в пространстве Этот и несколько следующих параграфов посвящены прямой на плоскости и плоскости в пространстве. Мы будем изучать эти поня- тия одновременно, так как у них много общего. И это понятно, ведь и прямая на плоскости, и плоскость в пространстве представляют собой один и тот же объект в линейном пространстве, называемый гиперплоскостью (§18). В тех случаях, когда сходные теоремы име- ют, по существу, одинаковые доказательства, мы будем доказывать только одну из них. В этом параграфе рассматриваются различные типы уравнений прямой на плоскости (плоскости в пространстве), каждый тип уравне- ния определяется тем геометрическим заданием, которое однозначно определяет прямую (плоскость). Канонические уравнения. Ненулевой вектор, коллинеарный прямой, называется ее направляющим вектором. Из аксиом геомет- рии следует, что через любую точку проходит единственная прямая с заданным направляющим вектором. Пусть прямая I с направляю- щим вектором а проходит через точку Мо. Очевидно, точка М лежит на прямой I (рис. 1) тогда и только тогда, когда векторы мол! и а коллинеарны, т.е. ли- нейно зависимы (§15). С учетом условия а О это равносильно тому, что вектор М0М линейно
118 Глава VII. Алгебраические линии и поверхности первого порядка выражается через вектор а: Мол/ = t а, / € R. (32.1) Таким образом, условию (32.1) удовлетворяют все точки М пря- мой I, и только они. Теорема 32.1. На плоскости в аффинной системе коорди- нат Оху уравнение прямой I, проходящей через точку Мо(хо,уо}, с направляющим вектором а = {т, п} имеет вид х - То У - Уо т п = 0 или х-х0 _ у — Уо т п (32.2) (32.3) Доказательство. Пусть точка М имеет координаты (х,у), то- гда Мо1^ — {х — Хо,у — Уо}- Условие (32.1) в силу линейности ко- ординат означает, что в определителе (32.2) первая строка линейно выражается через вторую, а это равносильно равенству (32.2). Итак, уравнению (32.2) удовлетворяют координаты (х,у) всех точек пря- мой I, и только они. Равенство нулю определителя второго порядка равносильно пропорциональности его строк, т.е. условию (32.3). Замечание 1. Уравнение (32.3) означает лишь пропорци- ональность и в случае, когда тп — 0 или п — 0, оно равносильно уравнению х — xq — 0 или у — уо = 0 соответственно. Уравнения (32.2), (32.3) называются каноническими уравнения- ми прямой на плоскости. Следствие 1. Уравнение прямой, проходящей через две различ- ные точки Мо(хо,уо) и Mi(rri,j/i), имеет вид x-xq у-уо = 0 Xi - х0 yi - уо Это следует из того, что вектор MqMi является направляющим вектором прямой. Без принципиальных изменений может быть получено аналогич- ное уравнение плоскости в пространстве. Два неколлинеарных век- тора, параллельных плоскости, называются ее направляющими век- торами. Из аксиом геометрии следует, что через любую точку прохо- дит единственная плоскость с заданными направляющими векторами.
§32. Уравнения прямой на плоскости и плоскости в пространстве 119 Пусть плоскость тг с напра- вляющими векторами pi и рг проходит через точку Mq. Оче- видно, точка М лежит в плос- кости тг тогда и только тогда, когда (рис. 2) векторы Pi, рг компланарны, т.е. ли- р нейно зависимы (§15). ис‘ С учетом условия неколлинеарности векторов pi и р2 это равно- сильно тому, что вектор MqAI линейно выражается через pi и р2: = upi+vp2, u, i> € R. (32-4) Теорема 32.2. В пространстве в аффинной системе ко- ординат Oxyz уравнение плоскости к, проходящей через точ- ку М0(х0,у0, zq), с направляющими векторами pi — и Р2 = {тты, ti2,/с2} имеет вид X — Xq У-Уо 2 - 20 ТП[ 771 kl = 0 ТП2 Tl2 ^2 (32.5) Доказательство теоремы повторяет доказательство теоремы 32.1. Уравнение (32.5) называется каноническим уравнением плоскос- ти. Следствие 2. Уравнение плоскости, проходящей через три точки М0(х0, уо, zq), Mi(xi,yi,zi), М2(т2> У2, £2), не лежащие на од- ной прямой, имеет вид х -х0 у — уо 2=1 — У1 - Уо ^2 -Х0 У2- Уо Z - Zq 21 - 20 22 — 20 = 0. Параметрические уравнения. Этот тип уравнений представля- ет собой другую форму записи условий (32.1) и (32.4). Пусть г = Ол1, го = OMq - радиус-векторы точек М и Mq относительно полюса О. Тогда MqA1 = г — го и условие (32.1) может быть записано в виде г — го + t a, t € R, (32.6) или, в координатной форме, в системе координат Оху: У Xq + tm, уо + tn, t е R. (32.7)
120 Глава VII. Алгебраические линии и поверхности первого порядка Уравнения (32.6), (32.7) называются параметрическими уравне- ниями прямой на плоскости в векторной и координатной формах. Замечание 2. Число t является координатой точки М на пря- мой I в системе координат {Л/q, а}. Аналогично условие (32.4) может быть записано в виде г = го + upi + v р2, m€R, (32.8) или, в координатной форме, в системе координат Oxyz: {х = хо + umi + vni2, У = Уо + ищ + vn2, (32.9) z = zq + uki 4- vk2, и, v € R. Уравнения (32.8), (32.9) называются параметрическими уравне- ниями плоскости в векторной и координатной формах. Замечание 3. Числа и, v являются плоскостными координатами точки М плоскости тг в системе координат {Л/о; pi, рз}. Общие уравнения. Теорема 32.3. Линия на плоскости является прямой то- гда и только тогда, когда она представляет собой алгебраическую линию первого порядка. Доказательство.Необходимость. Пусть I - прямая на плос- кости, проходящая через точку Мо и параллельная ненулевому век- тору а. Пусть Оху - произвольная аффинная система координат и а = {тп, п}, Мо(хд,уа). Тогда прямая I описывается каноническим уравнением (32.2) или, что то же самое, уравнением п(х — хо) — —т(у — уо) = 0, которое, если положить А — п, В = — m, С = — пхо + + туо, может быть записано в виде Ах+ Ву + С = 0. (32.10) Так как вектор а = {т, п} / 0, то по крайней мере один из ко- эффициентов А или В отличен от нуля. Поэтому левая часть уравне- ния (32.10) представляет собой алгебраический многочлен первой сте- пени. Следовательно, любая прямая на плоскости является алгебра- ической линией первого порядка. Достаточность. Пусть в аффинной системе координат Оху ли- ния I определяется уравнением (32.10). Это уравнение имеет частное АС ВС решение ха = ~ лз + д2’ = "^2 + д2’ иб° Ах° + ВУа + С = °- Вычитая последнее равенство из (32.10), получим, что А(х — а:0) + + В(у — уо) = 0 или, что то же самое, х - х0 у — уо -В А = 0.
§ 32. Уравнения прямой на плоскости и плоскости в пространстве 121 В силу теоремы 32.1 это уравнение определяет прямую, проходящую через точку Мо(хо,уо), с направляющим вектором а = {—В, Л}. Уравнение (32.10) называется общим уравнением прямой на плос- кости. Вектор п = (Л, В} называется вектором нормали к прямой относительно уравнения (32.10). Теорема 32.4. Поверхность в пространстве является плоскостью тогда и только тогда, когда она представляет собой алгебраическую поверхность первого порядка. Доказательство теоремы повторяет доказательство теоре- мы 32.3 с той лишь разницей, что уравнение плоскости имеет вид Ax + By + Cz + D = 0, где Л2 + В2 + С2 0, (32.11) AD _ BD _ CD Х° ~ ~ А2 + В2 + С2' Уо~ А2 + В2 + С2' Z°~ А2 + В2 + С2’ а уравнение (32.11) может быть записано в виде х — Хо -В -С У~Уо А 0 z- z0 0 Л = 0, если Л / 0 (случаи В / 0 и С 0 рассматриваются аналогично). Уравнение (32.11) называется общим уравнением плоскости в про- странстве. Вектор п = {Л, В, С} называется вектором нормали к плоскости относительно уравнения (32.11). Общее уравнение прямой (плоскости) называется полным, если все коэффициенты А, В, С (соответственно A,B,C,D) отличны от нуля. Теорема 32.5. В аффинной системе координат Оху на плос- кости (Oxyz в пространстве) вектор а= {тп, п} (соответственно а = {т, п, к}) параллелен прямой (плоскости), заданной общим урав- нением (32.10) (соответственно (32.11),), тогда и только тогда, ко- гда Ат + Вп = 0, (32.12) соответственно Ат + Вп + Ск = 0. (32.13) Доказательство (для прямой). Как следует из доказатель- ства теоремы 32.3, вектор b = {—В, Л} является направляющим век- тором прямой. Это означает, что вектор а параллелен этой прямой то- v. т п л гда и только тогда, когда а коллинеарен Ь, т.е. когда =0 или, что то же самое, Ат 4- Вп = 0. Замечание 4. Левые части условий (32.12), (32.13) можно рассматривать как скалярные произведения вектора нормали п и век- тора а в ортонормированием базисе. Таким образом, в прямоуголь- ной декартовой системе координат вектор нормали п — {Л, В} к
122 Глава VII. Алгебраические линии и поверхности первого порядка прямой (32.10) (соответственно п = {А, В, С} к плоскости (32.11)) перпендикулярен этой прямой (плоскости). Уравнения в отрезках. Полные уравнения (32.10) и (32.11) пря- мой на плоскости и плоскости в пространстве могут быть записаны в следующем виде: х У _ 1 Х + У i 2 - 1 -С/А -С/В И -D/А -D/В -D/C Полагая a = —С/А, b = -С/В (для прямой) и а = —D/А, Ь = -D/B, с — —D/С (для плоскости), получим эквивалентные уравнения называемые уравнениями прямой и соответственно плоскости в отрезках. Числа а, Ь, с в этих уравнениях имеют простой геометриче- ский смысл (рис. 3): они равны величинам отрезков, которые отсекает прямая (плоскость) на осях координат. Векторные уравнения. 1. Параметрическое уравнение (32.6) представляет собой векторное уравнение прямой на плоскости через направляющий вектор. Аналогично параметрическое уравнение (32.8) представляет собой векторное уравнение плоскости в пространстве через направляющие векторы. Оно порождает другие формы векторных уравнений плоско- сти. В самом деле, это уравнение означает компланарность векторов г— го, pi и р2, что согласно критерию компланарности (теорема 23.4) равносильно равенству (г - го, pi, р2) = 0 (32.14) или, в силу линейности смешанного произведения, (г, pi,p2) = D, (32.15) где D - константа, равная (го, plt р2). Уравнения (32.14), (32.15) представляют собой векторные уравне- ния плоскости через смешанное произведение.
§ 33. Взаимное расположение прямых и плоскостей 123 2. Из аксиом геометрии следует, что на плоскости (в пространстве) через заданную точку проходит единственная прямая (соответственно плоскость), перпендикулярная заданному вектору. Теорема 32.6. Уравнение прямой на плоскости (плоскости в пространстве), проходящей через точку Mo(tq) перпендикулярно вектору п, имеет вид (г-го, п) = О (32.16) или, что то же самое, (г, п) = Р, (32.17) где D - константа, равная (го, п). Доказательство. Утверждение теоремы вытекает из того, что точка М(г) лежит на прямой (на плоскости) тогда и только тогда, когда векторы Мол/и п ортогональны. Уравнения (32.16), (32.17) представляют собой векторные уравне- ния прямой на плоскости и плоскости в пространстве через нормали. § 33. Взаимное расположение прямых на плоскости (плоскостей в пространстве) Взаимное расположение двух прямых (плоскостей). Пусть на плоскости (в пространстве) две прямые (две плоскости) заданы общими уравнениями в аффинной системе координат Оху (Oxyz): li : AiX + Biy + Ci = О, A2 + B?^0, г = 1,2, (33.1) и соответственно Xi : AiX + Bty + Ctz + Di = 0, A? + В2 + C2 / 0, i = 1,2. (33.2) Составим матрицы из коэффициентов этих уравнений: Ai Bi о _ Ai Bi Ci A2 B2 ' A2 B2 C2 для прямых и Ai Bi Ci n _ Ai Bi Ci Di A2 B2 C2 ’ A2 b2 c2 d2 (33.3) (33.4) для плоскостей. Очевидно, что в обоих случаях 1 < rgA < 2, 1 < rg В < 2, rg А < rg В. Следовательно, для рангов матриц А и В возможны только следующие три набора значений: rg А rg В 1 2 1 1 2 2 (33.5)
124 Глава VII. Алгебраические линии и поверхности первого порядка Теорема 33.1. Прямые li и 1з на плоскости совпадают то- гда и только тогда, когда Ai _ В\ _ С\ _ А? В'2 Сз параллельны и не совпадают тогда и только тогда, когда у £i. Аз Вз Сз пересекаются тогда и только тогда, когда А , £1 Аз * Вз (33.6) (33.7) (33.8) Доказательство. Рассмотрим систему линейных алгебраичес- ких уравнений А[Х + Bly + Ci = О, (33.9) А3Х + Взу + Сз — О относительно неизвестных х, у. Для этой системы матрицы А и В из (33.3) являются основной и расширенной матрицами соответственно. Согласно (33.5) эта система совместна только в двух случаях: ко- гда rgA = rgB = 1 и rgA = rgB = 2. В случае когда rgA — 1, a rg В = 2, система несовместна. В первом случае решения систе- мы образуют одномерное линейное многообразие (§30), а во втором - нульмерное, т.е. система имеет единственное решение. Перейдем к прямым li и 1з. Совпадение прямых 1\ и I3 означает, что решения системы (33.9) образуют одномерное линейное много- образие, т.е. что rgA = rgB = 1 или, что то же самое, rgB = 1. Это условие равносильно (33.6) в силу теоремы о базисном миноре. Параллельность прямых li и 1з (и их несовпадение) означает, что си- стема (33.9) несовместна, т.е. что rgA = 1, rgB = 2. Это условие равносильно (33.7). Пересекаемость прямых 1\ и I3 означает, что си- стема (33.9) имеет единственное решение, т.е. что rg А = rg В = 2 или, что то же самое, rg А — 2. Это условие равносильно (33.8). Теорема 33.2. Плоскости ттх и тг2 совпадают тогда и толь- ко тогда, когда = Bi =£l = £l. Аз Вз Сз D3 параллельны и не совпадают тогда и только тогда, когда А! = В± = Cl В1 Аз Вз Сз D3 ’
§ 33- Взаимное расположение прямых и плоскостей 125 пересекаются тогда и только тогда, когда коэффициенты Ai, Bi, Су и А2, В2, Сз не пропорциональны. Доказательство теоремы представляет собой естественный аналог доказательства теоремы 33.1 и не содержит принципиальных отличий. Отметим лишь, что в случае, когда rg А = rg В = 1, решения системы образуют двумерное линейное многообразие (т.е. плоскости 7Г1 и тг2 совпадают), а в случае, когда rg.4 — rgB = 2, решения си- стемы образуют одномерное линейное многообразие (т.е. плоскости пересекаются по прямой). Замечание. Теоремам 33.1 и 33.2 можно дать единую форму- лировку в терминах матриц (33.3) и (33.4): прямые /j uZ2 (плоскости TTi U 7Г2) совпадают <=> rgB = l; параллельны и не совпадают <=> rgА — 1, rgB = 2; пересекаются <=> rgA = 2. Пучок прямых (плоскостей). Множество всех прямых плоско- сти, проходящих через данную точку Mq, называется пучком прямых с центром в точке Mq. Обозначение: тг(Мо). Пусть li и 12 - две не- совпадающие прямые пучка л (Mq), заданные уравнениями (33.1) в не- которой аффинной системе координат Оху. Положим F(x, у) = Aix + Bty + Ci, где i — 1,2. Теорема 33.3. Прямая принадлежит пучку л(Мо) тогда и только тогда, когда она определяется уравнением aFi (х, у) + 0F2(x, у) = 0 (33.10) при некоторых а, 0 е R, одновременно не равных нулю. Доказательство. Достаточность очевидна, так как урав- нение (33.10) является в силу условия (33.8) уравнением первой сте- пени и определяет прямую. Она проходит через точку Мо(хо.Уо), по- скольку Г1(г0, у0) = 0 и F2(t0. Уо) = 0. Необходимость. Пусть прямая I € тг(Мо)- Возьмем на этой прямой точку Mi(xi,yi), отличную от точки Мо(хо,уо'). Положим а = А2х^ + В2у1 + С2, 0 = -(Ajii + Biyi + Ci). Поскольку точка Mi не может одновременно лежать на li и Z2 (ибо прямые li и 12 не совпадают), то по крайней мере одно из чисел а или 0 отлично от ну- ля. Тогда уравнение aFi (1, у) + 0F2(x, у) = 0 согласно условию (33.8) является уравнением первой степени и определяет прямую. Очевид- но, она проходит через точки Mq (так как прямые Z2 проходят через Mq) и Mi (согласно выбору а, 0). Следовательно, эта прямая совпадает с I. Итак, любая прямая пучка п(Мо) определяется двумя пересекаю- щимися прямыми li и 12 этого пучка. Каждая пара чисел а, 0, где а2+ -I- 02 0, определяет единственную прямую пучка. Уравнение (33.10) называется уравнением пучка прямых, проходящих через точку пере- сечения прямых (33.1).
126 Глава VII. Алгебраические линии и поверхности первого порядка Множество всех плоскостей пространства, проходящих через пря- мую I, называется пучком плоскостейс осью/.Обоз начен ие: тг(/). Пусть 7Г1 и 7Г2 _ Две пересекающиеся плоскости пучка тг(/), заданные уравнениями (33.2) в некоторой аффинной системе координат Oxyz. Положим F,(x, у, z) = AiX + Biy + Ctz 4- D,, где i = 1,2. Теорема 33.4. Плоскость принадлежит пучку л{1) тогда и только тогда, когда она определяется уравнением aFi(x,y,z) + (№2(1,у, z) — Q (33.11) при некоторых а,/3 ё R, одновременно не равных нулю. Доказательство теоремы, по существу, повторяет доказатель- ство теоремы 33.3. Отметим лишь, что в данном случае Mi - любая точка плоскости, не лежащая на оси I. Уравнение (33.11) называется уравнением пучка плоскостей, про- ходящих через прямую пересечения плоскостей (33.2). § 34. Полуплоскости и полупространства Из аксиом геометрии следует, что каждая прямая I на плоскости разбивает эту плоскость на две полуплоскости, при этом точки Му и М2, не лежащие на прямой I, принадлежат одной полуплоскости, если отрезок [MiМ2] не имеет общих точек с прямой I, в противном случае точки Му и М2 принадлежат разным полуплоскостям. Выясним, как этот геометрический факт описывается в аналитической форме. Пусть прямая I в аффинной системе координат Оху определяется уравнением Ах 4- By 4- С = 0. (34.1) Теорема 34.1. Точки Му(ху, у у) принадлежат разным полуплоскостям относительно прямой I тогда и только то- гда, когда (•Aii 4- Вуу 4- С)(Л®2 4- Ву2 4- С) < 0. (34.2) Доказательство. Предварительно заметим, что точка Мо(хо, уо) является внутренней точкой отрезка [М1М2] тогда и толь- ко тогда, когда МуМо = tMyM2, где 0 < t < 1, т.е. х0 = (1 - t)xy 4- tx2, уо = (1 - t)yi 4- ty2, 0 < t < 1. Точки Му(ху,уу) и М2(х2,у2) принадлежат разным полуплоско- стям тогда и только тогда, когда существует точка Мо(хо,уо), общая для прямой I и отрезка [М1М2], причем Mq является внутренней точ- кой отрезка [MiМ2], т.е. f Azo 4- Вуо 4- С = 0, 1 Хо = (1 - t)xy 4- tx2, Уо = (1 - t)yy +ty2, 0 < t < 1.
§ 34. Полуплоскости и полупространства. 127 С учетом очевидного тождества С = (1 — t)C + tC получим, что точки Л/i и М2 принадлежат разным полуплоскостям тогда и только тогда, когда существует число t такое, что (1 — 4- Вщ 4- С) 4- t(Ax2 И- Ву2 4- В) — 0, 0 < t < 1, или, в обозначениях Axi + Ву\ + С = Fi, Ах2 + Ву2 + С = F2, (1 — t)Ft 4- tF2 ~ 0, 0 < t < 1. Это равносильно тому, что FiF2 < 0. Итак, для координат (т, у) всех точек одной полуплоскости выпол- няется неравенство Ах+Ву+С > 0, адругой — неравенство Ах 4- Ву + 4- С < 0. Полуплоскость, для точек М(х, у) которой Ах + By 4- С > 0, называется положительной полуплоскостью относительно уравне- ния (34.1) прямой I и обозначается символом тт+, а полуплоскость, для точек которой Ах 4- By 4- С < 0, - отрицательной полуплоско- стью и обозначается 7Г_. Теорема 34.2. Вектор нормали п = {А,В} к прямой I: Ах 4- By 4- С — 0, отложенный от любой точки прямой, направлен в сторону положительной полуплоскости. Доказательство. Пусть Мо(хо,уо) - произвольная точка пря- мой I. Отложим вектор и от точки Мо, пусть конец вектора п со- впадает с точкой Mi(xi,yi). Тогда п — {xi - io,yi - уо} = {А,В} и, следовательно, Xi = А + xq, yi = В 4- уо- Подставив координаты ^1,1/1 точки Mi в левую часть уравнения прямой I, получаем, что Атх 4- Byi 4- С — А2 4- В2 4- Axq 4- Вуо + С = А2 + В2 >0, так как Ахо + Вуо 4- С = 0 и п 0. Аналогичные факты имеют место и в пространстве. Плоскость тг : Ах 4- By 4- Cz 4- В — 0 (34.3) разбивает пространство на два полупространства. Теорема 34.3. Точки Mi(x\,y\,zi) и M2(x2,y2,z2) принад- лежат разным полупространствам относительно плоскости к то- гда и только тогда, когда (Axi 4- Ву\ 4- Czi 4- В)(Ат2 4- Ву2 4- Cz2 4- В) < 0. Доказательство теоремы принципиально не отличается от до- казательства теоремы 34.1. Полупространство, для точек М(х, у, г) которого Ах 4- By 4- Cz 4- 4- D > 0, называется положительным полупространством относи- тельно уравнения (34.3) плоскости тг, а полупространство, для точек которого Ах 4- By 4- Cz 4- О < 0, - отрицательным полупростран- ством. Теорема 34.4. Вектор нормали п = {А, В, С} к плоскости к: Ах 4- By 4- Cz 4- D — 0, отложенный от любой точки плоскости, направлен в сторону положительного полупространства. Доказательство теоремы аналогично доказательству теоре- мы 34.2. 5 Линейна* алгебра и аналитическая геометрия
128 Глава VII. Алгебраические линии и поверхности первого порядка § 35. Прямая на плоскости (плоскость в пространстве) в прямоугольной декартовой системе координат Рассматривается прямоугольная декартова система координат Оху на плоскости (Oxyz в пространстве), определенная ортонормиро- ванным базисом ei, ег (ej., ез, ез соответственно). Известно (§32, за- мечание 2), что вектор нормали п = {Л, В} (соответственно п — — {.4, В, С}) перпендикулярен прямой I, заданной уравнением (32.10) (соответственно плоскости тг, заданной уравнением (32.11)). Расстояние от точки до прямой (до плоскости). Теорема 35.1. В прямоугольной декартовой системе ко- ординат Оху расстояние р(Мо,/) от точки Мо(хо,уо) до прямой (32.10) определяется формулой ,,, n l^o + Вуо + С| р(и°'')= ЛР + в’ (35л) Доказательство. Пусть Mq £ I (для точек Mq е I равенство (35.1) очевидно). Опустим из точки Mq перпендикуляр на прямую I, пусть М1(хл,у1) - основание перпендикуляра. Тогда M^Mq = ап и p(M0,l) = IMxMqI = |а| |п| = |а|\/Л2 + В2. (35.2) Найдем а. Так как xq = 24 4- оЛ, уо = у\ 4- аВ, то Axq + Вуо 4- 4- С = Axi 4- Byi 4- С 4- а(А2 4- В2) — а(А2 4- В2). Отсюда а = (Axq 4- 4- Вуо 4- С)/(А2 4- В2). Подставив это значение а в (35.2), получим (35.1). Теорема 35.2. В прямоугольной декартовой системе ко- ординат Oxyz расстояние от точки Mq(xq, уо, zq) до плоскости (32.11) определяется формулой ,,, \ Ихо 4- Вуо 4-Czq 4- D\ pi Мо, л) = --, ---. у/А2 + В2 + С2 Угол между прямыми (между плоскостями). Пусть прямые Z1 и 12 (плоскости Ki и тг2) заданы уравнениями (33.1) (соответственно (33.2)). Вообще говоря, две пересекающиеся прямые li и 12 (плоскости и тгг) образуют два угла, в сумме равные тг. Достаточно определить один их них. Так как векторы нормали щ и п2 перпендикулярны прямым (плоскостям), то угол <р = (пТТл-г) совпадает с одним из углов между прямыми и 12 (между плоскостями лг и л2). Итак, согласно (22.6) угол <р между прямыми (33.1), совпадающий с углом между их нормалями, определяется формулой AjA-2 4- В\В2 cos ip = —, ,—. , ^/А2 + В?^/А2+В2
§ 36. Прямая в пространстве 129 а угол между плоскостями (33.2), совпадающий с углом между их нормалями, - формулой Л] Аг + В\В2 + С\С>2 cos — —, —, . В частности, прямые li и I2 {плоскости tti и тг2) перпендикулярны тогда и только тогда, когда Aj А2 + В1В2 = 0 ( j4j А 2 А В1В2 + Ci(?2 =0). § 36. Прямая в пространстве Уравнения прямой. 1. Векторное уравнение (32.6) прямой на плоскости остается справедливым и для прямой в пространстве, так как и в пространстве прямая однозначно определяется точкой и на- правляющим вектором. Итак (§32), если в пространстве зафиксиро- ван полюс О, то уравнение прямой, проходящей через точку Mq(to), с направляющим вектором а имеет вид г — го + ta, t 6 R. (36.1) Пусть в аффинной системе координат точка Mq имеет координаты (х0, уо, zq), а вектор а = {т, п, /с}. Тогда уравнение (36.1) может быть записано в координатной форме: X — Xq + tm, - У = Уо + tn, , z = zq 4- tk, t € R. (36.2) Уравнения (36.1), (36.2) называются параметрическими уравне- ниями прямой в пространстве в векторной и координатной формах соответствен но. 2. Уравнение (36.1), означающее коллинеарность векторов г— го и а, может быть записано и в терминах пропорциональности координат векторов г — го = {х — xq, у — Уо, z — zq} и а = {m, n, fc} следующим образом: х-хо = у-уо = z-zo т п к Уравнения (36.3) называются каноническими уравнениями пря- мой в пространстве. Так же как и для канонического уравнения (32.3) прямой на плос- кости, уравнения (36.3) говорят лишь о пропорциональности коорди- нат векторов г — го и а. Если, например, т — 0, то уравнения (36.3)
130 Глава VII. Алгебраические линии и поверхности первого порядка переходят в уравнения Если же rn = 0, п = 0, то уравнения (36.3) переходят в уравнения х - х0 = 0, у - уо = 0, т.е. прямая является линией пересечения плоскостей х — Хо = 0 и У - Уо = 0. 3. Для прямой, проходящей через две различные точки Af0(io, уо, zq) и Mi(xi,yi,zi), легко получить уравнения (36.1)-(36.3), так как в качестве направляющего вектора может быть взят вектор а = = MqMi - {li - То, У1 - Уо, Zi - Zq}. 4. Векторное уравнение (36.1) порождает и другие формы вектор- ных уравнений прямой в пространстве. В самом деле, это уравнение означает коллинеарность векторов г — го и а, что согласно критерию коллинеарности (теорема 23.2) равносильно равенству [г - г0, а] = 0 (36.4) или, в силу линейности векторного произведения, [г, а] = М, где М = [го, а]. (36.5) Заметим, что уравнения (36.4) и (36.5) лишены смысла для прямой на плос- кости; по своей структуре они близки к уравнениям (32.14) и (32.15) плоскости в пространстве. 5. Каждая прямая может быть представлена как пересечение двух плоскостей. Практически уравнения (36.3) задают Прямую именно та- ким образом, так как они эквивалентны системе из двух линейных уравнений, каждое из которых определяет плоскость. Дадим общую формулировку этого факта. В аффинной системе координат Oxyz прямая I, являющаяся линией пересечения плоскостей тг, : AiX + В,у + CiZ + .Di = 0, i = 1,2, определяется системой уравнений где ( Atx + Bty + Ciz + £>i = 0, ( А2Х + В2У + C2z + D2 = о, rg Bi Ci в2 с2 = 2. (36.6) (36.7) Ai Л2 Условие (36.7) означает, что плоскости тц и тг2 пересекаются (§33, замечание). Систему (36.6) называют общими уравнениями прямой в пространстве. Важно уметь переходить от одного типа уравнения прямой к дру- гому. Переход от каждого из уравнений (36.1)-(36.5) к любому дру- гому очевиден. Для перехода от уравнений (36.6) к (36-1)—(36.5) не- обходимо найти точку Мо и направляющий вектор а. Координаты
§ 36. Прямая в пространстве 131 точки Л/о можно найти как частное решение системы (36.6). Найдем вектор а. Теорема 36.1. Если в аффинной системе координат Oxyz прямая I задана общими уравнениями (36.6), то вектор а = Bi Су В2 С2 A G А2 С2 (36.8) А А является направляющим вектором этой прямой. Доказательство. Отметим прежде всего, что а^ Ов силу условия (36.7). Далее, вектор а параллелен плоскостям ttj и ттд, так как разложения определителей Л1 В\ С\ А С\ А% В2 С2 А2 В2 С2 А В\ Ci А &2 С2 = 0 и = о по первой строке совпадают с условиями (32.13) параллельности век- тора а плоскостям ttj и тг2. Итак, ненулевой вектор а параллелен каждой из плоскостей тн и л2. Следовательно, он является напра- вляющим вектором линии их пересечения. Замечание 1. Для запоминания координат вектора а может быть использован мнемонический определитель ei Аг А2 а = е2 е3 Bi Ci В2 С2 где ex, е2, е3 - базис, соответствующий системе координат Oxyz. Раз- ложение этого определителя по первой строке совпадает с разложе- нием вектора а по базису ех, ез, е3. Замечание 2. Теорема 36.1 относится к аффинной системе ко- ординат. Очевидно, что в прямоугольной декартовой системе коорди- нат, соответствующей ортонормированному базису ej, е2, е3, век- тор (36.8) может быть получен как векторное произведение [гц, п2] нормалей щ и п2 к плоскостям -яд и л2. Взаимное расположение двух прямых в пространстве. Пусть каждая из прямых Ц, г = 1,2, задана точкой Mi(xi, у±,zj и направляющим вектором aj = {т^тцА} в некоторой аффинной си- стеме координат Oxyz. Положим b = MiM2. Теорема 36.2. Прямые li и Z2 лежат в одной плоскости тогда и только тогда, когда Х2 — Xi mi m2 У2 -У1 ni П2 Z2 ~ Zi ki fc2 = 0. (36.9)
132 Глава VII. Алгебраические линии и поверхности первого порядка Доказательство. Действительно, прямые li и/2 лежат в одной плоскости тогда и только тогда, когда векторы Ь, а;, аг компланар- ны, т.е. линейно зависимы (теорема 15.2). Согласно теореме 14.2 это равносильно тому, что один из них линейно выражается через другие. В силу линейности координат то же относится и к их координатам, что означает (§16, следствие 1) равенство нулю определителя, стро- ками которого являются эти координаты. Замечание 3. В прямоугольной декартовой системе коорди- нат условие (36.9) может быть получено из критерия компланарности векторов b, ai, а2 (теорема 23.4 и соотношение (23.6)). Теорема 36.3. Прямые и 12 совпадают тогда и только тогда, когда rg 1’2 - 2=1 У2 - У1 Т71 £ 71 j ТП2 П2 Z2 - Z1 ki k2 (36.10) параллельны и не совпадают тогда и только тогда, когда rg 7П1 т2 П1 п2 fci fc2 Z2 - Xi 7711 77l2 У2 ~ У1 Щ n2 a2 - Zi ki k2 пересекаются тогда и только тогда, когда = 2, (36.11) rg 7721 Tij 7722 77.2 ki ^2 = rg Х2 — ^1 7П1 m2 У2 - У1 п2 Z2 - Л1 ki /с2 (36.12) 1, rg Доказательство. Условие (36.10) равносильно тому, что век- торы b, ai, а2 коллинеарны; условие (36.11) - тому, что векторы а1; а2 коллинеарны, а векторы b, ai, а2 компланарны, но не коллине- арны; условие (36.12) - тому, что векторы ах, а2 не коллинеарны, а векторы b, ai, а2 компланарны. Отсюда следует утверждение тео- ремы. Взаимное расположение прямой и плоскости. Пусть в прос- транстве в некоторой аффинной системе координат Oxyz заданы плос- кость тг: Ах + By + Cz + D = 0 и прямая I : г = го -I-1 а, где го = {10,2/0, zo}, а = {771,71, А:}. Теорема 36.4. Прямая I лежит в плоскости тг тогда и только тогда, когда ( Ат + Bn + Ск = 0, { Ахо "Ь Ву^ 4- Сzq + D = 0;
§ 36. Прямая в пространстве 133 прямая I параллельна плоскости %, но не лежит в ней тогда и толь- ко тогда, когда Г Ат 4- Bn + Ск = О, ( Ато 4- Вуд 4- Czq 4- D 7^ О; прямая I пересекает плоскость тг тогда и только тогда, когда Ат 4- Вп 4- Ск О. Утверждение теоремы следует из критерия (32.13) параллельно- сти вектора а и плоскости тг. Метрические задачи в прямоугольной декартовой системе координат. Пусть Oxyz - прямоугольная декартова система коорди- нат в пространстве. 1. Углом между двумя прямыми в пространстве называется лю- бой из углов между параллельными им прямыми, проходящими через какую-либо точку пространства. Таким образом, две прямые в прост- ранстве образуют между собой два различных (если они не перпенди- кулярны) угла, в сумме равные тг. Очевидно, что угол между напра- вляющими векторами прямых равен одному из этих углов. Следова- тельно, угол <р между прямыми 1<: г = г, -Ha», i — 1,2, совпадающий с углом между их направляющими векторами а1 = {m,,ni,fci}, вычи- сляется согласно (22.6) по формуле т]7П2 + П1П2 4- klk2 cos<p = —, —, . - - . у/т2 4- n2 + к2 у/т] + п2 А к% 2. Углом между прямой и плоскостью (если они не перпендику- лярны) называется меныпий из углов между этой прямой и ее ортого- нальной проекцией на плоскость. Если же прямая и плоскость перпен- дикулярны, го угол между ними считается равным тг/2. Угол </> между прямой Z: г — tq 4- t а и плоскостью тг: Ах 4- By 4- Cz 4- D — 0 на- ходится как дополнительный к углу между направляющим вектором прямой а = {т,п, fc} и вектором нормали к плоскости п= {Л, В, С} и вычисляется согласно (22.6) по формуле |Лт 4-Вп 4-Cfc| „ . sin о? = , 0 < <д < тг/2. Vm2 + п2 + к2у/А2 + В2 + С2 ~ 3. Расстояние р(М\,1} от точки Г]) до прямой / : г = го 4- ta находится как высота h (рис. 1) параллелограмма, построенного на векторах а и MqA/i, площадь и основание которого известны (§23): |а| Соотношения (23.5), (22.6) позволяют вычислить p(Mi,Z) по из- вестным прямоугольным координатам.
134 Глава VII. Алгебраические линии и поверхности первого порядка Рис. 1 Рис. 2 4. Расстоянием между скрещивающимися прямыми Ц: г = г, + + tai, i = 1,2, называется расстояние между параллельными плос- костями, в которых лежат прямые li и Zj- Это расстояние находится как высота параллелепипеда (рис. 2), построенного на век- торах Mi М2, ai, аз, объем и площадь основания которого известны (§23): Соотношения (23.6), (22.6) позволяют вычислить p(Z15Z2) по из- вестным прямоугольным координатам.
Глава VIII. Элементы общей алгебры В этой главе изучаются фундаментальные для всей алгебры поня- тия группы, кольца и поля. Они дают возможность с общих позиций взглянуть на рассмотренные в предыдущих главах понятия и факты и ввести, кроме того, новые. § 37, Группа Непустое множество G с заданной на нем алгебраической опера- цией * называется группой, если: 1) операция ассоциативна: (а * Ь) * с = а * (6 * с), Va, b, с G G; 2) операция обладает нейтральным элементом e€G:a*e = e*a = = a, Va € G; 3) для любого элемента а € G существует симметричный элемент а! е G : а * а' — а' ♦ а = е. Обозначение: G или {G, *). Условия 1-3 называются аксиома- ми группы. Группа с коммутативной операцией называется комму- тативной или абелевой. О терминологии. Обычно групповую операцию ♦ обозначают специаль- ными символами, чаще всего символами - или +, называя a • Ь (или просто ab) произведением, а a+b - суммой элементов a, b G G. В первом случае нейтральный элемент называют единицей (обозначение: 1), симметричный элемент - обрат- ным (обозначение: а-1), а саму группу G - мультипликативной. Во втором случае нейтральный элемент называют нулем (обозначение: 0), симметрич- ный - противоположным (обозначение: -а), а группу G - аддитивной. Если относительно групповой операции нет никаких оговорок, то обычно исполь- зуют терминологию мультипликативной группы. Как следует из определения, группа - это абстракция множества, наделенного одной алгебраической операцией. Большинство изучен- ных нами множеств являются конкретными проявлениями этого по- нятия, т.е. представляют собой группы. Действительно: а) (Z,+); <Q, +); (R, +); (Кп,+), где n = 1,2,3; (Rmxn,+); лю- бое линейное пространство V - это аддитивные абелевы группы; б) (Q\0, ); (R\0, •) - мультипликативные абелевы группы; в) ({А € R"x"|detA / 0},-); ({А е Rnx"|detA = 1},) - мульти- пликативные неабелевы группы; г) множество S(X) всех биективных отображений f : X —> X - мультипликативная неабелева группа. Из аксиом группы и свойств алгебраической операции (§9) выте- кают следующие факты. 1°. В любой группе существует, и притом единственный, ней- тральный элемент.
136 Глава VIII. Элементы общей алгебры 2°. В любой группе для каждого элемента существует, и притом единственный, симметричный элемент. Аксиомы группы можно несколько ослабить. Убедимся в этом. Пусть G - множество, наделенное алгебраической операцией. Эле- мент en € G такой, что аеп — а для любого а € G, назовем правой единицей множества G, а элемент a~l & G такой, что аа~1 = еп, - правым обратным к элементу а. Теорема 37.1. Множество G с ассоциативной алгебраи- ческой операцией является группой, если оно обладает правой еди- ницей еп и по отношению к ней каждый элемент а € G обладает правым обратным. Доказательство. Пусть а - произвольный элемент множества G и а~1 - правый обратный к нему элемент. Тогда аа~1 = еп — епеп — — еп{аа~х'} — (епа)а~х, т.е. аа~х = (епа)а~х. Умножив обе части последнего равенства справа на правый обратный элемент к элементу а~1, получим, что а = епа. Таким образом, правая единица множества G оказывается и левой единицей, т.е. просто единицей е множества G. Покажем теперь, что правый обратный элемент к элементу а явля- ется и левым обратным, т.е. а~ха = е. Действительно, еа~х = anTe = = а~х(аа~х) — (а~ха)а~х, т.е. еа~х = (a“1a)a“1. Умножив обе части последнего равенства справа на правый обратный элемент к элементу а~х, получим е = а~ха. Следствие. В группе любая правая единица является левой и той единственной единицей, которой эта группа обладает, а любой правый обратный элемент к элементу а группы является левым и тем единственным обратным, которым обладает-элемент а. Теорема 37.2. Множество G с ассоциативной алгебраиче- ской операцией является группой тогда и только тогда, когда эта операция обладает обратной. Доказательство. Необходимость. Пусть G - группа; по- кажем, что уравнения ах = Ь, (37.1) ya = b (37.2) имеют единственное решение для любых a, b € G. Действительно, элемент х = а~хЬ является решением уравнения (37.1), так как ах = — a(a~xb) = (aa~x)b = eb — Ь. Это решение единственно, посколь- ку если х' - любое другое решение (37.1), то ах' = ах и а~х(ах') = = а-Дат). Следовательно, х' — х. Аналогично доказывается утвер- ждение, касающееся уравнения (37.2). Достаточность. Пусть теперь уравнения (37.1), (37.2) при лю- бых a, b € G имеют единственное решение. Покажем, что G - группа. Для этого покажем, что выполнены все условия теоремы 37.1. Действительно, возьмем произвольный элемент а € G. Уравнение ах = а имеет единственное решение. Очевидно, оно играет роль пра- вой единицы для элемента а. Обозначим его е“. Для любого другого
§ 38. Подгруппа 137 элемента Ь € G существует элемент у е G такой, что Ь = ya (т.е. у - решение (37.2)). Тогда b = ya = y(ae%) — (уа)е“ — Ье“. Следова- тельно, Ье“ = b, Wb е G, и е“ = еп - правая единица множества G. Далее, уравнение ах = еп имеет решение, которое, очевидно, являет- ся правым обратным к элементу а по отношению к еп. Отсюда в силу теоремы 37.1 следует, что G - группа. Замечание. Попутно доказано еще одно свойство группы: в груп- пе любая правая (левая) единица для одного элемента является об- щей правой (соответственно левой) единицей. Итак, групповая операция обладает обратной операцией. В адди- тивной группе обратная операция называется вычитанием (справа и слева), а элементы х = Ь + (—а) и у = (—а) + Ь - разностью {право- сторонней и левосторонней соответственно). В абелевой группе обе разности совпадают и обозначаются единым символом b — а. § 38. Подгруппа Определение. Непустое подмножество Н группы G называется подгруппой группы G, если оно само является группой относительно алгебраической операции в G. Примеры. 1. Простейшими подгруппами любой группы являют- ся ее единичный элемент и сама группа. Эти подгруппы называют тривиальными. 2. Множество четных чисел - подгруппа аддитивной группы целых чисел. 3. Множество чисел, кратных р, где р € N, р > 1, - подгруппа аддитивной группы целых чисел. 4. Множество рациональных чисел, отличных от нуля, - подгруппа мультипликативной группы ненулевых действительных чисел. 5. Множество квадратных матриц n-го порядка, определители ко- торых равны единице, - подгруппа мультипликативной группы не- вырожденных матриц n-го порядка. Теорема 38.1. Подмножество Н группы G является под- группой этой группы тогда и только тогда, когда имеют место следующие импликации: 1) a,b G Н => ab € Н; 2) аеН ^а-'еН. Доказательство. Необходимость очевидна, она вытекает из того, что Н - группа. Достаточность. Из первого условия следует, что алгебраиче- ская операция в G является алгебраической операцией и в Н. Что же касается аксиом, то необходимо проверить только аксиому едини- цы. Пусть а € Н\ тогда, согласно условиям 1 и 2, а"1 € И и аа"1 = = е е Н.
138 Глава VIII. Элементы общей алгебры Группа невырожденных верхних (нижних) треугольных матриц. Множество М всех невырожденных верхних треугольных матриц n-го порядка образует мультипликативную группу. В этом можно убедиться, показав, что М — подгруппа мультипликативной группы невырожденных матриц n-го порядка, т.е. проверив все тре- бования теоремы 38.1. В самом деле, а) если А, В - верхние треугольные матрицы, то /с-й столбец ма- трицы АВ является линейной комбинацией первых к столбцов ма- трицы А, поэтому все его элементы, расположенные ниже к-й строки, равны нулю, и, следовательно, АВ - верхняя треугольная матрица; невырожденность АВ очевидна; б) если А - невырожденная верхняя треугольная матрица, то к-й столбец матрицы Л-1 является решением системы уравнений Ах — ек с треугольной матрицей Л, у которой все диагональные элементы от- личны от нуля; решая эту систему “снизу вверх”, получим Хп = о, Tn-I =0,...,2:fc+i =0, т.е. Л-1 - верхняя треугольная матрица; невырожденность Л'1 оче- видна. Группа ортогональных матриц. Множество М всех ортого- нальных матриц Q € Rnx" образует мультипликативную группу, так как а) произведение ортогональных матриц - ортогональная матрица: (Q1Q2)TQ1Q2 = QlQiQiQi = Л Q1Q2(Q1Q2)T = Q1Q2Q2QT = I; б) обратная к ортогональной матрице - ортогональная матрица: Q-l = QT, QT(QT)T = QTQ = I, (QT)TQT = QQT = I, и согласно теореме 38.1 M - подгруппа мультипликативной группы невырожденных матриц. Произведение подмножеств группы. Пусть G - группа, М и N - два ее подмножества. Произведением MN этих подмножеств называется множество всевозможных произведений тп, где т € М, п € N. Итак, MN — {тпп|тп € Af, п € TV}. Очевидно, что имеет место свойство ассоциативности: (MN)K — M(NK}, так как оба этих про- изведения состоят из элементов (тп)к = т(пк), где т € М, п & N, кеК. Если одно из подмножеств состоит только из одного элемента, на- пример М = {тп}, то произведение МN обозначается символом mN, а произведение NM - символом Nm, т.е. в этом контексте нет необ- ходимости отличать элемент от состоящего из одного этого элемента множества.
§ 38. Подгруппа 139 Замечание. Термин “произведение”, используемый здесь, весьма условен, он соответствует терминологии мультипликативной группы, принятой в теории групп. В аддитивной группе, очевидно, MN состоит из сумм т + п элементов подмножеств М и N и обозначается в зависимости от контекста символом M+N. Смежные классы. Пусть Н - подгруппа группы G, а - эле- мент группы G. Множество аН называется левым, смежным классом. группы G по подгруппе Н, порожденным элементом а, а множество На - правым смежным классом. Из определения вытекают следую- щие простейшие свойства смежных классов. Iе. а € аН, a G На, так как подгруппа Н содержит единицу. 2°. Смежный класс состоит из элементов группы, причем лю- бой элемент группы входит в какой-нибудь смежный класс (в силу свойства 1°). 3°. Подгруппа Н является одним из смежных классов (как левых, так и правых), поскольку Н = еН — Не. 4°. В абелевой группе аН = На, 'да € G. Примеры смежных классов содержит следующая таблица. Табли ца С н аН (Z.+) Н = {2fc 1 к 6 Z} mH = Нт = {тп 4- 2k | k € Z} = = {n6Z|n = m(mod2)}. Итак, адди- тивная группа целых чисел разбива- ется на два смежных класса по под- группе четных чисел: это классы всех четных и всех нечетных чисел. (Z,+) Пусть р € N, р > 1. Я = {рк | к е Z) mH = Нт = {n € Z | п = m(modp)} (см. (7.1)). Итак, аддитивная группа целых чисел разбивается на р смеж- ных классов по подгруппе Н чисел, кратных р: Со, С,, ... , Ср_ 1, где Сг - класс вычетов по модулю р. <кп,+) Пусть А 6 Rmxn. Я = {т € Rn| Ах = 0} Положим Аа = Ь.Тогда аН = На = {а + т|Ат = 0} = {г 6 Rn|Ar = Ь]. Итак, смежный класс аддитивной группы К” по подгруппе решений од- нородной системы Ах = 0, порожден- ный элементом а, представляет собой множество всех решений неоднород- ной системы Ах = Ь, частным реше- нием которой является а. (V.+), где V - линейное прост- ранство Пусть L - линей- ное подпространст- во V, H = L Пусть хо € V. Тогда хоН = Нхо = {то + т|т 6 L} - линейное многообра- зие то -f- Я. Теорема 38.2. Смежный класс порождается любым своим элементом. Доказательство. Надо показать, что если g € аН, то аН = дН. Пусть д = ahi, € Н. Тогда для любого элемента h G Н имеем
140 Глава VIII. Элементы общей алгебры ah = ’/г) = gh2, где h2 = h(lh € Я в силу теоремы .38.1. Значит, aH С дН. В то же время gh = a(h\h) = ah2, где h2 = hih € H. Следовательно, дН С аН. и с учетом вложения в другую сторону получаем требуемое равенство. Доказательство проведено для левого смежного класса, но очевидно, что оно может быть использовано и для правого. Теорема 38.3. Любые два левых (правых) смежных класса либо совпадают, либо не пересекаются. Доказательство. Утверждение теоремы вытекает из теоремы 38.2, так как если два смежных класса аН и ЬН имеют общий элемент д, то аН = ЬН = дН. Итак, вся группа разбивается на непересекающиеся левые (пра- вые) смежные классы по подгруппе Н. Это разбиение называется левосторонним (соответственно правосторонним) разложением группы G по подгруппе Н. § 39. Конечная х руппа Основные свойства. Группа, состоящая из конечного числа эле- ментов, называется конечной группой. Число элементов конечной груп- пы называется ее порядком и обозначается символом card G. Беско- нечную группу называют группой бесконечного порядка. Очевидно, что алгебраическая операция в группе конечного порядка может быть представлена “таблицей умножения” ее элементов. Этим мы восполь- зуемся в следующих примерах. 1. Группа из одного элемента состоит только из единицы: G — {е}, при этом алгебраическая операция определяется таблицей е е е 2. Группа из двух элементов G = {е,а} определяется таблицей Здесь аа а, так как иначе элемент а будет единицей для а, т.е. (§37, замечание) общей и единственной единицей е. Поэтому аа — е. 3. Группа из трех элементов G = {е, а, 6} определяется таблицей е а ь е е а ь а а ь е Ъ ь е а
§ 39. Конечная группа 141 Здесь, рассуждая так же, как в примере 2, получаем, что ab / a, ab b,ba a, ba ф b. Следовательно, ab = e = ba. Аналогично aa a, aa e (так как единственным обратным элементу а, как выяснено выше, является элемент Ь). Следовательно, aa — b. Аналогично bb = а. Заметим, что все три рассмотренные группы абелевы. Теорема 39.1 (теорема Лагранжа). Во всякой конечной группе порядок ее подгруппы является делителем порядка самой группы. Доказательство. Пусть cardG = n, card# = к. Рассмотрим левостороннее разложение группы G по подгруппе Н. Оно состоит из всех левых смежных классов аН, где а € G. Каждый класс аН состоит из всех элементов ah, где h € Н. Все элементы ah различны (так как если ahi = 0J12, то a~lahi = a~lah.2 и, значит, hi = h^), поэтому каждый класс аН состоит ровно из к элементов. Общее число смежных классов аН равно т < п. Таким образом, количество всех элементов группы G равно тк, т.е. п = тк. Симметрическая группа n-го порядка. Множество Sn (§8) всех подстановок (перестановок) n-го порядка образует мультипли- кативную группу как множество всех биективных отображений мно- жества на себя. Эта группа называется симметрической группой п-го порядка, ее порядок равен п!. Знакопеременная группа n-го порядка. Множество Ап всех четных подстановок n-го порядка образует мультипликативную груп- пу. Чтобы в этом убедиться, достаточно показать, что Ап — подгруппа симметрической группы Sn. Для этого проверим все условия теоре- мы 38.1. 1. Пусть / = 2 «2 2 ... п\ I € А, 02 ... (Зп) т.е. (01,02, • - •, оп) и (0i,02, • ,0п) - четные перестановки из первых п натуральных чисел. Покажем, что fg е Ап. Для этого запишем f в виде 101 02 0п\ \ 71 72 • • - 7п/ Тогда /1 2 ... п \ fg = \71 72 7и/ где (71,72, - •, 7п) - четная перестановка из первых п натуральных чи- сел, так как имеет одинаковую четность с перестановкой (0\ ,02,..., 0п).
142 Глава УШ. Элементы общей алгебры 2. Очевидно, что если п \ , € Ап, то / Группа Ап называется знакопеременной группой n-го порядка, ее порядок равен у, п > 2. Циклическая группа. Интересным примером подгрупп служат так называемые циклические подгруппы. Пусть а - элемент группы G, п € Z. Определим n-ю степень элемента а следующим образом: ' аа... а, п > О, п 1, П = о, , (a-1)"1, m = —п, п < 0. (39.1) Так как при m > 0 имеем (а 1)тпатп — 1, то из (39.1) следует, что а-тл = (а-1)”1 = (ат)-1. (39.2) В аддитивной группе вместо степеней элемента а говорят о крат- ных элемента а и обозначают символом па. Нетрудно проверить, что для любых m, n G Z anam=an+m, (39.3) (an)m = amn (39.4) (соответственно па + ma — (n + m)a, п(тпа) = (nm)a для аддитивной группы). Теорема 39.2. Множество {а} всех целых степеней эле- мента а группы G образует абелеву группу. Доказательство. Достаточно показать, что {а} - абелева под- группа группы G. Но это следует из теоремы 38.1 с учетом (39.2) и (39.3). Группа {а} называется циклической группой, порожденной эле- ментом а, при этом элемент а называется образующим элементом группы {а}. Очевидно, группа {а} является подгруппой любой другой подгруп- пы группы G, содержащей элемент а. Примером бесконечной циклической группы служит аддитивная группа целых чисел - всякое, число кратно числу 1, т.е. это число является образующим элементом рассматриваемой группы. Мульти- пликативная группа G, состоящая из двух чисел 1 и —1, является циклической группой, порожденной элементом —1. Теорема 39.3. Любая подгруппа циклической группы {а} является циклической.
§ 39. Конечная группа 143 Доказательство. Пусть Н - подгруппа циклической группы {а}, т.е. Н состоит из некоторых целых степеней элемента a: Н = = {afcl, акз,...}. Пусть, далее, т - наименьшее целое положительное число среди к1,кг,.... Очевидно, Н содержит все элементы вида акт, где к 6 Z. Докажем, что в Н не может быть других целых степеней элемента а. Пусть a71 € Н. Разделим п на т: п = тк + г, где т, г е Z, 0 < г < т. Тогда аг = апа~тк. Так как an С К, а~тк ц то ar е это противоречит тому, что т - минимальная положительная степень а, содержащаяся в Н. Порядок элемента. Степени элемента а с различными показаг телями не всегда различны, так в аддитивной группе целых чисел разные кратные нуля совпадают: кО — 10, к / Z; в мультипликативной группе ненулевых вещественных чисел: lfc = I1, к / I. Если все степени элемента а различны, то а называется элементом бесконечного порядка, в противном случае - элементом конечного по- рядка. Теорема 39.4. Если а - элемент конечного порядка, то су- ществует натуральное число п такое, что ап = 1 (в аддитивной группе: па = 0). Доказательство. Пусть а - элемент конечного порядка, т.е. существуют целые числа k, I такие, что ак = а1, к > I. Тогда ak~l = 1 и a” = 1, где п = к — I € N. Наименьшее п € N, для которого ап = 1, называется порядком элемента а. Теорема 39.5. Порядок элемента а группы совпадает с по- рядком циклической подгруппы {а}. Доказательство. Утверждение вытекает из того, что если по- рядок элемента а равен п, то степени о°,а',.. различны, а вся- кая другая степень совпадает с одним из этих элементов. Следствие 1. В конечной группе порядок любого элемента является делителем порядка группы. Следствие 2. Все конечные группы простого порядка являют- ся циклическими. Следствие 3. В конечной группе G порядка п ап = 1, Va € G. Теорема 39.6. Элемент ак является образующим элемен- том циклической группы {а} п-го порядка тогда и только тогда, когда кип взаимно просты. Доказательство. Пусть d = НОД(£,п) и п = dn', к = dk', п' < п, к' < к. Тогда элемент ак будет образующим элементом цикли- ческой группы {а} п-го порядка тогда и только тогда, когда порядок
144 Глава VIII. Элементы общей алгебры элемента ак совпадает с п. Так как (afc)n' = акп' = adk'n' = (ап)к‘ = 1, то порядок элемента ак будет совпадать с п тогда и только тогда, когда п' = п, т.е. тогда и только тогда, когда d = 1. § 40. Нормальный делитель Определения и свойства. Подгруппа Н группы G называется нормальным делителем, если для любого элемента а б G аН = На, (40.1) т.е. если любой левый (правый) смежный класс одновременно явля- ется правым (левым) смежным классом. Очевидно, что в абелевой группе любая подгруппа является нор- мальным делителем. Тривиальные подгруппы в любой группе также являются нормальными делителями: оба разложения по единичной подгруппе совпадают с разложением группы на отдельные элементы, оба разложения по самой группе состоят из одного класса - это сама группа. Укажем критерий нормального делителя для произвольной группы. Элементы а и b группы G называются сопряженными, если суще- ствует элемент с б G такой, что a = с-1Ьс. Теорема 40.1. Подгруппа Н группы G является нормаль- ным делителем тогда и только тогда, когда она вместе с каждым элементом содержит все сопряженные с ним элементы. Доказател ьство. Необходимость. Пусть Н - нормальный делитель, тогда согласно (40.1) Нс С. сН для любого элемента с б G. Это означает, что для любого элемента h б Н существует hi б Н такой, что he = chi, т.е. c~lhc = hi б Н. Достаточность. Возьмем произвольные элементы h б Н, с б G. Тогда c~lhc б Н и chc~l б Н. Это означает, что суще- ствуют элементы hi,h? б Н такие, что с-1/гс = hi, chc~L = hi, или he = chi, ch = hie. Значит, Нс С сН и сН С Нс, т.е. cH = = He. Примером нормального делителя в неабелевой группе является подгруппа матриц с определителем, равным единице, мультиплика- тивной группы невырожденных матриц n-го порядка, так как для эле- ментов этой подгруппы выполнено условие теоремы 40.1: если |Л | = 1, то \С~ 1АС| = |А| = 1 для любой невырожденной матрицы С. Фактор-группа. Из смежных классов по нормальному делителю может быть построена новая группа. Теорема 40.2. Смежные классы по нормальному делителю образуют группу относительно умножения подмножеств группы.
§41. Морфизмы групп 145 Доказательство. Покажем, что произведение смежных клас- сов по нормальному делителю является смежным классом. Действи- тельно, (аН)(ЬН) = { в силу ассоциативности произведения } — — а(НЬ)Н = { так как Н - нормальный делитель } — а(ЬН)Н = = аЬ(ЯЯ) = аЬН. Итак, (аЯ)(ЬЯ) = (аЬ)Я, (40.2) значит, умножение подмножеств группы является алгебраической операцией на множестве смежных классов по нормальному' делителю. Ассоциативность этого умножения уже известна (§38). Нейтральным элементом служит сама подгруппа Я, так как (аН)Н — (аН)(еН) — — (ае)Н = аН, Va € G. Обратным элементом к классу аН является класс а-1Я, так как (аЯ)(а-1Я) = (аа-1)Я — еН = Я. Группа смежных классов группы G по нормальному делителю Я называется фактор-группой группы G по подгруппе Н. Обозначение: G\H. Группа вычетов по модулю р. Вернемся к смежным классам аддитивной группы целых чисел по подгруппе Я чисел, кратных р. Как следует из §38 (пример 2 в таблице), фактор-группа 2|Я состоит ровно из р классов й совпадает с множеством Zp классов вычетов по модулюр (§7, пример 3). Алгебраическую операцию в Zp (т.е. произве- дение смежных классов) будем называть сложением, придерживаясь названия исходной операции в группе целых чисел. Согласно (40.2) суммой смежных классов СД+Сп является класс, который содержит сумму чисел т + п: Ст + Сп=Сг, где г = (пи-n)(modр). (40.3) Итак, Zp - аддитивная группа вычетов по модулю р. §41. Морфизмы групп Изоморфизм. Уже примеры конечных групп (§39) приводят к естественному выводу, что все группы (например, третьего порядка) обнаруживают большое сходство: алгебраические операции в них опи- сываются одной и той же таблицей умножения. Общий подход к вы- явлению различий или, напротив, к отождествлению групп основан на понятии изоморфизма. Две группы Gi и G? с операциями *j и *2 называют изоморфны- ми, если существует биективное отображение f : Gy —» Gz, которое сохраняет групповую операцию, т.е. /(а*16) = /(а) *2/(6), Уа, Ь 6 G\. Обозначение: G\ ~ G2. Само отображение / при этом называют изоморфизмом. Примеры. 1. Аддитивные группы целых чисел и четных чисел изоморфны, так как отображение f (n) = 2n, п € Z, есть изоморфизм. 2. Мультипликативная группа положительных вещественных чи- сел и аддитивная группа всех вещественных чисел изоморфны. В ка- честве изоморфного отображения f можно взять /(а) = In а. Извест-
146 Глава УШ. Элементы общей алгебры ное свойство логарифма Inad = Ina + Ind как раз моделирует условие изоморфизма. Отметим простейшие свойства изоморфизма. 1°. Отношение изоморфизма является отношением эквивалент- ности на множестве всех групп. Действительно, рефлексивность следует из того, что тождествен- ное отображение является изоморфизмом; симметричность - из того, что если / - изоморфизм, то /-1 (которое существует в силу биек- тивности /) также является изоморфизмом, так как /-1(а' *2 d') = = {а' = /(a), b' = /(d) в силу сюръективности /} = /^(/(а) *2 7(d)) = = {ибо f - изоморфизм } — /-1/(а *i Ь) — a *i d = /-1(а') /-1(d'); транзитивность - из того, что суперпозиция изоморфизмов, как легко проверить, также является изоморфизмом. 2°. В изоморфных группах Gi и G2 образ (и прообраз) единицы является единицей. Действительно, если a*ie = e*ia = а, то /(а)*г/(е) = 7(е)*г7(а) — = f(a). Отсюда с учетом того, что элементами /(а) исчерпывается вся группа G2 (в силу сюръективности /), следует, что /(е) = е' - еди- ница в G2. Следовательно, образом единицы е является единица е!. Значит, и прообразом единицы е' является е и, в силу инъективно- сти /, только е. 3°. В изоморфных группах G\ и G2 образ (и прообраз) обратного элемента является обратным элементом, т.е. /(а-1) = (/(а))-1. Доказательство этого факта аналогично доказательству свой- ства 2°, оно опирается на определение обратного элемента. Теорема 41.1 (теорема Кэли). Любая, конечная группа изоморфна некоторой группе перестановок на множестве своих эле- ментов. Доказательство. Пусть G = {go = е, 91,... ,gn-i} - группа п-го порядка. Построим отображение <р группы G на некоторое мно- жество S перестановок множества G, положив <p(g) = (род, gig, ..., gn-ig) для любого g € G. Так как группа G замкнута относи- тельно групповой операции, то gog, gig,... ,gn-i9 € G. Более того, эти произведения различны, так как из равенства g,g = g_,g в силу закона сокращения в группе следует, что g< — pj, т.е. i = j. Следо- вательно, gog, gig, . • •, gn-ig - перестановка элементов go, gi, • •, gn-i группы G, ip(g) - перестановка множества G: (9o 9i 9n-i \ 9o9 919 5n-i9/ и S - некоторое подмножество симметрической группы всех переста- новок множества G. Покажем, что у> - изоморфизм: 1) у - инъективно, так как если g / д' (д' € G), то д>(д) / ‘р(д') (хотя бы потому, что дод / додь так как до = е), т.е. различным элементам из G соответствуют различные перестановки из S;
§41. Морфизмы групп 147 2) ip сохраняет групповую операцию, так как /lx I 9® ‘ ' 9п-1 \ v" \до(дд') ... дАдд') gn-i(gg'y' .. . . / до • • • gi <?n~i \ / до • • д< • - gn—i ч>(д Мд) = , , , \soff - gig gn-ig / удод- -д^д---gn-ig дод gig gn—ig 1 / до gi - gn—i (дод)д' (дгд)д' (gn-ig)g'l \дод gtg- --gn-ig 9® • • • 9i • • • 9n~ I (дод)д' (gig)g' (gn-igW = ч>(дд)- Осталось отметить, что S - группа, т.е. подгруппа группы всех перестановок множества G. Это автоматически вытекает из того, что S - изоморфный образ группы G. Теорема Кэли выделяет семейство Sn,n = 1,2,... симметрических групп, в котором находятся с точностью до изоморфизма все конеч- ные группы. Теорема 41.2. Все бесконечные циклические группы изо- морфны аддитивной группе целых чисел. Доказательство. Если G - бесконечная циклическая группа с образующим элементом а, то соответствие ak I—► к будет взаимно однозначным отображением G —> Z. Изоморфность этого отображения вытекает из (39.3). Следствие. Все бесконечные циклические группы изоморфны между собой. Теорема41.2 выделяет аддитивную группу целых чисел, с которой с точностью до изоморфизма совпадают все бесконечные циклические группы. Для циклических групп конечного порядка такой объект бу- дет выделен в §46. Изоморфное отображение группы G на себя называется автомор- физмом. Несложная проверка показывает, что множество всех авто- морфизмов группы образует группу относительно суперпозиции ото- бражений. Гомоморфизм. Две группы Gi и G2 с операциями *i и *2 на- зывают гомоморфными, если существует сюръективное отображение <р : G\ -> G2, сохраняющее групповую операцию. Само отображение <р называется гомоморфизмом. Отметим простейшие свойства гомоморфизма. В гомоморфных группах
148 Глава VIII. Элементы общей алгебры 1) образом единицы является единица, т.е. <р(е) — е1, где е и е' - единицы групп G\ и Gi, 2) образом обратного элемента является обратный элемент к образу: = (у?(а))-1. Доказательства этих свойств повторяют доказательства аналогич- ных свойств изоморфизма. Отметим лишь, что к гомоморфизму от- носятся только первые части свойств изоморфизма. Пусть <р- гомоморфизм группы Gi на группу Gi. Множество кегу? = {а € (?1|у>(а) = е'} называется ядром гомоморфизма <р. Теорема 41.3. Нормальные делители группы, и только они, являются ядрами гомоморфизмов этой группы. Доказательство. Достаточность. Ядро гомоморфизма у> группы Gi является подгруппой группы Gi, так как для него выпол- нены оба условия теоремы 38.1: 1) если hi, hi kery>, то /i2) = <p(/ix) *2 <p(hi) = e! *2 e' = e', т.е. hi *i hi € kery; 2) если h € kery, то у>(Л.) = e' и, значит, = (e')-1 = e', т.е. /г-1 € kery>. Эта подгруппа является нормальным делителем, так как для нее выполнено условие теоремы 40.1: если h G кегу? и с € G, то у>(с-1 *i h *i с) — <р(с~1) *2 у?(/г) *2 у?(с) = у?(с-1) *2 <р(с) — у>(с-1 +1 с) = = уз(е) = е', т.е. с-1 *i h *i с € кегуз. Необходимость. Пусть Н - нормальный делитель группы G с операцией , покажем, что существует некоторая группа G' и не- который гомоморфизм у> : G —> G', ядром которого является под- группа Н. В качестве группы G' возьмем фактор-группу G\H группы G по нормальному делителю Н. В качестве гомоморфизма возьмем отображение ip : G —> G|H, которое каждому элементу а 6 G ставит в соответствие смежный класс аН, так что у?(а) = аН. Отображе- ние у? является гомоморфизмом, так как y>(ab) = (ab)H = {согласно (40.2)} = (аН)(ЬН) = y>(a)y>(i>), Va, b е G. Ядром этого гомоморфизма служит, очевидно, сам нормальный делитель Н. Построенное отображение у> : G —> G\H называется естествен- ным гомоморфизмом. § 42. Кольцо Определение, простейшие свойства. Перейдем к рассмотре- нию множеств, наделенных двумя алгебраическими операциями. Бу- дем называть одну из этих операций сложением (и обозначать симво- лом +), а другую - умножением (и обозначать символом ). Непустое множество К, наделенное двумя алгебраическими опе- рациями - сложением и умножением, называется кольцом, если эти операции удовлетворяют следующим аксиомам: Va,b,c€ К 1) а + Ь = 6+ а;
§ 42. Кольцо 149 2) (а + b) -f- с = а + (Ь + с); 3) 30 С АГ: а Ч- 0 — 0 4* а — а; 4) Va6 К 3 — а € К : а 4- (-а) = (—а) + а = 0; 5) (ab)c = а(Ъс)-, 6) (а + b)c = ab + Ъс, а(Ъ 4- с) = ab + ас. Кольцо называется коммутативным, если умножение в нем ком- мутативно; кольцо называется кольцом с единицей, если операция умножения обладает нейтральным элементом. Из аксиом кольца сле- дует, что кольцо является аддитивной абелевой группой. Очевидно, множества Z, Q, R образуют коммутативные коль- ца с единицей относительно обычных операций сложения и умно- жения чисел: множество всех четных чисел - коммутативное кольцо без единицы; множество RnXTl вещественных квадратных матриц п-го порядка - некоммутативное кольцо с единицей относительно извест- ных операций сложения и умножения матриц. Отметим простейшие свойства кольца, все они опираются на свой- ства множеств с одной ассоциативной операцией, и в частности, на свойства группы. 1°. Кольцо обладает всеми свойствами аддитивной абелевой груп- пы; в частности, в кольце: а) существует, и притом единственный, нулевой элемент 0; б) для каждого элемента а существует, и притом единственный, противоположный элемент —а; в) для любых элементов а, Ь е К существует, и притом единствен- ное, решение уравнения х + а = Ь; это решение называется разностью элементов Ь и а и обозначается символом Ь — а. Итак, b — а = Ь + (—а). г) определены целые кратные элемента (см. (39.1), (39.2)): ' a 4- a 4- ... 4- а, п > 0, па = п П _ 0, п = 0, . m(-a) = —(ma), m =-n, n < 0. 2°. В кольце умножение дистрибутивно относительно вычита- ния, т.е. a(b — с) = ab — ас, (а — Ь)с — ас — be, Va, Ь, с € К. Это следует из того, что b = (Ь — с) 4- с и ab = а(Ь — с) + ас. 3°. В кольце для любого элемента а: аО — Оа — 0. Это следует из дистрибутивности умножения относительно вычи- тания: аО — a(b — b) = ab — ab = 0. 4°. В кольце для любых элементов а, Ь: (—а)Ь = а(—b) = —аЬ. Это следует из того, что аЬ + (—а)Ь = (а + (—а))Ь = 0Ь = 0. Следствие. (-а)(—Ь) = ab, Va,b € К. 5°. В кольце с единицей для любого элемента а: (-1)а = а(-1) = -а. Это следует из того, что а 4- (— 1)а=1а+(—1)а = (14-(- 1))а=0а=0.
150 Глава УШ. Элементы общей алгебры 6°. В кольце с единицей, содержащем не менее двух элементов: 1/0. Действительно, если 0 = 1, то существует а С К: а / 0, а / 1. Тогда из равенства 0 = 1 следует, что Оа = 1а, т.е. 0 = а, но а / 0. 7°. В кольце с единицей множество обратимых (по умножению) элементов образует мультипликативную группу. Это следует из того, что произведение обратимых элементов обра- тимо, т.е. умножение в кольце является алгебраической операцией на этом множестве. Делители нуля. В кольце, как мы отмечали выше, алгебраиче- ские операции сложения, вычитания и умножения обладают свойства- ми привычных нам операций над числами. Однако кольцо обладает и специфическим свойством, которого нет в числовых множествах. Так, для чисел из равенства аЬ = 0 следует, что одно из чисел а или Ь рав- но нулю. В кольце это может и не выполняться. Например, в кольце матриц второго порядка существуют ненулевые матрицы, произведе- ние которых равно нулю: /1 0 \ / 0 0 \ / 0 0 \ 0 0 J 1 1 J - 0 0 J ' Ненулевые элементы а и b кольца называются делителями нуля, если ab = 0. При этом элемент а называется левым делителем нуля, а эле- мент Ь - правым. Кольцо вычетов. Рассмотрим аддитивную группу Zp = {Co,Cj, ...,Cp-t} вычетов по модулю р (§40). Напомним, что сложение на Zp определено правилом (40.3), т.е. Ст + Сп - это класс, в который входит число т + п. Известно, что Zp - группа относительно так вве- денной операции сложения (§40). Отметим, что это абелева группа, так как числа т + п и п -I- m входят в один и тот же класс. Отметим также, что нулем этой группы является класс Со чисел, кратных р, а противоположным к классу Ст ~ класс „ _ f Со , т = 0, Gm-\Cp_m, m>0. Определим на Zp операцию умножения. Положим СтСп = СТ , где г = mn (modp), т.е. СтСп ~ это класс, в который входит число тп. Эта операция обладает следующими свойствами: 1) CmCn = СпСт, так как СтСп - класс, в который входит пт, а тп = пт', 2) (CmCn)Cfc = Cm(CnCk), так как оба произведения представля- ют собой один и тот же класс, в который входит число (mn)fc — m(nk); 3) существует единица Ci, так как СтС\ - CjCm = Cm; 4) (Cm + Cn)Ck = CmCk + CnCfc, так как обе части равенства представляют собой класс, в который входит число (m -I- п)к — тк + 4- пк-,
§ 43. Поле 151 5) если р - составное число, то в кольце Zp есть делители нуля, так как если р = тпп, где 1 < т < р, 1 < п < р, то Ст,Сп € Zp и СтСп — С’о- Таким образом, Zp - конечное коммутативное кольцо с единицей, которое имеет делители нуля, если р - составное число. Оно называ- ется кольцом, вычетов по .модулю р. Подкольцо. Подкольцом кольца К называется подмножество F этого кольца, которое само является кольцом относительно операций, определенных в К. При этом говорят, что кольцо К является расши- рением кольца F, а кольцо F вложено в кольцо К. Так, кольцо Z целых чисел является расширением кольца Zjt чет- ных чисел и подкольцом кольца Q рациональных чисел. Легко показать, что множество F = {а + Ьх/2 | а, b € Z} является кольцом. Оно вложено в кольцо R. действительных чисел. § 43. Поле Определение, простейшие свойства. Полем называется ком- мутативное кольцо с единицей, содержащее не менее двух элементов, в котором каждый отличный от нуля элемент имеет обратный элемент. Из определения вытекают следующие свойства поля. 1°. Поле обладает всеми свойствами кольца. 2°. В поле нет делителей нуля, так как если ab — 0, а =4 0, то а- г(аЬ) = b = 0. Следствие. Умножение является алгебраической операцией на множестве всех ненулевых элементов поля. 3°. В поле Р множество всех ненулевых элементов образует мультипликативную коммутативную группу, и поэтому в поле: а) существует, и притом единственная, единица, причем 1^0; б) для любого элемента а 0 существует, и притом един- ственный, обратный элемент; в) для любых a,b € Р, а 0, уравнение ах = Ь имеет единствен- ное решение, при этом х = а~*Ь = Ьа~1; этот элемент называется частным от деления Ь на а и обозначается символом — или Ь/а. а 4° . В поле сохраняются все обычные правила обращения с дробя- а с bd ' b d bd' а = ~Ь ’ ми: (X С _1 _1 а) — = — <=> ad — be, так как равенство b а = cd 1 равносильно о d равенству 5(5-1a)d = b(cd-1)d, т.е. ad = be; а с ad ± be ас ас б) 7> ± Л = “ о а , — а а в) — = ~Ь
152 Глава VIII. Элементы общей алгебры Правила “6”, “в” доказываются так же, как и “а”. Тем самым все правила и формулы элементарной алгебры полно- стью сохраняются в любом поле, так как в их основе лежат одни и те же свойства операций сложения, вычитания, умножения и деления. Элементы поля называют числами. Очевидно, множества Q всех рациональных чисел и R всех действительных чисел являются полями. Расширение поля. Подмножество F поля Р называется подпо- лем поля Р, если оно само является полем относительно операций, определенных в Р. При этом говорят, что поле Р является расшире- нием поля F, а поле F вложено в поле Р. Так, поле R действительных чисел является расширением поля рациональных чисел. Еще одно расширение поля рациональных чисел можно получить, рассматривая числа вида а + Ъу/2 с рациональными а и Ь. Легко показать, что множество F = {a + dV2|a,i»GQ} образует поле. Очевидно, что поле Q является его подполем. Любое поле, элементами которого являются действительные числа с операциями сложения и умножения действительных чисел, будем называть числовым полем. Теорема 43.1. Поле рациональных чисел вложено в любое числовое поле. Доказательство. Пусть Р - поле, элементами которого явля- ются числа а € R. Если а 0, то Р содержит частное т.е. число 1. Складывая число 1 с самим собой несколько раз, цы получим, что все натуральные числа п содержатся в Р. С другой стороны, в поле Р должна содержаться разность п — п, т.е. число 0, поэтому в поле Р находятся и результаты вычитания 0 — п, п € N, т.е. все отрицатель- ные числа. Наконец, в поле Р содержатся и частные целых чисел, т.е. вообще все рациональные числа. В заключение отметим, что расширение поля R действительных чисел будет дано в §44. Изоморфизм колец и полей. Среди множества колец (и по- лей) встречаются кольца (соответственно поля), неразличимые с точ- ки зрения свойств действующих в них алгебраических операций. Эта “одинаковость” формализуется понятием изоморфизма. Два кольца К и К' (или два поля Р и Р') называются изоморф- ными, если существует биективное отображение <р: К —> К1 (соответ- ственно tp: Р Р1), сохраняющие операции: <р(а+Ь) = </?(а)+(р(6), у>(а6) = <р(а)<р(5), Va, be К (соответственно Г). Нетрудно показать (§41), что 1) отношение изоморфизма является отношением эквивалентности на множестве всех колец (и полей); 2) в изоморфных кольцах (и полях):
§ 43. Поле 153 а) образ и прообраз нуля есть нуль; б) образ и прообраз противоположного элемента есть противопо- ложный элемент; в) образ и прообраз разности есть разность соответствующих эле- ментов; г) образ и прообраз единицы (в случае кольца, если оно обладает единицей) есть единица; д) образ и прообраз обратного элемента (в случае кольца, если элемент обладает обратным элементом) есть обратный элемент; 3) свойство кольца иметь или не иметь делители нуля сохраняется и в изоморфном кольце. Из перечисленных свойств следует, что кольцо, изоморфное полю, само будет полем. Таким образом, изоморфные кольца (и поля) могут отличаться друг от друга только природой своих элементов, но они тождественны по своим алгебраическим свойствам: всякая теорема, доказанная для некоторого кольца (или поля) бу- дет справедлива ддя всех колец (соответственно полей), с ним изо- морфных, если только доказательство теоремы опиралось лишь на свойства алгебраических операций, но не на индивидуальные особен- ности элементов этого кольца (соответственно поля). Характеристика поля. Существуют поля, в которых некоторое целое кратное 1, т.е. nl — 1 + 1 + ... + 1, равно нулю. Наименьшее натуральное число п, обладающее этим свойством, называется харак- теристикой поля. Если указанное свойство не имеет места ни для какого натурального числа п, то говорят, что такое поле имеет харак- теристику 0. Очевидно, Q.R - поля характеристики 0. Примерами полей характеристики р > 1 служат все конечные по- ля. В самом деле, конечное поле является конечной аддитивной груп- пой, при этом характеристика поля р > 1, так как р совпадает с поряд- ком элемента 1, являющимся делителем порядка самой группы (§39, следствие 1). Теорема 43.2. Характеристикой поля может быть ли- бо 0, либо простое число. Доказательство. Пусть п- характеристика поля и п -состав- ное число, т.е. п = тк, где т, к € N, т < п, к < п. Тогда в силу дистрибутивности 1 + 1 4~ • • + 1 = (1 + 1 + • • + 1) (1 + 1 + ... + 1) — 0. n т k Так как в поле нет делителей нуля, то отсюда следует, что либо J + 1 + ... -г 1 = 0, либо 1 + 1 + ... + 1 = 0, т.е. п - не наименьшее m к натуральное число, обладающее указанным свойством.
154 Глава VIII. Элементы общей алгебры Теорема 43.3. Если Р - поле характеристики р, то для любого элемента а € Р имеет место равенство pa — Q. До к аз ате л ь ст во. В самом деле, из свойства дистрибутивности следует, что pa — а(р 1) = а-0 = 0. Поле вычетов. Кольцо вычетов Zp не будет полем, если р состав- ное, так как в этом случае в кольце Zp есть делители нуля (§42). Теорема 43.4. Если р - простое число и р > 2, то Zp - поле характеристики р. Доказательство. Покажем, что Zp - поле. Так как Zp - ком- мутативное кольцо с единицей (§42), то достаточно показать, что для любого элемента Ст е Zp, т / 0, существует обратный элемент. Для этого рассмотрим все возможные произведения СтСк , где к = 0,р — 1. Этих произведений имеется ровно р (т.е. столько же, сколько элемен- тов в Zp), и все они различны, так как из того, что СтСк = СтСп, к п, следует, что тк = mn(modp) или что тк — тп делится на- цело на р. Следовательно, m(fc - п) делится на р, причем 0 < т < р, 0 < к — п < р. Это означает, что р - составное число. Таким образом, произведения СтСк (к = 0,р - 1) по одному разу пробегают все мно- жество Zp и, значит, одно из них совпадает с С\. Итак, для любого класса Ст, где т / 0, существует класс Ск такой, что СтСк = Ci- Следовательно, Zp - поле. Характеристика этого поля равна р, так как Cj + С± + ... + С\ — Со > С\ -I- Ci 4-... + С\ — Ст Со при р тп т < р. Теорема 43.5. Любое поле характеристики р > 1 с точно- стью до изоморфизма является расширением поля вычетов Zp. Доказательство. В поле характеристики р элементы, крат- ные 1, т.е. элементы вида nl, где п = 0, р — 1, различны. Легко пока- зать, что эти элементы образуют подполе. Оно изоморфно полю выче- тов Zp = {Со,.. , Ср-1}: изоморфизм устанавливается отображением <p(n 1) = Сп, п — 0, р — 1. Следствие. Любое конечное поле с точностью до изоморфизма является расширением некоторого поля вычетов. Замечание. До сих пор при изучении алгебраических объектов мы предполагали, что в их основе лежат вещественные числа: веще- ственные матрицы, вещественные линейные пространства, веществен- ные системы линейных алгебраических уравнений, многочлены с ве- щественными коэффициентами. Все факты, касающиеся этих объек- тов, остаются справедливыми, если вместо поля вещественных чисел рассматривать любое поле. Это легко проверить, так как доказатель- ства таких утверждений опирались лишь на свойства алгебраических операций в поле.
§ 43. Поле 155 В дальнейшем вместо термина “вещественная матрица” будем употреблять термин “матрица над полем Р”, так же как и термины “линейное пространство над полем Р”, “система линейных алгебраи- ческих уравнений над полем Р", “многочлен над полем Р”. Этим замечанием мы воспользуемся уже сейчас для доказатель- ства следующей теоремы. Теорема 43.6. В конечном тюле число элементов п имеет вид п = рт, (43.1) где р - простое, т - натуральное числа. Доказательство. Любое конечное поле является полем харак- теристики р > 1. Так как у изоморфных полей одинаковое число эле- ментов, то согласно теореме 43.5 достаточно показать, что в конечном расширении поля Zp содержится п — рт элементов, где m £ N (оче- видно, р - простое число, так как Zp - поле). Покажем это. Пусть F = {ao,Oi,• • _ расширение поля Zp — {Co,Ci, ... ,Cp-i}. Очевидно, что поле F является линейным пространством над полем Zp. Пусть еj,...,ет - базис пространства F. Тогда F - множество всевозможных линейных комбинаций aiei 4-... 4- omem, а; е Zp, t = l,m. (43.2) Так как для каждого а» возможно р различных значений, то всего элементов вида (43.2) будет рт.
Глава IX. Комплексные числа В этой главе рассматривается новая система чисел, которая явля- ется расширением поля действительных чисел. Подобно известной из элементарной алгебры цепочке расширений N С Z с Q С R, каждое звено которой связано с необходимостью решения той или иной за- дачи, расширение поля действительных чисел связано с проблемой решения квадратных уравнений. Мы расширим поле действительных чисел так, чтобы любое квадратное уравнение, в частности простей- шее из них г2 + 1 =0, имело решение. Прежде чем вводить эти “новые” числа, отметим, что при каждом известном расширении “старые” чи- сла становились частью “новых”, т.е. отождествлялись с некоторым классом новых чисел. Например, натуральное число 5 отождествля- лось с целым числом +5 , или с рациональным числом |, или с дей- ствительным числом 4,9999... § 44. Поле комплексных чисел Понятие комплексного числа. Комплексными числами назы- ваются упорядоченные пары (а, Ь) вещественных чисел, для которых понятия равенства, суммы, произведения и отождествления с веще- ственными числами вводятся согласно следующим правилам (аксио- мам): 1) (a, b) = (с, d) <==> а = с, b = d; 2) (а,Ь) 4- (с,d)I = (а + с, b + d); 3) (а, 6) • (с, d) = (ас —bd, ad+ be)-, 4) пара (а, 0) отождествляется с действительным числом а. Обозначения: z — (a,b), С - множество всех комплексных чисел. Замечание 1. В первых трех аксиомах речь идет об определе- нии разных понятий, поэтому их сопоставление не может привести к каким-либо противоречиям. В несколько другом положении нахо- дится аксиома 4. Дело в том, что понятия равенства, суммы и про- изведения для вещественных чисел уже имеют определенный смысл и они не должны противоречить правилам 1-3. Но, как нетрудно проверить, правила 1-3 для вещественных чисел, как пар специаль- ного вида, совпадают с обычными правилами равенства, сложения и умножения вещественных чисел (проверьте!). Теорема 44.1. Множество С всех комплексных чисел явля- ется полем. Доказательство. Действительно, сложение и умножение явля- ются алгебраическими операциями на множестве С, при этом не- посредственной проверкой легко установить, что они подчиняются
§ 44. Поле комплексных чисел 157 всем аксиомам поля. Отметим лишь, что 0 = (0,0); 1 = (1,0); —z = а b = если 2 = (а,ft) 0. Следствие 1. Для любой пары, комплексных чисел z\ = (а, Ь), 22 — (с, d) существует, и притом единственная, разность z^ — Z2 = = (а — с, b — d). Следствие 2. Для любой пары комплексных чисел zi — (а, Ь), z2 — {c,d) / 0 существует, и притом единственное, частное z\ (ас + bd be — ad Z2 \ с2 + cP ’ с2 + d2 Алгебраическая форма комплексного числа. Введем обозна- чение: г = (0,1). Из аксиом 1-4 непосредственно вытекают следую- щие свойства комплексных чисел. 1°. г2 = —1, так как г2 = (0,1 )(0,1) = (—1,0) = —1. 2°. Любое комплексное число z = (а, 6) может быть записано в виде z = а т Ы, (44.1) так как z = (а, Ь) = (а, 0) + (О, Ь) — (а, 0) + (6,0)(0,1). Форма (44.1) записи комплексного числа z = (а, Ь) называется алгебраической формой числа z, при этом число а называется дей- ствительной частью комплексного числа z = а + Ы и обозначается символом Rez, а b - мнимой частью и обозначается Imz. Для ве- щественных чисел мнимая часть равна нулю. Комплексные числа, у которых действительная часть равна нулю, называются чисто мни- мыми. Очевидно, два комплексных числа равны тогда и только тогда, когда по отдельности равны их действительные и мнимые части. Комплексное число z = а — bi называется сопряженным к числу z = а + Ы. Теорема 44.2. Операция сопряжения комплексного числа обладает следующими свойствами: 1) z = z; 2) z = z <=> z € R; 3) z + z — 2а, Vz = а + Ы ; 4) zz = а2 + Ь2 , \/г — а + Ы; 5) Zj ± z2 = zf ± z^; zTz2 = zT2j; (zi/z2) = z^/zj, z2 / 0 . Все свойства проверяются непосредственно исходя из определе- ния. Замечание 2. Для комплексных чисел, заданных в алгебраиче- ской форме, операции сложения, вычитания, умножения и деления производятся по обычным правилам выполнения этих операций над двучленами а + Ы с учетом того, что г2 = — 1, и последующим приве- дением подобных членов (т.е. отдельно группируются вещественные числа и чисто мнимые). Особенно это удобно для умножения чисел:
158 Глава IX. Комплексные числа если zi = a + bi, Z2 = с + di, то zj Z2 = (a + Ы)(с + di) — ac + adi + + bci — bd = (ac — bd) + (ad + bc)i. Для деления чисел удобно числитель и знаменатель дроби Z1/Z2 предварительно умножить на zj: zj (a + bi) (с — di) Z2 Z2Z2 = {Z2Z2 = c2 + d2 / 0} = ac + bd be - ad c2 + d2 c2 + d21 Комплексная плоскость. Пусть на плоскости выбрана прямо- угольная декартова система координат. Поставим в соответствие каж- дому комплексному числу z = a + Ы точку Nf (рис. 1) этой плоскости с координатами (а, Ь). Очевидно, что это соответствие взаимно одно- значно. Вещественные числа изображаются точками оси абсцисс; на оси ординат располагаются изображения чисто мнимых чисел. Нача- лу координат соответствует число ноль; сопряженные комплексные числа изображаются точками, симметричными относительно оси аб- сцисс (рис.1). комплексные числа, Плоскость, точками которой изображаются называется комплексной плоскостью, ее ось абсцисс - вещественной осью, ось ординат - мнимой осью (в соответствии с наименованием чисел, изображения которых лежат на этих осях). Простое геометрическое истолкование получают на комплекс- ной плоскости операции сложения и вычитания комплексных чисел. Так как каждая точка М(а, Ь) плоскости связана с ее радиус-вектором г = {а, 5}, то комплексное число z = а + bi можно изображать на ком- плексной плоскости радиус-вектором точки M(a,b). При сложении (вычитании) комплексных чисел zi = a + bi и z2 — с + di склады- ваются (вычитаются) координаты радиус-векторов гДа, 6} и г2{с, точек, изображающих эти числа. Поэтому сложение (вычитание) ком- плексных чисел равносильно сложению (вычитанию) радиус-векторов (рис. 2) и может быть выполнено по правилу параллелограмма (§11). Геомегрический смысл умножения и деления комплексных чисел станет ясным из другой формы комплексного числа.
§ 45. Тригонометрическая форма комплексного числа 159 Сопряженная матрица. Пусть А — € Cmxn - матрица размера m х п над полем комплексных чисел. Матрица Ан = (af) размера n х m называется сопряженной к матрице Л, если = aji, i = l,n, j = Очевидно, что Ан = (А)т = (Лг), где А = (aij). Из определения и теоремы 44.2 вытекают следующие свойства сопряженной матрицы: 1) (А + В)н =АН +ВН, 2) (аА)н = аАя, Va € С; 3) (АВ)Н = ВНАН; 4) (Ая)я = Л____ 5) det Ан — det Л; 6) rg Ан = rg Л, выполненные для всех матриц, для которых определены левые части равенств. Замечание 3. Ранее был изложен способ построения поля С комплексных чисел как расширения поля R действительных чисел. Помимо этого способа суще- ствуют и многие другие. Один из них использует сложение и умножение матриц. Опишем его. 1. Множество матриц" вида J над полем действительных чисел обра- зует поле относительно операций сложения и умножения матриц. Обозначим его символом С'. Итак, с' = {[-ь 2. Множество Л' = {[5 2]i*eR} образует подполе поля С. 3. Поле С комплексных чисел изоморфно полю С, изоморфизм строится как отображение <р: С -> С, которое любому комплексному числу z = а + Ы ставит в соответствие матрицу ‘p(z) = Отображение ср переводит все вещественные числа а 6 R в скалярные матрицы ср(а) = [о д]. все мнимые числа Ы, b е R, - в матрицы </>(bi) = q|, в частности <p(i) = [д о] • Таким образом, поле комплексных чисел можно рассматривать и как поле дей- Г а bl ствительных матриц вида l , в котором роль действительных чисел играют Га 01 Г 0 11 матрицы вида q , роль мнимой единицы - матрица q . § 45. Тригонометрическая форма комплексного числа Алгебраическая форма комплексного числа z — а + Ы связана с декартовыми координатами точки М(а, Ь), изображающей это число на комплексной плоскости. Однако положение точки на плоскости од- нозначно определяется и ее полярными координатами (§25): расстоя- нием г от этой точки до начала координат и углом между положи- 6 Линейная алгебра и аналитическая геометрия
160 Глава IX. Комплексные числа тельным направлением оси абсцисс и радиус-вектором точки M(a.b) (рис. 1). В соответствии с этим вводятся следующие характеристики комплексного числа. Модулем комплексного числа z = a -f- bi называется число г = = Ч- Ь2 . Обозначение: |z|. Из определения вытекают следую- щие свойства. 1°. |z| - действительное неотрицательное число, причем |z| = 0 <=> z = 0. 2°. |z| совпадает с полярным радиусом точки М, изображающей это число на комплексной плоскости (рис. 1). 3°. |z| - \/z3. 4°. Модуль вещественного числа совпадает с абсолютной величи- ной этого числа. Аргументом комплексного числа z Ф 0 называется угол у между положительным направлением оси абсцисс и радиус-вектором точ- ки М. (рис. 1), отсчитываемый от оси абсцисс в любом направлении, при этом положительным считается направление против часовой стрелки. Обозначение: argz. Из определения вытекают следу- ющие свойства. 1°. arg z не определен для z — 0, а для z / 0 определен с точностью до слагаемого, кратного 2тг, так как при одном и том же г углы, отличающиеся на слагаемое 2тгк, где к £ Z, определяют одну и ту же точку комплексной плоскости, т.е. одно и то же комплексное число. 2°. arg z отличается от полярного угла точки М тем, что argz имеет бесконечно много значений. 3°. Два комплексных числа z\ и z2 равны тогда и только тогда, когда |zi| = |z2| и, если Izil^O, . argzj = argz2 + 2тгк, к € Z. ' ' ' Теорема 45.1. Любое комплексное число z 0 может быть записано в виде z = r(cos<р + isin <р), (45.2) где г — |z|, = argz .
§ 45. Тригонометрическая форма, комплексного числа 161 Доказательство. Пусть z = a 4- bi. Тогда из соотношений (25.1), связывающих прямоугольные координаты с полярными, сле- дует, что a — т cos <р, b = г sm<p и z = г (cos 4- i sin </>). Форма (45.2) записи комплексного числа называется тригономет- рической формой этого числа. Теорема 45.2. Для любых комплексных чисел zj и z-^ име- ют место неравенства ||*11 - |*2|| < 1*1 ± *з| < |*1| + |*г| • (45.3) Доказательство. Неравенства (45.3) вытекают из правила параллелограмма сложения и вычитания комплексных чисел (§44) и неравенств треугольника (рис. 2: ДОМ2М3, ЛОМ1М2). Это обосно- вание относится к случаю, когда точки О, Mi, М2 не лежат на одной прямой (очевидно, при этом неравенства (45.3) будут строгими). Если же точки О, М\, Мг лежат на одной прямой, то несложный перебор вариантов расположения этих точек приводит к неравенствам (45.3), которые в некоторых из этих вариантов могут обратиться в равен- ства. Неравенства (45.3) называют неравенствами треугольника на комплексной плоскости. Отметим, что теорема 45.2 относится только к модулям; для самих комплексных чисел неравенство не определено. Теорема 45.3. При умножении комплексных чисел их мо- дули умножаются, а аргументы складываются; при делении ком- плексных чисел их модули делятся, а аргументы вычитаются: |*1*г| = |*i||*2|, argZ!Z2 =argzi +argz2; (45.4) — = 1—г, arg— = argzx -argz2, *2^0. (45.5) *21 |*г| *2 Доказательство. Пусть z* = гДсозу»* 4- isin<pk), где k = 1,2. Тогда z\Z2 — rir2((cos</3i cos</?2 — siny?i siny>2) + z(siny?i созс^г + H-cos^i sin^)) — O^cos^i -I- 922) + zsin(sPi 4- ^2)) • Отсюда следует г , n *1 r^coscpi 4-isin^i) cos9?2 — isin9?2 (45.4). Если z2 / 0, то — = —--------—-----г -------—.---- = z2 T2(cos <p2 4-1 sm <£>2) cos y>2 — г sm <£2 = —(cos(<pi - <^2) 4- zsin(ipi - у’г))- Отсюда следует (45.5). r2 Замечание 1. Если один из сомножителей в (45.4) или z\ в (45.5) равен нулю, то теорема относится только к модулям. Замечание 2. Соотношения (45.4) переносятся и на любое число сомножителей (достаточно применить метод математической индук- ции).
162 Глава IX. Комплексные числа § 46. Возведение в степень и извлечение корня Возведение в степень. Пусть n € Z и z € С. Число zn, опреде- ленное равенствами zn = z-z - ...-z при n € N; zn = 1 при n = 0 (в n этом случае предполагается, что z 0); zn = \/zm при m = —n € N, называется п-й степенью числа z. Теорема 46.1. Если z = r(cos<p 4- isin<p), n € Z, mo zn = rn (cos тир 4- i sin nip). (46.1) Доказател ьство. Для n € Nравенство (46.1) вытекает из (45.4). Для n = 0 равенство (46.1) следует из определения: z° = 1 = r°(cos0+ + i sin 0). Если n < 0 и n - -m, m € N, то zn = — = —;------------------r — rn(cosmtp — i sin nup) = zm rm (cos mip _|_ i sm m(p j — rn(cos(—m<p) 4- zsin(-7n<p)) = rn(cosn<p -I- isinn<p). Формула (46.1) называется формулой Муавра. Извлечение корня. Пусть п € N. Корнем п-й степени из ком- плексного числа z называется число а € С такое, что ап — z. Очевидно, что для z = 0 существует единственный корень п-й степени, равный нулю (так как ап — 0 <=> |а|" =0 <=> а — 0). Теорема 46.2. Для ненулевого числа z — r(cos<p + г sin ф) существует ровно п различных корней оц, 012, • •, оп п-й степени: (p + 2zrk . . <p + 2irk\ , ------- ак — фт I cos —-----------I- г sm —-----I , к = 0, n - 1. (46.2) \ n n / Доказательство. Пусть a - корень п-й степени из числа z и а = p(cos# 4- isin#). Тогда о" = z или, в силу (46.1), pn(cosn0 4- 4- island) = r(cos<p 4-isinip). Согласно (45.1) это означает, что рп = г, nd = ip + 2irk, А е Z. Так как р > 0, г > 0, то существует единственный положитель- ный корень п-й степени р из положительного числа г - это арифме- тический корень р = \/г. Таким образом, число а = p(cos 6 4- г sin 6) является корнем п-й степени из числа z тогда и только тогда, когда г- „ <р 4- 2тгА , _ р = у/г, d = ---------------, к е Z, п <р + 2як . . 4- 2кк\ , _ т.е. числа ак = vH c°s-F г sin---- , к € Z, и только они, \ п nJ являются корнями п-й степени из числа z. Числа ак для к — 0, п — 1
§ 46. Возведение в степень и извлечение корня 163 различны, так как их аргументы отличаются самое большее на 2л(п - 1) тт -------- < 2л. Числа at при к > п совпадают с одним из корней п с*о, аь , an- j, так как если k = nq-\-r,0<r<n — 1, то + 2тгк <р + 2nnq + 2тгг + 2тгг „ -------- = ------------ = ---------1- 2irq, qtZ. n n n Следовательно, ak — ar. Геометрическая интерпретация корней. На комплексной плоскости все корни n-й степени из ненулевого числа z расположе- ны на окружности радиуса р — \/|2| и делят эту окружность на п равных частей (так как argot — wgotk-i + 2тг/п). В частности, все корни n-й степени из единицы имеют вид Ek = cos---Ь i sin-, к = 0, n - 1. (46.3) n n Они расположены на единичной окружности и делят ее на п рав- ных частей, начиная с eq = 1. При этом действительных корней может быть либо два, если п четно (е0 и еп/2), либо один, если п не- четно (е?о)- В любом случае недействительных корней четное число, они расположены симметрично относительно действительной оси, т.е. попарно сопряжены. Теорема 46.3. Все корни n-й степени из комплексного чи- сла 2^0 получаются умножением одного из этих корней на все корни n-й степени из единицы. Доказательство. Пусть at, к = 0,п — 1, - корни n-й степени из z = r(cosy> + isin<p), определяемые равенством (46.2). Тогда, со- гласно (45.4) и (46.3), afc£o = afc, afc£i = at+i, •. , ак£п-к = a0,... , vГруппа корней n-й степени из единицы. Рассмотрим множе- ство Нп = {£q,£i, • •, еп-1} всех корней n-й степени из единицы. 1. Нп - абелева мультипликативная группа, как подгруппа муль- типликативной группы ненулевых комплексных чисел (согласно тео- реме 38.1). 2. Н„ - циклическая группа, порожденная корнем £j, так как £fc = ef. Более того, этой группой исчерпываются по существу все конечные циклические группы порядка п (это было обещано в §41). Теорема 46.4. Все циклические группы порядка п изоморф- ны мультипликативной группе корней n-й степени из единицы. Доказательство. Пусть а - образующий элемент циклической группы G. Построим изоморфизм. Каждому элементу afc € G, 0 < к < п, поставим в соответствие корень Ek п-й степени из единицы. Это будет взаимно однозначное отображение группы G на мультипли- кативную группу Нп корней n-й степени из единицы, изоморфность которого следует из (39.3).
164 Глава IX. Комплексные числа Корень Ek называется первообразным корнем, п-й степени из еди- ницы, если он не является корнем из единицы никакой меньшей степе- ни, чем п. Очевидно, для любого п > 2 число ед - первообразный ко- рень. Помимо d могут существовать и другие первообразные корни. Например, при п = 4: — {1, г, —1, —г} и £3 = —г также является первообразным корнем, так как £° = 1, £3 = —г, = — 1, £3 — г. Теорема 46.5. Корень е п-й степени из единицы является первообразным корнем тогда и только тогда, когда его степени Ек, к = 0, п - 1, различны. Доказательство. Необходимость. Пусть Ек = е1 при 0<к<1<п-1. Тогда е1~к — 1, где 1<1-к<п-1. Следо- вательно, £ является корнем из единицы меньшей степени, чем п. Достаточность. Пусть £ - не первообразный корень. Тогда существует к < п такое, что ек = 1 = £° и степени е°, е1, ..., £п-1 не будут различными. Следствие 1. Корень е п-й степени из единицы является пер- вообразным корнем тогда и только тогда, когда он будет образую- щим циклической группы Н всех корней п-й степени из единицы. С л едствие 2. Корень Ek & Н п-й степени из единицы являет- ся первообразным корнем тогда и только тогда, когда кип взаимно просты (см. теорему 39.6). Таким образом, число первообразных корней п-й степени из едини- цы равно числу целых положительных чисел к, меньших п и взаимно простых с ним. Если р - простое число, то первообразными корнями будут все корни, кроме единицы.
Глава X. Многочлены над произвольным полем В §13 и 31 уже упоминались многочлены с вещественными коэффициентами в связи с линейными пространствами, а также в связи с алгебраическими линиями и поверхностями. В этой главе многочлены будут основным объектом изучения. Начнем с алгебраических (формальных) свойств многочленов без учета того, что многочлен является не только формальным выражением, но также и функцией. § 47. Кольцо многочленов Пусть Р - поле. Многочленом (полиномом) n-й степени от пере- менной х над полем Р называется выражение ао + очх + а2х2 Ч--\-апхп, (47.1) где а,, г = 0, п, — фиксированные числа из поля Ри ап 0. Эти числа называются коэффициентами многочлена, а число ап — старшим ко- эффициентом. Число 0 € Р по определению считается многочленом с нулевыми коэффициентами и называется нулевым многочленом. Сте- пень нулевого многочлена не определена. Многочлен обозначается символом f(x) или /n(z), степень много- члена /(т) - символом deg/, множество всех многочленов от пере- менной х над полем Р - символом P[zJ. Итак, Л1) = X akxk е Р[х], deg / = п. к=0 Замечание 1. Выражения z, z2,.... zn не несут смысловой нагрузки (пока), они должны восприниматься как символы. Таким образом, на многочлен (47.1) следует смотреть как на некоторое формальное выражение, вполне определяемое набором своих коэффициентов до,ai,...,ап, где ап 0. Два многочлена f{x),g(x) € Р[х] называются равными, если рав- ны их коэффициенты при одинаковых степенях переменной х. Обозначение: f(x) = g(x). Из определения следует, что нулевой многочлен равен только нулевому многочлену, а для ненулевых мно- гочленов /(z) = Y^k=oakxk и g(x) = ^2k=o^kxk равенство f(x) = g(x) означает, что deg / = degд = п; а, — bi, i = 0, n. (47.2) Равенство многочленов, определенное здесь, означает тождественное равен- ство, и мы будем называть его формальным в отличие от равенства многочленов как функций. В §49 будет доказана равносильность этих определений равенства.
166 Глава X. Многочлены над произвольным полем Введем на множестве Р[т] алгебраические операции. Суммой многочленов /(z) — и 9(х) — 22fc=o^3;fc назы- вается многочлен max(n,s) h(x) = ^2 ckxk> где ck=ak+bk. (47.3) k=0 Здесь недостающие коэффициенты ak или bk заменяются нулями. Обозначение: f{x) + g(x). Из определения вытекают следующие факты. 1°. Для любого многочлена /(z) € P[z] f(x) + 0 = 0+ f(x) = /(z). (47.4) 2°. Для ненулевых многочленов /(z), g(x), /(z) + g(z) deg(/ + g) < max (deg f, deg g). (47.5) 3°. Если /(z),g(z) e P[z], to /(z) + g(z) € P[z], т.е. сложение многочленов является алгебраической операцией на множестве P[z]. Произведением многочленов /(z) = 52*=о и 9(х) — zLfc=o bk%k называется многочлен h(z) = ^2cfczfc, где ск = У2 o,jbj, к = Q,n+я. (47.6) к=0 i+j=k Здесь суммирование в 52i+j=fc ведется по всевозможным индек- сам i и j, для которых i + j = к. Обозначение: /(z)g(z). Из определения вытекают следующие факты. 1°. Произведение ненулевых многочленов не может быть нулевым, при этом deg fg = deg / + deg g. (47.7) 2°. Если /(z),g(z) € P[z], to /(z)p(z) € P[z), т.е. умножение мно- гочленов является алгебраической операцией на множестве P[z]. 3°. Операция умножения многочленов порождает операцию умно- жения многочлена на число из поля Р как частный случай умножения многочленов: если /(z) = акхк и а 6 Р, то o/(z) = ^aafcZ^; (47.8) *=о таким образом, на множестве P[z] определен и внешний закон компо- зиции.
§47. Кольцо многочленов 167 Теорема 47.1. Множество Р[х] всех многочленов над по- лем Р является коммутативным кольцом с единицей и без делите- лей нуля. Доказательство. Проверим все аксиомы кольца (§42). Прежде всего отметим, что Р[х] - аддитивная абелева группа: коммутатив- ность и ассоциативность сложения очевидны (в силу (47.3)), нулем является нулевой многочлен (как отмечено в (47.4)), противополож- ным к многочлену f(x) = SZ=oafca:*’ как легко проверить, является многочлен — /(х) = J2J=O(—afc)xfc. Коммутативность умножения сле- дует из определения. Докажем ассоциативность умножения. Пусть /п(*) = Ek=o akxk> 5a(z) = ELo Ььх>С’№ = E£=o ckxk-Обозначим через Ofc, Pki и &k коэффициенты при xk у многочленов /(x)g(x), g(x)h(x), (/(x)g(x))/i(x) и /(x)(g(x)h.(x)) соответственно. Тогда в си- лу (47-6) 7fc= 52 G*^ = 12 ( 12 arbt)Cj= 52 arbtCP Фс = 52 = 52 (12 )= IL arbtc^ г-i-i—k r+i=k 4+j=i r+t+j = k re. 7^ = <5fc. Отсюда, если учесть, что deg(/g)/i = deg f(gh) = n + s+p, следует равенство (/(x)p(x))/i(x) = /(x)(<?(x)/i(x)). Роль единицы при умножении многочленов играет число 1, рас- сматриваемое как многочлен нулевой степени. Справедливость аксиомы дистрибутивности вытекает из равен- ства, Sl+j=k(ai + bi)ci = Y,i+j=kaicj + E»+j=fckcj> так ка-к левая часть этого равенства является коэффициентом при хк в многочлене (/(х)+р(х))Л(х), а правая часть - коэффициентом при той же степени х в многочлене /(x)/i(x) + p(x)?i(x). Наконец, из (47.7) следует, что в Р[х] нет делителей нуля. Следствие. Множество Р[х] является линейным пространс- твом над полем Р. Это следует из того, что любое кольцо по сло- жению - абелева группа; что же касается внешнего закона компози- ции (47.8), то его дистрибутивность относительно сложения является частным проявлением общего закона дистрибутивности в кольце Р[х), а справедливость других аксиом умножения на число очевидна. Замечание 2. Произведение (47.6) многочленов f(x) и g(z) может быть получено обычным для элементарной алгебры перемножением двух сумм (до + + а^х + • • + anxn)(bo + bi® + • • • + Ь3х‘} с последующей группировкой одночленов одинаковой степени. Это следует из общего закона дистрибутивности и из того, что многочлены /(г) и д(х) можно рассматривать как суммы многочленов. Замечание 3. Кольцо Р[х) не является полем, так как не всякий многочлен f(x) € Р[х) обладает обратным многочленом f~l(x). Действительно, равенство f(x)f~l(x) = 1 с учетом (47.7) означает, что многочлены нулевой степени, и только они, обладают обратными.
168 Глава X. Многочлены над произвольным полем § 48. Деление многочленов Кольцо Р[х] всех многочленов над полем Р по своим свойствам близко к кольцу Z всех целых чисел. Эта аналогия проявляется и в том, что для многочленов, как и для целых чисел, имеют место понятия деления нацело, деления с остатком, делителя, наибольшего общего делителя и др. Теорема 48.1. Для любых двух многочленов /(х), д(х) € Р[х], где д(х) / 0, существует, и притом единственная, пара многочле- нов q(x),r(x) € Р[х] такая, что: f(x)=g(x)q(x)+r(x), , . где либо г(х) — 0, либо deg г < deg g. ' ' ' Доказательство. Докажем первую часть теоремы. Будем счи- тать, что /(х) Д 0, так как в противном случае можно положить q(x) = 0, г(х) = 0. Пусть /(х) = "£2=йакхк, g(x) = ^=obfcxfc, deg/ = n, degg — s. Без ограничения общности считаем, что п > s, так как в противном случае можно взять q(x) = 0 и г(х) = /(х). Применим метод математической индукции по степени п многочлена f(x), считая д(х) фиксированным. 1. Пусть п = 0. Тогда з = 0 и q(x) = aobg1, т(х) = 0. 2. Пусть теперь теорема верна для любого многочлена степени меньшей п. Докажем ее для многочлена /(х) степени п > з. Воспроиз- ведем первый шаг известного из элементарной алгебры алгоритма де- ления многочленов с действительными коэффициентами, т.е. постро- им одночлен ——хп~5 и составим разность о» /Дх) =/(х) - ^хп-д(х). (48.2) Либо многочлен /Дх) равен 0, либо deg/i < п. В первом случае мож- но положить д(х) = -^xn-s, г(х) = 0. Во втором случае для много- Од члена /Дх) по индуктивному предположению найдутся многочлены дДх) и т(х) такие, что /Дх) — g(x)qi(x) 4-г(х), где либо т(х) — 0, либо degr < degg. Тогда, согласно (48.2), /(х) = ^-xn-sg(x) + д(х)дДх) + G + r(x). Положив q(x) = -р-хп~я + дДх), приходим к паре многочленов д(х),г(х) € Р[х], удовлетворяющей условиям (48.1). Остается доказать единственность. Пусть существует еще одна пара многочленов дДх),гДх) 6 Р[х], удовлетворяющая условиям (48.1). Тогда /(х) - g(x)q(x) + г(х) и /(х) = д(х)дДх) 4-гДх), т.е. g(x)(q(x) - qx(x)) = гДх) - г(х). (48.3)
§ 48. Деление многочленов 169 Если ri(i) - г(х) 0, то и q(x) — 91 (т) / 0, при этом степень правой части равенства (48.3) меньше з (в силу (47.5) и (48.1)), а левой части - не меньше з (в силу (47.7)), что невозможно. Следовательно, гДх) — г(х) = 0, а так как в кольце Р[х] нет делителей нуля, то и q(x) — qi(x) — 0. Таким образом, г(т) = ri(z) и q(x) = qi(x). Заметим, что доказанная теорема очень похожа на соответствую- щую теорему о делимости целых чисел. По аналогии с целыми числа- ми многочлен д(х) называется частным (или неполным частным ) от деления /(т) на д(х), а г(х) - остатком от этого деления. Если г(т) = 0, то говорят, что /(т) делится (или нацело делится) на д(х), при этом д(х) называется делителем f(x). Очевидно, делителями лю- бого многочлена f(x) будут все многочлены нулевой степени и все многочлены вида otf(x), где а 0. Многочлен 99(1) называется общим делителем многочленов f(x) и д(т), если он является делителем каждого из них. Очевидно, все мно- гочлены нулевой степени - общие делители любой пары многочленов. Многочлены, не имеющие других общих делителей, кроме многочле- нов нулевой степени, называются взаимно простыми. Многочлен d(x) называется наибольшим общим делителем нену- левых многочленов f(x) и д(х), если: 1) d(x) - общий делитель многочленов f(x) и д(х); 2) d(x) делится на любой общий делитель многочленов f(x) и д(х). Обозначение: НОД(/,д). Очевидно, если d(x) = НОД(/, <7), то ad(x) = НОД (/, д) для любого а ± 0. Теорема 48.2. Для любой пары ненулевых многочленов f(x), д(х) € Р[х] существует наибольший общий делитель. Он опре- делен однозначно с точностью до множителя нулевой степени. Доказательство. Приведем описание алгоритма построения НОД (/,<?), называемого алгоритмом Евклида или алгоритмом по- следовательного деления. Он состоит в следующем. Выполним цепочку делений с остатком согласно теореме 48.1: f(x) = 9(x)qi(x) + n(x), deg 74 < deg <7, 5(т) = ri (x)q2(x) +r2(z), deg 74 < deg 74, ri(x) = r2(x)q2(x) +r3(z), deg 7-3 < deg 74, 74—3(2:) = rfc_2(z)9fc_i(z) -Ык-Дх), degrjt-i < degrfc-j гь-2(х) = rfc_i(x)gfc(x) + rfc(x), , rk-i(x) = rfc(x)gfc+i(z). degrfc < degTfc-x, (48.4) Степени остатков понижаются, поэтому процесс оборвется в тот момент, когда деление выполнится нацело. Пусть гДх) - последний отличный от нуля остаток. Покажем, что г^(х) — НОД (/,5). Действи- тельно, просматривая равенства (48.4) снизу вверх, заключаем, что гДх) является делителем г*._1(х), 74-2(1), • , т-1(т), g(x), f(x), т.е. общим делителем f(x) и д(х). Просматривая равенства (48.4) сверху
170 Глава X. Многочлены над произвольным полем вниз, заключаем, что все остатки г\(х), г?(х), ... , rjt(x) делятся на любой общий делитель f(x) и д(х). Докажем вторую часть теоремы. Положим di(x) — НОД (/,<?), d2(x) = НОД (/,5). Тогда, согласно определению НОД (/,<?), di(x) = = d,2(x)qt(x), di(x) = di(x)q2(x) и, с учетом (47.7), degdi > degd2, deg da > degdi. Следовательно, degdi = deg da и многочлены di(x) и d2(x) отличаются лишь множителем нулевой степени. § 49. Корни многочленов До сих пор мы рассматривали многочлен как формально-алгебраи- ческое выражение. Вместе с тем многочлен /(х) можно рассматри- вать и как функцию от переменной х. Если f(x) = о\хк - многочлен над полем Р, с - некоторое число из поля Р, то число /(с) = 52?=о afcC* называется значением многочлена f(x) при х = с. Известно (из теории функций), что две функции называются рав- ными, если их значения равны при всех значениях переменной. Оче- видно, что если многочлены f(x) и д(х) равны как многочлены (см. (47.2)), то они равны и как функции. Однако обратное утверждение потребует дополнительных исследований и будет доказано позже. По- ка же, забегая вперед, будем иметь в виду, что оба подхода к понятию равенства многочленов совпадают. То же относится и к операциям над многочленами: сложение и умножение многочленов, определенные в §47, превращаются в сложе- ние и умножение функций, так как если <р(х) = f(x) + д(х), •ф(х') = = f(x)g(x), то <^(с) = /(с) 4- д(с), ^(с) = f(c)g(c}, Vc € Р. Корнем многочлена /(х) € Р[х] называется число с € Р такое, что Дс) = 0. Теорема 49.1 (теорема Безу). Остаток от деления мно- гочлена f(x) на х — с равен f(c). Доказательство. Разделим согласно теореме 48.1 многочлен f(x) на многочлен х — с. Тогда f(x) = (х — c)q(x) + г(х), где degr < < deg(x—с) = 1, так что г(х) — г - константа. Рассматривая значения обеих частей этого равенства при х = с, получим, что г = /(с). Следствие . Число с € Р является корнем многочлена f(x) € Р[х] тогда и только тогда, когда многочлен f(x) делится на х — с в кольце Р[х]. Алгебраическая замкнутость поля С. До сих пор все поля мы считали равноправными. Однако в вопросе существования корней многочлена это далеко не так. Поле Р называется алгебраически за- мкнутым, если любой многочлен /(х) € Р[х] степени п > 1 обладает в Р хотя бы одним корнем. Очевидно, что поле действительных чисел R не является алгебраически замкнутым, так как многочлен х2 +1 не имеет действительных корней.
§ 49. Корни многочленов 171 Теорема 49.2 (основная теорема алгебры). Поле С ком- плексных чисел алгебраически замкнуто. Эта теорема называется “основной” по традиции, установившейся с тех времен, когда проблема решения алгебраических уравнений бы- ла главной проблемой в алгебре (впервые теорема доказана Гауссом в 1799 г. для частного случая). Теперь же она относится к числу ря- довых утверждений, хотя и очень важных. Во всяком случае, на ней основана вся дальнейшая теория многочленов. И тем не менее эта те- орема не является чисто алгебраической. Все ее доказательства (а их после Гаусса найдено довольно много) в той или иной мере опираются на другие разделы математики. Мы приведем одно из них, наиболее алгебраическое из доступных нам. Для этого потребуются дополни- тельные понятия и факты. В приводимых ниже леммах, если не оговаривается особо, f(z) = = ао a^z 4----F anzn — многочлен над полем комплексных чисел от комплексной переменной z. Лемма 1. Пусть f(z) = a\z 4- a2z2 4- - • 4- OnZn - многочлен с нулевым свободным членом. Тогда для любого е > 0 найдется <5 > О такое, что для все:? z, для которых \z\ < <5, выполняется неравен- ство |/(z)| < е. Доказательство. Пусть |z| < 1. Тогда в силу (45.4) и (45.3) |/(z)| = |z| |ei + a2z + ••• 4-anzn-1| < |z| (|ai| + |a2| 4-4- |an|). Положим M = |ai] + |a21 + • • • + |an| и возьмем 6 = min(l, e/M). Тогда для всех z, для которых |z| < <5, выполняется неравенство |/(z)| < < |z| - М < е/М М = £. Комплексная функция /(z) от комплексной переменной z назы- вается непрерывной в точке zq, если для любого Е > 0 существует 5 > 0 такое, что для всех z, для которых |z — zq| < <5, выполняется неравенство |/(z) — f (zq) | < е. Лемма 2. Многочлен f(z) = а^ + a\z -I- - • - 4- anzn есть не- прерывная функция во всех точках комплексной плоскости. Доказательство. Пусть zq - произвольное комплексное число. Разложим многочлен /(z) по степеням z - zq: /(z) = со 4-сДг — zq) 4- + -• • + Cn(z - z0)n. Тогда co = /(z0), так что /(z) -/(z0) = ci(z-z0) 4- 4- • • 4- Cn(z — zo)n. Правая часть этого равенства представляет собой многочлен от z — zq с нулевым свободным членом. По лемме 1 для любого е > О найдется б > 0 такое, что |/(z) — f (z0)| < е для всех z, для которых \z - Zol < <5. Лемма 3. Модуль многочлена есть непрерывная функция. Доказательство. Утверждение вытекает из леммы 2 и свойств модуля комплексных чисел (45.3): |/(z) - /(z0)| > ||/(z)| - |/(z0)||. Лемма 4. Если f(z) - многочлен степени п > 1, то для любого М > О существует R > 0 такое, что для всех z, для которых |z| > R, выполняется неравенство |/(z)| > М.
172 Глава X. Многочлены над произвольным полем Доказательство. Пусть f(z) +a^z+-----------banzn. Запишем f(z) в виде /(z) = anzn (1 + ^z-1 + • + —= \ an an J = anzn (H-p(z-1)) , (49.1) где <j(z-1) - многочлен от z~l с нулевым свободным членом. В силу леммы 1 для е = 1/2 найдется <5 > 0 такое, что при \z~11 < 6 имеет ме- сто неравенство |<?(z-1)| < 1/2. Модуль anz" может быть сделан сколь угодно большим, именно при |z| > ^/2М/|ап| будет |апгп| > 2М. Возьмем R = max ( yJlM/\an\, Тогда если |z| > R, то |z-1| < д и |z| > i(/2M/|an|, так что согласно (49.1) |/(z)| = |anz"| |1 + g(z-1)| > |anzn| |1 - ly^”1)] | > 2М(1-|) = М. Число zq = xq + iyo называется пределом последовательности zn — xn + iyn, если для любого е > 0 существует натуральное число N такое, что Izn — zg\ < е для всех п> N. Обозначение: lim zn = zq. п—too Очевидно, что сходимость последовательности комплексных чисел zn равносильна сходимости двух последовательностей действительных чисел: lira хп — xq, Inn уп - Уо- п—too п—too Последовательность zn называется ограниченной, если суще- ствует число R > 0 такое, что \zn | < R. Лемма 5. Из любой ограниченной последовательности zn можно выделить сходящуюся подпоследовательность. Доказательство. Пусть zn = xn+iyn и |zn| < Я; тогда |xn| < R, так что хп - ограниченная последовательность действительных чисел. Из нее согласно теореме Больцано-Вейерштрасса [11] можно выде- лить сходящуюся подпоследовательность хПк —> хо- Рассмотрим соот- ветствующую подпоследовательность мнимых частей уПк. Она огра- ничена, и из нее также можно выделить сходящуюся подпоследова- тельность yntm —> уо- Тогда соответствующая подпоследовательность znkm сходится к z0 = Xg + iy0. Лемма 6. Точная нижняя грань модуля многочлена дости- жима, т.е. существует число zq такое, что |/(zq)| < |/(z)| при всех комплексных г. Доказательство. Рассмотрим множество всевозможных зна- чений модуля многочлена f(z). Так как |/(z) | > 0, то это множество ограничено снизу и, следовательно, имеет точную нижнюю грань. Обозначим ее через т. Тогда для любого натурального числа п можно найти комплексное число zn такое, что |/(zn)| < m+ -. (49.2) п Воспользуемся леммой 4: для М = т + 1 найдем R такое, что при |z| > R будет |/(z)| > М > т + Отсюда и из (49.2) следует, что
§ 49. Корни многочленов 173 |zn| < R- Последовательность zn оказалась ограниченной, и из нее со- гласно лемме 5 можно выделить сходящуюся подпоследовательность znk —> zq- Тогда в силу непрерывности |/(z)| (лемма 3) lim |/(z„k)| = |/(z0)|. (49.3) к-юо С другой стороны, из (49.2) и определения нижней грани имеем т < \f(zn„)| < т + -Т-, поэтому lim |/(znk)| = т. (49.4) кчоо Сопоставляя (49.3) и (49.4), приходим к требуемому равенству |/(z0)| =m. Лемма 7 (лемма Даламбера). Если f(z) - многочлен сте- пени п > 1 и f(zo) / 0, то найдется число zi такое, что |/(21)|<|/(20)|. Доказательство. Разложим многочлен f(z) по степеням z — zq: /(z) = Со + Cj (z - z0) H--k Cn(z - z0)n. (49.5) Очевидно, что co = /(zq) / 0. Пусть q - первый ненулевой коэффи- циент в (49.5) после со (такой коэффициент имеется, так как /(z) не константа). Тогда /(z) = со + c*(z - zQ)k -k cfe+i(z - z0)fc+1 + • • • + Cn(z - zg)n = = co(l + —(z-z0)fc + —(z-zo)fc(^±i(z-zo)-l------k — (z-z0)"-fcj) = \ Co Co Ck Ck ) = Co(l + — (z - z0)fc + —(z - z0)fcp(z - Zo)}, (49.6) x Co Co / где g(z - z0) = Cfc+1 (z - zo) -(-k — (z — z0)n-/c - многочлен от z-zq c Cfc Ck нулевым свободным членом. Согласно лемме 1 для е = 1/2 найдется такое <5, что если |z — zo| < <5, то \g(z - z0)| < 1/2. (49.7) Оценим правую часть (49.6). Пусть — = ft(cos0-kisin0), z-zg = со = r(cosyr + i sin уз). Выберем г так, чтобы Rrk < 1. Для этого нужно взять г < (/1//?. Далее положим в+ktp — тг, т.е. возьмем у> = (тг-0)//с. При таком выборе имеем — (z—zg)k = -Rrk. Теперь положим zi = zq+ со -kr(cosy>-kisinyj) при г < min(6, у/1/R) и уз = (тг—#)/k. Тогда из (49.6)
174 Глава X. Многочлены над произвольным полем следует, что f(zi) = Cq (1 - Rrk — Rrkg(zi - zq)), откуда |/(zi)| = ]cq| |1 - Rrk - Rrkg(zi - z0)| < < |cq| (|1 — Rrk\ + Rrk\g(zi — zq)|) < {в силу выбора г и (49.7)} < < Icol (1 - Rrk + Rrk/2) = |со| (1 - Ят*/2) < |со| = |/(z0)|. Доказательство основной теоремы. Пусть f(z) - произ- вольный многочлен степени n > 1 над полем С от комплексной пере- менной z. Согласно лемме 6 множество всевозможных значений \f (z)| имеет точную нижнюю грань т, которая достигается в некоторой точке zq, так что |/(zq)| = m. Тогда /(zq) = 0, так как в противном случае, если |/(zq)| / 0, то согласно лемме 7 найдется точка zj, для которой |/(<zi)| < |/(zq)| = inf |/(z)|, что невозможно. Таким образом, zq - корень /(z) и поле С комплексных чисел алгебраически замк- нуто. § 50. Каноническое разложение многочлена над полем комплексных чисел Теорема 50.1. Для любого многочлена f(z) = аьгк £ g C[z] степени п > 1 существуют числа ci,cj, . - ,сп 6 С такие, что f(z) = аДг - ci)(z -c2)...(z- сД- (50.1) Это разложение единственно с точностью до порядка сомножите- лей. Доказательство. Из алгебраической замкнутости поля С сле- дует существование корня ci € С многочлена /(z). Тогда в коль- це C[z] многочлен /(z) делится (теорема 49.1) на многочлен z - ci, так что /(z) = (z - ci)/i(z), где /i(z) G C[z], deg/j = n - 1. Если n — 1 > 1, то к многочлену /i(z) также применима основная теорема алгебры и, следовательно, /(z) = (z — cj.)(z -c2)f2(z), где /2(2) € C[z], deg/2 = n —2, c2 e С. Применив эти рассуждения n раз, найдем числа Ci, C2, •. -, Cn G С такие, что /(z) = (z - cj(z - с2)... (z - cn)fn, (50.2) где deg/n = 0 и, следовательно, fn - константа. Сравнив коэффици- енты при zn в обеих частях равенства (50.2), получим, что fn = ап. Тем самым доказано существование разложения (50.1). Докажем его единственность. Пусть существует другое разложе- ние: /(z) = аДг - ф)(г - d2)... (z - dn). (50.3) Каждое число с, из первого разложения встречается среди чи- сел di,..., dn второго разложения, так как в противном случае для Ci dj, j = 1,п, из (50.1) получим, что /(с,) = 0, а из (50.3) - что
§ 50. Каноническое разложение многочлена 175 f(ci) 0. Аналогично каждое число dj встречается в первом разло- жении. Покажем теперь, что если с, — dj, то с, встречается в (50.1) столько же раз, сколько dj в (50.3). Пусть с, равно dj и встречается в (50.1) k раз, а в (50.3) - т раз и пусть к > т. Положим (z — c,)m = y(z). Тогда ¥>(z)(z - с*)*-"1 {J (z-Cj) = y>(z) [J (*-<*,), dj откуда следует, что ^/(z-c^-"* П (z-c’)“ П (г-<Ь))=0. сл da dj Так как в кольце C[z] нет делителей нуля и <p(z) 0, то (Z-С,)*-1 [] (Z-Ca)= [J сл с, da dj Положив в этом равенстве z = с<, придем к противоречию. Итак, к < т. Аналогично показывается, что т < к. Значит, к - т. Теорема 50.2 (о каноническом разложении многочле- на над полем С). Для любого многочлена f(z) — Y^k=aakzk е C[z] степени п > 1 существуют числа щ, с2,.. ., Cm € С, где с, / Cj при i j, и числа ki, к?,..., кт & N, где к^ + кг + • - + кт = п> такие, что f(z) = an(z - c,)kl (z - c2)fc’... (z - cm)*". (50.4) Это разложение единственно с точностью до порядка сомножите- лей. Доказательство. Рассмотрим разложение (50.1) для много- члена f(z). Среди чисел ci,c2,... ,Сп могут быть одинаковые. Будем считать, что сьсг, ...,^ различны, а каждое из Cm+i,... ,с„ равно одному из ci, с2,..., Ст- Объединив одинаковые сомножители в этом разложении, получим /(z) = an(z-ci)kl(z - c2)fcj.. .(z -Cm)1", где Ci / Cj при i j no построению, a fci + k2 +--1- km = n, так как ki + fc2 -I-F km - это число всех сомножителей в (50.1). Единствен- ность разложения следует из теоремы 50.1. Разложение (50.4) называется каноническим разложением много- члена над полем комплексных чисел. Заметим, что числа с,, i = 1,тп, в каноническом разложении (50.4) являются корнями многочлена /(z) (так как /(с,) = 0, t = l,m) и других корней этот многочлен не имеет (так как /(а) / 0 для любого
176 Глава X. Многочлены над произвольным полем числа a / <\, i = l,m). Число ki в каноническом разложении мно- гочлена называется кратностью корня ct. Если ki — 1, то корень с, называется простым, если ki > 1 - кратным. Следствие 1. Любой многочлен f(z) 6 C[z] степени п > 1 имеет ровно п корней, если каждый корень считать столько раз, какова его кратность. Замечание 1. Это утверждение применимо и к многочлену нулевой степени, оно неприменимо лишь к нулевому многочлену, для которого любое число z € С является корнем. Вернемся к вопросу о равносильности двух определений равенства многочленов, о котором шла речь в начале §49. Теорема 50.3. Если два многочлена f(z),g(z) е C[z], сте- пени которых не превосходят п > 1, имеют равные значения при более чем п различных значениях переменной, то они равны. Доказательство. Действительно, многочлен h(z) = f(z) — -g(z) е C[z] имеет более п различных корней. Но deg/i < п, поэтому h(z) = 0. Следствие 2. Два многочлена f(z),g(z) е C[z] равны тогда и только тогда, когда совпадают их значения при всех значениях переменной z. Следствие 3. Многочлен f(z) 6 C[z] степени п > 1 однозначно определяется своими значениями в п 4-1 различных точках. Нетрудно показать, что если многочлен /(z) в точках ai, аз, • ••, an + i, где а; # О] при i / j, принимает значения /(ai), /(аз),.... /(аП4-1), то f( } = f(„ ч (z-ai)...(zr-a<-i)(z-ai+i)...(z-an+1) »=1 ’ (aj - aj). ..(ai - а,-1)(а< - ai+i)... (а4 - an+i) Этот многочлен называется интерполяционным многочленом Лагранжа. Теорема 50.4 (формулы Виета). Если сх,с2,... ,Сп -кор- ни многочлена f(z) - 52Z=oafcZfc, т0 ®п—1/(^1 + С2 + • • + Сп), e^n—z/^n “b(^i^2 С1С3 4- • • 4- CiCn 4" С2С3 4- * * * 4- сп—1Сп), fe/^n = ( — 1) 52 ^2 • 1 *1 <«2<- -<ik ao/fln = (-l^ca.-.Cn. (50.5) Доказательство. Достаточно рассмотреть случай, когда ап — 1, так как многочлены /(г) и (l/an)/(z) имеют одинаковые корни. Применим индукцию по п. Для п = 2 формулы (50.5) явля- ются известными из элементарной алгебры формулами Виета. Пусть для многочленов (п-1)-й степени формулы (50.5) имеют место, дока- жем их для многочлена /(г) = ao4-aiz4-----Fan_izn-14-zn. Согласно (50.1) /(z) = ((z - Ci)(z - C2) •. • (z - Cn-1)) (z - cn) = p(z)(z - Cn),
§51. Многочлены над полем вещественных чисел 177 где g(z) = (z — ci)(z — с2)... (z — Cn-i) - многочлен степени n — 1. Пусть g(z) = bo -F btz -|-F bn_2z"-2 + zn~l, тогда /(z) = (b0 -F biz 4--1- bn_2zn~2 + zn-1)(z - cn) = = boz + biz2 -I-F bn-2zn~1 + zn - (boCn + biCnZ 4-F bn_2CnZn~2+ +cnzn~1) = -b0Cn + (b0 -bjc^zd--F (bn-fc-i -bn-kCn)zn~k + • - + zn и /(z) — ao -F a\z H-F an-kZn~k -I-F zn. Сравним коэффициенты при zn~k и учтем, что для коэффициентов Ь, , г — 0, п — 2 , верны соотношения (50.5), т.е. fyn-l)-k — ( l)fc 52 ZCii • • • Cik j где суммиро- вание в ^2' ведется по всем 1 < й < гз < * • - < < п - 1. Тогда к = ^п — к— 1 Ьп—кСп = tyn— 1)—fc fyn— 1)— (fc— l)^n = = - -cik - = = (-l)fc (52•••<** +CnL4CiJ ' C«*-l) = где суммирование ведется по всем 1 < ii < i2 < • • < ik < n. Замечание 2. Все утверждения этого параграфа имеют место в любом алгебраически замкнутом поле. Формулы Виета примечательны тем, что их правые части предста- вляют собой такие многочлены от переменных Ci, • • ,£„, которые не меняются ни при какой перестановке корней ci,..., с* Такие много- члены называются симметрическими многочленами (или симметри- ческими функциями). Следующие п симметрических многочленов от п неизвестных называются элементарными симметрическими мно- гочленами: < 71 = Xj + Х2 -F • • + Тщ < т2 — xix2 + Х1Х3 + • • • “F Xyi—ixn, < 7n — к — • • • *7<к , «!< •<«* — Х1Х2 • - • • Таким образом, коэффициенты многочлена от одной переменной, имеющего старшим коэффициентом единицу, являются с точностью до знака симметрическими многочленами от его корней. §51. Многочлены над полем вещественных чисел Пусть f(x) = 52£=о акх>с ~ многочлен над полем R степени п, т.е. ак € R, к = 0, п, и ап / 0. Так как RcC, то многочлен f(x) можно рассматривать и как многочлен над полем С. Тогда, как показано в §50, этот многочлен с учетом кратностей имеет п корней (вообще говоря, комплексных).
178 Глава X. Многочлены над произвольным полем Теорема 51.1. Если с - комплексный (и не действитель- ный) корень многочлена f(x) G R[x], то и с является корнем этого многочлена. Доказательство. Если с является корнем многочлена f(x) = = Sk=o akXk, то ао + aic +-1- ancn = 0. Взяв сопряжение от обеих частей этого равенства, получим с учетом теоремы 44.2 и соотношения а*> — к = 0,п, что ао + aicH-1- апсп = 0. Положим <р{х) = [х - с)(х - с) = х2 - (с + с)х + |с|2. Очевидно, у(х) € R[xJ. Теорема 51.2. Если с - комплексный (и не действитель- ный) корень многочлена /(х) € R[x], то в кольце R[x] многочлен f(x) делится на <р(х). Доказательство. Разделим многочлен /(х) на <£>(х) в кольце R[x] согласно (48.1), тогда /(х) = tp(x)q(x) + r(x), где q(x),t(i) g R[x]. Это же разложение можно рассматривать как результат деления /(х) на у>(х) в кольце С[х]. Но в кольце С[х] многочлен /(х) делится нацело на v?(x), так как с и с являются корнями /(х). Отсюда и из единствен- ности результата деления (теорема 48.1) следует, что /(х) = уз(х)д(х), где g(x) € R[x]. Теорема 51.3. Кратности корней с и с многочлена с веще- ственными коэффициентами совпадают. Доказательство. Пусть с и с - корни многочлена /(х) € R[x] кратностей m и к соответственно. Покажем, что к < т. Пусть к > тп. Тогда, согласно теореме 51.2, /(х) = (<р(х))т д(х), где q(x) € R[x]. Но q(c) = 0, а q(c) 7^ 0, что невозможно в силу теоремы 51.1. Зна- чит, к < т. Аналогично можно показать, что т < к. Следовательно, к = т. Следствие. Многочлен с вещественными коэффициентами не- четной степени имеет хотя бы один вещественный корень. Теорема 51.4 (о каноническом разложении многочле- на над полем R), Для любого многочлена /(х) = Y^k=oakxk € R[x] степени п > 1 существуют числа ci,...,Cr G R, где с, ф Cj при i / j; числа Pi,qi,. •. ,ps,qa € R, где (pi,qi) (pj, qj) при i 7^ j; числа ki,..., kr € N и li,..., ls G N, где k, + 2 lj — n, такие, что Г 8 f(.x) = an П(я - Ci)ki JJ(x2 +Pji +qj)li. (51.1) i=i j=i Доказательство. Используем каноническое разложение (50.4) многочлена /(х), рассматривая /(х) как многочлен с комплексными коэффициентами: /(х) = an(x - Ci)fci... (х - cm)fe>", (51.2) где а / Cj при i j н. ki + + km — п. Числа ci,..., Ст являются комплексными корнями /(х). Среди этих корней могут быть и дей- ствительные. Пусть ci,..., Сг - действительные корни, а <>+1,..., Сщ -
§51. Многочлены над полем вещественных чисел 179 комплексные (не действительные). Тогда среди Сг+ь • • •, Cm вместе с каждым корнем Cj находится и сопряженный ему корень с, = Cj, при- чем той же кратности, так что ki = kj = и, следовательно, 21 j = ki+ 4- kj. Объединим в (51.2) пару сомножителей: (i - с})к’(х - Ci)k' = ((z - Cj)(i - Cj))!< = (х2 +PjX 4- где pj — -(cj 4- cj) e R, qj = CjCj € R. Тогда (x - cr+i)... (x- Cm) = (z2 +pix + qi)11 ...(z2 +pax + q,)l‘ и разложение (51.2) перейдет в (51.1), причем fci 4- • • • 4- kT 4- 2(h 4- 4- • • 4- Is) = ki 4- • + kr 4- &r+i 4- • • 4* km = n. Разложение (51.1) называется каноническим разложением много- члена над полем вещественных чисел. Замечание. Теорема 50.3 и ее следствия справедливы и для мно- гочленов с вещественными коэффициентами. В этом можно убедить- ся, если рассматривать их как многочлены с комплексными коэффи- циентами. Формулы Виета справедливы лишь для тех многочленов из R[z], которые имеют полный набор действительных корней.
Глава XL Алгебраические линии второго порядка на плоскости § 52. Эллипс Эллипсом, называется геометрическое место точек М плоскости, для которых сумма расстояний от двух фиксированных точек Fi и F2 плоскости есть постоянное число, большее, чем расстояние между Fi и F2. Это число обозначим через 2а. Точки Fi, F2 называются фоку- сами эллипса, расстояние между ними называется фокусным рассто- янием и обозначается через 2с. Числа п = р(М, Fi) и r2 — р{М, F2) называются фокальными радиусами точки М. Из определения эллипса следует, что точка М плоскости является точкой эллипса тогда и только тогда, когда fi + г2 = 2а, а > с. (52.1) Каноническое уравнение. Запишем условие (52.1) в координат- ной форме. Для этого введем на плоскости прямоугольную декар- тову систему координат Оху, приняв за начало О середину отрезка FiF2, за ось Ох - пря- мую FiF2, ориентированную от х Fi к. F2-, ориентацию на оси Оу выбираем произвольно (рис. 1). Эта система координат называ- ется канонической системой ко- ординат (для данного эллипса). Фокусы Fi и F2 в канонической системе координат имеют коорди- наты (-с, 0) и (с, 0) соответственно. Теорема 52.1. Уравнение эллипса в канонической системе координат имеет вид х2 У2 Ь2 а > Ъ > 0. (52.2) Доказательство. Пусть М(х,у) - точка эллипса (52.1). Тогда условие (52.1) может быть записано через координаты точек Fi, F2, М в виде х/(а: + с)2 + у2 -I- \/(а: - с)2 + у2 —2а, а > с.
§ 52. Эллипс 181 После переноса одного слагаемого в правую часть и возведения в ква- драт получим х2 + 2сх + с2 + у2 = 4а2 — 4а\/(т — с)2 + у2 + х2 - 2сх + с? + у2 или, после очевидных преобразований, ау/ (х — с)2 + у2 = а2 — сх. Еще раз возведем в квадрат: а2х2—2а2хс+а2с2+а2у2 = а4 — 2а2сх+ + с2!2 или х2(а2 — с2) + а2у2 — а2(а2 — с2), где а2 - с? > 0. Разделив обе части уравнения на а2(а2 — с2), придем к уравнению т2 у2 или “Г + тг = 1, где Ь2 = а2 — с2, а > Ь > 0. Таким образом, любая точка М(х, у) элли- пса удовлетворяет уравнению (52.2). Обратное утверждение, вообще говоря, не очевидно, так как при переходе от (52.1) к (52.2) мы два- жды возводили в квадрат обе части уравнений и поэтому на линии, определяемой уравнением (52.2), могут быть и "лишние" точки. По- кажем, что уравнению (52.2) отвечают только точки эллипса (52.1). Пусть точка М(х,у) удовлетворяет уравнению (52.2), тогда / х2\ у2 — Ь2 | 1--т ) и |х| < а. (52.3) \ а ) Найдем фокальные радиусы точки М. Имеем Г] = \/(х + с)2 4- у2 = J х2 + 2сх + с2 +Ь2 jх2 — . M'-?J+2c, + c. + y _ /^V+2cl + o3 _ V а2 V а2 I/ХС \2 IXC I сх — \ (-h а I =--f- а — а Ч-, V ' а / I а I а так как -—- < — = с < а в силу (52.3). Итак, а а Г1=а+-. (52.4) а Аналогично доказывается, что г2 = а - —. (52.5) Из (52.4) и (52.5) следует, что ri + г2 = 2а.
182 Глава XI. Алгебраические линии второго порядка на плоскости Уравнение (52.2) называется каноническим уравнением эллипса. В случае, когда а = Ь (т.е. фокусы совпадают), эллипс превращается в окружность радиуса а с центром в точке О - Fi = F2- Из канонического уравнения вытекают следующие свойства эл- липса. 1°. Координатные оси канонической системы координат (рис. 2) являются осями симметрии эллипса, так как вместе с точкой М(х,у) эллипса точки Mi(-x,у) и ^(х.-у) также принадлежат эллипсу. Начало координат канонической системы координат является цен- тром симметрии эллипса, так как точки М(х, у) и Мз(—х, -у) од- новременно принадлежат эллипсу. Начало координат канонической системы координат называется центром эллипса, числа 2а и 25 - большой и малой осями эллипса, а числа а и b - большой и малой полуосями. 2°. Все точки эллипса лежат в прямоугольнике, ограниченном пря- мыми х — ±а и у = ±6, так как для координат (т, у) точек эллипса |т| < а, |у| < Ъ. Точки Л1(-а,0), Лг(а,0), Bi(0, -5), пересече- ния эллипса с осями координат называются вершинами эллипса. 3°. Исследуем форму эллипса. В силу симметрии достаточно про- вести это исследование лишь для точек I четверти. Здесь уравнение эллипса имеет вид у - -\/а2 - х2, х € [0, а]. Легко показать, что: а а) у(х) непрерывна и убывает от у = Ь до у = 0; б) !/х(0) = 0, у'(а) — оо, следовательно, касательная к эллипсу в точке т = 0 параллельна оси Ох, а в точке х = а - оси Оу; в) у"(х) < 0, следовательно, линия выпукла вверх (рис. 2). Простой способ построения эллипса дается определением эллипса: достаточно нить длиной 2а закрепить концами в точках F\ и Fq, натянуть нить карандашом и передвигать карандаш, держа нить натянутой. Директориальное свойство. Число е = с/а называется эксцен- триситетом эллипса. Из определения следует, что 0 < е < 1, при
§ 52. Эллипс 183 этом или - - \/l - Е2 а (52.6) и, с учетом (52.4), (52.5), П = а + ех, Г2 = а — ех. (52.7) Соотношения (52.6) означают, что чем меньше эксцентриситет, тем эллипс “ближе” к окружности (для окружности е = 0). Для эллипса, не являющегося окружностью, две прямые dj и dj, заданные в канонической системе координат уравнениями , а А а di : х —---, dj : х = —, £ Е называются директрисами эллипса (рис. 3). Директриса d, называется соответствующей фокусу Fi, i = 1,2. Теорема 52.2. Эллипс, не являющийся окружностью, есть геометрическое место точек М плоскости, для которых отношение расстояния от данной точки F к расстоянию до данной прямой d, не проходящей через эту точку, равно данному положительному числу, меньшему 1, т.е. '-^ = е, 0 < е < 1. (52.8) ,d) Доказательство. Пусть p(F,d) — т. Найдем число а > 0, для которого т — - — аг. (52.9) Очевидно, а =------г. Положим 1 — Е2 с — as, Ь2 — а2(1 — £2). (52.10) Введем прямоугольную декартову систему координат Оху, при- нимая за ось Ох прямую, проходящую через точку F, перпендику- лярную прямой d (рис. 4) и ориентированную от F к d; за начало О - точку на оси Ох, расположенную от точки F на расстоянии с по другую сторону от прямой d; ориентация на оси Оу выбирается произвольно. В этой системе координат точка F имеет координаты (с, 0), а пря- мая d определяется уравнением х — а/Е, так как с+т = аг+т = ajs (рис. 4). Условие (52.8) для точки М(х,у) означает, что а/(т - с)2 + у2
184 Глава XI. Алгебраические линии второго порядка на плоскости Возведя обе части в квадрат, получим равносильное уравнение х2 — 2сх + с2 + у2 — х2е2 — 2хае + а2, которое с учетом того, что с = аг, может быть записано в виде (1 - s2)x2 + у2 = а2(1 - а2). Разделив обе части этого уравнения на правую часть, приходим в обо- значениях (52.10) к каноническому уравнению эллипса, эквивалент- ному (52.8): т2 у2 а>Ъ>Ь. а2- о2 Итак, точка М(х,у) принадлежит геометрическому месту точек (52.8) тогда и только тогда, когда она является точкой эллипса, для которого данная точка F является фокусом, прямая d - соответству- ющей директрисой, а число г - эксцентриситетом. Отметим, что до- казательство теоремы как раз и состоит в построении этого эллипса. Его полуоси а и Ь определены равенствами (52.9), (52.10). § 53. Гипербола Гиперболой называется геометрическое место точек М плоскости, для которых абсолютная величина разности расстояний от двух фик- сированных точек Fj и F2 плоскости есть постоянное положительное число, меньшее, чем расстояние между F\n F?- Это число обозначим через 2а. Точки Fi, F2 называются фокусами гиперболы, расстояние между ними называется фокальным расстоянием и обозначается че- рез 2с. Согласно определению а < с. Числа = p(M,Fi), г = 1,2, называются фокальными радиусами точки М. Из определения гиперболы следует, что точка М плоскости явля- ется точкой гиперболы тогда и только тогда, когда |тх - г2| = 2а, а < с. (53.1)
§ 53. Гипербола 185 Каноническое уравнение. Запишем условие (53.1) в координат- ной форме. Поступая так же, как и в случае эллипса, построим кано- ническую систему координат Оху для гиперболы (53.1). Теорема 53.1. Уравнение гиперболы в канонической систе- ме координат имеет вид т2 а2 Ь2 (53.2) Доказательство. Если М(х,у) - точка гиперболы (53.1), то |у/(т + с)2 + у2 - \/(х- с)2 + у2| — 2а, а < с, или \Х(х + с)2 + у2 - у/(х- с)2 4- у2 = ±2а, а < с. Используя те же преобразования, что и для эллипса, придем к урав- нению х2(а2 —-с2) + а2у2 = а2(а2 — с2), а2 - <? < О, или, в обозначениях — Ь2 = а2 — с2, к уравнению (53.2). Таким образом, любая точка М(х, у) гиперболы удовлетворяет уравнению (53.2). Обратное утверждение доказывается так же, как и для эллипса. Здесь |®| > а, поэтому (53.3) Таким образом, в обоих случаях |ri — г2| = 2а. Уравнение (53.2) называется каноническим уравнением гипербо- лы. Отметим простейшие свойства гиперболы, вытекающие из ее ка- нонического уравнения. 1°. Как и в случае эллипса, координатные оси канонической си- стемы координат являются осями симметрии гиперболы, а начало ко- ординат - центром симметрии. Ось Ох пересекает гиперболу в точ- ках Л1(—а, 0), Л2(а, 0) и называется вещественной осью гиперболы. Ось Оу не пересекает гиперболу и называется мнимой осью. Нача- ло координат называется центром гиперболы, числа а > 0, Ь > 0 - вещественной и мнимой полуосями гиперболы. 2°. Все точки гиперболы лежат вне полосы, определяемой прямы- ми х = ±а, так как |т| > а (рис. 1). Это означает, что гипербола состоит из двух отдельных частей, называемых ветвями гиперболы. 3°. Все точки гиперболы лежат в тех вертикальных углах, образо- ванных прямыми у = которые содержат вещественную ось, так как для точек М(х, у) гиперболы у = ±£\Лг2 — а2, т.е. |у| < £|а:|.
186 Глава XI. Алгебраические линии второго порядка на плоскости 4°. Исследуем форму гиперболы. В силу симметрии достаточно провести это исследование лишь в I четверти. Здесь уравнение ги- перболы имеет вид у = — а2, х > а. Легко проверить, что (рис. 1): а) у{х) непрерывна и возрастает на [а, +оо), при этом у (а) — 0 и lim у(х) = -|-оо; х-»+оо б) у'{а) = оо, так что касательная к гиперболе в точке х = а параллельна оси Оу, в) у"(х) < 0, следовательно, линия выпукла вверх; г) если I - прямая, заданная уравнением у = £х, то для всех точек М(х,у) гиперболы lim р{М,1) = 0, так как х->+оо (м г- ~ у! - 1Ьа: ~ ау1 - 1Ьа: ~ - q2I _ ? ’ >/1 + Ь2/а2 у/a2 +Ь2 у/а2 + & а2Ь = /-Л- гл,----/ л - - - -> 0 при X -> +ОО. у/а2 + Ь2(х + у/х2 — а2) Итак, все точки гиперболы с ростом х сколь угодно близко при- ближаются к прямым 11- У = и 12: у = не пересекая их. Прямые li, 12 называются асимптотами гиперболы. Директориалъное свойство. Число е — с/а называется эксцен- триситетом гиперболы. Из определения следует, что е > 1, при этом и, с учетом (53.3), Г ri = -(ет 4- а), ( г2 = —{ех - а) rj = ех 4- а, т2 — ех — а и ддя левой и правой ветвей гиперболы соответственно.
§ 54. Парабола 187 Прямые di и di, заданные в канонической системе координат урав- нениями , a j a ai : X =--, Д2: х = —, £ € называются директрисами гиперболы (рис. 2). Директриса d, называется соответствующей фокусу Ft, г = 1,2. Теорема 53.2. Гипербола есть геометрическое место то- чек М плоскости, для которых отношение расстояния от данной точки F к расстоянию до данной прямой d, не проходящей через эту точку, равно данному числу е > 1, т.е. P(M,F) p(M,d) ’ Доказательство. Так же как и в случае эллипса (теорема 52.2), для данных точки F, прямой d и числа е > 1 строится гипербо- ла, для которой точка F является фокусом, прямая d — соответству- ющей директрисой, чйсло е - эксцентриситетом. Если т = p(F,d), то полуоси гиперболы определяются соотношениями а т = ОЕ----, С = ОЕ £ (53.4) ТПЕ £2 - 1 или а с = ас, Ь2 = п2(е2 — 1). Использование тех же пре- образований, что и при доказательстве теоремы 52.2, завершает до- казательство. § 54. Парабола Параболой называется геометрическое место точек плоскости, для которых расстояние от некоторой фиксированной точки F плоскости равно расстоянию до неко- торой фиксированной прямой d, не проходящей через точ- ку F. Точка F называется фо- кусом параболы, прямая d - ее директрисой. Расстояние от фокуса параболы до ее дирек- трисы называется фокальным параметром параболы и обо- значается через р. Эксцентри- ситет параболы по определе- нию считается равным 1.
188 Глава XI. Алгебраические линии второго порядка на плоскости Каноническое уравнение. Введем на плоскости прямоугольную декартову систему координат Оху, принимая за ось Ох прямую, про- ходящую через точку F перпендикулярно прямой d, ориентирован- ную от прямой d к точке F, за начало О - середину отрезка FD, где D - точка пересечения оси Ох с прямой d; ориентацию на оси Оу выбираем произвольно (рис. 1). Эта система координат называется канонической системой координат для данной параболы. Теорема 54.1. Уравнение параболы в канонической систе- ме координат имеет вид у2 = 2рх, р > 0. (54.1) Доказательство. В канонической системе координат Оху фо- кус F имеет координаты (р/2,0), директриса d определяется урав- нением х = -р/2. Точка М(х, у) является точкой параболы тогда и только тогда, когда p(M,F) — p(M,d), или, что то же самое, ^-^)2 + у2 = р||. Возведя в квадрат обе части уравнения, получим равносильное урав- нение х2 — рх + у2 = х2 4- рх +р2/4 или уравнение (54.1). Уравнение (54.1) называется каноническим уравнением параболы. Следующие свойства параболы (рис. 1) непосредственно вытекают из канонического уравнения. 1°. Ось Ох канонической системы координат является осью сим- метрии параболы. Она называется осью параболы. Начало координат лежит на параболе и называется вершиной параболы. 2°. Все точки параболы расположены в правой полуплоскости от оси Оу, так как х > 0. 3°. Исследуем форму параболы. В силу симметрии достаточно рас- смотреть I четверть. Здесь уравнение параболы имеет вид у = \/2рх, х > 0. Легко проверить, что: а) у(х) непрерывна и возрастает на [0,+оо), причем у(0) = 0 и lim у(х) = +оо; б) j/'(0) = оо, так что касательная к параболе в точке х = 0 парал- лельна оси Оу, в) j/"(0) < 0, следовательно, парабола выпукла вверх (рис. 1). Замечание. Определение параболы, по существу, означает ее директориальное свойство р(М, Г) р(М, d) (54.2) где F - фокус, d - директриса, е - эксцентриситет, которое, как мы видели в §52, 53, имеет место для эллипсов и гипербол. Отличие
§ 55. Касательные к эллипсу, гиперболе и параболе 189 состоит лишь в том, что для эллипсов 0 < е < 1, для парабол е = 1, для гипербол е > 1. Итак, если на плоскости даны прямая d и не при- надлежащая ей точка F, то геометрическое место точек М плоско- сти, удовлетворяющих условию (54.2), является либо эллипсом (если О < £ < 1), либо параболой (если е = 1), либо гиперболой (если е > 1). Эти линии обладают целым рядом других свойств, имеющих “род- ственные” формулировки. § 55. Касательные к эллипсу, гиперболе и параболе Будем считать, что эллипс, гипербола и парабола заданы своими каноническими уравнениями (52.2), (53.2), (54.1). Найдем уравнения касательных к этим линиям. Теорема 55.1. В канонической системе координат уравне- ния касательных к эллипсу, гиперболе и параболе в точке (хо,уо) линии имеют вид ХХО УУо . а2 Ь2 ’ (55.1) хх0 ууо _ . а2 Ь2 ’ (55.2) УУО = р(х + То) (55.3) соответственно. Доказательство. Все три уравнения выводятся по одной схе- ме. Приведем ее для эллипса. Воспользуемся известным из курса маг тематического анализа [11] уравнением касательной в неособой точке (хо,Уо) линии, заданной неявно уравнением F(x,у) — 0. Это уравне- ние имеет вид г;(хо, УоКх ~ *о) + Fy(x0, у0)(у - Уо) = 0, (55.4) где F'x(xo,ya), Fy(xo,yo) ~ частные производные функции F(x,y) в точке (xq, уо). Для эллипса (52.2) уравнение касательной в точке (то, Уо) этого эллипса имеет согласно (55.4) вид ^•(х - х0) + §(у - уо) = 0 а2 сг х2 у2 или, с учетом того, что + 77 = 1, вид (55.1). П* п2
190 Глава XI. Алгебраические линии второго порядка, на плоскости § 56. Оптические свойства эллипса, гиперболы и параболы Здесь речь идет о биссекториальных свойствах касательных к этим линиям. Теорема 56.1. Касательная к эллипсу в произвольной его точке Mq есть биссектриса внешнего угла Мд треугольника F^Mg, где F\, F^ - фокусы эллипса. Доказательство. Рассмотрим касательную (55.1) к эллипсу (52.2) в точке Мд(хд,уд) (рис. 1). Рис. 1 Фокусы Fi(—с, 0), F?(c, 0) расположены по одну сторону от каса- тельной, так как в (55.1), с учетом условий 0 < £ < 1 и |хо| < а, имеем ~с10 _ 1 _ _ £хо _ | _ £до + а < Q а2 а а ’ cxQ _ exp j _ ех0 - а < Q а2 а а Обозначим через Pi и Рг основания перпендикуляров, опущенных из фокусов эллипса на касательную. Утверждение теоремы будет до- казано, если мы покажем, что Z.F2M0P2 — Z.P2M0Q или, что то же самое, AFiMqPi = Z.F2MQP2 (рис. 1). Пусть hi, h2 - расстояния от фокусов до касательной. Тогда hi -(сх0/а2) - 1 _ а + ехд _ 74 h-2 (схо/а2) - 1 а - ех0 т2 ’ следовательно, AF2M0P2 ~ AFiMqPi (так как оба они прямоуголь- ные), поэтому Z.F1M0P1 = Z.F2MgP2- Доказанной теореме можно дать следующую оптическую интер- претацию: если поместить в один из фокусов эллипса источник света, то лучи после отражения от эллипса соберутся в другом фокусе, так как световой луч отразится от эллипса как от касательной, проведен- ной к эллипсу в точке падения луча.
§ 56. Оптические свойства эллипса, гиперболы и параболы 191 Теорема 56.2. Касательная к гиперболе в произвольной ее точке Mq является биссектрисой внутреннего угла Mq треугольни- ка F1F2M0, где Fi, Fz - фокусы гиперболы. Доказательство. Эта теорема доказывается точно так же, как и предыдущая. Отметим лишь одно отличие (не затрагивая очевид- ные): фокусы Fi и Fz расположены по разные стороны от любой ка- сательной (рис. 2). Теореме 56.2 можно дать оптическое истолкование, аналогичное тому, которое было дано для эллипса. Теорема 56.3. Касательная к параболе есть биссектриса угла между фокальным радиусом MqF точки касания Мо и перпен- дикуляром MqD, опущенным из точки Mq на директрису. Доказательство. Из уравнения (55.3) касательной к параболе у1 — 2рх в точке Мо(то,уо) этой параболы сле- дует, что точка А (рис. 3) пере- сечения касательной с осью Ох имеет кординаты (—iq,0). Следовательно, АО = Xq и AF = АО + OF = хо + 4- р/2. С другой стороны, MqF = MqD — MqO + + CD = Xq + р/2. Таким образом, AF = MqF и, зна- чит, ZFAM0 = ZAMqF. Ho AFAMq — ZDMqA, следова- тельно, ADMqA = Эта теорема имеет следующее оптическое истолкование: если в фокусе параболического зеркала поместить источник света, то лучи, отразившись от зеркала, образуют пучок параллельных лучей. Это свойство используется в конструкции зеркальных прожекторов. 7 Линейная алгебра и аналитическая геометрия
192 Глава XI. Алгебраические линии второго порядка на плоскости §57. Полярные уравнения эллипса, гиперболы и параболы Пусть £ - какая-нибудь из трех линий: эллипс, гипербола или парабола, заданная своим каноническим уравнением. Введем полярную систему координат, приняв за полюс фокус F линии (для эллипса F - левый фокус, для правой ветви гиперболы F - правый фокус, а для левой ветви - левый фокус), полярную ось направим в положительную сторону оси Ох канонической системы координат Оху во всех случаях, кроме левой ветви гиперболы, а в этом случае - в отрицательную сторону оси Ох (рис. 1). Рис. 1 Тогда для любой точки М плоскости ее полярный радиус г со- впадает с фокальным радиусом р(М, F). Согласно директориальному свойству линии £ точка М(х,у) принадлежит £ тогда и только тогда, когда (57.1) р(М, d) £' где е - эксцентриситет линии £. Пусть p(F,d) = т, тогда p(M,d) — = МА = rcostp + т и уравнение (57.1) линии может быть записано в виде ИЛИ (57.2) г = (rcos<p + т)е те г —------------ 1 — е cos <р Для параболы е — 1,т — р, где р - фокальный параметр парабо- лы. Следовательно, в выбранной полярной системе координат пара- бола определяется уравнением г=-^- 1 - cos (57.3) Для эллипса и гиперболы число р = ti2 /а называется фокальным параметром. Из (52.9) и (53.4) следует, что число те в (57.2) совпа-
§ 58. Общее уравнение линии второго порядка 193 дает с фокальным параметром р, так как ( с2\ 2 1 л С 1 те = а — ае = а 1 г \ I2 / at2 b2 - —r- = — = p для эллипса и а2 а 2 / с2 Л те = ае — a = a 1 —т — 11- 7 ab2 Ь2 = = — — р для гиперболы. Это позволяет записать уравнение (57.2) в виде Р 1 — е cos ’ (57.4) где р - фокальный параметр линии, а е - ее эксцентриситет. Поскольку для параболы е = 1, уравнение (57.4) совпадает с уравнением (57.3) параболы. Таким образом, эллипс, гипербола и парабола описываются в полярной системе координат единым уравнением (57.4). Замечание. Проведем из фокуса F (рис. 1) прямую, перпендикулярную оси Ох. Эта прямая пересечет линию £ в двух точках N и Ny. Для точки А, как и для любой точки £, справедливо соотношение (57.1), так что p(N,F) p(N,d) е' Но p(N,d) - p(F,d) = тп, следовательно, p(N,F) = me = p. Таким образом, фокальный параметр линии С совпадает с половиной длины хорды NNy. § 58. Общее уравнение линии второго порядка Пусть Оху - аффинная система координат на плоскости. Алгебра- ическая линия второго порядка определяется уравнением F(x,y) = О, где F(x,y) - алгебраический многочлен второй степени от перемен- ных I, у с вещественными коэффициентами (§31). Этот многочлен принято записывать в виде F(x, у) = апх2 + 2а12ту + a22j/2 4- 2а33х + 2a23y 4- а33, где а2у + а22 + а22 0. В соответствии с этим алгебраическая линия второго порядка определяется уравнением ацт2 4- 2ai2xy 4- a22y2 + 2ау3х + 2a23y 4- a33 = 0, aii + ai2 4- a22 0. ( J Уравнение (58.1) называется общим уравнением алгебраической линии второго порядка на плоскости. Группа слагаемых ацх2 4- +2ау2ху + в22У2 (т.е. одночленов второй степени) называется квадра- тичной частью уравнения (58.1) (или группой старших членов),
194 Глава XI. Алгебраические линии второго порядка на плоскости группа слагаемых 2ацх + 2а2зу - линейной частью, азз - свободным членом. Рассмотренные в предыдущих параграфах эллипс, гипербола и парабола, очевидно, представляют собой алгебраические линии вто- рого порядка. Естественно поставить вопрос, какие еще линии явля- ются линиями второго порядка. Чтобы ответить на него, нужно най- ти такую систему координат, в которой уравнение (58.1) принимает наиболее простой вид (как это было в случае эллипса, гиперболы и параболы). Поиском такой системы координат мы и займемся. Компактная запись общего уравнения. Положим а11 а12 . & _ а13 Й12 0,2-2 ’ 0.23 х У X = Матрица А называется матрицей квадратичной части. В этих обозначениях уравнение (58.1) может быть записано в компактной форме: ХТАХ + 2ЬТ X + а33 = О, А = Ат, А / О. (58.2) В этом нетрудно убедиться, выполнив все умножения в левой части (58.2). Введем новую матрицу ац В = ai2 о,12 ахз а21г 0,23 . 0,13 0,23 0.33 . А ьт Ь ' азз Числа Ii = tr A, 12 = |А|, К3 = линии второго порядка, число К2 = В| называются инвариантами 011 <ИЗ , 0.22 0,23 + - по- 0-13 0.33 0.23 0,33 луинвариантом. Далее нам потребуется несколько дополнительных понятий, относящихся к матрицам. Характеристический многочлен. Характеристическим мно- гочленом матрицы А = (а-ц) G Rnxn называется функция /(А), опре- деленная равенством /(А) = |А-ЛГ|. (58.3) Легко проверить, что: а) если п = 2, то /(А) = (-А)2 + аД—А) + ао, где aj = tr А, ао = |А|; (58.4) б) если п = 3, то /(А) = (—А)3 + а2(-А)2 + aj(-A) + ао, где а2 = tr Л, ai = ан ^21 0,12 ац 0.22 а31 а13 0,22 0,23 0.33 0.32 йзз а0 = I Л|. (58.5) Главным минором матрицы называется минор, расположенный в строках и столбцах с одинаковыми номерами. Нетрудно заметить (см.
§ 58. Общее уравнение линии второго порядка 195 (58.4), (58.5)), что коэффициенты характеристического многочлена связаны с главными минорами матрицы: если п = 2, то ai - сумма главных миноров первого порядка, ао — единственный главный минор второго порядка; если п = 3, то аг, <И, ао - суммы главных миноров первого, второго, третьего порядков соответственно. Матрицы А, В € Rnxn называются подобными, если существует невырожденная матрица Q такая, что А = Q~1BQ. (58.6) Теорема 58.1. Характеристические многочлены подобных матриц совпадают. Доказательство. Действительно, если А — Q~lBQ, то |Л - А/| = \Q^BQ - А/| = - Q~lXIQ\ = \Q~\B - A/)Q| - = |B — A/|. Таким образом, при любом значении А характеристиче- ские многочлены матриц А и В принимают одинаковые значения и, следовательно, совпадают. С л ед стене. У подобных матриц второго порядка совпадают следы и определители. У подобных матриц третьего порядка совпа- дают следы, суммы главных миноров второго порядка и определи- тели. Преобразования общего уравнения. Пусть исходная аффин- ная система координат Оху соответствует началу О и базису е = = (ei, ез)- Переход к новой системе координат О'х'у' означает (§24) перенос начала в точку О'(а,0) и преобразование базиса eQ = е' с матрицей перехода Q. При этом старые координаты X = (х,у)Т свя- заны с новыми X' = (х',у')Т формулами преобразования координат: 1) X — а + X’, где а = (а,0)т, в случае переноса начала; 2) X = QX' в случае преобразования базиса. Исследуем особенности преобразования уравнения линии в каждом из этих случаев. Пусть линия £ в системе координат Оху задана сво- им общим уравнением (58.2). Теорема 58.2. При переходе к новому базису е' = eQ общее уравнение (58.2) преобразуется в уравнение Х'ТА'Х' + 2Ь'ТХ' + а33 = 0, (58.7) где А! = QTAQ, b' = QTb; при этом: 1) знаки инвариантов 1%, Кз не изменяются; 2) в случае, когда е и е' - ортонормированные базисы, инвариан- ты li, I2, Кз и полуинвариант К2 не изменяются. Доказательство. Подставим в уравнение (58.2) вместо старых координат X их выражения через новые координаты X': X = QX'. Тогда в новой системе координат Ох'у' линия L определяется урав- нением X'TQTAQX' + 2bTQX' + а33 = О
196 Глава XI. Алгебраические линии второго порядка на плоскости X'T{QTAQ)X' + 2(QTb)TX' + а33 = 0. Это означает, что в новом уравнении квадратичная часть опреде- ляется матрицей А' = QTAQ, (58.8) а линейная часть - столбцом b' = QTb. Таким образом, общее уравне- ние (58.2) линии £ преобразуется в (58.7). Докажем утверждение п.1. Из (58.8) следует, что |Л'| = |QTAQ\ — | А|- • |Q|2, т.е. I2 = 72|Q|2, где |<?| # 0. Следовательно, sgn/2 = sgn/2. Далее, если Q О О 1 QT о 0 1 и IQI = IQTI = IQ|. Матрица В', соответствующая уравнению (58.7), имеет вид В' - А' Ъ' Ь'т йзз QTAQ QTb bTQ йзз QTBQ. Следовательно, |В'| = |В| • |(?|2 = |В| • |Q|2 и К3 = /C3|Q|2. Таким образом, sgn-Кз = sgnK3. Докажем п.2. Если оба базиса е и е' ортонормированы, то матри- ца перехода Q будет ортогональной матрицей (§24) и QT = При этом матрица Q также будет ортогональной, ибо QTQ = QQT = I, и, следовательно, QT = Q-1. Таким образом, A'=Q~l AQ и В' = Q~XBQ, т.е. пары матриц А' и А, В' и В подобны. Отсюда И из теоремы 58.1 (нее следствия) вытекает, что числа Д = 1гЛ, /2 — Щ, Кз — |-В|, К2 = ai —12 (где dj - сумма главных миноров второго порядка ма- трицы В) при переходе к новому базису не изменяются. Замечание. Отметим, что при переходе к новому базису свобод- ный член не изменяется. Теорема 58.3. При переносе начала координат в точку О'(а, (3) общее уравнение (58.2) преобразуется в уравнение Х'ТАХ' + 2УГХ' 4- а‘33 = 0, (58.9) где b' = b + Аа. а33 = атАа 4- 2Ьта 4- а33, а = (а,/3)т, при этом инварианты. 1\, 12, не изменяются. Доказательство. Подставим в уравнение (58.2) X = X' + а. Тогда (Х'Т + ат) А(Х' 4- а) 4- 2bT(X' 4 а) 4- а33 = 0, или Х'т АХ' 4 Х'т Аа + о? AX' 4 атАа 4 2bTX' 4 2Ьта 4 а33 = 0. (58.10) Заметим, что произведение Х'т Аа есть вещественное число и его мож- но заменить результатом транспонирования, так что Х'т Аа = = (Х'тАа)т = атАтX' — {АарX'. Так как А = Ат, то атАХ' —
§ 58. Общее уравнение линии второго порядка 197 = aTATX' — (Аа)тX'. С учетом этих соотношений уравнение (58.10) может быть записано в виде Х'ТАХ' + 2( Аа + Ь)ТХ' + атАа + 2Ьта + а33 = 0. Это означает, что в новом уравнении квадратичная часть остается прежней, линейная часть определяется столбцом Ь' = Аа + 6, свобод- ный член азз равен атАа+2Ьта+азз- Таким образом, уравнение (58.2) линии £ преобразуется в (58.9). Что касается инвариантов, то неизменность Zj и Z2 очевидна, так как матрица квадратичной части А осталась прежней. Докажем, что Кз не изменяется. Имеем <*п ai2 <*13 <312 <*22 <*23 <*13 <*23 <*33 в' = <*11 <*12 <*12 <*22 <*13 + <*<*Ц + 00-12 <*23 + <*<*12 + 00-22 <*13 + <*<*11 + 00-12 <*23 + <*<*12 + 00-22 а33 где <*33 — enft2 + 2а + а2202 + 2ai3a + 2а23/3 + а33 = — <*зз + <3:ai3 + 00,23 + <*(<*13 4- аац + /Заи) + /?(а23 + <*<*12 + 00,22)- Последнее соотношение означает, что матрица В' получена из матри- цы В с помощью элементарных преобразований: если к третьей строке матрицы В прибавить линейную комбинацию первых строк с коэф- фициентами а, 0, а затем к третьему столбцу прибавить такую же линейную комбинацию первых столбцов, то получится матрица В'. Следовательно, К'3 — |В'| = |В| = Кз. Теорема 58.4. Общее уравнение линии второго порядка, за- данное в прямоугольной декартовой системе координат, переходом к другой прямоугольной декартовой системе координат приводится к одному и только одному из следующих типов уравнений: I. Aiz2 + Ajy2 + ао = 0, где А3А2 0; II. А2у2 + 2Ьох = 0, где A25q / 0; (58.11) III. А2у2 + со = 0, где А2 / 0. Доказательство. Пусть Оху - прямоугольная декартова си- стема координат и линия £ задана в этой системе координат общим уравнением (58.1). Шаг 1 (преобразование базиса). Метод вращений. Покажем, что если ай / 0, то поворотом осей можно привести квадратичную часть уравнения (58.1) к сумме квадратов. Действительно, поворот осей на угол <р приводит к новому базису е' = eQ с матрицей перехода (§24)
198 Глава XI. Алгебраические линии второго порядка на плоскости COSp sin. 99 -smy cos p . Очевидно, QTQ = QQT = I, т.е. Q - ортогональ- ная матрица. Согласно теореме 58.2 при переходе к системе координат {О;е'х.ег) матрица квадратичной части А преобразуется в матрицу А' = COS Ip sin р — sin p cos p an ai2 aj2 0.22 cos p — sin p sin p cos p Q = при этом a'i2 = —ai t cos p sin p — sin2 p + a12 cos2 p -I- a22 cos p sin p — = ai2cos2y> - —(<2.ц - a22) sin2y>. Если ctg2$p = (an - a22)/(2ai2), to a'12 = 0. Следовательно, при пово- роте осей на такой угол р квадратичная часть уравнения преобразу- ется в сумму квадратов и уравнение (58.1) в новой системе координат Ох'у' будет иметь вид а'ц2:'2 + a22y/2 + 2a'13rr' + 2a23j/ + азз = 0. (58.12) При этом в силу теоремы 58.2 инварианты Д, I2, Кз и полуинвариант К2 останутся прежними. Метод, использованный здесь, называется методом вращений. Шаг 2 (перенос начала). Дальнейшее упрощение уравнения (58.12) основано на том, что если в нем содержится ненулевой квадрат какой- либо переменной, то переносом начала можно освободиться от этой переменной в первой степени. Действительно, если a'n / 0, то — aii а'ц#'2 4- 2а'13т' = а'п ( х'2 + 013 \ _ ^13_ = J д." = + а'п ( 2Д13 _Л _ —Г~х = аи / “13 1 _ ' Д'2 — > — апа; “11 J а132 а'ц Таким образом, если а'ц / 0, а22 / 0, то переносом начала х"=а/ + ф, у"=у'±^ au a22 уравнение (58.12) преобразуется в уравнение “ит + а222/ "Г о33 — 0, ОцО22 О» а'132 а232 где а33 = азз-----------}—, т е- в уравнение типа I. а11 а22 Пусть один из коэффициентов а'п или а22 равен нулю. Если а'ц = О, а22 0, то переносом начала
§ 58. Общее уравнение линии второго порядка 199 „и _ .ч , а23 х —х , у =у + — а22 уравнение (58.12) преобразуется в уравнение а22у"2 + 2а'13х" + азз = °. а22 / °> (58.13) где а33 = азз — агз2/а22- Случай, когда а'к 0, а22 = 0, сводится к предыдущему переиме- нованием переменных х =у, у =х (58.14) что соответствует переходу к новому базису с матрицей перехода . Нетрудно проверить, что Q - ортогональная матри- ца, поэтому числа Ц, 13, Кз, Кз при таком переходе не изменяются. Очевидно, что новая система координат получена поворотом осей с последующим отряжением одной из осей относительно другой. Итак, дальнейшее преобразование общего уравнения (58.1) сводит- ся к преобразованию уравнения (58.13). Если в этом уравнении а'13 — 0, то уравнение (58.13) относится к уравнению типа III. Если же а'13 / 0, то 2а'13х" + а33 = 2а'13 (х" + а33/(2а'13)) и перено- Q = о 1 1 о сом начала х'" = х" + а^з/(2а'13), у'" = у" уравнение (58.13) приводится к уравнению а22у"'2 + 2а'13х"' = 0, а22а'13 / О, которое относится к типу II. Отметим, что все промежуточные и окончательная системы коор- динат оставались прямоугольными, так как преобразования базиса с помощью ортогональной матрицы перехода сохраняют свойство ор- тонормированности (§24). Итак, переходом к новой прямоугольной системе координат общее уравнение (58.1) приводится к одному из трех указанных типов уравнений. Перейдем к вопросу о единственности. Для этого найдем инвари- анты I?, Кз для каждого из уравнений (58.11). Имеем для уравнения типа I: Ai О А2 для уравнения типа II: О О О А2 ’ Ai 0 0 В = 0 а2 0 0 0 ао О Ьо О а2 о Ьо О о (58.15) (58.16)
200 Глава XI. Алгебраические линии второго порядка, на. плоскости для уравнения типа Ш: А = 0 О О Л2 0 0 о в = о а2 о . о 0 Со (58.17) Следовательно, 1) 12 / 0 для уравнения типа I; 2) 12 = 0, Кз / 0 для уравнения типа II; 3) 12 = 0, Кз = 0 для уравнения типа III. Эти условия взаимно исключают друг друга, и так как общее урав- нение и уравнения (58.11) имеют одинаковые инварианты 12, Кз, то общее уравнение (58.1) приводится только к одному из трех указан- ных типов уравнений. Уравнения (58.11) называются приведенными уравнениями линии второго порядка. Замечание. Особо отметим, что в прямоугольных координатах коэффициенты Ai и Л2 приведенных уравнений являются инвариан- тами линии, так как Ах + А2 — li, AiA2 — 12 (58.18) и, следовательно, Ai и А2 являются корнями характеристического многочлена матрицы Л: А2 - ДА +12 = 0. (58.19) § 59. Классификация линий второго порядка на плоскости Канонические уравнения. Теорема 59.1. Общее уравнение (58.1) линии второго порядка, заданное в прямоугольной декартовой системе координат, определяет одну и только одну из девяти линий, для каждой из ко- торых существует прямоугольная система координат, в которой уравнение этой линии имеет следующий вид: - мнимый эллипс;
§59. Классификация линий второго порядка на плоскости 201 3> ?+&=° I2 у а2 Ь2 6) у2 = 2рх (р > 0) 7) у2 = а2 (а / 0) 8) у2 = -а2 (а / 0) 9) у2-0 - пара мнимых пересекающихся прямых; - гипербола; - пара пересекающихся прямых; - парабола; - пара параллельных прямых; - пара мнимых параллельных прямых; - пара совпадающих прямых. Доказательство. Пусть общее уравнение (58.1) переходом к новой прямоугольной декартовой системе координат преобразова- лось в приведенное уравнение. Рассмотрим все возможные при этом варианты. Если 12 7^ 0, то уравнение (58.1) преобразуется в приведенное урав- нение типа I: Ахх2 + А2у2 + а0 = 0, (59.1) где Л1Л2 / 0. Для этого уравнения согласно (58.15) Л = А] 4-А2, I2 — А] Аг, Аз — АхАгао- (59.2) В зависимости от знаков Ai, Аг, ао уравнение (59.1) может быть записано по-разному. 1. Если А^г > 0, А;а0 < 0, т.е. 12 > 0, 71А3 < 0, (59.3) то простейшие преобразования приводят уравнение (59.1) к равно- 2 2 2 2 ЗГ У , % У , 9 сильному уравнению-----——I------— = 1 или —х- + -rr = 1, где а = —ао/Ai —о^/л2 о* = ——, сг = ——. В этом уравнении можно считать, что а > о > 0, Ау Л2 так как в противном случае достаточно переименовать переменные, как это было сделано в (58.14). Мы получили уравнение 1, известное нам как каноническое уравнение эллипса. 2. Если AiА2 > 0, AjOo > 0, т.е. 72 > 0, 7iA3 > 0, (59.4) то, поступая аналогично, приходим к уравнению 2. Ясно, что нет ни одной точки плоскости, удовлетворяющей это- му уравнению. Принято говорить о нем как об уравнении мнимого эллипса.
202 Глава XI. Алгебраические линии второго порядка на плоскости 3. Если А1А2 >0, ао = 0, т.е. 12 >0, К3 = 0, (59.5) то уравнение (59.1) эквивалентно уравнению 3, где а2 = |Aj| г, 62 = 1А2Г1- Ясно, что только начало координат удовлетворяет этому уравне- нию. Принято говорить о нем как об уравнении пары мнимых пере- секающихся прямых (или вырожденного эллипса). 4. Если А1А2 <0, ао 0, т.е. 12 <0, К3 ± 0, (59.6) то уравнение (59.1) эквивалентно ническое уравнение гиперболы. 5. Если АхАг <0, ао = 0, т.е. уравнению 4. Это известное кано- 12 <0, Кз = 0, (59.7) то уравнение (59.1) эквивалентно уравнению 5. Оно определяет пару Ь пересекающихся прямых у = ±—х. а Рассмотренные линии образуют первую группу линий второ- го порядка на плоскости. Ими исчерпываются все линии, которые определяются приведенными уравнениями типа I, т.е. случаем, когда 6. Если 12 = 0, Кз 0, то уравнение (59.1) преобразуется в при- веденное уравнение типа II: Х2у2 4- 2Ьох — 0, где АгЬо # 0- Для этого уравнения согласно (58.16) Л = Л2, h =0, Кз = -А2Ь2 / 0. Уравнение (59.8) эквивалентно уравнению у2 = 2рх, где р — —Ъо/Х2. В этом уравнении можно считать, что р > 0, так как в противном случае достаточно выполнить отражение оси Ох от- носительно оси Оу: х' = —х, у' = у, что соответствует переходу к новому базису с матрицей перехода Q = ортогональности приводит к ортонормированному базису и не меняет инвариантов. Итак, мы получили уравнение 6, известное как канони- ческое уравнение параболы. Если 12 — 0, Кз = 0, то уравнение (59.1) преобразуется в приве- денное уравнение типа 1П: (59.8) (59.9) -1 0 0 , которая в силу 1 Аг у2 + Со — 0, (59.10)
§ 59. Классификация линий второго порядка на плоскости 203 где Аг 0. Для этого уравнения согласно (58.17) /1 = Л2, 12 =0, К3 = 0, К2 = Л2со. (59.11) Линии этой группы определяются полуинвариантом К2. Как сле- дует из теоремы 58.2, преобразования базиса с помощью ортогональ- ной матрицы перехода не изменяют К2. Лемма. Если 72 — К3 = 0, то полуинвариант К2 не изменя- ется при параллельном переносе. Доказательство леммы. Не изменяя числа К2, преобразуем общее уравнение (58.1) в уравнение (58.12), в котором a'i2 = 0. Для этого уравнения д? _ а'п 0 0 а22 Так как 12 = 0, то а'ца22 = 0. Поэтому одно из чисел а'п или а22 равно нулю. Не изменяя инвариантов, можно считать (см. обсуждение (58.14)), что а'ц = 0. Тогда ’ 0 о . а13 В' = 0 а(3 а22 а23 а2з азз . Но К3 = 0, поэтому azi3 = 0 и уравнение (58.12) имеет вид а'22у'2 + ^а2зУ' + азз — 0, (59.12) при этом ’ 0 0 0 В' = 0 а22 а23 0 ' а23 ®33 . К2 — К2 — о2газз ^гз- (59.13) При параллельном переносе х.' = х" + а, у' — у" + (3 уравнение (59.12) преобразуется в уравнение а'22У"2 + 2(/Зд22 + о.2з)у" + 2/За23 + азз = 0, для которого В" '00 0 0 а22 0а22 Т а2з 0 /За22 Т <12з Дзз* <122/^ -|- 2а23/3 К2 = а22(а33 + о.'22(32 + 2а'23/3) - (/За22 + а'23)2 = а22а33 - а'23. Из (59.13) следует, что К2 = К2. Лемма доказана. Продолжим доказательство теоремы и вернемся к уравнению (59.10). Отметим, что согласно лемме полуинварианты К2 в уравне- ниях (58.1) и (59.10) совпадают.
204 Глава XT. Алгебраические линии второго порядка на плоскости 7. Если A2cq < 0, т.е. К2 < 0, (59.14) то уравнение (59.10) эквивалентно уравнению 7 (где а2 = — cq/X2 > 0), которое определяет пару параллельных прямых: у = а и у = —а. 8. Если А2со > 0, т.е. К2 > 0, (59.15) то уравнение (59.10) эквивалентно уравнению 8 (где а2 = со/А2 > 0). Ясно, что ни одна точка плоскости не удовлетворяет этому уравне- нию. Принято говорить о нем как об уравнении пары мнимых парал- лельных прямых. 9. Если со = 0, т.е. К2 = 0, (59.16) то уравнение (59.10) эквивалентно уравнению 9, которое определяет пару совпадающих прямых, у = 0 и у — 0. Условия (59.3)-(59.7), (59-9), (59.11), (59.14)-(59.16) исчерпывают все варианты линий второго порядка на плоскости и взаимно ис- ключают друг друга. Следовательно, общее уравнение (58.1) опре- деляет одну и только одну из девяти перечисленных линий. Для каждой из этих линий найдена прямоугольная декартова си- стема координат, в которой уравнение линии имеет вид 1-9. Эти урав- нения называют каноническими уравнениями линий второго порядка. Линии, для которых 12 > 0, называются линиями эллиптического типа; 12 < 0 - гиперболического типа; 12 — 0 - параболического типа. Замечание. Если общее уравнение (58.1) линии второго порядка задано в прямоугольной декартовой системе координат, то канониче- ское уравнение линии может быть найдено по инвариантам, так как согласно (58.18) и (58.19) коэффициенты Ai, А2 приведенных уравне- ний являются корнями характеристического многочлена матри- цы А: А2 - ДА + 12 = 0. При этом если Ai < А2, то в силу (59.2), (59.9), (59.11) _ К3 .2 _ К3 _ К2 a°-~h' Результаты проведенных исследований сведены в следующую таб- лицу.
§ 59. Классификация линий второго порядка на плоскости 205 Приведенное уравнение Но- мер Каноническое уравнение линии Название линии Признак линии Aix2 4- А2у2 + = 0t h А1А2 0 1 Р |Н IV + О’ * |*е V “|м о И Эллипс Z2 > 01 ЦК3 <0 2 2 2 — + ^- = -1 а* 6’ Мнимый эллипс Z2 > 0, ЦКз > 0 3 2 2 2-+ =0 Пара мнимых пересекаю- щихся прямых z2 > 0, Кз =0 4 2 2 5_ _ =1 а» 62 Гипербола /2 < 0, Кз # 0 5 — - = 0 а3 Ь2 Пара пересе- кающихся прямых h < 0, К3 =0 Л1<2±2у/-^1 = 0, ЛКз/0 6 у2 = 2pz, Р > о Парабола /2 = 0, Кз / 0 111/2 + у~ = 0, 11 Л / о 7 У2 = а2, а / 0 Пара парал- лельных прямых z2 — 0, Кз = 0i К2 < 0 8 у2 = — д2, а /- 0 Пара мнимых параллель- ных прямых V II II о о-° 9 У2 = 0 Пара совпа- дающих прямых о°° II И И Метод Лагранжа. Теорема 58.4 о приведенных уравнениях оста- ется справедливой и в аффинной системе координат, так как тип при- веденного уравнения определяется только знаками инвариантов 12, Кз, которые в силу теоремы 58.2 сохраняются при преобразованиях аффинной системы координат. Вместо вычисления инвариантов или метода вращений можно использовать метод выделения полных ква- дратов (метод Лагранжа), который состоит в следующем. 1. Пусть в общем уравнении (58.1) дц / 0. Выделим полный ква- драт в группе членов, содержащих переменную х: ацх2 + 2а12ху + 2ai3i = дц \ 2 / \ 2 012 \ ( <112 \ X Ч------у + Д13 I — Дц I --------У + Д13 ) “11 / \ац / Положим I а12 X — X Ч-----У ч- Д13- вы (59.17)
206 Глава XI. Алгебраические линии второго порядка на плоскости Тогда уравнение (58.1) примет вид а^х'2 + а22у2 + 2а23у + а33 = 0. (59.18) Если а22 7^ 0, то положив 1/ = у+ф, (59.19) а22 приводим уравнение (59.18) к уравнению ацх'2 + а22у2 4- а33 = 0, аца22 0, (59.20) которое является приведенным уравнением типа I. Преобразования координат (59.17), (59.19) определяют переход к новому базису с по- мощью матрицы перехода Q12 " Яц 1 и переноса начала. Согласно теоремам 58.2 и 58.3 знаки инвариантов 12, К3 в уравнениях (58.1) и (59.20) совпадают. Если в уравнении (59.18) а22 — 0, то: а) в случае когда а'23 = 0, уравнение (59.18) является приведенным уравнением типа Ш; б) в случае когда а'23 Ф 0, положив 2^23 приводим уравнение (59.18) к уравнению ацт'2 4- 2а'13у' = 0, аца'13 0, которое является приведенным уравнением типа П. 2. Пусть в общем уравнении (58.1) ац = 0, / 0. Поступая так же, как и в п.1 (с точностью до названия переменных), освобождаемся от слагаемого Ча^ху и линейной части (если это возможно) и прихо- дим к приведенным уравнениям, не изменив знаков инвариантов 72, К3. 3. Пусть в общем уравнении (58.1) ац = 0, а22 = 0. Тогда ai2 0. Положив х = х1 -I- у', у = х' — у', (59.21) сводим этот случай к уже рассмотренным. Отметим, что преобразова- ния координат (59.21) отвечают переходу к новому базису с матрицей 1 11 перехода Q — । . Так как приведенные уравнения (58.11) определяются лишь зна- ком инвариантов 12, Кз, то в результате выполненных преобразований общее уравнение (58.1) приведется к одному и только одному из урав- нений (58-11). С помощью метода Лагранжа легко устанавливается тип линии, однако не может быть получено каноническое уравнение.
Глава XII. Линейное пространство над произвольным полем В гл. IV мы рассматривали вещественные линейные пространства. Веществен- ными они назывались потому, что операция умножения на число предусматривала умножение вектора на вещественные числа. В §43 мы уже отмечали, что все свой- ства линейного пространства остаются в силе, если поле вещественных чисел R заменить произвольным полем Р. В этой главе воспроизводится известное опре- деление линейного пространства для случая произвольного поля, напоминаются уже известные факты и рассматриваются новые. § 60. Определение и терминология Пусть дано поле Р. Непустое множество V называется линейным или векторным пространством над полем Р, если на этом множе- стве определены внутренний закон композиции V х V —» V, называ- емый сложением, и внешний закон композиции Р х V —> V, называе- мый умножением на число из поля Р, удовлетворяющие следующим аксиомам: для любых a, b, с € V и а, /3 € Р 1) а-\-Ъ~Ь-\-а~, 2) (а 4- 6) 4- с — а 4- (b -I- с); 3) существует элемент в € V такой, что а + в = в + а = а; 4) для любого элемента a G V существует элемент —a G V такой, что а + (—а) = (—а) + а = в; 5) 1 а — а; 6) а(/3а) = (а/3)а; 7) (а 4- /3)а — аа + [За: 8) а(а 4-6) = аа 4- ab. Линейное пространство над полем R называется вещественным линейным пространством, а над полем С - комплексным. Два вектора х и у линейного пространства называются коллине- арными, если они отличаются лишь числовым множителем, т.е. либо х = ay, а € Р, либо у = [Зх, (3 € Р. Примеры. 1. Арифметическое пространство Рп - линейное прос- транство над полем Р. Как и в случае R”, здесь Рп = {я — (®i,. • •, in)|n € Р, k = l,n} с операциями: если х — (ii,...,in) и у = = (.У1, ---'Un), а € Р, то х + у = (li + У},. ,хп + уп), ах = (aii,...,axn). 2. В частности, арифметическое пространство Сп есть комплекс- ное линейное пространство. В таком пространстве арифметические векторы умножаются на комплексные числа. Однако можно было бы ограничиться умножением только на вещественные числа, при этом
208 Глава ХП. Линейное пространство над произвольным полем результат умножения, несомненно, останется арифметическим век- тором из Сп. Это означает, что внешний закон композиции можно ввести и как умножение на вещественные числа, т.е. как отображе- ние RxCn Сп. Символом Сд будем обозначать множество Сп, в котором внешний закон композиции определен как R х Сп —> С71. Нетрудно проверить, что Cg - вещественное линейное пространство. В частности, само поле С можно рассматривать как вещественное ли- нейное пространство Cr . 3. Аксиомы линейного пространства выявляют алгебраические свойства многих классов функций, часто встречающихся в математи- ческом анализе: например, С[0,1] - множество непрерывных функций на отрезке [0,1]; £>[0,1] - множество всех дифференцируемых функ- ций на отрезке [0,1]; С1 [0,1) - множество всех функций, непрерыв- ных вместе с первой производной на отрезке [0,1]. Хотя у каждого из перечисленных множеств имеются и другие замечательные свойства, все они охватываются единой алгебраической схемой, аксиоматизиру- емой определением линейного пространства. Нетрудно проверить, что эти множества являются вещественными линейными пространства- ми относительно обычных операций сложения функций и умножения функции на число. Линейные пространства функций принято назы- вать функциональными пространствами. Точки в линейном пространстве. В геометрических простран- ствах мы имели дело и с векторами, и с точками: каждая упорядо- ченная пара точек А и В однозначно определяла вектор а = аД каждый вектор а мы могли отложить от любой точки С, и это одно- значно определяло точку D - конец вектора а, отложенного от точки С. Если зафиксировать точку О как начало любого вектора простран- ства, то каждому вектору можно поставить в соответствие точку, ко- торая является его концом. Это приводит к взаимно однозначному соответствию между векторами пространства и точками, т.е. к воз- можности “отождествить” векторы и точки пространства. Обобщение этого факта для произвольного линейного простран- ства приводит к понятию аффинного пространства. Аффинным (или точечно-аффинным) пространством над линей- ным пространством V называется множество S элементов, называе- мых точками, для которого заданы а) линейное пространство V над полем Р и б) отображение v. S х S —> V, ставящее в соответствие каждой упорядоченной паре точек А, В € S вектор v(A, В) € V и удовлетво- ряющее следующим аксиомам: 1) для любой точки А G S и любого вектора а € V существует единственная точка В G S, для которой и(А.В) = а;
§ 60- Определение и терминология 209 2) для любых трех точек А, В, С € S имеет место равенство v(A,B) + v(B,C) = v(A,C). Обозначение: вектор и(Л,В) обозначается символом А&. Таким образом, A^ + В^ = А&. Из аксиом аффинного пространства следует, что а) А& = 0 тогда и только тогда, когда А = В; б) лё = -в1. Размерностью аффинного пространства S называется размерность линейного пространства V. Примеры. 1. Геометрические пространства Vi, V}, Vs являются аффинными пространствами над самими собой. 2. Любое линейное пространство V можно рассматривать как аф- финное пространство над самим собой. Для этого достаточно векторы назвать точками и определить отображение v: V х V —> V следующим образом: и (а, Ь) = а — Ь. (60.1) 3. Любое аффинное пространство S можно рассматривать как ли- нейное. Для этого зафиксируем какую-нибудь точку О пространства S и назовем ее началом. Тогда каждой точке А € S можно поставить в соответствие вектор оХ , называемый радиус-вектором точки А отно- сительно начала О. Множество радиус-векторов всех точек простран- ства S и составляет линейное пространство V. Более того, имеет место Теорема 60.1. Отображение <р: S -ь V, определяемое пра- вилом ___ <р(А) = ОХ, является биекцией, сохраняющей операцию и аффинного простран- ства, т.е. 1?(Л, В) = v(<p(A), <р(В)). (60.2) Доказательство. Биективностьотображения непосредствен- но вытекает из аксиомы 1. Что касается равенства (60.2), то согласно определению (60.1) оно эквивалентно вытекающему из аксиомы 2 ра- венству А$ = О$ -оХ. Теорема60.1 позволяет ‘‘отождествить” аффинные и линейные про- странства. Единственное отличие аффинных пространств от линей- ных состоит в том, что в линейном пространстве имеется единствен- ное начало в - нулевой вектор, в то время как в аффинном простран- стве в качестве начала можно взять произвольную точку.
210 Глава ХП. Линейное пространство над произвольным полем Замечание. В дальнейшем, говоря о линейном пространстве, будем иметь в виду, что его можно рассматривать как аффинное пространство с фиксирован- ным началом. Тогда в нашем распоряжении будут и векторы, и точки, как концы векторов. §61. Линейная зависимость. Ранг и база системы векторов Понятие линейной зависимости и связанные с ней утверждения рассматрива- лись в главе IV (§ 14-16) и относились к вещественным линейным пространствам. Все определения, а также теоремы и их доказательства остаются в силе и в произ- вольном линейном пространстве. Введем новые понятия. В дальнейшем, употре- бляя термин “линейное пространство”, будем иметь в виду линейное пространство над произвольным полем Р, не оговаривая это дополнительно. Будем рассматривать конечные системы ai,...,aic векторов ли- нейного пространства. Линейно независимая подсистема системы векторов, через ко- торую линейно выражается любой вектор системы, называется базой этой системы векторов. Примеры. 1. В системе из нулевых векторов нет ни одной базы, так как любая ее подсистема линейно зависима. 2. Базисные строки матрицы согласно теореме о базисном миноре образуют базу системы строк, рассматриваемых как векторы ариф- метического пространства. Это же относится и к базисным столбцам. 3. В системе трех неколлинеарных векторов плоскости Vj любая пара векторов образует базу. Обратим внимание на то, что в этих примерах система векторов может обладать не единственной базой, но при этом все базы одной системы состоят из одинакового числа векторов. Теорема 61.1. Подсистема системы векторов является базой системы векторов тогда и только тогда, когда образует мак- симальную линейно независимую подсистему. Доказательство. Необходимость. Пусть в системе векто- ров aj,..., а,.,..., а* подсистема щ,..., От образует базу (здесь для упрощения записи в качестве подсистемы взяты первые г векторов, что, как будет видно из доказательства, не нарушает общности рассу- ждений) . Тогда любая большая подсистема будет линейно зависимой в силу теоремы 16.2, так как любой ее вектор линейно выражается через базу а\,...,аг. Таким образом, база образует максимальную линейно независимую подсистему системы векторов. Достаточность. Пусть aj,... ,Ог - максимальная линейно не- зависимая подсистема системы векторов а\,..., аГ,..., а^ . Тогда для любого вектора аг, i = l,k, подсистема ai,...,ar,ai линейно зави- сима (если i < г, то как подсистема, содержащая два одинаковых вектора; если же г > г, то как подсистема из г + 1 > г векторов). В силу теоремы 14.6 вектор а, линейно выражается через aj,..., аг. Таким образом, aj,..., о,- - база.
§ 62. Базис и размерность 211 Следствие 1. Все базы одной системы векторов состоят из одинакового числа векторов, равного максимальному числу линейно независимых векторов системы. Число векторов базы называется рангом системы векторов. Оче- видно, ранг системы векторов равен максимальному числу линейно независимых векторов системы. Обозначение: rg(ai,-..,а„). Две системы векторов линейного пространства называются экви- валентными, если любой вектор каждой из этих систем линейно выра- жается через другую систему. Из определения следует, что база си- стемы векторов эквивалентна самой системе. Теорема 61.2. Если система векторов а\,...,ак линейно выражается через bi,... ,bm , то rg(aj,. - •, a*) < rg(bi,..., fem). Доказател ьство. Пусть ai,... ,аг и b^,... ,bs - базы рассмат- риваемых систем. Из условия теоремы и транзитивности свойства “ли- нейной выражаемости” следует, что база ai,..., От первой системы ли- нейно выражается через базу 6;,..., Ья второй. Тогда г < s, так как в противном случае, если г > s, система сц,... ,Ог была бы линейно зависимой в силу теоремы 16.2. Следствие 2. Ранги эквивалентных систем совпадают. Следствие 3. Эквивалентные линейно независимые системы векторов состоят из одинакового числа векторов. § 62. Базис и размерность Говорят, что система векторов ei,..., еп линейного пространства V порождает пространство V, если любой вектор х € V является линейной комбинацией ej,..., е^ . Упорядоченная система векторов ei,..., еп линейного простран- ства V называется базисом пространства V, если она линейно не- зависима и порождает V. Очевидно, что это определение совпадает с определением базиса, данным в §17 для вещественного линейного пространства. Теорема 62.1. Любые два базиса линейного пространства состоят из одинакового числа векторов. Это утверждение вытекает из эквивалентности двух базисов ли- нейного пространства и следствия 2 (§61). Итак, число векторов базиса не зависит от самого базиса и од- нозначно определяется самим пространством. Ответ на вопрос, что представляет собой это число, дает теорема 17.1, справедливая и в пространстве над произвольным полем. Напомним, что число векторов базиса линейного пространства V называется размерностью пространства V и обозначается символом dimV. Размерность нулевого пространства по определению считает- ся равной нулю. Из теоремы 17.1 следует, что размерность линейного пространства совпадает с максимальным числом линейно независи-
212 Глава XII. Линейное пространство над произвольным полем мых векторов этого пространства. Линейное пространство размерно- сти п, где n € N, называется n-мерным. Нулевое пространство и п-мерные пространства называются конечномерными. Линейное пространство называется бесконечномерным, если для любого числа k € N в пространстве существует к линейно незави- симых векторов. Пример бесконечномерного пространства дан в §17 (пример 5). В курсе линейной алгебры изучаются лишь конечномер- ные линейные пространства. Теорема 62.2 (о неполном базисе). В n-мерном прост- ранстве любую линейно независимую систему из к, где к < п, век- торов можно дополнить до базиса. Доказательство. Пусть в1,...,е* - линейно независимая си- стема векторов пространства V. Так как к < п, то в силу теоре- мы 17.1 система векторов ei,... ,е* не является базисом V и, следова- тельно, не порождает всего пространства V. Пусть вектор € V не является линейной комбинацией ei,...,е*, тогда система векторов й], ... ,efc,e/c+i линейно независима (в силу теоремы 14.6). Если к + 1 = п, то эта система векторов образует базис пространства V; если же к -I-1 < п, то аналогичным образом построим линейно неза- висимую систему из 2 векторов. За п— к таких шагов мы построим искомый базис ei,..., е^,..., еп. Точно так же, как и в §17, определяются координаты вектора в базисе и матрица перехода от одного базиса к другому. При этом все факты, связанные с этими понятиями, остаются в силе и в общем случае, так как их доказательства опираются на те свойства веще- ственных чисел, которые имеют место в любом поле.' Напомним эти факты. 1°. Разложение вектора по базису единственно. 2°. Координаты вектора обладают свойством линейности. 3°. При переходе от базиса е к базису f = eQ координаты вектора х изменяются по следующему закону: хе = Qxf. Примеры. 1. В арифметических пространствах Рп, Rn, Сп еди- ничные векторы (14.6) образуют базис (§17, пример 2). Этот базис принято называть ес7пественным. Координаты любого вектора а = — (ai,...,an) в естественном базисе совпадают с компонентами а\,...,ап этого вектора. 2. В арифметическом пространстве CJJ векторы (14.6), очевидно, не могут быть базисом, так как умножением этих векторов только на вещественные числа нельзя получить любой комплексный арифмети- ческий вектор a = (ац + i$i, -.., an + Д?п), где a^,/3* € R, k = 1,n. Добавим к векторам (14.6) еще п векторов: Д = (г,0,...,0), /2 = (0, г,... ,0)-/„ = (0,0,...,г). Покажем, что система векторов ei,..., еп, Д,..., /п образует ба- зис пространства С£. Действительно, лицейная комбинация этих век- торов с вещественными коэффициентами 0^,(3^ имеет вид
§ 63. Изоморфизм линейных пространств 213 п п + ^0kfk = («1 +i0i,-..,an+i(3n) (62.1) t=l i=l и равна нулевому вектору в = (0,..., 0) тогда и только тогда, когда <^к + i0k — 0, к = 1,п, т.е. 0^ = (Зк = 0, к — 1, п. Следовательно, векторы ei, • •, en, /j,..., линейно независимы. Они порождают все пространство Cg, так как любой вектор (cti + i(3i,...,an + if3n) из Cg согласно (62.1) является линейной комбинацией этих векторов с вещественными коэффициентами 0ц,..., аПУ /Зу,..., /Зп. Итак, dim Cg = 2n. § 63. Изоморфизм линейных пространств Два линейных пространства V) и Vj над общим полем Р называг ются изоморфными, если существует биективное отображение tp : V) —> Vj, которое сохраняет законы композиции, т.е. если для любых векторов ас, у 6 Vj и любого числа a G Р 1) у>(:с + у) = </j(z) +<р(у); 2) tp(ax) = сир(х). Обозначение: Ц = . Само отображение р называется изо- морфизмом линейных пространств. Примеры. 1. Геометрические пространства У), V2, V3 векторов на прямой, на плоскости и в пространстве изоморфны арифметиче- ским пространствам R1, R2 и R3 соответственно. Действительно, по- ставим в соответствие каждому вектору х G Vn набор его коорди- нат в каком-либо базисе е, т.е. арифметический вектор хс € R", где п — 1,2,3. Это соответствие взаимно однозначно и сохраняет законы композиции, так как координаты вектора обладают свойством линей- ности (§17). 2. V2 = CR. 3. Pmxn = Ртп и, в частности, Rmxn = Rmn. Отметим простейшие свойства изоморфных пространств. 1°. Отношение изоморфизма есть отношение эквивалентности на множестве всех линейных пространств над полем Р. 2°. В изоморфных пространствах а) образ (и прообраз) линейной комбинации векторов есть ли- нейная комбинация образов (прообразов) с теми же коэффициента- ми; б) образ (и прообраз) нулевого вектора есть нулевой вектор; в) образ (и прообраз) линейно независимой системы векторов образует линейно независимую систему; г) образ (и прообраз) базиса есть базис. Доказательства этих свойств опираются лишь на определение и элементарные свойства рассматриваемых объектов. Мы предоставля- ем их читателю.
214 Глава XII. Линейное пространство над произвольным полем Несмотря на простоту формулировок, уже эти свойства говорят о том, что изо- морфные линейные пространства, даже самой различной природы, с точки зрения свойств линейного пространства неразличимы. Это позволяет многие свойства ли- нейных пространств изучать на линейных пространствах простой структуры. К этой возможности мы будем неоднократно прибегать, проводя все вычисления в арифметических пространствах, а “рисуя” - в геометрических. Теорема 63.1 (критерий изоморфизма). Два линейных пространства над общим полем изоморфны тогда и только тогда, когда их размерности совпадают. Доказательство. Необходимость вытекает из свойства “г” изоморфных пространств. Достаточность. Пусть Vi и V2 - линейные пространства над полем Р и пусть dim Ц = dim V% = n. Выберем в этих пространствах по базису: пусть ei,..., еп - базис Vi, а /1,..., /п - базис V2. Построим отображение : Vi —> У2, поставив в соответствие каждому вектору х — £2"=1 otid € Vi вектор у = 52"=1 € У2 (т.е. вектор, который имеет те же координаты, что и вектор я). В силу единственности разложения вектора по базису отображение ф биективно. При этом Ф - изоморфизм, так как координаты вектора обладают свойством линейности. Следствие. Любое п-мерное вещественное пространство изо- морфно арифметическому пространству R”, а любое п-мерное ком- плексное пространство - арифметическому пространству Сп. Изоморфизм ф: V —> W, построенный при доказательстве теоре- мы 63.1, определяется двумя базисами ех,..., еп и /j,..., fn этих про- странств и переводит вектор х — х^ек в вектор.у = x^fk, имеющий в базисе /1,..., fn те же координаты, что и вектор х в ба- зисе ei,...,еп. В частности, если ej,...,еп - базис пространства V над полем Р и /1,... ,fn ~ естественный базис арифметического про- странства Рп, то отображение ф: V -> Рп, которое каждому век- тору х = Y^1k=ixkek ставит в соответствие арифметический вектор (ii,... ,хп) пространства Рп, является изоморфизмом. Этот изомор- физм называется координатным изоморфизмом, определенным бази- сом ei,..., еп. Координатный изоморфизм “заменяет” линейное пространство (сколь угодно экзотической природы) конкретным арифметическим пространством и сводит решение многих задач теории линейных про- странств к вычислениям в поле. § 64. Линейные подпространства. Линейная оболочка Напомним определение линейного подпространства, данное в §18 (оно остается неизменным и в случае линейного пространства над произвольным полем). Под- множество L линейного пространства V над полем Р называется линейным под- пространством пространства V, если оно само является линейным простран- ством относительно законов композиции в V . Другое определение линейного под- пространства, эквивалентное этому, устанавливается известной теоремой 18.1, ко- торая имеет место и в общем случае.
§ 64. Линейные подпространства. Линейная оболочка 215 Как было установлено в §30, множество всех решений однородной системы уравнений Ах = 0 (64.1) с п неизвестными образует линейное подпространство арифметического простран- ства Rn (или Рп в общем случае, когда А € pmxny Цр0 это подпространство £ говорят, что оно задано однородной системой (64.1), и записывают в виде L : Ах = 0. (64.2) Другой способ задания линейного подпространства дает понятие линейной оболочки. Пусть ai,..., а* - система векторов линейного пространства V над полем Р. Линейной оболочкой системы векторов ai,..., а* называет- ся множество всевозможных линейных комбинаций этих векторов. Го- ворят также, что линейная оболочка натянута на векторы ау,..., а*. . Обозначение: £(ai,... ,а*). Итак, f к ___ £(ai, .. ,afc) = < а = °4ai I ai € Р, г — 1,Лг > . I i=i J Из определения следует, что каждое конечномерное пространство является линейной оболочкой векторов своего базиса. В частности, линейное подпространство, заданное однородной системой (64.2), яв- ляется линейной оболочкой фундаментальной системы решений (§30). Теорема 64.1. Если ai,...,а^ - векторы линейного прост- ранства V, то £(ai,... , a^) является линейным подпространством пространства V. Это утверждение вытекает из теоремы 18.1, так как для линейной оболочки £(ai,... , a^) обе импликации имеют место. Итак, линейная оболочка £(ai,...,a^j _ это линейное подпрост- ранство, которое порождается векторами щ,..., а* . Теорема 64.2. Дее системы векторов линейного прост- ранства эквивалентны тогда и только тогда, когда их линейные оболочки совпадают. Доказательство. Необходимость. Пусть системы векторов ai,...,at и 61,..., Ьт эквивалентны. Тогда £(ai,...,a*) = = £(6i,..., bm), так как для этих множеств, как легко проверить, имеет место двустороннее вложение. Достаточность очевидна. Следствие!. Линейная оболочка системы векторов совпадает с линейной оболочкой своей базы. Следствие 2. Размерность линейной оболочки системы век- торов равна рангу этой системы: dim £(ai,..., afc) = rg(ai,..., afc). (64.3) Теорема 64.3 (о монотонности размерности). Размер- ность линейного подпространства не превосходит размерности пространства. Подпространство той же размерности, что и все пространство, совпадает с пространством.
216 Глава XII. Линейное пространство над произвольным полем Доказательство. Пусть L - линейное подпространство про- странства V, dimL — к, dim V = п. Тогда к < п, так как в противном случае в n-мерном пространстве V существует к, где к > п, линейно независимых векторов (например, векторы базиса L). Пусть к — п и ei,...,еп - базис L. Так как dimV = п, то векторы ei,...,en образуют базис V (§17, утверждение 1). Таким образом, L = V — = £(еь...,еп). § 65. Сумма и пересечение линейных подпространств Пусть L- линейные подпространства линейного прост- ранства V. Суммой подпространств Li,...,Lk называется множе- ство всевозможных векторов х, представимых в виде х = Х{ + ... -I- хк , (65.1) где Xi е L{, i = 1,к. Обозначение: Li 4-... + £*, или 52i= i Итак, к __ 52 Li = {х = Xi 4- ... + Xk | Xi e Li, i — 1, к} . 1=1 Представление (65.1) вектора x называется разложением вектора х по подпространствам L},... Лк • Пересечением подпространств Li,... ,Lk называется множество Li П ... П Lk = {х € V | х е Li, г = 1, к}. Заметим, что пересечение подпространств не пусто, так как всегда содержит нулевой вектор в пространства. Теорема 65.1. Сумма и пересечение подпространств ли- нейного пространства V являются линейными подпространства- ми пространства V. Это утверждение вытекает из теоремы 18.1, так как для 52i=i и П*=1 Li справедливы обе импликации. Заметим, что каждое из подпространств Li, i = 1,к, а также их пересечение являются линейными подпространствами суммы Li 4- -----1- Lk, а пересечение Li П ... РLk - линейным подпространством каждого из Li, г = 1, к. Теорема 65.2. Сумма линейных подпространств есть ли- нейная оболочка совокупности базисов слагаемых подпространств. Доказательство. Пусть ei,... ,ет, ,9i, , 9г - ба- зисы подпространств Li,Li,..., Lk соответственно. Положим W = = £(ei,... ,em,/i,... ,/3,... ,5i,... ,&). Тогда W = Li + • • 4- Lk, так как для этих множеств, как нетрудно проверить, имеет место дву- стороннее вложение. Следствие. Размерность суммы линейных подпространств рав- на рангу совокупности базисов слагаемых подпространств:
§ 65. Сумма и пересечение линейных подпространств 217 к dim 52 A = rg(eb..., em, Д,..., fs,... ,gi,..., gt). 1=1 Это утверждение вытекает из теоремы 65.2 (с учетом теоре- мы 64.3). Теорема 65.3- Для любых двух линейных подпространств L\ и L2 линейного пространства V имеет место соотношение dim(Li + L2} = dimLi 4- dimL2 — dimLi Г) Т2 (65.2) Доказательство. Рассмотрим сначала случай, когда Li Л ЛТ2 / {#} • Выполним следующее построение. Пусть /1,..., fs - базис L1 П Т2 . Так как Li Л L2 С Lj , Д П Т2 С Т2 , то согласно теореме о неполном базисе векторы Д,..., fa можно дополнить как до бази- са L\ , так и до базиса L2 . Пусть ej,..., em, /1,..., fs - базис Д, а Д,.... Д,<71,... ,<7t _ базис L2 Покажем, что система векторов fs, <7i,..., gt (65.3) образует базис Li +L2 . Действительно, она порождает Li + L2 в силу теоремы 65.2 и, кроме того, она линейно независима, так как если ТП 5 t 52 ciiei + 52 ал+52 = е > (65-4) г=1 г=1 t=l ТО t ms д = 52^ = _52^^_12ал- (65.5) i=l t=l i=l Отсюда следует, что вектор g является вектором как Lj, так и £2, т.е. <7 € Li Л Ь2 и, следовательно, вектор g является линейной комби- нацией векторов Д,... ,f3. Из единственности разложения вектора g по линейно независимой системе векторов .., ет, fi,..., fs следу- ет, что в (65.5) ai = ... = ат = 0. Тогда в (65.4) в силу линейной независимости Д, - •., Д, <71, • , <7t получим, что Д = ... — Д, = 0, = ... = = 0. Таким образом, только тривиальная линейная ком- бинация векторов (65.3) равна нулевому вектору. Итак, векторы (65.3) образуют базис L\ + Т2 и, следовательно, dim(£i + L2) = т + s + t. (65.6) С другой стороны, согласно схеме построения векторов (65.3), dim Lj -i-dim L2 - dimLi ЛТ2 = (m + s') + (s + t) - s = m у s +1. Сравнение этого соотношения с (65.6) дает (65.2). В случае когда Li Л L2 = {0}, доказательство проводится аналогично, только в нем не участвуют векторы Д,..., ft.
218 Глава XU. Линейное пространство над произвольным полем § 66. Прямая сумма подпространств Критерии прямой суммы. Сумма подпространств линейного пространства называется прямой суммой, если разложение каждого вектора в ней по слагаемым подпространствам единственно. Обозначение: Lt® ... ® Lk Теорема 66.1 (критерии прямой суммы). Для подпрос- транств Li,.. • ,Lk конечномерного линейного пространства V сле- дующие утверждения равносильны: 1) сумма подпространств Li,... ,Lk - прямая; 2) совокупность базисов подпространств L\,...,Lk линейно не- зависима; 3) совокупность базисов подпространств Li,... ,Lk образует ба- зис суммы Y^i=\ 4) dim52*=1 Ц = 52*=1 dimlj ; 5) существует вектор а € J2i=i Li, для которого разложение по подпространствам L\,...,Lk единственно; 6) произвольная система ненулевых векторов ai,..., а*, взятых по одному из каждого подпространства L,, г — 1,к, линейно неза- висима; 7) Г1ПГ2 = {0} (для к = 2). Доказательство. 1 => 2. Пусть совокупность ei,...,em, fi,..., fa,... ,gi,... ,gt базисов подпространств Li,..., Lk линейно за- висима и ms t '^OLiei + '^(iifi® ...Л-^^gi^e, (66.1) t—1 i=l i=l где ms t £>?+E#+--+E^/°- (66-2) i=l i=l i=l Положим t Il = Ё aiei , x2 = E 0ifi , - • - , xk = Ё li9i 1=1 i=l_ i=l Отметим, что Xi € Li, i = 1, к, причем среди xi,...,Xk в силу (66.2) и линейной независимости векторов каждого базиса существует вектор Xi в. Тогда соотношение (66.1) может быть записано в виде в — Xi + ... + Xi + ... 4- Хк , Xi в. (66.3) Это дает второе разложение нулевого вектора в (после известного: 0 = 0 + ... + 0 + ... + 0) по подпространствам Li,..., L»,..., Lk- 2 => 1. Пусть Li + ... + Lk - не прямая сумма. Тогда существу- ет вектор Ь из этой суммы, который имеет два разложения по под- пространствам Li,..., Lk’-
§ 66. Прямая сумма подпространств 219 Ь = 61 + ... 4- 4- ... + bk , (66.4) b = b\ + ... + Ь\ + ... + b'k, (66.5) отличающиеся хотя бы одним слагаемым 6, / 6'. Если вычесть из первого равенства второе и разложить каждое слагаемое bj — 6' , j = 1,п, по базису Lj, то получим нетривиальную линейную ком- бинацию базисных векторов пространств £i , равную нулево- му вектору. Эго противоречит линейной независимости совокупности базисов Li,..., Lk 2 <=> 3. Это следует из теоремы 65.2. 3 <==> 4. Эти утверждения отличаются только терминологией. 1 => 5. Это очевидно. 5 => 1. Пусть £i + ... + Lk - не прямая сумма. Тогда существует вектор b из этой суммы, для которого имеют место два различных разложения (66.4) и (66.5). Вычитая (66.5) из (66.4), получим нетри- виальное разложение нулевого вектора (66.3). Если его сложить с раз- ложением вектора а, то получим еще одно разложение вектора а. 1_=> 6. Пусть система векторов ai,...,ak, где а, € Li, а, / б, г = 1, k, линейно зависима. Тогда существуют числа од,..., ак € Р, одновременно не равные нулю (пусть, например, а, 0) и такие, что aiai + .. .4-010,4-.. .4-OfcOfc = в. Это равенство дает второе разложение нулевого вектора, отличное от тривиального (так как о..а, в), что противоречит утверждению 1. 6 => 1. Пусть Li 4-... 4- Lk - не прямая сумма, тогда существует вектор Ь, для которого имеют место два разложения (66.4) и (66.5). Вычитая одно из другого, получим, что а,, 4- а,.. 4-... 4- = в, где aIm = 51тл - b'im, Oim € £im, причем alm / 0 хотя бы для одного тп, m = 1, q. Значит, векторы а,,, а,2,..., а,2 линейно зависимы и, следо- вательно, любая система ненулевых векторов, взятых по одному из каждого Li, i= 1,/с, содержащая эти векторы, линейно зависима (в силу теоремы 14.3). Это противоречит утверждению 6. 4 <=> 7. Это следует из теоремы 65.3. Теорема 66.2. Линейное пространство V является прямой суммой двух своих подпространств Ly и L2 тогда и только тогда, когда: 1) dimV = dimLi 4- dim £2; 2) Li Ct L2 = {б} . Доказательство. Необходимость следует из теоремы 66.1 (утверждения 4 и 7). Достаточность. Из условия 2 следует, что L\ 4- L2 - прямая сумма. Положим L — Li ® L2. Согласно теореме 66.1 (утвержде- ние 4) dim£ = dim Li 4- dim £2. Отсюда в силу условия 1 вытека- ет, что dim£ = dimV. Это означает, что L — V (теорема 64.3), т.е. V = Li ф L2 .
220 Глава XII. Линейное пространство над произвольным полем Дополнительное подпространство. Пусть L - линейное под- пространство пространства V. Подпространство Ls называется до- полнительным подпространством к L (рис. 1), если L © — V. Очевидно, что при этом L - дополнительное подпространство к L6. Рис. 1 Т еорема 66.3. Для любого подпространства L линейного пространства V существует дополнительное подпространство. Доказательство. Будем считать, что L - нетривиальное подпространство (если L = {в}, то Ls = V, а если L — V, то Ls — {fl}). Пусть ei,...,efc - базис L. Дополним его до базиса ej,... ,ek,ek+l,... ,еп всего пространства V . Тогда £(е^+1,... ,еп) = = Ls , так как для подпространства £(efc4i,... ,еп) выполнены все условия теоремы 66.2. Замечание. В случае если L - нетривиальное подпространство, дополнительное подпространство определено неоднозначно. § 67. Линейное аффинное многообразие Линейное аффинное многообразие и связанные с ним понятия были определе- ны в §18. Там же приведены некоторые элементарные утверждения, относящиеся к вещественному линейному пространству. Все они остаются в силе и в линейном пространстве над произвольным полем Р (с очевидной заменой поля R на поле Р). Параллельные многообразия. Линейные многообразия Hi = = 4- Li и Hi - Х2 + Ь2 в линейном пространстве V называются параллельными, если либо Li С Г2, либо L2 С L\ (рис. 1). Теорема 67.1. Если два линейных многообразия с непу- стым пересечением параллельны, то одно из них содержит другое. Доказательство. Пусть линейные аффинные многообразия Л1 = xj -I- Li и Н2 = х2 4- L? параллельны и пусть L,CL2. (67-1) По условию существует вектор Xq € Hi Л Н2 • Так как вектором сдвига может служить любой вектор линейного многообразия (§18), то Hi = xq 4- Li, Н2 = х0 + L2. Отсюда с учетом (67.1) следует, что Hi С Н2 .
§ 67. Линейное аффинное многообразие 221 Сле дствие 1. Если линейные многообразия параллельны, то либо они не пересекаются, либо одно из них содержится в другом. Пересечение многообразий. Теорема 67.2. Непустое пересечение линейных много- образий Hi = Xi + Li, i — l,k, является линейным многообразием с к направляющим подпространством Q L,. i=l к Доказательство. По условию существует вектор то € П к к 1=1 следовательно, Hi = Xq + Li. Тогда Н, = Хо + П Li, так как для i=l 1=1 этих множеств имеет место двустороннее вложение. Теорема 67.3. Всякое к-мерное линейное многообразие в п-мерном пространстве можно задать в виде пересечения п — к гиперплоскостей. Доказател ьство. Пусть Н = xq + L - к-мерное линейное мно- гообразие и ei,...,e* - базис подпространства L. Дополним его до базиса ej,... , Cfc, ejt+i, , еп пространства V. В качестве иско- мых гиперплоскостей можно взять линейные многообразия И, = xq + + Li, i = 1, n — к, где Li — £(ei,..., efc, ek+2, ejt+3,..., en), Z>2 = L{e\,... ,ek, efc+i, ejt+3,... , en), Ln-к = Upl, >^kt^k+1i ^k+2i • i _ j) , т.е. Li - линейная оболочка всех векторов базиса V, кроме е^-ц. Очевидно, что Li Cl £2 П ... П Ln_fc = C(ei,... ,et) = L. В силу теоремы 67.2 отсюда следует, что Н = Нх П Я2 О . • • И Так как dim Li = п — 1, г — 1,п — к, то все Hi - гиперплоскости. Т е о р е м а 67.4. Пересечение линейного многообразия Н — — xq+L с любым подпространством, дополнительным kL, состоит ровно из одного вектора.
222 Глава XII Линейное пространство над произвольным полем Доказательство. Пусть Ls - дополнительное подпространство к L. Так как L ® Ls = V, то для вектора хо имеет место разложение х0 = у + z, где у е L, z € L6 . Тогда z = xq - у € Н, ибо -у € L. Следовательно, z - общий вектор Ls и Н, т.е. z 6 Ls П Н. Покажем, что z - единственный вектор пересечения L& Г\Н. Пусть z' € L5 П Н, тогда так как z е Н, z' € Н, то (§18) z — z' е L, а так как z 6 L6, z' € Ls, то z - z' € Ls. Из того, что Ln Ls = {0} , следует, что z — z' — в, т.е. z = z‘. Фактор-пространство. Пусть V - линейное пространство над полем Р, L - некоторое его линейное подпространство. Рассмотрим множество V|L всех линейных многообразий с направляющим под- пространством L: V\L = {Н — х 4- L | х € V}. Введем на этом множе- стве операции сложения и умножения на число из поля Р. Определим сумму многообразий Н\ = Xi + L, = Х2 4- L по следующему правилу: Н\ 4- Н2 = (xi 4- хг) 4- Г. (67.2) Это определение корректно, так как результат не зависит от вы- бора векторов сдвига многообразий Hi, Н2 Фактически эта опера- ция совпадает с известной операцией сложения смежных классов по нормальному делителю, т.е. с алгебраической операцией в фактор- группе (§40). Таким образом, правило (67.2) определяет внутренний закон композиции на V\L (рис. 2). Определим умножение многообразия Н = xg + L на число а £ Р по следующему правилу: аН = ахо 4- L. (67.3) Проверим корректность этого определения, т.е. что результат не зависит от выбора вектора сдвига хд. Пусть Н = х'а 4- L. Покажем, что ахо 4- L — axg 4- L. (67.4) Для любого элемента axq 4- у, у € L, из левого множества имеем ах0 4- у = а(х'о 4- х0 - Xq) + у = ах'о 4- а(х0 - Xg) 4- у = охд 4- yi, где У1 = а(хо — Хд) 4- у € L, так как хд — Хд 6 L, у е L. Следовательно, ахо 4- Г С охд 4- L. С другой стороны, для элемента из правого мно- жества о:Хд 4- у, у € L, имеем охд 4- у = {хд = хд 4- yi, где yi G L} = = a(x0 4- tn) 4- у = oxg 4- ayi 4- у = ax0 4- У2 , где y2 = aj/i 4- у G L. Следовательно, oxg 4- L C ax0 4- L. Оба вложения доказывают (67.4). Таким образом, правило (67.3) определяет внешний закон компо- зиции на V|L (рис. 3). Теорема 67.5. Множество V\L всех линейных многообра- зий с направляющим подпространством L есть линейное простран- ство относительно законов композиции (67.2), (67.3). Доказательство. Справедливость аксиом группы сложения вы- текает из того, что V\L - фактор-группа. Впрочем, непосредственная
§67. Линейное аффинное многообразие 223 проверка этих аксиом так же проста, как и проверка остальных акси- ом линейного пространства, ее мы предоставляем читателю. Линейное пространство V|L называется фактор-пространством линейного пространства V по подпространству L. Теорема 67.6. Фактор-пространство V\L изоморфно Ls . Доказательство. Если L = {0}, то Ls = У, V\L = V и, следовательно, V|L = Ls. Если L = И, то L6 = {б}, V|L = {в} и V|L = {#}. Пусть 0 < dimL < dimV и Ls - какое-нибудь до- полнительное подпространство к L. Согласно теореме 67.4 в каждом многообразии Н = х + L существует, и притом единственный, вектор z & L6 , так что Н — z+L. Таким образом, V\L — {Н = z+L | z € Ls} . Отображение : Ls —> V\L, которое каждому вектору z € Ls ставит в соответствие линейное аффинное многообразие Н = z + L € V|L, биективно в силу теоремы 67.4, оно сохраняет законы композиции в силу (67.2), (67.3). Таким образом, - изоморфизм. Следствие 2. dimV|L — dimV — dimL. 8 Линейная алгебра и аналитическая геометрия
Глава XIII. Евклидовы и унитарные пространства Линейные пространства, изучавшиеся нами до сих пор, несмотря на абстракт- ный характер, по своим свойствам очень близки к геометрическим пространствам. Однако в них еще не нашли отражение понятия, связанные с измерениями, такие, как длина вектора и угол между векторами. В §22 мы установили, что эти вели- чины тесно связаны с понятием скалярного произведения векторов. Они просто выражаются через скалярное произведение, а само скалярное произведение век- торов оказывается при этом весьма простой с точки зрения алгебры функцией: оно линейно по каждой из двух переменных. Это дает основание при введении метрических понятий в теории линейных пространств отталкиваться от понятия скалярного произведения. В этой главе рассматриваются только вещественные и комплексные простран- ства. Итак, V - линейное пространство над полем Р, где Р - либо R, либо С. § 68. Скалярное произведение Пусть V - вещественное или комплексное линейное пространство. Отображение (, ) : V х V -> Р называется скалярным произведением, если оно удовлетворяет следу- ющим аксиомам: для любых х, у, z 6 V и любого а 6 Р 1) (я, у) = (у,х); 2) (ах, у) = а(х, у); 3) (x + y,z) = (x,z) + (y,z); (68.1) 4) (х,х) > 0 для любого х € V, (х, х) = 0 тогда и только тогда, когда х = 0. Число (х, у) называется скалярным произведением векторов х и у, аксиомы 1-4 называются аксиомами скалярного произведения. Замечание 1. В вещественном случае черта в первой аксиоме может быть опущена. Замечание 2. Аксиома 4 в комплексном случае на пер- вый взгляд кажется парадоксальной, так как для комплексных чисел знак не определен. Однако из первой аксиомы следует, что скалярный квадрат (х, х) есть вещественное число. Вещественное линейное пространство со скалярным произведени- ем называется евклидовым пространством, а комплексное - унитар- ным. Обозначение: Е и U соответственно. Примеры. 1. В геометрических пространствах Vn, где п = 1,2,3, было введено скалярное произведение (22.1) на основании метрики, имеющейся на прямой, на плоскости и в пространстве. Оно удовле- творяет всем аксиомам скалярного произведения (теорема 22.2) и,
§ 68. Скалярное произведение 225 следовательно, является скалярным произведением и в принятом вы- ше смысле. Аксиоматическое определение скалярного произведения говорит о том, что геометрическое правило (22.1) не является един- ственным скалярным произведением в пространствах Vn, п = 1,2,3. 2. В арифметическом пространстве Rn скалярное произведение векторов х = (xi,..., Tn), У = (j/i, • • •, Уп) может быть введено сле- дующим образом: п (®.у) = Х™’ (68.2) г=1 а в арифметическом пространстве Сп - п (х<у) = (б8-3) i=i Для скалярных произведений (68.2) и (68.3) аксиомы (68.1) легко проверяются непосредственно. Скалярные произведения (68.2) и (68.3) называются естествен- ными скалярными 'произведениями в арифметических пространствах Rn и Сп соответственно. Для естественных скалярных произведений может быть использо- вана компактная форма записи: если арифметические векторы х и у записать как столбцы, т.е. х — (xi,..., хп)Т, у = (yi, - - , Уп), то (х,у) - хту = утх в К", (х,у) = хту = унх в Сп. 3. В функциональном пространстве С[0,1] скалярное произведение функций f(x) и д(х) может быть задано так: 1 (f,g) = У f(x)g(x)dx. (68.4) о Справедливость аксиом (68.1) вытекает из свойств определенного ин- теграла [11|. Итак, операции (68.2)-(68.4) определены корректно и превращают пространства Vn , Rn , С[0,1] в евклидовы пространства, а простран- ство Сп - в унитарное. Из определения скалярного произведения вытекают следующие простейшие свойства этой операции. 1°. (х, у -I- z) = (х, у) + (х, z), Vx, y,z G E (U). 2°. (x,ay) = a(x,y), Vx,y € E (U), Va G Ж (соответственно С). 3°. (0,x) = (x,e) = 0, Vx G E (C7). 4°. (x, у) — 0 для любого вектора у G Е (U) тогда и только тогда, когда х = 0.
226 Глава ХШ. Евклидовы и унитарные пространства 5°. Любое подпространство L евклидова (унитарного) простран- ства является евклидовым (соответственно унитарным) пространст- вом. Отметим, что скалярное произведение (т, у) векторов х, у линейно по первому аргументу, а в евклидовом пространстве - линейно по обоим аргументам (свойства 1° и 2°). Теорема 68.1. Для любых векторов х,у G Е (U) имеет место неравенство \(х,у)\2 <(х,х)(у,у) (68.5) или, в другой форме, (т,т) (х,у) (У,х) (у,у) > 0. Доказательство. Будем считать, что х / 6 (для х — в неравен- ство (68.5), очевидно, обращается в равенство). Для любых векторов х,у € Е (U) и любого числа а € R (С), согласно (68.1) и свойствам 1°—4°, имеем 0 < (ат — у, ах — у) = (ат, ат) - (ат, у) - (у, ат) + (у, у) = = |а|2(т, т) - а(т, у) - а(у, т) + (у, у). (68.6) Так как т в, то (т,т) 0. Возьмем а = (у,т)/(т,т). Тогда т (68.6) »«,. О < + (р.у), (т,т)2 (т, т) (т, т) откуда после очевидных преобразований получим (68.5). Неравенство (68.5) называется неравенством Коши-Буняковского. Замечание 3. В евклидовом пространстве неравенство Коши- Буняковского может быть записано в виде (т, у)2 < (т,т)(у, у). Теорема 68.2. Неравенство Коши-Буняковского обраща- ется в равенство тогда и только тогда, когда векторы х и у кол- линеарны. Доказательство этой теоремы фактически содержится в до- казательстве теоремы 68.1. Действительно, если т = 0, то т = Оу. Если же т в, то неравенство (68.6) обращается в равенство тогда и только тогда, когда 0 = (ат — у, ат — у), т.е. когда у = ат. § 69. Основные метрические понятия В евклидовом и унитарном пространствах длиной вектора т назы- вается арифметическое значение квадратного корня из его скалярного квадрата. Обозначение: |т|. Итак, |т| = ^(х,х). Из аксиом скалярного произведения вытекают следующие факты. 1°. Любой вектор т евклидова (и унитарного) пространства имеет длину, при этом |т| > 0, Vi е Е (U) и |т| = 0 <=> т — 0.
§ 69. Основные метрические понятия 227 2°. |ах| = |а||х|, Vz & Е (£7), Vo е R (соответственно С). В новой терминологии неравенство Коши-Буняковского может быть записано следующим образом: |(х,»)| < |х| • |у| - (69.1) Вектор единичной длины называется нормированным. Любой не- нулевой вектор можно нормировать, разделив этот вектор на его дли- ну. По аналогии с элементарной геометрией упорядоченная тройка векторов х, у, х + у рассматривается как треугольник, о котором гово- рят, что он построен на векторах х и у. Точно так же считается, что паралеллограмм, построенный на векторах х и у, имеет диагонали х + у и х - у. Теорема 69.1. В евклидовом (унитарном) пространстве для любых векторов х , у имеют место неравенства ||т|-|1/|| < |х + р| < |х|+ |!/|. (69.2) Доказательство. Имеем |гг -I- у|2 — (х + у,х + у) — (х,х) -Ь + (х, у) + (у, х) + (у, у). Применив к этой сумме числовые неравенства треугольника (которые справедливы как для вещественных, так и для комплексных чисел), с учетом неравенства (69.1) получим, что |х + у|2 < И2 + 2|х| • |у| + |у|2 = (|т| + |у|)2 , |х + у|2 > |х|2 - 2|х| \у\ + |у|2 = (И - |у|)2 • Отсюда следует (69.2). Неравенства (69.2) называются неравенствами треугольника в евклидовом (унитарном) пространстве. Очевидно, эти неравенства переносят известное из элементарной геометрии свойство сторон треугольника на произвольное евклидово (и унитарное) пространство. Точно так же легко проверяемое равен- ство |х + у|2 + |х - у|2 = 2(И2 + |у|2), (69.3) называемое тождеством паралеллограмма, справедливо в евклидо- вом (и унитарном) пространстве. В евклидовом пространстве углом между ненулевыми векторами х и у называется угол , 0 < < л, для которого cosy? = /Т’У). - (69.4) н • м Корректность этого определения следует из неравенства Коши- Буняковского (69.1). В унитарном пространстве понятие угла между векторами не определено. Од- нако и в евклидовом, и в унитарном пространстве можно ввести обобщение поня- тия прямого угла.
228 Глава XIII. Евклидовы и унитарные пространства § 70. Ортогональные векторы Ортонормированный базис. Два вектора х,у € Е (II) назы- ваются ортогональными, если (х, у) = 0. Из свойства 4° скалярного произведения (§68) следует, что нулевой вектор в, и только нулевой, ортогонален любому вектору пространства. В евклидовом пространстве вследствие равенства (69.4) ортогональность век- торов х и у означает, что либо один из них нулевой, либо угол между ними равен тг/2. Пусть L - линейное подпространство евклидова (унитарного) про- странства E(U). Вектор х называется ортогональным подпростран- ству L, если он ортогонален любому вектору у & Г.Обозначение: х ± L. Очевидно, что х ± £(ai,... ,a^) тогда и только тогда, когда х ± а,, i = 1, к. Два подпространства L\ и L2 называются ортогональными, если (х,у) — 0, Ух е Li, у € L2. Обозначение: L\ ± £2- Сумма подпространств 2Ji=1 Li называется ортогональной сум- мой, если ее слагаемые подпространства попарно ортогональны. Система векторов Xi,...,Xfc € Е (U) называется ортогональной системой, если (xj,Xj)=O при i yt j. (70.1) Система векторов xj,..., х^ € Е (II) называется ортонормирован- ной системой, если (xt,Xj) = <fy, где - символ Кронекера, т.е. s«={ i: р»2» Теорема 70.1. Ортогональная система ненулевых векто- ров линейно независима. Доказательство. Пусть xi,...,x* € Е (II) - ортогональная система ненулевых векторов. Умножая обе части равенства aiXi + ... + cuxi + ... + akxk = в (70.3) скалярно на х,, получаем в силу (70.1) а,(х,,х,) = 0, г = 1, к. (70.4) По условию Xj У в, значит, (х,,х*) ^0, ив силу (70.4) все коэф- фициенты линейной комбинации в (70.3) равны нулю. Следовательно, векторы рассматриваемой системы линейно независимы. С л едствие 1. Ортонормированная система векторов линейно независима. Следствие 2. В п-мерном евклидовом (унитарном) простран- стве любая ортонормированная система из п векторов образует базис.
§ 70. Ортогональные векторы 229 Базис, векторы которого образуют ортонормированную систему, называется ортонормированным базисом. В соответствии с (70.2) ei,..., - ортонормированный базис Е (U), если <«..е,) = { J; ‘j): (70S) Теорема 70.2. В евклидовом (унитарном) пространстве координаты х^,.. ,,хп вектора х в базисе е = (ei,... ,еп) вычисля- ются по правилу Xi = (x,ei), г = 1,п, (70.6) тогда и только тогда, когда е - ортонормированный базис. Доказательство. Необходимость. Пусть для любого век- тора х € Е (С) координаты в базисе е вычисляются согласно (70.6). Тогда по этому же правилу вычисляются координаты и базисных век- торов, которые известны, так как е< = 0ei + ... + Ое,-! + 1е, + 0е,+1 + . - + 0еп , г = 1,п. Сравнение координат вектора е< с правилом (70.6) приводит к требу- емым равенствам (70.5). Достаточность. Если е - ортонормированный базис и х = 52j=i TjCj , то свойство линейности скалярного произведения с учетом (70.5) приводит к (70.6). Теорема 70.3. В евклидовом (унитарном) пространстве скалярное произведение векторов х = 52"=i xiet > V — 527=1 > за~ данных своими координатами в базисе е, вычисляется по правилу п (х,у) = 52^57 (70.7) 1=1 тогда и только тогда, когда е - ортонормированный базис. Доказательство. Необходимость. Если скалярное произ- ведение вычисляется согласно (70.7) для любой пары векторов, то это же верно и для пары базисных векторов е, и е7 , координаты которых известны. Применив правило (70.7) к вычислению скалярного произ- ведения векторов Cj и е7 , получим требуемые равенства (70.5). Достаточность. Если е - ортонормированный базис и х = 527=1 х*е* ’ У = 527=1 У’е‘ ’ т0 в СИЛУ свойства линейности ска- лярного произведения имеем (®,у) = (52 ’ 52 Узез ) = 52 52 ^3/7(е<,е,) = £ аД/Г i=l j=l l=lj=l 1=1 Замечание. В евклидовом пространстве черта в равенстве (70.7) может быть опущена: (т, у) = 527=1 Х*У> Скалярное произведение (70.7) может быть записано в компактной форме через координатные столбцы хе и уе векторов х и у в базисе е следующим образом:
230 Глава XIII. Евклидовы и унитарные пространства (х, у) = х^уе = yfхе для евклидова пространства, (х,у) = х^уе = уНх£ для унитарного пространства. До сих пор все базисы линейного пространства были равноправны. С помо- щью любого базиса можно сводить операции сложения векторов и умножения вектора на число к операциям над числами. В евклидовом и унитарном простран- ствах теорема 70.3 отводит ортонормированному базису особую роль: с помощью такого базиса и третья операция - скалярное произведение векторов - сводится к операциям над числами. Возникает естественный вопрос, всегда ли существует ортонормированный базис. Теорема 70.4. В конечномерном евклидовом (унитарном) пространстве существует ортонормированный базис. Доказательство. Пусть dimV = п. Используем индукцию по п. При п = 1 утверждение очевидно: достаточно взять любой вектор f в и положить 61 = f /|/|. Пусть в любом (п — 1)-мерном евклидовом (унитарном) простран- стве существует ортонормированный базис; покажем, что ортонорми- рованный базис существует и в n-мерном пространстве Е (17). Пусть _ базис Е ((7). Линейная оболочка £(fi, • •,/п-1) являет- ся (тг — 1)-мерным пространством, и в нем по индуктивному предпо- ложению существует ортонормированный базис ei,... , en_i. Так как /п 0 = £(ei,...,en_1), то вектор дп = /n-aiei-a^- ... — an_ien_i отличен от нулевого вектора при любых о, € R(C). Выберем коэффициенты аг, i — l,n — 1, из условия ортогонально- сти вектора дп всем векторам 6j,.. , en-i ' 0 = (дп, 6j) = (/п, , i — 1, п — 1, или Qj = (/n, ei), i = 1, п — 1. Тогда, положив еп = дп/\9пI, получим ортонормированный базис ei,..., еп пространства Е (U). Процесс ортогонализации. Доказательство теоремы 70.4, по существу, представляет собой алгоритм последовательного построе- ния ортонормированного базиса по заданному базису Д,..., fn- Первый шаг. Полагая gi = fi, находим ei = <7i/|<7i | • k-й шаг (k > 2). Полагаем 9к = fk~ otiei - а2е2 - ... - a*-i6fc_i, (70.8) где at = (ffe,ei), i = 1, к - 1, и находим ек = дк/\дк\. Через п шагов получим ортонормированный базис ei,...,6n пространства. Описанный алгоритм называется процессом ортогона- лизации Грама-Шмидта. Ортогональная (унитарная) матрица. Матрица U £ Спхп на- зывается унитарной, если UUH = UHU = I,, (70.9) матрица Q G RnKn называется ортогональной, если QQT = QTQ = I. (70.10) Напомним, что в §24 уже рассматривались ортогональные матри- цы в связи с ортонормированным базисом геометрических прост-
§ 70. Ортогональные векторы 231 ранств. В произвольном евклидовом (унитарном) пространстве имеет место то же утверждение. Теорема 70.5. Матрица перехода от ортонормированного базиса е к базису е' евклидова (унитарного) пространства ортого- нальна (унитарна) тогда и только тогда, когда е! ортогональный базис. Доказательство повторяет доказательство теоремы 24.1 с учетом соотношений (70.5), (70.7), (70.9), (70.10). QR-разложение. Процесс ортогонализации Грама-Шмидта, опи- санный в матричной форме, дает еще одну факторизацию матрицы. Пусть А = [щ ... ап] - вещественная или комплексная матрица размера п х п с линейно независимыми столбцами ai,...,an е Rn (соответственно Сп). В результате применения процесса ортогонали- зации к этим столбцам относительно естественного скалярного про- изведения в арифметическом пространстве получатся ортонормиро- ванные столбцы gi,...,gn, которые образуют ортогональную (соот- ветственно унитарную) матрицу Q = [gi... дп]. Сам процесс ортого- нализации означает последовательное умножение матрицы А спра- ва на некоторые матрицы элементарных преобразований. Так как qi €. C(ai, qi, ,qi~i), г = l,n, то на i-м шаге матрица Л*_1 (по- лученная после (г — 1) шагов) умножится справа на матрицу Т 0 ... ои ... 0‘ 1 ... а2> - • • 0 1. так что весь процесс ортогонализации укладывается в матричную схе- му ЛТ1... Ln = Q или AL = Q, где L - верхняя треугольная матрица (как произведение верхних тре- угольных матриц), т.е. A = QR, (70.11) где Q - ортогональная (соответственно унитарная), a R = L~1 - верх- няя треугольная матрицы. Разложение (70.11) называется QR-разложением матрицы А. Если Л - прямоугольная матрица размера т х п с линейно не- зависимыми столбцами, то очевидно, что т > п, а матрица Q бу- дет прямоугольной матрицей размера т х п с ортонормированными столбцами gi,..., qn. Теорема Пифагора и ее обобщение. Если векторы хну орто- гональны, то треугольник, построенный на этих векторах, называют прямоугольным, а вектор х + у - гипотенузой этого треугольника.
232 Глава ХШ. Евклидовы и унитарные пространства Легко проверить, что |х + у|2 = |т|2 + |У|2, (70.12) а, в более общем случае, если х±,..., Xk - попарно ортогональны и 2 = 11 + . . . + Xk, то t и2 = £ы2, (70.13) £=1 Равенство (70.12) называют теоремой Пифагора в евклидовом (и унитарном) пространстве, а равенство (70.13) - ее обобщением. § 71. Матрица Грама Матрицей Грама системы векторов ai, тарного) пространства называется матрица ..., ajt евклидова (уни- G(ai,..., ак) — '(ai,ai) (ai,a2) ... (ai,dk)’ (71-1) .(<ifc,ai) (afc,a2) ... (fik,ak). Определитель матрицы Грама называется определителем Грама. Теорема 71.1. Система векторовai,... ,йк евклидова (уни- тарного) пространства линейно зависима тогда и только тогда, когда det G(ai,...,а*) = 0. Доказательство. Рассмотрим вектор у — $2t=i Q»°*- Так как у € £(ai,... ,ак), то равенство у = в равносильно ортогональности вектора у любому вектору из £(ai,..., а*,), что в свою очередь равно- сильно ортогональности вектора у векторам ai,... ,<ц, т.е. ' а1) + ... + аДа*, ay) =0, ...................................... (71-2) „ ai(ai,afe) + ... + ак(ак,ак) = 0. Линейная зависимость векторов щ,... ,а* означает наличие нетриви- ального набора коэффициентов ..., ак, для которых у — в, т.е. на- личие нетривиального решения однородной системы уравнений (71.2) с матрицей GT(ai,..., а*), а это согласно теореме28.6 означает равен- ство det G(aj.,..., а^) = 0. Матрица А е Спхп называется эрмитовой матрицей, если Ан = А; (71.3) матрица А € Rnx” называется симметрической (или вещественной эрмитовой) матрицей, если АТ = А. (71.4)
§ 72. Ортогональное дополнение 233 Из (71.3) следует, что |А| € R. Таким образом, для эрмитовых матриц (комплексных и вещественных) можно говорить о знаке опре- делителя. Теорема 71.2. Матрица Грама системы векторов евкли- дова (унитарного) пространства эрмитова. Доказательство. Пусть G(aj,..., an) — G — (gij) Из (71.1) следует, что = (a,,a_;), gji = (a^a.,), т.е. gtJ = gji Это означает, что GH = G или, в вещественном случае, GT = G.U Теорема 71.3. Определитель Грама линейно независимой системы векторов в евклидовом (унитарном) пространстве поло- жителен. Доказательство. Пусть aj,... , а*, - линейно независимая си- стема векторов евклидова пространства. Тогда dim£(ai,... ,аь) = к. Выберем ортонормированный базис в1,...,е^ линейной оболочки £(щ,..., at). Составим матрицу 011 012 . Оы Ofc2 Olfc Okfc . столбцами которой являются координаты векторов сц,... , а* в бази- се е = (et,... ,ejt). Тогда, согласно (70.7), (a,,a?) = Ss=i ~ = I2s=i ajsa«i = г = 1,*, j = 1, к. Следовательно, G(a1,...,aJt) = (AKA)T (71.5) и detG(ai,... ,а^) = |det А|2. Таким образом, detG(ai,..., at) > 0. (71-6) По условию система щ,... ,<4- линейно независима, поэтому, согласно теореме 71.1, detG(ab ... , a*) 0. Отсюда с учетом (71.6) следует, что detG(ai,... , at) > 0. Замечание. Равенство (71.5) дает компактную форму записи матрицы Грама; в частности, в вещественном случае G(al,...,ak) = ATA. § 72. Ортогональное дополнение Задача о перпендикуляре. Совокупность всех векторов х € Е (U), ортогональных подпространству L, называется ортогональным дополнением к L. Обозначение: . Теорема 72.1. Ортогональное дополнение к подпростран- ству является линейным подпространством. Доказательство. Пусть у\,у? € М, тогда (yi,x) — (2/2,1) = 0 для любого вектора х € L. Складывая эти равенства, получим, что
234 Глава ХП1. Евклидовы и унитарные пространства (?/1 + 5/2,г) — 0, Vi € L, т.е. гц + г/2 & LL. Аналогично если (у,х) — О, Vi € L, то (ay, х) — 0, т.е. ay G L1. Отсюда на основании теоремы 18.1 следует, что [Л - линейное подпространство. Теорема 72.2. Если L - линейное подпространство E(U), то L®Lr = E(U). (72.1) Доказательство. Утверждение очевидно, если L - тривиаль- ное подпространство. Пусть L - нетривиальное подпространство. Возьмем ei,... ,efc - ортонормированный базис L, е*,+ 1,..., еп - орто- нормированный базис L-1-. Система векторов ei,...,е^,i,... ,e,i ортонормирована и, следовательно, линейно независима (теоре- ма 70.1). Покажем, что она образует базис всего пространства Е (U). Пусть это не так. Тогда существует вектор f пространства, который не является линейной комбинацией ei,...,en. Система векторов ej,... ,еп, / линейно независима, и применение к ней процесса орто- гонализации приводит к вектору en+i, который ортогонален ej,..., еп и, значит, en+i € L1-. С другой стороны, en+i J_ lA , так как en+i ортогонален Cfc+i, ..., en. Следовательно, en_|_i = в. Отсюда согласно (70.8) вытекает линейная зависимость е^,... ,en,f, что противоречит допущению. Таким образом, система векторов ei,..., еп является ба- зисом Е (U) и dim L 4-dim/А = dimE (dimCZ). Так как TnlA = {0} , то согласно теореме 66.2 получаем (72.1). Следствие. Если L - линейное подпространство Е (U), то для любого вектора f G Е (U) существует, и притом единственное, разложение f = 9 + h, (72.2) где g € L, h ± L. Вектор g в разложении (72.2) называется ортогональной проек- цией вектора f на подпространство L, а вектор h — ортогональной составляющей вектора f. Задачу разложения (72.2) вектора на ортогональную проекцию и ортогональную составляющую называют задачей о перпендику- ляре. Этот термин заимствован из геометрии. С разложением (72.2) геометрического вектора мы уже встречались (рис. 1): чтобы полу- чить это разложение, достаточно опустить перпендикуляр из кон- ца вектора / на плоскость L. Имея в виду эту аналогию, ортого- нальную составляющую h в разложении (72.2) называют перпендику- ляром, опущенным из вектора f на подпространство L , а сам вектор f - наклонной к подпространству L. Аналогия с геометрическими векторами состоит не только в назва- нии. Отметим некоторые свойства составляющих g и h в разложении (72.2), которые имеют место и в геометрии: так как |/|2 = (д 4- h,g 4- + h) = (д,д) 4- (h,h), то I/I2 = ы2 + \h\2. (72.3)
§ 72. Ортогональное дополнение 235 \h\<\f\. Последнее неравенство означает, что длина перпендикуляра не пре- восходит длины наклонной. Решение задачи о перпендикуляре. Из теоремы 72.2 следует, что задача о перпендикуляре имеет, и притом единственное, решение. Укажем один из Способов построения этого решения. Пусть L — £(ai,... ,а*.-). Разложение (72.2) равносильно задаче построения векторов у и h таких, что f = 9 + h, 9 = Y,kj=i^aj, ( (f-g,<h)=0,i = l,k, geL, \ f-glL, 9 = «• /г 1 L h = f-g ( h = f-g Итак, задача о перпендикуляре сводится к поиску чисел Xi,..., Xk, для которых к '^Xj(aj,ai) = (f,ai), i = \,k. j=i (72.4) Сравнение этих соотношений с (71.2) говорит о том, что числа Xi,... .,Хк являются решением системы уравнений с матрицей Грама G(ai,...,afc) и правой частью (/, a4), г = 1,к. Эта система всегда имеет решение, так как она равносильна задаче о перпендикуляре. Отметим возможные при этом варианты. 1°. Если ai, •.. ,ац - ортонормированный базис L, то G(ai,..., a*,) = I и систе- ма (72.4) имеет единственное решение = (/,<!,), i = 1, к, при этом g = h=l~A 2°. Если линейно независимы, то detG(aj,... ,a^) ^Ои система (72.4) имеет единственное решение; решив систему (72.4), найдем g = xtai, h = f -g-
236 Глава XIII. Евклидовы и унитарные пространства 3°. Если aj,... ,а^ линейно зависимы, то det G(ai,... ,а*) = 0 и система (72.4) имеет бесконечно много решений, которые соответствуют бесконечному числу раз- ложений вектора g по линейно зависимой системе векторов щ,... , ац,. §73 . Линейное аффинное многообразие в евклидовом (унитарном) пространстве Пусть Н = Хо + L - линейное аффинное многообразие в евклидо- вом (унитарном) пространстве. Вектор а € Я, ортогональный L, на- зывается нормальным вектором линейного многообразия Н (рис. 1). Теорема 73.1. Для любого линейного многообразия в ев- клидовом (унитарном) пространстве существует, и притом един- ственный, нормальный вектор. Доказательство. Рассмотрим линейное многообразие Н = xq 4- + L (рис. 1). Все векторы из Н, ортогональные L, находятся в Н C\Lr, но это пересечение состоит ровно из одного вектора а, так как - дополнительное подпространство к L (теоремы 72.2 и 67.4). Этот век- тор а и будет единственным нормальным вектором для Н. Теорема 73,2. Нормальный вектор линейного многообра- зия совпадает с перпендикуляром, опущенным из любого вектора ли- нейного многообразия на направляющее подпространство. Доказательство. Пусть а - нормальный вектор линейного мно- гообразия Н — хо + L, тогда Н = а + L (§18). Следовательно, любой вектор f € Н (рис. 1) может быть представлен в виде f = a + g, gel. (73.1) Так как а ± L, то соотношение (73.1) совпадает с разложением век- тора f на ортогональную проекцию g и перпендикуляр а. Следствие. Среди всех векторов линейного многообразия нор- мальный вектор имеет наименьшую длину. Уравнение гиперплоскости. Пусть Н = xq + L - гиперплос- кость в Е (£7), т.е. dimL = п — 1, где n = dimL? (dim£7). Тогда L1 - одномерное подпространство и его базис состоит из одного вектора а.
§74. Расстояние в евклидовом (унитарном) пространстве 237 Вектор х € Н тогда и только тогда, когда разность х — xq € L, т.е. когда (т-то,а) = 0. (73.2) Таким образом, уравнению (73.2) удовлетворяют все векторы х гиперплоскости Н, и только они. Уравнение (73.2) может быть запи- сано в равносильной форме: (х,а)—р, (73.3) где р = (tq, a) - фиксированное число для данной гиперплоскости. Уравнению (73.3) можно придать координатную форму: если (xi,...,xn) и (Л1,..., Лп) - координаты векторов х и а в некотором ортонормированном базисе пространства, то уравнение (73.3) равносильно уравнению AiXi + ... + А„хп = р, которое в геометрических пространствах совпадает с общим уравнением прямой на плоскости и плоскости в пространстве § 74. Расстояние в евклидовом (унитарном) пространстве Множество М называется метрическим, пространством, если за- дано отображение р : М х М -> R, которое каждой упорядоченной паре элементов х, у € М ставит в со- ответствие число р(х, у) е R такое, что: 1) р(х, у) > 0, Vi, у € М, р(х, у) - 0 <=> х = у ; 2) р(х, у) = р(у, х), Vi, у G М; 3) р(х, z) < р(х, у) 4- р(у, z), Vx,y,z е М. Число р(х, у) называется расстоянием между х и у; отображение р - метрикой, аксиомы 1-3 - аксиомами метрики (расстояния). Расстоянием между множествами X и У в метрическом прост- ранстве называется число p(X,Y)= inf р(т,У); (74.1) в частности, если X = {т}, то р(т,У) = inf р(х,у) - расстояние между элементом х и множеством У. Примеры метрик. 1. Для действительных (или комплексных) чисел (т.е. М = R или С) хорошо известное расстояние между числа- ми р(х,у) — |i - у| является метрикой. 2. Для арифметических векторов в Rn (или Сп) отображение z n v 1/2 Р^,у) = (Х?1* -&I2) -
238 Глава ХШ. Евклидовы и унитарные пространства как легко проверить, является метрикой. Эту метрику называют есте- ственной. В гл. XIX будут рассмотрены и другие метрики в этих про- странствах. 3. Для любого непустого множества отображение Р(х,у) = 1, х^У, О, т = 0 является метрикой. Это один из примеров дискретной метрики. Мы вернемся к метрическим пространствам в гл. XIX и рассмо- трим новые понятия и факты, относящиеся к ним. Теорема 74.1. В евклидовом (унитарном) пространстве V отображение р: V х V —> R, определенное равенством р(х,у) = \х - у\, (74.2) задает метрику. Доказательство. Действительно, правило (74.2) определяет отображение р : V х V —> R, которое отвечает всем аксиомам метри- ки. Проверка этих аксиом тривиальна, отметим лишь одну из них: p(z,z) = |z-z| = \(x-y) + (y-z)\ < - у\ + |у-z\ = p(x,y)+p(y,z), \/х, y,z € V. Итак, евклидово (унитарное) пространство является метрическим пространством относительно метрики (74.2). В дальнейшем, говоря об евклидовом (унитарном) пространстве как о метрическом, будем иметь в виду именно эту метрику. Теорема 74.2 (о кратчайшем расстоянии). Расстояние между вектором f и линейным подпространством L в евклидовом (унитарном) пространстве равно длине перпендикуляра, опущенно- го из вектора f на L . Доказательство. Пусть f = g + h, где g € L, h € Г1, и у - произвольный вектор из L. Тогда p(J, у) = |/ — у\ = |(g + /i) — у| — \h + + (.9 ~ 2/)I — { в силу (72.3) } = + |<? - ?/|2 . Отсюда следует, что p(f,y) > \h\, Vy € L и p(J,y) = |/i|, если у = g. Это означает, что |Л| = inf р(/, у) = p(f,L). y€L Эта теорема может быть сформулирована и в других терминах, а именно: 1) расстояние между вектором f и подпространством L равно расстоянию между вектором f и его ортогональной проекцией на L; 2) среди всех векторов подпространства L ближе всего к вектору f расположена его ортогональная проекция на L. Теорема 74.3. Пусть Н = xq + L - линейное аффинное мно- гообразие в евклидовом (унитарном) пространстве. Тогда p(f,H)^p(f-x0,L).
§ 75. Изометрия 239 Это утверждение следует из теоремы 74.2 и того, что для любого вектора z — хо + у G Н справедливы равенства p(f,z) = \f — z\ = = К/ - *о) - У\ = Р(/ - *о,!/), где у G L. Теорема 74.4. Пусть Н\ = xi + Li u Н2 = х2 + L2 - линей- ные аффинные многообразия в евклидовом (унитарном) простран- стве. Тогда p(Hr, Н2) = p(xi - х2, ^1 + L2). Это утверждение следует из того, что для любых векторов zj = = si + yi G Ну и z2 = х2 + у2 G Н2 выполняются равенства p(zi, z2) — = 1^1 -Z2\ = |(xt -x2)- (yi -3/2)| = p(si-x2,j/), где у = yi-y2 € (Li + + L2). §75 . Изометрия Два евклидовых (или два унитарных) пространства Vj и V2 назы- ваются изометричными или евклидово изоморфными, если существу- ет биективное отображение <р : Vj —> V2, которое сохраняет законы композиции и скалярное произведение, т.е. если: 1) tp(x + y) =<p(s) +<р(у), Vx,yGVi; 2) tp(ax) = oip(x), Vx G У), Vo G P; 3) (<p(x),^(y)) = (x,y), Vx,j/GVi. Само отображение <p при этом называется изометрией или евкли- довым изоморфизмом. Из определения следует, что изоморфные евклидовы (унитарные) пространства изоморфны как линейные пространства. Теорема 75.1. Два евклидовых (унитарных) пространства изометричны тогда и только тогда, когда равны их