Текст
                    А.И.Малъцев
ОСНОВЫ ЛИНЕЙНОЙ АЛГЕБРЫ
ОГЛАВЛЕНИЕ
Предисловие к третьему изданию	7
Введение	8
Глава I. Матрицы и определители	10
§	1. Действия с матрицами	10
1.1.	Матрицы. Основное поле (10). 1.2. Умножение матриц (12). 1.3.
Транспонирование матриц (17). 1.4. Клеточные матрицы (21). 1.5.
Кватернионы (24).
Примеры и задачи	28
§	2. Определители	30
2.1.	Определение (30). 2.2. Основные свойства определителей (36).
2.3.	Определитель произведения. Обратные матрицы (45). 2.4.
Крамеровские системы линейных уравнений (50).
Дополнения и примеры	54
§	3. Характеристический и минимальный многочлены	55
3.1.	Подобие матриц (55). 3.2. Характеристический многочлен (57).
3.3.	Минимальный многочлен (60).
Примеры и задачи	64
Глава П. Линейные пространства	65
§	4. Размерность	65
4.1 Модули и векторные пространства (65). 4.2. Линейная зависимость
(70)	. 4.3. Изоморфизм (78).
Примеры и задачи	81
§	5. Координаты	81
5.1.	Координаты вектора (81). 5.2. Ранги матриц (85). 5.3. Общие
системы линейных уравнений (92).
Дополнения и примеры	97
§	6. Линейные подпространства	98
6.	1. Пересечение и сумма подпространств (98). 6.2. Прямые суммы
(103	). 6.3. Системы однородных линейных уравнений (105).
Примеры и задачи	109
Глава Ш. Линейные преобразования	110
§	7. Преобразования произвольных множеств	110
7.1.	Произведение преобразований (ПО). 7.2. Единичное и обратное
преобразования (112). 7.3. Взаимно однозначные преобразования
(113). 7.4. Подстановки (114).
Примеры и задачи	117
§	8. Линейные преобразования и их матрицы	117
8.1.	Простейшие свойства (117). 8.2. Матрица линейного
преобразования (120). 8.3. Преобразование координат (121).
Примеры и задачи	123

§ 9. Действия с линейными преобразованиями 123 9.1. Умножение линейных преобразований (123). 9.2. Умножение на число и сложение (125). 9.3. Многочлены от линейных преобразований (127). Примеры и задачи 128 §10 . Ранг и дефект линейного преобразования 129 10.1. Ядро и область значений (129). 10.2. Особенные и неособенные преобразования (131). 10.3. Ранг матрицы преобразования (133). Примеры и задачи 135 §11 . Инвариантные подпространства 135 11.1. Индуцированное преобразование (135). 11.2. Прямая сумма инвариантных подпространств (137). 11.3. Характеристический многочлен преобразования (139). 11.4. Собственные векторы и собственные значения (140). Примеры и задачи 143 §12 . Преобразования с матрицей нормальной формы 144 12.1. Диагональная форма (144). 12.2. Клетки Жордана (145). 12.3. Корневые подпространства (146). Примеры и задачи 149 Глава IV. Многочленные матрицы 150 §13 . Инвариантные множители 150 13.1. Эквивалентность (150). 13.2. Диагональная форма (152). 13.3. Наибольшие общие делители миноров (155). 13.4. Условия эквивалентности (159). Примеры и задачи 162 §14 . Элементарные делители 163 14.1. Связь с инвариантными множителями (163). 14.2. Элементарные делители распавшейся матрицы (165). Примеры и задачи 166 §15 . Нормальные формы матрицы линейного преобразования 167 15.1. Деление 1-матриц (167). 15.2. Скалярная эквивалентность (169). 15.3. Критерий подобия матриц (170). 15.4. Нормальная форма Жордана (171). 15.5. Естественная нормальная форма (174). 15.6. Другие нормальные формы (176). Примеры и задачи 179 §16 . Функции от матриц 180 16.1. Многочлен от жордановой матрицы (181). 16.2. Скалярные функции (182). 16.3. Представление значений функций многочленами (185). 16.4. Элементарные делители функций (187). 16.5. Степенные ряды (190). 16.6. Матрицы, перестановочные с данной матрицей (191). 16.7. Матрицы, перестановочные с перестановочными матрицами (195). Примеры и задачи 197
Глава V. Унитарные и евклидовы пространства 199 §17 . Унитарные пространства 199 17.1. Аксиоматика и примеры (199). 17.2. Длина вектора (203). 17.3. Ортонормированные системы (205). 17.4. Изоморфизм (210). 17.5. Ортогональные суммы. Проекции (211). Примеры и задачи 213 §18 . Сопряженные преобразования 214 18.1. Линейные функции (214). 18.2. Сопряженные преобразования (217) . 18.3. Нормальные преобразования (219). Примеры и задачи 224 § 19. Унитарные и симметрические преобразования 225 19.1. Унитарные преобразования (225). 19.2. Унитарная эквивалентность (227). 19.3. Нормальная форма матрицы унитарного преобразования (229). 19.4. Симметрические преобразования (231). 19.5.Кососимметрические преобразования(233). 19.6. Неотрицательные симметрические преобразования (235). Примеры и задачи 239 § 20. Разложения общих преобразований 240 20. 1. Разложение на симметрическую и кососимметрическую части (240) . 20.2. Полярное разложение (241). 20.3. Преобразование Кэли (245) . 20.4. Спектральное разложение (248). Примеры и задачи 252 Глава VI. Квадратичные и билинейные формы 254 § 21. Билинейные формы 254 21.1. Преобразование форм (254). 21.2. Эквивалентность билинейных форм (251).21.3.Конгруэнтность симметрических билинейных форм (259). Примеры и задачи 261 § 22. Квадратичные формы 262 22.1. Конгруэнтность (262). 22.2. Алгоритм Лагранжа (264). 22.3. Закон инерции квадратичных форм (267). 22.4. Знакопостоянные формы (269). Примеры и задачи 270 § 23. Пары форм 271 23.1. Эквивалентность пар форм (271). 23.2. Конгруэнтность пар форм (272). 23.3. Конгруэнтность несимметрических билинейных форм (276). Примеры и задачи 4 278 § 24. Билинейные функции 278 24.1. Основные определения (278). 24.2. Пространства с билинейной метрикой (282). 24.3. Билинейные функции в билинейно- метрических пространствах (286). Примеры и задачи 292
Глава VII. Линейные преобразования билинейно-метрических 293 пространств § 25. Основные типы линейных преобразований 293 25.1. Автоморфизмы (293). 25.2. Симметрические и кососимметрические преобразования (298). Примеры и задачи 300 § 26. Комплексные евклидовы пространства 300 26.1. Симметрические преобразования (301). 26.2. Кососимметрические преобразования (303). 26.3. Комплексные ортогональные преобразования (306). Примеры и задачи 309 § 27. Симплектические пространства 309 27.1. Симметрические преобразования (309). 27.2. Кососимметрические преобразования (312). 27.3. Симплектические преобразования (313). Примеры и задачи 315 § 28. Псевдоунитарные пространства 315 28.1. Симметрические преобразования (316). 28.2. Псевдоунитарные преобразования (324). Примеры и задачи 445 Глава VIII. Аффинные пространства 326 § 29. Общие аффинные пространства 326 29.1. Аксиоматика (326). 29.2. Линейные многообразия (334). 29.3. Параллельные плоскости (344). 29.4. Линейные функционалы (346). Дополнения и примеры 351 § 30. Аффинные координаты 353 30.1. Координаты точки (353). 30.2. Уравнения плоскостей (356). 30.3. Уравнения гиперплоскостей и прямых (364). 30.4. Преобразование аффинных координат (369). Примеры и задачи 373 § 31. Выпуклые тела 374 31.1. Лучи (374). 31.2. Полупространства (377). 31.3. Выпуклые множества (381). Дополнения и примеры 385 § 32. Евклидовы точечные пространства 386 32.1. Длина ломаной (386). 32.2. Угол между прямыми (388). 32.3. Ортогональные проекции (391). 32.4. Угол между плоскостью и прямой (397). Примеры и задачи 398 Предметный указатель 399 ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ Автоморфизм 139, 293, 332 Адъюнкт минора 55
Алгоритм Гаусса 51 — Лагранжа 264 База 72, 81, 106, 206 Базис 72, 337, 353 Вектор 66 — изотропный 283 — корневой 147 — нормированный 203 — свободный 326 — собственный 141 Гиперплоскость 100, 341, 362, 385 Гиперповерхность алгебраическая 357 Гомоморфизм 331, 351 Делитель миноров 155 — элементарный 164 Дефект матрицы 134 — преобразования 129 Длина вектора 203 Дополнение ортогональное 212 —, — к плоскости 393 Зависимость линейная 70, 71, 334, 336 Закон двойственности 351 — инерции 260, 268 Замыкание 336, 381 Изоморфизм билинейно-метрических пространств 284 — косой 81 — линейных преобразований 132, 228, 294 -----пространств 78, 132 — унитарных пространств 210 Кватернион 26 Клетка Жордана 145 -----обобщенная 178 Конгруэнтность матриц 259, 273 — форм 257, 272 Коразмерность 340 Кратность собственного значения 142 Линейная комбинация 68 Ломаная 387 Луч 376 Матрица 10 — автоморфизма 372 — адъюнгированная 47 — билинейной функции 279 — Грама 214, 282 ---жор данова 146, 171 — идемпотентная 29 — инволютивная 29 — индуцированного преобразования 137 — каноническая диагональная 152 — клеточно-диагональнаь 24 — клеточно-треугольная 62 — комплексно-сопряженная 20 — кососимметрическая 18 — линейного преобразования 120 — многочленная (1-матрица) 150 Матрица неособенная 49 — нильпотентная 64 — нулевая 11 — обратная 19, 85 — ортогональная 20, 49 — особенная 49 — перехода 83, 370 — полупростая 180 — полураспавшаяся 34, 62, 137 — преобразования 255 — присоединенная 47 — распавшаяся 61 — симметрическая 18 — симплектическая 314 — системы 30, 31, 50, 93 — скалярная 169 — сопровождающая 174 — строчечно-конечная 29 — транспонированная 18, 40 — треугольная 64 — унитарная 21, 49, 226 — формы 257 — характеристическая 57 — эрмитова 21, 234 Метрика билинейная 282
Минор 42, 55, 64 Многогранник выпуклый 386 Многообразие алгебр 351 — алгебраическое 357 — корневое 348 — линейное 336 Многочлен матричный 16, 167 — минимальный матрицы 60 -----преобразования 140 Множество выпуклое (конвексное) 381,383 Множители инвариантные 159, 172 Модуль 65 — унитарный 66, 80 Независимость линейная 70, 334, 336 Неравенство Бесселя 208 — Коши—Бупяковского 208 Область значений 129 Определитель 30, 31 — Вандермонда 54 — Грама 214 — объемный 355 — преобразования 139 Ортогональность векторов 205, 283 — множеств векторов 211 — подпространств 211 Отрезок 376 Перенос 327 Плоскость 100, 336 — дополнительная 340 — координатная «-мерная 362 — пустая 338 Подобие матриц 55, 170 — преобразований 132, 228 Подпространство 98 — дополнительное 339 — изотропное 283 — инвариантное 135 — истинное (нетривиальное) 99 — касательное 344 Подпространство корневое 147 — линейное 98 - — нулевое 98 — тривиальное 98 Подстановка 114, 115 Поле упорядоченное 374 Полуплоскость 380 Полупространство 378 Порядок дуальный 375 —, естественный на прямой 375 Правило треугольника 330 Представление функционала 355 Преобразование ПО, 117 — взаимно однозначное 113 — единичное 112, 118 — идемпотентное 248 — изометрическое 293 — индуцированное 137 — координат 83, 84, 121 — кососимметрическое 233, 291, 298 — Кэли 245, 299 — линейное 117, 241 — неособенное 131 — нормальное 219 — нулевое 118 — обратное 112 — ортогональное 249, 306 — особенное 131 — проекционное 248 — псевдоунитарное 324 — симметрическое 231, 235, 291, 298 — симплектическое 314 — сопряженное 217, 289 — унитарное 225 — эрмитово 231 ---матриц элементарное 151 Признак Якоби 270 Проекция вектора на подпространство 213, 248 — ортогональная 393 Произведение матриц 13 — преобразований 111 — скалярное 201, 202 Пространство аффинное над векторным пространством 326 -------полем 329, 351
— билинейно-метрическое 282 — евклидово 200, 201, 286, 386 — конечномерное 13 — линейное (или векторное) 66, 63 — метрическое 387 — псевдоевклидово 285 — псевдсунитарное 286, 315 — симплектическое 286, 309 — сопряженное (или дуальное) 214 — строк 68 — унитарное 201, 386 — функций 202 Процесс Грама—Шмидта 209 Прямая 100, 338 Равенство Парсеваля 209 Радиус-вектор точки 327 Разложение полярное 241 — спектральное 250 Размерность аффинного пространства 334 — выпуклого множества 383 — линейного пространства 73 Ранг матрицы 86 — однородной системы 108 — преобразования 12Э — формы 257 Расстояние между векторами 205 -----точками 38/ Репер 353, 388 Решение нулевое 106 Решение системы линейных уравнений 50, 93 Ряд степенной от матриц 190 Сдвиг 327 Сигнатура пространства 285, 286 — формы 260 Симплекс 385, 386 Система векторов линейно зависимая 70 -----ортогональная 205 -----ортонормированная 206 — координатная 81 -----нормальная 301, 316 -----симплектическая 309 — образующая 72 — точек выпукло неприводимая 386 — уравнений 357 -----линейных 50, 51, 95, 105 След матрицы 57 — преобразования 139 Смещение 329 Собственное значение матрицы 58 -----преобразования 140 Спектр линейного преобразования 252 Строка 68 — координатная 82, 353, 355 Сумма матриц прямая 24 — подпространств 100, 103, 211 — преобразований 126 — ряд матриц 190 Теорема Гамильтона—Кэли 59 — Кронекера—Капслли 94 — Шура 239 Тождество Лагранжа 47 Угол между лучами 391 -----прямой и плоскостью 396 -----прямыми 389 Форма 256 — билинейная 256, 258, 259, 261 — естественная нормальная 174, 175 — Жордана 146, 178 — каноническая X -матрицы 152 — квадратичная 254, 269 — линейная 254 — полилинейная 256 — эрмитова билинейная 258, 258, 263 — 5-го порядка 358 Формулы Крамера 51 Функционал линейный 346 — полилинейный 353 — 5-го порядка 358 Фундаментальная система решений 106 Функция 69 — билинейная 278, 280, 231 — квадратичная 280, 281
— косолинейная 224 — линейная 214 — матрицы 182, 183 Характеристика билинейной функции 325 — Вейра 180 — Сегре 180 Характеристический многочлен матрицы 57 -----преобразования 139 Циркулянт 44 Число характеристическое 58 Эквивалентность матриц скалярная 169, 228, 271 — форм 256, 271 — 1-матриц 151 Эндоморфизм косой 81 Ядро преобразования 129
ПРЕДИСЛОВИЕ К ТРЕТЬЕМУ ИЗДАНИЮ Анатолий Иванович Мальцев собирался существенно перера- ботать «Основы линейной алгебры» для третьего издания, выбросив часть старого текста и сделав значительные добавле- ния из геометрии. «В результате, — писал он в издательство, — возникает более чем наполовину новая книга. Надеюсь, что она будет полезна более подготовленным современным студентам уни- верситетов и пединститутов, в особенности тех университетов, где курсы линейной алгебры и аналитической геометрии чи- таются совместно. Я даже подумывал, не изменить ли название на «Основы линейной алгебры и аналитической геометрии». Смерть помешала Анатолию Ивановичу осуществить его планы, он успел написать только первые три главы (третью не полностью). В настоящем издании главы I, II, включающие теперь теорию определителей и систем линейных уравнений, печатаются по ру- кописи Анатолия Ивановича, а главы III—VII почти без изме- нений воспроизводят соответствующий текст второго издания. За- ключительную главу второго издания — о тензорах — Анатолий Иванович собирался подвергнуть коренной переработке, но не успел даже приступить к ней; в настоящем издании эта глава опущена. Вместо нее здесь приводится новая глава VIII—об аффинных пространствах, — которая печатается по неоконченной рукописи главы III. Ссылки на некоторые определения и результаты общей теории алгебраических систем даются по книге А. И, Мальцева «Алгебраические системы» (цитируется «АС»), вышедшей в 1969 г. в издательстве «Наука». Мы старались по возможности сохранить оригинальное изложение Анатолия Ивановича и ограничились са- мыми необходимыми изменениями и исправлениями отдельных неточностей. Ю. Л. Ершов, Ю. И. Мерзляков, В. Н. Ремесленников Новосибирск, Академгородок, 1 июня 1968 г.
ВВЕДЕНИЕ Линейная алгебра — ветвь математики столь же старая, как и сама математика. Первоначальной задачей линейной алгебры можно считать задачу решения линейного уравнения ах -j- b = 0. Хотя эта задача и не представляет каких-либо трудностей, прием, при помощи которого она решается, а также свойства соответ- ствующей линейной функции у — ах-\-Ь являются исходными образцами для идей и методов всей линейной алгебры. Напри- мер, учение о решении систем уравнений со многими неизвестны- ми имеет в своей основе идею замены системы цепочкой указан- ных уравнений простейшего вида. Важность систем линейных уравнений особенно возросла после создания аналитической геометрии, позволившей свести к исследованию систем линейных уравнений все основные вопро- сы о расположении плоскостей и прямых в пространстве. Поис- ки общих формул решения системы п уравнений с п неизвест- ными уже в XVIII в. привели Лейбница и Крамера к понятию определителя. В XIX в., помимо алгебры и аналитической гео- метрии, определители проникают и в анализ в работах Остро- градского, Якоби (функциональные определители), Вронского и др. Параллельно с этим в аналитической геометрии, теории чисел и особенно в теоретической механике все большую важ- ность приобретала задача преобразования квадратичных форм линейными подстановками переменных. Эта же задача явилась одной из центральных и в разработке геометрических идей Лоба- чевского и Римана, приведшей к созданию учения о линейных многомерных пространствах (Грассман). В середине прошлого века в связи с исследованиями некоммутативных алгебр (Гамиль- тон) в работах Кэли и Сильвестра возникает матричное исчисле- ние, занявшее в дальнейшем развитии линейной алгебры одно из главных мест. К концу XIX в. оказались созданными важ- нейшие разделы матричного исчисления: о нормальной форме матрицы линейного преобразования (Жордан), элементарных делителях (Вейерштрасс), парах квадратичных форм (Вейерштрасс, Кронекер), эрмитовых формах (Эрмит). Развитие дифференциаль- ной геометрии многомерных пространств и теории преобразований
ВВЕДЕНИЕ 9 алгебраических форм высших степеней приводит в конце XIX в. к созданию тензорного исчисления. В текущем столетии, методы линейной алгебры нашли обшир- ные применения и были развиты дальше в теории колец и модулей, в теории представлений групп, а также в теории топо- логических векторных пространств и других разделах функцио- нального анализа. Уже в последние два десятилетия теория ли- нейных неравенств и неразрывно связанная с ней теория аффин- ных многомерных пространств заняли одно из центральных мест в такой популярной области прикладной математики, как теория операций. Благодаря этому элементы теории многомерных аф- финных пространств стали теперь обязательной частью матема- тического образования инженеров и экономистов. В линейной алгебре изучаются объекты трех родов: матрицы, пространства и алгебраические формы. Теории этих объектов тесно связаны друг с другом. Большинство задач линейной ал- гебры допускает естественную формулировку в каждой из ука- занных трех теорий. Матричная формулировка обычно наиболее удобна для вычислений. С другой стороны, в геометрии и меха- нике большинство задач линейной алгебры возникает в виде задач об исследовании алгебраических форм. Тем не менее наи- более отчетливое понимание внутренних связей между различ- ными задачами линейной алгебры достигается лишь при рас- смотрении соответствующих линейных пространств, которые и являются поэтому главным объектом изучения линейной ал- гебры. С точки зрения теории форм содержание линейной алгебры естественно распадается на теорию линейных, теорию квадра- тичных и теорию форм высших степеней. К собственно линейной алгебре обычно относят лишь теорию линейных и квадратичных форм, а также начала теории полилинейных форм и тензорной алгебры.
Глава I МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ § 1. Действия с матрицами 1.1. Матрицы. Основное поле. Главными объектами изучения далее будут матрицы, линейные пространства и многочлены от нескольких переменных, называемые также алгебраическими фор- мами. В определении каждого из этих объектов участвует неко- торая совокупность К чисел или элементов иной природы, которая должна быть предварительно выбрана. Фактический выбор /< зависит от решаемых задач и научной дисциплины. Например, с алгебраической точки зрения результаты получают наиболее законченную форму, если в качестве К выбрать совокупность всех комплексных чисел. Напротив, в геометрии и механике обычно необходимо рассматривать вещественные числа, а в теории чисел в качестве К естественно брать совокупность рациональных чисел и даже совокупность лишь целых рациональных чисел. Поэтому, чтобы сделать результаты применимыми к возможно более широкому кругу задач, целесообразно заранее не фиксиро- вать, какая именно индивидуальная совокупность понимается под К- В некоторых разделах достаточно будет предполагать, что К — какое-то ассоциативное кольцо. В ряде глав мы будем предполагать, что К — произвольное поле или произвольное упо- рядоченное поле, а многие важные теоремы будут доказаны лишь в предположении, что /С — совокупность всех вещественных или совокупность всех комплексных чисел. Для геометрических и физических приложений наиболее важны как раз случаи, когда К, — поле вещественных или поле комплексных чисел. Элементы совокупности К далее будут называться числами, даже и тогда, когда /С будет произвольным кольцом. Мы будем их обозначать малыми греческими буквами а, р, ... , т. Произвольная система элементов совокупности К, располо- женная в виде прямоугольной таблицы, содержащей т строк и п столбцов, называется (т, п)-матрицей или просто матрицей над /С Чтобы записать матрицу, выписывают в надлежащем порядке обозначения ее элементов и получившуюся таблицу заключают в скобки или ограничивают двойными чертами. Таким
§ 1] ДЕЙСТВИЯ С МАТРИЦАМИ 11 образом, общий вид (т, п)-матрицы будет «и а12 ... «21 «22 • • • «2п - «ml «m2 • * • &тп - '«и а12 ... аи\ «21 «22 «2н v«ml «m2 ••• ®’тп! «И «12 • • * «1п «21 «22 • • • «2п «ml «m2 • • • «т п где а,-у — обозначения элементов из К- Часто вместо такой под- робной записи употребляют сокращенную: || а,-у || или || аг;-1| п- Если число строк матрицы равно числу ее столбцов, то матрица называется квадратной, а число ее строк, равное чис- лу столбцов, называется порядком квадратной матрицы. В частности, квадратная матрица порядка 1 — это просто элемент из К- Матрицу, имеющую только одну строку, называют просто строкой, а число ее элементов — длиной строки. В дальнейшем матрицы будут обозначаться большими буквами латинского алфа- вита. Две матрицы называются равными, если числа строк и столб- цов у них соответственно равны и если равны числа, стоящие на соответственных местах этих матриц. Таким образом, одно равенство между (т, п)-матрицами равносильно системе тп равенств между их элементами. Основными матричными операциями являются умножение числа на матрицу или матрицы на число, сложение и перемножение двух матриц. По определению, чтобы умножить число а на мат- рицу А или матрицу А на число а, нужно умножить на а все элементы матрицы А. Например, к pl Гак ар. £ т] ас ат] к р ка ра • а — £ 7]J [;а т]а Если рассматриваются матрицы над коммутативным кольцом К, то для любой матрицы А и любого а К справедливо равенство аА — Ах. В случае некоммутативного кольца К может оказаться, что аА Ф Ла. Беря в качестве К кольцо всех целых чисел, полу- чим, например, Г10 151 ’2 3’ _ Д 3' 7 —1 ~ 7 —1 Матрица, все элементы которой равны нулю, называется нуле- вой матрицей и обозначается О. Если желают указать явно число строк и столбцов нулевой матрицы, то пишут 0тп.
12 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ [Гл. Г Ясно, что для каждой матрицы А над Л/ и каждых а, р £ Я имеют место соотношения: 1. 1-Л = Л-1=Л. 2. 0-Л = Л-0 = О; а.О = О-а = О. 3. а (8Л) = (ар) Л; (Ла)р = Л(оф). Суммой двух матриц А и В, имеющих соответственно равные числа строк и столбцов, называется матрица, имеющая те же числа строк и столбцов и элементы, равные суммам соответствую- щих элементов матриц А, В. Например, 2 1 Из этого определения непосредственно вытекают соотношения: 4. а + (в-;-С) = (лн-в)+с. 5. Л + В = В4-Л. 6. (а + р) А =аЛ -|- рЛ; Л (а -{- Р) = Ла Лр. 7. а. (Л-4-В) = аЛ Д-аВ; (Л Д-В) а = Ла-|-Ва. 8. лд-о = о-дл = л, доказательства которых предоставляются читателю. В частности, применяя свойства 1 и 6, получим А^А = 2А, Л Д-Л Д-Л = ЗЛ,... Вводя обозначение (—1)Л = — А, будем иметь также ЛД-(—Л) = 0, (— а)Л= — аЛ, — (Л Д-В) = —Л — В, -(-Л) = Л. Для краткости вместо ЛД-(—В) обыкновенно пишут А—В. 1.2. Умножение матриц. В отличие от операций сложения и умножения на число операция умножения матрицы на матрицу определяется более сложным образом. Именно пусть заданы две матрицы Л, В, причем число числу строк второй. Если ~ац а1а ... aj„_ д___ а-21 • • • а2л L-aml am-2 ••• amzj столбцов первой из них равно ”рп ри ... pip" Р^1 Р-22 • • • Р'2р , ~Рл1 Рл2 ••• Рлр-1 то матрица Ти Ты ... Tip Т‘21 Ts2 • • • Т'2Р -1ml Тий ••• Imp-
§ И ДЕЙСТВИЯ С МАТРИЦАМИ 13 где Т»/---аиР1/Н~Я(-2р2?-4- ••• -|~®1лРл/ (j—!>•••, tn', i—р)> называется произведением А на В н обозначается АВ. Например, а aj а.2 г v "ay -f-pX. аЗ -|- as -|-ру ~ = “п рА т-4 Д-®1'л ais 4" _a.2f р2Х а23 p.2u, a.2s Правило умножения матриц иногда формулируют следующим образом: чтобы получить элемент, стоящий в i-й строке и j-м столбце произведения двух матриц, нужно элементы i-й строки первой матрицы умножить на соответственные элементы j-eo столбца второй и полученные произведения сложить. Произведение двух матриц, вообще говоря, зависит от порядка сомножителей даже и в том случае, когда кольцо К. коммута- тивно. Например, Если рассматривать матрицы не квадратные, то может слу- читься даже, что произведение двух матриц в одном порядке будет иметь смысл, а в обратном — нет. Докажем теперь основные свойства умножения матриц. 9. а(ЛВ) = (аЛ)В; Л(аВ) = (Ла)В; (ЛВ)а = Л(Ва). Пусть Л = || агу ||тя, В = || ||„р. Пользуясь правилом умноже- ния матриц, мы получим для элемента, находящегося в i-й строке и А-м столбце матрицы а(ЛВ) (i = l,..., m; k = \,..., р), сле- дующее выражение: Н ~~ЬQ-irfynk)’ Аналогично для элемента, находящегося в той же i-й строке и /г-м столбце матрицы (аЛ) В, получим выражение (а«д) Р1Й + ••• +(а«м)рЯй- Так как оба выражения равны, то первое из равенств 9 доказано. Такими же вычислениями доказываются и остальные два равенства из 9, а также и свойства: 10. (ЛД-В)С = ЛС + ВС. 11. С(А-{-В)^=СА--СВ. Из свойств 10, 11 непосредственно вытекает общее правило: чтобы умножить сумму матриц на сумму, нужно каждую мат- рицу первой суммы умножить на каждую матрицу второй и полу- ченные произведения сложить.
14 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ / [Гл. t Мы видели, что закон коммутативности для произведения матриц не выполняется: АВ может отличаться от В А. Однако второй арифметический закон — ассоциативность умножения —для матричного умножения выполняется *). 12. Л(ВС) = (ЛВ)С. Для доказательства положим АВ = М, BC=-N и обозначим элементы матриц М, /V через По правилу умножения матриц имеем Pik--4" ai'2p'2Z? Т" • • • —t- '’jt — P/1T1Z + ?/2f-2Z + • Ч~ $jp4pl, где a,-у, fki — элементы матриц А, В, С. Выполняя умноже- ние 7И на С, мы в t-й строке и l-м столбце матрицы (ЛВ) С получим сумму 4- ~г • • • + P-zp’fpz = S S ’оШ Л 7 Аналогично, выполняя умножение А на N, мы в i-i’i строке и в l-м столбце произведения А (ВС) получим сумму «/Рп 4- 4* • • 4- 7-in'>nl = У, У, ) !< Так как обе эти суммы отличаются лишь порядком слагаемых, то формула 12 доказана. Из формулы 12 следует, что произведение нескольких мат- риц А, В, С,..., D, записанных в определенном порядке, от способа расстановки скобок не зависит. Поэтому можно говорить не только о произведении двух, но и о произведении большего числа матриц. Например, можно говорить просто о произведении четырех матриц A BCD, так как все пять возможных способов вычисления этого произведения ((Л В) С) О, (Л(ВС))Р, Л((ВС)Д), А (В (CD)). (АВ) (CD) дают один и тот же результат. Действительно, каждое следующее произведение получается из предшествующего непосредственным применением закона ассоциативности 12. Выше уже отмечалось, что не всякие две матрицы можно сложить или перемножить, так как для осуществимости таких действий необходимы известные соотношения между числами *) Поскольку складывать и перемножать можно не любые матрицы, а только те, числа строк и столбцов которых подчинены известным условиям, то равенства 10, 11, 12 следует понимать так, что если действия, указанные по одну сторону от знака равенства, возможны, то действия, указанные по другую сторону, также возможны и результаты в обеих частях одинаковы.
§ П ДЕЙСТВИЯ С МАТРИЦАМИ 15 строк и столбцов. Это неудобство исчезает, если рассматривать только квадратные матрицы некоторого фиксированного порядка п. Любые две такие матрицы можно сложить или перемножить, также помножить на любые числа из Л, и в результате снова получатся квадратные матрицы того же порядка п. Свойства 1 —12 показывают, что совокупность всех квадратных матриц данного порядка п над произвольным ассоциативным кольцом К является снова ассоциативным кольцом относительно матричных операций сложения и умножения. Всюду далее мы будем предполагать, что основная числовая совокупность К есть ассоциативное кольцо с единицей 1. Квадрат- ная матрица, все диагональные элементы которой равны 1, а остальные — нулю, называется единичной и обозначается Е или Еп, где п — ее порядок. Таким образом, hi -1 0 ... о- 0 1 ... 0 _0 0 ... 1_ Непосредственным вычислением для любой квадратной матрицы А получим равенство АЕ — ЕА — А, выражающее основное свойство матрицы Е. Матрицы, имеющие вид га 0 ... 0- 0 ^ ... 0 _0 0 называются диагональными. Из правил действий непосредственно вытекает, что сумма и произведение диагональных матриц будут снова диагональными матрицами: "а ) ... 0 Га‘ 0 ... 0г " а - К Я1 0 0 - о ... 0 + 0 ... 0 о Р-Н1 ... 0 > _0 0 ... у. _0 0 ... 71- 0 0 7 + 71- а 0 . с - 'а, 0 о- аа, 0 ... 0 " 0 ₽ .. . с 0 ₽, ... 0 = 0 ₽₽! ... 0 • _0 0.. 7 -0 0 ... 71- _0 0 ... Л1_
16 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ [Гл. I Рассмотрим теперь произвольную квадратную матрицу X по- рядка п с элементами из кольца X- По определению полагаем Х° = Е, Х1 = Х, Х* = ХХ, Х'}=~-ХХХ, ... Так как в произведениях нескольких матриц скобки можно расставлять произвольно, то для любых целых неотрицатель- ных р, q и произвольной квадратной матрицы X над ассоциативным кольцом /< имеем XpXq — Xp*q, (1) (Xp)9 — Xpq. (2) Матрицы А и В называются перестановочными, если АВ— В А. (3) Из соотношения (1) получаем XpXq — Xp+q = XqXp, и, значит, все натуральные степени одной и той же матрицы перестановочны между собой. Справедливо и более общее утверждение: если матрицы А и В перестановочны, то любые их натуральные степени также перестановочны и для любого натурального р имеем (АВУ = АРВР. (4) В самом деле, для любых натуральных р, q ApBq — AA ...АВ... В. По условию в этом произведении можно переставить любые со- седние множители. Но такими перестановками можно их распо- ложить в любом порядке, в частности, можно переставить все сомножители, равные В, на первые места. Аналогично доказы- вается и формула (4). Рассмотрим теперь какой-нибудь многочлен <? С-) — 7-о + =чХ -!-••• + v" от буквы X, коэффициенты которого принадлежат кольцу X. Если А — какая-нибудь квадратная матрица над X, то выражение а0Е -|- Я1А 4- .. - -ф- апАп называется значением многочлена (X) при 1 — А или, короче, соответствующим многочленом от матрицы А. Предполагая кольцо X коммутативным, легко приходим к заключению, что значение суммы многочленов от X при X = А равно сумме значений слагаемых, а значение произведения многочленов равно произведению значений сомножителей.
§ 1] ДЕЙСТВИЯ С МАТРИЦАМИ 17 Пусть ср (X) = а0 -р ар. ... -|- Ф(Х) = ^оН-?1х+...+з„х\ Тогда А(Х) = <? (X) + * (X)=(*о + ?о) + («1Ч- 30 X Ч- • • • + (“-л ч- ?«) S (X) = '? (X) ф (X) =. а030 4- (я0?1 Ч- “i?o) X -|- ... -ф- а„?„Х2я. Наши утверждения состоят в том, что ДЛ) = ср(Л) + ф(А), £(Л) = <?(Л)ф(Л). Для доказательства достаточно выписать <?(Л), ф(Л), /(Л), g(A) и по правилам 1—12 матричного исчисления произвести сложение и умножение ср (Л) и ф(Л). В качестве примера рассмотрим равенство X2—1 =(Х—1)(Х-ф-1). Беря значения левой и правой частей при Х = Л, получим мат- ричное равенство А'2 — Е = (А — Е) (А + Е). Аналогичным путем из равенства X’ + 1=(X-H)(XS-X+1) получим соотношение Ая -L-E=(A Е) (Л2 - Л Л- Е). Вообще из каждого соотношения между многочленами от X таким способом получается некоторое матричное тождество. В частности, по правилам действий с многочленами имеем ср (X) ф (X) = ф (X) ср (X). Подставляя сюда вместо X какую-нибудь квадратную матрицу Л, получим ср(Л)ф(Л) = ф (Л) ср (Л). Следовательно, многочлены от одной и той же матрицы переста- новочны друг с другом. 1.3. Транспонирование матриц. Рассмотрим произвольную мат- рицу ““и а12 ... Л __ “21 “22 • “2л -“ml “m2 • • • “тл -
18 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ [Гл. I Матрица а11 а21 • • ат1 ^22 • • • -°1п а,2л ••• $’тп получающаяся из А заменой строк столбцами, называется транс- понированной по отношению к Л. В дальнейшем штрихом всегда будет обозначаться переход к транспонированной матрице. Для произвольных матриц А, В имеют место следующее пра- вила транспонирования'. (аЛ-Д W = rj-A' (АВ)’— В'А', где а, — какие-либо числа. Докажем, например, второе из этих равенств. Элемент, стоящий в г-й строке и /-м столбце мат- рицы (АВ)', равен элементу, стоящему в /-й строке и i-м столбце матрицы АВ, т. е. равен -гМ«Н- ••• + ajn?nh где a.ij, — элементы матриц А, В. Но это выражение есть сумма произведений элементов г-й строки матрицы В' на соответственные элементы /-го столбца матрицы А', так что (АВ)' —В'А'. Если А — произвольная квадратная матрица и А' —А, то А называется симметрической', если же А' = — А, то — кососимметрической. Элементы, расположенные симметрично относительно главной диагонали, у симметрической матрицы равны, а у кососимметрической противоположны. В частности, все диаго- нальные элементы кососимметрической матрицы равны нулю. Из правила транспонирования суммы непосредственно выте- кает, что сумма симметрических матриц есть матрица симметри- ческая, а сумма кососимметрических — матрица кососимметриче- ская. Произведение симметрических матриц может и не быть симметрической матрицей, например: 1 21 Г2 11Г4 3 2 3 ' 1 1 “ 7 5 Однако, если две симметрические матрицы А, В перестановочны, то их произведение будет снова матрицей симметрической.
ДЕЙСТВИЯ С МАТРИЦАМИ 19 Действительно, в этом случае (АВ)'— В'А'— ВА —АВ. Отсюда следует, что степени симметрической матрицы являются симметрическими матрицами и многочлены от симметрической мат- рицы являются также матрицами симметрическими. Квадратная матрица А над кольцом К называется обратимой (над К), если существует квадратная матрица X над К, удовлетво- ряющая соотношениям АХ = ХА — Е. (1) Каждая матрица X, удовлетворяющая условиям (1), назы- вается матрицей, обратной к А, или обращением матрицы А. У каждой обратимой матрицы А существует лишь одно обращение. Действительно, если наряду с матрицей X условиям (1) удовле- творяет матрица Y, то, умножая обе части равенства AY = Е слева на X, получим ХА • Y = ХЕ, или Y — X. Обращение матрицы А, если оно существует, обозначается через Л ]. Таким образом, по определению Д . Д '= Л-1. Л — (2) В условия (1) матрицы Л и X входят симметрично, и потому, если X есть обращение Л, то Л есть обращение X, иными сло- вами, (Л 'Г^Л. (3) Если квадратные матрицы А, В, С одного и того же порядка обратимы, то их произведение АВС также обратимо и (ABC) l = C~lB iA~1, т. е. обращение произведения матриц равно произведению обращений сомножителей, расположенных в противоположном порядке. Для доказательства надо проверить лишь равенства АВС С^В^А1 = С'В ’ А~' АВС = Е, являющиеся очевидными следствиями соотношений (2) и анало- гичных соотношений для матриц В, С. Для каждой обратимой матрицы Л наряду с натуральными степенями Л° — Е, А‘ — А, А- = АА, ... рассматривают и ее целые отрицательные степени, полагая по определению = (4)
20 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ [Гл. I Дробные степени матриц рассматриваются редко, так как во многих случаях обычные определения не дают однозначных зна- чений для таких степеней (см. п. 16.2 гл. IV). Из соотношений (2), (4) следует, что для любой обратимой матрицы А и любых целых (не обязательно положительных) чи- сел р, q имеют место обычные правила действий со степенями дрдч — Ам (ЛР)Ч = ЛРЧ, и если матрицы А, В обратимы и АВ — В А, то (АВ)Р = АРВР. Посмотрим теперь, как связаны операции транспонирования и обращения. Применяя правило транспонирования произведения матриц к соотношениям (1), получаем Х'А’ — А'Х' = Е, т.е. в результате транспонирования обратимой матрицы А полу- чается снова обратимая матрица и (//^-(Л-1)'. (5) Квадратная матрица А называется ортогональной, если АА' = А'А = Е, (6) т.е. если транспонированная матрица обратна к исходной. Отсюда, в частности, следует, что каждая ортогональная матрица обратима. Так как (А')' —А, то из (6) вытекает, что обращение ортого- нальной матрицы есть ортогональная матрица. Далее, если матрицы А, В ортогональны, то А’ = А~1, В' = В~1 и, значит, (АВ)' = В'А’ = ВЛЛ-' = (ЛВ)'1, Иными словами, произведение ортогональных матриц есть ортогональная матрица. Рассмотрим еще одну матричную операцию. Пусть А — произ- вольная матрица, элементы которой являются комплексными чис- лами. Заменим в А каждый элемент комплексно сопряженным чис- лом. Полученная таким способом новая матрица называется комп- лексно сопряженной с Л и обозначается А. Операция перехода к комплексно сопряженной матрице обладает следующими
ДЕЙСТВИЯ С МАТРИЦАМИ 21 § 1] свойствами: О.Л 4-3B = a4-L-3B, 4в=Лв, _л;=-(Лу, доказательство их весьма просто и предоставляется читателю. Матрицы Л и Л' называются эрмитово-сопряженными. Если Л = Л', то Л называется эрмитовой или эрмитово-симметри- ческой. Матрица А, удовлетворяющая соотношению А'А = АА' — Е, называется унитарной. Таким же способом, как и для ортогональных матриц, дока- зывается, что матрица, обратная к унитарной матрице, явля- ется унитарной и что произведение унитарных матриц явля- ется снова унитарной матрицей. Если все элементы матрицы Л — числа вещественные, то Л==Л, и, следовательно, для вещественных матриц понятия сим- метричности и эрмитовой симметричности, унитарности и ортого- нальности соответственно совпадают. 1.4. Клеточные матрицы. Разобьем какую-нибудь матрицу А системой вертикальных и горизонтальных прямых на части. Эти части можно рассматривать как матрицы низших порядков, из которых сама матрица построена как из элементов. Они назы- ваются клетками, ящиками или блоками матрицы Л, а сама мат- рица Л, разбитая определенным способом на клетки, называется соответственно клеточной, ящичной или блочной. Одна и та же матрица может быть разбита на клетки различными способами, например: 1 87 6' 3 5Ю 2 14 9 3 '1 8 7;6' 3 5 0 2 g j Г1 87 6' 3"5:0"2 14 9 3 Удобство разбиений на клетки состоит в том, что основные операции над клеточными матрицами формально совершаются по тем же правилам, как и над обыкновенными. В самом деле, пусть некоторая матрица А каким-то способом разбита на клетки: 4ц 412 • • • 41П 4mi . А mnj
22 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ [Гл. Г Умножая все клетки на число а, мы умножим на а все элементы матрицы А. Следовательно, &Ац • • • %Ain aAmi сс?4ЯГ2 • • • &А тп Пусть В — какая-либо матрица, разбитая на такое же число клеток, что и А: ГBlt Bt> ... Bin Bmi Вт2 . •. Вюп Предположим, кроме того, что соответственные клетки матриц А и В имеют соответственно равные числа строк и столбцов. Чтобы сложить матрицы А и В, надо, согласно определению, сложить их соответственные элементы. Однако то же самое про- изойдет и в том случае, если мы сложим соответственные клетки этих матриц. Поэтому Ац Вц j4j-2-j-Bj-2 • •• 4- А±В = /4,„1 -4- Вт1 А m2 • • • Чп1л —Втп ^ Несколько менее очевидно обстоит дело с умножением. Рассмот- рим матрицы U,n 1 и= V,, umi U тп V11 Vnl ... vip- ... vnp. V — разбитые на клетки U tj, Vjk таким образом, что число столбцов клетки Uy- равняется числу строк клетки V jk (i = l, •••> tn; i—1.......n; k—\, ..., p). При этом условии выражения Wik = UnVlk + Ui2Vik +... + uinvn!l имеют смысл. Легко показать, что ... IF,/ nv = ........ (1) Wml ... lFmpJ т. e. что матрицы, разбитые надлежащим образом на клетки, мож- но перемножать обычным путем: клетки произведения равны сум- мам произведений клеток строк U на клетки соответственных столбцов V.
§ и ДЕЙСТВИЯ С МАТРИЦАМИ 23 Докажем сначала это правило в следующем частном случае: [Д = ДС4-5Д. (2) Пусть аг/-, -fyy, bki — элементы соответственных матриц Д, В, С, D (i = 1, ..., т; j = 1, ..., п; 1, ..., s; I = 1...t). Выполняя действия, указанные в левой части равенства (2), мы получим, что элемент, стоящий в t-й строке и /-м столбце, будет равен aiihi + • + ainlnl + + • • • + Однако, вычисляя соответственный элемент правой части, мы получим то же выражение, и, таким образом, равенство (2) доказано. Пользуясь формулой (2), теперь легко доказать более общую формулу: Pi [Ах А3 ••• — Д151 + Д»Дз + • • + АПВП, (3) -Вп где А;, В, — отдельные клетки. При п = 2 эта формула совпадает с (2). Далее применяем индукцию. Пусть для значений л, меньших заданного, формула (3) уже доказана, и пусть В г С = [Л2 ... Ап], : Тогда из (2) имеем Pi' в3 [Дх Д2 ... Дл] L5. — А& + CD — AiBl 4- А.>Ва ... -j- AnBn- Аналогичным путем получаются и формулы (4) (5) Чтобы теперь из частных формул (3), (4), (5) вывести общую (1), обозначим строки клеток матрицы U через Ult ..., Um, столбцы клеток матрицы V через VL, ..., Vp. На основании формулы (5) UV = ~Ut ит UtV- Umv. Подставляя сюда вместо матрицы V ее разбиение на клетки [V\ ... Vp] и пользуясь формулой (4), получим ДА Их . • • UtVp 1ад • cmcpJ UV= (6)
24 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ [Гл. I Однако в силу (3) UiVk = Wn- uin\ — +••• + U-nVnk = IV,•*. Подставляя эти выражения в (6), мы получим формулу (1). Чаще всего квадратные матрицы приходится разбивать на клетки так, чтобы диагональные клетки были также квадратными. Легко видеть, что если две квадратные матрицы разбиты на клетки таким образом, что их диагональные клетки квадратны и степени соответственных диагональных клеток совпадают, то это разбиение удовлетворяет как условиям, при которых возможно поклеточное сложение, так и условиям, которые необходимы для возможности их умножения в качестве клеточных матриц. Клеточная матрица вида А = О ... 0~ о а2 ... О .0 О ... As. где Ai, ..., As — квадратные клетки, а О — нулевые матрицы надлежащих размерностей, называется клеточно-диагональной. Вместо этого говорят также, что А распадается на части Л1,..., As или что А есть прямая сумма матриц A j,..., As; сим- волически А — Ai -j- Аз -{-... -|- As. Операции над распавшимися матрицами приводятся к опера- циям над их диагональными клетками. Отсюда в свою очередь следует, что если / (А) — некоторый многочлен и Л — клеточно-диа- гональная матрица с диагональными клетками Ль..., Л5> то г/ ИО /И)= (7) 1.5. Кватернионы. Матрицы представляют собою удобный ап- парат, при помощи которого, исходя из какого-нибудь заданного кольца, например кольца вещественных чисел, можно построить более сложные кольца. Систематически этот вопрос изучается в теории колец, а мы здесь ограничимся рассмотрением лишь двух частных случаев.
§ 1] ДЕЙСТВИЯ С МАТРИЦАМИ 25 Рассмотрим кольцо /?> всех квадратных матриц 2-го порядка над полем R вещественных чисел. Введем обозначения 1 °] / — Г° —1 О J’ L1 О Пусть С — совокупность всех матриц из имеющих вид Простое возведение в квадрат матрицы I показывает, что Р =— Е, и потому действия над матрицами (1) можно произво- дить по формулам (а5 + ₽/)±(7ЕН-8/) = (а±7)Е + (3±8)/, (iE 4~ ₽/) ('{Е 8/) = (ау — р8) Е ~т- (аВ -ф- Bf) I, т. е. по тем же формулам, что и над комплексными числами а-ф-pi, т + Из указанных формул вытекает также, что сово- купность матриц С является кольцом и соответствие есть изоморфное отображение кольца С на кольцо всех комплекс- ных чисел. Исходя из матриц 2-го порядка Е, I, строим теперь следующие четыре квадратные матрицы 4-го порядка: Матрица е — это обычная единичная матрица 4-го порядка, и потому ei — ie = i, ej — je — j, ek = ke~-k. (3) Перемножая матрицы (2) по правилам перемножения клеточ- ных матриц и замечая, что /2 =— Е, получаем ij=zk = — ji, jk = i — — kj, ki = j = — ik (4) и, сверх того, /2 = /* = А* = —e. (5) Формулы (4) легко запоминаются: они означают, что в после- довательности /, /, k, i, j, k произведение двух соседних элемен- тов равно следующему за ними элементу.
26 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ (Гл. t Матрицы вида ае pi 7/ 4- 'jk = -Р В а ~7 — 81 (6) где а, р, 7, В — произвольные вещественные числа, называются кватернионами (иногда — кватернионными матрицами). Из (6) сле- дует, что представление кватернионов в форме ае 4" Р4'4~ 7/4~ однозначно. Иными словами, соотношение ае 4-4-у/-4 Вй == 4-J-71/J-8^ равносильно четырем равенствам: a = «i, Р —ръ 7 = 7ь 8 = 3!. Сложение и вычитание кватернионов, записанных в нормаль- ной алгебраической форме ае 4~ Pz 4~ 7/4“ 8^> производится по обычному правилу: (*е 4- р/ 4- 7/ 4- 8£) ± (Я1е 4- Pit 4- 71/ 4- 8,6) = = (а ± ai) е 4- (р ± РО i (7 ± 74 j 4- (8 ± Bt) k. (7) Для перемножения двух кватернионов, записанных в алгеб- раической нормальной форме, достаточно воспользоваться зако- ном дистрибутивности и таблицами умножения (3), (4), (5). В ре- зультате приходим к формуле (хе 4- pi 7/ 4- 8£) (оцб -J- р4 - 4 71 / -4- 8^) = — (a«i — PPi — 771 — 884 + (api + pai -4 78i — 7i8)* 4- 4-(«714-7“i 4-8₽i — P8i) /4- (аД 4- а18 4“ P7i— 7?iM- (8) Формулы (7), (8) показывают, что совокупность матричных кватернионов Q есть кольцо с единицей е, являющееся подколь- цом кольца всех вещественных матриц 4-го порядка. Кватернионы е, i, j, k обычно называются кватернионными единицами. Из соот- ношений (4) следует, что кольцо кватернионов некоммутативно. Наиболее замечательный факт состоит в том, что кольцо кватер- нионов является телом, т. е. что в кольце кватернионов разрешимы все уравнения вида ах — Ь, уа — Ь, (9) где а, b — любые заданные кватернионы, из которых а не равен нулю. Ниже приведены удобные формулы для решения этих урав- нений.
§ 1] ДЕЙСТВИЯ с МАТРИЦАМИ 27 Рассмотрим какой-нибудь кватернион q — а.е pi -J- -у/ -ф- 8Л. Вещественное число N (<?) = а2 + р2 + 72 + 82 называется нормой кватерниона q. Так как а, р, у, 8 веществен- ные, то норма любого кватерниона есть неотрицательное вещест- венное число, равнее нулю только для нулевого кватерниона. Кватернион а* — &е — р/ — -[j — ВА называется сопряженным для q. Ясно, что q** = q. Прямым пере- множением кватернионов q и q* (по формуле (8)) получаются основные равенства qq* = q*q = N (q')-e, откуда (10) или ql — -тгглР* (П) (при условии, что q ф 0). Возвратимся теперь к уравнениям (9). Умножая первое из них слева, второе справа на а1, получим х = а^Ь, у = Ьа'1. (12) Подстановка этих значений в уравнения (9) показывает, что формулы (12) на самом деле дают искомые решения этих урав- нений. Решения агЬ и Ьсг' в общем случае различны. Поэтому их часто называют левым и правым частными от деления b на а и обозначают соответственно через а\Ь и b/а. Непосредственными вычислениями легко проверяются формулы (ра —р&)* — аа* -\-$Ь*, (ab)* = Ь*а*, из которых просто выводится и важное соотношение N (ab) = N (a) N (b) (a, b£Q). В самом деле, N (ab) • е — abb*а* = aa*N (b) = N (a) N (b) е. Отображение а —же есть изоморфизм поля вещественных чисел в тело кватернионов. Это позволяет кватернион вида ле отожде- ствить с числом а и вместо ае -ф- pi -j- V + писать просто
28 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ [Гл. I а “Г Т/“Ь Так, например, (/ + k) (1 + i - /У1 = (/ + k) (1 - i + /) 1= J_____1_ . _j__2 3 3 1 I 3 В последующих разделах книги значительная часть резуль- татов будет относиться к объектам, определения которых зави- сят от наперед заданного тела К- Хотя главный интерес будут представлять случаи, когда — поле, рассуждения будут строиться таким образом, чтобы не исключать и некоммутативных тел. Изучая эти рассуждения, полезно иметь в виду, что тело может быть именно телом кватернионов Q. Примеры и задачи 1. Пусть ? (X) = —2 — 5Х + ЗХ3, тогда 2. Показать, что матрица является унитарной. При каких условиях диагональная матрица является ортогональной, унитарной? 3. Найти обратную для матрицы 2 1 1 5 2 3 4. Если 1 О 1 1 О 1 го п 1 я О 1 5. Показать, что все матрицы, перестановочные с 'О 1 О О'! 0 0 10 ООО 1 _о о о oj
ПРИМЕРЫ И ЗАДАЧИ 29 имеют вид to 11 1 (О OX а ох « ф ах В Ф Ф « Ф Ф Ф 1 I 6. Если матрица обладает двумя свойствами из следующих трех: вещественная, ортогональная, унитарная, то она обладает и третьим. 7. Всякая квадратная матрица может быть представлена в виде суммы симметрической и кососимметрической матриц. 8. Матрица I называется инволютивной, если Показать, что если матрица обладает двумя из свойств: симметричная, ортогональная, инво- лютивная, то она обладает и третьим. 9. Матрица Р называется идемпотентной, если Р2 = Р. Показать, что матрицы идемпотентны. 10. Если Р идемпотентна, то 1 = 2Р-Е инволютивна, и, наоборот, если / инволютивна, то (I + E) идемпотентна. И. Рассматриваются квадратные матрицы порядка п. Обозначим через Ец (z,j = l,..., п) матрицу, у которой в i-й строке и j-м столбце стоит 1, а все остальные элементы равны 0. Тогда для А = |; ay имеем ' А • Ejj= ацЕ^an!E„j, Eij А = ijiEn • + o-jnEin- Вывести отсюда, что матрица А тогда и только тогда перестановочна с каждой из матриц Еу, когда А имеет вид аЕ. Пользуясь этим результатом, показать, что матрица А тогда и только тогда перестановочна с произвольной квадратной матрицей порядка п, когда А = аЕ, где а — элемент из основного кольца К, перестановочный с каждым элементом из /<. 12. Иногда наряду с матрицами конечного порядка рассматривают и матрицы бесконечного порядка, имеющие вид бесконечной таблицы с двумя входами: Такая матрица называется строчечно-конечной, если каждая ее строка содержит лишь конечное число ненулевых элементов. Операции над строчечно-конечными (и аналогично определяемыми конечными по столбцам)
30 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ [Гл. I матрицами производятся по тем же правилам, что и над квадратными мат- рицами конечного порядка. Легко видеть, что в результате получаются также строчечно-конечные матрицы. Пусть А = || «;/|| — матрица бесконечного порядка, причем 1=а1а=: = яЕ, = ... и a.st = 0 для t — sr£\. Показать, что АА' = Е, А'А^Е. § 2. Определители 2.1. Определение. Понятие определителя возникло в связи с задачей решения систем линейных уравнений. Возьмем какое- нибудь поле Д и рассмотрим простейшие системы уравнений 1-й степени с двумя и тремя неизвестными с коэффициентами из К. Система двух линейных уравнений с двумя неизвест- ными ?i, записывается в следующем виде: all’l “j- я12?2 = pl, ... V-Zi-.-l — Во, где o.ij, рг- — заданные числа из. Д'. Матрицы Гаи а)2] Гац М Л = , D = а.2) а22] [ан а22 р.2| называются соответственно основной и расширенной матрицами системы (1). Чтобы исключить неизвестное ?.2, умножим первое из уравнений на ам, второе на — aj2 и сложим их. В результате получим уравнение (аца.22 — a12a.2]) — р3а12. Если аца32 — 0, то из этого уравнения и аналогичного уравнения, получающегося путем исключения получим а22?1 — а12?2 ana2e> — ' g2 А al1a22 — ®12a21 (2) Знаменатели выражений для неизвестных^,^ здесь одина- ковы и представляют собой многочлен от элементов основной матрицы А. Значение этого многочлена называют определителем или детерминантом матрицы А и обозначают det Л или | А |. Если матрица задана своей таблицей, то детерминант обозначают, заключая таблицу в вертикальные черты. Таким образом, по определению для любой квадратной матрицы 2-го порядка = aS — р-у. 8 (3)
5 2] ОПРЕДЕЛИТЕЛИ 81 С помощью определителей формулы (2) можно переписать в виде ₽1 «12 1 I “it Pi h За ®аа si — г , (4) а11 ®12 «И «12 1 ®S1 1 1 ®21 ®22 Решая аналогичным путем систему трех уравнений «11’1 4“ «12’2 4" «13’3 = Р1> «21?1 4- 4 ’ «23’3 — ^2, «31’1 4- «32’2 4- «33?3 == ?3 с тремя неизвестными 4, £2, 5з, получим- г ^1а22а33 - ^1«23«:!2 “Г ?2«32Я13 - ?2«12Я33 “F ?3Я12Я23 - |^3Я22Я13 41 — ----------------------j-----------------------—j а11а22а33 а11Я23а32 Т а12а23а31 — а12а21а33 Т а13а21а82 а13а22а31 и аналогичные выражения для t2, Конечно, эти выражения имеют смысл лишь в том случае, когда знаменатель их отличен от нуля. Матрицы «И «1'2 «13 «21 «2-2 «23 , «31 «32 «33. «11 «12 «13 ^1" «21 «2'2 «23 ‘3'2 «31 «32 «33 Рз_ в = называются снова основной и расширенной матрицами системы уравнений (5). Знаменатель в формуле (6) называется определи- телем или детерминантом квадратной матрицы 3-го порядка А. Итак, согласно определению «И «12 «13 «21 «22 «23 «31 «32 «33 — «11«22«33------ «11«23«32 4- «12«23«31---«12«21«33 4" 4~ «13«21«32 «13«22«31* (7) Объединяя справа и вспоминая формулу члены, содержащие элементы ап, (3), получим «12, «13, «И «12 «13 «21 «22 «23 «31 «32 «33 = «11 «22 «23 «21 «23 ---«12 «32 «33 «31 «33 4“ “13 «21 «22 «31 «32 (8) Формулу (8) легко запомнить. Для краткости вместо того, чтобы говорить определитель матрицы 2-го порядка, 3-го поряд- ка, говорят определитель 2-го, 3-го порядка. Три определителя
32 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ [Гл. I 2-го порядка в формуле (8) получаются из находящегося в ней определителя 3-го порядка вычеркиванием первой строки и соответственно 1-го, 2-го и 3-го столбцов. Далее, определитель 2-го порядка, получившийся вычеркиванием 1-й строки и /-го столбца, следует умножить на элемент, находящийся в первой строке и /-м столбце, все произведения снабдить чередующимися знаками и сложить. В результате и получится определитель 3-го порядка. Это правило подсказывает нам, как следует определить поня- тие определителя, или детерминанта, квадратной матрицы 4-го, 5-го и высших порядков. Итак, вводим следующее основное Определение. Определителем матрицы 1-го порядка, об- разованной числом ?, называется само это число а. Пусть теперь для какого-то натурального числа п 1 мы уже знаем, какой элемент кольца К является определителем произвольной квадрат- ной матрицы п-го порядка над К- Тогда для произвольной квад- ратной матрицы А = (п 1)-го порядка над К по определе- нию полагаем det||а,7|1| = Я111А{1 -а12|| 4-а131 Л’ | 1)4,„+i| Л?+‘ |, (9) где через |Л{| обозначена величина определителя матрицы п-го порядка, получаемой из первоначальной матрицы А вычеркиванием 1-й строки и j-го столбца (/=1, «4-1)- Применяя это определение для п—1, получим формулу (3) для определителей 2-го порядка. Зная выражение для определи- телей 2-го порядка, можем воспользоваться основным определе- нием, чтобы получить выражение (8) для детерминантов 3-го по- рядка. Из выражения (8) при помощи (3) получаем окончатель- ную формулу (7). Посмотрим теперь, какова окончательная формула для детер- минанта 4-го порядка. Согласно основному определению для произвольной квадратной матрицы А — ||а,7|| 4-го порядка детер- минантом ее служит выражение <*и Ct-2»2 CU3 СС04 <*32 а33 <*34 — а12 <*21 а23 <*24 <*31 <*33 <*34 “4 <*13 <*21 <*22 <*24 <*14 <*21 <*22 <*23 <*31 <*32 <*33 <*31 <*32 <*34 <*42 а43 а14 <*41 <*43 <*44 <*41 <*42 <*44 <*41 <*42 <*43 (Ю) Подставляя сюда из формулы (7) выражения определителей 3-го порядка и раскрывая скобки, получим искомую окончатель- ную формулу для определителя 4-го порядка. Мы ее не будем здесь выписывать, так как запоминать ее вряд ли целесообразно.
§ 2] ОПРЕДЕЛИТЕЛИ 33 Согласно (7) каждый определитель 3-го порядка равен сумме шести членов с чередующимися знаками. Поэтому, подставляя в (10) вместо определителей 3-го порядка их выражения и рас- крывая скобки, получим всего 4-6 = 24 члена. Половина их будет входить со знаком плюс и половина со знаком минус. Аналогич- ное утверждение истинно и для определителей любого порядка. Теорема 1. Для произвольной квадратной матрицы ап ... а1л *л! • • *лл а„; » п1пч (11) = S ± 4*2*2 где суммирование распространяется на произвольные перестановки (й, *2...in) чисел 1, 2, ..., п. Знак плюс или минус берется в зависимости от четности или нечетности перестановки (й, й, ..., *„), т. е. в половине случаев плюс, а в половине минус; общее число членов в сумме (11) равно 1-2...п = п!. Для п=1, 2, 3, 4 истинность теоремы нами уже проверена. Далее рассуждаем по индукции. Пусть теорема истинна для оп- ределителей какого-то порядка п, и пусть А=||а/у|| — квадрат- ная матрица порядка /г Д- 1. По предположению в формуле (9) каждый определитель |А/| (/ = 1, ..., п Ц- 1) имеет следующий вид: I Л {| zz= ± • • *л+1, тл’ (12) где суммирование распространяется на все перестановки (mi, ... ..., m„) чисел 1, ..., / — 1, j -ф-1, ..., п 4- 1. Число членов в сумме (12) равно п\. Подставляя в (9) вместо | А{ | их выражения и раскрывая скобки, получим всего п\ (п-\- 1) = (п-|- 1)! членов. Половина из них будет со знаком плюс и половина со знаком минус. Подобных членов не будет, так как члены, получающиеся при раскрытии различных скобок, отличаются друг от друга первыми множителями. Ясно, что произвольный член вида *1*2*2 * • -ал+’.»л+1 получится при раскрытии скобок из произве- дения аи |А^|, и потому формула (11) истинна. Из формулы (И) легко вытекает одно существенное следст- вие. Пусть элементы матрицы А = ||а/_,-[) суть комплексные числа. На основании формулы (11) имеем |Л | = 2±аН1...ал/л = £±аН1...ал,л = |Т|, т. е. |Л| = Ь4|. Формула (11) показывает, что величина определителя матрицы равна алгебраической сумме членов, каждый из которых есть 2 А. И. Мальцев
34 МАТРИЦЫ 'И ОПРЕДЕЛИТЕЛИ [Гл. I произведение элементов, взятых по одному из каждой строки и каждого столбца матрицы. Поэтому, если все элементы какой- нибудь строки или какого-нибудь столбца матрицы равны нулю, то будут равны нулю и все члены определителя. Таким образом, нами получено Следствие. Если какая-нибудь строка или какой-нибудь столбец квадратной матрицы состоит целиком из нулей, то оп- ределитель этой матрицы равен нулю. Квадратная матрица называется полураспавшейся, если ее эле- менты можно разбить вертикальной и горизонтальной чертами на четыре матрицы так, чтобы по диагонали стояли квадратные матрицы, а одна из двух других матриц состояла целиком из нулей. Иначе говоря, матрица А полураспавшаяся, если она имеет один из следующих двух видов: «н ... я!г а1>г+1 . ..Ящ r+i ... &.гп О ...0 az+1>r+1 ... „ О ...0 а„,г+1 ...алл Яи ... я)г 0 ... О ЯЛ1 . .. Ягг 0 ... О «Z+l.l ••• аг+1,г аг+1,г+1 ••• аг+1,Л jxni ... а„г r+i ... а„п Иногда первую из этих матриц называют верхней полурас- павшейся, а вторую — нижней полураспавшейся. Теорема 2. Определитель полураспавшейся матрицы равен произведению определителей ее диагональных клеток. Для матриц 2-го порядка это утверждение очевидно, так как I я 8 |_| я О I_ » |о В I — Iт 8 | —а8- Далее применяем индукцию, считая теорему 2 истинной для матриц какого-нибудь порядка п—1. Рассмотрим произвольную полураспавшуюся матрицу А порядка п. Пусть она имеет вид д________________________II ||__Г В Hl Л —1| а//II — С]> где В, С — квадратные матрицы, имеющие порядки г, s (г -\-s=ri), a Osr и D — прямоугольные матрицы, причем матрица Osr нуле- вая. Применяя формулу (9), получим | А | = яп | А} | - я1а | А11 +... + (- 1ГЧ, | Л ? |, (13) где А{— матрица порядка п—1, получающаяся из А вычерки- ванием первой строки и i-ro столбца. Легко заметить, что все матрицы Л‘ полураспадающиеся, и потому, в силу индуктивного предположения, определитель каждой из них равен произведе- нию определителей диагональных клеток. Однако матрицы Л}, ...
5 2] ОПРЕДЕЛИТЕЛИ 35 ...,Д; и матрицы Л;+*...А" распадаются по-разному. Для первых имеем |л;|=|в{|-|С|, (14) а матрицы Л[ + ', А* можно разбить горизонтальной и вер- тикальной линиями так, чтобы верхний левый квадрат имел по- рядок г. Так как у этого квадрата последняя строка состоит из нулей, то определитель его равен нулю. Определитель матрицы Л[+‘ равен произведению определителя указанного квадрата и определителя дополнительного квадрата. Поэтому | А{ +‘ | = 0 и, значит, |Л |=ап |в;|. |С|-... + (- 1ГЧ-1 в; |-|С| = = («п|в} I-...-И- irMBNMCMBHCI, (15) что и требовалось. Случай, когда матрица А имеет вид л _ II».. || — ГВ 71 — II II — DC ’ еще проще, так как здесь а1>г+1 = .. . = а1л = 0, и потому из (13), (14) сразу получаем (15). Теорема 3. Если есе соответственные элементы квадратных матриц А = || а/у.1|, В — одного и того же порядка п одина- ковы, за исключением элементов какой-то одной i-й строки, то ап . • «1л ап . • «1л «и «1л ап . * а£л + Рп- • Р/л = «/1 + Р«1 ••• «<л + Р «л! • алл ЯП1 • • «лл «Л1 «лл (16) Эта теорема иногда называется теоремой сложения определи- телей. Переходя к ее доказательству, обозначим через С матрицу, стоящую в правой части равенства (16). Для матриц 1-го порядка равенство (16) тривиально. Далее рассуждаем по индукции и предполагаем, что для матриц порядка п—1 теорема 3 истинна. Если в формуле (16) i— 1, то, разлагая определитель матрицы С по формуле (9), получим I с I = («•„ + Ри) I с} ...+(- Ясно, что С{ — А{ = В{, и потому |С| = (а11|Л}|-...+ (-1Г-1а1л|Л?|) + + (ЫВ}|-••• + (- 1Г%|В’|) = | А | + | В|. Допустим теперь, что в формуле (16) /+>1. Тогда |С| = а11|С}|-•••+ (- 1)" .4.IQI- (17) 2*
36 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ [Гл. Т Матрицы CJ, С;1 имеют порядок п—1, и потому к ним можно применить разложение вида (16). В результате получим \С‘ | = | А‘ 1 + 1ВЦ G = l. •••> п) и вследствие соотношения (17) имеем | С | = | А | -(-1В |. Говоря формально, основное определение детерминантов го- дится и для матриц с элементами из произвольного ассоциатив- ного (не обязательно коммутативного) кольца К.. В доказатель- ствах теорем 1, 2, 3 также коммутативность К не использовалась. Тем не менее ряд важнейших для приложений свойств детерми- нантов зависит от коммутативности основного кольца К.. Одно из таких свойств указывает ' Теорема 4. Пусть А—квадратная матрица с элементами из коммутативного кольца К.. Если все элементы какой-нибудь строки матрицы А умножить на некоторый элемент то определитель матрицы также умножится на X, Иначе говоря, ад • • • «1л «11 ... Я1Я = Х 1ац ... )л;п ад • а,л ал1 • • . алл а„1 • • • а„„ Доказательство точно такое же, как и у предыдущей теоремы, и мы его повторять не будем. Отметим лишь важное Следствие. Для любой квадратной матрицы А порядка п с элементами из коммутативного кольца К. и любого |ХЛ | = ХЯ|Л|. Действительно, при умножении на X матрицы А каждая из ее п строк умножается на X. Поэтому определитель матрицы А в результате умножится на Xя. 2.2. Основные свойства определителей. Рассмотрим произволь- ную квадратную матрицу А порядка п с элементами из какого-нибудь кольца Д. Согласно основному определению |Л | = ац| ЛЦ-а12| А1) + ... + (- 1)я+1а1л|Л7|, (1) где А{ — матрица, получаемая из Л вычеркиванием первой строки и /-го столбца. Применяя теперь к определителю матрицы А{ ту же формулу, получим I А{ | =аи | Л{> | -... + (- 1)ЧУ-11 Л!/'11 + (- 1У+Ч/+11Л'•/+11 + + ... + (-1УМ л Iя I, (2) где Л{* — матрица, получающаяся из А вычеркиванием первой и второй строк и /-го и А-го столбцов (/ yb k).
§ 2] ОПРЕДЕЛИТЕЛИ 37 Подставим в формулу (1) вместо величин | Л{| значения из (2). В результате придем к соотношению |Л|=£±а1.Язд|Л/*|. (3) Здесь суммирование берется по всевозможным парам /, k различ- ных чисел из множеств 1, ..., п, а знак плюс или минус ста- вится в соответствии с (1) и (2). Матрицы Л/* и Л*/, очевидно, одинаковы, и потому формуле (3) можно придать следующий вид: И 1= У (±а1уа2*±аиа2/)|Л'*[. (4) J<k Подсчитаем теперь более точно, какие именно знаки следует взять в последней формуле. Согласно (2) для /-го члена в (1) имеем (- 1 )Л>а1у I | = ... + (- l)/«av (- 1)Ч4 I Л{* | +... Аналогично, учитывая, что /<^й, для й-го члена из (1) имеем (- | л * I=...+(-1Г Ч* (- 1)'+Ч | Л %I+... Таким образом, коэффициент при |Л/*| в формуле (4) равен (_ 1)^+1 (ai_ a1Aa2y) = (- |, и, следовательно, И |=У (-1)У+4+1«|^“1*|.|Л/‘|. (5) I “V I Формула (5) называется разложением определителя по эле- ментам 1-й и 2-й строк. Она легко запоминается: берутся все- возможные определители 2-го порядка, элементы которых нахо- дятся в \-й и 2-й строках и каких-то j-м и k-м столбцах (j<2k), и умножаются на определители соответствующих матриц, полу- чающихся вычеркиванием указанных строк и столбцов из мат- рицы А. Произведения дополнительно умножаются на (— где показатель равен сумме номеров вычеркиваемых строк и столб- цов, и затем складываются. Полученная алгебраическая сумма равна определителю заданной матрицы. Точно такие же правила имеют место и для разложений по элементам первых трех, первых четырех и т. д. строк. Однако они нам далее не понадобятся.
38 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ [Гл. I Формулой (5) мы теперь воспользуемся, чтобы вывести ряд основных свойств определителей. Ниже предполагается, что эле- менты рассматриваемых матриц берутся из коммутативного кольца К. Теорема 1. Если в квадратной матрице переставить ка- кие-нибудь две строки, то определитель новой матрицы будет равен определителю старой, взятому со знаком минус. Для матриц 2-го порядка это утверждение проверяется не- посредственно: •у 8 = ”$ — 8а — — (аЗ — = ао — P'f, Далее по индукции предполагаем, что для матриц порядка п—1 теорема верна и что данная матрица A = ||aZy|| имеет поря- док п. Допустим, что в А переставляются две первые строки. Из формулы (5) видим, что при этом все определители 2-го порядка изменят знак, а дополнительные множители останутся без измене- ний. В результате вся сумма приобретает множитель —1, что и требовалось. Рассмотрим случай, когда переставляются какие-то /-я и k-я строки, где Тогда 1-я строка останется неизменной и из разложения (1) видим, что каждый множитель | | будет иметь после перестановки противоположное значение; поэтому и вся сумма после перестановки строк приобретет противополож- ное значение. Наконец, допустим, что переставляются 1-я и какая-то i-я строка, где г’Д>2. Этот же результат мы получим, переставив сначала 1-ю и 2-ю строки, затем 2-ю и г-ю и далее 2-ю и 1-ю. По доказанному каждый раз определитель будет менять знак, и в результате трех перемен определитель умножится на —1. Следствие 1. Определитель квадратной матрицы, имею- щей две одинаковые строки, равен нулю. Перестановкой строк можно достигнуть того, чтобы одинако- выми строками были 1-я и 2-я. При этом определитель матрицы с переставленными строками будет или совпадать с определите- лем первоначальной матрицы, или отличаться от него множите- лем —1. Из формулы (5) непосредственно видно, что определи- тель матрицы с совпадающими первыми двумя строками равен ну- лю. Поэтому равен нулю и определитель первоначальной матрицы. Следствие 2. Если к элементам некоторой r-й строки квад- ратной матрицы А = || aiy-1| прибавить соответственные элементы какой-то другой s-й (s Ф г) ее строки, умноженные на произволь- ный множитель X, то определитель новой матрицы будет равен опре- делителю старой.
§ 2] ОПРЕДЕЛИТЕЛИ 39 Действительно, в силу теорем 3 и 4 предыдущего пункта “и “1л “11 • • • “1Л “и • .. “1л “rl “si + А“Г1 ... “гл = “rl • • • “гЛ • • • asn “rl “и • • “гл • • ^гп • “Я1 “лл <*nl ••• «лп “л1 • • • алл Здесь' последний определитель имеет две одинаковые строки и по- этому равен нулю. До сих пор все наши результаты относились к строкам опре- делителей. Сделаем первый шаг, чтобы ввести в игру и столбцы. Теорема 2. Для каждой квадратной матрицы Л = ||агу-|| порядка п истинно следующее разложение по элементам 1-го столбца: |4 | = “ц | 4Ц - а21| 4.Ц + ... +(-1Г’ал11 4А|, (6) где Аг — матрица, получающаяся из А вычеркиванием 1-го столбца и r-й строки. Будем рассматривать элементы aiy заданной матрицы как буквы. Тогда определителем матрицы А будет многочлен от этих букв, общий вид которого был установлен в теореме 1 предыду- щего пункта. Там, в частности, отмечалось, что каждый член многочлена | А | содержит один и только один множитель из сово- купности ац, “si, “ль Соберем в | X | вместе все члены, содер- жащие множитель ari, вынесем этот множитель за скобки, а вы- ражение в скобках обозначим через Ari. В результате получим | А | — “114ц-у-“21X21 -f- ... +“„i4„i. (7) Сравнивая формулу (7) с формулой (1), приходим к выводу, что 4ц = | 4} |. Чтобы найти аналогичное выражение для Ari, теперь доста- точно воспользоваться теоремой 1. В самом деле, будем после- довательно переставлять r-ю строку матрицы 4 с каждой из пре- дыдущих, поднимая ее все выше и выше. После г — 1 таких перестановок получим матрицу В, отличающуюся от матрицы А только порядком строк, и потому I Д|=(- 1Г|В|. Разлагая определитель В по элементам 1-й строки, получаем |В|=“н|в{|-м1в121+ - -Ь(-1ГЧл1в?|
40 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ [Гл. I ИЛИ I А | = аг1 (-1 Г11 В\ | - ... + (—1)г+л~Чл | В?|. Сравнивая это разложение с разложением (7), приходим к со- отношению Лг1 = (- 1Г11 В{ Матрица В] получается из матрицы В вычеркиванием 1-й строки и 1-го столбца. Ясно, что ту же матрицу мы получим, вычеркивая из А r-ю строку и 1-й столбец, т. е. Bi = Alr. Заме- няя в формуле (7) Ari на (—1 )г-11 А‘г |, приходим к требуемому разложению (6). Выше отмечалось, что матрица, у которой 1-я, 2-я и т. д. строки совпадают соответственно с 1-м, 2-м и т. д. столбцами матрицы А, называется транспонированной относительно А и обозначается через А'. Ясно, что если матрица А квадратная по- рядка п, то матрица А! также квадратная порядка п. Теорема 3. Определитель квадратной матрицы А не ме- няется при ее транспонировании: И1 = 1М (8) Для матриц порядка 1 утверждение тривиально. Далее, как и выше, пользуемся индукцией, предполагая, что заданная мат- рица А = ]] aiy-11 имеет порядок п 1 и что для матриц порядка п — 1 теорема истинна. Разлагая определитель матрицы А по элементам 1-й строки, а определитель транспонированной мат- рицы А' по элементам 1-го столбца, получим |Л| = ац|Л}|— «и | Л| | -1- ... +(—1 )лча1Л |Л”|, I Л' I = ац I (Л')Ц - а121 т !+•• + (-ir^U I т |. Однако легко заметить, что (Л')1 =(Л')'. Матрицы Л' имеют порядок п — 1, и потому, в силу индуктивного предположения, кл,)л=1(Л‘),|=| л> । a=i,...;«). Сравнивая эти соотношения с разложениями (9), получаем (8). Итак, при вычислении определителя матрицы строки ее и столбцы можно поменять ролями. Поэтому из каждой теоремы, относящейся к свойствам определителя матрицы и содержащей в формулировке упоминания о строках или столбцах, можно по- лучить новую теорему, поменяв ролями строки и столбцы. В част- ности, из указанных выше свойств определителей, связанных со строками, получаем Следствие. При перестановке двух столбцов матрицы оп- ределитель матрицы приобретает противоположное значение. Оп- ределитель квадратной матрицы, имеющей два одинаковых столбца, равен нулю. Если все элементы какого-нибудь столбца матрицы
S 2] ОПРЕДЕЛИТЕЛИ 41 умножить на X, то определитель матрицы также умножится на X. Если ко всем элементам какого-нибудь столбца матрицы прибавить соответствующие элементы какого-нибудь ее другого столбца, умноженные на фиксированное число, то определитель новой матрицы будет равен определителю старой. Аналогично для разложения (5) путем изменения ролей строк и столбцов получаем разложение по двум первым столбцам: а,ч ау4 а и аУ1 •1^1- Наконец, из теоремы сложения определителей, относящейся к строкам, получаем соответствующую формулу ан ... а1; ... а1л аЛ1 • • • ап« • • • аяя «11 • • • • • • а1я ®я1 • • ?л£ • • • алл ан ... а1г Рп ... а]л ая1 ... ал£ | Рлг- ... алл относящуюся к столбцам. До сих пор мы пользовались только разложениями определи- теля по элементам первой строки, первого столбца. Вместе с тем мы знаем закон изменения величины определителя при переста- новке строк или столбцов. Это дает возможность из разложений по элементам первой строки или столбца сразу получить анало- гичные разложения по элементам любой строки или столбца. Теорема 4. Для произвольной квадратной матрицы A=jja,y || порядка п истинны следующие разложения по элементам г-й строки и s-го столбца-. | А 1 = (- 1ГЧ11ЛЛ+ ... +(- 1)Г+Чя| А*\, (10) |Л| = (-1ГЧ1ЛЛ4-... -и-irnans|лх1, (Н) где А! — матрица, получающаяся из А вычеркиванием i-й строки и j-го столбца. Ввиду равноправности строк и столбцов определителя доста- точно доказать лишь одну из формул (10), (11), например (10). Переставляя последовательно г-ю строку матрицы А с каждой над ней стоящей, через г — 1 перестановок получим матрицу ari ®г2 ... алл аи ан ... а1л В = аг-1,1 аг-1, 2 • • • «г-1, п ar+i, 1 ar+i. 2 • • • аг+1. п ая1 “я2 • • • аяя
42 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ [Гл. I Согласно теореме о перестановке строк имеем | А | ==(—l)r l |В|. Разлагая здесь определитель В по элементам 1-й строки и поль- зуясь очевидными соотношениями В’=Л‘, приходим к разло- жению (10). Определитель матрицы А1 называется минором определителя матрицы А, отвечающим элементу а.^. Выражение (—1)1+/'| Л{| на- зывается адъюнктом элемента агу- в | А | и обозначается часто че- рез | A \tj. При помощи понятия адъюнкта формулы (10), (И) можно записать в более коротком виде: аг11 Л -j-af-21 Л |£-2-|- ... ф«;л| А |;я = | Л (12) jлji,4а2/1л,2г4~ ••• 4 a«> 171 |я>-= Ml- (13) В этих равенствах каждый элемент а,-у множится на свой адъюнкт | A \ij. Что будет, если взять сумму произведений эле- ментов i-й строки на адъюнкты соответствующих элементов какой- нибудь другой строки? Чтобы получить ответ, заменим в данной матрице А j-ю строку ее t-й строкой, а все остальные строки, включая и i-ю, оставим неизменными. В результате получим не- которую матрицу В, у которой t-я и /-я строки одинаковы. Оп- ределитель матрицы равен нулю. В то же время ясно, что ми- норы элементов /-й строки у определителей матриц А и В сов- падают. Разлагая В по элементам /-й строки, получим an| Л |У14 ... +а/л|Л!/я = 0 (t’4/)- (14) Меняя в рассуждениях строки и столбцы, получим вторую серию соотношений: aitl24|iy4 ... -|-ant 4 1яу = 0 (i Ф j). (15) Соотношения (12) —(15) обычно формулируют следующим об- разом: Теорема 5. Сумма произведений элементов какой-нибудь строки (столбца) определителя на свои адъюнкты равна величине определителя. Сумма произведений элементов какой-нибудь строки (столбца) определителя на адъюнкты соответствующих элемен- тов любой другой его строки (столбца) равна нулю. Сделаем теперь несколько замечаний о способах вычисления определителей. Определители 2-го и 3-го порядков обычно вы- числяются по исходным формулам. Например, 7 —2 2 4 3 —1 5 1 8 4 —1 2 3 2 1 3 8 = 187.
ОПРЕДЕЛИТЕЛИ 43 Здесь мы разложили определитель 3-го порядка по элементам 1-й строки. Если бы среди элементов заданного определителя был равный нулю, то выгоднее было бы пользоваться разложением по элементам той строки (или столбца), в которой этот нулевой элемент находится. Этот же способ применим и для вычисления определителей высокого порядка, у которых много элементов, равных нулю. В частности, «Н «12 ... «1„ О «>> ... а2л О 0 ... алл «•22 ... «2Я О ••• «лп — аца-22 ... алл и аналогично О 0 ... «1Л О «л_1.2 ... ал_1,л «Л1 «П'2 • • • «лп О ... а)л ал-1,2 • • • «Л-1, л = (-1)п+1а«1 П{П — 1) = (--1) 2 «Л1 ... «1л- Более сложно обстоит дело, если порядок заданного опреде- лителя сравнительно высокий (например, 7 и больше), а среди элементов определителя нет нулей или их мало. В этом случае сначала к определителю применяют преобразования, указанные в следствии 2 из теоремы 1, стараясь подобрать коэффициент к так, чтобы новый определитель содержал нули в каких-то мес- тах или имел в каком-то смысле более простое строение. Эти приемы хорошо видны из следующего примера. Пусть нам надо вычислить определитель d~ 1 2 3 4 5 6 2 3 4 5 6 1 3 4 5 6 1 2 4 5 6 1 2 3 5 6 1 2 3 4 6 1 2 3 4 5 Вычитая в этом определителе из 6-й строки 5-ю, затем в но- вом определителе вычитая из 5-й строки 4-ю, затем из 4-й 3-ю
44 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ [Гл. Г и т. д., получим 1 2 3 4 5 6 1 1 1 1 1 —5 1 1 1 1 —5 1 d— 1 1 1 —5 1 1 1 1 —5 1 1 1 1 —5 1 1 1 1 Вычитая теперь 6-ю строку из 1-й, 2-й, ..., 5-й, получим 0 7 2 3 4 5 7 2 3 4 5 0 6 0 0 0 —6 1 0 0 0 —1 0 6 0 0 —6 0 0 d = л с л к л л =(-1)64 1 0 —1 0 V 0 V —0 и и 1 0 —1 0 0 0 6 —6 0 0 0 1 —1 0 0 0 1 —5 1 1 1 1 В получившемся определителе 5-го порядка прибавляем к 1-му столбцу остальные и затем разлагаем определитель по элементам 1-го столбца. Мы получим 2 1 2 3 4 5 0 0 0 0 —1 d= — 64- 0 0 0 —1 0 = — 64-21. 0 0—100 0—1000 Аналогичными вычислениями находится и общая формула 1 2 3 ... п — 1 п 2 3 4... п 1 лИ—1) , ... = (—1) 2 д(”2+ (16) п 1 2 ... п-2 п — 1 Этот определитель носит название циркулянта п-го порядка, так как его строки получаются циклическими перестановками эле- ментов 1-й строки. На указанную закономерность в расположе- нии элементов определителя и опирается вывод формулы (16), которая далее, впрочем, нами использоваться не будет. Для на- хождения численного значения определителей высокого порядка теперь прибегают к услугам машинно-счетных станций, на кото- рых имеются стандартные программы вычисления определителей, приспособленные к тому типу машин, которыми оборудованы
§ 2] ОПРЕДЕЛИТЕЛИ 45 станции. Найдем лишь грубую оценку числа арифметических дей- ствий, заведомо достаточных для вычисления определителя про- извольной матрицы n-го порядка. Допустим, что ап ф 0. Вычисляем а^1 и представляем искомый определитель в виде «и • 1 ацЧа ••• «иЧл «21 «22 ... «2Л ал1 ал2 • • • алл При этом мы выполняем одно обращение и п — I перемножений. Далее к элементам 2-й, 3-й, ..., n-й строк прибавляем элементы 1-й строки, умноженные соответственно на —«21, —«зь ••• ..., — anl ((« — I)2 умножений и столько же сложений). После этого задача сводится к вычислению определителя порядка п — 1: aji ••• <л-1 «п ял—1,1 ••• «Л —1, л —1 Продолжая указанный процесс, в конце мы должны будем найти лишь произведение ana' ••• (л—1 умножений). Всего при изложенном алгоритме потребуется произвести п—1 обращений чисел, п(п — 1) + (п-1)(п-2)+ ... -1-2• 1 —(п”(га „ (2п— 1) п(п — 1) „ , умножении, ------- сложении и заключительные п — 1 умножений. Таким образом, грубо говоря, для вычисления опре- делителя n-го порядка надо произвести около у п3 умножений и такое же количество сложений. Мы не будем здесь заниматься дальнейшим изучением этого вопроса. Ряд точных определений и результатов указан в статье В. Я. Пана «О способах вычис- ления значений многочленов» (Успехи матем. наук 21, № 1 (1966), 103—134), а также в приведенной в этой статье лите- ратуре. 2.3. Определитель произведения. Обратные матрицы. Значитель- ную роль в теории матриц играет Теорема 1 (об умножении определителей). Опре- делитель произведения квадратных матриц (с элементами из ком- мутативного кольца К} равен произведению определителей матриц. Пусть заданы квадратные матрицы Д = ||агД B = ||piy|| порядка п. На основании теоремы о полураспавшихся
46 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ [Гл. I матрицах (п. 2.1) «11 «21 «12 • • «1л • «2л 0 0 0 .. 0 .. . 0 . 0 «Л1 «Л2 • 0 0 .. . 0 Л | \В\ = —1 0 . . 0 pH Р12 • ₽1л 0 —1 . . 0 р21 Р-22 • Pin 0 0 . . —1 рЛ1 РлЗ Рлл Справа стоит определитель матрицы специального вида, имею- щей порядок 2/г. Не изменяя величины определителя, над этой матрицей можно выполнить последовательно следующее преобразование: к 1-й строке прибавляем элементы («4-1)-й строки, умноженные на а1Ь элементы (п-!-2)-й строки, умножен- ные на <хи, и т. д., элементы 2/г-й строки, умноженные на а1я. В результате возникнет матрица порядка 2п, у которой первые п мест 1-й строки будут заполнены нулями, а остальные п мест заполнены произведениями 1-й строки матрицы А на столбцы матрицы В. Теперь в новой матрице порядка 2п к элементам 2-й строки прибавляем элементы (п-{-1)-й, (п—2)-й и т. д. строк, умноженные соответственно на а.21, ай,..., а2„. Затем аналогичные, преобразования проделываем с 3-й,..., n-й строками. После этого получаем следующее равенство: 0 l>lipil 0 S«niPfl • • ^Aniftin 0 Pll Pin ... —1 Рл1 Pnn Чтобы привести правый определитель к полураспавшемуся виду, меняем в нем местами 1-й и (/г—|— 1)-й, 2-й и (/г2)-й,..., n-й и 2п-й столбцы. В результате получим равенство | А = 1)" ... IMn 0 ... 0 z:«n(-pii • • • l&nifiin 0 ... 0 Ph • • • Pin —1 ... 0 - Рл1 • • • Pnn 0 ... —1 (1)
§ Я ОПРЕДЕЛИТЕЛИ 47 Так как определитель полу распавшейся матрицы равен произ- ведению определителей диагональных клеток, то из соотноше- ния (1) вытекает, что |Л |-\В | = (- 1)л (- 1)л т. е. |Л|-| В| = | АВ\, (2) что и требовалось. Мы доказали теорему 1 для произведения двух матриц. Ясно, что отсюда непосредственно вытекает ее истинность и для про- изведений любого конечного числа матриц. Например, | АВС\ = \(АВ)С\ = \ ЛВ|-|С| = |Л|.|В|-|С|. В частности, для любой квадратной матрицы А |ЛЙ| = |Л|* '£ = 0,1,2,...). (3) Мы знаем, что транспонирование квадратной матрицы не меняет ее определителя. Поэтому для произвольных квадратных матриц А, В одного и того же порядка | А | • | В | =1ЛВ | = \А’В | = | АВ' | = | А’В' |. Например, пусть А— Х У и v Тогда xu-\-yv U* V1 = (х3 + z/2) (Z? -j- а3) - (хи + yv)\ т. е. (XV — yuf = (х2 + у3) (иг + о2) — (хи + уо)*. Это соотношение обычно записывают в виде следующего тож- дества: (х2 -j- у2) (и2 4- п2) = (xv ~уи)*-\- (хи 4- yv)*, называемого тождеством Лагранжа. Воспользуемся теперь теоремой 1 для более подробного изу- чения свойств обратной матрицы. Рассмотрим произвольную квадратную матрицу Л = ja/yj по- рядка п. Из адъюнктов элементов определителя Л составим мат- рицу и затем транспонируем ее. Получившуюся в результате матрицу называют присоединенной (адъюнгированной) для Л и
48 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ [Гл. I обозначают через А*. Иными словами, Л* = I A Ju | А [21 ... | А |Я1 IА [и | А [32 ... | А )Л2 --1А ] А ... | А |лл Вычисляя произведения А-А* и А*-А по правилам умноже- ния матриц и принимая во внимание формулы (12) — (15) пре- дыдущего пункта, непосредственно получаем важные соотно- шения А- А* = А*-А = \А 1-Е, (4) где Е — единичная матрица. Определитель матрицы А есть элемент основного кольца Д, из которого берутся элементы всех рассматриваемых матриц. Допустим, что в Д элемент [ А | имеет обратный [ А |-1. Тогда, умножая соотношения (4) на [ А |-1, приходим к равенствам Л-|Л|-1Л* = [ЛГ1Л*-Л = £, из которых следует, что Л-1 = |Л|-1-Л*. (5) С другой стороны, если матричное уравнение АХ = Е разрешимо, то, переходя к определителям, получим |Л|.|Д| = 1, т. е. элемент | А | обратим в кольце Д. Соединяя полученные результаты, приходим к следующему утверждению: Теорема 2. Квадратная матрица А с элементами из ком- мутативного кольца К с единицей тогда и только тогда имеет обратную матрицу с элементами из К, когда определитель А обратим в кольце К. Если обратная матрица существует, то ее определитель равен обратной величине определителя заданной матрицы. Например, в кольце всех целых чисел Д = {0, ± 1,...} имеют обратные только элементы 1 и —1. Поэтому целочисленная квад- ратная матрица тогда и только тогда имеет обратную целочис- ленную матрицу, когда определитель заданной матрицы есть ± 1. Пусть рассматриваются матрицы с элементами из некоторого поля. В поле любой ненулевой элемент имеет обратный. Поэтому
§ 2] ОПРЕДЕЛИТЕЛИ 49 над полем те и только те матрицы обратимы, определитель кото- рых отличен от нуля. Квадратная матрица, определитель которой равен нулю, на- зывается особенной. В противоположном случае матрица назы- вается неособенной. Поэтому отмеченное выше условие обратимо- сти матрицы может быть выражено следующим образом: квад- ратная матрица над полем тогда и только тогда имеет обратную, когда она неособенная. Мы видели, что для неособенных матриц А над полем К | Л-11 = | А Г1. Отсюда получаем |Л-т| = И-1 ... Л-11 = I ЛI (т = 1, 2,...), и потому формула (3) справедлива не только для натуральных k, но и для любых целых k (если матрица А обратимая). Согласно п. 1.3 квадратная матрица А называется ортого- нальной, если АА' — А'А = Е. Переходя к определителям, получаем | А |2 = 1, и потому, если матрицы рассматриваются над полем /(, то | А | = ± 1. Благодаря этому все ортогональные матрицы распадаются на два множества матриц: собственно ортогональных с определите- лем -j-1 и несобственно ортогональных, определитель которых равен — 1. Все собственно ортогональные матрицы относительно операции умножения образуют группу, являющуюся подгруппой группы всех ортогональных матриц. Напомним, что квадратная матрица А над полем комплексных чисел называется унитарной, если АА' = Е. Беря определители, получим —1, т. е. модуль определителя унитарной матрицы равен единице. В заключение найдем еще определитель присоединенной мат- рицы. В качестве кольца К возьмем кольцо многочленов от букв Xij (i, j — i,..., п) с целыми коэффициентами и рассмотрим матрицу X —1| Xij ||. Согласно формуле (4) Х-Х* — \Х\-Е, и потому |Х | • | X* | = | X |л. Так как многочлен | X | отличен от нуля, то равенство можно сократить на [ X |, и в результате получаем искомую формулу |Х* | = | XI"-1, (6) левая и правая части которой суть многочлены от переменных х{} с целыми коэффициентами. Но если два таких многочлена равны,
50 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ [Гл. Г то равны и значения их при любых значениях переменных из любого коммутативного кольца. Поэтому формула (6) истинна для произвольных квадратных матриц над любым коммутатив- ным кольцом. 2.4. Крамеровские системы линейных уравнений. Рассмотрим совокупность условий «и -'г ... 4-ai„ ?„ = ₽!, ...................... (1) “J- • • • "Т == ?т> где £1,..., ел — буквы, а агу, ₽, — какие-то элементы из некото- рого кольца К. Совокупность этих условий называется систе- мой линейных уравнений от неизвестных Si,..., 5Л над кольцом К. Последовательность элементов , th из кольца К называется решением системы (1), если при подстановке в условия (1) вме- сто переменных м,..., соответственных элементов in все условия становятся истинными. Вводя матрицы «и ... ai„ П А = Ь — &т\ • • • п систему (1) можно записать Матрица А в следующей матричной форме: Ах = Ь. (2) называется матрицей системы (1), а матрица an ... а1л В = расширенной матрицей системы (1). Свойства матрицы называется В нам потребуются в п. 5.3 при более детальном изучении свойств системы (1), а сейчас мы пока рассмотрим случай, когда /п = п, т. е. матрица А является квадратной. Допустим, что матрица А обратима. Тогда, умножая обе части равенства (2) слева на А~1, получим х = А ХЬ. (3) Обратно, умножая соотношение (3) слева на А, получим (2). Таким образом, условия (2), (3) равносильны, и потому формулу (3) можно рассматривать как формулу, решающую систему урав- нений (1) при условии, что матрица системы обратима. До сих пор мы даже не предполагали, что кольцо /С комму- тативно. Предположим теперь, что К — поле. Тогда обратимость
5 2] ОПРЕДЕЛИТЕЛИ 51 матрицы А будет равносильна ее неособенное™, обратная мат- рица будет выражаться указанным выше образом через присое- диненную и формулу (3) можно будет переписать в следующем виде х — | А Подставляя вместо матрицы А* ее выражение через адъюнкты определителя | А | и производя справа умножение, получим Е __ I A I1/P1 ~Ь ~Ь М \ni?n ‘ ~~ ! А I или, в окончательной форме, «И • • • «1, i-1 Pl «1, Z+1 • • • а1л Я-21 • • • 7-->, i-1 а:'я iJ-1 • • • 7-<л ал1 • • • ап, i-l ап. i+l • • • г1пп = (4) Для проверки достаточно разложить определитель, находя- щийся в числителе, по элементам z-ro столбца. Система линейных уравнений над полем называется краме- ровской, если число уравнений совпадает с числом неизвестных и определитель матрицы системы отличен от нуля. Мы видим, следовательно, что каждая крамеровская система линейных урав- нений имеет одно и только одно решение (?i,..., Ц, и это ре- шение дается формулами (4). Формулы (4) называются форму- лами Крамера в честь математика середины прошлого столетия Крамера, в работе которого они, по-видимому, впервые появи- лись. Для п — 2 и п — 3 формулы Крамера подробно были выпи- саны в п. 2.1. Формулы Крамера дают «замкнутое» выражение решения кра- меровской системы уравнений через коэффициенты этих уравне- ний. Тем не менее фактическое вычисление решений линейной системы по формулам Крамера вести нецелесообразно. В самом деле, для того чтобы воспользоваться формулами Крамера, надо вычислить значения и-j-1 определителей порядка п. Согласно грубым оценкам, сделанным в п. 2.2, при этом придется выпол- нить около га4 умножений и сложений. В то же время обычный способ последовательного исключения неизвестных требует, как мы сейчас проверим, значительно меньшего числа операций. Этот способ, надлежащим образом упорядоченный, ныне назы- вается алгоритмом Гаусса. Итак, рассмотрим снова систему линейных уравнений (1), коэффициенты которой взяты из некоторого поля К. Если все коэффициенты какого-то уравнения равны нулю, то вычеркиваем
52 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ [Гл. I его из системы. Если коэффициенты при всех неизвестных равны нулю, а р Ф 0, то система решений не имеет. Поэтому можно предположить, что некоторые из коэффициентов при неизвест- ных в первом уравнении отличны от нуля. Тогда, изменяя, если надо, нумерацию неизвестных, мы приведем систему к виду (1), где ап Ф 0. Вычисляем а„ и умножаем все члены 1-го уравне- ния на ай1. Затем из каждого 2-го, 3-го..... m-го уравнения вычитаем почленно 1-е уравнение, умноженное соответственно на а.21, a3i,..., ат1. После этого наша первоначальная система будет равносильна системе вида 44~«Г144~ ••• 4~«1™4 —Р1, а22 4 -J- ... Ц- а2га — р,2, (5) ат2^2 4~ • • 4“ атл4г = $т- Для перехода от системы (1) к системе (5) мы выполнили одно обращение, пт умножений и п(т~ 1) сложений. Поступая далее таким же образом с последними т — 1 уравнениями си- стемы (5), мы после одного обращения, —^ умноже- ний и (л — 1) (т — 2) сложений придем к системе вида 4- «12^2 4~ «13 4 4“ *' • 4" «1л 4 = Р1, 4 4“ «и 4 4- • • • 4- 4=Ра > атз4 + • • • + а«л4 — Pm. Продолжая указанный процесс, мы можем столкнуться с тремя случаями: а) на каком-то этапе заключим, что система решений не имеет; б) получим систему вида £i 4- Tis4 4~ • • • 4" 4- Ть г+14+14~ • • • 4- Т1л4=4, 4 4~ • • • 4- 1аг4 4~ Та. z+14+i 4- • • • 4" Т2л4=®2, 4 4- r+14+i 4- • - • 4- 7™4=4; в) получим систему вида 4 4~ Ти4 4- 11з4 4- • • • 4- =4, 44~'12з44“ ••• 4_12п4=®2» ................................. (6) 4-14- Тл-1. л4>—®л-1> 4=4- В случае б) выразим 4 из последнего уравнения через «сво- бодные» неизвестные 4+ь ---, 4- Подставив полученное значение
ОПРЕДЕЛИТЕЛИ 53 § 21 для V в предыдущее уравнение, найдем из него Ч-i и т. д. В результате найдем линейные выражения неизвестных Si, ..., через «свободные» неизвестные. Придавая «свободным» неизвестным произвольные значения, мы по указанным формулам можем вы- числить соответствующие значения для неизвестных Si, ..., Sr и получить, таким образом, некоторое решение Si, ..., Sr, ..., 4 заданной системы. То же самое будет и в случае в). Разница лишь та, что теперь мы получим вполне определенные значения для всех неизвестных Sb..., Подсчитаем, сколько же операций нам придется выполнить в случае в), чтобы получить решение. Для приведения системы к виду (6) (предполагая т = п) нам надо выполнить и обращений, «* + («- 1)34- ... +Р=4(2п+1)(п+1)п умножений и п(п — 1)-у-(п — 1)(п — 2)+ ... Д-2 -1 == (и —l)n(n — 1) сложений. Затем, чтобы из треугольной системы (6) найти не- известные, надо дополнительно произвести 1+2+,..+(п-1) = |п(п-1) умножений и столько же сложений. Таким образом, чтобы ре- шить систему (1) по способу Гаусса, требуется в общем случае п обращений, у и (и2Зи — умножений и ~ п (2n2 -j- Зп — 5) № п3 сложений. Заметим теперь, что по способу Гаусса можно вычислять и обратную матрицу Л'1. Делается это следующим образом. Пи- шется система линейных уравнений Ах = Ь, у которой столбцы х и b берутся буквенными. Затем из данной системы по способу Гаусса переменные Si,..., S„ выражаются через переменные ... ..., рл. В результате получаются формулы вида ~~ 1 “Н • • • 4" 7<л?л z= !>•••, «)• Так как из Ах = Ь следует х— A ib, то матрица ||т7/|| и будет искомой обратной для А. Подсчет числа операций показывает, что при этом достаточно произвести п обращений, ~п(4п3— 1)*=« О умножений и -|-(na — п)(2п— 1)^уП3 сложений.
54 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ (Гл. Т Изложенные подсчеты количества операций, необходимых для нахождения величины определителя матрицы, решения системы линейных уравнений и обращения матрицы, не учитывают неко- торых побочных операций и не принимают во внимание возра- стания числа десятичных знаков у перемножаемых или склады- ваемых чисел. Тем не менее полученные результаты могут быть полезны для решения вопроса, надо ли решать какую-нибудь практически интересную систему линейных уравнений ручным способом или целесообразно передать заказ в вычислительный центр. Дополнения и примеры 1. Решить по формулам Крамера систему х 4~ У + z = — 2, х 4- Зу— 2/ = — 4, 2x4-z — t — — 1, 2у — z — 3t = — 3. 2. По способу Гаусса найти обратные для матриц -а4-1 а а а а а+1 а а а а «4-1 а а а а « + 1_ 3. Доказать формулу (определитель Вандермонда) 4. Доказать, что « + -V1 а а а а 4- х2 ... а а а ... а 4- хп 5. Если в основном кольце К для любого а из 2а = 0 следует а = 0, то определитель любой кососимметрической матрицы над ЛГ нечетного порядка равен нулях. 6. Рассмотрим произвольную квадратную матрицу А (над коммутативным кольцом К) порядка п. Вычеркивая из А строки с номерами it, , ir (1 sg eSjL< ... <ir^n) и столбцы с номерами ji,... , Jr (leSJi< ••• получим новую матрицу Др {г_порядка п—г. Элементы матрицы А, надо-
§ 3] ХАРАКТЕРИСТИЧЕСКИЙ И МИНИМАЛЬНЫЙ МНОГОЧЛЕНЫ 55 дящиеся на пересечениях вычеркиваемых строк и столбцов, также образуют квадратную матрицу. Порядок последней матрицы равен г. Определитель ее называется минором порядка г определителя матрицы А, принадлежащим строкам с номерами iL, , ir и столбцам с номерами JL, ... , jr. Адъюнктом этого минора называется определитель матрицы Аумноженный на 1 * * * г (— l)s+z, где s = ij -1- ... + /г, t—ji + ••• + Jr- Имеет место следующее обоб- щение'разложения определителя по элементам 1-й и 2-й строки: если в опре- делителе п-го порядка фиксировать какие-то г строк, то сумма произве- дений миноров r-го порядка, принадлежащих фиксированным строкам, на свои адъюнкты равна величине заданного определителя. 7. Если заданная квадратная матрица X симметрическая или кососим- метрическая, то присоединенная матрица X* также симметрическая или косо- симметрическая. 8. Пусть А — квадратная матрица с целочисленными элементами, х, Ъ — столбцы, элементами которых являются буквы ... , 1п и соответственно ... , Система линейных уравнений Ах = Ь тогда и только тогда при любых целых значениях ... , 3,г имеет целые решения ... , 5Л, когда I А | = ± 1. § 3. Характеристический и минимальный многочлены Все рассматриваемые в настоящем параграфе матрицы будут предполагаться квадратными, одной и той же степени п. Эле- менты этих матриц берутся из произвольного фиксированного поля К- 3.1. Подобие матриц. Матрица А называется подобной матри- це В, если существует такая неособенная матрица X, что А — Х^ВХ. (1) В этом случае говорят также, что А получается преобразованием матрицы В при помощи X. Умножая равенство (1) слева на X и справа на X-1, получим В = ХЛХ-1 = (X-1)"1 АХ~\ Таким образом, из подобия Ас В вытекает подобие В с А. Далее, если А=Х~1ВХ, B = Y~lCY, то подстановкой получим A = (YXylC(YX). Следовательно, две матрицы, подобные третьей, подобны между собой. Наконец, каждая матрица, очевидно, подобна себе самой. Эти свойства показывают, что все квадратные матрицы данной степени п с элементами из какого-либо поля К естественно раз- биваются на классы подобных. Нахождение необходимых и доста- точных условий подобия матриц является одной из основных задач теории матриц. Решение этой задачи будет дано в гл. IV.
МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ [Гл. I Здесь же мы установим только несколько предварительных свойств подобных матриц. Для того чтобы преобразовать при помощи матрицы X сум- му матриц, достаточно преобразовать с помощью X каждое сла- гаемое. В самом деле, Х~‘ (А + А2 + ... + ЛА) X = X^AiX + Х~'АгХ + ... + Х~*АкХ. Для того чтобы преобразовать при помощи матрицы X произве- дение матриц, достаточно преобразовать каждый сомножитель. Действительно, X~lAiX - X-1 AtX ... X-'AkX = X^AjA,... AkX, так как произведения XX-1, стоящие в левой части, равны Е и их можно вычеркнуть. Для того чтобы преобразовать степень матрицы, достаточно преобразовать основание степени, т. е. X-MOTX = (X-MX)ra. При т2г0 эта формула есть частный случай предыдущей. Если же /и<^0, то пусть k = — т. Тогда X'1 АтХ = X-1 (Л-1)* * = (Х'М-'Х)* = (X’1 AX)~k = (Х^Л X)m. Преобразованное значение многочлена от матрицы равно зна- чению многочлена от преобразованной матрицы, иными словами, X~1f(A)X=f(X~1AX). (2) Это утверждение непосредственно вытекает из предыдущих, так как значение многочлена от А получается из А с помощью операций возведения в степень, умножения на число и сложения. Правила преобразования выражений во многих случаях позво- ляют значительно упростить вычисления. Например, пусть Индукцией легко доказывается, что Так как х-’лх= ' 7 4' —9 —5
§ 3] ХАРАКТЕРИСТИЧЕСКИЙ И МИНИМАЛЬНЫЙ МНОГОЧЛЕНЫ 57 то по правилу преобразования степени имеем [I 4Г-х-л-х=Г1+6я , 4" 1. —9 —5j L — 9n 1 — 6nJ 3.2. Характеристический многочлен. Пусть А — квадратная матрица с элементами а17 (i, /=1, 2.и). Матрица X — ап — а13 ...— а]л __ __ X • • • а2п <М — «л2 ..А —алл - где X — независимая переменная, называется характеристической матрицей для А. Ее определитель <р(Х) = |ХЕ — Л| (1) является, очевидно, многочленом относительно X и называется характеристическим многочленом матрицы А. Чтобы найти старшие члены этого многочлена, воспользуемся тем, что величина определителя равна сумме произведений его элементов, взятых по одному из каждой строки и каждого столбца и снабженных надлежащими знаками. Поэтому, чтобы получить член, имеющий относительно X наивысшую степень, необходимо взять произведения элементов наивысшей степени. В нашем слу- чае таким произведением будет только одно — произведение диаго- нальных элементов (X —ап)(Х— ... (X — алл). Все остальные входящие в состав определителя произведения имеют степень не выше п — 2, так как если один из множителей такого произве- дения будет —a-ij (i # /), то это произведение не будет содер- жать множителями X — а,;, X — а;-7- и будет, следовательно, степени не более п — 2. Таким образом, ср (X) = (X — ап)... (X — ат) члены степени не выше п — 2, или <Р (X) = хл - (ап алл) Хл-1 + ... (2) Сумма диагональных элементов матрицы называется ее следом. Формула (2) показывает, что степень характеристического много- члена матрицы равна порядку этой матрицы, старший коэффи- циент характеристического многочлена равен 1, а коэффициент при \п~1 равен следу матрицы, взятому с обратным знаком. Пола- гая в формуле (3) X —0, мы получим Т(0) = |- А | = (-1)" |Л|. Но ср (0) есть свободный член характеристического многочле- на. Поэтому свободный член характеристического многочлена
58 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ [Гл. Г матрицы А равен определителю этой матрицы, умноженному на (—1)л, где п — порядок матрицы А. Следующая теорема указывает на одно из важнейших свойств характеристического многочлена. Теорема 1. Характеристические многочлены подобных мат- риц равны друг другу. В самом деле, пусть матрица А подобна матрице В: А = Х'ВХ. Тогда для характеристического многочлена А получаем | ХЕ - А | = |ХЕ - Х~1ВХ | = | X"1 (ХЕ - В)Х\ = = | X11 • I ХЕ — ВI • I XI. Определители | X-11, | X | взаимно обратны и в произведении дают 1; поэтому | ХЕ — Л | = | ХЕ — В |, что и требовалось доказать. Из этой теоремы вытекает, в частности, что подобные матрицы имеют одинаковые следы и определители, так как след и опреде- литель матрицы, взятые с надлежащими знаками, являются коэф- фициентами ее характеристического многочлена. Равенство характеристических многочленов является необхо- димым, но, вообще говоря, не является достаточным признаком подобия матриц. Например, характеристические многочлены матриц равны. Однако А не может быть подобна Е, так как при любой матрице X - Х-1ЕХ = Х-1Х = Е. Корни характеристического многочлена матрицы называются ее характеристическими числами или собственными значениями. Кратные корни характеристического многочлена называются крат- ными собственными значениями матрицы. Известно, что сумма всех вещественных и комплексных корней многочлена степени п, имеющего старший коэффициент 1, равна взятому с обратным знаком коэффициенту при (л—1)-й степени переменной. Фор- мула (2) показывает поэтому, что в поле комплексных чисел сумма всех собственных значений матрицы равна ее следу. Заметим, что след суммы матриц равен сумме следов слагаемых, а след произведения числа на матрицу равен произведению этого
§ 3] ХАРАКТЕРИСТИЧЕСКИЙ И МИНИМАЛЬНЫЙ МНОГОЧЛЕНЫ 59 числа на след матрицы. Оба эти утверждения можно объединить в одну формулу: след (аЛ рВ) = а • след А 4~ ₽ • след В, для доказательства которой достаточно выписать соответственные матрицы и вычислить их следы. В п. 1.2 любому многочлену <р(Х) была поставлена в соответ- ствие матрица ср (Л), названная значением многочлена ср (X) при Х = Л. Если ср (Л) — О, говорят,-что Л есть корень ср (X). Теорема Гамильтона — Кэли. Каждая матрица является корнем своего характеристического многочлена. Пусть Л — какая-нибудь матрица. Обозначим через В присоеди- ненную матрицу для характеристической матрицы ХЕ—Л (см. п. 2.3). Элементы матрицы В обозначим через pty- (t, /=1, 2....... п). Эти элементы являются адъюнктами определителя | ХЕ — А | и поэтому представляют собой многочлены от X, степень которых не превосходит п — 1. Пусть Составим вспомогательные числовые матрицы № ... в^= й? ... № (£ = 0, 1, .... п — 1). ... В<*) г Тогда матрицу В можно будет, очевидно, представить в следую- щем виде: в = Bw + XBd) + ... + По основному свойству присоединенных матриц В(ХЕ —Л) = |ХЕ —Л |-Е. (3) Здесь | ХЕ — Л | есть характеристический многочлен матрицы А, который мы обозначим через ср (X). Пусть <р (^)= ао ~г а1^ Ч~ • • •Ч~ Ч~ X". Теперь равенство (3) можно переписать более подробно: (ЕЮ) X5(i) 4- ... 4- ’kn~1B(n~r>') (ХЕ — Л) = = (“о Ч~ ai^ Ч~ • • •Ч~1Ч~
60 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ (Гл. I Раскрывая скобки и сравнивая коэффициенты, стоящие при оди- наковых степенях X, получим — BWA = ^Е, — В(Г>А-\-В^ — ацЕ, — Bw АВ^ = а.>Е, — В^А + В^=апЛЕ, В(.п-1)===Е_ Умножим эти равенства соответственно на Е, А, ... , Ап справа и сложим. Все члены левой части уничтожатся, и мы получим О = а0Е 4- А 4~ аМ2 4~ ... 4~ А", т. е. у (А) —О, что и требовалось. 3.3. Минимальный многочлен. Рассмотрим всевозможные нену- левые многочлены / (X), корнем которых является некоторая задан- ная матрица А. Такие многочлены существуют; к ним относится, например, характеристический многочлен матрицы А. Ненулевой многочлен наинизшей степени со старшим коэффициентом 1, имею- щий своим корнем матрицу А, называется минимальным много- членом этой матрицы. Каждая матрица А имеет только один минимальный много- член. В самом деле, если бы их было два, например ф1 (X) и ф2(Х), то разность ф1 (X) — ф.2 (X) была бы ненулевым многочленом более низкой степени, корнем которого снова являлась бы матрица А. Разделив эту разность на ее старший коэффициент, мы полу- чили бы многочлен со старшим коэффициентом 1, корнем кото- рого являлась бы матрица А и который имел бы более низкую степень, чем минимальные многочлены ф1 (X) и ф4 (X), что проти- воречит определению минимальных многочленов. Всякий многочлен /(X), корнем которого является матрица А, делится без остатка на минимальный многочлен ф (X) этой мат- рицы. Действительно, пусть, наоборот, f (X) не делится на ф (X). Обо- значая через д(Х) частное, через г(Х) остаток от деления /(X) на Ф (X), будем иметь / (X) = ф (X) (X)-|-г (X). Подставив сюда X = А и пользуясь тем, что ф (Л) — [ (Л) = О, мы получим г(Л) = О. Но степень остатка г(Х) меньше степени делителя ф(Х). Поэтому г(Х) является ненулевым многочленом, корнем которого является матрица Л и степень которого меньше степени минимального многочлена ф (X), что противоречиво. Наше утверждение доказано. В частности, минимальный многочлен мат- рицы является делителем ее характеристического многочлена.
§ 3] » ХАРАКТЕРИСТИЧЕСКИЙ И МИНИМАЛЬНЫЙ МНОГОЧЛЕНЫ 61 Мы знаем, что подобные матрицы имеют один и тот же хара- ктеристический многочлен. Тем же свойством обладает и мини- мальный многочлен: подобные матрицы имеют одинаковые мини- мальные многочлены. В самом деле, пусть А подобна В : А = — Х~'ВХ. Если f (X)— какой-либо многочлен, имеющий своим корнем В, то согласно п. 3.1 f (Л) = / (Х-'ВХ) = Х~Ч (В) X —О. Таким образом, совокупность многочленов, имеющих своим кор- нем одну из подобных матриц, совпадает с совокупностью много- членов, имеющих своим корнем другую. Поэтому многочлен наи- меньшей степени со старшим коэффициентом 1, принадлежащий этой совокупности, будет минимальным многочленом для обеих матриц. Равенство минимальных многочленов является еще одним необ- ходимым условием подобия матриц. Однако это условие снова не является достаточным. Рассмотрим, например, матрицы "2 0 О’ ‘2 0 0’ А = 0 3 0 в = » 0 2 0 0 0 3. 0 0 3. Характеристические многочлены их равны соответственно (X- 2) (X —З)2 и (X- -2)2(Х-3). Поскольку эти многочлены различны, то Л и В не подобны. Минимальный многочлен матриц Л должен быть делителем ее характеристического многочлена, т.е. должен совпадать с одним из следующих многочленов: X—2, X — 3, (X-—З)2, (X — 2)(Х — 3), (X —2)(Х — З)2. Подставляя сюда вместо X матрицу Л, мы найдем, что первый раз нуль получится для многочлена (X — 2)(Х— 3). Сле- довательно, этот многочлен и будет минимальным для матрицы Л. Совершенно тем же способом найдем, что минимальным много- членом матрицы В будет снова многочлен (X — 2)(Х — 3). Итак, минимальные многочлены матриц Л, В равны, а сами матрицы Л, В не подобны. В п. 1.4 упоминалось, что матрицы вида ‘Л1 Л = \ , ч. где At,..., As — квадратные матрицы, называются распадающи- мися на клетки At,..., As или распадающимися в прямую сумму этих клеток.
62 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ (Гл. I Характеристический многочлен распавшейся матрицы равен произведению характеристических многочленов ее диагональных клеток. В самом деле, если А распадается на клетки At,..., Л.5, то ее характеристическая матрица, как легко видеть, имеет вид ГХ£1 - At -1 ).Е — А = 1-Ei-Ai IES — AS где Et,..., Es — единичные матрицы соответственных порядков. Из п. 2.1 известно, что определитель распавшейся матрицы равен произведению определителей ее диагональных клеток. Следова- тельно, | IE — А | = | X£t — Аг | • | ХЕ2 — Л21... | ).ES — As |, что и требовалось. Минимальный многочлен распавшейся матрицы равен наимень- шему общему кратному минимальных многочленов ее диагональных клеток. Пусть матрица Л распадается на клетки Ль ..., As. Обозначим че- рез (X), ..., (X) их соответственные минимальные многочлены. Рассмотрим произвольный многочлен /(X). Если /(Л) = О, то из формулы (7) п. 1.4 следует, что /(Л1) = .. , = f(As) = О. Но всякий многочлен, корнем которого является матрица Л,-, должен делиться на минимальный многочлен <pz (X) этой матрицы. Следовательно, /(X) есть общее кратное многочленов (X), ..., <р5(Х). Обратно, если какой-нибудь многочлен f (X) есть общее кратное от ф1 (X),... ..., М^), то, очевидно, / (Л) = О. Таким образом, чтобы получить минимальный многочлен матрицы Л, надо взять общее кратное многочленов <pi(X), ... , <ps(X) наименьшей степени, т. е. взять их наименьшее общее кратное, что и требовалось. Клеточная матрица Л называется полу распавшейся или клеточно- треугольной, если все ее диагональные клетки квадратные, а клетки, стоящие по какую-либо одну сторону от главной диаго- нали, заполнены нулями. В дальнейшем мы будем всегда пред- полагать, что нулевые клетки полураспавшейся матрицы стоят над главной диагональю. Таким образом, полу распавшиеся кле- точные матрицы имеют вид Ли д___ Ац Ли х _Л$1 Л$а... Л$$_ ~~
§ 3] ХАРАКТЕРИСТИЧЕСКИЙ И МИНИМАЛЬНЫЙ МНОГОЧЛЕНЫ 63 где Лц,..., Лм— квадратные клетки, а все клетки, стоящие над ними, заполнены нулями. Пусть В — какая-либо вторая полураспавшаяся матрица, диа- гональные клетки которой ; имеют ту же степень, что и соответ- ственные клетки матрицы А. На основании правил действия с клеточными матрицами имеем и Л 21 Л*22 Ли Л52... Л, Ли Ли Л'22 Asi Asi...Ass _Ast 4“ -Sn 'Bn Вц Вц ____________ Bst Bsi... вbS J Л.22+В22 Asi ~ J Bsi . . . Л_у5 —j— Bss где C{j=AijBjj Ait j+iBj+t, 7- 4~ • • • + АиВц. Следовательно, сумма и произведение полураспавшихся матриц являются полураспавши- мися матрицами, диагональные клетки которых равны суммам и произведениям соответствующих клеток заданных матриц. В частности, если f (X) — некоторый многочлен от X и Л — полурас- павшаяся матрица вида (1), то /(Л) = /Ии) Du f (Лj->) (2) Dsi Dsi.. .f (Л55) _ (клетки Dtj имеют более сложное строение). Из § 2 известно, что определитель полураспавшейся матрицы равен произведению определителей ее диагональных клеток. Отсюда непосредственно следует, что характеристический многочлен полураспавшейся матрицы, равен произведению характе- ристических многочленов диагональных клеток этой матрицы.
64 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ [Гл. I Если полураспавшаяся матрица А состоит из клеток степени 1, то Л называется также имеющей треугольную форму или просто треугольной матрицей. Собственные значения треугольной матрицы равны ее диагональным элементам. Из формулы (2) сле- дует также, что если G, С-2, Сл— собственные значения тре- угольной матрицы, то .... /(Q будут собственными значениями матрицы [(А). Примеры и задачи 1. Матрица называется нильпотентной, если некоторая ее степень равна нулевой матрице. Доказать, что полураспавшаяся матрица тогда и только тогда ннльпотентна, когда нильпотентны ее диагональные клетки. 2. Используя теорему Гамильтона—Кэли, показать, что если в поле комплексных чисел все собственные значения матрицы равны нулю, то мат- рица нильпотентна. 3. Показать, что если в прямой сумме матриц переставить слагаемые, то новая сумма будет матрицей, подобной старой сумме. 4. Вычислить характеристические многочлены и собственные значения матриц Г2 31 [1 4]’ Г COS а — S1D. а sin а COS а Д = 1 2 3 С= 2 1 3 3 з 6 5. Найти минимальные многочлены матриц 3 1 0 0 3 0 0 0 3 2 0 0 0 3 1 0 0 3 '3 11 .0 3] '2 0 0 0* 0 2 0 0 0 0 3 0 0 0 0 3 6. Показать, что собственными значениями диагональной матрицы яв- ляются ее диагональные элементы. 7. Доказать формулу след (ДВ) = след (В А). 8. Если из какой-либо квадратной матрицы порядка п вычеркнуть т строк с номерами it, is, и т столбцов с теми же номерами, то опре- делитель оставшейся матрицы порядка п — т называется главным минором степени п — т. Показать, что коэффициент при Хт характеристического многочлена матрицы А равен сумме всех ее главных миноров степени п—т, умноженных на (—1)п~т. 9. Показать, что характеристический многочлен матрицы АВ совпадает с характеристическим многочленом матрицы ВА. 10. Если Сг, ..., £.п — собственные значения матрицы А, то собствен- ными значениями матрицы /(Д), где /(К) — некоторый многочлен, будут ............../О
Глава 11 ЛИНЕЙНЫЕ ПРОСТРАНСТВА § 4. Размерность 4.1. Модули и векторные пространства. Произвольное не- пустое множество элементов 8 называется модулем над некоторым кольцом К, если выполняются следующие условия: а) дано правило, как для любой пары элементов а, b из 8 найти в 8 некоторый элемент, называемый суммой двух первых и обозначаемый символически а + Ь; б) дано правило, как для любого числа а из К и любого элемента а из 8 найти в 8 новый элемент, называемый произве- дением а на а и обозначаемый а а; в) операции сложения и умножения на число удовлетворяют следующим требованиям: 1° сложение коммутативно: а + b — b + а; 2° сложение ассоциативно: а (6 с) = (а Ь) -|- с; 3° возможно вычитание, т. е. для каждых двух элементов а, b из 8 в 8 существует элемент х такой, что а-\-х — Ь; 4° умножение ассоциативно: а (р«) = (ар) а; 5° умножение дистрибутивно по отношению к сложению в 8: а (а + 6) = аа -f- ab; 6° умножение дистрибутивно по отношению к сложению чисел: (а + Р) а = аа + [За. Если кольцо К имеет единицу 1, то обычно еще требуют, чтобы выполнялось условие 7° 1-а = а (а С 8). 3 А. И. Мальцев
66 ЛИНЕЙНЫЕ ПРОСТРАНСТВА [Гд. II В этом случае модуль называется унитарным. Унитарный модуль над телом К называется линейным или векторным пространством над К. Элементы модулей и векторных пространств называются векторами и в дальнейшем обозначаются малыми латинскими буквами а, Ь, х, у, ... Линейные пространства и совокупности векторов будут обозначаться большими готическими буквами §1, ®, 8, ЭД, ... В приведенном выше определении векторы умножались на элементы кольца К слева. По этой причине определенные выше модули и пространства называются также левыми модулями и левыми пространствами над К. Если потребовать, чтобы были определены произведения элементов 8 на элементы К справа, изменив при этом соответственным образом аксиомы 4° — 7°, то получится структура, называемая правым модулем, соответственно правым линейным пространством. Ясно, что свойства левых и правых пространств одинаковы, и различать левое и правое умно- жение важно тогда, когда они определены одновременно. Ниже левые пространства над К. называются просто пространствами над /(. Линейное пространство над полем комплексных чисел назы- вается комплексным линейным пространством, а над полем вещест- венных чисел — вещественным линейным пространством. Основ- ные примеры модулей и линейных пространств будут указаны ниже, а сначала рассмотрим простейшие следствия, которые непосредственно вытекают из аксиом 1° — 7°. Прежде всего, условие а) и аксиомы 2°, 3° показывают, что каждый модуль есть группа относительно операции сложения векторов, причем аксиома 1° требует, чтобы эта группа была коммутативной. Поэтому, как и в любой коммутативной груп- пе, сумма конечного числа векторов не зависит ни от порядка слагаемых в этой сумме, ни от способа расстановки скобок. Например, {а + 6) + (с + d) = с -f- (а -|- (d + 6)). Далее, в произвольном модуле, как в любой аддитивной группе, среди векторов имеется единственный вектор, обозначае- мый нами через о, обладающий тем свойством, что для любого вектора х рассматриваемого модуля % + o = o-|-x = x. Вектор о называется нулевым вектором или просто нулем модуля. Кроме того, для любого вектора а модуля 8 в этом модуле существует один и только один вектор у, удовлетворяющий уравнению а-Н# = о.
§ 4] РАЗМЕРНОСТЬ 67 Этот вектор у обозначается через —а и называется противополож- ным относительно а. Из аксиом 1°, 2°, 3° вытекает, что —о —о и для любых а, b — ( — «) = «, — (а + 6) = ( — й) + ( — Ь). В выражениях типа (— а) + & + (— с) принято опускать скобки и писать —а-\-Ь — с. Бинарная операция —, определен- ная формулой х — у = х + ( — у), называется операцией вычитания векторов. То, что один и тот же символ обозначает две разные операции (операцию перехода к противоположному вектору и бинарную операцию вычитания), в дальнейшем никаких неудобств не вызовет. До сих пор были сформулированы лишь те свойства модулей, которые присущи им, как коммутативным группам по сложению, т. е. вытекают из аксиом 1° — 3°. Принимая во внимание ак- сиомы 4° — 7°, легко получаем тождества О • а — о, та — а-\-а-\-... + а (т слагаемых, т— целое положительное), (—а) -а =— (а. а), а.-о = о. В самом деле, первое следует из того, что а ~ (1 4- 0) а = 1 • а 0 • а = а -|- 0 • а, второе доказывается следующим образом: та = (1-|- ... -1- 1)а= 1 -а +• ... -f-l-a = a-f- ... + а. Далее, так как а а + (—а) а == (а — а) а = о, то (—а.)а = — (а а). Наконец, четвертое равенство следует из того, что а.‘О-\-а.а = а.(р-\-а)=а.а. Отметим также, что когда К — тело, то из а а = о вытекает, что или а=О, или а = о. В самом деле, если а^о, то, умножая соотношение аа = о на число ат1, получим а = о. Выражения вида ai«i + оДОа + ... + 3*
68 ЛИНЕЙНЫЕ ПРОСТРАНСТВА [Гл. II называются линейными комбинациями векторов а(, а$> ... as. Наши рассуждения показывают, что линейные комбинации можно складывать, вычитать, умножать на числа, а также приводить в них подобные члены по обычным правилам. Наиболее известным примером линейного пространства явля- ется совокупность направленных отрезков, выходящих из какой- либо фиксированной точки О нашего обыкновенного пространства. Умножить отрезок на положительное вещественное число а — это значит увеличить его длину в а раз, не меняя направления. Если а отрицательно, то умножение отрезка на а означает уве- личение его длины в ] а | раз и изменение направления на прямо противоположное. Аналогично сложить два отрезка — значит взять диагональ параллелограмма, построенного на них. Нуле- вым вектором будет отрезок, начало и конец которого совпа- дают с точкой О. Поскольку операция умножения отрезка на число определена только для вещественных чисел, то основ- ным полем А здесь является поле всех вещественных чисел, и про- странство направленных отрезков есть вещественное линейное пространство. Это пространство мы будем всегда называть про- странством обыкновенных векторов-отрезков и обозначать ЭЕ . Более общим, а для всей теории линейных пространств и основным примером линейных пространств является простран- ство строк. Рассмотрим множество всех последовательностей вида [аь а2.....ап], где аь ..., ап — числа некоторого тела К, п — заданное целое число. Эти последовательности мы будем на- зывать также строками и рассматривать их как матрицы, со- стоящие из о/йгой строки. Две строки называются равными, если равны их соответственные элементы. Действия сложения строк и умножения на число определяются по соответственным мат- ричным формулам р[а1; ... ,a„] = [pai, ... , рая], [“ь «2.....ал] + [₽1, ₽2> ••• , = = [а1-Ь'Рь а2~|-р2, ••• , ая4~РлК Ясно, что аксиомы 1°—7° здесь выполняются и совокупность всех строк длины п с элементами из тела К является линейным пространством над К- Если в качестве А взять произвольное кольцо, то получится пример модуля над К. Вместо строк можно рассматривать матрицы, имеющие произ- вольное фиксированное число строк й столбцов с элементами из кольца К- Любую такую матрицу можно по прайилам матрич- ного исчисления умножить на число из К, и любые две можно сложить — в результате получится матрица того же вида. Аксиомы 1°—7° здесь, очевидно, снова выполняются, щ таким образом»
РАЗМЕРНОСТЬ 69 § 41 матрицы с т строками и п столбцами образуют относительно опе- раций сложения и умножения на число модуль над К или ли- нейное пространство, если К — тело. Рассмотрим еще один пример. Пусть ЭЛ— произвольное мно- жество каких-либо элементов и К — некоторое кольцо. Предполо- жим, что нам задан некоторый закон, ставящий каждому эле- менту т множества ЭЛ в соответствие определенное число из /<. Каждый такой закон называется функцией, определенной на мно- жестве ЭЛ со значениями в К,- Если функцию обозначить какой- либо буквой f, то через f (т) обозначается число, отвечающее элементу т. Число f(m) называется значением функции f на эле- менте т. Если функции f, g для всех т из ЭЛ удовлетворяют равенству f (m) — g(m), то их называют равными. Для функций, заданных на ЭЛ, обычным образом определяются операции умно- жения на число, сложения и перемножения функций. Например, если заданы число а и функция f, то, ставя в соответствие каж- дому элементу т из ЭЛ число af(m), мы получим новую функцию, которую называют произведением числа а на функцию f. Анало- гично определяются сумма и произведение двух функций. Если из этих операций расвматривать только две первые — умножение на число и сложение, то легко убедиться, что аксиомы модуля будут выполняться. Следовательно, совокупность всех функций, определенных на некотором заданном множестве ЭЛ, со значениями из какого-либо кольца К образует модуль над К. Как и выше, если исходное кольцо К является телом, то получим пример 'век- торного пространства. В случае, когда ЭЛ состоит из конечного числа элементов, для функций, определенных на ЭЛ, можно ввести более удобную запись. Пусть пи, пи, ... , ms — элементы множества ЭЛ. Обо- значим через [пи] функцию, равную 1 на т, и равную 0 на всех остальных элементах ЭЛ (Z — 1, ... , s). Тогда произведение а [т,] будет функцией, равной а на пи и 0 на всех остальных элементах ЭЛ, а выражение «1 [mJ + а2 [т2] 4-... 4~а5 [z?zj, (1) очевидно, будет функцией, равной на mi, <ха на m2, ... , as на ms. Следовательно, каждая функция, определенная на ЭЛ, может быть записана в виде (1), и такая запись, как легко видеть, возможна только единственным способом. Если, нет опасности смешения, то скобки в (1) опускают и вместо (1) пишут более кратко: «I mi аз пи -|-... -|- as ms, причем члены с нулевыми коэффициентами вообще не выписы- вают. Например, если 9)? состоит из букв а, Ь, с, то 2а — с озна- чает функцию, равную 2 на а, нулю на b и —1 на с.
70 ЛИНЕЙНЫЕ ПРОСТРАНСТВА [Гл. II 4.2. Линейная зависимость. Пусть 8 — какое-либо векторное пространство над телом коэффициентов К и ai, а2, ... ,ат — его векторы. Соотношение вида а1 -ф- 03 -ф... -ф- ат а£ = О, где аь ... , ат — некоторые числа из К, называется линейной за- висимостью между векторами alt ... , ат. Если все коэффициенты аь ... , ат равны нулю, то зависимость называется тривиальной. В противном случае, т. е. когда по меньшей мере один из коэф- фициентов отличен от нуля, зависимость называется нетривиальной. Ясно, что тривиальная зависимость существует между любыми векторами. Ответ на вопрос — существует или нет нетривиальная зависимость — зависит от рассматриваемых векторов. Например, в пространстве строк длины 3 между векторами а = [1, 4, 6], 6 = [1, —1, 1], с = [1, 1, 3] существует линейная зависимость 2а ф- 3fe — 5с = о. С другой стороны, в том же пространстве между векторами et = = [1, 0, 0], е2 = [0, 1, 0], е3 = [0, 0, 1] никакой нетривиальной линейной зависимости нет, так как соотношение ai -ф- а2 ?2 4“ аз ез = 0 означает, что [«1, 7->, а3] = [°> °, 0]> откуда “1 = «2 = а3 = 0. Конечная система векторов at, а^, ... , ат какого-нибудь линей- ного пространства называется линейно зависимой, если между ними существует нетривиальная линейная зависимость. Если такой зависимости нет, т. е. если из всякого соотноше- ния вида а1 -ф- а.2 a-i -ф-... -ф- ат ат = О следует а! = а2 = . ,. = ат = 0, то система ai, а2, ... , ат назы- вается линейно независимой. Из этого определения непосредственно вытекает, что если к линейно зависимой системе векторов alt ai, ... , ат присоединйть еще несколько векторов bit ... , bk, то расширенная система останется линейно зависимой. В самом деле, если ai<7i 4- а.2а2 атйт = О — нетривиальное соотношение между ait ... , ат, то ащ + ... + amam + 0-fei+ ... + 0 • bh = о будет нетривиальным соотношением между йь .... ат, bif ... ,bk.
РАЗМЕРНОСТЬ 71 § 4] В вопросах, связанных с линейной зависимостью, нулевой вектор о занимает особое место, так как всякая система, содер- жащая нулевой вектор, является линейно зависимой. Для дока- зательства достаточно заметить, что соотношение 1 • о + 0• а} + ... + 0= о является нетривиальной линейной зависимостью, имеющей место при любых й1, ... , ат. Данное выше определение линейно зависимой системы пред- полагает, что эта система содержит только конечное число векто- ров.Однако часто приходится рассматривать и бесконечные системы. Мы условимся .бесконечную систему векторов называть ли- нейно зависимой, если линейно зависимой будет какая-нибудь конечная часть ее. Следующий пример показывает, что бесконеч- ные линейно независимые системы векторов существовать могут. Рассмотрим совокупность всех многочленов от буквы X с коэффи- циентами из некоторого тела К. Эти многочлены относительно операций сложения и умножения на числа из Л, очевидно, обра- зуют линейное пространство. Многочлены 1, X, X2.....Хт, ... составляют в этом пространстве линейно независимую систему. Действительно, любая ее конечная часть хт-, х^......хтА ... <^mh) линейно независима, так как из aiXm«-|-а2Х"ь + ... +айХть = о следует, что aj = а2 — ... = ай = 0. Рассмотрим снова произвольное линейное пространство 2. Если какой-либо его вектор а можно представить в форме a = ajfl]-|-а.2ц.2... + «-тат, то говорят, что а выражается линейно через а1г а2, ... , ат или что а линейно зависит от aif ... , ат. Если векторы ai, ... , ат выражаются линейно через bit ... ... , bn, a bi, ... , bn выражаются линейно через Ci, ... , ср, то ai, ... ... , ат выражаются линейно через Cj, ... , ср. Для доказательства достаточно в линейные выражения век- торов ai, ... , ат через bi, . „ , bn подставить вместо bi, ... , bn их выражения через с1( ... , ср и привести подобные члены. Теорема 1. Если система ненулевых векторов аи а.,, ... , ат, рассматриваемых в определенном порядке, линейно зависима, то
72 ЛИНЕЙНЫЕ ПРОСТРАНСТВА [Гл. II по меныией мере один из этих векторов можно выразить линейно через предыдущие. Обратно, если один из векторов этой после- довательности выражается линейно через предыдущие, то сис- тема линейно зависима. Пусть между векторами «i, ait ... , ат существует нетриви- альная зависимость «i«i + а.га.г + ... 4 а.тат = о. (1) Обозначим через ай последний коэффициент, отличный от нуля. Если А = 1, то соотношение (1) обращается в ща1 = о («х^О), откуда «1 = о вопреки предположению, что система не содержит нулевых векторов. Следовательно, l<^k^m, и соотношение (1) мы можем переписать в виде ед+ ... +<хАай = о («й^О), откуда ak= — аг’а> «1 — • • • — агЧ-1 «й-г Таким образом, первая часть теоремы доказана. Обратное утверж- дение очевидно. Пусть ЭЛ — какое-нибудь множество векторов линейного пространства £. Система векторов «1, а>, ... этого множества называется системой образующих для ЭЛ, если всякий вектор из ЭЛ может быть выражен линейно через какое-либо конечное число векторов «1, а*, ... Линейно независимая система образую- щих для ЭЛ называется базой или базисом множества ЭЛ. Напри- мер, в пространстве всех многочленов от X многочлены 1, X, X2....Хт, ... (2) образуют базу, так как эти многочлены, как мы видели выше, линейно независимы и, с другой стороны, всякий многочлен имеет вид а0 -j- оцХ а.2Х2 amXm, т. е. выражается линейно через 1, X, ..., Хт. Лемма. Если система образующих at, щ, ... множества ЭЛ содержит элемент ait который можно линейно выразить через остальные образующие, то, выбрасывая а, из системы образующих, мы снова получим систему образующих для ЭЛ. В самом деле, по условию каждый вектор из ЭЛ является линейной комбинацией некоторого конечного числа образующих. Заменяя в этих комбинациях вектор а, его выражением через остальные образующие, мы получим выражение любого элемента 3)1 через образующие, отличные от ait что и требовалось.
РАЗМЕРНОСТЬ 73 5 4] Теорема 2. Из всякой системы образующих пространства $ можно выбрать базу этого пространства. Пусть 8 имеет конечную систему образующих ait щ, ..., as. Выбрасывая из этой системы векторы, выражающиеся линейно через предыдущие, мы получим некоторую систему векторов oia, ..., й,л, которая согласно лемме все еще будет системой образующих пространства 8. Так как ни один из векторов пос- ледней системы не может быть выражен линейно через предыду- щие, то в силу теоремы 1 эта система линейно независима и, следовательно, является базой пространства. Мы доказали теорему 2 в предположении, что система образующих содержит конечное число элементов. Однако эта теорема верна и в случае бесконечной системы образующих. Для доказательства достаточно располо- жить образующие в трансфинитную последовательность alt а2, ... ат, аш+1,... и выбросить из нее элементы, выражающиеся линейно через предыдущие. Пусть ai, аг, ... •— база пространства 8. Согласно определе- нию базы всякий вектор из 8 будет линейно выражаться через конечное число базисных векторов. Покажем, что такое выраже- ние возможно только единственным образом. В самом деле, пусть а = &iOj —j— —|— ... asos и Д = Р-|- . . . Вычитая, мы получим ° = (ai —₽1)«1 + (аа —••• +(as — Так как аг, аг, ... линейно независимы, то — ^ = 0, а3— р3 = = 0, ..., a.s— ps = O, или ai = pi, ..., = что и требовалось. Если линейное пространство 8 имеет хотя бы одну базу, состоящую из конечного числа элементов, то 8 называется конеч- номерным. Более подробно, 8 называется конечномерным, если в 8 можно выбрать такую конечно линейно независимую систему векторов, через которую все векторы из 8 выражаются линейно. Понятие базы неприменимо к нулевому пространству. Однако мы будем считать, что нулевое пространство также конечномерно. Теорема 3. Все базы конечномерного ненулевого линейного пространства 8 состоят из одного и того же конечного числа векторов. Это число называется размерностью пространства 8. Размерностью нулевого пространства называется число нуль. Согласно определению в 8 найдется база, состоящая из ко- нечного числа векторов. Пусть эта база будет at, ..., ап. (3) Покажем, что число векторов любой другой базы ха, ...» хт, ... (4)
74 ЛИНЕЙНЫЕ ПРОСТРАНСТВА [ГЛ. п не может превосходить п. В самом деле, рассмотрим систему Xt, ah ait ...,ап. (5) Так как система (3) является системой образующих 2, т. е. всякий вектор 2 выражается линейно через векторы (3), то тем более обладает этим свойством и система (5). Однако система (5) линейно зависима, так как первый ее вектор Xi может быть линейно выражен через остальные. Применяя к последователь- ности (5) теорему 3, мы видим, что один из векторов этой после- довательности, например «г, должен выражаться линейно через предыдущие. Выбрасывая из (5) вектор ait мы получим новую последовательность Xi, «'....ап_ь (6) где через а’, ..., dn_i обозначены оставшиеся из векторов щ, , ал. В силу леммы система (6) будет все еще системой образующих для 8. Рассмотрим теперь последовательность ^2, ^1» ^1» •••» di-1* (7) Эта последовательность линейно зависима, так как вектор выражается линейно через остальные ее элементы. Следовательно; по теореме 1 один из векторов этой системы должен выражаться линейно через предыдущие. Этот вектор должен быть одним из ..., а'п_1, так как и xt по предположению линейно незави- симы. Выбрасывая его из последовательности (7), мы получим по- следовательность х2, Xi, а"\, ..., а„^, (8) где через а”, ..., обозначены оставшиеся векторы из щ, ... ... , а'п_1. Поскольку последовательность (7) являлась системой образующих 8, то согласно лемме последовательность (8) также будет системой образующих для 8. Присоединяем теперь к пос- ледовательности (8) вектор х3, из новой последовательности вы- брасываем вектор, выражающийся линейно через предыдущие, и т. д. Если бы число векторов было больше п, то через п шагов мы получили бы последовательность ^л» %п~Ь • ••» Хз,Х1, (9) совсем не содержащую векторов щ, ... , ап, причем эта последо- вательность была бы системой образующих для 2. Это означает, что все векторы пространства 2 можно было бы выразить ли- нейно через векторы (9). В частности, можно было бы выразить линейно через векторы (9) и вектор х„+), что противоречит ли- нейной независимости векторов Xi,X2, Следовательно, база (4) не может содержать векторов больше, чем база (3), и, таким
§ 4] РАЗМЕРНОСТЬ 75 образом, все базы 2 состоят из конечного числа векторов. Однако в качестве базы (3) была взята произвольная конечная база. Поэтому наше рассуждение показало, что число векторов одной базы не может быть меньше числа векторов любой другой, т. е. что все базы 2 имеют одинаковое число векторов. Теорема 4. Для каждой линейно независимой системы век- торов «1.....ат конечномерного пространства 2 можно найти в 2 такие векторы am+i, ... , ал, что система at, ... , ат, am+t, ... ... , ап будет базой пространства 2. Доказательство. Выберем в 2 какую-нибудь базу xit Xt, ... , хп и составим последовательность аь аг, ... , ат, xit х2, ... , хл. (10) Выбросим теперь из этой последовательности все те векторы, которые выражаются линейно через предыдущие. Так как аь а2, ... ... , ат линейно незагшсимы, то ни один из них выброшен не бу- дет, и оставшаяся система примет вид «1, ... , ат, xi{ , xi2, ... , Xik. (11) На основании теоремы 1 эта система линейно независима. С дру- гой стороны, все векторы пространства 2 выражались линейно через систему (10). Согласно лемме тем же свойством должна обладать и система (11). Следовательно, система (11) есть база пространства 2, a xi{ , xi2, ... , xik — искомые векторы. Теорему 4 можно сформулировать еще так: всякая линейно независимая система векторов пространства 2 либо сама явля- ется базой 2, либо есть часть некоторой базы 2. Пусть 2 имеет размерность п. Тогда каждая база простран- ства 2 содержит п векторов и, значит, число векторов любой линейно независимой системы из 2 либо меньше п, либо равно п. В последнем случае система должна быть базисом пространства 2. В частности, максимальное число линейно независимых векто- ров из 2 равно п, т. е. равно размерности 2. Мы пришли к следующей теореме: Теорема 5. Всякая система из п-ф-1 вектора п-мерного ли- нейного пространства 2 линейно зависима. Любые п линейно не- зависимых векторов этого пространства образуют его базу. Мак- симальное число линейно независимых векторов пространства 2 равно размерности этого пространства. В заключение отметим, что теоремы 3, 4, сформулированные нами для конечномерных пространств, на самом деле имеют место и для пространств бесконечной размерности. Для этого только придется вместо числа векторов базы рассматривать мощ- ность совокупности ее векторов и соответственно этому под размерностью пространства понимать мощность совокупности
76 ЛИНЕЙНЫЕ ПРОСТРАНСТВА [Гл. .II векторов, образующих какую-нибудь базу этого пространства. Что касается теоремы 5, то из ее утверждений переносится на случай бесконечной размерности непосредственно только послед- нее. В настоящей книге мы будем изучать свойства конечномер- ных пространств. Поэтому в дальнейшем всюду, где не оговорено противное, под линейным пространством будет пониматься ли- нейное пространство конечной размерности. Определим размерность пространств, рассмотренных в п. 4.1. Пусть 31 — обыкновенное пространство направленных отрезков, выходящих из некоторой точки О. Эти /а, отрезки, как обычно, будем называть / векторами. Докажем, что любые три / вектора ai, аг, а3 пространства 31, вы- / / ходящие из О и не лежащие в одной / плоскости, составляют базу простран- —ж-----~т~—ства 31. В самом деле, аь а2, а3 линей- \ но независимы, так как в противном \ случае один из них, например а3, дол- \ жен был бы выражаться линейно через 'Ч> два других. Однако соотношение а3 — = a1a1-j-a2a2 означает, что а3 есть ди- Рие. 1. агональ параллелограмма, построенного на векторах щау, а.2а2. Поскольку atai и а2аа лежат в плоскости aiOa.2, то в той же плоскости лежит и а3, что противоречит предположению. С другой стороны, вся- кий вектор ОА пространства 31 может быть выражен линейно че- рез ai, а2, а3 (рис. 1): ОА = OPi *4“ Р2Р2 Р2А = ща^ -|- 7.2а2 -f- ос3а3, где щ есть отношение длины отрезка P^Pi (Ро = 0, Ps = А) к длине а,-, взятое с надлежащим знаком. Таким образом, at, а2, а3 есть база пространства 31, и, следовательно, 31 имеет размер- ность 3. Аналогичным образом доказывается, что совокупность векто- ров, выходящих из точки О и лежащих в некоторой плоскости, проходящей через О, является двумерным линейным простран- ством, а также что совокупность векторов, выходящих из О и лежащих на некоторой прямой, проходящей через О, является одномерным пространством. Рассмотрим пространство строк длины п с элементами из не- которого тела К. Пусть « ei = [1, 0, .... 01, [0, 1, ..., 0], ея = [0, 0, ..., 1].
§ 4] РАЗМЕРНОСТЬ 77 Умножая -эти строки последовательно на произвольные числа аь сц, ... ап и складывая, получим «161+0262 + ... + an6n = [ab аг, ... aj. Таким образом, произвольная строка [ab ..., an] выражается линейно через eit ..., еп. Однако система eit ..., еп линейно не- зависима, так как соотношение +«262+ ... +апеп = о дает [ai,7..2, ..., an] = [О, 0.0], откуда ai = «2 = ••• =an = 0. Поэтому е1г ег, ..., еп — база рассматриваемого пространства, и размерность его, таким обра- зом, есть п. Наконец, пусть 2 будет пространством функций, определен- ных на конечном множестве Э)1 со значениями в теле К. Обо- значим элементы из 301 через mi, т2, ... ms. Согласно п. 4.1 всякая функция f из 8 может быть представлена в виде f = ai [/nt]Н-а3[/п2] 4- ... + as[mj, где [mJ — функция, равная 1 на т, и равная 0 на остальных элементах множества ЙП. Следовательно, f выражается линейно через [mi], ..., [mJ. С другой стороны, равенство «1 [mJ+а2 [т2] + ... + ag[mj = o означает, что все значения функции, представляемой левой частью, равны нулю и, следовательно, aj= ... = as = 0. Мы видим, та- ким образом, что [mJ, ..., [mJ есть база пространства 8 и раз- мерность его равна s. Выше рассматривались линейные пространства, т. е. (унитар- ные) модули над телом К. Самые простые примеры показывают, что для модулей над произвольными кольцами и даже над про- извольными коммутативными кольцами теоремы 1, 2 пере- стают быт£> верными. В частности, пусть К — кольцо обычных це- лых чисел, 2 — совокупность тех же целых чисел, рассматривае- мых с обычной операцией сложения, а умножение «чисел» из К на «векторы» из 2 — это обычное умножение целых чисел. Целые числа, рассматриваемые как векторы из 2, условимся обозна- чать жирными цифрами, а числа из К — обыкновенными цифрами. Так как для любого вектора т истинна формула т — т-1, то наш числовой модуль 2 порождается вектором 1. Векторы 2 и 3 линейно зависимы, а именно: 2 • 3 + (—3) • 2 = 0. Однако для любого «(Ка.3^2, а-2^3, т. е. в 2 ни один из
78 ЛИНЕЙНЫЕ ПРОСТРАНСТВА [Гл. И векторов 2, 3 не выражается линейно через другой. Свойства модулей над произвольными кольцами систематически изучаются в теории модулей, тесно связанной с теорией чисел. Нас же бу- дут интересовать лишь свойства векторных пространств, и к теории модулей над кольцами мы будем возвращаться лишь там, где это будет нужно для теории векторных пространств. 4.3. Изоморфизм. Понятие линейного пространства состоит из двух существенно различных частей. Во-первых, линейное пространство есть совокупность некоторых вещей, называемых векторами, во-вторых, на линейном пространстве действуют опе- рации сложения и умножения на число. Поэтому либо можно интересоваться, чем являются векторы, каковы их природа и свойства, либо можно встать на противоположную точку зрения и интересоваться свойствами указанных операций независимо от природы элементов, над которыми они совершаются. В дальней- шем мы будем интересоваться только свойствами второго рода. Поэтому два пространства, устроенные одинаково по отношению к операциям сложения и умножения на число, мы будем считать обладающими одинаковыми свойствами, или изоморфными. Более точно понятие изоморфизма можно сформулировать следующим образом: Два линейных пространства над одним и тем же телом коэффициентов называются изоморфными, если между их элемен- тами возможно установить такое взаимно однозначное соответ- ствие, при котором сумме векторов первого пространства будет отвечать сумма соответственных векторов второго, а произведе- нию какого-либо числа на вектор первого пространства будет отвечать произведение того же числа на соответственный вектор второго. Взаимно однозначное соответствие, обладающее указанными свойствами, называется изоморфным или изоморфизмом. Рассмот- рим простейшие свойства изоморфизмов. При изоморфном соответствии нулевой вектор переходит в нулевой вектор. Действительно, пусть при изоморфном отобра- жении одного линейного пространства 8 на другое вектор а из 2 переходит в вектор ах из 21. Тогда согласно определению изоморфизма произведение 0-а должно переходить в произведе- ние 0 • «в т. е. нулевой вектор первого пространства должен пе- реходить в нулевой вектор второго. При изоморфном отображении система образующих первого пространства переходит в некоторую систему образующих второго. Действительно, пусть ait сц, ... , as — образующие первого пространства и bi, Ьг, ... , bs—-соответствующие им векторы во втором. Возьмем во втором пространстве произвольный вектор b и рассмотрим отвечающий ему вектор а в первом пространстве.
РАЗМЕРНОСТЬ 79 § 4] По условию а можно представить в форме CL ~ <Xj6Zi OlsOj 4” • •• По определению изоморфного отображения сумма ... 4-asas должна перейти всуммуа^Н- ... -\-asbs, следовательно, вектор b должен совпасть с суммой + ... +asbs, а это и значит, что векторы blt ..., bs составляют систему образующих второго пространства. При изоморфизме линейно независимые векторы переходят в линейно независимые. В самом деле, пусть линейно независимые векторы аъ аг, ... ... , ат первого пространства переходят в векторы bit Ьг, ... , Ьт второго. Допустим, что между последними векторами существует соотношение + ••• +?wAn = °i- Согласно определению изоморфизма левой части этого равен- ства отвечает в первом пространстве вектор + 3.>а.2 + ... + $тат, нулевому вектору 0| отвечает в первом пространстве нулевой вектор о. Следовательно, + • • • + ?тат = °' Так как векторы а1( ... , ат линейно независимы, то ' ₽1 = ^ = =?т = 0, т.е. векторы bt, , Ьт линейно независимы. Из двух последних свойств непосредственно вытекает, что база линейного пространства при изоморфизме переходит снова в базу линейного пространства, и, таким образом, изоморфные линейные пространства имеют одинаковую размерность. Обратное также справедливо: если два линейных простран- ства над одним и тем же телом коэффициентов имеют одинако- вую размерность, то они изоморфны. Для доказательства выберем в каждом из заданных про- странств какую-либо базу, например ait аг,'... , ап и Ьъ Ьг, ... ... , Ьп. Векторы а = ад 4- a.,a.2 + .... + a„a„, b = Pl&l + + . . . + мы назовем соответственными, если ai = pt, ... , an = 3n- Так. как каждый вектор пространства может быть выражен линейно через базу только одним способом, то наше соответствие взаим- но однозначно. Пусть теперь а = оад + ад2 -f- апап, b — aj&j Д- a.2Z?.2 .. -j- a.nbn
80 ЛИНЕЙНЫЕ ПРОСТРАНСТВА [Гл. II — два соответственных вектора. Тогда сШ = occtj @1 —|— —|— ... —|— ab — aa4&i -ф- аа.2Ь2 ..'. -ф- Так как соответственные коэффициенты в этих разложениях равны, то аа и ab будут соответственными векторами, т. е. при нашем соответствии произведение числа на вектор переходит в произведение того же числа на соответственный вектор. Ана- логично доказывается и то свойство, что сумма векторов перехо- дит в сумму соответственных векторов. Поэтому построенное со- ответствие является изоморфизмом, что и требовалось. Перечисленные выше свойства изоморфных соответствий по- казывают, что при заданном основном теле К каждое линейное пространство определяется своей размерностью с точностью до изоморфизма. Поэтому пространства строк длины п с элементами из тела К при п=1, 2, ... с точностью до изоморфизма исчер- пывают вообще все пространства конечной размерности над К. В частности, обыкновенное пространство направленных отрезков изоморфно пространству строк длины 3 над полем вещественных чисел, пространство функций, определенных на множестве ЭЛ, содержащем s элементов, со значениями в теле К изоморфно пространству строк длины s с элементами из К и т. д. - В заключение сделаем еще одно замечание. В общей алгебре централь- ную роль играют понятия алгебры данной сигнатуры и изоморфизма алгебр фиксированной сигнатуры (см. «АС»). В принятом нами определении поня- тия модуля формально не была указана сигнатура модуля, т. е. не были указаны те операции, которые считаются основными и по отношению к ко- торым определяется понятие изоморфизма. Определив (точно так же, как и для линейных пространств) понятие изоморфизма модулей, мы тем самым фиксируем совокупность основных операций, хотя и неявно. Выделяя эти основные операции в явном виде, приходим к следующему определению унитарного модуля, лишь по форме отличающемуся от определения в п. 4. 1. Унитарным модулем над кольцом АГ с единицей 1 называется алгебра, сигнатура которой состоит из символа ф- бинарной операции и символов —, (а ф АГ) одноместных операций, при условии, что в этой алгебре выпол- няются тождества Аф: х у =у -{- х, М2: x+(j/ + z) = (x + j/)-|-z; м3: х-Ну + (-у)) = *; Fa(A₽(a)) = /Ma): Afs: (а 4- ft) = Л’а (а) 4- /^ («.); : Fa+13 (а) = (а) + /ф (a); М7 : (a) = a. Таким образом, мы принимаем здесь в качестве отдельных основных операций умножение элементов' основного множества (векторов) на любой
. 651 КООРДИНАТЫ 81 фиксированный элемент а£АГ. Если основное кольцо К бесконечно, то сиг- натура модуля также бесконечна. Меняя кольцо К, мы меняем и сигнатуру класса модулей. Вообще говоря, возможен и другой путь, включения теории модулей в общую теорию алгебр. Для этого модули рассматривают как алгебры с двумя основными множествами: множеством чисел и множеством векторов. Сигна- тура теперь состоит из операций сложения чисел и взятия их противополож- ных, сложения и взятия противоположных векторов, операции умножения числа на вектор и 0-местной операции, выделяющей единицу 1 (всего 6 опе- раций). В качестве основных тождеств берут тождества, определяющие кольцо, определяющие коммутативную группу и тождества 4°—7° из п. 4.1. Новое понятие модуля отлично от старого. Все модули в новом смысле имеют одну и ту же сигнатуру (указанные 6 операций), и потому становится возможным спрашивать, изоморфны или нет модули над различными кольцами. Эти новые изоморфизмы, в отличие от определенных выше, часто называют косыми изоморфизмами. Соответственно этому определяются и косые авто- морфизмы, эндоморфизмы и другие аналогичные понятия. Примеры и задачи 1. Показать, что размерность пространства всех многочленов степени не выше п от одной переменной равна n-f-1. 2. Однородные многочлены степени п от двух переменных образуют линейное пространство размерности п 1. 3. Чему равна размерность пространства однородных многочленов сте- пени п от k переменных? 4. Матрицы с т строками и п столбцами с элементами из заданного тела /С образуют относительно обычных матричных операций сложения и умножения на число линейное пространство. Показать, что матрицы, у кото- рых один какой-либо элемент равен единице, а остальные равны нулю, обра- зуют базу этого пространства и, таким образом, размерность пространства равна тп. 5. Симметрические, а также кососимметрические матрицы порядка и с эле- ментами из какого-либо тела АГ образуют линейные пространства над АГ. Покй- п (п -|- 1) зать, что размерность этих пространств равна соответственно ——~ п(п — I) и —. § 5. Координаты 5.1. Координаты вектора. В предыдущем параграфе были рассмотрены простейшие общие свойства линейных пространств. Однако в приложениях, кроме знания общих свойств, важно уметь задать векторы при помощи чисел и свести векторные операции к действиям над числами. Эта задача решается путем введения в векторное пространство координат. Всякую базу линейного пространства 2, векторы, которой берутся в определенной последовательности, мы будем назы- вать координатной базой или координатной системой в 8. Таким образом, если ...,ая ' (1)
82 ЛИНЕЙНЫЕ ПРОСТРАНСТВА [Гл. II есть система координат в %, то те же векторы, взятые в другом порядке, будут другой системой координат в V. Мы йидели, что каждый вектор а из 8 может быть однозначно представлен в форме а = + a-ifli + ... + (2) Числа ab ..., а„ называются координатами вектора а в системе координат (1). Строка [аь а,2 ..., ал], составленная из координат вектора а, взятых в надлежащем порядке, называется коорди- натной строкой и обозначается [а]. Следовательно, если в про- странстве выбрана определенная координатная система, то каж- дому вектору отвечает координатная строка и, обратно, для каждой строки длины п формула (2) дает определенный вектор а, имеющий эту строку своей координатной строкой. Пусть векторы а, b имеют координатные строки [а2 ..., a„] и [₽i.....М, т. е. а = aifli 4~ • • • -f- anan, b = fliai 4- ... ^nan- Тогда, очевидно, aa = (aaj)ai4-(aa2)a24- ... 4-(aa„)a„, a + b = (aj 4- p2) 4- (a2 4~ Ра) Я-2 ~T • • • 4- (a« 4- Рл) un. Эти равенства можно, пользуясь, правилами действий со строками, переписать в виде [aa] = a[a], [a + 6] = [a] + [*L Следовательно, координатная строка суммы векторов равна сумме координатных строк слагаемых и координатная строка произ- ведения числа на вектор равна произведению этого числа на координатную строку вектора. Этот результат можно истолковать еще следующим образом. Пусть задано какое-либо линейное пространство 2 размерности п над телом К. Обозначим через £„ пространство строк длины п с элементами из /С Выберем в 8 определенную координатную систему и поставим каждому вектору из 8 в соответствие его координатную строку. Наш результат показывает, что это соот- ветствие есть изоморфизм между 2 и 8„. В частности, отсюда следует, что линейно независимые векторы имеют линейно неза- висимые координатные строки и каждая линейная зависимость между заданными векторами имеет место и между их координат- ными строками. В одном и том же пространстве 8 существуют различные коор- динатные системы. Поэтому возникает вопрос, как изменятся координаты вектора, если мы от одной координатной системы
КООРДИНАТЫ 83 перейдем к другой. Д,чя решения этого вопроса выберем в 8 какие-либо две координатные системы at, ait ..., ап и д', а’г, ... ... , а'п. Так как векторы aiy ..., апявляются базой пространства 2, то а\..а'п должны линейно выражаться через а{....ап. Пусть эти выражения будут Tig 6^2 —••• -J- ап, а-2 — <21 Т22 йч. 4~ • • • 4“ аП1 ап---Т«1 а1 4~ 4~ • • • 4- хпп аП‘ Матрица Тц ... Т-21 ... -Т/Н называется матрицей перехода от координатной системы <Zi, ..., ак к системе а\, , ап. Возьмем произвольный вектор а и обозначим через [аь ..., а„], [а', ..., <4] его координатные строки в старой и новой координатных системах. Следовательно, мы имеем а = <Х1 <?i 4~ ач 4" • • • 4- v-rflm а = а'а' 4~ «2<?2 4- • • • 4- а«а«- Подставляя во второе из этих равенств вместо векторов а\, ... , а‘п их выражения через ..., ап, получим а — (а1т11 4- я2~-21 4- • • • 4“ aziTral) а1 “Г (а1т12 4- ... 4- V-iT-nt) а2 4~ • • • » ИЛИ —«jTn 4~ a2T2i 4- • • • 4- аль а2 — а1т12 4~ а2Тм 4“ ••• 4-алъ ап — aiTi« 4- а2т-2Л 4~ • • • 4~ ал«- Эти равенства и являются искомыми формулами преобразова- ния координат. Замечая, что выражение для а;: а< = 4- a2T2i 4~ • • • 4~ аЛ«, представляет собой произведение координатной строки [а', ..., а'„] на г-й столбец матрицы Т, мы видим, что всю систему формул преобразования координат можно записать в кратком матричном виде: [аь ..., а„] =г[а;, ..., <] Т.
84 ЛИНЕЙНЫЕ ПРОСТРАНСТВА [Гл. II Мы получили следующее Правило Преобразования координат. Старая координатная строка вектора равна новой, умноженной на мат- рицу перехода. Докажем следующую полезную во многих случаях лемму: Лемма. Пусть А, В—квадратные матрицы порядка п с элементами из тела К. Если для любой строки [Еь ЕД с элементами из К .... ЕДД = [ЕЬ .... ЕД В, (3)- то А = В. В самом деле, если элементы матрицы А обозначать через а;у, а элементы матрицы В через (I, j = 1, ..., л), то для каждого i при значениях Ег =1, Е?- = 0 (i Ф j) равенство (3) дает а1А = р;А (/, А=1....л), что и требовалось. Рассмотрим теперь в л-мерном линейном пространстве две координатные системы а]; ап и aL, ..., а';1. Мы можем либо а', ап выразить через ль ап: а ==тпа1-{- ••• +zman> • ............................... (4) Un ~~ й] -р ... ~Р а„, либо, наоборот, at..ап выразить через л', а'п: ai —спа1+ ... -|-ап, ап — а, -{* ••• -р ап. Матрица Т, составленная из коэффициентов т,у, есть матрица пе- рехода от системы at, ..., ап к системе л', ап, а матрица 5, составленная из коэффициентов сг-у, является матрицей обрат- ного перехода от системы л', ..., а'п к системе л1; ..., ап. Пусть [х] — координатная строка произвольного вектора х в координат- ной системе ах, ..., ап, a [хф — координатная строка вектора х в системе а\..... а'п. Рассматривая координатную систему flj, ... ..., ап в качестве старой и применяя правило преобразования координат, получим [х] = [х]17’. (5) Рассматривая, наоборот, в качестве старой систему а\, ..., а'п, получим [х], = [х] 5. Подставляя сюда вместо [х] его выражение из (5), мы получим [х]1 = [х]1Т5
§ 5] КООРДИНАТЫ 85 'и аналогичным образом [х] = [х] ST. Здесь вектор х, а следовательно, и его координатные строки [х]ь [х] произвольны. В силу леммы отсюда получаем E=TS—ST, S=T~1. Таким образом, матрица преобразования координат всегда имеет обратную, которая является матрицей обратного преобразова- ния координат. Указанные рассуждения позволяют выяснить одну деталь, связанную с обратными матрицами и оставленную нами без рас- смотрения в п. 2.3. Согласно п. 2.3 квадратная матрица S’ на- зывается обратной для матрицы Т, если выполнены два равен- ства: ST — E, TS=E. Если S удовлетворяет только первому или только второму, то называется обратной слева или соответственно обратной справа. Теорема. Если квадратная матрица Т с элементами из тела К имеет левую или правую обратную матрицу S, то S является просто обратной матрицей для Т. Берем «-мерное пространство 2 с какой-нибудь базой . аь ... ..., ап. Вычисляем по формулам (4) векторы а\, ..., а„. Покажем, что они линейно независимы. Пусть Х| а\ + ... + Хл а1п = о. Ясно, что это соотношение равносильно матричному условию [X,. .... Хя].Т = о. (6) Если Т имеет правую обратную матрицу S, то, умножая обе части равенства (6) справа на S и замечая, что TS—E, полу- чим [Хь .... Хл]=о. Следовательно, векторы а\, ..., ai Линейно независимы, и потому систему а|, ..., а'п можно принять в ка- честве новой координатной системы в 2, причем матрица Т бу- дет матрицей перехода. Матрица перехода имеет обратную мат- рицу 7’"1. Умножая соотношение TS=E слева на 7’1, получим S=71~1. Мы показали, что правая обратная является просто обратной. Аналогично устанавливается, что левая обратная также является просто обратной. Изложенные рассуждения показывают, в частности, что каждая обратимая матрица порядка п является матрицей перехода для подходящих координатных систем. 5.2. Ранг,и матриц. Рассмотрим векторное пространство £ над каким-то телом К, имеющее конечную размерность п. Выберем
86 ЛИНЕЙНЫЕ ПРОСТРАНСТВА [Гл. II в 2 произвольную базу alt ... , ап в качестве координатной си- стемы, и пусть векторы Xj, ... , хт имеют соответственно коорди- натные строки [х1] = [а]1, ... , а1л], — 1атЬ • • • > атл1 •, Составляем из этих строк матрицу а11 • • • 71га ami ... атл Мы .уже знаем, что максимальное число линейно независимых векторов в системе xlt ..., хт равно максимальному числу линей- но независимых строк в системе [xi], ... , [хт], т. е. максимально- му числу линейно независимых строк матрицы А. Максимальное число линейно независимых строк произвольной матрицы А с элементами из заданного тела К называется ран- гом матрицы А или, подробнее, рангом по строкам. Таким образом, максимальное число линейно независимых векторов среди хь ... , хт равно рангу матрицы, составленной из координатных строк этих векторов. Вернемся снова к произвольной матрице А с т строками и п столбцами. Отметим какие-то k строк и k столбцов в А. Эле- менты матрицы А, находящиеся на пересечениях отмеченных строк и столбцов, взятые в их естественном порядке, образуют квад- ратную матрицу порядка k. Она называется минором £-го поряд- ка матрицы А. Рассматривая всевозможные миноры 1-го, 2-го и т. д. порядков матрицы А, увидим, что часть их будет обратимы- ми матрицами, а часть — необратимыми. Наивысший порядок об- ратимых миноров матрицы А назовем ее рангом по минорам или минорным рангом. МинОры 1-го порядка — это элементы матрицы А. Так как матрица А берется над телом, то необратимость минора 1-го по- рядка означает просто, что этот минор образован нулем. По- этому матрица А не имеет обратимых миноров тогда и только тогда, когда она состоит из нулей. В этом случае говорят, что минорный ранг матрицы А равен нулю. Заметим, что ранг по строкам нулевой матрицы также равен нулю, так как система нулевых векторов не имеет линейно независимых подсистем. Мы хотим теперь доказать, что ранг по строкам произвольной мат- рицы совпадает с ее рангом по минорам. Однако мы сделаем это не сразу, а предварительно рассмотрев квадратные матрицы. Теорема 1. Для того чтобы квадратная матрица А — = h/Jnn с элементами из некоторого тела К была обратима,
§ 51 КООРДИНАТЫ 87 необходимо и достаточно, чтобы ее строки были линейно неза- висимы. Обозначим через а, l-ю строку матрицы (Z = 1......п). Тог- да произвольная линейная зависимость ^1^1 ~т • • ~т Ofln = 0 (1) строк матрицы А может быть переписана в виде рч, ... , \п]-А=о. (2) Если матрица А обратима, то, умножая обе части равенства (2) на Л"1, получим [Хъ ... , Хл] = о, и необходимость условий теоремы 1 доказана. Напротив, пусть строки ai.....ап матрицы А линейно неза- висимы. Обозначим через I* векторное пространство всех строк длины п с элементами из тела К. Строки = [1, 0, ... , 0], е3 = [0, 1, ... , 0], е„—[0, 0, ... , 1] составляют базу 2. С другой стороны, пространство 2 н-мерно и, по условию, его векторы aj, ... , а„ линейно независимы. Поэтому векторы aj, ... , ап также составляют базу пространства £. Рассматривая базу et, ... , еп в качестве исходной координат- ной системы в £, а базу а{, ,а„ в качестве новой координат- ной системы, видим, что А есть матрица перехода от первой ко второй координатной системе, и потому (см. п. 5.1) матрица А обратима. Следствие. Определитель квадратной матрицы с элемента- ми из некоторого поля тогда и только тогда равен нулю, когда строки этой матрицы линейно зависимы. Действительно, для квадратных матриц с элементами из поля обратимость равносильна неособен но сти, т. е. отличию от нуля определителя матрицы. Вспоминая теперь замечание, сделанное в начале этого пунк- та, видим, что система п векторов «-мерного векторного про- странства над полем тогда и только тогда является базой этого пространства, когда определитель матрицы, составленной из координатных строк указанных векторов, отличен от нуля. В теореме 1 и ее следствии речь идет о строках матрицы. Однако эти же утверждения будут справедливы и для столбцов, если под выражением «линейная зависимость столбцов» понимать линейную зависимость относительно умножения столбцов на элементы К справа. Поэтому всюду, где противное не оговорено явно, под умножением строк на элементы из К мы понимаем
88 ЛИНЕЙНЫЕ ПРОСТРАНСТВА ' [Гл. II умножение строк на элементы слева, а под умножением столб- цов на элементы X понимаем умножение справа. Ясно, что это условие излишне, если в качестве К берется поле. Для неком- * мутативных тел К принятое условие становится существенным. Легко проверить, что все рассуждения, приведшие нас к тео- реме 1, остаются справедливыми, если в них слово «строка» за- менить словом «столбец». В результате получается Теорема 1а. Для того чтобы квадратная матрица с эле- ментами из некоторого тела была обратима, необходимо и до- статочно, чтобы ее столбцы были линейно независимы. Определи- тель квадратной матрицы с элементами из поля тогда и только тогда равен нулю, когда столбцы матрицы линейно зависимы. Ясно, что для случая, когда рассматриваются матрицы над полем, теорема 1а получается из теоремы 1 простым переходом к транспонированной матрице. Теорема 2. Пусть Д = || a ц ||тл — произвольная матрица с эле- ментами из какого-то тела К. Ранги матрицы А по строкам, по столбцам и по минорам не изменяются, если над А произвести любое из следующих преобразований: а) поменять местами какие-то строки матрицы А; б) поменять местами какие-то столбцы матрицы А; в) к элементам одной из строк матрицы А прибавить соот- ветствующие элементы какой-то другой строки, умноженные слева на произвольный фиксированный множитель С г) к элементам одного из столбцов матрицы А - прибавить соответствующие элементы какого-то другого столбца, умножен- ные справа на произвольный множитель I £ К. Ранг матрицы А по строкам равен максимальному числу ли- нейно независимых в совокупности ее строк aj..... ат. Меняя порядок строк А, мы изменим лишь их нумерацию, а линейная зависимость или независимость векторов не связана с нумерацией. Также ясно, что ранг матрицы А по строкам не меняется при пере- становке ее столбцов. В самом деле, обозначим строки новой мат- рицы, получившейся после перестановки столбцов, черезblt... , bm. Если между строками матрицы А существовала какая-то линейная зависимость Xf щ Д-... 4- \т ат = о, то очевидно, что новые строки связаны аналогичной зависимостью ~кЦц ... Д- >тЪт — о, и, об- ратно, из последней зависимости вытекает первая. То же самое верно и для случая, когда к какому-нибудь столбцу матрицы А мы прибавляем другой столбец, умноженный справа на X. Нако- нец, максимальное число линейно независимых строк не изменится, если Z-ю строку матрицы А заменить строкой at Ц- X aj, так как векторы системы «1, ..., ai Д-Хо/, ... , ajt .. . , ат выражаются линейно через векторы ал, ... , ат, а векторы последней системы выражаются линейно через векторы первой.
§5] КООРДИНАТЫ 89 Мы убедились, что ранг матрицы А по строкам не меняется при указанных в теореме преобразованиях. Аналогичные рассуж- дения показывают, что ранг матрицы А по столбцам также не ме- няется при преобразованиях а), б), в), г). Мы теперь перейдем к до- казательству неизменности ранга А по минорам, что потребует немного большего внимания. Пусть в матрице А переставляются какие-то строки или столб- цы. Миноры новой матрицы при этом получаются из соответствую- щих миноров старой также перестановками строк или столбцов, и нам следует лишь убедиться, что, переставляя строки или столб- цы обратимой матрицы, мы получим снова обратимую матрицу. Итак, пусть в квадратной матрице В —1| р,-7- ||si переставляются первая и z-я строки. Простой подсчет показывает, что новую матрицу можно представить в виде DB, где D = Ец Ег« -|-... Д- Ец-\- Ei+1, £н, Здесь через Е,, обозначена матрица, у которой в i-й строке и /-м столбце стоит единица, а на Остальных местах — нули. Непо- средственными вычислениями убеждаемся, что DD — E, D^ — D. Поэтому, если матрица В имеет обратную, то матрица B-1D будет обратной для DB. Аналогично матрица BD получается из В пе- рестановкой 1-го и i-го столбцов. Если В обратима, то BD также имеет обратную матрицу, именно DBE Неизменность минорного ранга при перестановках строк и столбцов доказана. Пусть теперь минорный ранг В равен г, и мы к i-й строке В прибавляем ее /-ю строку, умноженную на X. По предположению матрица В имеет обратимый минор порядка г, принадлежащий каким-то г строкам и г столбцам. Чтобы не услож- нять без нужды запись, допустим, что этот минор принадлежит первым г строкам и первым г столбцам матрицы В. Если изме- няемая i-я строка не принадлежит к числу первых г строк, то указанный минор r-го порядка является минором и новой матрицы. Поэтому ранг новой матрицы JSs г. Допустим, что i-я строка при- надлежит к числу первых г строк. Выписываем элементы старой и новой матриц, находящиеся в первых г столбцах, первых г строках и в /-й строке (если />г). Получатся матрицы Р11 Pil • • • pi> Prl ... Р„ _Р;1,... Ру>_
90 ЛИНЕЙНЫЕ ПРОСТРАНСТВА [Гл. II ’ Ри • .. - Q = • fijr В силу теоремы 1 первые г строк матрицы Р линейно незави- симы, и потому ранг Р по строкам равен г. Согласно доказан- ному отсюда следует, что ранг матрицы Q по строкам также равен г. Строки 1-я, ..., (г — 1)-я, (/—|- 1)-я, ..., r-я матрицы Q заведомо линейно независимы, так как они составляют часть линейно независимых первых г строк матрицы Q. Поэтому либо первые г строк матрицы Q линейно независимы, либо i-я строка линейно выражается через остальные строки, и потому осталь- ные г строк матрицы Q линейно независимы. Иными словами, один из миноров ₽11 ••• ₽1г + ^/1 • • • + 'tfjr _ Рп Ргг _ ••• ₽1г \ матрицы Q имеет линейно независимые строки. В силу теоремы 1 этот минор обратим и минорный ранг матрицы Q не меньше г. Мы доказали, что преобразование вида в) не уменьшает минор- ного ранга матрицы. Но если матрица С получается из А при- бавлением к i-й строке ее /-й строки, умноженной на X, то А полу- чается из С прибавлением к /-й строке матрицы С ее /-й строки, умноженной на — X. Ранг по минорам при том и другом преоб- разовании не уменьшается и потому остается неизменным. Остается рассмотреть еще преобразование г); но неизменность при нем минорного ранга матрицы А устанавливается совершенно тем же способом, что и неизменность при преобразовании в). Из теоремы 2 путем несложных рассуждений выводится основная
§5] КООРДИНАТЫ 91 Теорема 3 (о ранге матрицы). У произвольной матрицы А = || aij ||тл с элементами из тела ранг по строкам, ранг по столбцам и ранг по минорам совпадают. Утверждение тривиально, если все элементы матрицы А равны нулю. Поэтому предположим, что А содержит ненулевой элемент а,-у. Переставляя 1-ю и г-ю строки и 1-й и /-й столбцы матрицы А, получим некоторую матрицу В = ||р/у||, у которой рп = а/у ^О, причем в силу теоремы 2 три ранга матрицы В будут равны соответствующим рангам матрицы А. Теперь, прибавляя ко 2-й,... ..., т-й строкам матрицы В ее первую строку, умноженную слева соответственно на — ₽21₽и, ..., — ₽т1Ри > получим матрицу вида ₽12 • • • ₽1П 7'22 ••• 7'-'« ~[т% • • • ~(тп - ‘ причем три ранга матрицы Ci будут такими же, как у матрицы А. Если все 7,-у равны нулю, то преобразования считаем закон- ченными. Если же ч,у =£ О (iS=2, /5=2), то, переставляя 2-ю и t-ю строки и 2-й и /-й столбцы матрицы мы добьемся, чтобы у новой матрицы элемент был отличен от нуля. Прибавляя затем к 3-й, ..., m-й строкам вторую строку, умноженную соот- ветственно на — 732722, • • > — 7/П27221, получим матрицу вида Ct 813 ... 8)л О 8-22 • • • 5'п О О 8М ... 83л (8ц8.22 ф 0). 0 0 8т3 ... 8ОТЛ Ранги матрицы С2 снова совпадают с соответствующими рангами матрицы А. Продолжая процесс дальше, мы не больше чем через т шагов придем к матрице вида Р"11 • • Р*!/- ’ 1^1/1 О [1-22 • • • |л2г !л2, г+1 • • • Р.'2Л о о о о Нгг Нт, Г+1 • • * . ПУЛ о о ... о ([1ц ••• Нгг^О). _о о ... о о ... о __ ранги которой все еще будут совпадать с соответствующими ран- гами матрицы А. Однако из вида матрицы Сг непосредственно
92 ЛИНЕЙНЫЕ ПРОСТРАНСТВА [Гл. II следует, что все три ранга этой матрицы равны одному и тому же числу г. Поэтому и все три ранга матрицы А имеют одно и то же значение г. В п. 2.3 было показано, что квадратная матрица с элемен- тами из поля обратима тогда и только тогда, когда она имеет ненулевой определитель. Поэтому для матриц над полем тео- рема 3 может быть переформулирована следующим образом: Теорема За. У любой матрицы с элементами из поля мак- симальное число линейно независимых строк равно максимальному числу линейно независимых столбцов и равно наивысшему порядку ее миноров, имеющих ненулевой определитель. Фактическое отыскание ранга матрицы обычно производится по способу, указанному в доказательстве теоремы 3, или по его подходящим видоизменениям. Довольно часто оказываются полезными следующие два замеча- ния, непосредственно вытекающие из теоремы 3. Теорема 4. Для любых матриц А = || а,-7-||тл, В —1||1яа с элементами из произвольного тела ранг произведения, АВ не превосходит ни ранга матрицы А, ни ранга матрицы В. Действительно, из определения произведения видно, что строки матрицы АВ являются линейными комбинациями строк матрицы В, и потому максимальное число линейно независимых строк матрицы АВ не может быть больше максимального числа линейно независимых строк матрицы В. Аналогично столбцы, матрицы АВ являются линейными комбинациями столбцов мат- рицы А, и потому ранг матрицы АВ по столбцам не превосхо- дит ранга по столбцам матрицы А. Теорема 5. Если элементы матрицы А принадлежат полю, то ранг ее совпадает с рангом транспонированной матрицы А'. Все миноры матрицы А’ получаются транспонированием мино- ров матрицы А. Поскольку элементы миноров берутся из поля, то транспонирование обратимого минора приводит к обратимому минору, и потому ранг (по минорам) матрицы А’ совпадает с ран- гом (по минорам) матрицы А. В упражнении на стр. 97 указан пример обратимой матрицы с элементами из некоммутативного тела, у которой транспони- рованная матрица не является обратимой. 5.3. Общие системы линейных уравнений. Фиксируем какое- нибудь тело /С и рассмотрим произвольную систему уравнений вида а12 ~|~ • • Д- а1л -Z1 = Р1> а21 £1 “Г а22 ^2 4“ • • • -Д а2п — Pa, ' / 1 \
§ 5] КООРДИНАТЫ .93 где a/jF, рг -- заданные элементы из К., а с4, ..., £п — неизвест- ные, число которых п может быть меньше, больше или равно числу т уравнений. Один из алгоритмов для решения таких систем — способ исключения неизвестных — уже был изложен в п. 2.4. Доказанная в предыдущем пункте теорема о ранге матриц позволяет по-иному подойти к исследованию линейных систем уравнений. Коэффициенты а;у и свободные члены уравнений (1) естест- венно располагаются в две матрицы: “11 “12 ••• “1л “21 “22 • • • “2л ‘-“ml “m2 ••• “mzi-. “11 “12 • • • “1л И “21 а.м ... аг„ -“ml “m2 • • • “тл Рт- называемые основной и расширенной матрицами системы (1). Каждому уравнению системы (1) отвечает определенная строка в матрицах И и В. Перестановка уравнений в системе (1) влечет соответствующую перестановку строк матриц А и В, а измене- ние нумерации неизвестных влечет перестанов у столбцов в ука- занных матрицах. Говорят, что г-е уравнение системы (1) линейно зависит от li-го, ..., Г-го уравнений этой системы, если г-я строка матрицы В есть линейная комбинация ее Ц-й, ..., г5-й строк. Так как тело К не предполагается коммутативным, то строки матриц множатся всегда слева на элементы К, а столбцы матриц мно- жатся справа (см. п. 5.2). Решением системы уравнений (1) называется последователь- ность SJ, ..., £°п элементов тела /С, при подстановке которых в уравнения (1) вместо букв В)( ..., все равенства становятся истинными. Элементы ..., мы расположим в столбец [51, • ••, Ьп]' — х, после чего систему (1) можно будет переписать в матричной форме: А-х = Ь, (2) где b — столбец [^, ..., свободных членов. А) Если г-я строка матрицы В является линейной комбина- цией остальных ее строк, то, вычеркивая i-e уравнение из системы (1), получим сокращенную систему уравнений, имеющую ту же совокупность решений, что и система (1). Ясно, что каждое решение системы (1) является решением и сокращенной системы. Обратно, пусть г-я строка матрицы В равна сумме г’1-й, ..., is-Hi строк, умноженных слева соответственно на >-1, ..., из Д' (i ^zrf’i, ..., is), и пусть значения SJ, ..., удов- летворяют й-му, г>му уравнениям из (1). Тогда, умножая
94 ЛИНЕЙНЫЕ ПРОСТРАНСТВА (Гл. И эти уравнения слева соответственно на ль Xs и складывая почленно, получим i-e уравненйе. Б) Если ранг (по строкам) матрицы В равен г, то система уравнений (1) содержит подсистему из г линейно независимых уравнений, обладающую той же совокупностью решений, что и система (1). Поскольку ранг матрицы В равен г, то матрица В имеет г линейно независимых строк, через которые все остальные ее строки выражаются линейно. Беря уравнения, отвечающие ука- занным г линейно независимым строкам, получим требуемую подсистему. В) Если система уравнений (1) имеет какое-то решение ??,••> ih, то ранг расширенной матрицы В равен рангу основной матрицы А. Если равенства (1) для некоторых 5J, .... истинны, то они показывают, что последний столбец матрицы В равен сумме ее 1-го, ..., п-го столбцов, умноженных справа соответственно на (j®, ..., Поэтому общее максимальное число линейно незави- симых столбцов матрицы В равно максимальному числу линейно независимых столбцов матрицы А, т. е. ранг по столбцам мат- рицы В равен рангу по столбцам матрицы А. Слова «по столб- цам» здесь можно выбросить, так как в п. 5.2 было показано, что ранг по столбцам совпадает с рангом по строкам. Из утверждений Б) и В) легко выводится основная Теорема Кронекера— Капелл и. Для того чтобы система уравнений (1) имела решение, необходимо и достаточно, чтобы ранг расширенной матрицы был равен рангу основной матрицы этой системы. Если ранги основной и расширенной матриц совпадают с числом неизвестных, то система имеет единственное решение. Если ранг г основной и расширенной мат- риц меньше числа п неизвестных, то система (1) имеет более одного решения и равносильна системе вида , Ъц = + • • • + Т«,л-Л/„_г + 7'> ....................;.................... (3) Ч — + • • + п- Ajn_r + где (t’i, ..., ir, jt, ..., jn_r) — подходящая перестановка чисел 1, 2.....п. Иначе говоря, в последнем случае среди неизвестных можно выбрать такие п — г неизвестных Вд, ..., Ь/ , называе- мых свободными, придавая которым произвольные значения из К, можно для остальных неизвестных найти уже единственные зна- чения, удовлетворяющие системе (1). Необходимость условий вытекает из утверждения В). Поэтому пусть ранги матриц А, В совпадают и равны г. Матрица А.
S 5] КООРДИНАТЫ 95 содержит всего п столбцов, и потому г^п. По условию матрица А обладает обратимым минором М порядка г (см. п. 5.2), при- надлежащим каким-то Л]-й, ..., Лг-й строкам и Л-му, ..., 1>му столбцам матрицы А. Отсюда следует, что ^i-я, ..., Лг-я строки матрицы В линейно независимы и что все остальные ее строки являются линейными комбинациями указанных строк. Поэтому, оставляя лишь Лге....kr-e уравнения системы (1) и вычерки- вая остальные уравнения, мы получим сокращенную систему, имеющую те же решения, что и система (1). Оставляя теперь в каждом уравнении сокращенной системы слева члены, содер- жащие неизвестные Ц, и перенося вправо остальные члены, мы приведем сокращенную систему к виду М- (4) где Cs ••• ^S’in-r^n-r По условию минор M является обратимой матрицей. Умножая обе части равенства (4) слева на М^1, получим = М~1 Выполняя здесь в правой части умножение, придем к системе вида (3). Теорема доказана. Систему уравнений (1) иногда называют определенной, неопре- деленной, противоречивой, если она имеет соответственно единст- венное решение, более одного решения, не имеет решений. Заме- тим, что согласно этой терминологии система, не являющаяся определенной, либо неопределенная, либо противоречивая. Следствие 1. Если число уравнений в системе (1) меньше числа неизвестных, то система (1) либо неопределенная, либо противоречивая. Следствие 2. Система п линейных уравнений с п неизвест- ными тогда и только тогда определенная, когда основная матрица этой системы обратима. Оба эти следствия непосредственно вытекают из теоремы Кронекера — Капелли. Мы рассмотрели систему линейных уравнений (1), в которой коэффициенты стоят слева от неизвестных. Что можно сказать
96 ЛИНЕЙНЫЕ ПРОСТРАНСТВА [Гл. П о системе уравнений • • • Н- ^ла«1 =?1> *.......................................... (5) 51я! т ~ ~Г * * * 'Т~ '-п?п>п — у . которой коэффициенты стоят справа от неизвестных? Эту систему можно записать в матричном виде: Ой, U где Л = 1] а,-у Ц — матрица коэффициентов при неизвестных системы (5). Обратим внимание, что в матрице А коэффициенты z'-ro урав- нения образуют i-й столбец, а не i-ю строку, как было раньше. Все рассуждения, приведенные нами при доказательстве теоремы Кронекера — Капелли, сохраняют свою силу и для системы (5), если в них слова «столбец» и «строка» поменять местами, а под расширенной матрицей системы (5) понимать матрицу "Ян aim~ <*п1 • • • -Pi ... Таким образом, для совместности системы (5) необходимо и достаточно, чтобы ранг матрицы В совпадал с рангом матрицы А. Если ранги матриц А, В совпадают и равны числу неизвестных, то система (5) имеет единственное решение. Если ранги А, В совпадают и равны числу г, меньшему числа п неизвестных, то среди неизвестных найдутся п — г свободных неизвестных , ... ..., , через которые остальные неизвестные будут выражаться формулами вида —(s—1, г)- Ясно, что если рассматриваются линейные уравнения над полем, то различие между системами (1) и (5) исчезает. Для некоммутативных тел /С (например, для кватернионов (см. п. 1.5)) наряду со стандартными системами вида (1), (5) иногда рассмат- ривают и уравнения «смешанного» вида, например уравнение а; — £а = 0. Однако вопросы о разрешимости таких уравнений имеют специфический характер и выходят за рамки собственно линейной алгебры.
ДОПОЛНЕНИЯ И ПРИМЕРЫ 97 Дополнения и примеры 1. В пространстве строк длины 3 над полем рациональных чисел берется координатная система, состоящая из строк [1, 3, 5], [6, 3, 2], [3, 1, 0]. Каковы в этой системе координатные строки векторов [3, 7, 1], [0, 0, 1], [2, 3, 5], [1, 1, И? 2. Пространство V образовано многочленами от X степени не выше п. Показать, что многочлены 1, X — 1, (X—I)2, ..., (X — 1)л образуют базу пространства V. Найти в этой базе координатные строки многочленов 2 — 3X4- X2, Х«. 3. На плоскости берется координатная система, состоящая из двух взаимно перпендикулярных векторов длины 1, и после этого совершается преобразование координат с матрицей Каким условиям должны удов- летворять числа а, р, у, 8, чтобы новые координатные векторы были взаимно перпендикулярны и имели длину 4. Найти ранги матриц 1? “14-Х 1 11 1 ~ 1 14-Х 1 1 1 1 1 1 14-Х 1 1 1 1 1 . 1 4- Х_ 5. Показать, что в теле кватернионов К (п. 1-4) система «правых» линейных уравнений имеет единственное решение, а система «левых» уравнений 4- — 1» ^k-^ = i решений не имеет. Это дает пример обратимой матрицы над телом, у кото- рой транспонированная матрица необратима. 6. До сих пор под линейной независимостью строк мы понимали линей- ную независимость относительно умножения строк слева на элементы тела АГ, а линейную независимость столбцов понимали как независимость относительно умножения столбцов на -элементы тела справа. Это связано с исходным правилом умножения матриц: строки первой множить на столбцы второй. Конечно, вся теория останется неизменной, если матрицы умножать по «левому» правилу: столбцы первой множить на строки второй. Но тогда надо будет рассматривать линейную зависимость строк относительно умноже- ния на элементы АГ справа, а линейную Зависимость столбцов относительно умножения на элементы АГ слева. В результате получатся ранги матрицы по строкам справа и по столбцам слева. Оба эти ранга будут совпадать 4 А. И. Мальцев
98 ЛИНЕЙНЫЕ ПРОСТРАНСТВА [Гл. п друг с другом, но в общем случае будут отличны от обычных рангов по строкам (слева) и по столбцам (справа). Примером может служить кватернионная матрица Г1 Л [й —1] из упражнения 5, у которой левый ранг по строкам равен 2, а правый ранг по строкам равен 1. 7. Пусть А — обратимая квадратная матрица порядка п, В и С — произ- вольные матрицы, имеющие соответственно п строк и п столбцов. Тогда ранг (АВ) — ранг В, ранг (С А) = ранг С. 8. Привести пример квадратных матриц А, В одного и того же порядка 2, для которых ранг (АВ) ранг (ВА). 9. Показать, что для любых квадратных матриц А, В порядка п ранг (АВ) > ранг А -|- ранг В — п. § 6. Линейные подпространства 6.1. Пересечение и сумма подпространств. Непустая совокуп- ность 21 векторов какого-нибудь линейного пространства 8 назы- вается линейным подпространством этого пространства, если выполняются следующие два условия: 1° если Ш содержит какой-нибудь вектор а, то 21 содержит и все кратные ~ка, где X— число из тела коэффициентов-, 2° если 21 содержит какие-нибудь векторы а, Ь, то 'Л содержит и их сумму а--Ь. Ясно, что эти два условия равносильны следующему одному: если Л содержит какие-нибудь векторы а, Ь, то Л содержит и любую их линейную комбинацию Ха-|-[л(>. Из этих определений вытекает, что каждое линейное под- пространство Л содержит нулевой вектор и вместе с любыми своими векторами содержит и все их линейные комбинации. В п. 4.3 было отмечено, что каждое линейное пространство над телом К—это некоторая алгебра, основными операциями в которой являются сложение векторов, обращение векторов и умножение векторов (слева) на элементы из К- Так как обращение вектора равносильно умножению его на элемент —1 из Л", то условия 1°, 2° означают, что линейные подпростран- ства пространства Ч — это просто подалгебры алгебры Ч. Совокупность, состоящая только из нулевого вектора, обладает свойствами 1°, 2° и, следовательно, является линейным подпро- странством в 8. Это подпространство называется нулевым. С дру- гой стороны, само пространство 8 можно также рассматривать как свое собственное линейное подпространство. Нулевое под- пространство и 8 иногда называются тривиальными подпростран- ствами пространства 8. Все остальные подпространства называются нетривиальными или истинными.
§ 6] ЛИНЕЙНЫЕ ПОДПРОСТРАНСТВА 99 Простейший способ построения линейных подпространств состоит в следующем. Берем в заданном линейном пространстве £ произвольные векторы ai, аг, ...,ат и рассматриваем все их линейные комбинации а1Я1 “1“ ЩР-} -f- . .. Лтят. Обозначим совокупность этих комбинаций через 31. Так как сумма линейных комбинаций от ат и произведение линей- ной комбинации на число снова являются линейными комбина- циями от at,..., ат, то 31 — линейное подпространство. Векторы Ci,..., ат являются образующими этого подпространства. Выбра- сывая из них те, которые линейно зависят от предыдущих, мы получим линейно независимую систему образующих подпростран- ства 81, т. е. базу в 31*. Но число векторов базы есть размерность пространства, поэтому размерность подпространства 31 равна максимальному числу линейно независимых векторов, содержащихся в системе ai,..., ат. Иногда говорят, что подпространство 3( есть подпространство, натянутое на векторы аь ..., ат. Следовательно, размерность подпространства, натянутого на систему векторов й1,...,«т, равна максимальному числу линейно независимых векторов, содержащихся в этой системе. Способ натягивания подпространств на заданную систему векторов является вполне общим: всякое линейное подпростран- ство 31 линейного пространства 2 является подпространством, натянутым на свою базу. Поскольку число линейно независимых векторов в 2 не может быть больше размерности 2, то отсюда видно, что размерность линейного подпространства не может превосходить размерности объемлющего пространства. Более того, если размерность линей- ного пространства 2 равна размерности его подпространства 31, то база для 31 будет базой и для 2. Поэтому всякий вектор из 2 будет выражаться линейно через базу подпространства 31, таким образом, 31 совпадает с 2. Следовательно, размерность истинного линейного подпространства меньше размерности объемлющего пространства. В качестве примера рассмотрим обыкновенное пространство Э1, образованное направленными отрезками, выходящими из некото- рой точки О. Размерность пространства 31 равна трем, поэтому истинные подпространства могут иметь размерность 1 или 2. Подпространства размерности 1 должны натягиваться на какой- либо один ненулевой вектор а, т. е. должны быть совокуп- ностью кратных <ад отрезка а. Но все отрезки вида аа лежат на прямой, содержащей вектор а. Таким образом, одномерные подпространства 31 являются прямыми, проходящими через точку О. 4» •
100 ЛИНЕЙНЫЕ ПРОСТРАНСТВА [Гл. II Двумерные подпространства должны натягиваться на два линейно независимых вектора, т. е. на два вектора а, Ь, не лежащих на одной прямой. Пусть 31 — плоскость, проходящая через векторы а, Ь. Тогда все линейные комбинации аа-|-р& будут лежать в плоскости 81 и, с другой стороны, всякий вектор, лежащий в 91, будет линейной комбинацией векторов а, Ь. Следовательно, подпространство, натянутое на векторы а, Ь, будет совокупностью векторов, лежащих в плоскости 21. Итак, двумерными подпространствами пространства -11 являются плос- кости, проходящие через точку О. Пространства размерности, большей трех, не имеют столь наглядного геометрического истолкования. Однако геометрическую терминологию применяют и для них, называя одномерные линей- ные подпространства прямыми, двумерные — плоскостями, &-мер- ные при соответственно —/г-лиут/лш плоскостями. Линей- ные подпространства, размерность которых на 1 меньше размер- ности пространства, носят специальное название гиперплоскостей. Над подпространствами заданного линейного пространства можно производить некоторые операции, важнейшими из которых являются сложение и пересечение. Пересечением подпространств §1“53,... пространства S называется совокупность ф. векторов, входящих одновременно во все эти пространства. Операция пересечения обозначается знаком |~|, так что Ф = «П® П-- Пересечение любого числа линейных подпространств простран- ства % есть линейное подпространство этого пространства. В самом деле, нулевой вектор содержится в каждом из задан- ных подпространств 31, S3, -, - Поэтому он содержится и в их пересечении ф, которое является, таким образом, непустым множеством. С другой стороны, если какие-нибудь векторы а, b входят в пересечение ф, то они, а вместе с ними и любая их линейная комбинация входят в каждое из подпространств 81, 53,... Следовательно, аа-|~₽^ содержится в ф и ф — линейное подпространство. Суммой конечного числа линейных подпространств 8G, 312,..., 3ls пространства 8 называется совокупность векторов, представимых в виде а = <21 Ц-2 as, (1) где а,- — какой-нибудь вектор из 81,- (I = 1,..., s). Операция сложе- ния подпространств обозначается знаком Сумма конечного числа линейных подпространств простран- ства 8 является снова линейным подпространством, которое
§ 61 ЛИНЕЙНЫЕ ПОДПРОСТРАНСТВА 101 содержит все векторы заданных подпространств, а также всевоз- можные их линейные комбинации.' В самом деле, пусть заданы линейные, подпространства 2fi,...,2(s и пусть 21 = 8(1+ 31s- Если а, Ь — какие-либо векторы из 2С, то это значит, что их можно представить в форме а = ai -j- ai -j- • • ~i~ b = bi -|- b-i bs, где a,, bi принадлежат 2(г (i = l,..., s). Но тогда при любых a, p из К a.a 4- fib = (i-Ui -j- p&i) 4- (atZ-2 -j- fib,) .. - 4~ (aas 4“ P^s) есть разложение вектора ча -|- fib типа (1), так как aat-4“P^« входит в ?(,-. Следовательно, аа-1- fib входит в 21 и 2(— линейное подпространство. Полагая теперь в (1) а7 —о для / I, мы видим, что а, будет содержаться в 2(, т. е. 21 содержит все векторы из 2(;. Отметим, наконец, без доказательства следующие свойства суммы подпространств, непосредственно вытекающие из ее опреде- ления: ' 1° 2(4-23 = ® + 3(; 2° 21 И- ('В + 6) = (214- 23) + 6; 3° если 2( содержится в подпространстве 33, то 2(4-23 = 23. Рассматривая сумму двух произвольных линейных подпро- странств 21, 23, мы легко заметим, что ее размерность зависит не только от размерностей подпространств 2( и 23, но и от того, как велика их общая часть. Точное значение размерности суммы дается следующей теоремой. Теорема. Размерность суммы двух линейных подпространств пространства 2 равна сумме размерностей этих подпространств минус размерность их пересечения. Пусть 21 и 23 — заданные подпространства, п и г.2 — соответ» ственно их размерности. Обозначим размерность пересечения (Е этих подпространств через т. Выберем в 6 какую-либо базу Ci, Съ,..., ст. Векторы Ci, с2,..., ст линейно независимы и лежат в 2(. Поэтому в 2( можно найти такие векторы щ, а^,..., ak, что система as, а2,..., ak, Ci,..., ст будет базой в 2( (см. п. 4.2). По той же причине в подпространстве 23 найдутся векторы bi, bi,..., bp, которые вместе с векторами Ci, с.,,..., ст дадут базу для 23. Поскольку число векторов базы совпадает с размерностью пространства, то между числами k, р и размерностями подпро- странств 21, 23 существуют соотношения ri = k-\-m, гч=р-\-т. Если мы докажем, что система аи...,ак, ci,...,cm, bi,...,bp (2)
102 ЛИНЕЙНЫЕ ПРОСТРАНСТВА [Гл. II является базой пространства 21 + ©, то теорема 1 будет доказана, так как тогда размерность пространства 21 23 будет равна k т р = Гг -4- л2 — т. Всякий вектор а из 21 выражается линейно через систему ak, ст, являющуюся базой для 21, и тем более выра- жается через систему (2). Аналогично всякий вектор b из У также выражается линейно через (2). Но тогда и сумма а-\-Ь, т. е. любой вектор из 214- 23, будет линейно выражаться через (2). Нам остается показать, что система (2) линейно независима. Пусть aifli V-kak ЪС1 “Ь • • • "F 4^1 "'-••• “Г ?р^р — 0 (3) — какое-нибудь линейное соотношение между этими векторами. Положим b — Pj&j -j~... -\-fipbp. Вектор b выражается линейно через векторы bj,..., bp, содержа- щиеся в пространстве 23, поэтому b содержится в 23. С другой стороны, из (3) вытекает, что b = — ^ai — ... — nkak — Т1С! — ... — ^тст. (4) Поскольку ai,..., ак, Ci,..., ст содержатся в 21, то отсюда следует, что b также содержится в 21. Следовательно, b входит в пересече- ние пространств 21, 23, и, значит, в выражении (4) вектора b через базу 21 отсутствуют члены с alt..., ак, т. е. aj = а., —... = 7.а = 0. Подставляя эти значения в (3), мы получим “Йс1 “Г '[тСт + filbl -(-••• “F fipkp = °- Но система о,..., ст, bi,..., bp является базой для 23 и, следо- вательно, линейно независима, поэтому Т1 = • • • = Тт = = • • = Рр = 0. Линейная независимость системы (2) доказана. Из доказанной теоремы можно вывести неравенство, дающее наименьшее значение размерности пересечения подпространств. Рассмотрим какие-либо линейные подпространства 21, 23 из й и обозначим через и, г2 размерности этих подпространств, через п — размерность g, через т — размерность пересечения 21 [~| 23. На основании теоремы размерность суммы 21 23 равна гч — т. Однако размерность суммы 21 -j- 23 не может быть больше размер- ности пространства 8. Следовательно, ri-\-rt — m^n, откуда Итак, размерность пересечения двух линейных
§ 6] линейные подпространства 103 подпространств пространства 2 не может быть меньше избытка суммы размерностей этих подпространств над размерностью пространства 2. Например, пересечение двух плоскостей в трехмерном про- странстве всегда содержит прямую, пересечение двумерного и трехмерного подпространств четырехмерного пространства содер- жит прямую, пересечение двух трехмерных подпространств в четырехмерном пространстве содержит плоскость и т. д. 6.2. Прямые суммы. Согласно определению всякий вектор а, принадлежащий сумме линейных подпространств 2( = 3(1 + ?I3 + ... + !Ms> может быть представлен в виде а = щ -|— Я-j -j-... -j- as (fli £ 2Г(-, i = 1,..., s). (1) Однако это представление, вообще говоря, не будет однозначным. Если каждый вектор а из 31 допускает только одно представле- ние вида (1), т. е. если из равенств (1) и a=di-\-a.2-\-...-\-ds i = l,...,s) (2) следует, что а, = а\,..., as = ds, то сумма называется прямой суммой и обозначается 21 = 2(1 31а -j- 2( s. Прямые суммы обладают многочисленными специальными свой- ствами, некоторые из которых мы теперь рассмотрим. Прежде всего, требование однозначной разложимости любого вектора суммы можно в определении прямой суммы заменить более слабым требованием однозначной разложимости только нулевого вектора: если нулевой вектор суммы 21 — 2G % + • • • -j- 2IS допускает только одно разложение вида (1), т. е. если из а2 а> —j—... —j— а$ — о (а^ £ 21;, i — 1,..., s) следует, что а\=а.г = . .. = as = o, то сумма является прямой. Для доказательства рассмотрим какой-нибудь вектор суммы а и допустим, что он имеет два разложения: (1) и (2). Вычитая из одного разложения другое, получим (щ — ai) -j- (а2 — а2) (as — as) = о. Так как здесь (<зг—-оДС 21,-, 1=1. 2.....s, то согласно предпо- ложению щ — а\ = аг — а2 =... = as — ds = o, или ai=al, Oi = d2,..., as = a's. Утверждение доказано.
104 ЛИНЕЙНЫЕ ПРОСТРАНСТВА [Гл. п Следующая теорема относится к употреблению в прямых суммах скобок. Теорема 1. Если разложения линейных подпространств 21 = 2G 2G = 2IS1 + 8ls +. Ч~ 2112 -j- 4“ Ч- • • + 2ls, • • + 2limi, •• • 4-^sms> (3) (4) прямые, то разложение 21 = 2(ц 2112 Ч- •• • Ч~ + + 2-L.. . + 2(sms (5) также прямое; иными словами, если в прямой сумме каждое слагаемое заменить его прямым разложением, то получится снова прямое разложение. Обратно, если разложение (5) прямое, то разложения (4) и (3) также прямые. Докажем сначала первое утверждение.-Пусть ан Ок • • • _г aimi Ч~ • • Ч- asi -j- aSi -j-... -j- asms — o. Перепишем это равенство в виде Ui а-2 -4-... as = о, (6) где а^ — Ц- ац ... Ц- aimi (i = 1, 2,..., s). (7) Так как а,- С 21,•, а сумма (3) прямая, то из (6) следует, что ai = ai — ... = as — o и равенство (7) переходит в ан аи-|-... Ц-aimi = о (t = l, 2......s). (8) Но. разложение 2{/ = Ш;1 + Э1г.2+ ... по условию также прямое, поэтому из (8) следует, чтоа,1 = а/г = = ... —aim. — o. Таким образом, сумма (5) прямая, что и требо- валось. Повторяя рассуждения в обратном порядке, получим доказательство обратного утверждения. Теорема 1 позволяет рассматривать прямую сумму нескольких подпространств как результат последовательных прямых сумм двух слагаемых. Условия, при которых сумма двух подпространств будет прямой, можно представить в следующей удобной форме. Теорема 2. Для того чтобы сумма двух линейных подпро- странств пространства 2 была прямой, необходимо и достаточно, чтобы пересечение этих подпространств было нулевым. В самом деле' если пересечение двух подпространств и S3 содержит ненулевой вектор а, то.для о можно написать разло- жение ' а |-(—«) = о,
$ 61 ЛИНЕЙНЫЕ подпространства 105 где а Фо, «(Я, — а С 53, и, следовательно, сумма 31-j-® пря- мой не будет. Обратно, если сумма 31 ® не прямая, то для нулерого вектора должно найтись разложение а -\-Ь — о (аф о, а С 31, b £ 23). Так как Ь = — а, то b входит и в подпространство 31. Следова- тельно, в этом случае пересечение 31 |~| 23 содержит ненулевой вектор Ь, что и требовалось. Теорема 3. Размерность прямой суммы подпространств равна сумме размерностей этих подпространств. Если слагаемых два, то согласно п. 6.1 размерность суммы равна сумме размерностей слагаемых минус размерность пересе- чения. Но по теореме 2 пересечение подпространств в случае прямой суммы является нулевым и его размерность равна нулю. Поэтому размерность прямой суммы двух подпространств равна сумме их размерностей. Если слагаемых больше чем два, то дока- зательство легко проводится полной индукцией. Из теоремы 3 вытекает такое следствие: если подпростран- ство 31 есть прямая сумма подпространств 3G,..., 31s, то, выбирая в каждом подпространстве 9I-, базу а,:1, а^,..., aim. (i = Г, 2....s) и объединяя эти базы в одну систему в-u, в-12, • • , О1пц, • • •, osi, as2, ..., а$т$, (9) мы получим базу подпространства 31. Действительно, каждый вектор подпространства 31, выражается линейно через векторы (9), поэтому и любой вектор из ?! будет выражаться линейно через векторы (9). Число векторов системы (9) равно на основании теоремы 3 размерности подпространства 31. Поэтому система (9) является базой для 31, что и требовалось. Теорема 3 допускает обращение: если размерность суммы линей- ных подпространств равна сумме их- размерностей, то сумма прямая. Пусть сначала 31 = 311 —Э12 и разм. 31 = разм. 3G Д- разм. 312. В силу теоремы п. 6.1 отсюда следует, что размерность пересе- чения 311 П ^2 равна нулю, и, следовательно, это пересечение является нулевым. Согласно теореме 2 отсюда в свою очередь следует, что сумма 3li-)-?U прямая. Если число слагаемых больше ДЬух, то для доказательства достаточно применить индукцию. 6.3. Системы однородных линейных уравнений. В качестве иллюстрации к теории линейных подпространств рассмотрим задачу о решении систем линейных однородных уравнений, т. е. систем
106 ЛИНЕЙНЫЕ ПРОСТРАНСТВА [Гл. II вида 51а11 ~j- ?-2а21 4“ . • • “h ’n7n1 = 0, ............................ (1) £lalm Д" • • • Ч— ^~гУ-пт — 0, где агу — заданные элементы какого-то тела К, a Ej ... , <п— неиз* вестные, значения которых ищутся в теле К- Систему (1) можно переписать в следующей матричной форме: х-А = О, (2) где x = [Ei,Е„]— строка неизвестных, а А = ||а;у|| — матрица, у которой /-Й столбец образован коэффициентами /-го уравнения системы (1). Нулевая строка [0, 0] является решением систе- мы (1) при любых коэффициентах агу. Эта строка называется нуле- вым или тривиальным решением системы (1). Существование три- виального решения показывает, что система однородных линейных уравнений всегда непротиворечива. Для более подробного изучения свойств решений системы (1) обозначим через 2 пространство строк длины п над телом К и каждое решение [SJ, , Е«] системы (1) будем рассматривать как вектор х пространства 2, удовлетворяющий уравнению (2). Сово- купность всех решений уравнения (2) является линейным подпро- странством пространства 2. Действительно, из (2) и у-А —О следует (Хх Д- р.//) А = X (хЛ) р (уА) = О А для любых X, р С К- Иначе говоря, произвольная линейная ком- бинация решений системы (1) является снова решением системы (1). Поскольку пространство 2 имеет размерность п, то размерность пространства решений Системы (1) имеет размерность не выше п. Говорят, что какие-то решения xt, ... , xs системы (2) образуют фундаментальную систему решений для (2), если любое решение системы (2) можно представить в виде линейной комбинации указанных решений X]Xi 4- ... Xsxs и в то же время никакое из решений Xi.....xs нельзя представить в виде линейной комби- нации остальных. На языке теории линейных пространств это означает, что совокупность хг, ... , xs является просто базой под- пространства решений, а число фундаментальных решений — это размерность подпространства решений. Рангом однородной системы (1) называется ранг матрицы А. Однородные системы вида (1) являются частным видом общих систем линейных уравнений, уже изученных в-п. 5.3. С помощью - доказанной там теоремы Кронекера — Капелли легко получается основная
$6] ЛИНЕЙНЫЕ ПОДПРОСТРАНСТВА 107 Теорема об однородных линейных уравнениях. Размерность пространства решений системы (1) однородных линей- ных уравнений с п неизвестными равна разности п — г, где г — ранг системы (1). Если г = п, то по теореме Кронекера—Капелли система (1) должна иметь единственное решение, являющееся, следовательно, просто нулевым решением. Подпространство решений состоит из одного нулевого вектора, и его размерность 0 совпадает с раз- мерностью п — г. Пусть г<^п. Согласно теореме Кронекера—Капелли система (1) в этом случае (после подходящей перенумерации неизвестных и уравнений) будет равносильна системе вида £1 = 5г+11г+1, 1 Ч- • • • “h > (3) == г “К • • • “I- *=л7лг> где — подходящие элементы из К. Неизвестным Br+i, ..., В„ здесь можно придавать произвольные значения из /С. Полагая последовательно Вг+ь М = о,..., 0], В,+1, вг+2,..., вл] = [0, 1,.... 0], Вл+ь вг+3,..., М = о,..., 1] и вычисляя каждый раз по формулам (3) значения неизвестных Bj, ... , Вг, находим следующую систему решений для (1): ci = [v+i, 1, ••• , 7r+i.r, !> 0.0], С2 = [Тг+2.1> ••• > w.r, 0, 1, ... , 0], Сп—г == ["[лЬ • • • , 0, • • • , 1 ]• Мы знаем, что число линейно независимых строк в системе Cj, ... ... , сп_г совпадает с рангом матрицы, составленной из этих строк. Но из (4) видно, что указанная матрица содержит минор, обра- зованный последними п — г столбцами, являющийся единичной матрицей. Поэтому ранг матрицы равен п — г, и, следовательно, все векторы clt ..., спг линейно независимы. С другой стороны, формулы (3) показывают, что любое решение х — [В?,... , Вл] удов- летворяет соотношению х = В° _}- jCi —... -]- ВдС„ _ г, т. е. является линейной комбинацией решений й,..., сп_г. Тем самым мы убедились, что система с1г ... , сп_г является б^юй про- странства решений системы (1) и потому размерность этого про- странства равна п — г.
108 ЛИНЕЙНЫЕ ПРОСТРАНСТВА (Гл. II Отметим два непосредственных следствия доказанной теоремы. Следствие 1. Для того чтобы система п однородных линей- ных уравнений с п неизвестными £iai 1Ч- • • Ч- —- о, £)^л! Ч~ • • Ч~ ^Л^ЛЛ-'д с коэффициентами из какого-нибудь тела Д не имела ненулевых решений, необходимо и достаточно, чтобы матрица этой системы ап ... ал1 А = — а1л • • алл„ была обратимой. Действительно, условие п = г означает, что ранг матрицы А должен совпадать с ее порядком, т. е. матрица А должна быть обратимой. Следствие 2. Для того чтобы система п линейных одно- родных уравнений с п неизвестными с коэффициентами из неко- торого поля имела ненулевое решение, необходимо и достаточно, чтобы определитель матрицы этой системы был равен нулю. В самом деле, квадратная матрица с элементами из поля тогда и только тогда необратима, когда ее определитель равен нулю. Мы видели, что теорема об однородных линейных уравнениях является прямым следствием теоремы Кронекера—Капелли. По- следняя теорема справедлива не только для линейных систем с правыми коэффициентами, но и для линейных систем с левыми коэффициентами. Поэтому наряду с теоремой об однородных линей- ных уравнениях и следствием 1 справедливы аналогичные утверж- дения и о системах однородных линейных уравнений с левыми коэффициентами, а именно: совокупность решений-столбцов х = = [£J,...., системы однородных линейных уравнений <Хц$1 Ч- ••• Ч~а1л^л-0, (5) ат1^1 Ч- • • • Ч~ атп^п — 0 с коэффициентами из некоторого тела Д является линейным под- пространством пространства всех столбцов длины п над Д. Раз- мерносчвь этого пространства решений равна п — г, где г — ранг матрицы Л = ||аг/||, у которой г-я строка образована коэффи- циентами t-го уравнения системы (5).
ПРИМЕРЫ И ЗАДАЧИ 109 Примеры и задачи 1. Найти размерность линейного подпространства, натянутого на векторы о = |1, 3, 2, 1], Z> = [4, 9, 5, 4], с = [3, 7, 4, 3]. 2. Если elt ег, ... , еп — база линейного пространства 1', а 91/—линейное подпространство, натянутое на е,, то £ = 311+912+ ... -И,. 3. Для каждого истинного подпространства 91 пространства £' существует такое линейное подпространство ®, что £* = 91 4~®- 4; Доказать следующее обобщение теоремы 2 п. 6.2: для того чтобы сумма нескольких заданных,линейных подпространств была прямой, необхо- димо и достаточно, чтобы каждое из заданных подпространств имело нуле- вое пересечение с суммой всех остальных. 5. Показать, что пересечение всех линейных подпространств простран- ства £, содержащих заданные линейные подпространства, равно сумме последних. 6. Доказать, что для любых подпространств SI, ®, G линейного простран- ства имеют место равенства 91 (91® + ®) = 91® + 91®, (91 + ®) (91 + 6) = 91 + (91 + ®) 6, где для краткости пересечение подпространств обозначено как произведение. 7. Всякое линейное пространство V бесконечной размерности содержит истинное линейное подпространство, размерность которого совпадает с раз- мерностью всего пространства V. 8. Для каких значений X (из поля комплексных чисел) система уравнений х + 2Ху— \z — у, 2х + у — z — \х, л4 Ху----- 2 = 0 имеет ненулевбе решение? Для каких значений X пространство решений этой системы имеет наивысшую размерность? 9. Для каких значений параметра X система уравнений х4- у-|-(Х — 2)г = 1, Хх Зу '/-г = 2 совместна? 10. Каковы размерности пространств решений систем х — iy + iz = 0 1 х — yi 4- zi =0 jx 4- ky — 2 = 0 >, xj 4- У& — г =0 x— iy-f-(2i—j)z — O) x —yi -pz(2i—y') = 0 рассматриваемых над телом кватернионов (п. 1.5)? 11. Существует ли многочлен от кватернионных переменных а, Ь, с, d с кватернионными коэффициентами, обращение которого в нуль являлось бы необходимым и достаточным условием для существования ненулевого реше- ния у системы линейных уравнений ах 4- by = 0, сх 4- dy = О? 12. Существует ли многочлен от а, а, Ь, Ь, с, с, d, d, удовлетворяющий требованиям предыдущего упражнения? >
Глава III ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ Основной целью настоящей главы является изучение свойств преобразований линейных пространств. В §§ 8, 10 и в пп. 9.1, 11.1, 11.2 никаких ограничений на основное тело не накладывается. В пп. 9.2, 9.3, 11.3, 11.4 и в § 12 предполагается, что основное тело является полем. Во вводном § 7 устанавливается ряд понятий и свойств, относящихся к преобразованиям совершенно произ- вольных множеств. § 7. Преобразования произвольных множеств 7.1. Произведение преобразований. Рассмотрим произвольное множество объектов ЭЛ. Это множество может состоять как из конечного, так и из бесконечного числа, элементов. Преобразова- нием множества ЭЛ называется такой закон, который позволяет, зная какой-либо элемент множества ЭЛ, нахо- жу 2 дить снова некоторый элемент из ЭЛ. Мы ус- ловимся обозначать преобразования буквами , ей?, ...Если т — элемент из ЭЛ, то через тЛ будет обозначаться тот элемент множе- ./ ства который получается из элемента т i посредством преобразования еЛ. Элемент т-Л называется образом элемента т при преоб- ------д-----разовании erf, а т называется прообразом элемента . Рассмотрим в качестве примера совокуп- Рис. 2. ность всех точек плоскости и обозначим через U преобразование, заключающееся в повороте точек этой плоскости на 90° около некоторой ее точки О против часовой стрелки (рис. 2). Пользуясь рисунком, мы видим, что a7l = b, clt = d. Аналогично, если & означает сдвиг точек на 1 параллельно оси Оа, то а^— с, b^=f.
§ 7] ПРЕОБРАЗОВАНИЯ ПРОИЗВОЛЬНЫХ МНОЖЕСТВ 1 11 Два преобразования е/?, <33 множества 3)1 называются равными, если для каждого элемента т из 9Л тет? = т<ёЗ. Одним из основных понятий теории преобразований является понятие произведения преобразований, которое вводится следую- щим образом. Пусть даны преобразования &?, <31 множества 9)1. Первое из них переводит произвольный элемент т множества 9)1 в . Если к новому элементу применить преобразование то получится элемент (те/?) 33. Преобразование, переводящее т непосредственно в (тет/) <&', называется произведением е/? на 33 и обозначается о/? 33. Таким образом, по определению т (&333) = (те/?) 33. Если к элементу т сначала применить преобразование s®, а затем е/?, то получится элемент (та®) е/?, который может не совпасть с (тет^)<Ж Действительно, в разобранном выше примере с плоскостью имеем a (U&) = (all) & = Ьёё = f, а (&U) = (аё?) U = cll = d, следовательно, ИёЗ ф ^Ц. Таким образом, произведение преобра- зований вообще зависит от порядка сомножителей. Мы видим, что один из основных законов, которым подчиняется произведение чисел, теряется для преобразований. Однако другой основной закон — ассоциативность умножения — для преобразований сохра- няется. В самом деле, пусть е/?, 33, ё— произвольные преобра- зования множества ЭЛ, т — один из его элементов. Согласно опре- делению имеем т ((е/?33) ё) =. (т (е/?33)) ё = ((те/?) 33) т (ее? (ЗЗ'ё)) (т&?) (33?ё) = ((те/?) 33) ё, откуда (ет^Ге®) ё = е/? (ЗЗё). Пользуясь этим законом, легко вывести, что произведение любого конечного числа преобразований, записанных в определенном порядке, не зависит от способа расстановки скобок. Так, например, (о/? 33) (ё?3) = ([о/? 33) ё) ё?> = (о/? (ЗЗё?)) 33 = е/? ((33?ё) ёЗ). Поэтому в произведениях, содержащих несколько сомножителей, можно опускать скобки и говорить просто о произведении двух, трех и большего числа преобразований. Произведение п множи- телей, равных в/?, называется n-й степенью преобразования о/?
112 ЛИНЕЙНЫЕ .ПРЕОБРАЗОВАНИЯ [Гл. Ш и обозначается &Зп. Действия со степенями подчиняются обычным правилам е^те^л = е^т+я, (1) (2) доказательство которые очевидно. Если произведение двух преобразований <эЛ, 33 не зависит от порядка сомножителей, то , эй1 называются перестановоч- ными или коммутирующими. Формула (1) показывает, что сте- пени одного и того же преобразования перестановочны между собой. Если преобразования е^, е® перестановочны, то и вообще (е^ЗЗу^^ЗЗ*. (3) Если же <з^ и е® не перестановочны, то формула (3) может ока- заться неверной. 7.2. Единичное и обратное преобразования. Среди всех пре- образований множества особое место занимает преобразование, ставящее в соответствие каждому элементу т этого множества тот же самый элемент т. Это преобразование носит название единичного или тождественного и будет нами обозначаться через g. Таким образом, для любого т т$ — т. Пусть оЛ — произвольное преобразование множества ЭЛ. Так как т (feed) = (mg) od -= m@d, т g) = (/W) g = ma^, то ge/f? = e^g = od . Если для преобразования ed можно найти такое преобразо- вание а®, что 'id'3'З = 33ed = g, (4) то 33 называется обратным по отношению к ed, а само ed назы- вается обратимым. Легко видеть, что каждое обратимое преоб- разование имеет только одно обратное. Действительно, если ed имеет два обратных преобразования 33, то, умножая соотно- шение ed3 <= g слева на 33 и пользуясь равенствами (4) и ассоциативностью умножения преобразований, получим gg’ = ^@g, или 43 = 33.
§ 7] ПРЕОБРАЗОВАНИЯ ПРОИЗВОЛЬНЫХ МНОЖЕСТВ 1 1 3 Преобразование, обратное по отношению к обозна- чается Соотношения (4) симметричны относительно , е®; поэтому, если ДЗ обратно по отношению к а^, то е// обратно по отношению к а®, т. е. = (5) Положим по определению = = (п = 1, 2, 3, ...). Из (4), (5) легко следует, что формулы (1), (2) годны не только для целых положительных показателей, но и для всех целых показателей. В частности, (а®1) ' = (а^“1)’г = Далее, соотношение д^ДЗ е®-1©.®'-1 = g показывает, что 7.3. Взаимно однозначные преобразования. Не всякое преоб- разование обратимо. Следующая теорема указывает наглядный признак обратимых преобразований. Т еор ем а. Для того чтобы преобразование множества ЭЭ1 было обратимым, необходимо и достаточно, чтобы было взаимно однозначным отображением множества ЭЛ на себя, т. е. чтобы каждый элемент из ЭЛ имел в ЭЛ прообраз и чтобы различные элементы из ЭЛ переводились преобразованием о/£ в различные элементы. Докажем сначала необходимость. Пусть &3? имеет обратное преобразование а®, так что = ДЗо^ = g. Возьмем в ЭЛ произвольный элемент т, и пусть тЗЗ = п. Умно- жая это соотношение на и заменяя Д3@^ через g>, получим т = по^, т. е. каждый элемент т из ЭЛ является образом неко- торого элемента п из ЭЛ. С другой стороны, если два элемента mlt пи переводятся преобразованием в один и тот же элемент т^ = т-.^, то, умножая это соотношение на ДЗ, получим mi — тг. Следова- тельно, каждый элемент из ЭЛ имеет в ЭЛ только один прообраз. Докажем теперь достаточность условий. Согласно условиям для каждого элемента т в множестве ЭЛ найдется один и только один элемент га, для которого гае®" = гаг. (6)
114 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ [Гл. III Обозначим преобразование, переводящее т в п, через а®. Таким образом, mF3 = п. (7) Умножая (7) на exF и пользуясь равенством (6), получим т (FfiexF) — п-Л -- т. Так как т — произвольный элемент, то отсюда = Ана- логичным образом, умножая (6) на и пользуясь (7), получим в^ав = ‘%). Следовательно, есть искомое обратное преобразо- вание. 7.4. Подстановки. Преобразования конечных множеств обычно задают посредством таблиц, у которых в первой строке пишут в каком-нибудь порядке обозначения элементов заданного мно- жества, а под ними — обозначения соответствующих им элемен- тов. Например, /1 2 3\ С = I \3 1 2 / есть преобразование множества чисел 1, 2, 3, при котором 1 пе- реходит в 3, 2 в 1, 3 в 2 или, пользуясь установленными выше обозначениями, 1<? = 3, 2<з=1, 3<з —2. Обратимые преобразования конечных множеств называются подстановками. Чтобы преобразование, записанное таблицей, было подстановкой, необходимо и достаточно, чтобы не только в верхней строке, но и в нижней находились обозначения всех элементов множества, причем каждый элемент должен встречаться только раз. Для записи обратной подстановки а"1 достаточно, очевидно, в таблице для а нижнюю строку сделать верхней, а верхнюю — нижней. Пусть F (xi, ..., хп) — какая-либо функция от переменных X}, ..., хп, а а — подстановка чисел 1, ..., п. Результатом под- становки а, произведенной над переменными х1г ..., хп в функ- ции F, по определению называется выражение Ас = А(х13, ..., хлз). Из этого определения непосредственно следует, что для любых подстановок р, а и любых функций F, G от ..., хп имеем А(ра) = (Ар)о, (8) (FG) a=Fc.Ge, (А G) а = Д- Са. (9)
§7} ПРЕОБРАЗОВАНИЯ ПРОИЗВОЛЬНЫХ МНОЖЕСТВ 115 Возьмем теперь в качестве функции F выражение Д = П (•»/ — xj) = (*i — (*i — х3)... —х„)(х2 —х3)...(хл_1 —х„). (10) Ясно, что для любой подстановки о будем иметь Дз = ±Д. Если Да = Д, то з называется четной подстановкой, если Дз =— Д, то нечетной. Для необратимого преобразования о имеем Дз = 0. Поэтому для любого преобразования о множества чисел 1..........п имеем Дз = е^Д, где е3 = —1, если з— четная подстановка, г- = —1, если з— нечетная подстановка, и г,— 0, если з — необратимое преобразо- вание. Значение символа е, называется также знаком преобразо- вания о. Из формул (8), (9) имеем для произвольных преобразова- ний р, з грзД = Д (рз) = (Др) з = грг3Д, . откуда т. е. знак произведения преобразований равен произведению зна- ков сомножителей. Так как знак тождественного преобразования, очевидно, равен —J—1, то знак обратной подстановки всегда сов- падает со знаком заданной подстановки. Циклической подстановкой или циклом (ц 1-> ... 1т) называется подстановка, для которой (1з = Л2, i.2a = i3..= i^ — i^ и гз==1 для остальных элементов i множества, если они есть. В частности, двойным циклом или транспозицией (г/) называется подстановка, переставляющая i и j и оставляющая неизменными остальные элементы. Переставляя в выражении (10) для Д ин- дексы 1 и 2, легко убеждаемся, что Д(1 2) =— Д, т. е. что двой- ной цикл (1 2) есть подстановка нечетная. С другой стороны, непосредственные вычисления показывают, что (1 0(1 2) (1 0 = G'2), (2 /) (Z 2) (2 /) = (i /), а так как для любых р, з всегда ерар==еа, то ®(<7) = е(2 /) (" 2) (2 Л = е(>' 2) = е(1 2)’ т. е. всякий двойной цикл есть подстановка нечетная. Отсюда следует, далее; что произведение нечетного числа двой- ных циклов есть подстановка нечетная, а произведение четного числа двойных циклов — подстановка четная. В частности, из
116 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ _ [Гл. иг легко проверяемой формулы (1 2 3 ... т) = (1 2)(1 3)... (1 т) следует, что цикл (it • • йп) четной длины т есть подстановка нечетная, а цикл нечетной длины — подстановка четная. Ясно, что циклы без общих элементов являются перестано- вочными (коммутативными) подстановками. В то же время совер- шенно произвольную подстановку легко разложить в произведе- ние циклов без общих элементов. Для этого берем произвольный элемент множества й и смотрим, в какой элемент й переводит его подстановка. Если = то получаем единичный цикл (й), т. е. тождественную подстановку, в качестве первого множителя. Если ij ф it, то берем образ й элемента й- При i3 — ii получаем в качестве множителя цикл (й i.2), при i3 Ф й рассматриваем сбраз й элемента i3. Если й = й, то цикл закрывается, и полу- чаем множитель (й ii i3) и т. д.; перебирая постепенно все эле- менты множества, получим разложение подстановки в циклы без общих элементов. Например, имеем /1 2 3 4 5\ р = (з 4 5 2 J = (l 3 5)(2 4)- Перемножая знаки циклов, получим, что ер = — 1. Существует и другой способ определения знака подстановки — при помощи подсчета числа так называемых инверсий. По усло- вию при записи подстановок таблицами в верхней строке можно писать элементы множества в произвольном порядке. Однако в случае, когда рассматриваемое множество есть совокупность целых чисел, можно условиться в первой строке писать числа в порядке возрастания. Тогда подстановка будет вполне известна, если будет задана только нижняя строка таблицы, т. е. задана Перестановка чисел. Получаемое таким образом соответствие между подстановками и перестановками взаимно однозначно, и мы получаем возможность записывать подстановки вместо двухстроч- ных таблиц однострочными. Пусть о — подстановка, отвечающая перестановке й, й, •••, in чисел 1, 2, ..., п. Рассматриваем все- возможные пары ik, it.(k<4) и говорим, что пара ik, rz дает инверсию, если й^>й- Из соотношения Д= = П fee — */,) = П (-4 “ %й) fe<Z видно, что = 1, если четно число множителей x,k — х{[, для которых Й>Й. и ®а = —1, если число таких множителей нечетно. Следовательно, четность подстановки о совпадает с четностью числа инверсий в перестановке й, й.....й-
§ 81 линейные преобразования и их матрицы 117 Примеры и задачи 1. В обыкновенном пространстве берем прямоугольную систему коор- динат OXYZ. Обозначим через qxZ поворот пространства около оси ОХ на 90° по направлению от О Г к OZ, через —поворот на 90° около оси OY от OZ к ОХ и через —поворот на 90' Пусть т — точка с координатами (1, 0, 1). Вычислить координаты точек те/ё, т т iffeft)). Показать, что ^4 = ^=^ = ®, 2. Рассмотрим два преобразования д^, произвольного множества Э1, из которых g” обра- тимо. Возьмем произвольный элемент и из ЯЯ, и пусть Преобразование «сдвинет» и, v в некоторые элементы х, у. Показать, что тогда преобразование переведет х в у (рис. 3). 3. Выберем на плоскости произвольную точ- ку О и обозначим через поворот плоскости на некоторый угол а около О. Пусть —параллельный сдвиг плоскости на расстояние а в каком-либо определенном направлении. Показать, что е® 1 е/ё <£И есть поворот на угол а вокруг точки O&Q, a ахё~1ё!$охё— сдвиг плоскости на расстояние а в направлении, повернутом на угол а относительно перво- начального. § 8. Линейные преобразования и их матрицы 8.1. Простейшие свойства. Преобразованием линейного про- странства 8 называется закон, ставящий каждому вектору из 8 в соответствие снова некоторый вполне определенный вектор из 8. Преобразование называется линейным, если оно произведение числа на вектор переводит в произведение того же числа на соответственный вектор и сумму векторог» переводит в сумму соответственных векторов. Короче, преобразование «тК называ- ется линейным, если для любых векторов х, у из пространства 8 и любого числа а из поля коэффициентов имеют место равенства (ах) — а (х^), (1) (х -|- у) '-хё = Хх-ё -ф- уз/ё. (2) Полагая в (1) а = 0, получим 03^ = 0, т. е. всякое линейное преобразование переводит нулевой вектор в нулевой. Из (1), (2) вытекает непосредственно и следующее основ- ное свойство линейных преобразований: если охё— линейное
118 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ . [Гл. III преобразование, то (ajXl O-iX-j. -j-... -f- amxm) = ~(X1'22^) —[“ Й2 (X-227^) —|— . . . —j— (х^'-У'Д, (3) где Xi, x-2, ..., xm — произвольные векторы из ?, аь а.2, ат— произвольные числа из поля коэффициентов. Ддд доказательства достаточно применить индукцию по т. При т — 1 формула (3) совпадает с (1). Пусть теперь (3) спра- ведлива для т — 1 слагаемых. Тогда (^1X1 —j— Й2Х2 4“ • • • "П — (*1X1 । (х>Х2 -у" • • . ~т- *^Х^)) o/Z — --(*1Xj) гД —(7..2Х2 —р . . —)- Ь-mX^j - ----------------------------Я] (Х1 —р Ь..> (Х2 2^) р“ . . . —р О.т , что и требовалось. При т = 2 формула (3) обращается в (ах -j- pz/) — а (хзЛ) р (z/г^), (4) откуда при 3 = 0 и а = В = 1 получаем снова (1) и (2). Таким образом, свойство (4) вполне характеризует линейные преобразо- вания и может служить в качестве их определения. Мы условились выше называть единичным преобразованием g такое преобразование, которое каждый элемент переводит в себя. Поэтому, если рассматриваемое множество есть совокупность векторов линейного пространства 2, то (ах 4- ру) g = ах 4- Ъу ~ a (xg) + р (pg). Следовательно, единичное преобразование векторного простран- ства является линейным. Преобразование, переводящее каждый вектор в нулевой, называется нулевым и обозначается &. Ясно, что нулевое преобразование также линейно. Рассмотрим два конкретных примера. Пусть 2R — обыкновенное векторное пространство, т. е. совокупность направленных отрез- ков, выходящих из фиксированной точки О. Проведем через О какую-нибудь плоскость и обозначим через Хах/ проекцию от- резка х на эту плоскость. Тогда известные свойства проекций: 1) проекция суммы отрезков равна сумме их проекций, 2) если отрезок увеличить в а раз, то его проекция также увеличится в а раз, — перепишутся в виде равенств (х 4- у) = ХаД 4- уе^, (ах) еД = а (ХеХ?), * которые показывают, что операция проектирования является линейным преобразованием. В качестве второго примера рассмотрим совокупность всех многочленов от переменной X степени не выше п. Эти многочлены
§ 8] ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ И ИХ МАТРИЦЫ 119 относительно обыкновенных операций сложения и умножения на число образуют линейное пространство размерности п -ф-1. Поставим каждому многочлену в соответствие его производную. Так как производная от суммы равна сумме производных сла- гаемых, а постоянный множитель выносится за знак производ- ной, то операция дифференцирования является линейным пре- образованием пространства многочленов. Теперь посмотрим, какими элементами можно задать линей- ное преобразование. Теорема. Пусть а>, а2, ..., ап — какая-либо база линейного пространства 2. Выберем в 8 совершенно произвольные векторы bi, Ь.2, ..., bn. Тогда существует одно и только одно линейное преобразование пространства 8, переводящее векторы at, а2, ..., ап соответственно в векторы bt, b.>, ..., Ьп. Чтобы построить искомое преобразование, возьмем произволь- ный вектор х и выразим его линейно через базу а2, а2, , ап. Пусть J-?.,a.2-4-... + EA. (5) Составим вектор х' — iibi -ф ^ibi -j- tnbn. Преобразование, переводящее х в х’, назовем . Таким обра- зом, если х имеет выражение (5), то х-Л = 'НЬу -ф tibi -г... + ЪпЬп. (6) Подставляя сюда В,- = 1, £, = 0 (/ Ф i, /=1, 2, ..., п), мы полу- чим aio/l — b; (i — 1, 2, ..., п), так что преобразование пере- водит векторы Я1, ..., ап в bi, ..., bn. Покажем, что линейно. Умножая (5) на произвольное число а, мы будем иметь ах = (a?j) щ -I- (а$2) а2 -4-... -ф- (аЦ ап. Сравнивая этот результат с (6), получим (ах) оУ? = (aq) bi -ф- (а?2) 62 -ф-... -ф- (аЦ Ьп, т. е. (ах) оД — а. (ха^). (7) Пусть У = -ф- 'ща2 -ф-... -ф- 7]„ал — еще какой-нибудь вектор из 2. Тогда х -ф- z/ — (^i -ф- tqi) ai ($2 -ф- v>) a2 4~ Ч- ^л) и, следовательно, = -rjibl -ф- 0]2&2 -ф-... -ф- 1\nbn, (х ф- у) <2^=($! 4- oil) ь, 4-... -ф- (б„ 4- т)„) ьп.
120 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ [Гл. ш Последнее равенство дает (х + у) erf = iibi ^пЬп Ч-4“ • • • 4“ ЧпЬп = Xerf 4~ yerf• (8) Свойства (7), (8) означают, что erf линейно. Нам остается показать, что всякое линейное преобразование переводящее ait ..., а„ в blt ..., bn, совпадает с erf. Согласно условию ai^ = bi (i = l, 2, ..., п). Следовательно, если вектор х имеет выражение (5), то Ха® = i-j (ща®) — ^-ibi --[-••• 4~ ^nbn = Xerf, т. е. е$₽ = е^. Теорема доказана. 8.2. Матрица линейного преобразования. Мы покажем теперь, как задать линейное преобразование числами. Выберем в про- странстве 2 какую-либо координатную систему ah а-2, ..., ап и допустим, что задано линейное преобразование erf этого про- странства. Преобразование erf переведет векторы ..., ап в некоторые векторы cyorf, a~2erf, ..., anerf, которые мы можем выразить линейно через ait а2, ..., ап. Пусть эти выражения будут a^erf = осцй! ощгаг 4“ • •• 4“ а1лал, (1-ierf = ajiGi 4- О-ч,ч.а2 4~ • • .'4- a^erf — 4~ 4- • • • 4“ rj-nrfln- Матрица -an a12 ... alra- a.21 a22 ... ain - составленная из координатных строк векторов cyerf, ..., a^erf, называется матрицей преобразования erf в системе координат ait а2, ..., ап. Таким образом, при заданной системе координат каждому линейному преобразованию соответствует определенная матрица. Возникает вопрос, является ли это соответствие взаимно однозначным. Ответ положительный, так как, зная матрицу А, мы можем сначала найти векторы bi = andi аьа2 4~ ••4~ аыйл, == а21Я1 4- а22а.2 . 4~ а2лйл> bn = 4- 4" • • • 4“ аппап, а затем построить согласно теореме предыдущего пункта линей- ное преобразование erf, переводящее ai, .... ап соответственно
§ 8] линейные преобразования и их матрицы 121 в Ь\, .... bn. Это преобразование единственное, и его матрица, очевидно, совпадает с А, что и требовалось. Выясним, какие матрицы соответствуют единичному и нуле- вому преобразованиям пространства 8. Пусть ait а2, ..., а„ — произвольная система координат.в 8. Тогда 7 = 0 • Ui —. 4~ 0 ап, == 1 * -Н • • • —f- б ап, a„^' = 0-a1 4-...4-0-ал; a„g = 0-«j 4-...4- 1 -а,,. Следовательно, нулевое преобразование имеет нулевую, а единич- ное — единичную матрицы. Поставим, задачу: как, зная матрицу линейного преобразова- ния ет/ и координаты вектора х, найти координаты вектора Пусть выбранная система координат есть а2, ..., ап и век- тор х имеет в ней координаты !ц, £2, ..., Еп. Обозначим элементы матрицы А преобразования вычисленные в той же системе координат, через а,-у (г, / = 1, ..., п). Мы имеем X = 4- "Г • • • 4" %пап, х-.4 = Si (ai<s^) 4- Е-2 (аху/) 4~ • • • -р Согласно определению матрицы преобразования а^Л — anai 4~ 4- • • • 4~ ain^n (i = l, ..., п). Подставляя эти значения в предыдущее равенство, получим хо/1 = (4®и 4~ ^a2i 4~ • • • 4_ ^лал1) ai 4” • • • • • • 4" (4»1п 4 ~ 4- • • • + ^Лалл) °л- Следовательно, координатная строка нового вектора ХеЛ есть \Xerf\ — [?1Я11 4" • • • 4" ^Лал1> • • • , ^1а1п 4~ • • • Н~ ’Лялл] — И А, т. е. координатная строка нового вектора равна координатной строке старого, умноженной на матрицу линейного преобразо- вания: [Хе^] = [х] А. 8.3. Преобразование координат. В предшествующем пункте установлено взаимно однозначное соответствие между линейными преобразованиями «-мерного векторного пространства 8 и квад- ратными матрицами порядка п. Однако для этого потребовалось сначала выбрать в 2 определенную координатную систему. Изме- нив ее, мы изменим соответствие. В результате одному и тому же линейному преебразованию в старой и новой координатных системах будут отвечать различные матрицы A, Ai. Найдем связь между ними.
122 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ [Гл. III Пусть at, аг.....—старая, ai, ai, ..., ф, —новая коорди- натные системы, Т — матрица перехода (см. п. 5.1). Обозначим через [х], [x]i координатные строки вектора х в старой и новой систе- мах. Согласно правилу линейного преобразования имеем в ста- рой координатной системе [хг^] = [х] А. В новой координатной системе то же правило дает [x&^]i = [x]Hi. Однако правило преобразования координат п. 5.1 показывает что [х] = [x]i Т, [ха^] = [xa^li Т. Подставляя сюда значения \xsd\, [xa^]i и [х] из предыдущих равенств, получим [x]i ТА = [x]i AjT. Так как вектор х произволен, то по лемме п. 5.1 имеем ТА^= = А1Т, или А1 = ТАТ1. Итак, матрица линейного преобразования в новой координатной системе равна матрице того же линейного преобразования в ста- рой, преобразованной посредством матрицы обратного перехода. В заключение рассмотрим еще вопрос, как с точки зрения теории линейных преобразований истолковать матрицу перехода от одной координатной системы к другой. Пусть в пространстве S заданы две координатные системы at, аг, ..., ап и ai, ai, ..., а'п. Согласно теореме п. 8.1 существует однозначно определенное линейное преобразование , переводящее старую систему коор- динатных векторов в новую, т. е. обладающее свойством af&~ = dt (i = l, 2......п). Чтобы теперь по правилу п. 8.2 написать матрицу преобразо- вания dd в старой системе, мы должны все векторы а\ выразить через ai, ..., ап. Но то же самое следует сделать и для того, чтобы получить матрицу перехода. Таким образом, матрица перехода есть матрица линейного преобразования, переводящего старую координатную систему в новую, вычисленная в старой системе координат. Последнее добавление, впрочем, излишне, так как, вычисляя матрицу преобразования аГ' в новой координатной системе, мы получим все ту же матрицу перехода Т. В самом деле, если матрица преобразования в старой системе коор- динат есть Т, то матрица перехода будет также Т. Значит, мат- рица в новой системе равна ТТТ"1 = Т, что и требовалось.
§91 ДЕЙСТВИЯ С ЛИНЕЙНЫМИ ПРЕОБРАЗОВАНИЯМИ 123 Примеры и задачи 1. Рассмотрим пространство векторов на плоскости, выходящих из неко- торой точки О. Показать, что преобразование, состоящее в повороте всех векторов около точки О на угол а, является линейным и что его матрица [cos a sin а”] , если в качестве координатной системы взяты два — sin a cos aj взаимно перпендикулярных вектора длины 1. 2. Пусть 91—обыкновенное пространство направленных отрезков, выхо- дящих из некоторой точки О. Выберем в 9i координатную систему, состоя- щую из трех взаимно перпендикулярных векторов е,, е2, е3 длины 1. Пока- зать, что матрица линейного преобразования состоящего в проектиро- -1 0 От вании векторов на ось elt равна ООО а матрица проектирования на пло- Г1 0 0 0 0 0 скость eLes равна 0 1 0 О 0 0. 3. Как изменится матрица линейного преобразования Q^g, если в коор- динатной системе elt е2,..., еп переставить какие-нибудь два вектора, на- пример е, и е3? 4. Линейное преобразование одномерного пространства является умно- жением всех его векторов на одно и то же число. 5. Пусть V есть пространство всех квадратных матриц второго порядка. Показать, что преобразование <y-g, состоящее в умножении веете матриц из У Г1 2] справа на матрицу , будет линейным. Найти матрицу преобразова- 13 — 1J ния от/, если в качестве координатной системы в V взята система Г1 01 ГО 11 ГО 01 ГО 01 [о о]’ ,[о о]’ [1 о]’ [о 1] 6. Линейное преобразование e*g четырехмерного пространства i! имеет в координатной системе elt е2, е3, et матрицу 1 2 3 2" — 10 3 1 2 15—1 112 2 Какова будет матрица этого преобразования, если в качестве новой системы координат взять 1) elt ег, е4, 2) et, е^е.^ е2-\-е3, et + е2 + е-. + е4? § 9. Действия с линейными преобразованиями 9.1. Умножение линейных преобразований. Пусть в линейном пространстве 2 заданы два линейных преобразования oxg, Применяя к произвольному вектору х из 2 сначала преобразо- вание erf, а затем мы получим некоторый вектор у = (х&/) а®.
124 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ [Гл. III Преобразование, переводящее х непосредственно в у, было названо в п. 7.2 произведением на ёВ. Следовательно, х(е^ёВ)=:(х^ёВ. (1) Покажем, что произведение линейных преобразований есть пре- образование линейное. Согласно п. 8.1 для этого достаточно дока- зать справедливость равенства В силу (1) (« 4- ?у) = ((ах 4- ,Ву) ё®. Так как вхё и ёёЗ линейны, то ((ax + pz/) s//) ёВ = (а (х^\ + р (уг^))(Хе^) Д_ р . (у^)ёВ, или (ах 4- ?у) (в/ёёВ) = а • X (е^&®) 4~ р • У (в'Аёё'р что и требовалось. Выберем в пространстве 8 координатную систему и обозначим через А, В матрицы преобразований о/ё, ёд. Спрашивается, как найти матрицу преобразования о^ёАЗ Обозначим эту неизвест- ную матрицу через С. Пусть х — произвольный вектор простран- ства 8 и [х] — его Координатная строка. По правилу линейного преобразования [х(з^ёВ)] = [х] С. С другой стороны, [х(3^ё73)] = [(х3^)ёВ]=^[х^]В = [х]АВ. Сравнивая оба результата, мы видим, что при произвольном х [х]С = [х] АВ. Согласно лемме из п. 5.1 отсюда следует, что С = АВ, т. е. матрица произведения линейных преобразований равна про- изведению матриц этих преобразований. Рассмотрим какое-нибудь взаимно однозначное линейное пре- образование erf. Если а/ё переводит вектор х в у, то преобразо- вание, переводящее у в х, будет обратным преобразованием @/ёЛ (см. п. 7.3). Покажем, что если &ё линейное, то и линей- ное. В .самом деле, пусть иг®1 — х, ve^"1 — у,
§9] ДЕЙСТВИЯ С ЛИНЕЙНЫМИ ПРЕОБРАЗОВАНИЯМИ 125 где и, v — произвольные векторы из 2. Ввиду линейности преоб- разования erf (а.Х фу) erf = а • Xerf -ф- Р • yerf = Ш fly. Отсюда (au -|- fly) erf~* — гх -j- фу — а • Uerf~l -ф- fl • i)erf~\ что и требовалось. Если А — матрица преобразования erf и X — матрица преоб- разования erf-1, то из соотношений erf erf-1 = erf 1 erf = g следует: AX = XA=E, или X — Л"1. Таким образом, обратное преобразование имеет обратную матрицу. В частности, чтобы линейное преобразование было обратимым, необходимо и достаточно, чтобы была обра- тимой его матрица. Из наших результатов вытекает непосредственно также сле- дующее правило: матрица преобразования erfn равна Ап, где А — матрица преобразования erf. 9.2. Умножение на число и сложение. В этом и следующем пунктах предполагается, что основное тело К является полем. Преобразование, полученное в результате применения к некото- рому вектору сначала преобразования erf, а затем умножения нового вектора на число а, называется произведением а на erf и обозначается &erf. Это определение можно выразить формулой > X (a.erf) = a. (Xerf). Рассуждая, как и в случае умножения линейных преобразо- ваний, мы легко убедимся в том, что если erf — линейное преоб- разование, то a.erf — снова линейное преобразование. Найдем его матрицу. Пусть в некоторой фиксированной системе координат преобразование erf имеет матрицу А, а преобразование a.erf — матрицу В. На основании правила линейного преобразования [х (W/)] — [х] В, [X (aerf)] = [<х (xerf)] ~ a [Xerf] = а [х] А — [х] (аЛ), откуда [х] В == [х] (<хЛ), или В = аЛ. Итак, матрица произведения числа на линейное преобразова- ние равна произведению этого числа на матрицу преобразования.
126 . ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ [Гл. Ill Отметим, наконец, формулы а (Ра/) = (оф) , О • aS = &, 1 • aS = ат/, а (eSS) = (v.aS) S = aS (ааЭ), вполне аналогичные соответствующим формулам матричного исчис- ления. Доказательство их предоставляется читателю. Возьмем теперь какие-либо два преобразования ет/, а® линей- ного пространства 2 и каждому вектору х из 2 поставим в соот- ветствие вектор XaS -ф- xS3. Преобразование, переводящее х в xaS -ф xS3, обозначается aS -ф- S3 и называется суммой aS и S3. Таким образом, по определению X (aS -ф- а®) = XaS -ф xS. Если преобразования aS, S3 линейные, то (ах-ф-Ру) (ет/ ф-в®)==(аХ-фРу)ет/ -ф (ах -ф $у) S3 = = а • Хет/ -ф- р • уат/ -j- а • xS3 -j- р . yS3 = = a (XaS ~ф Хе®) -ф Р (ует/ -ф уе®) = а • X (ет/ е®) -ф- р • у (aS -ф- а®). Следовательно, сумма двух линейных преобразований есть пре- образование линейное. Найдем его матрицу. Пусть в некоторой координатной системе преобразования а/, S3 имеют матрицы А, В. Обозначим матрицу преобразования aS-\-S3 через С. Тогда [х [X (а^ ф- S3)] = [хат/ + xS] = [Хет/] -ф [XS] = = [х] А -ф [х] В = [х] (Л -ф В). Следовательно, [х] С = [х] (Д-ф В), С = Д-фВ, т. е. матрица суммы преобразований равна сумме их матриц. Действия с линейными преобразованиями подчиняются тем же основным законам, что и действия с матрицами. Часть их, относящуюся только к умножению, мы уже указали. Выпишем теперь и те, которые относятся либо к сложению, либо к свя- зям между сложением и умножением: ет/ S3 = S3 ет/, (ет/ -ф- S) '</ == от/ -J- (S3 -ф- ё), ет/ —® = от/, а (от/ S3) = ает/ -ф- <xS3, (а -ф- Р) ет/ = ает/ рот/, от/ (S3 -ф- <ё) -= оДS3 ет/^, (от/ -ф- S3) ё -|- S^S. .
§ 9] _ ДЕЙСТВИЯ С ЛИНЕЙНЫМИ ПРЕОБРАЗОВАНИЯМИ 127 Доказательство всех этих равенств проводится одним и тем же способом: берется произвольный вектор х и показывается, что преобразование, стоящее слева, переводит х в тот же самый век- тор, что и стоящее справа. Например, Хе^ (S3 -j- ??) = (ХаЛ?) (S3 -ф- = (хе^) а® (xsyf') 2?, X (erfS3 -ф- = X ('2,SS3j -ф- X (е^^) = (х<г^) S3 -ф- (хе^) откуда &S (S3 = <s^S3 -ф- Можно также вывести все эти законы непосредственно из соответствующих формул матричного исчисления. В самом деле, между квадратными матрицами порядка п и линейными преоб- разованиями «-мерного линейного пространства существует взаимно однозначное соответствие. Это соответствие обладает тем свойством, что сумма переходит в сумму, а произведение — в произведение. Поэтому всякое тождество между матрицами дает аналогичное тождество между линейными преобразованиями, что и требо- валось. 9.3. Многочлены от линейных преобразований. Пусть / (X) — а0 -ф- оцХ -ф- ... -ф- — некоторый многочлен от переменной X. Выражение / (<2^) &og -ф- -ф- . . . —|— f где g — единичное, а-/ — произвольное линейное преобразования, называется значением многочлена /(X) при Х = Ф/ или просто многочленом от &S. Если матрица преобразования &S в некото- рой системе координат равна А, то матрицей преобразования f(&S) в той же системе координат будет f (А) = лцЕ -ф- сцА -j- ... -ф- а-тАт. Действительно, /(а./) получается из оЛ с помощью операций умножения, умножения на число и сложения. Из указанных выше результатов видно, что, производя те же операции над матри- цей А, мы получим матрицу преобразования /(<а^). Все правила действий с многочленами от одной переменной имеют силу и для многочленов от линейного преобразования. Поэтому, если в какое-либо тождество между многочленами от X подставить вместо X линейное преобразование, то получится вер- ное соотношение. Например, из тождества X2- 1 =(Х — 1) (Х-ф- 1)г (Х-|-1)2 + (Х- 1)а-2Х2 = 2 подстановкой \ = получаем а^2 — g = — g) (a^ + g), (®^ -ф- g)2 4- (а^ - g)2 - 2г^2 = 2g.
128 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ [Гл. III В частности, из тождества ' • f(»g(»=gWf(H следует соотношение f(^)g^) = g^)f^, которое показывает, что многочлены от одного и того же линей- ного преобразования всегда коммутируют друг с другом. Положение оказывается иным для многочленов от нескольких переменных. Дело в том, что при вычислениях с многочленами принимается, что переменные коммутируют друг с другом. Отсюда получаются, например, равенства Хр.Х = Х2р, = /Лг1 и т. д. Подставляя в эти равенства вместо переменных X, р, произ- вольные линейные преобразования мы получим соотно- шения которые могут оказаться неверными для отдельных линейных преобразований. Ясно, что эти затруднения исчезнут, если рас- сматриваемые преобразования коммутируют друг с другом. Таким образом, во всякое тождество между многочленами от несколь- ких неизвестных можно вместо этих неизвестных подставить про- извольные, коммутирующие между собой линейные преобразова- ния: в результате получится верное соотношение между линей- ными преобразованиями. Мы условились считать, что все рассматриваемые в этой книге линейные пространства конечномерны. Однако это не исклю- чает того, что часть определений и теорем остается верной и для пространств бесконечной размерности. В качестве примера можно указать на определения линейных преобразований и действий с ними и на те свойства линейных преобразований, изложенные в этом параграфе, которые не были связаны с матрицами. Примеры и задачи 1. Пусть й— совокупность всех многочленов степени Слот).. Обозна- чим через преобразование, переводящее каждый многочлен /(X) в его производную f (X). Показать, что — 0. Найти матрицу в системе координат 1, X,..., Хл. 2. Пусть I! — бесконечномерное пространство всех многочленов от X. Обозначим через операцию дифференцирования, а через — операцию умножения многочленов на X. Показать, что обе операции линейны и что между ними существуют соотношения _ gFjgn = (л = 1, 2, ...). 3. Почему преобразование %, указанное в предыдущей задаче, нельзя рассматривать в пространстве многочленов степени не выше п?
§ 10] РАНГ И ДЕФЕКТ ЛИНЕЙНОГО ПРЕОБРАЗОВАНИЯ 129 4. Линейные, преобразования пространства V относительно операций сложения и умножения на число сами образуют линейное ’ пространство. Чему равна размерность этого пространства, если размерность V равна п> 10. Ранг и дефект линейного преобразования Выше рассматривались такие свойства линейных преобразо- ваний, которые были связаны главным образом с правилами дей- ствий с ними. Теперь мы рассмотрим несколько свойств, имею- щих более геометрический характер. 10.1. Ядро и область значений. Пусть заданы какая-либо со- вокупность векторов 301 линейного пространства 2 и произволь- ное его линейное преобразование о/ё. Каждый вектор а из 301 переводится преобразованием оЛ в некоторый новый вектор аоЛ — образ вектора а. Этот образ, вообще говоря, не будет принадле- жать 301. Совокупность образов всех векторов из 301 мы будем называть образом 301 относительно и обозначать 301е^. Про- образом совокупности 301 мы условимся называть совокупность всех тех векторов из 2, образ которых лежит в 301. Теорема 1. Образы и прообразы линейных подпространств пространства 2 относительно произвольного линейного преобра- зования являются снова линейными подпространствами. В самом деле, пусть 31 — линейное подпространство из 2. До- кажем, что 31е^ — также линейное подпространство. Возьмем в 31е^ какие-нибудь векторы а, Ь. Эти векторы являются, обра- зами некоторых векторов х, у из 31, т. е. а = х&£, Ь — уе^. Так как 31— линейное подпространство, то ах -4- $У содержится в 31 при любых а, р. Поэтому (ах-|-р#) <з^ содержится в 3(<г//. Но (ах $у) && — а х&£ 4- р • у-Л — р&, т. е. 31ат/ содержит ааД-^ и, следовательно, является линей- ным подпространством. Совершенно аналогично доказывается и то, что прообраз линейного подпространства 31 есть также линей- ное подпространство. Ядром линейного преобразования ет/ называется совокупность всех векторов ?, переводящихся преобразованием в нулевой вектор, а областью значений оЛ называется совокупность обра- зов всех векторов из 8. Размерность области значений назы- вается рангом преобразования, а размерность ядра — дефектом преобразования. Теорема 2. Сумма ранга и дефекта линейного преобразо- вания охё равна размерности пространства 2. Обозначим через 91 ядро преобразования и предположим, что размерность ядра 91 есть d. Размерность области значений 1W обозначим через г. Согласно определению d и г — дефект и 5 А. И- Мальцев
130 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ [Гл. Ш ранг преобразования ed. Выберем в области значений 2®^ неко- торую базу di,..., аг и обозначим через bit Ь^,...,ЬГ элементы пространства 2, переводящиеся преобразованием ed соответст- венно в ai, ait..., аг. Векторы bi, bit..., br линейно независимы, так как из Д" —f- &гЬг О следует: (а1^1 “|~ <&ibi . .. —^ГЬГ) od = ~<*2*12 Д' • • • Д~ Ч-г^г == и, поскольку fli.Oj,..., аг линейно независимы, al = а2 = ... = а.г = 0. Рассмотрим подпространство ЭУ1, натянутое на векторы bi, b*,..., br. Система &i,..., br является базой в ЭЛ, поэтому раз- мерность подпространства ЭД равна г, т. е. рангу преобразова- ния ed. Докажем, что пространство 2 есть прямая сумма под- пространств ЭЛ и 91. Согласно п. 6.2 для этого достаточно пока- зать, что ЯК (19Z — {о} и 2 = ЭЛ -1- 9?. Докажем первое. Всякий вектор из ЭД имеет вид b = a-ibi —<z2Z?2 “I” • • • “I” Rf-bf, Если b входит в 9i, то bed = о, т. е. (04&1 Д- • • • Д- ^-rbr) @d = (Xidi —|- •. • —|- = О. Но векторы at......... аг линейно независимы, поэтому ai = ... ... ==ar = 0, откуда b = o, что и требовалось. Остается показать, что 2 — ЭЛ —|-Возьмем произвольный вектор а из 2. Его об- раз aed лежит в ied и, значит, выражается линейно через at,... ,аг: Oed =. CCjiZi —СС2П2 “Н • • • Д” Пусть Ь = cti&i -j- о.%Ь% —|- ... —& — Ь О. Так как bed = 04 • b^ed —|— ... —• b^ed otjtZi -J— ... v.rar ==z aed, ТО Cod = (а — Ь) ed = Oed — bed = О. Следовательно, с входит в 91. Итак, a = b-\-c (b С ЭЛ, с С Д), но это и значит, что 2 = ЯЛ4-9?.
§10] РАНГ И ДЕФЕКТ ЛИНЕЙНОГО ПРЕОБРАЗОВАНИЯ 131 Поскольку сумма здесь прямая, то размерность пространства 2 равна сумме размерностей подпространств ЭЛ и 9J, т. е. равна сумме ранга и дефекта пространства 2. Теорема доказана. Рассмотрим пример. Пусть 9i — обыкновенное пространство направленных отрезков, выходящих из некоторой точки О. Возь- мем произвольную плоскость ф, проходящую через О, и обозна- чим через ФР операцию ортогонального проектирования на ф. Преобразование ФР переводит все пространство 91 в плоскость ф. Таким образом, ф есть область значений преобразования ФР и ранг равен 2. Ядро преобразования состоит из векторов, лежащих на прямой, проходящей через О перпендикулярно к плоскости ф, так как только эти векторы переводятся преоб- разованием ФР в нуль. Следовательно, дефект ФР равен единице. Сумма ранга и дефекта преобразования ФР равна 3, как и должно быть по теореме 2. 10.2. Особенные и неособенные преобразования. Выше было указано (п. 9.1), что не всякое преобразование обратимо. Обра- тимые линейные преобразования далее будут называться неособен- ными, а необратимые — особенными. Условия, при которых ли- нейное преобразование будет неособенным, мы получили в п. 9.1 в матричной форме. Теперь мы хотим придать этим условиям более геометрический характер. Теорема 3. Для того чтобы линейное преобразование пространства 2 было неособенным, необходимо и достаточно, чтобы ядро этого преобразования было нулевым, т. е. чтобы де- фект был равен нулю. Доказательство. Если данное преобразование неосо- бенное, то каждый вектор должен иметь только один прообраз, в том числе единственный прообраз должен иметь и нулевой вектор о. Поскольку о всегда является прообразом нулевого вектора, а ядро в данном случае может состоять только из од- ного вектора, то оно и будет равно о. Пусть, обратно, дефект erf равен нулю. Согласно теореме 2 отсюда следует, что ранг ехФ равен размерности 2, т. е. что раз- мерность области значений 2ет/ равна размерности 2. Следова- тельно, 2ет/ = 2, и мы видим, что всякий вектор из 2 является образом некоторого вектора из 2. Если мы докажем, что преоб- разование ат/ различные векторы а, b переводит в различные же, то это и будет означать, что преобразование обратимо (п. 7.3). Но из а&$ = Ье£ следует, что (а — Ь)о^ — о. Так как согласно предположению ядро ат/ нулевое, то а — Ь = о, или а = Ь, что и требовалось. Теорема доказана. Равенство дефекта a/Z нулю равносильно равенству ранга ат/ размерности пространства 2. Поэтому теорему 3 можно предста- вить еще в следующей форме: б*
132 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ [Гл. III Теорема 4. Для того чтобы линейное преобразование пространства 8 было неособенным, необходимо и достаточно, чтобы область значений оЛ совпадала с 8, т. е. чтобы ранг arf был равен размерности 8. Взаимно однозначное отображение одного линейного прост- ранства на другое называется изоморфизмом, если оно сумму век- торов первого пространства переводит в сумму соответствующих векторов второго, а произведение какого-либо числа на вектор первого пространства переводит в произведение того же числа на соответственный вектор второго (п. 4.3). Если оба линейных пространства совпадают, то мы получим изоморфное отображение линейного пространства самого на себя.Такое отображение назы- вается автоморфизмом линейного пространства. Определение авто- морфизма, очевидно, совпадает с определением неособенного ли- нейного преобразования. Следовательно, линейные неособенные преобразования пространства 8 можно рассматривать как авто- морфизмы этого пространства. Из самого определения автомор- физмов явствует, что автоморфизмы пространства 8 — это такие наложения пространства 8 самого на себя, при которых сохра- няются все его геометрические свойства, т. е. свойства, выра- жающиеся с помощью операций сложения и умножения на число. Рассмотрим два произвольных линейных преобразования <ДЗ пространства 8. Эти преобразования мы условимся называть изоморфными или подобными, если существует такой автомор- физм © пространства 8, который одно преобразование переводит в другое. Пусть и — какой-нибудь вектор из 8 и у — ио/1. Автоморфизм <ё переводит и в некоторый вектор х, a v — в некоторый век- тор у. Говорят, что переводит преобразование в е®, если х '^ — у (см. рис. 3). Поскольку х = иД, y = tfia, то равенство хДЗ=у дает • ибх/З = = v Uox£. Отсюда <i£33f§~^ = ed, <33 = . (1) Следовательно, преобразование <33 тогда и только тогда изо- морфно преобразованию ехё, если оно получается из а/? преобра- зованием его при помощи некоторого автоморфизма простран- ства 8, т. е. при помощи некоторого неособенного преобразования этого пространства. Выберем в 8 систему координат и обозначим Матрицы преоб- разований erf, 33, соответственно через А, В, С. Тогда равен- ство (1) будет равносильно матричному соотношению В = С'АС,
§ 10] РАНГ И ДЕФЕКТ ЛИНЕЙНОГО ПРЕОБРАЗОВАНИЯ 133 и мы приходим к следующему утверждению: для того чтобы два линейных преобразования пространства 8 были изоморфны, необ- ходимо и достаточно, чтобы их матрицы были подобными. Изоморфные преобразования мы должны рассматривать как преобразования, обладающие одинаковыми геометрическими свой- ствами. Отсюда видна важность классификации всех линейных преобразований с точностью до их изоморфизма. Алгебраически эта задача эквивалентна классификации всех квадратных матриц порядка п с точностью до их подобия. В то время как задача классификации всех линейных пространств над заданным полем решается без всякого труда (см. п. 4.3), задача классификации линейных преобразований требует для своего решения более углу- бленного изучения свойств линейных преобразований. Эта задача будет решена полностью только в следующей главе. Отметим, наконец, еще одно свойство изоморфных линейных преобразований: для того чтобы линейные преобразования &S, о® были изоморфны, необходимо и достаточно, чтобы существовали такие координатные системы, в которых эти преобразования вы- ражались бы одной и той же матрицей. В самом деле, если &S, S3 изоморфны, то их матрицы свя- заны соотношением А = СВС~1. Но это соотношение показывает, что если от заданной системы координат перейти к такой, чтобы матрица перехода была С, то матрица преобразования Si в но- вой системе будет А, т. е. будет совпадать с матрицей преобра- зования оД, вычисленной в старой системе координат. Обратно, если матрица А преобразования в системе координат щ,... ..., ап совпадает с матрицей преобразования S3, вычисленной в системе координат щ....... ал, то, обозначая через С матрицу перехода от первой системы координат ко второй, мы получим, что во второй системе координат матрицы .преобразований <гЛ, S3 будут соответственно равны САС1 п .А, т. е. будут подоб- ными, что и требовалось. 10.3. Ранг матрицы преобразования. В п. 10.1 мы ввели по- нятие ранга линейного преобразования. С другой стороны, из п. 5.2 известно понятие ранга матрицы как максимального числа линейно независимых строк ее. Возникает вопрос о связи этих понятий. Решение дается следующей теоремой: Теорема 5. Ранг произвольного линейного преобразования qS пространства 2 равен рангу матрицы этого преобразования. Пусть щ,..., ап — некоторая система координат в 2. Область значений преобразования &S состоит из образов векторов про- странства 2, т. е. из векторов вида Д- \ . —|— ОСдйд) Q.S (Хз (п^а7^) -|— . . (Хп (Пя<27^'). Это показывает, что область' значений преобразования есть
134 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ [Гл. Ill подпространство, натянутое на векторы а\&£,..., апо^. Ранг равен размерности области значений и равен, следовательно, максимальному числу линейно независимых векторов среди , anort: (п. 6.1). Пусть a.i&£ = <хц ai (Xia а2 . -j- otina„, ауЛ = а.э] Я] asjifla -j- ... а2лйл, , — ]“ ~' • • "Т” О'пп&п' Матрица '<*11 «12 ... «!„" __ a21 а22 • • • а2л -azil ^-л2 * * • azin - есть матрица преобразования . Строки этой матрицы являются координатными строками векторов ауг^,..., апо^. Поэтому мак- симальное число линейно независимых векторов среди а-угЛ,... ..., а.прЛ равно максимальному числу линейно независимых строк матрицы А, т. е. равно ее рангу, что и требовалось. Дефектом квадратной матрицы называется' разность между ее порядком и рангом. Из теорем 2 и 5 непосредственно выте- кает, что' дефект линейного преобразования равен дефекту его матрицы. В качестве примера рассмотрим систему п линейных однородных урав- нений Eiaii 4" ?Л1 4-• • “F =0, Sla12 4- ^2a23 + • • 4- £rtans = 0, (2) 51“1Л 4- isasn 4- ••• 4" ?л“лл == 0 . с п неизвестными Еъ 52, ..., £п. Требуется исследовать решения этой системы. Геометрически эту задачу можно истолковать следующим образом. Возьмем произвольное n-мерное линейное пространство I1 и выберем в нем какую- нибудь систему координат alr ..., ап. Условимся неизвестные величины ?2, ..., 5П понимать как координаты некоторого вектора х из 1!. Рассмотрим линейное преобразование этого пространства, имеющее своей матрицей матрицу А с элементами а,у (г, j = 1, 2,..., я). Систему уравнений (2) можно переписать в виде [х] А = О или в векторной форме Xq^ = O. Отсюда видно, что решениями системы (2) являются координатные строки векторов, принадлежащих ядру преобразования orf. Так как размерность ядра есть дефект преобразования, а дефект преобразования равен дефекту
S in ИНВАРИАНТНЫЕ ПОДПРОСТРАНСТВА 135 его матрицы, то мы приходим к известной теореме теории определителей: максимальное число линейно независимых решений однородной системы п линейных уравнений с п неизвестными равно дефекту матрицы этой си- стемы. Примеры и задачи 1. В пространстве строк длины 4 взята система координат et = [l, 0, 0, 0], е2 = [0, 1, 0, 0], ₽3 = [0, 0, 1, 0], е4 = [0, 0, 0, 1]. Найти ядро и область значений линейных преобразований, заданных мат- рицами “2 -2 10 0- "3 1 “1 3 5 Г 0 2 1 0 2 1 2 13 1 3 2 0 0 0 > 4 7 13 3 • 0_ 0_ 0 0_ _3 —1 1 1. 2. Пусть Q/g—линейное преобразование пространства V, ЯП—линейное подпространство из 1*. Показать, что размерность образа подпространства ЯП удовлетворяет неравенствам разм. ЯП—деф. Q/g г£разм. ЯП<г7^' г£разм. ЯП. 3. Если Q^g1 — произвольное, Qyg2— неособенное линейные преобразо- вания, то ранг (e^ie^s) = ранг (&g<,<axgi) = ранг oxgi. 4. Пусть oxgi, г—произвольные линейные преобразования как’ого- нйбудь линейного пространства Г. Тогда ранг + az^2)s£ ранг <3^ +ранг а./2, Деф. (сг/1-^2) Деф- q^i + деф- &/2, ранг (ет^кгт/^егранг ранг (&^1S^2) sSpanr ci7g„. 5. Всякое линейное преобразование ранга т может быть представлено в виде суммы преобразований ранга 1. 6. Для того чтобы матрица А порядка п имела ранг не выше 1, необ- ходимо и достаточно, чтобы А можно было представить в виде Рз Lan~ где ctj, Р/—подходящие числа. § 11. Инвариантные подпространства 11.1. Индуцированное преобразование. Говорят, что подпро- странство 31 линейного пространства 2 инвариантно относительно преобразования oxg, если каждый вектор из 31 преобразованием переводится снова в некоторый вектор из 31, т. е. если 3W<=31. Из этого определения непосредственно вытекает, что несобст- венные подпространства — нулевое и само 2 — инвариантны
136 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ [Ул. III относительно любого линейного преобразования. Также непосредст- венно следует и предложение, что сумма и пересечение инвариан- тных подпространств являются-снова инвариантными подпрост- ранствами. Отметим еще, что если подпространство 31 инвариантно отно- сительно какого-либо линейного преобразования то 31 будет инвариантным и относительно преобразования где — М? -|- -J- . • • + ат<2^т — произвольный многочлен от . В самом деле, если а — вектор из 31, то по условию а@^ со- держится в 31. Отсюда следует, что (W) orf — ао^4,' содержится в 31 и т. д. Мы видим, следовательно, что при любом век- тор ат4к содержится в 81. Но тогда 31 содержит и все линейные комбинации этих векторов, в частности, 31 содержит а/ (е^) = аоа cq • а&4 • 4~ • а.--Лт, - что и требовалось. Способы нахождения инвариантных подпространств будут рас- смотрены в п. 11.4 и в § 12; теперь же мы хотим показать, ка- ким образом можно воспользоваться знанием инвариантных под- пространств для упрощения матрицы преобразования. Пусть линейное преобразование имеет нетривиальное ин- вариантное подпространство 31. Выберем в 31 базу щ, а2, ..., ат и дополним ее линейно независимыми векторами am+i, ..., ап до базы всего пространства £. Чтобы найти в системе координат Ci, ..., ат, ат+1, ап матрицу преобразования <а^, необходимо векторы а&Л, ..., апех£ выразить линейно через координатные векторы ..., ап. Однако подпространство 81 инвариантно, по- этому векторы aie^, ..., ато^ лежат снова в 31 и выражаются линейно через а\, .... ат. Следовательно, а\&Д = ацЙ! ... в.\тату ато/ё — «mt@-t j— ... —«тт&т* --®m+l, 1^1 Щ * " " т^т ~“Н атлн-1. rflni а^г/1 — anlat —... -J- <хптат । .... — т. е. матрица преобразования e/f равна «ml А — «т! 1 • «тт am+l, т б ...б «т+i, т+1 • • • Лт+1, п ~А] О' В Аг~ (2) «nt •«пт «п, т+1 «пп
§ 11] ИНВАРИАНТНЫЕ ПОДПРОСТРАНСТВА 137 Итак, если линейное преобразование имеет инвариантное ли- нейное- подпространство, то в надлежащей координатной си- стеме его матрица разбивается на четыре клетки, из которых диагональные клетки квадратные, а правая верхняя может быть прямоугольной, но заполнена целиком нулями. Матрицы такого вида в п. 2.1 были названы полураспавшимися. Обратно, если в некоторой координатной системе матрица линейного преобра- зования <2/1 принимает полураспавшийся вид (2), то равенства (1) показывают, что в этом случае подпространство 81, натянутое на т первых координатных векторов, будет инвариантным относи- тельно <2/1. Геометрический смысл матрицы At можно истолковать следую- щим образом. Нам дано, что преобразование sA переводит каж- дый вектор из 31 снова в некоторый вектор из 31. Поэтому о/? можно рассматривать также как преобразование пространства 81. Обозначим это преобразование через <a^i и условимся называть e/i индуцированным преобразованием. Преобразования и eAi действуют на векторы подпространства 31 одинаково: если а — век- тор из 31, то U2/A — а<2/?\. Различие между этими преобразовани- ями состоит в том, что различны области их действия: если а — век- тор основного пространства 8, не входящий в 31, то aerf имеет смысл, a а&А смысла не имеет. Первые т равенств системы (1) показывают, что А есть мат- рица индуцированного преобразования а-А в системе координат • • • , • 11.2. Прямая сумма инвариантных подпространств. Мы рас- смотрели случай, когда линейное преобразование о/? имеет одно инвариантное подпространство. Предположим теперь, что е/£ имеет два инвариантных подпространства 311, 312, и, более того, предположим, что пространство 8 есть прямая сумма их. Выбе- рем в 31ь 31s соответственно координатные системы щ, ...,ат и a,„+i, ..., ап. Согласно п. 6.2 векторы at ..., ат, am+i, ..., ап обра- зуют координатную систему в 8. Посмотрим, какую форму в этой системе примет матрица преобразования еА. По условию век- торы щ<а^, ..., ато^ лежат в 3G, а векторы a,n+isA, ..., anv£ лежат в 312. Таким образом, а\о/£ — ЩЩ] —j— ... —j— ^1^ат, ат<2/ё — А • • • A --------- С1/л+1, *ф“ • • • | пап-, (3) а„о/£ = ал, т+1 От+1 + • • • + аллОи-
138 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ (Гл. III Следовательно, матрица преобразования о/? оказывается равной ~ац .. • a_im 0 ... О 6 ...б ГЛ1 1л\ Z1 —— —— . i) О ... О am+l, /714-I • • • a/n+l, п .0 -^2_ О ... 0 . (Хлл ~ т. е. оказывается распавшейся. Обозначим через e^i, преоб- разования, индуцируемые в подпространствах ?li, преобразо- ванием <а^. Из равенств (3) следует, что Ai и А2 являются мат- рицами преобразований в соответственных координатных системах. Итак, если пространство 2 распадается в прямую сумму под- пространств, инвариантных относительно линейного преобразо- вания &£, то в надлежащей координатной системе матрица пре- образования принимает клеточно-диагональный вид, диагональ- ные клетки которого являются матрицами преобразований, индуцированных преобразованием оЛ в инвариантных подпрост- ранствах. Это предложение доказано нами только для случая суммы двух инвариантных подпространств. Однако все рассуждения пере- носятся без изменений и на случай любого числа слагаемых. Предположим теперь обратное: пусть известно, что в некото- рой координатной системе матрица преобразования принимает распавшийся вид (4). Тогда из равенств (3) вытекает, что про- странство 2G, натянутое на т первых координатных векторов, и пространство 2(2, натянутое на оставшиеся координатные векторы, будут инвариантными относительно erf. Сумма 2li-j-2l8, очевидно, прямая и совпадает с 2. Следовательно, приводимость матрицы преобразования к клеточно-диагональной форме есть условие не только необходимое, но и достаточное для того, чтобы 2 явля- лось прямой суммой подпространств, инвариантных относи- тельно <2^. Рассмотрим следующую задачу. Дано разложение простран- ства 2 в прямую сумму некоторых линейных подпространств 2 = 311 + ^ + ... + ^, и в каждом подпространстве 2Г,- задано свое линейное преобра- зование Спрашивается, существует ли такое линейное преоб- разование пространства '2, относительно которого все под- пространства 2(г являются инвариантными и которое в каждом индуцирует преобразование ь а также будет ли это преобра- зование единственным.? Ответ, очевидно, утвердительный. В самом
§ hi ИНВАРИАНТНЫЕ ПОДПРОСТРАНСТВА 139 деле, выберем в каждом подпространстве 91, некоторую базу ап, а. а aim. и обозначим матрицу преобразования в этой координатной системе через Аг. Рассмотрим клеточно-диагональ- ную матрицу А = Ai -J- Аз -f-... -f- -dj. Система векторов ап, asl, •.., asms является базой пространства В этой базе матрице А отвечает некоторое ли- нейное преобразование пространства 8. В силу сказанного выше преобразование удовлетворяет всем требованиям нашей задачи. Это преобразование единственно, так как его матрица в указанной координатной системе определяется условиями задачи однозначно. 11.3. Характеристический многочлен преобразования. В этом и следующем пунктах предполагается, что основное тело является полем. Возьмем какое-нибудь линейное преобразование «-мер- ного линейного пространства S. Выбирая в 8 определенную коор- динатную систему «1, ..., мы сможем вычислить матрицу А преобразования &/. Характеристический многочлен ср (Х)=| 'Е—Л| матрицы А называется характеристическим многочленом преобра- зования . Если мы возьмем какую-либо другую координатную систему а\, ..., а'п и обозначим через Т матрицу перехода, то матрицей преобразования в новой координатной системе бу- дет согласно п. 8.3 Ai = TAT~\ т. е. матрица, подобная А. Однако в п. 3.2 было показано, что подобные матрицы имеют одинаковые характеристические много- члены. Таким образом, характеристический многочлен преобразо- вания не зависит от координатной системы, в которой он вычисляется. Степень характеристического многочлена равна порядку мат- рицы А, а порядок матрицы А равен размерности пространства 8. Поэтому степень характеристического многочлена преобразова- ния равна размерности пространства, в котором действует это преобразование. Сумма корней характеристического многочлена равна следу, а произведение корней — определителю матрицы А. Так как ха- рактеристический многочлен orf, а значит и его корни, не зави- сит от координатной системы, то от координатной системы не зависят также след и определитель А. Поэтому след и опреде- литель матрицы преобразования называются следом и опре- делителем самого преобразования . Если пространство 8 распадается в прямую сумму подпрост- ранств 5Мь инвариантных относительно , то в надлежащей
140 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ [Гл. III координатной системе матрица преобразования принимает клеточно-диагональный вид , ГА 01 Согласно п. 3.3 характеристический многочлен матрицы А равен в этом случае произведению характеристических многочленов матриц At, А.,. Но Л9 — матрицы линейных преобразований, - индуцируемых преобразованием в инвариантных подпрост- ранствах 2(1, ЙЬ. Следовательно, если пространство 2 распадается в прямую сумму подпространств, инвариантных относительно линейного преобразования , то характеристический многочлен преобразования равен произведению характеристических много- членов преобразований, индуцируемых преобразованием' аЛ в инва- риантных подпространствах. По теореме Гамильтона — Кэли (п. 3.2) всякая квадратная матрица А является корнем своего характеристического много- члена ср (X), т. е. ср (Л) —О. Пусть — линейное преобразование, имеющее матрицу А. Преобразование <р(ет/) имеет согласной. 9.3 матрицу ср (Л). Так как эта матрица нулевая, то <?(&£)=0. Сле- довательно, каждое линейное преобразование является корнем сво- его характеристического многочлена. Минимальным многочленом линейного преобразования на- зывается многочлен наинизшей степени, старший коэффициент которого есть 1 и корнем которого является преобразование ат/. Пусть А—матрица преобразования а/, вычисленная в некото- рой координатной системе. Так как соотношения /(Л) = 0 и /(ет/) = 0, где / (X) — произвольный многочлен, равносильны, то минимальный многочлен преобразования совпадает с минимальным многочленом матрицы этого преобразования. Если пространство 2 распадается в прямую сумму подпрост- ранств, инвариантных относительно преобразования то мат- рица преобразования в надлежащей системе координат рас- падается. Минимальный многочлен распавшейся матрицы есть наименьшее общее кратное минимальных многочленов ее диаго- нальных клеток (п. 3.3). Поэтому минимальный многочлен преоб- разования ет/ будет равен наименьшему общему кратному мини- мальных многочленов преобразований, индуцированных преобра- зованием ет/ в инвариантных подпространствах. 11.4. Собственные векторы и собственные значения. Пусть по-прежнему основное тело является полем. Мы хотим теперь более подробно изучить одномерные инвариантные подпростран- ства. Сначала введем следующие определения. Число С называется собственным значением линейного. преобразования ет/,. если
, § 11] ИНВАРИАНТНЫЕ ПОДПРОСТРАНСТВА 141 в пространстве 8 существует ненулевой вектор а, для которого = \а. (5) Всякий вектор, удовлетворяющий этому соотношению, называется собственным вектором преобразования принадлежащим соб- ственному значению С Нахождение собственных векторов и нахождение инвариант- ных одномерных подпространств — задачи равносильные. Дейст- вительно, пусть а — ненулевой собственный вектор преобразова- ния аЛ и С — отвечающее ему собственное значение. Рассмотрим одномерное подпространство ЭД, натянутое на вектор а, т. е. сово- купность всех векторов вида аа. Соотношение (аа) = а —&-а (6) показывает, что 31 инвариантно относительно . Обратно, пусть некоторое одномерное подпространство ЭД инвариантно относи- тельно &#. Выберем в ЭД произвольный ненулевой вектор а. Так как ЭД одномерное, то все векторы из ЭД имеют вид ад. По усло- вию а&4 принадлежит ЭД, следовательно, = Са, т. е. а — собственный вектор преобразования е^, принадлежащий собственному значению С. Равенство (6) показывает, что все остальные векторы ЭД также являются собственными векторами, принадлежащими собственному значению С Выберем в пространстве 8 некоторую координатную систему at, ..., ап, и пусть в этой системе линейное преобразование имеет матрицу А = || а,-7-1|. Обозначим через а какой-нибудь ненуле- вой собственный вектор преобразования . Пусть координатная строка вектора а есты ..., 6„], а соответственное собствен- ное значение равно О Равенство (5) в координатной форме дает или [а]Л=;[4 ^1ан 4~ ^за21 4-... 4- %nani —- ?1а12 4“ ?2а22 4~ • • • 4“ ^лал2 = ^1а1л 4- ^2а2л 4- • • • 4- ^п^-пп-&п. Перенося все члены в одну сторону, получим (с — «и) —д«а21 —... — £„a„i = о, - -------------- 4" $2 (£ - а32) - ... - ^Лал2 — 0. (7) (8) (9) Z — ‘1а1л — ^а2л — ... 4- МС — алл) = 0.
142 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ [Гл. III Эту систему можно рассматривать как систему п однородных линейных уравнений с п неизвестными Ь, ..., Так как системе (9) удовлетворяют координаты ненулевого собственного век- тора а, то (см. п. ч 10.3) — ata .,. — С — «22 ... — a»n С —«ц — оЦп = ]С£-Л] = 0, (10) — “«1 -- . . . С - «ля матрица. Но | Х£ — А | есть характеристический где Е — единичная многочлен матрицы А, поэтому равенство (10) показывает, что все собственные значения линейного преобразования являются кор- нями его характеристического многочлена. Обратно, если С есть корень характеристического многочлена преобразования , при- надлежащий полю коэффициентов линейного пространства, то С является собственным значением преобразования . В самом деле, равенство (10) показывает, что ранг матрицы системы (9) будет меньше п; следовательно, эта система будет иметь по меньшей мере одно ненулевое решение. Обозначая это решение через [$i, Ц, мы из (8) и (7) непосредственно получаем, что вектор а с координатами будет искомым ненулевым собственным вектором *). Кратностью собственного значения С линейного преобразова- ния называется кратность, с которой С входит в качестве корня в характеристический многочлен преобразования Рассмотрим пример. Пусть в трехмерном линейном веществен- ном пространстве с базой а>, зование сЛ с матрицей а3 действует линейное преобра- А= 3 1 —3 3 1 —1 2” —2 0 Требуется найти собственные значения и собственные векторы преобразования Вычисляем прежде всего характеристический многочлен преобразования ГХ-3 — 1 3 — 3 X—1 1 — 2' 2 = (X. — 4) (л9 4-4). X *) Более кратко доказательство последнего утверждения можно прове- сти следующим образом. Условие а^-~'Са можно переписать в виде a (Cg — — о. Это показывает, что собственные векторы являются век- торами, входящими в ядро преобразования Cg— Но чтобы ядро содер- жало ненулевые векторы, необходимо и достаточно, чтобы преобразование было особенном (п.10.2), т. е. необходимо и достаточно, чтобы | СЕ—А |=0. I»
ПРИМЕРЫ И ЗАДАЧИ 143 Его корни равны соответственно Х1 = 4, X2 = 2i, Х3 =—21. Так как- основное поле вещественное, то последние два значения от- брасываем, а первое Xt = 4 будет искомым собственным значе- нием. Чтобы найти собственные векторы, составляем систему (9), которая в нашем случае обратится в Зчз--О, --3?1 £з = 0, —2^i4-2^ + 4U = 0. Решая эту систему, находим 1з=0, где — произвольное. Таким образом, вектор будет при произвольном собственным вектором преобразования &#. Примеры и задачи 1. В комплексном пространстве S преобразование имеющее матрицу с базой alt a,, as, дано линейное -10 2 —Г 0 14—2 2—1 0 1 _2 —1 —1 2 Найти собственные векторы и собственные значения преобразования Показать, что подпространство, натянутое на векторы 2а2— а2,— а:, + ^4* является инвариантным относительно 2. Допустим, что пространство 8 имеет базу, образованную собствен- ными векторами преобразования оЛ • Какова будет матрица преобразова- ния в такой базе? 3. Если в пространстве 8 с системой координат а2, ..., ап матрица линейного преобразования имеет клеточный полураспавшийся вид д = ГА [<Э д2]’ где Д3 — квадратная матрица порядка т, то подпространство, натянутое на последние т координатных векторов ага_ш+1, ..., ап, будет инвариантным относительно оД. 4. Если преобразование неособенное, то всякое подпространство, инвариантное относительно будет инвариантным и относительно q^~1. 5. Если подпространство 91 инвариантно относительно преобразова- ния &/£, то образ и прообраз подпространства 91 будут также инвариант- ными относительно оД. 6. В комплексном линейном пространстве всякое линейное преобразо- вание имеет по меньшей мере один ненулевой собственный вектор. 7. Пусть в системе координат at, ..., ап матрица преобразования имеет диагональную форму с различными диагональными элементами. Найти
144 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ [Гл. ПГ все инвариантные подпространства преобразования и показать, что их число равно 2Л. 8. Если линейное преобразование я-мерного пространства 8 имеет я различных собственных значений, то матрица преобразования в подхо- дящей системе координат приводится к диагональному виду. § 12. Преобразования с матрицей нормальной формы В настоящем параграфе будут рассмотрены свойства линей- ных преобразований, матрицы которых имеют в некоторой фик- сированной координатной системе так называемую нормальную форму Жордана. Таким образом, возможность приведения матриц рассматриваемых преобразований к требуемому виду здесь будет предполагаться заранее. Вопрос о том, что такое приведение в поле комплексных чисел всегда возможно, будет решен далее, в п. 15.4. Всюду в этом параграфе предполагается, что основное тело является полем. 12.1. Диагональная форма. Простейшую характеристику преоб- разований, матрица которых может быть приведена к диагональ- ной форме, дает Теорема 1. Если линейное преобразование пространства размерности п имеет п линейно независимых собственных векто- ров, то, принимая эти векторы в качестве координатных, мы приведем матрицу преобразования к диагональному виду. Обратно, если матрица преобразования в некоторой координатной системе имеет диагональный вид, то базисные векторы являются собствен- ными векторами преобразования. Доказательство очевидно. Более тонкая задача состоит в том, чтобы по матрице преобразования, вычисленной в какой-нибудь случайной координатной системе, узнать, обладает ли преобразо- вание собственными векторами, образующими базу пространства. Эта задача будет решена в п. 15.4, а здесь мы рассмотрим только один частный случай ее. Теорема 2. Собственные векторы, отвечающие различным собственным значениям линейного преобразования, линейно неза- висимы. В самом деле, пусть ръ р2.......?т — различные собственные значения и аъ аг, ..., ат — отвечающие им собственные векторы линейного преобразования еЖ. По индукции можно считать, что ai, ..., линейно независимы. Допустим, что ai, ..., ат свя- заны зависимостью Я1Й1 + ... -j- = О. Применяя к обеим частям этого равенства преобразование получим aipi^i -f-... -ф- ят-»Рт-1а/п-1 “h-amPmam = °*
§ 12] ПРЕОБРАЗОВАНИЯ С МАТРИЦЕЙ НОРМАЛЬНОЙ ФОРМЫ 145 Исключив ат, будем иметь а1 (pm — pl) G1 4“ •. • + ат-1 (рт — Рт-1) йт-1 = О. Вследствие линейной независимости ait am_i это дает 04 = ... ,.. — а.т 1 = 0 и, следовательно, am = 0, что и требовалось. Сопоставляя обе доказанные теоремы, получаем такое след- ствие: если характеристический многочлен линейного преобразова- * ния п-мерного пространства имеет п различных корней, то мат- рица преобразования в подходящей координатной системе при- водится к диагональной форме. Например, характеристический многочлен матрицы 31 2~ _ 2 имеет корни ± 1, ±2; соответствующие собственные векторы имеют координатные строки [2, 3, —5, —4], [0, 3, —1, 4], [О, 0, 4, 5], ДО, 0, 0, 1]. Выбирая их в качестве координатных векторов, приведем матрицу А к диагональной форме с числами 1, —1, 2, —2 по главной диагонали. 12.2. Клетки Жордана. Матрица вида 1 0 ... (Г р 1 ... о л = р/;;° (1) р 1 р_. называется клеткой Жордана. Характеристический многочлен клетки Жордана равен (К — р)'г, где п — порядок матрицы. Сле- довательно, р является ее единственным собственным значением и имеет кратность п. Пусть £ — линейное пространство с базисом еь е.>, ..., еп и еЖ — линейное преобразование, имеющее в отмеченном базисе матрицу А вида (1). Тогда е&Ж = pei Д- е2, .... епЛоЖ == ре„л Д- еп, епоЖ — ре„ (2) и, следовательно, е^АоЖ — pg)—д, — pg)2 = e3, .... е,(еЖ — pg)""1 = еп. (3) Так как еЖ должно быть корнем своего характеристическо- го многочлена, то — pg)'* = <^’. Минимальный многочлен
146 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ [Гл. Ill преобразования делит его характеристический многочлен и по- тому должен иметь вид (X — p)s, 0 < s «5 п. Последнее из равенств (3) показывает, что и потому s = n, т. е. мини- мальный многочлен клетки Жордана совпадает с ее характери- стическим многочленом (/ — р)п. Обозначим через 2/ подпространство, натянутое на базисные векторы ег, ег_г1, ..., еп (i = 1, 2, ..., п). Из равенств (2), а также и из вида матрицы А следует, что все эти подпространства инва- риантны. С помощью соотношений (3) легко проверить, что 2г состоит из тех и только тех векторов х, для которых х(^ —р£,)^г'н = о. Это показывает, что цепочка подпространств 2 = 2i => 2г гэ... ... zz zd о не зависит от выбора координатной системы и опре- деляется самим преобразованием оЛ. Докажем, что других инвариантных подпространств преобра- зование не имеет. В самом деле, пусть ЭЛ •— какое-либо инва- риантное подпространство для е^, отличное от 2г, Ищем такое I, чтобы ЭЛцэ2;, Э)1Д)2г_1, полагая для общности 2п+1 = о. Пока- жем, что 3)1 = %t. Для этого рассмотрим произвольный вектор + + («/^О) (4) из ЭЛ. Если j^i, то а С Допустим, что j<Z_i. Применяя к обеим частям (4) преобразование (оЖ — pg)'-7-1, получим а(еЖ — pg)1 1 = Д-ау+1бг Д-...-|-ап_г-+у+1ея £ ЭЛ. Так как по предположению eit ..., еп £ ЭЛ, то e;_i С ЭЛ, а сле- довательно, 2,_1Сц2Л, что противоречит выбору г. Поэтому ЭЛ cz2;, откуда 3)1 = it. Заметим еще, что матрица преобразования не распадается ни в одной координатной системе. Действительно, распадение матрицы оЖ равносильно распаде- нию 2 в прямую сумму инвариантных подпространств, а послед- нее невозможно, так как из любых, двух инвариантных подпро- странств преобразования оЖ одно обязательно содержится в дру- гом, тогда как в прямой сумме слагаемые имеют нулевое пере- сечение. 12.3. Корневые подпространства. Линейные преобразования, матрицы которых приводимы к диагональному виду или к клетке Жордана, охватывают не всю совокупность матриц. В общем случае над полем комплексных чисел матрицу любого линейного преобразования можно привести к клеточно-диагональной форме с клетками Жордана по диагонали. Матрицы последнего вида называются жордановыми или имеющими жорданову нормальную форму.
$ 12J ПРЕОБРАЗОВАНИЯ С МАТРИЦЕЙ НОРМАЛЬНОЙ ФОРМЫ 147 Пусть в некотором базисе ., еп матрица линейного преоб- разования имеет нормальную жорданову форму Л = Л1Ц- -f-... As, (5) где At — клетка Жордана порядка с собственным значением рг (i = l, s), щr\-ns = n. Клетке Лг отвечает инвариант- ное подпространство g(,), натянутое на векторы ep.+l, ер.+^, , ед. (pi = ni +--• + Ул — Pi + ni)- Преобразование индуцирует в подпространстве 2(!) преобразование <г^г, матрицей которого и является клетка Лг. Согласно предыдущему все векторы х из удовлетворяют соотношению x(e^t — pzg,;)"i — О, а следовательно, и соотношению х(оЛ— $i&)nl = O. (6) Однако теперь уже нельзя сказать, что соотношение (6) харак- теризует только векторы из gt!), поскольку среди диагональных клеток > могут найтись и другие клетки с тем же собственным значением. Чтобы разобрать вопрос несколько детальнее, введем следующее определение. Вектор а называется корневым вектором высоты 1г, принадле- жащим корню р преобразования erf, если a (pg — е^)Л = 0. Понятие корневого вектора является обобщением понятия собственного вектора, так как собственные векторы — это корне- Еые векторы высоты 1. Совокупность всех корневых векторов, принадлежащих некото- рому фиксированному корню р преобразования erf, есть инва- риантное подпространство 8р, называемое корневым подпростран- ством преобразования orf. Действительно, если х, у принадлежат £-р и имеют высоты hi, hn, то при /г = тах(й1, /г2) имеем (ах фу) (pg — а^)Л = ах (pg — е^)л фУ (р& — е^)Л = О, Xerf (pg — е^)Л = X (pg — orf = О. Корневые векторы, принадлежащие различным корням, обяза- тельно линейно независимы. Более того, справедлива и более сильная Теорема 3. Если сумма Х!-]-х3-±-хт = х корневых век- торов, принадлежащих различным корням ръ ..., рт преобразова- ния erf, содержится в инвариантном подпространстве то каждое слагаемое в отдельности содержится в 291.
148 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ (Гл, их Положим ? W = а - pt)h‘ а - • • • (X - pmu)Vi. По условию (е^) й в то же время Xi? (®^) — (е^) =... = (е^) = О. Следовательно, хт<р (оЖ) £ ЭЛ. Многочлены <р (X) и (X — pm)hm взаимно просты. Поэтому найдутся такие многочлены F (X), G(X), что 1 = tp (X) У7 (X)(X — G (X), откуда g = ср (ет/) F + (е^ — рш§) »» G (&Ж), и, следовательно, хт = xmcp (е^) F (в#) 4~ Хт (&F — рт^т G (е#) = (е^) F (гЖ) С ЭЛ, что и требовалось. Сформулированное выше утверждение о линейной независимо- сти векторов xi, .... хт получается из доказанной теоремы при ЭЛ=о. В качестве следствия отметим также, что различные кор- невые подпространства имеют нулевое пересечение. Вернемся теперь снова к случаю, когда в некотором базисе матрица преобразования аЖ имеет нормальную форму Жордана (5). Выше были определены две серии подпространств: корневые под- пространства SP1, ..., и подпространства §6), .g^)) отве- чающие диагональным клеткам матрицы А. Чтобы выяснить связь между обеими сериями, обозначим через ЭЛ(1) сумму тех подпространств 8(,), которые'отвечают клеткам с собственным значением рь и аналогично определим ЭЛ(2), ..., ЭЛ(т). Ввиду этого из разложения g=g(l)Jj_g(‘2) путем объединения отдельных слагаемых получается разложение £ = ЭЖ1)-Н^’2)+--- + ЭЖ'Л’. (7) Ясно, что ЭЛ(1)<=8Р. (i = 1....т). Поэтому вместе с (7) имеет место и разложение Так как согласно теореме 3 сумма (8) прямая, то, сравнивая ее с (7), получим требуемые равенства ЭЛ(г,=--?Р;. Итак, если матрица преобразования &F может быть приве- дена к нормальной ферме Жордана, то пространство 2 есть прямая сумма корневых -подпространств , причем каждое кор- невое подпространство в свою очередь есть прямая сумма под-
ПРИМЕРЫ И ЗАДАЧИ 149 пространств, отвечающих клеткам Жордана с заданным собствен- ным значением. Приведенные рассуждения показывают также, что корневые подпространства определяются однозначно самим преобразова- нием оЖ и не зависят от выбора координатного базиса еп. Что касается подпространств £(1), то они, вообще говоря, зависят не только от еЖ, но и от способа приведения матрицы к нормаль- ной форме. Примеры и задачи 1. Пусть преобразование еЖ в базисе et, е3 имеет матрицу А = Гб И Г7 П = Л + Л + Д3, где Л1 = Д,= , Л3= . Корневые подпростран- [о bj * J ства суть Vo = Ket+ Ke,2 ф- Ke.3 + Ке^ и = Кеъ + Ket (К— основное поле), а 1!(11 =/<«!-j-A'Ca, £!|21 — Ке3 4- В новом базисе е\ = + еы = е2 е4, е'3 — et — es, e't = e3 — е4, е'. = е5, е'а = еа матрица оЖ будет той же самой, однако соответствующие клеткам Жордана подпространства Ал?; и Ке', Ке* будут уже иными. 2. Найти минимальные многочлены матриц 2 1 Г 3 1 4 2 1 1 2 1 2 2 1 11 Г2 1 Г 2 1 2 0 з] ’ 1 2 3. Матрица приводима к диагональной форме над полем комплексных чисел тогда и только тогда, когда минимальный многочлен ее не имеет кратных корней. 4. Если матрица преобразования приводима к нормальной форме Жор- дана, то каждое ее инвариантное подпространство есть прямая сумма пере- сечений его со всеми корневыми подпространствами преобразования. 5. Если матрица порядка п имеет п различных характеристических чисел, то соответствующее линейное преобразование имеет всего 2” инва- риантных подпространств, включая нулевое и все пространство.
Г л а в а IV МНОГОЧЛЕННЫЕ МАТРИЦЫ w Почти все матрицы, с которыми мы до сих пор встречались, имели своими элементами числа основного тела Д. Однако в связи с понятием характеристического многочлена нам пришлось рас- сматривать характеристическую матрицу \Е— А, элементы кото- рой были не числа из Д’, а многочлены от X с коэффициентами из К, причем предполагалось, что. само Д является полем. В настоящей главе мы займемся систематическим изучением свойств многочленных матриц, т. е. матриц, элементы которых являются многочленами от X с коэффициентами из основного поля. Эти результаты мы применим затем к задаче нахождения жордановой формы матрицы линейного преобразования. § 13. Инвариантные множители 13.1. Эквивалентность. Рассмотрим квадратную матрицу п-го порядка 7и(Х).../1?(Х)- элементами которой являются многочлены от буквы X с коэф- фициентами из основного поля Д. Матрицы такого вида мы будем называть многочленными или ^--матрицами *). Над Х-матрицами часто приходится совершать следующие преобразования: I. Умножение какой-либо строки на число из К, отличное от нуля. II. Прибавление к одной строке матрицы'какой-либо другой ее строки, умноженной на произвольный многочлен f (X). III. Умножение какого-либо столбца на число из К, отличное от нуля. IV. Прибавление к какому-нибудь столбцу элементов другого столбца, умноженных на произвольный многочлен f(E). *) Мы всюду предполагаем, что рассматриваемые матрицы квадратные, хотя многие результаты непосредственно переносятся и на прямоугольные Х-матрицы.
§ 13J ИНВАРИАНТНЫЕ МНОЖИТЕЛИ 151 Эти преобразования называются элементарными преобразова- ниями ^-матриц. Если над какой-нибудь Х-матрицей произвести элементарное преобразование, то получится опять некоторая Х-матрица; над этой матрицей можно снова произвести элемен- тарное преобразование и т. д. Говорят, что Х-матрица F экви- валентна Х-матрице G, если F можно получить из G цепочкой элементарных преобразований. Во многих случаях оказывается полезной следующая лемма: Элементарными преобразованиями I, II можно переставить любые две строки '/.-матрицы, а элементарными преобразованиями III, IV можно переставить любые два ее столбца. В самом деле, пусть нам требуется поменять местами i-ю и j-ю строки матрицы. Легко видеть, что мы достигнем этого, совершив следующие элементарные преобразования: 1) к i-й строке прибавим j-ю; 2) к j-й строке новой матрицы прибавим ее i-ю строку, умноженную на —1; 3) j-ю строку получившейся матрицы умножим на — 1; 4) к i-й строке последней матрицы прибавим ее j-ю строку, умноженную на —1. Если аналогичные преобразования совершить над столбцами, то в результате поме- няются местами i-й и j-й столбцы. Лемма доказана. Из этой леммы следует, что если матрица F отличается от G только порядком строк или столбцов, то F эквивалент- на G. Из определения эквивалентности Х-матриц непосредственно вытекают следующие свойства: 1. Отношение эквивалентности транзитивно", если F эквива- лентна G, a G эквивалентна Н, то F эквивалентна Н. В самом деле, по условию G можно получить из Н, a F из G цепочкой элементарных преобразований; следовательно, F можно получить цепочкой элементарных преобразований из Н. 2. Отношение эквивалентности симметрично-, если F эквива- лентна G, то G эквивалентна F. Другими словами, если F можно получить из G цепочкой элементарных преобразований, то и G можно получить из F цепочкой элементарных преобразова- ний. Докажем сначала, что если F можно получить из G каким- нибудь одним элементарным преобразованием, то G также можно получить из F одним элементарным преобразованием. Для этого мы пересмотрим все четыре типа элементарных преобразований. Пусть F получается из G преобразованием типа I, т. е. умноже- нием какой-либо i-й строки G на число а 0. Тогда, умножая i-ю строку F на а-1, мы,, очевидно, получим G. Пусть теперь F получается из G преобразованием типа II, например путем при- бавления к i-й строке матрицы G ее j-й строки, умноженной на /(X). В таком случае, прибавляя к i-й строке матрицы F ее j-ю
152 МНОГОЧЛЕННЫЕ МАТРИЦЫ [Гл. IV строку, умноженную на —/(>), мы получим обратно G. То же самое можно сказать и относительно преобразований типа III, IV. Мы видим, следовательно, что для каждого элементарного преобразования существует элементарное преобразование, ему обратное, отменяющее результат первого. Поэтому, если матрица F получается из G цепочкой элементарных преобразований, то, совершая обратные преобразования в обратном порядке, мы из матрицы F получим матрицу G, что и требовалось. 3. Отношение эквивалентности рефлексивно: каждая матрица эквивалентна самой себе. Например, совершая над F два взаимно обратных преобразо- вания, мы получим снова F. 13.2. Диагональная форма. Выше было показано, что отноше- ние эквивалентности транзитивно, симметрично и рефлексивно. Отсюда следует, что Х-матрицы можно разбить на классы экви- валентных друг .другу. Возникает вопрос: нельзя ли указать такую форму Х-матрицы, чтобы в каждом из этих классов содер- жалась одна и только одна матрица заданной формы? Формы, обладающие таким свойством, называются каноническими. Мы покажем, что для Х-матриц диагональная форма с некоторыми дополнительными условиями делимости будет в этом смысле канонической формой. Определение. ы матрица вида 71 (7 h (7 МТ. называется канонической диагональной, если каждый диагональный элемент ft (X) является делителем следующего (X) и если все отличные от нуля многочлены fi (X), ..., fn (X) имеют старший коэффициент 1. Отсюда следует, что если среди диагональных элементов кано- нической диагональной матрицы встречаются нули, то они должны занимать последние места, так как нуль не может быть делите- лем никакого ненулевого многочлена. С другой стороны, если среди диагональных элементов встречаются числа, отличные от нуля, то они должны быть равны 1 и занимать первые места, так как 1 ни на какой многочлен со старшим коэффициентом Г, кроме 1, не делится. Следовательно, каноническая диагональная
§ 13] ИНВАРИАНТНЫЕ МНОЖИТЕЛИ 153 матрица в общем случае будет иметь вид 1 ’дм О О где многочлены Д (X), fk (X) непостоянные, со старшим коэф- фициентом 1, причем каждый из них является, делителем следу- ющего. Теорема 1. Всякая ^-матрица конечным числом элементар- ных преобразований может быть приведена к канонической диаго- нальной форме. Доказательство. Пусть G — заданная Х-матрица. Если G — О, то доказывать нечего, так как О уже имеет нормальную форму. Предположим поэтому, что G Ф О. Среди всех Х-матриц, эквивалентных G, выберем ту, у которой элемент, стоящий в левом верхнем углу, отличен от нуля и имеет наименьшую степень. Пусть эта матрица есть F = УиР) ... Д„(Х)- _д;м... д„м_ Покажем, что все элементы первой строки и все элементы пер- вого столбца матрицы F делятся на /и (X) без остатка. В самом деле, пусть /li(X) = /n(X)<?i(X) + r;(X) (t = l, 2, ..., п), (1) где qt (X), п (X) — частное и остаток от деления fu (X) на fn (X). Произведем над F следующее элементарное преобразование: из элементов i-ro столбца вычтем элементы первого, умноженные на <7/(Х). Равенство (1) показывает, что элемент, стоящий'в пер- вой строке и i-м столбце новой матрицы, будет равен г, (X). Если
154 МНОГОЧЛЕННЫЕ МАТРИЦЫ [Гл. IV г,- (X) Ф 0, то степень rz(X) меньше степени делителя /ц(Х). Пере- ставляя первый и х-й столбцы, мы получим матрицу, эквивалент- ную F и имеющую в левом верхнем углу многочлен г, (X) меньшей степени, чем /ц (X), что противоречит ’определению матрицы F. Таким образом, rz(X) = O. Обозначая теперь через <7,- (X) частное от деления (X) на /и (X), произведем над матрицей F следующие элементарные пре- образования: из второго столбца вычтем первый, умноженный на <7а (X), затем из третьего столбца вычтем первый, умноженный на </з (X), ит. д. После этого произведем аналогичные преобразования над строками. В результате матрица F заменится эквивалентной матрицей 7п(Х) 0 ... о - я== 0 /г-22 (X) ... (X) О /г„2 (X) ... hnn (X) где ftZ/(X) — некоторые многочлены. Все hijtty делятся без остатка на /и (X). Действительно, если бы какой-нибудь из них, hi/ft), не делился на /и (X), то, при- бавляя к первой строке матрицы Н ее i-ю строку, мы получили бы матрицу Q, обладающую следующими свойствами: 1) Q эквивалентна G, 2) левый верхний элемент матрицы Q отличен от нуля и имеет наименьшую степень, 3) в первой строке матрицы Q имеется элемент /zi;(X), не делящийся на первый элемент этой строки. Однако мы видели, что из первых двух свойств вытекает делимость всех элементов первой строки на ее первый элемент. Следовательно, третье свойство противоречит первым двум, и наше утверждение доказано. Итак, мы показали, что для каждой Х-матрицы G существует эквивалентная ей матрица Н вида (2), где все /г/у(Х) делятся на /и (')• Теперь будем производить элементарные преобразования над матрицей 7/1 = /г>22 (X) ... hin (X) ••• hnn(Х)_ Каждое элементарное преобразование над Hi можно рассматривать и как элементарное преобразование матрицы Н. Легко видеть, что при этом первая строка и первый столбец матрицы Н меняться не будут. Кроме того, поскольку все элементы матрицы Hi делятся на /и (X), то и все элементы новых матриц, возникающих из Hi в результате элементарных преобразований, также будут делиться на /и (X).
§ 131 ИНВАРИАНТНЫЕ МНОЖИТЕЛИ 155 Применяя доказанный выше результат к матрице Hi, мы видим, что Hi можно элементарными преобразованиями привести к форме “ha3(X) 0 ... О ~ 0. MX) ... йз„(Х) _6 /гл3(Х) ... йлл’(Х)_ а матрицу Н, следовательно, — к форме /1-22 (X) Изз(Х) ... Йз„(Х) , /г„з'(Х) .../г„л(Х)_ где все (г, / = 3, ..., п) делятся на /г22(Х), а /г22(Х) делится на /и (X). Продолжая этот процесс дальше, мы через конечное число шагов получим требуемую каноническую диагональную форму. Из нашего доказательства нетрудно извлечь и практический способ для приведения Х-матриц к канонической диагональной форме. Идея его состоит в том, чтобы, пользуясь элементарными преобразованиями, сначала уменьшить степень элемента, стоящего в первой строке и первом столбце, и обратить в нуль остальные их элементы. После того как первая цель достигнута, применяем тот же способ к оставшемуся углу Hi и т. д. Теорема 1 утверждает, что каждый класс эквивалентных мат- риц содержит по меньшей мере одну матрицу, имеющую кано- ническую диагональную форму. В следующем пункте будет пока- зано, что такая матрица в каждом классе единственная. 13.3. Наибольшие общие делители миноров. Пусть F — какая- нибудь Х-матрица порядка п. Составим ее всевозможные миноры порядка k (k = 1, 2, ..., п). Эти миноры являются многочленами от X. Обозначим их наибольший общий делитель через Dk (F) *). Если окажется, что все миноры k-ro порядка равны нулю, то по определению будем считать Z)ft(X) = O. В частности, А(Х) есть наибольший общий делитель элементов матрицы F, a D„ (X) равен определителю F, деленному на свой старший коэффициент. Теорема 2. Эквивалентные с-матрицы имеют один и тот же наибольший общий делитель миноров k-го порядка (k = 1, 2,..., п). Пусть Flt F% — две эквивалентные Х-матрицы. Обозначим наи- большие общие делители их миноров А-го порядка соответственно *) Наибольшим общим делителем мы условимся всегда называть общий делитель наивысшей степени со старшим коэффициентом 1. Поэтому все не равные нулю многочлены Р*(Х) имеют старший коэффициент 1.
Г56 МНОГОЧЛЕННЫЕ МАТРИЦЫ (Гл. IV через Z)fti(X) и Z)M(X). Требуется показать, что DktQ~) — Dkt(\). Нам известно, что F2 можно получить из Ft цепочкой элементар- ных преобразований. Предположим сначала, что эта цепочка состоит только из одного элементарного преобразования. Пусть, например, Ft получается из Fi умножением всех элементов i-й строки матрицы Fj на число .а V 0. Соответственные миноры Fi и Fa тогда либо совсем не отличаются друг от друга, либо отличаются лишь постоянным множителем а. Однако постоянный множитель не влияет на вычисление наибольшего общего делителя многочленов, поэтому Dki = Dkt. То же самое будет и в случае, когда Ft получается из Fi умножением на а элементов какого-либо столбца матрицы Fj. Пусть теперь Fa получается из Ft преобра- зованием типа II или IV; например, пуст^ Fa возникает в резуль- тате прибавления к i-й строке матрицы Fi элементов /-й строки, умноженных на /(X). Покажем, что Dki делится на Dki. В самом деле, миноры k-ro порядка матриц F1; Fa можно разбить на три класса. К первому мы отнесем те из них, которые не содержат элементов i-й строки. Соответственные миноры мат- риц Fi, Ft в этом случае, очевидно, равны друг другу. Ко вто- рому классу отнесем те миноры, которые содержат элементы и i-й и /-й строк. Эти миноры у матриц Fi, Fa будут снова рав- ными, так как величина определителя не меняется, если к эле- ментам одной из его строк прибавляются величины, пропорци- ональные элементам какой-либо другой строки. Наконец, к треть- ему классу мы отнесем миноры, содержащие элементы i-й строки и не содержащие элементов /-й строки. Соответственные миноры этого класеа имеют вид Mi=fi4 М*= + > где невыписанные строки у обоих миноров одинаковы. На осно- вании теоремы сложения определителей Mt= -Н(Х) =Mi±f^)Ni, где Ni — некоторый минор матрицы Ft. Все миноры k-ro порядка матрицы Fi делятся и на Dki. Из наших рассуждений видно, что на Dkt делятся и все миноры Л-ro порядка матрицы Ft, так как они либо совпадают с соответственными минорами матрицы Ft, либо выражаются через них линейно. Но в таком случае Ры
$ 13] . ИНВАРИАНТНЫЕ МНОЖИТЕЛИ 157 в'ойдет множителем в наибольший общий делитель миноров А-го порядка матрицы Ft, т. е. войдет множителем в Dkt- Итак, если Ft получается из F\ одним элементарным преобразованием, то Dkt делится на Dki. Совершая над Fa обратное элементарное преобразование, мы получим Ft. Поэтому Dki также должен делиться на Dka. Но если старшие коэффициенты двух много- членов равны и эти многочлены делятся без остатка друг на друга, то они совпадают. Таким образом, Dkt = Dkt- Мы пока доказали равенство наибольших общих делителей в предположе- нии, что -Ft получается из Ft одним элементарным преобразова- нием. Однако если Dk (X) не меняется при каждом отдельном элементарном преобразовании, то, очевидно, Dk(/) не изменится и при нескольких последовательных преобразованиях. Поэтому теорему 2 можно считать доказанной в общем виде. Вычислим многочлены Dt (X), ..., £)Л(Х) для матрицы, имеющей канонический диагональный вид ~dt (*) 4(Х)_ Чтобы получить какой-нибудь минор А-го порядка, мы должны из D вычеркнуть п — k строк и п — k столбцов. Если из D вычеркнуть i-ю строку, то в i-м столбце останутся только нули. Поэтому, чтобы получить минор, отличный от нуля, мы должны вычеркнуть все столбцы матрицы D, номера которых равны номерам вычеркнутых строк. Таким образом, отличные от нуля миноры А-й степени должны иметь вид (X) d,k(ft = d^)d4(\)...d4V). (3) Наибольшим общим делителем этих миноров будет Dk (X). Из неравенств 1 -С vj -С v3 ... -С fk п следует, что 1 -С vb 2 ..., Поэтому d,_(X) делится на d,(X), а значит, (X).. (X) делится на dt (X). ..dk (X). Мы. видим, следовательно, что все
158 МНОГОЧЛЕННЫЕ МАТРИЦЫ миноры k-vo порядка матрицы D делятся на минор [Гл. IV d, (X) = d1(F)...dk(\). (4) dft(X) Если этот минор равен нулю, то и все миноры й-го порядка матрицы D также равны нулю. Согласно определению в этом случае £)*(') = 0. Если минор (4) отличен от нуля, то многочлены di (X), ..., dk (X) отличны от нуля и имеют старший коэффициент 1. Но тогда и минор (4) имеет старший коэффициент 1. Поскольку все миноры (3) делятся на (4), то Dk (X) совпадает с (4). Следо- вательно, в обоих случаях имеем 1Ш = й(Х)(/2(Х)...^(Х) (£ = 1, 2, .... п). (5) Таковы многочлены £>*(Х) канонической диагональной матрицы с диагональными элементами di(X),d„(X). Рассмотрим теперь произвольную Х-матрицу F. Обозначим через Dk (X) наибольший общий делитель миноров степени k этой матрицы. Согласно теореме 1 матрицу F элементарными преобра- зованиями можно привести к канонической диагональной форме ~di (X) d„(X) Согласно теореме 2 многочлены Dk (X), вычисленные для матрицы D, совпадают с соответственными многочленами (X), вычисленными для F. Таким образом, многочлены DkQ-) матрицы F и диагональ- ные элементы канонической диагональной матрицы D, к которой можно привести F, связаны соотношениями (5). Пусть О] (X), ..., Dr (X) отличны от нуля, а остальные много- члены Dr+i (X)....D„ (X), если они есть, равны нулю. Тогда из (5) имеем Di(ty — di(ty, d, (Х) = А(Х), Z?2(X) = dI(X)d2(X), d2(X) = Da(X):DL(X), Dr(X) = d1(X)d2(X)...d,(X), Dr+I (X) = dj (X) di (X)... dr (X) dr+1 (X), dr(A) = Dr(*):*W), dr+i(X)=-D^(X):Dz(X).
$ 13J ИНВАРИАНТНЫЕ МНОЖИТЕЛИ 159 Поскольку </г+1(Х)==0, то dr+a(X),.... dn(k) также должны быть равны нулю, и мы имеем окончательно di (X) = Di (X), d2 (X) = Di (X): D> (X).dr (X) = Dr (X): Dr_t (X), dr+i(k) = .,. = dn(k)=O. (6) Тем самым мы получили следующую теорему: Теорема 3. Если наибольшие общие делители Dk (X) миноров порядка k к-матрицы F при k = 1, 2, ..., г отличны от нуля, а Ог+1(Х) = 0, то диагональные элементы dk(F) канонической диагональной матрицы, к которой F приводится элементарными преобразованиями, выражаются через Dk ft) по формулам (6) и определяются, таким образом, матрицей F однозначно. Многочлены di(X),..., d„(X) называются инвариантными мно- жителями матрицы F. Число- г, фигурирующее в равенствах (6), имеет очень простой смысл: это — ранг матрицы F. Действительно, ранг матрицы F есть порядок наивысшего минора F, отличного от нуля. Если этот порядок равен г, то, следовательно, ДГ(Х)^О, а ДГ+1(Х) = О. Обратно, условия Z>r(X)^O, ДЛ+1(Х) = О означают, что некоторый минор порядка г отличен от нуля, а все миноры порядка г —1 равны нулю. Следовательно, ранг F равен г. 13.4. Условия эквивалентности. С помощью результатов пре- дыдущего пункта легко найти условия, при которых две задан- ные Х-матрицы являются эквивалентными. Эти условия мы пред- ставим в двух видах. Первое условие эквивалентности. Для того чтобы многочленные матрицы порядка п были эквивалентны, необходимо и достаточно, чтобы наибольшие общие делители их миноров k-го порядка совпадали при £ = 1, 2, ..., п. Поскольку совпадение наибольших общих делителей миноров равносильно совпадению соответствующих инвариантных множи- телей, то первое условие эквивалентности можно сформулировать и в следующем виде: для эквивалентности к-матриц необходимо и достаточно, чтобы их соответствующие инвариантные множи- тели были равны. Доказательство очевидно. В самом деле, если две Х-матрицы F, G эквивалентны, то их наибольшие общие делители Д*(Х) одина- ковы (теорема 2). Обратно, если многочлены Dk (X) у F и G равны, то F и G элементарными преобразованиями приводятся к одной и той же канонической диагональной матрице (теорема 3). Но две матрицы, эквивалентные третьей, эквивалентны между собой; следовательно, F эквивалентна G, что и требовалось. Второе условие эквивалентности. Для того чтобы многочленные матрицы F и G порядка п были эквивалентны,
160 МНОГОЧЛЕННЫЕ МАТРИЦЫ [Пс IV необходимо и достаточно, чтобы они удовлетворяли соотношению G = PFQ, где Р, Q — некоторые многочленные матрицы с постоянными отличными, от нуля определителями*). Прежде чем перейти к доказательству этого утверждения, мы сделаем несколько замечаний. Пусть 1 а 1 г-я строка, где а — некоторое число, отличное от нуля. Умножая произволь- ную матрицу F на А слева, мы увидим, что все элементы мат- рицы F останутся без изменения, кроме элементов i-й строки, которые умножатся на а. Таким образом, каждое элементарное преобразование типа I, совершаемое над матрицей F, равносильно умножению F на подходящую матрицу А слева. Аналогично, если мы умножим матрицу F слева на матрицу ”1 . . 0 . ; 0 . . 0~ 0 . . 1 . • Ш • •• 0 i-я строка в = 0 . . 0 . . 1 . . 0 j-я строка. 0 . . 0 . . 0 . . 1_ - где все диагональные элементы равны единице, элемент, стоящий в z-й строке и /-м столбце, равен /(X), а остальные элементы *) Эквивалентность Х-матриц была определена выше с помощью эле- ментарных преобразований. Наряду с этим понятие~эквивалентности часто определяют и другим способом. Именно две Х-матрицы G, F называют эквивалентными, если существуют неособенные квадратные матрицы Р, Q с постоянными определителями, удовлетворяющие соотношению G = PFQ. Тогда второе условие эквивалентности оказывается возможным истолковать как теорему о равносильности этих определений.
§ 13] ИНВАРИАНТНЫЕ МНОЖИТЕЛИ 161 равны нулю, то в результате к элементам i-й строки F прибавятся элементы ее ;-й строки, умноженные на /(X). Следовательно, каждое элементарное преобразование типа II равносильно умноже- нию матрицы F слева на соответственную матрицу В. Наконец, тем же способом легко убедиться, что элементарные преобразования матрицы F типа III, IV равносильны умножению F на соответственные матрицы А, В справа. Перейдем теперь к доказательству второго условия эквивалент- ности. Необходимость. Пусть матрица G эквивалентна матрице F. Это означает, что G может быть получена из F цепочкой после- довательных элементарных преобразований. Каждое элементарное преобразование мы можем заменить умножением на матрицу вида А или В соответственно -слева или справа. В результате получим равенство G=p1pa...ppPQ1Qa...Q?, (7) где каждая из матриц Р;, Qy имеет вид А или В (i, / = 1, 2, ...). Положим Р = Р1Р*...Рр, Q = Поскольку определители матриц В равны единице, а определи- тели матриц А являются постоянными, отличными от нуля чис- лами, то определители матриц Р и Q будут также постоянными1, отличными от нуля числами. Соотношение (7) дает G = PFQ, и необходимость доказана. Достаточность. Допустим, обратно, что G = PFQ, (8) где Р и Q — многочленные матрицы с постоянными, отличными от нуля определителями. Наибольший общий делитель £)Л(Х) всех миноров порядка п матрицы Р равен определителю Р, деленному на его старший коэффициент. Так как этот определитель есть постоянное число, то ОЛ(Х) = 1. Из соотношения (5) при k — n получаем Z)„(X)=dI(X)da(X)...d„(X)==l, откуда d1(X) = d.2(X) = ... = d„(X) = l, где di(X),..., d„(X) — инвариантные множители матрицы Р. Но инвариантные множители единичной матрицы Е также все равны •единице, ибо Е имеет канонический диагональный вид. Согласно первому признаку эквивалентности отсюда следует, что матрица Р 6 А. И. Мальцев
162 МНОГОЧЛЕННЫЕ МАТРИЦЫ [Гл. IV эквивалентна Е и, значит, может быть получена из Е цепочкой элементарных преобразований. Каждое элементарное преобразова- ние можно заменить умножением на матрицу типа А или В. В результате Р будет представлена следующим образом: р = Л • • • PkEQi = PbQi ...Qh где Pi, Qj — матрицы типов А, В. Применяя те же самые рассуждения к матрице Q, получим аналогичное разложение Подставляя эти разложения в (8), придем к равенству G = Л ... Р&... QiFMi... MsNi (9) из которого видно, что G получается последовательным умноже- нием матрицы F на матрицы Рг, Qi, М;, N{ типа А или В. Но каждое такое умножение равносильно некоторому элементарному преобразованию. Следовательно, G эквивалентна F, и доказатель- ство закончено. Примеры и задачи 1. Привести элементарными преобразованиями матрицы к канонической диагональной форме. 2. Пользуясь наибольшими общими делителями миноров, найти канони- ческую диагональную форму Х-матриц 'X 1 0 0 - Я-|-Х 1 0 " 0 X 1 0 -₽ а-|-Х 0 1 0 0 X 1 0 0 X -5 4 3 X-f-2_ _ 0 0 -3 а-]-Х- 3. Показать, что всякую прямоугольную Х-матрицу с т строками и п. столбцами можно привести элементарными преобразованиями к виду ... о d,(X) 0 ... О ... О'] О d2(X) ... О ... О О ... d„(X) О ... о О 0 ... dm(K) ... О О ... О Как должно быть сформулировано второе условие эквивалентности для таких матриц?
§14] ЭЛЕМЕНТАРНЫЕ ДЕЛИТЕЛИ 163 4. Показать, что элементарными преобразованиями типов I, II всякую квадратную Х-матрицу можно привести к виду 7и(Х) /1S(X) .../1Я(Х)" /22 (X) ... /2П (X) /ля (X). где диагональные элементы либо равны нулю, либо имеют старший коэф- фициент 1. 5. Вместо Х-матриц рассмотрим целочисленные матрицы, т. е. матрицы, составленные из целых чисел. Элементарные преобразования целочисленных матриц определяются следующим образом: I — умножение строки на ± 1; И — прибавление к элементам одной строки элементов любой другой, умно- женных на некоторое целое число; III, IV—аналогичные преобразования столбцов. Диагональная целочисленная матрица называется канонической, если ее диагональные элементы неотрицательны и каждый предыдущий делит последующий. Доказать теоремы: а) каждая целочисленная матрица может быть конечным числом элементарных преобразований приведена к канонической диагональной форме; б) эта каноническая диагональная форма единственна; в) для эквивалентности двух целочисленных матриц F, G необходимо и достаточно, чтобы между ними существовало соотношение G = PFQ, где Р, Q— некоторые целочисленные матрицы с определителя- ми ± 1. § 14. Элементарные делители Инвариантные множители характеризуют многочленную мат- рицу F с точностью до эквивалентности. Однако если F распа- дается на диагональные клетки, то зависимость инвариантных множителей матрицы F от инвариантных множителей клеток оказывается сложной. Поэтому в некоторых вопросах удобнее рассматривать не инвариантные множители, а так называемые элементарные делители матрицы F, поведение которых в случае распадения F более просто. 14.1. Связь с инвариантными множителями. Рассмотрим про- извольную Х-матрицу F, элементами которой являются многочлены от X с коэффициентами из основного поля К. На поле К. мы не будем здесь налагать никаких ограничений. Обозначим через di (X), d2(X), ..., d„(X) инвариантные множители матрицы F. Часть этих множителей может равняться нулю, поэтому мы предполо- жим для определенности, что di(X).....dr(X) нулю не равны, a dr+1(X) = ... = d„(X)=O. Число г, как мы видели выше, есть ранг матрицы F. Разложим каждый из многочленов dr (X),..., dr (X) на множители, неприводимые в поле К.. Пусть, например, dz(X) = [e1WF1hW]^...bW]4 где sj (X),..., sft (X) — различные неприводимые многочлены со стар- шим коэффициентом 1. Выражения [®i (X)]”1, ..., [еА (X)]"* называ- ем
164 МНОГОЧЛЕННЫЕ МАТРИЦЫ - [Гл, IV ются элементарными делителями инвариантного множителя dt (X). Элементарные делители всех непостоянных инвариантных множи- телей матрицы F называются ее элементарными делителями. Например, если инвариантные множители матрицы F равны соответственно 1, X, X2 (X -j- 1), X2 (X I)2, то элементарные делители будут X, X2, X2, Х-|- 1, (X-f- I)'2- Элементарный делитель вида [е(Х)р, где е (X) — неприводимый многочлен, называют принадлежащим многочлену е (X). В рассмотренном примере элементарные дели- тели X, X2, X2 принадлежат X, а X 1 и (Х-]-1)2 принадлежат Х-|- 1- Возьмем теперь некоторую Х-матрицу F и выпишем все ее элементарные делители. Если при этом какой-нибудь элементар- ный делитель F входит в несколько инвариантных множителей F, то мы его выпишем столько раз, во сколько инвариантных множи- телей он входит. Покажем, что полученная таким образом система элементарных делителей вполне определяет все непостоянные инвариантные множители матрицы F, а если к этому добавить еще порядок и ранг F, то тем самым будут определены и вообще все инвариантные множители матрицы F. Теорема 1. Порядок, ранг и система элементарных дели- телей ^-матрицы F вполне определяют ее инвариантные множи- тели и, следовательно, определяют F с точностью до эквивалент- ности. Доказательство легко уясняется из следующего примера. Пусть порядок F равен 6, ранг 4, элементарные делители X, X2, X2, X — (Х -1-1):|, X — 1, X—1. Поскольку порядок F есть 6, то F имеет шесть инвариантных множителей di(X), ..., d6(X). Из них d8(X) = = (ЦХ) = 0, так как ранг F должен быть 4. Если разложить di(X), ..., d4(X) на множители, то должны получиться указанные семь элементарных делителей. Поскольку, однако, d4 (X) делится на d3(X), d2(X) и di (X), то в d4(X) входят элементарные делители, принадлежащие ко всем неприводимым многочленам, и притом в высших степенях. Поэтому d4 (X) = X2 (X 1 )3 (X—1). Среди оставшихся элементарных делителей X, X2, X —j— 1, X — 1 высшие должны войти в d3(X); следовательно, (X) = X2 (X 1) (X — 1). В свою очередь высшие из оставшихся должны составить da(X), т. е. da(X)=X. Поскольку все элементарные делители уже'рас- пределены, то di (X) = 1. Ясно, что этот способ применим в любом случае, что и доказывает теорему. Элементарные делители зависят от основного поля /(. Напри- мер, пусть инвариантные множители некоторой Х-матрицы F равны X24-l, (X2-|-1)2. Если основное поле есть поле вещественных чисел, то многочлен Ха —1 неприводим и элементарными делите- лями матрицы F являются Х2-|- 1 и (Х2-|- I)2. Однако если основ- ное поле — поле всех комплексных чисел, то X2 1 = (X — /) (X 1)
$ 14] ЭЛЕМЕНТАРНЫЕ ДЕЛИТЕЛИ 165 и элементарными делителями F будут A -j-1, (X z')3, X — z, (Х-о3. 14.2. Элементарные делители распавшейся матрицы. Чтобы получить элементарные делители Х-матрицы, имеющей канони- ческую диагональную форму, достаточно взять, согласно определе- нию, все элементарные делители ее диагональных элементов. Покажем, что это же правило имеет место и для произвольной диагональной Х-матрицы. Лемма. Система элементарных делителей произвольной диаго- нальной Х-матрицы F есть объединение элементарных делителей ее диагональных элементов. Пусть F имеет своими диагональными элементами многочлены /i (X), Д(Х), •••> Без ограничения общности мы можем пред- полагать, что все эти многочлены отличны от нуля и что их старшие коэффициенты равны 1. Обозначим через Dk (X) наиболь- ший общий делитель миноров k-vo порядка матрицы F. Поскольку старшие коэффициенты многочленов Д(Х), ..., /„(X) равны единице, то Dn (X) будет определителем матрицы F, т. е. ^(А) = А(Х)А(Х).../„(Х). Но D„(X) = dI(X)d2(X)...d„ (М. где di(X),..., d„ (А) — инвариантные множители матрицы F. Поэтому, обозначая через е, (X), sa (X), ..., (X) различные неприводимые множители многочленов Д (X),..., f„(X), .мы видим, что каждый элементарный делитель матрицы F будет степенью одного из многочленов г, (X), ..., (X). Выделим теперь из Д (X)./=„(Х) наивысшие степени &i (X), на которые эти многочлены делятся. Пусть A(A) = h(X)F<^(X) (/=1,2....п), где gt (X) на ei (X) не делится. Мы хотим показать, что [®i (А)Г*> • • •, [®i (А)]4" и есть система элементарных делителей матрицы F, принадлежащих неприводимому многочлену ei(X). Поскольку элементарные делители, матрицы F не зависят от порядка ее строк и столбцов, то мы расположим эти строки и столбцы в таком порядке, чтобы .^sn. (1) Найдем наивысшую степень et (X), входящую в Dk (X). Согласно определению П*(Х) есть наибольший общий делитель миноров £-го порядка матрицы F, из которых, как мы видели выше (п. 13.3), отличными от нуля будут только миноры, равные К (Х) ... Nk (х) = h (А)]Ч+-gVi (X)... g4 (X).
166 МНОГОЧЛЕННЫЕ МАТРИЦЫ [Гл. IV Ввиду неравенств (1) наименьшую степень s, (X) содержит минор А (к)... fk (X) = [Sl gt (к) ... gk (X). • Следовательно, Dk (X) содержит sf (X) в степени Sj 4~ sk- Заменяя здесь k на k — 1, мы получим, что Dk_t (X) содержит si (X) в степени Si —s*_i. Но инвариантный множитель dft(X) равен отношению Dk('/) к Z>fe_i(k). Поэтому dk(ty содержит si (X) точно в степени sk- Итак, элементарные делители матрицы F, принадлежащие неприводимому многочлену г, (X), совпадают с принадлежащими et (X) элементарными делителями диагональ- ных элементов матрицы F. Так как наше рассуждение годится и для остальных многочленов е2(Х), ..., еДХ), то лемма доказана в общем виде. Теорема 2. Система элементарных делителей распавшейся матрицы равна объединению систем элементарных делителей ее клеток. Пусть Х-матрица F имеет клеточно-диагональный вид Элементарные преобразования отдельных клеток Ft,...,Fm можно рассматривать и как преобразования всей матрицы F. Эти преобразования' не нарушают клеточно-диагонального вида матрицы F, и преобразования, совершаемые над одной клеткой, не меняют вида всех остальных. Поэтому элементарными преоб- разованиями матрицы F можно привести все клетки к диагональ- ной форме. Применяя лемму, мы видим, что элементарные дели- тели матриц F, Fi, ..., Fm будут являться объедийениями эле- ментарных делителей тех диагональных членов, которые входят в эти матрицы. В частности, элементарные делители матрицы F получатся объединением элементарных делителей всех диаго- нальных элементов, т. е. объединением элементарных делителей всех клеток Л,..., Fm, что и требовалось. Примеры и задачи 1. Найти элементарные делители следующих матриц: “О 0 1 XJ-2~ 0 1 ^+2 1 X—1-2 _Х-|-2 - ООО X3- 0 ОХ (X—1) 0 (X—I)8 _k(X-l) J
§ 15] НОРМАЛЬНЫЕ ФОРМЫ МАТРИЦЫ ЛИНЕЙНОГО ПРЕОБРАЗОВАНИЯ 167 2. Найти инвариантные множители матриц Xs a+i)s Х(Х-1). -х 1 2 3“ X 1 2 X 1 Х_ ~Х 1 0 0~ 0X10 0 1X0 _0 0 1 х_ 3. Найти элементарные делители матрицы ~Ха + 2 X2 4-1 Ха4-Г 3 X2 + 1 3 _Х24-1 Xs+1 Xs + 1_ в поле рациональных чисел, в поле вещественных чисел, в поле комплекс- ных чисел. § 15. Нормальные формы матрицы линейного преобразования 15.1. Деление Х-матриц. Матричным многочленом от перемен- ной X называется выражение вида F (X) = Д0Хт -р Д^'* Ц- А^т~* + ... + Лт, (1) где До....Дт — квадратные матрицы одного и того же порядка с элементами из основного поля /С. Два многочлена называются равными, если равны матрицы, стоящие в этих многочленах при одинаковых степенях переменной X. Складываются и перемно- жаются матричные Х-многочлены по обычным правилам. Ясно, что каждый Х-многочлен можно записать в виде одной матрицы, элементами которой являются обыкновенные многочлены от X, и обратно. Например, 1 2] i Г5 0 3J ' [7 0' 1 Х2 = Xa-j-5X-|-l *6Х-|-2 1 7Х X2 — 2Х 4-3J Поэтому матричные Х-многочлены являются лишь особым видом записи Х-матриц. Если в Х-многочлене (1) матрица До отлична от нулевой, то т называется'степенью матричного многочлена. Многочлен F (X) назы- вается регулярным, если матрица До обратима. Очевидно, степень суммы матричных ^-многочленов не выше максимума степеней слагаемых. На примерах легко убедиться, что степень произведения двух матричных Х-многочленов может оказаться меньше суммы степеней сомножителей. Однако если хотя бы один из двух перемножаемых многочленов регулярен, то степень произведения точно равна сумме степеней сомножителей.
168 МНОГОЧЛЕННЫЕ МАТРИЦЫ [Гл' IV В самом деле, если (2) в(Х)=в0х^4-в1х>’-«4-... +вр и матрица Во обратима, то старший член произведения Л (Х)-В(Х) равен Л9В0Хт+р и из АйВ<ь—О следовало бы 0 = Л0В0Во1 —А» вопреки предположению. Теорема 1. Для произвольного матричного 1-многочлена А (X) и регулярного 1-многочлена В (X) существуют 1-многочлены Р (1), S (X), Q(X), R(l), удовлетворяющие требованиям: а) Л (X) = В (X) Р (X) + S (X), Л (X) = Q (X) В (X) + R (X); б) либо S(X) = O, либо степень S (X) меньше степени В (X); либо R(l) — O, либо степень R(>) меньше степени В(1). Требованиями а), б) указанные многочлены определяются одно- значно и называются: Р (1), 8(1) — левыми частным и остатком, Q (X), R (X) — правыми частным и остатком от деления А (X) на в (а). Для доказательства укажем процесс нахождения частных и остатков, который совпадает в рассматриваемом случае с алго- ритмом деления обычных многочленов. Пусть, например, Л (X), В (X) имеют вид (2). Если т<^р, то можно принять Р(Х) = О, 5(Х)=.Л(Х). Поэтому пусть т'^р. Составляем последовательные разности Si (X) = л (X) - л0 Во1 хт-р в (X) = Со1 чт1 + ..., S2 (X) = В, (X) - Со1 Во '^рв (X) =ь СД1т-> + • •, - (X)=st (X) — C{fBT'lmt-pB (X)=c^’x^+i +..., где точками обозначены члены низших степеней, a mt^<Cp. Скла- дывая эти равенства и полагая S(X) = SZ+1 (X), р (х)=ЛоВо'’хиг-р + с^вт'1т1~р +... + с$вт'1т‘~р, получим первое из соотношений а). Аналогично находятся Q(X), /?(Х). Остается доказать единственность. Но если Л (X) = в (X) р (X) 4- s (X)=в (X) р* (X) 4- в* (X), то В(Х)[Р(Х)-Р* (Х)] = В*(Х)- S(X). Так как многочлен В (X) регулярен, то в случае ненулевой разности Р (X) — Р* (X) степень левой части была бы не меньше степени В(Х), в то время как степень правой заведомо меньше степени В(Х). Поэтому Р(Х) = Р;).(Х) и В(Х) = В* (X).
§ 15] НОРМАЛЬНЫЕ ФОРМЫ МАТРИЦЫ ЛИНЕЙНОГО ПРЕОБРАЗОВАНИЯ 169 15.2. Скалярная эквивалентность. Согласно п. 13.4 две Х-мат- рицы А (X), В (X) эквивалентны тогда и только тогда, если суще- ствуют Х-матрицы U (X), V (X) с не зависящими от X ненулевыми определителями, удовлетворяющие соотношению Л(Х) = С(Х)В(Х) У(Х). (3) Условимся говорить, что матрица А (X) скалярно эквивалентна матрице В(Х), если существуют неособенные матрицы U, V с не зависящими от X элементами, удовлетворяющие соотношению (3). Матрицы с не зависящими от X элементами будем называть ска- лярными. Теорема 2. Если ^-многочлены первой степени А^АгВ, СХ D регулярны и эквивалентны, то они и скалярно эквива- лентны. По условию ЛХ4-В = (/(Х)(СХ4-Р) V(X), (4) где U (X), V (X) — матрицы с отличными от нуля постоянными определителями. Обозначим через Р, S левые частное и остаток от деления U (X) на ЛХ -J- В, а через Q, R — правые частное и остаток от деления V (X) на ЛХ -|- В. Следовательно, С/ = (ЛХ-4-В)Р + 5, У = (3(ЛХ4-В)4-7?. (5) Матрицы S и R скалярны, так как их степень меньше единицы. Покажем, что ЛХ + В .-= S (С/. 4-D)/?. (6) Действительно, умножая обе стороны равенства (4) на U~l и под- ставляя вместо V его выражение из (5), получим, перенеся члены, [С/-1 — (СХ + D) Q] (ЛХ + В) (СХ + D) р. Сравнивая степени левой и правой частей, видим, что выражение внутри квадратных скобок должно равняться некоторой скалярной матрице Т, и мы имеем T = U~' — (CX-j-O)Q, Т(ДХ4-В) = (СХ4-2?)7?. (7) Отсюда Е = U (СХ 4- D) Q + UT = (ЛХ -j- В) V-’Q 4- UT = = (ЛХ 4- В) V-'Q 4- [(ЛХ 4- В) Р + S] т, • т. е. Е=(Лх 4- в) [ 4- рт] 4- st. Но правая часть может иметь нулевую степень только в случае обращения в нуль квадратной скобки, откуда E — ST, T=S~l.
170 МНОГОЧЛЕННЫЕ МАТРИЦЫ [Гл. IV Сравнивая с (7), получаем (6), где S, а значит, и R — обратимые ска- лярные матрицы. 15.3. Критерий подобия матриц. Согласно п. 3.1 квадратные матрицы А, В над полем К называются подобными, если суще- ствует обратимая матрица Т с элементами из К. такая, что А = Т^ВТ. (8) Важность нахождения условий, при которых данные матрицы были бы подобны, была выяснена в гл. III. С помощью уже полученных результатов легко указать необходимые и достаточные условия подобия матриц и тем самым решить одну из основных задач теории матриц. Теорема 3. Для того чтобы матрицы А, В над произволь- ным полем К были подобны, необходима и достаточно, чтобы их характеристические матрицы ьЕ — А и ьЕ — В были эквива- лентны. Необходимость очевидна, так как из (8) следует, что 'kE — A = T~i (1Е — В)Т, т. е. что Х£— Ви ХЕ— Л эквивалентны и даже скалярно экви- валентны. Пусть, наоборот, матрицы ХЕ — В и ХЕ — А эквива- лентны. Так как они представляют собой матричные Х-многочлены, регулярные и первой степени, то в силу теоремы 2 они будут скалярно эквивалентными, т. е. найдутся такие неособенные ска- лярные матрицы S, R, что IE — A = S(IE — B)R. Сравнивая, в этом равенстве коэффициенты при X и свободные члены, получим E = SR, A = SBR, откуда A — R~lBR, (9) что и требовалось. Из доказанных теорем можно извлечь следующий алгоритм для распознавания подобия матриц А, В: составляем характери- стические матрицы ХЕ— А, >.Е— В и процессом, описанным в п. 13.2, приводим их элементарными преобразованиями к кано- нической диагональной форме. Если эти формы совпадают, то матрицы А, В подобны; если различны, то А и В не подобны. Иногда, кроме установления самого факта подобия, требуется найти и преобразующую матрицу Т, для которой В = Т~*АТ. В этом случае при небольшом порядке п рассматриваемых матриц полагают Т =^| ttj ||, переписывают матричное равенство ТВ — АТ в виде п* равенств между элементами ТВ и АТ и рассматривают эти равенства как линейные однородные уравнения относительно
§ 15] НОРМАЛЬНЫЕ ФОРМЫ МАТРИЦЫ ЛИНЕЙНОГО ПРЕОБРАЗОВАНИЯ 171 неизвестных величин Ziy(t, j—l, 2......п). Решая эту систему, находят Т. При больших п изложенный способ слишком громоздок, и предпочтительнее путь, указанный в самом доказательстве тео- ремы 3. Прежде всего, зная элементарные преобразования, пере- водящие матрицы ХЕ — А, f-E— В в каноническую диагональную форму, а следовательно, и элементарные преобразования, пере- водящие ХЕ— А в ХЕ— В, можно согласно п. 13.4 найти Х-мат- рицы U (X), V (X), для которых ХЕ — А = U (X) (ХЕ — В) V (X). Вычисляя правый остаток R от деления V (X) на ХЕ — А, будем иметь согласно (9) A — R'BR, т. е. R будет одной из искомых преобразующих матриц. Заметим, что для нахождения R нет необходимости фактически делить V (X) на ХЕ — А. В самом деле, записывая V (X) в виде P(X) = ]Z0Xft + y1X^+ ... + и применяя схему деления из п. 15.1, получим + УМ6-14-... 4- vk. (10) Аналогично, записывая многочлен U (X) в «левом» виде: E(X)=XU + XZ-1E1+ ... 4-£z> и выполняя левое деление на ХЕ — А, получим для левого остатка S выражение Е = + ... 4 £z. (11) Эти формулы для остатков от деления матричного Х-многочлена на двучлен ХЕ — А совершенно аналогичны формуле Безу r = f(a) для остатка от деления обычного многочлена f (X) на двучлен X — а. Поэтому (10), (11) иногда называют матричными формулами Безу для остатков. 15.4. Нормальная форма Жордана. В п. 12.2 были введены матрицы особого вида, названные жордановыми матрицами, и изучены некоторые свойства линейных преобразований, матрицы которых в подходящей координатной системе имеют жорданову форму. Однако основной вопрос, при каких условиях матрицу преобразования можно привести к жордановой форме, был оставлен открытым. Но теперь имеются все необходимые средства, чтобы ответить на этот вопрос. Теорема 4. Каждая квадратная матрица над-полем ком- плексных чисел, а также и над любым другим алгебраически зам- кнутым полем подобна матрице, имеющей жорданову форму. Две матрицы Жордана подобны тогда и только тогда, когда они
172 МНОГОЧЛЕННЫЕ МАТРИЦЫ [Гл. IV составлены из одних и тех же жордановых клеток и отличаются друг от друга самое большее лишь расположением клеток на глав- ной диагонали. Доказательству теорэмы предпошлем две леммы, ,имеющие и самостоятельный интерес. Лемма 1. Характеристическая матрица клетки Жордана имеет только один элементарный делитель (X — р)", где п — по- рядок клетки, а р — ее собственное значение. Характеристическая матрица заданной клетки Жордана (см. п. 12.2) имеет вид \Е — А — “X — р —1 0... 0 0 ~ Х-р —1 ... 0 0 X — р — 1 х — р_ • Вычислим наибольший общий делитель £>ft(X) миноров порядка k ' матрицы ХЕ — А. Прежде всего, имеем Dnfl)=^E-A\ = fl-Py. Далее, Dn i fl) есть наибольший общий делитель всех миноров степени п—1. Но среди последних находится минор -1 0 .. 0 0 X — р -1 .. 0 0 х — р ... 0 0 =(— I)"-1 X — р — 1 получаемый вычеркиванием первого столбца и последней строки матрицы ХЕ — А. Поскольку этот минор равен ± 1, то ЬпЛ fl) — 1. Обозначим через dt (X), ... , dnfl) инвариантные множители мат- рицы ХЕ — А. Из соотношений (X) = rf, (X) ... 4л(Х)-1, £Я(*) = <ММ dn_tfl)dnfl)^fl-P)n вытекает, что di (X) = ... = dn_i (X) = 1, dn fl) — fl — р)л. Следо- вательно, ХЕ — А имеет только один элементарный делитель и этот делитель равен (X — р)л. Лемма 2. Система элементарных делителей характеристи- ческой матрицы жордановой матрицы состоит из элементарных делителей ее клеток Жордана и определяет вид жордановой матрицы К
§15) НОРМАЛЬНЫЕ ФОРМЫ МАТРИЦЫ ЛИНЕЙНОГО ПРЕОБРАЗОВАНИЯ 173 однозначно с точностью до порядка следования клеток по главной диагонали. По определению жордановой 'матрицей называется клеточно- диагональная матрица с клетками Жордана по главной диаго- нали. Поэтому характеристическая матрица для матрицы Жор- дана распадается на характеристические матрицы для отдельных клеток Жордана. В силу п. 14.2 отсюда следует, что система элементарных делителей характеристической матрицы для матрицы Жордана состоит из элементарных делителей характеристических матриц отдельных клеток Жордана, по одному для каждой клетки. Тем самым система элементарных делителей характеристической матрицы для матрицы Жордана определяет вид этой матрицы однозначно с точностью до порядка расположения клеток по глав- ной диагонали. Характеристические матрицы подобных матриц эквивалентны и потому имеют одинаковые системы элементарных делителей. Отсюда следует, что подобные матрицы Жордана должны состоять из одинаковых клеток Жордана, и для завершения доказатель- ства теоремы 4 остается только для каждой заданной матрицы А уметь построить подобную ей матрицу Жордана. Пусть (X — pi)”1, ... , (X — Рл-)”5 — полный набор элементарных делителей характе- ристической матрицы ХЕ — А. Обозначим через В клеточно-диаго- нальную матриц^ диагональными клетками которой являются клетки Жордана с указанными элементарными делителями. Сле- довательно, матрица ХЕ — В имеет те же элементарные делители, что и ХЕ — А. Но тогда согласно п. 14.1 матрицы ХЕ — А и ХЕ—В эквивалентны, а согласно п. 15,3 отсюда вытекает,' что А подобна жордановой матрице В. Теорема доказана. Изложенные рассуждения дгют ответ и на вопрос о том, как по заданной матрице А найти подобную ей матрицу Жордана. Для этого достаточно составить характеристическую матрицу ХЕ — А, привести ее элементарными преобразованиями к канонической диагональной форме, разложить диагональные многочлены на множители, найти элементарные делители и по ним составить матрицу Жордана. Пусть, например, Составляем характеристическую матрицу -X —3 ХЕ —Л = 7 — 1 3' X 4-2 —9 1 Х-4
174 МНОГОЧЛЕННЫЕ МАТРИЦЫ [Гл. IV ) и ищем ее инвариантные множители. Эти множители, как легко видеть, будут 1, 1, (X — 1)(Х— 2)'2. Следовательно, элементарные делители равны X — 1, (X — 2)2 и жорданова матрица имеет вид 0‘ 1 2 В заключение сделаем еще одно замечание. Если элементар- ные делители матрицы ХЕ — А окажутся первой степени, то пер- вого порядка будут и клетки Жордана в соответствующей жор- дановой матрице В, т. е. матрица В будет диагональной. Обратно, если соответствующая жорданова матрица диагональна, то эле- ментарные делители будут первой степени. Таким образом, для того чтобы заданная матрица была подобна диагональной, необхо- димо и достаточно, чтобы все элементарные делители ее характе- ристической матрицы были первой степени. 15.5. Естественная нормальная форма. В поле комплексных чисел всякая матрица подобна некоторой жордановой матрице. Если же в качестве основного поля Е взять произвольное поле, то приведение к жор- дановой форме может оказаться невозможным. Для такого приведения во всяком случае необходимо, а также, как легко видеть, и достаточно, чтобы характеристический многочлен матрицы разлагался в /С на линейные множители. Поэтому возникает-задача — указать такую нормальную форму, к которой можно было бы привести матрицу в том поле, из которого берутся элементы этой матрицы. Таких нормальных форм можно указать бесконечное множество. Из них наиболее просто строится нормальная форма, называемая естественной. Пусть / (X) = а0ахХ. +ая_1Х'>-‘ + Х'’ — произвольный многочлен ненулевой степени, старший коэффициент кото- рого равен единице. Коэффициенты многочлена /(X) мы будем предполагать лежащими в некотором поле К- Матрица -О 1 0 ... О 0- 0 0 1 ... о о 0 0 0 ... 0 1 _ «о а1 ai ••• —ап-з —ап-1- называется сопровождающей матрицей многочлена f (X). Лемма 3. Если — многочлен ненулевой степени со старшим коэффициентом 1 и А — его сопровождающая матрица, то инвариантные множители характеристической матрицы СЕ —А равны 1, 1, ..., 1,/(X).
§ 15] НОРМАЛЬНЫЕ ФОРМЫ МАТРИЦЫ ЛИНЕЙНОГО ПРЕОБРАЗОВАНИЯ 175 В самом деле, если /(X) = а0-|-atX-f- 1 + Гп, то -х — 1 0 . .. 0 0 - ГЕ — А = 0 X — 1 . . 0 0 0 0 0.. . X —1 _«о «1 а3 . • ал-а 4" an-i- Вычеркивая первый столбец и последнюю, строку, мы получим минор, равный (—1)л-1. Следовательно, наибольший общий делитель Dn_t (X) мино- ров порядка п — 1 равен единице. Что касается Dn (X), то этот многочлен равен определителю матрицы ХЕ—А. Разлагая этот определитель по эле- ментам последней строки, мы непосредственно найдем, что Dn W — «о И- “Л + +ал-1хл 14* ^л- Из О„_1(Х) = 1 следует, что (X) ==...=d„_1 (X) = 1, а из Dn (X) =/(Х) вытекает, что dn(T) =/(Х), что и требовалось. Говорят, что матрица А имеет естественную нормальную форму, если А распадается на клетки Дь Д2, ... , Д5, являющиеся сопровождающими матрицами многочленов ft (X), f„ (X), ... , fs (X), каждый из которых делится на предыдущий. Покажем, что инвариантные множители матрицы А равны 1, ... , 1, fi (X), /2 (X), ... , fs (X), где число единиц равно сумме степеней многочленов f, (X), ... , /5(Х), уменьшенной на з. Действительно, характери- стическая матрица имеет вид -ГЕ, —At TES — Согласно лемме каждую клетку ГЕ,— А, элементарными преобразованиями можно привести к диагональному виду, в котором диагональными элемен- тами будут 1, ... , 1, ft (X). Меняя затем в ГЕ — А порядок строк и столбцов, мы приведем ее к диагональному виду с диагональными элементами 1, ... ... , 1, ft (X), , fs (X). Так как здесь каждый элемент делится на предыдущий, то этот вид будет канонической диагональной формой, аэлементы 1,..., \,f, (X), ..., Л (X) будут инвариантными множителями матрицы ГЕ — А. Поскольку поря- док матрицы А равнялся сумме степеней многочленов f, (X), ... , fs (X), а общее число инвариантных множителей равно порядку матрицы, то число единиц среди инвариантных множителей совпадает с указанным. Из нашего рассуждения вытекает, в частности, что естественная нор- мальная матрица однозначно определяется инвариантными множителями своей характеристической матрицы. Теперь мы можем в нескольких словах доказать следующую теорему: Теорема 5. Каждая матрица А с элементами из поля К приводится в этом поле к одной и только одной естественной нормальной форме. Пусть 1,..., 1, ft (X), ... , fs (X) — инвариантные множители матрицы ГЕ — А. Поскольку сумма степеней всех инвариантных множителей должна быть равна степени матрицы А, число единиц здесь равно сумме степеней многочленов (X)......fs (X), уменьшенной на з. Построим для каждого многочлена /г (X) сопровождающую матрицу Bi и рассмотрим клеточно- диагональную матрицу В с диагональными клетками В,, ... , Bs. Так как каждый из многочленов /,• (X) делится на предыдущий, то В будет естествен- ной нормальной матрицей. Инвариантные множители матрицы ГЕ — В равны,
176 МНОГОЧЛЕННЫЕ МАТРИЦЫ (Гл. IV как показано выше, 1, , 1, (X), ...,/s(X) и совпадают, таким образом» с инвариантными множителями матрицы ХЕ—А- В силу теоремы 3 отсюда следует, что А подобна В. Тем самым доказана возможность приведения матрицы А к естественной нормальной форме. Единственность следует из того, что естественная матрица В однозначно определяется инвариантными множителями, которые в свою очередь однозначно определяются матрицей А. 15.6. Другие нормальные формы. Преимуществом естественной нор- мальной формы является ее абсолютная однозначность: не только сами диагональные клетки, но и порядок их расположения по главной диагонали определяются однозначно. К недостаткам следует отнести то, что эта форма не дает приведения к клеткам наименьших возможных степеней, а также то, что форма Жордана не является ее частным случаем. • От первого из этих недостатков можно избавиться следующим образом. Условимся называть матрицу В квазиестественной, если В распадается на клетки Blt..., Bs, являющиеся сопровождающими матрицами многочленов вида Iе» О-))*”1. •••» les(^)]mi> гДе •••, es(X)—неприводимые в основном поле К многочлены со старшим коэффициентом 1. Поскольку В( — сопровождающая матрица многочлена [е; (Х)]т/, инвариантные множители характеристической матрицы ХЕ, — Bi равны 1, ... , 1, [е; (Х)]т'. Следовательно, \Ei-Bi имеет единственный элементарный делитель [е,- (X)jm«, а элементарными делителями матрицы ХЕ — В будут [е, (X)]mi, ... , [е^ (X)]ms. Так как ранг матрицы ХЕ — В равен ее порядку и равен сумме степеней многочленов [ег (Х)]ш‘, то квази- естественндя матрица однозначно, с точностью до расположения клеток по главной диагонали, определяется своими элементарными делителями. Отсюда, как и в предыдущем пункте, непосредственно вытекает, что каждая матрица А с элементами из поля К приводится в этом поле к квази- естественной нормальной форме. Эта форма определяется матрицей А одно- значно, с точностью до порядка следования клеток по главной диагонали. Клетки квазиестественной формы нельзя в поле /С расщепить на клетки более низкой степени, так как если такое расщепление было бы возможно, то характеристическая матрица клетки имела бы не один, а по меньшей мере два элементарных делителя. В заключение остановимся на нормальной форме, которую можно рас- сматривать как обобщение формы Жордана на произвольные подполя АГ поля комплексных чисел*. Пусть е (X) — какой-нибудь неприводимый многочлен с коэффициентами из /С- Мы предположим, что многочлен е (X) — ненулевой степени и что его старший коэффициент равен единице. Лемма 4. Если характеристический многочлен матрицы А с эле- ментами из числового поля К неприводим в К и равен е (X), то клеточная матрица ~А Е 0 ... 0- А Е ... 0 А Е А_ где Е — единичная матрица, имеет характеристическую матрицу с един- ' ственным элементарным делителем [е (Х)]т, где т — число диагональных клеток матрицы В. *) Вообще—на произвольные совершенные поля. При этом вместо поля комплексных чисел следует брать алгебраическое замыкание соответствую- щего поля.
§15] НОРМАЛЬНЫЕ ФОРМЫ МАТРИЦЫ ЛИНЕЙНОГО ПРЕОБРАЗОВАНИЯ 177 Пусть Х£ — А = Р, тогда о Су щ а. 1 а. . 0 . 0 0- 0 ' ХЕ — В = р — Е Р (12) Если мы к клеткам какого-нибудь столбца матрицы (12) прибавим клетки любого другого ее столбца, умноженные на произвольную Х-матрицу S, то эта операция будет равносильна, очевидно, серии элементарных преобразо- ваний типа И или IV, произведенных над матрицей ХЕ— В, так что мы в результате получим матрицу, эквивалентную ХЕ — В. Воспользуемся этим замечанием и произведем последовательно следующие преобразования, начи- ная с матрицы ХЕ — В- прибавим к первому столбцу второй, умноженный на Р, к первому столбцу новой матрицы прибавим третий, умноженный на Р2, а ко второму — третий, умноженный на Р, и т. д. После этих преоб- разований получим матрицу " 0 — Е 0 ... 0~ О 0 — Е ... О 0 0 0 ... — Е рт рт~1 Рт~2 ... Р Прибавляя теперь к последней строке первую, вторую, ... , умноженные соответственно на Pm~L, Pm~\ ..., и меняя порядок столбцов, придем к мат- рице ~—Е — Е рт (13) Поскольку матрица (13) имеет клеточно-диагональный вид и начальные ее клетки с точностью до знака единичные, то элементарные делители мат- рицы (13) совпадают с элементарными делителями матрицы Рт = (ХЕ—А)т, которой мы теперь и займемся. По условию характеристический многочлен матрицы А равен е (X) и неприводим в поле К- Из этого следует, что все его корни в поле ком- плексных чисел различны, и, следовательно, существует такая комплексная матрица Г, что ГАГ-1 имеет диагональный вид и ~Х — ах ~ ХЕ — ТАТ~1 = X — а3 х —«п_ Матрица Рт эквивалентна матрице TPmT~l = (TPT~l)m, а последняя имеет вид —(X —«i)m [Г (ХЕ — А) Т~‘]т = (ХЕ — ГАГ-1)"1 = ' (Х-«„)т_
178 МНОГОЧЛЕННЫЕ МАТРИЦЫ (Гл. IV Поэтому элементарные делители матрицы Рт в поле комплексных чисел равны (X — ai)m, , (X — ап)т. Все они принадлежат различным неприво- димым многочленам. Инвариантные множители матрицы Рт будут 1, ... ..., 1, (X — <*i)m ... (X — an)m = [е (X)]m. Но многочлен е (X) неприводим в поле К, следовательно, в этом поле матрица ХЕ— рт имеет только один элементарный делитель, именно [е (Х)]т. Таким образом, матрица (13), а вместе с нею и матрица (12) имеют только один элементарный делитель [е (Х)]т. Лемма доказана. Если А — присоединенная матрица для е (X), то условимся называть матрицу В обобщенной клеткой ^Кардана, отвечающей элементарному делителю [е (Х)]т. Условимся также говорить, что некоторая матрица имеет обобщенную форму /Кардана, если она распадается на обобщенные клетки Жордана. Ясно, что обобщенная жорданова матрица вполне определяется своими элементарными делителями. Теорема 6. Каждая матрица А с элементами из поля К приво- дится в этом поле к обобщенной форме ^Кардана. Эта форма опреде- ляется матрицей А однозначно, с точностью до расположения клеток по главной диагонали. В самом деле, пусть элементарными делителями матрицы ХЕ — Ав поле К являются многочлены [е (X)]mi, ..., [es (X)]ms. Для каждого многочлена [е,- (X)|mi строим соответственную обобщенную клетку Жордана 5,- и рассматриваем клеточно-диагональную матрицу В с клетками В; по главной диагонали. В силу леммы 4 элементарные делители матрицы ХЕ — В будут равны соответственным элементарным делителям матрицы ХЕ—А. Так как ХЕ— В и ХЕ — А имеют, кроме того, один и тот же ранг и один и тот же порядок, то А подобна В. Единственность следует из того, что элементарными дели- телями матрицы ХЕ—А матрица В определяется однозначно. Если основное поле К есть поле комплексных чисел, то все неприво- димые многочлены будут первой степени. Следовательно, в обобщенных клетках Жордана матрицы Л и В будут первой степени, и обобщенные клетки обратятся в обыкновенные клетки Жордана. Рассмотрим еще случай, когда основное поле К есть поле всех веще- ственных чисел. Неприводимые многочлены в К будут двух видов: 1) много- члены первой степени X — р; соответственные обобщенные клетки Жордана будут обыкновенными клетками Жордана; 2) е (X) — Xs ~|-рХ q, где /Р— — 4<у < 0; сопровождающая клетка А имеет вид а обобщенная клетка Жордана, отвечающая (X2 -|-рХ q)mt будет иметь вид матрицы В из леммы 4, где вместо А можно подставить матрицу иной формы: А = Г « ₽]. L— р aj * а и р — коэффициенты при вещественной и мнимой частях комплексного корня многочлена Xs -|--j- q. Такую замену сделать можно, так как матрица ГХ — ХЕ — Л= „ L ₽ -Я X — aj имеет характеристический многочлен, равный Xs -|-рХ q.
ПРИМЕРЫ И ЗАДАЧИ 179 Примеры и задачи 1. Узнать, какие из матриц 3 1 — 3” - 42 130 25- “2 1 — 1~ — 4 — 2 б 8 — 24 — 5 7 4 — 22 — 1 — 1 5 23 — 73 — 13_ _2 1 — 5. 8 13 16- -20 — 89 — зг- -2 о о- — 8 18 22 11 — 51 20 1 1 1 И 22 С27_ _20 — 95 — 36 _1 1 3_ являются подобными. Найти подобные им жордановы матрицы. 2. Доказать, что характеристический многочлен матрицы А равен про- изведению всех инвариантных множителей, а минимальный многочлен равен последнему из инвариантных множителей характеристической матрицы IE- А. 3. Найти минимальные многочлены матриц, указанных в задаче 1. 4. Доказать, что над полем комплексных чисел квадратная матрица тогда и только тогда подобна диагональной матрице, когда ее минимальный мно- гочлен не имеет кратных корней. 5. Показать, что взаимно транспонированные матрицы А, А' всегда подобны. 6. Если А — неособенная, В — произвольная матрицы, то АВ подобна В А. Будет ли АВ подобна ВА для произвольных матриц А, В? ' 7. Найти нормальные формы матриц ~—3 —1 з- 22 9 —27 5 2 —6_ 1—1 1 3’ —1 1 3—1 —1 —3 —1 —1 3 1—1—1 в поле рациональных чисел, в поле вещественных чисел, в поле комплекс- ных чисел. 8. Показать, что для построения нормальной формы в поле комплекс- ных чисел можно вместо клеток Жордана брать клетки вида О ... О 0- а ... 0 0 р ... о о р “ р_ где а — любое фиксированное число, отличное от нуля. 9. Характеристика Сегре. Пусть — линейное преобразование комплексного векторного пространства, рх, ..., ps — различные собственные значения этого преобразования. Обозначим через alfe, aafe, ..., степени клеток Жордана в жордановой нормальной форме принадлежащих соб- ственному значению р*. Символ [(а11> а21> а22> •••)••• (alS> a2S> •••)]
180 МНОГОЧЛЕННЫЕ МАТРИЦЫ [Гл IV называется характеристикой Сегре преобразования Например, матрицы 0 2 1 0 2 2 1 О 2 -2 10- 2 1 2 3 "2 1 0 0- 2 10. 2 1 2 имеют следующие характеристики Сегре: [(2, 1)(1)], [(2, 2)], [(3) (1)], [(4)]. Вычислить характеристики Сегре матриц, указанных в задаче 1. 10. Характеристика Вейра. Пусть —то же, что и в преды- дущей задаче. Обозначим дефекты преобразований — pt-g, — p(-g/, ... •••> (ez?— где p — кратность собственного значения р,-, через «И, “л + “<2, «11 + «12 + •• + “/₽• Строка {а,!, а,2, ..., а;р} называется характеристикой Вейра преобразования а.-#, отвечающей собственному значению рг. Показать, что характеристики Вейра преобразований, указанных в задаче 9, равны соответственно [{2, 1}, {!}], [{2, 2}], [{1, 1, 1}, {1}], [{1, 1, 1, 1}]. 11. Показать, что характеристика Сегре и характеристика Вейра, отве- чающие одному и тому же собственному значению, связаны следующим образом. Пусть характеристика Сегре есть (6, 4, 3, 3). Строим диаграмму из точ<уг Число точек в последовательных колонках этой диаграммы и будет харак- теристикой Вейра. Для взятого случая она равна {4, 4, 4, 2, 1, 1}. 12. Матрица с неприводимыми элементарными делителями называется полупростой. Показать, что любая матрица А может быть разложена в сумму полупростой и нильпотентной матриц, перестановочных между собой, и что такое разложение однозначно. § 16. Функции от матриц В настоящем параграфе будут рассмотрены такие вопросы ма- тричного исчисления, для решения которых используется возмож- ность приведения матриц к нормальной жордановой форме. Соот- ветственно этому в качестве основного поля здесь берется поле всех комплексных чисел. 16.1. Многочлен от жордановой матрицы. Простейшими функ- циями от матриц являются многочлены. В- дальнейшем будет дано общее определение функций от матриц, а сейчас мы укажем явное выражение для многочлена от матрицы, имеющей нормальную форму Жордана. Рассмотрим сначала отдельную клетку Жордана
§ 161 ФУНКЦИИ ОТ МАТРИЦ 181 порядка п Покажем, что для всех натуральных т имеет место формула Ат (2) где положено [т\ _ т(т— — й-f-l) [k) 1 -2...Й - Доказательство проще всего провести индукцией по т. Для т = 1 формула (2) совпадает с (1) и поэтому верна. С другой стороны, если равенство (2) верно для какого-нибудь т, то, умножая его на А, мы непосредственными вычислениями получим, что для Ат+1 формула (2) также верна. Пусть теперь f (X) —- некоторый многочлен от X: f (X) = <z0 -L- аД -Д <z.2X2 -L... аДЛ Согласно определению f (А) = Д- tXiA Д- а2А2 Д- • • • Д- a*Afe- Подставляя сюда вместо матриц А™ их значения из (2), мы уви- дим, что в i-й строке и (i Д- s)-m столбце матрицы f (А) стоит выражение Vi т (т 1)... (от — s) m-s_____ 1 cis) i \ L °™-------Г2.7.з “р — Ь2Т77' т*=0 Следовательно, окончательно имеем 7(р) -тгГ(р) Д/"(р).. /И) = /(р) -ЙГСр) •• (3) /(Р) _
182 МНОГОЧЛЕННЫЕ МАТРИЦЫ [Гл. IV Мы вычислили пока значение многочлена от клетки Жордана. Однако общая жорданова матрица А есть прямая сумма отдель- ных клеток Жордана: А = А1 —А>2 —|- • As, и согласно п. 1.4 /И)=/(Л1)+/(Д2)+...4-/ш. (4) Здесь /(Л1), f(Л5) — многочлены от отдельных клеток Жор- дана, выражения которых даны формулой (3) Этот результат можно применить и к вычислению многочленов от матриц Л, не имеющих формы Жордана. В самом деле, сначала ищем такое Т, чтобы матрица Т~ХАТ = В имела нормальную форму Жордана; затем вычисляем f(B) согласно формулам (3) и (4) и, наконец, в силу соотношения f (Л) = f (ГВТ') = Tf (В) т-1 (п. 3.1) получаем значение /(Л). 16.2. Скалярные функции. Общее понятие матричных функций определяется совершенно аналогично понятию обыкновенных чис- ловых функций. Именно рассмотрим некоторое множество матриц ЭЛ. Если каждой матрице Л из ЭЛ поставлена в соответствие некоторая матрица В, то говорят, что В есть функция от Л, определенная на ЭЛ. Мы хотим теперь каждой обыкновенной чис- ловой функции р = /(/.), заданной на некотором множестве ком- плексных чисел и удовлетворяющей сформулированным ниже требованиям, поставить в соответствие определенную матричную функцию f (Л). Соответствие это строится следующим образом. Пусть даны'некоторая числовая функция р = /(Х) и произвольная матрица Л. Обозначим через рь р3, ..., р, различные собственные значения матрицы Л. Приведем Л к нормальной форме Жордана: T-iAT = B = Bi-^B24-...^rBl, где Bi, — клетки Жордана, и рассмотрим какую-нибудь из них, например (5) отвечающую элементарному делителю (X —р,)яц Если функция /(X) определена в окрестности точки р; и имеет конечные производные
§ 161 ФУНКЦИИ ОТ МАТРИЦ 183 Г(р<), (р/), то мы полагаем, по определению, f(Bt) = 7 (р.) Дм fw -Д'1 ’М (6) f(pi) _ Далее, если /(X) определена в окрестности каждой точки рь , ps и имеет в них конечные производные надлежащих порядков, то мы полагаем также /(В) = /(В1)-4/(В2)4-... + /(ВД (7) f И) = Tf (В) Т-* — T(f (Bt) + ••• + / (В,)) Т-\ (8) Матрица /(А) называется значением функции /(X) при Х = Д. Ниже будет показано, что f(A) не зависит от способа приведения мат- рицы А к нормальной форме *) и, таким образом, является неко- торой матричной функцией от А. Эта функция называется соот- ветствующей числовой функции /(X). Ясно, что далеко не все матричные функции имеют соответствующие числовые. Те из них, для которых соответствующие числовые функции существуют, на- зываются скалярными функциями. Отметим несколько простейших свойств скалярных функций: А) Если /(X) есть многочлен от X, то значение скалярной функции /(А) совпадает со значением многочлена /(X) при Х = А в смысле п. 1.2. Действительно, само определение скалярных функций выбрано таким образом, чтобы для многочленов оно совпадало со старым. Б) Пусть. А — матрица и /ДХ), /ДХ) — числовые функции, для которых выражения ft (А) и /2 (А) имеют смысл. Если f (X) — fi (X) Ц- -ф-./а(Х), т0 /И) также имеет смысл и f(A) = fr (А) -ф-/а (А). В) Если А — матрица, ft (X) и /2 (X) — числовые функции, для которых /ДА) и /ДА) имеют смысл, и/(Х) = /ДХ)/ДХ), то f (А) имеет смысл и /(А) = Д (А)/ДА). Доказательства свойств Б) и В) аналогичны, поэтому мы огра- ничимся только рассмотрением свойства В). Чтобы вычислить /ДА), fi(A), f (А), мы, согласно определению, должны привести А к нормальной форме Жордана В и воспользоваться формулами (7) и (8). Если удастся показать, что / (В) = /ДВ)/ДВ), то из (8) непосредственно получится /(А) = /ДА)/ДА). С другой стороны, /(В)=/(в1)+/(в2)4-...+/(вд А (В) /2 (В) =ft (Bi) /2 (ВО 4-...+A (В<) A (Bz), *) То есть от выбора матрицы Г.
184 МНОГОЧЛЕННЫЕ МАТРИЦЫ [Гл. IV поэтому все дело сводится к доказательству равенств f{Bfa = fa(Bfafa(Bfa (» = 1, 2..f), где Bi — клетки Жордана. Беря значения ft (В fa, ft (В,) из фор- мулы (6) и перемножая, мы обнаружим, что в k-a строке и (А Н~ /)-м столбце матрицы fa (В,) fa (В fa будет стоять элемент, равный А (р) • у, № (?) + i f) (?) ~ ” (р) + • • • + 7Г <?> • A W- Это выражение можно переписать в виде yr [А (р) М (?) + i А (р) /И~ ’> (р) + • • • + № (?) h (р)] , что согласно правилу дифференцирования произведения функций совпадает с Jj-fW(p). Таким образом, fa(Bfafa(Bfa=f(Bfa, и утверждение В) доказано. Аналогичным образом, используя правило дифференцирования функции от функции, можно было "бы показать, что если число- вые функции <р (X) и /(<р(Х)) удовлетворяют требованиям, при ко- торых выражение /(р(А)) определено, и если ф (X) = f (ср (X)), то ф(А) = Г (ср (А)). Г) Пусть А — матрица, имеющая собственные значения рь р4, ... ..., р„, причем каждое собственное значение выписано здесь столько раз, какова его кратность. Если f (X) — числовая функ- ция и /(А) имеет смысл, то собственные значения матрицы /(А) равны f(P1), /(р2), ..., f(Pn). В самом деле, собственные значения матриц /(А) и Т lf(A)T — = f(T~1AT) соответственно равны, поэтому мы можем предпола- гать, что А имеет нормальную форму Жордана. Формулы (5) и (6) показывают, что в этом случае f(A) имеет треугольную форму, причем по главной диагонали f (А) стоят числа f(pfa, f (pfa, , f(?n)- Поскольку диагональные элементы треугольной матрицы являются ее собственными значениями, то утверждение Г) доказано. Рассмотрим два примера. 1) Пусть f(X) = X-1. Эта функция определена всюду, кроме Х = 0, и при всех значениях X, отлич- ных от нуля, имеет производные любых порядков. Следовательно, если матрица А не имеет нулевых собственных значений, т. е. если А неособенная, то f(A) имеет смысл. Но X-f(X) = l( поэтому A -f (А) = £, откуда f (А) = А-1. Таким образом, функции Хг1 отве- чает обратная матрица.
§ 16J ФУНКЦИИ ОТ МАТРИЦ 185 2) Пусть f (X) = VЭта функция при X О имеет конечные производные любых порядков. Таким образом, выражение А имеет смысл для всех неособенных матриц А *). Полагая в соот- ношении HW) = x Х = Л, мы получим f(A)f(A) = A. . Мы доказали, следовательно, что из всякой неособенной матрицы можно извлечь квадратный корень. 16.3. Представление значений функций многочленами. Во всех курсах высшей алгебры рассматривается задача, как по заданной системе различных чисел ръ р2, ..., p.s- и произвольной системе чисел ой, а2, ..., а5 построить многочлен f(X), который в точках ръ р2, ..., ps принимает соответственные значения аь а2, ..., as. Решение дается в виде известного интерполяционного многочлена Лагранжа. Для дальнейшего важно уметь строить многочлены, которые не только сами, но и их производные до некоторого порядка при- нимают заданные значения в точках рь р2, ..., ps. Эта задача является, таким образом, непосредственным обобщением пред- шествующей. Утверждение о ее разрешимости мы сформулируем в виде отдельной леммы. Лемма. Пусть заданы различные числа pi, ра, •••, р$ и таб- лица из (^+ l)s произвольных чисел ai}. Найдется многочлен р(Х), который в каждой точке р, имеет значение аго, а его j-я произ- водная— значение а;/ (г = 1, 2, .... s; /=1, ..., k). Сначала удобнее построить вспомогательный многочлен р,(X) такой, что он и его производные до k-ro порядка имеют требуе- мые значения лишь в точке рг, а в остальных заданных точках обращаются в нуль. Положим <Р/ W = ₽« + Р/i а - Pi) + • • • + (х “ Pi)ft> ф. (Х) = (X - Р1)*+1... (X - (X - pi+1)*+1... (X - Ps)ft+1, где p/о, Pii, •••, fiik — некоторые пока не определенные числа. Очевидно, при любых pi(1.....имеем Pi (Ру) = Pt (Ру) = • • • = Pi&) (Ру) — О (/V О- *) Чтобы устранить двузначность и сделать рассуждения вполне точными, достаточно в комплексной плоскости переменной X произвести разрез из начала координат вдоль луча, не содержащего ни одного собст- венного значения матрицы А, и рассматривать какую-либо одну ветвь радикала.
186 МНОГОЧЛЕННЫЕ МАТРИЦЫ [Гл. IV Согласно правилу дифференцирования произведения piJ) (р>)=?гу) (р;) ф,- (р,-) + /?И_ ° (р,-) ф»: (р/) 4-...+<р,- (рО ф/1 (pi), или = /Ф.'А (Р/) + /Фь А1Ф; (Р,) + • • • + (р,). (9) Так как Ф,-(р;) О, то из соотношений (9) при / = 0, 1.......k можно последовательно определить числа р/0, ₽и> • • • > и тем самым найти р,- (X). Многочлен Р (х) =• Pi (х) + Pi (х) + • • • + Л (х) будет, очевидно, удовлетворять всем требованиям леммы. Рассмотрим некоторую числовую функцию /(X) и матрицу А, для которой значение f (А) определено. Покажем, что тогда най- дется многочлен р(Х), для которого р(А) будет равно /(Л). Обо- значим через рь р2, ..., ps различные собственные значения ма- трицы А. Пусть ее порядок есть п. Согласно только что доказан- ной лемме мы можем построить многочлен р (X), удовлетворяющий требованиям *) р(р/)=/(р,-), р'Ы-ИрО, •••> р<л-1>(рг)=Гл-1)(р,) (10) (/ = 1, ..., s). Для определения смысла выражения f(A) нам нужны были только значения функции f(X) и ее производных самое большее до (п—1)-й в точках pi, р2, ..., ps. Поскольку эти значения у f (X) и р(Х) совпадают, то f (А)~ р(А). Итак: Теорема 1. Значения всех скалярных функций от матрицы А можно представить многочленами от А**). В частности, рассматривая функцию f (X) = ]/Х, мы видим, что для каждой неособенной матрицы А существует такой много- член р (X), для которого р(А)р(А) = А. С помощью теоремы 1 легко решается оставшийся в предыдущем пункте открытым вопрос об однозначности определения значения f(A). В самом деле, зная функцию /(X) и ее производные в точ- ках pi, ..., р5, мы можем построить многочлен р (X), значение которого р (Д) не зависит от приведения матрицы А к нормаль- ной форме Жордана и в то же время совпадает с [(А). Следо- *) Если какие-либо из производных fi' (р;) для определения /(Д) излишни, то соответствующие числа в (10) можно заменить нулями. ••) Заметим еще раз, что приведенные в тексте рассуждения показы- вают, что каждое значение /(А) заданной скалярной функции /можно пред- ставить в виде некоторого многочлена р (Д). Однако этот многочлен для одной и той же функции / будет различным ддя различных матриц А.
§ 16J ФУНКЦИИ ОТ МАТРИЦ 187 вательно, значение /(Л), определенное в предыдущем пункте с помощью приведения матрицы А к нормальной форме, от спо- соба этого приведения не зависит. Сделаем еще одно замечание. Пусть f (X) — некоторая числовая функция, А— матрица, для которой f(A) имеет смысл. Согласно теореме 1 мы можем найти многочлен р(Х), для которого р(А) = — f(A). При заданной функции /(X) многочлен р(Х) зависит лишь от элементарных делителей матрицы А. Но элементарные дели- тели матрицы А и транспонированной матрицы А’ совпадают, поэтому p{A') — f{A'). Из п. 1.3 легко усмотреть, что р(Л') = = р(Л)'. Таким образом, для всех скалярных функций [(А) имеем f(Ar) = f(A)'. 16.4. Элементарные делители функций. Рассмотрим вопрос, как по элементарным делителям матрицы А найти элементарные дели- тели какой-нибудь ее скалярной функции /(Л). Приведем А к нормальной форме т-мт = в = в1 + в2+... + в/, (Н) где Bi....Bt— клетки Жордана. Согласно определению Г(А) = ТЦВ)Т-', и, следовательно, элементарные делители матриц / (Л) и f(B) сов- падают. Из (11) вытекает, что / (В) = Ж)+ №) + •.• +Ж); поэтому система элементарных делителей матрицы /(В) есть объ- единение систем элементарных делителей клеток f(Bi), ..., f(Bt). Таким образом, наш первоначальный вопрос сводится к следую- щему: дана клетка Жордана В, с элементарным делителем (X—р/)"»; требуется найти элементарные делители для f (В,). На основании формул (5), (6) имеем * - f W " <Р‘) ХЕ, —/(Вг) = . (12) W(P/) Ищем наибольшие общие делители £)] (X), D.2 (X), ..., Dn. (X) мино- ров 1-го, 2-го, ..., п,-го порядков этой матрицы. Старший из них £>„ (X) равен определителю матрицы, следовательно, ^(Х) = (Х-/(Р;)Г.-,
188 МНОГОЧЛЕННЫЕ МАТРИЦЫ * [Гл. IV Все остальные являются делителями Dni (X) и поэтому имеют вид (X— /(?»))“. Рассмотрим (X). Этот многочлен должен быть делителем всех миноров порядка п,- — 1 матрицы (12), в том числе и минора Д(Х), получающегося вычеркиванием первого столбца и последней строки. Однако если в этот минор подставить вместо X число /(р,)> то получится матрица треугольной формы с элемен- тами — f'(P/) на главной диагонали и, значит, А(р/)==(—Г(Р/))Я/-'- (13) Мы предположим теперь, что f(pz):£O. Равенство (13) показы- вает тогда, что Д(Х) не делится на X —/(р;). Но многочлен D„._i (X) должен быть общим делителем многочленов Д (X) и t)n. (X), следовательно, — Остальные многочлены Dn 2(Х), ... ..., О2(Х), Di(X) являются делителями D„(_i(X) и поэтому также равны единице. Составляя отношения Dk+i:Dk, мы видим, что инвариантными, множителями матрицы (12) будут 1, ..., 1, (X — /(р;))л‘, вследствие чего матрица (12) будет иметь только один элементарный делитель (X —- f (р,))л«. Отсюда следует Теорема 2. Пусть матрица А имеет собственные значения Pi, ..., р,5 и /(X) — функция, для которой (р;)^0 (г —1, ..., s). Тогда, если матрица f(A) существует, то ее элементарные дели- тели можно получить заменой каждого элементарного делителя — матрицы А выражением — f(pd)ni- Например, если А — неособенная матрица, f (X) == X-1, то f (Л) — = А~’ и /'(рг) = — рГ2 =£ 0. Поэтому, если каждый элементарный делитель (X — р,)л« матрицы А заменить выражением (X — рГ1)”', то получится система элементарных делителей обратной матрицы. Теорема 2 позволяет находить элементарные делители матрицы f(A), принадлежащие тем собственным значениям /(р;), для которых f (рДт^О. Нетрудно указать соответствующее правило и в случае /'(pi) = 0. Пусть для некоторого собственного значения матрицы А 7 (Р,)=/"(Р() (Р<) = 0, (р,-)^0. (14) Требуется указать, в какие элементарные делители матрицы /(Д) переходит каждый элементарный делитель (X — р()Л/ матрицы А. Этот вопрос, очевидно, сводится к следующему: найти элементарные делители матрицы (6) при ус- ловии (14). Для k^n; матрица (6) является диагональной, и ее элементар- ными делителями будут X — / (рг),... X — /(рг). Случай k = 1 был разобран выше: матрица (12) имеег тогда единственный элементарный делитель (X—/(рг))”‘. Поэтому нас будут интересовать только значения k, лежащие между 1 и я/. Рассмотрим вспомогательное линейное пространство V размерности я,- с базой alt аг,..., ап.. Положим для краткости —/Д (рД = а/+1, я,- = п и обо- значим через линейное преобразование пространства Я с матрицей C=/(B,-)-/(p/)£i.
§ 16] ФУНКЦИИ ОТ МАТРИЦ 189 Мы имеем, таким образом, а% = ®й + 1вЛ + 1 + аЛ + 2аЛ+а + ••• + алал> «2^= ak + lak + s +••• + аП-10п> аП-& = аА + 1вл> afg = o (j>n — k).. (15) Нас интересуют элементарные делители преобразования поэтому мы выберем в 4! другую базу, в которой матрица преобразования g* будет иметь более простой вид. Пусть ei — ₽/iai + ₽<’, i+iai+i + • • + ₽<яал (Z = 1.л), тогда = ₽iia*+iai+* + (?iia*+3 + Pi,i+ia*+l) ai+*+l + ••• Подберем числа ₽y так, чтобы выполнялись соотношения е^ = ем, «jg — о (i = l.......л —й;/>л —ft). (16) Это дает следующую систему уравнений относительно ₽у: aA+iPii = Pi+Л, i+ki aA+iPi, il-1 Н“ aA+2^ii с= Pi+A, i+A+ii ••• Ввиду условия aft+1^£0 отсюда можно последовательно определить ₽у, ..., выражая их через р с большим первым индексом. Для Ру с i^n—k вообще никаких уравнений не получается, так что их можно выбрать произвольно. В частности, полагая „_* = ... = рлл = 1, мы для остальных начальных коэффициентов рп, ..., h-k+i,n-k+i получим ненулевые значения. Уравнения (15) тогда можно решить относительно в,, л2, ..., ап; поэтому система еи е2, ..., еп будет новой базой в 4', свя- занной условиями (16). Разложим векторы elf ..., еп на системы ^1+2Й> ••• ®2> ®2+Й1 ^S+Skl ••• ^2А» ••• и рассмотрим подпространства l'lt ..., 4?ft, натянутые на эти системы. Соот- ношения (16) показывают, что 4'г есть инвариантное подпространство с ба- зой ег, ei+k, ei+!!k, ..., причем ^ = 4\ + 4'2 + ... + 4>А. (17) В силу результатов п. 12.3 отсюда следует, что матрица преббразования распадается на k клеток Жордана с элементарными делителями т. ffia - tn t. X \ X s, X А, где mit mst mk— размерности подпространств 4'2, ..., Матрица исходного преобразования f (Bi) была связана с С фор- мулой поэтому элементарными делителями матрицы /(В,) являются (X—/(р,-)) *, ..., (X—/(pi)) *. Если символом [а] обозна- чить. максимальное целое число, не превосходящее а, тогда для mlt ..., получатся следующие выражения: Гл—1] , , + 1> Гл — k~l . , Г л ] bd-
190 МНОГОЧЛЕННЫЕ МАТРИЦЫ (Гл. IV Итак, если матраца А имеет элементарный делитель (X — р)т а f (р) =... =у1*~1) (р) = 0, У1*1 (р) 7^0, то при переходе от А к /(А) этот элементарный делитель расщепляется на элементарные делители Q-— /(Р))”*1. (й—У(р)Г\ где Гт — II , , Гт —21 Гт— й! , , mi = [й—J + = L k—J + ........ * = 1—ftj к Рассмотрим пример. Пусть А имеет элементарные делители (X—I)8, (X-J-2)2; требуется найти элементарные делители матрицы Ае — ЗД4 -f- ЗА2 — Е. Здесь у(Х) = Х3-ЗХ44-ЗХ3-1 =(Х — 1)3(Х4~1)3, /(—2)^0, у (1) =У'(1) = 0, У"’(1)7^0. Элементарный делитель (Х4~2)3 при переходе к f(A) дает (X — у(—2))3 = (Х— 27)3, а элементарный делитель (X—I)8 расщепляется на X3, X3, X3. Следовательно, элементарными делителями матрицы У (Л) будут X3, X3, X2, (X —27)3. 16.5. Степенные ряды. Последовательность квадратных матриц ^1» •••> ^m> ^m+i> ••• (18) одного и того же порядка называется сходящейся к матрице А, если эле- менты матриц .(18), стоящие на пересечении заданного столбца и заданной строки, стремятся -к соответствующему элементу матрицы А. Из этого определения непосредственно ясно, что если матрицы Ат и Вт при возра- стании т стремятся соответственно к А и В, то Ат-\-Вт и АтВт стре- мятся к А-}-В и АВ. В частности, если Т—постоянная матрица, а ма- трица Ат стремится к А, то 7'~‘АтТ будет иметь своим пределом 7'~‘А7'. Далее, если Лп = 4> + л£> + ... + л£) (« = 1, 2, ...), где порядки клеток от т не зависят, то Ат при возрастании т стремится к некоторому пределу тогда и только тогда, если к пределу стремится каждая клетка Д*0 отдельно. Последнее замечание позволяет весьма просто решить вопрос о сходи- мости так называемых степенных рядов от матрицы. Пусть «о 4~ ai^ 4~ 4~ 4~ 4~ ••• (19) — формальный степенной ряд относительно переменной X. Выражение + аМ + ааДа + ••• 4- «тДт 4“ (20) называется соответствующим степенным рядом от матрицы А, а многочлен fn (-Л) = а»£4- «1Л +... 4“ — n-й начальной суммой этого ряда. Ряд (20) называется сходящимся, если последовательность начальных сумм (Д), ...,Ут(Д), ... имеет пре- дел; в случае существования этот предел называется суммой ряда (20). Приведем матрицу А к нормальной форме Т^АТ= В = В, 4-Ba +... 4-В/, где Bi, ••., Bf — клетки Жордана. Выше мы видели, что сходимость после- довательности fm (А) равносильна сходимости последовательности Т~‘/т(А)Т (т = 1, 2, ...). Но T~lfm И) T=fm (Т^Д Г) =/т (В) =fm (BJ 4-... 4-Ут (Bt),
§ 161 ФУНКЦИИ ОТ МАТРИЦ 191 поэтому вопрос о сходимости ряда (20) равносилен следующему: при каких условиях этот ряд сходится для клеток Жордана В„ ... , ВД Рассмотрим одну из этих клеток, например Bi- Пусть ей отвечает элементарный дели- тель (X — р/)л‘. Согласно формуле (3) fm (Pi) || fm (Pj) ••• ^n,— i)|Zm (Pi) fm(fi) _2)|A (Pi) - fm (fi) - следовательно, fm (Bi) при возрастании т тогда и только тогда стремится к некоторому пределу, когда к пределу стремится fm (p;), f'm (рг), ... ..., ')(р;), т. е. когда в точке р;. сходится ряд (19), а также ряды, по- лучаемые из него почленным дифференцированием до (п,-—1)-го раза включительно. Из теории аналитических функций известно, что все эти ряды заведомо сходятся, если либо р, лежит внутри круга сходимости ряда (19), либо р/ лежит на окружности круга сходимости и (щ—1)-я производная от ряда 119) в точке р, сходится. Следовательно, доказана Теорема 3. Для того чтобы степенной ряд от матрицы А схо- дился, необходимо и достаточно, чтобы каждое собственное значение р; матрицы А либо находилось внутри круга сходимости соответствующего степенного ряда f (X), либо лежало на круге сходимости с тем, чтобы одновременно ряд, полученный (щ — \)-кратным дифференцированием ряда /(X), сходился в точке р;, где щ— степень наивысшего элементарного делителя, принадлежащего рг. 16.6. Матрицы, перестановочные с данной матрицей. Матрицы А, В называются перестановочными, если АВ = ВА. Каждая матрица перестановочна сама с собой и с единичной. Далее, если А перестановочна с матрицами В и С, то равенства А-ВС = ВАС = ВС • А, А (рВ + ₽С) = О.АВ + ₽АС = О-ВА 4- ЗСЛ = (аВ + рС) А показывают, что А перестановочна с их произведением и линей- ной комбинацией. Следовательно, если В перестановочна с А, то В перестановочна с любым многочленом от А. В частности, А перестановочна с многочленами от Л и любые два многочлена от А перестановочны друг с другом. Согласно п. 16.3 значения скалярных функций от матрицы А могут быть представлены многочленами от А. Многочлены от А перестановочны с каждой матрицей В, которая перестановочна с А. Следовательно, значение каждой скалярной функции от матрицы А перестановочно со ‘ всеми матрицами, перестановоч- ными с А. Соотношение а.Е:Р~Р-чЕ показывает, что матрицы а.Е пере- становочны со всеми матрицами того же порядка. Верно и об- ратное:
192 МНОГОЧЛЕННЫЕ МАТРИЦЫ 1Гл. IV Если квадратная матрица А порядка п перестановочна со всеми матрицами порядка п, то А имеет вид а.Е. Обозначим элементы матрицы А через агу. Пусть Р — матрица, у которой в р-й строке и <?-м столбце стоит единица, а осталь- ные места заняты нулями. Непосредственным перемножением находим -o . .. aip . .. 0- 0 0 . .. 0 - AP = 0 . • . 0 РЛ = v a?2 . • $-qn 0 . • anp • . 0_ 0 0 . . 0 где у первой матрицы выписан р-й столбец, а у второй p-я строка. По условию АР = РА, следовательно, app = agg и ар? = 0, если р Ф q. Ввиду произвольности ряд это означает, что А диаго- нальна и что все ее диагональные элементы равны между собой. Рассмотрим теперь более сложную задачу: найти все матрицы, перестановочные с заданной матрицей А. Для решения ее приведем А к нормальной жордановой форме T-1AT = B = Bl + B.i + ...-jrBs, (21) где Bi.... Bs — клетки Жордана. Если матрица X перестано- вочна с В, то, очевидно, Y — TXT-1 будет перестановочна с А, и, обратно, если Y перестановочна с А, то T^YT = Х будет перестановочна с В. Поэтому все дело сводится к тому, чтобы найти матрицы X, перестановочные с матрицей В, имеющей нор- мальную форму (21). Соответственно (21) разобьем на клетки и матрицу X: гхи х12 ... Xls- Y___ Xai Х22 •.. Х^ t-Xjfi Xsi ... XSs- Условие BX = XB приводится к равенствам BpXM=XpgBg (р, <7 = 1, ..., s). (22) Мы видим, что для каждой клетки Хрд получается только одно равенство (22), из которого нам и надо определить элементы Хрд. Пусть порядки матриц Вр, Вд равны соответственно k, m, а их собственные значения суть р, а. Тогда Хрд будет прямо- угольной матрицей с k строками и m столбцами. Обозначим элементы матрицы Хрд через (i = l, •••, k, j — 1, ...,-m)
S 16J ФУНКЦИИ ОТ МАТРИЦ 193 Выполняя здесь умножение и сравнивая элемент, который полу- чится в i-й строке и j-м столбце левой части, с соответственным элементом в правой, мы придем к уравнениям р5«7 ^i+i, j = j-i + 7 P^Al---- (i^k, (23) (i = k, /тМ), (24) (i=k, 7 = 1). (25)' Если p в, то из (25) следует = 0; тогда из (24) последова- тельно получим =... = Sjftm = 0, а-из (23) выведем, что все остальные также равны нулю. Таким образом, для р^Ьа имеем ХР9 = 0. Рассмотрим случай р = а. Уравнения (23), (24), (25) теперь обратятся в = (i = l..........А-1; / = 2, ..., т), (26) ^.7-1 = 0 (7 = 2, ..., т). (27) Если k^m, то, полагая 5ц = Еь £п = $2, .... = мы при- ведем уравнения (26) и (27) к уравнениям ^7 — 5гу = 0 G < 7)> а >д 1 V V ~ из которых следует, что матрица ЛР9 имеет линейный треуголь- ный вид (28) 7. А. И, Мальцев
194 МНОГОЧЛЕННЫЕ МАТРИЦЫ [Гл. IV. для k = m и соответственный вид для k~^>m. Если k<^m, то полагая 5i.m_*+i = 5i, = ..., мы приведем уравнения (23), (24) и (25) к уравне- ниям == J—i—m+k+L (j I 2S Я? ^)> 5,7 = 0 (/— i<^m — k), которые означают, что матрица имеет вид 0 . . 0 5, .. хво~ 0 . . 0 0 ?! .. Lo ... 0 0 0 ... 51 J Обратно, если клетки матрицы X имеют указанный выше вид, то уравнения (23), (24) и (25) удовлетворяются и, следовательно, X перестановочна с В. Например, если то перестановочные с В матрицы имеют вид а0 си а0 а.1 а0 где а/, рг, 7/, Вг — произвольные. Результат становится особенно простым для матриц вида Р1Е1 + ргЕъ+• • • + PsEs, где Ei, Es — единичные матрицы,
§ 161 ФУНКЦИИ ОТ МАТРИЦ 195 а числа рь .... ps различны. В этом случае для p^q клетки ХРЯ обращаются в нули и X принимает клеточно-диагональную форму. В частности, если В диагональна с различными диагональ- ными элементами, то перестановочные с В матрицы также диа- гональны. 16.7. Матрицы, перестановочные с перестановочными матри- цами. Многочлены от матрицы А обладают тем специальным свойством, что; они не только перестановочны с самой матрицей А, но перестановочны и с любой матрицей X, перестановочной с А. Это свойство оказывается характеристическим для многочленов от Л. Теорема 4. Если матрица С перестановочна со всеми ма- трицами, перестановочными с В, то С есть многочлен от В. Очевидно, доказательство достаточно дать для случая, когда В имеет нормальную жорданбву форму; поэтому пусть В — Bi -f- В% -р... -р Bs, где Bi, ..., Bs — клетки Жордана. Вспомогательные матрицы X = v-iEi o-iE% —f-... -j- v-sEsi где аъ ..., а,— произвольные числа, Ei, ..., Es — единичные ма- трицы, заведомо коммутируют с В, поэтому матрицы X коммути- руют и с С. Согласно предыдущему отсюда следует, что С распа- дается на клетки: С = Ci Са -j-... Cs, (30) причем из условия СВ —ВС вытекает, что эти клетки имеют линейную треугольную форму (28). Пусть теперь X — произволь- ная • матрица, коммутирующая с В. Общий вид матрицы X был установлен в предыдущем пункте. Согласно условиям доказывае- мой теоремы матрица С должна коммутировать с X. Представ- ляя X в клеточной форме, мы видим, что равенство СХ = ХС равносильно соотношениям CpXpq = XpqCq (р, <7=1, .... S). (31) Если соответствующие клетки Вр, Bq имеют разные собственные значения, то (31) ничего не дает, так как тогда Xpq = O. Поэтому мы предположим, что собственные значения клеток Вр и Вя сов- падают. Пусть 7»
196 МНОГОЧЛЕННЫЕ МАТРИЦЫ [Гл IV где Ei, Ег, Ет — произвольные числа. Умножая первую строку на последний столбец слева и справа и приравнивая результаты, мы получим -j- a£k-i — М* ~Ь Мь откуда ввиду произвольности чисел Ei, Е* следует, что ai = Pi, аа = р2) a* = pft. (32) Легко проверить, что аналогичные равенства получатся и при k^m. Равенства (30), (31) и (32) представляют собой полную систему условий,, которым должна подчиняться искомая матрица С. Чтобы сделать эти условия несколько более наглядными, мы по- ступим следующим образом. Расположим клетки Жордана ма- трицы В так, чтобы клетки с равными собственными значениями стояли рядом. Пусть, например, в = (В1 -р ... -j- BmJ + 4" • • • + 4~ • • • • • • + + • • • + -®s)> где каждая скобка содержит клетки с одинаковыми собственными значениями. Обозначая суммы, стоящие в скобках, соответственно через В(1), ..., В(Лн), мы разобьем матрицу В на более крупные клетки, которые назовем блоками. Соответственно этому разобьются на блоки и матрицы X и С. Результаты предыдущего пункта показывают, что все недиагональные блоки матрицы X равны нулю; что касается диагональных блоков X, то они имеют строе- ние, которое там было описано. Условия, полученные в настоя- щем пункте для матрицы С, показывают, что и диагональные блоки этой матрицы распадаются подобно В на клетки, причем клетки матрицы С имеют специальную треугольную форму.
ПРИМЕРЫ И ЗАДАЧИ 197 Равенства (32) означают, что. у клеток матрицы С, принадлежа- щих какому-либо одному блоку, элементы, расположенные на одной и той же параллели к главной диагонали, равны друг Другу. Возьмем, например, матрицу В в форме (29), приведенной в качестве примера в конце предыдущего пункта. Наши резуль- таты показывают, что матрица С, перестановочная с каждой матрицей, перестановочной с В, будет иметь форму а0 а, а2 а0 сц а0 с= а0 а! а0 (33) Хо Xj Х2 Х-о Xj Хо Остается показать, что С можно представить в виде много- члена от В. Мы это сделаем только для частного случая, когда В имеет вид (29), а С, следовательно, вид (33); в общем случае рассуждения остаются теми же. Итак, требуется показать, что матрица (33) есть многочлен от матрицы (29). Ищем многочлен /(X), удовлетворяющий условиям f (Р) = “о, f' (р) = «ь f" (р) = «2, /(0) = Хо, f(a) = X1, Г(0)=Х2. Такой многочлен согласно п.. 16.3 найти возможно. Применяя правило (3) из п. 16.1, убедимся в том, что f(B) = C. Примеры и задачи 1. Найти Ап, если 1 4 2 0—3—2 0 4 3 Л = 2. Найти все решения уравнения № = А, где А имеет то же значение, что и в предшествующей задаче. Какие из, этих решений будут многочленами от At Вычислить sin лЛ, еА, сое лЛ.
198 МНОГОЧЛЕННЫЕ МАТРИЦЫ [Гл. IV 3. Элементарные делители преобразования равны X5, (X — я)а, Х-|-у. Вычислить элементарные делители преобразований cosq^, sin 4. Если А, В—перестановочные матрицы, то еАев = еА^~в. 5. Для каких матриц А уравнение А —ех разрешимо? 6. Если сумму степенного ряда (19) обозначить через /(X), то сумма степенного ряда (20) в случае его сходимости будет равна f(A). 7. Написать общий вид матрицы, перестановочной с нормальной жорда- новой матрицей А, если А имеет элементарные делители (X—I)3, (X—I)2, X—1, (X + 2)2, Х + 2. 8. Пусть все инвариантные множители матрицы ХЕ— А, кроме послед- него, равны 1. Тогда всякая матрица, перестановочная с А, есть многочлен от А.
Глава V УНИТАРНЫЕ И ЕВКЛИДОВЫ ПРОСТРАНСТВА Изучавшиеся в предыдущих главах линейные пространства оказались, в известном смысле, беднее понятиями и свойствами, чем наше обыкновенное пространство. Такие понятия, как длина отрезка, величина угла, скалярное произведение, играющие ос- новную роль в геометрии, не нашли отражения в общей теории линейных пространств. Поэтому, если мы хотим, чтобы общая теория охватывала все наиболее существенные свойства обыкно- венного пространства, мы должны, кроме операций сложения век- торов и умножения их на число, ввести еще операцию скаляр- ного умножения. Изучение свойств векторов, расположенных в пространствах со скалярным умножением, и производится в на- стоящей главе. Основное тело в этой главе имеет весьма специальный вид: оно будет полем вещественных чисел в случае евклидовых про- странств и полем комплексных чисел в случае унитарных про- странств. § 17. Унитарные пространства 17.1. Аксиоматика и примеры. Пусть 91 — наше обыкновенное пространство, векторами которого служат направленные отрезки, выходящие из некоторой начальной точки О. Скалярным произ- ведением (а, Ь) векторов а, b называется произведение длин а и Ь на косинус угла между ними. Отсюда непосредственно выте- кают известные свойства скалярного произведения: (а) (а, Ь) = (Ь, а)\ (б) (аа, Ь) = а(а, Ь)\ (в) (а 4- Ъ, с) = (а, с) (Ь, с)-, (г) если афо, то (а, а) > 0. Выберем в пространстве 31 какие-нибудь три рзаимно перпен- дикулярных вектора elt е2, е3 длины 1 в качестве координатной системы. Тогда каждый вектор а будет допускать единственную запись в виде а = <Х1в1 ^2^2 “I- а3^3>
200 УНИТАРНЫЕ И ЕВКЛИДОВЫ ПРОСТРАНСТВА [Гл. V, где аъ а2, а3 — длины проекций вектора а на оси координат, взя- тые с соответствующими знаками. Если & = Р1в1 -J- 4~ рз^з — какой-либо второй вектор, то из определения скалярного про- изведения и свойств (б), (в) следует, что (а, &) = aiPi 4~ аар2 4“ азрз- (1) Пространство 91 вещественное. Это находит свое выражение в том, что проекции, длины, а также скалярные произведения векторов — числа вещественные. Однако в некоторых случаях возникает необходимость рассматривать векторы и с комплекс- ными проекциями. На первый взгляд кажется естественным в ка- честве скалярного произведения векторов с комплексными коор- динатами аь а2, а3 и £i, р3, [З3 взять снова выражение (1). В неко- торых случаях так и поступают. Пространство, которое при этом получается, называют комплексным евклидовым. К сожалению, скалярное произведение теряет при этом много важных свойств и среди них в особенности свойство (г). В самом деле, для вектора и = 3в14~ 4- 5fe3 (i== 1) формула (1) дает (a, a) = 94-16 4-25z2 = 0 вопреки свойству (г). Чтобы избавиться от этого неудобства, принимают в качестве определения скалярного произведения комплексных векторов не выражение (1), а выражение (а, Ь) = аф14~ а2р2 4~ азРз, (2) где черта сверху означает переход к комплексно сопряженным числам. В случае, когда векторы а, b вещественные, имеем {3,— = ₽у и выражение (2) совпадает с (1). Таким образом, новое оп- ределение (2) является расширением старого. С другой стороны, свойство (г) при новом определении заведомо выполняется, так как из (2) следует: (а, а) = <xj<x3 4- 0^2 4“ азаз — | ai |2 4~ I аз Р I аз |2> где |ау| — модуль числа а.у. Свойства (б), (в), как легко видеть, также выполняются. Что касается свойства (а), то оно для комп- лексных векторов изменяет свой вид. Действительно, из" (2) имеем ________________ (&, а) = piCti 4~ ?2а2 4“ Рзаз = р!а1 4~ Р3<Хз’ или (а*) (Ь, а) —(а, Ь).>
S 17] УНИТАРНЫЕ ПРОСТРАНСТВА 201 Пространство комплексных векторов, в котором скалярное произведение вычисляется по формуле (2), называется унитарным. Формула (а*) показывает, что свойства унитарного пространства, вообще говоря, отличаются от свойств обыкновенного пространства. Однако эти различия малосущественны. Во всяком случае, уни- тарное пространство по своим свойствам гораздо ближе подходит к обыкновенному пространству, чем упомянутое выше комплекс- ное евклидово пространство. Рассуждения, которые мы здесь привели, нельзя назвать вполне отчетливыми. Кроме того, рассмотренное пространство было трехмерным. Поэтому нам теперь нужно дать вполне строгое определение унитарных пространств, пригодное и для пространств любой размерности. В общей теории линейных пространств почти все делалось нами в предположении, что основное тело К совершенно произ- вольно. В настоящей главе в качестве /С будет рассматриваться только либо поле всех комплексных, либо поле всех веществен- ных чисел. Линейное пространство 8 над полем /( называется унитар- ным, если каждой паре векторов а, b из 8, взятых в определен- ном порядке, поставлено в соответствие некоторое число из К, называемое скалярным произведением (а, Ь) вектора а на вектор Ь, обладающее следующими свойствами: > 1° (а, b) = (b, а); 2° (аа, Ь) = а(а, 6); 3° (а-\-Ь, с) = (а, с) +(Ь, с); 4° если афо, то (а, а)^>6. В случае, когда основное поле К— поле вещественных чи- сел, унитарное пространство 2 называется вещественным унитар- ным или вещественным евклидовым пространством. В этом случае выражение (а, Ь), очевидно, совпадает с (а, Ь) и аксиома 1° при- нимает более простой вид: (а, Ь) = (Ь, а). Если поле К есть поле комплексных чисел, то пространство 8 называется комплексным унитарным пространством. В дальней- шем свойства вещественных евклидовых пространств и свойства комплексных унитарных пространств будут по большей части рассматриваться совместно, и под унитарным пространством будет пониматься, в соответствии с определением, либо вещественное, либо комплексное унитарное пространство. Отметим также, что в определении унитарных пространств не требуется, чтобы пространство имело конечную размерность. По- этому можно говорить и о бесконечномерных унитарных прост- ранствах. Хотя некоторые свойства унитарных пространств не зависят от размерности последних, мы будем рассматривать лишь
202 УНИТАРНЫЕ И ЕВКЛИДОВЫ ПРОСТРАНСТВА [Гл. V конечномерные пространства, если противное не оговорено явно. Теория бесконечномерных пространств входит в особую матема- тическую дисциплину — функциональный анализ. Из свойств 1°, 2° следует, что (аа, = а (а, р£>) — а (р&, а) = оф (Ь, а) — оф (а, Ь), т. е. (аа, [ЗЬ) = оф (а, Ь). (3) Аналогично из 1°—3° вытекает, что (а, b Ц- с) = (Ь Ц- с, а) == (b, a) -J- (с, а) = (а, Ь) ф- (а, с). Отсюда обычным способом получаем общую формулу (SaA- = bk>- (4) Соотношение (3) при a = 1, [3 = 0 дает (а, о) = (о, а) = 0. Укажем два примера. Рассмотрим линейное пространство строк длины п с элементами из поля /(. Условимся называть ска- лярным произведением строки a = [a! ал] на строку Ь = [{31;... ..., [Зл] выражение (а, Ь) = аф1 -j- аф.2 ал[Зл. (5) Из этого выражения видно, что (а, а) = а1а1 + ...ф-алал = |а1|2ф-...-)-|ал|\ (6) Поскольку модули |ау| — неотрицательные вещественные числа, сумма их квадратов будет неотрицательным вещественным числом, равным нулю только в случае равенства нулю всех слагаемых. Таким образом, свойство 4° здесь выполняется. Свойства 1°, 2°, 3°, очевидно, также выполняются, и пространство строк со ска- лярным произведением (5) является унитарным пространством размерности п над полем К,- Этот пример имеет существенное значение, так как дальше будет показано, что все унитарные пространства размерности п над полем К изоморфны друг другу. Примером унитарных пространств бесконечной размерности может служить пространство 8 всех непрерывных функций fit) с комплексными значениями, определенных на отрезке [0,1]. Сложение и умножение этих функций на число определяются обычным образом, а скалярное произведение функции f(t) на функцию g(l) определяется по формуле (A g) = lf(W)dt. (7) о
§17] УНИТАРНЫЕ ПРОСТРАНСТВА 203 Свойства 1°—4° легко доказываются, и, следовательно, простран- ство 2 является унитарным. В этом примере основным полем является поле всех комплексных чисел. Если мы будем рассмат- ривать только непрерывные функции с вещественными значе- ниями, то в качестве основного поля можно будет принять поле вещественных чисел. Формула (7) тогда заменится формулой (A g) = [f dt. о 17.2. Длина вектора. Согласно аксиоме 4° скалярный квадрат (а, а) любого вектора есть неотрицательное вещественное число. Неотрицательное значение квадратного корня из этого числа на- зывается длиной или нормой вектора а и обозначается [| а||. Таким образом, согласно определению ||а|| = V(а, а). Из этого определения непосредственно видно, что нулевой вектор является единственным вектором, длина которого равна нулю. Далее, если а — некоторое число, то || ац|| = У"(аа, а«)=]/^аа(а, а) — | а | У\а, а), (8) т. е. при умножении вектора на число длина вектора умножается на модуль этого числа. Вектор, длина которого равна единице, называется единичным или нормированным. Равенства (8) пока- зывают, что, умножив ненулевой вектор на число, обратное его длине, мы получим единичный вектор. Эта операция иногда называется нормированием вектора. Мы переходим к доказательству важного неравенства, связы- вающего длины векторов с величиной скалярного произведения этих векторов. Неравенство Коши — Буняковского. Для любых двух векторов а, b унитарного пространства имеет место неравенство |(а, &)|<||а||.||Н причем равенство здесь достигается тогда и только тогда, когда а и b линейно зависимы. Согласно аксиоме 4° для любого числа X (а — М), а — Х&) 0, (9) откуда после перемножения получим (а, а) —Х(а, b) - X (^~b) -f- XX (&, b)^0. (10) Если Ь = о, то требуемое неравенство выполняется тривиальным образом, так как обе его части оказываются равными нулю.
204 УНИТАРНЫЕ И ЕВКЛИДОВЫ ПРОСТРАНСТВА (Гл. V Поэтому мы предположим, что b =56 о. Подставим в неравенство (10) вместо л число и умножим все члены неравенства на поло- жительное число (Ь, Ь). В результате получим (а, а) (Ь, Ь) — (а, Ь) (а, Ь) — (а, Ь) (а, Ь) (а, Ь) (а, Ь) 0, или (а, Ь) (а, Ь) (а, а) (Ь, Ь), |(а, (11) Таким образом, неравенство Коши — Буняковского доказано. Если а, b линейно независимы, то а — lb ф о и мы вместо (9) можем взять строгое неравенство (а — lb, а — lb) 0. Но тогда во всех последующих неравенствах знак равенства можно отбросить, и мы получим вместо (11) неравенство |(а, Ь)|<||а|Н|6||. (12) Если же а, b линейно зависимы, например a — ab, то |(а, b)\ = \(ab, b)\ = \a.\(b, &)=||a|HIH Следовательно, дополнительное замечание к неравенству Буня- ковского также доказано. Посмотрим, что означает неравенство Буняковского в тех кон- кретных пространствах, которые были рассмотрены выше. Пусть 8 — унитарное пространство строк. Возьмем какие-нибудь его векторы а — [<*>.. ал] и b = [р1,..., рл]. Согласно формуле (6) имеем | (а, Ь) | = [агра 4-... алЗл |, [|«Ц = 1/|а1Г-Т---.4-|ал|2, !’ + ••.+ IW’. Неравенство Коши — Буняковского дает, следовательно, что |aip! 4-...4-алрл | <K|a1ja4-...4-|a„|«N-• •+1 М’. где ау, Ру — любые комплексные числа. Аналогично, если 2 — упомянутое выше пространство функций, то неравенство Буняковского обращается в неравенство 1 ____ 2 1 1 О 0 0 Возвратимся к произвольным унитарным пространствам. Нера- венство Коши — Буняковского позволит теперь весьма просто
§ 17] УНИТАРНЫЕ ПРОСТРАНСТВА 205 доказать следующее предложение: длина суммы векторов не пре- восходит суммы длин слагаемых. Достаточно, очевидно, рассмот- реть только случай двух слагаемых, так как общий, случай из него следует по индукции. Мы имеем 11а + &1Р = (а + ^> а + Ь) = = (а, a)-[-(a, b)-\-(a, b)-]-(b, b) = (a, a)4~2Re(a, b)-\-(b, b), где через Re (а, b) обозначена вещественная часть (а, Ь). Так как Re(a, &)<|(а, Ь) | <И41И> то откуда что и требовалось. Выражение || а — Ь\\ иногда называют расстоянием между век- торами а и Ь. Обозначив его символом р (а, Ь), мы получим сле- дующие соотношения: 1) р(а, а) = 0; р(а, Ь)^>0, если а^Ь', 2) р (а, Ь) — р (Ь, а)-, 3) р(а, Ь) 4- р (Ь, с)^р(а, с). Доказательства их очевидны; например, для последнего имеем р(а, с) = $а-сЦ=^(а-Ь) + (Ь — с)||^||а — H + с11 = = р(а, Ь) + р(Ь, с). 17.3. Ортонормированные системы. Векторы а, b унитарного пространства 8 называются ортогональными, если скалярное про- изведение а на b равно нулю. Если 8 — обыкновенное простран- ство, то понятие ортогональности совпадает с понятием перпен- дикулярности. Поэтому ортогональность можно рассматривать как обобщение понятия перпендикулярности. Из аксиомы 1° следует, что отношение ортогональности сим- метрично: если вектор а ортогонален к Ь, то b ортогонален к а. Нулевой вектор, очевидно, ортогонален ко всякому вектору про- странства и является единственным вектором, обладающим этим свойством. Система векторов ait щ,..., ат унитарного пространства на- зывается ортогональной, если любые ее два вектора а}-, ak (j ф k) ортогональны. Если система содержит только один вектор, то мы ее также будем называть ортогональной. Теорема 1. Всякая ортогональная система ненулевых век- торов унитарного пространства 8 является линейно независимой. В самом деле, пусть Я], Og,..., ат — ортогональная система ненулевых векторов и «1^1 4“ а«оа + • • • 4“ атат —
206 УНИТАРНЫЕ И ЕВКЛИДОВЫ ПРОСТРАНСТВА [Гл. V Умножая это равенство скалярно на а}-, получим “i(ai, ау) 4-... 4~ ат (аот, ау)=0, или ау(ау, ау) = 0, (13) так как в силу ортогональности системы все остальные члены обратятся в нуль. Носу#; о, следовательно, (<2у, ду)^0, и из (13) вытекает ау = 0, что и требовалось. Пусть размерность пространства 2 равна п. Теорема 1 пока- зывает, что в 8 всякая ортогональная система ненулевых векто- ров не может содержать более п векторов. Если п ортогональ- ных ненулевых векторов в 8 найдутся, то они составят ортого- нальную базу пространства 8. Покажем, что такая база в 2 действительно существует. Более того, покажем, что в каждом унитарном пространстве 2 любая ортогональная система нену- левых векторов может быть пополнена до ортогональной базы пространства 2. Пусть в 2 задана ортогональная система щ,... ..., ат. Пополним ее до максимальной ортогональной системы ai,..., ат, am+i,..., as ненулевых векторов. Такое пополнение возможно, так как согласно теореме 1 никакая ортогональная система не может содержать более п отличных от нуля век- торов. Покажем, что ai,..., Ощ,..., as и есть искомая база про- странства 2. Рассмотрим произвольный вектор х из 2. Введем обозначения У — -j- 4~ • • • 4~ Умножая все члены последнего равенства скалярно на ak, мы получим (у, ak) — (x, ak), откуда (х — у, ak) = (x, ak) — (y, ak) = 0. Таким образом, вектор х — у оказывается ортогональным ко всем векторам щ,..., as. По предположению система щ.....as является максимальной ортогональной системой ненулевых векторов 2, следовательно, х — у = 01 т. е. х=iiOi -j- 4-... 4- %sas- Итак, линейно независимая система Oi,..., as обладает тем свой- ством, что через нее любой вектор х выражается линейно. Но это и означает, что су...as — база пространства 2. Ортогональная система, состоящая из векторов единичной длины, называется ортонормированной. Нормируя ортогональные
§ in УНИТАРНЫЕ ПРОСТРАНСТВА 207 ненулевые векторы, мы получим, очевидно, снова ортогональные векторы. Поэтому, нормируя векторы какой-либо ортогональной базы пространства, мы получим ортонормированную базу этого про- странства. Мы видели, что всякую систему ненулевых ортого- нальных векторов можно дополнить до ортогональной базы про- странства. Поэтому имеет место Теорема 2. Всякую ортонормированную систему векторов пространства S можно пополнить до ортонормированной базы этого пространства. Так как любая система, содержащая только один вектор, яв- ляется ортогональной, то отсюда, в частности, следует, что в каждом унитарном пространстве существует ортонормирован- ная база. Систему векторов е2,..., еп, рассматриваемых в определен- ной последовательности, мы назвали координатной системой в про- странстве 8, если Ci,..., еп образуют базу пространства 8. Если e-i,..., еп — ортонормированная база, то и координатная система называется ортонормированной. Разница между произвольной и ортонормированной координатными системами такая же, как между косоугольной и прямоугольной декартовой системами коор- динат в обыкновенном пространстве. Действительно, пусть 3} — обыкновенное пространство векторов-отрез- ков с обыкновенным скалярным произ- ведением. Произвольная база простран- ства 91 состоит из трех произвольных век- торов а2, а3, выходящих из точки О и не лежащих в одной плоскости (см. рис. 1 на стр. 76). Возьмем некоторую точку А и выразим вектор ОА через координатные векторы alt щ, а3. Пусть О А = ос2ш2 Согласно определению числа аъ а2, а3 явля- ются координатами вектора ОА. В то же время из чертежа видно, что эти числа являются координатами точ- ки А, вычисленными в косоугольной декартовой системе коорди- нат с осями а1г а.2, а3, у которой по осям отложены в качестве еди- ничных отрезков векторы гц, аг, а3. Таким образом, произвольная координатная система в 3} с точки зрения аналитической геометрии равносильна косоуголь- ной декартовой системе координат с различными масштабами по координатным осям. Напротив, ортонормированная координатная система et, е2, е3 будет в этом смысле равносильна обыкновенной прямоугольной декартовой координатной системе с одинаковым масштабом на всех осях (рис. 4).
208 УНИТАРНЫЕ И ЕВКЛИДОВЫ ПРОСТРАНСТВА [Гл. V Ортонормированные координатные системы в унитарных про- странствах обладают многими специальными свойствами. Часть из них мы теперь рассмотрим. Если eit е.2,..., еп — ортонормированная система координат в пространстве 2, то координаты произвольного вектора а равны соответственным скалярным произведениям (a, е^), (а, е2),..., (а, еп). В самом деле, пусть а = -j- a2e2 алел. Умножая это равенство скалярно на е1г и пользуясь тем, что (ej, е*) = 0 для j^k, мы получим (a, ek)=ak(eb, ek) = ak (k=l, 2,..., п), что и требовалось. Если в ортонормированной координатной системе координаты векторов а, Ь равны соответственно аь а2,..., ал и р2,..., ₽л, то (a, b) =®ipi4~«2^24-...4“ал9л. (14) Действительно, пусть еь е2,..., еп — заданная ортонормиро- ванная система координат и а — ai^i 4- 4“ •••~Ь b — 4~ Ма 4- • • • 4- Тогда (а, Ь) = (у1,а,€/, 1 еь) — У, Я/Р/- Неравенство Бесселя. Если ei, е3,..., ет — произволь- ная ортонормированная система векторов унитарного простран- ства и а — какой-нибудь его вектор, то, полагая (a,ek) = <t-k (£=1,2,..., т)г будем иметь неравенство (а, а) =&| at |24-1 а2|24-...4-1ат |2. Мы дадим независимое доказательство этого неравенства, хотя оно легко вытекает и из предшествующих предложений. Составим вспомогательный вектор X = Ctjei 4- а262 4- • • • 4- атет- Мы имеем (а — х, а — х) = (а, а) — (а, х) — (х, а)-\-(х, х)Э=0, (15) (x,x) = (S«A> Za//) = SaA> (16) (a, x) = (a, SaA) = SaA» (х, а) —{а, х) = (18)
§ 17] УНИТАРНЫЕ ПРОСТРАНСТВА 209 Подставляя.значения (16), (17), (18) в неравенство (15), получим (а, а) - + S а/а/ °- т. е. (а, а)>2аА- что и требовалось. Если 61, е2...еп — ортонормированная база, то вместо нера- венства Бесселя согласно (14) будем иметь равенство (а, а) = ед ед алал, которое называется равенством Парсеваля. РавенствоПар- севаля является не только необходимым, но и достаточным усло- вием для того, чтобы ортонормированная система 6i, б2.......еп была базой. Если е.2, ..., ел — какая-нибудь ортонормированная система векторов пространства 8 и для каждого вектора а из 8 (а, а) = ед -f- а2а2 алал, где а^ = (а, ej), j=l, 2..... п, то еи б2, ..., ел — база про- странства 8. Доказательство легко вытекает из предшествующих предложе- ний и предоставляется читателю. Существование в каждом унитарном пространстве ортонормированной базы было доказано выше с помощью косвенных соображений. Однако имеется прямой способ, позволяющий из любой базы пространства получить некоторую его ортонормированную базу. Этот способ носит название про- цесса ортогонализации Грама—Шмидта и часто используется при рассмо- трении пространств функций. Сущность его заключается в следующем. Пусть а1г ..., ат — какая-нибудь линейно независимая система векторов унитарного пространства V. Поставим себе цель: построить такую ортонор- мированную последовательность векторов elt eit ..., ет, чтобы каждый ее J-й вектор ej выражался линейно через j первых векторов щ, ..., (у. По- строение будем вести индуктивно. Вектор et по условию должен выражаться через ах и иметь длину 1. Такой вектор мы получим, нормируя 1 = —=== ev /(Щ, ai) Теперь мы предположим, что для некоторого J векторы elt ..., ej, обла- дающие требуемыми свойствами, уже построены. Будем искать «;+1. Сначала подберем числа ...су так, чтобы вспомогательный вектор «;+1 = ey+1 + Vi + Va+-+“// О9) был ортогонален к векторам elt е2, ..., ej. Умножая (19) скалярно на 6Й(А=1, 2, ..., j), мы видим, что для этого необходимо, чтобы ak— — (aj+u ек). (20)
210 УНИТАРНЫЕ И ЕВКЛИДОВЫ ПРОСТРАНСТВА [Гл. V Обратно, беря для ak значения из (20) и подставляя в (19), мы получим вектор еД_ь ортогональный к ev ev ..., е.. Так как не может выра- жаться линейно через щ, ..., «у и, следовательно, не может быть линейной комбинацией векторов ер ..., е}., то отличен от нуля, и его поэтому можно нормировать. Положим e/+i = 1 - г ^/+1* (21) I e/+i I Соотношения (21) и (19) показывают, что е,-+1 выражается линейно через щ, «2, ..., ву+1. Сверх того, е;-+1 нормирован и ортогонален ко всем ..., ej. Следовательно, предположения индукции выполнены, и мы можем считать, что последовательность е,, е2, ..., ет построена. Если исходная последова- тельность alt а.,, ..., ат была базой пространства, то, очевидно, и последо- вательность е1( е«, ..., ет, полученная ортогонализацией, будет базой про- странства 1!. 17.4. Изоморфизм. В п. 4.3 мы условились два линейных про- странства называть изоморфными, если между их элементами можно установить взаимно однозначное соответствие, сохраняющее опера- ции сложения и умножения на число. В унитарных пространствах к этим операциям добавляется еще скалярное умножение. Поэтому унитарные пространства естественно назвать изоморфными только в том случае, если они ведут себя одинаково по отношению ко всем трем упомянутым операциям. Определение. Два унитарных пространства 2, 2t над одним и тем же полем коэффициентов называются изоморфными, если между их элементами можно установить такое взаимно однозначное соответствие, при котором сумма двух векторов из 2 переходит в сумму соответствующих векторов из 21, произведение числа на вектор из 2 переходит в произведение того же числа на соответствующий вектор из 21 и скалярные произведения соответ- ствующих пар векторов из £ и равны друг другу. Нас будут интересовать только такие свойства унитарных про- странств, которые являются свойствами трех основных операций, действующих в этих пространствах, и не зависят от природы эле- ментов, составляющих пространства. С этой точки зрения изо- морфные унитарные пространства будут иметь одинаковые свойства. Отсюда видна важность классификации всех унитарных пространств с точностью до изоморфизма. Эта классификация не отличается от классификации линейных пространств и дается следующей теоремой. Теорема 3. Для того чтобы два унитарных пространства над одним и тем же полем коэффициентов были изоморфны, необ- ходимо и достаточно, чтобы были равны размерности этих про- странств. В самом деле, если два унитарных пространства 2 и 21 изо- морфны, то они будут изоморфны и как линейные пространства,
§ 17] УНИТАРНЫЕ ПРОСТРАНСТВА 211 т. е. по отношению к операциям сложения и умножения на число. Однако изоморфные линейные пространства имеют одинаковую размерность, следовательно, размерности пространств 2 и 2) равны. Необходимость доказана. Обратно, пусть известно, что размерности пространств 2 и 21 равны. Выберем в 2 и 21 ортонормированные базы Ci, еп и е\........е'п. Условимся векторы х £ 2 и / С Si называть соответственными, если их координаты в выбранных базах одинаковы. Это соответствие взаимно однозначное и сохра- няет операции сложения и умножения на число (п. 4.3). Поэтому нам нужно только доказать, что скалярные произведения соответ- ственных пар векторов одинаковы. Рассмотрим два произвольных вектора а = (XiCi -ф а2&2 -ф • • • 4~ Ь = PiCi -ф + ... -ф в пространстве 2. Соответственные векторы из 2! будут а = aiCi -ф а2е-2 -ф ... -ф а„ел, b' = piCi -ф Рай -ф •.. -ф рпсл. Так как базы е1г ..., еп и el, ..., е'п ортонормированные, то по формуле (14) (й, Ь) = 7-1р1 -ф 4“ ... -ф = (fl , &), что и требовалось. 17.5. Ортогональные суммы. Проекции. Два множества векторов ЭЛ и 91 унитарного пространства 2 называются ортогональными, если каждый вектор первого множества ортогонален к каждому вектору второго. В частности, говорят, что вектор а ортогонален к множеству ЭЛ, если а ортогонален к каждому вектору из ЭЛ. Ортогональность ЭЛ и 91 иногда обозначается символически .в виде ЭЛ_]_91. Если множества Э)1 и 91 ортогональны, то их пересечение либо пусто, либо состоит только из нулевого вектора. В самом деле, если вектор а содержится в ЭЛ и в 91, то (а, а) = 0, откуда а = о. Сумма нескольких линейных подпространств 9G -ф ... -ф ?lm на- зывается ортогональной, если каждые два подпространства ?ly, (j ф k) ортогональны. Ортогональная сумма подпространств всегда является прямой суммой. Действительно, если сумма содержит только два слагаемых, то их пересечение в силу предыдущего замечания состоит только из нулевого вектора и, следовательно, сумма прямая. В общем случае доказательство ведется по индукции. Если сумма
212 УНИТАРНЫЕ И ЕВКЛИДОВЫ ПРОСТРАНСТВА [Гл. V. ортогональная и <2 = 0,1 -j- fla -j- ... -|~ as< Ь г= bi bt -j-r • 4" где aj £ 3ly, bj £ 3(y, /= 1, ..., s, mo (a, b) = (ai, ^) + (a2, M+ +(^» bs). (22) В самом деле, так как 3ly_J_3G при j-^k, то (а?-, &Д = 0. Следовательно, (а, &) = (£>/, = что и требовалось. Рассмотрим теперь произвольное непустое множество векто- ров ЭЛ некоторого унитарного пространства 8. Совокупность всех векторов пространства 8, ортогональных к SO?, называется орто- гональным дополнением множества 30? и обозначается SO?-1-. Ортогональное дополнение любого непустого множества ЭЛ является линейным подпространством. В самом деле, если а, b принадлежат ортогональному допол- нению ЭЛ1, а с — произвольный вектор из ЭЛ, то (аа-[-$Ь, с) = а(а, с)-\-$(Ь, с) = О. Следовательно, при любых a, J3 вектор аа-|~рб содержится в ЭЛ1 и ЭО?-1- является линейным подпространством. Теорема 4. Унитарное пространство 2 есть прямая сумма любого своего линейного подпространства 31 и его ортогонального дополнения Э11. Пусть ei, е-2, ..., ет — ортонормированная база подпространства 31, em+i, ..., es — ортонормированная база подпространства Э11. Для доказательства теоремы достаточно обнаружить, что eit ... ..., ет, , es есть база пространства 2. Допустим, наоборот, что система ei, ..., es не есть база пространства 2. Тогда согласно теореме 2 ее можно дополнить до ортонормированной базы про- странства 8. Пусть е — один из этих дополнительных векторов. Так как е ортогонален ко всем векторам eit ..., ет, то е содер- жится в Э!1. Следовательно, 311 содержит ортонормированную и поэтому линейно независимую систему векторов em+i.........es, е. Однако это противоречит нашему предположению, что ет+1, ..., es является базой для З!1. Теорема доказана. Из теоремы 4 вытекает, в частности, что 3l1J- = 3l. , (23) Действительно, SI11 заведомо содержит 21. С другой стороны, по теореме 4 для любого х из 311-1- имеем х = а^-Ь, а £ 31, b £ ЭН.
ПРИМЕРЫ И ЗАДАЧИ 213 Умножая это равенство скалярно на Ь, получим (&, Ь) = 0, т. е. Ь = о, х = а. Следовательно, 81±-1- = 31. Определим, наконец, еще понятие ортогональной проекции вектора на линейное подпространство. Пусть 31 — некоторое линей- ное подпространство унитарного пространства 2. Согласно теореме 4 2 есть прямая сумма подпространства 31 и его ортогонального дополнения 31-L. Следовательно, всякий вектор х из 2 может быть одним и только одним способом представлен в виде суммы х=а-]-Ь (а С 31, b £ ^)- ' (24) Слагаемое а называется проекцией вектора х на подпростран- ство 31. Так как формула (24) показывает, что 31 является орто- гональным дополнением к 3I-L, то в равенстве (24) слагаемое b будет проекцией вектора х на подпространство ЗР-. Умножая (24) на число а, получим о.х = аа-\-а.Ь (аа £ 81, оф £ 31-1-)» т. е. проекция произведения числа на вектор равна произведению этого числа на проекцию вектора. Аналогично доказывается и утверждение, что проекция суммы векторов на некоторое подпространство равна сумме проекций слагаемых на это подпространство. Примеры и задачи 1. Пусть еа, ег — ортонормированная система координат трехмерного унитарного пространства. Показать, что система векторов «1 = у (2ei + 2еа — ег), аг = у (2й! — ea + 2е3), — у (ei 2еа — 2г8) также образует ортонормированную систему координат этого пространства. 2. В унитарном пространстве 1! выбрана ортонормированная система координат elt ..., еп. Показать, что система векторов alt ..., ап тогда и только тогда будет ортонормированной базой пространства 2, когда матрица, составленная из координатных строк этих векторов, унитарна (см. п. 1.3). 3. Если аа, ..., ат — ортонормированная база линейного подпростран- ства Я, то проекция вектора х на Я равна , (.х, ai)a1 + (x, аа)аа + ... + (х, ат) ат. 4. В пространстве всех многочленов от X степени не выше п скалярное произведение определяется по формуле (7) п. 17.1. Показать, что это будет унитарное пространство размерности п 4-1. Показать, что, ортогонализуя в этом пространстве по Граму — Шмидту последовательность 1, X, Xs, мы получим многочлены 1, (2Х—1), (6Ха — 6X-J-1).
214 УНИТАРНЫЕ И ЕВКЛИДОВЫ ПРОСТРАНСТВА [Гл. V 5. Определителем Грама системы векторов аъ ва, ап n-мерного уни- тарного пространства Я называется определитель («1, «1) («1> «а) ••• («1. а„) д_ ej (а2, в3) ... (а2, ап) (ап, (ап, аг) ... (ап, ап) Пусть в S выбрана ортонормированная система координат. Показать, что определитель Грама Д равен квадрату модуля определителя, составленного из координатных строк векторов а±, ..., ап. Показать также, что сц, а„, ..., ап тогда и только тогда линейно независимы, если их определитель Грама отличен от нуля. 6. Истолковать геометрически процесс ортогонализации Грама — Шмидта в обыкновенном трехмерном пространстве векторов-отрезков. § 18. Сопряженные преобразования 18.1. Линейные функции. Пусть 8 — произвольное конечномер- ное линейное пространство над полем К- Поставим каждому век- тору х из S! в соответствие некоторое число f(x) из К- Соответ- ствия такого вида были названы в п. 4.1 функциями, определен- ными на 2, со значениями в К- Функция f(x) называется линей- ной, если для произвольных х, у из 2 и произвольных а, р из /С f (ах -Н z/) = а/ (х) -ф- р/ (у). (1) Подставляя в (1) а = р = О, мы получим /(о) = 0. По этой причине иногда вместо «линейная функция» говорят «линей- ная однородная функция». Легко видеть, что сумма линейных функций и произведение числа на линейную функцию — снова линейные функции. Проверим, например, первое утверждение. Пусть f=g-\-h, где g uh — линей- ные функции. Согласно определению f + № = g (ах + pz/) + h (ах -ф- pz/) = = W + Pg (У) + «Л (х) + Рй (У) = af (*) + Р/ (У) ’ что и требовалось. Нам уже известно, что действия сложения функций и умноже- ния их на число удовлетворяют аксиомам линейного пространства. Так как сумма линейных функций и произведение линейной функ- ции на число являются снова линейными функциями, то сово- купность всех линейных функций, определенных на векторном пространстве ?, сама является линейным пространством. Это про- странство называется сопряженным пространством по отношению к S и обозначается 2'.
§18] СОПРЯЖЕННЫЕ ПРЕОБРАЗОВАНИЯ 215 Из равенства (1), характеризующего линейные функции, непо- средственно вытекает более общее соотношение f (aiXi 4~ а2х.2 + • • • + а/Л) = = «1/ (Х1) 4” аз/ (х«) 4- • • • 4- ат/ (Хт), (2) доказательство которого мы опустим в силу его очевидности. Сле- дующие теоремы в значительной мере выясняют строение линей- ных функций. Теорема 1. Пусть е1; е._>, ..., еп — какая-нибудь координат- ная система в линейном пространстве 2. Зададим совершенно произвольную последовательность чисел аь а2, ..., а„ из К- Тогда найдется одна и только одна линейная функция f(x), определен- ная на 2 и удовлетворяющая условиям (/=1, 2, ..., п). (3) Доказательство. Пусть х — вектор из 2, X — ^1С1 4" ^2^2 4" • • • + ^Пеп- (4) Ставя этому вектору в соответствие число «iEi-]-а.2£24~ ••• 4-а^л> мы получим некоторую функцию f (х) на 2. Согласно определению f (Х) — а1^1 4- -Г • • • 4~ Полагая здесь х~е}-, мы будем иметь /(с;) = а/ (/=1, ...» п). С другой стороны, если У = 4- № 4- • • • + (5) то / (у) — «i7)! 4- 4~ • • • + ал7ш- Из (4) и (5) следует: «X 4- $у — (а$! 4- p7]i) ei 4- ... 4- (а£„ 4- £?]„) еп, откуда f (ах 4- ₽*/)=ai («^4- hO + • • • 4- а« (а 4- h«)=а/ (*) + ₽/ (у) • Таким образом, /(х) — линейная' функция. Мы доказали, что линейная функция, удовлетворяющая усло- виям (3), существует. Покажем, что она единственная. Пусть g(x) — линейная функция, для которой £(£/) = «/ (/== 1, ..., п). Тогда для произвольного вектора х с координатами 61, ..., мы будем иметь g(x)=gGiei4-... 4-^)=£ig(ci)4- ••• 4-^(c»)= = 5i«i 4- • • Ч~ т. e. g(x)=/(x).
216 УНИТАРНЫЕ И ЕВКЛИДОВЫ ПРОСТРАНСТВА [Гл. V Теорема 1 была доказана для произвольных линейных про- странств Если пространство 2 унитарное, то линейные функ- ции на 2 получают весьма простое выражение через' скалярное произведение. Теорема 2. Скалярное произведение (х, а) векторов унитар- ного пространства 2 при фиксированном а является линейной функцией от х. Тем самым каждому вектору а из 2 ставится в соответствие линейная функция, определенная на 2. Различные векпТоры дают при этом различные линейные функции, и все ли- нейные функции на 2 таким способом получаются. Первое утверждение очевидно, так как из f (х) = (х, а) сле- дует: /(ах4-рг/) = (ах-Н*/, а) = “(*> «) + ₽(*/. а) = «/(*) + ?/(*/)• Докажем второе утверждение. Если бы, вопреки ему, различным векторам а и b отвечала одна и та же линейная функция, то это означало бы, что равенство (х, а) — (х, Ь) имеет место при любых х из 2. Перенося члены в одну сторону, можно предста- вить его в форме (х, а — Ь) = 0, откуда, полагая х = а — Ь, по- лучим (а — Ь, а — Ь) = 0. Однако нулевой вектор является един- ственным, скалярный квадрат которого равен нулю, так что а — Ь = о, или а — Ь. Нам остается доказать третье утверждение, именно что всякая линейная функция /(х), определенная на 2, может быть представлена в форме Дх) = (х, а), (6) где а зависит от f, а х — произвольный вектор из 2. Обозначим через 21 совокупность тех векторов, для которых /(х) = 0. Так как f(o) — 0, то о заведомо содержится в 21. Далее, ебли векторы а и b содержатся в 21, то /(аа+^) = а/(а) + ₽/(&) = 0, т. е. и содержится в 21. Следовательно, 21 есть линейное, подпространство пространства 2. Если 21 = 2, то /(х) = 0 для всех х. Чтобы удовлетворить требованию (6), нам достаточно в этом случае взять а = о. Предположим поэтому, что 21 #= 2. Выберем какой-либо ненулевой вектор b из 2, ортогональный к 21, и постараемся найти такое число а, чтобы вектор а=лЬ удовлет- ворял соотношению (6). Пусть /(&) = р, /(х)=-£, где х — произ- вольный вектор из 2. Имеем ' f(x—|&) = /(х)-|/(&) = 0. с Обозначив разность х —через с, мы видим, что с входит в 2Г
S 18] СОПРЯЖЕННЫЕ ПРЕОБРАЗОВАНИЯ 217 и х = с4-^Ь. Отсюда •* р (х, а) = (-j- Ъ 4- с, ab\ = -^(b, Ь)-\- я (с, Ь). Так как вектор b ортогонален к 31, то (с, Ь) = 0 и, следова- тельно, (х, а) = ^(Ь, Ь). (7) Равенство (7) показывает, что если мы примем а = р (&, Ь)~1, то для любого х будем иметь (х, а) = $ = /(%), что и требовалось. 18.2. Сопряженные преобразования. Мы теперь воспользуемся результатами предыдущего пункта, чтобы для каждого линейного преобразования унитарного пространства построить однознач'но определенное новое преобразование, называемое сопряженным по отношению к старому. Пусть — линейное преобразование унитарного простран- ства 2. Выберем в 2 произвольный вектор у и рассмотрим выра- жение f(x) = (x&^, у), (8) где х — переменный вектор. Так как f(au-j-fto) = ((a«4-₽0 = y) = a.f (v), то f (x) — линейная функция. Поэтому f(x) можно представить согласно теореме 2 в виде f(x) = (x, а), (9) где вектор а однозначно определяется функцией /(х), т. е. пре- образованием и вектором у. Если рассматривать как за- данное преобразование, а вектор у менять, то для каждого век- тора у получится свои вполне определенный вектор а. Преобра- зование, переводящее у в а, обозначается и называется сопряженным к таким образом, a = yod*. Подставляя это значение в (9) и сравнивая с (8), мы получим соотношение (х<г^, у) — {х, у&#*), (10) имеющее место для произвольных векторов х, у из 2. -Свойство (10) вполне характеризует сопряженное преобразо- вание <а^*. В самом деле, пусть какое-либо преобразование <33 обладает тем же свойством, т. е. для любых х, у (х&^, у) = (х, уЗЗ),
218 УНИТАРНЫЕ И ЕВКЛИДОВЫ ПРОСТРАНСТВА * [Гл. V. ИЛИ (X, у&З*) — (х, уЗЗ) — (х, у&З* — уЗЗ) = 0. Это означает, что вектор у&З* — уЗЗ ортогонален ко всему про- странству, откуда у&З* = уЗЗ. Последнее равенство имеет место для всех у, следовательно, оД* =33. Теперь нетрудно доказать, что сопряженное преобразование &3* является линейным. Действительно, на основании (10) (х, = O.U Д- Pl>) — а. (ХеЗ?, и} -j- р (Ха^, V) = = а (х, Ие^"*) 4-р (X, 0е^*) = (х, а • ио^* Д' ₽ ' при любых значениях вектора х. В силу второго утверждения теоремы 2 это влечет за собой равенство (эдД-рп)^* = а • и&З* Д~р • Пе^*, которое и означает, что оЗЗ* линейно. Операция перехода к сопряженному преобразованию обладает следующими свойствами: а) б) (а<а^)* = йаХ/*, в) (<2^ + ^)*=^*-!-^*, г) (^33}*=33*в^*. Все эти свойства доказываются одним и тем же способом, по- этому мы ограничимся доказательством только одного из них. Например, (х&ЗЗЗ, у) = (хеЗ, уЗЗ*) = (х, уЗЗ*&3*), следовательно, (&3ЗЗу* = 33* e/g*. Отметим здесь же, что сопряженные преобразования для единичного и нулевого преобразований совпадают с ними самими. Действительно, (xg, у) = (х, у) = (х, у%>), (х®, у) = 0==(х, у®). Посмотрим, как связаны матрицы сопряженных преобразова- ний. Выберем в пространстве 2 ортонормированную систему координат eit е*... еп, и пусть — а,-1е1 4" Д" • • • 4“ а1лСл, ei&3* — Р/1^1 4” Pi2e2 Д- • 4- ?in^n (t = l, .... ri). Умножая эти равенства скалярно на е} и пользуясь ортонорми- рованностью системы ..., еп, мы получим еу)=а/у, (eterf*, {i, / = 1....п).
§ 18J СОПРЯЖЕННЫЕ ПРЕОБРАЗОВАНИЯ 219 Отсюда a.ij = (ei&^, ej) = (ei, = (ерЛ*, е,) = ру,-. Следовательно, если матрица преобразования есть А, то матрица сопряженного преобразования будет равна А'. Мы получили следующую теорему: Теорема 3. Если линейное преобразование имеет в орто- нормированной системе координат матрицу А, то сопряженное преобразование будет иметь в этой системе сопряженно- транспонированную матрицу А'. Операция перехода к сопряженным преобразованиям обладает свойствами а), б), в), г). На основании теоремы 3 мы заключаем, что теми же свойствами будет обладать и операция перехода к сопряженно-транспонированным матрицам. Этот результат легко получается и непосредственным вычислением (ср. п. 1.3). 18.3. Нормальные преобразования. Рядом замечательных свойств обладают линейные преобразования унитарного пространства, пере- становочные со своими сопряженными, для которых, таким обра- зом, имеет место соотношение Эти преобразования называются нормальными. Вспоминая, что в ортонормированной координатной системе сопряженные преоб- разования имеют сопряженно-транспонированные матрицы, мы непосредственно приходим к выводу, что те и только те линейные ' преобразования унитарного пространства нормальны, матрицы которых в ортонормированных базисах удовлетворяют соотношению АА' — А'А. Столь же просто получаются и следующие свойства нормаль- ных преобразований: Теорема 4. Всякий собственный вектор а нормального пре- образования ed, принадлежащий собственному значению р, будет собственным вектором и сопряженного преобразования но принадлежащим комплексно сопряженному собственному значению р. Нам дано: odod* , а(е^— pg) = O. Отсюда о — (а — pg), а (е/йГ — pg)) = (а — pg) (е^* — pg), а) = — pg)(ez^ — pg), а) = (а(е^* — pg), а(®^* — pg)), или — pg) = o, что и требовалось.
220 УНИТАРНЫЕ И ЕВКЛИДОВЫ ПРОСТРАНСТВА [Гл. V Теорема 5. Собственные векторы, принадлежащие различ- ным собственным значениям нормального преобразования аД, орто- гональны. Пусть aerf = ра, bod = ab (р ф а). Тогда р (а, Ь) = (а&^, Ь) — (а, Ь&^*) = о (а, Ь), т. е. (р — о) (а, Ь) = 0, (а, Ь) = 0. Лишь немногим более сложно доказывается следующая основная Теорема 6. В комплексном унитарном пространстве для каждого нормального преобразования существует ортонорми- рованный базис, состоящий из собственных векторов преобразо- вания а/t; матрица имеет в этом базисе диагональный вид. Для доказательства берем в исходном пространстве V какой- либо собственный вектор at ф о преобразования е/ё и обозначаем через fi подпространство, ортогональное к а-,. Если aiaz/ = p1ai, х £ fi, то (щ, xo^) = (aia^*, x) = pi(alt х) = 0, т. е. подпространство fi инвариантно относительно Из инва- риантности fi следует, что в нем найдется некоторый собственный вектор а2 преобразования а/t. Обозначаем через подпространство всех векторов из ?, ортогональных к а*, и полагаем fa — fi [~| f2. Так как fi, f2 инвариантны относительно erf, то инвариантным будет и подпространство fa, в котором поэтому снова найдется ненулевой собственный вектор а3 преобразования &£. Обозначая через f3 совокупность всех векторов f, ортогональных к а3, и полагая f3 = fi р f3, получим инвариантное подпространство векторов, ортогональных к а]( а3, д3. Продолжив процесс, получим искомый ортогональный базис а1г а2, • • •, ап пространства 2, состоя- щий из собственных векторов преобразования Выраженное в теореме 6 свойство нормальных преобразований комплексных пространств характеристично для этих преобразо- ваний. Действительно, если в некотором ортонормированием базисе матрица А преобразования диагональна, то матрица А' сопря- женного преобразования будет также диагональна, а значит и перестановочна с А. В вещественных унитарных пространствах положение несколько иное. Чтобы разобраться в нем, докажем сначала одно общее предложение, относящееся к произвольным вещественным линей- ным преобразованиям.
§ 18] СОПРЯЖЕННЫЕ ПРЕОБРАЗОВАНИЯ ’ 221 .Теорема 7. Каждое линейное преобразование orf веществен- ного ненулевого пространства имеет по меньшей мере одно инва- риантное подпространство размерности 1 или 2. Если характеристический многочлен <р (X) преобразования еЛ имеет вещественный корень а, то erf имеет в 2 ненулевой соб- ственный вектор. Подпространство, натянутое на этот вектор, и будет искомым одномерным инвариантным подпространством. Предположим теперь, что <р (X) вещественных корней не имеет. В таком случае ® (X) будет иметь пару сопряженных комплексных корней а = р io, а = р — io, так как коэффициенты многочлена <р (X) вещественны. Выберем в 2 какую-нибудь координатную систему ei, •••, еп, и пусть А — матрица преобразования &К в этой системе. Рассмотрим уравнение [$!, ..., УЛ=«[Е1, .... М, (И) где Si, ..., — некоторые неизвестные, значения которых будем искать в поле комплексных чисел. Уравнение (11) можно пере- писать в виде [?,, Ег, ..., 5л](а£-Л)^=0, где Е -г- единичная матрица, а О — нулевая строка. Это уравнение равносильно системе линейных однородных уравнений относи- тельно неизвестных ?i, kn с матрицей (аЕ— А)' (ср. п. 11.4). Так как определитель этой матрицы есть <р(а) и, следовательно, равен нулю, то уравнение (11) будет иметь в поле комплексных чисел ненулевое решение, которое мы обозначим теми же бук- вами ..., Положим для краткости [Si, Е2, ..., Ц = х, так что соотношение (11) примет вид хА — ах. (12) Переходя здесь к комплексно сопряженным числам, получим хА=ах. Но матрица А имеет вещественные элементы, поэтому А = А и ХА = ах. (13) Так как строки хi(x— х) вещественны, то в пространстве 2 найдутся векторы а, Ь, координатные строки которых будут соот- ветственно равны [а] = 1(х + х), (14)
(15) 222 УНИТАРНЫЕ И ЕВКЛИДОВЫ ПРОСТРАНСТВА [Гл. V Выражая отсюда х и X через [а], [&] и пользуясь (12), (13), при- дем к соотношениям [а] А = р [а] — о [6], [&] А = а [а] + р[6] (а = Р-Н°). Эти соотношения равносильны равенствам ао^ = ра~ ab, = аа pb, показывающим, что подпространство, натянутое на векторы а, Ь, инвариантно относительно преобразования . Теорема доказана. Допустим теперь, что рассматриваемое пространство 2 является вещественным унитарным, — некоторым его нормальным пре- образованием, характеристический многочлен которого ® (X) имеет два сопряженных невещественных корня р —ta и р — го (а 0). Выбирая в 2 в качестве координатной системы ..., еп какой- либо ортонормированный базис и повторяя предыдущее постро- ение, получим в 2 снова векторы а, Ь, связанные соотношени- ями (15). Покажем, что теперь векторы а, b будут ортогональ- ными. В самом деле, для нахождения этих векторов нам пришлось рассматривать пространство строк 2 над полем комплексных чи- сел. Это пространство строк мы можем считать унитарным, при- нимая в соответствии с п. 17.1 в качестве скалярного произве- дения строк [51, ..., Ц и hi, выражение -|--------------1-^„. Строки [ej, ..., [е„] составляют ортонормированный базис 2. Пре- образование, состоящее в умножении строк на матрицу А, будет линейным преобразованием, матрица которого в указанном базисе будет совпадать с А'. Так как А = А, то рассматриваемое пре- образование нормальное, а строки х, X, найденные в доказатель- стве теоремы 7, будут собственными векторами, отвечающими различным собственным значениям р —{-td и р —io. На оснований теоремы 5 имеем (х, Х) = 0, откуда ([а], Р])=^(* + *, х —х) = 0, т. е. (а, Ь) — 0. Выбирая в качестве х вектор длины 1/2, мы получим из (14), что а, b будут иметь длину 1. Докажем еще, что подпространство в 2, ортогональное к а и Ь, будет инвариантным относительно а/t. Но в пространстве строк 2 подпространство, ортогональное к [я] и [&], совпадает с подпространством 21, ортогональным к х и X. Последнее под- пространство инвариантно относительно А, так как оно является пересечением подпространств, ортогональных к собственным век-
§ 181 СОПРЯЖЕННЫЕ ПРЕОБРАЗОВАНИЯ 223 торам х, X нормального преобразования. Если теперь у С S, (а, у) = (Ь, у) = 0, то [г/] С Si> Ш А £ Si, откуда (у&£, а) = ([«/] А, [а]) = 0, (z/a^, b) = 0, что и требовалось. Преобразование индуцированное преобразованием в двумерном подпространстве, натянутом на векторы а, Ь, имеет в силу (15) матрицу р — о’ ° р/ А = Представляя комплексное число р ia в форме г (cos ср — i sin ср), мы придадим матрице At вид А1==г COS ср sin ср ' — sin ср cos ср J* Таким образом, есть произведение преобразования с матри- цей гЕ и преобразования с матрицей COS ср sin ср ' — sin ср cos ср . Первое из них есть преобразование подобия с.центром в начале координат и коэффициентом растяжения г, а второе, как легко видеть, есть просто поворот векторов в плоскости а, b на угол ср около начала координат. Теорема 8. Для каждого нормального преобразования вещественного унитарного пространства S существует в 2 такой ортонормированный базис, в котором матрица преобразования orf имеет вид «1 А = %k_ COS ср! sin ср/ — sincpj cos cpj т COS cpm sincpm‘ sincpm coscpnj’ (16) где числа k, m могут быть и нулями. Доказательство почти дословно совпадает с доказательством аналогичной теоремы 6. Различие состоит лишь в том, что теперь мы не можем утверждать, что в каждом инвариантном относи- тельно оЛ подпространстве содержится ненулевой собственный вектор a,-+i преобразования Однако если в нет собствен- ных векторов' преобразования orf, то на основании теоремы 7 в it найдется пара взаимно ортогональных* векторов ai4i, Ьм,
224 УНИТАРНЫЕ И ЕВКЛИДОВЫ ПРОСТРАНСТВА (Гл. V связанных соотношениями вида (15). В качестве подпространства £,+1 тогда можно взять совокупность векторов 8, ортогональных к а/+1 и bi+t. На основании сделанных выше замечаний 8^ будет инвариантным относительно е^, и процесс можно будет продол- жать далее по схеме, изложенной в доказательстве теоремы 6. В результате получим ортонормированный базис 8, состоящий из векторов аи ..., ак, ak+i, bk+t, ак+т, bk+m, связанных соот- ношениями вида ар&£ = арар (р=1, k), ’ ,7 (7 = 1....т, а^О), bgQ^ = aqag-\-^qbg J w ? которые показывают, что матрица преобразования в указан- ном базисе имеет как раз вид (16). Примеры и задачи 1. В обыкновенном трехмерном евклидовом пространстве St выбираем направленную прямую, проходящую через начало координат, и обозначаем через /(х) длину проекции вектора х на эту прямую, взятую с соответ- ствующим знаком. Показать, что f(x')— линейная функция и что всякая линейная функция в пространстве имеет вид а/(х), где а^О, а ось про- екций выбрана надлежащим образом (ср. теорему 2). 2. Функция /(х), определенная на комплексном линейном пространстве, называется косолинейной, если /(х-|-у>) =/(х) /(ах) = а/(х). Пока- зать, что всякая косолинейная функция на унитарном пространстве имеет вид (а, х). 3. Доказать, что соответствие между векторами унитарного простран- ства £ и косолинейными функциями, установленное в предыдущей задаче есть изоморфизм между £ и пространством всех косолинейных функций на 1*. 4. В унитарном пространстве £ с неортонормированным базисом а1г а2, аг даны линейные преобразования Si с матрицами Найти в £ ортонормированный базис, если известно, что охё, S3 нор- мальны и что вектор имеет длину 1. 5. Показать, что в комплексном унитарном пространстве из каждого нормального преобразования можно извлечь корень произвольной натураль- ной степени т, т. е. что для каждого нормального преобразования orf суще- ствует нормальное же преобразование S3 такое, что S3m = qS- Каково максимальное число таких преобразований 6. Доказать, что если Я ееть инвариантное подпространство нормального преобразования то ортогональное подпространство Я-*- будет также ин- вариантным относительно Если основное пространство комплексное, то указанное свойство характеристично^для нормальных преобразований.
SF 191 УНИТАРНЫЕ И СЙММЕТРИЧЕСКИЕ ПРЕОБРАЗОВАНИЯ ' 225 §19. Унитарные и симметрические преобразования 19.1. Унитарные преобразования. Изоморфное отображение унитарного пространства на себя называется унитарным преоб- разованием этого пространства. Более подробно: линейное неосо- бенное преобразование 11 унитарного пространства 2 называется унитарным, если оно не меняет величины скалярного произведе- ния, т. е. если для всех а, b из 8 имеет место соотношение (a, b) = (aU, bit). (1) Повороты обыкновенного трехмерного евклидова пространства около начала координат О представляют собой простейший при- мер унитарных преобразований. Зеркальные отображения этого пространства относительно какой-нибудь проходящей через О пло- скости представляют собой другой пример унитарных преобразо- ваний обыкновенного пространства. Можно легко доказать, что комбинациями этих двух типов преобразований исчерпываются вообще все унитарные преобразования обыкновенного простран- ства. Поэтому унитарные преобразования унитарных пространств можно рассматривать как преобразования, аналогичные враще- ниям и зеркальным отражениям обыкновенного евклидова про- странства. Из равенства (1), характеризующего унитарные преобразова- ния, следует, что (х, y) — (x1l, y1t) = (x, yllll*), откуда UU* = %>, 1l* = U-\ 11*11 = %. (2) Обратно, из соотношений (2) следует, что 11 обратимо и что (х, у) = (х, y1lU*) = (xU, yU). Таким образом, линейное преобразование 11 тогда и только тогда унитарно, когда сопряженное преобразование 11* совпадает с обратным В частности, соотношения (2) показывают, что унитарные преобразования являются нормальными преобразованиями в смысле предыдущего пункта. Выберем в пространстве 2 какую-нибудь ортонормированную систему координат, и пусть 11 — некоторое унитарное преобразо- вание этого пространства. Если матрица преобразования 11 равна U, то матрица сопряженного преобразования согласно п. 18.2 есть U'. Из соотношения (2). поэтому следует; UU' = E. (3) 8 А. И. Мальцев
226 УНИТАРНЫЕ И ЕВКЛИДОВЫ ПРОСТРАНСТВА [Гл. V Обратно, если в ортонормированной системе координат матрица U какого-нибудь линейного преобразования 11 удовлетворяет соот- ношению (3), то само преобразование U удовлетворяет соотноше- ниям (2) и, следовательно, является унитарным. Матрицы U, удо- влетворяющее соотношению (3), называются унитарными^. 1.3), и мы приходим к следующему результату: всякое унитарное пре- образование имеет в ортонормированной системе координат уни- тарную матрицу, обратно, если линейное преобразование в неко- торой ортонормированной системе координат имеет унитарную матрицу, то оно унитарно. Если основное поле К вещественно, то матрицы преобразова- ний также вещественны и соотношение (3) принимает вид UU’ = E. (4) Матрицы, удовлетворяющие этому соотношению, были названы в п. 1.3 ортогональными. Таким образом, вещественные унитар- ные преобразования в. ортонормированием базисе имеют ортого- нальные матрицы. Обратно, если матрица линейного преобразо- вания вещественного унитарного пространства в ортонормирован- ием базисе ортогональна, то преобразование унитарно. Согласно определению унитарные преобразования не меняют величин скалярных произведений. Отсюда следует, что унитарные преобразования не меняют длин векторов. Последнее свойство характеристично для унитарных преобра- зований: если линейное преобразование 11 унитарного простран- ства 2 не меняет длин векторов, то 11 унитарно-. В самом деле, пусть а, b — произвольные векторы из 8. По- ложим а11 = а', bll — tf. Так как преобразование U линейное, то при всех значениях а из поля коэффициентов (а -ф- ab) И — а' -ф- аЬ'. По условию 11 длин не меняет, так что (а —а£», а -ф- а.Ь) — (а' -ф- а.Ь', а' Выполняя здесь умножение и вычеркивая взаимно уничтожа- ющиеся члены, получим а(Ь, а)-]-а. (а, Ь)=а.(р', а')-|~а(а', Ь'). (5) При а = 1 это равенство переходит в (Ь, а)ф-(а, b) = (b', а')-\-(а', Ь'). (6) Если основное поле вещественно, то (Ь; а) —{а, Ь) и (6) дает
§ 19] УНИТАРНЫЕ И СИММЕТРИЧЕСКИЕ ПРЕОБРАЗОВАНИЯ 227 (а, Ь) — (аг, Ь'). Если же /С не вещественно, то, полагая в (5) а = г и сокращая на I, приходим к соотношению (Ь, а) — (а, Ь) = (У, а') — (а’, Ь'), которое вместе с (6) дает снова (а, Ь) = (а', Ь’). Итак, в обоих случаях (a, b) = (a', b’) = (aU, bU}, т. е. И унитарно. Рассмотрим вопрос о преобразовании координат в унитарных пространствах. Пусть ej, ег, ..., еп — ортонормированный базис в унитарном пространстве 2 и 71 — какое-нибудь унитарное пре- образование этого пространства. Так как унитарное преобразова- ние не меняет длин векторов и переводит ортогональные векторы в ортогональные, то система eJi, eJi, ..., e„ll будет снова орто- нормированным базисом в 2. Обратно, допустим, что некоторое линейное преобразование U переводит ортонормированный базис ei, е-2, ..., ел снова в ортонормированный базис e{U, . Возьмем в 8 произвольные векторы а = зад -j- алел, b = pifii ц- р-гб-г Д' er£n- Имеем (й, = Де,) = aipi Д- а23-2 Д-.. • -Д алЗл, (а77, Ь71) = —74З1 Д"«-«4“алрл, т. е. (а, Ь) = (а17, Ь77); преобразование И унитарно. Итак, для того чтобы линейное преобразование 11 было унитарным, необхо- димо и достаточно, чтобы И переводило ортонормированный базис в ортонормированный. Отсюда непосредственно вытекает и следующее предложение: матрица перехода от одного ортонормированного базиса к дру- гому унитарна, и, обратно, если один из базисов ортонормиро- ван, а матрица перехода унитарна, то другой базис также орто- нормирован. Для доказательства достаточно заметить, что матрица пере- хода от одной системы координат к другой совпадает с матрицей линейного преобразования, переводящего первую систему во вто- рую (п. 8.3). Отметим, наконец, еще следующие свойства унитарных преоб- разований, легко вытекающие из их определения: 1) единичное преобразование унитарно, 2) произведение унитарных преобра- зований унитарно, 3) обратное для унитарного преобразования унитарно. 19.2. - Унитарная эквивалентность. В связи с понятием уни- тарного преобразования естественно формулируется и одна из 8*
228 УНИТАРНЫЕ И ЕВКЛИДОВЫ ПРОСТРАНСТВА [Гл. V основных задач теории унитарных пространств. Речь идет о клас- сификации линейных преобразований этих пространств. Пусть 8 и Vj — унитарные пространства над одним и тем же основным полем К. Рассмотрим два линейных преобразования этих про- странств из которых действует в 8, а действует в 8f. Преобразования sz^t называются подобными или изо- морфными, если существует такое изоморфное отображение 8 на 81, при котором преобразование sz^ переходит в a^i. Поскольку все унитарные пространства с точностью до изоморфизма известны и определяются их размерностью п, то мы можем считать, что 14 совпадает с 8 и, следовательно, что преобразования и erfi действуют в одном и том же пространстве 8. В этом случае наше определение означает, что е/ и a/i тогда и только тогда изо- морфны, если существует изоморфное отображение zZ простран- ства 8 на себя, при котором переходит в Как мы видели в п. 10.2, это равносильно условию, что ez^i = ZrW#. (7) Если в 8 выбрать ортонормированную систему координат, то (7) можно переписать в матричной форме: Л1 = ^-‘Л^, (8) где V — унитарная матрица, Л и Л] — матрицы заданных линей- ных преобразований. Матрицы Л, Ль связанные соотношением (8), называются унитарно эквивалентными. Следовательно, линейные преобразования унитарного пространства тогда и только тогда изоморфны, если их матрицы, вычисленные в ортонормированием базисе, унитарно эквивалентны. Рассматривая матрицу U в соотношении (8) как матрицу пе- рехода, мы придем к такому предложению: линейные преобразова- ния ed, & унитарного пространства 8 тогда и только тогда изоморфны, если в 8 существуют два ортонормированных базиса, обладающих тем свойством, что матрица преобразования orf, вычисленная в одном из них, совпадает с матрицей преобразова- ния <$3, вычисленной в другом. Это предложение вполне аналогично соответствующему утвер- ждению для произвольных линейных пространств, рассмотренно- му в конце п. 10.2, где приведено и подробное доказательство. В качестве примера можно взять нормальные преобразования. Ясно, что для унитарного изоморфизма линейных преобразований унитарного пространства необходимо, чтобы Они были линейно изоморфны, т.е. изоморфны как линейные преобразования линей- ного пространства. Поэтому для унитарного изоморфизма линей- ных преобразований необходимо, чтобы их характеристические многочлены совпадали. Если заданные преобразования нормаль-
§ 19] УНИТАРНЫЕ И СИММЕТРИЧЕСКИЕ ПРЕОБРАЗОВАНИЯ 229 ны, то, зная корни их характеристических многочленов, можно согласно предыдущему пункту написать матрицы этих" преобразо- ваний в подходящих ортонормированных базисах пространства. Так как эти матрицы будут одинаковыми, то преобразования бу- дут унитарно изоморфными. Тем самым доказана Т е о р е м а 1. Для унитарного изоморфизма нормальных пре- образований как комплексных, так и вещественных унитарных пространств необходимо и достаточно coehadenue характеристи- ческих многочленов этих преобразований. В чисто матричной форме теорему 1 можно изложить следую- щим образом: Теорема 1а. Для унитарной эквивалентности матриц А, В, перестановочных со своими кососопряженными А', В’, и в поле ком- плексных и в поле вещественных чисел необходимо и достаточно совпадение характеристических многочленов А и В. В частности, для каждой комплексной или вещественной мат- рицы А, для которой АА' = А'А, существует такая комплексная, соответственно вещественная, унитарная матрица U, что матрица UAU~l — UAU' будет диагональна в комплексном случае и иметь вид (16) из п. 18.3 в вещественном случае. Таким образом, унитарный изоморфизм нормальных преобра- зований оказывается равносильным обычному изоморфизму их. 19.3. Нормальная форма матрицы унитарного преобразования. Как уже было отмечено, унитарные преобразования являются частным случаем нормальных. Поэтому теоремы 1 и 1а дают не- обходимые и достаточные условия унитарной изоморфности, а также и нормальный вид матриц унитарных преобразований. Характерная особенность унитарных преобразований, отличаю- щая их от остальных нормальных преобразований, дается сле- дующей теоремой: Теорема 2. Все корни характеристического многочлена уни- тарного преобразования имеют модуль, равный единице. Рассмотрим сначала комплексный случай. В этом случае каж- дому корню а характеристического многочлена унитарного пре- образования U соответствует ненулевой собственный вектора. Из aU = a.a, (all, dll) = (a, а) следует; (аа, аа) = аа(а, а) = (а, а), Т. е. аа= |а |2= 1. В вещественном случае каждому комплексному корню а = р-ф- -ф- го отвечает пара ненулевых ортогональных векторов а, Ь, для которых all — ра — <зЬ, Ы1 — <за -ф- pb.
230 УНИТАРНЫЕ И ЕВКЛИДОВЫ ПРОСТРАНСТВА [Гл. V Отсюда имеем (а, а) + (b, b) = (aU, аЩ (Ы1, Ы1} = (р2 -j- а2) ((а, а) (Ь, &)), т. е. р2-]-а2 = | а |2—1. Замечая, что среди вещественных чисел только 1 и —1 обла- дают модулем, равным единице, мы можем теорему 1а примени- тельно к унитарным преобразованиям сформулировать в следую- щей форме: Теорема 3. Для каждой унитарной матрицы А найдется такая комплексная унитарная матрица U, что UALE1 будет диагональной матрицей с диагональными элементами, по модулю равными единице. Для каждой вещественной унитарной матрицы А найдется такая вещественная унитарная матрица U, для ко- торой U А и~1 = Es + (-Et) 4- cos <f>! sin — sin ср! cos <pj cos sin®m’ — sin®m cos®,,J’ (9) где Es, Et —единичные матрицы порядков s и t, sincpyT^O (/ — — 1, m), причем некоторые из чисел s, t, m могут быть и нулями, т. е. в формуле (9) соответствующие члены могут от- сутствовать. Рассмотрим в качестве примера обыкновенное трехмерное евклидово пространство 31. Согласно теореме 3 для каждого орто- гонального преобразования U пространства 31 можно найти такую систему ei, е2, е3 взаимно перпендикулярных единичных векто- ров, что матрица преобразования 11 получит один из следующих шести видов: ’1 е) cos ср sin ср , — sin ср cos ср_ 1 *) cos <р sin <р . — sin ср cos ср Очевидно, преобразование 11 будет в случае а) тождественным пре- образованием, в случае р) зеркальным отражением относительно плоскости е20е3, в случае f) зеркальным отражением относительно прямой 0elt в случае 8) зеркальным отражением относительно
§ 19J УНИТАРНЫЕ И СИММЕТРИЧЕСКИЕ ПРЕОБРАЗОВАНИЯ 231 начала О, в случае е) вращением на угол ® около оси еь в слу- чае •/) вращением на угол ® около оси eit сопровождаемым зер- кальным отражением относительно плоскости е.Ое;1. Первые четыре случая можно рассматривать как частные случаи двух последних при = 0 и = 19.4. Симметрические преобразования. Линейное преобразова- ние унитарного пространства £ называется эрмитовым или симметрическим, если совпадает со своим сопряженным пре- образованием orf*. Таким образом, если симметрическое, то (х-v/, у) = (х, уа^). (10) Обратно, если при любых х, у из £ линейное преобразование еЛ удовлетворяет условию (10), то симметрическое. Из условия — очевидно, следует равенство = = , т. е. симметрические преобразования являются нор- мальными преобразованиями. Выберем в £ какой-нибудь ортонормированный базис, и пусть А — матрица симметрического преобразования . Матрица сопря- женного преобразования е^* в таком базисе равна кососопря- женной матрице А'. По условию &/*=<>/, откуда А' = А. (11) Обратно, из (11) следует, что о^*=о^, т. е. что симмет- рическое. Матрицы, удовлетворяющие соотношению (11), были названы в п.1.3 эрмитовыми. Таким образом, в ортонормирован- ием базисе симметрическим преобразованиям отвечают эрмитовы матрицы и, наоборот, эрмитовым матрицам отвечают симмет- рические преобразования. Преобразования вида ag при вещественном а представляют простейший пример симметрических преобразований. Общий при- мер дают преобразования, матрица которых в каком-либо орто- нормированием базисе имеет вещественную диагональную форму. Сумма симметрических преобразований, а также произведение симметрического преобразования на вещественное число являются снова симметрическими преобразованиями. В самом деле, если преобразования См симметрические, число а вещественное, то (oat; ей1)* = <тС* а®, (ae^)* = ъ-мС* = aestf. Произведение двух симметрических преобразований тогда ц только тогда является симметрическим, когда эти преобразования перестановочны. Действительно, из = , о/С — а/С*, = следует! (ezgfs®)* = i
232 УНИТАРНЫЕ И ЕВКЛИДОВЫ ПРОСТРАНСТВА 1Гл. V Обратно, если =е^е®, еЛ , е® = а®*, ТО а’Са® == (ет^е®)* = е®*а^* = еЖд^. Отсюда следует, в частности, что степени симметрического преоб- разования и вообще многочлены с вещественными коэффициентами от симметрического преобразования — снова преобразования сим- метрические. Собственные значения симметрических преобразований веще- ственны. - Действительно, пусть — симметрическое преобразование, а — его собственное значение и а — соответственный ненулевой Собственный вектор. Тогда (а, ао^} = (а, ай) = я(а, й), (а®//, й) = (аа, й) = а(а, а). Но (а, аоЛ) — (аа4, а). Сравнивая эти результаты, мы видим, что а = а, т. е. что а веще- ственно. Все корни характеристического многочлена эрмитовой ма- трицы вещественны. В самом деле, каждая эрмитова матрица А может быть рассма- триваема как матрица некоторого симметрического преобразова- ния унитарного пространства. Корни характеристического мно- гочлена матрицы А являются собственными значениями преобра- зования &=/ и поэтому вещественны. Выше было отмечено, что симметрические преобразования являются нормальными. Поэтому на основании теоремы 1 для уни- тарного изоморфизма симметрических преобразований необходимо и достаточно совпадение характеристических многочленов этих преобразований. Согласно теореме 6 п. 18.3 для каждого нормального преобразо- вания комплексного унитарного пространства существует ортонор- мированный базис, в котором матрица преобразования имеет диа- гональный вид. Поскольку все собственные значения симметри- ческих преобразований вещественны, указанная диагональная матрица для симметрических преобразований будет вещественной, и мы приходим к теореме:' Теорема 4. Всякое симметрическое преобразование комплекс- ного унитарного пространства в подходящем ортонормированном базисе имеет вещественную диагональную матрицу. Обратное также справедливо, так как если матрица линейного преобразования orf имеет в ортонормированном базисе вещест-
§ 19] УНИТАРНЫЕ И СИММЕТРИЧЕСКИЕ ПРЕОБРАЗОВАНИЯ 233 венную диагональную форму А, то А’ —А и, следовательно, . В матричной форме теорема 4 может быть переформулирована в следующем виде: Теорема 4а. Для каждой эрмитовой матрицы А существует такая комплексная унитарная матрица U, что UAU ' имеет ве- щественный диагональный вид. Рассмотрим теперь случай, когда orf — симметрическое преоб- разование вещественного унитарного пространства. Согласно тео- реме 8 п. 18.3 в подходящем ортонормированном базисе матрица преобразования распадется на клетки порядков 1 или 2. При этом клетки порядка 2 появляются только тогда, когда характе- ристический многочлен преобразования имеет невещественные корни. Но характеристические многочлены симметрических пре- образований невещественных корней не имеют. Следовательно, матрица симметрического преобразования и в вещественном слу- чае в подходящем ортонормированном базисе приводится к диа- гональному виду. Обратное, очевидно, также справедливо, и, таким образом, имеет место Теорема 5. Для каждого симметрического преобразования вещественного унитарного пространства существует такой орто- нормированный базис, в котором матрица преобразования прини- мает диагональный вид. Матрицы симметрических преобразований в ортонормированном базисе удовлетворяют соотношениям А' = А. В вещественном слу- чае это соотношение обращается в равенство А' —А. Матрицы, удовлетворяющие этому равенству, называются симметрическими (п. 1.3). Таким образом, в ортонормированном базисе матрицы вещественных симметрических преобразований симметричны и, обратно, преобразования симметричны, если их матрицы вещест- венные симметрические. Это замечание позволяет теореме 5 при- дать следующую форму: Т е о р е м а 5а. Для каждой вещественной симметрической мат- рицы А существует такая вещественная унитарная матрица U, что матрица UAU1 имеет диагональную форму. 19.5. Кососимметрические преобразования. Пусть 2 — унитар- ное пространство. Линейное преобразование называется косо- симметрическим, если оно связано со своим, сопряженным преоб- разованием соотношением е^* = —‘ (12) Если а, b — произвольные векторы пространства S, то из (12) следует: (а, Ье^) — (а&^*, Ь) = —(ае^, Ь).
23-4 УНИТАРНЫЕ И ЕВКЛИДОВЫ ПРОСТРАНСТВА [Гл. V Обратно, если для всех а, b имеем (а, Ье^) = — (а&£, Ь), то = — е^* и erf— кососимметрическое преобразование. В том случае, когда основное поле — поле комплексных чисел, кососимметрические, преобразования весьма просто выражаются через симметрические. В самом деле, пусть — симметрическое преобразование пространства 2. Тогда (Z'^Z)* = led* — Za~Z, т. е. io/ё является кососимметрическим. Обратно, если преобра- зование q/Z кососимметрическое, то (Z<2tZ)* = io/g* = io/l, следовательно, — симметрическое преобразование. В вещест- венных пространствах эта простая связь разрушается. Выберем в унитарном пространстве 8 ортонормированный ба- зис и обозначим через А матрицу какого-нибудь кососимметри- ческого преобразования orf. Так как матрица сопряженного преоб- разования равна А', то условие (12) дает А' = — А. (13) Обратно, из (13), очевидно, следует, что — кососимметричес- кое преобразование. Матрицы, удовлетворяющие соотношению (13), называются эрмитовыми кососимметрическими. Таким образом, в ортонормированном базисе кососимметрическим преобразованиям отвечают эрмитовы кососимметрические матрицы и, обратно, эр- митовым кососимметрическим матрицам отвечают кососимметри- ческие преобразования. Из соотношения (12) непосредственно вытекает, что сумма ко- сосимметрических преобразований и произведение кососиммет- рического преобразования на вещественное число снова являются кососимметрическими преобразованиями. Каждое собственное значение кососимметрического преобразова- ния либо равно нулю, либо есть чисто мнимое число. Если а — собственное значение кососимметрического преобра- зования и а — собственный ненулевой вектор, то (а, а&£) = (а, аа) = а(а, а), (а<2^, а) = (а.а, а) — а. (а, а). Но (а, ае^) = —(аооё, а), следовательно, —а = а, что и требо- валось. В частности, отсюда следует, что каждый корень характери- стического многочлена эрмитовой кососимметрической матрицы есть,либо нуль, либо чисто мнимое число.
§ 191 УНИТАРНЫЕ И СИММЕТРИЧЕСКИЕ ПРЕОБРАЗОВАНИЯ 235 Поскольку из соотношения непосредственно сле- дует равенство = е^е^*, то кососимметрические преобра- зования являются разновидностью нормальных преобразований, и потому для нахождения простейшей формы матриц кососимметри- ческих преобразований достаточно воспользоваться теоремой 8 из п. 18.3. В результате получается следующая Теорема 6. В вещественном унитарном пространстве мат- рица А кососимметрического преобразования в подходящем орто- нормированном базисе принимает вид где Ok — нулевая матрица порядка k. Действительно, согласно указанной теореме в надлежащем орто- нормированием базисе матрица заданного преобразования распа- дается на клетки порядков 1 и 2. Из соотношения (13) видно, что такому же равенству должны удовлетворять и отдельные клетки. Клетки порядка 1 являются вещественными числами рг, и соотношение (13) дает для них ру = — р/= — ру, т. е. ру- = 0. Если же клетка имеет порядок 2, то из (13) следует, что она должна иметь вид О <| что и требовалось. В матричной форме теореме 6 можно придать следующий вид: Теорема 6а. Для каждой вещественной кососимметрической матрицы А существует такая вещественная унитарная мат- рица U, что матрица UAU-1 приобретает вид (14). Для вещественных матриц унитарность и ортогональность — равносильные понятия, поэтому в теоремах 5а и 6а слова ве- щественная унитарная можно заменить словами вещественная ор- тогональная. 19.6. Неотрицательные симметрические преобразования. Сим- метрическое преобразование унитарного пространства 8 назы- вается неотрицательным, если для всех х из 8 (х&£, x)SsO. (15) Знак неравенства здесь имеет смысл, так как для симметри- ческих преобразований скалярное произведение (xad, х) всегда вещественно. Если в (15) знак равенства имеет место только для нулевого вектора, то называется положительным или положи- тельно определенным преобразованием.
236 УНИТАРНЫЕ И ЕВКЛИДОВЫ ПРОСТРАНСТВА [Гл. V Линейная комбинация неотрицательных преобразований с вещественными неотрицательными коэффициентами есть неот- рицательное преобразование. Это непосредственно видно из формулы (х (ае^ (За®), х) = а (х<гт£, х) -|- Р (х&, х). Произведение любого линейного преобразования на ему сопря- женное есть неотрицательное симметрическое преобразование. Действительно, (хо?#*,%)== (х&4, хо^) О, (Х&£*е£, Х) = (Х&^*, Хе^*)^0. Квадрат любого симметрического преобразования есть неот- рицательное преобразование. Вытекает из предыдущего, так как симметрическое преобра- зование сопряжено с самим собой. Все собственные значения неотрицательного преобразования вещественны и неотрицательны. Пусть — неотрицательное преобразование, а — его собствен- ное значение, а — соответствующий ненулевой собственный вектор. Тогда (tzs^, а) = а (а, а) 0. Следовательно, а^О. Если симметрическое преобразование комплексного или веще- ственного унитарного пространства 2 имеет неотрицательные собственные значения, то оно неотрицательно. Согласно п. 19.4 в £ существует ортонормированный базис ei, ..., еп, состоящий из собственных векторов преобразования оуЕ. Пусть аь ..., ал — соответствующие собственные значения и х = £161 -|- 4" ^пеп — произвольный вектор из 2. Тогда {хеД, х) — ааМг • 4~ ал4’л — = сц1 ь р + ... + ал]$лр^0, (16) что и требовалось. Определитель преобразования <э^ равен at a9... a„. Если он отличен от нуля, то все числа а7 больше нуля и сумма (16) будет равна нулю только для х = о. Следовательно, в этом случае будет положительно определенным. Если же | | — 0, то какое- нибудь из собственных значений, например alr равно нулю. Тогда {е^, е>) — 0 (elr ei) = 0 и преобразование оу? положительно определенным не будет.
- 5 19] УНИТАРНЫЕ И СИММЕТРИЧЕСКИЕ ПРЕОБРАЗОВАНИЯ 237 Следовательно, неотрицательное симметрическое преобразо- вание тогда и только тогда положительно определенное, когда оно неособенное. Рассмотрим теперь операцию извлечения квадратного корня из линейного преобразования. Говорят, что некоторое линейное преобразование Ж является квадратным корнем из линейного преобразования , если = (17) Уравнение (17) в зависимости от преобразования может сов- сем не иметь решений, может иметь лишь конечное число их, может иметь и бесконечное число решений. Однако для неотри- цательных симметрических преобразований дело обстоит совер- шенно определенно. Теорема 7. Для каждого неотрицательного симметрического преобразования унитарного пространства существует одно и только одно неотрицательное симметрическое преобразование S3t удовлетворяющее соотношению = . Всякое линейное преобразование, перестановочное с , переста- новочно с ДЗ. . Доказательство. Выберем в S ортонормированный базис ei....еп, составленный из собственных векторов преобразова- ния orf. Такой базис согласно п. 19.4 существует. Обозначим через оч, ..., ал соответственные собственные значения преобра- зования аЛ. Пусть е® — линейное преобразование, переводящее в (/=1, •••, и), где в качестве значений радикалов взяты их неотрицательные значения. Поскольку elt .,.,еп является орто- нормированным базисом, образованным собственными векторами преобразования S3, и собственные значения его равны ..., ]Лхл и, следовательно, неотрицательны, то S3 —- симметрическое неотрицательное преобразование. Но е^33г — a-jCj = ер^ (/—1, ..., «)• Поэтому &№==&£. Мы доказали, что требуемый квадратный корень из существует. Докажем последнее утверждение теоремы. Пусть Э? — некоторое линейное преобразование, перестановочное с . Расположим координатные векторы. е}, ..., е„ в таком порядке, чтобы равные собственные значения, если они есть, отвечали соседним коорди- натным векторам. Тогда матрицы преобразований S3 примут
238 УНИТАРНЫЕ И ЕВКЛИДОВЫ ПРОСТРАНСТВА [Гл. V соответственно вид lz as£s. где а1( ..., as — различные собственные значения преобразова- ния ет/, Ei, ..., Es — единичные матрицы. Матрицу преобразо- вания мы представим в соответственном клеточном виде ~XU xi2 ... xls~ X __= | A,, АУ ... Xis I lAs1 A' 52 • • • A55J Условие AX — XA дает г.Х.к— Xjipt-k (it k—1, 2, .s), или (*/ — аЛ.) XJk — 0. Так как ay-7^ aft для / 7= k, то XJk^=0 (j^k). Следовательно, но тогда - l'//'&sXss- что и требовалось. Остается доказать единственность. Пусть <ё’ — еще одно неот- рицательное симметрическое преобразование, для которого /'-===&<. Соответственно клеточному разбиению матрицы А, указанному выше, пространство 8 разложится в прямую сумму инвариантных подпространств (/=1, .... s). Так как — то по доказанному подпространства 8; инвариантны и относительно ¥>. Ввиду симметричности в каждом из подпространств суще- ствует ортонормированный базис, образованный собственными векторами <ё. Пусть тд, ~[jp — соответствующие собственные значения. Обозначив через j, ^преобразования, инду-
ПРИМЕРЫ И ЗАДАЧИ 239 цированные в подпространстве 8У соответственно преобразова- ниями вЛ, <£%, ё, имеем = afij, = V ё^ = j, откуда T/i = --- = lb = a/- Так как все ур неотрицательны, то отсюда 1у1 = ... = Тур = Кау и, следовательно, == ]/aygy = е®у, т. е. ё — -33. В качестве непосредственного приложения теоремы 7 докажем, что произведение перестановочных неотрицательных симметри- ческих преобразований есть преобразование неотрицательное. В самом деле, пусть e^i, — перестановочные симметри- ческие неотрицательные преобразования. Обозначим через их квадратные корни, которые согласно теореме 7 можно выбрать также перестановочными, симметрическими и неотрица- тельными. Тогда (e®ie®2)2 = 1ет/2, т. е. е^1<г^2 равно квадрату симметрического преобразования Следовательно, неотрицательно. Утверждение доказано. Из него, в частности, следует, что многочлены с веществен- ными неотрицательными коэффициентами от симметрического не- отрицательного преобразования сами будут симметрическими не- отрицательными преобразованиями. Примеры и задачи 1. Пусть et, ea, es—ортонормированный базис в унитарном простран-* стве 2. Найти матрицы унитарных преобразований, переводящих векторы е,, 2 2 12 12 с2 в векторы у -фу е„ — у е3, yCj — уеа -фу е3. 2. Если alt ..., ат и blt ..., bm— две ортонормированные системы век- торов n-мерного унитарного пространства то существует унитар- ное преобразование 2, переводящее первую систему во вторую. 3. Для того чтобы система векторов alt ..., ат унитарного пространства могла переводиться унитарным преобразованием в систему blt ..., bm, не- обходимо и достаточно, чтобы матрицы Грама для этих систем совпадали (см. задачу 5, стр. 214). 4. С помощью нормальной формы Жордана и процесса ортогонализации Грама—Шмидта показать, что матрица всякого линейного преобразования унитарного пространства может быть приведена к треугольной форме в под- ходящей ортонормированной системе координат (теорема Шура). 5. Доказать, что если произвольное преобразование ©тф унитарного про- странства 2 сохраняет величины скалярных произведений, то будет линейным и, следовательно, унитарным преобразованием пространства 2. 6. В линейном пространстве с точностью до изоморфизма существуют только две линейные функции. В унитарном пространстве линейные функции
240 УНИТАРНЫЕ И ЕВКЛИДОВЫ ПРОСТРАНСТВА [Гл. V с точностью до изоморфизма имеют вид а (х, е), где е — фиксированный единичный вектор. 7. В евклидовом пространстве в ортонормированном базисе матрицы преобразований соответственно равны Показать, что положительно определенное, УЙ неотрицательное, хотя и не является симметрическим, однако (х^, х)У:;-0 для любого х. 8. Найти симметрический неотрицательный квадратный корень из пре- образования <£$ предыдущей задачи. 9. Матрица симметрического неотрицательного преобразования, вычи- сленная в ортонормированном базисе, называется эрмитовой неотрица- тельной. Показать, что эрмитова матрица тогда и только тогда неотрица- тельна, если коэффициенты ее характеристического многочлена имеют чередующиеся знаки. При этом, если какой-нибудь коэффициент равен нулю, то коэффициенты всех младших членов также должны быть нулями. 10. Показать, что из каждого нормального преобразования можно извлечь корень любой положительной степени п, т. е. показать, что для каждого нормального существует нормальное преобразование Л', удов- летворяющее соотношению .%’п = Каково максимальное число таких значений .2-’? 11. В унитарном пространстве 2 выбран ортонормированный базис. Показать, что в этом базисе матрица каждого неотрицательного симметри- ческого преобразования ранга 1 может быть представлена в форме Д = [х]' [х], где [х] — координатная строка некоторого подходяще выбранного вектора х. 12. Всякое неотрицательное симметрическое преобразование есть сумма неотрицательных симметрических преобразований ранга 1. 13. Если эрмитовы матрицы с элементами ау, Ру неотрицательны, то матрица с элементами уу = ауРу также неотрицательна (г, / = 1, 2, ..., п). § 20. Разложения общих преобразований Унитарные, симметрические и кососимметрические преобразо- вания имеют весьма прозрачную геометрическую структуру. По- этому в унитарных или евклидовых пространствах при изучении общих линейных преобразований естественно возникает вопрос, нельзя ли эти преобразования выразить каким-нибудь простым способом через преобразования указанных специальных видов. Несколько таких способов, имеющих наиболее важное значение, и рассматривается в настоящем параграфе. 20.1. Разложение на симметрическую и кососимметрическую части. Пусть V — комплексное унитарное пространство, — не- которое его линейное преобразование. Введем обозначения а® = (®^ + &#*), & = ^.(ех^— ех£*). (1)
§ 20] РАЗЛОЖЕНИЯ ОБЩИХ ПРЕОБРАЗОВАНИИ 241 Имеем 33* = 1(е^'*4-е^')==^г, — 1(е^* — е^)=^. Следовательно, 33 иЗ симметрические. Из (1) вытекает оЗ = 33 (2) Таким образом, всякое линейное преобразование оЗ комплекс- ного унитарного пространства можно представить в виде (2), где 33, 'S — симметрические преобразования. Это представление однозначно, так как из (2) следует: оЗ* = 33* — i3* z=,33 — , откуда для 33, ё снова получаем выражения (1). Если основное поле вещественно, то разложение (2) не годит- ся. В этом случае поступают следующим образом. Пусть &3 — произвольное преобразование. Положим 33 = ~ (рЗ еЗ*), ё = — еЗ*). (3) Отсюда оЗ = 33 -j- ё. (4) Так как 33*=L(p3*-\-<гЗ}=33, ё*=~(рЗ* ~оЗ}=^ — ё, то в разложении (4) ^ — симметрическое, ё — кососимметри- ческое преобразования. Разложение (4) однозначно, ибо из него следует оЗ* =33— ё, откуда для 33 и снова получаем выра- жения (3). Следовательно, всякое линейное преобразование можно представить в виде суммы симметрического и кососимметрического преобразований. Это представление возможно только единственным способом. Разложение (4), очевидно, годится при любом основном поле. Преобразование 33 называется симметрической, а ё — кососимме- трической частью преобразования @3. С точкй зрения матричного исчисления разложение (2) озна- чает, что всякую квадратную матрицу А можно представить в виде В iC, где В и С — эрмитовы матрицы, а разложение (4) означает, что квадратную матрицу А можно представить в виде В3\-С, где В симметрическая, С — кососимметрическая матрицы. 20.2. Полярное разложение. Геометрически много более инте- ресным является представление линейного преобразования в виде произведения симметрического и унитарного преобразований. Возможность такого .разложения основывается на следующей лемме.
242 УНИТАРНЫЕ И ЕВКЛИДОВЫ ПРОСТРАНСТВА [Гл. V Лемма. Если линейные преобразования &-S, SB унитарного пространства £ изменяют длину векторов одинаковым образом*), т. е. если для любого а (а&£, a&S) = (да®, а£д), (5) то найдется такое унитарное преобразование 11 пространства Я, что И — S3. Рассмотрим область значений преобразования <га/, т. е. сово- купность векторов вида xoSl, где х пробегает пространство V. Обозначим эту область через 21. Аналогично обозначим область значений преобразования S3 через 23. Согласно п. 10.1 ?(, 53 яв- ляются линейными подпространствами. Мы хотим прежде всего установить изоморфное соответствие между 21 и 23. Пусть а — некоторый вектор из Ищем в I' такой вектор х, чтобы x&S — — а, и полагаем xS3=.h. Условимся вектор Ъ называть образом а и обозначать аД°. Покажем, что Ъ через а определяется одно- значно. В самом деле, неоднозначность может произойти только вследствие того, что вектор х из условия х<^Е = а определяется неоднозначно. Однако если xt — какой-либо другой вектор, удовлетворяющий условию X\ed — а, то (х — Xi) о/? — о: Соглас- но (5) отсюда следует: ((х — Ху) S3, (х — Xy)S3)~({x — Xy)&S, (х —Xi)e^) = 0, т. е. (х — Xy)S3 = o, или XyS3 — xS3, что и требовалось. Мы по- казали, таким образом, что бТэ является однозначным отображе- нием 21 в 23. Однако' легко видеть, что есть взаимно однознач- ное отображение 21 на 2$. Действительно, если b — вектор из 23, то в i найдется вектор х, для которого xS3= Ь. Тогда полагая x-^S — a, мы будем иметь а'^=Ь, что и требовалось.' Из самого определения соответствия 'Д'3 вытекает, что для каж- дого вектора х из 8 имеет место равенство - Хе^?Д° = xS3. (6) Пользуясь этим равенством, можно показать, что 'Д3 есть изо- морфное отображение 21 на 23. Действительно, пусть alt а-2 — век- торы из 21. Ищем такие хъ х2 в V, чтобы xie^ — at, х-2&# = а2. Тогда (7.Й! 4- ра2) (v.Xi&S + рх.2е^) СТ= (аХ1 Ц- ₽Х3) = = (axi + ₽Х3) S3 = a (XyS3) ₽ (х2-Д) = : а (х^Д3) + р (х2е^“Т) = аа^Д- (7) *) Преобразования ^5, обладающие этим свойством, называются метрически равными»
§ 20] РАЗЛОЖЕНИЯ ОБЩИХ ПРЕОБРАЗОВАНИЙ 243 т. е. отображение сохраняет операции сложения и умножения на число. Сверх того, (а/0 ajT) = xie/41) = (х^, x^) = = (Х1<г^, xI&^) = (a1, a,), (8) t. e. отображение “T5 сохраняет длины векторов. Следовательно, C'F—изоморфизм. Отображение у нас определено только для векторов из ?(. Мы хотим теперь доопределить его для всех остальных векторов пространства 2. С этой целью рассмотрим ортогональные подпро- странства Si-1 и S-U Согласно п. 17.5 для 2 имеют место прямые разложения 2 = ?4 4-S11 = s4-$B1 Подпространства 21 и S3 изоморфны и потому имеют одинаковую размерность. Но тогда ортогональные дополнения ?Д, Ж-1- также имеют одинаковую размерность. Унитарные пространства одина- ковой размерности изоморфны, поэтому должно существовать взаимно однозначное отображение 4-1 на Ш, сохраняющее опе- рации сложения и умножения на число и не меняющее длин векторов. Обозначим это отображение через W. Следовательно, если а', а" — векторы из ;-, то а'2/7, o’’Vj лежат в - и (аа' 4- ;3а") 'Ш = а (а^) -ф- ₽ (9) (а^, а"2^) = (а', а"). (Ю) Определим теперь преобразование И пространства 2 следующим образом. Пусть х— произвольный вектор из 2. Так как 2 = = Si 4~ 21-L, то х можно единственным образом представить в виде х^х'-\-х" (х'0Л, х"0Д1). (И) Положим по определению xU=x'4°-\-x,'W. (12) Преобразование U линейно, так как если У — У'-\~У" У"&^, то из (7), (9), (11) следует: (ах + Ш U = (а/ 04- (ах" 0 $у”) W = а (х#) 4- ₽ (у%). Преобразование И унитарно, так как в силу (8), (10), (11) (х#, хЩ = (х,бТ 4- х"20 х0 4- /Ф7) = = (х'^, х'ЧУ} 4- (х"2/7, х"444) = (х', х') 4“ (х", х") — (х, х).
244 УНИТАРНЫЕ И ЕВКЛИДОВЫ ПРОСТРАНСТВА [Гл. V Для всех х из 8 имеет место соотношение XQ^U = X<Si. Действительно, хоЛ входит в 31, поэтому в разложении (11) век- тор х" равен нулю и, следовательно, Согласно (6) это дает хо^71 = х<33. Отсюда ed7l = <zB, и лемма доказана. Теорема 1. Каждое линейное преобразование унитар- ного пространства 8 допускает полярное разложение — (13) где & — неотрицательное симметрическое, а 11 — унитарное пре- образования пространства 8. Преобразование & определяется однозначно', если — неособенное преобразование, то 77 также определяется однозначно. Согласно п. 19.6 преобразование является симметри- ческим и неотрицательным. Обозначим через неотрицательный симметрический квадратный корень из Таким образом, Для любого вектора х имеем (Xed, Хе^) = (х, Хе^&£*) — (Х, Х^) = (х^, Х^), т. е. преобразования и изменяют длины векторов одина- ковым образом. На основании леммы мы заключаем отсюда, что найдется такое унитарное преобразование 71, для которого ^71 = ^. Тем самым возможность полярного разложения доказана. Остается рассмотреть единственность его. Из (13) следует: , <^*=^^ = 71-^, eM*=&UU~'^ = Таким образом, преобразование является неотрицательным, симметрическим и квадрат его равен преобразованию Согласно теореме 7 п. 19.6 этими условиями преобразование определяется однозначно. Если arf — неособенное преобразова- ние, то — также неособенное, и тогда из (13) следует 71 = = &-*&£, т., е. 71 также определяется однозначно. Геометрический смысл теоремы 1 весьма прост. Именно она показывает, что действие всякого линейного преобразования про- странства 2 можно представить следующим образом: сначала 8 растягивается по п взаимно ортогональным направлениям со своим особым вещественным неотрицательным коэффициентом растяже-
§ ад РАЗЛОЖЕНИЯ ОБЩИХ ПРЕОБРАЗОВАНИИ 245 ния по каждому направлению, а затем поворачивается около на- чала координат*). Если преобразование неособенное, то все коэффициенты растяжения строго положительны. В случае осо- бенного преобразования некоторые коэффициенты обращаются в нуль и вместо растяжения по этим направлениям происходит проектирование пространства. Заметим -еще, что при доказательстве существования поляр- ного разложения мы отправлялись от произведения Если вместо него взять е^*е^, то в результате получится раз- ложение вида <27^ = Е где И— унитарное, — неотрицательное симметрическое пре- образования. Выберем в пространстве £ какую-нибудь ортонормированную систему координат. Тогда унитарным преобразованиям будут отвечать унитарные, симметрическим — эрмитовы матрицы и тео- рема 1 перейдет в следующее утверждение: каждую квадратную матрицу можно представить в виде произведения эрмитовой и унитарной матриц. Предполагая, что основное поле есть поле вещественных чи- сел, получим, что всякую квадратную вещественную матрицу можно представить в виде произведения симметрической и орто- гональной вещественных матриц. В теореме 1 утверждается, что &— неотрицательное симме- трическое преобразование. Соответственно этому и в двух послед- них утверждениях можно к словам эрмитова и симметрическая добавить: с неотрицательными собственными значениями. 20.3. Преобразование Кэли. Сравнивая свойства унитарных преобразований со свойствами симметрических, можно заметить, что оба класса преобразований тесно связаны друг с другом. Эту связь в явном виде дают так называемые формулы Кэли- Теорема 2 (преобразование Кэли). Если — симметрическое преобразование комплексного унитарного прост- ранства,, то преобразования zt ig имеют обратные', преобра- зование U, вычисленное по формуле — ig) (е^ -j- ig)’1, (14) унитарно, не имеет собственных значений, равных единице, и выражается через U по формуле = — i(^4-g)(^_g)-i. ' (15) . . *) Поворот понимается в смысле унитарного преобразования.
246 УНИТАРНЫЕ И ЕВКЛИДОВЫ ПРОСТРАНСТВА 1Гл. V Обратно, если 11 — унитарное преобразование, не имеющее собст- венных значений, равных единице, то преобразование 11 — g обра- тимо, преобразование , вычисленное по формуле (15), симмет- рическое и И выражается через пЛ в виде (14). Доказательство. Пусть ©/— симметрическое преобразо- вание унитарного пространства. Числа ±z не могут быть соб- ственными значениями преобразования так как все собственные значения симметрических преобразований вещественны (п. 19.4). Это означает, что преобразования ± 1$ неособенные. Из пере- становочности преобразований 4" zg и — zg вытекает их перестановочность с преобразованиями (е^-|- zg)-1, — zg)-1. Преобразование И, вычисленное по формуле (14), имеет сопря- женное, равное U* = Д,/ Д- zg)*1 (st/ — zg)* = (ет/ — z'g)”1 (st/ 4- zg). Отсюда zZzZ* = (©// - zg) (st/ + zg)-1 (st/ — zg)'1 (st/ + zg) = = — zg) (st/ 4- zg) 1 (st/ 4- zg) (©/ — zg)-1 = g, t. e. U унитарно. Покажем, что 21 — $ имеет обратное, Для этого из обеих частей равенства (14) вычтем g и результаты умножим на ет/ 4- zg. После очевидных преобразований будем иметь (Ж g) (ет/ 4~ zg) = —2zg, (16) или (22-^ = -l(©^-j-ig). Таким образом, 21 не имеет собственных^значений, равных еди- нице. Из (16), далее, следует: (2Z-g)©^ = — 2zg — i(U — g) = — z(#4~g), т. e. = -z(2Z4-g)(Z<-g)-1. Первая часть теоремы доказана. Доказательство обратного утвер- ждения вполне аналогично изложенному. Формулы Кэли устанавливают взаимно однозначное соответ- ствие между всеми симметрическими преобразованиями унитар- ного пространства 2 и теми его унитарными преобразованиями 21, которые не имеют 1 своим собственным значением. Аналогичные формулы 2Z = (zg4-e7/)(zg —©г/)-1, (14') ^ = 1^ — g)(2Z4-g)-i (157) дают взаимно однозначное соответствие между симметрическими преобразованиями пространства ? и теми унитарными преобразова- ниями U, для которых —1 не является собственным. значением.
§ 20] РАЗЛОЖЕНИЯ ОБЩИХ ПРЕОБРАЗОВАНИИ 247 Преобразования (14), (15), а также (14'), (15') возможны бла- годаря наличию в основном поле числа г. Если основное поле вещественное, то указанные формулы непригодны. Однако эти формулы легко могут быть видоизменены таким образом, чтобы они годились для любого поля. Именно, имеет место Теорема 3. Пусть а-Т— кососимметрическое преобразование унитарного пространства 2. Тогда преобразования ex/±g обра- тимы, преобразование ^ = (e^_g)(e^_|_g)-i (17) унитарно, не имеет собственных значений, равных единице, и e^ = -(^ + g)(Z<-g)-i. (18) Обратно, если И — унитарное преобразование и 1 не является его собственным значением, то преобразование &Т, вычисленное по формуле (18), — кососимметрическое и 21 выражается через а/Т в виде (17). В самом деле, если <г^ кососимметрическое, то ± 1 не могут быть его собственными значениями, так как все собственные зна- чения кососимметрических преобразований или равны нулю, или чисто мнимые (п. 19.5). Поэтому преобразования e^±g неосо- бенные. Так как (a-g Ц-g) —g) = (е^ — g) (ё^ g)> то (е^" — g) (а^ + g)-1 = (ez/ g)-1 (е^ — g). Из (17) имеем ^* = (s^*4-g)-i (e^*-g) = (_e^4-g)-i( —e.f —g) = = (oxi — g) 1 (e^ -ф- g), откуда 2121* = (e^ - g) (s^ + g)’1 (e^ - g)1 (e^ + g) = g/ t. e. 21 унитарное. Дальнейшие рассуждения совершенно анало- гичны приведенным в доказательстве теоремы 2, и мы их опустим. В заключение отметим, что результаты последних параграфов показывают известное сходство между свойствами линейных пре- образований унитарных пространств и свойствами комплексных чисел. Условимся считать, что линейные преобразования в неко- тором смысле аналогичны комплексным числам, а сопряженные преобразования аналогичны сопряженным' числам. Тогда симмет- рические преобразования, характеризующиеся свойством &£*— ~оЛ, будут аналогичны комплексным числам, удовлетворяющим соотношению z — z, т. е. вещественным числам; кососимметри- ческие преобразования, характеризующиеся свойством — = — е/ё, аналогичны комплексным числам, удовлетворяющим соотношению z =—z, т. е. чисто мнимым числам; унитарные пре- образования со свойством 2121*=^ аналогичны комплексным чис- лам г, для которых zz = 1, т. е. |z| = 1. Разложение из п. 20.1 будет соответствовать представлению комплексного числа
248 УНИТАРНЫЕ И ЕВКЛИДОВЫ ПРОСТРАНСТВА 1Гл. V z в декартовом виде z = x а полярное разложение — будет отвечать представлению комплексного числа в тригонометри- ческой форме z — p (cos<f> i sin <р) и т. д. 20.4. Спектральное разложение. С геометрической точки зрения одним из наиболее простых видов линейных преобразований является проектиро- вание векторов на какое-либо подпространство. Некоторые свойства этих проекционных преобразований здесь будут рассмотрены. Пусть в унитарном пространстве 1! задано линейное подпространство Я. Совокупность векторов, ортогональных к Я, есть ортогональное подпро- странство Я1, причем И есть прямая сумма Я и Я-L. Следовательно, каждый вектор а из V может быть однозначно представлен в виде а = а' + а" (а’£Я, а" С Я1). (19) Вектор а' называется проекцией вектора а на подпространство Я. Ставя в соответствие каждому вектору его проекцию на Я, мы получим некоторое преобразование пространства £!, которое называется проекционным и обо- значается Таким образом, по определению = а'. Индекс Я мы иногда для краткости будем опускать и вместо будем писать еТ5. Проекционные преобразования линейны, так как если вектор а имеет разложение (19), а вектор Ъ — разложение b = b’ + b" (й'£Я, Ь" £ Я1), то аа + ₽/> = (аа' Д- ₽й’) + (“а" Д- ₽6"), т. е. (аа Д- ₽й) = аа' Д- откуда (аа Д- ₽/>) еТ5 = а • вс? Д- ₽ • bffi. Проекционные преобразования являются неотрицательными симмет- рическими преобразованиями. Действительно, разложение (19) дает («г?, а) = (а’, а' Д- а") = («', а') 15= 0, так что еТ5 неотрицательно. С другой стороны, если Ь = й'Д-й" (й'^Я, й'^Я1), то (а^5, J) = (e’, £'Д-*") = («', £') = (а'Д-в’’, й') = (а, Ъ&), т. е. преобразование З1 симметрическое. Из формулы (19) вытекает еще одно важное свойство проекционных преобразований. Очевидно, для любого а имеем аЗл = а'З = а’ — аЗ, Преобразования, совпадающие со своим квадратом, называются идем- потентными. Таким образом, (20) показывает, что все проекционные преоб- разования идемпотентны.
§ 20] РАЗЛОЖЕНИЯ ОБЩИХ ПРЕОБРАЗОВАНИЙ 249 Обратно, свойства идемпотентности и симметричности вполне характе- ризуют проекционные преобразования: всякое симметрическое идемпотент- ное преобразование 3 есть проектирование на область значений 3- Пусть область значений 3 есть 91. Для каждого а справедливо разло- жение а = аЗ 4- a (g — <^). (21) Слагаемое аЗ, по определению, входит в 91. Второе слагаемое ортого- нально к 91, так как всякий вектор 91 есть хЗ, где х— некоторый вектор из V, а ввиду симметричности и идемпотентности преобразования 3 (хЗ, a (g — $”)) — (х, a (g — 0s) 0s) = (х, аЗ — аЗ) = 0. Разложение (21) показывает, следовательно, что аЗ есть проекция а на 91, что и требовалось. Найдем простейший вид матрицы проекционного преобразования еТ5^. Выберем в 91 и 91-^- ортонормированные базисы et, ..., ет и ет+1, ..., еп. Объединенная система elt ..., em+1, ..., еп будет ортонормированным базисом пространства V. Равенства eye?5 — ер еа3 = о (7=1, т; а = т-]-1, ..., п) показывают, что в этом базисе матрица преобразования 3% имеет вид -1 (22) 0_ Обратно, если в ортонормированной системе координат матрица некоторого линейного преобразования ^ приводится к виду (22), то 3, очевидно,— проекционное преобразование. Пусть 3, (g — операции проектирования на некоторые подпространства 91, ® пространства 9. Возникает вопрос: как расположение подпространств 91, ® в 9 влияет на свойства преобразований 3, й? Например, что можно сказать о 3, О, если 91, ® взаимно ортогональны или если 91 входит в 91 и т. п.? Чтобы ответить на этот вопрос, введем, прежде всего, такое опре- деление: два проекционных преобразования 3, О называются ортого- нальными, если 30 = Поскольку проекционные преобразования симметри- ческие, имеем отсюда ОЗ = 0*3* = (^й)* = т. е. из ортогональности 3 к 0 следует ортогональность О к 3. Для того, чтобы проекционные преобразования 3, О были орто- гональны, необходимо и достаточно, чтобы были ортогональны соот- ветствующие подпространства 91, ®. Пусть 30 = &, тогда для а£91, й£® имеем (а, Ъ) = (аЗ, bQ) = (аЗО, Ь) = 0,
250 УНИТАРНЫЕ И ЕВКЛИДОВЫ ПРОСТРАНСТВА [Гл. V т. е. 91 ’ ортогонально к S3. Обратно, если 91 ортогонально к ®, то для любого вектора х из S Х&^И, = М = что и требовалось. Для детального изучения свойств линейных преобразований обычно используют их матричное изображение. Однако если .матричное изображение по какой-либо причине неудобно, то стремятся выразить заданное линейное преобразование через преобразования более простого характера. В случае нормальных преобразований в качестве таких простейших преобразований можно принять проекционные преобразования. Разложение вида 4~ •• • "1“ (-3) называется спектральным разложением преобразования оД, если а) числа а1, , as различны', б) -Ж & (7 = 1, 2, s), в) &-.= & (7 = 1, 2, s), г) (jpbk;j, k= 1, 2, ..., s), i ) аГа ~г •••4" 3^s — Условия б), в), г) означают, что ..., — взаимно ортогональные проекционные преобразования. Ясно, что спектральное разложение могут допускать лишь нормаль- ные преобразования. Действительно, из (23) следует: opg* =. 6^3' 1 -J- а 4“ s> = ('Ep.jffij) (Еа^г)5;() = Sa/ayaT5j — . Обратно, всякое нормальное преобразование комплексного унитарного пространства допускает спектральное разложение. Пусть Q/g — нормальное преобразование комплексного унитарного про- странства £*. Мы видели, что в £! существует ортонормированная база elt е2, ..., еп, образованная собственными векторами преобразования . Расположим эти векторы так, чтобы те из них, которые отвечают одинако- вым собственным значениям, находились рядом. Пусть, наприйер, elt ...,ет отвечают собственному значению аь ..., ет? — собственному значе- нию а2 и т. д. Обозначим через £'г- подпространство, натянутое на векторы em._ +-i, •••> етр отвечающие собственному значению (i — 1, 2, ..., s). Так как все координатные векторы пространства £*г являются собственными, принадлежащими одному и тому же собственному значению а,-, то вообще все векторы из £’г будут собственными с собственными значениями, рав- ными а,-. Мы имеем £ = £1 + £2 + ... + ^, (24) где подпространства £',...£'.s взаимно ортогональны. Обозначим через Зр проектирование на подпространство £'г- Но из ортогональности подпространств £',- вытекает ортогональность соответствующих проекционных преобразований. Кроме того, из равенства (24) следует, что еТД-Д сГб. 4~ где zr — проектирование на V. Однако проектирование на £' есть единичное преобразование, так что ^ = ^4-^4-...-!-^. (25)
§ 20] РАЗЛОЖЕНИЯ ОБЩИХ ПРЕОБРАЗОВАНИЙ 251 Мы видим, таким образом, что преобразования а?5,..3S обладают свой- ствами б)—д). Покажем, наконец, что ат/ = “icT51 4" а,//2 -j-... -f- as^s. Пусть а — произвольный вектор из 1!. Равенство (25) дает a = a3i-\-а32-\-a3s. (26) Вектор a3i содержится в V,-, а все векторы из У, собственные, принадле- жащие собственному значению а,-, поэтому аЗщ/Е = аг • аЗЗ Умножая (26) на gz/, мы получим о-о^ — ^аЗ 1 -f-• 4" osa3s = о (pi31 4" ••• 4" as3s), откуда &>/ = + ••• + as3s, что и требовалось. Если оЕЗ — “Л 4" агЗа . 4- as3s (27) — какое-нибудь спектральное разложение преобразования о/?, то аъ ..., as— совокупность всех собственных значений этого преобразования. В самом деле, любое преобразование 3j по предположению отлично от &. Следовательно, найдется такой вектор а, что a3j^o. Но тогда в силу ортогональности преобразований 3\, ..., 3j мы получим аЗ~1=2 а^аЗj31 4~ а2аЗ,3g 4“ • •• 4“ o.sa3j3$ = а^аЗ1у, т. е. a3j—собственный вектор с собственным значением а/. Обратно, пусть а — ненулевой собственный вектор преобразования с собственным значением р. Из свойства д) следует; a —a3i + a32-)-+ a3s. (28) Условие (27) дает Oq/1 = а^З 1 4- а2аЗа 4-... 4- asa3s. Так как — ра, то О1йЗ 1 Ч- • • • 4“ а$аЗ§ $аЗ 1 4-. • • 4" 33$. Умножая это соотношение на 3/ и пользуясь свойствами в), г), мы получим a.ja3j=- $a3j, (а/ — р) аЗ)= о (у = 1, ..., s). Вектор а отличен от нуля, поэтому по крайней мере одно слагаемое a3j в 428) также отлично от нуля. Но тогда равенство (oj — р) аЗ)= о дает р = ад что и требовалось. Если = ^131 + as3s — спектральное разложение преобразова- ния оД и/(Х) = р0-|-р1Х4-...-|-р,лХт—какой-нибудь многочлен, то + (29) Мы имеем § —<25i4_,"4*^55> = а-131 4* • • • 4т as3 s> = ^j3j Tflj3j = %ajak3j3k = 0131 4- • • • 4- = Eam - 1^ . = Sa? 1 оьЗ}Зь = 3^ a™3s.
252 УНИТАРНЫЕ И ЕВКЛИДОВЫ ПРОСТРАНСТВА [Гл. V Умножая эти равенства последовательно на числа (30, ....и складывая, мы получим требуемое соотношение. Если оДз = + • • . + — какое-нибудь спектральное разложение преобразования axg, то gi_ (esg --- «!& ) (ет^ — а/-1В) (еЛГ — ai+iB) • • (е^ — asB) (ai — а1) — aZ-l) («£—«(+!)••• (a<—as) В самом деле, рассмотрим многочлен .Ml— ~ а^"’ ~ а,'-д^ ~ “»'+»)••• ~ аз> Ш (а> — а1) • • • (ai — ai-i) (ai — a«+i) • • • (az — as)' Согласно (29) ?> (<з^) = ®I (ai) i + ®i (as) <^2 + • • • + ?» (“s) zPs- Но ср,- (ay) = 0 (i ф j), <p(- (a() = 1, следовательно, <pz (osg) = eT5;. Последнее свойство показывает, что каждое нормальное преобразова- ние унитарного пространства допускает одно и только одно спектраль- ное разложение. Действительно, возможность разложения была установлена нами с самого начала, поэтому речь идет только о его единственности. Коэффициенты а,, ..., as спектрального разложения являются собственными значениями преобразования rj/g и, таким образом, преобразованием gyg определяются однозначно. Но, зная эти коэффициенты, мы тем самым знаем многочлены <pz (X) и, таким образом, знаем проекционные преобразования &Jit что и требовалось. Отметим еще несколько свойств спектральных разложений. Совокуп- ность коэффициентов, а,, ..., as спектрального разложения называется его спектром. Спектром линейного преобразования называется спектр его спектрального разложения. Выше показано, что спектр нормального пре- образования совпадает с совокупностью его собственных значений. Для того чтобы нормальное преобразование было симметрическим, соответственно кососимметрическим или унитарным, необходимо и доста- точно, чтобы его спектр был вещественным, соответственно чисто мни- мым или состоящим из чисел с единичным модулем. Пусть o/g — -j- +... + — спектральное разложение пре- образования Qjg. Тогда Qyg* — + й3^г — спектральное разложение сопряженного преобразования. Поскольку каждое нормальное преобразование допускает только одно спектральное разложение, условие o^g = равносильно равенствам az = az (i = 1, ..., s), т. е. равносильно вещественности спектра. Первое утверждение доказано.Остальные два до- казываются аналогично. Примеры и задачи 1. Разложить на симметрическую и кососимметрическую части, а также найти полярное разложение следующих матриц: 2 7 От Г° 1 °1 Г—1 2 —2т 6 2 2 1 4 0 0 , 4 —2 —4 L2 0 5. -0 0 9- 4 4 2- 2. Пусть S — двумерное евклидово пространство, o/g—его линейное пре- . образование, имеющее два единичных, но не ортогональных собственных
ПРИМЕРЫ И ЗАДАЧИ 253 вектора at, аа с собственными значениями а, и а2 (04 У а2). Найти полярное разложение преобразования q.^, если (elt a2) = cos<p, где <р известно. 3. Указать матричную формулировку преобразования Кэли (теоремы 2,3). 4. Показать, что всякая ортогональная матрица U порядка 3, не содер- жащая 1 среди своих собственных значений, имеет вид гсг 4- ,82 - 72 - 1 2 (-« + ₽() L 2 (-₽-«;) 2 (а + ₽7) _ р* f _ 1 2 (— 7 ~Ь 2 (3 — а?) 2 (7 + -а24-₽2 + Г’- 11 5. Комплексные квадратные матрицы порядка п образуют относительно сложения и умножения на число линейное пространство V размерности и2. Матрицы Ец, у которых в i-й строке и у'-м столбце стоит единица, а на остальных местах нуль, образуют базис пространства V. Сделаем простран- ство S унитарным, считая, что E/j дают ортонормированный базис в V, т. е. полагая, что скалярное произведение матриц А и В вычисляется по формуле (Д, В) = где а;у— элементы матрицы А, —элементы матрицы В. Умножение всех матриц из 1! на какую-нибудь матрицу X справа дает линейное преобразование пространства 1!. Показать, что а) унитарные матрицы имеют в V длину Уп', _ б) умножения на сопряженно транспонированные матрицы X и X' про- изводят в V сопряженные преобразования; в) умножение матриц из V на унитарную матрицу производит в V уни- тарное преобразование; г) умножение на эрмитову матрицу вызывает в У симметрическое, а умножение на эрмитово-кососимметрическую матрицу — кососимметриче- ское преобразования. 6. Показать, что сумма проекционных преобразований тогда и только тогда есть проекционное преобразование, когда = В по- следнем случае = ^я( sg- 7. Произведение проекционных преобразований 3^, тогда и только тогда проекционное, когда и перестановочны. В этом случае V® = Л ®- 8. Подпространство 81 содержится в ® тогда и только тогда, когда 9. Доказать 'формулу _!_ = g — еТ5^. 10. Подпространство 31 тогда и только тогда инвариантно относительно произвольного преобразования &/g, когда соответствующее проекционное преобразование удовлетворяет соотношению И. Если преобразования o/g, со спектральными разложениями o/g = = перестановочны, то каждой zEj перестановочно с каждым @,k. 12. Если нормальное преобразование Q/g перестановочно с произвольным линейным преобразованием ggj, то перестановочно и с 13. Каждое унитарное преобразование U комплексного унитарного про- странства представимо в форме И = е1л, где o/g — симметрическое преобра- зование. Обратно, при любом симметрическом Q/g преобразование е1Л уни- тарно.
Г лава VI КВАДРАТИЧНЫЕ И БИЛИНЕЙНЫЕ ФОРМЫ Предполагается, что все пространства, встречающиеся в этой главе, являются пространствами над полем (а не над произволь- ным телом). § 21. Билинейные формы 21.1. Преобразование форм. Многочлен F (?) от переменных ?i, ...,£„ с коэффициентами из некоторого поля Д' называется формой р-й степени над К от Si,..., tn, если все члены F имеют одну и ту же степень р относительно совокупности переменных. Формы первой степени называются линейными, второй степени — квадратичными, третьей степени — кубичными и т. д. Основными задачами теории форм являются задачи изучения законов, по которым меняются коэффициенты форм при линей- ных преобразованиях переменных, и нахождение простейших видов, к которым могут быть приведены формы такими преобра- зованиями. Иногда вместо одной формы рассматривают пару форм от одних и тех же переменных и ставится задача о нахождении такого преобразования переменных, чтобы сразу обе формы приняли возможно более простой вид. Это — задача о паре форм. Можно ставить задачи о тройках форм и т. п. Геометрическое истолкование задачи о преобразовании форм будет дано в конце этой главы, а сначала задача будет рассмот- рена с чисто алгебраической точки зрения и решена для квадра- тичных форм. Формулы, связывающие переменные Bi, ..., с новыми пере- менными EJ, мы будем писать в соответствии с п. 5.1 в виде = (/ = 1, 2, ..., п). (1) Матрица Т' = |]тгу|| будет всегда предполагаться обратимой, так что из соотношений (1) всегда можно новые переменные
§ 21] БИЛИНЕЙНЫЕ ФОРМЫ 255 выразить через старые. Матрица Т называется матрицей преоб- разования переменных в переменные Обычно заданные формы приходится преобразовывать посте- пенно: сначала вводят новые переменные по формулам (1), затем с помощью аналогичных формул вместо вводят переменные 1") и т. д. Пусть матрица перехода от переменных ; к переменным V есть Т матрица перехода от V к С' есть и т. д. Под- ставляя в формулы (1) вместо их выражения через мы выразим линейно переменные через у. Непосредственные под- счеты (ср. п. 5.1) показывают, что матрица перехода от £ к будет T^Ti. Применяя этот результат несколько раз, приходим к следующему выводу: если переход от переменных £ к перемен- ным V имеет матрицу Ti, переход от V к имеет матрицу и т. д., то матрица результирующего перехода от перемен- ных £ к переменным будет равна произведению TmTm_i... TfTt матриц всех промежуточных переходов. Например, пусть нужно преобразовать к простейшему виду квадратичную форму Е = + ЮУз. Имеем Вводя новые переменные £1=^ --^2 — ^3, & — £з = £з> получим F = - & + 8^з = — (£2 — 4;з)2 + 16;Л Подстановка ^ = ^[, Н2’ = $2 — ж ^ = 4$з обращает форму F в простейшую ер-Нз2. перехода от к Согласно правилу матрица ’1 О О’ О 1J L0 О 1 —4 О’ О 4_ Е будет О 1 —4 О’ О 4. ’ 1 —1 1 О 1 О " 1 — 1 — 1 В качестве второго примера рассмотрим общую задачу о пре- образовании произвольной системы т линейных форм /1 — ^2aai 4~ • • • Ч~ ^лаль fm —‘ ’1®1т "j” ^2а2т -ф" • • • "ф" ^rflnm (2)
256 КВАДРАТИЧНЫЕ И БИЛИНЕЙНЫЕ ФОРМЫ [Гл. VI от п переменных. Матрица Д = ||а,-у||, прямоугольная при называется матрицей этой системы. Подставляя в данные формы вместо переменных 5; их- выражения через 5} из (1), получим систему т линейных форм от новых переменных В}. Непосред- ственный подсчет показывает, что матрица At новой системы связана с матрицей А старой системы зависимостью А1==ТА, ' т. е. при переходе к новым переменным матрица системы линей- ных форм умножается слева на матрицу перехода. Чтобы привести систему (2) к простейшему виду, выберем среди форм fi, ..., fm, 5Ъ ..., 5Л первые п линейно независимых. Пусть это будут формы fiit ..., ft , Число г, очевид- но, равно рангу матрицы А. Вместо 51, ..., 5Л можно ввести пере- менные 5/ по формулам 51'= /^(5),..., 5; = А/5), = ....^ = 5,П, после чего заданная система (2) примет искомый простейший вид 51,.... 5;, f;+i,..., fm, где f’r+i, ..., fm — некоторые линейные формы от Bi, ..., 5Л. В част- ности, если все первоначальные формы были линейно независи- мыми, то указанной заменой переменных они приведутся к кано- ническому виду Л = В[....= 21.2. Эквивалентность билинейных форм. Вместо многочленов от одной систрмы переменных Bi.......5Л часто рассматривают многочлены от двух систем переменных, например 51, ..., 5Л и »]!, ..., 7]s, а также и от нескольких систем переменных. Много- член от нескольких систем переменных называется формой, если он однороден относительно каждой системы переменных отдельно. Особенный интерес представляют формы, линейные относительно каждой системы переменных. Если систем переменных две, то такие формы называются билинейными, если три, — то трили- нейными, в общем случае—полилинейными. Число переменных в каждой системе может быть различным. Задача о преобразовании форм от нескольких систем переменных может иметь различный смысл в зависимости от того, подвергать ли каждую систему переменных линейному преобразованию неза- висимо от преобразований других систем или же над каждой системой производить преобразования, как-то связанные друг с другом. Формы, которые можно перевести друг в друга независимым подбором линейных преобразований переменных, называются экви- валентными. Если же все системы переменных содержат одно и то же число переменных и. формы от этих систем могут быть
§ ЭД БИЛИНЕЙНЫЕ ФОРМЫ 257 переведены одна в другую путем линейных преобразований каж- дой системы, имеющих одну и ту же матрицу, то такие формы называются конгруэнтными. Ясно, что конгруэнтные формы всегда эквивалентны. Обратное, конечно, несправедливо в общем случае. Легко привести примеры эквивалентных форм, не являющихся конгруэнтными, даже среди билинейных форм. В настоящем пункте мы рассмотрим простейшую задачу об эквивалентности билинейных форм, а в следующем пункте — задачу о конгруэнт- ности симметрических билинейных форм. Билинейная форма от систем переменных ..., 5Л и ..., имеет вид = (t, /= 1, 2, ..., п). Матрица Л =||а(у||, составленная из коэффициентов формы, назы- вается матрицей формы, а ранг матрицы А называется рангом формы. Вводя в рассмотрение однострочные матрицы x = Г=Ь...................ад, мы можем форму F записать в виде F=XAY’. (3) Предположим теперь, что нам нужно от переменных ц перейти к новым переменным %, t\, связанным со старыми следующими формулами: ^=.2 ад»» или, в матричной записи, X = XiT, Y — YiS, (4) где T = ||tZy||, S = ||o,7||, а x1=iei.....ад, .............ад. Подставляя в (3) вместо X, Y их выражения из (4), получим F = X1TAS'Yi = X]A1Yi, где Ai — матрица преобразованной формы. Следовательно, если в билинейной форме с матрицей А произ- вести над первой системой переменных подстановку с матрицей Т, а над второй системой — подстановку с матрицей S, то получится билинейная форма с матрицей А = 74 S'. (5) Как уже было сказано, билинейные формы, получающиеся друг из друга линейными подстановками переменных, называются 9 А. И. Мальцев
258 КВАДРАТИЧНЫЕ И БИЛИНЕЙНЫЕ ФОРМЫ [Гл. VI эквивалентными. С другой стороны, согласно п. 13.4 матрицы А, Ai называются эквивалентными в поле Д, если существуют неособенные матрицы Р, Q с элементами из Д', для которых Л1 = РЛ<2. Сравнивая это с формулой (5), видим, что для экви- валентности билинейных форм над произвольным полем К. необхо- димо и достаточно, чтобы их матрицы были эквивалентны. Согласно п. 13.4 все квадратные матрицы данного порядка п и данного ранга г над полем Д эквивалентны между собой и эквивалентны матрице вида где Ег — единичная мат- рица порядка г, а — нулевая матрица порядка п — г. Применяя это к билинейным формам, получаем следующий результат, пол- ностью решающий задачу об эквивалентности билинейных форм: Для эквивалентности билинейных форм над произвольным полем необходимо и достаточно, чтобы соответственно совпадали порядки и ранги матриц форм. Формы, определитель которых отличен от нуля, называются неособенными, а остальные — особенными. Полученный результат об эквивалентности -форм показывает, что все неособенные били- нейные формы от систем п переменных эквивалентны форме S1T11 4~ . • • -f- а особенные формы эквивалентны формам вида Si'Tji -j-...(г — 0, 1, 2, ..., п — 1), где г — ранг формы. Если основное поле — поле комплексных чисел, то наряду с обычными билинейными формами рассматривают также формы Эрмита, имеющие вид где черта сверху означает комплексную сопряженность. Матрич- ная запись эрмитовой билинейной формы с матрицей А = || aiy-|| имеет вид Д = ДЛУ', а матрица новой эрмитовой формы, возникающей из F преоб- разованиями переменных (4), будет Ai = TAS'. ' (6) Отсюда, как и выше, получаем, что все эрмитовы билинейные формы от систем п переменных эквивалентны форме ^1711 4_ SaTja 4~... + где г — ранг заданных форм.
БИЛИНЕЙНЫЕ ФОРМЫ 259 § 21] 21.3. Конгруэнтность симметрических билинейных форм. Выше было указано, что билинейные формы от двух систем, состоящих из одного и того же числа переменных, называются конгруэнт- ными, если они возникают друг из друга при некоторых линей- ных преобразованиях обеих систем переменных с одинаковыми матрицами. Полагая S = T в формуле (5), приходим к заключению, что если в билинейной форме с матрицей А над обеими системами переменных произвести 'линейное преобразование с матрицей Т, то новая форма будет иметь матрицу Ai = TATf. (7) Матрицы A, Ai, связанные соотношением вида (7), где Т — подходящая неособенная матрица, называются конгруэнтными. Поэтому билинейные формы тогда и только тогда конгруэнтны, когда конгруэнтны их матрицы. Билинейные формы, матрица которых симметрична или косо- симметрична, называются также симметрическими или соответ- ственно кососимметрическими. Если заданная билинейная форма симметрична или кососим- метрична, то тем же свойством будут обладать и все конгруэнт- ные формы. Действительно, если A' — ztzA, то из (7) имеем Ai = ±TA'T' — ± At. Аналогичным образом рассматривая эрмитовы билинейные формы, получаем из (6), что матрица At новой эрмитовой формы, возникающей из формы с матрицей А при линейном преобразо- вании Т обеих систем переменных, имеет вид А1 = ТАТ'. (8) Матрицы A, Ai, связанные при помощи какой-либо неособен- ной матрицы Т соотношением (8), называются эрмитово-конгруэнт- ными. Поэтому конгруэнтность эрмитовых форм равносильна эр- митовой конгруэнтности их матриц. Эрмитова форма называется симметрической, если матрица ее эрмитово-симметрична, т. е. если А'= А. Из (8) непосредственно следует, что если данная эрмитова форма симметрична, то и все конгруэнтные ей формы также симметричны. Поскольку из конгруэнтности матриц следует их эквивалент- ность, то равенство рангов необходимо для конгруэнтности форм. Однако это условие далеко не достаточно. Достаточные условия в общих предположениях будут рассмотрены в п. 23.3, здесь такие условия будут даны лишь в важнейших случаях. 8*
260 КВАДРАТИЧНЫЕ И БИЛИНЕЙНЫЕ ФОРМЫ (Гл. VJ Прежде всего, пусть К — поле вещественных чисел и А — сим- метрическая матрица. Тогда согласно п. 19.4 найдется веществен- ная унитарная матрица U такая, что матрица At = UAU1 будет иметь диагональный вид. Но унитарность U означает, что UU' = — Е, откуда в силу вещественности матриц следует U1 = V, т. е. Ai — UAU’. Таким образом, А оказывается конгруэнтной диагональной матрице At. Тем самым нами доказана 'Теорема 1. Каждая вещественная симметрическая билинейная форма подходящим вещественным унитарным преобразованием переменных может быть приведена к виду «iSiTji аЛ4т(г 4й•••+ «Лг7!/-, (9) где г — ранг формы, a aj, ..., — отличные от нуля характе- ристические числа матрицы формы. В частности, для унитарной эквивалентности вещественных симметрических билинейных форм необходимо и достаточно совпадение характеристических много- членов матриц форм. Эта теорема дает больше, чем первоначально требовалось. Она утверждает, что приведение к диагональной форме осуществимо вещественным унитарным преобразованием переменных. Если унитарность преобразования переменных не нужна, то приведение к простейшему виду можно продолжить. Именно пусть форма уже приведена к диагональному виду (9). Изменим так нумера- цию переменных, чтобы сначала шли члены с положительными коэффициентами, а затем'— с отрицательными. Пусть, например, он, ..., as положительны, а <х5+1, ..., ar отрицательны. Тогда, полагая = = (/=1, .... s), = 'rik = V—’Xk’r\k = 1, ..., г), мы приведем форму к виду - 51Тц -f- ... -j- — ... — trT\r. (10) Разность . a = $ — (г — s) = 2s — г называется сигнатурой формы (10). Очевидно, форма (10) вполне определяется своими рангом и сигнатурой, ибо $ = у (а 4~ г). То, что сигнатура не зависит от способа приведения заданной формы к виду (10) и, таким образом, однозначно определяется исходной формой, составляет содержание так называемого закона инерции, который подробно будет рассмотрен в п. 22.3. Совершенно аналогичное положение имеет место и для эрми- товых симметрических форм. Пусть F — эрмитова форма с эрми- тово-симметрической матрицей А. Согласно теореме 4а (п.19.4)
ПРИМЕРЫ И ЗАДАЧИ 261 существует такая унитарная матрица U, что матрица Aj = UAUl будет вещественной диагональной. Из унитарности U следует, что U~l— U', откуда Ai — UAU'. Тем самым доказана Теорема 2. Всякая симметрическая эрмитова билинейная форма унитарным преобразованием переменных может быть при- ведена к диагональному виду «1^1 4" 4~ • • • аЛ41г с вещественными коэффициентами. Величины оч, аг являются отличными от нуля корнями характеристического многочлена матрицы формы, и потому для унитарной конгруэнтности сим- метрических эрмитовых форм необходимо и достаточно совпаде- ние характеристических многочленов этих форм. Если рассматривать не унитарную конгруэнтность, а конгру- энтность относительно произвольных линейных преобразований, то процесс приведения форм можно продолжить указанным выше способом, в результате чего получится форма вида +... + 6Л — Ui^+i — • • • — (11) К одному из этих л-|— 1 видов (r = 0, 1.......и) может быть при- ведена, следовательно, любая симметрическая эрмитова форма. Неконгруэнтность форм (11) при различных s снова вытекает из упоминавшегося выше закона инерции. Примеры и задачи 1. Показать, что система линейных форм от Ej, Е3, ?3, Ч- 6а, 6s Ч- 631 6з 4“ 6«, 614- 6а эквивалентна системе 61 4- 6а 4“ 6з, 6а 4“ ба 4" 61, 61 4“ 6з 4“ 61, 2;, 4~ 63 и не эквивалентна системе 61 —Ss 4- 63 , 63 4-63 — 61, 614-63, 2^4-ЗЕз-б!. 2. Показать, что система линейных форм fi—6iaij 4- 6aasi 4“ ••• 4“ inanl б—-1.................(12) эквивалентна системе gi = 6Ai+6a?a,' + -- + 6„3„i (/ = 1....М) - (13) тогда и только тогда, когда система векторов «г = [“1Л аа, •••> ат] (< = 1....tn) (14) линейного пространства векторов-строк подходящим неособенным линейным преобразованием этого пространства переводится в систему векторов bi — [pii, psi, •••, Pzii] (*’ — 1, ••• > m). (15)
'262 КВАДРАТИЧНЫЕ И БИЛИНЕЙНЫЕ ФОРМЫ [Гл. VI 3. Показать, что система линейных форм (12) может быть переведена унитарным преобразованием переменных в систему (13) тогда и только тогда, когда система векторов (14) унитарного пространства строк под- ходящим унитарным преобразованием этого пространства может быть пере- ведена в систему векторов (15). 4. Доказать, что для эквивалентности билинейных форм от систем, содер- жащих различное число переменных, необходимо и достаточно совпадение размерностей (чисел строк и столбцов) и рангов матриц форм. В частности, билинейные формы от систем переменных $1( ..., и тц, ..., '<\т (я >• т), имеющие ранг г, эквивалентны форме + ...+&V § 22. Квадратичные формы 22.1. Конгруэнтность. Согласно общему определению квадра- тичной формой от переменных Si, ..., S„ называется однородный многочлен второй степени от этих переменных. Каждая квадра- тичная форма от указанных переменных допускает однозначную запись в следующем симметричном виде: Матрица А = ||a,7|| называется матрицей квадратичной формы, % симметрическая билинейная форма от двух систем переменных, имеющая ту же матрицу, что и ква- дратичная форма, называется полярной для последней. Отожде- ствляя в полярной форме вторую систему переменных с первой, получим исходную квадратичную форму. Тем самым устанавли- вается взаимно однозначное соответствие между квадратичными формами и симметрическими билинейными формами. Например, если та)=^-^+з^.2-бад3, то симметричной записью F (S) будет F (S) = S; - S32 + 4 SiS2 + 4 - ЗЦ:| ~ и соответствующая полярная форма имеет вид F (S, 7]) = S17]! — S37i3 4- 4 + 4 — 3’27!3 ~ ^за- говорят, что квадратичная форма имеет диагональный вид,' если диагональный вид имеет ее матрица, т. е. если форма содер- жит только члены с квадратами переменных. Производя в форме (1) линейную замену переменных с матри- цей Т, получим новую форму (п. 21.1) F $,) = XAX'=XiTAT'X'1 (X = [Si.........S„], Xi = [Sj, ..., S„J)
§ 22] КВАДРАТИЧНЫЕ ФОРМЫ 263 с матрицей At = TAT'. Таким образом, закон изменения матрицы квадратичной формы тот же самый, что и для соответствующей полярной билинейной формы. Отсюда следует, что квадратичные формы тогда и только тогда конгруэнтны, когда конгруэнтны соответствующие поляр- ные формы, и из теоремы 1 предыдущего параграфа непосредст- венно получается Т е о р е м а 1. Каждая вещественная квадратичная форма под- ходящим вещественным ортогональным преобразованием перемен- ных приводится к диагональному виду + <*•,&’ уф-... + где г — ранг исходной формы, a aj, ..., а.г— отличные от нуля характеристические числа матрицы формы. В частности, для ортогональной конгруэнтности вещественных квадратичных форм необходимо и достаточно совпадение характеристических много- членов форм. Если допускаются и неортогональные преобразования перемен- ных, то приведение возможно далее. Именно если ои, положительны, а а5+), щ отрицательны, то подстановка = = (/ = 1.....= s-j-1, • • •, d (2) приводит форму (2) к виду Следовательно, к такому виду может быть приведена любая квадратичная форма в поле вещественных чисел. Другие поля будут рассмотрены в следующем пункте. Выражение вида F ФА = 1] = X АХ' (X = , Ц) при условии агу = я/7 (г, j=l, ..., п) называют эрмитовой квад- ратичной формой от переменных ..., с матрицей Д = [|аг-у||. Эрмитову симметрическую билинейную форму F (£, ц) = называют полярной формой для Рф). Законы изменения матрицы эрмитовой квадратичной формы и ее полярной формы совпадают. Поэтому конгруэнтность эрмитовых квадратичных форм равно- сильна конгруэнтности их полярных форм, и из теоремы о приве- дении симметрических эрмитовых билинейных форм (п. 21.3) следует Теорема 2. Каждая эрмитова квадратичная форма унитар- ным преобразованием переменных может быть приведена к виду -j-... -j- (3)
264 КВАДРАТИЧНЫЕ И БИЛИНЕЙНЫЕ ФОРМЫ [Гл. VI где г — ранг, аь у.г— ненулевые характеристические числа матрицы заданной формы. Для унитарной конгруэнтности эрми- товых квадратичных форм необходимо и достаточно, чтобы сов- падали характеристические многочлены матриц форм. Дальнейшим, уже не унитарным, преобразованием переменных' по формулам (2) форму (3) можно привести к виду 44 +... + U - Д+1Д+1 -... - ^г, который и является простейшим в этом случае. 22.2. Алгоритм Лагранжа. Одним из наиболее простых спосо- бов приведения квадратичной формы к диагональному виду яв- ляется так называемый способ Лагранжа, который здесь и будет рассмотрен. Основное поле можно предполагать произвольным полем характеристики, отличной от 2. Пусть требуется привести к диагональному виду форму (1). Возможны два случая: а) форма содержит квадрат хотя бы одйого переменного, б) форма не содержит квадратов переменных. а) Пусть, например, ап ф 0. Представляя форму в виде F — ян?! Д-2aia44Д-. ..Д- 2ai„?jSraД- У — Л>1. ;j. >1 = ®11 («114 Д~ <Хы4 ~|- • • • ~ а1л4)" —’ — аД (ЯЬ4 + 2я12а1з44-Д • • • + Дл^л) + У — Л>1, р.>1 = Я11 (<Хц4 -j- «1з4 Д- ... Д- СцДп/ Д--^! (4, •••> 4)> где Fi — квадратичная форма от 4, • • • > 4, и производя подста- новку 4 = «11^1 Д- а12?2 Д“ • • • Д- а1 Дл, 4 = 4 (г — 2, 3, ..., п), преобразуем форму F к виду F = ^'* + Fi, где Fi не зависит от Д. б) Пусть ап = . .. = а„п = 0, но, например, а12 0. Перепи- сывая форму F в виде F = 24 (а12Д Д- • • • + Мл) + Л (4..4) и производя замену 4 — ян4 Д-... Д- «1Дл — 4, 4 = 4 О’ = 1, 3, 4, .... п),
§ 22] КВАДРАТИЧНЫЕ ФОРМЫ 265 получим форму F = 2^; (е; + Q -f- Л = 2‘f + 21& + +.. •, содержащую квадрат переменной Таким образом, применяя процесс а) и дополняя его в необ- ходимых случаях процессом б), мы сможем привести заданную форму к диагональному виду. П р и м е р. К диагональному виду требуется привести форму F= 4 + 4J: + 8^ - - 4;,;s + 66,5, - 12у. + 253=4 + 6263 - Имеем F= (6, - 26, + зу3 - =- - « 4- 2E3s4 + 6265 - б4е5. Производя подстановку б^^-^ + з^, £;. = 5(. (/>1), получим форму =42 - 4- - if 4- =е;2 - (4 - 4/ 4- которую замена 0V3) приводит в О ~ ’ll - Г13 4" Wi - ’ll’ls- Теперь согласно б) производим подстановку = гч — ^4 ~ ’Is, = ’1/ (г 7s 4)> в результате которой получаем форму с- .2 .1 I , , , , .2 .2 | ! . . 1 Л3 1 ,2 Oi —— т<з 4“ (ч« 4" ’I:,) ’is— тп —Tia 4“ ^is 4“ Tli)-4 ’I* * Эту форму подстановка = •»]; 4-у ’ii, — (‘ = 1.3, 4), ?5 = Д2 приводит к диагональному виду 0 = 44-4-4-4^- Чтобы найти матрицу Т перехода от переменных С,- к начальным пере- менным достаточно согласно п. 21.1 перемножить матрицы промежуточ- ных переходов. Если вместо квадратичной формы требуется привести к диа- гональному виду симметрическую билинейную форму, то билиней- ную форму заменяем соответствующей квадратичной, приводим последнюю к диагональной форме и вычисляем матрицу перехода. Ввиду связи между квадратичными и билинейными формами этот же переход приведет к диагональному виду и заданную билиней- ную форму.
266 КВАДРАТИЧНЫЕ И БИЛИНЕЙНЫЕ ФОРМЫ [Гл. VI В заключение рассмотрим задачу о приведении к простейшему виду кососимметрической билинейной формы (а/7 = —Я/7) с коэффициентами из совершенно произвольного поля. Если все коэффициенты равны нулю, то форма приведенная. В противном случае пусть, например, at2 ф 0. Переписывая форму в виде F = 51 (*127)2 + . .. + — Т)! (М3 4- ... + а]п5л) 4- 4~-Я(4, .... 5Л, Т]2, Т1п) и производя замену 51 = «1-2^2 4- • • + Мл, = сзд 4-... 4~ СЗД„, 51 = 5г, = (« = 1, 3, ..., п), получим форму fi = 517)1 — 54114~(51, ..., 54 ..., 7)л). Теперь возможны два случая: а) остаток Ri не содержит 54 а сле- довательно, и т)4 б) остаток содержит 54 . В случае а) процесс далее совершаем только над остатком, так как он не зависит от уже выделенного члена 517)1— 544. В случае б) переписываем форму в виде F1 — 517)2 — 52t)j -4 5.2 («.237]3 4-... 4- М») — — 71-2 (®2353 4~ • •• + Мл) 4- Ri (53, ...) = =(51 — Ml—• • .—Мл) ''ll—Oil — Ml —... — Мл) 5.14- R> (54 ...), производим замену 51 = 51 CL2353 • . . . а2„5л, 7]j = 7ц ®23Т)3 . . , • а.2лТ1«, 5? = 51, 7]Г = 71; (1 = 2, ..., /г) ' и в результате получаем распавшуюся форму 51Ч1-5.М'4-^(54 .... *11', ...). Повторяя изложенный процесс над остатком, затем над новым остатком и т. д., приведем форму к виду 517)2 - 527)1 4- 537)4 - 51,7)3 4- ... 4- 52г_17)2г- 52/-7]2/-_1, где 2г—ранг приведенной, а следовательно, и первоначальной формы. В частности, снова получаем, что ранг кососимметриче~ ской матрицы — всегда число четное. Пример. Преобразовать к простейшему виду форму F = 51712 — ф- 5^3 — Е37)1 — 2517)4 + 2£ц]1 + . + 3527]з — 353Т]а 4- 527]4 — 541)2 т- 4537]4 -ф
§ 22} КВАДРАТИЧНЫЕ ФОРМЫ 267 Согласно правилу производим первую подстановку е;=+е3 - 2е4> л'=12+1)3—2^, е;-=ег, (*=i, 3> 4)> после которой форма приобретает вид — Ss’ii + — 3;^ - + _ 4^ + 4$'т]'. Совершая теперь преобразование £[ = е;-зе;-е;, ^ = ^-371'-^ 5;=е;-, = ч («’ = 2,3,4), получим простейшую форму F2 = - 4^^ + 45-TJ-. С практической точки зрения задача о приведении к простей- шему виду квадратичных форм распадается на две части: опре- деление окончательного простейшего вида формы и нахождение матрицы преобразования переменных, необходимого для приведе- ния формы к простейшему виду. В случае приведения при по- мощи произвольных линейных преобразований обе эти частные задачи решаются алгорифмом Лагранжа. Более сложно обстоит дело в случае приведения форм уни- тарными преобразованиями переменных. Пусть дана эрмитова форма с матрицей А. Во вспомогательном унитарном простран- стве векторов-строк умножение строк на матрицу А будет симме- трическим линейным преобразованием с матрицей А в про- стейшем базисе (п. 4.1). Нужно найти ортонормированный базис, в котором матрица преобразования А приобретает диагональный вид. Для этого ищем характеристические числа а]( ..., а„ мат- рицы А, решая характеристическое уравнение для А. Затем, решая системы линейных уравнений Bi.....U A =az[^, .... U относительно неизвестных В„, находим п линейно незави- симых собственных векторов = Й’1 (г = 1, ...,и) преобразования . Нормируя эти векторы, получим ортонорми- рованный базис, в котором матрица А, а следовательно, и исход- ная эрмитова форма принимают диагональный вид с диагональ- ными элементами а]; ..., ап. Если векторы X; уже нормированы, то искомая матрица перехода будет Т —1| ||. 22.3. Закон инерции квадратичных форм. В результатах п. 22.1 о приведении вещественных квадратичных, а также комплексных эрмитовых форм к диагональной форме остался пробел: не было установлено, .могут ли быть конгруэнтными формы с различной сигнатурой. Этот пробел заполняет
268 КВАДРАТИЧНЫЕ И БИЛИНЕЙНЫЕ ФОРМЫ [Гл. VI Теорема 3 (закон инерции). Каждая вещественная квадратичная форма может быть бесконечным числом подстано- вок переменных приведена к диагональному виду -)-• • 4“аЛЛ Однако, хотя сами коэффициенты аъ ...; а.г могут зависеть от употребленной подстановки, число положительных и число отри- цательных среди них не зависят от указанных подстановок и, таким образом, однозначно определяются самой исходной формой. Допустим, напротив, что вещественная квадратичная форма «14 +... 4- a.s¥s — aJ+i4+i — ... — a.rVr (at > 0) подстановкой переменных 4- = У, 4л;.г переводится снова в диаго- нальную форму 4-... 4- Ut - P/X+i -... - №г & > 0), причем s<4. Это значит, что если в равенстве 4-... 4" — 7-.s- i4-—1 ~ • • • — == =гм;3 4- ••• 4- - ^+i^+i - ••• - м;3 заменить переменные 4 их выражениями через l't, то оно обра- тится в тождество. Перепишем это тождество в виде а144-...4-а^4-&+Л+1 4~...4~Mr = M^24-...W;3 + «s+^+i4-...4-«ry (4) и рассмотрим систему уравнений £1 = 0.....4 = 0, 4+i = 0, ..., 4 = 0, (5) где под 4, ..., 4 понимаются их выражения через 4, ..., £4 Система (5) является системой линейных однородных уравнений относительно неизвестных 4, £.4 причем число уравнений s 4- (п — t) — n — (t — s) заведомо меньше числа неизвестных, поскольку />s. Но в таком случае система (5) должна иметь хотя бы одно ненулевое решение 4 = Ъ, ..., 4 = 1/, 4+1 = 0, ...,4 = 0. (6) Подставляя его в тождество (4), получим Pili 4--• • 4~ 4-as+i4+i 4- • • • -гаг4 = 0. (7) Числа ay- положительны, у®, £} неотрицательны, поэтому из (7) следует ~(i = . .. = ’[( = 0, что противоречит нетривиальности реше- ния (6). Закон инерции в той же самой формулировке имеет силу и для эрмитовых квадратичных форм. Доказательство его не отличается от изложенного выше.
§ 221 КВАДРАТИЧНЫЕ ФОРМЫ 269 22.4. Знакопостоянные формы. Вещественная квадратичная форма F ($) = У. называется неотрицательной, если для всех вещественных значений переменных $,• значение формы неотрица- тельно. Форма называется положительно определенной, если для каждой «ненулевой системы значений переменных значение формы строго положительно. Аналогично определяются понятия неполо- жительных и отрицательно определенных форм. Неотрицательные - и неположительные формы иногда называются также знакопосто- янными формами. Если форма от п переменных ..., имеет диагональный вид ajEj 4- .. • + — *.s+4s+i — ... — (a; > 0), то легко видеть, что она будет положительно'Определенной в слу- чае s = n, неотрицательной при s = r^n, неположительной для s —0 и отрицательно определенной в случае s = 0, r — п. При 0 <4 <4 г форма имеет положительные значения при одних зна- чениях переменные и отрицательные — при подходящих других. Так как знакопостоянство формы не меняется при замене пере- менных, то можно сказать, что положительно определенными являются те формы, которые приводятся к сумме п положитель- ных квадратов, неотрицательными являются формы, приводящиеся к сумме только положительных квадратов, хотя бы и в меньшем числе, чем число переменных, и соответственно для неположитель- ных и отрицательно определенных форм. В частности, неотрица- тельная форма положительно определена, если только она не- особенная. Если в обычных квадратичных формах позволить переменным принимать не только вещественные, но и комплексные значения, то введенные понятия теряют смысл, так как тогда любая нену- левая форма становится способной принимать невещественные значения. Дело меняется, если рассматривать эрмитовы формы. Причина состоит в том, что при любых как вещественных, так и комплексных значениях переменных эрмитовы формы имеют вещественные значения. Действительно, из условий аг? —сле- дует: F = У 2 2 £ = F, т. е. F вещественно. В силу этого понятия неотрицательности, положительной определенности и т. д. непосредственно распро- страняются на эрмитовы квадратичные формы. Положительная определенность формы, так же как и ее сигна- тура, в общем случае легко устанавливается путем приведения формы к диагональному виду по способу Лагранжа. Однако в от- дельных случаях имеют большой интерес и непосредственные
270 КВАДРАТИЧНЫЕ И БИЛИНЕЙНЫЕ ФОРМЫ [Гл. VI признаки положительной определенности. Из них мы рассмотрим только так называемый Признак Якоби. Квадратичная или эрмитова квадратич- ная форма от п переменных с матрицей А тогда и только тог- да неотрицательна, когда коэффициенты характеристического мно- гочлена А имеют чередующиеся знаки. При этом, если какой-либо коэффициент оказывается равным нулю, то и все коэффициенты при младших членах также должны равняться нулю. Действительно, согласно п. 22.1 преобразованием переменных с унитарной матрицей U заданная форма может быть приведена к диагональному виду с вещественной диагональной матрицей Ai = — UAU’ — UAIK1. Так как А не только конгруэнтна, но и по- добна Alt то характеристический многочлен А совпадает с харак- теристическим многочленом Ai и доказываемый признак остается проверить только для диагональных форм вида -|-...-}-аД.=г. Характеристический многочлен матрицы последней формы есть <0 (X) = (X — Л1) (X — а2)... (X — аг) Хя~г = Xя — з#.я2 — ... Если все а,- положительны, то формулы Виета U <^пАп2 ••• %. («1<П2 <...<«,) показывают, что коэффициенты <р(Х) обладают требуемыми свой- ствами. Обратно, пусть известно, что коэффициенты какого-либо многочлена отличны от нуля, имеют чередующиеся знаки и корни многочлена вещественны. Нужно доказать, что тогда все его кор- ни положительны. Предположим по индукции, что для всех мно- гочленов меньшей степени это уже доказано. Тогда ср' (X) будет иметь п — 1 положительных корней (так как если все предположе- ния для <р (X) удовлетворяются, то они заведомо удовлетворяются и для ср' (X)). Но в таком случае ср (X) по теореме Ролля имеет не менее п — 1 положительных корней, а последний n-й корень ср (X) будет положителен в силу того, что по предположению произ- ведение всех корней ср (X) положительно. Примеры и задачи 1. Найти матрицу линейного преобразования переменных, приводящего К простейшему виду билинейную форму 61I2 Esli + 5Sa’ls Н- — 2S114- 2. Показать, что в вещественном унитарном пространстве каждую ве- щественную кососимметрическую билинейную форму от п переменных веще- ственным унитарным преобразованием переменных можно привести к виду , „ „ «1 (611» ~ «al/J + • • • + «г (Ssr-ilsz- — Msr-i) (ср. п. 1'9.5). .
§23] ПАРЫ ФОРМ '271 3. Найти матрицы вещественных ортогональных преобразований, пере- менных, приводящих к диагональному виду формы: а) ц + е*е»+ц; б) 995] - 12515, + 485x5а + 13053 - 605253 + 7 1 5f; в) 105x1]! + 45хТ]2 + 452ч]х + 12=х1]з + 125si]i — 252i)2 — 145<р]3 — 1453i)2 + Sals, и выписать эти простейшие формы. 4. Найти матрицу унитарного преобразования, приводящего форму OBils — OSa^x -f- 2=хТ]4 — 254Ц1 Н- 2521]з — 253i]2 — 653i]4 -f- 654i]3 к простейшему виду. 5. Найти преобразование переменных, переводящее форму 4~ 5aEn-i ~Т • • • Н- ( s = ["2" ]) в сумму квадратов. § 23. Пары форм 23.1. Эквивалентность пар форм. В предыдущих пунктах рас- смотрена задача приведения к простейшему виду одной квадра- тичной формы. В настоящем параграфе будет рассмотрена важная задача о совместном приведении двух квадратичных форм. Напомним, что последовательность билинейных форм X, Fh от одних и тех же систем переменных $1, ... , и nji, ...» i)„ на- зывается эквивалентной последовательности билинейных форм Gi, ..., Gk от переменных ..., и тщ ..., если линейными обратимыми преобразованиями переменных = h] = h']S ([q = Rb ...» U) формы первой последовательности могут быть приведены в соответ- ствующие формы второй последовательности. Из результатов п. 21.2 вытекает, что последовательность били- нейных форм с матрицами Ai, ..., Ak тогда и только тогда экви- валентна последовательности билинейных форм с матрицами Bi, ..., Вк, когда существуют неособенные матрицы Р, Q с эле- ментами из основного поля такие, что PAjQ — Bj (/=1, .... £). (1) Две последовательности матриц Ait ..., Ak и Д, .... Bk на- зываются эквивалентными, если при некоторых неособенных ма- трицах Р, Q они связаны соотношениями (1). Таким образом, эквивалентность последовательностей форм и эквивалентность последовательностей их матриц равносильны друг другу. Пусть X — независимая переменная, F, G — пара квадратных матриц одного и того же порядка п. Инвариантные множители /-матрицы KF — G (см. п. 13.2) называются инвариантными
272 КВАДРАТИЧНЫЕ И БИЛИНЕЙНЫЕ ФОРМЫ {Гл. VJ множителями пары F, G. Если пара F, G эквивалентна паре Л, Gi, то из (1) следует: ).Ei — Gt = G (XF —- G) V'. Согласно п. 13.3 это показывает, что инвариантные множители Х-матриц XF] — Gi и XF— G совпадают. Итак, для эквивалентности двух пар матриц необходимо, чтобы инвариантные множители этих' пар совпадали. В общем случае это условие не является до- статочным *). Однако если первые матрицы обеих пар неособен- ные, то совпадения инвариантных множителей достаточно для их эквивалентности. Теорема 1. Пусть заданы две пары квадратных матриц F, G, Еъ Gi одного и того же порядка, из которых F, Fi неосо- бенные. Для эквивалентности пар F, G и Fit Gt необходимо и достаточно, чтобы инвариантные множители матрицы 1F — G совпадали с инвариантными множителями матрицы XFt — G,. Необходимость была уже доказана, поэтому установим только достаточность. Пусть инвариантные множители матриц XF — G и XFj — Gi одинаковы. Из соотношений F1QF — G) = )H~F>G, Ft 1 (ХЕ, — Gi) = XE — Fi'Gi вытекает, что инвариантные множители матриц ХЕ"—F'G и ХЕ — F~i'Gi также одинаковы. Так как эти матрицы являются ха- рактеристическими для F~'G и Fi'Gi, то отсюда следует (п. 15.3), что F'G и Fi'Gi подобны, т. е. что существует неособенная мат- рица Т, удовлетворяющая соотношению Fi'Gi^T-'F^GT. Мы имеем теперь ХЕ — F^Gi = Т~' (ХЕ — F~'G) Т = T~'F^' (ХЕ — G) Т, XFi — Gi = FiT-'F-' (ХЕ — G) Т, откуда Fi = GFV, Gi = UGV', где U — FiT~'F~l, V — T', Таким образом, пары Е, G и Fb Gi эквивалентны. 23.2. Конгруэнтность пар форм. Последовательность билиней- ных -форм от переменных и t;i, ..., т]п с матрицами Ai, .... Ак называется конгруэнтной последовательности билиней- ных форм с матрицами Bi, ..., Bk, если одним и тем же преобра- зованием обеих систем переменных формы первой последователь- *) Именно, кроме инвариантных множителей, в общем случае прихо-« дится рассматривать еще так называемые минимальные индексы.
§231 ПАРЫ ФОРМ 273 ности можно перевести в соответственные формы второй последо- вательности. Обозначая матрицу преобразования переменных через Т, бу- дем иметь Bj = TAjT' (/=1,2............k). (2) Две последовательности произвольных матриц Дь ..., Ak и Bi.... Вк называются конгруэнтными, если существует неособен- ная матрица Т, для которой выполняются условия (2). Аналогичным образом говорят, что одна последовательность квадратичных или эрмитовых квадратичных форм конгруэнтна другой последовательности форм, если подходящим обратимым преобразованием переменных формы первой последовательности можно одновременно перевести в соответственные формы второй последовательности. Условие (2) является, очевидно, необходимым и достаточным для конгруэнтности квадратичных форм с матрицами Ait ..., и Bi, ..., Bk. Для эрмитовых форм это условие заменяется сле- дующим: Bj = TAjT' (/=1, 2, ..., k). Сформулированная общая задача об условиях конгруэнтности последовательностей билинейных форм является весьма сложной уже для пары форм. Для случая, когда обе формы пары сим- метричны, в частности если формы квадратичные и если одна из форм пары неособенная, необходимые и достаточные условия кон- груэнтности были получены во второй половине прошлого века Вейерштрассом. Они будут изложены в конце этого пункта. Общий случай конгруэнтности пар квадратичных форм был изу- чен Кронекером. Ввиду некоторой громоздкости условий Кроне- кера они обычно излагаются в более специальных руководствах. И те и другие условия касаются форм над полем комплексных чисел. Случай иных полей рассматривался Диксоном и другими авторами. Мы сначала рассмотрим наиболее важный случай пары веще- ственных квадратичных форм, когда одна из них является поло- жительно определенной. Теорема 2. Каждая пара вещественных квадратичных форм от п переменных, из которых первая является положительно опре- деленной, подходящим вещественным преобразованием переменных может быть переведена в пару форм вида Д~ Д- • • • "Н --п, а1Ч Д~ Ч- • •• Д- (3) Числа ai, ..., ап с точностью до порядка следования определяются однозначно первоначальными формами и не зависят от способа приведения.
274 КВАДРАТИЧНЫЕ И БИЛИНЕЙНЫЕ ФОРМЫ 1Гл. VI В самом деле, пусть заданные квадратичные формы суть F (z) и G (;). Надлежащим линейным преобразованием переменных пер- вую из этих форм приводим к сумме квадратов переменных, что ввиду положительной определенности первой формы заведомо воз- можно. В результате получим пару форм вида « + й+...+^, Теперь ищем подстановку переменных с вещественной ортогональ- ной матрицей U, которая приводила бы к диагональному виду вторую форму. Так как матрица первой формы при этом будет в новых переменных равна UEU' — UU' — E, т. е. первая форма сохранит свой единичный вид, то после ука- занного преобразования заданные формы приобретут требуемый вид (3). Предположим, наконец, что формы F, G одним преобразова- нием переменных - приводятся к виду (3), а некоторым другим преобразованием — к виду И + ... -Нл, ₽1И + ^+...+₽Х (4) Тогда подходящее преобразование переменных с матрицей Т пере- ведет пару (3) в пару форм (4) и, следовательно, матрицы этих форм будут связаны соотношениями - Е = ТЕТ', В = ТАГ, (5) где А—диагональная матрица с элементами аь ..., а„, а В—диа- гональная матрица с элементами ..., -по главной диагонали. Первое из соотношений (5) дает ТГ — Е, откуда В = ТАГ1, т. е. матрицы А, В подобны и характеристические числа ai,..., ап первой из них должны совпадать с характеристическими числами ₽1, ..., 8„ второй. Для эрмитовых квадратичных форм имеет место совершенно аналогичная Теорема 2а. Каждая пара эрмитовых квадратичных форм, из которых первая положительно определенная, подходящим комп- лексным линейным преобразованием переменных может'быть пере-, ведена в пару форм вида ЕаЁа Е/я> -f" • • • “Ь где числа аь ал однозначно определяются исходными формами и не зависят от способа приведения. Доказательство аналогично предыдущему.
S' 23Г ПАРЫ ФОРМ 275 • Переходя к рассмотрению общего случая, прежде всего заме- тим, что из конгруэнтности пар матриц заведомо следует их эквивалентность. Совершенно неожиданно оказывается, что при некоторых условиях верно и обратное утверждение. Теорема 3. Предположим, что в двух парах квадратных матриц F, G и Fi, Gt первые матрицы F, Ft или обе симме- тричны, или обе кососимметричны и вторые матрицы G, Gi тоже или обе симметричны, или обе кососимметричны. Тогда в поле комплексных чисел из эквивалентности указанных пар вытекает их конгруэнтность. По условию существуют такие неособенные матрицы U, V, что F1 = UFV', G1 = UGV. (6) Переходя к транспонированным матрицам, мы получим отсюда Fi — VF’U’, Gi — VG'U'. Так как F и Ft симметричны или косо- симметричны, то это дает Fl = VFU'; (7) аналогичное равенство имеем для Gi. Сравнивая (7) с (6), полу- чаем UFV' = VFU', V-'U-F = F.(V]U)’. (8) Введем обозначение V~lU = Т: Второе равенство в (8) теперь дает TF — FT', ' ТгР=РТ'\ \ TkF — FT'k откуда (Яо£-4-а17’+ ... +akTk)F = F(^E^lT' + ... где «о, аь ..., а* — произвольные числа. В гл. IV (п. 16.3) было показано, что числа ав, ..., а.к возможно подобрать так, чтобы многочлен <р(Т)=а'в£4-а1Т+ ... был квадратным корнем из Т, т. е. чтобы <р(7,)<р(7') = 7'. Положим P=V<f(T), тогда PFP' = V? (Г) F<? (Г) V' = V? (Т) ? (Т) FV' = VTFV' = UFV', или PFP' = Ft. Повторяя те же рассуждения для матрицы G, мы получим PGP’ — Gt.
276 ' КВАДРАТИЧНЫЕ И БИЛИНЕЙНЫЕ ФОРМЫ [Гл. VI Следовательно, пара F, G конгруэнтна паре Fi} Git что и требо- валось... Теоремы 1, 3 позволяют сформулировать следующее условие конгруэнтности пар матриц: Пусть даны две пары матриц F, G и Ft, G\. Если F, Ft не- особенные и либо обе симметрические, либо обе кососимметрические и если G, Gi также либо обе симметрические, либо обе кососим- метрические, то необходимым и достаточным условием конгруэнт- ности пар F, G и Fi, Gi в поле комплексных чисел является сов- падение инвариантных множителей матриц >F — G и ).Fi — Gi. Действительно, если инвариантные множители матриц XF—G и ХД — Gi совпадают, то согласно теореме 1 пары F, G и Fi, Gt эквивалентны. Но тогда эти пары в силу теоремы 3 будут также конгруэнтны. Обратно, если F, G и Fi, Gi конгруэнтны, то они тем более эквивалентны, и, значит, инвариантные матрицы ХД — G совпадают с инвариантными множителями матрицы ).Fi — Gt. Приложения теоремы 3 к фактическому нахождению простей- ших видов пар комплексных форм будут рассмотрены позже, в гл. VII. В следующем пункте с помощью этой теоремы будет решен вопрос о конгруэнтности несимметрических билинейных форм. Заметим еще, что хотя до теоремы 3 вещественные квадратич- ные формы и эрмитовы формы вели себя одинаково, теорема 3 уже перестает быть верной для эрмитовых форм. Соответствую- щий пример будет рассмотрен в начале § 28. 23.3. Конгруэнтность несимметрических билинейных форм. Как уже сказано выше, результаты предыдущего пункта позво- ляют сформулировать необходимые и достаточные условия для конгруэнтности произвольных комплексных неособенных билиней- ных форм и тем существенно пополнить результаты п. 21.3. Теорема 4. Для того чтобы комплексные невырожденные билинейные формы с матрицами G иСЛ были конгруэнтны, необ- ходимо и достаточно, чтобы совпадали элементарные делители. / -матриц )-G — G' и XGi— Gj. Доказательство. Пусть формы конгруэнтны. Тогда мат- рицы G и Gi связаны соотношением Gi = UGU'. Отсюда G'i = t/G't/'. Следовательно, пара матриц G, G' конгруэнтна паре Gt, G\ и элементарные делители матрицы XG— G' совпадают с элементар- ными делителями матрицы XGi-^-Gj. Пусть, обратно,, элементарные делители матриц XG— G' и XGj — Gj совпадают. Тогда на Основании теоремы 1 пара G, G'
§ 231 ПАРЫ ФОРМ 277 эквивалентна паре Glt G’i, т. е. Gl = UGV', Gi = UG'V'. Положим G+G' = S, G — G' = T, Gr-^-G'^Si, (9) Из (9) вытекает, что Si = USV, Ti = UTV', т. e. пара S, T эквивалентна паре Si, Т\. Поскольку матрицы S, Si симметрические, а Т, Ti кососимметрические, то согласно теореме 3 пары S, Т и Si, Ti будут конгруэнтны, т. е. S1 = PSP', Т^РТР'. (10) S Т 2 [ т Но G= —у—, G1 = -L^—1, поэтому из (10) вытекает, что Gi = PGP'. Таким образом, матрица G конгруэнтна Теорема 4 показывает, что невырожденные билинейные формы над полем комплексных чисел с точностью до изоморфизма опре- деляются элементарными делителями матрицы XG— G'. Поэтому, чтобы решить задачу о классификации таких форм, достаточно указать, какие системы выражений вида (X— а)т могут служить системами элементарных делителей для матриц типа XG— G'. Легко видеть, что эти системы не могут быть произвольными. В самом деле, пусть (X — а)т входит k раз в систему элементар- ных делителей некоторой матрицы XG— G'. Тогда (X — а)т будет входить k раз и в систему элементарных делителей транспони- рованной матрицы XG' — G. Но XG' — G эквивалентна G'~‘ (XG'—G)= — ХЕ— Gr ,G; следовательно, (X — a)m входив k раз в систему элементарных делителей матрицы ХЕ— G'~'G. Теорема об элемен- тарных делителях функций (п. 16.4) утверждает, что каждый эле- ментарный делитель (X — а)т матрицы Х£—G' ’G переходит е эле- ментарный делитель (X — 7. ‘)т матрицы Х£ — (G'^G)"1. Так как последняя матрица эквивалентна XG,— G', то ,(Х— а1)'" входит k раз в систему элементарных делителей матрицы XG — G'. Следо- вательно, если (X — a)m есть k-кратный элементарный делитель матрицы '/G — G', то (X— а-1)"1 будет также ее k-кратным эле- ментарным делителем. При а = ±1 это условие обращается в тривиальность. С помощью дополнительных рассуждений' можно показать, что матрицы XG— G' содержат каждый элементарный делитель (X1 )2т+] обязательно четное число раз, в то время как элементарные делители вида (X—I)8"4"1, (Х± l)2m могут вхо- дить в эти матрицы в произвольных комбинациях. Указанные
3. Показать, что пара форм с матрицами г 2 31 валентна паре форм с матрицами , I о I экви- 278 КВАДРАТИЧНЫЕ И БИЛИНЕЙНЫЕ ФОРМЫ [Гл. VI условия для а как равных, так и не равных ±1 не только необ- ходимы, но и достаточны, чтобы система выражений вида (X—а)т могла быть системой элементарных делителей некоторой матрицы XG — G'. Примеры и задачи 1. Вещественным преобразованием переменных привести пары форм’ a) х~ + 2ху + 2у3, 2х~ — ху; б) 2х2 + 2ху + 2xz + 2/ + 2yz + 2г2, — 9х2 + Збху -|- 18xz -j- 15у>3 -f- 18_уг -р 18г3 к простейшему виду. 2. Пара, состоящая из симметрической положительно определенной и кососимметрической вещественных билинейных форм, вещественным преоб- разованием переменных может быть приведена к виду + • • • + ЬпЧп, “i (Sils ~ &li) + •••+ ar (br-rtsr — ЪгЪг-В- 2—61 Г - 6 6 1 3j ’ L 1—1 - 10 51 . Для доказа- тельства обобщить теорему 1 п. 23.1 на пары А, В, у которых | Х/1 iiB | т^О, путем рассмотрения инвариантных множителей — однородных многочленов от X, р.. 4. Доказать последние утверждения п. 23.3. § 24. Билинейные функции Теория билинейных форм геометрически может быть истолко- вана как теория билинейных функций в линейных пространствах. Истолкование это позволяет глубже понять и "основные факты теории форм; изложению его посвящен настоящий параграф. 24.1. Основные определения. Говорят, что на линейном про- странстве 2 задана функция ® (х, у) от двух переменных векторов х, у, если каждой паре векторов пространства £ поставлен в соответствие определенный элемент <р (х, у) из основного поля К. рассматриваемого пространства. Функция <р (х, у) называется би- линейной, если она линейна относительно каждой переменной в отдельности, т. е. если она удовлетворяет тождествам <р (<ziXi-|-а2Х2, y) = ai<f(xi, z/)4-a,®(x2, у), (1) <Р ₽iZ/t + р<2) = (х, Z/1) + (х, yi). (2) Билинейная функция на комплексном линейном пространстве называется эрмитовой билинейной, если она линейна относительно первого переменного и косолинейна относительно второго, т. е.
§ 241 БИЛИНЕЙНЫЕ ФУНКЦИИ 279 если она удовлетворяет соотношению (1) и соотношению ? (*, ₽i^i + = pi? (х, yt) -ф- (х, уА- (3) Из (1), (2), (3) непосредственно вытекает общее правило дис- трибутивности: ? (Xi-| -х.>-j-...-хт, ух -ф- у.г Ц-... 4~ у А = 2 ? У^ (4) как для билинейных, так и для эрмитовых билинейных функций. Выберем в S произвольный координатный базис at........... ап, и пусть х = SiGj -ф- -ф-... 5лол, У = WZ1 -|-гг2а, -ф- ^пап. Формулы (2), (4) дают ?(*, y) = ^{at, = (a.ij = <f(ah оу)). (5) Матрица y4 = J|afy|] называется матрицей функции <р(х, у) в ука- занном базисе. Зная матрицу А, мы, очевидно, знаем и функцию ср (х, у), так как формула (5) позволяет находить значения ср (х, у) для любой пары векторов х, у. Соответствие между матрицами и билинейными функциями взаимно однозначно, так как для произвольной матрицы А функ- ция ср (х, у), вычисляемая по формуле (5), будет билинейной с матрицей А. Обозначая через [х], [z/] координатные строки векторов х, у, формулу (5) можно записать в краткой матричной форме: <Р (х, у) = [х] А [у]', (6) которая позволяет непосредственно вывести следующее правило преобразования матриц билинейных функций: если в каком-либо базисе матрица билинейной функции есть А, то в новом базисе матрица функции будет Ах = ТАГ, (7) где Т — матрица перехода от старого базиса к новому. Действительно, применяя формулу (6) в старом и новом бази- сах, получим <Р (*> У) = W А [у]' = [хф ТАТ' [у\х == [хф Ai [y]'i, где А}, {хф, [y]i — матрица функции ср (х, у) и координатные строки векторов х, у в новом базисе. Поэтому Ai = TAT'. Рассматривая в формуле (5) координаты векторов х, у как независимые переменные; мы видим, что значение билинейной функции в каждом координатном базисе выражается билинейной
280 КВАДРАТИЧНЫЕ И БИЛИНЕЙНЫЕ ФОРМЫ ЕГл, VI формой, матрица которой совпадает с матрицей функции в этом базисе. Согласно (7) переход к новому базису влечет за собой замену билинейной формы соответствующей конгруэнтной формой, в силу чего конгруэнтные билинейные формы можно рассматривать как билинейные формы той же самой билинейной функции, но вычисленные в различных координатных базисах. Билинейная функция ср (х, у) называется симметрической, если ср(х, у) = <?(у, X), и кососимметрической, если ?(*, £/) — —?(#. х). Очевидно, симметрические и кососимметрические билинейные функ- ции — это такие функции, билинейные формы которых соответ- ственно симметричны или кососимметричны. Если ср (х, ^ — произвольная билинейная функция, то функции = У) + ?(У’ X)L ^(х, у}==^[<? (х, у) — (у, х)] - “ (8) будут билинейными и соответственно симметрической и кососим- метрической. Так как из (8) следует, что ср(%, у) ==cpj (х, #)+<р2(х, У), то всякую билинейную функцию можно представить в виде суммы симметрической и кососимметрической функций, причем, как легко видеть, это представление возможно только единственным способом. Функции вида ф(х) = ср(х, х), где <р (х, у) — некоторая били- нейная функция, называются квадратичными. Таким образом, квад- ратичные функции — это те функции одного переменного вектора, которые возникают из билинейных путем отождествления пере- менных векторов. Но если квадратичная функция ф(х) возникает указанным образом из билинейной функции ср (х, у), то ф (х) воз- никает путем отождествления переменных и из симметрической билинейной функции <р, (х, у)-. ср, (х, х) = ~ [ср (X, х) —j— ср (х, х)1 = ср (х, х). Поэтому при рассмотрении квадратичных функций достаточно брать в качестве порождающих лишь симметрические функции. С другой стороны, если ср (х, у) симметрична и ф (х) = ср (х, х), то Ф(.X-фу) = ср(х + у, X + «/)== ср(х, x)-j-2'p(x, //) + <?(//, у),
5 241 • БИЛИНЕЙНЫЕ ФУНКЦИИ 281 ИЛИ <Р (х, у) = у [ф (х + у) — ф (х) - ф <^)], т. е. каждая квадратичная функция возникает из одной и только одной симметрической билинейной функции, называемой полярной для соответствующей квадратичной функции. Пусть flj,..., ап — некоторый базис пространства и ф(х) = = <р (х, х), где <р (х, у) — симметрическая билинейная функция. Тогда для х == Sitzi znan имеем ф(х) = ср(х, х) =2<р(а;, а^, т. е. значение квадратичной функции выражается квадратичной формой от координат переменного вектора, матрица которой совпадает с матрицей соответствующей полярной билинейной формы. Рассуждая аналогично, получим, что значения эрмитовой били- нейной функции ср (х, у) выражаются вместо формулы (5) формулой ср(х, у) = 2]ср(аг, афщ, т. е. эрмитовой билинейной формой. При переходе к новому ба- зису матрица эрмитовой функции меняется по закону Аг = ТАТ'. Эрмитова функция ср (х, у) называется симметрической, если ср(х, у) = <?(у, х). Значения эрмитовых симметрических функций выражаются эрми- товыми симметрическими билинейными формами. Функции одного переменного вектора, возникающие из эрми- товых симметрических билинейных функций отождествлением пе- ременных векторов, называются эрмитовыми квадратичными функ- циямщ Связь между эрмитовыми квадратичными функциями и соответствующими эрмитовыми симметрическими билинейными функциями устанавливается формулами ф(х + iy) = <? (х + iy, x-\-iy) — = <Р (х, х) +1 (х, у) - <р (х, £)] + <р (у, у), ty(x-[-y) = <?(x, х) + <р(х, #) + ср(х, у) + ср (у, у), 2ср (х, у) = ф (х -j- у) + 1ф (х + iy) — (1 ф- i) [ф (х) 4~ф (£)]. ; Вычисляя значение эрмитовой, квадратичной функции ф (х) для вектора х = Ьущ -j-... + 1пап, где а1г.... ап — базис пространства,
282 КВАДРАТИЧНЫЕ И БИЛИНЕЙНЫЕ ФОРМЫ [Гл. VI получим Ф(х) = 2(р(аь т. е. значение эрмитовой квадратичной функции выражается эрми- товой квадратичной формой от координат переменного вектора, матрица которой совпадает с матрицей соответствующей эрмито- вой симметрической. билинейной функции, вычисленной по фор- муле (9). Отметим еще, что рассмотренные в п. 22.4.знакоопределенные квадратичные формы соответствуют тем квадратичным функциям в вещественном и эрмитовым квадратичным функциям в комплекс- ном пространстве, значения которых не меняют знака. 24.2. Пространства с билинейной метрикой. Согласно п. 17.1 вещественное или комплексное линейное пространство называется унитарным, если в нем определена некоторая функция двух пе- ременных векторов, значения которой называются скалярными произведениями этих векторов. Сформулированные там аксиомы означают престо, что скалярное произведение есть билинейная эрмитова положительно определенная функция. Изучение свойств унитарных пространств поэтому является изучением свойств по- ложительно определенных билинейных функций с особой точки зрения. По аналогии с этим мы будем называть линейное пространст- во 2 билинейно-метрическим, если в нем определена некоторая билинейная функция, значения которой мы будем называть ска- лярными произведениями векторов и обозначать (а, Ь). Если ска- лярное произведение является симметрической эрмитовой били- нейной функцией, то пространство будет называться пространством с эрмитовой билинейной метрикой. Если матрица скалярного произведения неособенная, то про- странство будет называться невырожденным. В противном случае пространство называется вырожденным. Матрица "(аъ ат)' G_ (at, ат) _(&пн &1) • *' ат)_ составленная из скалярных произведений векторов «1, ..., ат билинейно-метрического пространства 2, называется матрицей Грама системы а1г ат. Матрица Грама, составленная для векторов ai,...,an, образующих базис пространства 2, является просто матрицей основной билинейной функции <р (х, у) = (х, у), вычисленной в этом базисе. Отсюда следует, что матрицы Грама,
§ 24] БИЛИНЕЙНЫЕ ФУНКЦИИ 283 составленные для различных базисов пространства, конгруэнтны друг другу и поэтому имеют одинаковый ранг. В теории унитарных пространств важную роль играло поня- тие ортогональности векторов. Это понятие непосредственно пере- носится и в билинейно-метрические пространства. Пусть 8 — обыкновенное или эрмитово билинейно-метрическое Пространство. Вектор а из 2 называется ортогональным к Ь, если (о, 6) = 0. Из ортогональности а к b еще не следует ортогональ- ность b к а, так как в общем случае (а, Ь) (Ь, а). Поэтому иногда для большей определенности говорят, что а ортогонален слева к b, а Ь ортогонален справа к а. Из законов дистрибутив- ности (1), (2) следует, что если а ортогонален к нескольким век- торам alt ..., ат, то а будет ортогонален и к любой их линейной комбинации. Отсюда в свою очередь вытекает, что совокупность векторов пространства 8, ортогональных справа к векторам неко- торой системы будет линейным подпространством простран- ства 8. Это подпространство мы будем обозначать OJi-L. Совокуп- ность векторов из 8, ортогональных слева кЛХ)?, будет также не- которым линейным подпространством, которое мы условимся обозначать Назовем вектор х левым изотропным в пространстве 8, если он ортогонален слева ко всем векторам из 8. Подпространство -L8, состоящее из всех левых изотропных векторов 8, называется ле- вым изотропным подпространством в 8. Аналогично, определяют- ся правые изотропные векторы и правое изотропное подпростран- ство 8-L. Теорема 1. Размерности левого и правого изотропных под- пространств равны друг другу и совпадают с дефектом матрицы метрической формы (х, у), вычисленной в произвольном базисе. Таким образом, разность между размерностью пространства и размерностью изотропных подпространств равна рангу метриче- ской билинейной формы, билинейно-метрическое пространство тогда и только тогда невырожденное, когда оно не содержит ненулевых изотропных' векторов. Для доказательства выберем в 8 какой-нибудь базис. Тогда ле- вые изотропные векторы х должны удовлетворять при произ- вольном у из 8 соотношению (х, у) = [х] А [z/]' = 0, (10) где А — матрица Грама взятого базиса. Но из (10) следует: [х]А=О (здесь О — нулевая строка), т.. е. левые изотропные векторы образуют ядро линейного преобразования с матрицей А (п. 10.1), а размерность Ядра линейного преобразования равна дефекту мат-
284 КВАДРАТИЧНЫЕ И БИЛИНЕЙНЫЕ ФОРМЫ [Гл. VJ рицы преобразования. Аналогичным образом убеждаемся, что размерность правого изотропного подпространства равна размер- ности ядра линейного преобразования с транспонированной матри- цей А' и, следовательно, совпадает с дефектом матрицы А, что и требовалось. Всякое линейное подпространство 31 из 8 можно само по себе рассматривать как эрмитово или соответственно обыкновенное билинейно-метрическое пространство относительно того же скалярного произведения, что ив?. В общем случае из невырожденности S еще не вытекает невырожденность его под- пространств и, обратно, из невырожденности какого-либо под- пространства 31 еще не следует невырожденность всего простран- ства V. Т ео р е м а 2. • Если 81— невырожденное подпространство про- странства то для S имеют место прямые разложения е = 814-3(1 = 181-Д81. (11) Обратно, если хотя бы одно из разложений (11) верно, то под- пространство 31 невырожденное. Действительно, пересечение 81 Q 91-L есть правое изотропное подпространство в §1. Так как 81 невырожденное, то 81 Q —о; следовательно, сумма 31 -Д ?l-L прямая. Пусть теперь с — произвольный вектор из ?. Введем обозна- чения (aj, с) = Ту . (/=1, .... /и), где Ц], ..., ат — какой-либо базис §1. Вспомогательная система уравнений (aj, ai)^-]-(aj, а2) £2 Д-... Д-(ад am)£m = T/ (/=1, tn) разрешима относительно Ъ, ..., Ьт, так как ее определителем служит определитель матрицы Грама системы щ, ..., ат, отличный от нуля вследствие невырожденности 81. Вектор а = £1014-... .принадлежит 31 и, кроме того, (q,j, с — а) = 0 (/=1, ..., т), т. е. с — а£ 31-L, Поскольку для всякого с имеет место разложение с = аД-(с— а) (а£ 31, с — а£ ЭЛ), то ? есть сумма 31 и 31-L, что и требовалось. Билинейно-метрические пространства над одним и тем же по- лем коэффициентов называются изоморфными, если между их эле- ментами можно установить взаимно однозначное соответствие, при котором сумма векторов переходит в сумму, произведение числа на вектор переходит в произведение того»же числа на соответст- вующий вектор, а скалярные произведения пар соответствующих векторов равны друг другу.
5 24] БИЛИНЕЙНЫЕ ФУНКЦИИ 285 Из последнего условия, в частности, видно, что при изоморфном соответствии матрицы Грама систем соответствующих векторов совпадают. Обратно, если в двух билинейно-метрических прост- ранствах над одним и тем же полем существуют базисы с одина- ковыми матрицами, то пространства изоморфны. Для обычных и для унитарных линейных пространств ранее было показано, что с точностью до изоморфизма существует лишь по одному пространству каждой размерности п. Для билинейно- метрических пространств дело обстоит сложнее. Прежде всего докажем следующее очевидное утверждение: Теорема 3. Билинейно-метрические пространства над одним и тем же полем тогда и только тогда изоморфны, когда мат- рицы Грама произвольных базисов, выбранных в этих простран- ствах, конгруэнтны. Необходимость ясна, так как матрицы Грама всех базисов данного пространства конгруэнтны, а матрицы Грама соответст- венных базисов изоморфных пространств одинаковы. С другой стороны, если А, В — матрицы Грама базисов пространств £*, £4 и А конгруэнтна В, то на основании результатов предыдущего пункта в £* найдется базис и с матрицей В. Теорема 3 показывает, что задача классификации неизоморф- ных билинейно-метрических пространств тождественна задаче классификации билинейных форм с точностью до конгруэнтности, которая уже была рассмотрена в п. 23.3. Мы сформулируем здесь в терминах теории билинейно-метрических пространств только несколько следствий из результатов упомянутого пункта/ Вещественные невырожденные билинейно-метрические простран- ства с симметричной метрикой (х, у) = (у, х) называются псевдо- евклидовыми. Матрица Грама А произвольного базиса псевдоевклидова про- странства является вещественной симметрической. В силу тео- ремы 1 п. 21.3 матрица А конгруэнтна диагональной матрице с числами -j- 1 или — 1 на главной диагонали. Иными словами, в каждом псевдоевклидбвом пространстве размерности п сущест- вует базис,' в котором скалярное произведение векторов с коор- динатами Si, ..., in и •••> "Чп выражается формой (х, у) — 517)1 4- . .. + — 5s+11k+l — ... — in^ln- Число a = s — (n — s) называется сигнатурой пространства. Таким образом, псевдоевклиддвы пространства с точностью до изоморфизма определяются своими размерностью и сигнату- рой. При этом для любого я>0 и любого s (0^s«£n) сущест- вует псевдоевклидово пространство размерности п и-сигнатуры s — (n — s).
'28в ' КВАДРАТИЧНЫЕ Й БИЛЙНЕИНЫЕ' ФОРМЫ 1Гл. VI Невырожденные билинейно-метрические пространства с кососим* метрической метрикой (х, z/)=— (у, х) называются симплектическими. Матрица Грама какого-либо базиса симплектического простран- ства кососимметрическая и потому в силу п; 19.5 конгруэнтна Г О П клеточно-диагональной матрице с клетками вида по глав- ной диагонали. Таким образом, размерность симплектического пространства — всегда число четное и для каждого п с точностью до изоморфизма существует лишь одно симплектическое про- странство размерности 2п. В каждом симплектическом простран- стве размерности 2п существует базис, в котором скалярное про- изведение имеет вид (х, у) = ~ ^Л-1, еде $i, $.2л и т]1, ..., 7].2я — координаты векторов х, у. Комплексное невырожденное билинейно-метрическое простран- ство с симметрической метрикой называется комплексным евкли- довым. Поскольку всякая неособенная симметрическая билинейная форма приводима в поле комплексных чисел к форме с единичной матрицей, то с точностью до изоморфизма существует лишь по одному комплексному евклидову пространству каждой размерно- сти п. В каждом евклидовом пространстве размерности л сущест- вует базис, в котором скалярное произведение имеет вид (х> У) = Ml 4“ М'2 + • • • 4“ Мл- Наконец, комплексные невырожденные пространства с эрми- товой симметрической метрикой (х, у) = (у, х) называются псевдо- унитарными. Из теоремы 2 п. 21.3 следует, что в каждом псев- доунитарном пространстве размерности п существует базис, в котором скалярное произведение имеет вид (X, у) — Ml 4- • • • 4- Ms — — • • • “ Число a = s — (n — s) называется сигнатурой псевдоунитарного пространства. Вместе с размерностью а оно, очевидно, опреде- ляет псевдоунитарное пространство с точностью до изоморфизма. Что касается классификации произвольных комплексных невы- рожденных билинейно-метрических пространств, то она прово- дится.на основе теоремы 4 из п. 23.3. Для характеристики про- странства теперь необходимо выписывать набор элементарных делителей, подчиненный условием, сформулированным в конце п. 23.3. 24.3. Билинейные функции в билинейно-метрических простран- ствах. В предыдущем пункте геометризация теории одной били- нейной функции, заданной на линейном пространстве • была
§ 24] БИЛИНЕЙНЫЕ ФУНКЦИИ 287 достигнута тем, что значения билинейной функции рассматрива- лись как. скалярные произведения векторов, определяющих осо- бую метрику на 8. Подобно этому для геометризации теории пар билинейных функций, заданных на линейном пространстве одну из них принимают в качестве метрической функции, а вто- рую рассматривают как билинейную функцию, заданную на би- линейно-метрическом пространстве. Ясно, что теперь пара ср (х, у), cpi (х, у) и пара <р (х, у), <р2 (х, у) будут подобны относительно автоморфизмов линейного пространства 8 тогда и только тогда, .когда функция <pi (х, у) будет переводима в функцию <р2 (х, у) автоморфизмом билинейно-метрического пространства 8 с основной метрической функцией ср (х, у). Более того, в невырожденных билинейно-метрических простран- ствах с каждой билинейной функцией оказывается возможным связать взаимно однозначно некоторое линейное преобразование пространства. Поскольку эта связь не зависит от выбора базиса, то тем самым задача изучения билинейных функций становится равносильной изучению линейных преобразований билинейно- метрических пространств. С точки зрения теории линейных про- странств это означает, что изучение пар билинейных функций, из которых одна невырожденная, равносильно изучению пар, составленных из невырожденной билинейной функции и линей- ного преобразования. Итак, пусть 8 — эрмитово или обыкновенное билинейно-метри- ческое невырожденное пространство. Теорема 4. Всякая определенная на i линейная функция f (х) может быть представлена . одним и только одним способом в виде (х, а). Действительно, условие f (х) = (х, а) равносильно системе соот- ношений (aj, a) = f(aj) (/ = 1, .... п), (12) где щ, ..., ап — какой-нибудь базис 2. Полагая а = hat -ф-...-ф- <пап и рассматривая (12) как систему уравнений относительно h, Ъп, видим, что это — система п линейных уравнений с п неизвест- ными, определитель которой отличен от нуля, так как он является определителем матрицы основной формы в выбранном базисе. Сле- довательно, уравнения (12) однозначно разрешимы. Так же как в п. 18.2 было сделано для унитарных пространств, теоремой 4 можно воспользоваться, чтобы ввести в 8 понятие сопряженного преобразования. Рассмотрим произвольное линейное преобразование этого пространства. Для каждого заданного вектора а выражение (ха^, а) представляет собой линейную функцию от х. Согласно теоре- \ ме 4 в пространстве 8 найдется определенный вектор Ь, для
288 КВАДРАТИЧНЫЕ И БИЛИНЕЙНЫЕ ФОРМЫ . (Гл. VI которого (хе^, а) = (х, Ь) (13) при всех х. Обозначим через преобразование,' переводящее а в Ь. Тогда Ь = а^*, и равенство (13) можно переписать в форме (х®^, а) = (х, a&tf*). (14) Преобразование erf* называется правым сопряженным для Правое сопряженное преобразование вполне характеризуется свой- ством (14). Действительно, если для какого-нибудь преобразова- ния <Д? при любых а, х (хе4?, а) = (х,'ай®), то, сравнивая это равенство с (14), мы получим соотношение (х, аоА'*—агА)) = 0, которое показывает, что а=А* — aAi есть изотропный вектор про- странства S. Так как 8 -ненулевых изотропных векторов не содер- жит, то —а&А — о и Повторяя рассуждения п. 18.2, легко доказать линейность е^* и справедливость обычных формул (3^-1-^)* = ^ *4- о®*, (15) (a^)*:=<^W*, (16) (as^)*=ae^* ' (17) для обыкновенных, а также формул (15), (16) и (<W)*==W* (18) для эрмитовых билинейно-метрических пространств. Решим теперь вопрос, как связаны матрицы преобразования erf и его правого сопряженного Для этого выберем в V неко- торый базис и обозначим матрицы преобразований orf, erf* соот- ветственно через А, В. Пусть V —обыкновенное пространство. На основании формулы (6) п. 24.1 имеем (xerf, а) = [х&^] G [а]' = [х] AG [а]', (х, tza^'*) = [x]G[tze^'*y = [x]GB'[a]', где G — матрица Грама пространства ? в выбранном базисе. Отсюда AG — GB', B' — G~lAG. (19) В эрмитовых билинейно-метрических пространствах формулы (19) заменяются соотношениями AG — GB', B'^GAAG. (20) Мы видели, что в унитарных пространствах существуют орто- но'рмированные системы координат. Матрица Грама в этих систе- мах обращается в единичную, и соотношения (20) дают известный нам результат (п. 18.2): В’ —А. *
§ 24J билинейные функции 289 Пока мы определили только правое сопряженное преобразо- вание. Очевидно, тем же способом можно ввести и левое сопря- женное преобразование. Именно, пусть в 8 задано линейное пре- образование . Повторяя приведенные выше рассуждения, мы убедимся, что в 8 существует единственное преобразование ‘ё удовлетворяющее при всех х, а равенству (х, = , а). Преобразование S’ линейное. Мы условимся называть его левым сопряженным для и обозначать *&S. Если метрика в 2 симметрична или кососимметрична, то пра- вое и левое сопряженные преобразования для любого линейного пре- образования совпадают, так как (х&£*, у) = ±(у, Хо^*) = ±(уо^, х) = (х, y@/£) = (x*&S, у). Переходя к рассмотрению билинейных функций на 8, прежде всего замечаем, что значение выражения (ха^, у), где — неко- торое линейное преобразование, является билинейной или соот- ветственно эрмитовой билинейной функцией на 8. Если линейные преобразования , S3 различны, то и соответ- ственные билинейные функции (хе^, у), (xS3, у) также различны. В самом деле, противное означало бы, что (ха^, у) = (№®, у) для всех х, у из 8. Отсюда (ха^ — Х&Д z/) = 0 при всех значе- ниях у, т. е. xq.S— xS3 —левый. изотропный вектор. Так как 8 ненулевых изотропных векторов не содержит, то x&S — xS3, или оД = S3. Покажем теперь, что любая билинейная функция f(x, у), опре- деленная на 8, может быть представлена в форме (x&rf, у), где aS— линейное преобразование пространства 8. В этом предло- жении под f (х, у) следует понимать обыкновенную функцию, если 8 — обыкновенное билинейно-метрическое пространство, и эрми- тову, если 8 — эрмитово билинейно-метрическое пространство. Действительно, f(x, у) при каждом заданном значении-// является линейной функцией от х. В силу теоремы 4 это озна- чает, что для каждого у найдется однозначно определенный век- тор z такой, что соотношение f (х, у) = (х, г) будет иметь место для любых значений х. Обозначим через е® преобразование, переводящее у в г, тогда f(x, у) = (х, yS3). (21) В случае эрмитова билинейно-метрического пространства имеем f(x, а//!-|-^4),= а/(х, //i) + pf(x, t/2) = = а(х, /д-Д?) -j-Р(х, у^)=:(х, а(^)4-р(//^)). 10 А. И. Мальцев*
290 КВАДРАТИЧНЫЕ И БИЛИНЕЙНЫЕ ФОРМЫ [Гл. VI С другой стороны, в силу (21) f(x, ay! 4- fyt) = (х, (ayi -j- ^) &). Отсюда (a//i = a -ф- ? (у^)г т. е. & — линейное преобразование. То же самое имеет место и для обыкновенных билинейно-метрических пространств. Обозначив через &F левое сопряженное преобразование для а®, мы можем переписать (21) в форме /(х, у) — (х&^, у), что и требовалось. Итак, нами получена следующая Теорема 5. Если 8 — обыкновенное или эрмитово невы- рожденное билинейно-метрическое пространство, то выражение (х&£, у), где е/Е — линейное преобразование пространства V, является обыкновенной или соответственно эрмитовой билинейной функцией на 8. Обратно, для каждой обыкновенной или соответ- ственно эрмитовой билинейной функции f(x, у), заданной на %, существует такое однозначно определенное линейное преобразова- ние е/Е этого пространства, при котором f(x, у) = (х&£, у) для любых х, у из i. Теорема 5 устанавливает взаимно однозначное соответствие между билинейными функциями и линейными преобразованиями в невырожденных билинейно-метрических пространствах, позво- ляющее свести изучение билинейных функций к изучению линей- ных преобразований этих пространств. С точки зрения теории пар теорема 5 означает, что изучение пар билинейных функций, из которых хотя бы одна неособенная, может быть сведено к изу- чению смешанных пар, состоящих из неособенной билинейной функции и линейного преобразования. Посмотрим, как связаны матрицы билинейной функции f (х, у) и отвечающего ей линейного преобразования Выберем в 8 какой-нибудь базис, и пусть F, Л—матрицы функции f(x, у) и преобразования е^. Согласно формуле (6) п. 24.1 f(x, у) = [х]F[у]', (хе< y) = [xe^]G[y] = {x\ AG [у]', откуда F = AG, (22) где G — матрица Грама пространства 2 в выбранном базисе. Легко проверить, что эта формула имеет место и для случая эрмитовых билинейно-метрических пространств. Линейное преобразование билинейно-метрического простран- ства 2 называется симметрическим, если для любых х, у из 2 (xerf, у) = (х, уе^), (23)
§ 24J БИЛИНЕЙНЫЕ ФУНКЦИИ 291 Преобразование erf называется кососимметрическим, если (xerf, у) —— (х, yerf). (24) Сравнивая (23) и (24) с формулами, определяющими правое и левое сопряженные преобразования, получим вместо (23), (24) равносильные им соотношения G^==e^* = *e^> (25) <г^==—е^*==—=W. (26) Пусть 2 — пространство с симметрической метрикой, р,/ — неко- торое симметрическое линейное преобразование пространства 1*. Билинейная функция, отвечающая преобразованию erf, имеет вид f(x, y) = (xerf, у). Если 2 обыкновенное, то f(x, y) = (xerf, у) = (у, xerf) — (yerf, x)=f(y, х). Если 2 эрмитово, то соответственно имеем / (х, у) = (W, у) = (у, xarf) = (yerf, х) = / (у, х). Таким образом, в обоих случаях /(х, у) будет симметрической функцией. Те же рассуждения показывают, что из симметрич- ности f(x, у) вытекает симметричность соответствующего линей- ного преобразования erf. Аналогично кососимметричность преоб- разования erf равносильна кососимметричности соответствующей функции /(х, у). Если метрика пространства 2 кососимметрическая, то отноше- ние между симметричностью и кососимметричностью линейных преобразований и билинейных функций будет обратным: симмет- рическим преобразованиям будут отвечать кососимметрические функ- ции, а кососимметрическим — симметрические. Действительно, если erf — симметрическое преобразование обыкновенного билинейно- метрического пространства 2 с кососимметрической метрикой, то /(х, y) — (xerf,y) = — (у, xerf) — — (yerf, x)=—f(y, х). Аналогично доказываются и остальные утверждения. Мы пришли к следующей теореме:' Теорема 6. Если 2 — обыкновенное или эрмитово невыро- жденное пространство с симметрической метрикой, то симмет- рическим билинейным функциям отвечают симметрические линей- ные преобразования пространства 2, а кососимметрическим — косо- симметрические преобразования. Если метрика пространства 2. кососимметрическая, то, наоборот, кососимметрическим функциям отвечают симметрические преобразования, а симметрическим— кососимметрические преобразования, ю*
292 КВАДРАТИЧНЫЕ И БИЛИНЕЙНЫЕ ФОРМЫ [Гл. Vi Возвращаясь к теории пар, мы видим из теоремы ,6, что изучение пар симметрических или кососимметрических билинейных функций равносильно изучению симметрических и кососимметриче- ских линейных преобразований в пространствах с симметрической или кососимметрической метрикой. у Примеры и задачи 1. Матрица Грама билинейно-метрического пространства 1’ в базисе в1( а2, а,, а4 равна ~1 —з — 7 — 2“ 2 17 3 3—2 0 1 ’ -4—153. Показать, что левое изотропное подпространство £ имеет базис а, + о2— as, 5а2 + 6а3 — 7а4, а правое — базис 2«1 -j- За2 — а3, at-j-a2 — a,t. 2. Для того чтобы билинейно-метрическое пространство распадалось в прямую сумму двусторонне ортогональных подпространств, необходимо и достаточно, чтобы его матрица Грама в некотором базисе распадалась. 3. Если матрица Грама невырожденного билинейно-метрического про- странства 1* есть Q, то линейное преобразование пространства 1! с матри- цей Q’Q~l будет автоморфизмом этого пространства. 4. Показать, что для произвольного невырожденного подпространства 91 билинейно-метрического пространства £ размерности 9(4- и 4-91 равны раз- ности размерностей £ и 91. В частности, показать, что 4-(g[-l-) = (-Lgi)J- — 5[. 5. Каждое пространство с симметрической или кососимметрической метрикой есть прямая сумма изотропного и невырожденного подпространств. 6. Если в билинейно-метрическом пространстве £ правая и левая орто- гональности векторов равносильны, то £ есть либо пространство с симмет- рической метрикой, либо пространство с кососимметрической метрикой. 7. Функции ф, удовлетворяющие тождеству ЭД (ах + у) + ЭД (х — ЭД) = (1 + ЭД) (ЭД (х) + ЭД (у)), и только они являются квадратичными на линейном пространстве. 8. Пусть /—фиксированная квадратная матрица. Матрица А называется 1-ортогональной, если Al А' = I, называется I-симметрической, если Al — IA', и 1-кососимметри.ческой, если А! = — //'. Показать, что если некоторый базис билинейно-метрического пространства имеет матрицу Грама /, то в этом базисе изометрические преобразования имеют/-ортогональные матрицы, симметрические и кососимметрические преобразования имеют соответственно /-симметрические и /-кососимметрические матрицы.
Глава VII «. ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ БИЛИН ЕЙ НО-МЕТРИЧЕСКИХ ПРОСТРАНСТВ В настоящей главе будет рассмотрена классификация основных типов линейных преобразований (симметрических, кососимметри- ческих и изометрических) пространств с билинейной метрикой. Связь этой классификации с классификацией пар билинейных форм изложена в § 24 гл. VI, результаты которой при чтении настоя- щей главы будут предполагаться известными читателю. В данной главе, как и в предыдущей, предполагается, что все встречающиеся здесь пространства являются пространствами над полем (а не над произвольным телом). § 25. Основные типы линейных преобразований 25.1. Автоморфизмы. Согласно п. 24.2 линейное неособенное преобразование U билинейно-метрического пространства 2 назы- вается автоморфизмом пространства 2, если U не меняет величины скалярного произведения, т. е. если {xU, yU) — (x, у) (1) для всех х, у из 2. Автоморфизмы пространства 2 иногда назы- ваются также его изометрическими преобразованиями. Используя понятия правого и левого сопряженных преобразований, соотно- шение (1) можно представить в виде (х, y) = {xU, yU) = {x, yUU*)=={xU*U, у), откуда UU*=U*U = g. (2) Ясно, что из соотношения (2) вытекает, обратно, соотношение (1). Таким образом, для того чтобы линейное преобразование U невы- рожденного билинейно-метрического пространства было автомор- физмом, необходимо и достаточно, чтобы оба сопряженных с U преобразования совпадали с обратным для U. Выберем в 2 некоторый базис и обозначим через U матрицу преобразования U. Если пространство 2 обыкновенное, то соотно- шение (1) переходит в
294 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ ПРОСТРАНСТВА [Гл. VII где G — матрица Г рама. Отсюда * UGU' = G. (3) Если пространство 8 эрмитово, то (1) дает [х] UGU' = [х] G [#]', или UGU' = G. (4) Равенства (3) и (4) представляют собой условия, которым удо- влетворяют матрицы изометрических преобразований обыкновен- ных или соответственно эрмитовых невырожденных билинейно- метрических пространств. Два линейных преобразования e^i, билинейно-метриче- ского пространства £ называются изоморфными, если существует изоморфное отображение U пространства 8 на себя, которое пере- водит в Согласно п. 10.2 имеем о/ё\ = . (5) Преобразование U есть автоморфизм пространства 8, поэтому соот- ношение (5) показывает, что изоморфизм линейных преобразований билинейно-метрических пространств равносилен их подобию отно- сительно изометрических преобразований. В силу результатов п. 15.3 отсюда следует, что изоморфные линейные преобразования имеют одинаковые инвариантные множители. В общем случае этот признак не является достаточным для изоморфизма преобразова- ний. Однако если рассматривать симметрические, кососимметри- ческие или изометрические преобразования, то дело меняется. Теорема 1. Пусть 8— обыкновенное невырожденное про- странство над полем всех комплексных чисел с симметрической или кососимметрической метрикой. Тогда для изоморфизма сим- метрических, кососимметрических или ~изометрических преобразо- ваний пространства 8 необходимо и достаточно, чтобы инва- риантные множители этих преобразований совпадали. Необходимость была установлена выше, поэтому рассмотрим только достаточность. Пусть — заданные линейные пре- образования. По условию инвариантные множители и совпадают, следовательно, е^2 = W , (6) где — некоторое неособенное линейное преобразование про- странства 2. Переходя в обеих частях, к сопряженным преобразо- ваниям, получим *) • (7) *) Метрика в £ симметрическая или кососимметрическая, поэтому пра- вые и левые сопряженные преобразования совпадают.
§ 25] ОСНОВНЫЕ ТИПЫ ЛИНЕЙНЫХ преобразовании 295 Если e^i, е^2 симметрические или кососимметрические, то = = ±e^i, — и (7) переходит в (8) Если же e^i, изометрические, то ®/?=ел/г1, ==&’'№. Подставляя эти значения в (7) и возводя результат в степень — 1, мы снова получим (8). В силу (6) и (8) имеем = — откуда •sF'e^'* = -a/i. (9) Из (9) непосредственно вытекает, что (£=1,2,,..) и вообще f *) = f где /(X)— произвольный многочлен (ср. п. 23.2). Согласно теореме об извлечении квадратного корня (п. 16.3) многочлен f (X) можнб подобрать так, чтобы f (of f Вводя обозначения =zf 2^*), U = , мы получим = [/ (зГеГ'-)]- = f = >, у * ,-jy~ * -1 UU* — (^'еГ'*)2 == g. Таким образом, U является изометрическим преобразованием. В то же время из e/i^=J^Wi следует: \1l оД= = = s^"_1a^\e7~ = а^ч,-, что и требовалось. Теорема 1 показывает, что в комплексных евклидовых, а также комплексных симплектических пространствах для классификации с точностью до изоморфизма симметрических, кососимметрических и изометрических преобразований достаточно указать, какие эле- ментарные делители могут содержать эти преобразования. Теорема 2. Если изометрическое преобразование 11 обыкно- венного невырожденного билинейно-метрического пространства 2 содержит k раз элементарный делитель СХ — а)т, то И Содержит k раз и элементарный делитель (X — а-1)т. При а = ±Г утверждение теоремы бессодержательно. Поэтому мы предположим, что а ф ± 1. Выберем в € некоторый базис и
296 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ ПРОСТРАНСТВА [Гл. VII обозначим матрицу преобразования U через U. Согласно (3) UGU'—G, где G —матрица Грама. Отсюда U' — G'U~'G. (10) Элементарные делители матрицы 1Г совпадают с элементарными делителями матрицы U. Формула (10) показывает, что в свою очередь элементарные делители матрицы 1Г совпадают с элемен- тарными делителями матрицы U1 (ср. п. 15.3). Таким образом, элементарные делители матрицы U должны быть теми же самыми, что и у матрицы LT1. Однако согласно теореме об элементарных делителях функций (п. 16.4) элементарные делители матрицы UA получаются из элементарных делителей (X — а)"2 матрицы U заме- ной а на а-1. Следовательно, если в каждом элементарном дели- теле матрицы U вида (X — а)т заменить а на а”1, то получится снова элементарный делитель матрицы U, что нам и требовалось. Для эрмитовых билинейно-метрических пространств соотноше- ние (10) переходит в U’ = G~4JG. Соответственно этому и утверждение об элементарных делителях изменяется: если (р — а)т есть k-кратный элементарный делитель изометрического преобразования эрмитова билинейно-метрического невырожденного пространства, то (X — а-1)"1 будет также k-крат- ным элементарным делителем этого преобразования. Доказательство то же самое. Теорема 3. Пусть а, b — два корневых вектора некоторого изометрического преобразования U обыкновенного билинейно-метри- ческого пространства V. Если собственные значения а, р, к кото- рым принадлежат эти векторы, не взаимно обратны, т. е. если ар Ф1, то а и b ортогональны. Аналогично, если i эрмитово билинейно-метрическое и ар -ф. 1, то а, b также ортогональны. Доказательство одинаково как для обыкновенных, так и для эрмитовых пространств. Поэтому мы рассмотрим только обыкновен- ные пространства. Согласно условию a(v% — U)s = o, b(^-U)‘=o (=ф#:1), (11) где s, t — некоторые целые неотрицательные числа. Нам нужно показать, что из соотношений (11) вытекает равенство (а, 0=0. Доказательство проведем индукцией по значениям суммы s-^/. Если s -ф-1 = 0, то s — t — Q и соотношения (11) дают а = Ь — о, откуда (а, Ь) = 0. Предположим теперь, что нам задано некоторое значение суммы s~H и что для всех меньших значений этой суммы утверждение уже доказано. Введем обозначения a (ag — U) = ab b (pg — U) = bi.
5 25] ОСНОВНЫЕ ТИПЫ ЛИНЕЙНЫХ ПРЕОБРАЗОВАНИЙ 297 Так как Й1 (а§ — l = a (ag — liy = О, ггу-'== ь — иу = о, то по индукции (a, b1) = (ai, b) = (at, Z?i) = 0. Но равенство (а, ЬУ — 0 дает (a, 6(j3g — Z<)) = 0, или (а, ЬИ') = ^{а, Ь). (12) Аналогично из равенства (аь 6) = 0 следует: (а#, Ь) — а(а, Ь). (13) Наконец, равенство (ai, ЬУ — 0 дает 0 = (a(ag —#), b(pg —#)) = = ap(a, Ь) —т а (а, ЬЩ — р (aU, Ь)-\-(а21, ЫЕ), откуда ввиду (12) и (13) получаем 0 = — «Р (а, 6) + (а, Ь). (14) Так как ар ф 1, то (14) дает искомое соотношение (а, Ь) = 0. Теорема 4. Если — изометрическое, симметрическое или кососимметрическое преобразование пространства £ и подпростран- ство 21 инвариантно относительно е^, то правое и левое подпро- странства, ортогональные к 21, также инвариантны относи- тельно . Пусть — изометрическое преобразование пространства 8. Правое ортогональное подпространство 21-1- составлено из векто- ров Ь, которые при любом а из 21 удовлетворяют соотношению (a, b) = Q. Поскольку аЛ— неособенное преобразование, 21 инва- риантно и относительно Следовательно, вектор ао^~х входит в Л, откуда 6) = 0. Но (а&£~1, Ь) = , ЬеР?) — (а, Ь&^У, таким образом, (а, Ь^) = 0 для всех а из Л. Следовательно, Ь&^ входит в 21- и 21-L инвариантно относительно erf. Так же просто доказываются и остальные утверждения. Теорема 5. Пусть обыкновенное или эрмитово билинейно- метрическое пространство £' распадается в прямую сумму своих двусторонне ортогональных, подпространств it, ..., У,. Если все эти подпространства инвариантны относительно некоторого линейного преобразования arf пространства 8 и если erf изомет- рично или соответственно симметрично или кососимметрично на каждом из подпространств Vi, ..., V4, то erf будет таким же и на 8.
298 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ ПРОСТРАНСТВА [Гл. VII . Эта теорема показывает, каким образом можно воспользоваться прямыми разложениями при изучении свойств указанных типов линейных преобразований. Доказательство ее очевидно и предо- ставляется читателю. 25.2. Симметрические и кососимметрические преобразования. Напомним, что преобразование обыкновенного или эрмитова билинейно-метрического пространства называется симметрическим, если (хг^, у) = (х, уг^~) для всех х, у из ?. Теорема 6. Корневые векторы а, Ь, принадлежащие различ- ным собственным значениям р, а симметрического преобразования обыкновенного или эрмитова би линейно-метрического пространства, ортогональны. Действительно, согласно предположению и (pg — q^)s = o, — — о, (15) где s, t — некоторые целые неотрицательные числа. Нам нужно показать, что из (15) вытекает ортогональность векторов а и Ь. Доказательство поведем индукцией по значениям суммы s-\-t. При s Д—^ == 1 либо s, либо t равно нулю и, следовательно, либо а = о, либо Ь = о, откуда (а, Ь) — 0. Предположим теперь, что нам задано какое-нибудь значение суммы s Д-1 и что при всех меньших значениях этой суммы наше утверждение уже доказано. Пусть a1=a(pg — ет/), bi = b (ag — е?/).' Мы имеем ai (pg — e^/)s-I = n(pg —e^)s = o, bl (ag — er/)Z-1 = &(ag — a-g'p—o. Поэтому в силу индуктивного предположения (a, bi) = (a.i, &) —О или a (a, b) = (a, borf), p(a, b) = (as^, b). Так как ет/ симметрично, то правые части этих равенств совпа- дают и, следовательно, (а — р)(а, 6)==0, откуда (а, &) = 0, что и требовалось. Преобразование ет/ обычного билинейно-метрического простран- ства, удовлетворяющее соотношению (хе?/, у) = — (х, z/ет/) для всех х, у из ?, называется согласно п. 24.3 кососимметри- ческим.
§ 251 ОСНОВНЫЕ ТИПЫ ЛИНЕЙНЫХ ПРЕОБРАЗОВАНИЙ 299 Теорема 7. Пусть а, b — корневые векторы какого-нибудь кососимметрического преобразования обыкновенного билинейно-мет- рического пространства, принадлежащие собственным значениям р, а. Если р -4- а 0, то (а, Ь) = 0. Доказательство почти дословно совпадает с доказательствами аналогичных теорем 3, 6 и может быть здесь опущено. Изометрические преобразования произвольного невырожденного билинейно-метрического пространства 8 весьма тесно связаны с его кососимметрическими преобразованиями. Именно имеет место сле- дующая теорема, совершенно совпадающая по своей формулировке с теоремой п. 20.3 о преобразовании Кэли. Теорема 8. Пусть 8 — обыкновенное или эрмитово билинейно- метрическое пространство. Если — кососимметрическое преоб- разование пространства 8, не имеющее собственных значений, равных — 1, то = (16) будет изометрическим преобразованием пространства 8, также не имеющим собственных значений, равных — 1, причем будет выражаться через И по формуле е^ = (®-й')(© + й')-1. (17) Обратно, если И—изометрическое преобразование простран-, ства 8, не имеющее собственных значений, равных—1, то пре- образование вычисленное по формуле (17), будет кососимметри- ческим, не имеющим собственных значений, равных — 1, и 11 будет выражаться через по формуле (16). Формулы (16) и (17), как и в случае унитарных пространств, носят название преобразований Кэли. Их доказательство дословно совпадает с доказательством этих же формул, проведенным в п. 20.3 для унитарных пространств. Поэтому его здесь опустим. Заметим, что аналогичные формулы й' = -(§_е^)(§4-е^)~‘, (18) + (19) дают соответствие между кососимметрическими преобразованиями пространства 8, не имеющими собственных значений, равных — 1, и изометрическими преобразованиями пространства 8, не имею- щими собственных значений, равных 4~1. Преобразования Кэли сводили бы полностью изучение изометри- ческих преобразований к изучению кососимметрических, если бы не было исключительных собственных значений ± 1. Существова- ние этих значений делает необходимым несколько более подроб- ное независимое изучение свойств изометрических преобразований.
300 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ ПРОСТРАНСТВА [Гл. VII Наконец, докажем еще, что имеет место Теорема 9. Если (>. — а)т входит k раз в систему элемен- тарных делителей кососимметрического преобразования какого- нибудь обыкновенного невырожденного билинейно-метрического пространства 2, то (X-J-a)m также входит k раз в систему элементарных делителей преобразования e/Z. Действительно, матрица В сопряженного преобразования оЛ?* удовлетворяет соотношению (19) п-. 24.3: В' = G-'AG, где G—матрица Грама, А — матрица преобразования erf. Отсюда видно, что элементарные делители матрицы В совпадают с элемен- тарными делителями матрицы А. Однако из условия кососимме- тричности следует, что В — — А; таким образом, меняя знаки у а в каждом элементарном делителе (X — а)т преобразования е^, мы снова получим элементарные делители преобразования охё, что и требовалось. Примеры и задачи 1. Пусть U—какое-нибудь отображение невырожденного билинейно- метрического пространства V на себя, сохраняющее скалярное произведение: (all, bU) = (a, Ь). Показать, что U—линейное и, следовательно, изометри- ческое преобразование пространства 1'. 2. Определители изометрических преобразований обыкновенных невы- рожденных билинейно-метрических пространств равны ± 1, а определители изометрических преобразований невырожденных эрмитовых билинейно- метрических пространств равны единице по модулю. 3. В каждом невырожденном билинейно-метрическом пространстве S существует линейное преобразование удовлетворяющее условию (х, у) — = (yS^, х), если V обыкновенное, и условию (х, у) — х), если ё эрмитово. Показать, что преобразование <§? изометрическое и что его мат- рица равна G'G-1 или G'G-1 в зависимости от того, будет ли ё обыкно- венным или эрмитовым (G—матрица Грама пространства i!)- 4. Если в обыкновенном невырожденном билинейно-метрическом про- странстве 1’ правое и левое сопряженные преобразования для любого линейного преобразования совпадают, то метрика пространства ё либо сим- метрична, либо кососимметрична. § 26. Комплексные евклидовы пространства В настоящем и двух следующих параграфах мы разберем более детально простейшие формы, к которым могут быть приведены ма- трицы симметрических, кососимметрических и изометрических пре- образований в евклидовых, симплектических и псевдоунитарных пространствах над полем комплексных чисел, исчерпывающая клас- сификация которых дана в конце п. 24.2. Отметим, что речь здесь будет идти о том, чтобы найти простейшие формы матриц преоб-
5 26] хКОМПЛЕКСНЫЕ ЕВКЛИДОВЫ ПРОСТРАНСТВА 301 разований в некоторых специальных системах координат со вполне определенной матрицей Грама, так как только при таком условии преобразования будут известны с точностью до изоморфизма. Эта задача была решена в гл. V для унитарных и вещественных евклидовых пространств. В качестве специальной системы коор- динат там была выбрана ортонормированная система координат, в которой матрица Грама является единичной. В пространствах более сложных типов в качестве основных или нормальных систем координат удобнее брать системы координат с более сложной матрицей Грама. Мы начнем с изучения комплексного евклидова пространства. 26.1. Симметрические преобразования. Как уже было сказано, комплексным евклидовым пространством называется невырожден- ное пространство с обыкновенной симметрической метрикой над полем комплексных чисел. Матрица Грама комплексного евкли- дова пространства является неособенной и симметрической. Обратно, каждое комплексное билинейно-метрическое пространство с неособенной симметрической матрицей Г рама является комплекс- ным евклидовым пространством. Но все комплексные евклидовы пространства данной размерности п изоморфны, поэтому в каж- дом таком пространстве существует система координат с любой наперед заданной неособенной симметрической матрицей Грама. В частности, в каждом комплексном евклидовом пространстве 2 существует система координат alt а->, ..., ап, в которой матрица Грама имеет вид “0 ... 0 1~ 1 ... 0 0_ Мы условимся систему координат нормальной. Векторы нормальной творяют соотношениям с такой матрицей называть системы координат удовле- (йу, — 1, (ajt ak)— 0 (2) (/' —I- k п —1; J, k = 1, ..., и), которые и достаточны для нормальности. Полезность нормальных базисов определяется следующим их свойством: линейное преобразование, имеющее в нормальном базисе своей матрицей клетку Жордана, является симметрическим. Действительно, согласно п. 24.3 преобразование еЖ симмет-. рично; если симметрична матрица AG, где G — матрица Грама координатного базиса, з А — матрица преобразования еЖ в этом базисе. Но, умножая клетку Жордана порядка п на матрицу G*
302 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ ПРОСТРАНСТВА [Гл. VII путем непосредственных вычислений убедимся, что в результате получится симметрическая матрица. Это- замечание позволяет сразу же доказать следующую основ- ную теорему: Теорема 1. Пусть задана произвольная система выражений вида (X— pi)7”1, (X— P.s)™5- Тогда в комплексном евклидовом пространстве размерности п —mi rfms заведомо найдется симметрическое преобразование erf, для которого указанные выра- жения будут полной системой элементарных делителей. В самом деле, положим "0 ... 0 1“ -р71 0 ... - 0 ... 1 0 - р/ 1 ... (3) 1 ... 0 0 р/ 1 где порядки матриц GJt Aj равны = s). Пусть G = Gi .-4-Gs, A = Ai As. (4) В комплексном евклидовом пространстве 2 размерности п найдется базис с матрицей Грама G. Обозначим через erf линейное пре- образование с матрицей А в указанном базисе. Согласно приве- денному выше замечанию матрица AG симметрическая, а вместе с нею симметрично и преобразование orf. В то же время из (3), (4) видно, что erf имеет требуемый набор элементарных делителей. Ввиду теоремы 1 п. 25.1 доказанная теорема полностью решает вопрос о классификации с точностью до изоморфизма всех симметрических преобразований комплексного евклидова прост- ранства. В частности, из нее вытекает следующая Теорема 2. Пусть erf— симметрическое преобразование комплексного евклидова пространства 2. Тогда 2 можно разложить в прямую сумму взаимно ортогональных подпространств, инва- риантных относительно erf и таких, что в каждом из них най- дется нормальный базис, в котором матрица преобразования, индуцированного преобразованием erf, будет клеткой Жордана. Для доказательства обозначим через (К — Pi)"*1...(X — ps)ms набор элементарных делителей преобразования erf. Выберем в 2 базис ai....ап, матрица Грама которого равна матрице G из (4), и пусть ё® — линейное преобразование с матрицей А из (4) в базисе ai, ..., ап. Преобразования erf, <^3. симметричны и подобны. В силу упомянутой теоремы 1 п. 25.1 отсюда следует, что найдется изометрическое преобразование и, для которого orf = Тогда матрица преобразования erf в базисе aiU, ... anll будет совпадать с матрицей преобразования & в базисе
§ 26] КОМПЛЕКСНЫЕ ЕВКЛИДОВЫ ПРОСТРАНСТВА 803 аь ап, т. е. с матрицей А. В то же время матрица Грама базиса ахи, апи есть G, а для преобразования е® утвержде- ния теоремы 2 очевидны. В ортонормированном базисе матрица симметрического преоб- разования симметрична. Поэтому из теоремы 1 следует, что суще- ствуют комплексные симметрические матрицы с любым набором ' элементарных делителей. 26.2. Кососимметрические преобразования. Пусть — косо- симметрическое преобразование комплексного евклидова простран- ства 2. Разложим 2 в прямую сумму корневых подпространств 2 = + + - + Объединяя здесь слагаемые, относящиеся к парам противополож- ных собственных значений, мы получим новое разложение для 2: 2=ж+а)?14-...-Их/, где ЭЛ0— корневое подпространство, отвечающее корню нуль, а ЭЛД/ = 1...... /)— сумма вида 2р4-2_р. Теорема 7 п. 25.2 показывает, что подпространства ЭЛ0, ..., 9)lt взаимно ортого- нальны, сверх того, они инвариантны относительно &#. Поэтому изучение поведения на 2 сводится к изучению поведения этого преобразования в отдельных пространствах ЭЛо, ЭЛь..., ЭЛ^. Рассмотрим более детально ЭЛ0. Допустим, что ЭЛо отлично от нуля, и обозначим через ©т/0 преобразование, индуцируемое пре- образованием оЛ в ЭЛо. Так как все собственные значения пре- образования е^о равны нулю, то где р — размерность ЭЛо. Обозначим через т наименьший показатель степени преоб- разования е^о, обращающейся в нуль: Рассмотрим два случая: т четное и т нечетное. Пусть т четное, тогда т—1 нечетное и преобразование ©т/™-1 кососимметри- ческое. Билинейная функция у) также кососимметри- ческая. Поскольку эта функция отлична от нуля, в ЭЛ0 найдется пара векторов а, Ь, для которых 1, Ь) = 1. Из кососимметричности преобразования е^0 вытекает (tWJ, ZWJ) = — (аэт/*-1, 6©^'OZ+I) = ... = (—l)fe (a, £WZ+*). В частности, (а, Ь&#™~1) = (—1)т-1 (а©^^-1, Ь) =—1, так что bort!J1-1 Ф о. Положим d\ — d, 0-2 — о, dm — dm—l^^O, bi = Ь, b% = biQT^o, . •, bm bm-l<3^fl.
304- ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ ПРОСТРАНСТВА i [Гл. VII Соотношения (ак, «т+1-*)==(—aie^r1) = 0, (Ьк, bm+i_k) = 0, (ак, bm+l_k) = (~l)m-k, (ак, bj) = O (k -f- j tn -f- 1; k, j — 1.tri) . показывают, что матрица Грама этого базиса имеет вид . 0 * ... — 1 0 ... 0 1 ... 0 ♦ ... ~ 1 * ... 0 _1 ... о о... 0_ где в каждой из четырех клеток все члены, расположенные под побочной диагональю, равны нулю. Определитель такой матрицы равен ±1, и, следовательно, подпространство натянутое на аь ..., ат, blt ..., bm, является невырожденным. Ввиду теоремы 2 п. 24.2 Ж = % 4-914- > причем ЭЦ — снова инвариантное относительно е^0 подпростран- ство. Рассмотрим случай, когда т нечетное. Преобразование теперь симметрическое, следовательно, симметрична и отвечающая ему билинейная функция у). Поскольку эта функция не равна тождественно нулю, найдется вектор а, для которого (W”’1, а) 0. Положим - 4Z, tZg 4Z1Э/£о, • • • , ^771 Q. Подпространство %, натянутое на «1, ..., ат, инвариантно отно- сительно &/0. Его матрица Грама в системе координат аъ ... ..., ат имеет вид г(аь ai) ... (oi, am_i) (ait ату (аг, ai) ... (а.2, amJ) О Действительно, (aj, ак) = (ав^/-1, а^кл) = (- l)ft l (W/+M, а) = 0 для / Д- k > tn 1. П'ри этом (fll> ат) =® • • •== (flmt ^1) == ® -7~ 0.
в 261 КОМПЛЕКСНЫЕ ЕВКЛИДОВЫ ПРОСТРАНСТВА 305 Отсюда видно, что матрица G неособенная; значит, подпростран- ство 911 невырожденное, и мы снова имеем Ж = % 4- 9Ц-, где 91-L инвариантно относительно ет/0. Итак, в первом случае мы отщепили от-9Л0 подпространство 9?ь представляющее собой сумму двух подпространств четной раз- мерности, а во втором — одно подпространство нечетной размер- ности. Применяя тот же прием к дополнительному подпростран- ству 91J-, мы расщепим его еще раз в прямую сумму инвариантных подпространств и т. д. В результате пространство 9910 окажется разложенным в прямую сумму инвариантных подпространств, каждое из которых будет либо прямой суммой двух подпрост- ранств четной размерности, либо пространством нечетной раз- мерности. В этом разложении каждому подпространству отвечает элементарный делитель преобразования е/0, имеющий вид Хр, где р — размерность подпространства. Следовательно, кососимметри- ческое преобразование комплексного евклидова пространства содер- жит каждый элементарный делитель вида X2S четное число раз. Этот результат, а также теорема 7 п. 25.2 накладывают на си- стему элементарных делителей кососимметрического преобразо- вания известные условия. Покажем, что эти условия являются достаточными для существования кососимметрического преобра- зования. Теорема 3. Кососимметрические преобразования комплексных евклидовых пространств содержат элементарные делители, отве- чающие ненулевым собственным значениям, парами (к — а)т, (X а)т, элементарные делители вида Хр при р четном — также парами Хр, Хр, а элементарные делители вида V при р нечетном — в про- извольных комбинациях. Обратно, каждый набор конечного числа выражений (к — подчиненный этим условиям, есть систему элементарных делителей некоторого кососимметрического преобра- зования комплексного евклидова пространства подходящей размер- ности. Первая часть этого предложения была уже доказана. Поэтому для полного доказательства теоремы нам надо для произвольной системы выражений, подчиненной условиям теоремы, построить соответствующее кососимметрическое преобразование. По анало- гии с предыдущим пунктом это можно сделать следующим обра- зом. Каждой паре выражений (X—а;)т«, (Х-]-аг)т1, в том числе и парам с аг = 0, ставим в соответствие матрицы ГО Dt Bi О ° _г Л/=[р — BZJ’
306 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ ПРОСТРАНСТВА [Гл. VII где Dt — нормальная симметрическая матрица вида (1) из п. 26.1, a Bt—клетка Жордана порядка /и;, имеющая собственное значе- ние аг. Если среди заданных выражений найдутся выражения X24',"1, не имеющие себе парных, то ставим им в соответствие матрицы Gi = порядков 2s, ’0 ... 0 Г 0 ... 1 0 1 ... 0 0_ — 1. Пусть ГО 1 0 0... 0 — 1 0... ’ 0 1 ... А = 0-1 0 G = Л = А+ ... + Л. (5) Обозначим через 2 комплексное пространство с матрицей Грама G. Так как G — симметрическая неособенная матрица, то 2 — — комплексное евклидово пространство. Рассмотрим линейное преобразование еЖ пространства 2, имеющее своей матрицей А. Билинейная функция, отвечающая преобразованию , имеет матрицу AG, причем AG — AiGi-]- ... ASGS. Непосредственные вычисления показывают, что клетки ЛгС,-, а вместе с ними и матрица AG кососимметричны. Поэтому били- нейная функция и преобразование также кососимметричны. Из формы матрицы А видно, что элементарные делители преоб- разования <г^ имеют требуемые значения. Согласно теореме 1 п. 25.1 все кососимметрические преобразо- вания комплексного евклидова пространства, имеющие одинако- вые системы элементарных делителей, изоморфны. Поэтому из теоремы 3 следует, что для каждого кососимметрического преобра- зования вЛ в комплексном евклидовом пространстве 2 существует система координат, в которой матрица Грама G и матрица преоб- разования А имеют вид (5). 26.3. Комплексные ортогональные преобразования. Изометри- ческие преобразования комплексного евклидова пространства 2 называются обычно комплексными ортогональными преобразовани- ями. Если в 2 выбрана система координат с матрицей Грама G, то матрицы U ортогональных преобразований и только они удов- летворяют соотношению UGU' = Q. (6) В частности, если система координат ортонормированная, то G = E и (6) переходит в UU' = E.
§ 26] КОМПЛЕКСНЫЕ ЕВКЛИДОВЫ ПРОСТРАНСТВА 307 Иными словами, в ортонормированной системе координат мат- рицы ортогональных преобразований являются ортогональными. Согласно теореме 1 п. 25.1 ортогональные преобразования с одинаковыми элементарными делителями изоморфны. Поэтому для классификации ортогональных преобразований достаточно указать, какие системы выражений вида (X — а;)тг могут служить системами элементарных делителей ортогональных преобразований. Схема решения этой задачи следующая: элементарные делители кососимметрических преобразований нам известны, ортогональ- ные преобразования можно выразить через кососимметрические по формулам Кэли (п. 25.2), следовательно, с помощью теоремы об элементарных делителях функций от матриц (п. 16.4) можно найти и элементарные делители ортогональных преобразований. Однако при проведении этой схемы нужно учитывать наличие исключительных значений в формулах Кэли, благодаря чему решение принимает следующую, несколько более громоздкую форму. Пусть Н — ортогональное преобразование комплексного евкли- дова пространства £. Представляя g в виде прямой суммы кор- невых подпространств преобразования Н и объединяя подпрост- ранства, относящиеся к взаимно обратным собственным значениям, мы получим разложение 8 = 23Ь -f- 231t -j- 2012 + ... 4- 23?ь где все 2)1/ взаимно ортогональны, причем 23l_i, 33?i— корневые подпространства преобразования отвечающие собственным зна- чениям — 1, 4" 1- В каждом из подпространств 23?у- преобразова- ние # индуцирует некоторое ортогональное преобразование zZy, и элементарные делители преобразования Н распадаются на си- стемы элементарных делителей этих индуцированных преобразо- ваний. Рассмотрим преобразование 2<i. Все его собственные зна- чения равны 4*1- Формула Кэли переводит Hi в кососимметрическое преобразование e^i. Эту фор- мулу мы представим в виде е/4 = f (Hi), где f (X) = (1 —X) (1 -| X)_J. Так как производная от /(X) при Х = 1 в нуль не обращается, то (п. 16.4), подставляя в каждый элементарный делитель (X—а)т преобразования Hi вместо а число (1 —а) (1 -|-а) \ получим эле- ментарные делители преобразования &#i. Но элементарные дели- тели преобразования Hi имеют вид (X — 1 )*, следовательно, эле- ментарные делители преобразования e^i будут вида Xs. Кососим- метрические преобразования содержат каждый элементарный де- литель Х'5 при четном s четное число раз, поэтому преобразование Hi
308 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ ПРОСТРАНСТВА (Гл. VII содержит каждый элементарный делитель (А — 1/ при $ четном также четное число раз. Применяя формулу Кэли = + —^Г1 к преобразованию И мы аналогичным образом получим, что преобразование U содержит каждый элементарный делитель вида (ХЦ-!)8 при четном s снова четное число раз. Теорема 4. Элементарные делители комплексных ортого- нальных преобразований, отвечающие собственным значениям, отличным от ± 1, входят парами вида (X — a)m, (X — а1)"1, эле- ментарные делители вида (Х± 1)'2S входят четное число раз, а элементарные делители вида (X±1)2S+1 входят, в произвольных ком- бинациях. Обратно, любая система выражений вида (X — а,-)т« (я; # 0), удовлетворяющая этим требованиям, есть система элементарных делителей некоторого комплексного ортогонального преобразования. Первая часть теоремы уже доказана. Предположим поэтому, что нам задана некоторая система элементарных делителей, вида (X — я;)т‘ (я,- ф 0), удовлетворяющая условиям теоремы. Из этой системы элементарные делители вида (Х-|~ 1)р мы выделяем, а для каждого из оставшихся элементарных делителей (X — я,)т« строим выражение (X — р,)т<, где 0,- ==- (1 — а,) (1 а,)”1. Система выраже- ний (X — р,)т‘ будет удовлетворять требованиям теоремы 3 и, следо- вательно, будет системой элементарных делителей некоторого косо- симметрического преобразования е^0 комплексного евклидова про- странства Vo. Так как мы брали только значения я;, отличные от— 1, то все р; будут также отличны от—1. Применяя к преобразование Кэли, мы получим ортогональное преобразование #0 с элементарными делителями (X •—а£)т; (а; 7= —1). Аналогич- ным образом для каждого элементарного делителя вида (Х-|-1)'"’ берем выражение Х"2* и ищем кососимметрическое преобразова- ние оЛ\ некоторого пространства £1( имеющее своими элементар- ными делителями Хт'. Тогда преобразование = — (§ — j) j) 1 будет ортогональным преобразованием пространства имеющим элементарные делители (X—pi )mi. Выберемв Vo, рортонормированные системы координат и обозначим через-I70, t/i матрицы преобра- зований zZ0, Ux. Эти матрицы будут ортогональными, поэтому и прямая сумма их Z70 —|-* Ut — U будет также ортогональной, мат- рицей. Согласно построению элементарные делители матрицы U имеют требуемые значения, и теорема доказана/
§ 27] СИМПЛЕКТИЧЕСКИЕ ПРОСТРАНСТВА 309 Примеры и задачи 1. Построить ортогональную матрицу с элементарными делителями (X— I)2, (Х-l)2, Х-1-, X —2. 2. Показать, что матрицы вида ^А-\-В, где А — симметрическая неособен- ная матрица, а В—кососимметрическая, содержат каждый элементарный дели- тель вида Х2т четное число раз. 3. С помощью теоремы 2 привести к простейшему виду следующую пару квадратичных форм: + 251 + 25,5, + 2$Л - 2«3 - 2=35„ 5| + + 25з + 25^ - 45.s3 + 2=Л4 - 25354. Ответ: 2 (5^ + 53£4), 5* + 25,5, + 5|. 4. Построить комплексную кососимметрическую матрицу с элементарными делителями (X —З)2, (X-f- 3)2, X2, X2, X3. 5. Построить комплексную симметрическую матрицу с элементарными дели- телями (X — 2)3, X2, X3. § 27. Симплектические пространства 27.1. Симметрические преобразования. Согласно п. 24.2 сим- плектическими пространствами называются билинейно-метричес- кие пространства с невырожденной кососимметрической метрикой. Размерность симплектического пространства — число четное. Так как все симплектические пространства данной размерности изоморф- ны друг другу, то в каждом симплектическом пространстве раз- мерности п — 2т существует базис, матрица Грама которого равна любой наперед заданной неособенной кососимметрической матрице порядка п. В частности, в каждом симплектическом пространстве существуют системы координат, в которых матри- ца Грама имеет вид Эти системы мы будем называть в V будут существовать системы Грама имеет вид симплектическими. координат, в которых матрица О Е~ — Е О ' Аналогично где Е — единичная матрица, а О — нулевая матрица. Такие сис- темы условимся, называть нормальными. Далее мы будем рассмат- ривать только комплексные симплектические пространства.
310 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ ПРОСТРАНСТВА [Гл. VII Пусть теперь — некоторое симметрическое преобразование £. Разложим 2 в прямую сумму - -К, где pi, ра, ..., ps — различные собственные значения преобразова- ния , а ?р , 2Ps — соответствующие корневые подпростран- ства. Согласно п. 25.2 подпространства 2Р. взаимно ортогональны. Ввиду невырожденности пространства 2 подпространства 8р ,, ?р также невырожденные и, следовательно, симплектические. Возьмем какое-нибудь одно из них, и обозначим через ЭЛ. Преобразо- вание, индуцируемое в ЭЛ преобразованием е^, пусть будет 0. Положим, далее, — p(-g = <Ж Так как е^0 ng — симметрические преобразования, то — также симметрическое преобразование. Все собственные значения преобразования е^0 равны р;; поэтому, обозначая через р размерность ЭЛ, мы получим (^о-Р^)Р = ^ = ^ Пусть т — наинизший показатель, для которого <93т = 0. Выра- жение (№^эт-1, у) является кососимметрической билинейной функ- цией отх, у, отвечающей преобразованию а®"1'1. Так как а®"1'1 0, то функция (ха5Эт*1, у) не может обращаться тождественно в нуль и, следовательно, в ЭЛ существует пара векторов а, Ъ, для которых (tze®"1'1, Ь) = 1. Введем обозначения aa®/ = zz7+i, be& = Ь/+1 (/== 0, 1....т — 1). Вследствие симметричности а® мы имеем (О/, ah) = (a93i-\ a^k-1) = (a93>'+’1^, а) = (а, a^'+k^). Однако пространство 8 кососимметрическое, поэтому (ае®/+*Л а) = — (а; а Сравнивая это с предыдущим, мы видим, что (a7, ak) — 0 (/, k = 1, 2, ..., т)’. (2) Аналогично получаются и соотношения (bj, bk)=Q (j, k = \, 2, .... m). (3) Далее, из условий (a 03т\ b) 1, = 0 следует: (Om-s, &e+i)=(a^m-e-1, b^} = (a^m-\ b)=(am, ^)=1, (4) (aj, bk) = (a b = (a b) = 0 (/ -f- k > m Ц- 1). (5) Составляя теперь матрицу Грама для векторов alt..., ат, bt, bm, мы в силу соотношений (2) — (5) увидим, что она примет треуголь-
§ 27] ' СИМПЛЕКТИЧЕСКИЕ ПРОСТРАНСТВА 311 ный вид — с нулями под второй диагональю. Так как элементы, лежащие на самой второй диагонали, будут равны ±1, то опре- делитель этой матрицы отличен от нуля. Следовательно, подпро- странство ЭЛ1, натянутое на векторы ait ..., ат, Ьъ ..., Ьт, является невырожденным. Обозначим еще через ЭЛц и ЭЛн подпро- странства, натянутые соответственно на векторы ait ..., ат и bi, ..., Ьт. Ввиду соотношений (5) подпространства Э)1ц, ЭЛ)2 одной и той же размерности и ЭЛ1 есть их прямая сумма. Так как ЗЛ1 невырожденное, то на основании п. 24.2 имеем х = да?! элт. Подпространство ЭЛ1 инвариантно относительно поэтому ЭЛ-1 также инвариантно относительно о®. Поступая теперь с ЭЛТ таким же образом, как с ЭЛ, мы выделим из ЭЛТ подпространство ЭЛ2, являющееся прямой суммой двух подпространств.ЭЛи, ЭЛ.2.2, и т. д. Через конечное число шагов мы получим-прямое разложение зл=эЛ1 + эл2+...4-ал!, где каждое из подпространств ЭЛ!, ..., ЭЛ2 будет в свою очередь прямой суммой двух подпространств одной и той же размерности. Каждому подпространству размерности т, содержащемуся в этом разложении, отвечает элементарный делитель (X — р(-)т преобразо- вания е^. Таким образом, мы приходим к выводу, что в симплек- тическом пространстве элементарные делители симметрических пре- образований встречаются обязательно парами (X — рг)т, (X—р;)т. Покажем, что и, обратно, для каждой системы выражений (X — р,-)ть (X — рг)тг существует симметрическое преобразование симплектического пространства 2, имеющее эти выражения своими элементарными делителями. Каждой паре (X — р;)ть (X — p;)mj ставим в соответствие пару матриц где Е — единичная матрица порядка mit а В;клетка Жордана порядка m-i с собственным значением рг, и пусть G = Gi -f-.• .-j- Gs, А = Ai 4- • • • + As. (6) Рассмотрим комплексное билинейно-метрическое пространство 2 с матрицей Грама G. Так как G неособенная кососимметрическая, то 2 — симплектическое пространство. Непосредственные вычисле- ния показывают, что AG = AjGi 4~ A^Gi 4* • • • 4-
312 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ ПРОСТРАНСТВА [Гл. VH есть матрица кососимметрическая. Поэтому линейное преобразо- вание ©^ пространства V, имеющее матрицу А, является симмет- рическим. В то же время элементарные делители преобразова- ния &4 имеют требуемые значения. Итак: Теорема 1. Каждый элементарный делитель симметрического преобразования симплектического пространства встречается чет- ное число раз. Обратно, всякая система выражений (X — р,)т<, обла- дающая этим свойством, является системой элементарных дели- телей некоторого симметрического преобразования симплектиче- ского пространства. Мы уже знаем (п. 25.1), что симметрические преобразования симплектических пространств, имеющие одинаковые элементарные делители, изоморфны. Поэтому теорема 1 полностью решает за- дачу о классификации симметрических преобразований. В част- ности, она показывает, что для каждого симметрического преоб- разования в симплектическом пространстве 2 можно выбрать такой базис, в котором матрица Грама G и матрица преобразова- ния А примут вид (6). 27.2. Кососимметрические преобразований. Линейное преобра- зование а4 билинейно-метрического пространства 2 кососиммет- рично, если (хе4, у) = — (х, у &4) для любых х, у из 2. В силу теоремы 3 п. 26.2 элементарные делители кососиммет- рического преобразования симплектического пространства V, отвечающие ненулевым собственным значениям, входят парами вида (К — p)m, (X 4- р)т. Покажем, что элементарные делители пре- образования отвечающие нулевому собственному значению, т. е. имеющие вид Хт, также должны входить, парами Хт, \т, если т нечетное. Доказательство совершенно аналогично доказа- тельству соответствующего утверждения из п. 26.2, и мы укажем только его схему. Исходим из представления 2 в виде прямой суммы корневых подпространств преобразования Объединяя в этом представ- лении подпространства, отвечающие противоположным собствен- ным значениям, мы получим разложение 2-=я)?04-2)?1 4-... 4- где все подпространства Э)?о,..., инвариантны и взаимно орто- гональны, причем ЭЛ0— корневое подпространство, отвечающее корню нуль. Пусть — преобразование подпространства SDi0, индуцированное в нем преобразованием . Все собственные зна- чения преобразования равны нулю, поэтому ©Л’р = <й?, где р — размерность 2И0. Обозначим через т наименьший показатель, для которого = ^. Преобразование ©©/0 кососимметричевкое, следовательно, ©у/™"1 будет, как и в п. 26.2, симметрическим при т нечетном’ и кососимметрическим при т четном. Однако
§ 27J СИМПЛЕКТИЧЕСКИЕ ПРОСТРАНСТВА 313 соответствующая билинейная функция (хеЖ™-1, у) будет теперь симметрической при т четном и кососимметрической при т нечет- ном, так как метрика в симплектических пространствах кососим- метрическая. Дальнейшие рассуждения п. 26.2 сохраняются, с той разницей, что пара пространств теперь получится при т нечетном. Теорема 2. Элементарные делители кососимметрических преобразований симплектических пространств, отвечающие нену- левым собственным значениям, входят парами (\— р)т, ('/.Э-р)т, элементарные делители вида \т при т нечетном входят также парами кт, ст, а элементарные делители \т при т четном мо- гут входить в произвольных комбинациях. Обратно, всякая си- стема выражений (Ъ — щ)т‘, обладающая этими свойствами, есть система элементарных делителей некоторого косЪсимметрического преобразования симплектического пространства. Требуется доказать только вторую часть этой теоремвь Для этого каждой паре выражений (X —(X р;)'л/, в том числе и паре с р, —0, ставим в соответствие пару матриц — Г ° £‘Т А — ° Oj’ -В',’ где Е, — единичная матрица порядка т.-, а В, — клетка Жордана порядка тг с собственным значением р;. Оставшимся выраже- ниям вида Хт< с четным от,- ставим в соответствие пары матриц Рассмотрим комплексное билинейно-метрическое пространство 2 с матрицей Грама G. Матрица G кососимметрическая и неосо- бенная, поэтому 2 симплектическое. Линейное преобразование аЖ с матрицей А имеет заданные элементарные делители. В то же время еЖ кососимметрическое, так как непосредственные вычис- ления показывают, что матрица AG = AjGi A$G% -j-... ASGS симметрическая. Теорема доказана. 27.3. Симплектические преобразования. Изометрические пре- образования симплектического пространства 2 обыкновенно
314 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ ПРОСТРАНСТВА [Гл. VH называются симплектическими преобразованиями этого простран- ства. Таким образом, если 11 —симплектическое преобразование пространства 2, то (хИ, у21) = (х, у) для всех х, у из 2. В матрич- ной форме это равенство переходит в откуда UGU’ = G, (7) где G — матрица Грама, U — матрица преобразования'#. Выби- рая в 2 симплектическую систему координат, мы переведем со- отношение (7) в USU' — S, (8) где S'—симплектическая матрица вида (1). Матрицы U, удовлет- воряющие условию (8), мы будем называть симплектическими. Следовательно, чтобы некоторое линейное преобразование симп- лектического пространства было симплектическим, необходимо и достаточно, чтобы его матрица в симплектической системе коор- динат была симплектической. Из (8) также непосредственно вы- текает, что прямая сумма симплектических матриц является симплектической матрицей. Пусть U — произвольное симплектическое преобразование симплектического пространства 2. Представляя 2 в виде прямой суммы корневых подпространств преобразования # и объединяя затем слагаемые, относящиеся к взаимно обратным собственным значениям преобразования 11, мы получим разложение 2 = 2)1_i4-% + ^4- ••• +Ж. где ЭЛ1 — корневые подпространства, принадлежащие собст- венным значениям —1, —{—1. На основании теоремы 7 п. 25.2 подпространства ННц, •••, ЭЛЯ взаимно ортогональны. Исследование поведения 11 на 2 теперь приводите^ к иссле- дованию поведения 11 на каждом подпространстве 9)1, отдельно. Повторяя рассуждения п. 26.3 и пользуясь вместо теоремы об элементарных делителях кососимметрических преобразований комплексных евклидовых пространств соответственной теоремой для симплектических пространств, получим следующее предло- жение: Теорема 3. Элементарные делители симплектических пре- образований, относящиеся к собственным значениям, отличным от ±1, входят парами (X— p)m, (X — р-1)т, элементарные дели- тели вида (Х± } )-”» ! входят также парами (X-)- l)2m+1, или (X— l)2m+1, (X— 1)2”*+1, а элементарные делители вида (Х± 1)27‘ могут вводить произвольное число раз. Обратно, всякая система выражений, вида (X — р()т>, р, Ф 0, обладающая этими свойствами,
§ 28] ПСЕВДОУНИТАРНЫЕ ПРОСТРАНСТВА 315 есть система элементарных делителей некоторого симплекти- ческого преобразования. Согласно теореме 1 п. 25.1 симплектические преобразования, имеющие одинаковые элементарные делители, изоморфны. Поэтому теорема 3 дает полную классификацию симплектических преоб- разований с точностью до изоморфизма. Эта теорема, в частно- сти, показывает, что если —1- есть собственное значение симплекти- ческого преобразования, то кратность этого собственного значе- ния обязательно четная. Так как все остальные собственные зна- чения либо равны Ц-1, либо входят парами взаимно обратных одинаковой кратности, то произведение всех собственных значе- ний симплектического преобразования равно -|-1 *). Это произ- ведение равно определителю матрицы преобразования, и мы при- ходим к выводу, что определители матриц симплектических преобразований равны единице. Примеры и задачи 1. Построить симплектическую матрицу с элементарными делителями X-f-l, Х4-1, (А — 1)2. [А В Л q д, , где В, С кососимметрические, квадратные, одной и той же степени, содержат каждый элементарный де- литель четное число раз. 3. Сформулировать теорему 1 как теорему о парах кососимметрических билинейных форм. § 28. Псевдоунитарные пространства Псевдоунитарными пространствами мы назвали в п. 24.2 эрми- товы билинейно-метрические пространства над полем комплекс- ных чисел, метрика которых невырожденная и симметрическая: (х, ^) = (ц, х). Там же было показано, что все эти пространства с точностью до изоморфизма определяются своей размерностью п и сигнатурой s, причем s при данном п может принимать зна- чения п, п — 2, ..., —п. Как и раньше, нас будут интересовать свойства симметрических, кососимметрических и изометрических преобразований. Классификация этих преобразований в комплекс- ных евклидовых и симплектических пространствах основывалась нами на теореме 1 п. 25.1. В псевдоунитарных пространствах такая теорема, вообще говоря, места не имеет. Рассмотрим, на- пример, двумерное эрмитово билинейно-метрическое пространство 2 с базисом elt е$ и матрицей Грама 1 01 0 — 1]' *) Каждое собственное значение считается столько раз, какова его кратность.
316 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ ПРОСТРАНСТВА ГГл. VII Линейные преобразования 11г, Иъ определяемые равенствами ejZG = 2ei, е&ъ = , £2^2 ^2^2, будут, очевидно, изометрическими преобразованиями этого про- странства. Элементарные делители преобразований zZj, #-> одни и те же, именно К — 2, X----1_. Тем не менее 11х и И* не изоморфны. В самом деле, если бы’#1 и #2 были изоморфны, то их корневые подпространства, отвечающие собственному значению 2, можно было бы перевести одно в другое некоторым автоморфизмом про- странства 2. Корневое подпространство, отвечающее корню 2 пре- образования есть прямая а£Ь а аналогичное подпространство для 11=1 есть прямая а£.2. В то же время все ненулевые векторы первой прямой имеют положительный квадрат, а ненулевые век- торы второй — отрицательный квадрат. Таким образом, никакой автоморфизм пространства 8 не может первую прямую перевести во вторую, что и требовалось. Этот пример показывает, что для изучения преобразований псевдоунитарных пространств чисто геометрический путь стано- вится в известной мере необходимым. 28.1. Симметрические преобразования. Пусть V — какое-нибудь псевдоунитарное пространство размерности п и сигнатуры s. Рассмотрим произвольное линейное подпространство 91 из К Систему координат в 91 мы условимся называть положительной, нормальной, если ее матрица Грама имеет вид О ... О 1 О ... 1 О 1 ... О О и отрицательной нормальной, если ее матрица Грама имеет вид О ... 0—1 0...—1 0 (2) —1 ... 0 0 Очевидно, не всякое подпространство допускает нормальную сис- тему координат. Это зависит от сигнатуры подпространства и его размерности. Подпространства четной размерности, допускающие положительную или отрицательную нормальную систему коорди-
5 28] ПСЕВДОУНИТАРНЫЕ ПРОСТРАНСТВА 317 нат, имеют сигнатуру нуль; подпространства нечетной размер- ности с положительной нормальной системой координат имеют сигнатуру 1, с отрицательной — сигнатуру — 1. Доказательства легко вытекают из определения сигнатуры (п. 24.2). Исследуем элементарные делители симметрического преобразо- вания е/ё псевдоунитарного пространства 2. Разложим 2 в прямую сумму корневых подпространств преобразования и объединим слагаемые, 'отвечающие комплексно сопряженным собственным значениям. В результате получится разложение 8 в прямую сумму инвариантных подпространств 2 = ^ + %+...+^. ‘ (3) На основании п.'25.2 эти подпространства взаимно ортогональны, поэтому изучение преобразования orf сводится к изучению пове- дения внутри каждого ЭЛ;. Пространство 2 невырожденное, поэтому все ЭЛ; также невырожденные. Заметим теперь, что под- пространства ЭЛ,- могут быть двух типов: 1) 3)1;— прямая сумма двух корневых подпространств, отвечающих сопряженным неве- щественным собственным значениям *), и 2) Э)1; — корневое под- пространство, отвечающее вещественному собственному значению. Рассмотрим первый случай: пусть элг = эл;- + ЭЛ/, где ЭЛ/ ЭЛ/— корневые подпространства, отвечающие собствен- ным значениям а, а, где а а. Рассуждая, как в п. 25.1, получим (а', а2) = 0ч (а',', а"2) = 0, (4) где о', аг — любые векторы из ЭЛ/, d[,a"i — любые векторы из ЭЛ/. Если бы какой-нибудь вектор d из ЭЛ) оказался ортогональным ко всем векторам из ЭЛ/, то а’ был бы изотропным в ЭЛг. Ввиду невырожденности подпространства ЭЛ; это дает d — о. Итак, для каждого ненулевого вектора подпространства ЭЛ; найдется неор- тогональный вектор в подпространстве ЭЛ/. Мы предположили, что ЭЛ) есть корневое подпространство пре- образования , отвечающее корню а. Следовательно, при неко- тором натуральном т будем иметь ЭЛ)(а^ —ag)m = o, ЭЛ;(^ — ag)"2-1 о. (5) Выберем в ЭЛ; вектор а, для которого а(<а^ — ag)m l фо. Так как а(оФ— отличен от нуля, то в ЭЛ/ найдется вектор Ь, *) Если a—собственное значение, а а не есть собственное значение,, то мы формально будем считать, что V; — нулевое подпространство. .Из даль- нейших рассуждений следует, впрочем, что этот^случай невозможен.
318 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ ПРОСТРАНСТВА [Гл. VII не ортогональный к а Нормируем b так, чтобы — Ь) = 1. Введем теперь обозначения — ag)7 = tZy+i, b (©т/ — ag/ = Ь}Л , (J —О, 1, т — 1). Преобразование симметрическое, поэтому (з^ — о$)*=еЖ — ag, (а/ — ag)*' = (а^ — ag)'. Следовательно, при j-\-k = /и-pl имеем (flj, bk) = (a(e^ — а^1, b (&£ — ig)'^1) = = (a (a^ — ag)7+ft-2, b) = 1, (6) а при j k 4> m 1 (aJt bk)--=(a(^ — ^k-\ b) = 0. (7) В частности, из (6) следует, что b — ag)m-1 о. Далее, если а' принадлежит Э)1), то (ar, b (е^ — ag)m) = (а’ (еЖ — ag)m, b) — 0. Иными словами, вектор Ь(&£ — ag)m из подпространства 301" орто- гонален ко всем векторам из 9?iz- Согласно сделанному выше замечанию это дает b(erf-—ag)m = o. Обозначим через 91',, 91" подпространства, натянутые соответственно на векторы alt аг, ... ..., ат я blt bit ...,Ьт. Пусть Ci = fli Д-а2Й2 Д- . -\-итат, CjJri=Cj{e^ — ag) (/=1, ..., т— 1). Из формул (6), (7) следует, что при любых значениях- а2, ..., ат имеем (ci (а^ — ag)m_1, &t) = l, откуда снова (О, йт+1_у) = 1, (Cj,bk) = Q;(j-f-&>/n-|-1; /, k = \...tn). (8) Легко видеть, что коэффициенты а2, ..., а.т можно подобрать так, чтобы выполнялись дополнительные условия (ci, = Ьт^)= ... =(Ci, bi)==Q. Тогда при j-\-k<tn-{-1 будем иметь (Су, bk) = (Ci, bd^= bhk_i) = 0. (9) Пусть % = 91' -J- 9t'i. Соотношения (4), (8), (9) показывают, что система ct.....ст, bi, ... , Ьт есть положительная нормальная система координат в %. В то же время матрица преобразования в этой системе координат распадается на пару клеток Жор- дана с элементарными делителями (X — (x)m, (X — а)т.
§ 28] ПСЕВДОУНИТАРНЫЕ ПРОСТРАНСТВА 319 Подпространство 91j невырожденное, следовательно, где 91-L — снова инвариантное относительно подпространство. Если 91-L^o, т°. применяя к 91ф изложенный процесс, мы выделим из него инвариантное подпространство 912 и т. д. В результате получим для 991,- представление вида = % + % + ... 4-9ls., где 9?i, ..., 9ts. — инвариантные взаимно ортогональные подпро- странства, в каждом из которых существует положительная нор- мальная система координат, в которой матрица преобразования оЛ распадается на две клетки Жордана с элементарными делителями вида (X — a)m, (X — s)m. Рассмотрим второй случай. Пусть 991,- — корневое подпростран- ство, отвечающее вещественному собственному значению а. Снова ищем такое натуральное число т, чтобы 991,- (аЖ — ag)m = о, 991г (аЖ - ag)^1 ф о. Так как (аЖ — а&)*=еЖ — ag= аЖ— ag, то преобразование еЖ— ag, а вместе с ним и преобразование (аЖ— ag)”'1— симмет- рические. Соответствующая эрмитова билинейная функция (х(аЖ— ag)m i, у) также симметрична и не равна тождественно нулю на 9)1г. Поэтому в 991, найдется вектор а, для которого (а(аЖ — ag)m"i, a) = p^O. (10) Из симметричности функции следует, что р вещественное. Пола* гая ai — V | р | а, мы вместо (10) получим соотношение (а2(аЖ — ag)^1, ai) = e, е=±1. (11) В этом соотношении знак у единицы зависит от свойств самого преобразования еЖ, и, во всяком случае, нормировкой мы его изменить не можем. Введем обозначения о/+1 = о/(еЖ— ag) (/ = 1, •••, т—1). Из (11) следует: (ay, am+w) = (й1(аЖ — ag)m-1, ai) = е. (12) Аналогично из условия (аЖ — ag)m == о получим (aJt аь) = (Й1 (аЖ - ag)/+*~2, Д1) = 0 (/ + k > т -f 1). (13) Пусть . = «14~ а4а.2 -j- amam,
320 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ ПРОСТРАНСТВА (Гл. VII где. а2..<хт — пока произвольные числа. Положим = (/=1,..., w-1). (14) Равенства (12), (13) дают (b/t ЬтлЛ_]) = ъ, (Ь{,Ьк) = О (/ + £>'«+ 1;/, k= 1, ... , т). (15) Легко видеть, что числа а2, ... , ат можно так подобрать, чтобы выполнялись соотношения {blt bm_1) = (b1,bm_i)= ... ==(&ь м = о. Тогда при / -j- k<^m 1 будем иметь (bj, 6fe) = (6i, bi (е^ - ^к-^=(Ь1, bJ+k_t) = 0. (16) Рассмотрим подпространство 911, натянутое на bi,..., Ьт. Из (14) следует, что инвариантно относительно рЖ и матрица пре- образования о/l в этой системе координат равна клетке Жордана с элементарным делителем (X — a)m. С другой стороны, из (15), (16) видно, что bit ... , bm есть нормальная система координат в %, притом положительная, если е— — 1, и отрицательная, если е= — 1. Пространство 96 невырожденное, поэтому, если % Ф о, то ’ ЭЖ = 96 + 9?1, где 9iJ—инвариантное подпространство низшей размерности. Применяя к 91,!- тот же процесс, мы выделим из 9?J- инвариант- ное подпространство % и т. д., пока не получим разложение 9J6 в прямую сумму взаимно ортогональных подпространств. Прилагая теперь наши результаты к каждому подпространству 30?;, мы представим пространство 2 в форме 2 = ^ + ^+ ... + Фг, (17) где фь ..., фг — взаимно ортогональные подпространства, каждое из которых либо отвечает вещественному элементарному делителю (X — а)"! преобразования еЖ, либо — прямая сумма двух под- пространств, отвечающих сопряженным комплексным элементар- ным делителям (X — a)m,(X — а)т; при этом в подпространствах первого рода найдутся нормальные положительные или отрица- тельные системы координат, в которых матрица преобразования будет клеткой Жордана, а в подпространствах второго рода найдутся положительные нормальные системы координат, в кото-, рых матрица преобразования оЛ будет прямой суммой двух сопря- женных клеток Жордана. Каждому подпространству фу, отвечающему вещественному корню а, соответствует элементарный делитель (X — а)”1 преобра- зования еЖ. Условимся подпространству фу относить элементар- ный делитель-j-(X qt)m,, если в фу существует положительная
$ 28] ПСЕВДОУНИТАРНЫЕ ПРОСТРАНСТВА 321 нормальная система координат, в которой матрица преобразова- ния оЛ имеет вид клетки Жордана, и относить элементарный делитель —(X —а)т, если в существует отрицательная нор- мальная система координат, обладающая указанным свойством. С помощью этого правила мы, исходя из разложения (17), по- лучим систему элементарных делителей преобразования а/ё, в ко- торой каждый вещественный элементарный делитель будет снаб- жен определенным знаком. Условимся называть такую систему элементарных делителей знакоопределенной. Повторяя рассужде- ния, проведенные в конце п. 26.1, получим, что симметрические преобразования пространства 8, имеющие одинаковые знакоопре- деленные системы элементарных делителей, будут изоморфны. Предположим теперь, что нам дана произвольная система вы- ражений вида ± (X — а; )т>, в которой все невещественные выра- жения встречаются парами комплексно сопряженных и имеют знак плюс. Спрашивается, существует ли такое псевдоунитарное пространство 8 и такое его симметрическое преобразование еЖ, чтобы заданная система ± (X — аг)т» была знакоопределенной сис- темой элементарных делителей преобразования е^? Ответ, оче- видно, утвердительный. Построение пространства 2 и преобразова- ния <аЖ можно выполнить тем же путем, что и в п. 26.1. Так как ничего нового это построение не требует, то мы его предо- ставляем читателю. Нам остается доказать несколько более тонкий факт, что знако- определенная система элементарных делителей преобразования еЖ не зависит от выбора разложения (17) и целиком определяется самим преобразованием. Разложение (17) было получено в результате расщепления подпространств ЭЖ, на циклические подпространства Ц1(-. Так как сами подпространства Э)1У являются либо корневыми, либо суммами корневых и определяются, таким образом, одно- значно, то неоднозначность могла произойти только при разло- жении каждого SOiy. Подпространства й)1у, являющиеся суммами двух корневых, нас интересовать не могут, так как при их рас- щеплении получаются пары циклических подпространств с па- рами комплексно сопряженных элементарных делителей вида (X — а)т, (X — а)т. Остается, следовательно, только доказать, что, каким бы способом мы ни раскладывали корневое подпростран- ство Э)1У с вещественным корнем а в сумму взаимно ортогональ- ных неразложимых подпространств, знакоопределенная система элементарных делителей вида ± (X — а)т будет одна и та же. Пусть 311; = %+%+...+^, (18) (19) 11 А. И. Мальцев
322 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ ПРОСТРАНСТВА (Гл. VII — два разложения Э)1 у в ортогональные суммы неразложимых под- пространств. Обозначим через В((Х — a)mi, sz(X— a)mi знакоопре- деленные элементарные делители, отвечающие подпространствам Э(,- и ЦД-(/—1, /; 8г, гг=±1). Мы расположим слагаемые в суммах (18), (19) так, чтобы тх - mt. Допустим, что у нас есть несколько слагаемых высшей размерности: mi — ... = mh^> mh+1. Докажем, что тогда системы высших элементар- ных делителей г, (X — a)mi, ..., eft(X-—a) mk и (X — a)mi, ..., 8fe(X— а)"1* будут состоять из тех же самых членов. Рассмотрим билинейную функцию fi (х,у) = (х (а^ — ag)m'-1, j/). Преобразо- вание — ag симметрическое, поэтому и функция (х, _у) сим- метрическая. Подсчитаем ее сигнатуру с помощью разложения (18) и с помощью разложения (19). Все подпространства в раз- ложении (18) ортогональны относительно функции Д (х,у). По- этому сигнатура функции fi(x,y) на будет равна сумме ее сигнатур, вычисленных на каждом слагаемом отдельно. Однако при pf>k имеем ag)m-H=O, следовательно, Д(х, _у) на обращается в нуль. Рассмотрим теперь подпространства 9G.......ЗД. Пусть at, ... ,ат— базис в 9?i, для которого ц/+1==а7(е^ —ag) (j—l, , mi— 1). Так как ai (<>/— ag)m‘ = o, то при j -\-k Д>2 имеем /Дау, aft) — (a, (s^ — ag)"11"1, aft)=0. С другой стороны, согласно определению знака элементар- ного делителя fi (ai, ai) = (ai — ag)^”1, at) — Bi. Следовательно, матрица функции Д (х, у) в базисе at, ... , ат бу- дет содержать единственный ненулевой элемент, который равен 8, и стоит в начале главной диагонали. Отсюда видно, что сиг- натура функции Д (х, у) на % также равна 81Ф Аналогичные рас- суждения применимы и к подпространствам %, ..., й. В резуль- тате мы получим, что сигнатура функции Д (х, _у) на ЮД равна К, Д-8.2 Д-... Д-8А. Используя вместо разложения (18) разложение (19), придем к заключению, что сигнатура функции Д (х,у) на ЭЭД равна гц Д-eg Д~ ... Д-ел. Таким образом, Д- Д-... Д- 8ft = ej Д- е2 Д-... Д- eft. (20) Так как 8Z, ег = ±1, то из (20) вытекает, что обе системы чисел 8Ъ 8А и ei, ..., ей могут отличаться только порядком следо-
§ 28] ПСЕВДОУНИТАРНЫЕ ПРОСТРАНСТВА 323 вания и, значит, обе системы высших элементарных делителей (X — a)mi,..., 8ft (X — a)m* и Bj (X — a)mi, ..., eft (X — а)т* совпадают. Рассмотрим теперь билинейную функцию ft(x, у). На всех подпространствах размерности, меньшей mk+i, эта функ- ция обращается в нуль. Поэтому для сигнатуры f3(x, у) на SOiy имеем такие выражения: сигн. 991 у = =;сигн. 9и 4~-•• + сигн- 94 + сигн. 9tft+1 .-ф-сигн. 9?р, /9П сигн. = ’ = СИГН. ф1 +СИГН. фЛ 4-СИГН. фй+1 4“, • • + сигн. фр,_ где принято, что mk+i = ... = mp^>mp+l. Так как сигнатуры функ- ции /2 на соответственных подпространствах высшей размерности по доказанному совпадают, то из (21) следует, что СИГН. 9?ft+14-сигн. 94 = СИГН. ф;;+14~--- + СИГН- Фр, или 4+1 + • • • + 8р = ®д+1 + • • • + ®р- (22) Из (22) видно, что элементарные делители преобразования а-'?, имеющие степень mk+1, также совпадают. Продолжая этот процесс дальше, мы получим, что системы знакоопределенных элементар- ных делителей преобразования а-/, вычисленные из разложений (18) и (19), совпадают. Посмотрим теперь, что можно сказать о сигнатуре основного пространства 8, если известна знакоопределенная система элемен- тарных делителей какого-либо симметрического преобразования оЛ этого пространства. Разложение (17) показывает, что сигнатура пространства 8 равна сумме сигнатур подпространств ф1, ..., ф;. В тех из подпространств фу, которые отвечают парам сопряжен- ных собственных значений, существует положительная нормальная система координат. Однако размерность их четная и, значит, сиг- натура есть нуль. Также равна нулю и сигнатура подпространств, отвечающих вещественным элементарным делителям, но четной степени. По- этому остаются только подпространства, отвечающие вещественным элементарным делителям нечетной степени. Их сигнатура равна ±1 в зависимости от того, положителен или отрицателен соответству- ющий элементарный делитель. Следовательно, s = Si — s2, (23) где s — сигнатуре пространства 8, Si—число положительных, «а — число отрицательных вещественных элементарных делителей нечетной степени преобразования orf. И*
324 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ ПРОСТРАНСТВА ГГл. vn Из формулы (23), в частности, вытекает, что каждое симмет- рическое преобразование псевдоунитарного пространства сигна- туры s имеет по меньшей мере |s| вещественных элементарных делителей нечетной степени. Изучение кососимметрических преобразований псевдоунитарных пространств непосредственно приводится к изучению симметриче- ских, так как если симметрическое, то будет кососимметри- ческим, и наоборот. 28.2. Псевдоунитарные преобразования. Изометрические пре- образования псевдоунитарных пространств называются псевдоуни- тарными преобразованиями. Пусть U — псевдоунитарное преобра- зование пространства 8. Представляя 2 в виде прямой суммы кор- невых подпространств преобразования 'll и объединяя слагаемые, относящиеся к корням а, 13, связанным соотношением оф = 1, мы получим новое разложение для V = ЭЛ_1 + й>11 + % + • • • 4- где подпространства 501 j инвариантны относительно И и в силу тео- ремы 3 п. 25.1 взаимно ортогональны. К каждому из этих подпро- странств можно применить одну из формул Кэли (п. 25.2): e^ = /(g —2Z)(g + 2Zp (24) или = z (g 2Z)(& _ (25) В результате получим симметрические преобразования подпро- странств Э01,. Из (24), (25) имеем И = (g, 4- iW)(§ — tW)'1 или соответственно И = — (§> 4“ В первом случае каждый элементарный делитель преобразования orf вида (X — а)т перейдет в элементарный делитель (X—-у)"1, где 7 = (1 4-1«) (1 — i а)'1, а во втором — в (X — где у =—(14- 4~ja)(l—ia)-1. Так как е?/— симметрическое преобразова- ние, то его невещественные элементарные делители вида (X — а)гл будут встречаться парами (X — a)m, (X —а)"1. Однако (1 —г s) (1 —• — i а)"1 — (1 — г а) (1 4~ * а)'1, поэтому соответственные элементар- ные делители преобразования И также будут встречаться парами, но уже вида (X — у/”, (X — у~1)га. Если же а вещественное, то для у = (1 -(-* а)(1 — 1’а)-1 мы получим соотношение уу = 1.Обратно, из П—1 следует, что а вещественное. Таким образом, формулы (24), (25) устанавливают соответствие между элементарными де- лителями псевдоунитарного преобразования И и элементарными делителями симметрического преобразования . Мы видели, что
ПРИМЕРЫ И ЗАДАЧИ 325 симметрические преобразования с точностью до изоморфизма за- даются своими знакоопределенными системами элементарных де- лителей. Поэтому псевдоунитарные преобразования определяются с точностью до изоморфизма своими знакоопределенными систе- мами элементарных делителей. Только в этих системах знаки ± 1 должны быть теперь расставлены у элементарных делителей, отве- чающих собственным значениям, по модулю равным единице. Примеры и задачи 1. Провести полностью доказательства всех утверждений пп. 28.1, 28.2. 2. Пусть V — четырехмерное псевдоунитарное пространство с сигнатурой 2 (комплексное пространство Лоренца). Выберем в качестве главной системы координат в V систему elt ег, е9, eit в которой скалярный квадрат вектора х = -ь Е3с3 -j- J.p'.i имеет вид (х, х) = 5? + + 63 — Si- Показать, что матрица каждого симметрического преобразования пространства V может быть в подходящей главной системе координат приведена к одному из сле- дующих видов: а а Р ₽ 0 1 7 8 > 0 р 1 > -8 7 J [ -1-1 р где а, р, 7, 5 — вещественные числа. Решить аналогичную задачу для матриц псевдоунитарных преобразований пространства V. 3. Если л — размерность пространства, з — сигнатура эрмитовой били- нейной функции /, то характеристикой f называют выражение / = . Показать, что характеристика псевдоунитарного пространства V, в котором имеется симметрическое преобразование gjg, удовлетворяет неравенству + [4]» где h равно половине суммы показателей комплексных элементарных дели- телей преобразования a k пробегает все показатели его вещественных элементарных делителей. Символ [ууJ означает максимальное целое число, k не превосходящее . 4. В условиях предыдущей задачи пусть / (х, у) — (xQ;^,у). Показать, что характеристика функции f удовлетворяет неравенству где h — полусумма показателей комплексных элементарных делителей пре- образования А' пробегает показатели элементарных делителей, отвеча- ющих ненулевым вещественным корням, k'—то же для нулевого собствен- ного значения.
Глава VIII АФФИННЫЕ ПРОСТРАНСТВА Понятие трехмерного вещественного векторного пространства естественно возникает при описании основных свойств обычного физического пространства, если в этом пространстве выделена какая-то точка в качестве начала координат. Поскольку все точки физического пространства считаются равноправными, то наряду с понятием векторного пространства желательно иметь и матема- тическую модель, отвечающую понятию пространства, в котором предварительно не фиксируется никаких точек. Примерами этих моделей являются аффинное пространство и евклидово точечное пространство. Элементы теории таких пространств и будут изло- жены в этой главе. § 29. Общие аффинные пространства 29.1. Аксиоматика. Пусть задано какое-нибудь векторное пространство I* над полем К. Аффинным пространством 21 над век- торным пространством С называется произвольная совокупность, каждой паре элементов которой X, Y поставлен в соответствие некоторый вектор из 8, обозначаемый далее через ХУ, при условии, что выполнены следующие требования: Ai: для каждых X £ 21, v £ 8 существует один и только один элемент Y £ 21, удовлетворяющий соотношению XY — о; Л->: для любых X, Y, Z С 51 истинно равенство ~ху -\-~YZ = ~Х2. Элементы аффинного пространства называются его точками, а век- торы из 8 называются свободными векторами пространства 21. Для любых X g 21, v £ 8 будем через X • v обозначать ту точку Y g 21, для которой XY == о. Согласно аксиоме Ai такая точка в 21 существует и единственная. Отсюда, в частности, вы- текает, что для любых X, Y С 21, и С 8 X-XY — Y, Х-(Х-и)==и. (1) ___ ____________ Вследствие аксиомы А2 XX XY — XY, и потому XX —о, Х-о—Х (X С 21, о С 8).
§ 29] ОБЩИЕ АФФИННЫЕ ПРОСТРАНСТВА 327 Вследствие этой же аксиомы XY -}-YX = ХХ, и потому XY = — YX. (2) Наконец, для любых X, О, В, С, D£ 9( имеем (X-OB).CD = X-(OB-\-CD). (3) В самом деле, пусть X-OB — Y, Y - CD = Z. В силу А.> и (1) OB = XY, CD — YZ, OB~-^CD=XZ, и потому (X-OB)-CD = Z = X-XZ = X.(OB + CD). Каждой паре (О, В) точек пространства 9( поставим в соответ- ствие отображение 9( в 91, обозначаемое через ОВ и определяемое формулой ___ ОВ:Х->Х-ОВ (ХС 81), (4) т. е. положим Х-ОВ = Х-ОВ. Отображения ОВ (О, В£ 91) назы- ваются сдвигами (а также смещениями и переносами) простран- ства 91. Суперпозицию сдвигов ОВ, CD называют обычно суммой этих сдвигов, т. е. по определению полагают X-(OB + CO) = (X-OB)-CD^X-(OB + CO). (5) Произведение элемента X £ X на сдвиг ОВ определяют фор- мулой Х.(ХОВ) = Х-(ХОВ). (6) Совокупность всех сдвигов пространства 9(, снабженную опе- рациями сложения и умножений на все Х£ /<, обозначим через L (91). Равенства (5), (6) показывают, что отображение ОХ-+ОХ является изоморфизмом 8 на L (91), и потому L (9() есть векторное пространство над К. Фиксируем теперь в ?! какую-нибудь точку О. Тогда отобра- жение Х-+ОХ (Х£ 91) будет устанавливать взаимно однозначное соответствие между точками 9( и векторами g. Вектор ОХ обычно называется радиусом-вектором точки X относительно начальной точки О. Радиус-вектор сдвинутой точки X • ВС выражается через радиус-вектор первоначально заданной точки X при помощи формулы О (X • ВС) = ОХ + (ОС - ОВ). (7) Действительно, полагая X-BC — Y, будем иметь ХГ = ВС и, следовательно, 0(Х-ВС)=Ш7=0Х'+ХГ = 0^4-ВС?
328 АФФИННЫЕ ПРОСТРАНСТВА (Гл. VIII Пусть теперь нам задано какое-нибудь векторное пространство £ над полем К. Назовем векторы V точками и каждой паре их (и,??) поставим в соответствие вектор uv = v— и. Ясно, что при этом условии требования Aj, Ai заведомо будут удовлетворены и тем самым векторное пространство 2 обратится в аффинное простран- ство над самим собою. Это аффинное пространство мы обозначим через А (?). Так как равенство ху — и равносильно соотношению у — х = и, то для сдвигов пространства А (2) получаем формулу х- Ьс = хАг (с — Ь). (8) Наряду с понятием аффинного пространства над векторным пространством с чисто алгебраической точки зрения иногда удобно рассматривать еще понятие аффинного пространства над полем, возникающее следующим путем. Совокупность всех точек аффинного пространства 21 над векторным пространством £ над основным полем А обозначим через А. Вводим в А новые операции S(X, Y, Z), РДХ, Y), полагая по определению S(X, Y, Z) = Z-XY, Рх(Х, Y) = X-(kXY) (9) и обращая тем самым 21 в новую алгебру 21* = (А; 5, {А}) (ЧК). Легко проверить, что операции А, А в алгебре 21* обладают следующими свойствами: А*: Для каждых О, В, С, Х£ 21* S(B, С, 5(0, В, X)) = S(0, С, X); (10) AJ: Для каждых О, В, Х£ 21*, Xg 5(0, В, РДО, Х)) = РДВ, S(0, В, X)); (И) Аз’. Фиксируем в 21* произвольную точку О и с помощью операций 5, А вводим для элементов 21* новые операции X-^oY = S(O, X, Y), *-0X = Pi (О, X), (12) называемые локальным сложением и локальными умножениями элементов 2f* на числа X (в точке О). Относительно локальных операцийД-о и Х-о элементы 21* образуют векторное простран- ство над К, обозначаемое далее через £0- В самом деле, мы видели, что отображение Х->0Х (Х£ А) является взаимно однозначным соответствием между точками А и векторами из 2. Перенесем согласно этому соответствию век- 1 торные операции из £ в А, т. е. положим по определению X4-y=z<==>ox4-oy=oz, xx=z<==>xox=oz. (13)
§ 29] ОБЩИЕ АФФИННЫЕ ПРОСТРАНСТВА 329 В результате А обратится в линейное пространство над К и точка О будет нулевым элементом этого пространства. Так как X ХАВ = Y<==>XY = X AB<==X>OY - ОХ = X(ОВ - ОА), а из (13) следует, что ОУ - OX = Х (OF- ОЛ)<==>У — Х = Х(В — А), то Х-Х Аь = У<==>У = Х-фХ (В — А), откуда Х-Х ЛВ = Х+Х(В-А) (14) и, следовательно, <S(X, У, Z) = Y^Z-X, р.л(Х, У) = Х(У —Х)4-Х, Х4-оу = х-1-у, х.ох=хх. После этого утверждения А*, Аг, Аз становятся очевидными. Аффинным пространством над полем К называется множество элементов А, снабженное одной трехместной операцией S(X, У, Z) и серией бинарных операций РЛ(Х, У) (Х£ X), удовлетворяющих на А требованиям А*, Аг, Аз. Аффинное пространство над полем К, аналогично векторному пространству над Д’, является алгеброй (сигнатура которой зависит от А'п в общем случае бесконечна). Поэтому для аффинных пространств над полем оказывается автоматически определенной серия понятий, рассмотренных в «АС», таких, как изоморфизм, эндоформизм, конгруенция и т. и. Мы уже видели, каким образом каждое аффинное пространство 31 над векторным пространством V над полем К можно обратить в аффинное пространство 31* над полем К. Теперь мы хотим пока- зать, что этим способом можно получить любое аффинное простран- ство над К. Итак, пусть )В = (А,5, Рф— какое-нибудь аффинное простран- ство над полем X- Записывая тождество (10) в виде С-фв (В0Х) = С0Х (15) и полагая В —О, получим С + о (О -ф- X) — С -ф- g X. Это — уравнение в векторном пространстве ?0, и потому 0 + оХ = Х, (16) т. е. точка О есть нуль пространства 80. Для любых фиксированных точек О, В отображение Х-> 5 (О, В, X) (Х€ S)
330 АФФИННЫЕ ПРОСТРАНСТВА [Гл. VIII пространства 23 в себя назовем сдвигом 3 и обозначим его через ОВ. Таким образом, по определению полагаем X-0B = S (О, В, Х) = Х + 0В. (17) Переписывая соотношение (16) в форме Х-00 = Х, видим, что сдвиг 00 является тождественным отображением 3 на себя и, в частности, Об —XX для любых б, Хб 23. Как и выше, суммой сдвигов ОВ CD называем их суперпо- зицию, т. е. полагаем X-(OB-\-CD) = (X -~бВ)-~С1)=3(С, D,S(6,B, X)).’ (18) Тождество (10) означает, что для сдвигов справедливо правило треугольника ОВ-бВС = бС, (19) из которого, в частности, следует, что ОВ 4- ВО = 00, т. е. что сдвиги ОВ и ВО являются взаимно обратными отображениями. Из (15), (17) получаем X.CD = X4-cZ) = X4-c(C + b(Z)-bC)) = X4-b(j9-bC), или GD = BCD^BC). (20) Комбинируя формулы (20) и (19), приходим к соотношению О В + CD = ОВ В (D — вС) = O(D-bC), показывающему, что сумма сдвигов есть сдвиг. Определим, наконец, еще операцию умножения числа на сдвиг ОВ, полагая /- • ОВ = б~бб^В) = ОРбб, В), т. е. полагая, что X- ббВ) = 5(О, Р^О, В), Х) = РАХ, Х-бВ). (21) Из формулы (21) видно, что если OB — CD, то 'K-OB = \-CD, т. е. операция умножения числа на сдвиг определена однозначно. Теорема 1. Совокупность L(2l*) всех сдвигов аффинного про- странства 21* над полем К является векторным пространством над К относительно операций сложения сдвигов и умножения числа на сдвиг. Пространство изоморфно любому из пространств 20. Ставя каждой паре точек X, Y из 21* в соответствие сдвиг XY $ L(2l*), мы обратим 21* в аффинное пространство 21 над векторным пространством L(2[*). Если в пространство 21 ввести
§ 29] ОБЩИЕ АФФИННЫЕ ПРОСТРАНСТВА 331 по формулам (9) операции S, Р>, то получится снова простран- ство 51*. Последние два утверждения очевидны, так как, например, формулы (9) применительно к пространству 51 просто переходят в формулы (17) и (21). Докажем первые два утверждения. Выберем произвольную точку О С 51* и рассмотрим отобра- жение Л:Х — OX (X C^- TaK как любой сдвиг можно представить в форме ОХ, то А есть отображение £0 на L (51*). Проверим, сохраняет ли отобра- жение А операции сложения и умножения на числа. Имеем 2.0(ХН-о¥) = Z + С(Х + 0F) = (Z4-0Х) + 0Y = Z- (ОХ + 0Y), т. е. О (X -j- qY) = OX -J- OY и, следовательно, (Х~0У) Л = ХА-|-УЛ. Аналогичным путем из (21) получаем (X . 0Х) А =Х • ХА. Таким образом, отображение А является изоморфизмом ?0 на L(5i*) относительно операций сложения и умножений на числа, и потому L (31*) вместе с ?о является векторным пространством над К. Поставим, наконец, вопрос: при каких условиях два аффинных пространства изоморфны? Понятие изоморфизма введено в «АС» для произвольных алгебр, имеющих одинаковую сигнатуру. Аффинные пространства над полем К были опреде- лены как алгебры, сигнатура которых зависит от поля К- Поэтому для аффинных пространств над одним и тем же полем определено и понятие изоморфизма. Что касается аффинных пространств над заданным векторным пространством, то они были определены нами не как алгебры фиксированной сигнатуры, а как системы более сложной природы, для которых понятие изоморфизма мы пока не вводили. Введем следующее определение: Гомоморфизмом аффинного пространства 51 над векторным пространством 1! в аффинное пространство 53 над тем же вектор- ным пространством 1? называется точечное отображение <р: 51—-53, при котором ХУ = ХЙ^ (X, У С 51). (22) Ясно, что это условие равносильно следующему: (X-v)v = X'r-v (X € 51, v^Y). Из (22) видно, что отображение ср переводит различные точки в различные и что если ср есть гомоморфизм 51 на 53, то обратное отображение ср-1 — гомоморфизм 53 на 51.
332 АФФИННЫЕ ПРОСТРАНСТВА [Гл. VIII Гомоморфизм 31 на S3 называется изоморфизмом, если обратное отображение есть гомоморфизм 33 на 3(. Таким образом, понятия гомоморфизма и изоморфизма для аффинных пространств над фиксированным векторным пространством равносильны. Изоморфизм аффинного пространства 81 над векторным про- странством V на себя называется автоморфизмом 1’1 над 2. Теорема 2. Все аффинные пространства над одним и тем же векторным пространством изоморфны. Автоморфизмы аффинного пространства над векторным пространством — это его сдвиги. Пусть 3( и 33 — аффинные пространства над векторным прост- ранством 2. Выберем произвольные точки A t 31, В G 33 и рас- смотрим отображение ср: Av —-Bv (v g V). Из аксиом Аъ А2 не- посредственно заключаем, что <р — изоморфизм Si на 33. Далее, если <р — автоморфизм аффинного пространства 31 над векторным пространством С, то из формулы (22) получаем АХ — — A’fXf, откуда Х? == А? • АХ, и потому Х'< = Х-ХАС АХ = Х-(АХд-ХА^ = Х-АЖ, т. е. со — сдвиг 31 на вектор АА1?. Обратно, если ср — сдвиг, то ср имеет вид Xf — X-v, где v — произвольный фиксированный вектор из 2, и потому W?=(x-v) (Y-v) = Icy: Аффинное пространство над полем К есть алгебра сигнатуры S, Изоморфизм ср аффинного пространства 31 над полем К на аффинное пространство 33 над тем же полем К — это взаимно однозначное отображение 31 на 33, удовлетворяющее условиям. S(X, Y, Z)? = S(Xvf Yf, Zf), Px(X, Y)?=P\(X'?, Y'f) или, что равносильно, условиям (Z~XYy = Zt. XYY\ (23) (X-/.X7)'(24) Теорема 3. Для того чтобы отображение ср: 31 -> 33 аффин- ного пространства 8( над полем К на аффинное пространство 33 над тем же полем было изоморфизмом, необходимо и достаточно, чтобы отображение ф: XY ->X’JW(X, Y С 31) было изоморфизмом векторного пространства L (31) на векторное пространство L (33). Необходимость. Прежде всего установим однозначность отображения ф. Пусть XY = UV (X, Y, U, V С 3() и, следова- тельно, Z-1CY = Z-UV. Из (23) получаем Z'<• XXY* = Z*•
§ 29] ОБЩИЕ АФФИННЫЕ ПРОСТРАНСТВА 333 Так как Z’’ пробегает все пространство 53, то из последнего ра- венства имеем X’Y* = (ЛУф и потому отображение фоднозначно. Переписывая теперь соотношение (23) в форме по- лучаем для произвольных v, w £ L (Й) Zf (v -j- wf = (Z (v + ©))? = ((Zu) wy = (ZM) = Z* (u* 4- o4), откуда (и u')* = <4 -ф- иУ. (25) Аналогично, переписывая (24) в виде (X • \и.у = ХУ • Хи*, по- лучаем X* уиу = (X • (ки)У = X’f • )аУ, откуда (26) Соотношения (25), (26) означают, что ф есть изоморфизм L (й) на 2,(53). Достаточность. Пусть для отображения ср: Й-> 53 мно- жества Й на множество 53 отображение ф: XY->XfYf есть изо- морфизм Л(Й) на L (53). Так как при изоморфизме векторных пространств нулевой вектор отвечает нулевому вектору, то из Х1(' = У<₽ следует Х₽У'р = о, и потому XY = о, Х = У, т. е. ото- бражение ср взаимно однозначное. Далее, чтобы доказать истин- ность для ср соотношения (24), берем в й ту точку U, для ко- торой ХУ = ZU. Тогда (Z • ХУ У = (7* = Z? • Z4J f = Z'f- X'fY'f (27) и, в частности, (Zu^^ZV (и££(Й)). Из (26) теперь имеем (X • Ухуу = X'f (ХХУУ = х w* == х^хп7*, что и требовалось. Следствие 1. Аффинные пространства над заданным полем тогда и только тогда изоморфны, когда их векторные простран- ства сдвигов имеют одинаковую размерность. Действительно, согласно теореме 3 изоморфизм аффинных пространств над полем равносилен изоморфизму векторных про- странств сдвигов, а изоморфизм векторных пространств (см. п. 4.3) равносилен совпадению их размерностей. Следствие 2. Автоморфизмы аффинного пространства Й над полем, оставляющие на месте какую-нибудь точку О £ Й, —
334 АФФИННЫЕ ПРОСТРАНСТВА [Гл. V1IT это отображения вида ср: X -> О • ОХ', где <р — произвольный фикси- рованный автоморфизм векторного пространства L(2l). В самом деле, если ср — автоморфизм пространства 2(, остав- ляющий на месте точку О, то Х^О - Ш = 0 -ОДС = 0 -ОХ\ Обратно, если ср — автоморфизм L (21), то ХД^ = (O-OX^(O-OY^ = OY^ — ОХ*= (OY — OX)* = XY\ и потому согласно теореме 3 ср — автоморфизм пространства 21. Теорема 4. Для произвольной точки О аффинного прост- ранства 2( над полем К каждый автоморфизм ср пространства 21 над X может быть представлен в виде '? = <?o'U> (28) где <ol — подходящий сдвиг 2(, а ср0 — автоморфизм 2(, оставляю- щий точку О на месте. Для каждого автоморфизма е разложение вида (28) однозначно. Пусть ср — автоморфизм пространства 21. Тогда преобразование ср0 = ср .~0Ю есть автоморфизм 21 и из соотношений 0^о = 0^0Ю = 0 видно, что ср0 оставляет точку О на месте. Полагая срЛ = ОО?, получим равенство (28). Пусть теперь ? = Mi = c?o’cPi’> где ср/’ — сдвиг, срЗ1—автоморфизм 2(, оставляющий на месте О. Тогда O.cp))’cpr = O.cp3W = O- Так как сдвиг ср^’ср^1 оставляет на месте точку О, то cp'^’cpf1 = — 00, откуда ср^’ = срх и срй’ = <р0. 29.2. Линейные многообразия. Пусть 21 — аффинное прост- ранство над некоторым полем /<. Векторное пространство L(2!) сдвигов 21 обозначим через 8. Тогда каждой паре точек X, Y£ 21 будет отвечать в 8 вектор XY = XY, и это соответствие удовле- творяет аксиомам Ai, Аа из п. 29.1. Размерностью аффинного пространства 2( называется размерность соответствующего вектор- ного пространства 2. В частности, аффинное пространство раз- мерности 0 состоит лишь из одной точки. Точки Хо, Xi, ..., Хт пространства 21 называются линейно не- зависимыми, если линейно независимы векторы ХйХх, Х9Х%, ... ..., Х0Хт. Точка Х£ 21 называется линейно зависимой от последо-
§ 29J ОБЩИЕ АФФИННЫЕ ПРОСТРАНСТВА 335 вательности точек Хо, Хь Хт, если вектор Х0Х может быть линейно выражен через векторы XoXj,..., Х№Хт. В этих определениях точка Хо играет особую роль. На самом деле, линейная зависимость не связана с порядком точек в после- довательности Хо, Xi,Хт. Пусть О — произвольная точка пространства 5?1. Тогда Xjc'l = OXi — aX9 (1 = 0,1.....m), и свойство системы точек Хо, ... , Хт быть линейно независимой равносильно тому, что для любых Хъ ... , Хот g X из соотношения х, (ох? - ох0)+...+хл(бх^_ ОХ?) = о следует Х1==... = Хт = О. Полагая Хо =—Xj —... — Xm, видим, что точки Хо, Xi, ... , Хт тогда и только тогда линейно незави- симы, когда при любых Хо, Хъ ... , Хот £ X из соотношений ^•о -f Xi -j- Х/n = О, Хоох;+xtox; 4-... +xmox;=о вытекает Хо — Xj —... == Хт — 0. В это утверждение точки Хо, Х1; ..., Хт входят уже равно- правно, и потому, если последовательность точек Хо, Xi, ... , Хт линейно зависима, то линейно зависима и последовательность Х,-о, X!lt ..., Xim при любой перестановке (j0, Л, ••• , im) чисел 0, 1, ... ... , т. Это же относится и к понятию линейной зависимости точки X от последовательности точек Хо, Х)5 ... , Хт. В указанных определениях предполагалось, что последова- тельность Хо, Xi, ..., Хт имеет не менее двух членов (т:>1). По определению полагают, что система, состоящая из одной точки, линейно зависима и что линейная зависимость точки X от си- стемы Хо означает, что X — Хо- Из теорем п. 4.2 о линейной зависимости векторов непосред- ственно получаем, что а) последовательность точек Хо, Х1( ... , Xm (/n2s 1) тогда и только тогда линейно зависима, когда хотя бы один из ее членов линейно зависит от остальных', б) если точка X линейно зависит от точек Хо, • • •, Хт, а каждая из точек Xt линейно зависит от точек Y^, ... ,Yk, то точка X линейно зависит от точек Ylt, ... , в) если точка X линейно зависит от точек Хь ..., Хт, то X линейно зависит и от точек Хо, Xi...Хт, где Хо — любая точка пространства. Из свойства в) следует, что если система точек Хо, Xi,... ,Хт линейно независима, то и каждая ее подсистема, содержащая
336 АФФИННЫЕ ПРОСТРАНСТВА [Гл. VIII более одной точки, также линейно независима. Это позволяет ввести следующее определение: произвольная (конечная или бес- конечная) совокупность точек ЭЛ аффинного пространства 81 на- зывается линейно независимой, если каждая ее конечная под- совокупность, содержащая более одной точки, линейно незави- сима . Аналогично говорят, что точка X С 81 линейно зависит от со- вокупности точек ЭЛ, если X линейно зависит от какой-то конеч- ной подсовокупности точек из ЭЛ. Линейным замыканием произвольной непустой совокупности ЭЛ точек аффинного пространства 81 называется множество всех точек X £ 81, линейно зависящих от совокупности ЭЛ. Совокупность ЭЛ называется линейно замкнутой, если ЭЛ совпадает со своим ли- нейным замыканием. Линейно замкнутые совокупности точек аффинного простран- ства называются его плоскостями или линейными многообразиями. Иными словами, некоторая совокупность ЭЛ точек аффинного пространства 81 называется плоскостью в 8(, если для любых Xt, ... , Хт б. ЭЛ совокупность содержит и любую линейно зави- сящую от Xi, , Хт точку пространства 21. Отсюда следует непосредственно, что плоскостями заведомо являются каждая точка и само пространство 81. Плоскости ЭЛ, Л называются инцидентными, если одна из них содержится в другой. Если ЭЛ сЛ> то говорят также, что ЭЛ лежит на Л (или Л проходит через ЭЛ). Между плоскостями аффинного пространства 8! и линейными подпространствами векторного пространства L (81) существует весьма простая связь, которая иногда используется и для опре- деления понятия плоскости. Теорема 1. Если для какой-то совокупности ЭЛ точек аф- финного пространства 81 и некоторой точки Р Q ЭЛ множество £(ЭЛ) векторов вида РХ(Х£ ЭЛ) является линейным подпрост- ранством векторного пространства А (81), то ЭЛ — плоскость в 81. Для любой непустой плоскости ЭЛ аффинного пространства 8[ и любой точки Р С ЭЛ совокупность L(S)l) всех векторов вида РХ (X С ЭЛ) является линейным подпространством в L (81), не зави- сящим от выбора точки Р в ЭЛ. Действительно, пусть Р £ ЭЛ и £(ЭЭ1) — подпространство в L(8l). Если Xt,... , Хт € ЭЛ и точка X С 8( линейно зависит от Xi, ... , Хт, то для подходящих 4....£ К РХ = Ъ~РХ1 Д-... + ьтРХт £ L (ЭЛ), т. е. для подходящей точки У 2)1 имеем PX ==PY\ откуда Х = У€Л1.
§ 29] ОБЩИЕ АФФИННЫЕ ПРОСТРАНСТВА 337 Обратно, пусть ЭЛ — плоскость в 51 и Р, X, Y £ 2)1, X, р € К. Полагая 0 = Р-(фРХД-^Р?\ видим,-что T^ = \PX-^PY, т. е. точка Q линейно зависит от Р, X, Y и потому Q £ 2)1, PQ € £(ЭЛ); т. е. Л (ЭЛ) — линейное подпространство в Л (21). Для любых Р, Pi, X g ЭЛ имеем Р£Х = РХ— PPit и, следовательно, совокупность векторов вида Р£Х (X £ ЭЛ) совпадает с совокуп- ностью векторов вида РХ (X g ЭЛ). Отметим два важных следствия, вытекающих из теоремы 1. Следствие 1. Пусть О — фиксированная точка аффинного пространства 51, ЭЛ — какая-нибудь плоскость, проходящая через О, и Р — произвольная точка 51. Тогда совокупность 51 = ЭЛ • ОР всех сдвинутых точек плоскости 2)1 является плоскостью в 51, прохо- дящей через Р. Обратно, если 91— плоскость, проходящая через Р, то ЭЛ = 91 • РО — плоскость, проходящая через О. В самом деле, из О С ЭЛ следует Р = О OP g 91 и для каждой точки X £ 91 существует точка У £ ЭЛ, для которой X — Y ОР. Отсюда YX = OP, PX.=OY, и потому £(ЭЛ)=Л(ЭЛ-ОР). Следствие 2. Для каждой фиксированной точки О аффин- ного пространства 51 отображение X ->0Х (X $ 51) определяет вза- имно однозначное соответствие между линейными подпростран- ствами векторного пространства L (51) и плоскостями простран- ства 51, проходящими через О. Доказательство очевидно. В п. 29.1 было указано, что если каждый вектор о вектор- ного пространства 8 назвать точкой и положить vw — w— v, то получится аффинное пространство А (?) над 8. Какие совокупно- сти векторов 8 будут плоскостями в А (8)? Выделяя в А (8) в качестве фиксированной точки О нулевой вектор, видим, что отображение X -> ОХ, о котором идет речь в следствии 2, обращается в тождественное отображение w -> w. Поэтому плоскостями пространства А (8), проходящими через'О, будут все линейные подпространства пространства 8 и только они. Согласно следствию 1 плоскостями, проходящими через произ- вольную точку /2^8, будут совокупности векторов вида р -ЭЛ, где 2)1 — какое-нибудь линейное подпространство пространства 8. Базисом произвольной плоскости ЭЛ аффинного пространства 51 называется линейно независимое множество точек, линейное за- мыкание которого совпадаете 2)1. Ясно, что совокупность точек А£
338 АФФИННЫЕ ПРОСТРАНСТВА [Гл. VIII (i £ /) плоскости ЭЛ тогда и только тогда является базисом пло- скости ЭЛ, когда совокупность векторов АаА{ (i С I) для произ- вольной фиксированной точки Аа (а £ /) является базисом вектор- ного пространства £(ЭЛ). В силу теоремы о базисах векторных пространств п. 4.2 получаем: а) каждая плоскость аффинного пространства обладает ба- зисом; б) если плоскость Я)? содержится в плоскости Л, то каждый базис плоскости ЭЛ является частью подходящего базиса 31; в) все базисы любой фиксированной плоскости ЭЛ имеют одну и ту же мощность, равную разм. 1. Размерностью плоскости ЭЛ аффинного пространства 31 назы- вается размерность отвечающего ей векторного пространства L (ЭЛ). Из свойства в) следует, что размерность плоскости равна мощ- ности любого ее базиса, уменьшенной на 1. Пустое множество векторов аффинного пространства 31 иногда называется пустой плоскостью 31, имеющей пустой базис. Размерность пустой пло- скости считают, по определению, равной—1. 0-мерные плоскости — это точки пространства 31. 1-мерные пло- скости называются прямыми (прямыми линиями) пространства 31. Любые две различные точки прямой образуют ее базис, и через любые две различные точки пространства 31 проходит одна и только одна прямая. Вообще, любые /г-4-1 линейно независимых точек плоскости размерности k образуют базис этой плоскости, и потому через любые k -ф-1 линейно независимых точек (k ко- нечно) аффинного пространства 31 проходит одна и только одна A-мерная плоскость этого пространства. Для любых двух плоскостей ЭД, 91 аффинного пространства 31 условимся обозначать через ЭЛ \/ 9? линейное замыкание множе- ства ЭЛ (J 91. Плоскость ЭЛ \/ 91 может быть также определена как пересечение всех плоскостей пространства 31, содержащих в себе плоскости ЭЛ и 9?. Операция \/', рассматриваемая в качестве бинарной операции, определенной на совокупности всех плоскостей аффинного про- странства, является коммутативной, ассоциативной, идемпотент- ной (т. е. ЭЛ \/ ЭЛ = ЭЛ), и для любых плоскостей ЭЛ, 9? про- странства 31 ЭЛ с 91 <=> ЭЭ1 V Например, если ..., Хт— конечная совокупность точек пространства 31, то 2n=x1vx2V-..V^ является линейным замыканием указанной совокупности, т. е. наименьшей плоскостью, проходящей через точки Xi, ..., Хт.
§ 291 ОБЩИЕ АФФИННЫЕ ПРОСТРАНСТВА 339 Размерность ЭЛ равна максимальному числу линейно независимых точек в совокупности Xi.....Хт, уменьшенному на 1. В част- ности, разм. (Х1\/Х,\у...уХт)^т-1. Легко убедиться, что справедлива и общая Теорема 2. Для любых плоскостей ЭХ, X аффинного про- странства X разм. (ЭХ V X) < разм. ЭХ -ф- разм. X +1. (1) Если плоскости ЭХ, 91 имеют общую точку, то разм. (ЭХ V 91) 4“ разм. (ЭХ Q 91) — разм. ЭХ разм. 91. (2) Докажем сначала равенство (2). Пусть О £ ЭХ Q X. Тогда при отображении Х-+ОХ пространства X на векторное пространство L ('Л) плоскости из 91, проходящие через точку О, будут перехо- дить в линейные подпространства векторного пространства L (Л) с сохранением размерностей и отношения включения. Поэтому формула (2) является непосредственным следствием аналогичной формулы для линейных подпространств векторных пространств (см. п. 6.1, теорема 1). Оценка (1) вытекает из формулы (2). Действительно, если плоскости ЭХ, 91 имеют общую точку, то согласно (2) разм. (ЭХ V 91) «£ разм. ЭХ разм. 91. (3) Пусть ЭХ П 91 = ф. Присоединяя точку О £ ЭХ к базису плоско- сти 91, получим базис O\/9i, т. е. разм. (О\/Х) = разм. Х-ф-1. (4) Так как плоскости ЭХ и 0\/ X имеют общую точку О, то на основании (3) разм. (ЭХ V 91) = разм. (ЭХ \/ О V 91) разм. ЭХ -ф- разм. (О \/ X), откуда в силу (4) получаем (1). Итак, если плоскости ЭХ, X не имеют общих точек, то раз- мерность ЭХ \/ X лежит в следующих границах: max (разм. ЭХ, разм. X)<фразм. (ЭХ \/91)г=;разм. ЭХ -ф-разм. 91 -ф-1. На примерах легко убедиться, что размерность ЭХ \/X на са- мом деле может принимать любое значение, лежащее в этих гра- ницах. Каждой плоскости 2)1 произвольного аффинного простран- ства 31 отвечает линейное подпространство L (ЭХ) векторного про- странства £(Х). Согласно § 6 (см. задачу 3 на стр. 109) в L(X) найдется дополнительное подпространство £i, удовлетворяющее
340 АФФИННЫЕ ПРОСТРАНСТВА [Гл. VIII условиям Е(ЭЛ)Д-£1 = Е(21), L (j»i) П ^ = 0, где о — нулевой вектор пространства Д (21). Размерность оди- наковая у всех дополнительных подпространств, называется кораз- мерностью Е(ЭЛ) в L (21). По определению коразмерностью пло- скости ЭЛ в пространстве 2! называется коразмерность вектор- ного подпространства Л (ЭЛ) в векторном подпространстве L (21). Этому определению можно придать и другой вид. Для каждой плоскости ЭЛ назовем некоторую плоскость 31 дополнительной к ЭЛ в пространстве 21, если ЭХ V 31 -----21 и пересечение ЭЛ Q 3t состоит лишь из одной точки. Ясно, что в этих условиях под- пространство £(ЗД будет дополнительным к Л (ЭЛ) в L (21), и по- тому коразмерность плоскости ЭЛ в пространстве 21 равна раз- мерности любой дополнительной плоскости. Так как взаимно дополнительные плоскости имеют общую точку, то, применяя к ним формулу (2), получим равенство разм. ЭЛ Д- коразм. ЭЛ — разм. 21. (5) Если пространство 21 имеет конечную размерность, то из (5) получаем коразм. SOT = разм. 21 — разм. ЭЛ. (6) Из формул (2) и (6) для конечномерного пространства 21 не- посредственно получается Теорема 3. Для любых пересекающихся плоскостей ЭЛ, 9Z аффинного пространства 21 коразм. (ЭЛ Q 31) Д- коразм. (ЭЛ \J 3?) = коразм. ЭОТ Д- коразм. 31. (7) Однако нетрудно убедиться, что формула (7) справедлива и для бесконечномерных пространств. Следствие. Если в произвольном аффинном пространстве 21 пересечение плоскостей ЭД, ЗД...3ls не пусто, то коразм. (3?i Q ... П ЭД) ';Т коразм. ЗД Д-... Д- коразм. ЗД. (8) Для s —2 формула (8) вытекает из (7) непосредственно, а об- щий случай получается повторным применением указанного част- ного случая. Если плоскость ЭЛ лежит в плоскости 31 пространства 2J, то, рассматривая 31 как аффинное пространство над 7.(31) и обозна- чая через коразм. ^ЭЛ коразмерность плоскости ЭХ в простран- стве ЗД получаем формулу коразм. деЭЛ Д- коразм. 3? = коразм. ЭЛ, (9) легко устанавливаемую путем перехода к подпространствам век- торного пространства L (21). Из формулы (9), в частности,
§ 291 ОБЩИЕ АФФИННЫЕ ПРОСТРАНСТВА 341 следует, что если коразмерность плоскости ЭЛ в Ш конечна и ЭЛ czЛ, то коразм. Э1 =£5 коразм. ЭЛ — 1. (10) Плоскости, коразмерность которых равна 1, называются гипер- плоскостями. Иными словами, в аффинном пространстве конечной размерности п гиперплоскостями называются плоскости размер- ности п — 1. Поэтому в таком пространстве через каждые п ли- нейно независимых точек проходит одна и только одна гипер- плоскость. Рассмотрим теперь какую-нибудь конечную совокупность ги- перплоскостей Фп ...,фЪ в произвольном аффинном простран- стве 31. Согласно формуле (8) имеем 0 < коразм. № Г) ... Q 1&) s. (11) Говорят, что гиперплоскости ..., ЦЛ (для s, не превосхо- дящего размерности 31) находятся в общем положении, если имеет место точное равенство коразм. ($! П ... П ЦЬ) ^=s. (12) Покажем, что из (12) для каждого t-szs следует, что коразм.(фЦ Q ... = Г В самом деле, если бы оказалось, что коразм. (ф^П ... П W<?. то в силу (8) и (11) мы имели бы коразм. (№ П • • • П W П (Фм П • • • И Ф.)) < t + (s -1) - s в противоречие с (12). Теорема 4. Каждая плоскость ЭЭ1 конечной коразмерности s является пересечением подходящих s гиперплоскостей. Выбираем какой-нибудь базис ЭЛ и дополняем его некоторыми точками А], ..., As до базиса всего пространства 31. Пусть фг есть линейное замыкание множества ЭЛ U {^i......А-ь A+i, ..., Д4- Так как Ф 51 и \J Ai — ^, то ф)г— гиперплоскость (< = 1, ..., S) и ЭЛс^П...ПФ<. Из Ai получаем ... ЛФ., откуда согласно (10) коразм. (Ф1П • • П Ф*) s-
342 АФФИННЫЕ ПРОСТРАНСТВА [Гл. VIII Сравнивая это неравенство с (11), получаем коразм. (ф! П • •. П ф$) = s. Поскольку коразмерности плоскостей ЭЭ1 и ф1 Q ... П ф5 сов- падают и первая содержится во второй, то в силу (11) обе пло- скости совпадают, что и требовалось. В заключение сделаем несколько замечаний по поводу при- нятого выше определения понятия плоскости. Это определение может быть переформулировано следующим образом: совокуп- ность ЭЛ точек аффинного пространства 3( называется плоскостью, если для каждого натурального s и каждой последовательности Aj, ..., As точек из ЭЛ любая точка пространства 3(, линейно зависящая от точек упомянутой последовательности, принадле- жит ЭЛ. На самом деле, в этом определении достаточно принять s = 3, а для ряда типов основных полей X достаточно принять и s = 2. Именно справедлива Теорема 5. Если совокупность ЭЛ точек аффинного про- странства 31 вместе с любыми своими тремя точками содержит и все линейно зависящие от них точки 31, то ЭЛ — плоскость. Если 31 — аффинное пространство над полем К., характеристика кото- рого отлична от 2, и некоторая совокупность ЭЛ вместе с любыми своими двумя точками содержит и У все линейно зависящие от них точки 31, ^^/1 tno ЭЛ — плоскость в 31. / / Докажем второе утверждение. Пусть / множество ЭЛ удовлетворяет условиям / / этого утверждения и Хо, Xt, Х2, ...— / X последовательность каких-то точек ЭЛ. 1/^Надо доказать, что для любых Хъ ... ... , Х5^ \ соотношение Х0Х = XjX0Xi -j-... -j- Х5Х()Х5. Рис. 5. влечет Х^ЭЛ. Для s= 1 это истинно в силу условий теоремы. Далее, применяя индукцию, полагаем, что сформулированная импликация истинна для какого-то s 1 • Пусть х^=)4хл+...+xs+1xX7 Рассмотрим точки X, Z, удовлетворяющие соотношениям Согласно индукции из этих соотношений следует, что X £ ЭЛ, Z С ЭЛ. Теперь, полагая (рис. 5) Х»в=1(ад + ад>
§ 29] ОБЩИЕ АФФИННЫЕ ПРОСТРАНСТВА 343 видим, что точка В линейно зависит от X и Z, а лючка Y ли- нейно зависит от точек Хо и В. В силу условий теоремы отсюда последовательно находим В С ЭЛ, Y g SD1, что и требовалось. Пер- вое утверждение теоремы 5 доказывается аналогично, но без ис- пользования точки В, и потому для его истинности характери- стика поля X безразлична. Нетрудно видеть, что второе утвер- ждение для полей характеристики 2 неверно. В п. 29.1 были введены два основных понятия: аффинное про- странство над векторным пространством и аффинное пространство над полем. До сих пор в этом пункте мы рассматривали аффин- ные пространства над векторным пространством. Пусть теперь 31 — аффинное пространство над полем X и S (X, Y, Z), (X, Y) — основные операции в 31. Мы уже видели в п. 29.1, что сдвиги 31 — это автоморфизмы частного вида пространства 21 над X- Покажем теперь, что точка X пространства 21 тогда и только тогда ли- нейно зависит от каких-то точек Хо, Хъ ..., Хт из 21, когда X выражается в виде полинома от Хо, ..., Хт с помощью опера- ций S, Р>- В самом деле, если для некоторых Хъ ..., Xm £ X Х0Х — AjXoXj -ф-... -ф- ХтХ»Хт, то согласно п. 7.1 Х = ((Х0-Х1ХЛ)...).ХтХЛ. (13) Но для любых В, С, Z £ 21, X £ X Z-'/BC = S(B, Р^В, С), Z). Преобразуя с помощью этой формулы правую часть равен- ства (13), получим требуемое выражение X в виде полинома от точек Хо, Xi, ..., Хт. Обратно, из Х-5(УЬ У2, Уз), 2 = РХ(УЪ У2) следует, что У 3Х = У,К EZ = худл,, т. е. что X, Z линейно зависят от Уъ У2, У3, и потому если X выражается в виде полинома от Хо, Хъ ..., Хт, то X линейно зависит от Хо, Хь ..., Хт. Согласно определению совокупность точек пространства 21 называется плоскостью, если вместе с произвольными своими точками Xi, ..., Хт совокупность ЭЭ1 содержит и все линейно зависимые от них точки 21, т. е. содержит значения всевозмож- ных полиномов от Xi......Хт. Иначе говоря, плоскости в про- странстве 21 — это просто подалгебры алгебры 21, а линейные за- мыкания суть подалгебры, порожденные элементами соответствую- щих множеств.
344 АФФИННЫЕ ПРОСТРАНСТВА [Гл. VIII 29.3. Параллельные плоскости. Мы уже видели, что для каж- дой плоскости ЭЛ аффинного пространства 31 совокупность Л(Э.Л) всех векторов вида XY (X, Y С ЭЛ) является подпространством векторного пространства L(il). Подпространство L(3)l) часто на- зывают касательным подпространством к плоскости ЭЛ. Определение. Плоскости Л пространства 31 назы- ваются параллельными (символически ЭЭ1 || 91), если их касательные векторные пространства L(-^)i) и С (91) инцидентны, т. е. Л (ЭЛ) с Л (9?) или L(9l)^L(Wl). Из этого о .рэделения сразу вытекают несколько важных след- ствий. Следствие 1. Пересекающиеся плоскости 9?ii, ЭЛ2 тогда и только тогда параллельны, когда одна из них содержится в другой. Действительно, если ЭЛ] и ЭЛ2 имеют общую точку О, то А(ЭЛ,) (i — 1, 2) есть совокупность векторов вида OX (X £ ЭЭ1,), и потому инцидентность касательных пространств А (ЭЛ]) и /,(ЭЛ2) равносильна инцидентности плоскостей ЭЛ], ЭЛ2. Следствие 2. Если плоскости ЭЛ], ЭЛ2, ЭЛ3 имеют одну и ту же конечную размерность (или одну и ту же конечную кораз- мерность) и ЭЛ] || ЭЭ?3, ЭЛ2 || ЭЛ3, то ЭЛ( || ЭЛ2. По условию размерности (коразмерности) касательных про- странств Л(ЭЭ1;) конечны и одинаковы. Поэтому инцидентность L (ЭЛ,), L (ЭЛ7) эквивалентна их совпадению, и утверждение след- ствия сводится к тривиальному замечанию, что из /,(ЭЛ]) = /.(ЭЛ8), L (ЭЛ«) — L (ЭЛ3) следует L (ЭЛ]) — L (ЭУо2). Следствие 2 показывает, что для каждого конечного k все ^-мерные плоскости произвольного аффинного пространства 31 распадаются на пучки параллельных между собою плоскостей. Эти пучки иногда называются k-мерными направлениями в 31. Следствие 3. В аффинном пространстве 31 для любой пло- скости ЭЭ1 и любого сдвига и С L(W) ЭЭ1 || ЭЛ • и. Действительно, касательное пространство L (ЭЛ • и) состоит из векторов вида XuYи (X, Y С ЭЛ). Но XuYu = ХйХ + XY + YYu = — и + XY и = XY, и потому L (ЭЛ • и) — L (ЭЛ). Следствие 4. В аффинном пространстве через каждую точку В проходит одна и только одна гиперплоскость ф, парал- лельная произвольной наперед заданной гиперплоскости ЭЛ. Если В£^ЭЛ, то из следствия 1 видно, что единственной ги- перплоскостью, проходящей через В и параллельной ЭЛ, будет
§ 29] ОБЩИЕ АФФИННЫЕ ПРОСТРАНСТВА 345 сама гиперплоскость ЭД. Поэтому можно предполагать, что В ^3)1. Согласно следствию 3 гиперплоскость • ОВ (О С ЭД) проходит через В и параллельна ЭД. Если еще какая-нибудь гиперпло- скость 9? проходит через В и 91 || ЭЛ', то согласно следствию 2 9< || ЭД • ОВ, и в силу следствия 1 91 и 3)1 ОВ инцидентны. Но инцидентные гиперплоскости совпадают, что и требовалось. Теорема 1. Если в аффинном пространстве ?! гиперплоскость ф и ка- кая-нибудь плоскость 91 не пересека- ются, то ф параллельна 91. Мы хотим показать, что L (91) с L (ф). Пусть, напротив, для некоторых А, ВС 91 вектор АВ не принадлежит L (ф). Выбираем произвольную точку О С Ф (рис. 6) и рассматриваем вектор ОА. Так как ф — гиперплоскость, то £(И) = В(ф) + В(Л\/В). и потому для подходящих X ~ ф, U С А V В имеем О А = .= ОХ— AU, откуда OU — OX и, следовательно, U — X в про- тиворечии с условием ф П 91 = Q). Теорема 2. Для того чтобы непересекающиеся плоскости ЭД, 91 были параллельны, необходимо и достаточно, чтобы одна из них была гиперплоскостью в пространстве ЭД \/ 91. Достаточность непосредственно содержится в теореме 1. Дока- жем необходимость. Пусть L (91) Д/. (ЭД), Af 91. Достаточно показать, что 3)1 \/ 91 с \/ А. Плоскость ЭД \/ 91 состоит из тех точек X, которые зависят линейно от каких-то точек А,Х},... ... , Xs из 91 и точек Уь ... , Yt из ЭД. Таким образом, лх^мулл- ... ... = ДУ + ((л1-|- ... +(is)40 + 0Z (У С 91, O,Ze ЭД). ___По предположению AY С L (91) <= L (ЭД), и, следовательно, AY — OU (17 С 3)1). Отсюда вытекает, что АХ С L (ЭД V А), и потому X С ЭД V А. Следствие 1. Если плоскости ЭД, 91 конечномерные и не пересекаются, то они параллельны тогда и только тогда, когда разм. (ЭД V91) = шах (разм. ЭД, разм. 91)+ 1. (1) Доказательство очевидно. Из этого следствия, в частности, заключаем, что две непересекающиеся прямые параллельны тогда
346 АФФИННЫЕ ПРОСТРАНСТВА [Гл. VIII и только тогда, когда они лежат в одной двумерной плоскости. Аналогично непересекающиеся прямая и двумерная плоскость па- раллельны тогда и только тогда, когда они лежат в трехмерной плоскости, и т. д. Следствие 2. Для каждого конечного /г^>0 в аффинном пространстве 21 через каждую точку В проходит одна и только одна k-мерная плоскость ф, параллельная наперед заданной k-мер- ной плоскости Можно ограничиться случаем, когда В В силу фор- мулы (1) плоскость ф должна быть гиперплоскостью в простран- стве В, и потому дело сводится к следствию 4 из опреде- ления параллельных плоскостей. 29.4. Линейные функционалы. Функция f: 21->Х, определен- ная на множестве всех точек аффинного пространства 21 со зна- чениями в основном поле Д, называется функционалом на 21. Понятие функционала на 31 является частным случаем понятия функции, определенной на произвольном множестве, значения которой принадлежат заданному полю К- Для таких функций в п. 4.1 определены понятия суммы и произведения числа на функцию, причем оказывается, что относительно этих операций совокупность всех функций образует линейное пространство, размерность которого совпадает с мощностью множества, служащего областью определения. Функционал f, определенный на аффинном пространстве 2(, называется линейным (или аффинным) на 21, если для любых О, Р, Q, R С 21 и X, р. £ Д, удовлетворяющих соотношению бД==ЮРД-р.О(2, (1) имеет место равенство f(^) = X(f(P)-f(O)) + (i(f(Q)_f(O)) + f(O). (2) Покажем, что для любого линейного функционала f для про- извольных Хо, Xi......Xs, X С 21 и Хь ... , Xs £ Д истинна импликация ХДС= 2 №!=>№)= 2 \(/(Х;)-/(Хо)) + /(Хо). (3) i — 1 i = 1 Для s = 2 импликация (3) совпадает с импликацией (1)=£>(2), определяющей линейность f. Далее по индукции полагаем, что импликация (3) истинна для какого-то фиксированного зэ=2. Пусть Х0У = У, Х;Х0Х;. Рассматривая точку X, удовлетворяю- (=1 _________________ S _____ щую условию Х0Х = У Х(-Х0Х(-, получим (3). Далее из соотно- i=i
§ 29J ОБЩИЕ АФФИННЫЕ ПРОСТРАНСТВА 347 шения ХйУ — 4- Xs+IXoXs+i и импликации (1)Д>(2) получаем f (У) = (I (X) - f (Хо))+xs+1 (f (Xs+1) - f (Xe)) 4- f (Хо)= = SM№)-№))+№), i = 1 •• что и требовалось. Ясно, что все постоянные функционалы являются линейными. Также очевидно, что сумма линейных функционалов и произве- дение числа на линейный функционал являются снова линейными функционалами. Поэтому совокупность всех линейных функцио- налов на аффинном пространстве 31 есть линейное пространство. Это пространство обозначается через 3(у и называется сопряжен- ным к Ш. Множество всех постоянных функционалов является одномерным линейным подпространством пространства -ilj. Лемма. Если f — линейный функционал на аффинном про- странстве 8( и в некоторых точках А, В ' 31 имеем f (Л ) В- f (В), то для любого а < X на прямой А\/ В найдется точка X, в которой f(X) = a.. Для произвольной точки X £ А V В имеем АХ = Х-АВ (XgX), (4) откуда согласно (2) f(X) = X(HB)~f(X)) + f(X). Поэтому, беря для X значение Х=(а-/(Л))(/(В)-ИЛ))-1, получим из (4) искомую точку X £ А \/ В, для которой f(X) = a. Теорема 1. Для каждого непостоянного линейного функ- ционала f на аффинном пространстве 81 совокупность тех точек X £ 81, в которых f имеет фиксированное значение a С X, является гиперплоскостью в 31. Обратно, для любой гиперплоскости ЭЛ и произвольного a е X существует такой линейный функционал f, значения которого равны а на ЭЛ и отличны от а вне ЭЛ. Докажем первое утверждение. Пусть ЭЛ — совокупность тех точек X е 81, для которых f(X) = a. Так как функционал f не постоянен на 31, то для подходящих А, В g 31 будет f (А) f (В). Согласно лемме отсюда следует, что на прямой А V В найдется точка X, принадлежащая ЭЛ, и потому совокупность ЭЛ не пустая. Если Хо, Xi, .... Xs £ ЭЛ и X—линейно зависящая от них точка, *го /(Х0) = /(Х1)= ... =/(Хд) = « (5)
348 АФФИННЫЕ ПРОСТРАНСТВА [Гл. VIII И ДЛЯ ПОДХОДЯЩИХ Хь . .. , Xs £ X ад=х1.вд1 +... -ps.xX. (6) Из формул (6), (3), (5) находим /(Х) = а, т. е. X $ ££>i. Иначе говоря, совокупность ЭЛ есть плоскость в 31. Остается проверить, что коразм. ЭЛ = 1. Поскольку функционал f не по- стоянен, то найдется точка А, для которой /(Л)т^а, и потому А С ЭЛ. Возьмем произвольную точку X (Е 'Л и покажем, что Xf А\/Э)1. Если f(X) — a., то X £ ЭЛ и доказывать нечего. Поэтому пусть [(Х)^а и пусть М £ ЭЛ. Согласно лемме на прямой А\/ М (рис. 7) найдется точка В, в которой /(В) f(X), и потому на прямой В\/ X найдется точка N С ЭЭ1. Мы видим, что X линейно зависит от В, N, а В линейно зависит от А, М. Поэтому X линейно зависит от А, М, X N и Хе X А Докажем теперь второе утвержде- ние теоремы. Пусть 3( = ЭЛ\/^> М е ЭЛ- Тогда для произвольной точки X е найдется разложение м N_вида рИс. 7. мх=х.лд4 4-л«7 (хе х, ие эл) и только одно. Вводя функционал /0(Х) = Х, видим, что он равен 0 на ЭЛ и отличен от 0 вне ЭЛ, а функционал f(X) = = fe(X)4-a равен а на ЭЛ и отличен от а вне ЭЛ. Поэтому в проверке нуждается только линейность функционала /0. Пусть Л0Х41| — Xi • XqXi -j- ... —|— Xs. XOXS, MXt^Zi-MA + MUi (UitWl; t = 0, 1,... , s) и,__следовательно, /o(X;) — az (i — 0, 1, ... , s). Так как XoXj — MXj — MX6, то из формул (7) получаем mxs+1=ш, д- 2 (та—та)= = (^я/— \-“<>) + ао) • AL4 откуда /о (Х5+1) = s х, (/= (Xi) - / (Хо)) + / (Хо), что и требовалось. Совокупность тех точек Х£ Я, в которых данный функцио- нал f или система функционалов /г обращается > нуль, назы- вается корневым многообразием функционала (системы функцио- налов). Поэтому теорема 1 равносильна утверждению, что кор-,
§ 29] ОБЩИЕ АФФИННЫЕ ПРОСТРАНСТВА 349 невое многообразие непостоянного линейного функционала есть гиперплоскость и каждая гиперплоскость есть корневое многооб- разие подходящего линейного функционала. Если функционал постоянен, то корневое многообразие его, очевидно, либо пусто, либо совпадает с 31 (нулевой функционал). Корневое многообра- зие системы функционалов есть пересечение корневых многооб- разий, принадлежащих данной системе функционалов. Поэтому корневое многообразие произвольной системы линейных функ- ционалов является плоскостью (возможно, пустой или совпадаю- щей со всем пространством 31). В п. 29.2 было показано, что каждая плоскость ЭЛ, имеющая конечную коразмерность s^sl, может быть представлена в виде ЭЛ — |~| ... 0 где , ... , — подходящие гиперплоскости. Обозначая через ft линейный функционал, для которого является корневым многообразием, видим, что ЭЛ будет сово- купностью тех X С 21, Для которых Л(Х)=о,..., Д(Х) = 0. (8) Обращая вопрос, спросим себя, для каких линейных функ- ционалов ft, ..., fs соответствующее корневое многообразие (8) будет плоскостью коразмерности s? Теорема 2. Для того чтобы корневое многообразие системы линейных функционалов ft,...,fs было плоскостью коразмер- ности s, необходимо и достаточно, чтобы функционалы ft, ... , fs были линейно независимы (в 3iy) и имели хотя бы одну общую корневую точку. Необходимость. Обозначим через ЦЗ,- корневое многооб- разие функционала Если fs (X) — a-tft (X) as tfs-i (X) (X £ ?!), то фц П ... П S1V1E$S- Поэтому коразм. ($, П П IV) = = коразм. (431 f) ... Р| Ц14..1) Дх, и, следовательно, условия теоремы необходимы. Достаточность. Положим ЭЛ = 43, п ,.?п п 43s. Согласно п. 29.2 коразм. ЭЛ < s. Пусть коразм. ЭЛ <О- Тогда в 31 найдутся точки At, ... , Л5_1, для которых 8l = aR\MiV--\Ms-b (9) Рассмотрим всевозможные функции, определенные на мно- жестве {Л1, ..., со значениями в поле X- Эти функции образуют линейное пространство, размерность которого равна
350 АФФИННЫЕ ПРОСТРАНСТВА [Гл. VIH s—1, если точки Дь As~i различны, и меньше s—1, если какие-то из этих точек совпадают. Таким образом, пространство функций, определенных на {А, ..., Л5_1}, имеет размерность не выше s—1, и потому среди любых s функций, определенных на указанном множестве, хотя бы одна может быть выражена линейно через остальные. В частности, если мы будем рассмат- ривать функционалы Д, ... , fs лишь на множестве {Дь ... , As_t}, то один из них заведомо можно будет выразить линейно через остальные. Пусть, например, A(X) = aJ/1(X)+ ... Н-а^-ИХ). (10) Это равенство истинно для всех точек Х=Л1; ..., Asl. Пользуясь линейностью рассматриваемых функционалов, равен- ством их нулю на плоскости 9)1 и соотношением (9), легко обна- ружить, что равенство (10) истинно для всех точек X £ 21, т. е. функционалы fi, ..., fs линейно зависимы, и достаточность усло- вий установлена. В самом деле, из (9) следует, что для каждой точки X С 21 найдутся такие О, У £ 9)1 и ..., что ОХ = KOAi + ... + X.-iOX-i + OY, потому fj (О') —ft (Y) = 0, и в силу (3) Ь(Х)=х1А(Л1)4-...+х,_1А(Л,_1) (1 = 1,..., s). (П) Принимая во внимание, что равенство (10) истинно для X — А}- (/ = 1, ..., s— 1), из (11) получаем s_1 s_1 s • 1 fs (X) = 2 ys (лу) = 2 h 2 (лу)= == S W-h ••• + rj-s-ifs~i(X), A = 1 y=l что и требовалось. Следствие 1. Пусть плоскость 9)1 в аффинном простран- стве 21 имеет конечную коразмерность в. Тогда совокупность 9)1 всех линейных функционалов на 21, равных 0 на 9)1, является век- торным пространством размерности в. Действительно, если Э)!1- содержит линейно независимые функционалы Д, ..., fs+1, то, обозначая через корневую гипер- плоскость функционала /г, получим fl 0 ^+i, и потому коразм. 9)1 ^ s-(- 1.
ДОПОЛНЕНИЯ И ПРИМЕРЫ 351 Если же все линейные функционалы из L выражаются линейно через , fs_i, то = П ... П 5&-1, и, следовательно, коразм. ВД-С s—1. Следствие 2. Для любого аффинного пространства 31 раз- мерность сопряженного пространства 31/ на 1 больше размер- ности 31. Пусть ® = 1} — базис пространства 31 и F — какая- нибудь функция, определенная на 33 со значениями в К. Фикси- руем какую-нибудь точку О 5В. Для любой точки X g 31 суще- ствует однозначно определенная система X,-, . ..„ X/ £ Д, удов- летворяющая условию OX^iOAi + ... 4-Х; OAi . 1 1 1 1 S S Для функции F определяем функционал /ffl=24(f(4)-fW)+FM. Легко проверяется, что функционал f линейный на 31 и что F -> f есть изоморфизм векторного пространства функций на 33 на векторное пространство 31/. Поэтому размерность 31/ равна мощности базиса 33, т. е. равна размерности 31, увеличенной на единицу. Дополнения и примеры 1. Пусть 91—аффинное пространство над векторным пространством £ = А(Й). Для каждой плоскости ЯЧ^Й обозначим S4-L совокупность линей- ных функционалов на 81, обращающихся в 0 на S01. Обратно, для каждой совокупности U линейных функционалов обозначим через ЦТ корневое мно- гообразие для U. Тогда для пространства й произвольной размерности спра- ведлив следующий закон двойственности', для каждой непустой плоскости DIE91 имеем (ЭЧ-Х)Т = S01 и размерность ЯЧ равна коразмерности ЯЧ-L в линей- ном пространстве 81/ — всех линейных функционалов на й. Обратно, если линейное подпространство Ией/ не содержит отличных от нуля постоян- ных функционалов, то (цТ)1 = ц и размерность U равна кораз- мерности ЦТ в й. 2. Гомоморфизмы аффинных пространств. Аффинные пространства над полем К являются алгебрами фиксированной сигнатуры, и потому можно говорить о гомоморфизмах, конгруенциях и фактор-про- странствах аффинных пространств над К (см. «АС»). Легко видеть, что если 0 — конгруенция на аффинном пространстве й, то смежными классами по 0 будут плоскости, получающиеся одна из другой сдвигами и потому параллельные между собой. Обратно, если ЯЧ— плоскость, то все парал- лельные ей плоскости, получающиеся из ЯЧ сдвигами, образуют систему смежных классов некоторой конгруенции на й. Размерность фактор- пространства равна коразмерности ЯЧ.
352 АФФИННЫЕ ПРОСТРАНСТВА [Гл. УШ 3. Из аксиом A*, AJ, AJ видно, что класс всех аффинных пространств над фиксированным полем ТС определяется посредством тождеств, т. е. этот класс является многообразием алгебр. Поэтому можно говорить о свободных аффинных пространствах над полем К с данной системой свободных поро- ждающих. Так как базис конечномерного пространства является его системой порождающих, число его элементов, уменьшенное на 1, совпадает с раз- мерностью 91 и все пространства данной размерности изоморфны, то каждое аффинное пространство 91 над Д' является свободным пространством, а эле- менты любого базиса 91 являются свободными порождающими 91. 4. Обозначим через 91 X 93 декартово произведение аффинных прост- ранств 91, 93 над фиксированным полем К (в смысле «АС» — как декартово произведение алгебр 91 и 93). Показать, что векторное Н пространство сдвигов L (91 X V) изоморфно прямой сум- ме пространств L (91) и 2.(93). В частности, аффинное пространство конечной размерности п изоморфно декартову произведению п одномерных аффинных пространств. 5. Обозначим через О группу автоморфизмов аффин- ного пространства 91. Для любой точки О £ 91 обозна- чим через Go совокупность всех тех автоморфизмов 91, которые оставляют точку О неподвижной. Наконец, Рис-°- пусть D — совокупность всех сдвигов 91. Легко прове- рить, что Go — подгруппа в G, a D — абелева инвари- антная подгруппа в G. Согласно теореме 4 п. 29.1 имеем полупрямое разло- жение G = G0D (GQ[\D=\), из которого, в частности, следует, что фактор-группа GiD изоморфна Go, Если пространство 91 одномерно, то группа Go изоморфна мультипликатив- ной группе поля Д' и потому абелева, а группа G метабелева. 6. В обозначениях предыдущего дополнения проверить равенство АО Go • ОД = ОД-1 • Go • ОА = GA, 7. Согласно теореме 5 п. 29.2, если поле К имеет характеристику, отлич- ную от 2, то каждое множество точек S01 аффинного пространства над Д', содержащее вместе с любыми двумя различными своими точками и всю проходящую через них прямую, является плоскостью. Для характеристики 2 это, вообще говоря, неверно. Пусть Д'—поле, состоящее из двух элемен- тов 0,1, V — векторное пространство пар (х, у) (х, у £ Д') и 91—аффинное пространство над £ (рис. 8). Легко проверяется, что в 91 имеется всего 4 точки и 6 прямых. Совокупность S01 — {(0, 0), (0, 1), (1,0)} плоскостью не является, а в то же время вместе с любой парой своих точек содержит и проходящую через них прямую (совпадающую с этой парой). § 30. Аффинные координаты 30.1. Координаты точки. Пусть 31 —аффинное пространство конечной размерности п над каким-то полем /С. Согласно п. 29.2 любая последовательность (Ао, Ль..., А„), состоящая из п^-\ линейно независимых точек пространства Й, называется базисом 21.
§ 30] АФФИННЫЕ КООРДИНАТЫ 353 Последовательность (Ло, ., u„), образованная произвольной точкой Ло С 21 и линейно независимыми векторами vltv„ из векторного пространства L (21), называется репером (точнее, «-мер- ным репером) в 21. Точка Ло называется началом репера. Ясно, что каждому . базису (Ло, Ai. А„) соответствует репер (Ло, Л0Л1,..., ЛоЛл) и каждому реперу (Ло, Vj,..., vn) отвечает базис (Ло, Л0У1.. Aov„). Поэтому часто не делают различий между понятиями базиса и репера. Фиксируем в пространстве 21 какой-нибудь репер R — (О, ОА1,..., ОА„) и будем называть его координатным репером. Тогда для каждой X £ 21 ее радиус-вектор ОХ будет однозначно пред- ставим в виде ОХ = ^-бЛ1 + ... + ^.ОЛ,г (1) Числа В1,..., называются координатами точки X в репере R (или-в базисе (О, Ль..., Лл)), а строка $ = (?*,..., 5я) назы- вается координатной строкой точки X в указанном репере. Эти координаты иногда называются аффинными координатами. При изменении координатного репера (например, даже при изменении порядка векторов, в котором они записываются) изменяется и координатная строка точки. Закон изменения будет рассмотрен ниже, в п. 30.4. Пусть Хо, Xt, Хъ — произвольные точки пространства. Гово- рят, что точка Xi делит пару точек (Хо, Х2) в отношении Х(Х£К), если XoXi = kXiX2. Отсюда, в частности, следует, что если точка Xj делит пару (Хо, Х2) в каком-нибудь отноше- нии, то все три точки лежат на одной прямой. Обратно, если точки Хо, Xi, Ха лежат на одной прямой и Xj Ф Х2, то Xi заве- домо делит пару (Хо, X») в отношении X — XoXi: XjX2, так как векторы X0Xi и Х1Х2 должны быть линейно зависимы. Как по данному числу X £ Д' и заданным координатам (5J,... • • • • ^). (Ч» • • > точек Хо, Ха найти координаты (£},..., S?) точки Xi, делящей пару (Хо, Х2) в отношении X? По условию имеем ОХг = $!.бЛ1+... + ^-бЛя (1 = 0, 1,2), откуда хЛ/+1=^+1-^=(М+1-^)-ол1+...+(^+1-^)-оля. Соотношение X»Xi = XXiX2 дает 12 А. И. Мальцев
354 АФФИННЫЕ ПРОСТРАНСТВА [Гл. VIII и потому «=1....") Ясно, что заданное число X должно быть отлично от —1, так как в противном случае из XoXi =— XiX2 получим Хо — Х^. Полагая Х==1, получим формулы = (/ = 1...., п) для координат середины Х> пары (Хо, Х2). Посмотрим теперь, как линейная независимость произвольных точек Xt,..., Xs пространства Я отражается на их координат- ных строках. Пусть ОХг = ^.ОЛ1 + ... + ^.ОЯ,г (г=Л........... S) (2) и, следовательно, (Е|,..., £?) есть координатная строка точки X. в выбранном репере. Линейная независимость точек по опреде- лению равносильна линейной независимости векторов XiX^,... ..., XiXs- Из равенств (2) имеем х^г=ох;_ох1 = (^-Е;)-ол1 + ...4-(^-^.олп; т. е. строка (;! — Ц,..., — £?) является координатной строкой вектора XjX, в базисе OAj..ОА„. Поэтому максимальное число линейно независимых точек в системе Xt,..., Xs, равное увели- ченному на единицу максимальному числу линейно независимых векторов в системе XjX2,...» XiX5, равно 1 -|- ранг = 1 + рангр/ — ^[j. Легко убедиться, что 1 ранг 'Ц — М ... — If ... £»-!?_ == ранг -1 1 .1 ... ^ ... ;'1 В’ ... $»
§ 301 АФФИННЫЕ КООРДИНАТЫ 355 Действительно, вычитая из 2-й,..., n-й строки правой мат- рицы ее первую строку, мы не изменяем ее ранга, и потому ранг Е‘ ... е? = ранг Е* ... Е* что и требовалось. -1 е* ... е* - о Е» — Е} ... ц — е» _ о E|-ej ... Е"-Е^ . = 1 4- ранг 1^-/ — ||, Пусть (Е1,..., Ея) — координатная строка точки X. Тогда строку (1, В1,..., Ега) часто называют расширенной координатной строкой точки X. Полученный выше результат теперь можно вы- сказать такими словами: максимальное число линейно независимых точек в системе Х\,..., Xs равно рангу матрицы, составленной из расширенных координатных строк точек этой системы. В частности, для того чтобы точки Xj,..., Хп, Хл+1 п-мер- ного аффинного пространства были линейно независимы, необходимо и достаточно, чтобы 1 1 Е} ... Е" 1 Е1 Ея 1 Si + i S» + i где Е!,..., Е? — координаты точки Xi (< = 1,..., Определитель, стоящий в (3) слева от знака Д, иногда назы- вается объемным определителем системы точек Xj,..., Хя+1. Обращение его в нуль означает, что точки Xi,..., Хп+1 лежат в одной гиперплоскости пространства 31. В п. 29.4 было введено понятие линейного функционала f (X) в аффинном пространстве 3(. Посмотрим, как значения этого функ- ционала выражаются через координаты точки X. Пусть (Е1,..., Ега) — координатная строка точки X в каком-то репере /? = (О, ОА,... ..., ОА„). Тогда из (1) и соотношения, характеризующего линей- ность /(X), получаем /(X)—А • • • 4~ ап^п А (4) где а, — f (Д,) — f (О), я0 — f (О) — фиксированные числа, завися- щие лишь от функционала f и репера R. Обратно, беря совер- шенно произвольные а0, аь ..., an X и вводя функционал / фор- мулой (4), легко проверить, что f будет линейным на 31. Говорят, что полином очЕ1 -j-... Д- алЕга Д- “о от переменных Е];... ..., Ея представляет функционал f в репере R. Из сказанного 12*
356 АФФИННЫЕ ПРОСТРАНСТВА [Гл VIII видно, что соответствие между линейными полиномами от п пе- ременных с'.... $л и линейными функционалами на ?1 взаимно однозначное, причем если функционал f представляется полино- мом aiS1 • • • + + ®о> а функционал g —- полиномом [М1 + • • • ... + Мп + 0о. то V (X) + м? (X) = (Xai + ИМ &' + ••• + (х% + + ^0- (5) Иначе говоря, ставя в соответствие каждому линейному функ- ционалу на ?1 представляющий его полином от ..., \п, мы получаем изоморфное отображение векторного пространства Лу всех линейных функционалов на 8( на векторное пространство всех (неоднородных) линейных полиномов от ..., с коэф- фициентами из основного поля X- Из (5) видно, что действия сложения линейных функционалов и умножения их на число сводятся к соответствующим действиям над строками коэффициентов линейных полиномов. Отсюда, в частности, заключаем, что максимальное число линейно неза- висимых линейных функционалов, содержащихся в системе fi (X), .... fs (X), равно рангу матрицы, составленной из коэф- фициентов линейных форм, представляющих указанные функ- ционалы. 30.2. Уравнения плоскостей. В n-мерном пространстве Л над полем X будем считать фиксированным какой-то координатный репер /? = (О, OAi, ..., ОАп) и далее под координатами точек 41 будем понимать их координаты в репере /?. Пусть Р(;‘, ..., £") — некоторое условие, связывающее про- извольные числа S1, ..., В" из X. Таким образом, для каждых конкретных значений переменных £*, ..., £ X условие Р может быть истинным или ложным. Говорят, что условие Р определяет в пространстве Я множество точек ЭЛ, если произвольная точка Х£ Si тогда и только тогда принадлежит ЭЛ, когда координаты (V, ..., tn) точки X удовлетворяют условию Р. Отсюда, в частности, следует, что если условия Р(^\ ..., V1) и Q(?'....Чп) определяют в пространстве SI соответственно мно- жества ЭЛ и 3J, то конъюнкция этих условий Р (51, ..., ;") и ......... 5”) определяет пересечение указанных множеств, дизъюнкция Р или Q определяет их объединение ЭЛ J Л, а отри- цание не Р определяет дополнение СЭЛ = 91\ЭЛ. Пусть f (S1..... ?")— какая-нибудь функция, определенная на X со значениями в X. Условие вида ZG1. .... 5»)=0 (1) называется уравнением от переменных S1, ..., а конъюнкция уравнений /,(V.....£л) = 0 (i = l, 2....s) (2)
АФФИННЫЕ КООРДИНАТЫ 357 § 30] называется системой уравнений от переменных Е1, Ел. Если система уравнений (2) определяет в пространстве 91 множество ЭЛ, то говорят также, что (2) есть система уравнений для множе- ства 3)1. Согласно приведенному выше значению множество то- чек ЭЛ, определяемое системой уравнений (2), является пересе- чением множеств, определяемых каждым уравнением системы (2) в отдельности. В произвольном поле условие оф = 0 равносильно дизъюнк- ции а = 0 или р = 0. Поэтому, если уравнения / (V, ..., Е") = 0, я(Е’, И = 0 (каждое в отдельности) определяют в пространстве 91 соответ- ственно множества ЭЛ и Л, то уравнение Ж ..., Е")-^1, £л) = 0 (3) определяет в 91 объединение множеств ЭЛ и 91. Множество ЭЛ точек аффинного пространства 91 называется алгебраической гиперповерхностью, если существует такой много- член /(Е1, ..., Ел) от переменных Е1, ..., е коэффициентами в поле /С, что ЭЛ определяется уравнением (1). Степень многочлена f по совокупности переменных Е1, ..., Ея называется степенью гиперповерхности ЭЛ. Так как одно и то же множество ЭЛ может иметь много различных уравнений, то одна и та же алгебраическая гиперповерхность может иметь различ- ные степени. Нетрудно сообразить, в частности, что если какая- то гиперповерхность имеет степень п, то любое большее число также будет ее степенью. Наименьшая из степеней заданной алгебраической гиперповерхности называется ее порядком. Поскольку степень произведения полиномов равна сумме сте- пеней сомножителей, то из формулы (3) следует, что объедине- ние алгебраических гиперповерхностей порядков s и t есть снова алгебраическая гиперповерхность, порядок которой не выше s -ф-1. Алгебраическая гиперповерхность ЭЛ называется распадаю- щейся, если она есть объединение каких-то двух отличных от нее непустых алгебраических гиперповерхностей. Пересечение конечного числа алгебраических гиперповерх- ностей называется алгебраическим многообразием. Понятия алгебраической гиперповерхности и ее порядка мы определили с помощью вида уравнений, которым удовлетворяют координаты произвольной точки гиперповерхности. С изменением координатного репера будут изменяться координаты точки, вместе с ними будут изменяться и уравнения рассматриваемого множе- ства. Поэтому было бы точнее говорить не об алгебраической гиперповерхности порядка s, а об алгебраической гиперповерх- ности порядка s в данном координатном репере, аналогично о
358 АФФИННЫЕ ПРОСТРАНСТВА [Гл. VIII распадении в данном координатном репере и т. д. Однако далее будет показано, что на самом деле свойство множества точек быть алгебраической гиперповерхностью данного порядка не за- висит от выбора координатного репера. Свойства произвольных алгебраических многообразий со- ставляют предмет изучения особой дисциплины — алгебраической геометрии. В этой книге будут изучены свойства лишь гипер- поверхностей 1-го порядка (гиперплоскостей) и их пересечений (плоскостей). Отмеченная выше зависимость определений алгебраичности и порядка от выбора координатного репера не очень удобна. Чтобы обойти эту зависимость, употребляется следующий прием. Пусть в аффинном пространстве 'Л размерности п задан некоторый функционал /(X). Выбираем в 31 какой-нибудь координатный репер R = (О, 0А1г ..., 0Д„) и каждой последовательности^1, ... ..., В" чисел из /С ставим в соответствие число /(51, ..., £л), рав- ное f(X), где X — точка с координатами V, ..., tn. В резуль- тате каждому функционалу оказывается поставленной в соответ- ствие функция от п переменных Е1, ..., ?я, представляющая функ- ционал f в данном координатном репере /?. Обратно, определяя для функции /(£*, ..., ?") функционал /(X) равенством f(X)^f(l\ ..., Г), видим, что любая функция от п переменных представляет в ука- занном репере некоторый функционал. Ясно, что корневое много- образие функционала f(X), состоящее из тех точек Xg 31, для которых /(Х) = 0, совпадает с множеством, определяемым урав- нением /($1, ..., ^) = 0 в данном координатном репере. Однако в определении понятия функционала и его корневого многообра- зия координатные реперы не участвуют, и потому уравнения множеств точек выгоднее писать в виде /(Х) = 0, где f — некото- рый функционал. Спрашивается, как же при этом охарактеризо- вать те функционалы, значения которых представляются поли- номами? Ответ следующий. Мы уже видели в п. 30.1, что линей- ными полиномами представляются линейные функционалы. Далее рассматриваем функционалы F (Хь ..., Xs) от s переменных точек. Функционал F (Xt, .... Xs) называется линейным по i-му аргументу Xt, если он обращается в линейный функционал от Хг при любых фиксированных значениях остальных переменных. Функционал F(Х\, ..., Xs) называется полилинейным, если он линеен по каждому своему аргументу. Теперь мы подошли к главному пункту: функционал f(X) от одной переменной X назы- вается функционалом (или формой) s-го порядка (или степени s), если существует такой полилинейный функционал F (Xi......Xs)
? 30] АФФИННЫЕ КООРДИНАТЫ 359 от s переменных, что f(X) = F(X.....X). Легко проверяется, что при любом фиксированном координат- ном репере функционал /(X) тогда и только тогда имеет поря- док s, когда значения его представляются подходящим полино- мом степени s от координат точки X. Доказательство ввиду его очевидности мы здесь опустим. После этих общих соображений мы теперь перейдем к глав- ному вопросу этого параграфа — изучению уравнений плоскостей. Итак, пусть в заданном аффинном пространстве конечной раз- мерности п фиксирован какой-то координатный репер /? = (О, OAi, ..., ОА„). Уравнение от переменных степени 1 — это уравнение вида = (4) где по меньшей мере один из коэффициентов аь ..., а„ отличен от 0. Вводя функционал видим, что множество точек ЭЛ, представляемое уравнением (4), —• это корневое многообразие функционала f(X). Согласно п. 30.1 функционал f(X) линейный и непостоянный, поэтому ЭЭ1 есть гиперплоскость в ?(. Итак, произвольное линейное уравнение от переменных S1, ..., V' представляет гиперплоскость в аффинном пространстве. Рассмотрим какую-нибудь систему линейных уравнений Обозначая через ЭЛ,- совокупность точек, координаты которых удовлетворяют i-му уравнению из (5), видим, что система урав- нений (5) определяет пересечение гиперплоскостей ЭЛ = ЭЛ1 П ... ... П ЭЛ5. Согласно п. 29.2 это пересечение либо пустое, либо плоскость, коразмерность которой не превышает s, а размер- ность ЭЛ, следовательно, не меньше п — s. Каково же точное значение размерности ЭЛ? Введем линейные функционалы Г/(Х)=а«е‘4-...4-а^-?’- а=1......8). Плоскость ЭЛ есть корневое многообразие системы этих функ- ционалов. Согласно теореме 2 п. 29.4, если ЭЛ Ф ф, то размер- ность равна максимальному числу линейно независимых
360 АФФИННЫЕ ПРОСТРАНСТВА [Гл. VIП функционалов в системе Д, ..., fs, т. е. (см. п. 29.4) разм. ЭЛ фавна рангу матрицы составленной из коэффициентов при переменных системы уравнений (5). Остается выяснить, когда Э1=0 и когда ЭЛ^ф, т. е. при каких условиях система (5) совместна. Но ответ на последний вопрос дается теоремой Кронекера — Капелли (см. п. 5.3): для совместности системы уравнений (5) необходимо и достаточно, чтобы ранг основной матрицы этой системы совпадал с рангом ее расширенной матрицы. Таким образом, нами получена Теорема. В п-мерном аффинном пространстве 'it в любом координатном репере произвольная (п— г)-мерная плоскость (Osgjrsgn) может быть представлена системой уравнений вида а^ + а'Г2 + ... + а^ = ₽г (7 = 1...г), (6) у которой ранг основной матрицы равен г. Произвольная система линейных уравнений вида (4) представляет в 91 (п — г)- мерную плоскость, если ранги основной и расширенной матриц системы (4) совпадают и равны г. Если же упомянутые ранги различны, то система (4) несовместна и потому представляет пустую плоскость. Рассмотрим следующую задачу. В пространстве 9( даны коор- динатные строки (Р), ..., Р7) точек В,- (г = 0, 1, ..., s). Найти уравнения минимальной плоскости ЭЛ =В0 V^i V-• • V^> ПР0' ходящей через заданные точки. Решим ее сначала в векторной форме. Согласно п. 29.2 пло- скость ЭЛ состоит из тех точек X С 91, у которых вектор В0Х может быть представлен в форме ВоХ = XjBoBi\SBOBS (Хъ ..., X, £/С) или ox = xt (OBj - ОВо) +... + xs (0Bs - ОВо) + ОВо. (7) Уравнение (7) иногда называют уравнением плоскости в век- торной параметрической форме. Подставляя в него вместо радиу- сов-векторов OX, OBj соответствующие координатные строки, по- лучим соотношения = + + + (i = l, ...,п). (8) Вводя обозначения р/ — перепишем эти соотношения в форме Bi=^,+...+'d\+PJ (» = 1...п), (9) выражающей координаты произвольной точки X £ ЭЛ через вспо-
§ эд АФФИННЫЕ КООРДИНАТЫ 361 могательные независимые параметры ......... Xs. Уравнения (9) называются координатными параметрическими уравнениями пло- скости Э)Е Так как ЪЯ = В^\/ В{\/.. .\/ Bs, то размерность 3)1 равна максимальному числу линейно независимых точек, содер- жащихся в системе Во, Bj, Bs, уменьшенному на 1, т. е. равна рангу матрицы С = ||7‘. составленной из коэффициентов при переменных Хъ Х5 в параметрических уравнениях. Чтобы из параметрических уравнений (9) плоскости 3)1 полу- чить ее общие уравнения вида (5), достаточно из системы (9) исключить параметры Хъ Xi. Это можно сделать, например, следующим образом. Ищем ранг матрицы Ту 1|. Пусть он равен г и, следовательно, среди уравнений (9) найдутся какие-то ire, t2-e, ..., ir-e уравнения и среди параметров Хъ ..., Xs такие параметры Хд, ..., Ху> Д <...</,), что det || ф Ф 0. Решая эти уравнения относительно неизвестных Хд, ..., А;. , получим для них линейные выражения через ;i, ..., и осталь- ные параметры Х;- (j ..., /Д'). Подставим теперь полученные значения параметров в каждое из оставшихся уравнений систе- мы (9). В результате получатся линейные соотношения между переменными и параметрами Хд / ^{/ь ..., jr}. На самом деле, в эти соотношения параметры Ху- войдут с коэффи- циентами нуль (в силу того, что г —ранг матрицы и по- тому полученные соотношения будут являться соотношениями вида (5), представляющими плоскость 3)1. В приведенных рассуждениях предполагалось, что Если г = п, то плоскость 3)1, проходя через линейно независи- мые п 1 точек, будет совпадать со всем пространством ?( и при желании ее «общее уравнение» можно написать в виде 0-V + ... + 0-^ = 0. (10) Рассмотрим обратную задачу: как для плоскости 3)1, задан- ной общими уравнениями вида (5), найти параметрические урав- нения? Пусть размерность 3)1 равна г<^п. Тогда система (5) содержит лишь г независимых уравнений и в этих уравнениях коэффициенты при каких-то г переменных образуют матрицу, детерминант которой отличен от 0. Для определенности предпо- ложим, что независимы первые г уравнений и отличен от нуля детерминант, образованный коэффициентами при переменных S1, ..., Г. Тогда, решая первые г уравнений относительно пере- менных V, .... V, получим систему уравнений вида = + + <1 = 1..............................................г>’ (П)
362 АФФИННЫЕ ПРОСТРАНСТВА [Гл. VIII равносильную системе (9). Ясно, что система (11) равносильна параметрическим уравнениям = + + _Г + Рг !...............'), ? = (/ = /-+ 1, .... п). Мы подробно рассмотрели задачу о нахождении уравнений минимальной плоскости, проходящей через заданные точки. Ясно, что эта задача представляет собой частный случай более общей задачи о нахождении минимальной плоскости, проходящей через заданные плоскости 991, 91. Однако указанная более общая за- дача формальным путем может быть сведена к первой задаче. В самом деле, плоскости 991 и 91 могут быть представлены в виде 991 = Во V V • • • V (разм. 991 = $), 91 = С0\/С1 V---VC/ (разм. 91 = 0, где Во, Bi, ..., Bs — какие-то линейно независимые точки из 991, а С», Ci, ..., Ct — линейно независимые точки из 91. Тогда 991\/91 = BoV.-.V^VCoV---VCm и задача привелась к проведению минимальной плоскости через точки Во, ..., Bs, Со, .... Ct. Спрашивается, как найти точки Во..... Bs, если плоскость 991 задана своими общими уравне- ниями вида (5)? Один из способов (не самый короткий) следую- щий. Приводим систему (5) к виду (11). Тогда в качестве то- чек В,- заведомо можно взять точки с координатными строками (Во) = (?’, .... Г. 0,0,..., 0), (В,) = (?*+ -[) + „ ?* + !< + . •••, + v + 1, 0, .... 0), (B4)=(?1 + i;+2, ₽’ + -[?+2,.... Г + р+2, 0, 1,.... 0), (BO = (^ + iA, РЧ-iA, .... Г+т;, о, о,..., I) (s + r=n). Рассмотрим еще один частный вопрос. Пусть в пространстве 91 выбран координатный репер 9? = (О, OAt, .... ОА„). Тогда плоско- сти вида O\/Ai\/...\/Air (1 sCO <\..<И’ГsCп) называются r-мерными координатными плоскостями. Полагая =ovw • Л/Л-Л/Л+М • -W (12) видим, что фь ..., суть всевозможные координатные гиперплоскости. Из (12) следует, что точка X с координатами (£*...$”) тогда и только тогда принадлежат когда е' = 0. (13)
§ 30] АФФИННЫЕ КООРДИНАТЫ 363 Иначе говоря, уравнение (13) есть уравнение гиперплоскости фг. Координатная плоскость ОХ/А^ V- • является пере- сечением всех тех гиперплоскостей фу, индекс которых отличен от й, ..., ir. Поэтому уравнения плоскости ЭЛ можно записать в форме где а, р, ..., у — это последовательность тех натуральных чисел совокупности 1, 2,.... п, которые не входят в множество {й,..., ir}. Например, уравнения i-й координатной оси O\/At можно записать в виде V==... = Si-i==^ = ... = ^ = o. В качестве иллюстрации рассмотрим следующий числовой пример. В обыкновенном вещественном трехмерном аффинном пространстве /?' задано линейное многообразие ЭЛ двумя уравне- ниями: ^‘ + 2^=1, 1 ^4-2?3-2^ = 2. / 1 Л Какова размерность ЭЛ? Составляем этой системы 1 2 —1 Г 12—22 расширенную матрицу и видим, что она содержит отличный от нуля определитель 2-го порядка, элементы которого выделены жирным шрифтом. Более того, указанный определитель принадлежит основной матрице системы. Поэтому ранг расширенной матрицы, равный двум, совпадает с рангом основной матрицы. Отсюда заключаем, что коразмерность ЭЛ равна 2, а размерность ЭЛ равна 1, т. е. ЭЛ есть прямая. Решая систему (14) относительно S1, £3, получаем !Р = — 1, = —2^. Здесь можно считать параметром, и потому (15) можно рассматривать как параметрические уравнения прямой ЭЛ. При- давая параметру 58 значения О, 1, получаем из (15), что точки с координатами (О, 0, —1) и (—2,1, —1) лежат на прямой ЭЛ. Рассмотрим еще один пример. Какие множества точек в про- странстве R3 представляются уравнениями a) W = 0, б) (е1)8 - 4- +е* - е8 -н3=о? (15)
364 АФФИННЫЕ ПРОСТРАНСТВА [Гл. VIII Ясно, что в случае а) искомое множество есть совокупность трех координатных гиперплоскостей с уравнениями: 1) £1 = 0, 2) |’ = 0 и 3) ?3 = 0. В случае б) левая часть разлагается на множители V ф- 1 и I1 — ;'2 -С и потому искомое множество есть совокупность гиперплоскостей, имеющих, уравнения 1 = О и в‘-а2-ь^=о. 30.3. Уравнения гиперплоскостей и прямых. Мы хотим здесь рассмотреть более подробно уравнения гиперплоскостей, прямых, а также условия их параллельности, выраженные в координат- ной форме. Теорема 1. Каждая гиперплоскость в п-мерном аффинном пространстве может быть представлена уравнением 1-й степени Я]?1 -ф- . . . -ф- ЯЛ£Л -ф- Я0 — 0. (1) Для того чтобы гиперплоскость, представляемая уравнением (1), совпадала с гиперплоскостью, представляемой уравнением ^1 + ... + ^л-Но==О, (2) необходимо и достаточно, чтобы их соответственные коэффициенты были пропорциональны: Гиперплоскости, представляемые уравнениями (1), (2), тогда и только тогда параллельны, когда пропорциональны соответству- ющие старшие коэффициенты: Теорема содержит три утверждения. Первое из них уже было доказано в п. 30.2. Чтобы гиперплоскости (1), (2) совпадали, необходимо и достаточно, чтобы совокупность уравнений (1), (2) определяла гиперплоскость. Согласно теореме п. 30.2 это равно- сильно тому, что а это и означает (3). Гиперплоскости (1), (2) параллельны, если они либо совпа- дают— и тогда имеем (3),—либо не пересекаются. В последнем случае уравнения (1), (2) должны быть несовместны и потому, в силу теоремы Кронекера •— Капелли, т. е. имеем (4). Итак, в обоих случаях условие (4) истинно.
§ 30] АФФИННЫЕ КООРДИНАТЫ 365 Рассмотрим задачу: дано уравнение (1) какой-то гиперплоскости ф и координаты EJ,..., некоторой точки А. Найти уравнение гиперплоскости, параллельной ф и проходящей через А. Пусть (2) — уравнение искомой гиперплоскости ф'. Так как эта гиперплоскость параллельна гиперплоскости (1), то должны выполняться условия (4). Поэтому, умножая уравнение (2) на подходящий множитель пропорциональности, мы можем предста- вить уравнение искомой гиперплоскости ф' в виде о^14-...-Н,Г + ^=о. (5) По условию точка А лежит на ф'. Поэтому я1^о-Ь • • • Ч-—|—рб=о. (6) Вычитая из (5) почленно (6), получим искомое уравнение Ясно, что гиперплоскость, определяемая уравнением (1), тогда и только тогда проходит через начало (0,..., 0) координатного репера, когда ао = О. Рассмотрим случай, когда а0т^О. Деля все коэффициенты уравнения (1) на —а0, мы приведем его к виду Числа 71,..., 7,г допускают простое геометрическое истолкова- ние. Действительно, найдем точку пересечения гиперплоскости (7) с координатной осью ОХ/А,. Уравнения этой оси имеют вид £1 = ... = е-1 = Е'+1 = ... = $я = О. (8) Решая совместно (7) и (8), находим £г = 7г. Таким образом, гиперплоскость (7) отсекает на оси О'х/А, вектор 7;ОЛг. По этой причине уравнение (7) обычно называют уравнением гиперплоскости в отрезках. Рассмотрим еще один вопрос: при каких условиях уравнение (1) представляет гиперплоскость, проходящую через координатную плоскость OVAV• -VАг (1Сг<л)? Плоскость эта состоит из точек с координатами (V,..., Г, 0,..., 0). Подставляя эти коорди- наты в уравнение (1), получим -{-а^ф-ао-О. Это соот- ношение должно выполняться для любых чисел S1,..., У поля К- Следовательно, ai = .. . = ar — a0 —0. Аналогично убеждаемся, что гиперплоскость (1) тогда и только тогда проходит через /--мерную координатную плоскость O\ZAi\J.. Л/Д/ > когда a,i = ... = a/ == = ao = O. Оставляя в уравнении (1) неизменными старшие коэффициенты aj....a„ и придавая различные значения свободному члену а0> мы получим уравнения параллельных гиперплоскостей. Поэтому,
366 АФФИННЫЕ ПРОСТРАНСТВА [Гл. VIII если в уравнении (1) а,1 = ...— а,- = 0, а свободный член а0 про- извольный, пго гиперплоскость (1) параллельна координатной плоскости 0\/A; .. \/Aiг. В частности, гиперплоскость (1) тогда и только тогда параллельна координатной оси 0\j At, когда а( = 0, т. е. когда уравнение (1) не содержит явно i-й текущей координаты. Мы знаем, что через каждые п линейно независимых точек «-мерного аффинного пространства проходит гипер- плоскость В1\/.. Х/Вп и только одна. Как написать уравнение этой гиперплоскости, если координатные строки точек Bi,..., Вп известны? Пусть (pj,..., Р"),..., (р«, ...,?") — координатные строки точек В\,..., Вп. Чтобы произвольная точка X с координатами Ч,..., лежала на гиперплоскости Bt\/.. .\/Вп, необходимо и достаточно, чтобы система точек X, Bi,..., Вп была линейно зависимой. Согласно п. 30.1 указанная система точек тогда и только тогда линейно зависима, когда координаты этих точек удовлетворяют условию 1 V ... 5" 1 РА Разлагая определитель по элементам первой строки, видим, что уравнение (9) является линейным относительно переменных 51,..., и потому представляет искомую плоскость. Свободный член уравнения (9) равен det j|P/il- Следовательно, гиперплоскость, проходящая через линейно независимые точки Bi,..., Вп, тогда и только тогда проходит через начало координат, когда deti|p/l| = O. Рассмотрим теперь более подробно уравнения прямых. Пусть в «-мерном аффинном пространстве 21 задана пара различных точек Во(Ро, ..., р") и Bi(p}, ..., р«), где в скобках указаны координаты этих точек в фиксированном координатном репере R = (O, OAt, ..., ОАп). Точка X принадлежит прямой B0\/Bi тогда и только тогда, когда для некоторого числа X будет В0Х = XB0Bi, т. е. когда (i=l,..„ «). (10) Определяя X из каждого уравнения (10) и приравнивая результаты, получим
§ 301 АФФИННЫЕ КООРДИНАТЫ 367 Обратно, если координаты Е1, ..., Е" какой-то точки X удовле- творяют равенствам (11), то, обозначая через X общую величину отношений (11), получим (10), и потому X б Bt>\/Bi. Таким образом, уравнения (11) являются уравнениями прямой, проходящей через две заданные точки. Заметим, что в отношениях (11) некоторые из знаменателей могут равняться нулю. Так как мы хотим, чтобы соотношения (11) были равносильны условиям (10), то в случае р< —р' = 0 надо полагать Е' — р' = 0. Вводя обозначения р; — Р‘ = р‘, р‘ —р‘, мы можем переписать уравнения (И) в виде Е1-р1 Е2-р2_ Числа р1, .... р" называются направляющими коэффициентами прямой, а уравнения (12) называются уравнениями прямой с на- правляющими коэффициентами. Теорема 2. Для того чтобы прямая (12) была параллельна прямой = = (13) необходимо и достаточно, чтобы их направляющие коэффициенты были пропорциональны: Прямые (12) и (13) тогда и только тогда совпадают, когда выполнены условия пропорциональности (14) и условия Р1-?1 ft2 ~ _ .. Рга - 1" J Ч2 ’ ’ <п ’ выражающие, что точка с координатами р1,..., рл, принадлежащая прямой (12), лежит на прямой (13). Из уравнений (12) видно, что на прямой, представляемой этими уравнениями, лежат точки В0(Р1, ..., Р") и Bt (р1 р1,... ..., р'г-j- рл). Аналогично на прямой (13) лежат точки Coh1,..., l") и Ci (ф - v1..-4- Vя). Согласно п. 29.3 прямые Bp\/Bi и Co\/Ci тогда и только тогда параллельны, когда CoCi = XBoBi для некоторого X б К, т. е. когда координаты векторов B0Bi и C0Ci пропорциональны. Так как координаты указанных векторов равны р1....р” и соответственно эп, то отсюда получаем (14). Поскольку для совпадения прямых достаточно, чтобы они имели общую точку и были параллельны, то второе утверждение теоремы 2 непосредственно вытекает из ее первого утверждения.
368 АФФИННЫЕ ПРОСТРАНСТВА [Гл. VIII Помимо уравнений вида (13) прямая в n-мерном аффинном пространстве может быть задана и общей системой линейных уравнений вида ai«‘+•••+Ч«л + ао==О (г = 1, .... s), (15) у которой ранги основной и расширенной матриц равны п—1. Как, зная уравнения прямой в общем виде (15), найти ее урав- нения в каноническом виде (13)? Для этого достаточно найти координаты каких-то двух различных точек прямой (15) и затем воспользоваться формулой (11); но можно поступить и следую- щим образом. По условию ранг системы (15) равен п— 1. Поэтому п—1 текущих координат — допустим £1, ..., $п'1— можно выра- зить через остающуюся текущую координату \п. В результате получим выражения вида откуда = -r^' (i = l, ... , и—1), ti—[i1_ рт-*—рт рт Это и будут канонические уравнения прямой (15). В заключение найдем еще условия параллельности прямой и гиперплоскости в координатной форме. Теорема 3. Гиперплоскость, заданная уравнением . -р- 4_ ао — 0> (16) тогда и только тогда параллельна прямой, заданной уравнениями когда Ч4’ 4~ ... Д- = 0. (18) Обозначая общую величину отношений в (17) через X, получим ?‘==[лб.-4рг (г = 1, ... , п). (19) Подставляя вместо текущих координат эти значения в (16), приходим к уравнению (ащ‘ 4- ... 4- a„u«) к = - (Х1грт 4- ... 4- 4- а0). (20) Если окажется ащ1 4~ • • • 4“ 0, то из (20) найдем един- ственное значение для X, а с помощью (19) и единственные зна- чения для координат V точки пересечения прямой (17) и гипер- плоскости (16). Таким образом, в указанном случае прямая и гиперплоскость заведомо не параллельны. Пусть ащ14~ • 47-«!)И = 0- Если правая часть в (20) отлична от нуля, то уравнение (20) решений для X не имеет, прямая (17)
АФФИННЫЕ КООРДИНАТЫ 369 § 301 и гиперплоскость (16) не пересекаются и потому они парал- лельны. Если же правая часть в (20) равна нулю, то (20) удов- летворяется при любых значениях X, т. е. все точки прямой лежат на гиперплоскости и потому прямая и гиперплоскость снова параллельны. 30.4. Преобразование аффинных координат. Как изменяются координаты ......произвольной точки X «-мерного аффинного пространства 'Л, если мы от фиксированного координатного репера /? = (О, (Mi, ... , 0А„) перейдем к какому-нибудь другому реперу 2?' = (0', O'A't, ..., О'Ап)? Рассмотрим сначала случай, когда репер /?' получается из репера /? посредством сдвига на век- тор 00'. В этом случае OAl^OAi (i=l............п). (1) По предположению 0Х = ^-0Л1+ ... -'г<п-ОАп. (2) Обозначая через а’, ..., э." координаты нового начала О' (в «старом» репере 7?) и через V, ... , новые координаты точки X (в репере /?'), получим 07У = а1 • OAi 4- ... -I- уп ОАП, (3) ...+;л'-ом;. (4) Складывая почленно равенства (3), (4), пользуясь соотноше- ниями (1) и сравнивая результат с формулами (2), приходим к искомым формулам —£г'4~а‘ (4 = 1» •••> «)> (о) выражающим закон преобразования координат при переносе начала. Рассмотрим теперь случай, когда начало нового координат- ного репера совпадает с началом старого репера. Системы коор- динатных векторов О Ai, ..., ОАп и OMJ, .... О’А„ представляют собою два базиса векторного пространства L (Л), и потому новые координатные векторы О'At должны выражаться через старые по формулам вида OA^-.OAi+ ... +^.OA„ (i=l,...,n), (6) где определитель матрицы T' = ||V.|| отличен от нуля (п. 8.3).' Замечая, что О — О', подставляем в формулу (4) вместо век- торов OA'i их выражения (6). Сравнивая результат подстановки с равенством (2), приходим к соотношениям ...4-гЧ (i = i,...,«), 13 А. И. Мальцев
370 АФФИННЫЕ ПРОСТРАНСТВА [Гл. VIII которые можно короче переписать в знакомой матричной форме G1.......................^) = (Г, ..., (7) Наконец, переход от репера /? —(О, OAit ..., ОА„) к произ- вольному другому реперу /?' —(О', О'Лф ..., О'Лй) можно осу- ществить в два шага (см. рис. 9 для п = 2): 1) сдвигаем перво- начальный репер на вектор 00'; в результате получим репер /?* с началом в точке О'; 2) от репера /?* переходим к реперу /?'; при этом не меняется начало коорди- , 4* , нат. Пользуясь последовательно фор- f у ’ мулами (5) и (7), получаем окончатель- I / ные соотношения А* А2 (В1, ... , = ... , \ ’ +(а\ ..., а-), (8) “ ’ где Т' = [|т}|| — матрица перехода от ба- Рис 9 зиса ОЛ]...... ОАп к базису О'Лф ... ..., О’А’п (составленнаяиз коэффициентов линейных выражений векторов О'Л; через векторы OAlt ... , ОЛга), (а1,..., а") — координаты нового начала, (;‘, ..., zn} и (£v, ... ..., £л') — старые и новые координаты произвольной точки X. По чисто формальным причинам в п. ЗОЛ строка (1, S1,...» Н) была названа расширенной координатной строкой точки X, где («*, ..., z")— строка ее обычных координат. Из формулы (8) вытекает непосредственно, что где (i,e..и=(1> Tr'r== “1 а1 ... а” 0 ... О) (Ю) 0 ... Матрица Tr<r называется матрицей перехода от репера R к реперу R'. Из (10) вытекает, что определитель матрицы Tr>r совпадает с определителем матрицы Цт'.Ц, являющейся матрицей перехода от старого координатного базиса в векторном простран- стве L(2() к новому базису. Обратно, для любой матрицы Т9 вида (10) с отличным от нуля определителем и любого наперед заданного репера R формулы (6) и числа а1, ..., а" позволяют однозначно найти такой репер R', чтобы матрица Т9 была мат- рицей перехода от R к R'. Из формулы (9) вытекает следующее важное
§ 30] АФФИННЫЕ КООРДИНАТЫ 371 Следствие. Пусть заданы три произвольных репера R, R', R", и пусть Тц’ц — матрица перехода от R к /?', Т^'ц’ — мат- рица перехода от R’ к R". Тогда матрицей перехода от R к R’ будет произведение Тц"п'Тц'ц- В частности, если Т^’п есть мат- рица перехода от репера R к реперу R', то матрицей перехода от R' к R служит обратная матрица Tr'r- В самом деле, обозначая через (S1, £л), (s1', Вл'), (с1", ... , Е'г ") координаты произвольной точки X соответственно в реперах R, R', R", согласно (9) получаем (1, ..., $«) = (!, Г, ..., и в то же время (1, S*...^) = (1, ... Ляут^ = (1, Г....... Таким образом, для произвольных 51", ..., in" £ К. имеем (1, В1", ..., ^').7>₽ = (1, Г, .... Подставляя сюда в качестве V", ...» координаты в репере R" вершин этого репера, получим Тц”п=ТЦ"Ц'Т Ц’Ц. (И) Если репер /?" совпадает с репером R, то матрица очевидно, будет единичной и соотношение (И) обращается в Е — Т RX'T п'п, откуда Tn = Tfa. (12) До сих пор мы интересовались только законом изменения координат точек. Спрашивается, как изменяются уравнения мно- жеств точек при переходе от одного координатного репера к другому? Пусть задано уравнение /(;*, ... , И = 0 (13) какого-то множества 3)1 в некотором репере R. По определению это означает, что произвольная точка X тогда и только тогда принадлежит 2)1, когда ее координаты $*, ..., удовлетворяют соотношению (13). При переходе к новому координатному ре- перу R' получаем согласно (8) (Z = l, ... , п). Подставляя эти выражения для S1, в (13), получим + ... , £6A"-|-a")=0. (14) 13*
372 АФФИННЫЕ ПРОСТРАНСТВА [Гл. VIII Так как новые координаты Е1', ..., Iя' произвольной точки X тогда и только тогда удовлетворяют соотношению (14), когда X С то (14) является искомым уравнением множества ЭЛ в новом координатном репере. Левая часть равенства (14) яв- ляется некоторой функцией g (4', ... , ;"') от переменных 4',..., £л', вид которой, вообще говоря, отличается от вида первоначальной функции /. Однако если / есть полином от 4, ..., В" какой-то степени s, то из (14) видно, что g будет также полиномом сте- пени s от 4', ... , £л'. Как и в случае векторных пространств (см. п. 5.1), вопрос о преобразовании аффинных координат оказывается тесно свя- занным с задачей нахождения всех автоморфизмов аффинного пространства 21 над фиксированным полем К- Пусть п — размер- ность пространства 2( и — некоторый автоморфизм 21 над X (см. п. 29.1). Выбираем в 21 какой-нибудь координатный репер /? = (0, 0Аь ..., ОАп). Вершины его О, Ait ..., Ап образуют линейно независимую систему точек в 21. Отношение линейной независимости сохраняется при изоморфизмах, и потому точки 0®Х, А^, Апе^ можно принять за вершины нового коор- динатного репера 2?®^ = (Ое^К, Ое^А^, ..., Oe^Ane.Af\ Обо- значим через (X)}j, ..., (Х)л координаты произвольной точки X, вычисленные в репере 2?, и пусть ад=(1, ад,..., (Х)л) — расширенная координатная строка точки X в репере R. Тогда формула (2) примет следующий вид: ох=ад.ад4- ... 4-ад-ад. (15) При изоморфизмах линейные зависимости между векторами сохраняются, и потому из (15) получаем (WXe^ — (Х)д • Ое^А^ (Х)^ • ОеЛ-Ап^. (16) Иными словами, координаты Х®Х в репере Rad совпадают с координатами X в репере R, т. е. в новой сокращенной записи [Х®Х]Л>,Л = [X]/?. Применяя формулу (9), получаем [Х]^ — [Хе^]^ = [Ха/1 • Тi>.ar и потому, в силу (12), [Х®^]/г = [Х]Тадл. (17) Матрица Трр.л называется матрицей автоморфизма в ре- пере R и обозначается через или просто через [&#], если
ПРИМЕРЫ И ЗАДАЧИ 373 репер К заранее известен. В силу этого соотношение (17) можно переписать в окончательной форме: [Хв^] = [Х][з^]. (18) Пусть а^, а® — какие-нибудь два заданных автоморфизма пространства 'Л. Применяя формулу (18), получаем [X (©^^)] = [Х][е^^]> [(Х^) а®] = [Х<^] [7®] = [X] р], откуда [Х][а^] = [Х]([а^]р]). Так как это равенство должно выполняться для любой точки X, то = \^\ р] и, следовательно, Рассмотрим пример. Пусть есть сдвиг Л на вектор 00' с координатами а1, ... , а" в репере /? = (0, OAi, ... , ОАп). Тогда из формул (9) и (5) получаем ~ 1 — а1 — а2 . 0 1 0 .. . 0 S,X] — Т = 0 0 1 .. . 0 0 0 0 .. . 1 Если же автоморфизм е# оставляет неподвижным начало координатного репера /?, то матрица \?ХГ\ распадается на 1 и матрицу перехода в векторном пространстве L(?l). Примеры и задачи 1. Найти необходимые и достаточные условия пересечения двух пря- мых, заданных уравнениями с направляющими коэффициентами. 2. Найти параметрические уравнения плоскости, заданной системой уравнений х, ло, — Це., -|- З.г4 = 1, хг -|- 2xs — x3-j- 2х4 — 3, л", —— х? — 4х3 —5х, — — 3. 3. Доказать, что любая плоскость ffli аффинного пространства сама является аффинным пространством, размерность которого равна размер- ности Эй. 4. Доказать, что плоскость Эй аффинного пространства, отличная от точки, тогда и только тогда параллельна любой не пересекающей ее пло- скости, когда 2R является гиперплоскостью.
374 АФФИННЫЕ ПРОСТРАНСТВА [Гл. VIII § 31. Выпуклые тела До сих пор мы не рассматривали такие существенные геомет- рические понятия, как отношение «лежать между», полуплоскости, выпуклость. Причина в том, что в аффинных пространствах над произвольным полем они не могут быть введены естественным путем. Для их трактовки надо сузить класс полей и перейти к рассмотрению аффинных пространств над упорядоченными полями, например над полем вещественных чисел. Основные свой- ства таких пространств и составляют предмет изучения в этом параграфе. 31.1. Лучи. Напомним, что поле К называется упорядоченным (см. «АС»), если помимо операций сложения и умножения для элементов К введено еще отношение порядка , подчиняющееся двум условиям: а^ре>а-|-р^р + р, (О 0<а и 0=Ср=>0=Сар(а, р, р£ Л). (2) Важнейшим примером упорядоченного поля может служить поле вещественных чисел, которое в первую очередь и следует иметь в виду во всех дальнейших рассуждениях этого и следую- щего параграфов. Отметим на всякий случай, что из (1), (2) прямо вытекают следующие свойства: Для любого элемента а упорядоченного поля О < Д, — а* < 0 (3) и, в частности, 0-С1, —1=с0. Для произвольных элементов а, р, р упорядоченного поля а г'" р £> — р - — а, (4) О ' а и р р => ар ар. (5) По определению полагают, что отношение а<^р равносильно конъюнкции а^сриат^р, а отношения аС-З, а^>р означают то же, что и отношения р=Са, р<^а. Неотрицательный из эле- ментов а, — а называется абсолютной величиной а и обозначается через |а[. Из (1)—(5) легко следует, что | — а | = | а | , | а -[- р I | а | -| р | , | ар | = | а | • |р|. Рассмотрим теперь какое-нибудь аффинное пространство 21 над упорядоченным полем К. Говорят, что в пространстве 21 точка X лежит между точками А и В, если АХ — >~-АВ и 0<XsSl (АСЛ). (6)
§ 31] ВЫПУКЛЫЕ ТЕЛА 375 Ясно, что если X лежит между Л и В, то А, X, В лежат на одной прямой. Далее, отношение «лежать между» симметрично: если X лежит между А и В, то X лежит между В и А. Дей- ствительно, из (6) получаем ~АВ = АХД-ХЯ = \-АВ-\-ХВ, и потому ВХ = (1 -Х).ДД, 0^1-X^l. Пусть А, В, С — попарно различные точки, лежащие на одной прямой. Тогда для подходящего X £ р имеем АС — с АВ. Число X удовлетворяет одному и только одному из условий: а) Х<^0; б) 0 < X < 1; в) X > 1. Легко проверяется, что в случае а) точка А лежит между В и С; в случае в) В лежит между А и С; в слу- чае б), по определению, С лежит между А и В. Таким образом, из любых лежащих на одной прямой трех различных точек одна и только одна лежит между двумя другими. Аналогично устанавливается и второе основное свойство отно- шения «лежать между»: если точка X лежит между точками А, В, а точка Y лежит между А и X, то Y лежит между А и В. При помощи понятия «между» на каждой прямой можно ввести два естественных отношения порядка, называемых также напра- влениями прямой. Выберем на заданной прямой ЭЛ какие-нибудь различные точки А, В и для точек ЭЛ введем бинарное отноше- ние =Сдв> зависящее от А, В, полагая, по определению, X ABY истинным, если ЛХ = Х.ЛВ, AY = ii-AB и Х^р. (X, р, £ К), (7) т. е. упорядочивая точки прямой ЭЛ в соответствии с порядком, в котором находятся их координаты в репере (Л, АВ). Ясно, что порядки еХАВ и =СВа дуальные, т. е. что С другой стороны, порядок ^pq, определяемый на ЭЛ какой- нибудь другой парой точек Р, Q, в случае Р 'YabQ совпадает с порядком =Сдв, а в случае Q-YABP совпадает с порядком ^ва- Таким образом, на прямой ЭЛ среди порядков вида ^pq суще- ствует лишь два различных порядка. Они называются естествен- ными порядками или направлениями прямой. При автоморфизмах пространства 21 над К отношение «лежать между» сохраняется и естественные порядки также сохраняются. Однако благодаря нали- чию на прямой двух естественных порядков автоморфизмы про- странства 21 могут один из естественных порядков на прямой ЭЛ переводить в другой естественный порядок той же прямой. Поэтому
376 АФФИННЫЕ ПРОСТРАНСТВА [Гл. VIII инвариантом является не отношение порядка, а пара дуальных отношений порядков. Теорема. Если линейный функционал f(X) не постоянен на прямой SOt, то отображение f(X)-*X (X С ЭХ) является взаимно однозначным отображением К на Э.Х, при котором порядок sg, заданный на поле К, переходит в один из двух естественных по- рядков, определенных на ЭЭ?. Фиксируем на прямой какие-нибудь точки О, А, для которых f (О) ф f (Л), и пусть ОХ = \-ОА (Х{№, Х£7(). В силу (7) отображение X -> X является взаимно однозначным отображением К на ЭХ, переводящим заданный порядок на К в естественный порядок на S0?. Из линейности f следует: /(Х)=Х(/(Л)-/(О))+/(О)=аХ + ₽. Так как а^О, то отображение /(Х)->Х является взаимно однозначным отображением К на К, либо сохраняющим порядок, либо обращающим порядок. Отображение f(X)->X, как компо- зиция отображений f (X) -> X и X -> X, также является взаимно однозначным и переводящим порядок на К в естественный поря- док на £0?. Для любых двух точек А, В пространства 3? отрезком [А, В] называется совокупность всех точек, лежащих между А и В. Точки А, В называются концами отрезка [Л, В]. Из определения отношения «лежать между» следует, что концы отрезка принад- лежат отрезку, а из симметричности отношения следует, что [Л, В] —[В, Л]. Ясно, что отрезок [Л, Л] состоит лишь из точки А. Говорят, что число X лежит между числами а, р (а, р, X g X), если а е-<:Х^: р или &«gX-Ca. Совокупность чисел, лежащих между а и р, называется числовым отрезком и обозначается через [а, р]. Из предыдущей теоремы получаем Следствие. Совокупность значений линейного функцио- нала f(X) на отрезке [А, В] есть числовой отрезок [f (Л), f(B)]. Совокупность значений f на прямой ЭЭ1 либо совпадает со всем полем К (если f не постоянен на ЭХ), либо состоит из одного - числа (если f постоянен на ЭХ). Введем теперь понятие полупрямой или луча. Говорят, что точка X лежит по ту же сторону от точки О, что и точка А, если X лежит между О, А или А лежит между О, X. Совокупность точек ЭХ0 пространства 3( называется лучом, если в ЭХ0 существуют такие различные точки О, А, что ЭХо состоит из всех точек X, лежащих от О по ту же сторону, что и точка А. Точка О называется вершиной луча, который мы теперь обозна- чим ЭХоа.
§ 31] ВЫПУКЛЫЕ ТЕЛА 377 Из этого определения следует, что все точки луча ЭЭ?ол принад- лежат прямой О \/ А. Если на прямой О \/ А взять репер (О, ОЛ) в качестве координатного репера, то каждому С К будет отве- чать точка X с линейной координатой X, для которой ОХ = ЮА. Ясно, что луч ЭЛол состоит из точек прямой 0\/А, имеющих неотрицательную координату. Отсюда, в частности, видно, что каждый луч имеет лишь одну вершину О и если на луче ЭД о а взять какую-нибудь точку В, отличную от О, то лучи ЭЭ1ОД и ЭЭ?ов совпадают. Легко также убедиться, что если на некоторой пря- мой взять произвольную точку О, то прямая будет распадаться в точности на два различных луча с вершиной О. Пусть линейный функционал f (X) на прямой ЭЛ не постоян- ный. В силу теоремы 1 на прямой ЭЛ найдется точка О и только одна такая точка, в которой функционал f обращается в нуль. Так как при отображении f(X)->-X порядок в К переходит в естественный порядок на ЭЛ, то совокупности точек VJi,,, ЭЛ1 из ЭЛ, в которых XsgO и соответственно X 0, являются как раз теми лучами, на которые точка О делит прямую ЭЛ. 31.2. Полупространства. Аналогом понятия луча для много- мерных плоскостей пространства VI служит понятие полуплоскости и, в частности, понятие полупространства, к определению кото- рого мы теперь и перейдем. Пусть снова 31 — какое-нибудь аффинное пространство над упорядоченным полем /< и ф — произвольная гиперплоскость в VI. Если ф содержит точки X, Y, то ф содержит и все точки пря- мой X\/Y. Поэтому любой отрезок [Л, В] из VI либо целиком содержится в ф, либо содержит не более одной точки из ф. Говорят, что точки А, В лежат по разные стороны от гипер- плоскости ф, если обе они не принадлежат ф, но отрезок [Л, В| содержит некоторую точку из ф. Во всех остальных случаях говорят, что точки Л, В лежат по одну сторону от ф, символи- чески: Л = В(ф). В частности, Л = Л(ф) и из Л = В(ф) сле- дует В = А (ф) для любых Л, В. Далее, если Л £ ф, то Л = В (ф) для любой точки В. Теорема 1. Пусть f (X) —- какой-нибудь непостоянный линей- ный функционал на пространстве VI и ф — гиперплоскость, состоя- щая из точек X, в которых f (Х) = 0. Тогда для любых А, В Л = В(ф)<==>/(ЛН(В)>0. (1) Пусть А, В лежат по разные стороны от ф. Совокупность значений, принимаемых f(X) в точках отрезка [Л, В], есть число- вой отрезок [/(Л), /(В)]. По условию /(Л)т^О, /(В)^0 и О с [f (Л), f (В)], Следовательно, f (Л) • f (В) < 0. Обратно, пусть для каких-то точек Л, В имеем f (Л) • f (В) 0. Тогда О£ [/ (Л),
378 АФФИННЫЕ ПРОСТРАНСТВА [Гл. VIII /(В)], т. е. для некоторой точки X £ [А, В] имеем /(Х) = 0, откуда X £ ф, и потому А, В лежат по разные стороны от ф. Следствие. Если точка А не лежит на гиперплоскости ф и А = В($), А = С(ф), то В = С($). Действительно, если точки А, В, С удовлетворяют перечис- ленным требованиям, то согласно теореме 1 /И)^о, fM)/(B)^o, /(А)/(С)^о, откуда (f (A))2 f (В) f (С) 0, и потому / (В) / (С) 0. Введем теперь основное понятие: для любой гиперплоскости ф и произвольной точки А (g ф совокупность тех точек, которые лежат вместе с точкой А по одну сторону от ф, называется полу- пространством, определяемым гиперплоскостью ф и точкой А. Это полупространство условимся временно обозначать й^д. Из определения видно, что ЗТрд заведомо содержит А и гипер- плоскость ф. Множество, получаемое из й^д выбрасыванием гипер- плоскости ф, называется открытым полупространством, опреде- ляемым гиперплоскостью ф и точкой А. Теорема 2. Если точки А, В не принадлежат гиперпло- скости ф и отрезок [А, В] не содержит точек ф, то полупро- странства 31^д, 2ls£3 совпадают. Если точки А, С лежат по разные стороны от ф, то ?(^д Ф и каждое полупростран- ство совпадает либо с 2Ьрд, либо с Рассмотрим непостоянный линейный функционал /(X), обра- щающийся в 0 на ф. Так как отрезок [А, В] не содержит точек ф, то ввиду формулы (1) числа f(A) и f (В) имеют одинаковые знаки. Аналогично устанавливаем, что числа f(A) и /(С) имеют разные знаки. Из теоремы 1 следует, что для любой точки D ф, если /(D) ^>0, то совпадает с совокупностью ?(+ тех точек X, для которых /(*)^0; (2) а если f (D) 0, то совпадает с совокупностью тех точек X, для которых /(Х)<0. (3) Таким образом, произвольное полупространство совпадает либо с й+, либо с 2Г. Если /(А)^>0, то из упомянутых выше соотношений получаем ^д=^в=^ если же /(А)<^0, то ^фД = = ^+«
ВЫПУКЛЫЕ ТЕЛА 379 § 311 Следствие 1. Для каждого непостоянного линейного функ- ционала f (X) совокупность точек X, удовлетворяющих неравенству и совокупность точек X, удовлетворяющих неравенству Г(Х)^О, являются двумя полупространствами, определяемыми гиперпло- скостью f(X) = O. (4) Совокупности точек X, определяемых строгим неравенством Ж)>о (5) и соответственно строгим неравенством (6) являются открытыми полупространствами, на которые гиперпло- скость (4) делит заданное аффинное пространство VI. В самом деле, согласно п. 29.4 уравнение (4) определяет не- которую гиперплоскость которая определяет полупростран- ства (2) и (3). Совокупности точек, определяемых строгими нера- венствами (5) и (6), получаются из полупространств (2), (3) отбра- сыванием решений уравнения (4) и потому являются открытыми полупространствами. Следствие 2. Пусть в пространстве 31 конечной размер- ности п выбран произвольный координатный репер. Тогда сово- купность точек X, координаты которых S1....удовлетворяют фиксированному неравенству . -J- яо, у которого хотя бы один из старших коэффициентов аь ..., ал отличен от нуля, является полупространством, определяемым гиперплоскостью +«„!" = а0. (7) Совокупность точек X, координаты которых удовлетворяют строгому неравенству ... +ая^>яо, является открытым полупространством, определяемым гиперпло- скостью (7). Согласно п. 30.1 функционал, определяемый формулой
380 АФФИННЫЕ ПРОСТРАНСТВА [Гл. VIII является линейным и непостоянным на 81. Применяя к f след- ствие 1, получим требуемые утверждения. Пока мы рассматривали лишь в известном смысле крайние случаи: лучи или полупрямые и полупространства. Однако легко определить понятие полуплоскости и для любой плоскости ЭЛ, содержащейся в пространстве 8(. В самом деле, мы знаем, что ЭЛ можно рассматривать как подпространство над тем же полем К, что и пространство 8(. Применяя сказанное выше к аффинному пространству ЭЛ над Д', получим понятие полупространства про- странства ЭЛ. Эти полупространства называются полуплоскостями плоскости ЭЛ. Теорема 3. Пусть плоскость 3)1 и гиперплоскость $ не параллельны и А — какая-нибудь точка из ЭЛ, не лежащая на 'ф. Тогда пересечение полупространства 8(>^л и плоскости ЭЛ будет полуплоскостью в ЭЛ, определяемой точкой А и гиперплоскостью ЭЛ П ф 6 пространстве ЭЛ. Каждая полуплоскость в ЭЛ есть пересечение ЭЛ с подходящим полупространством 8(>^л пространства 81. Пусть f (X) — непостоянный линейный функционал, обращаю- щийся в нуль на ф), и пусть f(A)^>0. Тогда полупростран- ство 8(фд будет совокупностью решений неравенства а пересечение ЭЛ |~| 81^л будет совокупностью точек Y С ЭЛ, удо- влетворяющих неравенству /(У)^0. Так как ограничение f на ЭЛ есть линейный функционал на ЭЛ, то согласно следствию 1 мно- жество ЭЛ П 8(,^л есть полуплоскость в ЭЛ. Аналогично доказы- вается и второе утверждение теоремы 3. Возвращаясь снова к полупространствам пространства 81, поставим вопрос: какими способами могут располагаться друг относительно друга два полупространства 81^л и 8(rj£? Рассмотрим отдельно каждый из трех возможных здесь слу- чаев: 1) Гиперплоскости и D совпадают. Тогда полупростран- ства 8(^д и 8(гхб либо совпадают, либо их объединение есть все пространство 81, а пересечение — гиперплоскость ф. 2) Гиперплоскости Ц) и £1 не пересекаются и, следовательно, параллельны. Здесь возможны следующие подслучаи: а) О^^Д- Тогда 81фл Q Чщ = Ф- б) £ 81св, О (£81^. Тогда 81овгоЭ(фл. в) Q € 51фд- Тогда 8(^л 8(с^. г) Q) С D С 81фЛ. Тогда ^д П ^св Ф‘ Множества последнего вида иногда называются гиперслоями. Пересечение любой прямой с гиперслоем, как легко убедиться, либо пусто, либо совпадает со всей прямой, либо есть отрезок прямой.
§ 31] ВЫПУКЛЫЕ ТЕЛА 381 3) Гиперплоскости $ и Q пересекаются. Согласно п. 29.2 ф П есть плоскость, коразмерность которой равна 2. Пересе- чение полупространств называется в рассматриваемом случае гиперуглом с ребром ф Q D. 31.3. Выпуклые множества. Множество точек <2 аффинного пространства 51 над упорядоченным полем К называется выпук- лым или конвексным, если хе е и yе е=>[%, л е ®. (П Отсюда следует, что плоскости пространства 21, а также от- резки, лучи, полуплоскости и открытые полуплоскости в 21 яв- ляются выпуклыми множествами. Из определения (1) непосредственно видно, что пересечение любого семейства выпуклых множеств является выпуклым множе- ством. В частности, пересечение любого семейства полупространств есть выпуклое множество. Пересечение всех выпуклых множеств, содержащих какое-ни- будь фиксированное множество точек ЭЛ, называется выпуклым замыканием множества ЭЛ и обозначается через Conv ЭЛ. Из сде- ланного выше замечания вытекает, что выпуклое замыкание произ- вольного множества ЭЛ есть наименьшее выпуклое множество, содержащее в себе ЭЛ. Ясно, что ЭЛ выпукло тогда и только тогда, когда Conv ЭЛ = ЭЛ. Также очевидно, что из ЭЛ с Л сле- дует Conv ЭЛ cz Conv Л. Каждая точка X е 21 сама по себе обра- зует выпуклое множество, и потому ConvX = X. Однако уже для двух точек X, У, как легко убедиться, имеем формулу Conv {X, Y} = [X, У]. (2) Выражение для выпуклого замыкания произвольного множе- ства дает Теорема 1. Выберем в пространстве 21 какую-нибудь точку О. Выпуклое замыкание Conv ЭЭ1 произвольного множества точек ЭЛ есть совокупность всех точек X С Л, для каждой из которых в ЭЛ найдется конечная система точек 7И1, ..., ;WS, связанных с X соотношениями OX==\i.OMi^-...-\-\s-OMs, (3) где М.....— подходящие числа из X, подчиненные условиям Xj^O......Х^О, (4) Xi Ц-... -j- Х5 = 1. (5) Обозначим через ЭЛС совокупность точек X, удовлетворяющих требованиям (3), (4), (5), и покажем, что ЭЛС выпукло. Пусть А,
382 АФФИННЫЕ ПРОСТРАНСТВА [Гл. VHI В 4 Э?4 и, следовательно, для подходящих М, С ЭЛ, а,, ру £ Д О А = 04 • ОЛЬ as • OMS, ов = р1.олд + ...4-р5-олд, причем а,-^0, р,-^0 (z — 1, ..., s), ai 4_ • • 4~ as — Pi 4~ • • • 4- Р$ = 1 • Для произвольной точки X £ [А, 5] имеем ОХ==к-ОА~г\>-ОВ (Хг>0, p.2s0, Х4-р. = 1), и потому ОХ = (Xaj ррi) • OMi 4~... Д- (Ла5 hPs) OMS. Так как здесь Ха,- Д- ррг ss 0 (z = 1, ..., $) и, кроме того, У (Ч- + Р-Р/) = Х У «, + Р У Pz = 1, то X С ЭЛС и множество Э??с выпуклое. Остается показать, что каждое выпуклое множество 9J, содер- жащее множество ЭЛ, содержит и все точки X, удовлетворяю- щие условиям (3), (4), (5). В эти условия входит натуральное число s, и при s=l только что сформулированное утверждение тривиально. Далее применяем индукцию по s. Пусть для какого-то фиксированного s любая точка X, удовлетворяющая условиям (3), (4), (5), принадлежит Э1. Рассмотрим точку Y, удовлетворяющую условиям ^ = а1-6Ж + ... + «5-Ж + ^-0Щ1 (МгеЭЛ), оц4-...-j-°-s4“а«+1= 1, о (z = 1,..., s4-1). Если здесь а5 = 0 или ai+1 = 0, то по индуктивному предположе- нию Y 4 Э1. Поэтому пусть а5-а^+1^0, и, следовательно, пола- гая р = 7.| 4-...4-as’ имеем р4>0- Точка X, определенная соот- ношением 0X^=^0MiA-...-]- — 0Ms, р. ' 1 р. ° удовлетворяет условиям (3), (4), (5) с фиксированным s, и по- тому X С Л. Теперь имеем OY = р • ОХ 4- as+1 • OMs+l (p4-a5+1 = l, pS&O, as+i5a0), и потому Y С [X, iW5+i]. Так как Э1 выпукло и X, Ms+i С Ж, то Y z Э?, что и требовалось. В каждом из условий (3) участвует лишь конечное число точек множества. Поэтому из теоремы 1 вытекает, что выпуклое
§ 31J ВЫПУКЛЫЕ ТЕЛА 383 замыкание бесконечного множества точек есть объединение выпук- лых замыканий всевозможных конечных подмножеств данного мно- жества. Говорят, что размерность выпуклого множества <3 равна г, если <2 содержится в некоторой r-мерной плоскости и не содер- жится ни в какой плоскости меньшей размерности. Аналогично определяется и коразмерность выпуклого множества. Следствие. Если максимальное число линейно независимых точек в множестве ЭЛ равно г 4-1, то размерность Conv ЭЛ равна г. Пусть, например, все точки множества ЭЛ линейно зависят от линейно независимых точек Alt ..., Аг этого множества. Тогда Э)1 содержится в плоскости Л = Ао \/ V- • • V Аг, имею- щей размерность г, и потому Conv ЭЛ ст Conv 91. Но плоскость — множество выпуклое, и, следовательно, Conv ЭЛ cz Л. Выпуклое множество <2 называется собственным в простран- стве Л, если коразмерность <2 равна нулю. Остальные выпуклые множества называются несобственными в Л. Примерами собствен- ных выпуклых множеств могут служить само пространство Л, а также его полупространства и открытые полупространства. Плоскости ненулевой коразмерности и их полуплоскости являются несобственными выпуклыми множествами в Л. Ясно, что каждое выпуклое множество <5 является собственным выпуклым множе- ством в плоскости, служащей линейным замыканием 2. Говорят, что точка В лежит строго внутри отрезка [А, В], если В отлична от А, В и В £ [А, В]. Точка В называется внут- ренней для некоторого выпуклого множества ®, если на каждой прямой, проходящей через В, найдется отрезок, содержащий В строго внутри себя и целиком принадлежащий 2- Говорят, что точка В касается выпуклого множества 2, если существует такая проходящая через В прямая, что любой ее от- резок, содержащий точку В строго внутри себя, содержит хотя бы одну точку из 2. В частности, все точки множества 2 ка- саются <5. Однако могут существовать и точки, касающиеся 2, но не принадлежащие 2. Если все точки, касающиеся 2, при- надлежат <5, то <5 называется замкнутым множеством. Выпуклое множество 2 называется открытым, если каждая точка В — внут- ренняя для <5. Теорема 2. Пересечение произвольного семейства замкнутых выпуклых множеств есть замкнутое выпуклое множество. Пересе- чение любого конечного семейства открытых выпуклых множеств есть открытое выпуклое множество. Первое утверждение непосредственно следует из определения замкнутых множеств. Докажем второе утверждение. Пусть ЭЭ1, 91 — выпуклые открытые множества. Тогда множество ЭЛ [") 51
384 АФФИННЫЕ ПРОСТРАНСТВА [Гл. VIII выпуклое. Если оно пустое, то доказывать нечего, так как пу- стые множества по определению открытые. Пусть S £ ЭЛ [~| Л и 33 — произвольная прямая в пространстве 31, проходящая через точку S. Согласно предположению на этой прямой найдутся от- резки, содержащие S строго внутри себя и принадлежащие соот- ветственно множествам S01 и Л. Но тогда пересечение этих от- резков будет искомым отрезком, принадлежащим ЭЛ Q Л и содер- жащим точку В строго внутри себя. Введем еще одно важное понятие. Точка В называется гра- ничной для выпуклого множества 2, если В касается <2, но не является внутренней для <5. Иначе говоря, точка В называется граничной для S, если существует такая проходящая через В прямая, на которой каждый отрезок, содержащий строго внутри себя точку В, содержит по меньшей мере одну точку из ® и одну точку не из 2. Совокупность всех точек, граничных для выпуклого множества 2, называется границей множества 2. Теорема 3. Произвольное полупространство Зйрд, определяе- мое в пространстве 31 какой-нибудь гиперплоскостью ф и не ле- жащей на ф точкой А, а также соответствующее открытое по- лупространство = 31,^д \ ф являются соответственно замк- нутым и открытым выпуклыми множествами в 31. Границей того и другого множества служит полуплоскость ф. Каждое несобствен- ное выпуклое множество 2 в 31 не содержит внутренних точек. Пусть Р £ ф. Рассмотрим прямую А \/ Р и на ней произволь- ный отрезок [В, С], содержащий точку Р строго внутри себя. Так как прямая А \/ Р не лежит в ф, то концы отрезка [В, С] также не принадлежат ф, и поскольку Р £ [В, С], то точки В, С лежат по разные стороны от гиперплоскости ф. Следовательно, один из концов В( С принадлежит открытому полупространству 3($д, а другой конец не принадлежит ЗЕрд. Таким образом, точка Р гранична как для 31фд, так и для ЗС^д. Покажем, что любая точка D (g Э1фд не касается Э1^д, а по- тому не касается и Э1^д. Пусть ЭЛ — произвольная прямая, про- ходящая через точку D. Если эта прямая не пересекает ф, то она целиком лежит в полупространстве 31^ = 31ф^\ф и потому произвольный ее отрезок не содержит точек из 31 цд. Если же ЭЛ пересекает ф в какой-то точке Р, то на ЭЛ найдутся точки В, С, отличные от D, Р и такие, что D £ [В, Р], С £ [О, Р]. Та- ким образом, отрезок [В, С] лежит на ЭЛ, содержит строго внутри себя D и не содержит точек полупространства 31^ д. Поэтому точка D не касается 3()цд. Одновременно мы доказали, что все точки открытого полупространства 31^£> внутренние и потому лю- бое открытое полупространство есть открытое выпуклое множество.
ДОПОЛНЕНИЯ II ПРИМЕРЫ 885 Для доказательства последнего утверждения теоремы доста- точно обозначить через ф ту гиперплоскость, в которой по пред- положению содержится множество 6, и заметить, что отрезок прямой А V Р (Р С А € Ф), содержащий строго внутри себя точку Р, непременно содержит и точки, не принадлежащие ги- перплоскости ф. Из теорем 2, 3 получаем важное Следствие 1. Пересечение любого семейства полупространств пространства 'Л есть замкнутое выпуклое множество в 31. Пере- сечение любого конечного семейства открытых полупространств пространства 31 есть открытое выпуклое множество в 31. Вспоминая, что для любого непостоянного линейного функ- ционала /(X) совокупность решений неравенства /(X)^sO есть полупространство, а совокупность решений строгого неравенства /(Х)^>0 есть открытое полупространство, получаем Следствие 2. Пусть Д (X), fs(X) — какие-нибудь непо- стоянные линейные функционалы на аффинном пространстве'^. Тогда совокупность решений X системы неравенств Д.(Х)^0 (1 = 1, ...,s) есть замкнутое выпуклое множество в 31, а совокупность решений системы строгих неравенств aw>o (z=i,.... s) есть открытое выпуклое множество в 31. Гиперплоскость ф называется опорной гиперплоскостью вы- пуклого множества <3, если ф <3 Ф ф и все точки 3 лежат по какую-нибудь одну сторону от ф. Пересечения опорных ги- перплоскостей с множеством 3 называются гранями 3. Из этих определений непосредственно следует, что грани выпуклых мно- жеств принадлежат границам этих множеств и сами являются выпуклыми множествами. Грани замкнутых выпуклых множеств замкнуты. Дополнения и примеры Пусть 81 — произвольное аффинное пространство конечной размерности над упорядоченным полем Д'. 1. Выпуклое замыкание линейно независимых точек At, ..., Аг+1 назы- вается r-мерным симплексом в 81. Если г < п, то этот симплекс лежит в r-мерной плоскости At V ••• V ^r+i и поэтому является несобственным вы- пуклым множеством в 8(. n-мерные симплексы называются просто симплек- сами в Я. Точки Д„ ..., Ап+1 называются вершинами симплекса Conv {At, .... An+t}. 2. Описать симплексы одномерных, двумерных и трехмерных пространств. 3. Для каждого г, Osgrsgn—1, все r-мерные грани симплекса Д э-rConv {At, ..., A„+t} — это симплексы Conv ..., Д(/.+1} (1«S^<... • ••<<r+i=5n+1).
386 АФФИННЫЕ ПРОСТРАНСТВА [Гл. VIII 4. Каждое выпуклое множество ®, состоящее лишь из граничных точек симплекса А, целиком содержится в некотором (п—1)-мерном симплексе Д'= Conv {Aj, A;_i> A(-+i, An+i}- 5. Если точки Ai, Ar+1 линейно независимы и для некоторых точек Z?i, ..., Br+i Conv{А ц Ar+i} = Conv {5i......5r+i}, то множество {At, ..., Аг+,} и множество {5П ..., Вм} совпадают. 6. Выпуклым многогранником в Э1 называется выпуклое замыкание С = Conv {Сц ..., Cs} произвольной конечной системы точек Съ ...,CS из Э1. Система точек называется выпукло неприводимой, если ни одна точка системы не содержится в выпуклом замыкании остальных точек. Показать, что если С = Conv {С,, ... , СЛ} — выпуклый многогранник, то существуют точки С,-, ..., С,(, I i, •< ... <Z s, такие, что система точек С(1, ..., Cit выпукло неприводима и Conv{Ci, ..., Cs} = Conv {Cfl, ..., C/J. 7. Симплекс 5 назовем диагональным симплексом выпуклого «-мерного многогранника С, порожденного выпукло неприводимой системой точек Ci, ..., Cs+i, если вершины симплекса принадлежат множеству {Ci.Cs+i}- Говорят, что r-мерный и s-мерный симплексы А тл В расположены пра- вильно (друг относительно друга), если они либо совсем не пересекаются, либо пересекаются по множеству, служащему гранью того и другого симп- лекса. Имеет место следующее утверждение: Существует такое множество диагональных симплексов многогранника ®, что любая точка многогранника принадлежит объединению точек этих симп- лексов, и любые два симплекса из этого множества расположены правильно. § 32. Евклидовы точечные пространства В предыдущих параграфах мы изучали свойства аффинных пространств над заданным векторным пространством £. Допустим теперь, что векторное пространство 8 является унитарным или евклидовым. Аффинное пространство над унитарным (евклидовым) векторным пространством 8 называется унитарным (евклидовым) точечным пространством над £. Размерностью унитарного точеч- ного пространства над 8 называется размерность соответству- ющего унитарного векторного пространства £. Основное внимание ниже будет уделено изучению свойств евклидовых точечных про- странств над полем всех вещественных чисел. Так как поле ве- щественных чисел упорядоченное, то в евклидовых точечных про- странствах определено понятие выпуклости (п. 31.3). 32.1. Длина ломаной. Пусть Urt обозначает n-мерное унитарное точечное пространство над унитарным векторным пространством £ над полем К. Каждой паре А, В точек 11л отвечает однозначно определенный вектор АВ из 8. Поскольку векторное пространство £ унитарное, то в £ определено понятие длины вектора АВ. Эту
§ 32] ЕВКЛИДОВЫ ТОЧЕЧНЫЕ ПРОСТРАНСТВА 387 длину мы будем обозначать через р (Л, В) и называть расстоянием от точки А до точки В. Таким образом, по определению р(Л, В) = |)ЛВ||=К (АВ, АВ). (1) Из свойств длин векторов (п. 17.2) вытекает, чт£ для любых точек А, В 1° Р(Л,В) = Р(В, Л); 2° Р(Л, В) = 0<==> Л = Так как для произвольных точек Л, В, С из 1Д имеем АС = = АВ Д- ВС, то согласно оценке длины суммы векторов имеем 3° Р(Л, В) + р(В, С)^р(Л, С). Произвольное множество М, каждой паре элементов Л, В которого поставлено в соответствие неотрицательное вещественное число р (Л, В), удовлетворяющее требованиям 1°, 2°, 3°, называется метрическим пространством с метрикой р. Поэтому определение (1) обращает унитарное точечное пространство в метрическое пространство. Применяя повторно неравенство 3°, легко приходим к более общему неравенству р(Л1, Лд) —р(Ла, Лз)р(Л5_1, As)^5=p(Ai, As), (2) справедливому для произвольной конечной последовательности точек Ль А^, ..., As унитарного точечного пространства. Если точечное пространство 11„ евклидово, то основное поле К — поле вещественных чисел — упорядочено, и потому в 11л каждая пара точек Л, В определяет отрезок [Л, В] (п. 31.1). Число р(Л, В) называется длиной отрезка [Л, В]. Для любой последовательности точек Ль Л2, ...,AS последовательность от- резков [А, Л2], [Л3, Л3]....[A_t, лл называется ломаной, соединяющей Л1 с As, а отрезок [Л1, Л5] называется замыкающим ломаную. Сумма длин отрезков ломаной называется длиной ломаной. Неравенство (2) означает, что в любом евклидовом пространстве длина ломаной не меньше длины замы- кающего отрезка. При каких условиях в неравенстве (2) имеет место знак ра- венства? Согласно п. 17.2 (для s = 2) в унитарном векторном пространстве из соотношений ЛМ2 Д: о и IIЛ1Л21] Д-1| Л2Лз|] -Д... Д-1[ Л5_1Л5|| = || Л1Л2 Д-.. .Д- Л$_1Л51| (3)
388 АФФИННЫЕ ПРОСТРАНСТВА [Гл. VIII следует, что все векторы ЛгЛ/+х линейно зависят от А{Аг и по- этому А 2Л2+] =* А}А$ (i = 1, .,., s — 1). Подставляя эти значения в (3) и сокращая на ЦЛхЛзЦ, приходим к равенству I I +1 ^21Ч- • • Ч~ I ; Ч Ч~ Ч Ч- • • • Ч~ Чл I- (4) Если пространство евклидово, то числа ...,Х51 вещественные и равенство (4) истинно тогда и только тогда, когда эти числа имеют одинаковый знак. Ясно, что в этом случае точки Alt Л?, ... ... , As лежат на одной прямой и последовательные отрезки ло- маной 1Л, Л2], [Л-2, Лз], ... , пересекаются лишь по со- ответствующим концевым точкам. Итак, в евклидовом точечном пространстве длина ломаной равна длине замыкающего отрезка тогда и только тогда, когда ломаная является разбиением замы- кающего отрезка. Посмотрим теперь, как найти расстояние между точками А, В унитарного точечного пространства 11л, зная координаты этих точек. Пусть (О, ..., еп) — координатный репер в и„, векторы которого образуют ортонормированную систему в векторном про- странстве г. Обозначая через «1, и ..., ₽« координаты точек Л, В в указанном репере, будем иметь АВ = ОВ — О А = (Pi — ei -ф-... -|- (Зп — ал) еп и потому Р (А, В) = |2 + - + (5) Если пространство 11л евклидово, то координаты точек будут вещественными числами и, следовательно, формулу (5) можно будет переписать в более простом виде: р (Л, В) = V(Рх - ах)4 4-. •. Ч- (h - (6) При выводе этих формул мы предполагали, что векторы ко- ординатного репера образуют ортонормированную систему. Такие реперы мы будем называть ортонормированными. Если вместо ортонормированного координатного репера взять произвольный, то формула для расстояния между двумя точками приобретет более сложный вид, который мы здесь не будем выписывать. 32.2. Угол между прямыми. Рассмотрим произвольные прямые ЗЕ и ]1) в n-мерном унитарном точечном пространстве И,2. Выберем из этих прямых по паре различных точек Лъ Аа и соответст- венно Л3, Л3. Отвечающие этим парам векторы ЛхЛа и Л3Л*
§ 321 ЕВКЛИДОВЫ ТОЧЕЧНЫЕ ПРОСТРАНСТВА 389 удовлетворяют неравенству Коши—Буняковского I ^3^1) I 1 liaTM-lirail"' Поэтому найдется вещественное число <р, удовлетворяющее тре- бованиям COS ср = ЛзЛ) I . 11^м81М1лл11 (1) Это число ср не зависит от выбора указанных пар точек на прямых ЗЕ, g). Действительно, если Вь Д и В3, — какие-нибудь другие аналогичные пары, то BjBi — X • AiA-2, B3B,t = р. • A3At для подходящих X, р С К и потому I (Z?iZ?a> В-.В; ) I I Хр. | I (ДДа, AsAt) I Таким образом, вещественное число ср, удовлетворяющее требо- ваниям (1), зависит лишь от самих прямых 33, g) и называется величиной угла между прямыми ЗЕ, g) или просто углом между прямыми J и Ч). Прямые ЗЕ и g) называются перпендикулярными, если угол между ними равен тс/2. Из соотношений (1) следует, что прямые ЗЕ и g) тогда и только тогда перпендикулярны, когда любой вектор, лежащий на одной из этих прямых, ортогонален к любому век- тору, лежащему на другой прямой. Отметим также, что угол между прямыми ЗЕ, g) тогда и только тогда равен нулю, когда прямые параллельны. В самом деле, если прямые параллельны, то векторы, лежа- щие на этих прямых, линейно зависимы и потому в формуле (1) имеем A3Ai = ^ • Д14», откуда прямыми сокращениями получаем coscp—1, ср = 0. Обратно, пусть ср = О и, следовательно, | (Д1Л2, Л3Л4) | = || А1Ач || • || Л3Д41|• Это случай, когда в неравенстве Коши—Буняковского имеет место знак равенства. Следовательно, AsAi-k-AiA^ и потому прямые ЗЕ и Ч) параллельны. Фиксируем в унитарном пространстве Vn какой-нибудь орто- нормированный координатный репер (О, ...,е„). Мы знаем,
390 АФФИННЫЕ ПРОСТРАНСТВА [Гл. VIII что уравнения прямых 3F, можно представить в виде где ^ — параметр, a Zj...1п и тп — угловые коэффи- циенты. Пусть точка Ai получается при значении t=ti(i=l, 2, 3, 4). Обозначая через ап, , а,л координаты точки At (i = = 1, 2, 3, 4), будем иметь als = lsti S? (Z = 1, 2; s=l,...,n), = (i = 3, 4; s=l,,..,n) и, следовательно, AiAi -— (t~i — ti) (het -4-... 1пё^), AgAi = (ti — ts) (tn.ei -J-... -j- mnen). Подставляя эти значения в формулу (1), получим COS Ср = -----— -1 1 1 Т _ 1 п П[ . VIz, Is+... +1 inIsу|ОТ1^+... + |ОТ„|’ (4) Это стандартная формула для косинуса угла между прямыми, заданными в ортонормированной системе координат каноническими уравнениями (2) и (3). Беря в качестве прямой (3) s-ю коорди- натную прямую, определяемую уравнением ’ £1 __ ___ о [ ... 0 , и обозначая через <р5 угол прямой (1) с этой координатной пря- мой, получим и, в частности, cos2 <picos2 <рл = 1. (5) В п. 30.3 мы уже видели, что условие параллельности прямых (2) и (3) можно записать в виде h-= =^- «1 ''' тп' Полагая в формуле (4) <р = к/2, приходим к соотношению /1/П1 -j- • • • lnmn = 0, (6)
§ 32] ЕВКЛЙДОВЫ ТОЧЕЧНЫЕ ПРОСТРАНСТВА 391 представляющему собою условие перпендикулярности прямых, за- писанных каноническими уравнениями в ортонормированном ко- ординатном репере. В евклидовых точечных пространствах наряду с понятием угла между прямыми вводят обычно еще понятие угла между лучами. Канонические уравнения лучей в n-мерном евклидовом точечном пространстве записываются также в виде (2) и (3), где . и ~4i> • • • , — координаты вершин этих лучей, а координаты ^,... ... , произвольной точки лучей получаются из указанных урав- нений при произвольных неотрицательных значениях параметра t. Так как основное поле теперь — поле вещественных чисел, то найдется единственное вещественное число <р, удовлетворяющее требованиям cos ? Т«1 + --- + ^л _ ( о< <(7) Kzi+ ••• + /« Vm'i + --- + mn которое и называется углом между упомянутыми лучами. Согласно этим определениям угол между любыми прямыми лежит в пре- делах 0, у, а угол между лучами может быть и тупым. Напри- мер, пусть задан луч своими каноническими уравнениями иметь вид (/=^0) (/^0). Тогда уравнения противоположного луча, составляющего вместе с заданным лучом целую прямую, будут т — in или, в канонической форме, -h ••• —In Вычисляя угол между этими противоположными лучами по формуле (7), получим cos tp = —1 и потому cp = it. 32.3. Ортогональные проекции. При помощи понятия перпен- дикулярности прямых легко определить отношение перпендику- лярности ^-мерной и /-мерной плоскостей унитарного простран- ства U„. Именно говорят, что прямая ЗЕ пространства 11„ перпен- дикулярна ^-мерной плоскости 2)1 из U,2, символически ЗЕ I 2)1, если ЗЕ перпендикулярна любой прямой, принадлежащей 2)1. Так как перпендикулярность прямых равносильна ортогональ- ности лежащих на них ненулевых векторов, то $±2)1<=>ЗЁ_кЖ (1) где 2)1 означает касательное подпространство к плоскости ЗЯ (в обозначениях п. 29.3 ЗЯ=Ь(3)1)).
392 АФФИННЫЕ ПРОСТРАНСТВА [Гл. VHI Прямая ЗЕ называется перпендикуляром, опущенным из точки А на плоскость ЭЁ>4, если 9Е проходит через А, перпендикулярна ЭЛ и пересекает ЭЛ в какой-то точке Р. Точка Р называется основанием перпендикуляра, опущенного из А на ЭЭ1, или проек- цией А на ЭЛ. Теорема 1. В k-мерном унитарном пространстве 11„ из каждой точки А, не лежащей на произвольной k-мерной плоско- сти ЭЛ (1 — 1), можно опустить один и только один перпендикуляр на ЭЛ. Единственность. Допустим, что существуют различные прямые А V В и А \/С (В Ф С; В, С g9)i), перпендикулярные Э.Л. В таком случае эти прямые были бы перпендикулярны прямой В \/ С, лежащей в плоскости ЭЛ. Пусть прямые А\/ В, А\/С и В\/С, лежащие, очевидно, в 2-мерной плоскости А \/ В \/ С, имеют направляющие коэффи- циенты (/i, /г), (nit, тг), («1, п2) соответственно в некотором орто- нормированном репере плоскости А \/ В \/ С. Условие ортогональ- ности прямых А\/ В и В\/ С влечет равенство llni-\-Llni = Q (см. (6)); аналогично ортогональность А\/ С и В\/ С влечет равенство прщ 4- пищ = 0. Мы видим, что система Л-^1 ~Н ItXi = 0, m.\Xt m->x-i ~~ 0 имеет нетривиальное решение (щ, пр. Следовательно, ' '*=0. mt т-г или = Таким образом, прямые А\/В и A\JС парал- лельны (см. п. 30.3) и имеют общую точку А. Отсюда вытекает, что они совпадают. Полученное противоречие заканчивает дока- зательство единственности. Существование. Предположим сначала, что ЭЛ — гипер- плоскость, т. е. k = n— 1. Согласно п. 17.5 в 11л найдется одно- мерное векторное подпространство ЭЛ-Ц ортогональное к ЭЛ. Совокупность А • ЭЛ1 является прямой, проходящей через А и перпендикулярной ЭЛ. Остается лишь убедиться, что Л-ЭЛ1 пере- секает ЭЛ. Однако это очевидно, так как в противном случае прямая А ЭЛ-1- была бы параллельна ЭЛ и потому в ЭЛ нашлась бы прямая, параллельная (и не перпендикулярная) А ЭЛ-L. Если теперь ЭЛ не гиперплоскость в Un, то рассмотрим под- пространство Л = А \/ Э^‘- В унитарном пространстве Л совокуп- ность ЭЛ является гиперплоскостью. Поэтому, согласно преды- дущему, из А можно опустить внутри Л перпендикуляр на ЭЛ.<
§ 32] ЕВКЛИДОВЫ ТОЧЕЧНЫЕ ПРОСТРАНСТВА 393 Ясно, что этот перпендикуляр будет перпендикуляром и внутри основного пространства 11л. В теореме 1 решается задача о проведении перпендикуляра через точку А так, чтобы он пересекал плоскость ЭЛ. Посмотрим, как будет обстоять дело, если опустить последнее требование. Согласно п. 17.5 совокупность ЭЛ£ всех векторов пространства 1ГЛ, ортогональных к ЭЛ, является векторным подпространством раз- мерности п—к. Поэтому совокупность А • ЭЛ1 будет множеством точек, лежащих на всевозможных прямых, перпендикулярных ЭЛ и проходящих через точку А. Поскольку ЭЛ-1- — векторное под- пространство размерности п — к, то множество Л • ЭЛ-^есть (п — к)- мерная плоскость. Пересечение А • и ЭЛ не может содержать никакой прямой 3f, так как в противном случае любой вектор, лежащий на Эг, принадлежал бы одновременно пространствам ЭЛ и ЭЛ1, что невозможно. Следовательно, пересечение ЭЛ и А • ЭЛ1 либо пусто, либо состоит из одной точки. Если А С ЭЛ, то пересечение ЭЛ и А • ЭЛ1 состоит, очевидно, из точки Л. Если же Л (£ ЭЛ, то основание перпендикуляра, опущенного из Л на ЭЛ, принадлежит одновременно Л • ЭЛ ' и ЭЛ, и потому ЭЛ Q Л • ЭЛ ' состоит лишь из упомянутого основания перпендикуляра. Плос- кость Л-ЭЛ1 иногда называют ортогональным дополнением к ЭЛ, проведенным через точку А. В частности, если ЭЛ — гиперплос- кость и Л ^ЭЛ, то ортогональное дополнение Л • ЭЛХ есть пря- мая, перпендикулярная гиперплоскости ЭЛ и пересекающая ее в точке Л. Эта прямая называется перпендикуляром к гипер- плоскости ЭЛ, восставленным в точке Л. Проекцией (более точно, ортогональной проекцией) точки Л на произвольную плоскость ЭЛ называется точка пересечения плос- костей ЭЛ и Л • ЭЛХ. Иначе говоря, если Л ЭЛ, то проекцией Л на ЭЛ называется основание перпендикуляра, опущенного из Л на ЭЛ. Если же Л С ЭЛ, то проекцией Л на ЭЛ называется сама точка Л. Проекция Л на ЭЛ иногда обозначается через РгдаЛ или Лэд. Отображение Рг$щ: 11л->-ЭЛ называется (ортогональным) проектированием пространства Пл на плоскость ЭЛ. Посмотрим, каким образом выражаются координаты проекции точки Л на плоскость ЭЛ через координаты Л. Выберем в под- пространстве ЭЛ какую-нибудь ортонормированную базу elt ...,ek и дополним ее векторами ек+1, ...,еп до ортонормированной базы е1г..., ek,..., еп всего пространства 11л. Фиксируем в ЭЛ произ- вольную точку О и в качестве координатного репера в U„ при- мем репер (О, gj,..., еП). Пусть точка Л в этом репере' имеет координаты «j..... ал. Покажем, что проекцией А на ЭЛ будет
394 АФФИННЫЕ ПРОСТРАНСТВА [Гл. VIII точка Р с координатами 0... О (см. рис. 10 для k = 2). В самом деле, плоскость ЭЛ состоит из точек, координатные строки которых имеют вид (gp..., 0... 0). Поэтому любой вектор х, принадлежащий ЭЛ, представим в форме +... 4- Ьеь- Но РА~ ak+1ek+1 + а„е„, и поэтому (х, РЛ) = 0, т. е. прямая Р \/ А перпендикулярна плоско- сти ЭЛ, что и требовалось. Итак, если О А = а1е1 4~ akek 4" • • • 4" апеп> то — aiei 4~ • •• 4" (2) где 3)?=ov^iV-.-V^- Из формулы (2) непосредственно вытекает важная Теорема 2. Ортогональное проектирование Рг$щ: 11ге-* ЭЛ является линейным отображением, т. е. для него для любых точек Ли), д(2)> д(з)1 д(4)^ д<5)( д(в) и любых чисел Д р £ Д соотно- шение ЖЛ^ = Ь Л^Л^Д-р-Л^Л^ (3) влечет Действительно, обозначая координаты точки Л(£) через а^,... ,aW (i = 1,..., 6) и принимая во внимание условие (3), полу- чаем равенства + a?’) (s=l,..., п). (5) С другой стороны, согласно (2) имеем Л^Л^^(4г + 1)~а^)е1 + ---+Н + 1)--Ч;))еА (1 = 2,4, 6). (6) Сравнивая (6) и (5), приходим к соотношению (4). Проекцией произвольного множества точек в на пло- скость ЭЛ называется совокупность проекций на ЭЛ всех точек S. Теорема 3. Проекция прямой Т на произвольную плоскость ЭЛ есть прямая или точка. Если Т(1).£(s)— какие-то прямые унитарного пространства 11л и ЭЛ — произвольная плоскость в 11„, то ...V^aR^V (7) На каждой прямой SE(£) выберем пару различных точек Л(1), = s). Плоскость 3£(1)V ... состоит из тех
§ 32] ЕВКЛИДОВЫ ТОЧЕЧНЫЕ ПРОСТРАНСТВА 395 точек С, для которых Д^С = Xi • Ди)ви> Ц-... 4- К • W ’ + • ЛП)Л^> +... ... + |Л5.Д(1М^ (8) при подходящих Хь..,, Xs, (JtbС К (см. п. 29.2). На осно- вании (4) отсюда получаем = + • •• + ^' 9-2 ’ ...-j-p.5-Л^Д^, (9) и потому Сж = (А О) V В^ V • • • V V Обратно, если D £ (Дй> УВ5Щ V ... \/ V В$), то для подходящих Х1(..., Х5, р.2>..., fis £ Д’ имеем A<$iD—X1' + • • • + xs • + н-2 • ДдИда + •• ... + ^.Дйр§. (10) Берем в пространстве S£(1)\y у/°£(5) точку С, для которой истинно равенство (8). Сравнивая (9) и (10), видим, что C^ — D и потому D С (SE(I)\/ ... VМы видим, следовательно, что (T‘>V...V^)ffl=(^V4V - V0$v^y При s = l получаем = Поэтому = Д» V В^, и оба утверждения теоремы 3 доказаны. Следствие. В унитарном пространстве проекция плоско- сти 91 на какую-нибудь плоскость есть снова плоскость, размер- ность которой не превышает размерности 91. Для доказательства достаточно представить плоскость 91 в виде линейного замыкания проходящих через одну точку независимых прямых и применить формулу (7). В евклидовых точечных пространствах определены понятия отрезка и выпуклого тела. С помощью формулы (4) легко про- веряется Теорема 4. В евклидовом топочном пространстве проекцией произвольного отрезка [Д, В] на плоскость 991 является отрезок [ Ддгул, Вдд] и потому проекция любого выпуклого множества яв- ляется выпуклым множеством. В самом деле, если С С [Д, В], то ДС = Х-ДВ, Q=sgXggl. Согласно (4) отсюда следует, что ^аяС5К = Х-Д^В^, и по- ТОМУ сэгЧЛ№ М <Л’ [V М Обратно’ еСЛИ
396 АФФИННЫЕ ПРОСТРАНСТВА (Гл. VIIf D С ГЛ»,, В™,!, то для подходящего X (0 к sg 1) имеем. A-.D — = X Л^В^. Беря на отрезке [Л, В] точку С, для которой АС = \-АВ, и сравнивая (4) с равенством Л^£> = Х- Л^В^, полу- чим и, значит, [Л^, Вд1^с[Л, В]^, что и требовалось. Посмотрим, как можно вычислить координаты проекции задан- ной точки на заданную гиперплоскость, если координаты точки и уравнение гиперплоскости известны. Пусть (О, еп)— орто- нормированный координатный репер в унитарном пространстве, В — точка с координатами ....... и 4-...-j-a„;„ = a (И) — уравнение заданной гиперплоскости. Рассмотрим какие-нибудь две различные точки С, D с координатами -ft, ..., и соответ- ственно 8Ъ .8„, лежащие на гиперплоскости (11). Тогда CD = (81_I1)ei4-... + (8„_T„)e„. (12) Координаты С, D должны удовлетворять уравнению (11). Под- ставляя их в уравнение (11) и вычитая почленно получающиеся два равенства, получим ai (§1 — Т1) + ..-4“ал(8л — Тя) = 0. (13) Из (12) и (13) видим, что прямая Si Pi Рп (14) перпендикулярна любому вектору CD, лежащему в плоскости (11), и потому перпендикулярна этой плоскости. Так как прямая (14) проходит через точку В, то равенства (14) есть канонические уравнения прямой, проходящей через заданную точку В с координа- тами ₽1,...,₽„и перпендикулярной заданной плоскости (11). Решая совместно уравнения (11) и (14), найдем координаты а> + <‘ = 1’ •••’ проекции В на гиперплоскость (11). 32.4. Угол между плоскостью и прямой. Рассмотрим произ- вольную Л-мерную плоскость ЭЛ, лежащую в n-мерном унитар- ном пространстве 11, и какую-нибудь прямую 9Е этого простран- ства, пересекающую плоскость Э)1 в точке А. Проекцией прямой X на плоскость ЭЛ будет прямая проходящая через точку Л. Угол между прямой St* и ее проекцией St'SJK называется углом между прямой^ и плоскостью ЭЛ (рис. 11). Если прямая St' лежит в плоскости ЭЛ, то = и угол между St и ЭЛ равен нулю.
§32] ЕВКЛИДОВЫ ТОЧЕЧНЫЕ ПРОСТРАНСТВА 397 Если же St' не лежит в плоскости ЭЛ, то существует единственная (k-\- 1)-мерная плоскость Л, проходящая через ЭЛ иЕ Плоскость ЭЛ в пространстве Л является гиперплоскостью, и потому через точку А в пространстве Л можно провести лишь единственный перпендикуляр ф к ЭЛ. Пусть В — произвольная точка на 9Е, отличная от Л и пусть С — проекция В на ЭЛ. Прямая В\/С лежит в пространстве Л и перпендикулярна ЭЛ. Все перпенди- куляры к одной и той же гиперплоскости параллельны (см. п. 32.3), и потому прямые Э), А V С (см. рис. 11) лежат водной двумерной плоскости. Отсюда следует, что угол © между St н ЭЛ н угол ф ме- жду St и Э) в сумме дают я/2. Остается рассмотреть случай, когда Л-мерная плоскость ЭЛ и прямая St не пересекаются. Берем на плоскости ЭЛ произвольную точку Л. Согласно п. 30.3 в пространстве U существует единст- венная прямая St", проходящая через точку Л и параллельная прямой St'. Угол между прямой St' и плоскостью ЭЛ называется в рассматриваемом случае углом между прямой St и плоскостью ЭЛ. Легко проверяется, что так определенный угол между прямой St и плоскостью ЭЛ не зависит от выбора вспомо- гательной точки Л. Пусть рованный плоскость в пространстве U фиксирован некоторый ортонорми- репер (О, ei, еп) ив этом репере заданы гипер- ЭЛ уравнением :« = «• (1) и прямая (2) Выбираем St каноническими уравнениями р _ go е р) Ч Ч Чг h ~ 1П на гиперплоскости ЭЛ точку Л, координаты которой пусть будут оь ..., <зп. Тогда прямая St', параллельная St и про- ходящая через Л, будет иметь уравнения ti °1 _ ап 11 ~ 1п (3) а перпендикуляр Э), восстановленный в точке Л к гиперпло- скости ЭЛ, будет иметь уравнения * . qi__ tn “1 “л ’
398 АФФИННЫЕ ПРОСТРАНСТВА [Гл. VIII Согласно п. 32.2 для угла ф между Т и $ имеем I ЯЛ + ••• + аИп /| Р + ...+ I ал Is /I h |2 + ... + |'л I2 и, следовательно, угол <р между ЭЛ и St удовлетворяет соотно- шениям sin ср ___________I а1Л ~Ь ••• + ап1п I_______ ai I2 + •• + ! ап Is /! Л I2 + •••+! |2 (o^cp^-j). (5) Как и в обычном евклидовом пространстве, угол между пря- мой и плоскостью в унитарном пространстве обладает свойством экстремальности. Теорема. Пусть в унитарном п-мерном пространстве 1!л прямая St пересекает k-мерную плоскость ЭЛ в точке А под углом гр, отличным от 0 и к/2. Тогда угол между St и любой прямой 3, проходящей в плоскости ЭЛ через А и отличной от проекции St на ЭЛ, больше ср. Берем на St какую-нибудь точку В, отличную от А, и опу- скаем из В на ЭЛ перпендикуляр, основание которого обозначим через С. Основание перпендикуляра, опущенного из точки В на прямую 3, обозначим через D (см. рис. 11). Так как прямая В\/С перпендикулярна плоскости ЭЛ, то углы BCD и ВС А пря- мые. Угол BDA прямой по построению. Из прямоугольных треу- гольников ВС A, BDA, BCD соответственно получаем sin?=:^, sin(X 3) = f^, bd^Vbc^dc^bc. Lj /1 D /1 Поэтому sin ср sin (X 3)> (X 3)> что и требовалось. Примеры и задачи В приведенных ниже задачах предполагается, что в каждом случае выбран и зафиксирован ортонормированный репер евклидова точечного простран- ства и точки этого пространства задаются координатами относительно этого репера. 1. Найти ортогональную проекцию отрезка [(0, 0, 0, 0), (4, —1, —3, 4)] на плоскость 9Д = Ао V V ^2 V ^з, где координатные строки точек До, At, А2, А3 — соответственно (0, 0, 0, 0), (1, 1, 1, 1), (1, 2, 2, —1), (1, 0, 0, 3). 2. Расстоянием от точки А до плоскости Шс называется минимум рас- стояний от данной точки до точек из SW. Доказать, что это расстояние равно длине вектора ДРг^А. 3. Найти длины сторон и внутренние углы треугольника, вершины кото- рого заданы координатными строками (2, 4, 2,4, 2), (6, 4, 4, 4, 6), (5, 7, 5, 7, 2). 4. Найти угол между прямой Ао \/ В и плоскостью Ло У Л V Да, где координатные строки точек Ао, AL, Аа, В равны соответственно (0, 0, 0, 0), (3, 4, —4, —1;, (0, 1, —1, 2), (2, 2, 1, 1).
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ Автоморфизм 139, 293, 332 — косой 81 Адъюнкт минора 55 — элемента 42 Алгоритм Гаусса 51 — Лагранжа 264 База 72, 81, 106, 206 Базис 72, 337, 353 Вектор 66 — изотропный 283 — корневой 147 — нормированный 203 — свободный 326 — собственный 141 Гиперплоскость 100, 341, 362, 385 Гиперповерхность алгебраическая 357 Гомоморфизм 331, 351 Делитель миноров 155 — элементарный 164 Дефект матрицы 134 — преобразования 129 Длина вектора 203 Дополнение ортогональное 212 — , — к плоскости 393 Зависимость линейная 70, 71, 334, 336 Закон двойственности 351 — инерции 260, 268 Замыкание 336, 381 Изоморфизм билинейно-метрических прост- ранств 284 — косой 81 — линейных преобразований 132, 228, 294 ---пространств 78, 132 — унитарных пространств 210 Кватернион 26 Клетка Жордана 145 ---обобщенная 178 Конгруэнтность матриц 259, 273 — форм 257, 272 Коразмерность 340 Кратность собственного значения 142 Линейная комбинация 68 Ломаная 387 Луч 376 Матрица 10 — автоморфизма 372 — адъюнгированная 47 — билинейной функции 279 — Грама 214, 282 — жорданова 146, 171 — идемпотентная 29 — инволютивная 29 — индуцированного преобразования 137 — каноническая диагональная 152 — клеточно-диагональная 24 — клеточно-треугольная 62 — комплексно-сопряженная 20 — кососимметрическая 18 — линейного преобразования 120 — многочленная (А-матрнца) 150 Матрица неособенная 49 — нильпотентная 64 — нулевая 11 — обратная 19, 85 — ортогональная 20, 49 — особенная 49 — перехода 83, 370 — полупростая 180 — полураспавшаяся 34, 62, 137 — преобразования 255 — присоединенная 47 — распавшаяся 61 — симметрическая 18 — симплектическая 314 — системы 30, 31, 50, 93 — скалярная 169 — сопровождающая 174 — строчечно-конечная 29 — транспонированная 18, 40 — треугольная 64 — унитарная 21, 49, 226 — формы 257 — характеристическая 57 — эрмитова 21, 234 Метрика билинейная 282 Минор 42, 55, 64 Многогранник выпуклый 386 Многообразие алгебр 351 — алгебраическое 357 — корневое 348 — линейное 336 Многочлен матричный 16, 167 — минимальный матрицы 60 --- преобразования 140 Множество выпуклое (конвексное) 381, 383 Множители инвариантные 159, 272 Модуль 65 — унитарный 66, 80 Независимость линейная 70, 334, 336 Неравенство Бесселя 208 — Коши—Буняковского 208 Область значений 129 Определитель 30, 31 — Вандермонда 54 — Грама 214 — объемный 355 — преобразования 139 Ортогональность векторов 205, 283 — множеств векторов 211 — подпространств 211 Отрезок 376 Перенос 327 Плоскость 100, 336 — дополнительная 340 — координатная г-мерная 362 — пустая 338 Подобие матриц 55, 170 — преобразований 132, 228 Подпространство 98 — дополнительное 339 — изотропное 283 — инвариантное 135 — истинное (нетривиальное) 99 — касательное 344
400 ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ Подпространство корневое 147 — линейное 98 — нулевое 98 — тривиальное 98 Подстановка 114, 115 Поле упорядоченное 374 Полуплоскость 380 Полупространство 378 Порядок дуальный 375 — , естественный на прямой 375 Правило треугольника 330 Представление функционала 355 Преобразование 110, 117 — взаимно однозначное 113 — единичное 112, 118 — идемпотентное 248 — изометрическое 293 — индуцированное 137 — координат 83, 84, 121 — кососимметрическое 233, 291, 298 - Кэли 245, 299 — линейное 117, 241 — неособенное 131 — нормальное 219 — нулевое 118 — обратное 112 — ортогональное 249, 306 — особенное 131 — проекционное 248 — псевдоунитарное 324 — симметрическое 231, 235, 291, 298 — симплектическое 314 — сопряженное 217, 289 — унитарное 225 — эрмитово 231 — л-матриц элементарное 151 Признак Якоби 270 Проекция вектора на подпространство 213, 248 — ортогональная 393 Произведение матриц 13 — преобразований 111 — скалярное 201, 202 Пространство аффинное над векторным прост- ранством 326 — — — полем 329, 351 — билинейно-метрическое 282 — евклидово 200, 201, 286, 386 — конечномерное 13 — линейное (или векторное) 66, 68 — метрическое 387 — псевдоевклидово 285 — псевдоунитарное 286, 315 — симплектическое 286, 309 — сопряженное (или дуальное) 214 — строк 68 — унитарное 201, 386 — функций 202 Процесс Грама—Шмидта 209 Прямая 100, 338 Равенство Парсеваля 209 Радиус-вектор точки 327 Разложение полярное 241 — спектральное 250 Размерность аффинного пространства 334 — выпуклого множества 383 — линейного пространства 73 Ранг матрицы 86 — однородной системы 108 — преобразования 129 — формы 257 Расстояние между векторами 205 ---точками 387 Репер 353, 388 Решение нулевое 106 Решение системы линейных уравнений 50, 93 Ряд степенной от матриц 190 Сдвиг 327 Сигнатура пространства 285, 286 — формы 260 Симплекс 385, 386 Система векторов линейно зависимая 70 --- ортогональная 205 ---ортонормированная 206 — координатная 81 ---нормальная 301, 316 ---симплектическая 309 — образующая 72 — точек выпукла неприводимая 386 — уравнений 357 ---линейных 50, 51, 95, 105 След матрицы 57 — преобразования 139 Смещение 329 Собственное значение матрицы 58 --- преобразования 140 Спектр линейного преобразования 252 Строка 68 — координатная 82, 353, 355 Сумма матриц прямая 24 — подпространств 100, ЮЗ, 211 — преобразований 126 — ряд матриц 190 Теорема Гамильтона—Кэли 59 — Кронекера—Капелли 94 — Шура 239 Тождество Лагранжа 47 Угол между лучами 391 ---прямой и плоскостью 396 ---прямыми 389 Форма 256 — билинейная 256, 258, 259, 261 — естественная нормальная 174, 175 — Жордана 146, 178 — каноническая Л-матрицы 152 — квадратичная 254, 269 — линейная 254 — полилинейная 256 — эрмитова билинейная 258, 258, 263 — s-ro порядка 358 Формулы Крамера 51 Функционал линейный 346 — полилинейный 358 — 5-го порядка 358 Фундаментальная система решений 106 Функция 69 — билинейная 278, 280, 281 — квадратичная 280, 281 — косолинейная 224 — линейная 214 — матрицы 182, 183 Характеристика билинейной функции 325 — Вейра 180 — Сегре 180 Характеристический многочлен матрицы 57 --- преобразования 139 Циркулянт 44 Число характеристическое 58 Эквивалентность матриц скалярная 169, 228, 271 — форм 256, 271 — Л-матриц 151 Эндоморфизм косой 81 Ядро преобразования 129