Текст
                    А.И.Кострикин, Ю.И.Манин
ЛИНЕЙНАЯ АЛГЕБРА И ГЕОМЕТРИЯ
Книга посвящена изложению фундаментальных понятий и аппарата линейной
алгебры и родственных ей разделов геометрии. От имеющихся курсов линейной
алгебры книга отличается большим вниманием к приложениям и связям с
другими областями математики: включено обсуждение основных принципов
квантовой механики, описана геометрия пространства Минковского, дано
введение в линейное программирование. Книга содержит современный
математический материал, не излагавшийся в традиционных руководствах: язык
категорий и категорные свойства линейных пространств, кэлерова метрика,
введение в теорию многочленов Гильберта.
Для студентов механико-математических специальностей высших учебных
заведений.
ОГЛАВЛЕНИЕ
Предисловие	5	ортогональные многочлены
Часть 1. Линейные пространства и	7	§ 5. Евклидовы пространства	117
линейные отображения		§ 6. Унитарные пространства	126
§ 1. Линейные пространства	7	§ 7. Ортогональные и унитарные 133
§ 2. Базис и размерность	14	операторы
§ 3. Линейные отображения	21	§ 8. Самосопряженные операторы 137
§ 4. Матрицы	27	§ 9. Самосопряженные операторы 147
§ 5. Подпространства и прямые	38	в квантовой механике
суммы		§ 10. Геометрия квадратичных	155
§ 6. Факторпространства	47	форм и собственные значения
§ 7. Двойственность	51	самосопряженных операторов
§ 8. Структура линейного отображения	54	§ 11. Трехмерное евклидово	163 пространство
§ 9. Жорданова нормальная форма	61	§ 12. Пространство Минковского 171
§ 10. Нормированные линейные пространства	68	§ 13. Симплектические	181 пространства
§11. Функции линейных операторов	74	§ 14. Теорема Внтта и группа	185 Витта
§ 12. Комплексификация и	77	§ 15. Алгебры Клиффорда	189
овеществление		Часть 3. Аффнииая и проективная 193
§ 13. Язык категорий	83	геометрия
§ 14. Категорные свойства линейных пространств	88	§ 1. Аффинные пространства,	193 аффинные отображения и
Часть 2. Геометрия пространств со	93	аффинные координаты
скалярным произведением		§ 2. Аффинные группы	201
§1.0 геометрии	93	§ 3, Аффинные подпространства 205
§ 2. Скалярные произведения	95	§ 4. Выпуклые многогранники и 212
§ 3. Теоремы классификации	102	линейное программирование
§ 4. Алгоритм ортогонализации и	по	§ 5. Аффинные квадратичные	215

функции и квадрики § 6. Проективные пространства 220 § 7. Проективная двойственность 226 и проективные квадрики § 8. Проективные группы и 230 проекции § 9. Конфигурации Дезарга и 239 Паппа и классическая проективная геометрия § 10. Кэлерова метрика 243 §11. Алгебраические 245 многообразия и многочлены Гильберта Часть 4. Полилинейная алгебра 254 § 1. Тензорное произведение 254 линейных пространств § 2. Канонические изоморфизмы и 259 ПРЕДМЕТНЫЙ Аксиома Дезарга 243 — Паппа 243 Аксиомы трехмерного проективного пространства 241 — проективной плоскости 242 Алгебра внешняя 192, 276, 277 — гомологическая 88 — Грассмана 192, 276 — Клиффорда 189 — Ли 34, 38 ----классическая 35 ----gl(n,K) 35 ----о(п,К) 35 ----sl(n,K) 35 ----su(n)35 ----u(n) 35 — над полем ассоциативная 189 — симметрическая 273, 274 — тензорная 266 Алгоритм ортогонализации Грама — Шмидта 111 Альтернатива Фредгольма конечномерная 50 Альтернирование тензора 275 Амплитуда вероятности 131 линейные отображения тензорных произведений § 3. Тензорная алгебра линейного 264 пространства § 4. Классические обозначения 266 § 5. Симметричные тензоры 271 § 6. Кососимметричные тензоры и 275 внешняя алгебра линейного пространства § 7. Внешние формы 285 § 8. Тензорные поля 287 § 9. Тензорные произведения в 291 квантовой механике Предметный указатель 297 УКАЗАТЕЛЬ Аннулятор р-вектора 279 Антисимметриэация тензора 275 Аппроксимация 114 Базис пространства 14 ---гиперболический 186 ---двойственный 24 ---жорданов 59 ---ортогональный 106 ---ортонормированный 106 ---симплектический 107 — тензорный 257 Базисы одинаково ориентированные 46, 177 ---пространственно ориентированные 178 Бозон 293 Буст 179 Валентность тензора 264 Вектор грассмановых координат 282 — касательный 287 — корневой 61 — собственный 56 — состояния 130 — циклический 67
Векторы одинаково временно ориентированные 176 — ортогональные 98 Величина случайная 126 ---нормированная 126 Величины случайные независимые 126 Вероятность 129 Вершина выпуклого множества 214 Вес билинейной формы 114 Возмущение 152 Вычитание внешнее 194 Гамильтониан 150 — невозмущенный 152 Геометрия ортогональная 98 — симплектическая 98 — эрмитова 98 Гиперплоскость 224 — касательная 228 — полярная 227 Гиперповерхность алгебраическая 246 Гомотетия 22 Грань верхняя 20 — выпуклого множества 213 Грассманиан 281 Группа аффинная 201 — Внтта 189 — движений 202 — классическая 33 — линейная полная 24, 34 ---специальная 34 — Лоренца 135, 173, 178 — ортогональная 34 ---специальная 34 — проективная 231 — Пуанкаре 202 Группа симплектическая 183 — унитарная 34 ---специальная 34 Движение аффинного евклидова пространства 202 ----------несобственное 204 ---------собственное 204 — непрерывное 44 Двойственность тензорных произведений 260 Действие 151 — симметрической группы на тензорах 260 — транзитивное 193 — эффективное 193 Дельта-функционал Дирака 13 Дельта-функция 9 Деформация 44 Диагональ главная 27 Диаграмма 84 — коммутативная 84 Дисперсия 149 Дифференциал отображения в точке 27 — функции 289 Дифференцирование кольца 288 Длина вектора 118, 129 — флага 18 Дополнение ортогональное 53, 102 — прямое 43 Зависимость линейная 16 Замыкание проективное 225 Значение собственное 56 — среднее 149 Идеал 247 — градуированный 247 — двусторонний 274 — конечно порожденный 248 — , порожденный множеством 248 Излучение фотонов 152 Изометрия линейных пространств 99 Изоморфизм 23 — в категориях 83 — естественный 23 — канонический 24 — проективный 230 — функторный 87 Инвариант линейного оператора 33 Индекс оператора 50
Интервал времениподобный 172 — пространствеииоподобный 172 — светоподобный 172 Карта аффинная 221 Категория 83 — абелевых групп 83 — групп 83 — дуальная 85 — линейных пространств 83 — множеств 83 — функторов 87 Квадрат коммутативный 84 Квадрика аффнииая 219 — полярная 227 Кватернионы 168 Клетка жорданова 58 — циклическая 67 Ковариация 126 Кольцо градуированное 247 Комбинация линейная 8 ---тензоров одинакового типа 268 — точек барицентрическая 198 Коммутатор 34 — в К-алгебре Ли 38 — групповой 37 Комплекс 84 — ацикличный 85 — точный 85 в члене 85 Комплексификация линейного пространства 80 — проективного пространства 229 Композиция морфизмов 83 — функторов 87 Компонента градуированного пространства однородная 246 — группы Лоренца 178 — тензора 267 Конец стрелки 83 Конус асимптотических направлений 158 — световой 173 Конфигурации в аффнииом пространстве аффниио конгруэнтные 208 ---------метрически конгруэнтные 208 — проективно конгруэнтные 232 Конфигурация 208 — Дезарга 240 — координатная 208 — Паппа 240 — проективная 232 Кообраз 50 Координата тензора 267 Координаты аффинные 197 — барицентрические 199 — вектора 14 — точки однородные 220 Коразмерность подпространства 49 Косокоммутативность 276 Коэффициент корреляции 126 — Фурье 115 Коядро 50 Критерий Сильвестра 113 — цикличности пространства 67 Круг 71 Лемма о змее 91 — Цорна 20 Линия мировая инерциального наблюдателя 172 Логарифм оператора 76 Матрица 27, 267 — антисимметричная 35 — антиэрмитова 35 — блочная 28 — Грама 96 ---положительно определенная 113 — диагональная 27 — Дирака 36 — единичная 28 — жорданова 58 — квадратная 27 — композиции линейных отображений 30
— контраградиентная 268 — кососимметричная 35 — косоэрмитова 35 — линейного оператора 29 ---отображения 29 — ортогональная 34, 134, 135 — Паули 36, 164 — перехода 32 — псевдоортогональная 135 — псевдоунитарная 135 — симметричная 35 — скалярная 28 — транспонированная 28 — треугольная верхняя 27, 28 ---иижняя 28 — унитарная 34, 135 — эрмитова 35 — эрмитово антисимметричная 35 симметричная 35 — сопряженная 34 Медиана системы точек 212 Метод наименьших квадратов 121 — Штрассена 37 Метрика 69, 96 — дискретная 69 — естественная 69 — кэлерова 244 Многогранник 213 Многообразие алгебраическое 246 — Грассмана 281, 283 Многочлен, аннулирующий оператор 59 — Гильберта 252 — Лежандра 116, 143 — минимальный 60 — однородный 245 Многочлен тригонометрический 114 — Фурье 114, 115, 143 — характеристический 56 — Чебышева 117, 145 — Эрмита 117, 144 Множество выпуклое 71 — измеримое 122 — линейно упорядоченное 19 — частично упорядоченное 19 Множитель Лоренца 176 — фазовый 130 Модуль 248 — градуированный 248 — конечно порожденный 249 — нётеров 249 Монотонность размерности 18 Морфизм категории 83 — нулевой 84 — функторный 87 Наблюдаемая 148 — импульса 150 — координаты 150 — проекции спина 150, 167 — энергии 150 ---квантового осциллятора 150 Направление 164 Направления асимптотические 157 Направленность времени 172 Начало стрелки 93 Независимость линейная 16 Неравенство Кошн — Буняковского— Шварца 118, 128 — Минковского 74 — треугольника 118, 129 ---в обратную сторону 175 Норма вектора 70 — линейного оператора индуцированная 72, 146 Оболочка аффинная 206 — линейная 16 — проективная 223 Образ линейного отображения 26 — обратный 86 Образующие конуса 158 — мультипликативные 189 Объект категории 83 ---инъективный 83 ---проективный 83 Объем п-мерный 122 ---шарового кольца 125
Овеществление линейного пространства 77 Ожидание математическое 126 Окружность 71 Оператор Гамильтона 150 — диагонализируемый 56 Оператор пограничный 92 — линейный 21 — неотрицательный 146 — нильпотентный 61 — нормальный 145 — ортогональный 133 — рождения частиц 294 — самосопряженный 138, 139 — симметричный 139 — сопряженный 139 — унитарный 133 — уничтожения частиц 294 — числа частиц 294 — эрмитов 139 Определитель линейного оператора 33 Опускание индексов тензора 263,270 Ориентация пространства 46, 166 ---Минковского 177 Оси квадратичной формы главные 156 Отклонение среднеквадратичное 149 Отношение двойное 235 — перспективное 237 — порядка 19 Отображение антилинейное 82 — аффниио линейное 195 — аффинное 195 — билинейное 51, 95 — двойственное 52 — двойственности 227 — линейное 21 ---нулевое 22 ---ограниченное 72 ---тождественное 22 — полилинейное 95, 254 ---универсальное 254 — полулинейное 82 — полуторалинейное 96 — симметризации 271 — сопряженное 52 — Хопфа 222 Отражение 136 — времени 180 — пространственное 180 Пара базисов двойственная 52 Параболоид гиперболический 157 — эллиптический 156 ---п-мерный 158 Парадокс близнецов 176 Параллелепипед со сторонами {li,...,ln} 123 Пары наблюдаемых канонически сопряженные 149 Пересечение подпространств трансверсальное 40 Перестановка 269 Перпендикуляр к двум подпространствам общий 210 Печка 148 План производства 212 ---, оптимальный по прибыли 213 Плоскость гиперболическая 185 — проективная 220 Поглощение фотонов 152 Подгруппа операторов однопараметрическая 75 — ортохроииая 173 Подмногообразие линейное 47 Подмножество выпуклое 71 — ограниченное 70 Подпространства аффинные параллельные 205, 206 — ортогональные 98 Подпространство аффинное 205 — вещественное 230 — градуированное 247 — изотропное 102, 181
—, инвариантное относительно оператора 56 — линейное 10 — направляющее 205 — , натянутое навекторы 16 — невырожденное 102 — , порожденное векторами 16 — проективное 223 — собственное 56 — состояний квантовой системы 129 Подсемейство максимальное 17 Подъем индексов тензора 263, 270 — поля скаляров 86, 258 Покрытие проективного пространства аффнииое 220 Поле векторное 288 — тензорное 289 Положение общее подпространств 40 ---точек 233 — равновесия механической системы 159 Полупространство 213 Поляризация квадратичной формы 10 Последовательность Коши 70 — линейных пространств точная 54 — сходящаяся 70 — точная 85 — фундаментальная 70 Постоянная Планка 151 Правила Фейнмана 131, 132 Преобразование Кэлн 146 Приведение билинейной формы к каноническому виду 109 — квадратичной формы к каноническому виду 110, 111, 114 — матрицы к каноническому виду 108 Принцип неопред елейности Гейзенберга 149 — Паули 293 — проективной двойственности 226 — суперпозиции 130, 292 Проективизация 230 Проектор 42 — самосопряженный 141 Проекция вектора ортогональная 119 — из центра 236 Произведение векторное 167 — внутреннее 287 — Кронекера 37 — морфизмов 83 — скалярное 96 ---антисимметричное 98 ---невырожденное 99 ---симметричное 98 ---симплектическое 98 ---эрмитово 98 -------симметричное 98 — тензорное 37 ---линейных отображений 262 ---пространств 255 Производная по направлению 288 Пространства изометричные 99 — изоморфные 23 Пространство анизотропное 185 — аффнииое 94, 193 ---евклидово 202 — банахово 70 — бесконечномерное 14 — векторное 7 — вероятностное конечное 126 — гильбертово 127 — гиперболическое 185 — главное однородное 194 — , двойственное к данному 10, 51 — евклидово 117 — касательное 288 — когомологий 91 — комплексное сопряженное 81 — конечномерное 14 — координатное одномерное 8 ---п-мерное 8 — линейное 7
----, ассоциированное с аффинным пространством 193 ----градуированное 246 ----над телом 242 ----нормированное 70 -------полное 70 — метрическое 68, 69 ----полное 70 — Минковского 158, 171 — нульмерное 8 — ортогональное одномерное нулевое 101 -------отрицательное 101 -------положительное 101 — проективное 94, 220 ----двойственное 226 ----координатное п-мерное 220 ----трехмерное вещественное 170, 171 Пространство рефлексивное 26 — симплектическое 181 — сопряженное 10 — спиноров 163 — унитарное 126 — физическое инерциального наблюдателя 173 — функций 8, 9 — циклическое 67 Прямая проективная 220 Пфаффиан 184 Разбиение проективного пространства клеточное 237 Разложение оператора полярное 147 ----спектральное 142 Размерность алгебраического многообразия 253 — линейного пространства 14 — проективного пространства 220 Ранг матрицы 37 — семейства векторов 16 — скалярного произведения 99 — тензора 264, 294 ----предельный 295 Расположение подпространств взаимное 40 Расстояние между множествами 119, 132 ------точками 69 — от точки до подпространства 209 Расширение группы аффнииое 202 Ряд абсолютно сходящийся 70 — Пуанкаре 251 — теории возмущений 154 — Фурье 116 Свертка тензора 262, 269 ------по -индексам 263 ------полная 263 Сдвиг 193 Семейство векторов линейно зависимое 16 ------независимое 16 Сигнатура квадратичной формы 110 — пространства 104 Символ Кронекера 9 Симметризация тензора 271 Симплекс замкнутый 201 ------вырожденный 201 — (п—1)-мерный стандартный 201 Система аффинных координат 197 — координат барицентрическая 199 ------инерциальная 173 — образующих идеала 248 ------модуля однородная 249 — уравнений нормальная 122 След линейного оператора 33 Сложение матриц 29 Сопряжение 33 — дифференциальных операторов формальное 143 Состояние вакуумное 294 — квантовой системы 130 ------базисное 131 ------возбужденное 152 ------вырожденное 152 ------основное 152 ------стационарное 151
Спаривание пространств 51 -----каноническое 51 Спектр квантовой системы энергетический 151 — оператора 58 -----простой 58 — самосопряженного оператора 161 Спуск поля скаляров 78 Среднее арифметическое 13 — взвешенное 14 — квадратичное взвешенное 114 Статистика Бозе — Эйнштейна 293 — Фермн 293 Степень внешняя 287 — вырождения 151 — многообразия 253 Столбец матрицы 27 Стрелка 83 Строка матрицы 27 Структура комплексная 78 -----каноническая 78 -----сопряженная 81 Сумма линейных отображений прямая 44 — подпространств 38 -----прямая 41 -----внешняя 43 Суперпозиция 130 Сфера 69 Сходимость по норме 70 Тело 242 — кватернионов 168 Температура 125 Тензор 264, 268 — антисимметричный 275 — ковариантный 264 — контравариантный 264 — кососимметричный 275 — Кронекера 268 — метрический 267, 290 — симметричный 271 — смешанный 264 — структурный 265, 268 Теорема Витта 186 — Гамильтона — Кэлн 60 — Дезарга 257 — инерции 105 — о продолжении базиса 17 Теорема о продолжении отображений 88, 89 ---точности функтора 89, 90 — Паппа 241, 243 — Фишера — Куранта 162 — Шаля 204 — Эйлера 137 — Якоби 114 Теориявозмущений 152 — Морса 160 — относительности специальная 171 Тип тензора 264 Топология слабая 73 Точка аффинного пространства 193 — вещественная 230 — внутренняя 213 — критическая 160 — невырожденная 160 — проективного пространства 220 — центральная 216 Точность функтора тензорного умножения 264 Тройка точная 85 Углы Эйлера 170 Угол между векторами 119, 129 ---прямой и аффинным подпространством 212 ---прямыми 212 Умножение внешнее 275 — матриц 30 — на скаляр 22, 29 — тензорное 265 Уравнение Шрёдингера 151 Уровень энергетический 151 Условие Гильберта 13 — Коши 13 — линейное 10 Факторпространство 48
Фермнон 293 Фильтр 148 Фильтрация возрастающая 18 — убывающая 18 Флаг пространства 18 максимальный 18 Форма 95, 245 — билинейная 108 — квадратичная 109 ---положительно определенная 113 — нормальная жорданова 59 — объема 291 — полилинейная 95 Функтор 85 — ковариантный 85 — контравариантный 85 — , представляющий объект категории 87 — тензорного умножения 264 Функционал линейный 10 Функция аффниио линейная 195 — квадратичная 215 — линейная 10 — полилинейная 95 Характеристика эйлерова 91 Центр 216 Цепь 19 Цилиндр параболический 157 Часть анизотропная пространства 188 — квадратичная квадратичной функции 215 — линейная аффнииого отображения 195 ---квадратичной функции 215 Число заполнения 293 Шар замкнутый 69 — открытый 69 Шар п-мерный 124 Эквивалентность норм 72 Эксперимент Штерна— Герлаха 165 Экспонента ограниченного оператора 75 Элемент максимальный 20 — наибольший 20 — однородный 246 Эллипсоид п-мерный 124 Энергия 125 Ядро линейного отображения 26 -------левое 102 -------правое 102 — скалярного произведения 99 А-модуль 248 — градуированный 248 р-вектор 279 — разложимый 279 р-форма внешняя 285, 291 О-процесс 239 \|т-функция 130 1-форма дифференциальная 289
ПРЕДИСЛОВИЕ На все можно смотреть с разных точек зрения, предмет этой книги — не исключение. Для студента мехмата МГУ линейная алгебра — это то, что читают первокурсникам во втором семестре. Для прсфесснонала-алгебраиста, воспитан- ного в духе Бурбаки, линейная алгебра — это теория алгебраических структур частного вида — линейных пространств и линейных отображений, или, в более новомодном стиле, теория линейных категорий. С более широкой точки зрения, содержание линейной алгебры состоит в про- работке математического языка для выражения одной из самых общих есте- ственнонаучных идей — идеи линейности. Возможно, ее важнейшим специальным случаем является принцип линейности малых приращений: почти всякий есте- ственный процесс почти всюду в малом линеен. Этот принцип лежит в основе всего математического анализа и его приложений. Векторная алгебра трехмер- ного физического пространства, исторически ставшая краеугольным камнем в здании линейной алгебры, восходит к тому же источнику после Эйнштейна мы понимаем, что и физическое пространство приближенно линейно лишь в малой окрестности наблюдателя. К счастью, эта малая окрестность довольно велика. Физика двадцатого века резко и неожиданно расширила сферу применения идеи линейности, добавив к принципу линейности малых приращений принцип суперпозиции векторов состояний. Грубо говоря, пространство состояний любой квантовой системы является линейным пространством над полем комплексных чисел. В результате почти все конструкции комплексной линейной алгебры пре- вратились в аппарат, используемый для формулировки фундаментальных зако- нов природы: от теории линейной двойственности, объясняющей квантовый прин- цип дополнительности Бора, до теории представлений групп, объясняющей таб- лицу Менделеева, «зоологию» элементарных частиц и даже структуру простран- ства-времени. Выбор материала для этого курса определялся желанием авторов не только изложить основы аппарата, почти завершенного к началу этого века, но и дать представление о его приложениях, обычно относимых к другим дисциплинам. Традиции преподавания способствуют рассечению живого тела математики на изолированные органы, жизнеспособность которых приходится поддерживать искусственно. Особенно это относится к «критическим периодам» в истории на- шей науки, которые характерны вниманием к логической стройности н детальной проработке оснований. Последние полвека были временем теоретико-множествен- ной перестройки языка и фундаментальных понятий; единство математики стало рассматриваться преимущественно как единство ее логических принципов. Не отказываясь от замечательных достижений этого периода, мы хотели отразить в книге и намечающиеся тенденции к синтезу математики как орудия познания внешнего мира. (К сожалению, нам пришлось оставить в стороне теорию вычис- лительных аспектов линейной алгебры, выросшую в самостоятельную науку.) По этим соображениям в предлагаемую книгу, как и во «Введение в алгеб- ру» одного из авторов, включен не только материал для лекционного курса, ио и разделы для домашнего чтения, которые могут быть использованы также на семинарских занятиях. Жесткого разделения здесь не может быть. Все же в со- ответствии со стандартной программой лекционный курс (один семестр, по две лекции в неделю) должен включать основной материал § 1—9 части 1; § 2—8
части 2; § 1, 3, 5, 6 части 3 и § 1, 3—6 части 4. При этом под «основным мате- риалом» мы понимаем не столько доказательства трудных теорем (которых в линейной алгебре немного), сколько систему понятий, которыми следует овла- деть. Поэтому многие теоремы из этих разделов могут быть рассказаны в более простом варианте или вовсе опущены; по недостатку времени такие сокращения неизбежны. Как избежать при этом превращения лекций в унылый список опре- делений, составляет серьезную заботу преподавателя. Мы надеемся, что осталь- ные разделы курса помогут ему в этом. При переиздании внесены исправления опечаток и мелких стилистических по- грешностей, сообщенных нам рядом читателей. В двух местах пришлось коррек- тировать доказательства. Многочисленные ценные замечания были сделаны со- трудниками кафедры алгебры и теории чисел Ленинградского государственного университета. Конструктивная критика рецензентов, а также высококвалифици- рованная, тщательная работа редактора издания В. Л. Попова во многом спо- собствовали улучшению качества книги. Мы выражаем им всем глубокую бла- годарность. Все оставшиеся недочеты в книге авторы, разумеется, относят на свой счет. СПИСОК ДОПОЛНИТЕЛЬНОЙ ЛИТЕРАТУРЫ 1. Кострикин А. И. Введение в алгебру. — М.: Наука, 1977. 2. Ленг С. Алгебра. — М.: Мир, 1968. 3. Мальцев А. И. Основы линейной алгебры. — М.: Наука, 1975. 4. Гельфанд И. М. Лекции по линейной алгебре. — М.: Наука, 1966. 5. Халмош П. Р. Конечномерные векторные пространства. — М.: Физматгиз, 1963. 6. Артин Э. Геометрическая алгебра.—М.: Мир, 1970. 7. Глазман И. М., Любич Ю. И. Конечномерный линейный анализ. — М.: Наука, 1969. | 8. Воеводин В. В. Вычислительные основы линейной алгебры. — М.: Наука, 1977.
Часть 1. ЛИНЕЙНЫЕ ПРОСТРАНСТВА И ЛИНЕЙНЫЕ ОТОБРАЖЕНИЯ § 1. Линейные пространства 1. Векторы с началом в выбранной точке пространства можно умножать на числа и складывать по правилу параллелограмма. Это — классическая модель законов сложения перемещений, ско- ростей, сил в механике. В общем определении векторного, или ли- нейного, пространства вещественные числа заменяются произволь- ным полем, а простейшие свойства сложения и умножения век- торов постулируются в качестве аксиом. Никаких следов «трехмерности» физического пространства в определении ие остается. Понятие размерности вводится и изучается отдельно. Из курса аналитической геометрии на плоскости и в трехмер- ном пространстве известно много примеров геометрической интер- претации алгебраических соотношений между двумя или тремя переменными. Но, по выражению Н. Бурбаки, «...ограничение геометрическим языком, отвечающим пространству только трех измерений, было бы ярмом для современного математика, столь же неудобным, как то, которое мешало грекам распространить понятие числа на отношения несоизмеримых величин...». 2. Определение. Линейным (или векторным) пространством L над полем Ж называется множество, снабженное бинарной опера- цией LXL-+L, обычно обозначаемой как сложение: (Ц, /2) »—> + /2, и внешней бинарной операцией ЖУ^Е-^-Е, обычно обо- значаемой как умножение: (a,l)>—>al, которые удовлетворяют следующим аксиомам: а) Сложение элементов L, или векторов, превращает Е в ком- мутативную (абелеву) группу. Ее нулевой элемент обычно обозна чается 0; элемент, обратный к I, обычно обозначается —I. б) Умножение векторов на элементы поля Ж, или скаляры, унитарно, т. е. 11 = 1 для всех I, и ассоциативно, т. е. a(bl) = (ab)l для всех а,Ь<^Ж\ l^L. в) Сложение и умножение связаны законами дистрибутивности, т. е. а (1\ 4" /2) == ^1 (ai 4~ щ) /= ^1/ 4~ aj, для всех a, ait а2е.Ж; I, Е, l2 е Е. 3. Вот некоторые простейшие следствия определения. а) 0/ = а0 = 0 для всех а е Ж, l^L. Действительно, 0/ + 0/ = = (0-f-0)/ = 01, откуда 01 = 0 по свойству сокращения в абелевой группе. Аналогично, й0 4- «0 = а (0 4- 0)= й0, т. е. й0 = 0. 7
б) (—1)/ = — /. Действительно, / + (—'!)/ = !/ + (— 1)/ = (!-}- + (— 1)) Z = 0Z = О, так что вектор (— 1) I обратен к I. в) Если al — 0, то либо а = 0, либо I — 0. В самом деле, если а 0, то 0 = a~l {al) = (a~la)l = il — l. г) Для любых П1, .... ап<^Ж; Ц, ln^L однозначно опре- п делено выражение -ф ... + anln — У aih- благодаря ассоциа- £ = 1 тивности сложения в абелевой группе можно не расставлять скобки, указывающие порядок вычисления попарных сумм. Ана- логично, однозначно определено выражение Oia2 ... ап1. п Выражение вида У, называется линейной комбинацией Z = 1 векторов /ь .... /я; скаляры а,- — коэффициенты этой линейной комбинации. Следующие примеры линейных пространств будут постоянно встречаться в дальнейшем. 4. Нульмерное пространство. Это — абелева группа L= {0}, состоящая из одного нуля. Единственно возможный закон умно- жения на скаляры: и0 = 0 для всех oejjf (убедитесь в справед- ливости аксиом!). Предостережение: нульмерные пространства над разными поля- ми— это разные пространства: задание поля Ж входит в опреде- ление линейного пространства. 5. Основное поле Ж как одномерное координатное пространст- во. Здесь L = Ж, сложение — это сложение в умножение на скаляры — это умножение в Ж. Справедливость аксиом линейного пространства следует из аксиом поля. Более общо, если имеется поле К и его подполе Ж, то К можно рассматривать как линейное пространство над Ж. Например, поле комплексных чисел С является линейным пространством над полем вещественных чисел R, которое в свою очередь является линейным пространством над полем рациональных чисел Q. 6. n-мерное координатное пространство. Положим L — Жп = = ХХ ..-У^Ж (декартово произведение л 1 множителей). Элементы L можно записывать в виде строк (аь ..., ап), а^Ж, или столбцов высоты п. Определим сложение и умножение на ска- ляр формулами: (щ, ..., an) + (i>i.&„) = («, + &!, ..., an + bn), a(ait an)<^(aait ..., аап). При п — 1 получается предыдущий пример. Одномерные простран- ства над Ж называют прямыми, или ^-прямыми; двумерные — Jzf-плоскостями. 7. Пространства функций. Пусть S — произвольное множество, F(S)—множество функций на S со значениями в Ж, или отобра- жений S в Ж. Как обычно, если f: 8-+Ж — такая функция, то через f(s) обозначается значение f на элементе seS. I6
Сложение и умножение функций на скаляр определяется пото- чечно: (f + g) («) = f (s) + g (s) для всех sg S, (af) (s) = a(f (s)) для всех a e Ж; s e S. Если S = {1, .... «}, to F(S) можно отождествить с Жп\ функ- ции f ставится в соответствие «вектор» всех ее значений (f(l), f(n)). Правила сложения и умножения согласованы относительно такого отождествления. Каждому элементу sgS можно поставить в соответствие важ- ную «дельта-функцию ds, сосредоточенную на {«}», которая опре- деляется так: 6s(s)= 1, бДО = О, если t=£s. Если 5={1, .... п}, вместо dt(k) обычно пишут б,* — это символ Кронекера. Если множество S конечно, то всякую функцию из F(S) можно однозначно представить в виде линейной комбинации дельта-функ- ций: У f(s)6s. в самом деле, это равенство следует из совпа- seS дения значений левой и правой части в каждой точке sg S. Наоборот, если f — У asds, то, беря значение в точке s, получаем se.S f(s)= as. Если множество S бесконечно, то этот результат неверен, точ- нее говоря, не может быть сформулирован в рамках наших опре- делений: суммы бесконечного числа векторов в общем линейном пространстве не определены! Некоторые бесконечные суммы мож- но определить в линейных пространствах, снабженных понятием предельного перехода, или топологией (см. § 10). Такие простран- ства составляют основной предмет изучения в функциональном анализе. В случае 5 ={1, .... п} функция б,- представлена вектором е,=(0, ..., 0, 1,0, ..., 0) (единица на t-м месте, нули на осталь- ных), а равенство / = У f(s)6s превращается в равенство s е S п (fi|, - •, ftn) У i — 1 8. Линейные условия и линейные подпространства. В анализе прежде всего рассматриваются вещественнозначные функции, определенные на всем R или интервалах (a, Для боль- шинства приложений, однако, пространство всех таких функций слишком велико: полезно рассматривать непрерывные или диф- ференцируемые функции. После введения соответствующих опре- делений обычно доказывается, что сумма непрерывных функций непрерывна и произведение непрерывной функции на скаляр не- прерывно: то же для дифференцируемости. Это означает, что только непрерывные или только дифферен- цируемые функции сами по себе образуют линейное пространство. Более общо, пусть L — линейное пространство над полем Ж, а М cg L — его подмножество, которое является подгруппой и
которое переходит в себя при умножении на скаляры. Тогда М вместе с операциями, индуцированными операциями в L (другими словами, ограничениями на М операций, определенных в L), назы- вается линейным подпространством в Z,, а условия, определяющие принадлежность к М общего вектора из L, называются линейными условиями. Вот пример линейных условий в координатном пространстве Жп\ фиксируем скаляры ..., ап^Ж и определим AfcZ,: (х„ 0,^ = 0. (1) i=i Объединение любого числа линейных условий также является линейным условием. Иными словами, пересечение любого числа линейных подпространств также является линейным подпро- странством (проверьте это!). Позже мы докажем, что в Жп любое подпространство описывается конечным.числом условий вида (1). Важный пример линейного условия дает следующая кон- струкция. 9. Двойственное линейное пространство. Пусть L — линейное пространство над Ж. Рассмотрим сначала линейное пространство F(L) всех функций на L со значениями в Ж. Назовем теперь функ- цию feF(L) линейной (иногда говорят «линейный функционал»), если она удовлетворяет условиям f (4 + 4) = f(4) + f (4), f(nl) — af(l) для всех l,li,l2^L, а(=Ж. Индукцией по числу слагаемых от- сюда получаем, что f (S Oik ) = £ atf (lt). Мы утверждаем, что линейные функции образуют линейное подпространство в F(L), или «условие линейности является линей- ным условием». В самом деле, если f, ft и f2 линейны, то (А + f2) (4 + 4) = fi (4 + 4) + f-Ah + 4) = = f 1 (/1) + f (4) + f2 (4) + f2 (4) = (fl + f2) (4) + (fl 4- f2) (4). (Здесь последовательно используются: правило сложения функ- ций, линейность fi и f2, коммутативность и ассоциативность сложе- ния в поле и опять правило сложения функций.) Аналогично, Xaf) (I, + l2) = a [f (h + 4)1 = a [f (/,) + f (/2)] = = a [f (/i)] + a [f (4)1 = («f) (4) + (af) (4). Таким образом, fi + f2 и af также линейны. Пространство линейных функций на линейном пространстве L называется двойственным, или сопряженным к L пространством, и обозначается L*. В дальнейшем мы встретимся со многими другими конструк- циями линейных пространств. 1Q
10. Замечания относительно обозначений. Обозначать нуль и сложение в Ж и L одинаковыми значками не вполне последова- тельно, но очень удобно. Все формулы обычной школьной алгеб- ры, которые осмысленны в этой ситуации, оказываются верными (см. образцы в п. 3). Вот два примера, когда предпочтительнее другие обозначения. а) Положим L = {л е R|x >• 0}. Рассмотрим L как абелеву группу по умножению и введем на L умножение на скаляры из R по формуле (а,х)ь->ха. Легко проверить, что все условия опре- деления п. 2 выполнены, хотя принимают в обычной записи другой вид: нулевой вектор в L есть 1, вместо 1/ = / мы имеем х1=х; вместо a(bl) = (ab)l— тождество (хь)а = хЬа; вместо (а+ 6)/ = = al + Ы — тождество x“+b = хахь и т. д. б) Пусть L — векторное пространство над полем комплексных чисел С. Определим новое векторное пространство L с той же ад дитивной группой L, но другим законом умножения на скаляры: (а, где а — комплексно сопряженное число к а. Из формул а-\-Ь = = а-}~ Б и ab = аБ без труда следует, что L — векторное простран- ство. Если в какой-то ситуации нам приходится рассматривать одновременно L и L, то может оказаться удобно писать вместо al, скажем, или а ° I. 11. Замечания о чертежах и наглядных образах. Очень многие общие понятия и теоремы линейной алгебры удобно иллюстриро- вать схематическими чертежами и картинками. Мы хотим сразу же предупредить читателя о некоторых опасностях таких изобра- жений. а) Малая размерность. Мы живем в трехмерном пространстве, и наши чертежи изображают обычно двух- или трехмерные об- разы. В линейной алгебре работают с пространствами любой ко- нечной размерности, а в функциональном анализе—с бесконечно- мерными. Наша «маломерная» интуиция поддается очень серьез- ному развитию, но развивать ее нужно сознательно. Простой пример: как представить себе общее расположение двух плоскостей в четырехмерном пространстве? Вообразите две пересекающиеся по прямой плоскости в R3, которые отрываются вдоль этой прямой всюду, кроме начала координат, расходясь в четвертое измерение. б) Вещественное поле. Физическое пространство R3 линейно над вещественным полем. Непривычность геометрии линейного пространства над Ж может быть связана со свойствами поля Ж. Например, пусть Ж = С (важнейший для квантовой механики случай). Прямая над С —это одномерное координатное простран- ство С1. Мы привыкли, что умножение точек прямой R1 на веще- ственное число а есть растяжение в а раз (при а > 1), сжатие в а-1 раз (при 0 < а < 1) или их комбинация с «переворачиванием» прямой (при а < 0). 11
Но умножение на комплексное число а, действующее на С1, естественно представлять себе при геометрическом изображении С1 в виде R2 («плоскость Аргана» или «комплексная плоскость» — не путать с С2!). При этом изображении числу z = x-j-iy^C отве- чает точка (х, у)е R2, а умножение на а =#0 соответствует растя- жению в |п| раз и повороту на угол arg а против часовой стрелки. Мы видим, в частности, что при а = — 1 вещественное «перево- рачивание» прямой R1 есть ограничение на R1 поворота С1 на 180°. Вообще, /i-мерное комплексное пространство С" можно, и часто полезно, представлять себе как 2п-мерное вещественное простран- ство R2" (ср. § 12 о комплексификации и овеществлении). Другим примером являются конечные поля Ж, в частности поле из двух элементов Рг={0, 1}, важное в теории кодирования. Здесь конечномерные координатные пространства конечны, и иногда удобно связывать с линейной геометрией над Ж дискретные об- разы. Например, У7" часто отождествляют с вершинами «-мерно- го единичного куба в Rn—множеством точек (ej, ..., еп), где е, = 0 или 1. Покоординатное сложение в F"— это операции Бу- ля: 14-0 = 0-|-1 = 1;04-0=1-|-1=0. Подпространство, состоя- щее из точек с е< + ... + е„ = 0, определяет простейший код с обнаружением ошибок. Условившись, что точки (ei, ..., 8„) коди- п руют сообщения только при У, 84 = 0, и приняв сигнал (ej, ..eh) i = l п с У 81 =# 0, мы можем быть уверены, что помехи при передаче 1=1 привели к ошибочному приему. в) Физическое пространство евклидово. Это значит, что в нем определены не только сложение векторов и умножение на скаляр, но также длины векторов, углы между ними, площади и объемы некоторых фигур и т. п. Наши чертежи несут принудительную информацию об этих «метрических» свойствах, и мы их машиналь- но воспринимаем, хотя в общей аксиоматике линейных пространств они никак не отражены. Нельзя представлять себе, что один век- тор короче другого, или что пара векторов образует прямой угол, до тех пор, пока пространство не наделено специальной дополнительной структурой, скажем, абстрактным скалярным произведением. Таким структурам посвящена вторая часть книги. УПРАЖНЕНИЯ 1. Образуют ли линейное пространство над Q следующие множества веще- ственных чисел: а) положительные вещественные числа; б) неотрицательные вещественные числа; в) целые числа; г) рациональные числа со знаменателем N; д) числа вида а + bit, где а, b — любые рациональные числа? 2. Пусть S — некоторое множество, F(S)—пространство функций со значе- ниями в поле Какие из следующих условий являются линейными; a) f обращается в нуль в данной точке S;
6) f обращается в единицу в дайной точке S; в) f обращается в нуль во всех точках подмножества So с S; г) f обращается в нуль хотя бы в одной точке подмножества So с S; д) f(x)->0 при |х| -> со; е) f(x) 1 при |х| ->оо; ж) f имеет ие более конечного числа точек разрыва (в д) —ж) предполагаем S = R и$=И)? 3. Пусть L — линейное пространство непрерывных вещественных функций на отрезке [-1. И- Какие из следующих функционалов на L являются линейными: 1 a) f —> f (х) dx; - 1 1 б) f t—> f2 (х) dx: -1 в) f I—> f (0) (это — «дельта-фуикционал Дирака»); г) f 1—> f (х) g (х) dx, где g — фиксированная непрерывная функция на [-1, И? 4. Пусть L — Жп. Какие из следующих условий на (xj, ..., xn) s L явля- ются линейными: п а) £ aixi — 1; «ь •••> ап s i = I п б) £ */ = 0 (разберите отдельно случаи: Ж — R, Ж — С, Ж — поле из i = l двух элементов, или, более общо, поле характеристики два); в) хз •= 2х4? 5. Пусть Ж — конечное поле из q элементов. Сколько элементов имеется п в линейном пространстве Сколько решений есть у уравнения £ а1х1 =0? 1 = 1 6. Пусть —пространство бесконечных последовательностей (аь аг, а3 ...), а, е с покоординатным сложением и умножением. Какие из следующих условий на векторы из являются линейными: а) только конечное число координат на at отлично от нуля; б) только конечное число координат at равно нулю; в) среди координат а, никакая не равна 1; г) условие Коши: для каждого в > 0 существует такое N > 0, что | ат — а„ | Се при т, п > N; оо д) условие Гильберта: ряд £ |ап|2 сходится: П=1 е) (а,) образуют ограниченную последовательность, т. е. существует такая константа с, зависящая от (а;), что |а,| <с для всех i (в г) —е) предполагаем = R или С)? 7. Пусть S — конечное множество. Докажите, что каждый линейный функ- ционал на f(S) однозначно определяется семейством элементов {as|s eS} по- ля X: функции f ставится в соответствие скаляр £ asf (s). seS Если п — число элементов в S и а« = 1/п для всех s, мы получаем функцио- нал f >—-? — / (s)—среднее арифметическое значений функции. seS 12
Если Ж == R и. as 0, £ as = 1, функционал £ asf (s) называется S €= S s «= S взвешенным средним функции / (с весами as). § 2. Базис и размерность 1. Определение. Семейство векторов {<?ь ..., еп} в линейном пространстве L называется (конечным) базисом L, если каждый вектор из L однозначно представляется в виде линейной комбина- п ции I — У, а(е1г at е Ж. Коэффициенты at называются координа- тами вектора I относительно базиса {ei}. 2. 'Примеры, а) Векторы е, = (0,.. •, 1, ••0), 1 sC I п, обра- зуют базис Жп. б) Если множество S конечно, функции 6seF(S) образуют базис F(S). Оба эти утверждения были проверены в § 1. Если в L выбран базис из п векторов и каждый вектор задает- ся своими координатами в этом базисе, то сложение и умножение п п на скаляр выполняются покоординатно: У пге( + У 6fef = i=! “l п П П — S (a2 + bt) et, а У atei = У Поэтому выбор базиса равно- ,=1 i=i силен отождествлению L с координатным векторным простран- « -> ством. Вместо равенства /— У а{е* иногда пишут 1 = а, подразу- z=i -+ мевая под а вектор-столбец (Я| х : I ап / или вектор-строку (аь ..., ««) = [«!, .... an]f координат at, ... ..., ап; в этих обозначениях явное указание базиса опущено. 3. Определение. Пространство L называется конечномерным, если оно либо нульмерно (см. § 1, п. 4), либо имеет конечный базис. Остальные пространства называются бесконечномерными. Удобно считать, что базис нульмерного пространства образует пустое множество векторов. Поскольку для нульмерных про- странств все наши утверждения тривиализируются, мы обычно бу- дем ограничиваться рассмотрением непустых базисов. 4. Теорема. В конечномерном пространстве число элементов базиса не зависит от базиса. Это число называется размерностью пространства L и обозна- чается dim L или dim^ L. Если dim L=^=n. пространство L назы- вается «-мерным. В бесконечномерном случае мы пишем dimZ, = oo. Доказательство. Пусть (е^ ..., еп}—некоторый базис L. Мы докажем, что никакое семейство векторов {е\, .... е'т} с т > п не может служить базисом L по следующей причине: существует 14
tn представление нулевого вектора 0 — £ хге$, в котором не все х< <=| равны нулю. Поэтому 0 не однозначно представляется в виде ли- нейной комбинации векторов {e'i}: всегда существует тривиальное т представление 0 = У, 0е'(. i=i Отсюда уже следует полное утверждение теоремы, поскольку этим мы проверим, что никакой базис не может содержать больше элементов, чем другой базис. п Положим e'k — У alket, k = 1, ..., т. Для любых Ж имеем т т п п / т \ £ = У xk £ а е{ = У (У a{kxk \ ег 1 = 1 1 = 1 / Поскольку {е,} образуют базис в £, нулевой вектор имеет един- п ственное представление У 0е& в виде линейной комбинации {е*}. т Поэтому условие У xke'k~ 0 равносильно системе однородных ли- k = 1 нейных уравнений относительно т TialkXk=0, i—l.........п. k “1 Поскольку число неизвестных т больше числа уравнений п, эта система имеет ненулевое решение. Теорема доказана. 5. Замечания, а) Можно было бы рассматривать произвольные семейства векторов и называть такое семейство базисом, если лю- бой вектор пространства однозначно представляется в виде конеч- ной линейной комбинации элементов семейства. В этом смысле любое линейное пространство имеет базис, и у бесконечномерного пространства базис всегда бесконечен. Однако это понятие не слишком полезно. Как правило, бесконечномерные пространства снабжаются топологией, и определение базиса видоизменяется с учетом этой топологии и возможности определять некоторые бес- конечные линейные комбинации. б) В общих линейных пространствах базисные векторы по тра- диции нумеруются целыми числами от 1 до п (иногда от 0 доп), но это совершенно не обязательно. Базис {6S} в F(S) естественно нумеруется элементами множества se5. Можно также считать базис L просто подмножеством в L, элементы которого не снаб- жены никакими индексами (ср. п. 20). Нумерация, или, скорее, порядок элементов базиса, существенны при использовании мат- ричного формализма (см. § 4). В других вопросах может оказаться важной другая структура на множестве индексов базиса. Напри- мер, если S — конечная группа, то важно, как индексы $ бази- 15
ca {6S} перемножаются внутри S, а случайная нумерация S це- лыми числами может только загромоздить обозначения. 6. Примеры, а) Жп имеет размерность п. б) E(S) имеет раз- мерность п, равную числу элементов S, если S конечно. Позже мы научимся вычислять размерности линейных про- странств, не строя их базисов. Это очень важно, потому что многие числовые инварианты в математике определяются как размерности («числа Бетти» в топологии, индексы операторов в теории диффе- ренциальных уравнений); базисы же соответствующих пространств могут оказаться трудно вычислимыми или не имеющими особого смысла. Но пока мы еще должны поработать с базисами. Проверка того, что данное семейство векторов {ei, ..., еп} в L образует базис, в соответствии с определением состоит из двух частей. Их отдельное рассмотрение приводит к следующим поня- тиям. 7. Определение. Линейной оболочкой семейства векторов назы- вается множество их всевозможных линейных комбинаций в L. Легко проверить, что линейная оболочка является линейным подпространством в L (см. § 1, п. 8). Линейную оболочку Жех + + Же^ + ... также называют подпространством, натянутым на векторы {е,} или порожденным векторами семейства {е,}. Ее мож- но определить еще как пересечение всех линейных подпространств в L, содержащих все е, (докажите!). Рангом семейства векторов называется размерность его линейной оболочки. Первое характеристическое свойство базиса: его линейная обо- лочка совпадает со всем L. 8. Определение. Семейство векторов {е,} называется линейно независимым, если никакая нетривиальная линейная комбинация п {ед не равна нулю, т. е. если из У — 0 следует, что все i=i ai — 0. В противном случае оно называется линейно зависимым. Линейная независимость семейства {в/} означает, что нулевой вектор однозначно представляется в виде линейной комбинации элементов семейства. Тогда любой другой вектор имеет либо един- ственное представление, либо ни одного. Действительно, сравни- вая два представления п п п I — £a.ei = £a'eit находим 0 — У (аг — а,) откуда az = a'. Отсюда следует второе характеристическое свойство базиса: его элементы линейно независимы. Объединение этих двух свойств равносильно первоначальному определению базиса. Заметим еще, что семейство векторов линейно независимо то- гда и только тогда, когда оно образует базис своей линейной обо- лочки. Семейство {еь ..., еп} заведомо линейно зависимо, если среди векторов е, есть нулевой или два одинаковых (почему?). Ю
Более общо: 9. Лемма, а) Семейство векторов {еь ..., еп} линейно зави- симо тогда и только тогда, когда хотя бы один из векторов еу яв- ляется линейной комбинацией остальных. б) Если семейство {еь ..., еп} линейно независимо, а семей- ство {еь ..., еп, e„+i} линейно зависимо, то en+i является линейной комбинацией е\, ..., еп- п Доказательство, а) Если У, а,е, = 0 и а, 0, то = / = 1 ' п == У (— a^'a^et- Наоборот, если У biei, то е,— У —0. i = l <=#/ l¥-i l+i n+l б) Если У а(б( = 0 и не все а; равны нулю, то обязательно ( = 1 йл+1 =/= 0, иначе мы получили бы нетривиальную линейную зави- п симость между еь еп. Поэтому еп+1 — У (— а~^аЛемма 1 = 1 доказана. Пусть Е — {ej, ..., еп) — некоторое конечное семейство векто- ров в L, F —{е(]> — его линейно независимое подсемей- ство. Назовем F максимальным, если каждый элемент из Е ли- нейно выражается через элементы из F. 10. Предложение. Каждое линейно независимое подсемейство Е’ cz Е содержится в некотором максимальном линейно независи- мом подсемействе F czE. Линейные оболочки F и Е совпадают. Доказательство. Если в Е\Е' есть вектор, не предста- вимый в виде линейной комбинации элементов Е', добавим его к Е'. В силу утверждения б) леммы п. 9 полученное семейство Е" будет линейно независимым. Применим то же рассуждение к Е" и т. д. Поскольку Е конечно, этот процесс оборвется на макси- мальном семействе F. Любой элемент линейной оболочки Е, оче- видно, линейно выражается через векторы семейства F. В случае Е' = 0 в качестве Е" нужно выбрать ненулевой век- тор из Е, если он есть; иначе F пусто. И. Замечание. Этот результат верен и для бесконечных се- мейств Е. Для его доказательства следует применить трансфинит- ную индукцию или лемму Цорна: см. пп. 18—20. Максимальное подсемейство не обязательно единственно: рас- смотрим Е={(1,0), (0,1), (1,1)}, Е' = {(1,0)} в X2. Тогда Е' содержится в двух максимальных независимых подсемействах {(1,0), (0,1)} и {(1,0), (1,1)}. Однако число элементов макси- мального подсемейства определено однозначно; оно совпадает с размерностью линейной оболочки Е и называется рангом семей- ства Е. Часто бывает полезна следующая теорема. 12. Теорема о продолжении базиса.Пусть E'={et, .... em}— линейно независимое семейство векторов в конечномерном про- странстве L. Тогда существует базис L, содержащий Е'; 17
Доказательство. Выберем какой-нибудь базис {em+i, ... ..., еп} в L и положим Е={е\, ет, em+i.......е„). Обозначим через F максимальное линейно независимое подсемейство Е, содер- жащее Е'. Оно является искомым базисом. В самом деле, нужно только проверить, что линейная оболочка F совпадает с L. Но она равна линейной оболочке Е по предло- жению п. 10, а последняя равна L, потому что в Е содержится базис пространства L. 13. Следствие (монотонность размерности). Пусть М — линей- ное подпространство в L. Тогда dimAf dim£, и если L конечно- мерно, то из dim М = dim L следует, что М — L. Доказательство. Если М бесконечномерно, то L также бесконечномерно. Действительно, покажем сначала, что в М мож- но найти сколь угодно большие независимые семейства векторов. Если семейство из п линейно независимых векторов {еь ..., еп} уже найдено, то его линейная оболочка М' cz М не может совпа- дать с М — иначе М было бы n-мерно. Поэтому в М есть вектор вп+1, линейно не выражающийся через {вь ..., еп}, и утвержде- ние б) леммы п. 9 показывает, что семейство {вь ..., еп, ел+1} линейно независимо. Теперь предположим, что М бесконечномерно, a L n-мерно. Тогда любые п + 1 линейных комбинаций элементов базиса L линейно зависимы по рассуждению в доказательстве тео- ремы п. 4, что противоречит бесконечномерности М. Остается разобрать случай, когда М и L конечномерны. Но тогда любой базис М по теореме п. 12 Можно продолжить до ба- зиса L, откуда и следует, что dim М dim L. Наконец, если dimM = dim£, то любой базис М должен быть базисом L — иначе его продолжение до базиса состояло бы из > dim L элементов, что невозможно. 14. Базисы и флаги. Один из стандартных способов изучения множеств S с алгебраическими структурами состоит в выделении в них последовательности подмножеств So cz S1 cz S2 cz ... или So=>Si S2z5 ... так, что переход от одного подмножества к следующему устроен в каком-то смысле просто. Общее название таких последовательностей—фильтрации (возрастающая и убываю- щая соответственно). В теории линейных пространств строго воз- растающая последовательность подпространств LqCz L\ cz ... cz Ln пространства L называется флагом. (Мотивировка названия: флаг {точка 0} cz {прямая} cz {плоскость}—это «гвоздь», «древко» и «полотнище».) Число п назовем длиной флага £0 с Т\ cz ... cz £„. Флаг £ocz£tcz ... cz£„cz ... назовем максимальным, если £о= {0}, 1И-<==£ и между Li, Lt+l (для всех i) нельзя вставить подпространство: если £f-cz Л4 cz £,+ь то либо L; — М, либо М = £ж. По всякому базису {еь .... е„} пространства £ можно постро- ить флаг длины п, положив £0 = {0}, Li — линейная оболочка {eb ..., е,} (при 1). Из доказательства следующей теоремы 18
будет видно, что этот флаг максимален и что наша конструкция дает все максимальные флаги. 15. Теорема. Размерность пространства L равна длине любого его максимального флага. Доказательство. Пусть Lqcz. Lxcz Ь2а ...— максималь- ный флаг в L. Для каждого i 1 выберем вектор et е £t\£,_I и покажем, что {вь ..., е,} образуют базис пространства Lt. Прежде всего, линейная оболочка семейства {еь ..., e,_i) со- держится в £,_ь а е,- не лежит в £,_], откуда индукцией по i (с - учетом е\ =А 0) следует, что {еь ..., е,} линейно независимы для всех I. Теперь индукцией по i покажем, что {еь ..., е,} порождают £,-. Пусть это верно для i— 1, и пусть Af — линейная оболочка семей- ства {еь ..., е,}. Тогда Li-i <= М по индуктивному предположению и из-за того, что е,£,_ь По определению максималь- ности флага отсюда следует, что М = L,. Теперь нетрудно завершить доказательство теоремы. Если £ocz£icz ••• <= £„ = £ —конечный максимальный флаг в £, то векторы {вь ..., еп}. е, е £i\£z_i, по доказанному образуют базис в £, так что п = dim £. Если в £ есть бесконечный максималь- ный флаг, то эта конструкция дает сколь угодно большие ли- нейно независимые семейства векторов в £, так что £ бесконечно- мерно. 16. Дополнение. В конечномерном пространстве £ любой флаг можно дополнить до максимального, и поэтому его длина всегда dim £. Действительно, будем вставлять в-исходный флаг проме- жуточные подпространства, пока это возможно. Этот процесс не может продолжаться до бесконечности, ибо конструкция систем векторов {вь ..., е,}, е, е £,\£,_i, по любому флагу дает линейно независимые системы (см. начало доказательства теоремы п. 15), и потому длина флага не может превзойти dim £. 17. Основной принцип работы с бесконечномерными простран- ствами: лемма Цорна, или трансфинитная индукция. Большинство теорем конечномерной линейной алгебры нетрудно доказать, опи- раясь на существование конечных базисов и теорему п. 12 о про- должении базисов: много примеров тому читатель увидит в даль- нейшем. Но привычка к базисам затрудняет переход к функцио- нальному анализу. Мы опишем сейчас теоретико-множественный принцип, который в очень многих случаях заменяет апелляцию к базисам. Напомним (см. «Введение в алгебру», гл. 1, § 6), что частично упорядоченным множеством называется множество X вместе с бинарным отношением порядка на X, которое рефлексивно (х х), транзитивно (если х у, у г, то х г) и антисиммет- рично (если х у и у х, то х — у). Вполне может оказаться, что пара элементов х, у е X не находится ни в отношении х у, ни в отношении у х. Если же для любой пары либо х у, либо у х, то множество называется линейно упорядоченным, или цепью. 19
Верхняя грань подмножества У в частично упорядоченном множестве X — это любой элемент хе А' такой, что у х для всех у е У. Верхняя грань подмножества может и не существовать: если X — R с обычным отношением а У = Z (целые числа), то верх- ней грани у У нет. Наибольшим элементом частично упорядоченного множества X называется элемент ne А’ такой, что х п для всех хе X, а мак- симальным — элемент meX, для которого из m <хеX следует х = ш. Наибольший элемент всегда максимален, но не на- оборот. 18. Пример. Типичный пример упорядоченного множества X — это множество всех подмножеств &(S) множества S или некото- рая его часть, упорядоченное отношением Если S имеет больше двух элементов, то 5я (S) частично упорядочено, но не линейно упорядочено (почему?). Элемент Se^(S) максимальный, и даже наибольший в 5я (S). 19. Лемма Цорна. Пусть X — непустое частично упорядоченное множество, любая цепь в котором обладает верхней гранью в X. Тогда любая цепь обладает такой верхней гранью, которая явля- ется в то же время максимальным элементом в X. Лемму Цорна можно выводить из других, более приемлемых интуитивно аксиом теории множеств, но логически она эквива- лентна так называемой «аксиоме выбора», если остальные аксио- мы приняты. Поэтому удобно причислять ее к числу основных ак- сиом, что часто и делается. 20. Пример применения леммы Цорна: существование базиса в бесконечномерных линейных пространствах. Пусть L — линейное пространство над полем Ж. Обозначим через X множество линейно независимых подмножеств векторов в L, упорядоченное отношением S. Иными словами, Уе X, если любая конечная линейная комби- нация векторов из У, равная нулю, имеет нулевые коэффициенты. Проверим условие леммы Цорна: если S — некоторая цепь в X, то у нее есть верхняя грань в X. Действительно, положим/ — (J У. У eS Ясно, что У s Z для всякого Уе£; кроме того, Z образует линейно независимое множество векторов, потому что любое конечное множество векторов {t/b ..., уп} из Z содержится в некотором эле- менте Уе5. В самом деле, пусть yt е У; е S; так как S — цепь, из каждых двух элементов У,, У, е S один является подмножеством другого; выкидывая по очереди меньшие множества из таких пар, мы получим, что среди У, есть наибольшее множество; в нем и содержатся все у\, ..., уп, которые, таким образом, линейно неза- висимы. Применим теперь заключение леммы Цорна. Здесь достаточна только часть его: существование в X максимального элемента. Согласно определению, это такое линейно независимое множество векторов У еХ, что если добавить к нему любой вектор / е L, то множество У U {/} уже не будет линейно независимым. Точно такое 20
же рассуждение, как при доказательстве утверждения б) леммы п. 9, показывает тогда, что I есть (конечная) линейная комбинация элементов У, т. е. У образует базис в L. УПРАЖНЕНИЯ {((«), Г(«). ... 1. Пусть L — пространство многочленов от х степени 1 с коэффициен- тами в поле Ж. Проверить следующие утверждения: а) 1, х....х"-1 образуют базис в L. Координаты многочлена f в этом базисе — это его коэффициенты. б) 1, х — а, (х— а)2, (х— а)"-1 образуют базис в L. Если char Ж = = р п, то координаты многочлена f в этом базисе: (("-1)(а) ) (п— 1)! Г в) Пусть alt ап^Ж—попарно различные элементы. Положим £<(х) = _ (х — aj) (at — aj)Многочлены gi(x), ..., g„(x) образуют базис L («интерполяционный базис»). Координаты многочлена f в этом базисе: {f(ai) 2. Пусть L — n-мерное пространство, f: L^-Ж — ненулевой линейный функ- ционал. Доказать, что М = {leL\f(l) =0} является (п—1)-мерным подпро- странством в L. Доказать, что все (п—1)-мерные подпространства получаются таким способом. 3. Пусть L — « мерное пространство, М cz L — m-мериое подпространство. Доказать, что существуют линейные функционалы fi, ..., fn-m е L* такие, что + = {Z|h(Z)=... = f„_m(Z)=O}. 4. Вычислить размерности следующих пространств: а) пространства многочленов степени от п переменных; б) пространства однородных многочленов (форм) степени р от п переменных; в) пространства функций из F(S), |S| < оо, обращающихся в нуль во всех точках из подмножества So cz S. 5. Пусть Ж — конечное поле характеристики р. Доказать, что число его элементов равно рп для некоторого « ^ 1. (Указание. Рассмотреть Ж как линей- ное пространство над простым подполем, состоящим из всех «сумм единиц» в Ж\ 0, 1, 1 + 1, - ..) 6. Заменой понятия флага в бесконечномерном случае служит понятие цепи подпространств (упорядоченных по включению). Пользуясь леммой Цорна, до- казать, что всякая цепь содержится в максимальной. § 3. Линейные отображения 1. Определение. Пусть L, М — линейные пространства над по- лем Ж. Отображение f: L-+M называется линейным, если для всех L, а^Ж имеем f (al) = af (I), f (Z, + Z2) = f (/,) + f (Z2). Линейное отображение является гомоморфизмом аддитивных групп. В самом деле, f(O) = Of(O) = O и f(—l) = f((—1)0 = = — f(0- Индукция по п показывает, что для любых (це.Ж. 02, \ " L aih ]=Laif Vi)- = 1 / i = l Линейные отображения f: L-+L называются также линейными операторами на L. 21
2. Примеры, а) Нулевое линейное отображение f: L-+M, f(/) = 0 для всех l^L. Тождественное линейное отображение: f: L-+L, f (I) = I для всех IeL. Оно обозначается id/, или id (от английского слова «identity»). Умножение на скаляр а^Ж, или гомотетия f: L-*-L, f(l) = al для всех l^L. При а = 0 получается нулевой оператор, при а = 1 — тождественный. б) Линейные отображения f: L-^-Ж— это линейные функции, или функционалы, на L (см. § 1, п. 9). Пусть L—пространство с базисом {вь ..., еп}. Для любого 1 i п отображение е‘: L-^-Ж, где е‘(/) — i-я координата I в базисе {вь ..., е„}, является линей- ным функционалом. в) Пусть £={xeR|x>0} наделено структурой линейного пространства над R, описанной в § 1, пример а) п. 10, М — R *. Отображение log: £->Af, х>—^-logx, R-линейно. г) Пусть S cz Т — два множества. Отображение F(T)-+F(S), которое всякой функции на Т ставит в соответствие ее ограниче- ние на S, линейно. В частности, если S={s}, sef, fe£(T), то отображение: ft—>(значение f в точке s) линейно. Конструкция линейных отображений с нужными свойствами часто основывается на следующем результате. 3. Предложение. Пусть L, М—линейные пространства над полем Ж\ {/i, ln}czL и {mit ..., — два семейства векторов с одинаковым числом элементов. Тогда: а) если линейная оболочка {It, ..., 1п} совпадает с £, то суще- ствует не больше одного линейного отображения f: L-+M, для которого f (/,) — пи при всех I; б) если {/ь ..., 1п} к тому же линейно независимы, т. е. обра- зуют базис £, то такое отображение существует. Доказательство. Пусть f, f' — пара отображений с = — f'{li) = пи для всех I. Рассмотрим отображение g = f— f', где (f — H(O=f(O — f(0- Легко проверить, что оно линейно. Кроме того, оно переводит в нуль все I, и потому любую линейную ком- бинацию векторов Т. Значит, f и f совпадают на каждом векторе из £, откуда f' = f. Пусть теперь {£, ..., 1п} образует базис £. Так как каждый п элемент £ однозначно представляется в виде мы можем 1 = 1 определить теоретико-множественное отображение f: L-+M фор- мулой ап X п £ atlt ) = £ atm{. Его линейность проверяется непосредственно. В этом доказательстве использовалась разность двух линей- ных отображений L-+M. Это частный случай следующей более общей конструкции. 4. Обозначим через 3?(L, М) множество линейных отображе- ний из £ в М. Для и а^Ж определим af и f + g 22
формулами (af) (I) = a (f (I)), (f + g) (I) = f(l) + g (I) для всех 1<=L. Точно так же, как в § 1, п. 9, проверяется, что af и f + g линейны, так что S (L, М)—линейное пространство. 5. Пусть f^S'il^M) и g е 2? (М, N). Теоретико-множествен- ная композиция g°f=gf'. L-*-N является линейным отображе- нием. Действительно, (gf) (Л + /2) = g If (А + /2)1 = g If (/i) + f (4)1 = g If (/,)] + g [f (/2)] -= = g/(6) + ₽f(/2) и, аналогично, (gf) (al) = a(gf(l)). Очевидно, idM ° f = f о idt = f. Кроме того, h(gf) — (hg)f, когда обе части определены, так что скобки можно опустить; это общее свойство ассоциативности теоретико-множественных Отображений. Наконец, композиция gf линейна по каждому из аргументов при фиксированном втором: например, g ° (afi + bfz) = a (g о fi) -f- 4~ b(g °fz). 6. Пусть M)—биективное отображение. Тогда у него есть теоретико-множественное обратное отображение f-*; M-+L. Мы утверждаем, что f~l автоматически линейно. Для этого следует проверить, что f~' (mi + m2) = Г1 (mi) + Г1 (»г2). Г1 (ami) = af~l (тх) для всех mi, m2 6= М; а^Ж. Поскольку f биективно, существуют и однозначно определены такие векторы /ь /2е£, что tni = f(li). Написав формулы f (h) + f (4) = f (А + 4)> af (h)= f (аЦ), применив к их обеим частям f~l и заменив в результате /,• на f~'(mi)> получим требуемое. Биективные линейные отображения f: L-+-M называются изо- морфизмами. Пространства L и М называются изоморфными, если между ними существует изоморфизм. Следующая теорема показывает, что размерность пространства полностью определяет его с точностью до изоморфизма. 7. Теорема. Два конечномерных пространства L и М над по- лем Ж изоморфны тогда и только тогда, когда у них одинаковые размерности. Доказательство. Изоморфизм I: L-+M сохраняет все свойства, формулируемые в терминах линейных комбинаций. В частности, он переводит любой базис L в некоторый базис М, так что размерности L и М совпадают. (Из этого рассуждения следует также, что конечномерное пространство не может быть изоморфно бесконечномерному.) Наоборот, пусть размерности L и М равны п. Выберем базисы {/ь ..., /„} и {mi...mn} в L и М соответственно. Формула / п \ п \i=l / i=l 23
определяет линейное отображение L в М по предложению п. 3. Оно является биекцией, ибо формула (п \ п Z ) = У, i\ / z=i определяет обратное линейное отображение f~l. 8. Предупреждение. Если даже изоморфизм между двумя ли- нейными пространствами L, М. и существует, он определен одно- значно только в двух случаях: а) £ = М = {0}, б) L и М одномерны, а Ж— поле из двух элементов (попро- буйте доказать это!). Во всех остальных случаях имеется много (если Ж бесконеч- но, то бесконечно много) изоморфизмов. В частности, имеется много изоморфизмов пространства L с самим собой. В силу ре- зультатов пп. 5 и 6 они образуют группу относительно теоретико- множественной композиции. Эта группа называется полной линей- ной группой пространства L. Позже мы сможем описать ее в более явном виде как группу невырожденных квадратных матриц. Иногда бывает, что между двумя линейными пространствами определен некоторый изоморфизм, не зависящий ни от каких произвольных выборов (как выборы базисов в пространствах L и М в доказательстве теоремы п. 7). Такие изоморфизмы мы бу- дем называть каноническими или естественными (точное определе- ние этих терминов можно дать только на категорном языке, о ко- тором см. § 13). Следует тщательно отличать естественные изо- морфизмы от «случайных». Мы приведем два характерных при- мера, очень важных для понимания этого различия. 9. «Случайный» изоморфизм между пространством и двойст- венным к нему. Пусть L — конечномерное пространство с базисом {вь ..., е„}. Обозначим через е'е£* линейный функционал /ь->е‘(/), где е‘(/) —i-я координата вектора I в базисе {е<} (не путать с 7-й степенью; в линейном пространстве она не опре- делена). Мы утверждаем, что функционалы {е1, .... еп} образуют базис в L*, так называемый двойственный к {еь ..., еп} базис. Равносильное описание {е‘} такое: e‘(efc) = 6lft (символ Кронекера: 1 при i = k, 0 при i =/= k). В самом деле, всякий линейный функционал f: L-^Ж можно представить в виде линейной комбинации {е‘}: 1=1 Действительно, значения левой и правой части совпадают на п ( п \ любой линейной комбинации akek, потому что е‘ ( akekJ ~ at по определению е1, 24
п Кроме того, (е,} линейно независимы: если £щлг = 0, то для 1 = 1 всех k, 1 k п, имеем ak = ( У J (е/г) = 0. Поэтому L и L* имеют одинаковую размерность п и даже определен изоморфизм f: L-+L*, который переводит е, в е1. Однако этот изоморфизм не каноничен: замена базиса {еь еп}, вообще говоря, меняет его. Так, если L одномерно, то для любого ненулевого вектора ei е L семейство {ej является ба- зисом L. Пусть {е1} —двойственный базис к (щ), el(ei) = 1. Тогда к базису {ащ}, а е J$f\{0}, двойствен базис {а~1е1}. Но линейные отображения ft: ejt-^e1 и f2: ащ1—>a~lel различны, если только а2 =/= 1. 10. Канонический изоморфизм между пространством и дважды двойственным к нему. Пусть L — линейное пространство, L* — пространство линейных функций на нем, £**=(£*)*—пространство линейных функций на L* — «дважды двойственное к L простран- ство». Опишем каноническое отображение ес L^L**, не зависящее ни от каких произвольных выборов. Оно ставит в соответствие каждому вектору L функцию на L*, значение которой на функ- ционале f е L* равно f(l); в краткой записи: Ч- /(/)]. Проверим следующие свойства еь! а) Для каждого L отображение el(1): линейно. Дей- ствительно, это означает, что выражение f(l) как функция от f при фиксированном I линейно по f. Но это следует из правил сложе- ния функционалов и умножения их на скаляр (§ 1, п. 7). Следовательно, eL действительно определяет отображение L в £**, как и утверждалось. б) Отображение el: линейно. Действительно, это озна- чает, что выражение f(/) как функция от I при фиксированном / линейно, — это так, ибо f е L*. в) Если L конечномерно, то отображение el: является изоморфизмом. В самом деле, пусть {е\, ..., еп} — базис L, {о1, ..., еп} — двойственный базис L*, {е[, ..., е'п} — базис в £**, двойственный к {е1, ..., еп}. Покажем, что eL(e/) = e;, откуда и будет следовать, что el— изоморфизм (в этой проверке использование базиса L безобидно, ибо в определении el он не участвовал!). В самом деле, е/. (<?,) согласно определению есть функционал на £*, значение которого на ек равно eft(e,) = 6Ift («символ Кроне- кера»). Но e'i — точно такой же функционал на £* по опреде- лению двойственного базиса. Заметим, что если £ бесконечномерно, то el: L-+L** остается инъективным, но перестает быть сюръективным (см. упражнение 2). В функциональном анализе вместо полного £* обычно рассмат- 25
ривают только подпространство линейных функционалов L', не- прерывных в подходящей топологии на L и Ж, и тогда отображе- ние £->£" может быть определено и иногда оказывается изомор- физмом. Такие (топологические) пространства называют рефлек- сивными. Мы доказали, что конечномерные пространства (без учета топологии) рефлексивны. Рассмотрим теперь связь между линейными отображениями и линейными подпространствами. 11. Определение. Пусть f: L-+-M — линейное отображение. Множество Ker f — {/ е L | f (/) = 0} cz L называется ядром f, а мно- жество Imf = {теЛ11 3 l^L, f(l) = m}cz М называется образом f. Нетрудно убедиться, что ядро f является линейным подпро- странством в L, а образ f — линейным подпространством в М. Про- верим, например, второе утверждение. Пусть mb m2<= Imf, а^ Ж. Тогда существуют такие векторы h,l2^L, что f(/i) = mi, f(fe) = = m2. Значит, mi + т2 — f(li + /2), ami = f{al\). Следовательно, mi + Im/ и ami Imf- Отображение f инъективно тогда и только тогда, когда Kerf—{0}. В самом деле, если f(li} — f(l2}, /1 =/=/2, то 0 =/= 1\— — /2eKerf. Наоборот, если O#=/^Kerf, то f(/) = O = f(O). 12. Теорема. Пусть L — конечномерное линейное пространство, f: L^>-M — линейное отображение. Тогда Kerf и Imf конечномерны и dim Ker f + dim Im f = dim L. Доказательство. Ядро f конечномерно по следствию п. 13, § 2. Выберем базис {вь ..., ет} в Ker f и продолжим его до базиса {eit ..., em, em+i.ет+п} пространства L по теореме п. 12, § 2. Покажем, что векторы f(em+i), ..., f(em+n) образуют базис в Im f. Отсюда, очевидно, будет следовать теорема. Любой вектор из Im f имеет вид /т+п \ т+п f\ У )= У aJ(^). \ i=l / i=m+l Следовательно, f(em+i), ..., f(em+n) порождают Imf. m+n / m+n x Предположим, что У, at-f (et-) = 0. Тогда f I У aieil=0. t—m+1 \t=m+ / m±n m+n tn Это значит, что У е Ker f, т. е. У = У О/вр Это i=m+l «=т+1 /=1 возможно, только если все коэффициенты равны нулю, ибо {et, ... ..., ет+п}—базис L. Следовательно, векторы f(em+i), ..., f[em+n) линейно независимы. Теорема доказана. 13. Следствие. Следующие свойства f равносильны (в случае конечномерного L): a) f инъективно. б) dim L = dim Imf. Доказательство. Согласно теореме, dim£ = dimlmf то- гда и только тогда, когда dim Ker f = 0, т. е. Kerf — {0}, 26
УПРАЖНЕНИЯ 1. Пусть ft Rm->R"— отображение, заданное дифференцируемыми функ- циями, вообще говоря, нелинейными и переводящими нуль в нуль: f (*1...Хт) fi (*l, . . ., Хт), . . .), I = 1.П, h(o.....0) = 0. Поставим ему в соответствие линейное отображение dfB: Rm R", называемое дифференциалом f в точке 0, по формуле Д df, , ( df, df X - Z тё:»’'-(тё <°>....X <’>)• i=l I ' ‘ где {₽у}> {^} — стандартные базисы Rm и R". Показать, что если произвести замену базисов в пространствах R” и R" и вычислить df0 по тем же формулам в других базисах, то новое линейное отображение dfD совпадает со старым. 2. Докажите, что пространство многочленов Q[x] не изоморфно своему двой- ственному. {Указание. Сравните мощности.) § 4. Матрицы 1. Цель этого параграфа — ввести язык матриц и установить основные связи его с языком линейных пространств и отображе- ний. За дальнейшими подробностями и примерами мы отсылаем читателя к главам 2 и 3 «Введения в алгебру»; в частности, мы будем пользоваться развитой там теорией определителей, не по- вторяя ее. Читателю следует самостоятельно убедиться в том, что изложение в этих главах без изменений переносится с поля веще- ственных чисел на любое поле скаляров; исключения составляют лишь те случаи, где используются такие специфические свойства вещественных чисел, как порядок и непрерывность. 2. Термины. Матрицей А размера m X п с элементами из мно- жества S называется семейство (alfc) элементов из S, пронумеро- ванное упорядоченными парами чисел (t, /г), где 1 i tn, 1 k С п. Часто пишут А = (aik), 1 i m, 1 k п; указание размера может быть опущено. При фиксированном t семейство (ац, ..., ain) называется i-й строкой матрицы А. При фиксированном k семейство (alft, ..., ать) называется k-м столбцом матрицы А. Матрица раз- мера 1 X п называется просто строкой, а матрица размера tn X 1 — столбцом. Если m — п, матрица А называется квадратной (иногда говорят «порядка п» вместо «размера «X п»). Если А — квадратная матрица порядка п, 8=Ж (поле) ц aik — 0 при i^=k, матрица А называется диагональной-, иногда ее записывают diag(alb апп). Вообще, элементы (ац) называ- ются элементами главной диагонали. Элементы а1? Л+ь а2, k+2, , где k ~> 0, образуют диагональ, стоящую выше главной, а элемен- ты a*+i, ь а*+2, г; , где k > 0, — диагональ, стоящую ниже глав- ной. Если S — Ж и atk = 0 при k < i, матрица называется верхней 27
треугольной, а если «,•* =* 0 при k > I, то нижней треугольной. Диагональная квадратная матрица над Ж, у которой все элементы на главной диагонали одинаковы, называется скалярной. Если эти элементы равны единице, матрица называется единичной. Единич- ная матрица порядка п обозначается Еп или просто Е, если поря- док ясен из контекста. Все эти термины обязаны своим происхождением стандартной записи матрицы в виде таблицы (°п Ou ... ain а21 °22 -- Oin a ml * * • ®mn Транспонированная к А матрица А1 имеет размеры п\пг, и ее элемент в i-й строке и k-м столбце равен а*,. (Иногда используе- мое обозначение A‘~(aki) двусмысленно!) 3. Замечания. Большая часть матриц, встречающихся в теории линейных пространств над полем Ж, имеет своими элементами элементы самого этого поля. Однако бывают и исключения. На- пример, мы будем иногда рассматривать упорядоченный базис {ei, ..., еп} пространства L, как матрицу размера 1Х« с элемен- тами из этого пространства. Другой пример — блочные матрицы, элементами которых в свою очередь являются матрицы — блоки исходной. Именно разбиение номеров строк [1, ..., m] — /|[) иЛ11 С/д и номеров столбцов [1,-. ., n] = /iU ... U-Д на идущие подряд попарно непересекающиеся отрезки определяет разбиение матрицы А на блоки где имеет своими элементами a,*, Если p = v, можно очевидным способом определить понятия блочно диаго- нальной, блочной верхней треугольной, блочной нижней треуголь- ной матриц. Этот же пример показывает, что не всегда удобно нумеровать столбцы и строки матрицы числами от 1 до т (или п): часто существен лишь порядок строк и столбцов. 4. Матрица линейного отображения. Пусть N и М — конечно- мерные линейные пространства над Ж с отмеченными базисами {е, еп} и {ej, ..., е'т} соответственно.Рассмотрим произвольное линейное отображение f: N-+M и поставим ему в соответствие матрицу А; размера тХп с элементами из поля Ж следующим образом (заметьте, что размеры Af суть размерности N,M в об- ратном порядке). Представим векторы f(ek) в виде линейных ком- т бинаций: f (ek) == X Тогда по определению Af = (aik). Иными словами, коэффициенты этих линейных комбинаций суть последо- вательные столбцы матрицы Ар 28
Матрица Л/ называется матрицей линейного отображения f относительно базисов (или в базисах) {ek}, {e'i}. В силу предложения п. 3, § 3, линейное отображение / одно- значно определяется образами f(ek)t и в качестве последних мож- но взять любое семейство из п векторов пространства М. Поэтому описанное соответствие устанавливает биекцию между множе- ством S(N, М) и множеством матриц размера тХ п с элементами из Ж (или над Ж). Эта биекция, однако, зависит от выбора ба- зисов (см. п. 8 ниже). Матрица Af позволяет также описывать линейное отображение f в терминах его действия на координаты. Если вектор I пред- ставлен столбцом х — [%1, ..., хп] своих координат в базисе \ п {вь ..., е„}, т. е. I — x^i, то f(J) представлен вектором-столб- > i-1 цом у = [у1....ут], где п yi = HatkXk> *=К •••> k=i Иными словами, y — Af-x — обычное произведение матрицы Af на столбец х. Когда речь идет о матрице линейного оператора A=(alk), всегда подразумевается, что в «двух экземплярах» пространства N выбирается один и тот же базис. Матрица линейного оператора квадратна. Матрица тождественного оператора единична. Согласно п. 4, § 3, множество S (N, М) является в свою оче- редь линейным пространством над Ж. При отождествлении эле- ментов S (N, М) с матрицами эта структура описывается следую- щим образом. 5. Сложение матриц и умножение на скаляр. Пусть А — (а,ц), B — (bik) — две матрицы одинакового размера над полем Ж, а Ж. Положим ^ + B = (c<fe), где clk — alkA~bik, аА = (aaik). Эти операции определяют на матрицах данного размера структуру линейного пространства. Легко проверить, что если A —Af, В = Ag (в одинаковых базисах), то Af + Ag ~ Af+g> Aaf — aAf, так что указанное соответствие (а оно биективно) является изо- морфизмом. В частности, dim S (N, М) = dim М dim N, потому что пространство матриц изоморфно Жтп (размер т\п). Композиция линейных отображений описывается в терминах умножения матриц. 6. Умножение матриц. Произведение матрицы А размера т X X п' над полем Ж на матрицу В размера п"Хр над полем Ж 29
определено тогда и только тогда, когда п' = п" — п; размер АВ в этом случае равен т X Р, и по определению п АВ = (с1к), где ctk=Xanbik- Нетрудно проверить, что (АВ)* = В‘А*. Может случиться, что АВ определена, но ВА не определена (если т=/=р) или обе матрицы АВ и ВА определены, но имеют разные размеры (если т#=п), или даже определены и имеют оди- наковые размеры (т = п~р), но не совпадают. Иными словами, умножение матриц не коммутативно. Однако оно ассоциативно: если матрицы АВ и ВС определены, то (АВ) С и А (ВС) опреде- лены и совпадают. В самом деле, положим Д=(а,7), B — (bjk), C — (cki). Согласованность размеров А с ВС и АВ с С предлага- ется проверить читателю. Если она уже проверена, то мы можем вычислять (И)-Й элемент (АВ) С по формуле Z (Z aijbjk \ сы — Z (aiibik) сы> k \ j ) j, k а (t/)-fi элемент А (ВС) по формуле Z ^t/^Z bjkcki^ (bjk^ki)- Так как умножение в Ж ассоциативно, эти элементы совпадают. Зная уже, что умножение матриц над Ж ассоциативно, мы можем убедиться,. что «поблочное умножение» блочных матриц также ассоциативно (см. также упражнение 1). Кроме того, произведение матриц линейно по каждому аргу- менту: (аА + ЬВ) С = аАС + ЬВС\ А (ЬВ 4- сС) = ЬАВ + с АС. Важнейшее свойство умножения матриц состоит в том, что оно отвечает композиции линейных отображений. Однако целый ряд других ситуаций в линейной алгебре также удобно описывается умножением матриц: это главная причина унифицирующей роли матричного языка и некоторой самостоятельности матричной ал- гебры внутри линейной алгебры. Перечислим некоторые из этих ситуаций. 7. Матрица композиции линейных отображений. Пусть Р, N, R f М — три конечномерных линейных пространства, Р —> М —* М — два линейных отображения. Выберем базисы {<?"}, (e'k] и {ет} в Р, N, М соответственно и обозначим через Ag, Af, Afg матрицы g, f, fg в этих базисах. Мы утверждаем, что = AfAg. В самом деле, пусть Af = («//), Ag = (bik). Имеем fs(ek) ~ Z bikf (ei) ~ Z bik Z ajtej — Z f Z ajibik) ek' I i 1 I ' I / 30
Следовательно, (/, А)-й элемент матрицы Afg равен £ altbik, т. е. Afg = AfAg. Согласно результатам пп. 4—6 множество линейных операто- ров & (L, L) после выбора базиса в L можно отождествить с мно- жеством квадратных матриц Мп(Ж) порядка n = dimZ, над по- лем Ж. Имеющиеся в обоих множествах структуры линейных про- странств и колец при этом отождествлении согласованы. Биекциям, т. е. линейным автоморфизмам f: L-+-L, отвечают обратимые мат- рицы: если f^f~l = idL, то AfAf-[ = Еп, так что 1 = Xf1. На- помним, что матрица А обратима, или невырождена тогда и только тогда, когда det А =И=0. 8. а) Действие линейного отображения в координатах. В обо- значениях п. 4 мы можем представлять векторы пространств N, М в координатах столбцами и тогда действие оператора f записывается на языке матричного умножения формулой или у = А;х (ср. п. 4). Иногда удобно писать аналогичную фор- мулу в терминах базисов {et}, {e'k}, где она принимает вид Це,......<?„) = (/(<?,)...f(en)) = (e'h .... e'm) Af. При этом формализм матричного умножения требует, чтобы в вы- ражении справа векторы М умножались на скаляры справа, а не слева; это безобидно, мы просто будем считать, что е'а = ае' для любых е' е М, а^Ж. Пользуясь такого рода записями, мы будем иногда нуждаться в проверке ассоциативности или линейности по аргументам «сме- шанных» произведений матриц, часть которых имеет элементы из Ж, а другая часть из L, например (fa, ..., enM)B = fa, ..., еп)(АВ) или (е -ф e'v ..., еп + е'п) А = fa, ..., еп) А + fa, Л и т. п. Формализм пп. 4, 5 автоматически переносится на эти слу чаи. То же замечание относится к блочным матрицам. б) Координаты вектора в измененном базисе. Пусть в про странстве L выбраны два базиса fa.} и fa}. Любой вектор I / 31
п можно представить его координатами в этих базисах: 1 = У, г е — п. — Л x'ke'k- Покажем, что существует квадратная матрица А поряд- ка п, не зависящая от I, такая, чтох = Лх'. п Действительно, если e'k = lLaikeit то Л = (а/Й): Матрица А называется матрицей перехода (от нештрихованного базиса к штрихованному), или от штрихованных координат к не- штрихованным. Заметим, что она обратима; обратная матрица есть матрица перехода от штрихованного базиса к нештрихован- ному. Заметим, что формулу х = Ax' можно было прочесть также как формулу, выражающую координаты старого вектора-столбца х че- рез координаты вектора f(x'), где f— линейное отображение L^L, описанное матрицей! А в базисе {ek}. В физике эти две точки зрения называются соответственно «пассивной» и «активной». В первом случае мы описываем одно и то же состояние системы (вектор /) с точки зрения разных на- блюдений (со своими системами координат). Во втором случае наблюдатель один, а состояние системы подвергается преобразова- ниям, состоящим, например, из симметрий пространства состояний этой системы. в) Матрица линейного отображения в измененных базисах. В ситуации п. 4 выясним, как изменится матрица Af линейного отображения, если перейти от базисов {e'j к новым базисам Рй}’ {ё,} пространств /V, М. Пусть В — матрица перехода от {е^}-координат к {ё,Д -координатам, а С—матрица перехода от {е'}-координат к {ё'}-координатам. Мы утверждаем, что матри- ца Af отображения f в базисах {ё^}, (ё'| равна Af = C~lAfB. В самом деле, вычисляя в базисах, имеем (г.) А - f ((«»)) = f (И в) = (f (е,)) в - (,;> л,в_(г;) с-'А,в. Рекомендуем проделать аналогичные вычисления в координатах. Особенно важен частный случай N — M, {<?,} = (е'|, = В = С. Матрица линейного оператора f в новом базисе равна Af = B~lAsB. 32
Отображение Ау—>В~'АВ называется сопря- жением (посредством невырожденной матрицы В). Сопряжение является автоморфизмом матричной алгебры Мп {Ж): а^Ж', \i--l / «=1 В~'(А'...Ат)В = (В 'А{В) ... (В’Ч„В) (в произведении справа внутренние сомножители В и В~} попар- но сокращаются, ибо стоят рядом). Особую роль играют те функции от элементов Мп(Ж), которые не меняются при замене матрицы на сопряженную, потому что с помощью этих функций можно строить инварианты линейных опе- раторов-. если <р — такая функция, то, полагая <р(0 —полу- чим результат, зависящий лишь от f, но не от базиса, в котором пишется А/. Вот два важных примера. 9. Определитель и след линейного оператора. Положим Trf = Tr4f= X ан> где Af = (aik} i = l (след — «trace» — матрицы А есть сумма элементов ее главной диагонали); det f = det Af. Инвариантность определителя относительно сопряжения очевидна: det (В~~'АВ) = (det £0-1 • det А • det В = dfet А. Чтобы установить инвариантность следа, докажем более общий факт: если А, В —такие матрицы, что АВ и ВА определены, то Тг/В = Тг ВА. Действительно, Tr АВ = Z X ai,blh Tr АВ = £ £ b,iail. i i i i Если теперь В невырождена, то, применяя доказанный факт к матрицам В~~1А и В, получим Тг(й-'ЛВ) = Тг (ВВ 'л) = Тг А. В § 8 мы введем собственные значения матриц и операторов, симметрические функции от которых дадут другие инвариантные функции. В заключение этого параграфа мы приведем определения, на- звания и стандартные обозначения для нескольких классов матриц над вещественными и комплексными числами, исключительно важ- ных в теории групп и алгебр Ля и ее многочисленных приложе- ниях, в частности в физике. Первый класс образуют так называе- мые классические группы-, они действительно являются группами 33
относительно матричного умножения. Второй класс образуют ал- гебры Ли: они составляют линейные пространства и устойчивы относительно операции взятия коммутатора: [А, В[ = АВ— ВА. Параллелизм обозначений для этих классов получит некоторое объяснение в § 11 и в упражнении 8. 10. Классические группы. а) Полная линейная группа GL(n, Ж}. Она состоит из невы- рожденных квадратных матриц размера пХп над полем Ж. б) Специальная линейная группа SL (п, Ж). Она состоит из квадратных матриц размера пХ/г над полем Ж с определителем единица. В этих двух случаях Ж может быть любым полем. Дальше мы ограничимся полями Ж = R или С, хотя существуют обобще- ния этих определений на другие поля. в) Ортогональная группа О(п,Ж). Она состоит из матриц размера пХпс условием АА‘ — Еп. Такие матрицы действительно образуют группу, ибо ЕЛ = Еп, А-\А-У = А-\А1Г^^АГ1^{Е^ = ЕП, наконец, (АВ) (АВ/ = АВВ'А' = АА‘ = Еп. При Ж — R, С эта группа называется вещественной или комп- лексной соответственно. Элементы группы О(п, Ж} называются ортогональными матрицами. Вместо O(n, R) обычно пишут О(п). г) Специальная ортогональная группа $>0(п,Ж). Она состоит из ортогональных матриц с определителем единица: SO (и, .Ж) = О(и, .X)DSL(n, Ж). Вместо SO(n, R) обычно пишут SO(n). д) Унитарная группа U(n). Она состоит из комплексных мат- риц размера п\п, удовлетворяющих условию АА‘— Еп, где А — матрица, элементы которой комплексно сопряжены с соответствую- щими элементами матрицы А: если А= (aik), то A — (ciik). Поль- зуясь равенством АВ — АВ, нетрудно проверить, как и в случае в), что U(n) является группой, как в предыдущем пункте. Элементы U (и) называют унитарными матрицами. Матрицу А1 часто называют эрмитово сопряженной с матри- цей А; математики обычно обозначают ее А*, а физики А+. Заме- тим, что операция эрмитова сопряжения определена для комплекс- ных матриц любых размеров. е) Специальная унитарная группа SU(n). Она состоит из уни- тарных матриц с определителем единица: SU(n) = U(n)(] SL(n, С). Из определений ясно, что вещественные унитарные матрицы — это ортогональные матрицы: O(n) = U(n)f|GL(n, R), SO(n)== = U(n)nSL(n, R). 34
11. Классические алгебры Ли. (Матричной) алгеброй Ли назы- вается любая аддитивная подгруппа квадратных матриц Мп(Ж), замкнутая относительно операции коммутирования [Л,В] = = АВ — В А. (Общее определение см. в упражнении 14.) Следую- щие множества матриц составляют классические алгебры Ли; обычно они даже образуют линейные пространства над Ж (иногда над R, хотя Ж — С). Они не являются группами по умножению! а) Алгебра gl(n,Ж}. Она состоит из всех матриц Мп(Ж) б) Алгебра sl(n, Ж). Она состоит из всех матриц Мп(Ж) со следом нуль (иногда говорят «бесследных»). Замкнутость отно- сительно коммутатора следует из формулы Тг[Д,В]=0, доказан- ной в п. 9. Заметим, что Тг является линейной функцией на про- странствах квадратных матриц и линейных операторов, так что sl(n, Ж} является линейным пространством над Ж. в) Алгебра о(п, Ж}. Она состоит из всех матриц в Мп(Ж), удовлетворяющих условию А А~ А* = 0. Равносильное условие: A =(aik), где ац = Q (если характеристика Ж отлична от двух), а1к = —dki- Такие матрицы называются антисимметричными, или кососимметричными. Заметим, что ТгД = 0 для всех А ео(п,Ж}. Если Д' = — А, В‘ = —В, то [А,В]‘ = [В‘,А‘] = [—В, — Д] = = -[Л,В], так что [Л, В] кососимметрична. Такие матрицы об- разуют линейное пространство над Ж. Попутно заметим, что матрица А называется симметричной, если А* = А. Множество таких матриц не замкнуто относительно коммутирования, но замкнуто относительно антикоммутирования АВ 4- ВА или операции Йордана ~ (АВ 4- ВА). г) Алгебра u(n). Она состоит из комплексных матриц размера пХщ удовлетворяющих условию A A-Af — 0, или а,* = —aki. В частности, на диагонали у них стоят чисто мнимые элементы. Такие матрицы называются эрмитово антисимметричными, или антиэрмитовыми, или косоэрмитовыми. Они образуют линейное пространство над_И, но не над С. Если А* = — А, В* — —В, то [Л, В]* = [В*, Л'] = [-В, - л] = -[л, в], так что u(n) является алгеброй Ли. Попутно заметим, что матрица А называется эрмитово симмет- ричной, или просто эрмитовой, если А — А1, т. е. aki = йгк. Очевид- но, вещественные эрмитовы матрицы симметричны, а антиэрмито- вы — антисимметричны. В частности, о (п, R) = и (п) П si (п, R). Матрица А эрмитова, если матрица 1А антиэрмитова, и на- оборот. д) Алгебра su(n) Это есть u(n)()sl(n, С)—алгебра бесслед- ных антиэрмитовых матриц. Они образуют R-линейное простран- ство. 33
Во второй части книги, изучая линейные пространства, снаб- женные евклидовыми или эрмитовыми метриками, мы выясним геометрический смысл операторов, которые представлены матри- цами из описанных классов, а также пополним наши списки. УПРАЖНЕНИЯ 1. Сформулировать точно и доказать утверждение о том, что матрицы над полем, разбитые на блоки, можно умножать поблочно, если размеры и количе- ство блоков согласованы: 0iy)(£/fe)= (IL AiiB ik^, когда число столбцов в блоке Ац равно числу строк в блоке В1к и число блоч- ных столбцов матрицы А равно числу блочных строк матрицы В. 2. Ввести понятие бесконечной матрицы (с бесконечным числом строк и/или столбцов). Найти условия, когда можно перемножать две такие матрицы над полем (примеры: финитные матрицы, т. е. матрицы только с конечным числом ненулевых элементов; матрицы, у которых в каждом столбце и/или каждой строке конечно число ненулевых элементов). Найти условия существования трой- ных произведений. 3. Доказать, что уравнение ХУ— УХ = Е неразрешимо в конечных квадрат- ных матрицах X, У над полем нулевой характеристики. (Указание. Рассмотреть след обеих частей.) Найти решение этого уравнения в бесконечных матрицах. (Указание. Рассмотреть линейные операторы d/dx и умножения на х на про- d , d , странстве всех многочленов от х и воспользоваться тем, что —.— (х/) — x—r-f = а л а л 4. Описать явно классические группы и классические алгебры Ли в случаях п = 1 и п = 2. Построить изоморфизм групп П(1) и SO (2, R). 5. Следующие матрицы над С называются матрицами Паули: -а?)- ’-(?;)• -=с0^ (Их ввел известный физик В. Паули, один из создателей квантовой механики, в своей теории спииа электрона.) Проверить их свойства: а) [Са.Сь] = ZiVabcCc, где {a, b, с} — {1,2, 3} и eot>c — знак перестановки ( 12 3Y k а b с) б) + ОьО„ = 2б0;>ао (Ьаь — символ Кроиекера). в) Матрицы tai, /аг, Й7з над R образуют базис su(2); над С — базис si (2); матрицы Оо, ioi, 1'02, ia3 над R образуют базис u(2), иад С — базис gl(2). 6. Следующие матрицы над С порядка 4 называются матрицами Дирака (здесь аа — матрицы Паули): v,,.-(_»?)• (их ввел известный физик П. А. М. Дирак, один из создателей квантовой ме- ханики, в своей теории релятивистского электрона со спином). Пользуясь ре- зультатами упражнений 5 и 1, проверить их свойства: а) \’аУь + Уь\а — 2gabEit где gab = 0 при а Ф b, gm = 1, £ц = g22 =- .= g33 — —1. б) По определению, у5 = iyiYaYaYo. Проверить, что Vs = ~ в) Y0Y.' = — YsYa Для а = °» Ь 2> 3l V5 = Ei- 86
7. Проверить следующую таблицу размерностей классических алгебр Ли (как линейных пространств над соответствующими полями): gl (n, .X) | si (и, Ж) о (и, М) | u (и) su (и) , I 9 . И (л — 1) I „ , , л2 и2 •— 1 ——------- л2 л2 — 1 8. Пусть А — квадратная матрица порядка п, е — вещественная переменная, е -» 0. Показать, что матрица U = Е + еЛ «унитарна с точностью до е2» тогда и только тогда, когда Л аитнэрмитова: UU* = Е + О (е2) <=>• А +~Д‘ = 0. Сформулировать и доказать аналогичные утверждения для других пар класси- ческих групп и алгебр Ли. 9. Пусть U = Е + еЛ, V — Е + еВ, где е -» 0. Проверить, что = В + е2 [Д, В] + О(е3) (выражение слева называется групповым коммутатором элементов U, V). 10. Ранг гкЛ матрицы над полем — это максимальное число ее линейно независимых столбцов. Доказать, что гк Л/ = dim Im f. Доказать, что квадратная матрица ранга 1 представляется в виде произ- ведения столбца на строку. 11. Пусть Л, В — матрицы над полем размеров т X л, mi X «1 и пусть зафиксированы нумерации всех тп элементов Л и всех пцгц элементов В (на- пример, последовательно по строкам). Тензорное произведение, или произведе- ние Кронекера, ЛОВ — это матрица размера тп X «Mi с элементом aikbtm на месте а0, где а — номер 0 — иомер Ь1т. Проверить следующие утвержде- ния: а) ЛОВ линейно по каждому из аргументов, когда другой фиксирован. б) Если т — п, 1Щ = П], то det (Л ® В) = (det Л)т‘ (det B)m- 12. Сколько нужно операций, чтобы перемножить две большие матрицы? В следующей серии утверждений излагается метод Штрассена, позволяющий значительно сократить их число, если матрицы действительно большие. а) Умножение двух матриц порядка N обычным методом требует № умно- жений и N2(N — 1) сложений. б) Имеет место следующая формула умножения при N = 2, обходящаяся 7 умножениями (вместо 8) за счет 18 сложений (вместо 4), коммутативность элементов не предполагается: (а Ь\ ( А В\ _ I- с - J'-C -D) ((a + d)(AA-D)-(b-\-d) (С+ D) - d(A-C)-(a- b) D, (a-b) D-a(D-B)\ ~\(d—c) A — d (A — C), (o + d)(A4-D) - (a + c) (A + B) -~a(D—B) — (d—c)Aj' в) Применяя этот метод к матрицам порядка 2", разбитым на четыре 2"-* X 2п~*-блока, показать, что их можно перемножить, применив 7" умноже- ний и 6(7" —4") сложений. г) Дополнив матрицы порядка N до ближайшего порядка 2" нулями, по- казать, что для их умножения достаточно О (A'log:7) = О(№’81) операций. Не удастся ли вам придумать что-нибудь лучшее? 13. Пусть L = М,,(л)—пространство квадратных матриц порядка п. До- казать, что для любого функционала f е t* существует единственная матрица А Е Мп(^) со свойством f(X) = Tr(AX) для всех X Мп(Х”). Вывести отсюда существование канонического изомор- физма 9? (L, L) -> (L, £)]* для любого конечномерного пространства L. 37
14. Ж-алгеброй Ли называется линейное пространство L над Ж вместе с бинарной операцией (коммутатор): L X L -» L, обозначаемой [ , ] и удовлетво- ряющей условиям: а) коммутатор [Z, т] линеен по каждому из аргументов Z, т е L при фик- сированном другом аргументе; б) [/, т] = — [т, [] при всех I, т\ в) [Z„ [Z2,Z3]] + Д, [А, Z2]] + [I2, [Zs ZJ] = 0 (тождество Якоби) при всех Zj. Zj, Zg ge L. Проверить, что описанные в п. 11 классические алгебры Ли являются ал- гебрами Ли в смысле этого определения. Более общо, проверить, что коммутатор [X, У] = ХУ — УХ в любом ассо- циативном кольце удовлетворяет тождеству Якоби. § 5. Подпространства и прямые суммы 1. В этом параграфе мы изучим некоторые геометрические свойства взаимного расположения подпространств конечномерного пространства L. Поясним первую задачу на простейшем примере. Пусть L\, L[cL— два подпространства. Естественно считать, что они одинаково расположены внутри L, если существует такой ли- нейный автоморфизм f: который переводит L\ в £[. Для этого, конечно, необходимо, чтобы dim£] == dim£i, потому что f сохраняет все линейные соотношения и, значит, переводит базис Z-i в базис £{. Но этого и достаточно. В самом деле, выбе- рем базисы {ер ..., ет) в £t и {е[, е'т) в £[. По теореме п. 12 § 2 их можно дополнить до базисов {еь .... ет, em+i, еп} и е'т, е'т+\............е'} пространства £. По предложению п. 3 § 3 существует линейное отображение f: £->-£, переводящее е(- в е' для всех I. Это отображение обратимо и переводит L{ в £[. Таким образом, все линейные подпространства одинаковой раз- мерности одинаково расположены внутри L. Дальше естественно рассмотреть возможные расположения (упорядоченных) пар подпространств £ь £2 cz £. Как выше, будем говорить, что пары(£р £2) и (£', £2) одинаково расположены, если существует такой линейный автоморфизм /: £->-£, что f^L^ = L{ f(£2) = £'. Снова равенства dim£1 = dim£j и dim£2 = dim£2 являются необходимыми для одинаковой расположенности. Од- нако, вообще говоря, этих условий уже недостаточно. Действи- тельно, если (£1, £2) и (£ь £2) одинаково расположены, то f пере- водит подпространство £j П L? в Ц f] £2, и потому необходимо также условие dim (£I f| £2) = dim (£t f) £2). Если dim Ц и dim £2 фиксиро- ваны, но £[ и £2 в остальном произвольны, то dim(£i f] £2) может принимать, вообще говоря, целый ряд значений. Чтобы выяснить, какими они могут быть, введем понятие суммы линейных подпространств. 2. Определение. Пусть L\, ..., Ln<—L — линейные подпростран- ства в L. Их суммой называется множество 2 Lt — £, + ... + £„ = f 2 //1 Zz e Lt |. i=l <.i=l J 38
Легко убедиться, что сумма также является линейным подпро- странством и что эта операция сложения ассоциативна и комму- тативна, так же как и операция пересечения линейных подпро- странств. Другое описание суммы £t -f- ... -f- Ln состоит в том, что это наименьшее подпространство в L, содержащее все Lt. Следующая теорема связывает размерности суммы двух под- пространств и их пересечения: 3. Теорема. Если L\, L2cz L конечномерны, то L\[\Lz и L\ + L2 конечномерны и dim (Li f) £2) + dim (£1 + ^2) — dim Lx + dim L2. Доказательство. LxLt является линейной оболочкой объединения базисов L\ и £2 и потому конечномерно; L\ Г) £2 содер- жится в конечномерных пространствах L\ и £2. Положим m — dim L\ [\L2, n— dim £1, p = dim L2. Выберем ба- зис {еь ..., em} пространства £j [~| £2. По теореме п. 12 § 2 его можно дополнить до базисов пространств Lx и £2: пусть это будет {еи •••’ ет’ <+1......<} п {ei....ет> <+!> •••/<}• Назовем такую пару базисов в Li и £2 согласованной. Мы докажем сейчас, что семейство ..., ет, е^+1, ..., е'п, е"т+1...е"р] составляет базис пространства L\ + £2. Отсюда бу- дет следовать утверждение теоремы: dim (£1 + £г) = р + п — tn = dim Lx + dim £s — dim Lx f) £2. Поскольку каждый вектор из L\ + £2 есть сумма векторов из £i и £2, т. е. сумма линейных комбинаций {ег ..., ет, e'm+v ... • • -’е'п} и {ei> • • •> ет' em+i’ • • •> е₽}> объединение этих семейств по- рождает £i + £2. Поэтому остается лишь проверить его линейную независимость. Предположим, что существует нетривиальная линейная зависи- мость т п р + У yte'i + У zX = °- i-1 /—m-t-1 ' ' fe-m+1 Тогда обязательно должны существовать индексы j и k, для кото- рых tjj =# 0 и zk =# 0: иначе мы получили бы нетривиальную линей- ную зависимость между элементами базиса L\ или £2. р Следовательно, ненулевой вектор У, zke"k е £2 должен ле- (т п \ У х,е. + У i/,e'l. Значит, он 1 = 1 /=ш + 1 '/ лежит в £1 f] £2 и потому представим в виде линейной комби- нации векторов {ех, ..., ет}, составляющих базис £1 f] £2. Но это представление дает нетривиальную линейную зависимость между векторами [e]t .... ет, em+i, ..., е"р], что противоречит их опре- делению. Теорема доказана. 39
4. Следствие. Пусть щ п2 п — размерности пространств Ц, Ьг и L соответственно. Тогда числа i = dim£1n£2 и s = = dim (Ц + £2) могут принимать любые значения, подчиненные условиям 0 si I sC П\, П2 S sC п и i 4- S = П\ 4- tl2. Доказательство. Необходимость условий следует из включений Ц L2C. Li, L\ L2c: L и из теоремы и. 3. Для доказательства достаточности выберем s — щ 4- «2 — i линейно не- зависимых векторов в L: {ер .... е(.; е'1+1.е'п’ е?+Р ..., и обозначим через Ц, L2 линейные оболочки [ер ..., ер е'+Р ..., e'J и [ер ..., ег; e'-+i, ..., соответственно. Как в теореме, не- трудно проверить, что £1П£2 есть линейная оболочка {ci, ..., е,}. 5. Теперь мы можем установить, что инварианты ni=dim£i, п2 = dim L2 и i = dim£i f) £2 полностью характеризуют расположе- ние пары подпространств (£1, £2) в L. Для доказательства возьмем другую пару (Li, L2) с теми же инвариантами, построим согласо- ванные пары базисов для Ц, £2 и L\, L2, затем их объедине- ния — базисы Li + £2 и £1 4~ £2, как в доказательстве теоремы п. 3, наконец, продолжим эти объединения до двух базисов £. Линей- ный автоморфизм, переводящий первый базис во второй, устанав- ливает одинаковость расположения £j, £2 и Ц, Ь2. 6. Общее положение. В обозначениях предыдущего пункта будем говорить, что подпространства £], £2с £ находятся в общем положении, если их пересечение имеет наименьшую, а сумма — наибольшую размерность, допускаемую неравенствами из след- ствия п. 4. Например, две плоскости в трехмерном пространстве находятся в общем положении, если они пересекаются по прямой, а в четы- рехмерном пространстве, — если они пересекаются по точке. Другой термин для того же понятия: L\ и £2 пересекаются трансверсально. Название «общее положение» обусловлено тем, что в некото- ром смысле большинство пар подпространств (£1, £2) находится в общем положении, а другие расположения являются вырожден- ными. Уточнить это утверждение можно разными способами. Один из них состоит в том, чтобы описать множество пар подпространств некоторыми параметрами и проверить, что пара не находится в общем положении, только если эти параметры удовлетворяют до- полнительным соотношениям, которым общие параметры пе удов- летворяют. Другой способ, который годится для Ж — R и С, состоит в сле- дующем: выбрать в £ некоторый базис, определить L\ и £2 двумя системами линейных уравнений и показать, что можно как угодно мало изменить коэффициенты этих уравнений («пошевелить L\ и £2») так, чтобы новая пара оказалась в общем положении. Можно было бы пытаться далее рассматривать инварианты, характеризующие взаимное расположение троек, четверок и боль- шего числа подпространств в £. Комбинаторные трудности здесь 40
быстро растут, и для решения этой задачи нужна другая техника; кроме того, начиная с четверок, расположение перестает характе- ризоваться только дискретными инвариантами типа размерностей разных сумм и пересечений. Заметим еще, что, как показывает наша «физическая» интуи- ция, расположение, скажем, прямой относительно плоскости ха- рактеризуется углом между ними. Но, как мы отмечали в § 1, понятие угла требует введения дополнительной структуры. В чисто линейной ситуации есть только различие между «нулевым» и «не- нулевым» углом. Теперь мы изучим один частный, но очень важный класс взаим- ных расположений n-ок подпространств. 7. Определение. Пространство L является прямой суммой своих подпространств L\, ..., £„, если каждый вектор le. L однозначно п представляется в виде У /г, где lt е Е,. i~l Когда условия определения выполнены, мы пишем L == п — Lx ф ... ® Ln, или Ь = Например, если {еь еп}— i=] п базис L, a Li = Me-,— линейная оболочка вектора ei, то E = ®EZ. п п Очевидно, если/. = @Lh то Е — У Lp, последнее условие является i-l £=1 более слабым. 8. Теорема. Пусть Li.....Lncz L — подпространства в L. п L — ®Li тогда и только тогда, когда выполнено любое из сле- /=1 дующих двух условий: п а) У, Ez — L и L) П ( У L^ = {0} для всех 1 С / < п; п п б) и У dim Li = dim L {здесь предполагается, что L i = l z=i конечномерно). Доказательство, а) Однозначность представления любого п вектора / е L в виде У Ц, lt е L, равносильна однозначности 1 = 1 такого представления для нулевого вектора. В самом деле, если п п п h, т0 0= У (// — //) и наоборот. Если имеется нетри- ; = 1 1 = 1 1 = 1 * 1 п виальное представление 0 = У в котором, скажем, I, =jb 0, то 1 = 1 lj— — У 1{ е Lj П ( У Ef), так что условие а) нарушено. Обра- щая это рассуждение, получаем, что из нарушения условия а) сле- дует неоднозначность представления нуля. 41
б) Если ®LZ = L, то во всяком случае 1=1 п п ^Li=L и £ dim Li dim L, потому что объединение базисов L, порождает L и, значит, содер- жит базис L. По теореме п. 3, примененной к L/ и У, Llt имеем dimLyQ^y Lz) + dim L == dim + dim ( У L^. Но размерность пересечения слева нулевая по предыдущему утвер- ждению. Кроме того, если сумма всех Li прямая, то и сумма всех Li, кроме Lj, прямая, и мы можем по индукции считать, что dim (У LA = У dimLt. Поэтому У dim £г = dim L. \i^i / i&i i Наоборот, если У dimL( — dim L, то объединение базисов всех i Li состоит из dimL элементов и порождает все L, а потому яв- ляется базисом в L. В самом деле, нетривиальное представление п нуля 0 = У L, /г е Li, дало бы нетривиальную линейную комби- нацию элементов этого базиса, равную нулю, что невозможно. Рассмотрим теперь связь между разложениями в прямую сум- му и специальными линейными операторами — проекторами. 9. Определение. Линейный оператор р: L-+ L называется проек- тором, если р2 = р о р — р. п Прямому разложению £ = ф Lt естественно сопоставляются п 1 проекторов, которые определяются так: для любых // е £/ li- Поскольку любой элемент I е L однозначно представляется в виде п Lp, l^Lp отображения р,- определены корректно. Их линей- /“1 I ность и свойство Pi = Pi проверяются прямо из определения. Оче- видно, Li = Im pt. Сверх того, если I #= /, то pip/ — 0: вектору /,• отвечает представ- п ление lt — У lh где = 0 при i =# /, h — It. п / п \ f п \ п Наконец, У р,~ id, ибо I У pi 11 У lt 1 = У lt, если Z, е Lt. Наоборот, по такой системе проекторов можно определить отве- чающее ей прямое разложение. 42
ГО. Теорема. Пусть pi, ..., рп: L-*~ L —конечное множество проекторов, удовлетворяющих условиям п У Pi = id, pip] = о при i #= j. 1 — 1 н Положим Lt = Im pt. Тогда £ = ф Lt. z=i n Доказательство. Применяя оператор id —к лю- п бому вектору l^L, получим/=£ pz (/), где pi(l)^. Li. Поэтому i =1 п £=££z. Для доказательства того, что эта сумма прямая, при- меним критерий а) из теоремы п. 8. Пусть I е Lf f] (У, Lt^. Вей- лу определения пространств Lt — Im pz существуют такие векторы /ь ..., 1п, что l-Р, (Z/)=Z PtUi)- i¥-f Применим к этому равенству оператор p.z и воспользуемся тем, что р ? = ру, ptPi = 0 при i =#= /'• Получим P/(Z/) = £P]Pi (^по- следовательно, I = 0, что завершает доказательство. 11. Прямые дополнения. Если L — конечномерное пространство, то для любого подпространства L\ с: L можно выбрать такое под- пространство L2C.L, чю L = L\®L2, кроме тривиальных случаев £,={0} или Li = L этот выбор неоднозначен. В самом деле, выбрав базис {сь ..., ет} в £z и продолжив его до базиса {ez, ... ..., ет, em+i, • • •, £п} в £, мы можем взять в качестве £2 линейную оболочку векторов {em+i, .... еп}. 12. Внешние прямые суммы. До сих пор мы исходили из се- мейства подпространств £ь ..., £„ одного и того же пространства £. Пусть теперь £ь ..., Ln — пространства, не вложенные заранее в общее пространство. Определим их внешнюю прямую сумму £ следующим образом: а) £ как множество есть £i X • • • X Ln, т. е. элементы £ суть семейства (/ь ..., /п), где li^Li. б) Сложение и умножение на скаляр производятся покоорди- натно: (Л, z„) + (zL .... zX)=(Zi + z;,..., ln + l'n), a(h, ln)^=(cdi, .... aln). Нетрудно проверить, что £ удовлетворяет аксиомам линейного про- странства. Отображение fz: Lt-+L, fi.(l) = (0..0,1, 0, ..., 0) 43
(I на i-м месте) является линейным вложением £, в L, и из опре- п делений немедленно следует, что L — ф ft (Lt). Отождествив Lt i = l с ft(Li), получим линейное пространство, в котором Ц содержатся и которое разлагается в прямую сумму L,-. Это оправдывает на- звание внешней прямой суммы. Часто удобно обозначать внешнюю н прямую сумму также ф Lt. i-i п 13. Прямые суммы линейных отображений. Пусть L —ф1£, t = 1 п М = фм£, f: L-+M— такое линейное отображение, что /(£,-)<= с Mi. Обозначим через f£ индуцированное линейное отображение п Li^-Mj. В таком случае принято писать f—ф/£. Аналогично 1 = 1 определяется внешняя прямая сумма линейных отображений. Вы- брав в L и М базисы, являющиеся объединением базисов £г и Mi соответственно, мы получаем, что матрица f является объеди- нением стоящих по диагонали блоков, которые представляют собой матрицы отображений f£; на остальных местах стоят нули. 14. Ориентация вещественных линейных пространств. Пусть L— конечномерное линейное пространство над полем вещественных чисел. Два упорядоченных базиса {<?£} и [е'^ в нем всегда одина- ково расположены в том смысле, что имеется единственный линей- ный изоморфизм f: L-+-L, переводящий е£ в е'.. Поставим, однако, более тонкий вопрос: когда можно перевести базис {et} в базис {е'| непрерывным движением, или деформацией, т. е. найти такое семейство ft: L^>-L линейных изоморфизмов, непрерывно завися- щее от параметра /е[0, 1], что /о — id, f{ (ef) = е\ для всех i? (Не- прерывно зависеть от t должны просто элементы матрицы f в ка- ком-нибудь из базисов.) Для этого имеется очевидное необходимое условие: поскольку при изменении t определитель ft меняется не- прерывно и не проходит через нуль, знак det f< должен совпадать со знаком det f0 — 1, т. е. det ft > 0. Верно и обратное утверждение: если определитель матрицы перехода от базиса {ej к базису {е£} положителен, то {а} можно перевести в (е'^ непрерывным движением. Это утверждение, очевидно, можно сформулировать иначе: любую вещественную матрицу с положительным определителем можно соединить с единичной матрицей непрерывной кривой, со- стоящей из невырожденных матриц (множество вещественных невырожденных матриц с положительным определителем связно). Чтобы перейти от языка базисов к языку матриц, достаточно ра- ботать не с парой базисов {е£}, {//(£<)}, а с матрицей перехода от первого ко второму. Мы докажем это утверждение, разбив его на серию шагов. 44
а) Пусть A — Bi ... Bn, где A, Bi — матрицы с положитель- ными определителями. Если все В, можно соединить с Е непре- рывной кривой, то это верно и для А. Действительно, пусть Bj(t) — такие непрерывные кривые в про- странстве невырожденных матриц, что В/(0) = в/, В}(1) = Е. Тогда кривая A(t) — Bi(t) ... B„(t) соединяет А с Е. б) Если А можно соединить непрерывной кривой с В, а В с Е, то можно соединить А с Е„ Действительно, если A(t) такова, что Д(0) = Л, Д(1)--В, и В (t) такова, что В (0) = В, В (1) = Е, то кривая ( А (2/) при 0 1/2, (^\B(2t-~ 1) при соединяет А с Е. Трюк с изменением масштаба и начала отсчета t использован лишь потому, что мы условились параметризовать кривые матриц числами t е [0, 1]. Очевидно, можно пользоваться любыми промежуточными интервалами параметризации, проводить последовательно все нужные деформации и менять масштаб лишь в конце. Поэтому дальше мы не будем заботиться об интервалах параметризации. в) Любую квадратную невырожденную матрицу А можно пред- ставить в виде произведения конечного числа элементарных мат- риц следующих типов: Fs,t, Fs,t(E), FS(E), ?.eR. Обозначим через Est матрицу с единицей на месте (s, t) и нулями на остальных ме- стах. Тогда по определению Fs.t — Е — Е^ — Ett + Est + Efs; Fs.t (X) = E + EEst; FS(K) = E + (X - 1) Ess. Этот результат доказан в книге «Введение в алгебру», гл. 2, § 4, следствие из теоремы п. 5. г) Пусть теперь матрица А представлена в виде произведения элементарных матриц. Предполагая ее определитель положитель- ным, покажем, как соединить ее с £ с помощью нескольких после- довательных деформаций, пользуясь результатами шагов а) и б). Прежде всего, det Fs, ?(Х) = 1 при всех X и Fs, <(0) = £. Меняя в исходных сомножителях X от начального значения до нуля, мы можем деформировать все такие множители в Е, так что можно считать, что их нет с самого начала. Матрицы FS(X) диагональны: на месте (s, s) стоит X, на осталь- ных— единицы. Изменим X от начального значения до 4-1 или —1 в соответствии со знаком начального значения. Результатом де- формации будет либо единичная матрица, либо матрица линейного отображения, меняющего один из базисных векторов на противо- положный и оставляющий остальные на месте. Результатом деформации А на этом этапе будет матрица ком- позиции двух преобразований: одно сводится к перестановке век- торов базиса (Fs,; меняет местами s-й и t-й вектор), другое меняет знаки части векторов (композиция Fs(4~l) и Ft(—1)). 45-
Любую перестановку можно разложить в произведение попар- ных перестановок. Матрицу перестановки векторов базиса в пло- /0 IX (—1 ох „ /—cos/ sin/\ скости К Л можно соединить с I q । I кривой I cos/J’ л/2 t 0. Очевидно, разнеся элементы последней матрицы по местам (s, s), (s, t), получим соответствующую дефор- мацию в любой размерности, уничтожающую множители /. К этому моменту Л превратилась в диагональную матрицу с элементами ±1 на диагонали, причем число минус единиц четно, ибо определитель А положителен. Матрицу ) можно сое- динить с I q । I кривой I . t cos (J. л t 0. Собрав все —1 по- парно и проведя такие деформации всех пар, мы завершим доказа- тельство. Вернемся теперь к ориентации. Будем говорить, что базисы {е,}, одинаково ориентированы, если определитель матрицы перехода от одного из них к другому положителен. Ясно, что множество упорядоченных базисов L раз- бивается в точности на два класса, состоящих из одинаково ориен- тированных базисов, тогда как базисы из разных классов ориенти- рованы по-разному (или противоположно). Выбор одного из этих классов называется ориентацией про- странства L. Ориентация одномерного пространства соответствует указа- нию «положительного направления в нем» или полупрямой R+e = {ое| а > 0), где е — любой вектор, определяющий ориен- тацию. В двумерном пространстве задание ориентации с помощью ба- зиса {еь е2} можно представлять себе как указание «положитель- ного направления вращения» плоскости от е\ к е2. Это интуитивно согласуется с тем, что базис {/?2, /?1) задает противоположную , fO IX ,, ориентацию (определитель матрицы перехода L 0) равен —1) и противоположное направление вращения. В общем случае переход от базиса {ej к базису {е(}, состоя- щему из тех же векторов, но в другом порядке, сохраняет ориен- тацию, если перестановка четная, н меняет ее, если перестановка нечетная. Замена знака у одного из векторов е; меняет ориента- цию на противоположную. В трехмерном физическом пространстве выбор конкретной ориентации может быть связан с физиологическими особенностями человека — асимметрией правой и левой стороны. Левая сторона—- это та, где у подавляющего большинства людей находится сердце. Большой, указательный и средний пальцы левой руки, согнутые по направлению к ладони, в линейно независимом положении об- разуют упорядоченный базис, фиксирующий ориентацию («пра- вило левой руки»). Вопрос о том, существуют ли чисто физические процессы, позволяющие выбрать ориентацию пространства, т. е. 46
«неинвариантные относительно зеркального отражения», был ре- шен около двадцати лет назад положительно, ко всеобщему изум- лению, экспериментом, установившим несохранение четности в сла- бых взаимодействиях. УПРАЖНЕНИЯ I. Пусть (Д, Z-2, Z-з)—упорядоченная тройка плоскостей в Жъ, попарно раз- личных. Доказать, что имеются два возможных типа взаимного расположения таких троек, характеризующихся тем, что dim Д Г1 Л2 Г1 £3 = 0 или 1. Какой из этих типов следует считать общим? 2. Доказать, что тройки попарно разных прямых в Жг все одинаково рас- положены, а для четверок это уже неверно. 3. Пусть Lt с. L2c ... с L„ — флаг в конечномерном пространстве А, т, — dim Li. Доказать, что если £t cz.. .с=£п—другой флаг, m/ = dimL/, то автоморфизм L, переводящий первый флаг во второй, существует тогда и толь- ко тогда, когда mi = т[ для любого i. 4. То же для прямых разложений. 5. Доказать утверждения пятого абзаца п. 6. 6. Пусть р: L-+ L — проектор. Доказать, что L = Ker р ® Im р. Вывести отсюда, что в подходящем базисе L любой проектор р представлен матрицей вида / gr | 0 \ к о |о )’ где г = dim Im р. 7. Пусть L — n-мерное пространство над конечным полем из q элементов а) Вычислить количество й-мерных подпространств в L, 1 k гС п. б) Вычислить количество пар подпространств Lt, L2c L с данными размер- ностями Llt L2 и L\ П L2. Убедиться, что при q оо доля этих пар, находящихся в общем положении, среди всех пар с данными dim Lt, dim L2 стремится к 1. § 6. Факторпространства 1. Пусть L — линейное пространство, М с L — его линейное под- пространство, a — вектор. Различные вопросы приводят к рас- смотрению множеств вида I М — {1 ml т М}, «сдвигов» линейного пространства М на вектор I. Вскоре мы убе- димся, что такие сдвиги не обязаны быть линейными подпро- странствами в L; их называют линейными подмногообразиями. Начнем с доказательства следующей леммы. 2. Лемма. It -|- — /2 + М2 тогда и только тогда, когда — М2 — М и Ц — 12^М. Таким образом, всякое линейное под- многообразие однозначно определяет линейное подпространство М, сдвигом которого оно является. Вектор же сдвига определяется лишь с точностью до элемента из этого подпространства. Доказательство. Прежде всего, пусть h — /2еМ. Поло- жим It — 1.2 = то. Имеем It + М = {Ц + пг | m <= М}, l2 + М = {Ц + m — tn0 [ m е М}. Но когда пг пробегает все векторы из М, пг — пг0 тоже пробегает все векторы из М. Поэтому h М = l2 М. 47
Наоборот, пусть Zi Ч- Mi = l2 + M2. Положим m0 = h—12. Из определения ясно, что тогда mG-\-Мх = М2. Так как 0еЛ12, мы должны иметь moGAfi. Значит, то-\-Мх=Мх по рассуждению в предыдущем абзаце, так что М( =М2 — М. Это завершает дока- зательство. 3. Определение. Факторпространством L/М линейного простран- ства L по М называется множество всех линейных подмногообра- зий в L, являющихся сдвигами подпространства М, со следующими операциями: а) (/1 + М) + (/2 + М) = (/1 + /2)+М, б) й(/1 + М) = all -ф М для любых /ь l2 е L, а^Ж. Эти операции определены корректно и превращают L/М в ли- нейное пространство над полем Ж. 4. Проверка корректности определения. Она состоит из сле- дующих шагов: а) Если /| -р М = h Т" М и li -р М = 1ч -Т М, то h -р h -р М = = l'i + l2 + M. В самом деле, из леммы п. 2 следует, что Л — Zi = mi sM и L— — /2= М. Поэтому снова по лемме п. 2 (Л *Т /2) 4~ М = (/] ~Т /2) + (mi -р mi) -р М = (/i -р /2) -р М, ибо mi -р m2 е М. б) Если l\ + М — h -р М, то ah + М — al'i + М, В самом деле, снова полагая/, — = А1, имеем ah — al\— = ате.М, и’применение леммы п. 2 дает требуемое. Таким образом, сложение и умножение на скаляр действительно однозначно определены в L/М. Остается проверить аксиомы ли- нейного пространства. Но они сразу же следуют из соответствую- щих формул в L. Например, одна из формул дистрибутивности проверяется так: | a [(G + Л1) + (/2 -р Л1)] = а ((/, -Р /2) + М) = a (h + /2) -р М = = alx -р а/2 -р М = (alx -р М) -р (п/2 Ч- ZW)== о (Р Ч- Af) -р а (12 -р М). Здесь последовательно используются: определение сложения в L/M, определение умножения на скаляр в L/М, дистрибутивность в L и снова определение сложения и умножения на скаляр в L/M. 5. Замечания, а) Из определения видно, что аддитивная группа L/М совпадает с факторгруппой аддитивной группы L по аддитив- ной группе М. В частности, подмногообразие М cz L является ну- лем в L/M. б) Имеется каноническое отображение /: L-+ L/M: f(l)— I Ч~ М. Оно сюръективно, а его слои — прообразы элементов — суть как раз подмногообразия, отвечающие этим элементам. Действительно, по лемме п. 2 f-' (h -р Л1) = {/ cz L11 Ч" М = h -р Л1} — {/L11 — Iq gz AJj — h Ч~
Заметим, что в этой цепочке равенств 10 4-Л4 первый раз рассмат- ривается как элемент множества L/М, а остальные — как подмно- жества в L. Из п. 4 ясно, что f — линейное отображение, а лемма п. 2 по- казывает, что Ker f — М, ибо /о + М — М тогда и только тогда, когда /0 е М. 6. Следствие. Если L конечномерно, то dim L/M = dim L — — dimAL Доказательство. Применить теорему п. 12, § 3 к по- строенному отображению L->L/M. Многие важные задачи в математике приводят к ситуации, когда пространства Л4 cz L бесконечномерны, а факторпростран- ство L/М конечномерно. В этом случае пользоваться следствием п. 6 нельзя, и вычисление dimL/A4 обычно становится нетривиаль- ной задачей. Число dimL/M вообще называется коразмерностью подпространства М в L и обозначается codim М или codimLM. 7. Поставим следующую задачу: даны два отображения f: L—> М п когда существует такое отображение Л: что g = hf? На языке диаграмм: когда можно вложить диаграмму L в коммутативный треугольник 2f (ср. § 13 о коммутативных диаграммах). Ответ для линейных отображений дается следующим результатом. 8. Предложение. Для существования h необходимо и достаточно, чтобы Ker f cz Ker g-, если это условие выполнено и Im f = М, то h единствен. Доказательство. Если h существует, из g — hf следует, что g(l) = hf(I) — 0, коль скоро f(/) = 0. Поэтому Ker/czKerg. Наоборот, пусть Ker f cz Ker g. Построим сначала h на подпро- странстве ImfczM. Единственная возможность состоит в том, чтобы положить h(m) = g(l), если m — f(l). Нужно проверить, что h определено однозначно и линейно на Im f. Первое следует из того, что если tn = f (А) = f (/2), то /1 — /2 е Ker f cz Ker g, откуда g(ll) = g[l2). Второе следует автоматически из линейности fug. Теперь достаточно продолжить отображение h с подпростран- ства ImfczM на все пространство М, например, выбрав базис Im f, дополнив его до базиса М и положив h равным нулю на до- полняющих векторах. 49
9. Пусть g: L-+-M — лилейное отображение. Мы уже опреде- лили ядро и образ g\ дополним это определение, положив кообраз g-. Coim g — L/Ker g, коядро g: Coker g = Af/Im g. Имеется цепочка линейных отображений, «разбирающая g на ча- сти», где все отображения, кроме Л, — канонические вложения и факто- ризация, a h — единственное отображение, делающее коммутатив- ной диаграмму с/ V- Coimg- —h »~Img* Оно определено однозначно, потому что Ker с ~ Ker g, и является изоморфизмом, потому что обратное отображение тоже существует и определено однозначно. Смысл объединения этих пространств в пары (с приставкой «ко» и без нее) объясняется в теории двойственности (см. следую- щий параграф и упражнение 1 к нему). 10. Конечномерная альтернатива Фредгольма. Пусть g: L-+- ->М — линейное отображение. Число ind g = dim Coker g — dim Ker g называется индексом оператора g. Из предыдущего пункта сле- дует, что если Lu М конечномерны, то индекс g зависит только от L и М: indg = (dimМ — dim Img) — (dimL —- dim Img) ~ dimAf — dim L. В частности, если dimM = dimL, например, если g — линейный оператор на L, то indg = 0 для любого g. Отсюда вытекает так называемая альтернатива Фредгольма: либо уравнение g(x) — у разрешимо для всех у, и тогда уравне- ние g(x) = 0 имеет лишь нулевые решения; либо это уравнение разрешимо не для всех у, и тогда однород- ное уравнение g(x) — 0 имеет ненулевые решения. Точнее, если ind g = 0, то размерность пространства решений однородного уравнения равна коразмерности пространства правых частей, при которых разрешимо неоднородное уравнение. 50
УПРАЖНЕНИЯ 1. Пусть М, N с L. Доказать, что следующее отображение является линей- ным изоморфизмом: (М + N)/N m + n + Nt->m + M()N. 2. Пусть L — М Ф N. Тогда каноническое отображение является изоморфизмом. § 7. Двойственность 1. В § 1 мы поставили в соответствие каждому линейному про- странству L двойственное к нему пространство L* — S?(L, Ж), а в § 3 показали, что если dim L <Z оо, то dim L* = dim L, и построили канонический изоморфизм el: £->-£*’. Здесь мы продолжим описа- ние двойственности, включив в рассмотрение линейные отображе- ния, подпространства и факторпространства. Теория двойственности получила свое название благодаря тому, что она выявляет ряд свойств «двусторонней симметрии» ли- нейных пространств, довольно трудных для наглядного воображе- ния, но совершенно фундаментальных. Достаточно сказать, что дуализм «волна — частица» в квантовой механике адекватно вы- ражается именно на языке линейной двойственности бесконечно- мерных линейных пространств (точнее, соединения линейной и групповой двойственности в технике анализа Фурье). Удобно следить за этой симметрией, несколько изменив обозна- чения, принятые в § 1 и 3. 2. Симметрия между L и L*. Пусть l^L, f^L*. Вместо f(l) мы будем писать (f, I) (в знак аналогии со скалярным произведе- нием— но векторов из разных пространств!). Таким образом, мы определили отображение L*\ Оно линейно по каждому из двух аргументов f, I при фиксированном втором: (fi + f2, /) = (Л, /) + (f2, О» («Л. /) = а(Л, 0. (f, h + /2) = (f. /i) + (L /2), (L «/>) = a (f, /,). Вообще, отображения £X с таким свойством называются билинейными, а также спариваниями между пространствами £ и М. Введенное выше спаривание между £ и L* называется канони- ческим (ср. обсуждение этого слова в § 3, п. 8). Отображение ел £-»-£** из § 3, п. 10, как видно из его опреде- ления, можно задать условием: Ы1), = 0. где слева стоит символ спаривания между £** и £*, а справа — между £* и £. Если dim£ < оо, так что eL является изоморфизмом, и мы условимся отождествлять £** и £ посредством ег, эта фор- мула приобретает симметричный вид (/, f) = (f, I). Иными словами, мы можем также рассматривать £ как пространство, двойственное к L*. 51
3. Симметрия между двойственными базисами. Пусть {щ, ... с,,} — базис в L, {е1, ..., еп} — двойственный базис в L*. Со- гласно п. 9 § 3 он определяется формулами ( 0 при i k, (е, ej = 6,j = { . . , ' (1 при i — k. Симметрия (ег, ek) = (ek, в1) в соглашениях предыдущего пункта означает, что базис (е*) двойствен к базису (е‘), если L рассмат- ривать как пространство линейных функционалов на L*. Таким образом, (е‘) и (е*) образуют двойственную пару базисов, и это отношение симметрично. п Представим вектор l*^L* в виде линейной комбинации У btel, п а вектор I е L в виде У й.е.-. Тогда /=1 /61 \ п п I • I (/*, /)== У йД (е', е-)= У йД = (а1....ап) • = f./=i ' »=i I : / х bn' (at \ : 1=(Л О, где а, b — вектор-столбцы соответствующих коэффициентов. Эта формула совершенно аналогична формуле для скалярного произ- ведения векторов в евклидовом пространстве, однако связывает в этой ситуации векторы из разных пространств. 4. Двойственное, или сопряженное отображение. Пусть f: L -> — линейное отображение линейных пространств. Мы покажем сейчас, что существует единственное линейное отображение /*: М*->£*, которое удовлетворяет условию <Г(т), l) = (m, f(l)) для любых векторов m* е М*, I е L. а) Единственность f*. Пусть f‘, f2— два таких отображения. Тогда (f* (m*), /) = (m*, f (I)) — (f* (m"), /) для всех m’eM’, / L, от- куда следует, 4To((fJ — f‘) (m‘),/) = 0. Фиксируем tn* и будем ме- нять/. Тогда элемент^* — (m’)eL’ как линейный функционал на L принимает только нулевые значения и, значит, равен нулю. Поэтому f* — f2» б) Существование f*. Фиксируем m* е М и рассмотрим выраже- ние (m*,f(l)) как функцию на L. В силу линейности f и билиней- ности (,) эта функция линейна. Значит, она принадлежит L*. Обо- значим ее через f*(in*). Равенства Г (m; + т’г) = г (rnj) + Г («;), Г (ат*) = af* (т) 52
следуют из линейности (in*, f(l)) по т*. Значит. [*—линейное отображение. Пусть в L, М выбраны некоторые базисы, а в L*, М* — двой- ственные базисы. Пусть f в этих базисах представлено матрицей Л Мы утверждаем, что /* в двойственных базисах представлено транспонированной матрицей А‘. В самом деле, пусть В — матрица /*. Согласно определениям и п. 3 имеем, обозначив вектор-столбцы координат т*, I через а, Ь, (т, f(Z)) = Gf(M (f (tn), /) = (Ba)* Ь = (а'В*) Ь. Из ассоциативности умножения матриц и единственности f* сле- дует, что Д = В1, т. е. В — А‘. Основные свойства сопряженных отображений собраны в сле- дующей теореме: 5. Теорема, a) (f ф- g)* — f* А~ g*', 6) (af)* = af*; здесь f, g: L->-M и a e в) (Ig)' = gT', здесь L M N; r) id* = id, 0* = 0; д) если канонически отождествить L** с L и М** с М, то f**: £** _> до** отождествляется с f: L-+ М. Доказательство. Если считать, что L и М конечномер- ны, то проще всего проверить все эти утверждения, представив f, g матрицами в двойственных базисах и воспользовавшись про- стыми свойствами операции транспонирования: (аА + ЬВ)* = аА1 А-ЬВ*, (АВ)* = В*А‘, Е1 = Е, 0* = 0, (Д')' = 0. Инвариантную проверку мы оставляем читателю в качестве упраж- нения. 6. Двойственность между подпространствами в L и в L*. Пусть М с L — некоторое линейное подпространство. Обозначим через Мх с L* и будем называть ортогональным дополнением к М мно- жество функционалов, обращающихся в нуль на М. Иными сло- вами, т' е ЛИ <=> (т*, т) — 0 для всех т е М. Легко видеть, что Мх является линейным пространством. В сле- дующих утверждениях собраны основные свойства этой конструк- ции (L предполагается конечномерным). а) Имеется канонический изоморфизм L*/МА Строится он так: многообразию I* ~(- М1 ставится в соответствие ограничение функционала /* на М. От выбора /* оно не зависит, ибо ограниче- ния функционалов из Мх на М нулевые. Линейность этого отобра- жения очевидна. Оно сюръективно, ибо всякий линейный функцио- нал на М продолжается до некоторого функционала на L. В самом деле, пусть {еь ..., ет} — базис в М, {е]; ..., ет, em+i, еп) — его продолжение до базиса L. Функционал f на М, 53
заданный значениями f(et), f(en), продолжается на Л, напри- мер, если положить f (em-ц) = ... — f(e-i) = 0. Наконец, построенное отображение инъективно. В самом деле, у него нулевое ядро: если ограничение I* на М равно нулю, то (*еЛР и I* + АГ1 = А11— нулевой элемент из L*/ML. б) dim М dim АГ1 — dim L. Действительно, это следует из пре- дыдущего утверждения, следствия п. 6 § 6 и того, что dim L* = = dim L, dim M* = dim Al. в) При каноническом отождествлении L** с L пространство (Af1)1 совпадает с М. Действительно, так как (m*, т) — 0 для всех tn* и данного те.М, ясно, что М сДАН)1. Но, кроме того, по предыдущему свойству, примененному дважды, dim (АН)1 = dim L — dim Af1 = dim Af. Значит, Af = (Al1)1. r) (Afj + А12)г = Af1 П Al1; f] AQ1 = Af1 + Af1. Доказательство предоставляется читателю в качестве упраж- нений. УПРАЖНЕНИЯ 1. Пусть с линейным отображением g: L->-M конечномерных пространств связана цепочка отображений, построенных в п. 8 § 6. Построить канонические изоморфизмы Ker g* -> Coker g, Coim g* -> Im g, Im g* -> Coim g, Coker g* -> Ker g. 2. Вывести отсюда «третью теорему Фредгольма»: для того чтобы уравнение у было разрешимо (по х при данном у), необходимо и достаточно, чтобы у был ортогонален к ядру сопряженного отображения g*: M*-*-L*. f g 3. Последовательность линейных пространств и отображений L —» М —» N называется точной в члене М, если Im f = Ker g. Проверить следующие утвер- ждения: а) Последовательность 0—> L — > М точна в члене L тогда и только тогда, когда f — инъекция. g б) Последовательность М —> # —> 0 точна в члене N тогда и только тогда, когда g — сюръекция. f fi в) Последовательность конечномерных пространств 0 —» L —> М —» —N -—► 0 точна (во всех членах) тогда и только тогда, когда точна двой- fi* f * ствённая последовательность 0 —► N* —► М* —» L* —► 0. 4. Мы знаем, что если отображение f: L-+M в некоторых базисах пред- ставлено матрицей А, то отображение f* в двойственных базисах представлено матрицей А‘. Вывести отсюда, что ранг матрицы совпадает с рангом транспони- рованной матрицы, т. е. что максимальные числа линейно независимых строк и столбцов матрицы совпадают. § 8. Структура линейного отображения 1. В этом параграфе мы начнем изучать следующую задачу: возможно яснее геометрически представить себе устройство линей- ного отображения f: AI. Ответ совсем прост, когда L и Af никак 54
не связаны друг с другом: он дается теоремой из п. 2 этого пара- графа. Гораздо интереснее и многообразнее получается картина, когда M — L (этот и следующий параграфы) и Л! = L* (следую- щая часть). На матричном языке речь идет о приведении матрицы f к возможно более простой форме с помощью подходящего, спе- циально приспособленного к структуре f, базиса. В первом случае базисы в L и М можно выбирать независимо, во втором речь идет об одном базисе в L или о базисе в £ и двойственном к нему ба- зисе £*: меньшая свобода выбора приводит к большему разнооб- разию ответов. На языке § 5 нашу задачу можно переформулировать следую- щим образом. Построим внешнюю прямую сумму пространств £ Ф М и поставим в соответствие отображению f его график Г/: множество всех векторов вида (/Д(())е£ФМ. Легко убедиться, что Г/ есть линейное подпространство в £ Ф М. Нас интересуют инварианты расположения Г/ в £ Ф М. Для случая, когда базисы в £ и М можно выбирать независимо, ответ дается следующей теоремой. 2. Теорема. Пусть f: L-+M — линейное отображение конечно- мерных пространств. Справедливы следующие утверждения: а) Существуют такие прямые разложения Ь—Ь0ФЦ, М = = М] Ф М2, что Ker f = £0 и f индуцирует изоморфизм Ц с М{. б) Существуют такие базисы в £ и М, что матрица f в этих базисах имеет вид (ац), где ац — 1 для 1 i г и ац =0 для остальных i, j. в) Пусть А—некоторая матрица размера тХп. Тогда су- ществуют такие невырожденные квадратные матрицы В и С раз- меров mXm и пХп и такое число r^min(m, п), что матрица ВАС имеет вид, описанный в предыдущем пункте. Число г опреде- лено однозначно и равно рангу А. Доказательство, а) Положим £0 = Kerf, а в качестве £j выберем прямое дополнение к £(1: это возможно в силу п. 10 § 5. Затем положим Mi = Im f, а в качестве М2 выберем прямое допол- нение к М\. Нужно лишь проверить, что f определяет изоморфизм £1 с М\. Отображение f: £1-^-Л11 инъективно, потому что ядро f, т. е. £0, пересекается с £] лишь по нулю. Оно сюръективно, по- тому что если I = /о -|- /] £, /о £о, /| £], то /(/) = /(/]). б) Положим г = dim Ц = dim Mi и выберем в £ базис {ei, ..., ет, er+i, ..., еп}, где первые г векторов образуют базис £ь а следующие—базис £0. Далее, векторы е\ = f^et), 1 i г, образуют базис в Мг = Imf. Дополним его до базиса М векторами К+Р •••• <}• Очевидно, Hei> •••> еА ег+и •••• еп) = (еи •••> °) = так что матрица f в этих базисах имеет требуемый вид. 55
в) Построим ио матрице А линейное отображение f координат- ных пространств Жп-+Ж™ с этой матрицей, затем применим к нему утверждение б) В новых базисах матрица f будет иметь тре- буемый вид и выражаться через А в виде ВАС, где В, С — мат- рицы перехода: см. п. 8 § 4. Наконец, rk А — rk ВАС — rk f — — dim Im f. Это завершает доказательство. Теперь перейдем к изучению линейных операторов. Нач- нем с введения простейшего класса: диагонализируемых опера- торов. Назовем в общем случае подпространство LG<~L инвариант- ным относительно оператора f, если f(L0)az Lo. 3. Определение. Линейный оператор f: L-+ L называется диаго- нализируемым, если выполнено любое из двух равносильных усло- вий: a) L разлагается в прямую сумму одномерных инвариантных подпространств-, б) существует базис L, в котором матрица оператора f диаго- нально. Равносильность этих условий проверяется без труда. Если в ба- зисе (е() матрица оператора f диагональна, то f(et) = Т^е,, так что одномерные подпространства, натянутые на е,, инвариантны и L разлагается в их прямую сумму. Наоборот, если L = ф — та- кое разложение не, — любой ненулевой вектор из £,, то {е,} обра- зуют базис в L. Диагонализируемые операторы образуют простейший и во мно- гих отношениях самый важный класс. Например, над полем ком- плексных чисел, как мы убедимся, любой оператор можно делать диагональным, как угодно мало изменив его матрицу, так что опе- ратор «в общем положении» диагонализируем. Чтобы понять, что может помешать оператору быть диагонализируемым, введем два определения и докажем одну теорему. 4. Определение. 1) Одномерное подпространство L\CzL назы- вается собственным для оператора f, если оно инвариантно, т. е. Если £] — такое подпространство, то f действует на нем как умножение на скаляр \^Ж. Этот скаляр называется соб- ственным значением оператора f (на Ц). б) Вектор l^L называется собственным для J, если линейная оболочка Ж1 является собственным подпространством. Иными сло- вами, 1^=0 и f(l) = Kl для подходящего }.<^Ж. Согласно определению п. 3, диагонализируемые операторы f допускают разложение £ в прямую сумму своих собственных под- пространств. Выясним, когда у f имеется хотя бы одно собственное подпространство. 5. Определение. Пусть £ — конечномерное линейное простран- ство, f: L-* £ — линейный оператор, А — его матрица в каком-ни- будь базисе. Обозначим через P(t) и назовем характеристическим многочленом оператора f, а также матрицы А, многочлен det(f£ — Д) с коэффициентами в поле Ж (det — определитель), 66
6. Теорема, а) Характеристический многочлен линейного опера- тора I не зависит от выбора базиса, в котором представлена его матрица. б) Любое собственное значение оператора является корнем P(t) и любой корень P(t), лежащий в Ж, является собственным значением для f, отвечающим некоторому (не обязательно един- ственному) собственному подпространству в L. Доказательство, а) Согласно п. 8 § 4 матрица оператора f в другом базисе имеет вид В~'АВ. Поэтому, пользуясь мульти- пликативностью определителя, находим det (tE — В~'АВ) = det (B~l (tE — A)B) = = (det В)-' det (tE - Л) det В = det (tE - A). Заметим, что P(t) = in— Trf-tn_,+ ... +(—l)"detf (обозна- чения из п. 9 § 4). б) Пусть XeJ— корень P(t). Тогда отображение X-id— / представлено вырожденной матрицей и, значит, имеет нетривиаль- ное ядро. Пусть /=#0 — элемент из ядра; тогда f(l) = kl, так что X есть собственное значение для [, а I — соответствующий соб- ственный вектор. Наоборот, если /(/)= X/, то I лежит в ядре X-id— f, так что det (X- id — f) — Р(Х) = 0. 7. Теперь мы видим, что оператор f вообще не имеет собствен- ных значении и тем более не диагонализируем, если его характе- ристический многочлен P(t) не имеет корней в поле Ж. Это вполне может случиться над алгебраически не замкнутыми полями та- кими, как R и конечные поля. Например, пусть А — — мат- рица с вещественными элементами. Тогда det (tE — A) — t2 — (а + d) t + (ad — be), n если (a-f-d)2 — 4(ad — bc) = (a — d)2 + 4ftc<0, то А недиаго- нализируема. Таким образом, мы впервые столкнулись здесь со случаем, когда свойства линейных отображений существенно зависят от свойств поля. Чтобы не принимать последние во внимание как можно дольше, в следующем параграфе до п. 9 мы будем предполагать, что поле Ж является алгебраически замкнутым. Читатель, не знакомый с другими алгебраически замкнутыми полями, кроме С, можег всюду считать, что Ж = С. Алгебраическая замкнутость Ж равно- сильна любому из двух условий: а) любой многочлен от одной пе- ременной P(t) с коэффициентами в Ж имеет корень Хе Ж\ б) лю- п бой такой многочлен P(t) может быть представлен в виде «П(/ — /=! — X#)4, где а, 'щ^Ж\ при !=/=/; это представление одно- значно, если Р(/)^0. В этом случае число г{ называется крат- ностью корня X,- многочлена P(t). Множество всех корней характе- 57
ристического многочлена называется спектром оператора f. Если все кратности равны 1, говорят, что f имеет простой спектр. Если поле Ж алгебраически замкнуто, то согласно теореме п. 6 любой линейный оператор f: £->L имеет собственное подпростран- ство. Однако он все равно может оказаться недиагонализируемым, ибо сумма всех собственных подпространств может оказаться меньше L, тогда как у диагонализируемого оператора она всегда равна L. Прежде чем переходить к общему случаю, разберемся с комплексными 2 X 2-матрицами. 8. Пример. Пусть L — двумерное комплексное пространство с базисом, оператор j: L^L представлен в этом базисе матрицей ^=(с d)’ Характеристический многочлен для f равен /2—(а-МУ+ 4- (ad — be), его корни суть Х112 =— ° + ±/у/^а + Ьс. Рассмотрим отдельно следующие случаи: a) Х,У=Х2. Пусть е}—собственный вектор для Xi, е2— для Х2. Они линейно независимы, потому что если ае} Д- Ье2 = 0, то f (aet + be2) = a'k{ei + W.2e2 = 0, откуда ХДое, + be2) — (aX^i + bX2e2) = b(Xi — X2)e2 = 0, t. e. fc=±=0 и аналогично a = 0. Следовательно, в базисе {еь е2) матрица f диагональна. б) Xi = Х2 = X. Здесь оператор f диагонализируем, только если <1 г ' (а b \ ( I Ох он умножает на X все векторы из L: это значит, что1 с d j = I 0 ? I, т. е. а = d = X, b = с = 0. Если же эти условия не выполнены, а выполнено только более слабое условие (а — d)2 -f- 4Ьс = 0, гаран- тирующее, что X] = Х2, то у оператора f может быть, с точностью до пропорциональности, только один собственный вектор и f заве- домо не диагонализируем. Пример такой матрицы: ( о • Эта матрица называется жор- дановой клеткой размера 2X2 (или ранга 2). В § 9 мы покажем, что именно такие матрицы образуют «строи- тельные блоки» для нормальной формы общего линейного опера- тора над алгебраически замкнутым полем. Дадим общее определе- ние: 9. Определение, а) Жардановой клеткой Jr(\) размера г X г с собственным значением К называется матрица вида (X 1 0 ... 0\ ° х. 1.’.”° ]• о о о ... х7 б) Жордановой матрицей называется матрица, состоящая из диагональных блоков' Jri(ht) и нулей вне этих блоков: Б8
в) Жордановым базисом для оператора ф. L-+L называется та- кой базис пространства L, в котором матрица оператора f является жордановой, или, как говорят, имеет жорданову нормальную форму. г) Приведением квадратной матрицы А к жордановой нормаль- ной форме называется решение уравнения в матрицах вида X~lAX = J, где X — (неизвестная) невырожденная матрица, a J — (неизвестная) жорданова матрица. 10. Пример. Пусть Ln(X) — линейное пространство комплексных функций вида e*-xf(x), где ХеС, f(x) пробегает многочлены сте- пени —1. Поскольку (eKxf (x)) = eKx(kf(x)+f'(x)), дифферён- d и цирование является линейным оператором на этом про- странстве. Положим ei+l — ~^eKx (напомним, что 0! = 1), i = 0, ... ..., п — 1. Очевидно, £ ^+1) = еКх + еКх = е‘ + tei+l (первое слагаемое отсутствует при 1 = 0). Следовательно, (X 1 0 ... 0\ 0Л 1 ... 0 I ! . . . . х7 Таким образом, функции образуют жорданов базис для d оператора в нашем пространстве. Этот пример показывает особую роль жордановых матриц в теории линейных дифференциальных уравнений (см. упражнения 1—3 к § 9). 11. Кроме уже рассмотренных геометрических соображений для нужд следующего параграфа нам понадобятся алгебраические све- дения о полиномиальных функциях от оператора. Пусть f: L-+L — фиксированный оператор. п а) Для любого многочлена £af/' = Q(/) С коэффициентами п из поля УА выражение ^аф1 имеет смысл в кольце ^(L.L) эндо- 1=0 морфизмов пространства £; мы будем обозначать его Q(f). б) Будем говорить, что многочлен Q(t) аннулирует оператор f, если Q(f) — 0. Ненулевые многочлены, аннулирующие f, суще- ствуют всегда, если L конечномерно. В самом деле, если dim L = п, то dim 2 (L, L) = п2 и операторы id, f, ..., fn'! линейно зависимы над УА. Это рассуждение показывает, что имеется аннулирующий f многочлен степени г^я2. На самом деле теорема Гамильтона — Кэли, которую мы докажем ниже, устанавливает существование аннулирующего многочлена степени п. 59
в) Рассмотрим многочлен M(t) со старшим коэффициентом единица, аннулирующий / и имеющий наименьшую возможную сте- пень. Он называется минимальным многочленом оператора f. Оче- видно, он определен однозначно: если МД/), Л12(/)—два таких многочлена, то МД/)—М2(/) аннулирует f и имеет строго мень- шую степень, так что —М2(/) = 0. г) Покажем, что любой многочлен, аннулирующий f, делится на минимальный многочлен f. Действительно, пусть Q(f) — O. Раз- делим Q с остатком на М: Q(t) = X(t)M(t) + R(t), deg/?(/)< < deg M (/). Тогда R (f) — Q (f) — X(f)M (f) = 0, так что R = 0. 12. Теорема Гамильтона — Кэли. Характеристический много- член P(t) оператора f аннулирует этот оператор. Доказательство. Мы будем пользоваться этой теоремой и докажем ее только для случая алгебраически замкнутого поля Ж, хотя она верна и без этого ограничения. Проведем индукцию по dim L. Если L одномерно, то f есть умножение на скаляр X, P(t)=t — X и P(f) — O. Пусть dim£ = n^2 и теорема доказана для пространств раз- мерности п—1. Выберем собственное значение X оператора f и одномерное собственное подпространство Ц cz L, отвечающее X. Пусть {ei} — базис L\\ дополним его до базиса {elt ..., еп} про- странства L. Матрица оператора f в этом базисе имеет вид (Л'* ... * \ Поэтому P(t) = (t — — А). Оператор f определяет линей- ное отображение f: L/Li-t-L/Li, = Векторы ё, = е,-+ £i е £/£i, /^2, образуют базис_£/£ь и матрица опе- ратора f в этом базисе равна А. Поэтому P(t) = det(/£— А) есть характеристический многочлен оператора f, и по индуктивному предположению P(f) = O. Значит, P(f)/e£i для любого вектора I е £. Следовательно, P(f)l = (f-K)P(f)l = O, ибо f — X переводит в нуль любой вектор из £t. Это завершает до- казательство. 13. Примеры, а) Пусть f = idt, dim£ = n. Тогда характеристи- ческий многочлен f равен (t—1)”, а минимальный многочлен ра- вен t — 1, так что они не совпадают при п > 1. б) Пусть f представлен жордановой клеткой /Г(Х). Характери- стический многочлен оператора f равен (/— Х)г. Чтобы вычислить минимальный многочлен, заметим, что 7ДХ) = Х£г +/ДО). Далее, (0 0 ... 1 0 ... 0\ ° ° . ? ! '.° I’ о о... о о... о/ где единицы стоят на к-й диагонали выше главной; /Д0)* = 0 при 60
К Z>: Г. С ЛруГОЙ СТОРОНЫ, ur(x)-XEr)ft=jr(0)fc при 0 k г—1, а поскольку минимальный многочлен — дели- тель характеристического, это доказывает, что они совпадают. УПРАЖНЕНИЯ 1. Пусть f: L^> L - диагонализируемый оператор с простым спектром. а) Доказать, что любой оператор g: L-*-L такой, что gf = fg, может быть представлен в виде многочлена от f. б) Доказать, что размерность пространства таких операторов g равна dim L. Верны ли эти утверждения, если спектр оператора f не прост? 2. Пусть f,g: L L — линейные операторы в пространстве размерности п над полем нулевой характеристики. Предположим, что f = 0, dim Ker f = 1, gf — fg=f- Доказать, что собственные значения g имеют вид а, а— 1, а — 2, ... ..., «-(п-1) для некоторого а е Ж. § 9. Жорданова нормальная форма Основная цель этого параграфа — доказательство следующей теоремы о существовании и единственности жордановой нормаль- ной формы для матриц и линейных операторов. 1. Теорема. Пусть Ж'— алгебраически замкнутое поле, L — ко- нечномерное линейное пространство над Ж, f: £ -*- L — линейный оператор. Тогда: а) Для оператора f существует жорданов базис, т. е. его мат- рица А в некотором базисе может быть приведена заменой базиса X к жордановой форме: X~lAX = J. б) Матрица I определена однозначно с точностью до переста- новки входящих в нее жордановых клеток. 2. Доказательство теоремы разбивается на ряд промежуточных п шагов. Мы начнем с конструкции прямого разложения £ = ф£г, f=i где Li — инвариантные подпространства для f, которые впослед- ствии будут отвечать набору жордановых клеток для f с одним и тем же числом X на диагонали. Чтобы инвариантно охарактери- зовать эти подпространства, вспомним, что (Л(Х)— КЕг)п==0. Оператор, некоторая степень которого равна нулю, принято назы- вать нильпотентным. Итак, на подпространстве, отвечающем клет- ке /,(Х), оператор f — X нильпотентен; то же верно для его огра- ничения на сумму подпространств с фиксированным X. Это моти- вирует следующее определение. 3. Определение. Вектор I е L называется корневым вектором оператора f, отвечающим X е Ж, если существует такое г, что (f — Х)'7 = 0 (здесь f — X обозначает оператор f — X id)'. Очевидно, все собственные векторы корневые. 4. Предложение. Обозначим через £(Х) множество корневых векторов оператора f в L, отвечающих X. Тогда L{K) — линейное подпространство в L и L (Х)=^{0) тогда и только тогда, когда X — собственное значение для f. 61
Доказательство. Допустим, (f — X)r,Zi — (f — X)r,Z2 — 0. Полагая r = max(rt, r2), находим (f — L)r(h + Z2) = 0 и (/— Z)r'fa/|) = 0. Следовательно, 1(1) является линейным подпро- странством. Если X— собственное значение для f, то имеется собственный вектор, отвечающий X, так что L(X)#={0}. Наоборот, пусть ZsL(X), Z#=0. Выберем наименьшее значение г, для которого (f — К)г1 — 0. Очевидно, г 1. Вектор Г =(f— X)r-*Z является собственным для f с собственным значением X: Z' =#= 0 по выбору г И (f — X) Г — 0, откуда /(/') = 'Ll'- 5. Предложение. L = ф'£(Х/), г&е h пробегает все собствен- ные значения оператора f, т. е. различные корни характеристическо- го многочлена f. S Доказательство. Пусть Р(/) = П(^ — Х/)Г( — характери- г=1 стический многочлен f, X, =/= X, при i=£j. Положим Ff(Z) = ep(O(Z —Х()“% fi-Fi(f), Li —Im fi. Проверим следующую серию утверждений. a) (f — Х,)г* L,={6}, т. е. Li cz L (fa). Действительно, (f — fa)r‘ ft— = (f — ^i)r‘Fi(f) = P (f) = 0 по теореме Гамильтона — Кэли. 6) L = Li+ ... -\-Ls. Действительно, так как многочлены Fi(t) в совокупности взаимно простые, существуют такие многочлены S Xi(t), что У, Fi(t)Xi (/)= 1. Поэтому, подставляя вместо t опера- «==1 тор f, имеем Ьж (f) = id. г-i Применяя это тождество к любому вектору Z е L, находим i=ifi(xt(f)^ th. в) L = Li Ф ... Ф Ls. Действительно, выберем 1 i s и проверим, что ДП ( У £Л «= {0}. Пусть Z — вектор из этого пе- ресечения. Тогда (f-XipZ = O, ибо Ze=L(; Fi(f)l — П (f-X,)r/Z = O, ибо Ze £ £/. / ¥= i i =/= i Так как (t— faY1 и Ft(t)— взаимно простые многочлены, су- ществуют такие многочлены X(t) и У (/), что X (Z) (/ — Хг/г + У (/) X 'XFi(t)—l. Подставляя сюда f вместо t и применяя полученное операторное тождество к Z, находим X(f) (0)ф У(/) (0)= Z — 0. г) £, ==£(Х/). В самом деле, мы уже проверили, что £, с£(Х(). Для доказательства обратного включения выберем вектор /е 62
e L(ki) и представим его в виде I = /' + I", I'Li, Геф Lt. i ‘ Существует такое число г', что (/ — Хг)г7" = 0, поскольку Г = I — — I'^LCkt). Кроме того, Fi(f)l" = 0. Написав тождество X(t) (t — XiY' + Y(t)Fi (t)— 1, подставив в него f вместо t и приме- нив к Г, получим I" = 0, так что I == V е. Lt. 6. Следствие. Если оператор f имеет простой спектр, то он диа- гонализируем. Доказательство. В самом деле, число разных собствен- ных значений / тогда равно п = deg P(t) = dim L. Поэтому в раз- п ложении £ = ф£(Хг) все пространства £(Х() одномерны, а так f=i как каждое из них содержит собственный вектор, в базисе из этих векторов матрица оператора f становится диагональной. Теперь мы фиксируем одно собственное значение X и докажем, что ограничение f на £(Х) обладает жордановым базисом, отве- чающим этому £. Чтобы не вводить новых обозначений, мы будем до конца п. 7 считать, что f имеет единственное собственное зна- чение К и Е — ЦК). Более того, мы можем считать даже, что X = 0, потому что любой жорданов базис для оператора f являет- ся одновременно жордановым базисом для оператора f + щ где р— любая константа. Тогда оператор f нильпотентен по теореме Гамильтона — Кэли: P(t) = tn, fn — 0, и мы докажем следующий факт: 7. Предложение. Нильпотентный оператор f на конечномерном, пространстве £ имеет жорданов базис, матрица оператора f в этом базисе является объединением клеток вида /г(0). Доказательство. Если у нас уже есть жорданов базис в пространстве £, удобно поставить ему в соответствие диаграмму i i НИ ни D, подобную изображенной здесь. В этой диаграмме точки изобра- жают элементы базиса, а стрелки описывают действие f (в общем случае действие f — X). Элементы нижней строки оператор f пере- водит в нуль, т. е. в ней стоят собственные векторы оператора f, входящие в базис. Каждый столбец, таким образом, изображает базис инвариантного подпространства, Отвечающего одной жорда- новой клетке, размер которой равен высоте этого столбца (числу точек в нем): если f (eh) f (eft-l) — eh-2> • • •» f tel) — 0, 63
тс /О 1 О ... О\ f(elt .... ek) = (ei, ел) °.0 1,"\° . \о о О ... О/ Наоборот, если мы найдем в L базис, элементы которого f пе- реводит в другие его элементы или в нуль так, что элементы этого базиса вместе с действием f можно изобразить подобной диаграм- мой, то он будет жордановым базисом для L. Проведем доказательство существования индукцией по размер- ности L. Если dim£=l, то нильпотентный оператор f является нулевым, и любой ненулевой вектор в L образует его жорданов базис. Пусть теперь dim/. = H>l, и пусть для размерностей, меньших п, существование жорданова базиса уже доказано. Обо- значим через Loc. L подпространство собственных векторов для /, т. е. Kerf. Так как dim Lo > 0, имеем diinL/£0<«, а оператор f: L-+L индуцирует оператор f: £/£0-»_£/£0: f(/ + Lo) = f(l) + Lo. (Корректность определения оператора f и его линейность прове- ряются немедленно.) По индуктивному предположению f имеет жорданов базис. Мы можем считать его непустым: иначе L — Lo, и любой базис Lo бу- дет жордановым для J. Построим диаграмму D для элементов жорданова базиса оператора ], в каждом ее столбце возьмем са- мый верхний вектор ё,-, i=l, и положим ci = et Д- Lo, ei^L. Теперь построим диаграмму D из векторов пространства L следующим образом. Для 1= 1, ..., т столбец с номером i диа- граммы D будет состоять (сверху вниз) из векторов е,, f(e,), ... ..., fht~l (et), fhi(ei),rAe-hi — высота t'-ro столбца в диаграмме D. Так как ?Лг(ё,-) = 0, то fh‘ (et) е LQ и fhl+l (ег) = 0. Выберем базис линейной оболочки векторов fh' (еД • • , fhm (ет) в £0, дополним его до базиса Lo и поставим дополняющие векторы в качестве дополнительных столбцов (высоты единица) в нижней строке диа- граммы D; f переводит их в нуль. Таким образом, диаграмма D из векторов пространства L вместе с действием оператора f на ее элементы имеет в точности такой вид, как требуется для жорданова базиса. Нужно только проверить, что элементы D действительно образуют базис L. Сначала покажем, что линейная оболочка векторов из D равна т h{-\ L. Пусть I е L, 1 = I + Lo. По предположению i= £ £ (е{). i-1 /=о Так как Ло /-инвариантно, отсюда следует, что _ • -1 т i /—£ Xanfl(ei)^ Lo. i-l l~v Но все векторы р'(е>), j hi—1, лежат в строках диаграммы D, начиная со второй снизу, а подпространство Lo порождено элемен- 64
тами первой строки D по построению. Поэтому / можно предста- вить в виде линейной комбинации элементов D. Остается проверить линейную независимость элементов D. Прежде всего, элементы нижней строки D линейно независимы. Действительно, если некоторая их нетривиальная линейная комби- т нация равна нулю, то она должна иметь вид £ atfhi (ei) — О, ибо i=»l остальные элементы нижней строки дополняют базис линейной оболочки {fh' (gj), ..до базиса Л0.Но все h, 1, поэтому так что т т и £«/Л~1(ё/) = 0. t=i i=i Из последнего же соотношения следует, что все at — 0, потому что векторы fht~l (et) составляют нижнюю строку диаграммы D и яв- ляются частью базиса Л/Ло. Наконец, покажем, что если имеется любая нетривиальная ли- нейная комбинация векторов D, равная нулю, то из нее можно получить нетривиальную линейную зависимость между векторами нижней строки D. В самом деле, отметим самую верхнюю строку D, в которой имеются ненулевые коэффициенты этой воображае- мой линейной комбинации. Пусть номер этой строки (считая сни- зу) равен h. Применим к этой комбинации оператор fh~l. Оче- видно, ее часть, отвечающая й-й строке, перейдет в нетривиальную лийейную комбинацию элементов нижней строки, а остальные сла- гаемые обратятся в нуль. Это завершает доказательство предло- жения. Теперь нам осталось проверить часть теоремы из п. 1, относя- щуюся к единственности. 8. Пусть фиксирован произвольный жорданов базис операто- ра/. Любой. диагональный элемент матрицы оператора f в этом базисе, очевидно, является одним из собственных значений % этого оператора. Рассмотрим часть базиса, отвечающего всем блокам матрицы с этим значением %, и обозначим через Ц, его линейную оболочку. Поскольку (Л-(%)—%)г = 0, имеем cz Ар.), где Л (%) — корневое подпространство L. Кроме того,Л=фЛл/ по определению жорданова базиса и L = ф Л (%,) по предложению п. 5, где в обоих случаях %,- пробегает все собственные значения оператора f по одному разу. Следовательно, dim L-t,t — dim L (kt) и — L(kt). Значит, сумма размеров жордановых клеток, отвечающих каж- дому %(, не зависит от выбора жорданова’ базиса, и, более того, от выбора базиса не зависят линейные оболочки Lk{. Поэтому достаточно проверить теорему единственности для случая L—L(K) или даже для L = L (0). «5
Построим диаграмму D, отвечающую данному жорданову ба- зису L — L(0). Размеры жордановых клеток —это высоты ее столбцов; если, как на чертеже, расположить столбцы в порядке убывания, то эти высоты однозначно определятся, если известны длины строк в диаграмме, начиная с нижней, в порядке убывания. Покажем, что длина нижней строки равна размерности £o = Kerf. Действительно, возьмем, любой собственный вектор I для f и пред- ставим его в виде линейной комбинации элементов D. В эту ли- нейную комбинацию все векторы, находящиеся выше нижней стро- ки, войдут с нулевыми коэффициентами. Действительно, если бы самые высокие векторы с ненулевыми коэффициентами лежали в строке с номером h 2, то вектор fh-1(/) = 0 был бы нетривиаль- ной линейной комбинацией элементов нижней строки D (ср. конец доказательства предложения п. 7), а это противоречит линейной независимости элементов D. Значит, нижняя строка D образует базис Lo, так что ее длина равна dim Lo, и потому эта длина оди- накова для всех жордановых базисов. Точно так же длина второй строки не зависит от выбора базиса, так как она равна размер- ности Kerf в Л/Ло в обозначениях предыдущего пункта. Это завер- шает доказательство единственности и теоремы п. 1. 9. Замечания, а) Пусть оператор f представлен матрицей А в некотором базисе, тогда задача приведения А к жордановой форме может быть решена с помощью следующих действий. Вычислить характеристический многочлен А и его корни. Вычислить размеры жордановых клеток, отвечающих корням %. Для этого достаточно вычислить длины строк соответствующих диаграмм, т. е. dim Ker (Л — %), dim Ker (Д — %)2 — dim Ker (Д — %), dim Ker (Д — X)3— dim Ker (Д — %)2, ... Построить жорданову форму J матрицы А и решить матричное уравнение АХ — X] = 0. Пространство решений этой линейной си- стемы уравнений будет, вообще говоря, многомерно, и среди реше- ний будут и вырожденные матрицы. Но по теореме существования обязательно есть невырожденные решения; можно взять любое из них. б) Одно из важных приложений жордановой формы — вычис- ление функций от матриц (пока мы знакомы лишь с полиномиаль- ными функциями). Пусть, скажем, нам нужно знать большую сте- пень AN матрицы Д. Так как степень жордановой матрицы вычис- лить легко (см. § 8, п. 13), экономный способ может состоять в использовании формулы AN = X]NX~\ где А = Х]Х~Х: дело в том, что матрица X вычисляется раз навсегда и не зависит от N. Эту же формулу можно использовать для оценки роста элементов мат- рицы Д". в) В терминах жордановой формы легко вычислить минималь- ный многочлен матрицы Д. В самом деле, ограничимся для про- стоты случаем поля нулевой характеристики. Тогда минимальный многочлен Л(%) равен (f — К)г (см. п. 13 § 8), минимальный мно- гочлен блочной матрицы (Д{ (Л)) равен (/—Л)тах наконец, ми- 66
нимальный многочлен общей жордановой матрицы с диагональ- S ными элементами М, Xs при i=/=j) равен Ц(/ — МЧ /=> где г/ — наибольший размер жордановой клетки, отвечающей X/. 10. Другие нормальные формы. В этом пункте мы вкратце опишем другие нормальные формы матриц, пригодные, в частности, для алгебраически незамкнутых полей. а) Циклические пространства и циклические клетки. Простран- ство L называется циклическим относительно оператора f, если в L существует такой вектор /, также называемый циклическим, что векторы I, f(l)......образуют базис L. Полагая et = i «= 1, ..., п — dim L, имеем (an-i 1 0 ... 0 “"т2.0.1:':0 а0 0 0 ... 0 где а-^Ж однозначно определяются из соотношения fn (/) = П-1 = £ atfl (0- Матрица оператора f в таком базисе называется цик- i = 0 лической клеткой. Наоборот, если матрица оператора f в базисе (еь ..., еп) является циклической клеткой, то вектор I — еп цик- личен, и а = Г~Цеп) (индукция вниз по I). Покажем, что вид циклической клетки, отвечающей f, не зави- сит от выбора исходного циклического вектора. Для этого прове- рим, что первый столбец клетки состоит из коэффициентов миня- и-1 мального многочлена оператора f: M(t) = tn — У, а^1. 1 = 0 В самом деле, M(f) = 0, потому что M(f) [f— [М(/)/] = 0, а векторы f‘(/) порождают L. С другой стороны, если N(t) — многочлен степени <п, то N(f)^=O, потому что иначе, применив оператор N(f) — O к циклическому вектору /, мы получим нетри- виальное линейное соотношение между векторами базиса /, f(J), ... ..., Г-Д/). б) Критерий цикличности пространства. Согласно предыдущим рассмотрениям, если пространство L циклично относительно f, то его размерность п равна степени минимального многочлена опера- тора f и, стало быть, минимальный многочлен совпадает с харак- теристическим. Обратное тоже верно: если операторы id, f, ..., fn~‘ линейно независимы, то существует такой вектор /, что векторы .... f"-1 (I) линейно независимы, так что L циклично. Мы не будем доказывать это утверждение. в) Матрица любого оператора в подходящем базисе может быть приведена к прямой сумме циклических клеток. Доказатель- ство можно провести аналогично доказательству теоремы о жор- дановой форме. Вместо множителей (t — Хгр характеристического многочлена следует рассматривать множители р,(/р> где р,Ц) — неприводимые над полем Ж делители характеристического много- 67
члена. Теорема единственности также имеет место, если ограни- читься случаем, когда минимальные многочлены всех циклических клеток неприводимы. Без этого ограничения она неверна: цикличе- ское пространство может быть прямой суммой двух циклических подпространств, минимальные многочлены которых взаимно просты УПРАЖНЕНИЯ 1. Пусть L — конечномерное пространство дифференцируемых функции ком- плексной переменной «, обладающее тем свойством, что если f е L, то е L. Доказать, что существуют такие комплексные числа М, ..., и целые числа fi, ..., rs 1, что L = ®Lt, где Е,-— пространство функций вида Л*Р(. (х) Pt(x)—произвольный многочлен степени 1. (Указание. Рассмотреть жор- d данов базис для оператора на L и последовательно вычислить вид входя- щих в него функций, начиная с нижней строки его диаграммы.) 2. Пусть у(х)—функция комплексной переменной х, удовлетворяющая диф- ференциальному уравнению вида п—1 dny , V dly п „ d^ + Lat^°-at^c- i-~0 Обозначим через L линейное пространство функций, натянутое на d'yjdx1 для всех i 0. Доказать, что оно конечномерно и оператор dldx переводит его в себя. 3. Пользуясь результатами упражнений 1 и 2, вывести, что у(х) представ- ляется в виде e^ixPl (х), Р, — многочлены. Как связаны числа К/ с видом дифференциального уравнения? 4. Пусть J, (А)—жорданова клетка над С. Доказать, что, как угодно мало изменив ее элементы, можно добиться того, что полученная матрица будет диа- гонализируемой. (Указание. Изменить элементы на диагонали, сделав их по- парно разными.) 5. Перенести результат этого упражнения на произвольные матрицы над С, воспользовавшись тем, что коэффициенты характеристического многочлена не- прерывно зависят от элементов матрицы, а условие отсутствия кратных корней многочлена равносильно тому, что его дискриминант не обращается в нуль. 6. Придать точный смысл следующим утверждениям и доказать их: а) общая 2 X 2-матрица над С диагонализируема. б) общая 2 X 2-матрица с одинаковыми собственными значениями недиаго- нализируема. § 10. Нормированные линейные пространства В этом параграфе изучаются специальные свойства линейных пространств над вещественными и комплексными числами, связан- ные с возможностью определить в них понятие предельного пере- хода и построить начала анализа. Особую роль эти свойства иг- рают в бесконечномерном случае, так что по существу излагае- мый материал является элементарным введением в функциональ- ный анализ. 1. Определение. Пара (E,d), где Е — множество, a d: EXE-*- R — вещественнозначная функция, называется метрическим про- 66
странством, если выполнены следующие условия для всех х, у, г<=Е: а) d(x, у) = d(y, х) (симметрия); б) d(x, х)=0; d(x, //)>(), если х=/=у (положительность); в) d (х, z) d (х, у) + d(у, г) (неравенство треугольника). Функция d с такими свойствами называется метрикой, a d(x,y)— расстоянием между точками х, у. 2. Примеры, а) Е = R или С, d(x, у) = |х — у\. -> -> ( п \1/2 б) Е = R" или С", d (х, //)==( У, | Xi — yi |2) • Это так называе- \i=l / мая естественная метрика. Во второй части мы рассмотрим ее си- стематически и изучим ее обобщения на произвольные основные поля в теории квадратичных форм. Другие метрики: di (х, ~у) = max (|xz — yt |), d2 (х, у)= £ | xz — yt |. i = 1 в) Е = С(а, Ь) — непрерывные функции на отрезке [а,Ь]. Вот три наиболее важные метрики: di(f, g) = max |/(/) —g(OI, b d2(f, g)=[\f(t)-g(t)\dt, a , b sl/2 (Проверьте аксиомы. Для d2 в примере б) и в примере в) нера- венство треугольника будет доказано в следующей части.) г) Е — любое множество, d(x, у)= 1 при х^=у. Это — одна из дискретных метрик на Е. (С каждой метрикой связана некоторая топология на £, и по- следняя описанная метрика индуцирует дискретную топологию.) 3. Шары, ограниченность и полнота. В метрическом простран- стве Е с метрикой d множества В (х0, r)={xf=E\d (х0, х) < г}, В(*о. ^) = {> g E\d (х0, х)< г}, S (х0> г) = {х е Е | d (х0, х) = г} называются соответственно открытым шаром, замкнутым шаром и сферой с центром в точке хо и радиуса г. Не следует связывать с ними интуитивные представления, слишком близкие к трехмер- ным пространственным. Например, в примере г) п. 2 все сферы радиуса г =/= 1 пусты. С9
Подмножество F cz E называется ограниченным, если оно со- держится в некотором шаре (конечного радиуса). Последовательность точек хь х2, ..., хп, ... в Е сходится к точ- ке а е Е, если lim d (хп, а)=0. Последовательность называется фун- п->оо даментальной (или последовательностью Коши), если для всякого е>0 существует N = /V(e), такое, что d(x8 ПрИ Ш, П >2V(e). Метрическое пространство Е называется полным, если любая последовательность Коши в нем сходится. Из полноты R и С, до- казываемой в анализе, следует, что пространства R" и С" с лю- бой из метрик d, dlt d2 примера б) п. 2 полны. 4. Нормированные линейные пространства. Пусть теперь L — линейное пространство над R или С. Особо важную роль играют метрики на L, которые удовлетворяют двум условиям: a) d(h, /2) = d(li -|- 1,12 + /) для любых /, /ь l2 е L (инвариант- ность относительно сдвига); б) d(ah, al2) = | a |d(/i, /2) (умножение на скаляр а увеличи- вает расстояния в | а | раз). Пусть d — такая метрика. Назовем нормой вектора / (относи- тельно d) и будем обозначать через ||/|| число d(l, 0). Из аксиом метрики (п. 2) и условий а), б) вытекают следующие свойства нормы: || 01| = 0, ||/||> 0, если 1^=0; || al || == | а 11| 11| для всех а^.Ж, L\ ||/1 + /21| <11|/] || +1| /21| для всех Ц, /2е Е. Первые два свойства очевидны, третье проверяется так: ||Л 4- /2|| = = d(h + /2, 0) = d(h, -l2) С d(lu 0) + d(0, -/2)M/ill + ll/2l|. Линейное пространство L, снабженное функцией нормы || ||: £->-R, удовлетворяющей перечисленным трем условиям, называет- ся нормированным. Наоборот, по норме восстанавливается метрика: положив d(li, /2)=1|/1 — М, легко проверить аксиомы метрики. Для нее d(l, 0) = ||/||. Полное нормированное линейное пространство называется ба- наховым пространством. Пространства R" и С" с любыми нормами, отвечающими метрикам из п. 2, банаховы. Общее понятие сходимости последовательности в метрическом пространстве, данное в п. 3, специализируется на случай нормиро- ванных линейных пространств и называется сходимостью по нор- -ме. Линейная структура позволяет определить понятие сходимости ряда, более сильное, чем сходимость по норме его частичных сумм. оо Именно, ряд У, I, называется абсолютно сходящимся, если схо- 1=0 оо дится ряд У II II ||. »=! 70
5. Норма и выпуклость. Нетрудно описать все нормы на одно- мерном пространстве L: любые две из них отличаются друг от друга умножением на положительную константу. В самом деле, пусть / <= L — ненулевой вектор, || ||ь || ||2— две нормы. Если IUII1 = с||/||2, то ||п/||1 = | а| HZII1 = с|а|||/||2 = с||п/||2 для всех ас У£. Будем называть кругами (соответственно окружностями) в од- номерном пространстве L шары (соответственно сферы) ненуле- вого радиуса с центром в нуле относительно любой из норм. Как следует из предыдущего рассуждения, множества всех кругов и окружностей в L не зависят от выбора исходной нормы. Вместо задания любой нормы можно указать ее единичный круг В пли единичную окружность S: S восстанавливается по В как граница В, & В восстанавливается по S как множество точек вида {al\l^S, 1}. Заметим, что при Ж = R круги суть отрезки с центром в нуле, а окружности — пары точек, симметричные относительно нуля. Чтобы перенести это описание на пространства любой размер- ности, нам понадобится понятие выпуклости. Подмножество EaL называется выпуклым, если для любых двух векторов /ь 12еЕ и для любого числа 0 а 1 вектор ah -(-(1 — а)12 лежит в Е. Это согласуется с обычным определением выпуклости в R2 и Rs: вместе с любыми двумя точками («концами векторов h и /2») множество Е должно содержать весь соединяющий их отрезок («концы век- торов al\ + (1 — а)/2»). Пусть || ||—некоторая норма на L. Положим В = (/е £| ||/||^ 1}, S ={Ze Л|||/|| — 1}. Ограничение || || на любое линейное под- пространство Lo cz L индуцирует норму на Lo. Отсюда следует, что для любого одномерного подпространства LodL множество L0(\B является кругом в Z.o, а множество Lo f] S — окружностью в смысле данного выше определения. Кроме того, из неравенства треуголь- ника следует, что если /|J2e В, 1, то ||ц/1+(1-а)/2||<а||/1 И + (1 -«)||/2Н<1, т. е. ah + (1 — а)12^В, так что В — выпуклое множество. Справедлива и обратная теорема: 6. Теорема. Пусть Sc L — множество, удовлетворяющее двум условиям: а) Пересечение S f| £0 с любым одномерным подпространством Lo является окружностью. б) Множество В = {«/] | а | 1, I е S) выпукло. Тогда на L существует единственная норма || ||, для которой В является единичным шаром, aS — единичной сферой. Доказательство. Обозначим через || ||: £->-R функцию, которая на каждом одномерном подпространстве Lo является нор- мой с единичной сферой S f) Lo. Ясно, что такая функция суще- ствует и единственна, и нуждается в проверке лишь неравенство треугольника для нее. Пусть h, ||/il| = Nj, ||/2|| = Л^2, M=/=0. Применим условие выпуклости В к векторам Ni'h и УГ*/2еВ. 71
Получим ЛД’/i 4- ЛГ2 W, + N, откуда II Ж + N? /У-Г’/2|«С1, II Z> 4-/2II <^4-^2 = 11Л II4-II/2II. 7. Теорема. Любые две нормы || ||i и || ||2 на конечномерном пространстве L эквивалентны в том смысле, что существуют поло- жительные константы 0 < с с' с условием C||/Il2<l|/Ill<c'l|/Il2 для всех l^L. В частности, топологии, т. е. понятия сходимости, отвечающие любым двум нормам, совпадают, и все конечномер- ные нормированные пространства банаховы. Доказательство. Выберем базис в А и рассмотрим есте- / п ч 1/2 ственную норму || х || — I У, | xt |21 относительно координат в этом базисе. Достаточно проверить, что любая норма || ||] эквивалентна этой. Ее ограничение на единичную сферу нормы || || является непрерывной функцией координат х, принимающей лишь положи- тельные значения (непрерывность следует из неравенства треуголь- ника). Следовательно, эта функция отграничена от нуля констан- той с > 0 и ограничена константой с'>0 по теореме Больцано — Вейерштрасса (единичная сфера S для || || замкнута и ограни- чена). Из неравенства с sj||/||is^ с' для всех I следует неравен- ство с||/||^||/||1^с'||/|| для всех l^L. Поскольку L полно в тополо- гии, отвечающей норме || ||, и понятия сходимости для эквивалент- ных норм совпадают, L полно в любой норме. 8. Норма линейного оператора. Пусть L, М — нормированные линейные пространства над одним и тем же полем R или С. Рассмотрим линейное отображение f: L-*-M. Оно называется ограниченным, если существует такое вещественное число N О, что для всех l^L выполнено неравенство 11/(7) 11=^/V||/|| (левая норма — в М, правая —в L). Обозначим через S'(L,M) множе- ство ограниченных линейных операторов. Для каждого /е S1 (L, М) обозначим через ||/|| нижнюю грань всех N, для кото- рых выполняются неравенства ||/(/)||^ ЛА||/||, /е L. 9. Теорема, a) S'(L, М) является нормированным линейным пространством относительно функции ||/||, которая называется ин- дуцированной нормой. б) Если L конечномерно, то ЗЛ(Ь, М) = S (L, М), т. е. любое линейное отображение ограничено. Доказательство, а) Пусть /, g е S?X(L, М). Если |1/(/)||^ /Vill/ll и ||g(/) || С Л/2||/|| для всех I, то II (/ 4- g) (/) II < (Л/( 4- N2) IIIII, II af (I) || < I a I /V, || 11|. Поэтому f 4- g и af ограничены и, более того, переходя к нижним 72
граням, имеем ll/ + g||<ll/ll + llgll, ||а/1| = | я ||| / ||. Если ||f||=0, то для любого е > 0 ||/(/) ||^ е||/||. Значит, ||/(/)||=0, так что f = 0. в) На единичной сфере в L отображение /•—>||/(/)|| является непрерывной функцией. Так как эта сфера ограничена и замкнута, эта функция ограничена и, более того, верхняя грань ее значений достигается. Поэтому на сфере ||/(/)1КМ так что ||/(/)||< ЛП|/|| для всех / е L. Попутно мы обнаружили, что ||/||= тах{||/(/)||, /е единичная сфера в Z,}. 10. Примеры: а) В конечномерном пространстве L последова- тельность векторов /], ..., In, ... сходится к вектору I тогда и только тогда, когда в некотором (и потому в любом) базисе по- следовательность i-х координат векторов I/ сходится к i-й коорди- нате вектора /, т. е. если f(h).... сходится для любого линейного функционала feL*. Последнее условие можно пере- нести на бесконечномерные пространства, потребовав сходимость f(h) лишь для ограниченных функционалов f. Это приводит, во- обще говоря, к новой топологии на L, называемой слабой топо- логией. б) Пусть L — пространство вещественных дифференцируемых / I \1/2 функций на [0,1] с нормой 11/11 = 1 \ f(tfdt I . Тогда оператор '0 ' 1 I умножения на t ограничен, ибо /2/ (О2 dt < / (/)2 dt, а оператор о о неограничен. В самом деле, для любого целого п 0 функ- ция уЧп+ 11п лежит на единичной сфере, а норма ее производной V2n+ 1 2w _ j- -* ОО при П->ОО. f S 11. Теорема. Пусть L—► Л1—> N — ограниченные линейные отображения нормированных пространств. Тогда их композиция ограничена и Ilgo/IKlIgllll /11- Доказательство. Если II/(/) IK MII/II и llg(m)||< Mdlmll для всех I е L, m е М, то 1|£°/(/)11<лМ/(/)11<ад||/||, откуда, переходя к нижним граням, получаем требуемое утвер- ждение. 73
УПРАЖНЕНИЯ 1. Вычислить нормы на R2, для которых единичными шарами являются множества: а) х2 + У2 1; б) х2 + У2 г2; в) квадрат с вершинами (±1, ±1); г) квадрат с вершинами (0, ±1), (±1, 0). 2. Пусть f (х) 0 — дважды дифференцируемая вещественная функция на [a, b] cz R и Доказать, что множество {(х, у) |п^х^Ь, 0^y^f(x)}c с: R2 выпуклое. 3. Пользуясь результатом упражнения 2, доказать, что множество |х|₽ + |</|₽ I для р> 1 в R2 является единичным шаром для некоторой нормы. Вычислив эту норму, доказать неравенство Минковского: (IX, + У,1Р + | х2 + у2 \РУ‘Р < (| X, |р + I х2 |р)’'₽ + (| у, |р + | у2 |Р)‘/Р. 4. Обобщить результаты упражнения 3 на случай R". 5. Пусть В — единичный шар некоторой нормы в L,B* — единичный шар ин- дуцированной нормы в L* = S'iL, X), X — R или С. Дать явное описание В* и вычислить В* для норм из упражнений 1 и 3. § 11. Функции линейных операторов 1. В § 8 и 9 мы определили операторы Q(f), где f: L-+L — линейный оператор, a Q — любой многочлен с коэффициентами из основного поля Ж. Если Ж — R или С, пространство L нормиро- вано, а оператор f ограничен, то Q(f) можно определить для более общего класса функций Q с помощью предельного перехода. Мы ограничимся рассмотрением голоморфных функций Q, за- даваемых степенными рядами с ненулевым радиусом сходимости: со оо Q(t)=Ylaiti. Положим если этот ряд из опера- "о г=о оо торов абсолютно сходится, т. е. если сходится ряд У, f‘ ||. (Вслу- £-0 чае dimL<oo, которым мы в основном будем заниматься здесь, L) = S? (L, L), и пространство всех операторов конечномер- но и банахово; см. § 10, утверждение б) теоремы п. 9.) 2. Примеры, а) Пусть f — нильпотентный оператор. Тогда II/7II = 0 для достаточно больших i, и ряд Q(f) всегда абсолютно сходится. На самом деле он совпадает с одной из своих частичных сумм. оо б) Пусть || f || < 1. Ряд У fl абсолютно сходится и i=.U ОО / ОО X (id-f)Efi = [g)fj(id-f)=id. Действительно, N / N \ (id - f) £ fl = id - f = X fl ) (id - f) i-o \<-o / 74
и переход к пределу при N <х дает требуемое. В частности, еспи llfll< 1, то оператор id — f обратим. в) Назовем экспонентой ограниченного оператора f оператор со Так как ||f"|| ||f||" (см. теорему п. 11 § 10) и числовой ряд для экспоненты равномерно сходится на любом ограниченном множе- стве, функция exp(f) определена для любого ограниченного опера- тора f и непрерывна по f. Например, ряд Тейлора ^-^у-ф(й(^)дЛЯ значения ф(/ -|- А/) можно формально записать в виде ехр <р. Чтобы эта запись приобрела точный смысл, нужно, конечно, выбрать про- странство бесконечно дифференцируемых функций ф с нормой и проверить сходимость в индуцированной норме. Частный случай: exp (a id) — e°id (а — скаляр);exp(diag(ab ... ..., a„)) = diag(expa1, ..., expan). Основное свойство числовой экспоненты: еаеь = еа+ь, вообще го- воря, нарушается для экспоненты операторов. Однако есть важный частный случай, когда оно выполнено: 3. Теорема. Если операторы f,g-. L~^L коммутируют, т. е. fg = gf, то (exp f) (expg) = exp(f + g). Доказательство. Применяя формулу бинома Ньютона и пользуясь возможностью переставлять члены абсолютно сходя- щегося ряда, получаем (expf)(expg)=/'^-JrfiWX4-H== X = / \fc>0 / i. tn tn - X ЁтгёДог Tt~-‘ = z i X - m>0 i=0 i=0 = £ + g)m = exp(f + g}. Коммутативность fug используется в том месте, где (f + g)m разлагается по биному. 4. Следствие. Пусть f: L->L — ограниченный оператор. Тогда отображение L): является гомоморфизмом группы R в подгруппу обратимых операторов 3?l(L,L) по умно- жению. Множество операторов {exp tf 11 е R} называется однопарамет- рической подгруппой операторов. 5. Спектр. Пусть f— некоторый оператор в конечномерном пространстве, Q(t) — такой степенной ряд, что Q(f) абсолютно схо- 75
дится. Нетрудно видеть, что если Q(t)—многочлен, то в жорда- новом базисе j матрица Q(f) является верхней треугольной, и на ее диагонали стоят числа Q(M, где %,- — собственные значения f. Применив это соображение к частичным суммам Q и перейдя к пределу, получим, что это же верно для любого ряда Q(Z). В ча- стности, если S(f) — спектр f, то S(Q(f)) = Q(S(f)) = {Q(A) |Ze eS(f)}. Более того, если учитывать характеристические корни Л,- с их кратностью, то Q(S(f)) будет спектром Q(f) с правиль- ными кратностями. В частности, det (exp f) = П exp К{ = exp ( £ м) = exp Tr f. i = l \i-l / Переходя на язык матриц, мы отметим еще два простых свой- ства, которые доказываются таким же образом: a) Q(A') = Q(A)'; б) <2(Д) = <2(Д), где черта означает комплексное сопряжение; здесь предполагается, что ряд Q имеет вещественные коэффи- циенты. Пользуясь этими свойствами и обозначениями § 4, докажем следующую теорему, относящуюся к теории классических групп Ли (здесь Ж — R или С). 6. Теорема. Отображение ехр переводит gl(n, Ж), si (и, Ж), о(п,Ж), u(n), su(n) в СЦп,Ж), $>Цп,Ж), $О(п,Ж), U(n), SU(n) соответственно. Доказательство. Пространство gl(n, Ж} переходит в GL(n,Ж}, ибо согласно следствию п. 4 матрицы ехрА обратимы. Если Тг А — 0, то det ехр А = 1, как было доказано в предыдущем пункте. Из условия Аф-А' = 0 следует, что (ехр А) (ехр А)'= 1, а из условия А 4- Д' — 0 следует, что ехр А (ехр Л)' = 1. Это завер- шает доказательство. 7. Замечание. Во всех случаях образ ехр покрывает некоторую окрестность единицы соответствующей группы. Для доказатель- ства можно определить логарифм операторов f с условием ||f — id||< 1 обычной формулой log f = (— 1)" и по- О казать, что f — ехр (log f). Однако в целом отображения ехр, вообще говоря, не сюръек- тивны. Например, не существует матрицы А е si (2, С), для кото- рой ехр А = ( q _J ) е SL (2, С). В самом деле, А не может быть диагонализируемой, иначе ехр А была бы диагонализируемой. Зна- чит, собственные значения А совпадают, а так как след А равен нулю, эти собственные значения должны быть нулевыми. Но тогда собственные значения ехр А равны 1, тогда как собственные зна- чения равны — 1. 76
§12. Комплексификация и овеществление 1. В § 8 и 9 мы убедились, что работа над алгебраически замк- нутым полем проясняет геометрическую структуру линейных опе- раторов и дает удобную каноническую форму матриц. Поэтому, даже работая с вещественным полем, удобно иногда пользоваться комплексными числами. В этом параграфе будут изучены две основные операции: увеличения и уменьшения поля скаляров в применении к линейным пространствам и линейным отображениям. Мы уделим больше всего внимания переходу от R к С (комплек- сификация) и от С к R (овеществление) и кратко коснемся более общего случая. 2. Овеществление. Пусть L — линейное пространство над С. Забудем про возможность умножать векторы из L на все комп- лексные числа и оставим лишь умножение на R. Очевидно, мы получим линейное пространство над R, которое будем обозначать Lr и называть овеществлением L. Пусть L, М — два линейных пространства над С, f: L->M — линейное отображение. Очевидно, рассмотренное как отображение £к->Л'1к,оно остается линейным. Мы будем обозначать его fR и называть овеществлением f. Ясно, что idR = id, (fg)v = fKg„', (af+ + bg\ = afR + bgn, если a, b e= R. 3. Теорема, а) Пусть {<?i, ..., em}—базис пространства L над С. Тогда {еь ..., е,п, 1в\, iem} является базисом пространства LK над R. В частности, dimR Lv = 2 dimc L. б) Пусть А = В + iC — матрица линейного отображения f: L-^M в базисах {ev ..., и [е{, ..., е'} над С, где В, С—ве- щественные матрицы. Тогда матрицей линейного отображения Lr^Mr в базисах {е,........em, ie{......iem), {e[, .... е', iet...ie'n} бУдет (?"«)• Доказательство, а) Для любого элемента leL имеем m tn mm l— 52 akek = 52 (bk + ick) ek — bkek + 52 ck (MJ, k=\ Ь| Ы где bk, ck — вещественная и мнимая части ak. Поэтому {ek,iek} по- m m рождают Lr. Если 52 b/fik + 52 ck (MJ = 0, где bk. cfeeR, to fe=l fe=l bk + iCk = 0 в силу линейной независимости {щ, ..., ek) над С. откуда следует, что bk = с* — 0 для всех k. б) Согласно определению А, имеем Щ.......«,.)=(<........<)(В + <С). откуда, в силу линейности f над С, f • • •» iem) = «.•••> <) (- С + iВ). 77
Поэтому (Ке1).... ==(^> •-•> en, iev ...» *em)(c jg)’ что завершает доказательство. Следствие. Пусть f: L->L— линейный оператор на конечно- мерном комплексном пространстве L. Тогда det f R = | detf |2. Доказательство. Пусть f представлен матрицей В -|- iC (В, С вещественны) в базисе {еь ..., ет}. Тогда, применяя эле- ментарные преобразования (прямо в блочной структуре) сначала к строкам, потом к столбцам, находим: . , f , ,( В —С\ , .CB + iC—C+iBx detfR = det(c B) = det( / ) = = det ( R £iC в\с) = det (fi + iC) det (B - iC) = = det f det f — | det f |2. 4. Спуск поля скаляров: общая ситуация. Довольно очевидно, как обобщаются определения п. 2. Пусть К — некоторое поле, — его подполе, L — линейное пространство над К. Забыв про умножение векторов на все элементы поля К и оставив лишь умножение на элементы Ж, мы получим линейное пространство Ду над Ж. Аналогично, линейное отображение f: L-+M над К пре- вращается в линейное отображение fx: ,LX-+ Мх. Одно из назва- ний этих операций — спуск поля скаляров (от К до Ж). Ясно, что id« (fg)х fXSX’ "Ь &fx + если a, b ее Ж. Само поле К можно также рассматривать как линейное простран- ство над Ж. Если оно конечномерно, то размерности dimK L и 'dimxLx связаны формулой dimjf Lx — dim^r К dimj< L. Для доказательства достаточно проверить, что если {ei, ..., еп} — базис L над К, a {blt ..., bm}—базис К над Ж, то {&iet, ... ..., b{en, ...; bmei, bmen} образуют базис Lx над Ж. 5. Комплексная структура на вещественном линейном прост- ранстве. Пусть L — комплексное линейное пространство, Lr — его овеществление. Чтобы полностью восстановить умножение на ком- плексные числа в Lr, достаточно знать оператор /: Lr->Ar ум- ножения на i: J (/)—//. Очевидно, этот оператор линеен над R и удовлетворяет условию Д = —id; если мы знаем его, то для лю- бого комплексного числа а bi, a, 6eR, имеем (а + Ы) I = al Ц- Ы (Z). Это соображение приводит к следующему важному понятию: 6. Определение. Пусть L — вещественное пространство. Комп- лексной структурой на L называется задание линейного оператора J: L-+L, удовлетворяющего условию J2 — —id. 178
Описанная выше комплексная структура на £R называется ка- нонической. Это определение оправдывается следующей теоремой: 7. Теорема. Пусть (L,J)— вещественное линейное пространство с комплексной структурой. Введем на L операцию умножения на комплексные числа из С по формуле (а + bi) l = al -\-Ь1 (/). Тогда L превратится в комплексное линейное пространство L, для которого LK = L. Доказательство. Обе аксиомы дистрибутивности легко проверяются, исходя из линейности J и формул сложения комп- лексных чисел. Проверим аксиому ассоциативности умножения: (а Д- Ы) [(с -ф di) Z] = (а + bi) [cl + dJ (/)] = a[cl + di (/)] -(- -(- bJ [cl + dJ (/)] = acl + adj (/) Д- be J (I) — bdl — — (ac — bd) I -f- (ad -}- be) J (I) =• [ac — bd-\- (ad Д- be) z] I = — [(a + bi) (c 4- di)] I. Все остальные аксиомы выполнены по той причине, что L и £ совпадают как аддитивные группы. 8. Следствие. Если (L,'J)—конечномерное вещественное про- странство с комплексной структурой, то dimR£ = 2n четна, и мат- рица J в подходящем базисе имеет вид /О — Еп\ \Еп 0 ) ' Доказательство. Действительно, dimRL = 2dimcL в силу теоремы п. 7 и утверждения а) теоремы п. 3 (конечномерность £ следует из того, что любой базис £ над R порождает £ над С). Далее, выберем базис {еь ..., еп} пространства £ над С. Матрица умножения на i в этом базисе равна iEn. Поэтому матрица опе- ратора J в базисе {еь ..., ie\........ien) пространства £ имеет требуемый вид в силу утверждения б) теоремы п. 3. 9. Замечания, а) Пусть £ — комплексное пространство, g: — вещественно линейное отображение. Поставим во- прос, когда существует такое комплексно линейное отображение f: L-+L, что g = fK- Очевидно, для этого необходимо, чтобы g коммутировал с оператором J естественной комплексной структуры na£R, ибо g(H) = g(Jl)— ig(T) = Jg(l) для всех l^L. Это усло- вие является также достаточным, потому что из него автомати- чески следует линейность g над С: g ((а + bi) I) = ag (I) + bg (il) = ag (I) + bgj (I) = = ag (I) + bJg (I) = (a + bl) g (I) = (a + bi) g (I). б) Пусть теперь £ — четномерное вещественное пространство, f: £->£— вещественно линейный оператор. Поставим вопрос, когда на £ существует такая комплексная структура J, что f являет я 73
овеществлением комплексно линейного отображения g: где L — комплексное пространство, построенное с помощью J. Вот частичный ответ, относящийся к случаю dimRL — 2: такая струк- тура существует, если f не имеет собственных векторов в L. В самом деле, тогда f имеет два комплексно сопряженных соб- ственных значения 1±щ, ><, р=/=0. Положим J = p-*(f—• — Xid). По теореме Гамильтона—Кэли, f2— 2Xf + (X2 + р2) id — О, откуда J2 = и-2 цг _ 2Kf Х2 id) = _ id Кроме того, / коммутирует с f. Это завершает доказательство. 10. Комплексификация. Теперь мы фиксируем вещественное линейное пространство L и введем комплексную структуру J на внешней прямой сумме L Ф L, определив ее формулой J Gi> О~(—^2» Л)- Ясно, что J2 ——1. Назовем комплексификацией пространства L комплексное пространство L ф L, связанное с этой структурой. Мы будем обозначать его Lc. Другие стандартные обозначения: С®£ R или С © L; их происхождение станет ясно после ознакомления с тензорными произведениями линейных пространств. Отождествив L с подмножеством векторов вида (1,0) в L® L и пользуясь тем, что i(l, 0) = 1(1,0) = (0, /), мы можем записать любой вектор из Lc в виде (/„ У = (6. 0) + (0, 12) = (Z1; 0) + i(12, ()) = /,+ il2. Иными словами, Lc= L Ф iL, последняя сумма является прямой над R, но не над С! Любой базис L над R будет базисом Lc над С, так что dimR L— — dimc£c. Пусть теперь f: L->M — линейное отображение линейных про- странств над R. Тогда отображение fc (или f ® С): Lc-+Mc, определенное формулой Г (6. /8) = (Ш /(/2)). линейно над R и перестановочно с J, ибо fHlo li) = (-f(l2), f(li)) = If(li, l2). Следовательно, оно комплексно линейно. Оно называется комплек сификацией отображения f. Очевидно, idc=id, (af-\-bg)c = =nfc -4- bgc-, a,b<= R; и (fg)c = fcgc- Рассматривая пару базисов L и M как базисы Lc и Мс соответственно, убеждаемся, что мат- рица отображения f в исходной паре базисов совпадает с матри- цей отображения fc в этой «новой» паре. В частности, (комплекс- ные) собственные значения отображений f и fc и их жордановы формы совпадают. Проследим теперь, что происходит при композиции операций овеществления и комплексификации в двух возможных порядках 80
11. Сначала комплексификация, затем овеществление. Пусть L — вещественное пространство. Мы утверждаем, что существует естественный изоморфизм {L%-+L®L. Действительно, по конструкции Lc совпадает с L ф L как веще- ственное пространство. Аналогично, (в смысле этого отождествления) для любого вещественного линейного отображе- ния f: L-+-M. Композиция в обратном порядке приводит к несколько менее очевидному ответу. Введем следующее определение. 12. Определение. Пусть L — комплексное пространство. Сопря- женным комплексным пространством L называется множество L с той же структурой аддитивной группы, но с новым умножением на скаляры из С, которое мы временно обозначим а*1: a*l — al для любых а е С, / е L. Аксиомы проверяются без труда, если воспользоваться тем, что ab = аЪ и а + b = а + Ь. Аналогично, если (L,J) — вещественное пространство с комп- лексной структурой, оператор — J также определяет комплексную структуру, которая называется сопряженной с исходной. В обозна- чениях теоремы п. 7, если L — комплексное пространство, отвечаю- щее (L, J), то L—комплексное пространство, отвечающее 13. Сначала овеществление, потом комплексификация. Теперь мы можем для всякого комплексного линейного пространства L построить канонический комплексно линейный изоморфизм f: (£R)^£©L С этой целью заметим, что на (£и)с имеются два вещественно линейных оператора: оператор канонической комплексной струк- туры J(/i,/2) = (—к,1\) и оператор умножения на i, отвечающий исходной комплексной структуре L: k) = (ill, th) Так как J коммутирует с I, он комплексно линеен в этой структуре. По- скольку J2 = —id, его собственные значения равны +i. Введем стандартные обозначения для двух подпространств, отвечающих этим собственным значениям: £>• ° = {(G, l2) е= (Lr)c | J (/,. /2) = i (/„ l2)}, L°-1 = {(/„ /2) e= (Lr)c IJ (/., l2) = - i (/„ l2)}. Оба множества А1-0 и L0-1 являются комплексными подпростран- ствами в (Lr)c: ясно, что они замкнуты относительно сложения и умножения на вещественные числа, а замкнутость относительно умножения на J следует из того, что J и i коммутируют. Покажем, что /.• = L1-0® L°- ’, а также, что L' ® естественно изоморфно L, тогда как L°-1 естественно изоморфно L. 81
Из определений сразу же следует, что L1-0 состоит из векторов вида (/, — II), a Z+1— из векторов вида (т, im). Для данных l\, уравнение (Zi, Z2) = (/, —il) + (m, im) на I, т имеет един- ственное решение I — Z| m = Z1 2 ll1 Следовательно, L = = L1’°GL0’1. Отображения £->/? °: />—>(/,—il) и lt—>(l,U) являются вещественно линейными изоморфизмами. Кроме того, они перестановочны с действием i на L, L и действием J на £!, °, £0,1 в СИЛу определений. Это завершает нашу конструкцию. 14. Полулинейные отображения комплексных пространств. Пусть L, М — комплексные линейные пространства. Полулинейным (или антилинейным) отображением f: L-+-M называется линей- ное отображение f: L-+M. Иными словами, f — гомоморфизм ад- дитивных групп, и f(al) = af(l) для всех a g С, / е L. Особая роль полулинейных отображений станет ясна во второй части, при изучении эрмитовых комплекс- ных пространств. 15. Подъем поля скаляров: общая ситуация. Пусть, как в п. 4, К — некоторое поле, Ж— его подполе. Тогда для любого линей- ного пространства L над Ж можно определить линейное простран- ство K®L, или LK, над К, сохранив размерность. До введения ж |аг е К?, т. е. языка тензорных произведений дать общее определение LK затруд- нительно, но для практических целей достаточно следующего по- луфабриката: если {ci....еп} — базис L над Ж, то LK состоит из всех формальных линейных комбинаций | по- имеет тот же базис над Л. В частности, (Жп)к — Кп. По ^-линей- ному отображению f: L->A4 определяется К-линейное отображе- ние LK-^MK: если f задано матрицей в некоторых базисах L и М, то fK задается той же матрицей. В заключение укажем одно приложение комплексификации: 16. Предложение. Пусть [: L-+-L — линейный оператор в веще- ственном пространстве размерности ^1. Тогда f имеет инвариант- ное подпространство размерности 1 или 2. Доказательство. Если f имеет вещественное собственное значение, то подпространство, натянутое на соответствующий соб- ственный вектор, инвариантно. В противном случае все собствен- ные значения комплексны. Выберем одно из них X -|- ip. Оно будет также собственным значением fc в Lc. Возьмем соответствующий собственный вектор /1 + 1/2 в Lc, /ь (2gL. Согласно определениям fc (/1 + ih) = f (Л) + if (У = (* +/р) (Zi + il2) = (М - р/2) + i (р/! + М2). Следовательно, f(/i) = Mi— р/2, f(lz) = p/i + W2, и линейная обо- лочка {/i, /2} в L /-инвариантна. 82
§ 13. Язык категорий 1. Определение категории. Категория С состоит из следующих данных: а) Класс (или множество) Ob С, элементы которого назы- ваются объектами категории. б) Класс (или множество) Mor С, элементы которого назы- ваются морфизмами категории, или стрелками. в) Для каждой упорядоченной пары объектов X, У е Ob С за- дано множество Homc (X, У) cz Mor С, элементы которого назы- ваются морфизмами из X в У и обозначаются Х->У или f: Х->¥ V f V или X —► У. г) Для каждой упорядоченной тройки объектов X, У, Z е Ob С задано отображение Homc (X, У) X Нотс (У, Z) -> Нотс (X, Z), сопоставляющее паре морфизмов (f, g) морфизм gf, или g of, на- зываемый их композицией, или произведением. Эти данные должны удовлетворять следующим условиям: д) Mor С есть несвязное объединение (j Homc (X, У) по всем упорядоченным парам X, У е Ob С. Иными словами, для каждого морфизма f однозначно определены объекты X, У такие, что f е Hom С (X, У): начало X и конец У стрелки f. е) Композиция морфизмов ассоциативна. ж) Для каждого объекта X существует тождественный мор- физм idxeHomc(X, X) такой, что id* ° f = f ° idx = / всякий раз, когда эти композиции определены. Нетрудно видеть, что такой морфизм единствен: если idx— другой морфизм с тем же свой- ством, то id^ = id^o idx = idx. Морфизм f: Х->У называется изоморфизмом, если существует такой морфизм g: У->Х, что gf = idx, fg — idy. 2. Примеры, а) Категория множеств Set. Ее объекты — множе- ства, морфизмы — отображения множеств. б) Категория Sfinw линейных пространств над полем Ж. Ее объекты — линейные пространства, морфизмы — линейные отобра- жения. в) Категория групп. г) Категория абелевых групп. Различия между классом и множеством обсуждаются в аксио- матической теории множеств и связаны с необходимостью избе- жать знаменитого парадокса Рассела. Не всякое собирание объ- ектов воедино образует множество, ибо понятие «множество всех множеств, не содержащих самих себя в качестве элемента», про- тиворечиво. В аксиоматике Гёделя — Бернайса такие собрания множеств называются классами. Техника теорий категорий тре- бует собираний объектов, лежащих в опасной близости к таким парадоксальным ситуациям. Мы, однако, будем пренебрегать этими тонкостями. 83
3. Диаграммы. Поскольку в аксиоматике категорий ничего не говорится о теоретико-множественной структуре объектов, мы не можем в общем случае работать с «элементами» этих объектов. Все основные общекатегорные конструкции и их приложения к конкретным категориям формулируются преимущественно в тер- минах морфизмов и их композиции. Удобный язык для таких фор- мулировок— это язык диаграмм. Например, вместо того чтобы го- ворить, что у нас имеются четыре объекта X, Y, U, V, четыре мор- физма fe Homc(X, У), g е Homc(У, V), h е Homc(X, U) и (!eHomc(6f, V), причем gf = dh, говорят, что задан коммутатив- ный квадрат «Коммутативность» здесь — это равенство gf = dh, которое озна- чает, что «два пути вдоль стрелок» от X к V приводят к одному и тому же результату. Более общо, диаграмма — это ориентиро- ванный граф, вершины которого являются объектами С, а ребра — морфизмами, например X----*-Y--- U-----V----э-W Диаграмма называется коммутативной, если любые пути вдоль стрелок в ней с общими началом и концом отвечают одинаковым морфизмам. В категории линейных пространств, а также в категории абе- левых групп особенно важен класс диаграмм, называемых комп- лексами. Комплекс имеет вид последовательности объектов и стре- лок ... X-+Y->U-+V .... конечной или бесконечной, которая удовлетворяет следующему условию: композиция любых двух соседних стрелок является ну- левым морфизмом. Заметим, что понятие нулевого морфизма не является общекатегорным: оно специфично для линейных про- странств и абелевых групп и для специального класса категорий — так называемых аддитивных категорий. Часто объекты, входящие в комплекс, и морфизмы нумеруются некоторым отрезком целых чисел: f—l ^0 *1 ^2 84
Такой комплекс линейных пространств (или абелевых групп) на- зывается точным в члене Xi, если Im f,_i = Ker f, (заметим, что в определении, комплекса условие Д- ° Д_] — 0 означает только, что Im ft-i cz Ker fi). Комплекс, точный во всех членах, называется точ- ным, или ацикличным, пли точной последовательностью. Вот три простейших примера: а) Последовательность 0-*£—>Л1 всегда является комплек- сом; она точна в члене L тогда и только тогда, когда Ker i — образ нулевого пространства 0. Иными словами, точность здесь озна- чает, что i— инъекция. б) Последовательность Л-1 —N -> 0 всегда является комплек- сом; точность его в члене М означает, что Im j — N, т. е. что j — сюръекция. в) Комплекс 0->L —+ М—> N—> Оточен, если i — инъекция, / — сюръекция и Imi = Kerj. Отождествив L с образом i — под- пространством в М, мы можем поэтому отождествить У с фак- торпространством М/L, так что такие «точные тройки» являются категорными представителями троек (Lcz М, M/L). 4. Естественные конструкции и функторы. В математике весьма важны конструкции, которые можно применять к объектам неко- торой категории так, что при этом снова получаются объекты категории (другой или той же самой). Если эти конструкции яв- ляются однозначными (не зависят от произвольных выборов) и универсально применимыми, то часто оказывается, что они пере- носятся и на морфизмы. Аксиоматизация ряда примеров привела к важному понятию функтора, впрочем, естественному и с чисто категорной точки зрения 5. Определение функтора. Пусть С, D — две категории. Функ- тором F из категории С в категорию D называется задание двух отображений (обычно обозначаемых также F): ОЬС->ОЬО, Мог СМог D, которые удовлетворяют следующим условиям: а) если feHomc(X, У), то F(f)e HomD(77(X), Е(У)); б) F(gf) = F(g)F(f) всякий раз, когда композиция gf опреде- лена,'и F(idx) = idf(X) для всех X е Ob С. Функторы, которые мы определили, часто называют ковариант- ными функторами. Определяют также контравариантные функ- торы, «обращающие стрелки»: для них условия а) и б) заме- няются условиями а') если f€=Homc(X, Y), то F(f) <= Ното(Е(У), Е(Х)); б') F(gf)=F(f)F(g) и F(i<M=idpW. Можно избежать этого различения, если ввести конструкцию, ста- вящую в соответствие каждой категории С дуальную категорию С° по правилу: ОЬС = ОЬС°, Мог С = Мог С° и Нотс(Х, У) = =Нотс° (У, X), причем композиция gf морфизмов в С отвечает композиции fg этих же морфизмов в С°, взятых в обратном по- рядке. Удобно обозначать через X®, f° объекты и морфизмы в С°, отвечающие объектам и морфизмам X, f в С. Тогда коммутативная 85
диаграмма в С отвечает коммутативной диаграмме в С° z (Ковариантный) функтор F: C-+D° можно отождествить с кон- травариантным функтором F: C-+D в смысле данного выше опре- деления. 6. Примеры, а) Пусть Ж— поле, Zinx — категория линей- ных пространств над Ж, Set — категория множеств. В § 1 мы объ- яснили, как любому множеству S е Ob Set поставить в соответ- ствие линейное пространство F (S) е Ob Z'.n функций на S со значениями в Ж. Поскольку это естественная конструкция, сле- дует ожидать, что она может быть продолжена до функтора. Так оно и есть. Функтор оказывается контравариантным: морфизму f: S->T он ставит в соответствие линейное отображение F(f): F (Т)-> F(S), чаще обозначаемое f* и называемое подъемом, или обратным образом, на функциях: Г(ф) = Ф°Л где f: S->T, <р: Т^Ж. Иными словами, /*(<р)—это функция на S, значения которой по- стоянны вдоль «слоев» отображения f и равны <p(t) на та- ком слое. Хорошее упражнение для читателя — проверить, что мы действительно построили функтор. б) Отображение двойственности: Zlnx Zinx, на объектах задаваемое формулой L i—> L* = Z (L, Ж), а на морфизмах — формулой f*—*f*, является контравариантным функтором из кате- гории Zinx в себя. По существу, это доказано в § 7. в) Операции комплексификации и овеществления, изученные в § 12, определяют функторы ZinK~> Zitic и Zinc -> Zinv со- ответственно. То же относится к более общим конструкциям подъема и спуска поля скаляров, кратко описанным в § 12. г) Для любой категории С и любого объекта X е Ob С опре- делены два функтора из С в категорию множеств: ковариантный hx‘. C->Set и контравариантный hx: C->Set°. Вот их определения: йх(У) = Нотс(Х, У), hY(f: Y-+Z) есть отображение hx(Y) = Homc(X, Y)-+hx(Z) = Homc(X, Z), которое ставит в соответствие морфизму X -> У его композицию с морфиз- мом f: Y-+Z. 86
Аналогично, hx{ У) — Homc( У, X) и hx (f: Y-+Z) есть отобра- жение hx(Z) = Homc(Z, X)-*-hx(Y) = Нотс(У, X), которое ставит в соответствие морфизму Z->-X его композицию с морфизмом f: Y-+Z. Проверьте, что hx и hx действительно являются функторами. Их называют функторами, представляющими объект X категории. Заметим, что если С — 2?inx, то hx и hx можно считать функ- торами со значениями также в -£игж, а не в Set. f о 7. Композиция функторов. Если С\ —*• С2 —* С3 — три катего- рии и два функтора между ними, то композиция GF: С1->С3 опре- деляется как теоретико-множественная композиция отображений на объектах и морфизмах. Тривиально проверяется, что она яв- ляется функтором. Можно ввести «категорию категорий», объектами которой яв- ляются категории, а морфизмами — функторы! Более важной, однако, является следующая ступень этой вы- сокой лестницы абстракций: категория функторов. Мы ограни- чимся объяснением, что такое морфизмы функторов. 8. Естественные преобразования естественных конструкций, или функторные морфизмы. Пусть F, G: C-+D — два функтора с об- щими началом и концом. Функторным морфизмом <р: F-+G назы- вается класс морфизмов объектов <р(X): Ё(Х)->- G(X) в категории D, по одному для каждого объекта X категории С, обладающий тем свойством, что для каждого морфизма f: Х->У в категории С квадрат ГДО УG(X) F(f) G(f) F(Y) —------* G(Y) коммутативен. Функторный морфизм называется изоморфизмом, если все ср (X) суть изоморфизмы. 9. Пример. Пусть 9?lnx-+ Sinx — функтор «двойного со- пряжения»: £*—»£**, ft—»/**. В § 7 мы построили для каждого линейного пространства L каноническое линейное отображение bl: Li—>L**. Оно определяет функторный морфизм ем: где Id — тождественный функтор на ЗЧпж, ставящий в соответствие каждому линейному пространству само это пространство и каж- дому линейному отображению — само это отображение. Действи- тельно, согласно определению, мы должны проверить коммута- тивность всевозможных квадратов вида М--— 87
Для конечномерных пространств L, М это устанавливается с по- мощью утверждения д) теоремы п. 5 § 7. Проверку в общем слу- чае предоставляем читателю. УПРАЖНЕНИЯ 1. Пусть Seto — категория, объектами которой являются множества, а мор- физмами — такие отображения множеств f: S->T, что для любой точки 1еТ слой 7-,(0 конечен. Показать, что следующие данные определяют ковариантный функтор Fo- Set0~> Z'inx' a) Fo(S)= E(S): функции на S со значениями в Ж\ б) для любого морфизма f: S-t-T и функции <р: функция Ео(7)(ч>) = = /♦(<₽) ^FIT) определяется так: 7, (<Р) (О = Е Ф («) sef-1 (О («интегрирование по слоям»), 2. Доказать, что спуск поля скаляров с К до Ж (см. § 12) определяет функ- тор Z § 14. Категорные свойства линейных пространств 1. В этом параграфе собраны некоторые утверждения о кате- гории всех линейных пространств Zinx или конечномерных ли- нейных пространств Zinfx над данным полем Ж. По большей части они являются переформулировкой на категорном языке утверждений, которые мы уже доказали раньше. Их выбор обу- словлен следующим своеобразным критерием: это как раз те свой- ства категории Zinx, которые нарушаются для таких наиболее близких категорий, как категория модулей над общими кольцами (например, над Z, т. е. категория абелевых групп) или даже ка- тегория бесконечномерных топологических пространств. Деталь- ное изучение этих нарушений для категории модулей составляет основной предмет гомологической алгебры, а в функциональном анализе часто приводит к поиску новы-х определений, которые позволяют восстановить «хорошие» свойства Zinfx (таково поня- тие ядерных топологических пространств). 2. Теорема о продолжении отображений. а) Пусть Р, М, N — линейные пространства, Р конечномерно, j: M-+N— сюръективное линейное отображение. Тогда любое ли- нейное отображение g: P-+N можно поднять до такого линейного отображения h: Р-+М, что g — jh. Иными словами, диаграмму с точной строкой Р g- М—----------э- о 88
можно вложить в коммутативную диаграмму б) Пусть Р, L, М — линейные пространства, М конечномерно, i: L-^M — инъективное линейное отображение. Тогда любое ли- нейное отображение g: L->-P можно продолжить до линейного отображения h: М-> Р так, что g = hi. Иными словами, диаграмму с точной нижней строкой Р в I лг*--z*------о можно вложить в коммутативную диаграмму Доказательство, а) Выберем базис {eit еп} в Р, по- ложим е' = g (ez) е N. В силу сюръективности j существуют век- торы е" е М такие, что /(ez') = ez, t=l, ...,п. По предложению п. 3 § 3, существует единственное линейное отображение /г: Р-^М такое, что h (ez) ==е", i — 1, •.., п. По конструкции jh (ez) = j (е")== = ez = g(e(). Так как {е,} образуют базис Р, имеем jh — g. б) Выберем базис ..., е'т) пространства L и продолжим еА“г(ел)> Д° базиса {е1.е,п‘, ет+\, ..., еп} про- странства М. Положим h (ег) = g (ez) при 1 iт, h(ej)= 0 при 1 Такое отображение существует по тому же пред- ложению п. 3 § 3. Можно также прямо применить предложение п. 8 § 6. Теорема доказана. В категории модулей объекты Р, удовлетворяющие условию а) теоремы (при всех М, N). называются проективными, а объекты, удовлетворяющие условию б), — инъективными. Мы доказали, что в категории конечномерных линейных пространств все объекты проективны и инъективны. 3. Теорема о точности функтора S. Пусть 0-+L —> М —> N -> —►О—точная тройка конечномерных линейных пространств, Р — любое конечномерное пространство над тем же полем. Тогда S 89
как функтор отдельно по первому и второму аргументу индуци- рует точные тройки линейных пространств: а) 0^3?(Р, L)-^£(P, М)-^&(Р, М)->0, ^2 /о б) 0<-3?(L, Р)+?-£(М, P)*—g(N, P)<—Q. Доказательство, а) Напомним (см. пример г) п. 6 § 13), что /1 ставит в соответствие морфизму Р -> L его композицию с t: L-+M, a j\ ставит в соответствие морфизму Р^-М его ком- позицию с /: M-hN. Отображение ц инъективно, потому что i— инъекция, так что если композиция P-+L—> М нулевая, то P-hL— нулевой морфизм. Отображение ji сюръективно в силу утверждения а) теоремы п. 2: любой морфизм g: P-hN можно поднять до морфизма Р-нМ, композиция которого с j дает исход- ный морфизм. Композиция jio нулевая: она переводит стрелку Р-н Lb стрелку P-hN, которая является композицией Р—> —-> М ~~~н N, но ji — 0. Мы проверили, таким образом, что последовательность а) яв- ляется комплексом, и остается установить ее точность в среднем члене, т. е. Ker/i = ImZ1. Мы уже знаем, что Ker/izalmii. Для доказательства обратного включения заметим, что если стрелка Р-нМ лежит в ядре ji, то композиция этой стрелки с /: M-hN равна нулю, а потому образ Р в М лежит в ядре /. Но ядро j со- впадает с образом i(L)cz М в силу точности исходной тройки. Зна- чит, Р отображается в подпространство i(L), и потому стрелку Р-н-М можно поднять до стрелки P-+L, композиция которой с i даст исходную стрелку. Это и означает, что последняя лежит в образе i\. б) Здесь рассуждения совершенно аналогичны, или, точнее, двойственны. Отображение t2 сюръективно в силу утверждения б) теоремы п. 2. Отображение /2 инъективно, потому что если компо- зиция М ~~н N -н Р равна нулю, то и стрелка N-нР нулевая, так как j сюръективно. Композиция i2/2 равна нулю, ибо композиция L—>M—*• N —>Р нулевая для любой последней стрелки. По- этому остается доказать, что Ker i2 ст Im j2 (обратное включение только что проверено). Но стрелка М —* Рлежит в ядре г2, если i f композиция L—>М —* Р нулевая. Значит, £=Кег j лежит в ядре f. Определим отображение f: N-нР формулой f (п) — f (j~l (п)), где j~l(n)^M— любой прообраз п. От выбора этого прообраза ни- чего не зависит, ибо Ker j ст Ker f. Легко проверить, что f линейно и что /2(F) = в самом деле, h(f) есть композициям которая переводит- m ge М в fj (tn) = f(j~' (j(m))) = f(ni). Теорема доказана. 4. Категорная характеризация размерности. Пусть G — некото- рая абелева группа, записываемая аддитивно, %: ObS? inf X->G — 90
произвольная функция, определенная на конечномерных линейных пространствах и удовлетворяющая двум условиям: а) если L и М изоморфны, то %(Л) = %{М); б) для любой точной тройки пространств 0->L->М-+-N->-0 имеем х(М) = х(£) + х(М) (такие функции называются аддитив- ными) . Имеет место 5. Теорема. Для любой аддитивной функции % имеем X(L)=dini^L-№). где L — произвольное конечномерное пространство. Доказательство. Проведем индукцию по размерности L. Если L одномерно, то L изоморфно Жх, так что х(Г) = ХР^>|) = =dimx-L • Пусть теорема доказана для всех L размерности п. Если размерность L равна /г +1, выберем одномерное подпро- странство Lo cz L и рассмотрим точную тройку О -> Lo L L/Lo О, где г —вложение Lo, a + Lo е L/Lo. В силу аддитивности X и индуктивного предположения X (Т) = X {Lo) + X {L/Lo) = %m + <!imx (L/Lo) X (Ж1) = = X m + «X(X1) = (n + 1)Xm = dimx L % (Жх). Теорема доказана. Этот результат является самым началом большой алгебраиче- ской теории, которая сейчас активно развивается, — так называе- мой К-теории, лежащей на стыке топологии и алгебры. УПРАЖНЕНИЯ 1. Пусть А: 0-—► £,—>L2-—► ...—>Ln—> 0 — комплекс конечномер- ных линейных пространств. Факторпространство //‘(К) = Ker d;/Itn d;_, назы- вается i-м пространством когомологий этого комплекса. Число % (К) = п = У (—Ip dimZ., называется эйлеровой характеристикой комплекса. Доказать, что Х(Ю= £ (—l/dimZf* (К). 2. «Лемма о змее». Пусть дана коммутативная диаграмма линейных про- странств Z ---1—. м------Ъ- л'-----о I f Г Л 81
с точными строками Показать, что существует точная последовательность про- странств 6 Ker / -> Ker g Ker h —>• Coker f -> Coker g -> Coker h, в которой все стрелки, кроме 6, индуцированы dp d2, d\, d2 соответственно, а связывающий гомоморфизм 6 (называемый также кограничиым оператором) определяется так: чтобы определить б (я) для пеКег/i, следует найти те.М с n — d2(m), построить gfrnleM', найти / с/, с d{ (j ) — g(m) и положить 6 (я) = Г -ф Im f е Coker f. В частности, следует проверить существование б (я) и его независимость от произвола в промежуточных выборах. dl , , dt , 3. Пусть Л: ... ->Li —> Li+1 . и К : ... ->Lt —> Li+i -> ... — два комплекса. Морфизмом f: К-+ К’ называется такой набор линейных отображе- ний f,: Lt -> Lp что все квадраты коммутативны. Показать, что комплексы и их морфизмы образуют категорию. 4. Показать, что отображение К-+Н‘(К) продолжается до функтора из ка- тегорий комплексов в категорию линейных пространств. f , g, 5. Пусть 0 -> К * К * К" -> 0 — точная тройка комплексов и их мор- физмов. По определению, это означает, что для каждого i тройки линейных пространств I/ Z gl ft Q->Ll-^- l" точны. Пусть H‘ — соответствующие пространства когомологий. Пользуясь лем- мой о змее, построить последовательность пространств когомологий ... -> Н1 (К) -> Н1 (К') -> Н1 (К") -Л. Hi+l + и показать, что она является точной.
Ч а с т ь 2. ГЕОМЕТРИЯ ПРОСТРАНСТВ СО СКАЛЯРНЫМ ПРОИЗВЕДЕНИЕМ § 1. О геометрии 1. Эта и следующая части нашего курса посвящены теме, ко- торую можно назвать «линейные геометрии», и ей уместно предпо- слать краткое обсуждение современного смысла слов «геометрия» и «геометрический». В течение многих столетий под геометрией понималась геометрия Евклида на плоскости и в пространстве. Она продолжает составлять основное содержание обычного школьного курса, и эволюцию геометрических понятий удобно проследить на примере характерных особенностей этой, ныне весьма частной, гео- метрической дисциплины. 2. «Фигуры». Школьная геометрия начинается с изучения та- ких фигур на плоскости, как прямые, углы, треугольники, окруж- ности и круги и т. п. Естественное обобщение этой ситуации со- стоит в выборе некоторого пространства М, «объемлющего про- странства» нашей геометрии, и некоторого множества подмножеств в М — изучаемых в этом пространстве «фигур». 3. «Движения». Вторая существенная компонента школьной геометрии — это измерение длин и углов и выяснение соотношений между линейными и угловыми элементами различных фигур. По- требовалось длительное историческое развитие, прежде чем было осознано, что в основе этих измерений лежит существование от- дельного математического объекта — группы движений евклидо- вой плоскости или евклидова пространства как целого, и что все метрические понятия могут быть определены в терминах этой группы. Например, расстояние между точками является единствен- ной функцией от пары точек, инвариантной относительно группы евклидовых движений (если потребовать ее непрерывности и еще выбрать «единицу длины» — расстояние между выбранной парой точек). «Эрлангенская программа» Ф. Клейна (1872) зафиксиро- вала понимание этого замечательного принципа, и «геометрией» надолго стало изучение пространств М, снабженных достаточно большой группой симметрий, и свойств фигур, инвариантных отно- сительно действия этой группы, включая углы, расстояния и объемы. 4. «Числа». Открытием столь же фундаментальной важности (и гораздо более ранним) был декартов «метод координат» и осно- ванная на нем аналитическая геометрия плоскости и пространства. 9й
С современной точки зрения координаты суть некоторые функции на пространстве М (или на его подмножествах) с вещественными, комплексными или еще более общими значениями. Задание кон- кретных значений этих функций позволяет зафиксировать точку пространства, а задание соотношений между этими значениями определяет множество точек. Описание класса рассматриваемых в данной геометрии фигур в М можно заменить описанием класса соотношений между координатами, которые описывают интересую- щие нас фигуры. Поразительная гибкость и сила метода Декарта связана с тем, что функции на пространстве можно складывать и умножать, интегрировать, дифференцировать и применять другие процессы предельного перехода и в конечном счете пользоваться всей мощью математического анализа. Все общие современные геометрические дисциплины — топология, дифференциальная и комплексно аналитическая геометрия, алгебраическая геометрия — выбирают в качестве исходного определения понятие геометриче- ского объекта как совокупности пространства М и заданной на нем совокупности F (локальных) функций. 5. «Отображения». Если (M^Fi) и (М2, F2)— два геометриче- ских объекта описанного выше типа, то можно рассматривать ото- бражения которые обладают тем свойством, что обрат- ное отображение на функциях переводит элементы из F2 в эле- менты из Еь В наиболее логически завершенных схемах среди таких отображений находятся как группы симметрий Ф. Клейна, так и сами координатные функции (как отображения М в R или С). Геометрические объекты образуют категорию, и ее морфизмы служат достаточно тонкой заменой симметрий даже в тех случаях, когда этих симметрий не слишком много (как у общих римановых пространств, где можно измерять длины, углы и объемы, но дви- жений, вообще говоря, недостаточно). 6. Линейные геометрии. Теперь мы можем охарактеризовать место линейных геометрий в этой общей картине. В известном смысле слова линейные геометрии относятся к числу непосред- ственных потомков геометрии Евклида. Рассматриваемые в них пространства М суть либо линейные пространства (теперь уже над общими полями, хотя R или С по-прежнему остаются в центре внимания, особенно ввиду многочисленных приложений), либо про- странства, производные от линейных: аффинные («линейные про- странства без отмеченного начала координат») и проективные («аффинные пространства, пополненные бесконечно удаленными точками»). Группы симметрий суть подгруппы линейной группы, которые сохраняют фиксированное «скалярное произведение», а также их расширения сдвигами (аффинные группы) или фактор- группы по гомотетиям (проективные группы). Рассматриваемые функции линейны или близки к линейным, иногда квадратичны. Фигуры суть линейные подпространства и многообразия (обобще- ния прямых на евклидовой плоскости) и квадрики (обобщения окружностей). Можно представлять себе эти обобщения евклидо- вой геометрии как результат чисто логического анализа, и устано- 94
вившийся формализм линейных геометрий действительно обладает удивительной стройностью и компактностью. Но жизнеспособность этой ветви математики в значительной мере связана с ее многооб- разными естественнонаучными приложениями. Понятие скалярного произведения, лежащее в основе всей второй части курса, может служить для измерения углов в абстрактных евклидовых про- странствах. Но математик, который не знает, что оно же измеряет вероятности (в моделях квантовой механики), скорости (в про- странстве Минковского специальной теории относительности) и коэффициенты корреляции случайных величин (в теории вероят- ности), лишается не только общей широты кругозора, но и гиб- кости чисто математической интуиции. Поэтому мы сочли необхо- димым включить в курс сведения и об этих интерпретациях. § 2. Скалярные произведения 1. Полилинейные отображения. Пусть L\, ..., Ln, М — линей- ные пространства над общим полем Полилинейным отображе- нием (при п — 2 билинейным) называется отображение f: LtX ... УЛп->М, (/„ .... .... ln)^M, которое линейно как функция любого из аргументов /, <= Л,- при фиксированных остальных lj^.Lj, j=l, ..., п, j^=i. Иными сло- вами, f(f,...1,+т„ i„......./.)= =к<.............у+щ..........«:....у. f • * • 9 Ul[, li^.\9 • • • 9 ^n) uf (l\, . . • , ll, ..., ln) для i = 1,..., n; a e Ж. В случае М=Ж полилинейные отображе- ния называются также полилинейными функциями, или формами. В первой части Мы уже встречались с билинейными отображе- ниями C\L^X-. (f, f(=L',le=L; S{L,M)XL^M: (f,l)^f(l), fe=SP(L,M), l(=L. Определитель квадратной матрицы полилинеен как функция от ее строк и столбцов. Еще один пример: Жп X Жт Ж’. {х, у) X giHiy, = x'gJ, где G — любая матрица размера п\т над Ж, векторы из Жп, Жт представлены столбцами своих координат. Общие полилинейные отображения мы будем изучать позже, в части, посвященной тензорной алгебре. Здесь же мы займемся важнейшим для приложений классом билинейных функций L X L -> Ж, а также, при Ж = С, функций L X Е С, где L — про- странство, комплексно соиряженное с L (см. ч. 1, § 12). Каждая 95
такая функция называется также скалярным произведением или метрикой, на пространстве L, и пара (L, скалярное произведение) рассматривается как единый геометрический объект. Изучаемые в этой части метрики лишь в специальных случаях являются мет- риками в смысле определения п. 1 § 10 ч. 1, и читатель не дол- жен смешивать эти омонимы. Скалярное произведение L\L^~C чаще всего рассматривают как полуторалинейное отображение g: LXL-^C, линейное по пер- вому аргументу и полулинейное по второму: g{allt bl2)—abg{li,l2). 2. Способы задания скалярного произведения, а) Пусть g: L X (или £ХЬ->С)—некоторое скалярное произведение на конечномерном пространстве L. Выберем базис {eit еп} в L и определим матрицу G = {g{eh с,)); Z, /=1, ..., п. Она называется матрицей Грама базиса {et, ., еп} относительно g, а также матрицей g в базисе {еь ..., еп}. Задание {<?,} и G вполне определяет g, потому что в силу свойства билинейности п \ п у g (х, у} = g I S xtet, £ y^j I = £ Xlyfg {еь ej) = x*Gy. \i = l 7 = 1 / i, /=1 В случае полуторалинейной формы аналогичная формула приобре- тает вид g (х, y) = g ( £ xtet, у^) = xtyjg (et, е,) = xfGy. Наоборот, если базис {еь ..., еп} фиксирован, a G — любая матрица размера иХп над Ус, то отображение (х, y)~>x Gy (или x*Gj в полуторалинейном случае) определяет скалярное про- изведение на L с матрицей G в этом базисе, как показывают оче- видные проверки. Таким образом, наша конструкция устанавли- вает биекцию между скалярными произведениями (билинейными или полуторалинейными) на n-мерном пространстве с базисом и матрицами размера пХ«- Выясним, как меняется G при замене базиса. Пусть А — мат- рица перехода к штрихованному базису. В координатах: х = Ах', где х — столбец координат вектора в старом базисе, a j? — столбец его же координат в новом. Тогда в билинейном случае g {х, у) = x*Gy = {Ax' * G {Ay') — (x')* A*GAy', так что матрца Грама штрихованного базиса равна A*GA. Анало- гично, в полуторалинейном случае она равна A*GA. В первой части курса матрицы служили нам в основном для записи линейных отображений, и интересно выяснить, нет ли есте- ственного линейного отображения, связанного с g и отвечающего 96
матрице Грама G. Оно действительно существует, и его конструк- ция дает равносильный способ задания скалярного произведения. б) Пусть g: Ly^L-^ffl— скалярное произведение. Поставим в соответствие каждому вектору l^.L функцию gr. L-^Ж, для ко- торой gi(m) = g(l, т), meL. Эта функция линейна по т в билинейном случае и антилинейна в полуторалинейном, т е. gt е L* или соответственно gi е L* для каждого /. Кроме того, отображение g: L-^L’ или h-^gi = g(l) линейно, канонически построено по g и однозначно определяет g по формуле g(l, m) — (g(l), т), где внешние скобки справа обозначают каноническое билинейное отображение или £*Х^~>С. Наоборот, по любому линейному отображению g: L-+L* (или £->£*) однозначно восстанавливается билинейное отображение g-. (или g-. LXL-+C) по той же формуле g(l, m) = (g(l), tri). Связь с предыдущей конструкцией такова: если в L выбран базис {еь ..., еп} и g задается матрицей G в этом базисе, то g задается матрицей G* в базисах {e{, ..., еп}, {е1, еп}, двой- ственных друг другу. Действительно, если g задано матрицей G1, то соответствующее скалярное произведение g в двойственных базисах имеет вид g Й, У) = (g Й, У) = (g <x)fy (или (g (х)У Ъ = =^(Gtx')t у(или 'GW у) = хЮу(плн хЮу), что доказывает требуемое. Здесь мы пользовались замечанием, сде- ланным в § 7 ч. 1,о том, что каноническое отображение L*X ъ двойственных базисах определяется формулой (х, у) = —х*у. 3. Свойства симметрии скалярных произведений. Перестановка аргументов в билинейном скалярном произведении g определяет новое скалярное произведение g1-. g‘(l, m) = g(m, I). В полуторалинейиом случае эта операция также меняет места «линейного» и «полулинейного» аргументов; если мы хотим, чтобы этого не произошло, то удобнее рассматривать gf: g'tl, m)==g{m, I). 67
У g‘ линейный аргумент будет на первом месте, если у g он был на первом месте, а полулинейный — соответственно на втором. Операция g'—^g1 или g>—легко описывается на языке матриц Грама: она отвечает операции Gt—^G1 или соответственно (предполагается, что g, g‘, g* пишутся в одном и том же базисе L). Действительно, (X у) = g (у, х) = y‘Gx = СуЮхУ = х(С*у, gl(x, y) = g(y, х)~ tjtGx = (ytGx)t — х(С(у. Мы будем заниматься почти исключительно скалярными произ- ведениями, которые удовлетворяют одному из следующих условий симметрии относительно этой операции: a) g* — g- Такие скалярные произведения называются симмет- ричными, а геометрия пространств с симметричным скалярным произведением называется ортогональной геометрией. Симметрич- ные скалярные произведения задаются симметричными матрицами Грама G. б) gt = ~g- Такне скалярные произведения называются анти- симметричными, или симплектическими, а соответствующие гео- метрии называются симплектическими. Им отвечают антисиммет- ричные матрицы Грама. Полуторалинейный случай: в) gt — g. Такие скалярные произведения называются эрмитово симметричными, или просто эрмитовыми, а соответствующие гео- метрии— эрмитовыми. Им отвечают эрмитовы матрицы. Грама. Из условия g‘ — g следует, что g(l, I) — g(l, I) для всех /е L, т. е. все значения g(l, I) вещественны. Эрмитово антисимметричные скалярные произведения обычно не рассматриваются специально, ибо отображение g'^—^ig устанав- ливает биекцию между ними и эрмитово симметричными скаляр- ными произведениями: = — ig- Геометрические свойства скалярных произведений, отличающихся друг от друга лишь множителем, практически одни и те же. На- против, ортогональная геометрия во многом отличается от симп- лектической: редукция соотношений gl — g и g* — —g друг к другу таким простым способом невозможна. 4. Ортогональность. Пусть (Г, g)—векторное пространство со скалярным произведением. Векторы /ь /2 L называются ортого- нальными (относительно g), если g(/i,Z2)=O. Подпространства Li, L2czL называются ортогональными, если g(h, /2) = 0 для всех /1 е L], /2еГ2. Основная причина, по которой важны лишь ска- лярные произведения с одним из свойств симметрии предыдущего пункта, состоит в том, что для них свойство ортогональности век- торов или подпространств симметрично относительно этих векто- 98
ров или подпространств. Действительно: если gl — ±g или g* — g, то g (I, m) = 0 ±: g* (I, tn) — Q<=>g (m, l) — Q и аналогично в эрмитовом случае (по поводу обратного утвержде- ния см. упражнение 3). Если не оговорено обратное, в дальнейшем мы будем рассмат- ривать только ортогональные, симплектические или эрмитовы ска- лярные произведения. Первое применение понятия ортогонально- сти содержится в следующем определении. 5. Определение, а) Ядром скалярного произведения g на про- странстве L называется множество всех векторов I е L, ортогональ- ных ко всем векторам L. б) g называется' невырожденным, если ядро формы g триви- ально, т. е. состоит только из нуля. Очевидно, ядро формы g совпадает с ядром линейного отобра- жения g: L > L* (или L -> L*) и потому является линейным подпространством в L. Поэтому задание невырожденной формы g можно заменить заданием изомор- физма L-+L* (или Г*). Так как матрицей § служит транспониро- ванная матрица Грама G1 базиса L, невырожденность g равно- сильна невырожденности матрицы Грама (любого базиса). В тен- зорной алгебре и ее приложениях к дифференциальной геометрии и физике очень широко используется то обстоятельство, что невы- рожденная ортогональная форма g определяет изоморфизм оно служит основой техники «поднятия и опускания индексов». Ранг g определяется как размерность образа g, или как ранг матрицы Грама G. 6. Задача классификации. Пусть (Ц, gi), (L2, g2) — два линей- ных пространства со скалярными произведениями над полем УГ. Назовем их изометрией любой линейный изоморфизм f: который сохраняет значения всех скалярных произведений, т. е. gi(l, = FO Для всех I, Назовем такие пространства изометричными, если между ними су- ществует изометрия. Очевидно, тождественное отображение яв- ляется изометрией, композиция изометрий есть изометрия и линей- ное отображение, обратное к изометрии, есть изометрия. В сле- дующем параграфе мы решим задачу классификации пространств с точностью до изометрии, а затем изучим группы изометрий про- странства с самим собой и покажем, что среди них содержатся классические группы, описанные в § 4 ч. 1. Классическое решение задачи классификации состоит в том, что всякое пространство со скалярным произведением разлагается в прямую сумму попарно ортогональных подпространств малой размерности (один в ортогональном и эрмитовом случае, один или УУ
два — в симплектическом). Поэтому мы закончим этот параграф непосредственным описанием таких маломерных пространств с метрикой. 7. Одномерные ортогональные пространства. Пусть dim£=l, g — ортогональное скалярное произведение на L. Возьмем любой ненулевой вектор l^.L. Если g(l, Z) = О, то g =а 0, так что g вы- рожденное и нулевое. Если g(l, 1) = а=/=0, то для любого х^Ж значение g(xl,xl) равно ах2, так что все значения g(l, I) на нену- левых векторах в L составляют в мультипликативной группе Ж* — J^\{0} поля Ж смежный класс по подгруппе, состоящей из квадратов: {ах2|хе Ж*}^ Ж*](Ж*}2. Этот смежный класс пол- ностью характеризует невырожденное симметричное скалярное произведение на одномерном пространстве L: для (Li,gi) и (£2,^2) два таких класса совпадают тогда и только тогда, когда эти про- странства изометричны. В самом деле, если gt (Ц, £) = ах2, giib, h)~ay2, где Lt, то отображение f: li — y~lxl2 определяет изометрию L\ с L2, что доказывает достаточность. Необходимость очевидна. Так как R*/(R*)2 = {±1} и С‘=(С*)2, мы получаем следую- щие важные частные случаи классификации. Над R любое одномерное ортогональное пространство изоме- трично одномерному координатному пространству с одним из трех скалярных произведений: ху, —ху, 0. Над С любое одномерное ортогональное пространство изомет- рично одномерному координатному пространству с одним из двух скалярных произведений: ху, 0. 8. Одномерные эрмитовы пространства. Здесь рассуждения аналогичны. Основное поле равно С; вырожденность формы рав- носильна ее обращению в нуль. Если же форма невырождена, то множество значений g(l,l) для ненулевых векторов l^L есть смежный класс подгруппы R*+ ={х е R* |х > 6} в группе С*, ибо g(al, al)=^ aag{l, l) = \a\2g{l,l), и |a|2 пробегает все значения в R+, когда agC*. Но каждое ненулевое комплексное число z однозначно представляется в виде ref<₽, где a eZ(f> лежит на единичной комплексной окружности, которую мы обозначим ct = H C’llz|= 1}. На групповом языке это определяет прямое разложение С* = R+X ХС'и изоморфизм C’/R+->Ci- Таким образом, невырожденные полуторалинейные формы классифицируются комплексными чис- лами, по модулю равными единице. Однако мы еще не полностью учли свойетва эрмитовости, которое означает, что g(l, l) — g(l, I), т. е. что значения g(l,l) все вещественны. Поэтому эрмитовым формам отвечают.только числа +1 в CJ, как и в ортогональном случае над R. Окончательный ответ: Над С любое одномерное эрмитово пространство изометрично одномерному координатному пространству с одним из трех скаляр- ных произведений: ху, — ху, 0. 100
Одномерные ортогональные пространства над R (или эрмитовы над С) со скалярными произведениями ху, —ху, 0 (или ху, —ху, 0) в подходящем базисе мы будем называть соответственно положи- тельными, отрицательными и нулевыми. Скалярные произведения ненулевых векторов на себя в них принимают соответственно толь- ко положительные, только отрицательные или только нулевые зна- чения. 9. Одномерные симплектические пространства. Здесь мы встре- чаемся с новой ситуацией: любая антисимметричная форма на одномерном пространстве над полем характеристики =/=2 тожде- ственно равна нулю, в частности, вырождена! Действительно, g(i, i) = -g(i, i)^g(i, 0 = 0, g (al, bl) = abg (I, I) = 0. Что касается характеристики 2, то условие антисимметрии g(l, m)<= =—g(m, I) в этом случае равносильно условию симметрии g(l,m)== g(m, I), так что над такими полями симплектическая гео- метрия не отличается от ортогональной. Впрочем, у ортогональной геометрии также появляются свои особенности, й Мы обычно будем этот случай исключать из рассмотрения. Ясно поэтому, что одномерные симплектические пространства не могут быть строительным материалом для конструкции общих симплектических пространств, и нужно пойти по крайней мере на шаг дальше. 10. Двумерные симплектические пространства. Пусть (L, g) — двумерное пространство с кососимметрической формой g над по- лем характеристики У=2. Если форма g вырождена, то она ав- томатически нулевая. В самом деле, пусть 1^0 — такой вектор, что g(l,m)*=z 6, для всех m е L. Дополним I до базиса {1,1'} в L и учтем, что g(l\l') = g(l, 0 = 0 п0 предыдущему пункту. Тогда для любых a, b, a', b' е М имеем g (al 4- a'I', bl 4- b'l') = abg (I, l) + ab'g(l, l') — a'bg(l, I') + bb'g (Г, !')“(). Пусть теперь g ненулевая и, значит, невырожденная. Тогда су- ществует пара векторов ei, е2 с g(e\, е2) = a 0 и даже са=1: g(a~lei, е2) = а~'а =“ 1. Пусть g(ei,e2)i= 1. Тогда векторы еь е2 линейно независимы и, значит, образуют базис L: если, скажем, е\ = ае2, то g(ae2, е2)=^= = ag(e2, е2) = 0. В координатах относительно такого базиса ска- лярное произведение g записывается в виде g (-4е! 4“ Х2е2> Hlel 4- У2Р2) = xlg2 Х2У[ и имеет матрицу Грама Окончательно, получаем: 101
Над полем Ж характеристики =#2 любое двумерное симплек- тическое пространство изометрично координатному пространству Ж"2- со скалярным произведением Xty2 — х2у{ или 0. УПРАЖНЕНИЯ 1. Пусть L, М — конечномерные линейные пространства над полем М1 и g: £ХМ->-Л?—билинейное отображение. Назовем левым ядром g множество £о = {I е £|g(Z, m) = 0 для всех теЛ1}, правым ядром g множество Мо = = {т е М |g(Z, т) = 0 для всех (е£). Докажите следующие утверждения: a) dim L/Lo = dim MIM0. 6) g индуцирует билинейное отображение g': L/L0X М1М0-+ У?, g'U + Lo, g(l,m), у которого левое и правое ядра нулевые. 2. Докажите, что всякое билинейное скалярное произведение g: (над полем Ж характеристики =/=2) однозначно разлагается в сумму симметрич- ного и антисимметричного скалярного произведения. 3. Пусть g: — такое билинейное скалярное произведение, что свойство ортогональности пары векторов симметрично: из g(li, 1г) ^=0 следует, что g(Zz, Zj) = 0. Докажите, что тогда g либо симметрично, либо антисимметрич- но. (Указания, а) Пусть Z, т, п е L. Докажите, что g(l, g(l, n)in — g(l,m)n) — 0. Пользуясь симметрией ортогональности, выведите отсюда, что g(l, n)g(m, I) = =g(n> Og(Z, m)- б) Положив n — l, выведите отсюда, что если g(l, m)^=g(m, I), то g(Z, Z)=0. в) Покажите, что g(n, n)=0 для любого вектора n e L, если g несимметрично. С этой целью выберите Z, m c g(Z, m) ¥= g(m,l) и разберите от- дельно случаи g(Z, и) g(n, Z), g(l,n) -j= g(n, l). г) Покажите, что если g(n, n) 0 для всех net, rog антисимметрично.) 4. Дайте классификацию одномерных ортогональных пространств над конеч- ным полем Ж характеристики =И=2, показав, что есть циклическая группа второго порядка. (Указание-. Покажите, что ядро гомоморфизма Xi—- х2 имеет' порядок 2, пользуясь тем, что любой многочлен над полем имеет не больше корней, чем его степень.) 5. Пусть (£, g) — линейное пространство размерности п с невырожденным скалярным произведением. Докажите, что семейство векторов {ст.ея) в L линейно независимо тогда и только тогда, когда матрица (g(et, е,)) невырождена. § 3. Теоремы классификации 1. Основная цель этого параграфа — дать классификацию ко- нечномерных ортогональных, эрмитовых и симплектических про- странств с точностью до изометрии. Пусть (X, g) — такое простран- ство, LocL — его подпространство. Ограничение g на Lo является скалярным произведением на Lo. Назовем Хо невырожденным, если ограничение g на Lo невырождено, и изотропным, если огра- ничение g на Хо равно нулю. Существенно, что если даже L не- вырождено, ограничения g на нетривиальные подпространства мо- гут. быть вырожденными или нулевыми. Например, в симплекти- ческом случае вырождены все одномерные подпространства, а в ортогональном пространстве R2 с произведением Xiyi—х2у2 вы- рождено подпространство, натянутое на вектор (1,1). Ортогональным дополнением к подпространству LociL назы- вается множество Ц- = {I е L | g (lo, /) = 0 для всех /0 е= Хо} (не путать с введенным в первой части ортогональным дополне- 102
нием к Lo, лежащим в L*, здесь мы им пользоваться не будем). Легко видеть, что является линейным подпространством в L. 2. Предложение. Пусть (L,g) конечномерно. а) Если подпространство LqCzL невырождено, то L — LoQ)Lo. б) Если оба подпространства Lo и Lo невырождены, то (£ох)-*- = Lo. Доказательство, а) Пусть g: L->L* (или Z,*)—отобра- жение, ассоциированное с g, как в предыдущем параграфе. Обо- значим через g0 его ограничение на Lo, g0: Lo~> L* (или L*). Если Lo невырождено, то Kergo = O: иначе в £0 есть вектор, ортогональ- ный ко всему L и тем более к Lo. Поэтому dim Im gQ = dim Lo- Это означает, что когда lo пробегает Lo, линейные формы g(lo, •) от второго аргумента из L или L пробегают dim Lo-мерное про- странство линейных форм на L или L. Так как Lx есть пересече- ние ядер этих форм, dim Lx == dim L — dim Lo, t. e. dim Lo + dim = dim L. С другой стороны, из невырожденности Lo следует, что Lo П L^ = = {0}, ибо L0(]Lq есть ядро ограничения g на Lo- Поэтому сумма L-j-Lo прямая; но ее размерность равна dimL, так что LO®LX = — L. б) Из определений ясно, что LoC2(Lx)x. С другой стороны, если Lo, Lx невырождены, то по предыдущему dim (L^)x — dim L — dim Lx — dim Lo. Это завершает доказательство. 3. Теорема. Пусть (L, g)— конечномерное ортогональное (над полем характеристики =И=2), эрмитово или симплектическое про- странство. Тогда существует разложение L в прямую сумму по- парно ортогональных подпространств: L = L, ® ... ф Lm, одномерных в ортогональном и эрмитовом случае и одномерных вырожденных или двумерных невырожденных в симплектическом случае. Доказательство. Проведем индукцию по размерности L. Случай dim L = 1 тривиален; пусть dimL ^2. Если g нулевая, доказывать нечего. Если g ненулевая, то в симплектическом слу- чае имеется пара векторов /ь /2eLc g(L,/2)=/= 0. Согласно п. 10 предыдущего параграфа, натянутое на них подпространство Lo не- вырождено. По предложению п. 2 _L==LO®LX, и по индуктивному предположению мы можем далее разложить Lo', как сформули- ровано в теореме. Это даст требуемое разложение L. В ортогональном и эрмитовом случае мы покажем, что из не- тривиальности g следует существование невырожденного одномер- ного подпространства Lo; проверив это, мы сможем положить 103
£' = £оф£'о' и применить прежнее рассуждение, т. е. индукцию по размерности L. В самом деле, допустим, что g(l, I) = 0 для всех /gL, и пока- жем, что тогда g = 0. Действительно, для всех /ь Iz^L имеем 0 — g Ui + In li + У = g Gi> А) + 2g(li> I?) + g (1-2’ h) — 2g(li, I?) или 0 = g(li + Z2, li+l2) = g (h, h) + 2 Reg(К, 1г) + g (l2, У = 2 Reg(h, l2). В ортогональном случае отсюда сразу следует, что g'(/i,fe) = 0. В эрмитовом мы получаем лишь, что Reg(/i, /2) = 0, т. е. g(h, /2) = = la, ае R. Но если а =/= 0, то также 0 = Re g ((la)~l h, /2) = Re (ia)~l g (llt l2) = 1. Получаем противоречив. Это завершает доказательство. Перейдем теперь к проблеме единственности. Само по себе разложение в ортогональную прямую сумму, существование кото- рого утверждается в теореме п. 3, далеко не единственно, кроме тривиальных случаев размерности 1 (или 2 в симплектическом случае). Над общими полями в случае ортогональной геометрии неоднозначно определяется также и набор инвариантов а, е который характеризует ограничения g на одномерные подпространства Lt. Точный ответ ца вопрос о классификации ор- тогональных пространств существенно зависит от свойств основ- ного поля, и для Ж — Q, например, связан с такими довольно тонкими теоретико-числовыми фактами, как квадратичный закон взаимности. Поэтому в ортогональном случае мы ограничимся опи- санием результата для Ж = R и С (дальнейшие подробности см. в § 14). 4. Инварианты пространств с метрикой. Пусть (L, g)—про- странство со скалярным произведением. Положим п = dim L, ro = dimLo, где Lo — ядро формы g. Кроме того, введем два до- полнительных инварианта, относящихся только к ортогональной для Ж = R и эрмитовой геометриям: г+ и г_, числа положитель- ных и отрицательных одномерных подпространств £,• в некотором ортогональном разложении L в прямую сумму, как в теореме п. 3. Очевидно, г0 п и п = го + г+ -|- г_ для эрмитовой и ортого- нальной геометрии над R. Набор (г0, г+, г_) называется сигнатурой пространства. При ,го = О сигнатурой называют иногда также (г+, г_) или г+ — г- (считая п = r+ -j- г_ известным). Теперь мы можем сформулировать теорему единственности. 5. Теорема, а) Симплектические пространства над произволь- ным полем, а также ортогональные пространства над С с точ- ностью до изометрии определяются двумя целыми числами п, го, т. е. размерностями пространства и ядра скалярного произведения. б) Ортогональные пространства над R и эрмитовы простран- ства над С с точностью до изометрии определяются сигнатурой 104
(г0, л+) г_), которая не зависит от выбора ортогонального разло- жения (это утверждение называется теоремой инерции). Доказательство, а) Пусть (L, g) — симплектическое про- странство или ортогональное пространство над С. Рассмотрим его прямое разложение L — ф Д, как в теореме п. 3, и покажем, что го совпадает с числом одномерных пространств в этом разло- жении, вырожденных для g. На самом деле сумма этих пространств Lo совпадает с ядром g. Действительно, очевидно, что она содер- жится в этом ядре, ибо элементы Lo ортогональны как к Lo, так и к остальным слагаемым. С другой стороны, если Д — ф Д и g(l, li) = gUp в ортогональном случае, и существует вектор I/ е Lj с g(l, l'i) = g(lh в симплектическом случае, ибо иначе ядро ограничения g на Д было бы нетривиально, и g на L, была бы нулевой по п. 10 § 2, вопреки тому, что j > г0. Поэтому I ф (ядро g), и Lo = (ядро g). Если теперь (L,g) и (Д, g') — два таких пространства с одина- ковыми п и го, то, построив их ортогнальные прямые разложения 11 п го L = ф Д и L = ф Д, для которых (ядро g) == ф Д и (ядро g') = 1 : । _ 1 = ф Д, мы можем определить изометрию (L, g) с (L, g') как прямую сумму изометрий ф/г, f{: L{-+Li, которые существуют в силу результатов пп. 7 и 10 § 2. б) Пусть теперь (Д g) и (L',g')—пара ортогональных про- странств над R или эрмитовых над С с сигнатурами (г0, г+, г_) и (Д Д> Ф), определенными с помощью некоторых ортогональных разложений £ = фД, L =@Li, как в теореме п. 3. Предполо- жим, что между ними существует изометрия. Тогда прежде всего dim L = dim L', так что г0-j-д + г_ = г'+ д + ф. Далее, точно так же, как в предыдущем пункте, проверяется, что г0 сов- падает с размерностью ядра g, а г' — с размерностью ядра g', а эти ядра суть суммы нулевых пространств Д и L't в соответ- ствующих разложениях. Поскольку изометрия определяет линей- ный изоморфизм между ядрами, имеем г0 = г' и д + г_ = д + г'_. Остается проверить, что Д = Д, г =г’ . Положим L — Дф Дф L-, Ф = ДфД-фФ, где Д, Д, Д —суммы 105
нулевых, положительных и отрицательных подпространств исход- ного разложения L, и соответственно для L'. Предположим, что r+ — dim L+ > r'+ — dim L'+, и придем к противоречию; воз- можность г+ < г'+ разбирается аналогично. Ограничим изометрию f: L-»-L' на L+czL. Каждый вектор f(Z) однозначно представ- ляется в виде суммы /(Z) = f(Oo + f(Z)+ + f(O-> где f(Z)+eLj. и т. п. Отображение L+->L+, Z i—линейно. Так как по предположению dimL+>dimL+, существует нену- левой вектор ZeL+, для которого f(Z)+=O, так что f(O = f(Z)o+/(Z)- Но g(l, Z) > 0, потому что l^L+ и L+ есть ортогональная прямая сумма положительных одномерных пространств. Так как f — изометрия, мы должны иметь также g'(f(l), f(l))> 0. С другой стороны, ё' if (П, f (О) = ё' (f (Оо + f (0- , f(Oo + f (I)-) = ё' (f f (I)-) < 0. Это противоречие завершает доказательство того, что у изомет- ричных пространств сигнатуры, вычисленные по любым ортого- нальным разложениям, одинаковы. Наоборот, если (L, g), (L',g'j— два пространства с одинако- выми сигнатурами, то между подпространствами из их ортого- нальных разложений L — ф L{ и L' — фЬг можно установить взаимно однозначное соответствие Ц •>-+ Ц, сохраняющее знак ограничения g на Lt и g на Ц соответственно. По результатам пн. 7 и 8 § 2 существуют изометрии f,: Lt -> Lt, и их прямая сум- ма ф/i будет изометрией между L и L'. Теперь мы выведем несколько следствий и переформулировок теорем пп. 3 и 5, которые подчеркивают разные аспекты ситуации. 6. Базисы. Пусть (L,g)—пространство со скалярным произве- дением. Базис {ei, еп} в L называется ортогональным, если g(ei, ei) ~ 0 для всех {i- Из теоремы п. 5 следует, что у любого ортогонального или эрмитова пространства имеется ортогональ- ный базис. Действительно, достаточно построить разложение L = фьг на ортогональные одномерные подпространства и затем выбрать е, е Li, et =f= 0. Ортогональный базис {et} называется ортонормированным, если g(et, ei) — 0 или ±1 для всех i. Обсуждение в конце § 2 по- казывает, что у любого ортогонального пространства над R или Сиу любого эрмитова пространства имеется ортонормированный базис. Теорема п,- 5 показывает, что числа элементов е ортонорми- рованного базиса с g(e, е) — 0, 1 или —i ие зависят от базиса для iff === R (ортогональный случай) и X = С (эрмитов случай). В ор- тогональном случае над С всегда можно добиться того, что 106
g(ei,ei) = O или 1, и количества таких векторов в базисе не за- висят от самого базиса. Матрица Грама ортонормированного ба- зиса имеет вид (при надлежащем упорядочении). Чаще всего понятие ортонор- мированного базиса применяют в невырожденном случае, когда векторов е,- с g(ei, е,)==0 нет. Следующая простая, но важная фор- мула позволяет явно написать коэффициенты разложения любого вектора ееL по ортогональному базису (в невырожденном слу- чае) : L g (eif е{) e‘- Действительно, скалярные произведения левой и правой части со всеми ei совпадают, а из невырожденности следует, что если g(e,ei) — g(e',ei) для всех i, то е = е', ибо е — е' лежит в ядре формы g. В симплектическом пространстве ортогональный базис, оче- видно, может существовать, только если g — 0. Теорема п. 3 обес- печивает, однако,существование симплектического базиса {ei,e2, ... ..., ег; ег+ь ..., e2r- e2r+i, еп}, который характеризуется тем, что g(eh er+l) = — g(er+l, ег) = 1, i= 1, .... г, а все остальные попарные скалярные произведения равны нулю. Действительно, следует разложить L в ортогональную прямую сумму двумерных невырожденных подпространств Ц, 1 i г, и одномерных вырожденных L/, 2r -|- 1 j п, и в качестве {ei, er+i} для 1 I г взять базис L,, построенный в п. 10 § 2, а в качестве е, для 2г 4- 1 j п взять любой ненулевой век- тор из L/.. Матрица Грама симплектического базиса имеет вид Ранг симплектической формы, по теореме п. 5, равен 2г. В ча- стности, невырожденное симплектическое пространство обяза- тельно четномерно. Пусть L — невырожденное симплектическое пространство, {еь ..., er, er+i, .... е2г} — симплектический базис в нем. Пусть Ц — линейная оболочка {ei, ..., er}\ L2 — линейная оболочка {er+i....е2г}. Очевидно, пространства L\ и L2 изотропны, имеют 107
половинную размерность и £=£1ф£.2. Каноническое отображе- ние g: L-+- L* определяет отображение Si: L2 —> £г, gi (/2)01) = g (12, /1)- Это отображение является изоморфизмом, ибо dim £2= dimLi = = dim Ц и Ker g{ — 0: вектор из Ker g{ ортогонален к L2, ибо L2 изотропно, и к Li по определению, a L невырождено. Отсюда следует, что любое невырожденное симплектическое пространство изометрично пространству вида L = Li ф Li с сим- плектической формой g((f, D, if, = f, fsC, l, 1'^Ц. Дальнейшие подробности см. в § 12. 7. Матрицы. Описывая скалярные произведения их матрицами Грама и переходя от случайного базиса к ортогональному или симплектическому, мы в силу результатов п. 2 § 2 и п. 6 этого параграфа получаем следующие факты: а) Всякую квадратную симметричную матрицу G над полем Ж можно привести к диагональному виду преобразованием где А невырождена. При Ж =* R можно добиться, чтобы на диагонали стояли только 0, ±1, а при Ж = С — только 0, 1; количества 0 и ±1 (соответственно 0 и 1) будут зависеть лишь от G, но не от А. б) Всякую квадратную антисимметричную матрицу Q над по- лем Ж характеристики #=2 можно привести преобразованием Gi—^A‘GA, где А невырождена, к виду / 0 I Er | 0 х ( -gr| ° I ~ )• V 0 I 0 I 0 ' Число 2г равно рангу G. в) Всякую эрмитову матрицу G над С можно привести к диа- гональному виду с числами 0, ±1 на диагонали преобразованием Gi—>А*0а, где А невырождена. Количества 0 и ±1 зависят лишь от G. 8. Билинейные формы. Если векторы пространства (L, g) с фиксированным базисом записываются координатами в этом ба- зисе, то выражение g через координаты является билинейной фор- мой от 2п переменных, п == dim L: п -> > g = (xlt .... х„; 1/1, ..., уп) = £ gifXtyf = xfGy, i, /=1 где G — матрица Грама базиса. Замена базиса сводится к линей- ному преобразованию переменных Xi......хп и у\, уп с по- мощью одной и той же невырожденной матрицы А в билинейном случае (или матрицы А для х, А для у в полуторалинейном слу- 108
чае). Предыдущие результаты означают, что в зависимости от свойств симметрии матрицы G форму можно привести таким пре- образованием к одному из следующих видов, называемых канони- ческими. Ортогональный случай над любым полем: g(X aiXiyt-, ы над полем R можно добиться того, чтобы а,- = 0, ± 1; над полем С — чтобы at — 0 или 1. Эрмитов случай (форма полуторалинейная): g(-t #)= Е «i-W i =i at — 0 или 1. Симплектический случай: м = 2г + г0, и форма имеет вид g (х, J) == Е (x{yr+i — y{xr+l). i=l 9. Квадратичные формы. Квадратичной формой q на простран- стве L называется такое отображение у. для которого существует билинейная форма й: со свойством q (/) = h (I, I) для всех / е L. Покажем, что если характеристика поля Ж не равна 2, то для всякой квадратичной формы q существует единственная симмет- ричная билинейная форма g со свойством q(l)~g(l,l), называе- мая поляризацией q. Для доказательства существования положим q(l) — h(l, I), где h — исходная билинейная форма, и g (I, tn) = ± [h (I, m) + h (tn, /)]. Очевидно, g симметрична, т. e. g(l, m) — g(tn, l). Кроме того, g(l, 0 = /) + й(/, l)] = q(l). Билинейность g сразу же следует из билинейности h. Для доказательства единственности заметим, что если q(l) = = gi(l, l) = gz(l, I), гДе gi, g2 симметричны и билинейны, то фор- ма g = g\— gi тоже симметрична и билинейна, и g(l, /) = 0 для всех / <= L. Но по рассуждению в доказательстве теоремы п. 3 от- сюда следует, что g(l,m) — 0 для всех I, meL, что завершает доказательство. Заметим, что если q(l)~ g(l, l),g симметрична, то g (I, tn) = j + ^) — q (I) — q (tn)]. Мы установили, таким образом, что ортогональные геометрии (над полями характеристики =/=2) можно рассматривать как гео- 109
метрии пар (Ь, q), где q: L-^Ж— квадратичная форма. В коор- динатах квадратичная форма записывается в виде п q(x) = X aijXiXj, i, i= I где матрица (а,,) определяется однозначно, если она симметрична: ац = ац. Например, q (£[, х2) ~ ®цЛ'1 4” 4~ #22л:|. Теоремы классификации означают, что невырожденной линейной заменой переменных квадратичную форму можно привести к сум- ме квадратов с коэффициентами: Я G) = Е «,-4 i=i Если Ж = R, можно считать, что а, = 0, ±1; количества го, г+, г- нулей и плюс-минус единиц определены однозначно и составляют сигнатуру исходной квадратичной формы; г+ + г_ —это ее ранг. Если Ж = С, можно считать, что а, = 0,1; количество единиц — это ранг формы; он также определен однозначно. § 4. Алгоритм ортогонализации и ортогональные многочлены В этом параграфе мы опишем классические алгоритмы для отыскания ортогональных базисов и важные примеры таких бази- сов в пространствах функций. 1. Приведение квадратичной формы к сумме квадратов. Пусть q(xx, ..., х„) = £ аих{Х1, аи = а1{, i,i=i — квадратичная форма над полем Ж характеристики #=2. Следую- щая процедура дает удобный практический способ отыскания ли- нейной замены переменных xt, приводящей q к сумме квадратов (с коэффициентами). Случай 1. Существует ненулевой диагональный коэффи- циент. Перенумеровав переменные, мы можем считать, что йц=/=0. Тогда Я (хх....хп) = апх^ + х1 (2а12х2 4- • •• 4~ 2alnx„) + q' (х2, ..., хп), где q' — квадратичная форма от п—1 переменных. Выделяя полный квадрат, находим q(xx, .... х„) = ац (*! + ^-^2+ ••• + —хЛ + q" (х2, • • •, хп), где q" — новая квадратичная форма от — 1 переменных. По- лагая /Ц = Xl + аП ‘ (а12х2 + • • • + ащхп), у2 = х2, уп = хп, 110
мы получаем в новых переменных форму + •••• Уп\ и следующий шаг алгоритма состоит в применении его к q". Случай 2. Все диагональные коэффициенты равны нулю. п Если вообще q — 0, то делать ничего не нужно: q = X 0 • х2. i=i Иначе, перенумеровав переменные, можно считать, что а12 ¥= 0. Тогда <7(М....х„) = = 2а12х1х2 + xJi (х3, ..., хп) + х212 (х3, .... хп) + q' (х3) .... хп), где /1, /2— линейные формы, a q' — квадратичная. Положим Х1 = Й + f/2> = yi — у2, Xi = yit i 3. Б новых переменных форма q приобретает вид 2а12 (у[ - %2) + q" (f/P У2, Уп), где q" не содержит членов с у\, </2. Поэтому к ней можно приме- нить способ выделения полного квадрата и снова свести задачу к меньшему числу переменных. Последовательное применение п этих шагов приведет форму к виду У г?. Окончательная ли- i=i нейная замена переменных будет невырожденной, так как таковы все промежуточные замены. Последняя замена переменных щ ~ Vl ai I zi при щ =/= 0 в слу- чае Ж = R и Ui — ^UiZi при в случае Ж = С приведет форму к сумме квадратов с коэффициентами 0, ±1 или 0, 1. 2. Алгоритм ортогонализации Грама—Шмидта. Он весьма близок к описанному в предыдущем пункте, но формулируется в более геометрических терминах. Мы будем рассматривать одно- временно ортогональный и эрмитов случай. Исходными данными являются: пространство (L, g) с ортого- нальной или эрмитовой метрикой, заданной в базисе [е', ..., е'^. Пусть Li — подпространство, натянутое на е', ..., е\, i — 1, ..., п. Процесс ортогонализации, примененный к базису {ej, ..., е'^, можно рассматривать как конструктивное доказательство следую- щего результата: 3. Предложение. Предположим, что в описанных обозначениях все подпространства Li, ..., Ln невырождены. Тогда существует такой ортогональный базис {щ, ..., еп} пространства L, что ли- нейная оболочка {ei....е,} совпадает с Li для всех i = 1, ..., п. Он называется результатом ортогонализации исходного базиса {е', ..., е'}. Каждый вектор щ определен однозначно с точностью до умножения на ненулевой скаляр. 1Ц
Доказательство. Построим е(- индукцией по i. В каче- стве ci можно взять еР Если ев ..., 6i_i уже построены, будем искать Ci в виде i—i ei ~ ei — X Л/ер xi Так как {е'Р .... <} порождаЮт Ц, а {е\, e'^J и {ер ... ..., e.J порождают L;_i, любой такой вектор е, вместе с ei, ... ..., е,_] будет порождать Lt. Поэтому достаточно добиться того, чтобы в/ был ортогонален к е\, ..., et-i, или, что то же самое, к бр e'4_i. Эти условия означают, что g (е{, е^,) —О, k=l, ... ..., i — 1, или i-i Sv(e'/> e') = g(ep e'k), fe=l, .... i-1. Это система i—1 линейных уравнений для i—1 неизвестных х/. Ее матрица коэффициентов есть матрица Грама базиса {е'р пространства Lt~\. По предположению, она невырождена, так что Xj существуют и определены однозначно. Любой ненулевой вектор 61, ортогональный к L(_i, должен быть пропорционален е<. Более простая и решаемая сразу система уравнений получится, если искать е, в виде i-i считая в], ..., 61-1 уже найденными. Поскольку ei....e£_i по- парно ортогональны, из условий g(ei, в/) = 0,........— 1, на- ходим Весь смысл этого доказательства состоит в явном выписывании систем линейных уравнений, последовательное решение которых определяет в/. Заметим, что матрица коэффициентов первой си- стемы суть последовательные диагональные миноры матрицы Грама исходного базиса: Gi= (S <))> 1 < 1’ k < L Если бы мы не стремились к алгоритмичности, проще всего было бы рассуждать так: в силу предложения п. 2 § 3 и невы- рожденности Lt-i имеем Lt = Li_x ® Lf--i; dim Lj--i — dim Lt — dim Li-i — 1. Возьмем теперь в качестве е,- любой ненулевой вектор из Lr-i- 4. Замечания и следствия, а) Процесс ортогонализации Гра- ма — Шмидта чаще всего применяется в ситуации, когда g(l, /) _> О 112
для всех I е L, I =# 0, т. е. к евклидовым и унитарным простран- ствам, которые мы подробно изучим позже. В этом случае все подпространства L автоматически невырождены, и ортогонализи- ровать можно любой исходный базис. Форма g с таким свойством называется положительно определенной, и ее матрицы Грама на- зываются положительно определенными. б) В случае Ж = R или С можно строить сразу ортонормиро- ванный базис. Для этого, отыскав вектор et, как в доказательстве предложения, следует тут же заменить его на |g(e£, е,) |~1/2ez или g(et, Ci)~l/2et (для ортогональных пространств над С). в) Любой ортогональный базис невырожденного подпростран- ства Lod L можно дополнить до ортогонального базиса всего про- странства L. Действительно, L — Lo ф Lo, и в качестве дополнения можно взять ортогональный базис Lo. Искать его можно методом Гра- ма — Шмидта, если сначала как-нибудь дополнить базис Го до базиса L, позаботившись о невырожденности промежуточных под- пространств. г) Пусть (e'v ..., е^} —базис (L,g), а {еь ..., еп}— его ортогонализация. Положим at = g(ei, ej)— это единственные не- нулевые элементы матрицы Грама базиса {е(}. Будем считать, что g эрмитова или g ортогональна над R. Тогда все числа а, веще- ственны, и сигнатура g определяется количеством положительных и отрицательных чисел а,. Покажем, как восстановить ее по ми- норам исходной матрицы Грама G = ^g(e'., е'^}. Пусть G<— i-й диагональный минор, т. е. матрица Грама {е', ..., е.}. Если А{—• матрица перехода к базису {ец е(}, то det (g (б*, e;))i<ft, = . .ai = det(A-GiA) = detG/(det Ai)~ в ортогональном случае или «!...(?£= det (i4iGi/4f) = det G/[ det A, |? в эрмитовом случае. Поэтому всегда знак а1...аг = знак detG£. Итак, сигнатура формы g определяется числом положительных и отрицательных элементов последовательности В частности, форма g (и ее матрица G) положительно опреде- лена тогда и только тогда, когда все миноры det Gi положительны (напомним, что G либо вещественна и симметрична, либо комп- лексна и эрмитово симметрична). Этот результат называется кри- терием Сильвестра. Более общо, для невырожденной квадратичной формы над лю- бым полем тождество щ.. .а£ = det G{ (det Дг)2 ИЗ
показывает, что исходную форму с симметричной матрицей G и невырожденными диагональными минорами Gt можно линейным преобразованием переменных привести к виду yi det G. / я tr—"Уд det Gq = 1, Z_j detG1-_1 u ибо квадраты (detА)2, мешающие непосредственно выразить at через det Gf, можно внести сомножителями в переменные. Этот результат называется теоремой Якоби. 5. Билинейные формы на пространствах функций. Рассмотрим функции fi, f2, заданные на отрезке (а, Ь) вещественной прямой (возможно, а = —оо, Ь = оо) и принимающие вещественные или комплексные значения. Пусть G(x)—фиксированная функция от хе(а, Ь). Билинейные формы на пространствах функций в ана- лизе часто задаются выражениями типа ь gift, f2)=\G(x)fl(x)f2(x)dx а или (полуторалинейный случай) ь gift, /2)=$С(х)Мх)Ш</х. а Разумеется, G, fi и f2 должны удовлетворять каким-то условиям интегрируемости; в последующих примерах они будут выполнены автоматически. Функция G называется весом формы g. Значение ь ъ g (f, f) — \g (х) f (х)2 dx или G (х) | f (х) |2 dx а а есть взвешенное квадратичное среднее функции f (с весом G); если G 0, его можно рассматривать как некоторую интеграль- ную меру уклонения f от нуля. Типичная задача аппроксимации функции f линейными комбинациями некоторого заданного набора функций fi, ..., fn, ... состоит в поиске таких коэффициентов «1, ..., ап, ..., которые при данном п минимизируют взвешенное среднее квадратичное функции Позже будет видно, что коэффициенты а; особенно просто на- ходятся в случае, когда {f,} образуют ортогональную или орто- нормированную систему относительно скалярного произведения g. В этом параграфе мы ограничимся явным описанием нескольких важных ортогональных систем 6. Тригонометрические многочлены. Здесь 67 = 1, (а,Ь) = = (0, 2л). Тригонометрическими многочленами (или многочленами 114
Фурье) называются конечные линейные комбинации функций cosnx, sinnx йли конечные линейные комбинации функций е‘пх, n<^Z. Обычно первые применяются в теории вещественнозначных функций, а вторые — комплекснозначных. Поскольку einx «= == cos пх 4- I sin пх, над С оба пространства многочленов Фурье со- впадают. Над R используется билинейная метрика, над С — полу- торалинейная. Функции {1, cosnx, sin пх\п 1} и {einx|п е Z} ли- нейно независимы (как над R, так и над С). Кроме того, они об- разуют ортогональную систему, как следует из легко проверяемых формул: 2л 2л , „ f , с . (л при /П = П>0, \ cos тх cos пх ах = \ sin тх sin пх ах = < л J J ( 0 при т п, 2л cos тх sin пх dx = О о 2л 2л z _ г , — , с ,, , . (2л при т = п, \ eimxe,nxdx== \ e‘(m-vxdx = < J J (0 при т=£п. Системы —т=- cosnx, -Usinnx|n>ll и ( -1— etnx\n е Z уп 'у/л ) (. -у2л поэтому ортонормированы. Скалярные произведения любой функ- ции f на [0, 2л] с элементами этих ортонормированных систем на- зываются коэффициентами Фурье этой функции: 2л а0 = —L \ f (х) dx, 2л ап — —7=- \ f (х) cos пх dx, n 1, ул J и 2л Ьп — \ f (х) sin пх dx, п 1, J для вещественных функций f и 2л = —4=- f (x)e~lnxdx, V2n J n e Z, для комплексных функций. Если сама функция f является много- членом Фурье, то по формуле разложения из п. 6 § 3 имеем f W = ~7=- ао + -7= Е cos пх + bn sin пх> д/2л Vл Пб
для вещественных функций f и для комплексных функций f. Суммы справа, разумеется, конеч- ны в рассматриваемом случае. Бесконечные ряды такой структуры называются рядами Фурье. Вопрос об их сходимости вообще и сходимости к той функции f, коэффициентами Фурье которой яв- ляются ап, Ьп, в частности, исследуется в одной из важнейших глав анализа. 7. Многочлены Лежандра. Здесь G = l, (а,Ь) = (—- 1, 1). Мно- гочлены Лежандра Ро(х), Pi(x), Р2(х), ... определяются как ре- зультат процесса ортогонализации, примененного к базису {1, х,х2, ...,} пространства вещественных многочленов. Обычно они нормируются условием Pn(l)= 1. В такой нормировке их яв- ный вид дается следующим результатом: 8. Предложение. Ро (х) = 1, Рп (х) = (х2 — 1)", п > 1. Доказательство. Так как степень многочлена (х2—1)п dn равна 2/т, степень '^я-(х®—1)" равна п, так что Pi.Pt по- рождают то же пространство над R, что и 1, х, ..., х‘. Поэтому для проверки ортогональности Pi, Pj, i Ф j, достаточно убедиться, что 1 xkPn (х) dx — 0 при k < п. -1 Интегрируя по частям, получим t x‘X(x2-l)redx = J ил -1 1 1 = | -k \ xk-l^i(x2-irdx. -1 -1 Первое слагаемое обращается в нуль, ибо (х2—1)" в точках ±1 имеет корень кратности п, а каждое дифференцирование снижает кратность корня на единицу. Ко второму слагаемому можно при- менить аналогичную процедуру; после k шагов получится интеграл, пропорциональный k ЛП— k— i I ^=I(x2-irdx=^=rT(x2-l)n =0. I R dx R 1 116
Далее, по формуле Лейбница zf V-"5 [ AZ \ /7 [(х _ 1)" (х + 1)"] = У ( . I-7T (х - 1)"4m (* + 1)". ах \ к ) dxK dxn к fe«o В точке х = 1 не обращается в нуль только слагаемое, отвечаю- щее k — п, так что Р» (*) - W ( " )[-£г<* - »“]^+ = rid 1 '•1-2“= 1. что завершает доказательство. 9. Многочлены Чебышева. G=—.....I--.'.. , (а, &) = (-— 1, 1). Мно- -V 1 — X2 гочлены Тп(х), п Q, суть результат ортогонализации базиса {1,х,х2, Явные формулы: T’nU) = (~(2У V1 - х2 ~(1 — х2)"-'/2 = cos (п arc cos х). Нормировка: 1 (0 при f rmW T-n W dx = J л/2 при J V1 — xs при m =£= п, т = п =£ О, т = п = 0. 10. Многочлены Эрмита. G = e~x\ (a,b) = (—оо, оо). Много- члены Нп(х) суть результат ортогонализации базиса {1,х, х2, ...}. Явные формулы: Яп(х) = (-1)п^т(е-х’)- Нормировка: оо J е~х'Нт (х) Нп (х) dx = — оо о 2п/т1 д/л при т =£= п, при т = п. Мы оставляем доказательства читателю в качестве упражнения. УПРАЖНЕНИЯ 1. Доказать, что эрмитова или ортогональная форма g неотрицательно оп- ределена, т. е. g (/, /) 0 для всех 1&L, тогда и только тогда, когда все диа- гональные мииоры ее матрицы Грама неотрицательны. 2. Доказать утверждения п. 9 и 10 Этого параграфа. § 5. Евклидовы пространства 1. Определение. Евклидовым пространством называется конеч- номерное вещественное линейное пространство L с симметричным положительно определенным скалярным произведением. 117
Мы будем писать (Z, т) вместо g(l, т) и |/| вместо (Z, Z)1/2; число |Z| будем называть длиной вектора /. Из результатов, доказанных в § 3—4, следует, что: а) во всяком евклидовом пространстве есть ортонормирован- ный базис, все векторы которого имеют длину 1; б) поэтому оно изометрично координатному евклидову про- странству R" (л = dimL), в котором (*» Еl*l=(Е• 1 = 1 \ i=l / Ключом ко многим свойствам евклидова пространства является многократно перестирывавшееся неравенство Коши — Буняков- ского — Шварца: 2. Предложение. Для любых Ц, Z2 е L имеем (h, 4X14 II 41- Равенство достигается тогда и только тогда, когда векторы llt линейно зависимы. Доказательство. В случае R — 0 имеет место равенство и 4, Z2 линейно зависимы. Будем считать, что Ц 0. Для любого вещественного числа t имеем I «1 + 4 I2 = («1 + 4. + 4) == Z21 4 I2 + 2/ (/„ Z2) + 14 Г > 0 в силу положительной определенности скалярного произведения. Поэтому дискриминант квадратного трехчлена справа неположи- телен, т. е. (4, 4)2 —141214IX о. Он равен нулю тогда и только тогда, когда этот трехчлен имеет вещественный корень t0. В этом случае I 44 + 4 I2 = 0 Z2 = — ZqZi, что завершает доказательство. 3. Следствие (неравенство треугольника). Для любых Ц, Е, l^L 14+ 4X1 41 + 141. 14-4X1 4-41 + 1 4-41- Доказательств о. Имеем I4 + 4I2=I4 i2 + 2(4. 4) + l4Xl4l2 + 2l4ll4l + l4F- = (I4I + I4I)2- Заменив здесь 1\ на 1\ — 4 и 4 на 4 — 4, получим второе неравен- ство. 4. Следствие. Евклидова длина вектора |Z| является нормой на L в смысле определения в п. 4 § 10 ч. 1, а функция d(l, tn)~ == | Z - m | — метрикой в смысле определения п. 1 там же. Доказательство Остается проверить только, что |aZ| = I = | а 11 /1 для всех a g R, но | al | = (al, al)''2 (а21Z I2)'/2 = | а 11Z |. 118
5. Углы и расстояния. Пусть l\, l2^L— ненулевые векторы. В силу предложения п. 2 __ । <- Gi> 1г) । IZ.IIM Поэтому существует единственный угол ф, О ср л, для ко го- рого Он называется углом между векторами 1\, 12. Поскольку скаляр- ное произведение симметрично, это «неориентированный угол», чем и объясняется интервал его значений. В соответствии со школьной геометрией угол между ортогональными векторами равен л/2. Можно систематически развить евклидову геометрию на основе данных определений длины и угла и убедиться, что в размерностях два и три она совпадает с классической. Например, многомерная теорема Пифагора есть тривиальное следствие определений: если векторы /1, /„ попарно ортого- нальны, то Обычная формула косинусов в геометрии плоскости, применен- ная к треугольнику со сторонами /ь /2, /з, утверждает, что |/312 = 1 А 12 + 1А12-2 | А || |/2| соэф, где ф — угол между /1 и /2. В векторном варианте l3 = h —12, и эта формула превращается в тождество |/i -/2|2 = 1 А 12 + 1А12-2(/„ /2) в соответствии с нашим определением угла. Пусть U, VcL—два множества в евклидовом пространстве. Расстоянием между ними называется неотрицательное число d(U, VJ^infflA-AIIAet/, l2e-V}. Рассмотрим частный случай: U = {1} (один вектор), V = LoczL — линейное подпространство. В силу предложения п. 2 § 3 имеем L — Lo® L3 и l — lo + lo, где /0 е Lo, lo^Lo. Векторы /0, /о суть ортогональные проекции I на Lo, Lo соответственно. 6. Предложение. Расстояние от I до Lo равно длине ортогональ- ной проекции I на Lo- Доказательство. Для любого вектора mе Lo имеем 11 — пг | = | Iq /о — пг | = 110 — пг | -|- | /о | в силу теоремы Пифагора, ибо векторы l0 — m^L0 и lo s Lo орто- гональны. Следовательно, Ц9
и равенство достигается только в случае т = 1о, что доказывает требуемое. Если в Lo выбран ортонормированный базис {ei, .... ет}, то проекция I на Lq определяется формулой т /о = S (^> ei) ei- i=l Действительно, левая и правая части имеют одинаковые скаляр- ные произведения со всеми ei, поэтому их разность лежит в LJ-. Окончательно, т d(l, Lo)= 1-^(1, e/)ef есть наименьшее значение |/ — т\, когда т пробегает Lo-Посколь- ку |/o|2^|Z|2 по той же теореме Пифагора, имеем т Е(/. e^CI/l2. 1 = 1 7. Приложения к пространствам функций. Рассмотрим в каче- стве примера пространство непрерывных вещественных функций на [a, b]c R со скалярным произведением ь (f,g)=\fgdx. . а Оно бесконечномерно, но все наши неравенства будут относиться к конечному числу таких функций, так что каждый раз можно будет считать, что мы работаем в конечномерном евклидовом про- ь ь странстве: f2 (х) dx 0 и если fz (х) dx — 0, то f(x) = O. а а Неравенство Коши — Буняковского — Шварца приобретает вид Сь у ь ь \f(x)g (х) dx I f (х)2 dx j g (х)2 dx. а ' а а Неравенство треугольника: СЪ 4 1/2 / Ь 4 1/2 / Ь 4 1/2 \(f(x) + g(x))2dxj <( f (х)2 dx j +Hg(x)2dxJ . Если (а,Ь) = (0,2л) и щ, bi — коэффициенты Фурье функции f(x), как в п. 6 § 4, то многочлен Фурье N /л (х) = -4=- а0 + У (ап cos пх + bn sin пх) \ 2п . 4-1 12.0
является ортогональной проекцией f(x) на линейную оболочку {l,cos/u, sin пх\ 1 п N}. Поэтому коэффициенты Фурье f(x) при каждом М минимизируют среднеквадратичное отклонение f(x) от многочленов Фурье «степени» Неравенство |fw|2=^|f|2 приобретает вид N 2л Оо + ^2 + &*)<$/ U)2 dx. t-i о Поскольку правая часть не зависит от /V, а а2, &2^0, ряд оо а2+£(«? + $ 1=! сходится для любой непрерывной функции f(x) на [0,2л]. Можно 2л доказать, что он сходится в точности к j f (х)2 dx. о Совершенно аналогичные соображения применимы к многочле- нам Лежандра, Чебышева и Эрмита. Мы оставляем их в качестве упражнения читателю. 8. Метод наименьших квадратов. Рассмотрим систему пг ли- нейных уравнений для п неизвестных с вещественными коэффи- циентами п ^aijXj^bt, i=l.........m. /"i Предположим, что эта система «переопределена», т. е. m > п и ранг матрицы коэффициентов равен п. Тогда она, вообще говоря, не имеет решений. Но можно попробовать найти такие значения неизвестных х°, чтобы суммарное среднеквадратичное от- клонение левых частей от правых принимало наименьшее возможное значение. Эта задача имеет существенные практические приложения. Например, при геодези- ческих работах местность разбивается на сеть треугольников, не- которые элементы которых измеряются, а другие вычисляются по формулам тригонометрии. Поскольку все измерения приближен- ные, рекомендуется сделать их больше, чем строго необходимо для вычисления остальных элементов, ио по той же причине тогда уравнения для этих элементов почти наверняка окажутся несов- местными. Метод наименьших квадратов позволяет получить «при- ближенное решение», более надежное из-за большего количества вложенной в систему информации. Покажем, что наша задача может быть решена с использова- нием результатов п. 7. Интерпретируем столбцы матрицы коэффи- 121
циентов е(-= («!<-, ami) и столбец свободных членов f = = (Ь[, ..., Ьт) как векторы координатного евклидова простран- ства R"1 со стандартным скалярным произведением. Положив п xiet> i *=1 получим,что т / п ч 2 п 2 Е (Е aijxt — bij = Е xiet — f Поэтому минимум среднеквадратичного отклонения достигается п тогда, когда Е x<iei является ортогональной проекцией / на под- пространство, натянутое на е,. Это означает, что коэффициенты х°{ должны находиться из системы и уравнений с п неизвестными / п Ч (E/fei> е/)- /=1> •••>«> так называемой «нормальной системы». Ее определитель есть оп- ределитель матрицы Грама ((ef, е,)), где |"1 (ez, в/) == £ akiakJ. Он отличен от нуля, ибо предполагалось, что ранг исходной си- стемы, т. е. системы векторов (е<), равен п (см. упражнение 5 к § 2). Поэтому решение существует и единственно. Вернемся теперь к теме «измерения в евклидовом простран- стве». 9. n-мерный объем. На одномерном евклидовом пространстве простейшим фигурам — отрезкам и их конечным объединениям — можно поставить в соответствие длины и суммы длин. На евкли- довой плоскости школьная геометрия учит измерять площади та- ких фигур, как прямоугольники, треугольники и, с некоторым тру- дом, круги. Обобщение этих понятий дает глубокая общая теория меры, естественное место которой не здесь. Мы ограничимся спи- ском основных свойств и элементарными вычислениями, связан- ными со специальной мерой фигур в n-мерном евклидовом про- странстве— их п-мерным объемом. n-мерный объем есть функция vol", определенная на некоторых подмножествах /г-мерного евклидова пространства L, называемых измеримыми, и принимающая неотрицательные вещественные зна- чения или оо (па ограниченных измеримых множествах — только конечные значения). Совокупность измеримых множеств достаточно богата. Мы просто постулируем следующий список свойств vol" и измеримость фигурирующих в них множеств, не доказывая суще- ствование функции с такими свойствами и не указывая естествен- ную область ее определения. 122
а) Функция vol" счетно аддитивна, т. е. vol"( 0 t/j )= У, volnUt, если 0 при i ф /; vol1 (точка)—0; vol1 (отрезок )== длина отрезка. Отрезок в од- номерном евклидовом пространстве есть множество векторов вида th ф(1 — t)h, 0 t 1; его длина.есть |/i — /2|. б) Если I) s V, то vol" U vol" V. в) Если L = L\ ф £2 (ортогональная прямая сумма), dimZ.i = m, dimT2 = n, V с Т2, то для i/ХЕ = = {(h, h) | /i е U, h е V) <= L, ф £2 имеем volm+n (U X V) = vol'" U vol" V. г) Если f: L-+L— произвольный линейный оператор, то vol" (f (U)) = | det f | vol" U, n — dim L. Свойства, а), б) едва ли нуждаются в комментариях. Свойство в) является сильным обобщением формулы площади прямоуголь- ника (произведение длин сторон) или объема прямого цилиндра (произведение площади основания на длину образующей). Заме- тим, что из свойства в) вытекает, что (т фи)-мерный объем огра- ниченного множества IE в L, лежащего в подпространстве L\ раз- мерности т < т ф л, равен нулю. Действительно, тогда L = — L\®L± и IE — VX{0}, наконец, vol"({0}) = 0 при л > 0 в силу а) ив). Смысл свойства г) менее очевиден. Оно является основным вкладом линейной алгебры в теорию евклидовых объемов и слу- жит причиной появления якобианов в формализме многомерного интегрирования. Возможно, наиболее интуитивное объяснение его состоит в замечании, что оператор растяжения в а е R раз вдоль одного из векторов ортогонального базиса должен умножать объ- емы на | а | в силу свойств а) ив). Но любой ненулевой вектор можно дополнить до ортогонального базиса, поэтому диагонали- зируемый оператор f с собственными значениями а,\, ..., aneR должен умножать объемы на |щ] ... |ап| — |detf|. Наконец, изо- метрии должны сохранять объемы, и, как мы убедимся позже, любой оператор есть композиция диагонализируемого и изометрии (см. § 8, упражнение 11). Теперь, пользуясь этими аксиомами, приведем список объемов простейших и наиболее важных n-мерных фигур. 10. Единичный куб. Это множество {6в1 + ... ф tne^Os^ti^ 1}, где {cj, ..., еп}—некоторый ортонормированный базис L. Из свойств а) и в) из п. 9 сразу следует, что его объем равен единице. Куб со стороной а > 0 получится, если разрешить пробегать значения 0 ti а. Так какой является образом единичного куба относительно гомотетии — умножения на а, — его объем равен ап. 11. Параллелепипед со сторонами {Л, ..., 1п}. Это множество {/iZi Ф ... ф Z«Zn10 h1}. Мы покажем, что его объем равен 128
Vl det GI, где G =((/,-,//))—матрица Грама сторон. В самом деле, если {/ь ..., 1п} линейно зависимы, то соответствующий парал- лелепипед лежит в подпространстве размерности CdimL и его «-мерный объем равен нулю по замечанию в п. 9. В то же время матрица G вырождена. Поэтому остается разобрать случай, когда {/ь ..., 1п} линейно независимы. Пусть {еь ..., еп}—ортонормированный базис в L, a f — линейное отображение L->L, переводящее е, в i = 1, ... ..., п. Если А — матрица этого отображения в базисе {е<}: (/j, ..., /п)==(в1, , вп)А, то матрица Грама {k} равна А*А, ибо матрица Грама {е,} еди- ничная. Следовательно, Vl det G | = Vl det (ЛМ) | = | det A |. С другой стороны, | det A | = | det f |, и f переводит единичный куб в наш параллелепипед. В силу свойства г) из п. 9 объем паралле- лепипеда равен | det /[, что завершает доказательство. 12. n-мерный шар радиуса г. Это множество векторов Bn(r)={/| |Z|<4, или, в ортогональных координатах, Вп (г) == {(%,, ..., xn) £ х2{ < г2 Так как В"(г) получается из В"(1) растяжением в г раз, имеем volnBn(r) = volnBn(l)r". Константа vol"Bn(l) = bn может быть вычислена лишь аналити- ческими средствами. Рассекая (« + 1’)-мерный шар «-мерными ли- нейными подмногообразиями, ортогональными к некоторому на- правлению, получим индуктивную формулу 1 ^+1 = [ 2 J (л/1 - Хп+1)П dxn+i О J Разумеется, й1 = 2, Ь2 = л, 63=«=ул. 13. n-мерный эллипсоид с полуосями гь ..., г„. Он задается в ортогональных координатах уравнениями <1. Поскольку он получается из Вп(1) растяжениями в п раз вдоль 1-й полуоси, его объем равен Ьпгх ... гп. 14. Одно свойство «-мерного объема. Оно состоит в том, что при очень больших п «объем п-мерной фигуры сосредоточен 124
вблизи ее поверхности». Например, объем шарового кольца между сферами радиуса 1 и 1 — е равен 6„[1 — (1 — е)п], что при фикси- рованном сколь угодно малом е, но растущем п стремится к Ьп- Двадцатимерный арбуз радиуса 20 см с толщиной корки 1 см чуть не на две трети состоит из корки: Это обстоятельство играет большую роль в статистической ме- ханике. Рассмотрим, например, простейшую модель газа в резер- вуаре, состоящего из п атомов, которые будем считать материаль- ными точками массы 2 (в подходящей системе единиц). Предста- вим мгновенное состояние газа п трехмерными векторами (fi, ..., vn) скоростей всех молекул в физическом евклидовом пространстве, т. е. точкой Зп-мерного координатного пространства R3". Квадрат длины векторов в R3n имеет прямой физический смысл энергии системы (суммы кинетических энергий атомов): £=Zl^l2. /=1 Для макроскопического объема газа в нормальных условиях по- рядок п есть 1023 (число Авогадро), так что состояние газа опи- сывается точкой на сфере огромной размерности, радиус которой есть корень квадратный из энергии. Пусть два таких резервуара соединены так, что они могут об- мениваться энергией, но не атомами, и сумма их энергий Е\ -|- + Е2 = Е остается постоянной. Тогда энергии Е} и Е2 большую часть времени будут близки к таким, которые максимизируют «объем пространства состояний», доступный объединенной систе- ме, т. е. произведение vol-В (Е}/2) vol—В (Е|/2) (мы заменили площади сфер объемами шаров, что буквально не верно, но почти не влияет на результат). Так как с ростом Е[ и убыванием Е2 (Еу -|- Е2 = const) первый объем невероятно быстро растет, а второй убывает, имеется резкий пик этого произведения при некоторых значениях Еь Е2, отвечающий «наиболее вероят- ному» состоянию объединенной системы. Очевидно, это происходит там,где log vol- В (Е’/2) = 4- log vol- В(£‘/2). Обратные к этим величинам суть (с точностью до пропорциональ- ности) температуры резервуаров, и наиболее вероятное состояние отвечает равенству температур. 123
УПРАЖНЕНИЯ 1. Доказать, что угол <р наклона прямой в плоскости R2, проходящей из на- чала координат в среднеквадратичном как можно ближе к т заданным точкам (я,-, bi), i = 1, пг, определяется формулой “Л)/(Д “О- (Указание. Найти наилучшее «приближенное решение» Я;Х = bi.) 2. Пусть Р„ (х) — n-й многочлен Лежандра. Доказать, циент многочлена ип (х) = 1 _ 2” (п!)2 (2п)1 Рп (х) равен единице грала /(«) = (я (х)2 dx на множестве многочленов и(х) -1 системы уравнений что старший коэффи- и что минимум инте- степени п со старшим коэффициентом 1 достигается при и = «п. (Указание. Разложить и по многочле- нам Лежандра степени ^п.) 3. Пусть (S, р) — пара, состоящая из конечного множества S и веществен- ной функции р: S -> R, удовлетворяющей двум условиям: p(s) 5» 0 для всех s a S и У р («)•=!. Рассмотрим иа пространстве вещественных функций f(S) на S (со значениями в R) линейный функционал Е: F(5) ->-R: £(/)=£ и U) f (s). Обозначим через Fo(S) ядро Е. (S, р) называется конечным вероятностным пространством, элементы F(S)— случайными величинами на нем, элементы Fo(S)—нормированными случайными величинами, число E(f)—математическим ожиданием величины f. Случайные величины образуют кольцо относительно обычного умножения функций. Доказать следующие факты. a) F(S) и F0(S) имеют структуру ортогонального пространства с квадратор дливы вектора f, равным E(f2). Пространство F(S) евклидово тогда и только тогда, когда p(s) > 0 для всех seS. б) Для любых случайных величин f,g е F(S) ня, b е R положим Р(/ = я)== У р($); Р (/ = я; £==&) = У р (s) fts&a g(s)-b («вероятности того, что f принимает значение а или f = а и g =• Ь одновремен- но»). Назовем две случайные величины независимыми, если Р (f = a; g= b) = Р (f = а) Р (g —Ь) при всех a, b @ R. Доказать, что если нормированные случайные величины f,ge=F0(S) независимы, то они ортогональны. Построить пример, показывающий, что обратное неверно. Скалярное произведение величин f, gePo(S) называется их ковариацией, а косинус угла между ними — коэффициентом корреляции. § 6, Унитарные пространства 1. Определение. Унитарным пространством называется комп- лексное линейное пространство L с эрмитовым положительно on- ределенным скалярным произведением, 126
Как в § 5, мы будем писать (1,т) вместо g(l,m) и |/| вместо (/,/)1/2. Ниже мы убедимся, что | /| является нормой на L в смысле § 10 ч. 1. Унитарные пространства, полные относительно этой нормы, называются также гильбертовыми. В частности, конечно- мерные унитарные пространства гильбертовы. Из результатов, доказанных в § 3—4, следует, что: а) всякое конечномерное унитарное пространство имеет орто- нормированный базис, все векторы которого имеют длину 1; б) поэтому оно изоморфно координатному унитарному про- странству С" (n = dim L) со скалярным произведением -> -> Л > ( п у/2 (х, у) = £ Xigi, I х | = I £ | Xi I2 1 - >=1 \i-l / Ряд свойств унитарных пространств близок к свойствам евкли- довых, главным образом по следующей причине: если L — конеч- номерное унитарное пространство, то на его овеществлении LR имеется (единственная) структура евклидова пространства, в ко- торой норма |/| вектора та же, что и в L. Существование видно из предыдущего абзаца: если {еь ..., е„}—ортонормированный базис L, a {et, ie\, e2,ie2, ..., en,ien}—соответствующий базис Lr, то п 2 п п Z XjGj = X I Xj |2 = х ((Re x,)2 + (Im x,)2), i-i /=i f-i и выражение справа есть евклидов квадрат нормы вектора п п У Re х.е, + У Im х, (щ.) в ортонормированном базисе (е/,1еЛ. /-1 /-1 Единственность следует из п. 9 § 3. Однако скалярные произведения в унитарном пространстве L и евклидовом £r не совпадают: второе принимает только веще- ственные значения, а первое — комплексные. На самом деле, эрми- тово скалярное произведение на комплексном пространстве приво- дит не только к ортогональной, но и к симплектической структуре на £r с помощью следующей конструкции. Временно мы возвращаемся к обозначению g(l,m) для эрми- това скалярного произведения на £ и положим a(l, m) = Re g(l, пг), b{l, m) = Img(/, щ). Тогда имеют место следующие факты: 2. Предложение, а) а(1, пг) — симметричное, a b(l,m)—анти- симметричное скалярное произведение на Ьц ; оба они инвариантны относительно умножения на i, т. е. канонической комплексной структуры на Lr: a(il, im) — a(l, m), b(il, im)= b(l, tn); б) a и b связаны следующими соотношениями: a (I, m) = b (il, tri), b(l, m)~ — a (il, tri); 127
в) любая пара связанных Соотношениями б) [-инвариантных форм а, Ь на Lr, первая из которых симметрична, а вторая анти- симметрична, определяет эрмитово скалярное произведение на L по формуле g (l,m) — a (I, m) + ib {I, m); г) форма g положительно определена тогда и только тогда, когда форма а положительно определена. Доказательство. Условие эрмитовой симметрии g(l, m) — = g(m, I) равносильно тому, что a (I, m) + ib (I, т) — а (т, 1) — ib (т, I), т. е. симметрии а и антисимметрии Ь. Условие g(il,im) — = iig(l, т) — g(l, т) равносильно /-инвариантности а и Ь. Условие С-линейности g по первому аргументу означает R-линейность и линейность относительно умножения на i, т. е. а (И, т) + ib {it, т) = g (И, т) = ig (I, tri) = — b (/, т) -|- ia (/, т), откуда следуют соотношения б) и утверждение в). Наконец, g(1,1) = а(/, /) в силу антисимметрии Ь, откуда следует г). 3. Следствие. В прежних обозначениях, если g положительно определена и{е\, ..., е„)—ортонормированный базис для g, то {ci, ..., еп, iei, ..., ien} является ортонормированным базисом для а и симплектическим для Ь. Наоборот, если L — 2п-мерное вещественное пространство с евклидовой формой а и симплектической Ь, а также базисом {еь ..., еп, вп+1, .... егп}, ортонормированным для а и симплекти- ческим для Ь, то, введя на L комплексную структуру с помощью оператора J(ef) = en+I, J(el) = — ei^n, n+l</<2n, и скалярное произведение g(l, m) = a(l, m)-f- ib(I, m), мы получим комплексное пространство с положительно определенной эрмито- вой формой, для которого {вь ..., еп} является ортонормирован- ным базисом над С. Доказательство получается простой проверкой с помощью предложения п. 2, и мы оставляем его читателю. Вернемся теперь к унитарным пространствам L. Комплексное неравенство Коши — Буняковского — Шварца имеет следующий вид: 4. Предложение. Для любых /ь /2 L КА, /2)l2<Uil2|/2l2, причем равенство достигается тогда и только тогда, когда век- торы l\, lz пропорциональны. Доказательство. Как в п. 2 § 5, для любых веществен- ных I имеем |Z/i + /2 |2 = /2| |2 + 2/ Re (/„ /2) +1 /2 |2> 0. 128
Случаи / = 0 тривиален Считая, что Ц #= 0, выводим отсюда, что (Re(/>, /2))2<|/1|2|/2|2- Но если (/1,/2) = | (А, M k‘<f, феК, то Re(e-“*)/1,/2) = | (/ь/2) |. Поэтому КА, 4)12<|е-Ч I2 К212 = IA I2 К212- Строгое равенство здесь достигается тогда и только тогда, когда | /ов_‘ч’/1 + /2| = 0 для подходящего t0 е R, что завершает доказа- тельство. В точности так же, как в евклидовом случае, отсюда выводятся следствия: 5. Следствие (неравенство треугольника). Для любых /1, /2, <= L K.+AICIAI+IAI, \ll-lZ\^\ly-h\ + \h-h\- 6. Следствие. Унитарная длина вектора |/| является нормой на L в смысле определения в п. 4 § 10 ч. 1. (Здесь несколько изменяется проверка свойства |al\ = |а||/|: | al | = (а/, al)'12 = (аа (/, /))1/2 = | а 1111.) 7. Углы. Пусть /1, /2 е L — ненулевые векторы. В силу предло- жения п. 4 оI (/1, Ml , Поэтому существует единственный угол ср, 0 ф л/2, для ко- торого Однако в важнейших естественнонаучных моделях, использующих унитарные пространства, эта же величина “jTyjTl (точнее> ее квадрат) интерпретируется не как косинус угла, а как вероят- ность. Опишем вкратце постулаты квантовой механики, включаю- щие такую трактовку. 8. Пространство состояний квантовой системы. В квантовой механике постулируется, что с такими физическими системами, как электрон, атом водорода и т. п„ можно связать (неодно- значно!) математическую модель, состоящую из следующих дан- ных. а) Унитарное пространство Уб, называемое пространством со- стояний системы. Такие пространства, рассматриваемые в стан- дартных учебниках, по большей части являются бесконечномер- ными гильбертовыми пространствами, которые реализуются как пространства функций на моделях «физического» пространства или пространства-времени. Конечномерные пространства Ус 129
возникают, грубо говоря, как пространства внутренних степенен свободы системы, если она рассматривается как локализованная пли если ее движением в физическом пространстве можно так или иначе пренебречь. Таково двумерное унитарное пространство «спиновых состояний» электрона, к которому мы еще вернемся. б) Лучи, т. е. одномерные комплексные подпространства в Ж, называются (чистыми) состояниями системы. Вся информация о состоянии системы в фиксированный момент времени определяется заданием луча L ст % или ненулевого век- тора ф е L, который называется иногда ^-функцией, отвечающей этому состоянию, или вектором состояния. Фундаментальный постулат о том, что ф-функции образуют комплексное линейное пространство, называется принципом супер- п позиции, а линейная комбинация У, п,ф/, а/ е С, описывает / = । суперпозицию состояний фь ..., фл. Заметим, что, поскольку физи- ческий смысл имеют только лучи Сф/, а не сами векторы ф;, коэф- фициентам а, также нельзя приписать однозначно определенного смысла. Однако, если выбирать ф/ нормированными, |ф;|2= 1, п и линейно независимыми, а также нормировать У О/фр то произ- вол в выборе вектора ф, в своем луче сводится к умножениям на числа е'Т/, которые называются фазовыми множителями-, таков же будет произвол в выборе коэффициентов а,, которые мы смо- жем тогда сделать вещественными и неотрицательными, что вместе 11 с условием нормировки У а/ф; 1 позволяет определить их /=1 однозначно. Сильно идеализированные предположения о связи этой схемы с реальностью состоят в том, что у нас имеются физические при боры («печки»), способные приготовлять много экземпляров нашей системы в мгновенных состояниях ф (точнее, Сф) для раз- личных ф Сверх того, имеются физические приборы В, («фильтры»), на вход которых подаются системы в состоянии ф, на выходе обнаруживаются они же в некотором (возможно, дру- гом) состоянии х, или же не обнаруживается ничего (система «не проходит» через фильтр В ). Второй основной (после принципа суперпозиции) постулат квантовой механики состоит в том, что: система, приготовленная в состоянии ф е 3%, может быть сразу же после этого обнаружена в состоянии с вероятностью I (Ф. %) I2 IФ I21 х I2 — cos2 6, где 0 — угол между ф и у.. В дальнейшем, по мере введения дополнительных геометриче- ских понятий, мы уточним математическое описание «печек» и «фильтров». Сверх того, мы объясним, что произойдет, если при- готовленную в состоянии ф систему ввести в фильтр не сразу, а 130
по истечении времени t: оказывается, что в промежутке состояние яр, а вместе с ним и скалярное произведение (ф, %) будет меняться, и это изменение также прекрасно описывается в терминах линей- ной алгебры. Если -ф, х нормированы, го указанная выше вероятность равна |(ф, X) |2, а само скалярное произведение (ф,х)> являющееся комплексным числом, называется амплитудой вероятности (пере- хода от ф к х). Заметим, что физики вслед за Дираком обычно рассматривают скалярные произведения, антилинейные по перво- му аргументу, и записывают наше (ф, х) в виде <х|ф>, так что начальное и конечное состояние системы расположены справа на- лево. Скобки < > по английски называются «bracket». Соответ- ственно, Дирак называет символ |ф> «кет-вектором», а символ <х| — соответствующим «бра-вектором». С математической точки зрения, |ф> есть элемент Ж а <ф|— соответствующий ему эле- мент пространства антилинейных функционалов -&*, и <х|ф> есть значение х на ф. Если ф, х ортогональны, т. е. (ф, х) = 0, т0 систему, приготов- ленную в состоянии ф, нельзя будет (сразу же после приготовле- ния) обнаружить в состоянии х, т. е. она пе пройдет через фильтр В7 (наоборот, через фильтр ZAj, она пройдет с достоверностью). Во всех остальных случаях ненулевая вероятность перехода от ф к х имеется. Элементы любого ортонормированного базиса {ф)......ф„) об- разуют набор базисных состояний системы. Предположим, что у нас есть фильтры В^, .... В^п. Многократно пропуская через них п системы, приготовленные в состоянии ф = У, а/ф,, 0 at 1 i=i (вектор считается нормированным), мы обнаружим ф,- с вероят- ностью а~г Таким образом, коэффициенты этой линейной комби- нации могут быть измерены экспериментально, однако в принци- пиально статистическом опыте. Это одна из причин, по которым квантовомеханические измерения требуют обработки большого статистического материала. Впрочем, часто системы в состоянии Ф идут в фильтр «потоком» и на выходе вероятности а2 получают- ся в виде интенсивностей, чего-то вроде «спектральных линий»; эти интенсивности сами по себе уже являются результатом статисти- ческого усреднения. В дальнейшем мы уточним связь этой схемы с теорией спектров линейных операторов. 9. Правила Фейнмана. Пусть в выбран ортонормированный базис {фь ..., фп}. Для любого вектора состояния фе^ имеем п Ф — £ (Ф, Ф«) ф/, 1 — 1 откуда п (Ф> Х)= Е (Ф> Ф.ИФо х). i-1 131
Аналогично, (-ф, яр,) = £ (яр, яр,)(яр,-, яр,): подставляя эту формулу j=i в предыдущую, получим п (Ф, х)=.Е (Ф, Ф».)(Ф/„ Фь)(Ф«» х) /ь *2“1 и вообще для любого т 1 п (ф, х) = Е (ф> ФО (Фл, фо • • • (Ф,-, х)- '..........1т“1 Эти простые формулы линейной алгебры можно интерпретировать, по Фейнману, как законы «комплексной теории вероятностей», от- носящиеся к амплитудам вместо вероятностей. Именно, будем рассматривать последовательности типа (яр, ф([, яр,2, яр/т, %) как «классические траектории» системы, последовательно пробегаю- щей состояния в скобках, а число (яр, ф<,)(ф/|, Фг2) • • • (Ф<т. X) — как амплитуду вероятности перехода из яр в % вдоль соответствую- щей классической траектории. Эта амплитуда является произведением амплитуд переходов вдоль последовательных от- резков траектории. Тогда приведенная выше формула для (яр, х) означает, что эта амплитуда перехода есть сумма амплитуд перехода от яр к у по всевозможным классическим траекториям («одинаковой длины»). Бесконечномерный и более рафинированный вариант этого за- мечания, в котором основную роль играют пространственно-вре- менные (или энергетически-импульсные) наблюдаемые, Р. Фейн- ман положил в основу своей полуэвристической техники выраже- ния амплитуд через «континуальные интегралы по классическим траекториям». Пространство траекторий является бесконечномер- ным функциональным пространством, и математикам до сих пор не удалось построить общую теорию, в которой были бы оправ- даны все замечательные вычисления физиков. 10. Расстояния. Расстояние между подмножествами в унитар- ном пространстве L можно определить точно так же, как в евкли- довом: d(U, V) = inf {| Z, — /2II Zj /2<== V}. Расстояние от вектора I до подпространства Lo также равно длине ортогональной проекции I на Lo- Доказательство ничем не отличается от евклидова случая. В частности, если ..., ет) — ортонормированный базис Lo, то d(l, Lo) = т ед Ci i=l как в евклидовом случае, и т 2 т H^edei =E1U. i == i i ** * по теореме Пифагора, isa
11. Приложение к пространствам функций. Как в § 5 и 4, мы можем вывести неравенства для комплекснозначных функций: ь \f(x)g (х) dx а b Ъ < I f (х) I2 dx | g (х) |2 dx, а а \f(x) + g (х) |2 dx а также для их коэффициентов Фурье. Рассматривая функции на отрезке [0,2л] и полагая 2л \ f (х) е ~lnx dx, Л/2л J получаем, что в пространстве со скалярным 2л J f(x)g(x)dx сумма о N произведением Е а’е‘“ п=~ -N является ортогональной проекцией [ на пространство многочленов Фурье «степени и минимизирует среднеквадратичное откло- нение f от этого пространства. В частности, Л 2л У I ап I2 «С $ Ifwfdx, n=~N О со так что ряд У, | ап |2 сходится. -- оо § 7. Ортогональные и унитарные операторы 1. Пусть L — линейное пространство со скалярным произведе- нием g. Множество всех изометрий f: L-+L, т. е. обратимых ли- нейных операторов с условием для всех /1,. (2^ L, очевидно, образует группу. Если L — евклидово пространство, такие операторы называются ортогональными, а если L унитарно, то унитарными. Симплектические изометрии будут рассмотрены позже. 2. Предложение. Пусть L — конечномерное линейное простран- ство с невырожденным скалярным произведением ( , ), симмет- ричным или эрмитовым. Для того чтобы оператор f: L-> L был 133
изометрией, необходимо и достаточно, чтобы выполнялось любое из следующих условий: а) (/(/), )(/)) = (/,/) для всех 1<=L (здесь предполагается, что характеристика поля скаляров отлична от двух); б) пусть {ei, еп}—базис в L с матрицей Грама G, А— матрица оператора f в этом базисе. Тогда A'GA = G, или AfGA — G; в) f переводит некоторый ортонормированный базис в ортонор- мированный базис; г) если сигнатура скалярного произведения равна (р, q), то матрица оператора f в любом ортонормированием базисе {в\, ... ..., ер, ep+i, ..., ер+д} с (е,, е,) — 4-1 при i^p и (&, е,) = — 1 при р 4- 1 р 4- q удовлетворяет условию или в симметричном и эрмитовом случае соответственно. Доказательство, а) В симметричном случае это утверж- дение следует из п. 9 § 3: если f сохраняет квадратичную форму (/, l)—q(l) , то f сохраняет и ее поляризацию (I, m) = ~ [q(l 4- т) — q (/) — q(m)\. В эрмитовом случае имеем аналогично Re (/,-т) = ^[q(l-\-m) — q(l) — q (m)] и предложение п. 2 § 6 показывает, что (/, т) однозначно восста- навливается по Re(/, т) по формуле (/, т) — Re (I, т) — i Re (il, т) и потому / сохраняет (I, т). б) Если f — изометрия, то матрицы Грама базисов {ei, ..., еп} и {ffej, ..., f(en)} совпадают. Но последняя матрица Грама равна A‘GA в симметричном ц A‘GA в эрмитовом случае. Наоборот, если [ переводит базис {е,, ..., enj в (е', .. , е'} и матрицы Грама базисов {ej и {ej совпадают, то f — изометрия в силу формул ко- ординатной записи скалярного произведения из п. 2 § 2. в), г). Эти утверждения являются частными случаями преды- дущих. Из предложения п. 2 следует, что ортогональные (соответ- ственно унитарные) операторы — это операторы, которые в одном (и потому в любом) ортонормированном базисе задаются ортого- 134
нальными (соответственно унитарными) матрицами, т. е. матри- цами U, которые удовлетворяют соотношениям UU1 = Е„ или UU1 = Еп. Множества таких матриц размера л X л были введены впервые в § 4 ч. 1; они обозначались О (л) и 11(л) соответственно. Анало- гично, матрицы изометрий в ортонормированных базисах сигна- тур (Р, #)> удовлетворяющие условиям г) предложения 2, обозна- чаются О(р, q) и U(p. р); при р, q^O они называются иногда псевдоортогональными и псевдоунитарными соответственно. В этом параграфе мы будем заниматься только группами О (л) и U(n). Фундаментальная для, физики группа Лоренца 0(1,3) будет изу- чена в § 10. 3. Группы U(l), 0(1) и 0(2). Из определения немедленно следует, что 1'(1) = {оеС || л | = 1} = {е1т|<ре R}, О(1) = {+ 1} = U(l)d R. Далее, если L;eO(n), то 1ЛЛ = Еп, откуда (det U)2 — 1 и det U = ± 1. Если U — ( ° * ) — ортогональная матрица с опре- делителем —1, то — ортогональная матрица с опре- делителем 1, принадлежащая SO(2). Матрицы из SO(2) имеют вид {(с — be = а2 Ь2 = с2 d? = 1, ас + bd — о|. Очевидно, любую такую матрицу можно представить в виде /cosqp — sintpX ( 2я) \ sin ф cos ф 7 1 т. е. она задает евклидов поворот на угол ф. Отображение U (D-> SO (2): (COS<]P ~sin‘p') ' ' ' ’ \ sin ф cos ф 7 является изоморфизмом. Его геометрический смысл объясняется следующим замечанием: овеществление одномерного унитарного пространства (С1, |z|2) есть двумерное евклидово пространство (R!, х2 + х£), а овеществление унитарного преобразования гь->е‘Чг задается матрицей поворота на угол ф. В § 9 мы построим значительно менее тривиальный эпимор- физм SU(2)->SO(3) с ядром {±1}. (cos ф — sin ф \ п , sin cos ф ) на угол Ф б, л не имеют соб- ственных векторов в R2 и потому не диагонализируемы. Наоборот, все матрицы C;s0(2) с det U = —I диагонализируемы. Точнее говоря, характеристический многочлен матрицы / cos ф — sin (р \ \ — sin ф — cos ф J 135
равен t2— 1 и имеет корни ±1. Легко проверить непосредственно, что соответствующие этим корням собственные подпространства ортогональны; ниже это будет доказано в гораздо большей общности. Поэтому любой оператор из 0(2) с det U — —1 является отражением относительно некоторой прямой: он действует тожде- ственно на этой прямой и меняет знак векторов, ортогональных к ней. Пользуясь этой информацией, мы можем теперь установить структуру общих ортогональных и унитарных операторов. 4. Теорема, а) Для того чтобы оператор f в унитарном про- странстве был унитарным, необходимо и достаточно, чтобы он диагонализировался в ортонормированном базисе и имел спектр, расположенный на единичной окружности в С. б) Для того чтобы оператор f в евклидовом пространстве был ортогональным, необходимо и достаточно, чтобы его матрица в подходящем ортонормированном базисе имела вид Л (<pi) Л (<рт) Л (ф) = ( cos ф — sin ф sin ф cos ф где на пустых местах стоят нули. в) Собственные векторы ортогонального или унитарного опе- ратора, отвечающие разным собственным значениям, ортого- нальны. Доказательство а) Достаточность утверждения оче- видна: если U = diag(Xi, ..., Х„), |Х,|2 — 1, то UU1 = Еп, так что U — матрица унитарного оператора. Наоборот, пусть /— унитарный оператор, X — его собственное значение, Ц. — соответствующее собственное подпространство. По предложению п. 2 § 3 имеем L = LK®L^. Подпространство Lx одномерно, /'-инвариантно, и ограничение / на Lx является одномерным унитарным оператором, поэтому leU(l), т. е. |Х|2= 1. Если мы покажем, что подпро- странство L£ также /-инвариантно, то индукцией по dim/, от- сюда можно будет вывести, что L разлагается в прямую сумму /-инвариантных попарно ортогональных одномерных подпро- странств, что докажет требуемое. 136
В самом деле, если /0 еЦ, 10 =# 0 и (/о, 0 = 0. то (4, /(/)) = (/(А-'/о), /(/)) = (А-'/о, /) = Л-'(/и, /) = 0, так что б) В ортогональном случае рассуждения аналогичны: непо- средственно проверяется достаточность условия и затем проводит- ся индукция по dim Л. Случаи dim А = 1,2 разобраны в предыду- щем пункте. Если dimZ.^3 и f имеет вещественное собственное значение X, нужно снова положить L — Z.a@Z.A и рассуждать, как выше (заметим, что здесь обязательно Х=±1). Наконец, если f не имеет вещественных собственных значений, то следует выбрать двумерное /-инвариантное подпространство Lo cz L, которое суще- ствует по предложению п. 16 § 12 ч. 1. На нем матрица ограни- чения / в любом ортонормированием базисе будет иметь вид А (ср) в силу предыдущего пункта. Поэтому остается проверить, что под- пространство L+ также /-инвариантно. Действительно, если Uo> /) — 0 для всех /о е Lo, то (/о, f(/)) = (f(Z“1(/o)). /(/)) = (Г1 (/о). 0 = 0, ибо /-1(/о)^^о Для всех /0 е Lo. Это завершает доказательство. в) Пусть Kill, i = 1, 2. Тогда (Л, У = №М(М) = ^(11( 4). Так как |Х,|2= 1, при Xi =/= Х2 имеем AiA2=/=1. Следовательно, (Л, /2) = 0. Это рассуждение применимо одновременно к унитар- ному и ортогональному случаю. Доказательство окончено. 5. Следствие («теорема Эйлера»). В трехмерном евклидовом пространстве любое ортогональное отображение f, не меняющее ориентацию (т. е. элемент группы SO(3)), является вращением относительно некоторой оси. Доказательство. Так как характеристический многочлен / имеет степень 3, у него обязательно есть вещественный корень. Если он единственный, то он должен быть равен 1, ибо det / = 1. Если есть больше одного вещественного корня, то все корни ве- щественные, и возможны комбинации (1, 1, 1) или (1, —1, —1). В любом случае собственное значение 1 имеется. Соответствую- щее собственное подпространство является осью вращения, а в ортогональной к нему плоскости индуцируется элемент SO (2), т. е. вращение на некоторый угол. § 8. Самосопряженные операторы 1. В первой части мы видели, что простейший и наиболее важ- ный класс линейных операторов образуют диагонализируемые опе- раторы. Оказывается, что в евклидовых и унитарных простран- ствах совершенно особую роль играют операторы с вещественным спектром, диагонализируемые в некотором ортонормированном ба- зисе. Иными словами, эти операторы осуществляют вещественные 137
растяжения пространства вдоль системы попарно ортогональных направлений. Пусть {в|, е,,}—ортонормированным базис в L и): L->- L — оператор, для которого Де,)= Ket, е R, i = 1, п. Нетрудно убедиться, что он обладает следующим простым свойством: (НЛ), /2) = (А. Z(/2)) ДЛЯ всех lit l2f= L. (1) Действительно, (F (Е ^ег)> Е У/е/) = Е KxttJi или Е КЬУо (Е НЕ «//•₽/)) = Е Мг//< ИЛИ Е (в унитарном случае вещественность X, использовалась во второй формуле). Операторы со свойством (1) называются самосопря- женными, и мы установили, что операторы с вещественным спек- тром, диагонализируемые в ортонормированном базисе, самосопря- жены. Вскоре мы докажем и обратное утверждение, но сначала исследуем свойство самосопряженности более систематично. 2. Сопряженные операторы в пространствах с билинейной фор- мой. В первой части курса мы показали, что для любого линей- ного отображения /: L-+M существует единственное линейное отображение /*: М* -> L*, для которого (Г(т‘), 0 = ("Л НО). где т*Е М*, I е L и где скобки означают канонические билиней- ные отображения L* X L -* Ж, М* XM-t-Jf. В частности, при М — L оператору /: L-+L отвечает оператор /*: L*-+L*. Предположим теперь, что на L имеется невырожден- ная билинейная форма g: LXL-^-X, определяющая изоморфизм g: L-+L*. Тогда, отождествив L* с L посредством g~\ мы можем рассмотреть /*, точнее g~’°f*°g, как оператор на L. Мы по-преж- нему будем обозначать его /* (точнее было бы писать, например, но f* в старом смысле в этом параграфе больше не будет фигурировать) Очевидно, новый оператор однозначно опреде- ляется формулой g (Г (0. m) = g (/, f (m)). Он по-прежнему называется сопряженным с f (относительно ска- лярного произведения g). В полуторалинейном случае g определяет изоморфизм L с L*, а не с £*. Поэтому на L с помощью этого изоморфизма следует переносить оператор f*: £*->£*, который определяется как f* (т) — f*(т). Перенесенный оператор g~l°f*°g: L-+L линеен. Следовало бы обозначить его /+, но мы сохраним более традицион- ное обозначение /*. Тогда и в полуторалинейном случае будет справедлива формула g(/‘(О, m)^g(l, 138
Операция fлинейна, если g билинейна, и антилиненна, если g полуторалинейна. Операторы f: L -> L со свойством f* = f в евклидовых и конеч- номерных унитарных пространствах называются самосопряжен- ными, в евклидовом случае —также симметричными, а в унитар- ном— эрмитовыми. Эта терминология объясняется следующим простым замечанием. 3. Предложение. Если оператор f: L-+ L в ортонормированном базисе задается матрицей А, то оператор f* задается в этом же базисе матрицей А' (евклидов случай) или А‘ (унитарный слу- чай) . В частности, оператор самосопряжен тогда и только тогда, когда его матрица в ортонормированном базисе симметрична или эрмитова. Доказательство. Обозначая скалярное произведение в L скобками, а векторы — столбцами их координат в ортонормиро- ванном базисе, имеем (f (х), у) = (Лх/ у = (х'Лг) у = х1 (А*у) = (х, Г (у)) (евклидов случай). Отсюда и следует, что матрица f* равна А1. Унитарный случай разбирается аналогично. 4. Самосопряженные операторы и скалярные произведения. Пусть L — пространство с симметричным или эрмитовым скаляр- ным произведением ( , ). Для любого линейного оператора L-+L мы можем определить новое скалярное произведение (, )j на L, положив (/1, z2)f = (H/i), 4)- Предположим, что L невырождено, так что мы можем пользо- ваться понятием сопряженного оператора. Тогда (/2, A)f = (f(/2), Z1)==(Z2. Г (М) = (Г (6). /2) = (/ь /2)г в евклидовом случае, и аналогично (/2,li)f = (f(l2), /,) = (/2, Г(11)) = (Г(11), /2) = (6, /2)р в унитарном. Следовательно, если оператор f самосопряжен, то построенная по нему новая метрика (ti, l2)f будет по-прежнему симметричной или эрмитовой. Верно и обратное, как нетрудно убедиться прямо или с помощью предложения п. 3. Таким образом, мы установили биекцию между множествами самосопряженных операторов, с одной стороны, и симметричных скалярных произведений в пространстве, где одно невырожденное скалярное произведение задано, — с другой. В евклидовом и уни- тарном случае после выбора ортонормированного базиса соответ- ствие легко описывается на матричном языке: матрица Грама ( , )f транспонирована к матрице отображения f. 139
Теперь мы докажем основную теорему о самосопряженных операторах, параллельною теореме п. 4 § 7 об ортогональных и унитарных операторах и тесно с ней связанную. 5. Теорема, а) Для того чтобы оператор f в конечномерном евклидовом или унитарном пространстве был самосопряжен, не- обходимо и достаточно, чтобы он диагонализировался в ортонор- мированном базисе и имел вещественный спектр. б) Собственные векторы самосопряженного оператора, отве- чающие разным собственным значениям, ортогональны. Доказательство, а) Достаточность мы проверили в на- чале этого параграфа Вещественность спектра в унитарном слу- чае устанавливается просто: пусть К — собственное значение опе- ратора f, I е L — соответствующий собственный вектор. Тогда Л (Z, /) = (/(/), /) = (/, f(/)) = X(/, I), откуда Х = Х, ибо (/, /)-У=0. Ортогональный случай сводится к уни- тарному следующим приемом: рассмотрим комплексифицирован- ное пространство £с и введем на нем полуторалинейное скаляр- ное произведение по формуле (/, -ф Иг, /3 + 1Ц) — (Ц, /3) -Т (/2, Ц) 4~ i (Izt /3) — i Ui. Id- Легкая прямая проверка показывает, что Lc превращается в унитарное пространство, a fc — в эрмитов оператор на нем. Спектр оператора fc совпадает со спектром оператора f, ибо в любом R-базисе L, являющемся в то же время С-базисом Lc, f и fc за- даются одинаковыми матрицами. Поэтому спектр оператора / ве- ществен. Дальше оба случая можно рассматривать параллельно и про- вести индукцию по dim L. Случай dimL=l тривиален. При dim L > I выберем собственное значение X и отвечающее ему соб- ственное подпространство Д, затем положим Д = L,L По предло- жению п. 2 § 3 имеем L — L$® L\. Подпространство Ц инва- риантно относительно Д потому что если /0 ё= Lo, /0 =/= О и I е L\, т. е. (/о,/) = 0, то (/о, f(0) = (f(U 0 = М/О, 0 = 0, так что По индуктивному предположению ограничение иа L\ диагонализируется в ортонормированном базисе L\. Доба- вив к нему вектор /0 е Lv, | Zo | = 1, получим требуемый базис в L. б) Пусть /(/i) = Xi/i, /(/2) = Х2/2. Тогда МО. /2) = (/(0). /2) = (0, f(/2)) = ^(/i. 4), откуда следует, что если Xi =/= А.2, то (/ь /2) = 0. 6. Следствие. Любая вещественная симметричная или комплекс- ная эрмитова матрица имеет вещественный спектр и диагонали- зируема. Доказательство. Построим по матрице А самосопряжен- ный оператор в координатном пространстве R" или С" с канони- 140
ческой евклидовой или унитарной метрикой и применим теорему п. 5. Из нее видно даже больше: матрицу X такую, что Х~'АХ диагональна, можно найти в О(п) или в U(n) соответственно. 7. Следствие. Отображение ехр: и («)->- U(n) сюръективно. Доказательство Алгебра Ли u(n) состоит из антиэрми- товых матриц (см. § 4 ч. 1), а любая антиэрмитова матрица имеет вид iA, где А — эрмитова матрица. Чтобы решить относительно А уравнение ехр (iA )= U, где U е U(n), реализуем U как унитарный оператор [ в эрмитовом координатном пространстве С". После этого по теореме п. 4 § 7 найдем в С" новый ортонормированный базис {еь ..., еп}, в котором матрица оператора f имеет вид diagfe'4''...зададим в этом базисе оператору матрицей diag(<pi, ..., ф„) и обозначим через А матрицу оператора g в ис- ходном базисе. Очевидно, exp(zg)=f и ехр(ц4) — U. 8. Следствие, а) Пусть gt, g2— две ортогональные или эрми- товы формы в конечномерном пространстве L, и одна из них, ска- жем gi, положительно определена. Тогда в пространстве L суще- ствует базис, матрица Грама которого относительно gt единична, а относительно g2 диагональна и вещественна. б) Пусть g\. g2 — две вещественные симметричные или комп- лексные эрмитово симметричные формы относительно переменных Xi, ..., хп\ i/i..уп, и gi положительно определена. Тогда с по- мощью невырожденной линейной замены переменных (общей для х и у) эти две формы можно привести к виду п > + п gl (X, у) — £ хрур g2(x, у)= £ TiXtl/t, Xi €= R, i= 1 i = i или > -> п + + п gt (х, у)= £ ХЩГ, g2(x, у)=- £ TiXit/i, R. 1= I i=l Доказательство. Очевидно, обе формулировки эквива- лентны. Чтобы доказать их, рассмотрим (L,gt) как ортогональное или унитарное пространство, переобозначим gt(L, 12) через (Ц, /2) и представим g2(h,l2) в виде (/ь l2)j, где f: L-+L— некоторый самосопряженный оператор, как это было сделано в п. 4. После этого найдем ортонормированный базис в L, в котором f диагона- лизируется. По замечанию в конце п. 4 этот базис будет удов- летворять требованиям следствия (точнее, утверждения а)). 9. Ортогональные проекторы. Пусть L — линейное простран- ство над Ж и пусть дано его разложение в прямую сумму: L — = Lt ф L2. Как было показано в ч. 1, оно определяет два проек- тооа рр. L-+ L таких, что Im pt — Lt, idi — P\ -j- p2, Ptp2 = p2pt = 0, p‘1i — p{. Собственные значения проекторов равны 0 или 1. Если L — евклидово или унитарное пространство и L2 = Lf, то соответствующие ортогональные проекторы диагонализируются в ортонормированном базисе L — объединении таких базисов Lt и L2 — и потому самосопряжены. Наоборот, любой самосопряженный 141
проектор р есть оператор ортогонального проектирования на подпространство. Действительно, Кегр и Imp натянуты на соб- ственные векторы р, отвечающие собственным значениям 0 и 1 со- ответственно, так что Кег р и Im р ортогональны по теореме п. 5 и L —- Ker р ® Im р. Далее, если самосопряженный оператор / диагонализируется в ортонормированном базисе {ej, f(ei} = ^iei, и pi — ортогональный проектор L на подпространство, натянутое на е,-, то (2) 1 = 1 Эта формула называется спектральным разложением оператора f. Можно считать, что X, пробегает только попарно различные собственные значения, а рг есть оператор ортогонального проекти- рования на полное корневое подпространство Л(Х,); формула (2) останется верной. Теорема п. 5 обобщается также на ограниченные по норме (и, с осложнениями, на неограниченные) самосопряженные опера- торы в бесконечномерных гильбертовых пространствах. Однако это обобщение требует очень нетривиального изменения некоторых основных понятий. Главные проблемы связаны со структурой спектра: в конечномерном случае X является собственным значе- нием f тогда и только тогда, когда оператор X id—f необратим, тогда как в бесконечномерном случае множество точек необрати- мости оператора X id — f может быть больше множества собствен- ных значений f: для неизолированных в спектре точек Хо собствен- ных векторов, вообще говоря, нет. С другой стороны, именно мно- жество точек необратимости оператора X id — f служит правиль- ным обобщением спектра в бесконечномерном случае. Эта нехватка собственных векторов требует изменения многих формулировок. Основной результат является обобщением формулы (2), где, од- нако, суммирование заменяется интегрированием. Мы ограничимся описанием нескольких важных принципов на примерах, где эти затруднения не возникают. 10. Формально сопряженные дифференциальные операторы. Рассмотрим какое-нибудь пространство вещественных функций на отрезке [а, Ь] со скалярным произведением ь (f, g)= f(x)g(x)dx. а Предположим, что оператор переводит его в себя. Согласно формуле интегрирования по частям (1k’ £) + (f’ тг) = la = f - f (a) g (a). 142
Поэтому, если пространство состоит только из функций., прини- мающих на концах интервала одинаковые значения, то (£*)=(/•->) d т.е. на таком пространстве оператор—-^ сопряжен с операто- р°м £• Используя формулу интегрирования по частям несколько раз или пользуясь формальным операторным соотношением (/ о ... ° fn}" — Гп° ... ° f*, получаем, что на таких пространствах Г П "1 * п I z— dx1 z—' dx' Li = 0 dl , > где запись —т- °at (х)для оператора означает, что, применяя его dx1 к функции f(x), мы сначала умножаем ее на сц(х) и затем диффе- ренцируем I раз по х. Формула (3) определяет операцию (фор- мального) сопряжения дифференциальных операторов: Оператор D называется (формально) самосопряженным, если D — D*. Слово «формальный» здесь напоминает о том, что в опре- делении не указано явно пространство, на котором D реализуется как линейный оператор. Если скалярное произведение определяется с помощью веса G(x): ь (f, g)G = ) с W f (*) g M dx> a то очевидные вычисления показывают, что вместо D* следует рас- сматривать оператор GlDfG (считая, что G не обращается в нуль); именно он является кандидатом на роль сопряженного оператора к D относительно (/, g)c. Покажем, что ортогональные системы функций, рассмотренные в § 4, состоят из собственных функций самосопряженных диффе- ренциальных операторов. а) Вещественные многочлены Фурье степени sZN. Оператор d2 -(р^г, формально самосопряженный, переводит это пространство в себя и самосопряжен па нем. Кроме того, его собственные зна- чения равны 0 (кратность I) и —I2, —22, ..., —№ (крат- ность 2). Соответствующие собственные векторы суть 1 и {cos пх, sin пх}, 1 п N- б) Многочлены Лежандра. Оператор , > ,, d2 . ... d d (х~ — 1) -r-2 - • 2х -7- = -г- v ' dx2 dx dx 143
формально самосопряжен и переводит пространство многочленов степени ^Л' в себя. Имеет место очевидное тождество (х2- 1)^(х2 — l)" = 2nx(x2- 1)", откуда по формуле Лейбница, примененной к обеим частям, dx L dx J = (X2 - 1) -^(x2-l)" + 2(«+l)x-^(x2- 1)“ + ах ах + п (п + 1) (х2 - 1)" = 2пх (х2-1)"+2п (п+1) (X2-1)". dx dx dx Разделив последнее равенство на 2"п! и вспомнив определение многочленов Лежандра, получим отсюда [(х2 - + 2х^]Р- W = п(п+\)Рп (х). членов Эрмита G(x)!). в) Многочлен ственный вектор Таким образом, оператор (х2 — 1) + 2х на пространстве многочленов степени ^.N диагонализируется в ортогональном ба- зисе из многочленов Лежандра и имеет простой вещественный спектр. Стало быть, он самосопряжен. Разумеется, самосопряженность на этом пространстве можно было бы проверить и непосредственным интегрированием по ча- стям: член типа пропадет здесь из-за множителя х2—1 в коэффициентах оператора. Тогда из результатов этого пункта и теоремы п. 4 получается другое доказательство попарной ортого- нальности многочленов Лежандра. Мы оставляем читателю часть проверок и интерпретацию в терминах линейной алгебры соответствующих фактов для много- и Чебышева (помнить о весовых множителях , dn Эрмита Нп(х) = ( — 1)" ех' (е х) есть соб- с собственным значением —2п оператора dx2 dx dn 2 Функция e~*2/2 Hn (x) = ( — Ipe*2'2 (e*2) является собствен- ным вектором оператора и ср 2 Н == — хг dx' с собственным значением —(2п ф- 1). Первое, утверждение проверяется прямой индукцией по п, кото- рую мы опускаем. Для доказательства второго утверждения рас- 144
смотрим вспомогательный оператор .. d М = —.----х. ах Легко проверить, что [Н, М\=НМ — МН = - 2 -х) = -2М. Отсюда следует, что если / есть собственная функция оператора Н с собственным значением X, то /И/ есть собственная функция оператора Н с собственным значением к— 2: HMf = [Н, M]f + MHf = - 2Mf + kMf == (к - 2) Mf. Поскольку Н (е~х2/2)=—е~х?12, мы получаем, что М' (е-х!/2)есть соб- ственная функция для Н с собственным значением —(2и-|- 1) при всех и > 0. С другой стороны, прямая проверка показывает, что ех,рМ (e*x2/2f (х)) = ех' ~ (е x’f (х)), откуда вытекает, что е~х2!-Нп (х) = ( - 1)пМп (е х“:), что завершает доказательство второго утверждения. г) Многочлен Чебышева ... / \ ( — 2)лн! g dn ,. 2\п 2~ Тп W == ,77“й V 1 — X1 -т-п (1 “ X2) 2 п ' ' (2п)! v dxn ' ' есть собственный вектор с собственным значением —п2 оператора ,1 2\ d" d (1 — х) -г-2-Х-J- . ' ахг ах 11. Нормальные операторы. Как унитарные, так и самосопря- женные операторы в унитарном пространстве являются частным случаем нормальных операторов, которые можно описать двумя равносильными свойствами: а) Это операторы, диагонализируемые в ортонормированном базисе. б) Это операторы, коммутирующие со своим сопряженным опе- ратором. Проверим равносильность. Если {et}—ортонормированный базис с f(e,)=Zet-, то f*(et) = — kiCi, так что [/,/*] = 0, и из а) следует б). Для доказательства обратной импликации выберем собствен- ное значение к оператора f и положим LA = {/eL|f(Z) = W}. Проверим, что /'*(L?Jc: В самом деле, если I е L, то / (/” (/))=•/*(/Ю)= Г = (0, 145
поскольку ff* = [*j. Отсюда вытекает, что пространство Lj f-ин- вариантно: если (/, 10) = 0 для всех l0 е L, то (/(/), /о) = (/, ГО = «- Такое же рассуждение показывает, что /^-инвариантно. Огра- ничения f и f* на L£, очевидно, коммутируют. Применяя индук- цию по размерности L, мы можем считать, что на f диагона- лизируется в пронормированном базисе. Так как то же верно для Н, это завершает доказательство. УПРАЖНЕНИЯ 1. Пусть f: L-+L — оператор в унитарном пространстве. Доказать, что если I (f(OT) I c|Z|2 для всех I е /.. и некоторого с > 0. то I (f (О, т) | + | (/, f (т)) К 2с 11 11 т | для всех I, т е L. 2. Пусть f: £->£ — самосопряженный оператор. Доказать, что I (f (П, 0 I < I И1112 для всех I е L, где |/|— индуцированная норма f, и если с < |f|, то существует вектор I е L с I (f (I), I) I > с 11 Р. 3. Самосопряженный оператор f называется неотрицательным, f 0, если (ЖО^о для всех /. Доказать, что это условие равносильно неотрицательно- сти всех точек спектра f. 4. Доказать, что отношение f g: f — g 0 является отношением порядка на множестве самосопряженных операторов. 5. Доказать, что произведение двух коммутирующих неотрицательных само- сопряженных операторов неотрицательно. 6. Доказать, что из каждого неотрицательного самосопряженного оператора можно извлечь единственный неотрицательный квадратный корень. 7. Вычислить явно поправку второго приближения к собственному вектору и собственному значению оператора Нп + еН, 8. Пусть f — самосопряженный оператор, со е С, 1m со ¥= 0 Доказать, что оператор g= (f — со id) (f — со id)"1 унитарен, его спектр не содержит единицы и f = (cog — со id) (g — id)"1- 9. Наоборот, пусть g — унитарный единицы. Доказать, что оператор оператор, спектр которого не содержит самосопряжен и f = (cog — со id) (g — id) 1 g = (f — co id) (f — co id)"1. (Описанные здесь отображения, которые связывают самосопряженные и уни- тарные операторы, называются преобразованиями Кэли. В одномерном случае . , а— со они отвечают отооражению a i—> _ , которое переводит вещественную ось в единичную окружность.) 10. Пусть f: L-+L — любой линейный оператор в унитарном пространстве. Доказать, что f*f—неотрицательный самосопряженный опера юр п что он поло- жителен тогда и только тогда, когда f обратим. 146
11. Пусть f обратим и — ^ = 1*!. где г,. г2— положительные самосо- пряженные операторы. Доказать, что f = г1“1 =“2Л2- где «1, ii2 унитарны. (Эти представления называются полярными разложениями линейного оператора (, где ил, и2 — соответственно правый и левый фазовые множители f. В одномерном случае получается представление ненулевых ком- плексных чисел в виде гс"(.) 12. Доказать, что полярные разложения f = r,ui = u2r2 единственны. 13. Доказать, что полярные разложения существуют также для необратимых операторов f, но однозначно определяются лишь rt, гг, а не унитарные сомно- жители. § 9. Самосопряженные операторы в квантовой механике 1. Мы продолжаем здесь обсуждение основных постулатов квантовой механики, начатое в п. 8 § 6. Пусть 5^ — унитарное пространство состояний некоторой кван- товой системы. Для характеризации конкретных состояний в фи- зике пользуются возможностью определить на них («измерить») значения некоторых физических величин таких, как энергия, спин, координата, импульс и т. п. Если единица измерения каждой та- кой величины, а также начало отсчета («нуль») выбраны, то воз- можные значения являются вещественными числами (это по су- ществу определение скалярных величин), и мы всегда будем считать это условие выполненным. Третий (после принципа суперпозиции и интерпретации ска- лярных произведений как амплитуд вероятности) постулат кван- товой механики состоит в следующем. Каждой скалярной физической величине, значения которой можно измерять на состояниях системы с пространством состояний Ж, можно поставить в соответствие самосопряженный оператор f: Ж-*-Ж со следующими свойствами-. а) Спектр оператора f есть полное множество значений вели- чины, которое можно получить, производя измерения этой вели- чины на разных состояниях системы. б) Если ф е Ж> — собственный вектор оператора f с собствен- ным значением К, то при измерении этой величины на состоянии ф с достоверностью получится значение А. в) Более общо, измеряя величину f на состоянии ф, |ф|= 1, мы можем получить значение X из спектра оператора f с вероят- ностью, равной квадрату нормы ортогональной проекции ф на пол- ное собственное подпространство Ж (К), отвечающее X. Так как в силу теоремы п. 4 § 8 Ж разлагается в ортогональ- m ную прямую сумму Q) Ж (Х(), >., ф 7./ при i =/= j, мы можем разло- t = [ жить ф в соответствующую сумму проекций ф, е <9^(Zz), i — 1, ... .... m. Теорема Пифагора пг 1 = IФI2 = £ I ф,- I2 Г-1 147
интерпретируется тогда как утверждение о том, что, производя измерения / на любом состоянии ф, мы с вероятностью I получим хоть какое-нибудь из возможных значений f. Физические величины, о которых мы говорили выше, и соот- ветствующие им самосопряженные операторы также называют наблюдаемыми. Постулат о наблюдаемых иногда трактуется более широко и считается, что любому самосопряженному оператору отвечает некоторая физическая наблюдаемая. В бесконечномерных пространствах Ж эти постулаты несколько меняются. В частности, вместо б) и в) следует рассматривать ве- роятность того, что при измерении / в состоянии ф значения попа- дут в некоторый интервал (a, b)ci R. Этому интервалу также можно поставить в соответствие подпространство ь) с — образ ортогонального проектора р[а, ьу на ф Ж (Аг)в конечно- е(а, Ь> мерном случае, — и искомая вероятность равна I Р(а. мФ I2 = (Ф. Р(а, Ь)Ф)- Кроме того, в бесконечномерном случае операторы наблюдаемых могут оказаться определенными лишь на некотором подпростран- стве Ж) <= Зё. Связь этой терминологии с понятиями, введенными в п. 8 § 6, такова. Фильтр В-, —это прибор, который измеряет наблюдаемую, отвечающую ортогональному проектору на подпространство, по- рожденное у. Ей приписывается значение 1, если система прошла через фильтр, и 0 в противном случае. Печка /Ц — это комбина- ция прибора, производящего систему, вообще говоря, в разных состояниях, и фильтра ВУ[, пропускающего затем лишь системы в состоянии ф. Рецепт вычисления вероятностей, данный в п. 8 § 6, очевидно, согласуется с рецептом, данным в свойствах б), в) выше На этом примере видно, что прибор, измеряющий некоторую наблюдаемую, скажем В.-, в состоянии ф, вообще говоря, меняет это состояние: с вероятностью |(ф, х)|2 он превращает его в у, а с вероятностью 1—|(ф. х)|2 «уничтожает» систему. Поэтому термин «измерение» в применении к такому акту взаимодействия системы с прибором может привести к совершенно неадекватным интуитивным представлениям. Классическая физика основана на предположении о том, что акт измерения можно в принципе про- извести, сколь угодно мало повлияв на состояние системы, под- вергшейся измерению. Тем не менее термин «измерение» общепри- нят в физических текстах, и мы сочли необходимым ввести его щесь, начав ранее с менее обычных, но интуитивно более удобных «печек» и «фильтров». 2. Средние значения и принцип неопределенности. Пусть f — некоторая наблюдаемая, {Z,}— ее спектр, <5^ =© <5^ (Лг) — соот- ветствующее ортогональное разложение. Как было сказано, на состоянии ф, |ф|=1, f принимает значение X, с вероятностью (Ф/фф), где pi — ортогональный проектор на Поэтому 148
среднее значение !v величины f на состоянии гр, взятое по многим измерениям, можно вычислить так: Е МФ. Р,Ф) = Е (Ф> М<Ф) = (Ф. f (Ф)) (повторяем, что | гр | = 1). Наша величина (гр, f (у)) в обозначениях Дирака выглядит так: <?х1Лф>. Часть этого символа есть результат действия оператора / на кет вектор |гр>, a <x|f — результат действия сопряженного оператора на бра-вектор <х|. Вернемся к средним значениям. Если операторы f, g самосо- пряжены, то оператор fg, вообще говоря, не является самосопря- женным: (fg)' = gT = gf fg, если f,g не коммутируют. Однако f2, f—X (?.cR) и коммутатор [f, g] =-1- (fg — gf) по-прежнему самосопряжены. Среднее значение [(f — $ наблюдаемой (f — М2 в со- стоянии гр есть среднеквадратичное отклонение значений f от их среднего значения, или дисперсия (разброс) значений f. Положим ^ = V[(f-OV 3. Предложение (принцип неопределенности Гейзенберга). Для любых самосопряженных операторов f, g в унитарном простран- стве g]Ф, ф)|. Доказательство. Пользуясь очевидной формулой if -?r £ — gj = [/> gb самосопряженностью операторов f, g и неравенством Коши — Бу- няковского — Шварца, находим (f\ — f— g\ = g — g^) l([f. g]Ф. Ф) I = I ((Agi — gJi) Ф. ф)1 = 1(£1ф, ЬФ) —(ЛФ. g^)l = = I 2 Im (gjip, f,ip) К 21 (gtip, ),ф) | < <2V(f,ip, /уф) V(gi^ ?|Ф) = 2 ЛД], Ag4- Это показывает, что средний разброс значений некоммутирую- щих наблюдаемых f, g, вообще говоря, не может быть одновре- менно сделан как угодно малым. Говорят еще, что некоммути- рующие наблюдаемые не измеримы одновременно-, к этой форму- лировке следует относиться с теми же предосторожностями, что и к термину «измерение». Особую роль играет применение неравенства Гейзенберга к случаю канонически сопряженных пар наблюдаемых, которые по 149
определению удовлетворяют соотношению ~ [Л £] = Для них каково бы ни было состояние ф. Заметим, что в конечномерных пространствах таких пар нет, ибо Tr [f, g] = О, Trid = dim5^. Од- нако в бесконечномерных пространствах они существуют. Клас- сический пример: ±ГХ i L ’ l^] = id. i dx I Эти операторы появляются в квантовых моделях физических систем, которые на классическом языке называются «частица, дви- жущаяся в одномерном потенциальном поле». Опишем эти и некоторые другие наблюдаемые подробнее. 4. а) Наблюдаемая координаты. Это оператор умножения на х в пространстве комплексных функций на R (или некоторых под- множествах R) со скалярным произведением [f(x)g(x)dx. Под- разумевается квантовая система: «частица, движущаяся по пря- мой, во внешнем поле». б) Наблюдаемая импульса. Это оператор у 77“ в анало- гичных пространствах функций. (При нем обычно пишут множи- телем постоянную Планка Л; это относится к выбору системы единиц, на котором мы не останавливаемся.) в) Наблюдаемая энергии квантового осциллятора. Это — опе- 1 Г d2 , 21 ратор у| —+ х I, снова в подходящих единицах. г) Наблюдаемая проекции спина для системы «частица со спи- ном 1/2». Это любой самосопряженный оператор с собственными значениями ±1/2 на двумерном унитарном пространстве. Даль- нейшие подробности о нем будут даны позже. В примерах а) — в) мы намеренно не уточняли, в каких уни- тарных пространствах действуют наши операторы. Они существен- но бесконечномерны и строятся и изучаются средствами функцио- нального анализа. О примере г) мы скажем кое-что еще ниже. 5. Наблюдаемая энергии и эволюция системы во времени. В описание любой квантовой системы вместе с ее пространством состояний Ж входит задание фундаментальной наблюдаемой Н-. Ж-*-Ж, которая называется наблюдаемой энергии, или опера- тором Гамильтона, или гамильтонианом. В ее терминах формулируется последний из основных посту- латов квантовой механики. Если в момент времени 0 система находилась в состоянии ф и за промежуток времени t развивалась как изолированная си- стема, в частности, над ней не производились измерения, то в мо- 150
мент времени 1 она будет находиться в состоянии (ф), где ос ехр ( - iHt) = £ ~ '"р"- : Ж -> Ж п=0 (см. § 11 ч. 1). Оператор ехр(—iHt)=U(t) унитарен. Однопараметрическая группа унитарных операторов {U(t) 11 е R} целиком определяет эволюцию изолированной системы. Физическая размерность (энергия)Х(время) называется «дей- ствием». Многие эксперименты позволяют определить универсаль- ную единицу действия — знаменитую постоянную Планка h = = 1,055-10~34 Дж-с. В нашей формуле подразумевается, что Ht измеряется в единицах п, и чаще ее пишут в виде expl ф. Мы будем опускать Й для сокращения записи. Заметим еще, что, поскольку оператор e~iHt линеен, он пере- водит лучи в в лучи и в самом деле действует на состояния системы, а не просто на векторы ф. Закон эволюции можно записать в дифференциальной форме: (е ’ /я/ф) — — 1Н (в“ /тф), или, полагая ф(/) = е~/Шф, = — /Дф Дф, если помнить о единицах) . Последнее уравнение называется уравнением Шрёдингера. Впер- вые оно было написано для случая, когда ф реализованы как функции в физическом пространстве и И представлен дифферен- циальным оператором относительно координат. В следующих комментариях мы, как обычно, ограничимся в основном конечномерными пространствами состояний №. 6. Энергетический спектр и стационарные состояния системы. Энергетический спектр системы — это спектр ее гамильтониана Н. Стационарные состояния — это состояния, которые не меняются со временем. Отвечающие им лучи должны быть инвариантны относительно оператора eitH, т. е. быть одномерными собственными подпространствами этого оператора. Но эти подпространства те же, что и для оператора Н. Собственному значению Е, гамиль- тониана, или энергетическому уровню системы, отвечает собствен- ное значение eitEi = cos lEj -ф i sin tE, оператора эволюции, меняю- щееся co временем. Если Н имеет простой спектр, то пространство Уё снабжено каноническим ортонормированным базисом, состоящим из векто- ров стационарных состояний (они определены с точностью до фа- зовых множителей е‘Ч). Если кратность энергетического уровня Е больше единицы, этот уровень и соответствующие состояния на- зываются вырожденными, а кратность Е— степенью вырождения. 151
Все состояния, отвечающие нижнему уровню, т. е. наименьшему собственному значению Н, называются основными состояниями системы; основное состояние единственно, если нижний уровень невырожден. Этот термин связан с представлением о том, что квантовая система никогда не может рассматриваться как пол- ностью изолированная от внешнего мира: с некоторой вероят- ностью она может излучить или получить порцию энергии. В не- которых условиях гораздо вероятнее, что энергия будет потеряна, чем приобретена, и система будет иметь тенденцию «свалиться» в свое нижнее состояние и в дальнейшем в нем оставаться. По- этому неосновные состояния называются иногда возбужденными. В примере г 1 осциллятора: — п. 4 был написан гамильтониан квантового dl 2*1 ---dx^ +х г В разделе в) п. 10 § 8 было показано, что функции е~х'12Нп(х) образуют систему стационарных состояний гармонического осциллятора с уровнями энергии Еп = п + . п=1, 2, 3, ... (Более подробный анализ показы- вает, что энергия измеряется здесь в единицах Йсо, где константа со отвечает частоте колебаний соответствующего классического осциллятора.) Разумным образом определив унитарное простран- ство, в котором следует работать, можно показать, что это полная система стационарных состояний. При п > 0 осциллятор может излучить порцию энергии Еп— Ет = (п — m)fuD и перейти из со- стояния в состояние В применении к квантовой теории электромагнитного поля об этом говорят как об «излучении п — т фотонов частоты ш». Обратный процесс будет поглощением п — m фотонов; при этом осциллятор перейдет в более высокое (возбуж- денное) состояние. Важно, что энергия может быть получена или передана лишь целыми кратными Йы. В основном состоянии осциллятор имеет ненулевую энергию у/гю, которая, однако, никак не может быть передана — более низких энергетических состояний осциллятор не имеет. Электромаг- нитное поле в квантовых моделях рассматривается как суперпо- зиция бесконечно многих осцилляторов (отвечающих, в частности, разным частотам со). В основном состоянии — вакууме — оказы- вается поэтому, что поле имеет бесконечную энергию, хотя с клас- сической точки зрения оно является нулевым — раз от него нельзя отнять энергию, оно не может ни на что воздействовать! Эго простейшая модель глубоких трудностей современной квантовой теории поля. Ни математический аппарат, ни физическая интерпре- тация квантовой теории поля не достигли какой-либо степени за- конченности. Это открытая и увлекательная наука. 7. Формулы теории возмущений. В аппарате квантовой меха- ники важную роль играют ситуации, когда гамильтониан Н си- стемы может рассматриваться как сумма Но -ф е/Л, где Но — «не- возмущеннып» гамильтониан, а — малая добавка, «возмуще- ние». С физической точки зрения возмущение часто обусловливает 152
взаимодействие системы с «внешним миром» (например, внешним магнитным полем) или компонент системы между собой (тогда Но отвечает идеализированному случаю системы, состоящей из сво- бодных, невзаимодействующих компонент). С математической точки зрения такое представление оправдано, когда спектральный анализ невозмущенного гамильтониана Но проще, чем И, и спек- тральные характеристики Н удобно представлять рядами по степеням е. первые члены которых определяются через Но. Мы ограничимся следующими наиболее употребительными формулами и качественными замечаниями к ним. а) Поправки первого порядка. Пусть Ноео—Коео, |во|=Е По пытаемся найти собственный вектор и собственное значение Но ф еЯ[, близкие к е0 и Хо соответственно, с точностью до членов второго порядка малости по е, т. е. решить уравнение {Но + ъН|) (е0 -j- ее{) = (Хо eZJ (е0 -ф- ee() + о (е2). Приравнивая коэффициенты при е, получаем (Но Хо)б[ = (Л] Н |)е0- Неизвестные здесь — это число М и вектор е\. Их можно найти по очереди с помощью следующего приема. Рассмотрим скаляр- ное произведение обеих частей последнего равенства на е0. Слева будет нуль в силу самосопряженности Н — Ко: ((Но K0)eit ео) = (е(> (Но *^о)ео)==^- Поэтому ((?ч — Ht)e0, ео) = 0 и в силу нормированное™ е- = (Н\в0, е0). Это поправка первого порядка к собственному значению Ху: «сдвиг энергетического уровня» ₽Л| равен (еН^о, е0), т. е. по ре- зультатам п. 12 совпадает со средним значением «энергии возму- щения» eHi на состоянии е0. Для определения в) теперь нам нужно обратить оператор Но — Ко. Разумеется, он необратим, ибо Ко—собственное значение Но', но правая часть уравнения, (Z[— Н})е0, ортогональна к ес. Поэтому достаточно, чтобы Но — Ко был обратим на ортогональ- ном дополнении к е0, которое мы обозначим еп1. Это условие (в конечномерном случае), очевидно, равносильно тому, чтобы кратность собственного значения Ко у Но была равна единице т. е. невырожденности энергетического уровня Ло. Если это так, то ei~((Ho — Ме±) 1 Р-i — Н\)е., ° что дает поправку первого порядка к собственному вектору. Выберем ортонормированный базис {е0 — е(0), е(,); .е(п>}, в котором Но диагоналей с собственными значениями ^о = л(0'. 153
X(l\ ..., В базисе {е(1), .... е(п>} пространства имеем (А, — //i)e0=- £ ((Л1 — //|)e0. e'l')efi> -= — £ е<‘>)ей), i = 1 i --- l откуда Интуитивно ясно, что эта поправка первого порядка может быть хорошим приближением, если энергия возмущения мала по срав- нению с расстоянием от уровня /.Г) до соседнего: е должно компен- сировать знаменатели /.()—Х*0. Физики так обычно и считают. б) Поправки высших порядков. По аналогии с разобранным случаем покажем, что когда собственное значение Хо невырождено, можно индуктивно найти поправку (i’+l)-ro порядка к (к0, е0), считая, что поправки порядков уже найдены. Пусть 1. Мы решаем уравнение (Но + е//,) ( £ £%) = Г £ e% V £ е'е) + о (е/+2) относительно е,+ь Ач-н Приравнивая коэффициенты при е‘+1, по- лучаем (Яп — Ао)ei +1 = (М — + Аг + |е0. (=2 Как выше, левая часть ортогональна е0, откуда i ^z+i = ((Н। — Л|) ег, е0) £ М (ez+z_z, е0), 1=2 [i+I (Z| — H^ei + £ Azei+1_z 1=2 Таким образом, все поправки существуют и единственны. в) Ряды теории возмущений. Формальные ряды по степеням е оо оо £ £ etz‘, i~u /=0 где Ki и е, находятся по выписанным рекуррентным формулам, называются рядами теории возмущений. Можно доказать, что в конечномерном случае они сходятся при достаточно малых е. В бесконечномерном случае они могут расходиться; тем не менее несколько первых членов часто приводят к предсказаниям, хорошо согласующимся с экспериментом. Физическая роль рядов теории возмущений в квантовой теории поля очень велика. Их матема- гическое исследование приводит к многим интересным и важным задачам. 154
г) Кратные собственные значения и геометрия. В наших пре- дыдущих вычислениях запрет на кратное собственное значение h0 проистекал из желания обратить НЛ, на ej и формально вы- ражался в появлении разностей Ло — Х(/) в знаменателях. Можно получить формулы и в общем случае, надлежащим образом изме- нив рассуждения, но мы ограничимся разбором геометрических эффектов кратности. Они видны на типичном случае Но = id: все собственные значения равны единице. Малое изменение Но при- водит к следующим эффектам. Собственные значения становятся разными, если это изменение достаточно общее: этот эффект в физике называется «расщепле- нием уровней», или «снятием вырождения». Например, одна спек- тральная линия может расщепиться на две или больше либо при увеличении разрешения прибора, либо при помещении системы во внешнее поле. Математическая модель в обоих случаях будет состоять в учете малой поправки к Но, ранее неучтенной (впро- чем, иногда и в изменении исходного пространства состояний). Теперь обдумаем, что может происходить с собственными век- торами. В полностью вырожденном случае Но диагонализируется в любом ортобазисе. Малое изменение Но, снимающее вырожде- ние, означает выбор ортобазиса, вдоль осей которого происходят растяжения, и коэффициентов этих растяжений. Коэффициенты должны мало отличаться от исходного ho, но сами оси могут идти в любых направлениях. Таким образом, вблизи вырожденного собственного значения его собственные направления начинают зависеть от возмущения очень сильно. Два сколь угодно малых возмущения единичного оператора с простым спектром могут диа- гонализироваться в двух фиксированных и жестко повернутых друг от друга ортобазисах. Это показывает внутреннюю причину появления разностей Хо — Х(/) в знаменателях. § 10. Геометрия квадратичных форм и собственные значения самосопряженных операторов 1. Этот параграф посвящен изучению геометрии графиков квад- ратичных форм q на вещественном линейном пространстве, т. е. множеств вида xn+i = q(xi, ..., хп) в Rn+1, и описанию некоторых приложений. Одна из важнейших причин, по которой эти класси- ческие результаты вызывают живой интерес и в наши дни, со- стоит в том, что квадратичные формы дают следующее (после линейного) приближение к любой дважды дифференцируемой функции и потому являются ключом к пониманию геометрии «искривления» любой гладкой многомерной поверхности. В § 3 и 8 мы уже доказали общие теоремы о классификации квадратичных форм с помощью любых линейных или только орто- гональных преобразований, поэтому здесь мы начнем с проясне- ния их геометрических следствий. Будем считать, что мы работаем п в евклидовом пространстве со стандартной метрикой У, xj. Забве- 155
ние евклидовой структуры означает лишь введение более грубого отношения эквивалентности между графиками. План геометриче- ского исследования состоит в том, чтобы разобраться с малыми размерностями, где форму графика можно представить себе на- глядно, и затем посмотреть на маломерные сечения многомерных графиков в разных направлениях. Читателю рекомендуется рисо- вать картинки, иллюстрирующие наш текст. Мы считаем ось хп+1 направленной вверх, а пространство R" расположенным горизон- тально. 2. Одномерный случай. График кривой х2=Хх, в R имеет три основных формы: «чаша» (выпуклость вниз) при X > 0, «ку- пол» (выпуклость вверх) при X < 0 и горизонтальная прямая при X = 0. Относительно линейной классификации, допускающей про- извольное изменение масштаба вдоль оси хь эти три случая исчер- пывают все возможности: можно считать, что к = ±1 или 0. При ортогональной классификации X является инвариантом: |Х| опре- деляет крутизну стенок чаши или купола, она тем больше, чем больше |А|. Другая характеризация |Х| состоит в том, что 2। есть радиус кривизны графика на дне или в вершине (0,0). Дей- ствительно, уравнение окружности радиуса R, касающейся оси xi в начале, имеет видх^ + (х2—R)2—R\ и вблизи нуля имеем Х?~ 2R ' 3. Двумерный случай. Чтобы разобраться в нем, перейдем к ортонормированному базису в R2, в котором q приводится к сум- ме квадратов с некоторыми коэффициентами: q(t)\, Уг)—^2 + к,У2- Прямые, натянутые на элементы этого базиса, называются глав- ными осями формы q\ они, вообще говоря, повернуты относительно исходных осей. Числа и /.2 определены однозначно, будучи соб- ственными значениями самосопряженного оператора А, для кото- > > рого q(x) — xAx j(b старых координатах). При X.t=/=X2 сами оси также определены однозначно, но при М = Х,2 их можно выбирать произвольно (лишь бы они были ортогональны). Для каждого из коэффициентов Хь Х2 есть три основные возможности (X, > 0, X, <0, X, — 0), но соображения симметрии позволяют ограничить- ся четырьмя основными случаями (из которых только первые два невырождены). а) х3=Х|^+Х2^2, Хр Х2>0. График является эллиптическим па- раболоидом, имеющим форму чаши. Прилагательное «эллиптиче- ский» объясняется тем, что проекции горизонтальных сечений 7^у\ + -|-Х9#2 = с при с > 0 суть эллипсы с полуосями -^/сХ^1, направ- ленными вдоль главных осей формы q (при Xj = Х2— окружности). (Эти проекции являются линиями уровня функции q.) Существи- тельное «параболоид» объясняется тем, что сечения графика вер- тикальными плоскостями ayi ф- by? = 0 суть параболы (при Х1 = Х2 график является параболоидом вращения). 156
Случай Xi, Х2 < О— это та же чаша, но опрокинутая. б) х3 = Л]У’ — Х2«/|, М, Х2 > 0. График является гиперболи- ческим параболоидом. Линии уровня q суть гиперболы, непустые для всех значений х3, так что график уходит и выше, и ниже пло- скости х3 = 0; сечения вертикальными плоскостями — по-преж- нему параболы. Линия уровня х3 = 0—это «вырожденная гипер- бола», сводящаяся к своим асимптотам, двум прямым ± V^2//2 = *’• Эти прямые в R2 называются «асимптоти- ческими направлениями» формы q. Если рассматривать q как (неопределенную) метрику в R2, то асимптотические прямые со- стоят из всех векторов длины нуль. Асимптотические прямые де- лят R2 на четыре сектора. Линии уровня q — х3 при х3 > 0 лежат в паре противоположных секторов; когда x3->-f-0 сверху, они «прижимаются» к асимптотам, превращаются в них при х3 — 0 и при х3 < 0, «пройдя насквозь», оказываются в другой паре проти- воположных секторов. Вертикальные сечения графика плоско- стями, проходящими через асимптотические прямые, суть сами эти прямые, «распрямившиеся параболы». Случай — ZjT/2 + К.2у2, Хр Х2 > 0, получается из разобранного заменой знака х3. в) r3 = Xy2, X > 0. Поскольку от у2 функция не зависит, сечения графика вертикальными плоскостями у2 — const имеют один и тот же вид: весь график заметается параболой х3 = Ху2 в плоскости (t/i, л'з) при ее движении вдоль оси у2 и называется параболическим цилиндром. Линии уровня суть пары прямых у{ = ± д/х3Х-1; при х3 = 0 они склеиваются в одну прямую; весь график лежит над плоскостью х3 — 0. Случай х)=Ху2, Х<0 получается «опрокидыванием». г) х3 = 0. Это — плоскость. 4. Общий случай. Теперь мы в состоянии понять геометрию графика xn+i — q(xi....хп) при произвольных значениях п. Перейдем к главным осям в Rn, т. е. к ортонормированному m базису, в котором q{ylt .... уп) ••• Хт#= 0. Как выше, они определяются однозначно, если m — п и К, =#= X/ при i ф j или если m — п — 1 и X, =# X, при i j. От координат ym+i, .... уП форма q не зависит, поэтому весь график получается из графика m в Rm+I переносом вдоль подпространства, натянутого на i -1 {ет-н....еп}. Иными словами, вдоль этого подпространства гра- фик «цилиндричен». Нетрудно убедиться, что оно является как раз ядром билинейной формы, полярной к q, и тривиально тогда и только тогда, когда q невырождена. Пусть q невырождена, т. е. m = п. Можно считать, что Хь ... ..., X, > 0, Xr+i, ..., Х,+. < 0, т. е. (г, s)—сигнатура формы q. Если форма q положительно определена, т. е. г = п, $=0, то 157
график имеет вид n-мерной чаши: все его сечения вертикальными плоскостями суть параболы, а все линии уровня q — с > 0 суть эллипсоиды с полуосями д/сЛг1, направленными вдоль главных осей. Уравнение такого эллипсоида имеет вид " / г №' т. е. он получается из единичного шара растяжениями вдоль ортогональных направлений. В частности, он ограничен: целиком лежит в прямоугольном параллелепипеде | | д/ЩЛ i == = 1, ..., п. Ниже мы убедимся, что изучение вариации длин по- луосей разных сечений эллипсоида (тоже эллипсоидов) дает по- лезную информацию о собственных значениях самосопряженных операторов. При г = 0, s — п получается купол. В обоих случаях график называется (и-мерным) эллиптическим параболоидом. Промежуточные случаи rs =# О приводят к многомерным гипер- болическим параболоидам разных сигнатур. Ключом к их геомет- рии является снова структура конуса асимптотических направле- ний С в R", т. е. нулевого уровня формы q(ij\.t/„) = 0. Конусом он называется потому, что заметается своими обра- зующими: прямая, содержащая один вектор из С, целиком лежит в нем. Чтобы составить себе представление о базе этого конуса, рассмотрим его пересечение, скажем, с линейным многообразием У* = 1: - 4“'“§«=! Видно, что база является множеством уровня квадратичной фор- мы от п—1 переменной. Простейший случай получается, когда она положительно определена: тогда это множество уровня есть эллипсоид, в частности, оно ограничено, и наш конус похож на «школьные» трехмерные конусы. Этот случай отвечает сигнатуре (п—1,1) или (1,и—1); при « = 4 пространство (R4, q) есть знаменитое пространство Минковского, которое будет подробно изучено ниже. Для других сигнатур С устроен заметно сложнее, ибо его база «уходит на бесконечность». Сечения графика q вер- тикальными плоскостями, проходящими через образующие С, со- впадают с этими образующими. Для любых других плоскостей получаются либо «чаши», либо «купола» — асимптотические на- правления разделяют эти два случая. Поэтому конус С делит про- странство R"\C на две части, сплошь заметаемые прямыми, вдоль которых q соответственно положительна или отрицательна. Одна из этих областей называется совокупностью внутренних пол ко- нуса С, другая — его внешностью. Геометрический смысл сигна- туры (r,s) грубо, но наглядно можно описать следующей фразой: график формы q по г направлениям уходит вверх, а по s — вниз. 158
Хотя мы работали все время с вещественными квадратичными формами, те же результаты применимы к комплексным эрмито- вым формам. Действительно, овеществление С" есть R2", и ове- п ществление эрмитовой формы У, alfxlxl, alt = ajh есть веществен- ная квадратичная форма. При овеществлении все размерности удваиваются: в частности, комплексная сигнатура (г, s) превра- щается в вещественную сигнатуру (2r, 2s). Опишем теперь вкратце и без доказательств два приложения этой теории в механике и топологии. 5. Колебания. Представим себе сначала шарик, который может кататься в плоскости R2 под действием силы тяжести по желобу формы Точка (0,0) во всех случаях является одним из возможных движений шарика — положением равновесия. При X > 0 это положение устойчиво: небольшое начальное отклонение шарика по положению или скорости приведет к его колебаниям около дна чаши. При Я, < 0 оно неустойчиво: шарик свалится вдоль одной из двух ветвей параболы. При Х = 0 оно безразлично относительно отклонений но положению, но не по скорости: шарик может оставаться в любой точке прямой х2 = 0 либо равномерно двигаться в любую сторону с начальным импульсом. Оказывается, что математическое описание большого класса механических систем вблизи их положений равновесия хорошо моделируется качественно многомерным обобщением этой кар- тинки: движением шарика вблизи начала координат по многомер- ной поверхности xn+\ = q(x\, ..., х„) под действием силы тя- жести. Если г/ положительно определена, любое «малое» движение будет близко к суперпозиции малых колебаний вдоль главных осей формы q. Вдоль нулевого пространства формы возможен уход на бесконечность с постоянной скоростью. Вдоль направлений, где q отрицательна, возможно сваливание вниз. Наличие как нулевого пространства, так и отрицательной компоненты сигнатуры свиде- тельствует о неустойчивости положения равновесия и сомнитель- ности приближения «малых колебаний». Важно, однако, что когда это равновесие устойчиво, малые изменения формы чаши, по кото рой катается шарик (или, более технически, потенциала нашей системы), не нарушают этой устойчивости. Чтобы понять это, вернемся к сделанному в начале параграфа замечанию о приближенном представлении любой (скажем, триж- ды дифференцируемой) вещественной функции f(xt, ...,хп). Вблизи нуля она имеет вид / (*!, • • хп) = f (0, • • •, 0) -ф X nix, + X bifXiXj + о ( Y | x, I2) f = l i. j—1 \i — \ z где а, = Д-(0. .... 0), Ь,-Ду (О.........0). 159
Вычтя из f ее значение в нуле и линейную часть, получаем, что остаток квадратичен с точностью до членов более высокого по- рядка малости. Это вычитание означает, что мы рассматриваем отклонение графика f от касательной гиперплоскости к этому гра- фику в нуле. Обозначив эту касательную плоскость через R", обнаруживаем, что поведение f вблизи нуля определяется квад- Z ffH \ ратичной формой с матрицей I — (0, .. ., 0)) по крайней мере, когда эта форма невырождена, — иначе нужно учитывать члены более высокого порядка малости. (Например, график х2~ X" слева уходит вниз, а справа — вверх; графики квадратичных функ- ций так себя не ведут Двумерный график х3=Х| + х3 —это «обезьянье седло», в одном криволинейном секторе xy + *2<0 уходящее вниз — «для хвоста».) п Точка, в которой дифференциал df = dxt обращается в нуль (т. е. —— = 0 для всех i = 1, п^, называется критической точкой функции f (в наших примерах это было на- чало координат). Она называется невырожденной, если в ней п квадратичная форма Дх/Дху невырождена. Пред- i. /=i 1 f шествующее обсуждение можно резюмировать в одной фразе: вблизи невырожденной критической точки график функции распо- ложен относительно касательной гиперплоскости, как график ее квадратичной части. После этого можно доказать, что малое изме- нение функции (вместе с ее первыми и вторыми производными) может лишь слегка сдвинуть положение невырожденной крити- ческой точки, но не меняет сигнатуры соответствующей квадра- тичной формы и потому общего поведения графика (в малом). Можно также доказать, что вблизи невырожденной критиче- ской точки можно сделать такую гладкую и гладко обратимую (хотя, вообще говоря, нелинейную) замену координат yt — — yt(x\, ..., хп), i=l, п, что в новых координатах / будет задаваться в точности квадратичной функцией: п Ну\.....#п) = Ж • -.0)+ £ ь^урур i-l =1 Строгое изложение теории малых колебаний читатель сможет найти в книге В. И. Арнольда «Математические методы класси- ческой механики» (М.: Наука, 1974, гл. 5). 6. Теория Морса. Представим себе в («+ 1)-мерном евклидо- вом пространстве R',+1 n-мерную гладкую ограниченную гипер- поверхность V, вроде яйца или баранки (тора) в R3. Рассмотрим сечения V гиперплоскостями х„+1 = const. Предположим, что имеется только конечное число значений ct, ..., cm таких, что 160
гиперплоскости xn+1 — а касаются V и притом в единственной точке Vi е V. Вблизи этих точек касания V можно приблизить графиком квадратичной формы х„+1 = с,- ф qi(xy — м(щ), ... ..., хп — Xn(Vi)), если только V находится в достаточно общем положении (например, бублик не должен лежать горизонтально). Оказывается, что важнейшие топологические свойства V, —в ча- стности, так называемый гомотопический тип V — вполне опреде- ляются набором сигнатур форм qh т. е. указанием того, по сколь- ким направлениям V вблизи Vi уходит вниз и по скольким—- вверх. Самое замечательное то, что, хотя информация о сигна- турах qt чисто локальна, восстанавливаемый по ней гомотопиче- ский тип V есть глобальная характеристика формы V. Например, если имеются только две критические точки с( и с2 с сигнатурами (п, 0) и (0, п), то V топологически устроена как n-мерная сфера. Подробности читатель сможет найти в книге Дж. Милнора «Теория Морса» (М.: Мир, 1965). 7. Самосопряженные операторы и многомерные квадрики. Пусть теперь L — конечномерное евклидово или унитарное про- странство, f: L-+L—самосопряженный оператор. Нас интересуют свойства его спектра. Расположим собственные значения / в по- рядке убывания с учетом кратностей: Х| Х2 ... и выбе- рем соответствующий ортонормированный базис {е}, е2, ..., <%}. Вернемся к точке зрения п. 4 § 8, согласно которой задание f равносильно заданию новой симметричной или эрмитовой формы (f(^i)>^) или же квадратичной формы qf (/) = (/(/), I) (в унитар- ном случае она квадратична на овеществленном пространстве). В базисе {щ, ..., <?„} она приобретает вид п п <7f (*,..х„) = £ Лф2 или £ 1 х(. |2 и, таким образом, направления Re, (или. Се,) суть главные оси qf. Простейшее экстремальное свойство собственных значений Z, выражается следующим фактом. 8. Предложение. Пусть S —{I е L\|/| = 1}—единичная сфера пространства L. Тогда Х,== max<7f(/), Л„ = min^(/)- z <= s i <=s Доказательство. Поскольку |x,|2 0 и М ••• Агг, очевидно На единичной сфере левая часть есть Тп, а правая Xt. Эти значе- ния достигаются на векторах (0, ..., 0, 1) и (1, 0, ..., 0) соответ- ственно (координаты берутся в базисе {е1г еп}, диагонализи- рующем /). 161
а ограничение на 9. Следствие. Пусть Lk — линейная оболочка семейства {ei, ek}, L+— линейная оболочка семейства {е*, .... еп}. Тогда К = max {qf (I)11 e= S П L+} = min {<7f (/) | / e= S П L^}. Доказательство. Действительно, в очевидных координа- п тахограничение qf на ££ имеет вид k Lk — вид Г \ | xt |2. Следующее важное усиление этого результата, в котором вместо Lf рассматриваются любые линейные подпространства в L коразмерности k— t, называется теоремой Фишера — Куранта. Она дает «минимаксную» характеристику собственных значений дифференциальных операторов. 10. Теорема. Для любого подпространства L'cL коразмерности k — 1 справедливы неравенства: < max {<7f (/) | / g= S f| L'}, Z„_fc+1 > min {<7f (/) | / <= S f| L'}. Эти оценки точны для некоторых L' (например, LJ и L~_k+i со- ответственно), так что Kk = пип max {qf (/) | I (= S f| L'}, — max min {qf (/) 11 <= S f| L'}. Доказательство. Поскольку dim L' 4- dim L& = (n — k + 1) + k = n + 1, a dim dim L = и, из теоремы п. 3 § 5 ч. 1 следует, что dim (L' П 1. Возьмем вектор <= L' (~| f| S. Согласно следствию 9 Zft = min {qf (/) \l e S f L^}, так что Kk^qf(lJ) и тем более X/; max{<7f(/) |/е Sf|L'}. Второе неравенство теоремы проще всего получить, применив первое неравенство к опера- тору— f и заметив, что знаки и порядок собственных значений при этом обращаются. 11. Следствие. Пусть dimL/L0 = 1 и р — оператор ортогональ- ного проектирования L -> Lo. Обозначим через Л' ZJ, ^ ... К' j собственные значения самосопряженного оператора pf: Ц, -> Lo. Тогда S ^2==^ ^2^ • • • Zn, т. е. собственные значения операторов f и pf перемежаются. Доказательство. Ограничение формы qf на Lo совпадает с Qpf- (f(0> 0 = (Pf(O> 0» если I ^о- Поэтому Л* =» max (/) 11 s S f| L'} == max {q^ (/) 11 e S f) L'} 162
для подходящего подпространства U с: Lo, имеющего коразмер- ность k—1 в Lo- Значит, в L оно имеет коразмерность k, откуда Хй+1 K'k. Записав это неравенство для —f вместо f, получим — — %'k, т. е. 7.'k Lk. Это завершает доказательство. Мы предоставляем читателю возможность убедиться в том, что следствие п. 11 имеет следующий простой геометрический смысл. Будем считать, что Zi > 0 и вместо функции на S рассмотрим эллипсоид е: qi(l) = 1. Тогда его сечение ео подпространством Lo также представляет собой эллипсоид, длины полуосей которого перемежаются с длинами полуосей эллипсоида е. Вообразите себе, например, эллипсоид е в R3 и его сечение пло- скостью ео- Большая полуось ео не превосходит большой полуоси е («очевидно»), но не меньше, чем средняя полуось е. Малая по- луось ео не меньше малой полуоси е («очевидно»), но не больше средней полуоси е. Контрольный вопрос: как получить в сечении окружность? §11. Трехмерное евклидово пространство 1. Трехмерное евклидово пространство ё является основной моделью физического пространства Ньютона и Галилея. Четырех- мерное пространство Минковского Л, снабженное симметричной метрикой сигнатуры (r+, r_) = (1,3), является моделью простран- ства-времени релятивистской физики. Уже поэтому они заслужи- вают более пристального изучения. С математической точки зре- ния они также имеют особые свойства, существенные для пони- мания устройства мира, в котором мы живем: связь вращений в 8 с кватернионами и существование векторного произведения; геометрия векторов нулевой длины в Л. Эти специальные свойства весьма удобно излагать на языке связи геометрии и Л с геометрией вспомогательного двумер- ного унитарного пространства Ж, называемого пространством спи- норов. Эта связь имеет также глубокий физический смысл, став- ший ясным лишь после появления квантовой механики. Мы из- брали именно такое изложение. 2. Итак, фиксируем двумерное унитарное пространство Ж. Обо- значим через ё вещественное линейное пространство самосопря- женных операторов в Ж с нулевым следом. Каждый оператор f е ё имеет два вещественных собственных значения; они отли- чаются только знаком, ибо след, равный их сумме, обращается в нуль. Положим If |= ViWT — положительное собственное значение f. 3. Предложение. ё с нормой | | является трехмерным евкли- довым пространством. Доказательство. В ортонормированном базисе Ж опера- торы f представлены эрмитовыми матрицами вида О -в)’ ае R’ *sC’ дел
т. е. линейными комбинациями Re b • <7] 4- Im b • сг2 -R ао&, где оь о2, п3 — матрицы Паули (см. упражнение 5 к § 4 ч. 1): ’.=(?;)• Так как oj, о2, о3 линейно независимы над R, dimR S — 3. Положим теперь (Л я)=4Тг Это билинейное симметричное скалярное произведение, и если собственные значения f равны ±Х, то I Л2 = 4 Тг (И = |(Л2 + Л2) = | det f|. Очевидно, Z2 = О тогда и только тогда, когда f — 0. Это завершает доказательство. Назовем направлением в S множество векторов вида R+f = W |а > 0}, где f—ненулевой вектор из S. Иными словами, направление — это полупрямая в S. Направление, противоположное к R.f,— это R+(-f). 4. Предложение. Имеется взаимно однозначное соответствие между направлениями в S’ и разложениями Ж в прямую сумму двух ортогональных одномерных подпространств Ж+®Ж_. Именно, направлению R+f отвечают Ж>+—собственное подпро- странство Ж для положительного собственного значения f, Ж_ то же для отрицательного собственного значения. Доказательство. Ж+ и Ж- ортогональны по теореме п. 4 § 7. Замена f на af, а > 0, не меняет Ж+ и Ж— Наоборот, если ортогональное разложение Ж = Ж+®Ж_ задано, то множество операторов f ^S, растягивающих Ж в X > 0 раз вдоль Ж+ и в —X < 0 раз вдоль Ж-, образует направление в S. 5. Физическая интерпретация. Отождествим S с физическим пространством, например, посредством выбора ортогональных ко- ординат в S и в пространстве. Отождествим Ж с пространством внутренних состояний квантовой системы «частица со спином ’/2, локализованная вблизи начала координат» (например, электрон). Выбрав направление R+fcz^, включим магнитное поле в физи- ческом пространстве вдоль этого направления. В этом поле си- стема будет иметь два стационарных состояния, которые как раз и суть Ж+ и Ж-. Если направление R+f отвечает, скажем, верхней вертикальной полуоси избранной координатной системы в физическом простран- стве («ось z»), то состояние Ж+ называется состоянием «с проек- цией спина + */2 на ось z» (или «спин вверх»), а Ж~ — соответ- ственно состоянием «с проекцией спина —’/г» (или «спин вниз»). 164
Такая традиционная терминология является реликтом докванто- вых представлений о том, что наблюдаемая спина отвечает клас- сической наблюдаемой «момент количества движения» — характе- ристике внутреннего вращения системы и потому может быть сама представлена вектором в 8, который поэтому имеет проекции на оси координат в 8. Это совершенно неверно: состояния системы суть лучи в Зв, а не векторы в 8. Расхождение с классикой ста- новится еще более очевидным при рассмотрении систем со спином s/2, s > 1, для которых dim 36 = s + 1. Точное утверждение дается именно предложением п. 4. Мы дали идеализированное описание классического экспери- мента Штерна — Герлаха (1922). Вместо электронов в нем исполь- зовались ионы серебра, проходившие между полюсами электро- магнита. Из-за неоднородности магнитного поля ионы, вышедшие в состояниях, близких к 36+ и 36- соответственно, пространственно разделялись на два пучка, что и позволило макроскопически отождествить эти состояния. Серебро испарялось в электрической печке, а магнитное поле между полюсами играло роль объедине- ния двух фильтров, пропускающих раздельно состояния 36+ и <9^_. Продолжим теперь изучение евклидова пространства 8. 5. Предложение. (f,g) — 0 тогда и только тогда, когда fg + + gf = o. Доказательство. Имеем (Л £) =4 Тг = 4 Тг = Т Tr М + S)2 -f2- g2]- Но f2 имеет единственное собственное значение | f |2, поэтому все квадраты операторов из 8 являются скалярными, значит и fg-\-gf — скалярный оператор, и он равен нулю тогда и только тогда, когда его след равен нулю. 6. Ортонормированные базисы в 8. Из доказательства предло- жения п. 5 ясно, что операторы {ei, е2, е3} образуют ортонормиро- ванный базис тогда и только тогда, когда e* = e2 = e2=id; eief + ejei == 0, /=/=/• В частности, если в 36 выбран ортонормированный базис, то операторы, заданные в нем матрицами Паули щ, о2, о3, образуют ортонормированный базис в 8: (Т2==а2 = а2==ао=^1 0). о_О/ + ол==01 Теперь мы можем объяснить математический смысл матриц Паули, доказав обратное утверждение. 7. Предложение. Цля каждого ортонормированного базиса {^i, ез} пространства 8 существует ортонормированный базис {hi, hi} пространства 36, обладающий тем свойством, что Ае, — 0^1, de2 — (?2 ПЛИ О2, где Ае — матрица оператора е в базисе {hi, /г2}. Он определен с точностью до умножения на комплексное число, по модулю равное единице. 165
Доказательство. Собственные значения ei суть ±1. Пусть Ж = Ф Зв-, где es действует на тождественно, а на —изменением знака. Выберем сначала векторы й'е<9^+1 ft^e5!?_, |ft'| = |ft'|=l. Они определены с точностью до умноже- ния на е'4’1, е‘ч”; матрица е3 в базисе {ft', й2} есть о3. Далее, ei (^i) = eie3 (А) = езе| (А)’ так что е, (Л') есть ненулевой собственный вектор для е3 с собствен- ным значением —1. Поэтому в] (ftj) = aft'. Аналогично е, (й') = 0й'. Матрица et в базисе {fti, fe} эрмитова, поэтому а=р. Наконец, е, = id, поэтому сф = 1 = |<х|2 =|р|2. Заменив {Л', Л'} на {ftb h2) — {xh't, yti2}, где |x| = jt/|=l, чтобы превратить мат- рицу ei в новом базисе в оь получим ei (fti) = xet (hi) — х ah> — аху~ lh& ei (йз) = ув\ (hi) = у pfti = р ух~ ‘ftp Поэтому х, у должны удовлетворять еще условию ху~' — а-1; тогда автоматически axy~l — pf/x-1 = 1. Можно положить, напри- мер, х = 1, у = а. Итак, в базисе {йц йг} имеем Ава = <т3,Ае, = 04, и этот базис определен с точностью до умножения на скаляр, по модулю рав- ный единице. Те же рассуждения, что для еь показывают, что в таком базисе Ае, имеет вид ( 2 , где |у|2=1. Кроме того, условие ортогональности 6162 + 6261 = 0 дает сжп+апо-». т. е. у+у==О, откуда у = i, либо у = —i. Поэтому Ае, = С2 или А₽2 = — о2. 8. Следствие. Пространство ё снабжено отмеченной ориента- цией: ортонормированный базис {вь е2, е3) принадлежит к классу, отвечающему этой ориентации, тогда и только тогда, когда суще- ствует ортонормированный базис {hi, h2} в Ж, в котором Ае = aa> a = 1, 2, 3. Доказательство. Мы должны проверить, что если {еа} в базисе{ftfc} и в базизе {h'b} задаются в точности матрицами Паули, то определитель матрицы перехода от {еа} к {е'а} поло- жителен, или что имеется непрерывное движение, переводящее {ео} в {е'а}. Мы построим такое движение, показав, что {ftb} пере- водится в {й'} унитарным непрерывным движением: существует такая система унитарных операторов ft". Ж-+Э6, зависящая от па- раметра /е[0, 1], что /0 = id, ft(hb) = h'b и {/«(fti), /«(йг)} обра- зуют ортонормированный базис для всех t. Тогда, обозначив 16(j
через {g/(ei), gt(e2), £/(вз)} ортонормированный базис задаю- щийся матрицами Паули в базисе {f/(/ti), f/(ft2)}, мы построим нужное нам движение в ё>. Пусть {&', h'2} = {/t,, h.^U. Поскольку оба базиса ортонорми- рованы, матрица перехода U должна быть унитарна. По следствию п. 7 § 8 ее можно представить в виде ехр(М), где А—эрмитова матрица. Тогда для всех t^A матрица tA эрмитова, а оператор ехр(/б4) унитарен, и мы можем положить ft {hi, A2} = {Ai, А2}ехр(/М), Это завершает доказательство. Операторы Oi/2, <т2/2, оз/2 в Ж называются наблюдаемыми проекций спина на соответствующие оси в S-. эту терминологию объясняет квантовомеханическая интерпретация из п. 5. Множи- тель 1/2 введен для того, чтобы их собственные значения были равны ±‘/2- 9. Векторное произведение. Пусть , е2, вз} — ортонормиро- ванный базис в <5, принадлежащий отмеченной ориентации. Век- торное произведение в <5 определяется классической формулой (х А + х2е2 + х3е3) X {У\£\ + У#2 + Уз^з) = — (^2^3 — ^зУа) ei + (-*зУ1 — Х1У3} е2 + (х1Уз x2!Ji) ез- Замена базиса на другой, ориентированный так же, не меняет векторное произведение; если же новый базис ориентирован про- тивоположно, то у него меняется знак. Инвариантную конструкцию векторного произведения нетрудно дать в наших терминах. Вспомним, что антиэрмитовы опера- торы в<$с нулевым следом образуют алгебру Ли su(2) (см. § 4 ч. 1). Пространство % можно отождествить с этой алгеброй Ли, разделив каждый оператор из % на i. Поэтому на у <£ имеется структура алгебры Ли. Имеем Г1 1 1 о 1 L i &а’ i ^abc i где ei23 = 1 и Еаьс кососимметричен по всем индексам, или [ста, Os] 2ieajcoc. Поэтому Г3 3 1 /3 \ ( 3 \ X ха<та, £ уъоь = 2Ц £ хаса I X I Е ) - так что векторное произведение с точностью до тривиального мно- жителя есть просто коммутатор операторов. Это позволяет без вы- числений установить классические тождества X X у = — у X Х\ xX(Jxz)+zXUXy) + Jx(2Xx)-0. 1«Т
Есть еще один способ ввести векторное произведение, одно- временно связав его со скалярным произведением п кватернио- нами. 10. Кватернионы. Как и коммутирование, умножение операто- ров из <$, вообще говоря, выводит нас за пределы ё‘. одновременно нарушается эрмитовость и условие обращения следа в нуль. На самом деле произведение операторов из <S лежит в Rid -ф i<$, при- чем «вещественная часть» есть как раз скалярное произведение, а «мнимая» — векторное. Действительно, = ieofccac при а =/= Ь, {а, Ь, с} = (1, 2, 3}, <’« = ‘,о=(о ,)• «=1,2,3, так что ( £ хаса ) ( £ уьсь ) = ( £ хауа ) о0 + i ( £ ха0а ) X ( £ Уь°ь ) > \а-1 / \Ь = 1 / \а=1 / \а=1 / \Ь=1 / или, как пишут физики, (х • о) (у • о) = (х • у) о0 + i(х х У) а, о == (oj, а2, о3). Отсюда видно, что вещественное пространство операторов Rid + iff замкнуто относительно умножения. Его базис составляют в клас- сических обозначениях элементы 1 = о0, i — — lG\, j = — ш2, k — — io3 с таблицей умножения f = j2 = k2==_l, = = ki = —ik = j; jk= —kj = i, Иными словами, мы получаем тело кватернуонов в одном из традиционных матричных представлений (ср. «Введение в алгебру», гл. 9, § 4). 11. Гомоморфизм SU(2)-> SO(3). Фиксируем ортонормирован- ный базис {hlt hi} в Ж и соответствующий ему ортонормирован- ный базис {еь е2, <М в <$, для которого Ае{ — oi. Любой унитар- ный оператор U: переводит {ht, h2} в {h'{, h2}, этому по- следнему базису отвечает базис {е', е', е'3}, и имеется ортогональ- ный оператор s(U); который переводит^.} в {е}}. По следствию п. 8 s(f/)eSO(3), ибо определитель s(U) положи- телен. Реализовав & матрицами в базисе {hi, hi}, мы можем предста- вить действие s{U) на <8 простой формулой: «(£/) (A) = t/A{7-1 для любых Д е Й’. Действительно, это частный случай общей фор- мулы замены матрицы оператора при замене базиса. Мы можем теперь доказать следующий важный результат, .168
12. Теорема. Отображение s, ограниченное на SU(2), опреде- ляет сюръективный гомоморфизм групп SU(2)-*SO(3) с ядром {±£г}- Доказательство Из формулы s(U) (Д) = UAU~l сразу видно, что s(E)— id и s{(JV)= s(<7)s(V), так что s является го- моморфизмом групп. Его сюръективность проверяется так. Выберем элемент geSO(3) и пусть g переводит базис (оь о2, о3) в <S в новый базис (o', а'9, о'3}_ Построим по нему базис {ft', /г'} в в котором операторы о' задаются матрицами а,. По предложению п. 7 {ft,, h'^ существует с точностью до того, что матрица а', возможно, равна —а2, а не о2- На самом деле эта возможность исключена по следствию п. 8, ибо g SO (3) сохра- няет ориентацию <S. Оператор U, переводящий {/гр й2} в {h'vh'2}, удовлетворяет условию s(U) — g. Правда, он может принадлежать лишь U (2), а не SU(2). Если det U = е‘ч, то SU(2). Матрица е~^/2и переводит {hi, h2} в {е~^121г\, e~i<fl2h'A, а этому базису в по-прежнему отвечает базис {ст', о'„ а'3{ в <S. Следова- тельно, также s(e~“P/2£/)= g, и мы получаем, что s: SU(2)->SO(3) сюръективен. Ядро гомоморфизма s: U(2)->SO(3) состоит только из скаляр- ных операторов {e'^id}: это следует из предложения п. 7, согласно которому базис {/г', /г2} восстанавливается по {<?', е2, е'} как раз с точностью до умножения на е'Ч Пересечение группы id} с SU(2) равно в точности {±id}, что и завершает доказательство. Смысл построенного гомоморфизма выясняется в топологии: группа SU(2) односвязна, т. е. любую замкнутую кривую на ней можно непрерывным движением стянуть в точку, тогда как для SO(3) это неверно. Таким образом, SU(2) является универсаль- ным накрытием группы SO(3). Мы воспользуемся доказанной теоремой для того, чтобы разо-- браться в структуре группы SO(3), играя на том, что SU(2): устроена проще. Здесь уместно процитировать Р. Фейнмана: «Не правда ли, странно, что, живя в трех измерениях, мы все же с трудом воспринимаем, что произойдет, если сперва по- вернуться так, а потом еще как-нибудь. Вероятно, если бы мы были птицами или рыбами и если бы мы на собственном опыте знали, что бывает, когда все время крутишь разные сальто в про- странстве, нам было бы легче воспринимать подобные вещи». (Фейнман Р., Лейтон Р. Сэндс М. Фейнмановские лекции по физике, вып. 8, гл. 4. — М.: Мир, 1978, с. 101). 13. Структура SU(2). Прежде всего, элементы SU(2) суть 2 X 2-матрицы с комплексными элементами, для которых (Л = О и det И = 1. Отсюда сразу же следует, что su<2H(-sD |fl|2+|fe|2==: 1
Множество пар {(а, Ь) | |п|2 -ф |2 = 1} в С2 превращается в сферу единичного радиуса в овеществлении С2, т. е. R4: (Re а)2 + (Im а)2 + (Re 6)2 + (Im ft)2 = 1. Итак, группа SU (2) топологически устроена как трехмерная сфера в четырехмерном евклидовом пространстве. Теперь напишем некоторую систему образующих группы SU (2), вдохновляясь следствием п. 7 § 8, согласно которому отображе- ние ехр: u(2)->U(2) сюръективно. Непосредственное вычисление экспоненты от трех образующих пространства su(2) дает; / 1 . \ (eitl2 0 \ ехр (2 =4 0 Любой элемент g -)е SU(2), представить в виде для которого ab 0, можно ехр (у 1ф<т3) ехр Q е <ф cos ~ е 2 .. 6 /ф I sin — е . , е «-Ф I sin “ е е cos —- е 2 где 0 <р < 2л, 0 < 0 < л, —2л ф < 2л. Для этого достаточно положить |a| = cos-5-. arg а — ---ф argi> = ——^-!—. (Эле- Z Л менты SU (2) с b = 0, очевидно, имеют вид ехр Q- нр<т3) ; мы оставляем читателю возможность разобраться с элементами, для которых а — 0.) Углы <р, 0, ф называются углами Эйлера в группе SU(2). 14. Структура SO(3). Мы отождествили SU(2) топологически с трехмерной сферой. При гомоморфизме s: SU(2)-> SO(3) в одну точку SO(3) переходят пары элементов + (7eSU(2). На сфере они образуют концы одного из диаметров. Поэтому SO(3) топо- логически есть результат склеивания трехмерной сферы по парам противоположных точек. С другой стороны, пары противополож- ных точек сферы находятся во взаимно однозначном соответствии с прямыми в четырехмерном вещественном пространстве, соеди- няющими точки пары. Множество таких прямых называется трех- 170
мерным вещественным проективным пространством и обозначается иногда RP3-, позже мы изучим проективные пространства подроб- нее. Таким образом, SO(3) топологически эквивалентна RP3. Посмотрим теперь, во что гомоморфизм s переводит образую- щие SU(2), описанные в предыдущем пункте. В стандартном базисе {а,, о2, о3} пространства <8 имеем ехр| (у i/o,) or, ехр ( ехр | (у f7a,)<j2exp ( — у *7ог,) «= (cos /) ст2 — (sin /) Оз, ехр | (у *7oi)o3exp( — у i/oQ = (sin /) о2 + (cos /) or3. s (ехр (у i7ctQ1 = I 0 cos t \ 0 sin t О — sin t cos t Поэтому является вращением 8 на угол t вокруг оси Ro,. Совершенно ана- логично проверяется, что s (ехр (у есть вращение 8 на угол t вокруг оси ak также для k — 2,3. В частности, любое вра- щение из SO(3) разлагается в произведение трех вращений отно- сительно о3, Oi, Оз на углы Эйлера ф, 0, ср, причем ф можно счи- тать меняющимся от 0 до 2л. УПРАЖНЕНИЯ 1. Доказать тождества ->->> -> -> -> (хХ у, г) = (х, yXz), (х X У) X z — х X (у X z) = (х, у) z — х (у, г). (Указание. Воспользоваться ассоциативностью умножения в алгебре кватернио- нов.) 2. В трехмерном евклидовом пространстве выделены две осп г и г', образую- щие между собой угол <р Пучок электронов с проекцией спина 4-1/2 иа ось z подается на фильтр, пропускающий лишь электроны с проекцией спииа 4-1/2 на , _ , , <р ось z . Показать, что доля прошедших через него электронов будет равиасоз- —. § 12. Пространство Минковского 1. Пространством Минковского М называется четырехмерное вещественное линейное пространство с невырожденной симмет- ричной метрикой сигнатуры (1,3) (иногда работают с сигнатурой (3, 1)). Прежде чем приступить к математическому изучению этого пространства, укажем основные принципы его физической интерпретации, лежащие в основе специальной теории относитель- ности Эйнштейна. 171
а) Точки. Точка (или вектор) пространства Л есть идеали- зация физического события, локализованного в пространстве и времени, типа «вспышки», «излучения фотона атомом», «столкнове- ния двух элементарных частиц» и т. п. Начало координат Л сле- дует представлять себе как событие, происходящее «здесь и сей- час» для некоторого наблюдателя; оно фиксирует одновременно начало отсчета времени и начало отсчета пространственных коор- динат. б) Единицы измерения. В классической физике длины и вре- мена измеряются в разных единицах. Поскольку есть модель пространства-времени, в специальной теории относительности дол- жен быть способ пересчета пространственных единиц во времен- ные и наоборот. Принятый способ эквивалентен принципу «постоян- ства скорости света с»: он состоит в том, что выбранной единице времени Zo ставится в соответствие единица длины lo—cto — рас- стояние, проходимое светом за время t0 (например, «световая се- кунда»). Одна из единиц /0 или to считается далее выбранной раз навсегда; после того как вторая зафиксирована условием /0 = do, скорость света в этих единицах становится равной 1. в) Пространственно-временной интервал. Если /ь — две точки пространства Минковского, скалярное произведение (1\ — 1ч, li — 1г) называется квадратом пространственно-временного интер- вала между ними. Этот квадрат может быть положительным, ну- левым или отрицательным; в физических терминах соответственно времениподобным, светоподобным или пространственноподобным. (Некоторое объяснение этих терминов будет дано ниже.) Если 1г = 0, эти же термины применяются к вектору h в зависимости от знака (/i, Л). г) Мировые линии инерциальных наблюдателей. Если на пря- мой LccJt хоть один вектор времениподобен, то и все векторы времениподобны. Такие прямые называются мировыми линиями инерциальных наблюдателей. Хорошим приближением к отрезку такой линии может служить множество событий, происходящих в космическом корабле, который движется свободно (с выключен- ными двигателями) вдали от небесных тел (учет их тяготения требует изменения математической схемы описания пространства- времени и перехода к «искривленным» моделям общей теории относительности). Заметим, что мы ввели пока в рассмотрение только мировые линии, исходящие из начала координат. Инерци- альный наблюдатель, не бывший «здесь и сейчас», движется по некоторому сдвигу 1 + L времениподобной прямой L. Пусть /ь/2— две точки на мировой линии инерциального наблюдателя. Тогда (/1 —Z2,/1 — /2)>0, и интервал |Ц—/2|==(/1— /2, Л — /2),/2 есть собственное время этого наблюдателя, протекшее между собы- тиями li, /2 и измеренное по показаниям движущихся вместе с ним часов. Мировая линия инерциального наблюдателя есть его соб- ственная «река времени». Физический факт направленности времени (из прошлого в бу- дущее) математически выражается заданием ориентации каждой 172
времениподобной прямой, так что длина |/| времениподобного вектора может быть снабжена знаком, отличающим векторы, на- правленные в будущее и в прошлое. Ниже мы увидим, что имеет смысл представление о согласованности этих ориентаций, т. е. о существовании общего направления времени — но не самих вре- мен!— для разных инерциальных наблюдателей. д) Физическое пространство инерциального наблюдателя. Ли- нейное подмногообразие ёi = I -|- 1Л cz Л интерпретируется как множество точек «мгновенного физического пространства» для инерциального наблюдателя, находящегося в точке I своей мировой линии L. Ортогональное дополнение берется, разумеется, относительно метрики Минковского в Л. Нетрудно убедиться, что Л — L ф L1 и что на LL индуцируется структура трехмерного евклидова пространства (только с отрицательно определенной метрикой вместо обычной положительно определен- ной). Все события, отвечающие точкам М, интерпретируются на- блюдателем как происходящие «сейчас»; для другого наблюдателя они не будут одновременными, ибо LJ- при L\ Ь2. е) Инерциальные системы координат. Пусть £ —времениподоб- ная прямая с ориентацией, во — положительно ориентированный вектор на ней длины единица, {еь е2, е3}—ортонормированный базис в L1: (е,, е,) =—1 для I — 1,2,3. Система координат в Л, отвечающая базису {е0, ..., е3}, называется инерциальной систе- мой. В ней / 3 я \ з ( Е xteh Е yiCi) = хоуо — Е Xiyi • \i=0 1=0 / i=l Поскольку x'o = c/o, где t0—собственное время, пространственно- временной интервал от начала до точки Е хге(. равен I с2/2 — t=0 \ 3 х 1/2 — £ х?) ' Каждая инерциальная система координат в Л опре- 1=1 / деляет отождествление Л с координатным пространством Мин- / 3 \ ковского R4, • Изометрии Л (или координатного про- \ t == 1 / странства) образуют группу Лоренца-, изометрии, сохраняющие ориентацию во времени, — ее ортохронную подгруппу. ж) Световой конус. Множество точек / е Л с (/, /) = 0 назы- вается световым конусом С (начала координат). В любой инер- циальной системе координат С задается уравнением з *о= Е 4 1 = 1 При х0 > 0 точка (х0, х{, х2, х3) на световом конусе отделена от положения наблюдателя (х0, 0, 0, 0) пространственноподобным 173
3 интервалом с квадратом — £ х? =— х2, т. е. находится на рас- 1=1 стоянии, которое за время х0 пройдет квант света, выпущенный из начала координат в начальный момент времени. (При хо < О множество таких точек отвечает вспышкам, которые произошли в момент собственного времени х0 и могли наблюдаться в точке начала отсчета: «приходящее излучение».) Соответственно «нуле- вые прямые», целиком лежащие в С, — это мировые линии частиц, испущенных из начала координат и летящих со скоростью света, например, фотонов. Читатель может увидеть базу «приходящей полы» светового конуса, выглянув в окно,— это небесная сфера. Прямые в Я, состоящие из векторов с отрицательным квадра- том длины, не имеют физической интерпретации. Они должны были бы отвечать мировым линиям частиц, летящих быстрее све- та, — гипотетических «тахионов», не обнаруженных эксперимен- тально. Перейдем теперь к математическому изучению Я. 2. Реализация Я как пространства метрик. Как в § 9, фикси- руем двумерное комплексное пространство Ж и рассмотрим на нем множество Я эрмитово симметричных скалярных произведе- ний. Оно является вещественным линейным пространством. Если выбран базис {/ц,/!?} в 5^, то матрицы Грама этих метрик будут всевозможными эрмитовыми 2 X 2-матрицами. Поставим в соот- ветствие метрике 1&.Я определитель ее матрицы Грама G, кото- рый будем обозначать det I. Переход к.базису {Л,, h'2] — {Л2, V приведет к замене G на G'VGV, и det G' — | det Е|2 det G. В частности, если V е SL(2, С), то det G = det G'. Поэтому вычис- ление det I в любом из базисов 3%, лежащих в одном классе отно- сительно действия SL(2, С), приведет к одному и тому же резуль- тату. Впредь мы фиксируем такой класс базисов Зё, и все det бу- дем вычислять относительно него. Замена класса только умно- жает det на положительный скаляр. 3. Предложение, а) Я является четырехмерным вещественным пространством. б) На Я имеется единственная симметричная метрика для которой (I, /)=det/. Ее сигнатура равна (1, 3), так что Я представляет собой пространство Минковского. Доказательство, а) Пространство эрмитовых 2 X 2-матрнц имеет базис о0—(q ^=Е2; Oi, <т2, Оз, где О/, /^ 1, — матрицы Паули. Поэтому dimj?" = 4. б) Покажем, что в матричной реализации Я функция det/ представляет собой квадратичную форму, поляризация которой имеет вид (/, т) — у (Тг I Тг т — Тг 1т\ явно симметричный и билинейный. В самом деле, если X, ц— соб- ственные значения I, то det / = Хц, Тг I = X ф- р, Тг Р — X2 ф- р2, так 174
что Лц = detZ = |((Л + ц)2- X2 - ц2) =4 ((Тг /)2- Тг /2)-(/,/)• Теперь очевидно, что {о0, Oi, о2, о3} является ортонормированным базисом Ж с матрицей Грама diag(l,—1,—1,—1), так что сигна- тура нашей метрики равна (1,3). Это завершает доказательство. 4. Следствие. Пусть Е<^Ж— времениподобная прямая. Тогда L1 с метрикой — (I, пг) является трехмерным евклидовым простран- ством, и Ж — L® L1. Доказательство. Утверждение Ж = L Ф L1 следует из предложения п. 2 § 3, ибо времениподобные прямые, очевидно, невырождены. Так как сигнатура метрики Минковского на Ж есть (1,3), а на L1 — (1,0), на L1 она должна быть (0,3), что завер- шает доказательство. Перейдем теперь к изучению геометрического смысла скаляр- ных произведений. Неопределенность метрики Минковского приво- дит к замечательным отличиям от евклидовой ситуации, которые имеют важный физический смысл. Самые яркие факты связаны с тем, что неравенство Коши — Буняковского — Шварца для вре- мениподобных векторов оказывается обращенным в другую сто- рону. 5. Предложение. Пусть (/i,/i)>0, (/2, /2)>0, к<=Ж. Тогда (Zi, /2)2>(/ь М(4> 4)- Равенство достигается тогда и только тогда, когда h, la линейно зависимы. Доказательство. Прежде всего проверим, что квадрат- ный трехчлен (tlx + 4, tl\ 4- /2) всегда имеет вещественный корень t0. В матричной реализации Ж условие (4, 4) > 0 означает, что det /2 > 0, т. е. что /2 имеет вещественные характеристические корни одного знака, скажем, е2 (4-1 или —1). Аналогично, пусть 81 — знак собственных значений Ц. Тогда при t-^>—(8i82)oo мат- рица tl\ 4- /2 имеет собственные значения, примерно пропорцио- нальные собственным значениям h (ибо. /i4~Z_14 стремится к 4), и их знак будет —е2, а при t = 0 матрица 0/i 4~ 4 = 4 имеет соб- ственные значения знака е2. Следовательно, при изменении t от 0 до —(ei82)oo собственные значения tl\ 4- 4 проходят через нуль, и det (tl\ + /2) обращается в нуль. Значит, дискриминант этого трехчлена неотрицателен, так что (4, 4)2>(4. 4) (4, 4)- Если он равен нулю, то некоторое значение t0 е R является дву- кратным корнем, и матрица tol\ 4- h, имея два нулевых собствен- ных значения и будучи диагонализируемой (она эрмитова!), равна нулю. Поэтому /1 и 4 линейно зависимы. 6. Следствие («неравенство треугольника в обратную сторону»). Если 1\, 4 времениподобны и (Ц, 1г)~^ 0, то 1\ 4- 4 времениподобен и I /1 + 4I> 141+ 141 175
(где |Z| = (Z, Z)I/2), и равенство достигается тогда и только тогда, когда Ц, Z2 линейно зависимы. Доказательство. Ui + /2|2=1 ^1 Р + 2(Z„ /2)+|/2|2> X/1P + 2I/! ||/2I + |/2|2 = ([/1I + |Z2|)2. Равенство достигается лишь при (/ь Z2) = | /11 | Z2| Дадим теперь физические интерпретации этих фактов. 7. «Парадокс близнецов». Времениподобные векторы /1, /2 с (/ь Z2) 0 назовем одинаково временно ориентированными. Из предложения п. 5 видно, что для них (Zi,Z2)> 0. Вообразим двух близнецов-наблюдателей: один инерциален и движется по своей мировой линии от точки 0 до точки /1 + 12, другой доходит до той же точки от начала отсчета, двигаясь сначала инерциально от 0 до /] и затем от Zi до l\ + Z2: вблизи нуля и вблизи Zi он включает двигатели своего космического корабля, чтобы сначала улететь от брата, а затем снова вернуться к нему. Согласно следствию п. 6 собственное время, протекшее для путешествующего брата, будет строго меньше времени, протекшего по часам домоседа. 8. Множитель Лоренца. Если 1\ и Z2 времениподобны и одина- с (Z1, М ково временно ориентированы, то по предложению п. 5 . , 1 *1 I I *2 I 1, и мы не можем интерпретировать эту величину как косинус угла. Чтобы понять, что она собой представляет, снова прибегнем к физической интерпретации. Пусть |Z||=1, |Z2|=1; в частности' инерциальный наблюда- тель Zi прожил единицу собственного времени с момента начала отсчета. В точке 1\ физическое пространство одновременных со- бытий для него есть l\ -j- (RZi) Мировая линия наблюдателя R/2 пересекает это пространство в точке л72,'где к находится из условия (х/2 —1\, 1\) = 0, т. е. x=(Zi, Z2)-1. Расстояние от h до xZ2 пространственнопо- добно: для наблюдателя R/,— это расстояние, на которое R/2 уда- лился от него за единицу времени, т. е. относительная скорость R/2. Она равна (учесть, что у метрики в (RZi) следует изменить знак!) v = [ — (xl2 — /ь х/2 — Zi)]1/2 = [ — (х/2 — Z], х/2)]1/2 — = [ - X2 (Z2, Z2) + X (Zb Z2)]V2 = [ - (/,, /2)-2 + 1]V2, откуда «'• «= vrb- Это знаменитый множитель Лоренца-, часто его пишут в виде —явно указывая, что скорости измеряются по отноше- -у 1 — и2/сг нию к скорости света. В частности, 1 -'Т 2 171>
т. е. в момент собственного времени единица для первого наблю- дателя второй наблюдатель находится в его физическом простран- стве, когда часы второго наблюдателя показывают д/1—у2- Это — количественное выражение эффекта «сокращения времени» для движущегося наблюдателя, качественно описанное в преды- дущем пункте. 9. Евклидовы углы. В пространстве (R/o)x, где /0 — времени- подобный вектор, геометрия евклидова, и там скалярное произве- дение имеет обычный смысл. Пусть h, /2— еще два времениподоб- ных вектора с той же ориентацией. Мы можем спроектировать их на (R/о)1 и вычислить косинус угла между проекциями. Предо- ставляем читателю самостоятельно убедиться в том, что для на- блюдателя RZ0 это — угол между направлениями отлета от него наблюдателей RZi и R/2 в его физическом пространстве. Абсолют- ного значения этот угол не имеет; другой наблюдатель R/(' уви- дит его другим. 10. Четыре ориентации пространства Минковского. Пусть {е,}, [e't], i — 0, .... 3, — два ортонормированных базиса в Я’- (е0, е0) = =(е.А, е')=1, (ег, ez) = (e'p е') = — 1 при i = 1, ..., 3. По аналогии с прежними определениями назовем их одинаково ориентирован- ными, если один переводится в другой непрерывной системой цзо- метрий ft: ЛЛ, f0—id, ft (ez) — e't. Два условия оди- наковой ориентированности, очевидно, необходимы: а) (е0, е') > 0. Действительно, (е0, ft (е0))2 1 по предложению п. 5, так что знак (е0, ft (е0)) не может меняться при изменении t, а (е0,/о(бо)) — 1- Выше мы назвали е0 и е'о с таким свойством одинаково временно ориентированными. з б) Определитель отображения ортогональной проекции Ем-> Z-1 3 -* Е Re/> записанного в базисах [е{] или {е'}, положителен. 3 3 Действительно, проекция Е R^z -»• Е Rft (ei) невырождена ни 1-1 1=1 при каком значении t: иначе пространственноподобный вектор из з з Е R^z был бы ортогонален Е К^(е£)==(^(ео))Х* т' е‘ ПРОПОР" ционален f t (e'J — времениподобному вектору; это невозможно. Зна- чит, определители этих проекций при всех t имеют одинаковый знак, а при / = 0 он положителен. Можно сказать, что пары базисов со свойством б) одинаково пространственно ориентированы. Наоборот, если два ортонормированных базиса в Л имеют одинаковую пространственную и временную ориентацию, то они одинаково ориентированы, т. е. переводятся друг в друга непре- рывной системой изометрий ft. Чтобы построить ее, положим 177
' , . + (1 - 0 во тл . , прежде всего ft (е0) — —-—। Из условия (е0, е0) 1 следует, что ft (во) времениподобен и имеет квадрат длины единица при всех 0 1. Далее, в качестве ft(e\,ez,e3) выберем орто- нормированный базис в ft(e0)J-, получающийся из проекции {еьег, Сз} на ft (во)1- процессом ортогонализации Грама — Шмидта; очевидно, он непрерывно зависит от t. Ясно, что ft (е0) = е', a {f, (е^, f, (е2), /] (е3)} и {е', е', е3} суть одинаково ориентиро- ванные ортонормированные базисы в Их можно перевести друг в друга непрерывным семейством чисто евклидовых враще- ний (в')1, оставляющих е0 неподвижным. Это завершает дока- зательство. Обозначим через Л группу Лоренца, т. е. группу изометрий пространства Ж, или 0(1,3). Пусть далее Л* — подгруппа Л, сохраняющая ориентацию некоторого ортонормированного ба- зиса; — подмножество Л, меняющее его пространственную, но не временную ориентацию; Л* — подмножество Л, меняющее его временную, но не пространственную ориентацию; At — подмно- жество Л, меняющее его временную и пространственную ориента- ции. Нетрудно убедиться, что от выбора исходного базиса эти под- множества не зависят. Мы доказали следующий результат: 11. Теорема. Группа Лоренца Л состоит из четырех связных компонент: А = Л* (J U Л* U Л^- Тождественное отображение лежит, очевидно, в Л*. Аналогом теоремы п. 12 § 11 является следующий результат. 12. Теорема, Реализуем Ж как пространство матриц Грама эрмитовых метрик в Ж в базисе {/ц./гг}. Для любой матрицы Vf=SL(2, С) поставим в соответствие матрице I Ж новую мат- рицу _ sfy)l = V4V. Отображение s определяет сюръективный гомоморфизм SL (2, С) на Л* с ядром (± £2). Доказательство. Очевидно,_ что s(V)l линейно по I и сохраняет квадраты длин: det(V'/V)= det I. Поэтому s(V)eA. Так как группа SL(2, С) связна, любой ее элемент можно непре- рывно деформировать в единичный, оставаясь внутри SL(2, С),— преобразование Лоренца $(Г) можно непрерывно деформировать в тождественное, так что s(V)eA*. Поскольку s(id)= id и s(ViГг) = s(Vi)s(V2), s является гомоморфизмом групп. Если Р/Г = I для всех I <= Ж, то, в частности, _Ио;-Г = щ, где о0 = Е2, <Т|, 02, оз — матрицы Паули. Условие РГ = Е2 означает, что V унитарна; после этого условия Ро,Г = Ро/(Р)-’= о, означает, что V — ±Е3: это было доказано в п. 12 § 11. Таким образом, Ker $ « {±Е2}. 178
Осталось установить, что s сюръективен. Пусть f: — преобразование Лоренца из А*, переводящее ортонормированный базис {ej в {е'^. Метрики на Ж, отвечающие е0 и е'о, определе- ны, ибо собственные значения как е0, так и е' имеют одинаковый знак, потому что detey —dete' = 1. Из (е0, е') > 0 следует, что эти метрики одновременно положительно или отрицательно опреде- лены. Действительно, выше мы убедились, что соединяющий их отрезок /е'(1 —/е0), О 1, целиком состоит из временипо- добных векторов. Отсюда уже вытекает существование такой мат- рицы VeSL(2, С), что s(V) переводит е0 в е'о, т. е. е'0*=У*е0У, где е0 и е'о отождествлены с их матрицами Грама. Действи- тельно, V — это матрица изометрии е0) с е'о); априори ее определитель может быть равен —1, но это противоречило бы возможности соединить V с Е2 в SL(2, С) с помощью деформации где e'=(V9)79(^0)V9, ^ — соответствующая деформация в А*. Итак, s(V) переводит е0 в е'о. Дальше остается показать, что евклидов поворот {s(V)ep s(V)e2, s(V)e3J в {e'v е'2, e'j можно осуществить с помощью s(U), где t/eSL(2, С) и s(U) оставляет е0 на месте. Можно считать, что а' представлен матрицей сг0 в ба- зисе {hi, h2}. Тогда мы должны выбрать U унитарной с условием U (s (Vjez) U~l = e't для i= 1, 2, 3. Это можно сделать по теореме п. 12 §11, ибо базисы {s (V)eJ и {е'^, i=l, 2, 3, в (в')1 ортонор- мированы и одинаково ориентированы. Доказательство окончено. 13. Евклидовы повороты и бусты. Пусть е'—два одинаково временно ориентированных* времениподобных вектора длины еди- ница, Lq, L' — ортогональные дополнения к ним. Имеется стан- дартное преобразование Лоренца из А*, переводящее е0 в е'о, которое в физической литературе называется бустом. При ео — е'о это — тождественное преобразование. Прие0^= е' оно определяется так: рассмотрим плоскость (Д П Г')1. Она содержит е0 и е'. Сиг- натура метрики Минковского на ней равна (1, 1). Поэтому суще- ствует пара единичных пространственноподобных векторов elt е'<= (Д Q L')-L, ортогональных к е0 и е'о соответственно. Буст оставляет на месте все векторы из Lo f| L'o и переводит е0 в е', et в е\ соответственно. Чтобы вычислить элементы матрицы перехода {е0, d) = {eo’ ei}’ заметим прежде всего, чтоа = (е0, е') = == 1 х;— , где v — скорость относительного удаления инерциаль- -V1 — и2 ных наблюдателей, отвечающих е0 и е'о. Далее, матрицы Грама К ej и {<, <} суть (J °), поэтому a2 — b2—l, ac — bd = 0, с2 —dz = —1. 179
Из первого уравнения, зная а, находим Ь——......... Добавляя V1 — V2 сюда условие, что определитель буста ad — be равен единице, по- лучаем d — а, с = Ь. Окончательно, матрица буста в базисе {е0, ei, ег, 63}, где {62,63}—ортонормированный базис (Z^flL')-1-, имеет вид V1 — V2 — V2 yj\ — V2 -\/\ —V2 О 0 10 0 0 0 1 или в терминах пространственно-временных координат Хо + VX{ VX0 -j- Xj t ' j ’ x'== X2=X2> X3=X3- Стоящую в левом верхнем углу матрицу можно записать также как матрицу «гиперболического поворота» ( ch 0 sh 0 \ k sh 0 ch 0 )’ найдя 6 из условий сЬ0 = ев+е-в 2 1 Vi — и2 ’ sh6 Если исходить из двух одинаково ориентированных ортонорми- рованных базисов {е0, е,, е2, е3} и {е'о, е{, е2, е'}, то преобразова- ние Лоренца, переводящее один в другой, можно представить в виде произведения буста, переводящего е0 в е'о, и затем евкли- дова поворота в (е')-1-, который переводит образ базиса {еь е2, е3} после буста в базис {е', е'2, е3}, оставляя ej- на месте. 14. Пространственные и временные отражения. Любое трех- мерное подпространство Рам Л, на котором метрика Минковского (анти)евклидова (т. е. прямая М времениподобна), определяет преобразование Лоренца, тождественное на L и меняющее знак на LL. Все такие операторы называются отражениями времени. Любое трехмерное подпространство L cz Л, на котором метрика Минковского имеет сигнатуру (1,2) (т. е. прямая LL простран- ственноподобна), также определяет преобразование Лоренца, тож- дественное на L и меняющее знак на L1. Все такие операторы называются пространственными отражениями. Если фиксировать какое-нибудь отражение времени Т и про- странства Р, то все элементы из А*, А*, будут получаться из элементов Л* умножением на Т, Р, РТ соответственно. 180
§ 13. Симплектические пространства 1. В этом параграфе мы будем рассматривать конечномерные линейные пространства L над полем Ж характеристики #=2, снаб- женные невырожденным кососимметрическим скалярным произве- дением [ , ]: ЬУ^Ь-^-Ж, и называть их симплектическими про- странствами. Напомним свойства симплектических пространств, ко- торые уже были установлены ранее, в § 3. Размерность симплектического пространства всегда четна. Если она равна 2г, то в пространстве существует симплектический базис {е\, ег; сг+ь ..., eir}, т. е. базис с матрицей Грама вида I - Ег 0 ) В частности, все симплектические пространства одинаковой раз- мерности над общим полем скаляров изометричны. Подпространство L\ cz L называется изотропным, если ограни- чение скалярного произведения [, ] на него тождественно равно нулю. Все одномерные подпространства изотропны. 2. Предложение. Пусть L — симплектическое пространство раз- мерности 2r, L\dL — изотропное подпространство размерности п. Тогда п г, и если г\ < г, то L\ содержится в изотропном под- пространстве максимальной возможной размерности г. Доказательство. Поскольку форма [,] невырождена, она определяет изоморфизм L -> L*, при котором вектору / е L ста- вится в соответствие линейный функционал l't—>[/, /']. Отсюда сле- дует, что для любого подпространства Li cz L имеем dim — — dim L — dim Lx (cp. § 7 ч. 1). Если к тому же L\ изотропно, то L{ cz Lf-, откуда г, — dim dim = dim L—dim L, — 2r—rl, так что ri r. Рассмотрим теперь ограничение формы [, ] на Lj-. Во всем про- странстве L ортогональное дополнение к LJ- имеет размерность dim L — dim — dim Lt по предыдущему рассуждению. С другой стороны, L\ лежит в этом ортогональном дополнении и потому совпадает с ним. Значит, L\ есть в точности ядро ограничения [, ] на Д'. Но в Lj1- имеется симплектический базис в том его ва- рианте, который рассматривался в § 3, где допускались вырож- денные пространства: {ei, ..., ег_Г1; er-n+i, ..., егц-г.)', в2(г-п)+1.вгг-г}. с матрицей Грама / 0 рг_г,|0\ 0 |0 • \ О I 0 |0/ Размер единичной клетки есть ^-(dimAj1 — dim!]) = г — г }. Векторы e2(r_ri)+i, ..., С2Г-п порождают ядро формы наГ^т. е. Lr, 181
добавив к ним, например, et, ..., er-r„ получим r-мерное изотроп- ное подпространство, содержащее Lt. 3. Предложение. Пусть L — симплектическое пространство раз- мерности 2r, L\ cz L — изотропное подпространство размерности г. Тогда существует другое изотропное подпространство £2 cz L раз- мерности г такое, что L — L\ Ф £2, и скалярное произведение инду- цирует изоморфизм L., -» £*. Доказательство. Мы докажем несколько более сильный результат, полезный в приложениях, а именно установим суще- ствование подпространства £2 среди конечного числа изотропных подпространств, связанных с фиксированным симплектическим базисом {ei, ..., er; er+i, ..., е2г} в £. Именно, пусть дано разбиение {1, ..., г} = 7U/ на два непере- секающихся подмножества. Тогда г векторов {et, er+j | i <= £ j е /} порождают r-мерное изотропное подпространство в £, называемое координатным (относительно выбранного базиса). Очевидно, их имеется 2Г. Покажем, что £2 можно найти среди координатных подпространств. Пусть М натянуто на {в\, ..., ег} и dim(£i ПМ) — $, 0 s г. Существует такое подмножество I с:{1, ..., г} из г — s элементов, что £1Г)М трансверсально к N, натянутому на {et | i е /}, т. е. £! П М П Af = {0}. Действительно, множество {базис £i £| A1}(J U{ei, ..., ег} порождает М, поэтому базис L\ П М можно допол- нить до базиса М с помощью г — s векторов из (ei, ег} по предложению п. 10 § 2 ч. 1. Номера этих векторов образуют иско- мое I, ибо £i П М + N = М, так что £i П М Q N = {0}. Положим теперь J={1......г}\/ и покажем, что изотропное подпространство £2, натянутое на {et, er+j | i е /, /е/}, является прямым дополнением к £ь Достаточно проверить, что L\ П £2 = {0}. Действительно, из доказательства предложения п. 2 следует, что £iL = £l, £/= £2. Но £i П содержится в £ь N содержится в £2, так что сумма М = £i П М ортогональна к Ц П £г- Но М изотропно размерности г, поэтому М1 = М, и L\ Я £2 cz М. Значит, окончательно £1П£2 = (£1ПЛ'1)П(/^АМ) = (£,ПЛ'1)П/У = {0}. Линейное отображение £,->£* ставит в соответствие вектору I е £2 линейную форму mi—>[/, m] на L\. Оно является изомор- физмом, ибо dim £2 = dim L\ — г, а его ядро содержится в ядре формы [,], которая, по предположению, невырождена. Это завер- шает доказательство. 4. Следствие. Любые пары взаимно дополнительных изотроп- ных подпространств в £ одинаково расположены: если L — L2 = = £[©£', то существует изометрия f: L-+-L такая, что = L\, /(£2) = 4 Доказательство. Выберем базис {е\, ..., ег} в Lt и двой- ственный к нему базис {er+i, ..., е2г} в £2 относительно описан- 182
ного выше отождествления L(->-L2. Очевидно, {еь е2г} есть симплектический базис в L. Аналогично построим симплектический базис (е'...e'J по разложению L'Q)L'2. Линейное отображе- ние f'.ei I—i=l, .... 2г, очевидно, является требуемой изо- метрией. Из этого следствия и предложений пп. 2, 3 следует, что лю- бые изотропные подпространства одинаковой размерности в L пе- реводятся одно в другое подходящей изометрией. 5. Симплектическая группа. Множество всех изометрий f: L-+-L симплектического пространства образует группу. Множество мат- риц, представляющих эту группу в симплектическом базисе {вь ..., с2г}, называется симплектической группой и обозначается Sp(2r, Ж}, если dim L — 2г. Условие AeSp(2r,Jtf) равносильно тому, что матрица Грама базиса {еь ..., е2г}А совпадает с = (_£ ?)• т- е- что А72гА =/2г, так что det А = ±1; ниже мы докажем, что detA = I (см. п. 11). Поскольку /2г = —В2г, это условие можно записать также в виде А == —/2r(Af)-1/2r. Отсюда вытекает 6. Предложение. Характеристический многочлен P(t)== = det(/E2,— А) симплектической матрицы -А возвратен, т. е. P(t) = t2rP(t-1). Доказательство. Имеем, пользуясь тем, что det А = 1, det {1Е2г - А) = det (ZE2r + /2г (А*)-1/^) = det (ZB2r - (А')-1) = = det (tA* - E2r) = t2r det (TlE2r - A‘) = t2r det (Z"1^ - A). 7. Следствие. Если Ж = R и A — симплектическая матрица, то вместе с каждым собственным значением 7. у А есть собственные значения X-1, X и X-1. Доказательство. Поскольку А невырождена, X =/= 0 и Р(Х-*) = Х~2гР(Х) = 0. Поскольку коэффициенты Р вещественны, Р(Х) = Р(Х) = 0. Комплексное сопряжение есть симметрия относительно веще- ственной оси, а отображение Х>—>Х-* — симметрия относительно единичной окружности. Значит, комплексные собственные значения А появляются четверками, симметричными одновременно относи- тельно вещественной оси и единичной окружности, а веществен- ные собственные значения — парами. 8. Пфаффиан. Пусть Ж2г — координатное пространство, А — Невырожденная кососимметрическая матрица порядка 2г над Ж. Скалярное произведение [х, у] = х*Ау в ЖЖ невырождено и косо- симметрично. Переходя от исходного базиса к симплектическому, получаем, что для матрицы А найдется такая невырожденная мат- рица В, что 183
откуда det А = (det В)2. Итак, определитель каждой кососимметри- ческой матрицы является точным квадратом. Это наводит на мысль попытаться извлечь из определителя квадратный корень, который был бы универсальным многочленом от элементов А. Это действительно возможно. 9. Теорема. Существует единственный многочлен с целыми коэффициентами РМ от элементов кососимметрической матрицы А такой, что det Л = (Pf Л)2 и Pf(_g ^г^ = 1- Этот многочлен называется пфаффианом и обладает следующим свойством: Pf (В*АВ) = det В • Pf А для любой матрицы В. (В случае char Ж 0 коэффициенты Pf «целы» в том смысле, что лежат в простом подполе поля Ж, т. е. являются суммами единиц.) Доказательство. Рассмотрим г(2г—1) независимых пе- ременных над полем Ж: {«//] 1 i < j 2г}. Обозначим через К поле рациональных функций (отношений многочленов) от а</ с коэффициентами из простого подполя поля Ж. Положим А = (ац), где ciij = —ац при i>j, ац = 0, и введем на координатном про- странстве №г невырожденное кососимметрическое скалярное про- изведение х‘Ау. Перейдя к симплектическому базису с помощью некоторой матрицы В, получим, как выше, det А = (det В)2. Априори det В является лишь рациональной функцией от ац с коэффициентами из Q или простого' поля конечной характери- стики. Но так как det А — многочлен с целыми коэффициентами, квадратный корень из него также должен иметь целые коэффи- циенты (здесь мы пользуемся теоремой об однозначном разложе- нии на множители в кольце многочленов 2[ац] или Рр[а//]). Знак VdetA, очевидно, однозначно фиксируется требованием, чтобы значение Vdet /2г было равно единице. Последнее равенство из формулировки теоремы устанавлива- ется так. Прежде всего, BfAB кососимметрична вместе с А, так что Pf2 (В*АВ) = det (В1 АВ) = (det В)2 det А = (det В)2 Pf2 А. Поэтому Pf (В* АВ) = ± det В Pf А. Чтобы установить знак, достаточно выяснить его в случае А = /аг, В == Е2г, где он, очевидно, положителен. 10. Примеры. Pf f о а12\ \-ais 0 J 121 (о Я'12 Я13 Я1<\ — Ч|2 0 Й23 ^24 I . -а13-а23 0 Оз4 —а12«34 + «13024— «14^23 • — Й14 — «24 “ g34 0 ' 1с4
11. Следствие. Определитель любой симплектической матрицы равен единице. Доказательство. Из условия A*l2r А — 12г и теоремы п. 9 следует 1 = Pf /2Г = Pf (Д72гД) = det A Pf /2г, что доказывает требуемое. Мы пользовались этим фактом при доказательстве предложе- ния п. 6. 12. Связь ортогональной, унитарной и симплектической групп. Пусть R2r— координатное пространство с двумя скалярными про- изведениями: евклидовым (,) и симплектическим [,]: > -> ->.+ (х, у) = х у, -> -> ->->-> [X, у] = х I2ry=:(x, 12гу). Поскольку 12г— — Е2г, оператор 12, определяет на R2r комплекс- ную структуру (см. § 12 ч. 1) с комплексным базисом^ {е/ + ier+j\j = 1, ..., г}, относительно которой имеется эрмитово скалярное произведение (х, у)~(х, y) — iCx, у] (см. предложение п. 2 § 6). В терминах этих структур имеем U (г) = О (2г) П Sp (2r) = GL (г, С) f] Sp (2r) = GL (г, С) П О (2г). Мы оставляем читателю проверку в качестве упражнения. § 14. Теорема Витта и группа Витта 1. В этом параграфе мы изложим результаты Витта, относя- щиеся к теории конечномерных ортогональных пространств над произвольными полями. Они уточняют теорему классификации из § 3 и могут рассматриваться как далеко идущее обобщение тео- ремы инерции и понятия о сигнатуре. Начнем с некоторых опреде- лений. Как обычно, считаем характеристику поля скаляров не равной двум. Гиперболической плоскостью называется двумерное простран- ство L с невырожденным симметричным скалярным произведе- нием (,), имеющее ненулевой изотропный вектор. Гиперболическим пространством называется пространство, раз- лагающееся в прямую сумму попарно ортогональных гиперболи- ческих плоскостей. Анизотропным пространством называется пространство, не имеющее (ненулевых) изотропных векторов. Над вещественным полем анизотропные пространства L имеют сигнатуру (», 0) или (0, п), где п — dim L. Мы сейчас покажем, 185
что гиперболические пространства суть обобщения пространств с сигнатурой (т,т). 2. Лемма, У гиперболической плоскости L всегда существуют базисы {е', е'2} с матрицей Грама « {ер е2} с матрицей Г рама (°}). Доказательство. Пусть l^L, Если Л е L не пропорционален /, то ибо L невырождена. Можно счи- тать, что (/1, /)= 1. Положим е{ = 1,е2 — 1х—— - I- Тогда (ehei) = (e2, е2) = 0, (ei,e2) = 1. Положим е' = --1 , е' = -~р^-. Тогда (е', е[)=1, (е', е') = — 1, (е\, е>) = 0. Лемма доказана Базис {ei, е2} мы будем называть гиперболическим. Аналогично, в общем гиперболическом пространстве мы будем называть гипер- болическим базис с матрицей Грама, состоящей из диагональных блоков (° q)• 3. Лемма. Пусть UcL — изотропное подпространство в невы- рожденном ортогональном пространстве L, {еь ..., ет}—базис в Lo. Тогда существуют такие векторы е\, ..., e‘m е L, что {еь е', ет, е'т] образуют гиперболический базис своей линейной оболочки. Доказательство. Пусть Lt — линейная оболочка {е2, ... ..., ет}. Так как L\ строго меньше Lo, то L\ строго больше Lo в силу невырожденности L. Пусть et е L\ \ Lo. Тогда (еь щ) = О при i 2, но (вр е^ =#0. Можно считать, что (е", е,) — 1, так что е" не пропорционален еь Как в доказательстве леммы п. 2, положим (вр / e'l=ei—-——~е\- Тогда {et, ej образуют гиперболический базис своей линейной оболочки. Ортогональное дополнение к ней невырождено и содержит изотропное подпространство, натянутое на {е2, ..., ет}. К этой паре можно применить аналогичное рас- суждение, и индукция по т дает требуемое. 4. Теорема (Витт). Пусть L — невырожденное конечномерное ортогональное пространство, L', L" cL — два его изометричных подпространства. Тогда любая изометрия f': L'-^L" может быть продолжена до изометрии f: L-*-L, совпадающей с f' на L’. Доказательство. Разберем последовательно несколько случаев. a) L' «= L" и оба пространства невырождены. Тогда L — = £' Ф(Ь')Х и можно положить f — f'® б) L' =/= L", dim L' — dim L"=l, и оба пространства невырож- дены. Изометрию f': L’-^L” можно продолжить до изометрии f": L' + L"->L' + L", положив — для l^L', ["(!) = — для leL". Если L'+ L" певырождено, то f" продол- жается до f по предыдущему случаю. Если L' + L" вырождено, то 183
ядро скалярного произведения на L' -f- L" одномерно. Пусть ei по- рождает это ядро, е2 порождает L'. В ортогональном дополнении к е2 в L найдем такой вектор е\, что базис {ер е'| порождаемой этими векторами плоскости гиперболичен. Это возможно по лемме п. 3. Покажем, что подпространство Lo, натянутое на{ер е\, е2}, невырождено, и изометрия L' -> L" продолжается до изометрии f: Lo. После этого можно будет применить случай а). Невырожденность следует из того, что (е2, е2)У=0, а матрица Грама векторов {ер ер е2} имеет вид (01 ох 10 0 ). о о (е2, е2) / Для продолжения f' заметим сначала, что ортогональное дополне- ние к f'(e?) в Lo двумерно, невырождено и содержит изотропный вектор е>. Поэтому оно является гиперболической плоскостью, так же как и ортогональное дополнение к е2 в Lo. По лемме п. 2, существует изометрия второй плоскости с первой. Ее прямая сум- ма с f является искомым продолжением. в) dim L' — dim L" > 1 и L', L" невырождены. Проведем ин- дукцию по dim L'. Так как в L' имеется ортогональный базис, су- ществует разложение L — L\ ф в ортогональную прямую сумму подпространств ненулевой размерности. Так как f— изометрия, то L = L\ ф £2, где Li — f (Li), и эта сумма ортогональна. По индук- тивному предположению ограничение f' на Lt продолжается до изометрии ft: L—>L. Она переводит (£i)x => £2- в (£i)x=>£2. Снова по индуктивному предположению существует изометрия (£i)x с (£i)x, которая на L2 совпадает с ограничением До- полнив его ограничением f' на £,, получим требуемое. г) L' вырождено. Мы сведем этот последний случай к уже разобранному. Пусть Lqc: L — ядро ограничения метрики на L'. Выбрав ортонормированный базис в L', мы можем построить пря- мое разложение £ = £i ф Lo, где Lt невырождено. В ортогональ- ном дополнении к Д внутри L мы можем найти подпростран- ство Lo такое, что сумма £офА]ф£о прямая и пространство £оф£э гиперболично, как в лемме п._3; в частности, £офДф£э невырождено. Аналогично построим £оф£1ф£о> исходя из про- странства L". Очевидно, изометрия f': L‘ -> L" продолжается до изометрий этих прямых сумм, ибо все гиперболические простран- ства одинаковой размерности изометричны. Возможность дальней- шего продолжения этой изометрии следует теперь из случая в). Теорема доказана. 5. Следствие. Пусть L\, L2 — изометричные невырожденные пространства и L\, L? — их изометричные подпространства. Тогда ортогональны? дополнения (д)х, (д)х к ним изометричны. 187
6. Следствие. Пусть L — невырожденное ортогональное про- странство. Тогда любое изотропное подпространство L содержится в максимальном изотропном подпространстве, и для двух макси- мальных изотропных подпространств L', L" существует изометрия f: L-> L, переводящая L' в L". Доказательство. Первое утверждение тривиально. Для доказательства второго допустим, что dim L' dim L". Любая ли- нейная инъекция f': L'-> L" является изометрией L' с Im/'. По- этому она продолжается до изометрии f: L-+L. Тогда £'<=/-'(£") и f_1 (£") изотропно. Так как L' максимально, dim L' = dim f-1 (£") = = dim L". 7. Следствие. Для любого ортогонального пространства L су- ществует ортогональное прямое разложение Lo® Lh® Ld, где Lo изотропно, Lh гиперболично и La анизотропно. Для любых двух таких разложений существует изометрия f: L-*- L, переводящая одно из них в другое. Доказательство. Возьмем в качестве £0 ядро скалярного произведения. Разложим L в прямую сумму Lo® Li. В Li возьмем максимальное изотропное подпространство и вложим его в гипер- болическое подпространство удвоенной размерности Lh, как в лем- ме п. 3. В качестве La возьмем ортогональное дополнение к Lh в Li. Оно не содержит изотропных векторов, иначе такой вектор можно было бы добавить к исходному изотропному подпростран- ству, которое не было бы максимальным. Это доказывает суще- ствование разложения требуемого вида.. Наоборот, в любом таком разложении Lo® Lh® La простран- ство Lo является ядром. Далее, максимальное изотропное подпро- странство в Lh одновременно максимально изотропно в Lh Ф La, поэтому размерность Lh определена однозначно. Значит, для двух разложений £оф£ьфД/ и £оф£лф La существует изометрия, переводящая Lo в Lo, Lh в Lh- Она дополняется изометрией Ld в Ld по теореме Витта, что завершает доказательство. Назовем La ани- зотропной частью пространства £; она определена с точностью до изометрии. Это следствие есть обобщение принципа инерции на произволь- ные поля скаляров, сводящее классификацию ортогональных про- странств к классификации анизотропных пространств или, на языке квадратичных форм, к классификации форм, не представ- ляющих нуля, для которых из q(l) = 0 следует, что I = 0. 8. Группа Витта. Пусть Ж— поле скаляров. Обозначим через №(Ж) множество классов анизотропных ортогональных про- странств над Ж (с точностью до изометрии), дополненное классом нулевого пространства. Введем на №(Ж) следующую операцию сложения: если £ь Z_2— два анизотропных пространства, [£i], '[jL2] — их классы в №(Ж), то [Li] + [£2] — класс анизотропной ча- сти Li®L2 (справа стоит ортогональная внешняя прямая сумма). Нетрудно убедиться, что определение корректно. Далее, эта операция сложения ассоциативна, и класс нулевого пространства служит нулем в W (Ж). Более того, имеет место 188
9. Теорема, a) W (Ж) с введенной операцией сложения яв- ляется абелевой группой, называемой группой Витта поля Ж. б) Пусть La означает одномерное координатное пространство над Ж со скалярным произведением аху, aeJf\{0}. Тогда [£о] зависит только от смежного класса а (Ж*)2, и элементы [£о] со- ставляют систему образующих группы W (Ж). Доказательство. Нам осталось убедиться, что у каждого элемента ЦДХ) существует обратный. Действительно, пусть L — анизотропное пространство с метрикой, которая в ортогональном п базисе {еь ..., еп) задана формой У, azx?. Обозначим через L про- 1-1 п странство L с метрикой — У atx2 и покажем, что L®L гипер- болично, так что [L] + [£] — [0] в W (X). Действительно, метрика п в L Ф L задана формой X ai (х2 — у2^). Но плоскость с метрикой а(х2 — у2), очевидно, гиперболична, ибо форма невырождена, а вектор (1, 1) изотропен. То, что [£а] зависит лишь от а (УТ*)2, было проверено в п. 7 § 2. Кроме того, каждое «-мерное ортого- нальное пространство разлагается в прямую ортогональную сум- му одномерных пространств вида La- Это завершает доказатель- ство. § 15. Алгебры Клиффорда 1. Алгеброй над полем Ж мы будем называть ассоциативное кольцо с единицей А, содержащее поле Ж и такое, что Ж лежит в центре А, т. е. коммутирует со всеми элементами А. В частности, А является J^-линейным пространством. Рассмотрим конечномерное ортогональное пространство L с метрикой g. В этом параграфе мы построим такую алгебру C(L) и ^-линейное вложение р: £->С(£), что для любого элемента IeL будет выполнено соотношение р (О2 = <?(/, 0-1, т. е. скалярный квадрат каждого вектора из L будет реализован как его квадрат в смысле умножения в C(L). Кроме того, эле- менты p(L) будут мультипликативными образующими С(£), т. е. любой элемент из C(L) окажется представимым в виде линейной комбинации (некоммутативных) одночленов от элементов р(£). Алгебра С(£) (вместе с отображением р) с такими свойствами будет называться алгеброй Клиффорда пространства L. 2. Теорема, а) Для всякого конечномерного ортогонального пространства L алгебра Клиффорда C(L) существует и имеет раз- мерность 2" над Ж, где п = dim L. б) Пусть о: L-*-D — любое Ж-линейное отображение L в Ж-алгебру D, для которого o(l)2 — g(l, I) 1 для всех I е L. Тогда существует единственный гомоморфизм Ж-алгебр т: С (£)->/) 189
такой, что a —top. В частности, C(L) определена однозначно с точностью до изоморфизма. Доказательство, а) Выберем в L ортогональный базис {ei, еп}, (ei,ei)— at. По определению, в C(L) должны выпол- няться соотношения р (е,)2 = ah р (е;) р (ez) = — р (е,) р (е,), i j. Второе из них следует из того, что [р(е,,+ е;)]2 = р(е<)2 + + Р (е<) Р (е/) + р (е;) р (е,) + р (е;)2 = р (е.)2 + р(е;)2. Разложив эле- менты /1, ..., 1m е £ по базису {е,} и пользуясь тем, что умноже- ние в £ JJf-линейно по каждому из сомножителей (это следует из того, что УН лежит в центре), мы можем представить любое произ- ведение p(/i) ... р(/т) в виде линейной комбинации одночленов относительно р(е<). Заменив р(ет)2 на а,- и p(ez)p(ey) при i> j на —p(e/)p(₽z), мы можем привести любой-одночлен к виду ap(ezj ... ...p(e,-m), где aeJSf, £ </2 < ... < im. Дальнейших соотноше- ний между такими выражениями не видно; одночленов р(е»()... ... р (в;т) имеется 2т (включая тривиальный одночлен 1 при ш = 0). План доказательства состоит в том, чтобы сделать строгими эти наводящие соображения, действуя более формально. С этой целью для каждого подмножества S<={1, ..., п} вве- дем символ es (который впоследствии окажется равным p(eZj)... •••р(е‘т)’ если 5 = {‘ь •••’ < ••• положим также еа— 1 (0 — пустое подмножество). Обозначим через С(£) ^-ли- нейное пространство с базисом {es}- Определим умножение в С(£) следующим образом. Если 1 s, t п, положим (s, t) = 1 при s^t, — 1 при S > t. Для двух подмножеств S, £с{1, ..., п} положим a(S, Т)~ П (s, 0 П аь seS ZeSnT tc=T где, напомним, at — g(et, ei). Пустые произведения считаются равными единице. Наконец, произведение линейных комбинаций S ases> X ^тет е С (L); as,bT е Ж, определим формулой (£ a$es) (£ bTeT} = £ asbT a (S, Т) е8ут, где SVT — (5 U 7')\(Sf| Т)— симметрическая разность множеств S, Т. Все аксиомы JSf-алгебры проверяются тривиально, за исклю- чением ассоциативности. Ассоциативность достаточно проверить на элементах базиса, т. е. установить тождество (e$er) eR = es 180
Поскольку es£T—a(S, T)esVr, имеем (eseT)efi = a(S, T)a(S\/T, К)е(5уГ)ук, е5(етек) = а($> TvR)a(7, R)esVffVRb Нетрудно проверить, что (sv7)vR = sv(7vR)= = {(SU7U/?)\[(SnnU(Sfl/?)U(7fl/?)]}U(Sn7f]/?). Поэтому остается убедиться лишь в совпадении скалярных коэф- фициентов. Часть a(S, T)a(SV T,R), относящаяся к знакам, имеет вид П (s, t) П (и. г). seS ueSvT t^T r^R Заставив во втором произведении и пробегать сначала все эле- менты S, а затем все элементы Т (при фиксированном г), мы вве- дем сомножители (и, г)2, ueS[]T, равные единице, так что этот «знак» можно записать в симметрическом по 5, Т, R виде П (s> о П («, и п («. г). s&S u^S иеТ t(=T reR reR Аналогично с тем же результатом преобразуется знак, относя- щийся к o(S, Т V R)a(T, R). Остается разобрать множители, в ко- торые входят скалярные квадраты п,. Для a(S, T)a(S V Т, R) они имеют вид Но (S V 7)1'] R =(S П R) V(T(] R), a S f] 7 с этим множеством не пересекается, и (S f) 7)U [(S П R) V(T f] R)] состоит из тех элементов SU7UR, которые содержатся более чем в одном из этих трех множеств. Поэтому наш множитель симметрично зависит от S,T,R. Аналогично с тем же результатом вычисляется нужная нам часть коэффициента а(5, 7 V R)a(T, R). Это завершает доказательство ассоциативности алгебзь;С (L). Определим, наконец, J^-линейное отображение р: L-^C(L) условием р (е<) == вц). Согласно формулам умножения еа является единицей в С (L), и ( afe0 при i — j, v ' v '' {,) I — е пе„-. при I #= /. Поэтому (р, C(L)) есть алгебра Клиффорда для L. б) Последнее утверждение доказывается формально. Пусть a: L -> D — Х-линейное отображение с o(Z)2 —g(/, /)•!. Суще- ствует единственное ^-линейное отображение т: С (£)->£), которое на элементах базиса es определено формулой T(ep1-w)==o(^)”’o(eU> Т (ей) = 191
Для него тор = а, ибо это так на элементах базиса L. Наконец, т является гомоморфизмом алгебр. Действительно, T(eser) = T(a(S, Т)е8^т) = а (S, T)t(esvi), и нетрудно проверить, что x(es)x(eT) можно привести к тому же виду, пользуясь соотношениями ст (е{)2 — ah о (et) о (е,) — — о (е,) о (et) при i j. Это завершает доказательство. 3. Примеры, а) Пусть L — двумерная вещественная плоскость с метрикой —(>с2 +1/2) - Алгебра Клиффорда C(L) имеет базис (1, еь е2> 6162) с мультипликативными соотношениями в|' = е2 = 1 > ^1^2== • Нетрудно убедиться, что отображение 11—>1, e,i—>i, e2i—>j, eie2i—*k определяет изоморфизм C(L) с алгеброй кватер- нионов H. б) Пусть L — линейное пространство с нулевой метрикой. Алгебра C(L) порождена образующими {ei, ..., еп} с соотноше- ниями е^—0, eie/— — ejei при / =/= /. Она называется внешней алгеброй, или алгеброй Грассмана, ли- нейного пространства L. Мы еще вернемся к ней в части 4. в) Пусть L— Jtc—комплексифицпрованное пространство з Минковского с метрикой х2— х? относительно ортонормирован- i = 1 него базиса {е,} в М, являющегося одновременно базисом Л1С. Покажем, что алгебра Клиффорда С (,<с) изоморфна алгебре комплексных 4 X 4-матриц. С этой целью рассмотрим матрицы Дирака, записываемые: в блочном виде: v»-(v,/=1.2.3. Пользуясь свойствами матриц Паули а;, нетрудно убедиться, что у,- удовлетворяют тем же соотношениям в алгебре матриц ЛД(С) что и р(в/) в алгебре C(Jfc): 9 2 9 .9 1 >0= - V1 = — V9= — 1 (т. е. £4); yiyi -|- у/у,> — 0 при t #= j. Значит, С-линенное отображе- ние о: .#с->/И4(С) индуцирует гомоморфизм алгебр т: C(Jtc)~> —►Л'ГДС), для которого т-р(е,)— у,. Непосредственным вычисле- нием можно проверить, что отображение т сюръективно, а так как обе С-алгебры С(^с)и М4(С) шестнадцатимерны, т является изоморфизмом.
Часть 3. АФФИННАЯ И ПРОЕКТИВНАЯ ГЕОМЕТРИЯ § 1. Аффинные пространства, аффинные отображения и аффинные координаты 1. Определение. Аффинным пространством над полем Ж назы- вается тройку. (A,L, +), состоящая из линейного пространства L над полем м, множества А, элементы которого называются точ- ками, и внешней бинарной операции Ay^L-^A-. (а, /)>—> а -|- I, удовлетворяющей следующим аксиомам-. а) (а I) + пг *=* а + (I + т) для всех а<=А', I, ms L; б) а + 0 = а для всех аеА; в) для любых двух точек а,Ь е А существует единственный вектор le L со свойством b = а + I. 2. Пример. Тройка (L, L, +), где L — линейное пространство, а -ф совпадает со сложением в L, является аффинным простран- ством. Удобно говорить, что она задает аффинную структуру ли- нейного пространства L. Этот пример типичен; позже мы увидим, что всякое аффинное пространство изоморфно такому. 3. Термины. Мы часто будем называть аффинным простран- ством пару (Д,£) пли даже просто А, опуская указания на -|-. Линейное пространство L называется ассоциированным с аффин- ным пространством А. Отображение А-+А: ai—^a-j-l называется сдвигом на вектор I; удобно иметь для него специальное обозна- чение ti. Мы пишем а — I вместо t-i(a) или « + (—/) 4. Предложение. Отображение определяет инъективный гомоморфизм аддитивной группы пространства L в группу пере- становок точек аффинного пространства А, т. е. эффективное дей- ствие L на А. Это действие транзитивно, т. е. для любой пары то- чек, а, Ь&А существует [eLc ti(a) = b. Наоборот, задание транзитивного эффективного действия адди- тивной группы L на множестве А определяет на А структуру аф- финного пространства с ассоциированным пространством L. Доказательство. Из аксиом а) и б) следует, что при любых l^L и аеЛ уравнение ti(x) = a имеет решение х== = «+(—/), так что все ti сюръективны. Если /;(«)== б(Ь), то, найдя по аксиоме в) такой вектор m е L, что b = а -ф т, получаем а + I == (а + т) + I = (а + /) + т. Но а + I = (а ф- /) + 0, поэтому из условия единственности аксиомы в) следует, что т — 0, так что а = Ь. Поэтому все ti инъективны. 193
Аксиома а) означает, что tm°ti = ti+m, а аксиома б)—что to == idz- Поэтому отображение является гомоморфизмом аддитивной группы L в группу биекций ZI с самим собой. Его ядро равно нулю в силу аксиом б) и в). Наоборот, пусть L%A-^A: (I, a)t—>a -|- I — эффективное тран- зитивное действие L на А. Тогда аксиомы а) и б) получаются прямо из определения действия, а аксиома в) — из соединения свойств эффективности и транзитивности. 5. Замечание. По поводу действия групп (не обязательно абе- левых) на множествах см. § 2 главы 7 «Введения в алгебру». Мно- жество, на котором группа действует транзитивно и эффективно, называется главным однородным пространством над этой Группой. Отметим, что в аксиомах аффинного пространства не фигури- рует явно структура умножения на скаляры в L. Она появляется лишь в определении аффинных отображений и затем барицентри- ческих комбинаций точек А. Но прежде несколько слов о форма- лизме. 6. Правила вычислений. Тот единственный вектор leL, для которого Ь = а-\-Ц удобно обозначать b — а. Эта операция «внеш- него вычитания» ЛХЯ-э-L: (b,a)i—>b— а обладает следующими свойствами: а) (с — Ь) + (& — а)=с— а для всех а, Ь, сеЯ; сложение слева — это сложение в L. Действительно, пусть с = b + I, Ь — а + пг, тогда с = *=а так что с — 1А~ т*=(с— fc)-f-(6— о). б) а — а = 0 для всех а е А. в) (а+/) — (& +т) = (а — 6) + (/—т) для всех а,Ь^А, I, т s L. В самом деле, достаточно проверить, что (fe + m) + (a— Ь) + 4-(/ — m) = a-|-Z, или & + (« — Ь)= а, а это — определение а — Ь. Вообще, употребление знаков ± для различных операций АХА-э-L, АХА-э-Л подчиняется следующим фор- мальным правилам. Выражение ±ai±«2± ••• ±am + 6 + ... ... + In для «/5/1, Ik^L имеет смысл, если либо т четно и все rtfl/ можно объединить в пары вида а,- — а,, либо т нечетно, и все точки можно объединить в такие пары, кроме одной, входящей со знаком 4~. В первом случае вся сумма лежит в L, во втором — >в А. Кроме того, она зависит от своих слагаемых коммутативно и ассоциативно: например, а} — а2А-1 можно вычислять как (aj — а2)-[-1 или (й1 + /)—а2 или а\—(а2 — Z); мы позволим себе писать а А- I, так же как I + а. Доказывать это правило в общем виде мы не станем. Всякий раз, когда мы будем им пользоваться, читатель без труда разобьет нужную выкладку на серию элементарных шагов, каждый из ко- торых сведется к применению одной аксиомы или формулы а)—в) начала этого пункта. Заметим, что сумма а + Ь, где а, b е А, вообще говоря, смысла не имеет, так же как и выражение ха, где х с= УА (исключение: 184
A—L). Тем не менее ниже мы придадим однозначный смысл, на- пример, выражению у а 4-уЬ (но не его слагаемым!). Интуитивно аффинное пространство (A,L, -ф) следует пред- ставлять себе как линейное пространство L с «забытым» началом координат 0. Оставлена лишь операция сдвига на векторы L, сум- мирования сдвигов и умножения вектора сдвига на скаляр. 7. Аффинные отображения. Пусть (Ль Li), (Л2, £2) — два аф- финных пространства над одним и тем же нолем Ж. Аффинно 'линейным, или просто аффинным, отображением первого во вто- рое называется пара (f,Df), где f: Д1->Д2, Df: Li~+L2, удовлет- воряющая следующим условиям: a) Df — линейное отображение. б) Для любых а.1, а2^А имеем f(ad~ f(a2)=Df (01— а2). (Оба выражения лежат в L2.) Df (пли D(f)) называется линейной частью аффинного отобра- жения f. Поскольку oi — а2 пробегает все векторы Ц, когда аь a2^Ai, линейная часть Df определяется по f однозначно. Это позволяет обозначать аффинные отображения просто f: Ai~+A2. 8. Примеры, а) Любое линейное отображение f: Li->L2 инду- цирует аффинно линейное отображение пространств (Lb L\, +)-> ->(£2, И, +) • Для него Df = f. б) Любой сдвиг tp. аффинно линеен и D(ti) = idL. Дей- ствительно, h (ад — tt (ад = (сц + /) — (а2 + Z) = гц — а2. в) Если f: Ai-^-A2 — аффинно линейное отображение и l^L2, то отображение tiof: Д1->Л2 аффинно линейно, и D(ii°f) = D(f). В самом деле, h ° f (ад— h ° f (а2)= (f (ад +1)— (f (ад + /)= f (ад — f (ад = Df (a}—a2\ г) Аффинно линейная функция f: А-+Ж определяется как аффинно линейное отображение А в (Ж\ Ж1,+), где Жх—одно- мерное координатное пространство. Таким образом, f принимает значения в Ж, a Df есть линейный функционал на L. Любая по- стоянная функция f аффинно линейна: Df = 0. 9. Теорема, а) Аффинные пространства вместе с аффинными отображениями образуют категорию. б) Отображение, ставящее в соответствие аффинному про- странству (Л, L) линейное пространство L, а аффинному отображе- нию f: (Ai, Ld^~(A2, L2) линейное отображение Df: Li^-L2, яв- ляется функтором из категории аффинных пространств в категорию линейных пространств. Доказательство. Справедливость общекатегорных аксиом (см. § 13 ч. 1) вытекает из следующих фактов. Тождественное отображение id: аффинно. Действительно, Oi — a2 = idL(ai — а2). В частности, £>(idA) = idi. 195
Композиция аффинных отображений А—'-> А —А является аффинным отображением. В самом деле, пусть a, be А. Тогда fi(a)— fi(b) = Dfi(a— b) и далее f2f 1 («) - f2f i (b) = Df2 [f, (a) - h (ft)] = Df2 о Df, (a - b). Мы доказали требуемое и заодно получили, что D(f2fi)=^ — Df2oDfi. Вместе с формулой D(id/i)^= idL это доказывает утверждение б) теоремы. Следующий важный результат характеризует изоморфизмы в нашей категории. 10. Предложение. Следующие три свойства аффинного отобра- жения f: Ai—>А2 равносильны-. a) f— изоморфизм-, б) Df — изоморфизм-, в) f — биекция в теоретико-множественном смысле. Доказательство. Согласно общекатегорному определению f: А,->А2 есть изоморфизм тогда и только тогда, когда имеется такое аффинное отображение g: А2->АЬ что gf — id^,, fg — id^. Если оно существует, то D (fg) — idz,2 = D(f)D (g) и D (gf) = idz., = *=D(g)D(f), откуда следует, что D(f)—изоморфизм. Покажем теперь, что Df — изоморфизм тогда и только тогда, когда f — биекция. Фиксируем точку ai е Ai и положим a2 — f(ai). Любой элемент А,- однозначно представляется в виде at + U, lt е Lt, i = 1, 2. Из основного тождества f («1 + /i) - f (а.) = Df [(а, + - а,] = Df (lt) следует, что f(«i + Zi)= a2 + Df(Zi). Следовательно, f — биекция тогда и только тогда, когда Df(L) при lxeLx пробегает все эле- менты L2 по одному разу, т. е. Df является биекцией. Но линейное отображение есть биекция тогда и только тогда, когда оно обра- тимо, т. е. является изоморфизмом. Наконец, покажем, что биективное аффинное отображение яв- ляется аффинным изоморфизмом. Для этого следует проверить, что обратное к f теоретико-множественное отображение аффинно. Но в обозначениях предыдущего абзаца это отображение опреде- ляется формулой f ' + 4) “=О1 + (Df) 1 (l2), l2 е £2. Поэтому Г1 (а2 + 12) - Г1 (а2 + li) = (Df)”1 (l2) - (Df)"1 (l'2) = (Df)’* (Z2 - f2) в силу линейности (Df)-1. Итак, f-1 аффинно и D(f-1) = D(f)-1. Окончательно, мы установили импликйЦЙи В) =Ф-б)-«=>в) => а, откуда и следует предложение. Конструкция конкретных аффинных отображений часто основы- вается на следующем результате. 106
11. Предложение. Пусть (Ab Li), (Аг, Дг)— два аффинных про- странства. Для любой пары точек cieAi, а2^А2 и любого ли- нейного отображения g: Li~+ L2 существует единственное аффин- ное отображение f: Ai->A2 с f(ai) = а2 и Df = g. В самом деле, положим f («1 + h) = а2 + g Gi) для /1 е L\. Поскольку любая точка Ai однозначно представляется в виде ai + li, эта формула определяет теоретико-множественное отображение f: Ai->A2. Оно аффинное, f(«i)= ц2 и Df — g, по- тому что f («! + 'О - /(°. + 0=s (А) - в (I',) -g(I, - О= -«[(О,+ (,)-(«,+01 Это доказывает существование f. Наоборот, если /' — отображение с требуемыми свойствами, то f(ai + l)-f(ai) = g(l), откуда f (ai + I) — а2 + g(l) для всех I е L. 12. Важный частный случай предложения п. 11 получается, если применить его к (A, L), (L, L), а е A, OeL и g=> idj> Мы получим, что для любой точки а е А существует единственный аффинный изоморфизм f-. А-+ L, переводящий эту точку в начало координат, с тождественной линейной частью. Это и есть точный смысл представления о том, что аффинное пространство есть «ли- нейное пространство с забытым началом координат». В частности, аффинные пространства изоморфны тогда и только тогда, когда изоморфны ассоциированные линейные про- странства. Последние классифицируются своей размерностью, и мы можем назвать размерностью аффинного пространства размер- ность соответствующего линейного пространства. 13. Следствие. Пусть fi, f2: Ai~>A2— два аффинных отображе- ния. Их линейные части совпадают тогда и только тогда, когда f2 есть композиция fi со сдвигом на некоторый вектор из Ь2, кото- рый определяется однозначно. Доказательство. Достаточность условия была проверена в примере в) п. 8. Для доказательства необходимости выберем лю- бую точку аеЛ1 и положим fr Очевидно, f'2(a) = — и D (f2) = D (f2). По предложению п. 11 f'2 — f2- Наоборот, если f2 = ti°fi, то l = f2(a)—fi(a); этот вектор не зависит от а^А из-за совпадения линейных частей /j, f2. 14. Аффинные координаты, а) Система аффинных координат в аффинном пространстве (A, L) есть пара, состоящая из точки ао^А (начала координат) и базиса {ei, ..., еп} ассоциированного линейного пространства L. Координаты точки а е А в этой си- стеме образуют вектор (хь ..., хп)е^'г, однозначно определяе- п мый условием а = а0 + xtet. 197
Иначе говоря, отождествим А с L посредством отображения с тождественной линейной частью, переводящего йо в 0, и возьмем координаты образа точки а в базисе {еь еп}: это и будут V1....Хп. Пусть в пространствах А], А2 выбраны системы координат, отождествляющие их с Жт, Жп соответственно. Тогда любое аф- финно линейное отображение f: Aj->A2 можно записать в виде f(x) = Bx + y, где В — матрица отображения Df в соответствующих базисах L2, а у — координаты вектора f — а' в базисе Ь2, а„ — нача- ло координат в А,, а" — начало координат в А2. Действительно, отображение х >—> Вх 4- у аффинно линейно, переводит а{ в f (й£) и имеет ту же линейную часть, что и f. б) Другой вариант данного определения системы координат со- стоит в том, чтобы заменить векторы {еь ..., еп} точками {flo 4-51, ..., йо 4~ еп) в А. Положим щ = йо + е,-, i=l, ...,п. Координаты точки йеА находятся тогда из представления п й = Йо + У, xt (а( — й0). Возникает соблазн «привести по- i=l (п х 1 — у Xi ) йи+ п 4- У Х/йрОтдельные члены в этой сумме не имеют смысла! Тем »=i не менее оказывается, что суммы такого вида можно рассматри- вать, и они весьма полезны. 15. Предложение. Пусть ас, ..., as — любые точки аффинного 8 пространства А. Для любых у0, ..., ys^№ с условием У «/г = 1 «=о S определим формальную сумму У у fit выражением вида 8 s У yiOf — а ч- У уi (at — а), i-0 i-0 где а — любая точка А. Утверждается, что выражение справа не S зависит от а. Поэтому точка У yfli определена корректно. Она i-u называется барицентрической комбинацией точек ао, .... as с коэф- фициентами у0, ..., ys. Доказательство. Заменим точку а на точку а 4~ I, Получим s S 04-/4- У yi(at — а — 1) = а 4- У yi(at-a), 19ft
✓ s \ ибо I 1 — У */,- )/= 0. Мы пользовались здесь правилами, сфор- X i-0 / мулированными в п. 6. Читателю будет полезно провести эту вы- кладку подробно. 16. Следствие. Система {а0; «1 — Яо> ..., — Оо}. состоящая из точки а^А и векторов at — а0 в L, образует систему аффин- ных координат в А тогда и только тогда, когда любая точка А однозначно представима в виде барицентрической комбинации п п У, хущ, Xi^W, У%£=1. »=0 i-0 Когда это условие выполнено, система точек {а0, ..., ап} назы- вается барицентрической системой Координат в А, а числа хо, ... п хп — барицентрическими координатами точки У i-0 Доказательство. Все непосредственно следует из опреде- п п лений, если вычислять £ xfaf по формуле а0 + У х{ (at — а0). i —0 i=1 Действительно, так как любая точка А однозначно представляется в виде йо + Л система {«о, «1 — «о> •••> ««— «о} является аффинной системой координат в А тогда и только тогда, когда всякий вектор le.L однозначно представляется в виде линейной я комбинации У%г(аг— а0)> т- е- если {fli — °о.«л—йо} обра- 1 зуют базис L. По координатам Xi, ..., хп.вектора I барицентриче- ские координаты точки «о +1 восстанавливаются однозначно в п виде 1 — У xt = х0, Xi, ..., х„. /-! 17. С барицентрическими комбинациями можно во многом об- ращаться так же, как с обычными линейными комбинациями в линейном пространстве. Например, слагаемые с нулевыми коэф- фициентами можно выбрасывать. Наиболее полезное замечание состоит в том, что барицентрическая комбинация нескольких бари- центрических комбинаций точек ао, ..., as в свою очередь является барицентрической комбинацией этих точек, коэффициенты которой можно вычислять по ожидаемому формальному правилу! s s s s z пг х Х1 у Уиси + х2У ynat + ... + xm У yimat= У ( У xkyik )«!• i-0 i-О Г=0 i-0 \k-l / Действительно, s m ms m У X ХкУ1ьш У Хк у f/ife= У Хь «= 1, i—О k=\ i=0 k=\ так что последняя комбинация барицентрична. Вычисляя левую и правую части этого равенства по правилу, сформулированному в предложении и. 15, с помощью одной и той же точки сеД и применяя формализм п, 6, легко получим, что они совпадают. 199
Наконец, барицентрические комбинации ведут себя как линей- ные комбинации относительно аффинных отображений. 18. Предложение, а) Пусть f: А1-^А2 — аффинное отображение и а0 as е At. Тогда f ( У xta^\ = У Xtf (at), \f=0 / i=0 s если Xt — 1. б) Пусть ao, ..., an задают барицентрическую систему коор- динат в At. Тогда для любых точек Ьо, ..., Ьп^А2 существует единственное аффинное отображение f, переводящее а, в b,-, i — = 1, ..., п. Доказательство. Выбрав а еЛ,, получим f (Д ад) = f (й + ДXi (at — а)) = / (а) + Df xt (at — а)) = “ f (а) + Е xtDf (ai ~ «) = f («) + E xi (f (ai) — f («)) = E Xif (af) i^O i = 0 i=0 по предложению n. 15, что доказывает утверждение a). Если a0, ..., an образуют барицентрическую систему коорди- нат в Ль то по следствию п. 16 всякая точка А представляется п единственной барицентрической комбинацией У, .ад-. Определим i = 0 тогда теоретико-множественное отображение f: At->-A2 формулой / п \ п f ( У, .ад-) = У xtbt. В силу а) это единственное возможное опре- \»=о / «=о деление, и нужно лишь проверить, что f — аффинное отображение. Действительно, вычисляя, как в предложении п. 15, получаем / п \ / п \ п п п f ( Е xtai) — f ( У yiai) = У xibi — У yfa = b0 + У xt (bt — b0) — \i=0 / \i=0 / i=0 i=0 /=0 [n bo + X У1 (bi — b0) i^O n / n n x = X Ui — 7f) (bi — bo)=Df ( X )’ z=0 \t=0 t=0 / где Df: Li->L2 — линейное отображение, переводящее a, — aQ в bt — b0 для всех t= 1, ..., n. Оно существует, ибо аг — aQ, ... ..., ап — «о по предположению образуют базис Ц. 19. Замечания. В аффинном пространстве R" барицентрическая m комбинация представляет положение «центра масс» си- 1=1 стемы единичных масс, помещенных в точках а,. Этим объясня- ется терминология. Если а,=(0, ..., 1, ..., 0) (единица на t-м месте), то множество точек с барицентрическими координатами Xi, ..., хп, 0 Xi 1, составляет пересечение линейного много- 200
образия Х[ = 1 с положительным октантом (точнее, «2"-тантом»). i-1 В топологии это множество называется стандартным (п — 1)-мер- ным симплексом. Одномерный симплекс — это отрезок прямой, двумерный — треугольник, трехмерный — тетраэдр. Вообще, мно- ( п п жество s У, Xfii У xt — 1, 0х,1 ? есть замкнутый симплекс Ь-i “1 ) с вершинами alt ..., ап в вещественном аффинном пространстве. Он называется вырожденным, если векторы а2— а^ ..., ап — aj линейно зависимы. § 2. Аффинные группы 1. Пусть А— аффинное пространство над полем Ж. Множество аффинных биективных отображений f: А->А в силу предложения п. 10 § 1 образует группу, которую мы будем называть аффинной группой и обозначать Aff А. Ее отображение D: Aff A^-GL(L), где GL(L)— группа линей- ных автоморфизмов ассоциированного векторного пространства, является гомоморфизмом. Он сюръективен по предложению п. 11 § 1 и имеет своим ядром группу сдвигов {ti\l^L} по следствию п. 13 § 1. Эта группа сдвигов изоморфна аддитивной группе про- странства L по предложению п. 4 § 1. Таким образом, Aff А есть расширение группы GL(L) с помощью аддитивной группы L, кото- рая является нормальным делителем в Aff А. Это расширение является полупрямым произведением GL(L) и L. Чтобы убедиться в этом, фиксируем любую точку а е А и рассмотрим подгруппу GaczAffA, состоящую из отображений, оставляющих а на месте. По предложению п. 11 § 1 каждый эле- мент f^Ga однозначно определяется своей линейной частью Df, и Df можно выбирать как угодно. Следовательно, D индуцирует изоморфизм Ga с GL(£). Для любого отображения f <= Aff А можно найти единственное отображение fa & Ga с той же линейной частью, и f^=ti°fa для подходящего Ze L по следствию п. 13 § 1. Фиксировав а, будем записывать ti о fa в виде пары [g; /], где g = Df = Dfa е GL(L). Правила умножения в группе Aff А на языке таких пар имеют следующий вид. 2. Предложение. Имеем [§ь Al fe; У — teisv» £МУ + А1> Доказательство. Согласно определениям [g; I] переводит точку а -ф m е А в а -ф g(m) -ф I, откуда [£ь У [&; У (с + m) = [g,; Zi] (g + (m) -ф Z,) == = a + gi (g2 (tn) ф Z2) += а ф gxg2 (m) -ф gx (l.f) ф Z, = = lSlS2> gl (У + Л] (« + m), 201
что доказывает первую формулу. Вычисляя с ее помощью произве- дение [g; Z] [g-1; —g-1 (Z)], получаем [idL; 0); а эта пара представ- ляет тождественный элемент АПЛ. Это завершает доказательство предложения и показывает, что Aff А — полупрямое произведение. 8. Пусть теперь GczGL(L)—некоторая подгруппа. Множество всех элементов f eAffA, линейные части которых принадлежат G, очевидно, образуют подгруппу в Aff А — прообраз G относительно канонического гомоморфизма AffA->GL(L). Мы будем называть ее аффинным расширением группы G. Особенно важен случай, когда ассоциированное с А линейное пространство снабжено дополнительной структурой — скалярным произведением, a G представляет собой соответствующую группу изометрий. Так строятся две важные в приложениях группы: группа движений аффинного евклидова пространства (G = О (л)) и группа Пуанкаре (L— пространство Минковского, G — группа Лоренца). Изучим подробнее группу движений. 4. Определение, а) Аффинным евклидовым пространством на- зывается пара, состоящая из аффинного конечномерного простран- ства А над полем вещественных чисел и метрики d на нем (в смысле определения п. 1 § 10 ч. 1), которая обладает следую- щим свойством: для любых точек а, Ь^А расстояние. d(a, Ъ) за- висит только от а — b^L и совпадает с длиной вектора а — Ь в подходящей евклидовой метрике пространства L (не зависящей от а, Ь). б) Движением аффинного евклидова пространства А называ- ется произвольное отображение f: А->А, сохраняющее расстояния: d(f(a), f(b)) = d(a, b) для всех а, Ь^А. 5. Теорема. Движения аффинного евклидова пространства А образуют группу, совпадающую с аффинным расширением группы ортогональных изометрий O(L) ассоциированного с А евклидова пространства L. Доказательство. Проверим сначала, что любое аффинное отображение f: А-+А с Df^O(L) является движением. В самом деле, согласно определениям d(f(a), f(b)) — \f (a) — f(b)\^\Df(a — b)\^=\a — b[ = d(a, b): в третьем равенстве мы воспользовались тем, что Pf^O(L). Основная работа связана с доказательством обратного утверж- дения. Прежде всего, очевидно, что композиция движений есть дви- жение. Далее, мы уже установили, что сдвиги являются движения- ми. Пусть «еА — произвольная фиксированная точка, f — движе- ние. Положим g = Za-rHaj ° f. Это движение, оставляющее точку а на месте. Достаточно доказать, что оно аффинное и что Dg eO(L). Отождествим А с L, как в п. 12 § 1, с помощью отображения с тождественной линейной частью, переводящего а в 0 <= L. Тогда g превратится в отображение g: L-+L со свойствами g(0) = 0 и 1^(0 — g(m) | = |/~ m| для всех /, m е L, и достаточно устано- вить что такое отображение лежит в 0(G). 202
Проверим прежде всего, что g сохраняет скалярные произве- дения. Действительно, для любых I, те L U |2 — 2 (/, т) + | т I2 == 11 — т |2 = I g (/) — g (tn) |2 = = lg(0l2 —2(g(Z), g (m)) +1 g (m) I2» откуда следует требуемое, ибо \g(l) |2 = |Z|2, |g(m) |2 = fm]2. Теперь покажем, что g аддитивно: g(l -j- т) = g(l) + g(m). Поло- жив 1+т = п и воспользовавшись предыдущим свойством, имеем О = | n — I — /п|2 = |п|2 + |/|2 + |т|2 — 2(п, /) — 2(п, т) + 2(Z, т) =* = lg(n)l2 + lg(Z)l2 + lg(m)l2 — 2(g(n), g(l)) — 2 (g(n), g(m)) + + 2 (g (I), g (m)) = | g (n) — g (0 — g И) I2, откуда g(n) = g(Z)+g(m). Наконец, покажем, что g(xZ) = xg(t) для всех xeR, leL. Полагая m = xl, имеем 0 = | m — xl |2 = | m |2 — 2x (tn, I) + x21112 — = | g (m) |2 — 2x (g (m), g (/)) + x2 [ g (/) I2 = I g (m) — xg (I) I2. Итак, g — линейное отображение, сохраняющее скалярные произ- ведения, т. е. geO(L). Теорема доказана. 6. Теорема. Пусть f: А-+А— движение евклидова аффинного пространства с линейной частью Df. Тогда существует такой век- тор leL, что Df (Z) = I и f = ti°g, где g: Ае-А— движение, имеющее неподвижную точку а е А. Доказательство. Прежде всего, выясним геометрический смысл этого утверждения. Отождествив А с L посредством аффин- ного отображения с тождественной линейной частью, которое пе- реводит а в 0, мы получаем, что f является композицией ортого- нального преобразования g и сдвига на вектор I, неподвижный относительно g (ибо Df—Dg). Иными словами, это «винтовое движение», если detg= 1, или винтовое движение, скомбиниро- ванное с отражением, если detg = —1. В самом деле, g вполне определяется своим ограничением go на/1 :g = gn®tdRt, так что g есть вращение вокруг оси RZ (возможно, с отражением). Приступим теперь к доказательству. Положим L2 — Ker (Df — — idt), Li — Л?1. Имеем L = Ц Ф Z,2; L2 состоит из Df-инвариант- ных векторов, пространство инвариантно относительно Df — idt (ибо Df ортогонален), и ограничение Df — idt на L\ обратимо. Выберем сначала произвольную точку а' е А и положим g' = tn-.г.п е f. Очевидно, g'(a') — a'. Положим f(a') — а'= ==l\A~tz, где ЦеЦ, 12еЬ>, тогда f = tt,ofi,og' и Df(l2)=l2 по определению. Покажем, что g=h,°g' имеет неподвижную точку а = а' 4- tn для некоторого m е Ц. Имеем tt, ° g' (а' + tri} = g' (а' + m) + /, — а' + Df (m) + Ц. Правая часть равна а' m тогда и только тогда, когда аоз
(Df — id/,) m-J-/1 = 0. Но, как мы уже отмечали, на Ц оператор Df— idL обратим и Поэтому т существует. Мы получили требуемое разложение f = ti2og и завершили доказательство. Движения f со свойством det Df = 1 называются иногда соб- ственными движениями, а остальные (с det Df — —1) —несобствен- ными. Представим более наглядно информацию о движениях аф- финных евклидовых пространств размерности д^З, содержащуюся в теореме и. 6. В следующем пункте сохранены обозначения этой теоремы. 7. Примеры, а) п=1. Поскольку О(1)= {±1}, собственные движения состоят только из сдвигов. Если f несобственное, то Df = —1, и из Df(l) = l следует, что 1 — 0. Поэтому всякое несоб- ственное движение прямой имеет неподвижную точку и, стало быть, является отражением относительно этой точки. б) п = 2. Собственное движение f с Df — id является сдвигом; если Df#= id и det Df = 1, то Df, будучи вращением, не имеет не- подвижных векторов, так что снова I = 0 и f имеет не- подвижную точку, относительно которой f является вращением. Если f — несобственное движение, то Df есть отражение плоско- сти относительно прямой, a f есть комбинация такого отражения и сдвига вдоль этой прямой. Значит, если несобственное движение плоскости имеет неподвижную точку, то оно имеет целую прямую неподвижных точек и представляет собой отражение относительно этой прямой. в) п = 3. Если det Df= 1, то Df всегда имеет собственное зна- чение единица и неподвижный вектор. Поэтому все собственные движения трехмерного евклидова пространства являются винто- выми движениями вдоль некоторой оси (включая сдвиги, т. е. вы- рожденные винтовые движения с нулевым поворотом). Это — так йазываемая теорема Шаля. Если движение f — tig несобственное и /#=0> то ограничение g на плоскость, ортогональную к I и проходящую через неподвиж- ную точку а, есть несобственное движение этой плоскости. Поэтому оно является отражением ’относительно прямой в этой плоскости. Обозначим через Р плоскость, натянутую на I и на эту прямую. Тогда tig есть комбинация отражения относительно плоскости Р и сдвига на вектор I, лежащий в Р. Наконец, если I = 0, т. е. f несобственное и имеет неподвижную точку, то, отождествляя ее с нулем в L, a f с Df и пользуясь су- ществованием у f собственной прямой Lo с собственным значением минус единица, получаем геометрическое описание f как компози- ции вращения в Lq и отражения относительно Ьф. Пользуясь полярным разложением линейных операторов, мы можем также разобраться в геометрической структуре любого обратимого аффинного преобразования евклидова аффинного про- странства. 8. Теорема. Всякое аффинное преобразование п-мерного евкли- дова пространства f может быть представлено в виде композиции трех отображений: а) и растяжений (с положительными коэффи- U)4
циентами) вдоль п попарно ортогональных осей, проходящих через некоторую точку аоеЛ; б) движения, оставляющего неподвижным точку а0; в) сдвига. Доказательство. Заменив / его композицией с подходя- щим сдвигом, как в доказательстве теоремы п. 5, мы можем счи- тать, что уже f имеет неподвижную точку а0. Отождествив А с L и flo с нулем, мы можем разложить f = Df в композицию положи- тельно определенного симметрического оператора и ортогональ- ного оператора. Приведя первый из них к главным осям и перенеся эти оси в А, получим требуемое. 9. Заметим в заключение, что в этом параграфе мы широко пользовались линейными подмногообразиями в А (прямыми, пло- скостями), определяя их конструктивно как прообразы линейных пространств в L при разных отождествлениях А с L, зависящих от выбора начала координат. Следующий параграф посвящен бо- лее систематическому исследованию связанных с этим понятий. § 3. Аффинные подпространства 1. Определение. Пусть (A, L) — некоторое аффинное простран- ство. Подмножество В cz А называется аффинным подпростран- ством в А, если оно пусто или если множество М = {bt — b2<= L\bt, b2eB}cL является линейным подпространством в L и tm (В) а В для всех т<=М. 2. Замечания, а) Если выполнены требования определения и В непусто, то пара (В, Л1) образует аффинное пространство, что оправдывает терминологию (подразумевается, что сдвиг В посред- ством вектора из М получается ограничением на В этого же сдвига на всем А). В самом деле, просмотр условий в определении п. 1 § 1 сразу же показывает, что они выполнены для (В, М). В частности, выбрав любую точку бе В, получаем В — = {b + m | m <= М). б) Будем называть линейное подпространство М={Ь{ — Ь2 |&1, 62еВ} направляющим для аффинного подпространства В. Размерностью В называется размерность М. Очевидно, из В-, а В2 следует, что Л41 с: М2 и, значит, dim Bj dim В2. Назовем два аф- финных подпространства одинаковой размерности с общим на- правляющим пространством параллельными. 3. Предложение. Аффинные подпространства одинаковой раз- мерности Bi, В2а А параллельны тогда и только тогда, когда су- ществует такой вектор 1<=L, что В2 = ti(Bi). Любые два вектора с таким свойством отличаются на вектор из направляющего про- странства для Bi и В2. Доказательство. Если B2=ti(Bt) и М2, М-, — направ- ляющие В2 и В] соответственно, то М2 = {а — b | а, Ь^ В2} — {(«' + /) — (Ь' + I) | a', b' е BJ = так что В] и В2 параллельны. 205
Наоборот, пусть М — общее направляющее для В\ и В2. Вы- берем точки 6]SBn Ь2^В2. Имеем Bi = {6, -ф l\I e Al}, B2 — = {b2 -f-Z | Z M}, откуда B2 = (Д). Наконец, легко видеть, что tit (ВО = ti, (В2) тогда и только тогда, когда lt — /2 е М. 4. Следствие. Аффинные подпространства в L (с аффинной структурой) — это линейные подмногообразия L в смысле опреде- ления п. 1 § 6 ч. 1, т. е. сдвиги линейных подпространств. 5. Следствие. Параллельные аффинные подпространства оди- наковой размерности либо не пересекаются, либо совпадают. Доказательство. Если b е В\ f]В2, то по предыдущему В] = {b -ф m| m е М} = В2, где М — общее направляющее Д и В2. 6. Аффинные подпространства В, и В2 не обязательно одина- ковой размерности называются параллельными, если одно из их направляющих содержится в другом. Слегка изменяя предыдущие доказательства, легко получить следующие факты. Пусть В{ и В2 параллельны и dim В] dim В2. Тогда существует такой вектор (eL, что ti(Bi)a В2, и два вектора с этим свойством отличаются на элемент из Mi. Кроме того, либо Д и В2 не пересекаются, либо Bi содержится в Д. 7. Предложение. Пусть (В\, М{), (В2, Л12)— два аффинных под- пространства в А. Тогда Вх f] Д либо пусто, либо является аффин- ным подпространством с направляющим М, f] М2. Доказательство. Пусть ДПД непусто и ЬеВ-ПД- Тогда В] = {b -ф Zi | Z 7И,}, Д = {b -ф l211 <= Л12}, откуда Вх f] Д = — Д + /| Z cz Лф Г| Лф}, что доказывает требуемое. (Следствие п. 5, очевидно, вытекает отсюда.) 8. Аффинные оболочки. Пусть S cz А — некоторое множество точек в аффинном пространстве А. Наименьшее аффинное под- пространство, содержащее S, называется аффинной оболочкой S. Оно существует и совпадает с пересечением всех аффинных под- пространств, содержащих S. Мы можем описать аффинную обо- лочку в терминах барицентрических линейных комбинаций (пред- ложение п. 11 § 1). 9. Предложение. Аффинная оболочка множества S совпадает с множеством барицентрических комбинаций элементов из S: где {s 1, ..., sn} cz S пробегает всевозможные конечные подмно- жества S. Доказательство. Покажем преже всего, что барицентриче- ские комбинации образуют аффинное подпространство в А. В са- мом деле, обозначим через М cz L линейное подпространство, натя- нутое на всевозможные векторы s — /; s, t(^S. Любые две бари- центрические комбинации точек S можно представить в виде п п £ x{St, £ ’ЬЩ с одним и тем же множеством {$], ..., взяв i=i t=i ’ объединение двух исходных множеств и положив лишние коэффи- 206
п п циенты равными нулю. Поскольку Е xt — ^yi~0, разность этих i = l t = l комбинаций можно представить в виде п Е — yt) (Si — S,) i=l и потому она лежит в М. Наоборот, любой элемент из М вида п п / п X п У, xt (st — ti) есть разность точек Е xzsz -ф — Е xt j Si и ,E XAl + / п X -ф^1 ~ Exi)si ИЗ S. Поэтому М = {b\ — b2\bi, b2&S}. Это же соображение показывает, что tm (S) cz S для всех m е Л1. Следо- вательно, S является аффинным подпространством с направляю- щим пространством М. Ясно, что ScS. Наоборот, пусть В zz> S — любое аффинное подпространство, п {S1.....s„} czS-Тогда длялюбых Xi.......имеем i-i « п Е XtSi = Sj -ф У Xi (Si — 8,). i = l n Поскольку Si, ..., sneB, вектор E*z(s/—$i) лежит в направ- ляющем пространстве В и потому сдвиг Si на него лежит в В. Значит, S<zB и S действительно является наименьшим аффинным подпространством, содержащим S. 10. Предложение. Пусть f: /4]->-Л2— аффинное отображение двух аффинных пространств', B}czAi и В2сзЛ2— аффинные под- пространства. Тогда f(Bi)aA2 и f~‘ (BzjczAi являются аффин- ными подпространствами. Доказательство. Пусть Bi == {b -ф l\I <= MJ, где Mi — на- правляющее пространство для Bt. Тогда f(Bi)=* {f(b)A-Df(l)\le <= MJ = {/(&)+ Т\Г & ImDf}. Следовательно, f(Bi)—аффинное подпространство с направляющим пространством Im Df. В частности, f(Ai) есть аффинное подпространство в А2, B2f] f)f(Ai) есть аффинное подпространство и f~l (В2) = f~' (В2П/И1))„ в силу общих теоретико-множественных определений. Заменив Аа на f(Ai) и В2 на BaflfHi), мы можем ограничиться случаем, когда f сюръективно. Пусть М2 — направляющее пространство для В2. Тогда В2 = {Ь -ф m\m е MJ и f~l(B2) = {b' -ф m'\f (b') = Ь, Df(m')^M2}, Справа можно ограничиться одним значением b'G ef~l(b): остальные получатся из него сдвигами на Ker Df. Отсюда следует, что f~l(B2) имеет вид {Ь' -ф m\m е Df~l(M2)} и потому является аффинным подпространством с направляющим подпро- странством (Df)~l(M2}. 207
11. Следствие. Множество уровня любой аффинно линейной функции является аффинным подпространством. Доказательство. В самом деле, множества уровня аффин- но линейной функции А->Х* суть прообразы точек в Но любая точка в аффинном пространстве является аффинным под- пространством (с направляющим {0}). 12. Предложение. Пусть f\, fn — аффинно линейные функ- ции на аффинном пространстве А. Тогда множество {czeA | fi (aj = = ... —fn(an) = 0} является аффинным подпространством в А. Если А конечномерно, то всякое его аффинное подпространство имеет такой вид. Доказательство. Указанное множество является конеч- ным пересечением множеств уровня аффинно линейных функций. Поэтому оно аффинное в силу следствия п. 11 и предложения и. 7. Наоборот, пусть В а А — аффинное подпространство в конечно- мерном аффинном пространстве A, Mcz. L — соответствующие ли- нейные пространства. Если В пусто, его можно задать уравнением f = 0, где f — постоянная функция на Л с ненулевым значением (очевидно, любая такая функция аффинно линейна, Z5/ = 0). Иначе, пусть gt — ... = gn = 0— система линейных уравнений на L, задающая М; в качестве gt, ..., gn можно взять, например, базис подпространства M^-czL*. Выберем точку беВи построим аффинно линейные функции fp А^-ffl1 с условиями ft(6) = 0, Dft= = gt, i—1, ..., n. Очевидно, fi(b -ф l)~gi(l). Поэтому точка b +1 s А обращает в нуль все функции 'f/ тогда и только тогда, когда I е М, т. е. тогда и только тогда, когда b +1 е В. Это за- вершает доказательство. 13. Назовем конфигурацией в аффинном пространстве А ко- нечную упорядоченную систему аффинных подпространств {Вь ... Вп}. Две конфигурации {Вр ..., Вп) и {В', ..., В^} назовем аффинно конгруэнтными, если существует такой аффинный авто- морфизм feAffA, что f(Bi) = B'i, i = 1, ..., п. Возможны ва- рианты этого понятия, когда f разрешается выбирать лишь из не- которой подгруппы AffA, например, группы движений, когда А евклидово. В последнем случае будем называть конфигурации метрически конгруэнтными. Важные понятия и результаты аффин- ной геометрии связаны с отысканием инвариантов конфигураций относительно отношения конгруэнтности. Заметим, что оно явля- ется аффинным вариантом понятия «одинаковой расположенности», которое мы изучали в § 5 ч. 1. Докажем несколько основных результатов о конгруэнтности. Пусть А — аффинное пространство размерности п. В соответ- ствии с результатами пп. 8—11 § 1 назовем конфигурацию {йо, ..., ап} из п + 1 .точки в А координатной, если ее аффинная оболочка совпадает с А. 14. Предложение, а) Любые две координатные конфигурации конгруэнтны и переводятся друг в друга единственным отображе- нием f е AffA. 80S
б) Координатные конфигурации {а0, •••>«„} и {а', ..., а'п) в евклидовом пространстве А метрически конгруэнтны тогда и только тогда, когда d (at, а^ — d (а'., а'^ для любых i, j el, ..., п. Доказательство, а) Положим et — at — а0, е\ = а'{ — ай. Системы {ef} и \е'^ образуют базисы в L. Пусть g: L^L — ли- нейное отображение, переводящее е{ в е'.. Построим аффинное отображение /: со свойством Df = g и f(ao)—a'o. Оно су- ществует по утверждению п. 11 § 1 и лежит в Aff Л, ибо g обра- тимо. Кроме того, f (fl.) = f («о) + § (ai ~ flo) = a'o + e't = a'o + («J ~ <) = для всех 1= 1, ..., n. Эта же формула показывает, что f един- ственная, ибо Df должно переводить в е\ и f (а0) = а'о. б) В силу доказанного выше достаточно проверить, что f яв- ляется движением тогда и только тогда, когда d (аг, = d (а\, для всех i, /. В самом деле, d(af, a/) = |ai — а, | — | et — в/|, где е0 = а0 — ао = О, и аналогично d (ait а'^ — | е'. — е' |. Если f — дви- жение, то Df ортогонально и сохраняет длины векторов, так что условие необходимо. Наоборот, пусть оно выполнено. Тогда |вг| — = | е'-1 для всех i — 1, ..., п и далее из равенств | eL — ej |2 = | е'. — — е'|2 получаем, что (ер е^ = {е'., е'^ для всех i, /.Значит, матрицы Грама базисов (ej и (е'^ совпадают. Но тогда отображение g, переводящее {ezj в [е'^, является изометрией, так что f является движением. Доказательство окончено. Рассмотрим теперь конфигурации (6, В), состоящие из точки и аффинного подпространства. В евклидовом случае назовем рас- стоянием от Ь до В число d(b, В) = inf {| 111 b + (е В}. 15. Предложение, а) Конфигурации (Ь, В) и (Ь', В') аффинно конгруэнтны тогда и только тогда, когда dim В => dim В' и либо одновременно b <£В, Ь' ф В', либо одновременно Ь & В, Ь' е В’. б) Конфигурации (Ь, В) и (Ь', В') метрически конгруэнтны тогда и только тогда, когда dimB== dim В' и d(b, B) — d(b', В'), Доказательство, а) Сформулированные условия, очевид- но, необходимы. Пусть они выполнены. Обозначим через М, М' направляющие В, В' соответственно и выберем линейный автомор-> физм g: L^L, для которого g’(Af)=Al/. Если Ь^В и b'еВ\ построим аффинное отображение /: А->А с условиями Df = g й f(b) — b'. Очевидно, f(b -f- /) = 6'+-£(/), так что f(B) = B'. Если b (£В и Ь' В', наложим на g дополнительные условия» Выберем по точке а е В, a's В' и потребуем, чтобы g переводил вектор b — а в вектор Ь' — а'. Оба вектора ненулевые и лежат вне М, М' соответственно, поэтому стандартная конструкция, ис- ходящая из базисов L вида {базис М, b — а, дополнение} и 209
{базис М', b' — а', дополнение}, показывает существование g. По- сле этого снова построим аффинное отображение /: Л->Л с Df=g и [(b) = Ь'. Проверим, что f(B) = B. В самом деле, прежде всего, Ца) = а', потому что f (a) = f (b — (b — a)) = f (b) — g (b — a) = b' — (b'— a')^a'. Далее, f(a -f-1) — f(«) + g(l), и условие /еЛ1 равносильно усло- вию g(l)^M', так что f(B) = B'. б) Необходимость условия снова очевидна. Для доказатель- ства достаточности подчиним выборы, сделанные в предыдущем рассуждении, дополнительным требованиям. Прежде всего, отож- дествим А с L, выбрав начало координат в В. Тогда В отождест- вится с М, b станет некоторым вектором в L. Пусть а — ортого- нальная проекция b на М. В линейном варианте мы уже знаем, что d(b, В) = |b — а|. Аналогично определим точку а' на М' или в нашем отождествлении на В'. В качестве g возьмем изометрию L, переводящую М в М' и b в Ь'. Она существует: дополним орто- нормированные базисы в М и М' соответственно до ортопормиро- ванных базисов в L, содержащих (b — a)/\b— а\ и (Ь'— а')/ /\Ь — а|, и определим g как изометрию, переводящую первый базис во второй. После этого аффинное отображение f: Л->Л с Df — g и f(b) = b' будет движением, переводящим (Ь, В) в (Ь', В'). 16. Рассмотрим, наконец, конфигурации, состоящие из двух под- пространств Bi, В2. Полная классификация их с точностью до аффинной конгруэнтности может быть проведена с помощью соот- ветствующего результата для линейных подпространств, доказан- ного в п. 5 § 5 ч. 1. Полная метрическая классификация довольно громоздка: она требует рассмотрения расстояния между В{ и В2 и серии углов. Мы ограничимся обсуждением единственного метри- ческого инварианта — расстояния, которое, как обычно, определим формулой d(Bt, В2) = inf {| bi — b^ || bi e= Bt, b2(==B2}. Назовем общим перпендикуляром к Bi, В2 такую пару точек bi^Bi, Ь2^В2, что вектор bt — b2 ортогонален к направляющим Bi и В2. (Точнее было бы называть общим перпендикуляром отре- зок {/61 + (1 — /)Ь210 1}.) 17. Предложение, а) Общий перпендикуляр к Bi и В2 всегда существует. Множество общих перпендикуляров биективно пере- сечению направляющих В{ и В2. б) Расстояние между Bi и В2 равно длине любого общего пер- пендикуляра |61 — 6г| к ним. Доказательство, а} Пусть Mi, М2 — направляющие Bi и В2 и пусть Ь\ е Вр b2 е В2. Спроектируем вектор Ь{ — Ь2 ортого- нально на Mi М2 и представим проекцию в виде mi + m2, mt е eAfj. Положим bii=b'l — m{, b2 — b’2-[- m2. Очевидно, b.e.Bt и &1 — b2 = b\ - b2 — (mx 4- m2) e= (M, + M2)J-. Значит, {bi, b2} есть общий перпендикуляр к Bb В2, 210
Пусть {fej, 62) и {&', b'2} — два общих перпендикуляра.Тогда bi — b\ а Мр Ь2 — 6.' е М, и, кроме того, &I — Ь., <— (Л1! M2)-*-, bj — b2 а (М। 4“ М2) J-. Значит, разность (61 — &') — (62 — 62), лежит одновременно в M( + + М2 и (Mi + Ma)1- Поэтому она равна нулю. Следовательно, bt — b{ = Ь2 — Ь2 е Мх П М2. Наоборот, если {Ьь &2} — фиксирован- ный общий перпендикуляр и «!еМ|ПЛ'12, то {b\-\-m, bz + m} тоже является общим перпендикуляром. Это завершает доказа- тельство первой части предложения. б) Пусть (61, 62}—общий перпендикуляр к Вх, В2 и е Вь Ь2 е В2 — любая другая пара точек. Достаточно доказать, что ® самом деле, fe'i - Ь'2 = (Ь{ - 62) + (Ь\ - &,) + (62 - &'). Но (Ь] — 6,) (6.2 — Ь2) е Л4] -f- М2, а вектор Ь\— Ь2 ортогонален Mi 4- М2. Значит, по теореме Пифагора что завершает доказательство. Установим в заключение один полезный результат, характери- зующий аффинные подпространства. 18. Предложение. Подмножество Sa А является аффинным подпространством тогда и только тогда, когда вместе с любыми двумя точками s, taS оно содержит всю прямую, проходящую через эти точки, т. е. их аффинную оболочку. Доказательство. Прямая, проходящая через точки s, taS,—это множество {xs -f-(1 — х)t|х еЖ}. Поэтому необходи- мость условия следует из предложения п. 9. Наоборот, пусть оно выполнено. Поскольку в силу того же предложения аффинная обо- лочка S состоит из всевозможных барицентрических комбинаций п точек S, мы должны проверить, что такие комбинации У, xtst ле- 1=1 жат в S. Проведем индукцию по п. При п = 1, 2 результат очеви- ден. Пусть п >• 2 и для меньших значений п результат доказан. п Представим X хг$г в виде и—2 п y^irSl + yt £ i=l i-n-i n—2 где /Д = X хь У2 = хп-1 + хл (мы можем считать, что обе эти /=1 п суммы не равны пулю, иначе X xtst aS по индуктивному i=i 211
предположению). Очевидно, ~ — У\ + У 2 — 1 • Уг п—2 п Значит, и ^2 лежат в S, и потому их барицен- 1=1 i=n-l трическая комбинация с коэффициентами у\, t/2 лежит в S. Это завершает доказательство. УПРАЖНЕНИЯ 1. Назовем t-й медианой системы точек а, ..., ак еИ отрезок, соединяю- щий точку Ch с центром масс остальных точек (а,-// =А= i}. Доказать, что все ме- дианы'пересекаются в одной точке —центре масс at, а,,. 2. Угол между двумя прямыми в евклидовом аффинном пространстве А— это угол между их направляющими. Доказать, что две конфигурации из двух прямых в А метрически конгруэнтны тогда и только тогда, когда углы и рас- стояния между прямыми в обеих конфигурациях совпадают. 3. Угол между прямой и аффинным подпространством размерности 1 — это угол между направляющей прямой и ее проекцией на направляющую под- пространства. Пользуясь этим определением, обобщить результат упражнения 2 на конфигурации, состоящие из прямой и подпространства. § 4. Выпуклые многогранники и линейное программирование 1. Постановка задачи. Основная задача линейного программи- рования ставится следующим образом. Дано конечномерное аф- финное пространство А над полем вещественных чисел R и т -|- 1 аффинно линейных функций ft, ..., fm\ f: A->R. Требуется отыскать точку (или точки) оеД удовлетворяющие условиям 0, ... .... /т(п)>0, для которых функция f принимает наибольшее воз- можное значение при этих ограничениях. Вариант, в котором некоторые из неравенств направлены в обратную сторону, О, и/или требуется отыскать точки, в ко- торых f принимает наименьшее возможное значение, сводится к предыдущему случаю заменой знака соответствующих функций. Условие fi(a) = O равносильно совокупности условий ft(a):>0 и —О- Все функции ft можно считать непостоянными. 2. Мотивировка. Рассмотрим следующую математическую мо- дель производства. Пусть имеется предприятие, использующее т видов различных ресурсов и производящее п видов различных продуктов. Ресурсы и продукты измеряются в своих единицах неотрицательными вещественными числами (случай, когда это це- лые числа, например, количество штук автомобилей, мы не рас- сматриваем; при больших объемах производства и потребления ресурсов он хорошо аппроксимируется «непрерывной» моделью). План производства — это вектор (хь ..., >:n)eR", указываю- щий количество X/ /-го продукта, которое необходимо произвести. Принимается следующая линейная модель потребления ресурсов: 212
если на производство единицы /-го продукта расходуется коли- чество ац единиц /-го ресурса, то для выполнения плана (хь ..., хп) п требуется У, a^Xj единиц /-го ресурса. Ресурсы, отпускаемые пред- приятию, определяются вектором (bit ..., bm)- дается Ь, единиц /-го ресурса. Следовательно, план (хь ..., хп) выполним, только если выполняется система ограничений fitXi....xn) = bi — ^al]xj^0, /=1, т. Мы будем всегда считать, что эти неравенства совместны. Предположим, что предприятие реализует выпущенную им про- дукцию по цене с, за единицу /-го продукта. Тогда прибыль от реализации произведенного продукта будет равна п f(Xi, ...» Х„)= £ С/Х/. г=1 План производства (xi, ..., хп) называется оптимальным по прибыли, если Дх) достигает наибольшего возможного значения при ограничениях /7^0, х,-0 (/= 1, ..., п) (последнее усло- вие означает, что предприятие не добывает производимых им про- дуктов на стороне — для продажи или для запчастей). Мы видим, что задача составления оптимального плана яв- ляется частным случаем задачи, сформулированной в п. 1. Разумеется, практические приложения линейного программиро- вания связаны с разработкой конкретных алгоритмов отыскания оптимального плана, которые можно применять вручную или на ЭВМ. Мы ограничимся в этом параграфе изложением геометри- ческих аспектов задачи, лежащих, конечно, в основе всех алго- ритмов. 3. Основные геометрические понятия. Фиксируем конечномер- ное аффинное пространство А над полем R. Буквы f с индексами будут обозначать аффинно линейные функции на А. Полупространством называется множество точек вида (яе е А | f (а) 0}, где /—непостоянная аффинно линейная функция. Многогранником называется пересечение конечного числа полупро- странств. Напомним, что подмножество S cz А выпуклое, если из Дь a2<=S и 0 х 1 следует, что xat +(1—x)a2^S. Поскольку й(хд/-|- + (1—x)a2) = xf((?i)-|-(l — x)f(a2), все полупространства выпук- лы. Так как пересечение любого семейства выпуклых множеств выпуклое, все многогранники выпуклые. Мы будем говорить, что любая точка ха-, +(1 —х)а2, 0 < х < 1, является внутренней точ- кой отрезка с концами Д] и а2. Пусть S — выпуклое множество. Выпуклое подмножество Т cz S называется гранью S, если любой отрезок с концами в S, некото- рая внутренняя точка которого лежит в Т, целиком лежит в Т. 213
Все множество S является своею гранью. Грань S, состоящая из одной точки, называется вершиной S. Читателю следует предста- вить себе куб, октаэдр и многогранный угол в трехмерном про- странстве, чтобы иметь наглядную картину основной ситуации, важной для линейного программирования. Грани этих фигур в смысле нашего определения — это грани, ребра и вершины школь- ной геометрии плюс сама фигура. Вершины шара — это все точки его поверхности. Важнейший результат этого параграфа будет состоять в том, что максимум аффинно линейной функции на ограниченном много- граннике (в приложениях этот случай наиболее распространен) достигается на одной из его вершин; последних конечное число. Но прежде нам придется разобраться в структуре многогранников и их граней подробнее. 4. Лемма. Пересечение семейства граней и грань грани выпук- лого множества S является гранью S. Доказательство, а) Пусть Т— Ть Ti— грани S. Любой отрезок с концами в S, внутренняя точка которого принадлежит Ti, целиком лежит в Г/. Значит, если его внутренняя точка лежит в Т, то он лежит в Т. б) Пусть TiczT czS, Т — грань S. Любой отрезок с концами в S, внутреняя точка которого лежит в Л, целиком лежит в Т, ибо Т — грань S, значит, его концы лежат в 7* и потому он цели- ком лежит в Т\, ибо Т\ — грань Т. 5. Лемма. Пусть S — многогранник,, 'заданный неравенствами fi 0, i=l, ..., tn. Тогда для любого I многогранник S{ — = SQ {« | fi (а) — 0} либо пуст, либо является гранью S. Доказательство. Пусть S,- непуст, и внутренняя точка отрезка x«i-|-(l — х)а2 лежит в S,. Функция f,(xai + + (1 —х)а<>), 0 х 1, линейна по х, обращается в нуль для не- которого 0 < Ко < 1 и, кроме того, неотрицательна при х — 0 и х=1. Поэтому она тождественно равна нулю, так что весь отре- зок лежит в Si. 6. Лемма. Непостоянная аффинно линейная функция f на мно- гограннике S— {a|f, (а) 0} не может принимать максимальное значение в точке а е S, для которой все f, (a) > 0. Доказательство. Так как f непостоянна, Df Ф 0. Выбе- рем в векторном пространстве L, ассоциированном с А, веГктор /<= L, для которого Df(/)=#O Можно считать, что Df(l)> 0, изме- нив знак I в случае нужды. Если число е > 0 достаточно мало и czeS, то fi(a -j- 0 для всех 1 = 1, ..., т: достаточно взять е < min । । • Поэтому а 4- S для таких е. Но f (а 4- е/) = — + f(«), так что f(a) не является максимальным значением f. Теперь мы можем доказать наш основной результат. 7. Теорема. Предположим, что аффинно линейная функция f ограничена сверху на многограннике S. Тогда она принимает свое максимальное значение во всех точках некоторой грани S, являю- 214
щейся также многогранником. Если S ограничен, f принимает свое максимальное значение в некоторой вершине S. Доказательство. Проведем индукцию по размерности А, Случай dim Л = 0 очевиден. Пусть dim Л — и и для меньших раз- мерностей теорема доказана. Пусть S задан системой неравенств fi 0, ..., fm^O- Так как множество S замкнуто, ограниченная сверху функция f на нем принимает максимальное значение в не- которой точке а. Если ft (а) > 0, ..., fm(a)>0, то по лемме п. 6 f может быть только константой; в частности свое единственное значение она принимает на всем S. Иначе fi(a)= 0 для некото- рого I. Это значит, что f принимает максимальное значение в точке непустого многогранника St, который является гранью S и лежит в аффинном подпространстве {а|Д(а)=0} размерности п—1, ибо fi непостоянна. По индуктивному предположению максималь- ное значение ограничения f на S, принимается во всех точках не- которой многогранной грани S,. По лемме п. 4 она же будет гранью S. Она будет многогранником, ибо к неравенствам, опре- деляющим ее в Si, с левыми частями, продолженными на все Л, следует добавить равенство ft = 0. Теперь индукцией по размерности аффинной оболочки S по- кажем, что у любого ограниченного многогранника обязательно есть вершина. В самом деле, для размерности нуль это очевидно. Пусть размерность больше нуля. Мы можем считать, что аффин- ная оболочка S есть все Л. Возьмем любую непостоянную аффин- но линейную функцию на Л. Она должна принимать на S макси- мальное значение, ибо S ограничен и замкнут. Стало быть, у S есть непустая грань, во всех точках которой это значение прини- мается. Она является ограниченным многогранником, аффинная оболочка которого имеет строго меньшую размерность. По индук- тивному предположению у нее есть вершина, являющаяся также вершиной S по лемме п. 6. Окончательно, пусть S ограничен и Т — многогранная грань S, на которой исходная функция f принимает свое максимальное зна- чение. Тогда любая вершина Т, существование которой доказано, является искомой вершиной S. § 5. Аффинные квадратичные функции и квадрики 1. Определение. Квадратичной функцией Q на аффинном про- странстве (A,L) над полем Ж называется отображение Q: для которого существуют такие точка а0<Е1А, квадратичная форма q: L-^УА, линейная форма /: L^-УА и константа с<=Ж, что Q(a) = q(a — а0) +1 (а — а0) + с для всех а е Л. Форма q называется квадратичной частью Q, а I—"линейной частью Q относительно точки а0. Очевидно, с —Q(a0). Покажем прежде всего, что от выбора точки п0 квадратичность Q не зави- сит. Точнее, пусть g— симметричная билинейная форма на L, 215
являющаяся поляризацией q. Мы, как обычно, считаем, что харак- теристика Ж отлична от двух. 2. Предложение. Если Q(a)~ q(a— a0)-\-l(a — йо) + с, то для любой точки а0 е А имеем Q («) = <7 (« — а'о) + 1'(а — а'о) + с', где I' (tn) = l(m) + 2g(m, а' — а0), с' = Q (а'). Таким образом, переход к другой точке меняет линейную часть Q и константу. Доказательство. В самом деле, 9 (а ~ «о) = 9 ((« - «о) + («о ~ ао)) = = q (а - а') + 2g (а - а0, а'о - а0) + q (а' - а0), / (а - а0) = I ((а - а') + (а'о - a0)) = l(a- а'о) +1 (а' - а0), что доказывает требуемое. 3. Назовем точку ар центральной для квадратичной функции Q, если линейная часть Q относительно а0 равна нулю. Объясне- ние этого термина состоит в замечании, что точка ар центральна тогда и только тогда, когда Q(a) = Q(ap— (a — a0)) для всех а: действительно, разность левой и правой части в общем случае равна 21(а— а0), ибо q(a— a0)=iQ(— (а — ар)). Геометрически это значит, что после отождествления А с L, при котором а0 пере- ходит в начало координат, функция Q становится симметричной относительно отражения mi—>—m. Назовем центром функции Q множество ее центральных точек. 4. Теорема, а) Если квадратичная часть q функции Q невы- рождена, то центр Q состоит из единственной точки. б) Если q вырождена, то центр Q либо пуст, либо является аффинным подпространством в А размерности dim А — rk q (rk q — это ранг q), направляющее подпространство которого совпадает с ядром q. Доказательство. Начнем с любой точки йрбЛ и пред- ставим Q в виде q(a— a0)4-Z(a— a0)4-c. Согласно предложению п. 2 точка а'о е А будет центральной для Q тогда и только тогда, когда выполнены условия I (пг) «= — 2g (tn, а'о — а0) для всех msL. Когда а'о пробегает все точки А, вектор а'о — а0 пробегает все элементы L, и линейная функция от га е L вида — 2g (tn, а'о — a0) пробегает все элементы L*, лежащие в образе канонического отображения §•, L-+L*, связанного с формой g. Если q невырождена, то g — изоморфизм. В частности, для функционала —Z/2eL* имеется единственный вектора' — ade L со 816
свойством g ( •, а'о — a0) — — — I (•). Точка в этом случае и является единственной центральной точкой Q. Если q вырождена, то возможны два случая. Либо —//2 не ле- жит в образе g‘, тогда центральных точек нет. Либо —Z/2 лежит в образе g. Тогда для любых двух точек а'о, а" с условием g(-. = = имеем а0 — а" Е Ker §, и наоборот, если g( • ,а'о — а0) = — у / (•) и а" е а' + Ker g, то g(«, a"-a0)==-±l(-). Таким образом, центр является аффинным подпространством, а Kerg, т. е. ядро q, — его направляющим. Это завершает доказа- тельство. Теперь мы можем доказать теорему о приведении квадратич- ной функции Q к каноническому виду в подходящей аффинной системе координат {а0, в|, ..., еп}, {е,}— базис L, а0^А. Напом- ним, что точка а^А в ней представлена вектором (хь ..., хп), п если а — а0А- У Klei- tz 5. Теорема. Пусть Q — квадратичная функция на аффинном пространстве А. Тогда существует такая аффинная система коор- динат в А, в которой Q принимает один из следующих видов. п а) Если q невырождена, то Q (хр ..., х„)= У, М + с: Лг, с<=Ж. б) Если q вырождена ранга t, но центр Q непуст, то Г <э(хр •••« xn) = iE1M+c; в) Если q вырождена ранга г и центр Q пуст, то Г Q (хр • • •, х„) = hfX] + Xr+V Доказательство. Если q невырождена, выберем в качест- ве ао центральную точку Q. Тогда Q(a) = q(a — а0)+с. В каче- стве ei, ..., еп выберем базис в L, в котором q приводится к сумме квадратов с коэффициентами. Тот же прием приводит к цели всегда, если центр непуст. Если центр Q пуст, начнем с произвольной точки а0 и базиса Г {вь ..., еп}, в котором квадратичная часть Q имеет вид У i-1 817
п Пусть линейная часть имеет вид I = X Мы утверждаем, что (=1 и/ =/= 0 для некоторого j > г. Действительно, иначе I = У, ргхь и «=1 тогда Q можно представить в виде г г г 2 У, “1“ У ^iУ * * * * Xi “1“ С ~ У \ Г Х1 “Ь ~2}Г) с • 1=1 1=1 i-1 4 1z Х-' Следовательно, точка а0— / будет центральной для Q, что «=1 ‘ противоречит предположению о пустоте центра. Но если ц/ > 0 для некоторого j > г, то система функционалов {е1, ег, 1} в L* линейно независима. Мы можем дополнить ее до базиса в L* и в двойственном базисе L получить для Q вы- Г ражение вида У \Х~1 + Хг+1 “Ь С’ где Хг+1 как функция на L есть просто I. Теперь ясно, что имеется точка, в которой Q обращается в нуль, например, xi = ... = хг = 0, xr+i =—с, хг+2 = ... = хп = = 0 в этой системе координат. Начав построение с этой точки, мы Г получим представление Q в виде У \х? + хг+1. 6. Дополнения, а) Вопрос о единственности канонического вида сводится к уже решенной задаче о квадратичных формах. Если q невырождена и в некоторой системе координат имеет вид п У Х;х^ -(- с, то точка (0.0) является центром и потому опре- /=1 делена однозначно, константа с определена однозначно как значе- ние Q в центре, а произвол в выборе осей и коэффициентов тот же, что для квадратичных форм. В частности, над R можно счи- тать, что Л, = ±1, и полным инвариантом является сигнатура. Над С можно считать, что все Л, = 1. В вырожденном случае с непустым центром начало координат можно выбирать в центре как угодно, но константа с все равно определяется однозначно, ибо значение Q во всех точках центра постоянно: если а, ао лежат в центре, то /(а—ао) = 0 и q(a—а0) = = 0, ибо а — ао лежит в ядре q. К квадратичной части применимы прежние замечания. Наконец, в вырожденном случае с пустым центром начало ко- ординат можно брать в любой точке, где Q обращается в нуль; к квадратичной части применимы прежние замечания. б) Если А — аффинное евклидово пространство, то Q приво- дится к каноническому виду в ортонормированном базисе. Числа Zi, ..., определены однозначно. Произвол в выборе центра тот же, что и в аффинном случае, произвол в выборе осей тот же, что для квадратичных форм в линейном евклидовом пространстве. 818
6. Аффинные квадрики. Аффинной квадрикой называется мно- жество {й е= A |Q(a) = 0}, где Q—некоторая квадратичная функ- ция на А. Взгляд на канонические формы Q показывает, что к проблеме исследования типов квадрик применимы все результаты § 10 ч. 2. Рассмотрим вопрос о единственности функции Q, задающей данную аффинную квадрику над полем R. Прежде всего, квадрика может быть аффинным подпространством в А (возможно, пустым): Г уравнение У х\ — 0 равносильно системе уравнений хх = ... i=i ... — х, — 0. При г > 1 имеется много непропорциональных друг другу квадратичных функций, задающих ту же квадрику, напри- Г мер У 14х? = 0 с любыми X, > 0. Покажем, что для остальных 1=1 квадрик ответ проще: 7. Предложение. Пусть аффинная квадрика X, не являющаяся аффинным подпространством, задается уравнениями Qi = 0 и (?2 = 0, где Qi, Q2— квадратичные функции. Тогда Qi — XQ2 для подходящего скаляра >. е R. Доказательство. Прежде всего, X не сводится к одной точке. В силу предложения п. 18 § 3 имеются две точки щ, а2 X, аффинная оболочка которых (прямая) не лежит в X целиком. Пусть аъ а2^Х и прямая, проходящая через точки аь а2, не лежит в X целиком. Введем в А систему координат {ay, ei, ..., еп}, где еп = а2 — а\. Запишем функцию Qi в этой системе координат Q1 • ••> Х„) = Хх2 + /1 (х,..*п-1) (Х1» •••> Хп-1)> где /j, I" — аффинно линейные функции, т. е. многочлены степени ^1 от X], ..., Хл-ь Так как прямая, проходящая через точки oi = (0....0) и а2 — (0, .... 0, 1), не содержится в X целиком, то Х=/=0 и 1\ (0)' — 4X1" (0) > 0. Разделив Q! на А, можно считать, что Х = 1. Аналогично, можно считать, что как квадратный трехчлен от хл: Q2(Xp ...» х„) — х~ + 12 (Хр xn_j) хп 4- /2 (Хр xn_j) и /2(0)2'—41" (0) > 0. Мы знаем теперь, что С?! и Q2 имеют одина- ковое множество вещественных корней, и хотим доказать, что Qi — Qi- Фиксируем вектор (сь .... Cn-i)sRn~* и рассмотрим векторы (ici...tcn-T), R. При малых по модулю значениях t дискри- минанты по х„ трехчленов Q\(tC\, ..., tcn-\, х„) и Q2(tc\, ..., tcn-\, Хп) остаются положительными, и вещественные корни их, отвечаю- щие точкам пересечения одной и той же прямой с X, совпадают. Значит, 1\ = 1'2 и в таких точках (tc\...tcn-\). Поэтому l'i^l'2 и I"Т2, ибо аффинно линейные функции, совпадающие 219
на открытом множестве, совпадают. Действительно, их разность обращается в нуль в окрестности начала координат и потому мно- жество ее корней не может быть собственным линейным подпро- странством. Это завершает доказательство. § 6. Проективные пространства 1. Аффинные пространства получаются из линейных «забве- нием начала координат». Проективные пространства можно строить из линейных по меньшей мере двумя способами. а) Добавить к аффинному пространству «бесконечно удален- ные точки». б) Реализовать проективное пространство как множество пря- мых в линейном пространстве. Мы выберем в качестве основного определения б): оно яснее показывает однородность проективного пространства. 2. Определение. Пусть L — линейное пространство над полем Ж. Множество P{L) прямых (т. е. одномерных линейных подпро- странств) в L называется проективным пространством, ассоцииро- ванным с L, а сами прямые в L называются точками P(L). Число dimL— 1 называется размерностью P(L) и обозначается dimP(L). Одномерные и двумерные проективные пространства на- зываются соответственно проективной прямой или проективной плоскостью. Проективное пространство размерности п над полем Ж обозначается также ЖРп или Рп(Ж). или просто Рп. Смысл со- глашения dimP(L)= dimL— 1 станет сейчас ясен. 3. Однородные координаты. Выберем базис {е0, .... еп} в про- странстве L. Каждая точка р е P(L) однозначно определяется лю- бым ненулевым Вектором на соответствующей прямой в L. Коор- динаты хо, , хп этого вектора называются однородными коорди- натами точки р. Они определены с точностью до умножения на ненулевой скаляр: точка (Zx0, ..., Ах„) лежит на той же прямой р и все точки прямой получаются таким образом. Поэтому вектор однородных координат точки р по традиции обозначается (х0: xt: ... :х„). Таким образом, координатное п-мерное проективное простран- ство Р(Жп+1) есть множество орбит мультипликативной группы Ж* = Ж\{0}, действующей на множестве ненулевых векторов Жп+1\{0} по правилу Z (х0, • •, хп) = (Хх0, • • -, kxn); (х0: xt:... :хп) есть символ соответствующей орбиты. Пользуясь однородными координатами, можно хорошо предста- вить себе структуру Рп как множества несколькими разными спо- собами. а) Аффинное покрытие Рп. Положим Ui = {{xq. ... :х„) | #= 0), Z = 0, ..., п. п Очевидно, Р"= U Ut. В классе векторов проективных координат «=о любой точки p^Ui имеется единственный вектор с Z-й координа- 220
той, равной 1: (х0: ... :хд ... :х„) —(хо/хд ••• :1: ••• :хп/х<). Опу- ская эту единицу, получаем, что U, биективно множеству Жп, ко- торое мы можем интерпретировать как n-мерное линейное или аффинное координатное пространство. Заметим, однако, что пока у нас нет никаких оснований считать, что на Uh имеется какая-то естественная не зависящая от выбора координат линейная или аффинная структура. Позже мы покажем, что инвариантно можно ввести на Hi лишь целый класс аффинных структур, связанных, впрочем, каноническими изоморфизмами, так что геометрия аф- финных конфигураций в любой из них будет одна и та же. Назовем множество (Л s Жп l-й аффинной картой Рп (в данной системе координат). Точки^/', ..., y(^e.Ui и (г//’, ..., t/ф^^и t при i =/= j отвечают одной и той же точке Рп, лежащей на пересе- чении Utf\Ui, тогда и только тогда, когда, вставив 1 на i-e место в векторе (у\‘\ ..., z/(n£)) и йа /-е место в (у*/*, ..., г/(пп), мы полу- чим пропорциональные векторы. В частности, Р1 == C7oU U\, Uo ~ И^^Ж-, точка у е (70 отвечает точке \/у е Ui при у #= 0; точка у — 0 из Uo не лежит в [7], а точка 1Д/= 0 из U\ не лежит в Uo- Естественно считать, что Р1 полу- чается из Uo — Ж добавлением одной точки с координатой у = оо. Обобщая эту конструкцию, получаем б) Клеточное разбиение Рп. Положим Е/ = {(х0: ... :хп)|Х/ = 0 при j<l, х{ #= 0). п Очевидно, Е0 = (70 и P"=|J Vlt но на этот раз все Vi попарно z=o не пересекаются. В классе проективных координат любой точки ре V'i имеется единственный представитель с единицей на i-м ме- сте; опуская эту единицу и предшествующие нули, мы получаем биекцию Vi с Жп~1. Окончательно Рп^Жп\}Жп-'\}Жп~г\} ... (J Ж* Жп 1) Р"“*. Иными словами, Рп получается добавлением к Uo = Жп бесконечно удаленного (п—1)-мерного проективного пространства, состоя- щего из точек (0:Хь ... :х„); в свою очередь, оно получается из аффинного подпространства V! добавлением бесконечно удален- ного (относительно Vi) проективного пространства Рп~2 и т. д. в) Проективные пространства и сферы. В случае Ж = R или С есть удобный способ нормировки однородных координат в Р", не требующий выбора ненулевой координаты и деления на нее. Именно, любую точку Р" можно представить координатами (хо: ... п ...: х„) с условием £| xt |2 = 1, т. е. точкой на п-мерной (при Ж=И) или (2м—J—1 )-мерной (при Ж~С) евклидовой сфере. Степень оставшейся неоднозначности такова: точка (Хх0: ... :Лхп) по-преж- нему лежит на единичной сфере тогда и только тогда, когда |Л| = 1, т. е. К — ±1 при Ж = R, X = е,ч>, 0 <р < 2л при Ж = С. 221
Иными словами, л-мерное вещественное проективное простран- ство RP" получается из n-мерной сферы S" отождествлением пар ее диаметрально противоположных точек. В частности, RP1 устроена как окружность, a RP2— как лист Мёбиуса, к которому по его границе приклеен круг (рис. 1, 2). Сложнее «увидеть» СР": в одну точку СР" склеивается целый большой круг сферы S2"+1, состоящий из точек (хое1ч>, ..., л„е,ч>) с переменным ф. Из описания СР1 в случае б) в качестве С U {оо} ясно, что СР1 можно представлять себе как двумерную сферу Ри- мана, в которой оо представлена северным полюсом, как при сте- Рис. 1 реографической проекции (рис. 3). Поэтому наше новое представ- ление СР1 в виде факторпространства S3 дает замечательное ото- бражение S3->-S2, слои которого являются окружностями S1. Оно называется отображением Хопфа. В описании этого пункта мы совсем забыли о линейной струк- туре, исходной для RP" и СР", зато нам стали ясно видны тополо- гические свойства этих пространств, в первую очередь их компакт- ность. (Строго говоря, в определении Рп никакая топология не фигурировала; удобнее всего вводить ее именно с помощью отображений сфер, условившись, что открытые множества в RP" и СР" это те, прообразы которых в S" и S2"+1 открыты.) Впредь мы не будем пользоваться топологией и вернемся к изу- чению линейной геометрии проективных пространств. Не будет, однако, преувеличением сказать, что важность RP" и СР" в значительной мере объясняется тем, что это естественные ком- пактификации R" и С", позволяющие распространить основные черты линейной структуры на бесконечность. Даже над абстракт- ным полем УС, не несущим никакой топологии, эта «компактность» 222
проективных пространств появляется в массе алгебраических ва- риантов. Типичный пример: на аффинной плоскости две разные прямые, вообще говоря, пересекаются в одной точке, по могут быть и параллельны. Это означает, что точка их пересечения «ушла в бесконечность», и при переходе в проективную плоскость она благополучно обнаруживается: любые две проективные прямыё на плоскости пересекаются. Вернемся теперь к систематическому изучению геометрии Рп 4. Проективные подпространства. Пусть М с: L — любое линей- ное подпространство в L. Тогда Р(М)сг P(L), ибо каждая прямая лежащая в М, является в то же время прямой, лежащей в L. Множества вида Р(М) называются проективными подпростран- ствами в P(L). Очевидно, Р(М.{ R М2) = P(Mi)R Р(М2), и то же верно для пересечения любого семейства. Следовательно, семей- ство проективных подпространств замкнуто относительно пересе- чений. Поэтому в множестве проективных подпространств P(L)t содержащих данное множество SczP(L), имеется наименьшее —- пересечение всех таких подпространств. Оно называется проектив^ ной оболочкой S, обозначается S и совпадает с Р(М), где М —г линейная оболочка всех прямых, отвечающих точкам sgS, в L При переходе от пар LaM к парам P(L)c Р(М) размерности уменьшаются на единицу, так что коразмерность dimL— dim М совпадает с коразмерностью dimP(L)— dimР(М). Далее, как мы уже отмечали, Р(М{ R М2) = Р(ЛЛ)П Р(М2), а Р(М1-[-Л12) совпа- дает с проективной оболочкой P(A1i)U Р(М2). Пользуясь этими замечаниями, мы можем написать проектив- ный вариант теоремы п. 3 § 5 ч. 1. Заметим лишь, что в соответ- ствии с определением в п. 2 размерность пустого проективного пространства следует считать равной —1: этот случай вполне реален, ибо непустые подпространства могут иметь пустое пере- сечение. 5. Теорема. Пусть Р\, Р2— два конечномерных проективных подпространства в проективном пространстве Р. Тогда dim Pi П Р2 + dim Pi Ц Р2 «= dim Р{ ф- dim Р2. 6. Примеры, a) Pt, Р2 — две разные точки. Тогда dimPiRP2 = •= —1, dim Pj = dim P2 = 0, откуда dim P} U P2 = 1, т. e. проектив- ной оболочкой двух точек является прямая. Согласно определению проективной оболочки, она является единственной проективной прямой, проходящей через две точки. б) Допустим, что dim Pi ф- dim Р2 dim Р. Тогда, поскольку dim Pi U Р2 dim Р, имеем dim Pi R Р2 0. Иными словами, два проективных подпространства, сумма размерностей которых больше или равна размерности объемлющего пространства, имеют непу- стое пересечение. В частности, в проективной плоскости нет «па- раллельных» прямых: любые две прямые пересекаются либо в одной точке, либо в двух и тогда (в силу примера а)) совпадают. Аналогично, две проективных плоскости в трехмерном проективном 223
пространстве обязательно пересекаются по прямой или совпадают. Проективная плоскость и прямая в трехмерном пространстве пе- ресекаются по точке или прямая лежит в плоскости. в) Условие Pi П Рг = 0 в случае Pt = P(Mi) означает, что Mi f]M2= {0}, т. е. что сумма Mi + М2 прямая. 7. Задание проективных подпространств уравнениями. Линей- ная функция f: £->J5f на линейном пространстве L не определяет Никакую функцию на P(L) (кроме случая f== 0), ибо всегда есть прямая в L, на которой эта функция непостоянна, и нет возмож- ности фиксировать ее значение в соответствующей точке P(L). Но уравнение f = 0 определяет линейное подпространство в L и по- тому проективное подпространство в P(L). Если L конечномерно, то любое подпространство в L и потому любое подпространство в Р(Е) можно задать системой уравнений fi = ... = fm= 0. В однородных координатах Рп этот эффект проявляется так: си- стема линейных однородных уравнений п 4=1,..., tn, задает проективное подпространство в Рп, состоящее из точек, од- нородные координаты которых (х0: хп) удовлетворяют этой системе. Умножение всех координат на А. не нарушает обращения в нуль левых частей. 8. Аффинные подпространства и гиперплоскости. Пусть М cz £ — линейное подпространство коразмерности единица. Тогда P(M)cz сй(£) имеет коразмерность единица, и мы будем называть такие подпространства гиперплоскостями. Мы покажем сейчас, как ввести на дополнении Ам к гиперпло- скости Р(М) структуру аффинного пространства (Ам, М, +). Вы- берем в L линейное многообразие М' — in' -J- М, не проходящее через начало координат. Оно имеет естественную аффинную струк- туру: сдвиг на m е М в М' индуцирован сдвигом на m в £, т. е. состоит в прибавлении т. С другой стороны, Ам и М' находятся в биективном соответ- ствии: точка Ам есть прямая, не лежащая в М, и она пересекается с М' в единственной точке, которую и поставим в соответствие ис- ходной точке Ам. Так получаются все точки по одному разу. С по- мощью этого биективного соответствия аффинную структуру на М' можно перенести на Ам. Однако выбор М' не однозначен, и это приводит к неоднозначности аффинной структуры Адг. Чтобы срав- нить две такие структуры, покажем, что тождественное теоретико- множественное отображение Ам в себя является аффинным изо- морфизмом этих двух структур. 9. Предложение. Пусть (Ам, М, +') и (Лл), М, +") — две аф- финные структуры на Ам, построенные с помощью описанной конструкции. Тогда тождественное отображение Ам в себя явля- 224
ется аффинным изоморфизмом, линейная часть которого есть не- которая гомотетия М. Доказательство. Пусть две структуры отвечают подмно- гообразиям пг’ ф-Л! и Классы m' ф- М и т" М в одно- мерном факторпространстве L/-M пропорциональны. Поэтому мож- но считать, что т" — ат', a = Jt. Умножение на а в L переводит т' ф-М в т"М и индуцирует тождественное отображение P(L) в себя и потому Ам в себя. С другой стороны, сдвиг на вектор т е М в т' ф- М при гомотетии переходит в сдвиг на вектор ат е М в т" ф- М. Это и доказывает требуемое. 10. Следствие. Множество аффинных подпространств в Ам с их отношениями инцидентности, а также множества аффинных ото- бражений Ам в другие аффинные пространства не зависят от произвола в выборе аффинной структуры Ам- Это оправдывает возможность рассматривать дополнение к лю- бой гиперплоскости в проективном пространстве просто йак аф- финное пространство без дальнейших уточнений. Посмотрим теперь, как выглядит проективное пространство Р(М) «с точки зрения» аффинного пространства Ам. 11. Предложение. Точки Р(М) находятся в биективном соот- ветствии с классами параллельных прямых в Ам. Иными словами, каждая точка Р(М) есть «направление ухода на бесконечность» в Ам. Доказательство. Отождествим Ам с m'М. Класс па- раллельных прямых в т'М определяется своей направляющей в М, т. е. точкой в Р(М), и это соответствие биективно. 12. На самом деле можно сказать больше: каждая прямая I в Ам однозначно определяет содержащую ее прямую в P(L) — а именно, ее проективную оболочку I. Проективная оболочка по- лучается добавлением к I единственной точки, которая как раз ле- жит в Р(М) и является «бесконечно удаленной точкой» этой пря- мой. Весь класс параллельных прямых в Ам имеет общую беско- нечно удаленную точку в Р(М). При отождествлении Ам с т' ф- М оболочка 1 отвечает всем прямым плоскости в L, проходящей че- рез I и направляющую I, а бесконечно удаленная точка I — это сама направляющая. Более общо, пусть А с: Ам — любое аффинное подпространство. Тогда его проективная оболочка А в P(L) обладает следующими свойствами: a) А\АссР(М): добавляются лишь точки на бесконечности. б) dim Л = dimA. в) Д\А есть проективное подпространство в Р(М) размерно- сти dimA — 1. (Поэтому А называют также проективным замыка- нием А.) Отождествление Ам с m'-j-M сводит проверку этих свойств к прямому применению определений. Действительно, А состоит из прямых, лежащих в линейной оболочке A cz т' ф- М. Эта линейная оболочка натянута на направляющую Lo подпространства А и лю- бой вектор из А. Поэтому ее размерность равна dimL0+l = 225
*з= dim A 4-1, значит, dim A = dim А. Все прямые в этой линейной оболочке пересекаются с т' 4- М, т. е. отвечают точкам А, за ис- ключением прямых, лежащих в направляющей Lo- Последние ле- жат в Р(М) и образуют проективное пространство размерности dim Lo— 1 = dim А — 1. § 7. Проективная двойственность и проективные квадрики 1. Пусть L — линейное пространство над полем Ж, L* — двой- ственное к нему пространство линейных функционалов на L. Проективное пространство P(L*) называется двойственным к про- ективному пространству P(L). Каждая точка P(L*) есть прямая {Xf} в пространстве линейных функционалов на L. Гиперплоскость f = 0 в P(L) не зависит от выбора функционала f на этой прямой и однозначно определяет всю прямую. Поэтому можно сказать, что точками двойственного проективного пространства являются гиперплоскости исходного проективного пространства. Если в L и L* выбраны двойственные базисы и соответствую- щие системы однородных координат в P(L) и P(L*), это соответ- ствие приобретает простой вид: гиперплоскости с уравнением п У, atxt = 0 в P(L) отвечает точка с однородными координатами (оо: .ап) в P(L*). Канонический изоморфизм L-> L** показывает симметрию отношения двойственности между двумя проективными пространст- вами. Более общо, переводя результаты § 7 ч. 1 на проективный язык, мы получим следующее соответствие двойственности между системами проективных подпространств в P(L) и P(L*) (мы счи- таем дальше, что L конечномерно). а) Подпространству Р (Л4) cP (L) отвечает двойственное к нему подпространство P(MJ~) с: P(L*). При этом dim Р(М) 4- dim Р (ЛН) — dim Р (L) — 1. б) Пересечению проективных подпространств отвечает проек- тивная оболочка двойственных к ним, а проективной оболочке — пересечение. В частности, отношение инцидентности двух подпро- странств (т. е. включение одного в другое) переходит в отношение инцидентности. Это позволяет сформулировать следующий принцип проектив- ной двойственности, являющийся, собственно говоря, метаматема- тическим, поскольку он представляет собой утверждение о языке проективной геометрии. 2. Принцип проективной двойственности. Предположим, что мы доказали теорему о конфигурациях проективных подпространств в проективных пространствах, в формулировке которой фигурируют лишь свойства размерности, инцидентности, пересечения и взятия проективной оболочки. Тогда двойственное утверждение, в котором 226
все термины заменены на двойственные к ним по правилам пре- дыдущего пункта, также является теоремой проективной гео- метрии. Простой пример: к теореме «две разные плоскости в трехмер- ном проективном пространстве пересекаются по одной прямой» двойственна теорема «через две разные точки в трехмерном проек- тивном пространстве проходит одна прямая». (В § 9 мы позна- комимся с гораздо более содержательными теоремами о проектив- ных конфигурациях.) 3. Проективная двойственность и квадрики. Если линейное про- странство L снабжено изоморфизмом L-+L*, то P(L*) можно отождествить с P(L), и отображение двойственности между проек- тивными подпространствами Р(Ь) и P(L*) превратится в отобра- жение двойственности между подпространствами в P(L). Задание изоморфизма равносильно заданию невырож- денного скалярного произведения g: Ly(.L-^X. Рассмотрим подробнее геометрию проективной двойственности, отвечающую случаю, когда скалярное произведение g симметрично. Как обычно, будем считать, что характеристика поля X отлична от двух. Тогда g однозначно восстанавливается по квадратичной форме q(l) = = g(l, I). Уравнение ^(/)==0 определяет квадрику Qo в L. Ее образ в P(L) мы также будем называть квадрикой, а в применении к тео- рии двойственности — полярной квадрикой. Заметим, что Qo есть конус с центром в начале координат: если I е Qo, то вся прямая XI лежит в Qo- Отождествляя P(L) с бесконечно удаленными точ- ками L, мы можем отождествить Q с базой конуса Qo. Согласно общей теории g и q определяют отображение двойст- венности множества проективных подпространств P(L) в себя; гиперплоскость в Р(Ь), двойственная точке p^P(L), называется полярной к р (относительно q или Q). Чтобы разобраться в гео- метрическом устройстве этого отображения, выведем сначала урав- нение полярной гиперплоскости в однородных координатах. Мы можем работать сначала в L. Пусть уравнение Qo имеет вид q(x0, ..., хп)е= £ aqXiX/^O, а^а^. I, /=0 Точке (хд, ..., в L при изоморфизме L->-£*, связанном c q, п отвечает линейная функция £ aijx‘x/ от (хо, - x„)gL. По- этому уравнение полярной гиперплоскости имеет вид п £ а„х?х, = 0. В частности, если (х°: ... : е Q, го полярная гиперплоскость к данной точке содержит эту точку. Более того, в этом случае ее 22?
уравнение можно переписать в виде п п. X дх (АО’ • • ’ Хп) (*/ ~ х1) = X аИХ°1 (Х/ — Xf) = °- /=1 ' 1,1-0 Pi Pl Pi Рис. 4 В элементарной аналитической геометрии (над R) такое уравне- ние определяет касательную гиперплоскость к Qo в ее точке (л'о...х°). Это мотивирует общее определение: 4. Определение. Касательной гиперплоскостью к невырожден- ной квадрике Qcz Р (£) в точке p^Q называется гиперплоскость, полярная к р относительно квадратичной формы q, задающей Q. Пользуясь общими свойствами проективной двойственности, мы можем теперь немедленно восстановить геометрически значитель- ную часть отображения двойственности и получить серию красивых и неочевидных геометрических теорем, образцы которых мы при- ведем. Ниже Q — (невырожденная) квадрика в Р2 или Р3. а) Пусть Q ст Р2, р{, р2 — две точки на квадрике, р3 — точка пересечения касательных к Q в pt и р2. Согласно общему принципу двойственности точка р3 отвечает тогда прямой pip2, проходящей через р{ и р2, I т. е. проективной оболочке pi и р2. 1 Заставим точку р3 меняться вдоль I прямой I; проведем из каждой точки пря- I мой две касательные к Q и соединим I пары точек касания. Тогда все получаю- щиеся «хорды» Q пересекутся в одной pz точке г, которая отвечает I в силу двой- Р'г ственности. Еще раз заметим, что для р% доказательства мы не нуждаемся ни в каких вычислениях: это следует просто из того, что по общему принципу двой- ственности проективная оболочка точек 1рна к пересечению двойственных к ним пря- мых, которые и суть соответствующие хорды. Один момент, однако, заслуживает специального упоминания. Попарные пересечения касательных к точкам Q могут не заметать всю плоскость. Например для эллипса в RP2, как на рис. 4 (у нас нарисован, конечно, лишь кусочек аффинной карты в RP2), мы получим лишь внешность эллипса. Как же узнать, какие прямые отвечают внутренним точкам эллипса? Рйс. 4 подсказывает ответ: в силу симметрии двойственности следует провести через внутрен- нюю точку г пучок хорд к Q, затем построить точки пересечения касательных к Q в противоположных концах этих хорд; они и за- метут двойственную к точке г прямую /. Однако, таким образом, описание отображения двойственности становится неоднородным. У нас оказываются два рецепта для по- строения прямой I, полярной к точке г. 223
1) Если точка г лежит вне эллипса Q (или на нем), проведите две касательные из г к Q (или одну) и соедините точки касания прямой I (или возьмите касательную /). 2) Если точка г лежит внутри эллипса Q, проведите все пря- мые через г, постройте точки пересечения касательных к двум точкам пересечения прямых через г с Q. Их геометрическое место и будет прямой, двойственной к г. Оказывается, все дело в том, что основное поле R здесь не яв- ляется алгебраически замкнутым. Если бы мы работали в СР2, годились бы оба рецепта, и притом для всех точек г е СР2. Ве- щественная прямая I, лежащая целиком вне вещественного эллипса Q, на самом деле все равно пересекается с ним, но в двух комп- лексно сопряженных точках, и две комплексно сопряженные каса- тельные к Q в этих точках пересекаются уже в вещественной точке г, лежащей внутри Q. Из вещественной точки г, лежащей внутри Q, все равно можно провести две комплексно сопряженные каса- тельные к Q, через точки касания которых проходит вещественная прямая — это и есть I. В этом смысле вещественная проективная геометрия RP2 яв- ляется лишь кусочком геометрии СР2, и по-настоящему простая и симметричная теория двойственности имеет место в СР2, a RP2 отражает лишь ее вещественную часть. Классическая проективная геометрия была в значительной мере посвящена выяснению деталей этого красивого мира конфигура- ций, состоящих из квадрик, хорд и касательных и «невидимых» комплексных точек касания и пересечения. На самом деле вся квадрика может не иметь вещественных точек, как например х2 + х2 + %2 = 0- Тем не менее видимая часть двойственности разыгрывается на RP2. б) Дадим еще одну иллюстрацию в трехмерном случае: рас- смотрим проективную невырожденную квадрику Q в трехмерном проективном пространстве и проведем из точки г вне Q касатель- ные плоскости к Q. Тогда все точки касания лежат в одной пло- скости, а именно в плоскости, двойственной к г. Причина снова та же: пересечению касательных плоскостей двойственна проектив- ная оболочка точек касания, и если все касательные плоскости пересекаются в точности по г (это нужно и можно доказать в слу- чае, когда Q имеет достаточно много точек), то эта проективная оболочка должна быть двумерна. Комментарии по поводу комплексных точек касания и пересе- чения те же, что и в двумерном случае. Строгое определение вместилища недостающих точек проектив- ного пространства и квадрики в случае УС = R опирается на по- нятие комплексификации (см. § 12 ч. 1). 5. а) Комплексификацией проективного пространства Р(£) над R называется проективное пространство Р (£с) иад С. Канониче- ское вложение L c:Lc позволяет сопоставить каждой R-прямой в £ ее комплексификацию — С-прямую в £с, что определяет 829
вложение Р (£) cz Р (Lc). Точки Р (£с) суть «комплексные точки» вещественного проективного пространства P(L). б) Изоморфизм L-+L*, определяемый скалярным произведе- нием g на L, индуцирует крмплекспфицированный изоморфизм Lc—>-(£с)*. Он определяется симметричным скалярным произведе- нием gc на Lc, которое задает нам квадрику Qc и проективную двойственность вР(£с). На Lc и P(LC) действует операция ком- плексного сопряжения, индуцированная антилинейным изоморфиз- мом LC-»LC, тождественным на L cz Lc. Точки P(L)—это точки P(LC), инвариантные относительно комплексного сопряжения; они называются вещественными. Более общо, проективные подпростран- ства в Р (Lc), переводящиеся в себя при комплексном сопряжении, находятся в биекции с проективными подпространствами в P(L). Назовем такие подпространства вещественными. Тогда два отобра- жения, устанавливающие взаимнообратные биекции, можно опи- сать так: (вещественное проективное подпространство в />(£с))-> (мно- жество его вещественных точек в £(£)); (проективное подпространство в £(£))-»-(его комплексифика- ция в P(LC)). в) Отображение двойственности в P(L), определенное с по- мощью g, получается из отображения двойственности в P(LC), определенного с помощью gc, посредством ограничения послед- него на систему вещественных подпространств в Р (£с), отождест- вленную с системой подпространств в P(L), как в разделе б). Проверки всех этих утверждений, если учесть результаты § 12 ч. 1, проводятся непосредственно, а в вещественной системе коорди- нат Lc, пришедшей из L, совсем тавтологичны. Единственная со- держательная сторона ситуации, проиллюстрированная выше на примерах, состоит в возможности проявления вещественных точек на невидимых комплексных конфигурациях вроде лежащей внутри эллипса точки пересечения двух невещественных касательных к двум комплексно сопряженным точкам этого эллипса. В случае основного поля Ж, отличного от R, нужно воспользо- ваться общим функтором расширения основного поля (например, до алгебраического замыкания Ж} вместо комплексификации. Си- туация, однако, несколько усложняется тем, что вместо одного отображения комплексного сопряжения придется привлекать всю группу Галуа для выделения объектов, определенных над исход- ным полем (вещественных в случае Ж <= R). § 8. Проективные группы и проекции 1. Пусть L, М — два линейных пространства, f: L-+M— линей- ное отображение. Если Kerf = {0}, то f переводит любую прямую из L в однозначно определенную прямую в М и, значит, индуцирует отображение P(f)‘. P(L)-+ Р(М), называемое проективизацией /. В частности, если f — изоморфизм, P(f) называется проективным 230
изоморфизмом. При Ker f =/" {0} положение дел сложнее: прямые, лежащие в Kerf, т. е. составляющие проективное подпространство Р (Kerf) с: P(L), переходят в нуль, который не определяет никакой точки в Р(М). Поэтому проективизация P(f) определена лишь на дополнении Of = P(L)\P(Kerf). Оба этих случая важны, но ве- дут в разных направлениях, и мы исследуем их отдельно. Наибо- лее существенные геометрические черты ситуации выявляются уже при L = М. 2. Проективная группа. Пусть Л-1 = L, f пробегает группу ли- нейных автоморфизмов пространства L. Следующие утверждения очевидны: a) P(idt)= idp(L>; б) P(fg) = P(f)P(g). В частности, все отображения P(f) биективны и P(f-1)== P(f)~*. Поэтому P(f) пробегает группу отображений P(L) в себя, которая называется проективной группой пространства Р(£) и обозначается PGL(L), отображение Р: GL(L)-*PGL(L), f~+P(f) является сюръективным гомоморфизмом групп. Каждое отображение P(f) переводит проективные подпростран- ства Р(£) в проективные подпространства, сохраняя размерность и все отношения инцидентности. Вместо PGL(J^n+1) пишут PGL(n). 3. Предложение. Ядро канонического отображения Р: GL(£)->- -►PGL(P) состоит в точности из гомотетий. Поэтому PGL(L) изо- морфна факторгруппе GL(L)/<%"*, где Ж* — {aidzja е <7?\{0}}. Доказательство. По определению Ker Р — {f s GL(L) | P(f) = idp(t)}. Любая гомотетия переводит каждую прямую из L в себя, поэтому с: Ker Р. Наоборот, всякий элемент Ker Р пере- водит любую прямую в себя и потому диагонализируем в любом базисе L. Но тогда все его собственные значения должны совпа- дать. В самом деле, пусть f(ei) = Xiei, f(e2) = X2e2, где et, е2 линей- но независимы. Тогда из условия f (^ + е2) = p(ei + е2) —+ -|- 7.2е2 следует, что Тч = |л = ^2. Значит, f — гомотетия, что дока- зывает требуемое. 4. Отображения P(f) в координатах. Если линейное отображе- ние f: L-+L в координатах задается матрицей А: f (х0, • • -, хп) *=s А • [хр, • • •, хп] (произведение матрицы А на столбец [х0, .... хп]), то P(f) в со- ответствующих однородных координатах задается той же матри- цей А или любой пропорциональной ей: Р (f) (х0: ... : х„) cz (М) • [х0, ..., х„], К е Ж*. Если ограничиться рассмотрением точек с хОт₽=0, проективные ко- ординаты которых можно выбирать в виде (1:гд: ... ‘Уп), и так же записывать координаты образа точки, мы придем к дробно- 231
линейным формулам: п п а°°+ZLа^1: По1+а^1: к Z«1 i-1 п аоп + Е а1пУ1 1=*1 п “оо + Е “zo^Z Z = 1 п aoi + Е ai\yi i~\ п “оо + Е “zo^z Z=1 (Аналогичный вид, разумеется, имеет P(f) на множестве точек, где Xi =/= 0, i любое.) Эти выражения теряют смысл там, где зна- менатель обращается в нуль, т. е. в тех точках дополнения к гипер- плоскости %о = О, которые P(f) переводит в эту гиперплоскость. Если таких точек нет, то в терминах аффинных координат (у!....уп) на P(L)\{xo = O} мы получаем аффинное отображе- ние. Инвариантное объяснение этого дает следующий результат. 5. Предложение. Пусть М с: L — подпространство коразмерно- сти единица, P(M)czP(L) — соответствующая гиперплоскость, Ам— дополнение к ней с аффинной структурой, описанной в § 6. Поста- вим в соответствие любому проективному автоморфизму P(f): P(L)-+P(L) с условием f(M)cz М его ограничение на Ам- Получим изоморфизм подгруппы PGL(L), переводящей Р(М) в себя, с Aff А м- Линейная часть ограничения Р([) на Ам пропорциональна ограничению f на М. Доказательство. Введем аффинную структуру на Ам, отождествив Ам с линейным многообразием т' -р М ст L: каждой точке Ам ставится в соответствие пересечение соответствующей прямой в L с т' + М. Если f(M)cz М, то в классе f с одним и тем же P(f) можно выбрать единственное отображение f0, для которого fo(m' + М) =т' 4- М. Ограничения всех таких отображений f0 обра- зуют группу аффинных преобразований т' 4- М, поскольку пг' 4- М есть аффинное подпространство в L с его аффинной структурой, а f0: L->-L линейно и потому аффинно. Линейная часть такого f0, очевидно, совпадает с ограничением f0 на М. Для всякой линейной части можно найти соответствующее fo, и при фиксированной ли- нейной части можно найти f0, переводящее любую точку т' 4- М в любую другую: чтобы увидеть это, достаточно выбрать базис в L, состоящий из базиса в М и вектора т', после чего воспользоваться формулами п. 3. Наконец, если f тождественно действует на т' 4- М и М, то P(f) = idp(L), ибо f переводит каждую прямую в Z. в себя. Это завершает доказательство. fi. Действие проективной группы на проективных конфигура- циях. Назовем проективной конфигурацией конечную упорядочен- ную систему проективных подпространств в P(L'). Будем говорить, что две конфигурации проективно конгруэнтны тогда и только тогда, когда одну можно перевести в другую проективным преоб- 232
разованием P(L) в себя. Очевидно, для этого необходимо и доста- точно, чтобы соответствующие конфигурации линейных подпро- странств в L были одинаково расположены в смысле § 5 ч. 1. По- этому мы можем сразу же перевести доказанные там результаты на проективный язык и получить следующие факты. а) Группа PGL(L) транзитивно действует на множестве проек- тивных подпространств фиксированной размерности в P(L), т. е. все такие подпространства конгруэнтны (см. п. 1 § 5 ч. 1). б) Группа PGL(£) транзитивно действует на множестве упоря- доченных пар проективных подпространств в P(L) с фиксирован- ными размерностями членов пары и их пересечений, т. е. все такие пары конгруэнтны (см. п. 5 § 5 ч. 1). в) Группа PGL(£) транзитивно действует на множестве упоря- доченных n-ок проективных подпространств (Рь ..., Рп) с фикси- рованными размерностями dimP,-, которые обладают следующим свойством: для каждого i подпространство Pi не пересекается с проективной оболочкой (Рь ..., Pi-i, Pl+i, ..., Рп), т. е. наимень- шим проективным подпространством, содержащим эту систему. Действительно, пусть Pt = P(Li), Lt с: L. Проективная оболочка (Pi, ..., Pi-i, Pi+i, ..., Pfl), как нетрудно убедиться, совпадает с P(£i4~ ... -j- Li-i -|- Li+i + +ДЭ, а условие пустоты ее пере- п сечения с Р(Li) означает, что Lt П £ £, = {0). В силу условия а) теоремы п. 8 § 5 ч. 1 сумма L\ Ф ... Ф £„ прямая, и GL(£) тран- зитивно действует на таких n-ках подпространств (выбрать базис в L, дополняющий объединение базисов всех £,, и воспользоваться тем, что GL(£) транзитивна на базисах L). В качестве частного случая (dimP, = 0 для всех i) получаем следующий результат: все наборы п точек в Р(£), обладающие тем свойством, что никакая точка не лежит в проективной оболочке остальных, проективно конгруэнтны. г) Группа PGL(£) транзитивно действует на множестве проек- тивных флагов Р, cz Р2 cz - - - с Р„ в Р(£) фиксированной длины п с фиксированными размерностями dim Р,. Действительно, любой такой флаг является образом флага £jcz cz t2 cz ... в £; выберем базис в L, первые dim Рг 4- 1 элементов которого порождают подпространство £, для каждого I, и снова воспользуемся транзитивностью действия GL(£) на базисах. Кроме этих результатов, являющихся прямым следствием соот- ветствующих теорем для линейных пространств, разберем один интересный новый случай, в котором впервые появляется нетри- виальный инвариант относительно проективной конгруэнтности: классическое «двойное отношение четверки точек на проективной прямой». Большую часть рассуждений можно провести в случае произвольной размерности, и мы начнем с общего определения. 7. Определение. Система точек pt, .pN в п-мерном проектив- ном пространстве Р находится в общем положении, если для всех m min{yV, п 4~ 0 и всех подмножеств S а: {1......Ю мощности 233
tn проективная оболочка точек {pi 11 е S} имеет размерность m— 1. Нас особенно будут интересовать случаи N = «4- 1, «4-2, п -f- 3. а) п -J- 1 точек в общем положении. Поскольку никакая точка системы не лежит в проективной оболочке остальных (иначе проек- тивная оболочка всей системы имела бы размерность п — 1, а не п), такие конфигурации уже были рассмотрены в разделе в) п. 6; в частности, проективная группа на них транзитивна. Сейчас мы хотим обратить внимание на то, что проективное преобразование, переводящее одну систему п 4- 1 точек в общем положении в дру- гую, не определено однозначно. Действительно, если в[........е„+1— ненулевые векторы, лежа- щие в pi, , pn+i соответственно, то {в].....e«+t} есть базис L (где P — P(L)) и группа проективных преобразований, оставляю- щих на месте все точки рг, состоит в точности из преобразований вида P(f), где f диагональны в базисе {еь ..., en+i}. Эта остав- шаяся степень свободы позволяет доказать транзитивность дейст- вия PGL(L) на системах п-j-2 точек в общем положении. б) п 4~ 2 точки в общем положении. Если точки {pi, ..., р„+2} находятся в общем положении, то точки {рь ..., p„+i} также на- ходятся в общем положении. Как в предыдущем абзаце, выберем базис {ец ..., en+i), et^pi. Он определяет систему однородных координат в Р. Пусть (хр. xn+i)—координаты точки рп+2 в этом базисе. Ни одна из координат xt не -равна нулю, иначе вектор (%1, ..., Xn+i) на прямой р„4-2 линейно выражался бы через век- торы е/, 1^/^«4-1, j5# i, откуда следует, что проективная обо- лочка «4- 1 точки {pJi=/=/} имела бы размерность п— 1, а не п. Но преобразование P(f) с f = diag(X]........Хп+1) (в базисе {ei, ..., вп+1}) переводит (хр ...: xn+i) в точку (XiXp...: Z„+1xn+i), a pi, pn+i оставляет на месте. Отсюда следует, что любую точку (хр Xn+i) (все хг^=0) можно перевести в любую другую (ур ...: z/n+i) (все yz¥=O) единственным проективным преобра- зованием, оставляющим рь ..., рп на месте. Итак, мы установили, что все упорядоченные системы «4-2 точек в общем положении в Р, где dim Р ~ п, конгруэнтны и, бо- лее того, образуют главное однородное пространство над группой PGL(L). Принимая «пассивную» точку зрения вместо «активной», мы можем сказать, что для любой упорядоченной системы точек {pi,..., рп+2} существует единственная система однородных коорди- нат в Р, в которой координаты pi,..., pn+z имеют следующий вид: pt = (l :0: ... :0), р2 = (0: 1 :0: ... :0). р„+1 = (0: ... : 0 : I , Рп+2 = (1 Можно назвать эту систему приспособленной к {рь ..., pn+i}- в) «4-3 точки в общем положении. Такие конфигурации уже не все конгруэнтны: если {рх..рп+3) и {р'( .... рп+3} даны, мы 234
можем найти единственное проективное отображение, переводящее pt в p't для всех 1 sC / /г + 2, но р„+з попадает или не попадает в р'+3 в зависимости от ситуации. Нетрудно описать проективные инварианты системы из п 4- 3 точек. Выберем систему однородных координат в Р, в которой пер- вые л 4-2 точки имеют координаты, описанные в случае б). В ней точка ри+з имеет координаты (хи ...: x„+i), определенные одно- значно с точностью до пропорциональности. Любой проективный автоморфизм Р, примененный одновременно к конфигурации {pi, ..., Pn+з} и к приспособленной к ней системе координат, пе- реведет эту конфигурацию в другую, а систему координат — в при- способленную систему координат новой конфигурации. Поэтому координаты (хр. ...: xn+i) последней точки останутся теми же самыми. Все предыдущие рассуждения с очевидными видоизменениями переносятся также на случай, когда у нас имеются два л-мерных проективных пространства Р и Р', конфигурации {рь ..., pN} cz Р и {р', ..., р^| cz Р', и мы интересуемся проективными изомор- физмами Р-+Р', переводящими первую конфигурацию во вторую. Резюмируем результаты обсуждения в следующей теореме: 8. Теорема, а) Пусть Р, Р' — п-мерные проективные простран- ства, {р,, ..., рп+2) <^Р и {р;, ..., р„+2} cz Р' — две системы точек в общем положении. Тогда существует единственный проективный изоморфизм Р —> Р', переводящий первую конфигурацию во вторую. б) Аналогичный результат верен для систем л 4- 3 точек в об- щем положении тогда и только тогда, когда координаты (л4~3)-Д точки в системе, приспособленной к первым п 4- 2 точкам, для обеих конфигураций совпадают (конечно, с точностью до скаляр- ного множителя). 9. Двойное отношение. Применим теорему п. 8 к случаю п = 1. Мы получим, прежде всего, что если на двух проективных прямых заданы упорядоченные тройки попарно разных точек (это и есть здесь условие общности положения), то существует единственный проективный изоморфизм прямых, переводящий одну тройку в другую. Далее, пусть задана четверка попарно разных точек {рь р2, р3, р4) <= Р' с координатами (1:0), (0:1), (1:1) и (xi:x2) в приспо- собленной системе. Тогда х2 =£- 0. Положим [Р2. Р3> Рр Pj = x1x2-1- Это число называется двойным отношением четверки точек {р,}. Необычный порядок объясняется желанием сохранить согласован- ность с классическим определением: в аффинной карте, где р2 — оо, рз = 0, pi = 1, координаты точек в квадратных скобках распола- гаются так: [0, 1, оо, х], где х и есть двойное отношение этой чет- верки. Сам термин «двойное отношение» происходит из следующей яв- ной формулы для вычисления инварианта [хь х2, xs, x4J, где х, 235
на сей раз понимаются как координаты точек р,- в произвольной аффинной карте Р'. Согласно результатам п. 4 группа PGL(l) в этой карте представлена дробно-линейными преобразованиями вида х и-> -°* , ad — Ьс=£О. Такое преобразование, переводя- щее (xi, х2, хз) в (0, 1, оо), имеет вид X] — X Xi — Х1 х> —1------:-----—. Хз — X хз — х2 Подставляя сюда х = х4, находим [Х1, х2, х3, х4] Xl — Х4 _ Xl — х2 ~~ Хз — Х4 ' Хз — х2 ' Еще одна классическая конструкция, связанная с утвержде- нием а) теоремы п. 8 для п = 1, описывает представление симме- трической группы S3 дробно-линейными преобразованиями. Со- гласно этой теореме любая перестановка {рь р2, Рз)1—>{Pa(i), ро<2), рО(3)} трех точек на проективной прямой индуцирована единствен- ным проективным преобразованием этой прямой. В аффинной карте, где {pi, р2, рз} = {О, 1, оо}, эти проектив- ные преобразования представлены дробно-линейными преобразо- ваниями Перейдем теперь к изучению проекций. 10. Пусть линейное пространство L представлено в виде прямой суммы двух своих подпространств размерности 1: L = Lx ф Ь2. Положим P = P(L), Pi — P(Li). Как было показано в п. 1, линейная проекция f: L-+L2, f{h + l2)=l2, h e Li, индуцирует отображение P(f): P\ Pi~> P2, которое мы будем называть проекцией из центра Pi на Р2. Чтобы описать всю ситуацию в чисто проективных терминах, заметим следующее. a) dim Р} -j- dim P2= dim P—1 и Р1П732=0- Наоборот, любая конфигурация (Pi, Р2) с такими свойствами происходит из един- ственного прямого разложения L « L, Ф L2. б) Если то P(f)« = a; если а е (Pi U Р2), то P(f)a определяется как точка пересечения с Р2 единственной проективной прямой в Р, пересекающейся с Pt и Р2 и проходящей через а. Действительно, случай о е Р2 очевиден. Если а ф Pi U Р2, то на языке пространства L нужный нам результат формулируется так: через любую прямую Lq cz L, не лежащую в Li и L2, проходит единственная плоскость, пересекающаяся с Lt и L2 по прямым, и ее пересечение с L2 совпадает с ее проекцией на L2. В самом деле, одна плоскость с этим свойством есть: она натянута на проекции Lo на Li и L2 соответственно. Существование двух таких плоскостей 236
влекло бы существование двух разных разложений ненулевого вектора /0 Lo в сумму двух векторов из L\ и £2 соответственно, что невозможно, ибо L — L\ ф Е2. Поскольку описанная проективная конструкция отображения Р-+Р\Р1 поднимается до линейной, мы сразу же получаем, что для любого подпространства Р' cz ограничение проекции P'->Pi является проективным отображением, т. е. имеет вид P(g), где g — некоторое линейное отображение соответствующих вектор- ных пространств. В важном частном случае, когда Р\— точка, Р2— гиперпло- скость, отображение проекции из центра Р} на Р2 переводит точку а в ее образ на Р2, видимый наблюдателем из Рь Поэтому отно- шение между некоторой фигурой и ее проекцией в таком случае называют еще перспективным. Интуитивно менее очевидна, напри- мер, проекция из прямой на прямую в Р3 (рис. 5, 6). Важное свойство проекций, которое следует иметь в виду, состоит в следующем: если Р' cz Р\РЬ то проекция из центра Pt опреде- ляет проективный изоморфизм Р' и его образа в Р2. Действительно, на языке линейных пространств это означает, что проекция f: L2-*- L2 индуцирует изоморфизм М с/(Л4),где М с L — лю- бое подпространство с Lif|AI — {0}. Это так, ибо Lx — Ker f. 11. Поведение проекции вблизи центра. Ограничимся дальше рассмотрением проекций из точки р\ = а е Р и попытаемся по- нять, что происходит с точками, находящимися вблизи центра. В случае Ж — R и С, когда действительно можно говорить о бли- зости точек, картина такова: в точке а нарушается непрерывность проекции, ибо точки Ь, как угодно близкие к а, но подходящие к а «с разных сторон», проектируются в далеко отстоящие друг от друга точки р2. Именно это свойство проекции лежит в основе ее приложений к разного типа вопросам о «разрешении особенностей». Если в Р лежит некая «фигура» (алгебраическое многообразие, векторное поле), имеющая вблизи точки а необычное строение, то, проектируя ее из точки а, мы можем растянуть окрестность этой точки и увидеть, что в ней происходит, в увеличенном масштабе, причем коэффициент увеличения при приближении к а безгранично растет.
Хотя эти приложения относятся к существенно нелинейным си- туациям (тривиализируясьв линейных моделях), стоит разобраться в структуре проекции вблизи ее центра несколько подробнее, на- сколько это можно сделать, оставаясь в рамках линейной гео- метрии. 12. Введем в P(L) проективную систему координат, в которой центром проекции является точка (0, ..., О, 1), а Р2 = РП~1 со- стоит из точек (х0: хг х,г-ь 0); чтобы добиться этого, следует выбрать в L базис, являющийся объединением базисов в Ц и (поскольку центр — точка, dim — 1). Нетрудно видеть, что тогда точка (х0: ...: хп) проектируется в (х0: .хп-ь 0). Дополнение А к Р2 снабжено аффинной систе- мой координат (Уо....Уп-|) — (хо/хп, ..., хп_1/х„) с началом О в центре проекции. Рассмотрим прямое произведение А X Рг = А X Рп~1 и в нем график Го отображения проекции, ко- торое, напомним, определено только на Л\{0}. Этот график состоит из пар то- чек с координатами ((хо/хя, ..., xrt_|/xn), (Xq : ... : xn__i)), где не все х0, ..., xn-i равны нулю од- новременно. Увеличим график Го, доба- вив к нему над точкой О^А множество (OJXP"-1 ХРп~1, г = гои{0)ХРп-1> в соответствии с геометрической интуи- цией, согласно которой при проекции из 0 центр «переходит во все пространство Р”-1». Множество Г обладает рядом хоро- ших свойств. а) Г состоит в точности из пар точек ((№> • • •. i/n-i)> (хо: • • • : x„_i)), удовлетворяющих системе алгебраических уравнений j/iXj — У/Xi == 0; i, j — 0, ..., п — 1. Действительно, эти уравнения означают, что все миноры матрицы (х0 ... х„_! \ равны НуЛЮ> так что ее ранг равен единице (ибо пер- вая строчка ненулевая) и, значит, вторая строка пропорциональна первой. Если коэффициент пропорциональности не равен нулю, мы получаем точку из Го, а если равен, то из {0} X Г”-1. б) Отображение Г->Л: ((г/0, (хо: ...: xn-i))->(^o, • • - ..., z/,t_i) является биекцией всюду, кроме слоя над точкой {0}. 238
Иными словами, Г получается из А «вклеиванием» целого проек- тивного пространства Р"-1 вместо одной точки. Говорят, что Г по- лучается из А «раздутием» (blowing up) точки, или о-процессом с центром в точке О. Прообраз в Г каждой прямой в А, проходящей через точку О, пересекает вклеенное проективное пространство рп-! также по одной точке, но своей для каждой прямой. В случае Ж — R, п = 2 можно представлять себе аффинную карту вклеен- ного проективного пространства Pi как ось винта мясорубки Г, де- лающего полоборота на протяжении своей бесконечной длины (рис. 7). Реальное применение проекции к исследованию особенности в точке О е А связано с переносом интересующей нас фигуры с А на Г и рассмотрению геометрии ее прообраза вблизи вклеенного пространства Рп~1. При этом, например, прообраз алгебраического многообразия будет алгебраичен благодаря тому, что Г задается алгебраическими уравнениями. § 9. Конфигурации Дезарга и Паппа и классическая проективная геометрия 1. Классическая синтетическая проективная геометрия была в значительной мере посвящена изучению семейства подпространств в проективном пространстве с отношением инцидентности; свойства этого отношения можно положить в основу аксиоматики, и прийти затем к современному определению пространств P(L) и поля ска- ляров Ж так, что L и Ж появятся как производные структуры. В таком построении большую роль играют две конфигурации — Дезарга и Паппа. Мы введем и изучим их в рамках наших опреде- лений и затем вкратце опишем их роль в синтетической теории. 2. Конфигурация Дезарга. Пусть S — семейство точек в проек- тивном пространстве. Символом S мы будем обозначать его проек- тивную оболочку. Рассмотрим в трехмерном проективном простран- стве упорядоченную шестерку точек (рь р2, Ра; д\, Рг, Рз)- Предпо- лагается, что точки попарно разные и что pip2p3 и qiq2q3 суть плоскости. Далее, пусть прямые p\q\, р?д2 и p3q3 пересекаются в одной точке г, отличной от р, и qt. Иными словами, «треугольники» Р1Р2Р3 и <7192<7з «перспективны», и каждый из них есть проекция другого из центра г, если они лежат в разных плоскостях. Тогда для любой пары различных индексов {i, /} cz {1, 2, 3} прямые Р<Р/ и qtqj не совпадают, иначе мы имели бы р, = qt, ибо р, и qi суть точки пересечения этих прямых с прямой ptqi. Кроме того, прямые pipj и qtqt лежат в общей плоскости rpip/. Поэтому они пересекаются в точке, которую мы обозначим sk, где {i, /, /г} = = {1, 2, 3}: это точка пересечения продолжений пары соответ- ствующих сторон треугольников pip2p3 и pip2p3. Теорема Дезарга, которую мы докажем в следующем пункте, утверждает, что три точки s1; s2, s3 лежат на одной прямой. Конфигурация, состоящая из десяти точек р/, qj, Зц, г и десяти 239
соединяющих их прямых, показанных на рис. 8, называется конфи- гурацией Дезарга. Каждая ее прямая содержит ровно три ее точки, и через каждую ее точку проходят ровно три ее прямые. Читателю предлагается самостоятельно убедиться в том, что она по существу симметрична (в том смысле, что группа перестановок ее точек и Рис. 8 прямых, сохраняющая отношения инцидентности, транзитивна как на точках, так и на прямых). 3. Теорема Дезарга. В опи- санных выше условиях точки Si, s2, «з лежат на одной прямой. Доказательство. Мы раз- берем два случая в зависимости от того, совпадают плоскости РгРгРз и 91<?2^з или нет. а) Р1Р2Р3 =/= <71?2<7з («простран- ственная теорема Дезарга». В этом случае плоскости р\р2рз и пересекаются по прямой, и нетрудно убедиться, что $i, s2, s3 лежат на ней. Действительно, точка S], например, лежит на прямых р2рз и q2qz, которые в свою оче- редь лежат в плоскостях р\р2р3 и q\q2q2 и, значит, в их пересечении. б) р\р2рз = ?192<7з («плоская теорема-Дезарга»). В этом случае выберем в пространстве точку г', не лежащую в плоскости pip2p3, и соединим ее прямыми с точками г, pt, ps. В плоскости /р^ср ле- жит прямая piqi и, значит, точка г. Проведем в ней через г пря- мую, не проходящую через точки г' и рь и обозначим ее пересече- ния с прямыми r'p,, r'qv через p\,q\ соответственно. Тройки (р', р2, Рз) и ?2> ?з) лежат уже в разных плоскостях — иначе содер- жащая их общая плоскость содержала бы прямые р2р3 и q2q3 и потому совпадала бы с р\р2рз, но это невозможно, ибо р', q\ в этой начальной плоскости не лежат. Кроме того, прямые p\q’ p2q2 и рз<7з проходят через точку г. В силу пространственной теоремы Де- зарга точкир'р2П q\q2, p\p3ftq'tq3 и р2Р3П<72<73 лежат на одной пря- мой. Но если спроектировать эти точки из г' на плоскость р1р2рз, то получатся как раз $з, s2, s, соответственно, потому что г' проек- тирует (р;, р2, р3) в (р,, р2, р3) и (рр ?2, 9з) в (<7р <?2, 9з) и, зна- чит, стороны каждого из этих треугольников в соответствующие стороны исходных треугольников. Это завершает доказательство. 4. Конфигурация Паппа. Рассмотрим в проективной плоскости две разные прямые и две тройки лежащих на них попарно разных точек рь р2, рз и qb q2, q3. Для любой пары различных индексов 240
{i, /} с: {1, 2, 3} построим точку sk — p,qj П qipt, где {i, /•, k} = = {1, 2, 3}. 5. Теорема Паппа. Точки sb s2, s3 лежат на одной прямой. Доказательство. Проведем прямую через точки «з, $2 и обозначим через S4 ее пересечение с прямой p\qi. Наша цель со- стоит в доказательстве того, что si лежит на ней. Построим два проективных отображения f2: Р1РгРз-> 919293- Первое из них, fi, будет композицией проекции Р1р2рз на s2sa из точки 91 с проекцией зз«2 на 919393 из точки рь Очевидно, fifpif^qi для всех i=l, 2, 3, и, кроме того, fi(ti) — t2, где t\ = = Р1Р2Р3 fl 91929з, <2 = S4S3S2n 919г9з (рис. 9). Второе из них, f2, будет композицией проекции р\р2рз на s2s2 из точки q2 с проекцией s3s2 на 919293 из точки р2. Эта композиция переводит pi в 91, р2 в q2 и t\ в t2. Поскольку fi и f2 одинаково действуют на тройках точек (/ь Рь Рг), они должны совпадать. В частности, fa (рг) = f2(р3). Но Л(рз) = 9з- Значит, /2(рз) = 9з- Это утверждение геометрически оз- начает следующее: если обозначить через si пересечение q2p2 П S3S2, то прямая р29з проходит через s'. Но тогда — 92Рз Я Р29з — Значит, Si лежит на s2s3, что и требовалось доказать. 6. Классические аксиомы трехмерного проективного простран- ства и проективной плоскости. Классическое трехмерное проектив- ное пространство определяется как множество, элементы которого называются точками, снабженное двумя системами подмножеств, элементы которых называются соответственно прямыми и плоско- стями. При этом должны выполняться следующие аксиомы. Ть Две разные точки принадлежат единственной прямой. Т2. Три разные точки, не лежащие на одной прямой, принадле- жат единственной плоскости. Т3. Прямая и плоскость имеют общую точку. Т4. Пересечение двух плоскостей содержит прямую. Т5. Существуют четыре точки, не лежащие в одной плоскости и такие, что любые три из них не лежат на одной прямой. Т6. Каждая прямая состоит не менее чем из трех точек. 241
Классическая проективная плоскость определяется как множе- ство, элементы которого называются точками, снабженное систе- мой подмножеств, элементы которой называются прямыми. При этом должны выполняться следующие аксиомы. Пр Две разные точки принадлежат единственной прямой. П2. Пересечение двух прямых непусто. П3. Существуют три точки, не лежащие на одной прямой. П4. Каждая прямая состоит не менее чем из трех точек. Множества P(L), где L — линейное пространство над полем размерности 4 или 3, вместе с системами проективных плоскостей и прямых в них, как они были введены выше, удовлетворяют аксио- мам Ti—Те и П1—П4 соответственно, что немедленно следует из стандартных свойств линейных пространств, доказанных в ч. 1. Однако не всякое классическое проективное пространство или плоскость изоморфно (в очевидном смысле слова) одному из наших пространств P(L). Следующая фундаментальная конструкция дает много новых примеров. 7. Линейные и проективные пространства над телами. Телом (или не обязательно коммутативным полем) называется ассоциа- тивное кольцо К, множество ненулевых элементов которого обра- зуют группу по умножению (не обязательно коммутативную). Все поля являются телами, но обратное неверно. Например, кольцо классических кватернионов является телом, но не полем. Аддитивная группа L вместе с бинарным законом умножения KXA->-L: (а, называется (левым) линейным простран- ством над телом К, если выполнены условия определения п. 2 § 1 ч. 1. Значительная часть теории линейных пространств над полями почти без изменений переносится на линейные пространства над телами. В частности, это относится к теории размерности и базиса и теории подпространств, включая теорему о размерности пересече- ния. Это позволяет построить по каждому телу К и линейному про- странству L над ним проективное пространство P(L), состоящее из прямых в L, и систему его проективных подпространств Р(М), где М er L пробегает линейные подпространства разных размер- ностей. Когда dim KL — 4 или 3, эти объекты удовлетворяют всем аксиомам Ti—Т6 и ГК—П4 соответственно. 8. Роль теоремы Дезарга. Оказывается, однако, что существуют классические проективные плоскости, не изоморфные даже никакой плоскости вида P(L), где L — трехмерное линейное простран- ство над каким-нибудь телом. Причина этого состоит в том, что в проективных плоскостях вида P(L) теорема Дезарга по-прежнему верна, тогда как существуют недезарговы плоскости, где она не выполняется. Сформулируем без доказательства следующий ре- зультат: 9. Теорема. Три свойства классической проективной плоскости равносильны: а) В ней выполняется плоская теорема Дезарга. б) Ее можно вложить в классическое проективное пространство. 242
в) Существует линейное трехмерное пространство L над неко- торым телом К, определенным однозначно с точностью до изомор- физма, такое, что наша плоскость изоморфна P(L). Импликация б)=>а) устанавливается прямой проверкой того, что доказательство пространственной теоремы Дезарга использует лишь аксиомы Т]—Т6. Импликация в)=>б) следует из того, что L можно вложить в четырехмерное линейное пространство над тем же телом. Наконец,, импликация а)=>в), являющаяся самым тонким мо- ментом доказательства, устанавливается прямой конструкцией тела по дезарговой проективной плоскости. Именно, сначала с помощью геометрической конструкции проекций из центра вводится понятие проективного отображения проективных прямых в плоскости. Да- лее, доказывается, что для двух упорядоченных троек точек, ле- жащих на двух прямых, существует единственное проективное отображение одной прямой в другую. Наконец, фиксируется пря- мая D с тройкой точек р0, pi, р2, множество К определяется как 0\{рг} с нулем ро и единицей р\, и законы сложения и умножения в К вводятся геометрически с помощью проективных преобразова- ний. В проверках аксиом тела существенно используется теорема Дезарга, в этом контексте возникающая как аксиома Дезарга Щ. 10. Роль теоремы Паппа. Даже в дезарговых плоскостях тео- рема Паппа может не выполняться. Назвав соответствующее утверждение аксиомой Паппа Пс, мы можем сформулировать сле- дующую теорему, которую мы также приведем без доказательства: 11. Теорема, а) Если в классической проективной плоскости вы- полнена аксиома Паппа, то плоскость является дезарговой. б) Дезаргова классическая плоскость удовлетворяет аксиоме Паппа тогда и только тогда, когда связанное с ней тело коммута- тивно, т. е. эта плоскость изоморфна P(L), где L — трехмерное ли- нейное пространство над полем. Дальнейшие подробности и опущенные нами доказательства чи- татель может найти в книге: Хартсхорн Р. Основы проективной геометрии. — М.: Мир, 1970. § 10. Кэлерова метрика 1. Если L — унитарное линейное пространство над С, то на проективном пространстве P(L) можно ввести специальную ме- трику, называемую кэлеровой в честь открывшего ее важные обоб щения Э. Кэлера. Сама эта метрика была введена в прошлом веке Фубини и Штуди. Она играет особенно важную роль в комплексной алгебраической геометрии и неявно также в квантовой механике, потому что такие пространства Р(/.), как было объяснено в ч. 2, являются пространствами состояний квантовомеханическпх систем. Эта метрика инвариантна относительно тех проективных пре- образований P(L), которые имеют вид Р (f), где f — унитарное отображение L в себя. Вводится она следующим образом. Пусть Pi, р2^Р(Ь). Точкам pi, р2 отвечают два больших круга на еди- 243
ничной сфере S cz L, как показано в разделе в)' п. 3 § 6. Тогда кэ- лерово расстояние d(pi, р2) равно расстоянию между этими кру- гами в евклидовой сферической метрике S, т. е. длине кратчайшей дуги большого круга на S, соединяющей две точки на прообразах Pi и р2. Основная цель этого параграфа — доказательство следующих двух формул для d(pi, р2). 2. Теорема, а) Пусть h,l2^L, |/i| = |/г| = I; pi,p2^P(L)— прямые С/j и С12. Тогда d(pi, рэ) = arccos | (/i, Z2) |, где (/], 12) — скалярное произведение в L. б) Пусть в L выбран ортонормированный базис, относительно которого в Р(Ь) определена однородная система координат. Пусть две близкие точки р\, р2^Р(Ь) заданы своими координатами {у\, • • •, Уп) и (z/i + dyi, , уп~\~ dyn) в аффинной карте Uo (см. раздел а) п. 3 § 6). Тогда квадрат расстояния между ними с точ- ностью до третьего порядка малости по dyt равен Е I |2 Е «1^1 i=\ ’ + Ei^ I2 ’ + Ei^ i2 i=l Доказательство, а) В евклидовом пространстве расстоя- ние между двумя точками на единичной сфере равно длине той дуги соединяющего их большого круга, которая лежит между 0 и л, т. е. евклидову углу, или арккосинусу евклидова скалярного произ- ведения радиусов. Евклидова структура на L, отвечающая исход- ной унитарной структуре, задается скалярным произведением Re(Zi, 12). Поскольку мы должны найти минимальное расстояние между точками больших кругов (е/ч>/1), (е‘*/2), а арккосинус — убывающая функция, нужно подобрать (риф так, чтобы при дан- ных /1, 12 величина Re(e‘4’/1, е1^12) приняла наибольшее возможное значение. Но она не превосходит | (1\, 12) | и при подходящих <р, ф достигает этого значения: если (р — —arg(Zi, Z2), то (ez<₽Zi, Z2) = = | (/j, Z2) |. Поэтому окончательно d(Pi, р2) = arccos |(/ь /2)|. б) Положим п \1/2 /?=( 1 + Еш2 . \ £==1 / R-\-dR = 1+ ElP< + <W \ f-i Тогда прообразами точек (уи ..., уп) и (у\ + dyx,...,yn-\- dyn) на S будут точки (L У' -М ; ( 1 £t_+££L Уп + d,Jn) I/?’ R'"'' R J’ 2 \R + dR' R + dR’"' R + dR J 244
Поэтому / « _ ___ \ Я2 + £ (/1> /2) = £ (R + dR) ( 1 + £ Ус (Ус + dUi> ) = R (R + dR} x <=i 7 и /?4 + Я2 £ (У^ + ytdy{) + £ tJidt/i I Gb h) К = R2 (R + dRyz Далее, (R + dR)2 = I + X | yt + dyt |2 = R2 + £ {ytdyi + yzdz/, + | dyt f). «=! »=! Поэтому с точностью до третьего порядка малости по dyi п п |2 £ I dyt |2 £ yid^l КА. /2)Р=1 ——4--^— Л А С другой стороны, если <р = arccos| (/ь /2) |, то с точностью до <р4 при малых ср имеем КА. Z2)|2 = (cosq))2=(l-4+ ...)2=1-<р2+ ... Сравнение этих формул завершает доказательство. §11. Алгебраические многообразия и многочлены Гильберта 1. Пусть P(L) — n-мерное проективное пространство над полем Ж с фиксированной системой однородных координат. Мы уже многократно встречались с проективными подпространствами в Р(£) и квадриками, которые определяются соответственно систе- мами уравнений п = k=\, т, /=0 или п ciijXiXj — f), a{j = atl. Более общо, рассмотрим произвольный однородный многочлен, или форму, степени т 1: F (х0, . £ я . . Хд° ... х п. l0+... + in^m i. Хотя она не определяет функции на P(L), множество точек с одно- родными координатами (х0: ...: х„), для которых F — 0, опреде- 245
лено однозначно. Оно называется алгебраической гиперповерх- ностью (степени tn), заданной уравнением F = 0. Более общо, множество точек в P(L), удовлетворяющих си- стеме уравнений F1 = F2=...=Fft = 0, где Fi — формы (возможно, разных степеней), называется алге- браическим многообразием., определенным этой системой урав- нений. Изучение алгебраических многообразий в проективном про- странстве составляет одну из основных целей алгебраической гео- метрии. Разумеется, общее алгебраическое многообразие является существенно нелинейным объектом, поэтому, как и в других гео- метрических дисциплинах, важное место в технике алгебраической геометрии занимают методы линеаризации нелинейных задач. В этом параграфе мы введем один такой метод, восходящий к Гильберту и дающий с минимумом предварительной подготовки важную информацию об алгебраическом многообразии VclP(L). Его идея состоит в том, чтобы поставить в соответствие алгебраи- ческому многообразию V счетную серию линейных пространств {/m(V)} и изучить их размерность как функцию от т. Именно, пусть /m(V) — пространство форм степени т, обращающихся в нуль на V. Покажем, что существует многочлен Qv(m) с рациональными коэффициентами такой, что dimIm(V) = Qv(tn) для всех доста- точно больших т. Коэффициенты многочлена Qv являются важней- шими инвариантами V. На самом деле мы установим заметно бо- лее общий результат, но для его формулировки и доказательства нам придется ввести несколько новых понятий. 2. Градуированные линейные пространства. Фиксируем раз на- всегда основное поле скаляров Ж. Градуированным линейным про- странством над Ж будем называть линейное пространство L вместе с фиксированным его разложением в прямую сумму подпро- оо странств: L — ^Ц.Этг сумма бесконечна, но каждый отдельный i =о элемент l^L однозначно представляется в виде конечной суммы: оо I — £ h ее Li, в том смысле, что все U, кроме конечного числа (=0 их, равны 0. Вектор h называется однородной компонентой I сте- пени г, если I е L,, то I называется однородным элементом сте- пени i. Пример: кольцо многочленов А(п) от независимых переменных хо, • - -, хп разлагается как линейное пространство в прямую сумму где А(,"‘ состоит из однородных многочленов степени i. i=0 Заметим, что если интерпретировать х(- как координатные функции на линейном пространстве L, а элементы А(п> как полиномиальные 246
функции на этом пространстве, то линейные обратимые замены координат сохраняют однородность и степень. оо Другой пример: 1 = ® 7m(V), где V — некоторое алгебраи- ческое многообразие. Очевидно, / с А<л> и 1т(У) = А{^ Q7. Более общо, градуированное подпространство М градуирован- оо кого пространства £ = фд— это линейное подпространство, оо обладающее следующим свойством: М = ф(Л1 П Ц)- Очевидное /=о равносильное условие: все однородные компоненты любого эле- мента М сами являются элементами М. Если McL — пара, состоящая из градуированного простран- ства и его градуированного подпространства, то факторпростран- ство L/М также обладает естественной градуировкой. Именно, рассмотрим естественное линейное отображение ОО ОО ✓ СО X Ф Д/М, -> L/М: I (/, + М{) ->£/,+ м £=0 /= ! \£=0 / (суммы справа конечны). Оно сюръективно, потому что любой эле- оо оо мент X li> li е Д есть образ элемента У (/, -Д Mt). Оно инъек- 1=0 1=0 оо оо тивно, ибо если У, /, + М = М, то£ l{^ М nl^M в силу £=0 1=0 однородности М. Поэтому это отображение — изоморфизм, и мы можем определить градуировку L/М, положив (L/M)i — Li/Mi. Семейство градуированных подпространств в L замкнуто отно- сительно пересечений и сумм, и все обычные изоморфизмы линей- ной алгебры имеют очевидные градуированные варианты. 3. Градуированные кольца. Пусть А— градуированное линей- ное пространство над ЗД являющееся в то же время коммутатив- ной J^-алгеброй с единицей, умножение в которой подчинено условию AiAs с Ai+I. Тогда А называется градуированным кольцом (точнее, градуиро- ванной .у/1-алгеброй). Так как JAAiCzAi, имеем WczAo. Важней- ший пример — кольца многочленов А(л); в них, конечно, A(on> — Jf. 4. Градуированные идеалы. Идеалом 1 в произвольном комму- тативном кольце А называется подмножество, образующее адди- тивную подгруппу А и замкнутое относительно умножения на элементы А: если fel и а&А, то af(^I. Градуированным идеа- лом в градуированном кольце А называется идеал, который как со ^-подпространство А градуирован, т. е. I — ф Д, lm = /(]Am. 247
Основной пример: идеалы /т(Е) алгебраических многообразий в кольцах многочленов Л(п). Стандартная конструкция идеалов та- кова: пусть S cz А — любое подмножество элементов. Тогда мно- жество всех конечных линейных комбинаций J У, atst | az е Л1 является идеалом в А, порожденным множеством S. Множество S называется системой образующих этого идеала. Если идеал имеет конечное число образующих, то он называется конечно порожден- ным. В градуированном случае достаточно рассматривать мно- жества S, состоящие только из однородных элементов; порожден- ные ими идеалы тогда автоматически градуированы. Действитель- но, однородная компонента степени j любой линейной комбинации У также будет линейной комбинацией У где а\к^ — однородная компонента aL степени kt = j — degs, (degs<— степень я,). Поэтому она лежит в идеале, порожденном S. Если градуиро- ванный идеал конечно порожден, то у него есть конечная система однородных образующих: она состоит из однородных компонент элементов исходной системы. Для упрощения доказательств следует обобщить понятие гра- дуированного идеала и рассмотреть также градуированные модули. Это — последнее из списка нужных нам понятий. 5. Градуированные модули. Модуль М над коммутативным кольцом А, или Л-модуль, — это аддитивная группа, снабженная операцией А\М->-М: (a, которая ассоциативна ((ab)m = a(bm) для всех a, b^A, т^М) и дистрибутивна по обоим аргументам: (а + b) т — ат + bm, a (m + n) = ат + ап. Кроме того, мы требуем, чтобы 1 т = т для всех т е М, где 1 — единица в А. Если А — поле, то М — просто линейное пространство над Л; можно сказать, что понятие модуля является обобщением понятия линейного пространства на случай, когда скаляры образуют лишь кольцо (см. Введение в алгебру, гл. 9, § 3). Если А — градуированная ^-алгебра, то градуированным A-модулем М мы назовем Л-модуль, являющийся градуированным оо линейным пространством над Ж, М = и такой, что AtMf cz Ml+I для всех i, j 0. Примеры: а) А является градуированным Л-модулем. б) Любой градуированный идеал в А является градуирован- ным Л-модулем. Если М— градуированный Л-модуль, то любое градуированное подпространство N cz М, замкнутое относительно умножения на элементы А, само является градуированным Л-модулем — подмо- дулем М. По любой системе однородных элементов 5 cz М можно 248
построить порожденный ею градуированный подмодуль, состоящий из всех конечных линейных комбинаций У, azsz, а, еЛ, sz е S. Если он совпадает с М, то S называется однородной системой образую- щих ЛЕ Модуль, имеющий конечную систему образующих, назы- вается конечно порожденным. Если градуированный модуль имеет какую-нибудь конечную систему образующих, то он имеет и конеч- ную систему однородных образующих: однородные компоненты элементов исходной системы. Рассмотрение всевозможных модулей, а не только идеалов, в нашей задаче дает большую свободу действий. Умножение на эле- менты а е А в фактормодуле вводится формулой а (т -J- N) = ат -]- N. В градуированном случае градуировка на М/N определяется преж- ней формулой — Mt/Ni. Корректность определения прове- ряется тривиально. Элементы теории прямых сумм, подмодулей и фактормодулей формально не отличаются от соответствующих результатов для ли- нейных пространств. Теперь мы можем приступить к доказательству основных ре- зультатов этого параграфа. 6. Теорема. Пусть М — произвольный конечно порожденный мо- дуль над кольцом многочленов A(n) — Jf[x0, ..., хп] от конечного числа переменных. Тогда любой подмодуль NczM конечно по- рожден. Доказательство. Мы разобьем его на несколько шагов. Стандартная терминология: модуль, каждый подмодуль кото- рого конечно порожден, называется нётеровым (в честь Эмми Нётер). а) Модуль М нётеров тогда и только тогда, когда любая беско- нечная цепочка возрастающих подмодулей M\cz М2 cz ... в М ста- билизируется-. существует такое а0, что Ма — Ма+\ для всех а а0. оо В самом деле, пусть М нётеров. Положим N= [J Mt. Пусть i=l П\, ..., nk — конечная система образующих в N. Для каждого 1 гС j k существует i(/) такой, что п^Мщу Положим п0 = с= max{i(j) |j = 1, ..., k}. Тогда Ma содержит пх, ..., nk для всех а а0 и потому Ма = N. Наоборот, пусть любая возрастающая цепочка подмодулей в М обрывается. Будем строить систему образующих подмодуля N cz М индуктивно: в качестве «| еА' возьмем любой элемент; если П\, ..., ni^N уже построены, обозначим через M,czN порожден- ный ими подмодуль и при N М, выберем nz+1 из /V\MZ. Этот процесс оборвется через конечное число шагов, иначе цепочка Mt с? ... cz Mi cz ... не стабилизировалась бы. б) Если подмодуль NczM нётеров и фактормодуль М/N нёте- ров, то М нётеров-, верно и обратное. 249
Действительно, пусть Mj cz М2 cz ... — цепочка подмодулей в М. Пусть Оо таково, что обе цепочки Мх П N' cz М2 П N cz ... и (Mi + N)/N cz(M2 + W)/M cz ... стабилизируются при a a0. Тогда и цепочка ЛД cz M2 cz ... стабилизируется при а ао. Обратное утверждение очевидно. в) Прямая сумма конечного числа нётеровых модулей нётерова. п Действительно, пусть М = фЛД, М{ нётеровы. Проведем г=0 индукцию по п. Случай п = 1 очевиден. При п 2 модуль М со- держит подмодуль, изоморфный Мп, с фактором, изоморфным п-1 ф М/. Оба этих модуля нётеровы, так что М нётеров в силу б). 1-0 г) Кольцо Д(п) нётерово как модуль над самим собой. Иными словами, любой идеал в Л(и) конечно порожден. Это — основной частный случай теоремы, установленный впер- вые Гильбертом. Доказывается он индукцией по п. Случай п = —1, т. е А^—Ж, очевиден. В самом деле, любой идеал I в поле Ж совпадает либо с {0}, либо с Ж\ если а^1, а =/= 0, то Ь — = (6а-1)ае/ для всех Ь^Ж. Индуктивный шаг основан на рас- смотрении А(п) как [х„]. Пусть /<п) cz Л(п) — идеал. Предста- вим каждый элемент из /<”> как многочлен по степеням хп с коэф- фициентами из Множество всех старших коэффициентов таких многочленов есть идеал /<"-*> в /К"-1). По предположению индукции он имеет конечное число образующих <pb ..., <pm. К каж- дой образующей <р,- подберем элемент /; = ф,^‘+ ••• из /<">, где многоточием обозначены члены низших степеней по х„. Положим d= max {dt}. Многочлены Д, ..., fm порождают в Л(п) некото- рый идеал I cz /(п). Пусть теперь f — <pxs + (члены низших степеней) — любой эле- мент из /(я). По определению <p е /(я-1), так что <р = ocjtpi + ... ... ar!lq>m. Если s d, то многочлен f—^aiftXs dl принадле- жит /(я) и его степень < s. Действуя аналогичным образом, полу- чим в результате выражение f = g-}~h, где йе/, a g— многочлен из /(п) степени, меньшей d. Все многочлены из /(я) степени < d образуют подмодуль J в Д<я_,)-модуле, порожденном конечной системой {1, хп, ..., х^-1]. В соответствии с предположением индукции о нётеровости и с утверждением в) подмодуль 7 конечно порожден. Мы доказали, что /(я) = 14~ J— сумма двух конечно порожден- ных модулей. Поэтому идеал /(я) конечно порожден. Теперь мы можем без труда завершить доказательство теоремы. Пусть модуль М над Л(я) имеет конечное число образующих mi, mx- Тогда имеется сюръективный гомоморфизм Д(я)-модулей k Л(П) © ... е Д(«> -> М: (fl..fk) X fim‘- ’—— ----------- <-1 А раз 250
Модуль А(">® ... ФЛ(П) нётеров в силу г) и в). Следовательно (см. б)), его фактормодуль М нётеров. 7. Следствие. Любая бесконечная система уравнений Ft — О, ieS, где F, — многочлены в Aw, эквивалентна некоторой своей конечной подсистеме. Доказательство. Пусть 1 — идеал, порожденный всеми F,-. Он имеет конечную систему образующих {G/}. Рассмотрим такое конечное подмножество So с: S, что все Gj линейно выражаются через F,, i^S0. Тогда система уравнений F, = 0, ieS(i, эквива- лентна исходной, т. е. имеет то же самое множество решений. 8. Многочлены Гильберта и ряд Пуанкаре градуированного модуля. Пусть теперь М — градуированный конечно порожденный модуль над кольцом Л(п). Тогда все линейные пространства MkczM конечномерны над Ж. Действительно, если {а,} — однородный JJf-базис йоп)+ .. • + Л'б’ и {пг,} — конечная система образующих М, то Mh как линейное пространство порождено конечным числом элементов с deg а,- + deg пг, = k. Положим dk(M) — dimMfc. Формальный степенной ряд от пере- менной t оо Ям(0=Е dk{M)tk k=0 называется рядом Пуанкаре модуля М. 9. Теорема, а) В условиях предыдущего пункта существует та- кой многочлен f(t) с целыми коэффициентами, что б) В тех же условиях существует такой многочлен P(k) с ра- циональными коэффициентами и такое число N, что dk (М) — Р (k) для всех N. Доказательство. Выведем сначала второе утверждение из N первого. Положим f(f)~ У, аф1 и приравняем коэффициенты при tk в правой и левой частях тождества Нм (/) = /(/)(! — О"(и+1). оо Получим, учитывая, что (1 —1)~(n+1) == ( п + k ) tk‘. k=0 N) <»*(«) = £ /-0 При k~^ N выражение справа есть многочлен от k с рациональ- ными коэффициентами. 261
Теперь индукцией по п докажем утверждение а). Удобно поло- жить Л(-|,= Ж = Ло-1); Л/~|> = {0) для t 1. Конечно порожден- ный градуированный модуль над Л<-1>— это просто конечномерное векторное пространство над Ж, представленное в виде прямой N N суммы X Mk. Его ряд Пуанкаре есть многочлен У так А=1 Г=0 что результат тривиально верен. Пусть теперь он доказан для Л(л-1), и 0; установим его для Л(л). Пусть М — конечно порожденный градуированный модуль над Л(л). Положим Л' = {т е М | хпт = 0}, С — М/хпМ. Очевидно, К и хпМ суть градуированные подмодули М\ поэтому С также имеет структуру градуированного Л<л>-модуля. Но умноже- ние на хп аннулирует как К, так и С. Поэтому, если мы рассмотрим К и С как модули над подкольцом А («-о = Ж[хо, ..., хи_1]с: cz Л<л> = 3f[xo, ..., Хп], то любая система образующих для них над Л(л) будет в то же время системой образующих над Л*"-1). По теореме п. 6 К конечно порожден над Л(л> как подмодуль конечно порожденного модуля. С другой стороны, С конечно порожден над Л<">, потому что если mi, ..., тр порождают М, то Ш\-\- хпМ, ... ..., тр + хпМ порождают С. Следовательно, К и С конечно по- рождены над Л'”-1), и к ним применимо индуктивное предположе- ние. Из точных последовательностей линейных пространств над Ж'. хп 0 — Кт~>Мт~^Мт+1~>Ст+1->0, т^О, следует, что dim Mm+i — dim Мт = dim Ст+1 — dim К,„. Умножив это равенство на tm+l и просуммировав по т от 0 до оо, получим Нм (/) — dim Af0 — tHM (t) == Hc (t) — dim Co — tHK (t), или по индуктивному предположению для К и С f„ (0 if* (0 (1 — t) Нм (0 = dim Af0 — dim Co + ~ (1* Z)n . где fc(t) и — многочлены с целыми коэффициентами. Оче- видно, отсюда следует требуемое. 10. Размерность и степень алгебраического многообразия. Пусть теперь V cz Рп — некоторое алгебраическое многообразие, которому отвечает идеал 7 (У). Рассмотрим многочлен Гильберта Pv(k) фактормодуля Л(Л)/7(У): Ру (A) = dim Л<й)//а(У) для всех ko. Нетрудно видеть, что Ррп (k) = ( п + k ) , так что deg Ррп (k) = =/г. Поэтому deg Ру Число d= deg Pv называется размер- 252
ностью многообразия V. Представим старший член Pv(k) в виде kd Можно доказать, что е — целое число, которое называется степенью многообразия V. Размерность и степень — важнейшие характеристики «величины» алгебраического многообразия. Мож- но дать их чисто геометрическое определение: если поле Ж алге- браически замкнуто, то d-мерное многообразие степени е пересе- кается с «достаточно общим» проективным пространством Рп~й cz cz Рп дополнительной размерности в точности по е разным точкам. Мы не будем доказывать эту теорему. Заметим в заключение, что после открытия Гильберта около полувека оставался нерешенным вопрос, как следует интерпрети- ровать значения многочлена Гильберта Pv(k) для тех целых зна- чений k, при которых Pv(k) =#= dim lk( V) (в частности отрицатель- ных k). Он был решен лишь в пятидесятых годах с созданием тео- рии когомологий когерентных пучков, когда выяснилось, что при любом k значение Pv(k) есть альтернированная сумма размер- ностей некоторых пространств когомологий многообразия V. Ана- логичная интерпретация была дана многочленам Гильберта любых конечно порожденных градуированных модулей. УПРАЖНЕНИЯ 1. Доказать, что многочлен Гильберта проективного пространства Рп не за- висит от размерности m проективного пространства Рт, в которое Рп вложено: рп CZ Р™ 2. Вычислить многочлен Гильберта модуля где F — форма степени е.
Часть 4. ПОЛИЛИНЕЙНАЯ АЛГЕБРА § 1. Тензорное произведение линейных пространств 1. Последняя часть нашей книги посвящена систематическому изучению полилинейных конструкций линейной алгебры. Основой алгебраического аппарата служит понятие тензорного произведе- ния, которое вводится в этом параграфе и подробно изучается дальше. К сожалению, главные приложения этого формализма ле- жат за пределами собственно линейной алгебры: они относятся к дифференциальной геометрии, теории представлений групп и квантовой механике. Мы лишь вкратце коснемся их в последних параграфах. 2. Конструкция. Рассмотрим конечное семейство векторных пространств L\, Lp над одним и тем же полем скаляров Ж. Напомним, что отображение Ц X ••• Y.LP^L, где L — еще одно пространство над Ж, называется полилинейным, если оно линейно по каждому из аргументов L<=Li, / = 1, ..., р, при фиксирован- ных остальных. Наша ближайшая цель — построить универсальное полилиней- ное отображение пространств £ь ..., Lp. Его образ будет назы- ваться тензорным произведением этих пространств. Точный смысл утверждения об универсальности объяснен ниже, в формулировке теоремы п. 3. Конструкция состоит из трех шагов. а) Пространство Ж. Это множество всех финитных функций на Li X • • • X Lp со значениями в Ж, т. е. теоретико-множественных отображений £i X • • X £Р-*Х, равных нулю во всех точках мно- жества А] X • • • X Lp, кроме конечного числа. Оно образует ли- нейное пространство над Ж с обычными операциями поточечного сложения и умножения на скаляр. Его базисом являются дельта- функции б(/ь ..., 1Р), равные 1 в единственной точке (Zi, ..., Zp)e е £i X • • • X Lp и нулю в остальных. Опуская знак ё, мы можем считать, что Ж состоит из формальных конечных линейных комби- наций семейств (Zi....Zp)e£iX ••• X £₽'• = lp)\atr..ip^ Ж}. Заметим, что если поле Ж бесконечно и хотя бы одно из про- странств Lt не нульмерно, то Ж — бесконечномерное пространство. 254
б) Подпространство По определению оно порождено всеми векторами из Л вида (Л....// + //, .... /₽)- (/о ......../Р) -(/i.l'j, .... /Р). (Zi, ...» alj, lp) — a(li, ..., Ij, ..., Ip), а^Ж. в) Тензорное произведение Ц® ... ® Lp. По определению Lt ®...® Lp = Ц® .. ®lp = (l{, .., /р) + Де Ц®...® Lp, I’. L\X-.. X Lp —> L\ ® ... ® Lp, t (Z1; ..., Zp) == Zj ® •.. ® Zp. Здесь M/Ma — факторпространство в обычном смысле слова. Эле- менты Li® ... ®£р называются тензорами, 1\® ... ® 1Р — раз- ложимыми тензорами. Поскольку семейства (Zj, ...,1Р) составляют базис Л, разложимые тензоры Ц® ... ® 1Р порождают все тен- зорное произведение £] ® ... ® Lp, но отнюдь не являются бази- сом: между ними есть много линейных зависимостей. Основное свойство тензорных произведений описано в следую- щей теореме: 3. Теорема, а) Каноническое отображение t: L1X---XLp->Ll® ...®LP, (1Ъ .... Zp)h->Z,® ... ®lp, является полилинейным. б) Полилинейное отображение t универсально в следующем смысле слова-, для любого линейного пространства М над полем Ж и любого полилинейного отображения s: Li X XLp-^-M су- ществует единственное линейное отображение f: Lj® ... ® Ln-^M такое, что s — f °t. Мы будем кратко говорить, что s проводится через f. Доказательство, а) Мы должны проверить следующие формулы: Zi ® ... ® (Z/ + Z/) ® ... 01Р = = li® ... ®l'l® ... ®1Р-]- h® ... ®l'i® ... ® 1Г, Z] 0 ... ® (alt) ® ... 0 Zp = п (Z] ® ... ® I/ 0 ... 0 Zp), т. е., например, для первой формулы (Zi, •••> Z/-|- I/, •••, lp) -|- Mv, — [(Zi, ..., Z/, ..., Zp) Ло] 4~ + [(/!, ....Zp)+.<o]. Вспоминая определение факторпространства (п. 2 и 3 § 6 ч. 1), и систему образующих подпространства Л о, описанную на шаге б) в п. 2 этого параграфа, немедленно получаем эти равенства из определений. б) Если f вообще существует, то условие s — f°t однозначно определяет значения f на разложимых тензорах: f(Zj® ...®Zp) = fo/(Z1, ..., Zp) = s(Z,.Zp). 255
Поскольку последние порождают Lt ® ... ® Lp, отображение f единственно. Для доказательства существования f рассмотрим линейное отображение gt которое на базисных элементах Л опре- делено формулой Я (Л, .... Zp) = s(Z1.lp), т. е. ^(Ea/1..Jp(Z1, ..., Zp))= £aZ1...Zps(Z1..Zp). Нетрудно убедиться, что cz Ker g. Действительно, g[(/i, ...,zj + z';, .... Zp)-(Zb ....z'/, ...,Zp)-(Zb ...,z; ...,ZP)]= = s(Zi, Z/+ If, Zp) — s(Zi.........11, ..., lp) — — s(li, ...» If, ..., lp) = 0 в силу полилинейности s. Аналогично проверяется, что g аннули- рует образующие JHq второго типа, связанные с умножением одной из компонент на скаляр. Отсюда вытекает, что g индуцирует линейное отображение ft — L]® .. .&Lp-+M (см. предложение п. 8 § 6 ч. 1), для которого f (ll 0 . . . 0 lp) = S (11г . . •, lp). Это завершает доказательство. Теперь мы приведем несколько непосредственных следствий этой теоремы и первые приложения нашей конструкции. 4. Пусть S(Li, ..., Lp; М)—множество полилинейных отобра- жений Li X • • • X АР в Л4. В теореме п. 3 мы построили отображе- ние множеств (Ц.....Lp, М) -> 2 (Li 0 ... 0 Lp, M), ставящее в соответствие полилинейному отображению s линейное отображение f со свойством s — f °t. Но левая и правая части являются линейными пространствами над Ж (как пространства функций со значениями в векторном пространстве М: сложение и умножение на скаляр производится поточечно). Из конструкции очевидно, что наше отображение является линейным. Более того, оно является изоморфизмом линейных пространств. Действительно, сюръективность следует из того, что для любого линейного отобра- жения ft Li® ... 0АР->2И отображение s — f°t полилинейно в силу утверждения а) теоремы п. 3. Инъективность следует из того, что если s #= О, то f ° Z #= 0 и потому f #= 0. Окончательно, мы полу- чили каноническое отождествление линейных пространств Z(Lt, .Lpt M) = g?(Lt® ...®LP\ M). Таким образом, конструкция тензорного произведения пространств сводит изучение полилинейных отображений к изучению линейных 256
отображений путем введения новой операции на категории линей- ных пространств. 5. Размерность и базисы, а) Если хоть одно из пространств L\, Lp нулевое, то их тензорное произведение является ну- левым. В самом деле, пусть, скажем, Lj = 0. Любое полилинейное отображение f: £1 X ••• Х£Р-*-М при фиксированных l,eL, i =/= /, линейно на Lj', но единственное линейное отображение нуле- вого пространства само нулевое. Значит, f = 0 при всех значениях аргументов. В частности, универсальное полилинейное отображе- ние t: L\ X ••• X£₽->£i® ... ® Lp является нулевым. Но его образ порождает все тензорное произведение. Поэтому последнее нульмерно. б) dim(Z.1® ... ®£p) = dim£i ... dim£p. Если хоть одно из пространств нулевое, это следует из преды- дущего результата. В противном случае будем рассуждать так: размерность L\® ... ® £р совпадает с размерностью двойствен- ного пространства SL(L\® ... ® £р, Ж). В п. 4 мы отождествили его с пространством полилинейных отображений S (£] X • •. ... XLP, Ж). Выберем в пространствах £,• базисы {е(Д ..., Всякому полилинейному отображению f- LtX- • -X ЕР~>Ж поставим в соответствие набор из ti\ ... пР скаляров В силу свойства полилинейности этот набор однозначно опреде- ляет /: .......................................ф \ Ч-I р~1 / Кроме того, он может быть произвольным: правая часть последней формулы определяет полилинейное отображение векторов (л/11, ... ..., х(₽>) при любых значениях коэффициентов. Это означает, что пространство полилинейных отображений £i X • • X Lp-^Ж имеет размерность п1 ... np = dim £, ... dim Lp, что завершает доказа- тельство. в) Тензорный базис L\® ... ® £р. Предшествующее рассуж- дение позволяет установить также, что тензорные произведения ® ... ® е'0 образуют базис пространства £i ® ... ®£р (счи- таем, что все пространства £, имеют размерность 1 и, для простоты, конечномерны). В самом деле, эти тензорные произве- дения порождают £: ® ... ® Lp, ибо через них линейно выра- жаются все разложимые тензоры. Кроме того, их количество в точности равно размерности £] ® ... ® Lp. 257
6. Тензорные произведения пространств функций. Пусть S.... ...,SP — конечные множества, F(S()—пространство функций на S,: со значениями в Ж. Тогда имеется каноническое отождествление F(S1X...XSp) = F(SI)®...®F(Sp), которое ставит в соответствие функции 6(S|.s ) элемент 6S| ® ... . ..®6S (см. п. 7 § 1 ч. 1). Поскольку оба этих семейства обра- зуют базис своих пространств, это действительно изоморфизм. Если ft е F(Si), то fi 0 . • • ® fp = Е fi (si) 6Sl) 0 • • • 0 Q E, fP (sP) 6sp) перейдет при этом изоморфизме в функцию («!, .. ., Sp)^ft (S|). . Jp(sD), т. е. разложимые тензоры отвечают «разделяющимся переменным». Если Si= ... =SP = S, то тензорное произведение функций на 5 соответствует обычному произведению их значений «в незави- симых точках 5». Именно в таком контексте тензорные произведения чаще всего появляются в функциональном анализе и физике. Однако алге- браическое определение тензорного произведения подвергается в функциональном анализе существенным изменениям, связанным с учетом топологии пространств; в частности, его обычно прихо- дится пополнять по разным топологиям. 7. Подъем поля скаляров. Пусть L— линейное пространство над полем R,Z.C— его комплексификация (см. § 12 ч. 1). По- скольку поле С можно рассматривать как линейное пространство над R (с базисом 1, i), мы можем построить линейное простран- ство C0L, порожденное базисом 1 0 et, ..., 10е„, 10еь ... ..., i 0 еп, над R, где {еь ..., еп] — базис L. Ясно, что R — линей- ное отображение С®£—>ЛС: 1®е,->— определяет изоморфизм С 0 L с Lc. Более общо, пусть Ж‘ cz К — тюле и его подполе, L — линейное пространство над Ж. Рассмотрев сначала К как линейное про- странство над Ж, построим тензорное произведение К.® L. После этого введем на нем структуру линейного пространства над К, определив умножение на скаляры а е К формулой a(b®l) = ab®il', a,b^K, l^L. Чтобы проверить корректность этого определения, построим про- странство Л, свободно порожденное элементами К X L, и его под- пространство как в п. 2, так что К® L— Л/'Л>}. Определим умножение на скаляры из К в Л, положив на базисных элементах a(b, — /); а,ЬвК, l^L, 258
и распространив это правило на остальные элементы K'/L по Ж-линейности. Непосредственная проверка показывает, что Ж пре- вращается в К-линейное пространство, а Ж^— в его подпростран- ство, так что Ж/Ж^ = /\ ® L также становится линейным простран- ством над К. Это и есть общая конструкция подъема поля скаля- ров, упомянутая в п. 15 § 11 ч. 1. Важный частный случай: при К — Ж линейное пространство Ж ® L над Ж канонически изоморфно L. Этот изоморфизм пере- водит а ® I в al. § 2. Канонические изоморфизмы и линейные отображения тензорных произведений 1. Тензорное умножение обладает некоторыми алгебраическими свойствами операций, называемых умножениями в других контек- стах, например, ассоциативностью. Однако в формулировке этих свойств имеется своя специфика из-за того, что тензорное умноже- ние есть операция над объектами категории. Например, простран- ства (Lt® L2)® L3 и Ll®(L2®L3) не совпадают, как явствует из сравнения их конструкции: они лишь связаны канонически опреде- ленным изоморфизмом. В этом параграфе мы опишем ряд таких «элементарных» изо- морфизмов, очень полезных при работе с тензорными произведе- ниями. Предупредим читателя, однако, что мы вынуждены будем ограничиться лишь введением в теорию канонических изоморфиз- мов. Главный вопрос, систематическое исследование которого мы опустим, состоит в их совместности. Предположим, например, что у нас есть два естественных изоморфизма между некоторыми тен- зорными произведениями, по-разному скомпонованных из не- скольких «элементарных» естественных изоморфизмов. Обяза- тельно ли эти изоморфизмы совпадут? Можно проводить непосред- ственную проверку в каждом конкретном частном случае или попытаться построить общую теорию, которая оказывается до- вольно громоздкой. Аналогичные задачи возникают в связи с естественными ото- бражениями, которые не являются изоморфизмами, например та- кими, как симметризация или свертка. 2. Ассоциативность. Пусть Li, ..., Lp— линейные пространства над Ж. Мы хотим построить канонические изоморфизмы между пространствами вица (Li ® L2) (... ® Lp), получающимися в ре- зультате тензорного умножения ..., Lp группами в разном порядке, который устанавливается расстановкой скобок. Самый удобный способ, автоматически обеспечивающий совместимость, состоит в том, чтобы построить для каждой расстановки скобок линейное отображение L\® ... ® £р->(£] ® L2) (... ® Lp) с по- мощью универсального свойства из утверждения б) п. 3 § 1 и про- верить, что оно является изоморфизмом. Мы подробно рассмотрим конструкцию L\®L2®L3~i-(L\®L2} ® ® L3, общий случай совершенно аналогичен. 259
Отображение L\ X L^-^ L\ ® £2: (Лh ® I2 билинейно. По- этому отображение Lt X £2 X L5-+(L\ ® £2)® L3: (/ь /2, l3) 1—^ 1—>(/] ® /2)® l3 трилинейно. Значит, его можно провести через единственное линейное отображение £, ® £2 ® £3->(£j ® £2)® L3. По самой конструкции последнее отображение переводит Zi®/2®/3 в (/]®/2)®/3. Выбрав в пространствах £ь £2, £3 базисы и вос- пользовавшись результатом п. 5 § 1, получаем, что это отображе- ние переводит базис в базис и поэтому является изоморфизмом. Окончательно: произведение (Lt® L?) (... ® £,,) с любой рас- становкой скобок можно отождествить с £] ® £2 ® ... ® £р, про- сто опустив все скобки-, на элементах (It ® /2) (... ® 1Р) это отож- дествление действует по тому оке правилу. Поэтому мы позволим себе писать (/] ® /2)® /3 — 1\ ® /2 ® /3 = /1 ® (12 ® /3) и т. п. 3. Коммутативность. Пусть о — любая перестановка чисел 1, ..., р. Определим систему изоморфизмов fc' £1 ® • • • ® £р > ) ® . . . ® £р(р) со свойством fat = fa°fz для любых о, т. Для этого заметим, что отображение £1 X • • X Lp—* jOfrti) ® • • • ® £р(р): (£, • • • > 1р)1 * ® • • • ® ^<т(р) полилинейно. Поэтому оно проводится через отображение fa: £1 ® ... ® £р-> £<r(i)® ... ®£р(р) в силу утверждения б) теоремы п. 3 § 1. На произведениях векторов оно действует очевидным об- разом, переставляя сомножители, и рассмотрение его действия на тензорном произведении базисов £ь ..., £р показывает, что это изоморфизм. Свойство fOr = fo°fr очевидно. Таким образом, мы определили действие симметрической груп- пы Sp на ... ® Lp. В случае, когда все пространства £, раз- ные, можно пользоваться изоморфизмами fc для однозначного отождествления £1 ® ... ® £р с £а(П ® ... ® £а(р). В этом смысле тензорное умножение коммутативно. Однако записывать это отож- дествление в виде равенства, не указывая явно fa (как мы делали для ассоциативности), опасно, если среди пространств Lt, .... Lp есть одинаковые. 4. Двойственность. Имеется канонический изоморфизм £i ® ... ® £Р -> (£i ® . • • ® £р) • Чтобы построить его, поставим в соответствие каждому элементу (ft, ..., fp)e £iX-•-X £Р полилинейную функцию (Л) ... fo (/р) от (/], ..., /(;)g£iX ... ~>\LP. В силу утверждения б) теоремы п. 3 это отображение проводится через отображение £|®... ®£р-> (пространство полилинейных функций на Lt X ••• Х£р)- Послед- нее пространство в силу конструкции п. 4 § 1 отождествляется с пространством ,<?(£|@ ... ® Lp, Ж) —(Lt® ... ®£р)*. Таким образом, мы построили искомое отображение. Чтобы показать, что оно является изоморфизмом, заметим, что размерности пространств 260
(Li ® ... ® Lp)* и L* ® ... ® Lp совпадают (мы ограничиваемся конечномерными L(). Поэтому достаточно проверить, что наше отображение сюръективно. Но в его образе содержатся функции fi(li) ... fp(lp), где ft пробегают некоторый базис Li, и, как в п. 5 § 1, нетрудно убедиться, что они образуют базис S (Lb ..., Lp; Ж) = = (L] 0 ... ®LP)*. Отождествление (Lt ® ... ® Lp) c Lj ® ... ® Lp с помощью описанного изоморфизма обычно безобидно. 5. Изоморфизм S{L, TH) с L* 0 7И. Рассмотрим билинейное ото- бражение ГХМ->£(£, М): (/, где f(=L*, I е L, пг е М. Как билинейность выражения f(i)m по f и т, так и его линейность по 1 очевидны. В силу многократно использованного свойства универсальности ему отвечает линейное отображение С ®M-^S(L, М). Выберем в L, М базисы {/ь ..., 1а}, {nit, ..., ть} и в L* — двойст- венный базис {/', ..., /“}. Элемент ll®mj тензорного произведения базисов L*, М переходит в линейное отображение, которое перево- дит вектор lk^L в /‘(Zft)m/= Матрица этого линейного отображения размера b X а имеет единицу на месте (/г) и нули на остальных местах. Поскольку такие матрицы образуют базис X'(L, М), построенное отображение переводит базис в базис и является изоморфизмом. Рассмотрим важный частный случай: L = М. Здесь S(L, = Пространство эндоморфизмов S (L, L) содержит выделенный эле- мент: тождественное отображение id/.. Его образ в L* 0 L, как видно из предыдущих рассуждений, равен £ lk 0 lk, К— : где {lk}, {lk} — пара двойственных базисов в L и L*. Таким обра- зом, формула для этого элемента имеет одинаковый вид во всех парах двойственных базисов. Кроме того, пространство эндоморфизмов S(L, L) снабжено каноническим линейным функционалом следа Tr: S{L, Из прежних рассуждений следует, что след отображения, которое поставлено в соответствие элементу Z‘0Z/, равен б;/ (посмотрите на матрицу), так что общему элементу тензорного произведения L* 0 L ставится в соответствие число « а £ а{1‘ ®/,ь->Х4 i,i=i 1 i=i 261
Этот линейный функционал L* ® L-± Ж называется сверткой. Поз- же мы дадим определение свертки в более общем контексте. 6. Изоморфизм 3?(L®M, N) с 3?(L, 3?(М, N)). Пространство S?(L®M, N) изоморфно пространству билинейных отображений LXM-t- N. Каждое такое билинейное отображение f: (I, пг) при фиксированном первом аргументе I представляет со- бой линейное отображение от I это отображение зависит линейно. Таким образом, получаем каноническое линейное отобра- жение £(L®M, N) = S?(L, М; N)->S?(L, £{М, N)). Рассуждение с базисами в L, М, N, аналогичное проведенному в предыдущем пункте, показывает, что оно является изоморфизмом (как всюду, пространства предполагаются конечномерными). (Это отождествление является важным примером общекатегор- ного понятия «функторов, сопряженных по Кану».) 7. Тензорное произведение линейных отображений. Пусть £ь ... ..., Lp', Mi, Мр — два семейства линейных пространств, fp Li-^Mi — линейные отображения. Тогда можно построить ли- нейное отображение fi ® ... ® fp: Li ® ... ® Lp^Mi ® ... ® Мр, называемое тензорным произведением ft и однозначно характери- зуемое простым свойством (fi ® • • • ® fP)(h ® ... ® /р)= A Ui) 0 ... 0 fp(lp) для всех h е Li. Его существование доказывается все тем же стан- дартным применением утверждения б) теоремы п. 3 § 1, если заметить, что отображение Л, X ... X Lp-> Ml 0 ... 0 Мр. (h, .... Ipf^fi (h) ® ... ® fp(lp) полилинейно. Если все fi суть изоморфизмы, то и fi ® ... ® fp является изо- морфизмом. 8. Свертка и подъем индексов. С помощью этой конструкции мы можем дать общее определение свертки «по паре или несколь- ким парам индексов». Пусть у нас имеется тензорное произведение Li ® ... ® Lp, причем для некоторых двух индексов Z, /е{1,..., р} имеем Lt = L*, £/ = L. Свертка по индексам I, j есть линейное ото- бражение р Л, 0 ... ®LP~> 0 Lk, 1 fe =/= i, / которое получается как композиция следующих линейных отобра- жений: а) Отображение fa, где о — перестановка индексов {1, ..., р}, переводящая i в 1, j в 2 и сохраняющая порядок остальных ин- 262
дексов: / р \ / р fo: Ц<8> •• • ® £,® 0 £fe| = £’®£®( ® Lk \ k=A ) \ /г=1 4fe #= z. / =£ i, ; б) Свертка первых двух множителей, тензорно умноженная на тождественное отображение остальных: / р \ / р £*®£® ® £й1->^®| ® Lk \ \ k = \ k t, / * k it у в) Отождествление p \ p ® Lk ® Lk. fc = i 9 k=\ it j ' t, у Если имеется несколько пар индексов (£, /1), (ir, j,) таких, что Li = Af*, Ljk = Mk, то эту конструкцию можно повторить не- сколько раз в применении ко всем парам последовательно. Резуль- тирующее линейное отображение называется сверткой по этим парам индексов. Оно зависит от самих пар, но не от порядка про- ведения сверток по ним. Может оказаться, что {1, ..., р} — — {£, /1, ..., ir, jr}. Тогда получится полная свертка. Снова рассмотрим тензорное произведение £] ® ... ® Lp и предположим, что для z-го пространства задан изоморфизм £: £(->£t (в приложениях он чаще всего строится с помощью невырожденной симметричной билинейной формы на £,). Тогда линейное отображение id ® ... ® g ® ... ® id: £, ® ... ® £г ® ... ®£р-> -» £] ® ... ® L*i ® ... ® Lp называется «опусканием t-го индекса», обратное к нему—«подъ- емом /-го индекса». Объяснение термина будет дано в следующем параграфе. Обе конструкции, свертки и подъема/опускания индекса, чаще всего применяются в случае £, = £ или £*, когда на £ задана орто- гональная структура. Возникает масса линейных отображений, связывающих пространства £ ®₽®£®‘7, которые строятся как композиции поднятия и опускания индексов и сверток. Эти отобра- жения играют большую роль в римановой геометрии, где с их по- мощью (и с помощью аналитических операций типа дифференци- рования) строятся важнейшие дифференциально-геометрические инварианты. 9. Тензорное умножение как точный функтор. Фиксируем ли- нейное пространство М и рассмотрим отображение категории конеч- номерных линейных пространств в себя: £i—>£®Af на объектах, 263
fi—>f®idw на морфизмах. Из определений легко усмотреть, что idtf—и f ° g f ° g ® idM = (f ® idM) о (g ® idM). Поэтому данное отображение является функтором, который назы- вается функтором тензорного умножения на М. ) £ Покажем, что если последовательность0 —> £] —> L —> L2—> О точна, то и последовательность f ® id/K g ® id^f О -> L1 ® М-------> L® М -------> £2 ® /VI -> О точна. Это свойство называется точностью функтора тензорного умножения. Как и точность функтора S, оно нарушается в катего- риях модулей, и это нарушение служит важным объектом изучения в гомологической алгебре: ср. обсуждение в § 14 ч. 1. Проще всего проверить точность, выбрав в £ь £, £2 базисы, приспособленные к f, g таким образом, что {ei, ..., еа} —базис £ь {f (е,), ..., f(ea); е'а+1, .... е'а+ь} - базис Ц {g (<+1), ..., g (е'а+ь)} - базис £2. Выбрав еще базис [е”, ..., е"} пространства /VI, полу- чим, что тензорные произведения базисов К- ® е"}, (f (е.) ® е', e'k ® д}, {g (e'fc) ® е'} приспособлены к f ® id/;I, g ® 1блг в том же смысле слова. § 3. Тензорная алгебра линейного пространства 1. Пусть L — некоторое конечномерное линейное пространство над полем . Любой элемент тензорного произведения Т£(£) = С ® ... ® L ® £ ® .. ® £ р ч называется тензором на £ типа (р, q) и валентности (или ранга) р + q. Говорят также, что он является смешанным тензором, р раз ковариантным и q раз контравариантным. Первые две части книги фактически были посвящены изучению следующих тензоров ма- лого ранга. а) Удобно положить 7о(£)==.£/>, т. е. называть скаляры тензо- рами ранга 0. б) £?(£)==£, т. е. тензоры типа (1,0) суть линейные функ- ционалы на £. Тензоры типа (0, 1) суть просто векторы из £. в) T\[L) = L ® £, В п. б § 2 мы отождествили £* ® £ с про- странством S (L, L). Следовательно, тензоры типа (1, 1) «суть» линейные операторы на £. г) T?(L) = £ ® £ В п. 4 § 2 мы отождествили £*®£* с (£0£)*, или с билинейными отображениями £Х£->^- Таким образом, тензоры типа (2, 0) «суть» скалярные произведения на £. В п. 5 § 2 мы отождествили £*®£* с S’U**, L*)~S(L, L*). При 264
этом отождествлении скалярному произведению на L ставится в соответствие линейное отображение L->/.*, которое отвечает рас- смотрению этого скалярного произведения как функции от одного из своих аргументов при фиксированном втором. Таким образом, наши тензорные конструкции § 2 обобщают конструкции части 2. д) Приведем еще один пример: структурный тензор ^-алгебры. Здесь мы будем понимать под J^-алгеброй линейное пространство L вместе с билинейной операцией умножения LXL-*L: (/, m)-> -> 1т, не обязательно коммутативной или даже ассоциативной, так что, например, алгебры Ли подходят под это определение. Согласно утверждению б) теоремы п. 3 § 1 умножение можно определить также как линейное отображение L®L~>L. В и. 5 § 2 мы отождествили пространство 3?(L®L, L) с (L®L)*®£ или, пользуясь еще п. 4 § 2 и ассоциативностью, с L* ® L* ® L. Следовательно, задать на пространстве L структуру JSf-алгебры— это все равно, что задать на нем тензор типа (2, 1), называе- мый структурным тензором этой алгебры. 2. Тензорное умножение. В соответствии с п. 4 § 2 мы можем отождествить пространство Tp(L) с (Л®₽®(L )®fl) и затем с про- странством полилинейных отображений f: LX •• • XWX-X^X р « Два таких полилинейных отображения типа (р, q) и (р', q') можно тензорно перемножить, получив в результате полилинейное отображение типа (р -фр', q + q'): (jf®g)(Zb /Р; /ь - /₽'! А, - Zp! /Г, .... Q = = f(lx, lp, /Г, .... /р)Ж .... lp-, I*, .... Q где h, l'j^L, h, It e L . Из этого определения сразу же видна билинейность тензорного умножения по его аргументам: (41 + 4?) ® 2 = a (/, ® g) + b (f2 ® g); f ® (agi + bg2) = a(f ® gf) + b (f ® g2), а также его ассоциативность: (f ® g) ® h = f ® (g ® Zi). Однако оно не коммутативно: f ® g, вообще говоря, не совпадает eg®/. Если не переходить к интерпретации тензоров как полилиней- ных отображений, то тензорное умножение можно определить с по- мощью операций перестановки п. 3 § 2, с учетом ассоциативности, как отображение /0: L* ® ... ® L* ® L ® ... ® L ® L* ® ... ® L* ® L ® ... ® L 1 1 11 I " 11 '1'1 ' 4 I " ' " ' ' I I I I I — I I I ' 'III 141 —Ш... Р q р' o' ® ... ® L*® L® —^—11 H-II1^ . И1ГЧ11— 111^ P+P' q+q' 265
где о переставляет третью группу из р' индексов на места после первой группы из р индексов, сохраняя их относительный порядок и относительный порядок остальных индексов. В этом варианте билинейность тензорного умножения столь же очевидна, а его ассоциативность превращается в некоторое тождество между под- становками, которое читателю легче увидеть самому, чем следить за длинными, но банальными объяснениями. 3. Тензорная алгебра пространства L. Положим оо T(L)= ф TQP(L) р, 9=1 (прямая сумма линейных пространств). Это бесконечномерное про- странство вместе с операцией тензорного умножения в нем, опре- деленной в предыдущем пункте, называется тензорной алгеброй пространства L. Заметим, что над полем комплексных чисел бывает важно рас- сматривать расширенную тензорную_ алгебру, являющуюся прямой суммой пространств <8> L®p ® L*®q'. Например, полу- торалинейная форма на L как тензор лежит в L*®L*. По недо- статку места мы не будем систематически изучать эту кон- струкцию. § 4. Классические обозначения 1. В классическом тензорном анализе тензорный формализм описывается в координатных обозначениях. Ими и сейчас широко пользуются в физической и геометрической литературе, и этому языку следует отдать должное: он компактен и гибок. В этом па- раграфе мы введем его и покажем, как выражаются на нем раз- личные конструкции, описанные выше. 2. Базисы и координаты. Пусть L — конечномерное линейное пространство. Выберем в нем базис {еь ..., еп} и будем задавать п векторы L их координатами (а1, ..., ап) в этом базисе: У, В L* выберем двойственный базис{е1, ..., еп}, (е1, ву) = б)=О при i^=j‘, 1 при i — j, и векторы из L* будем задавать координа- п тами (6Ь ..., 6„): У, Ь,е’. Расположение индексов в обоих слу- /=1 чаях выбирается так, чтобы в суммировании участвовали пары одинаковых индексов, один из которых находится наверху, другой внизу. В C®P®L®4 построим тензорное произведение рассмотрен- ных базисов {е1' ® ... ® е‘р ® ец ® ... ® et 11 < ik < п, 1 < < п]. 266
Любой тензор Т е Тр (£) задается в нем своими координатами 2 h... ip Т = ® ... ®е1р® е/, ® ... ® е, . л—< ij ... 1р • i > q Заметим, что суммирование здесь снова распространено на пары одинаковых индексов, один из которых верхний, другой — нижний. Это настолько характерная черта классического формализма, что зачастую принимается соглашение опускать знак суммы во всех случаях, когда подразумевается такое суммирование. В частности, при этом соглашении векторы из L записываются в виде a’ej, а функционалы в виде 6,е‘. Скалярное произведение между L* и L, т. е. значение функционала bte! на векторе за- пишется a'bi или bia‘. Более того, можно пойти еще дальше по этому пути экономии и ие писать сами векторы а, и е‘. Тогда элементы L записываются в виде а1, элементы L* — в виде bi, а общий тензор Т е Тр (L) — в виде тЬ [ч. Иными словами, в классической записи тензора Т явно указаны-, координаты, или компоненты Т в тензорном ба- зисе L*®p®L®q, пронумерованные как элементы тензорного ба- зиса; номера являются сложными индексами; ковариантная часть индекса (о, ... ,1р) пишется внизу, а контравариантная (/ь ..., jq)— наверху; подразумевается', выбор исходного базиса {щ, ..., еп} в L, по которому строится двойственный базис {е1, ..., еп} в L* и затем тензорные базисы во всех пространствах Tq(L). Иногда удобно рассматривать тензоры, лежащие в пространст- вах, где сомножители L и L* расположены в ином порядке, чем принятый нами, например, L®L* вместо L*®L, или L ® L* ® ® L ® L. Указание на это делается с помощью «блочного располо- жения» сложных индексов у координат тензора. Например, тензор Т е L® L* можно задавать компонентами, которые обозначаются Т{, a T^L®L*®L®L — компонентами Т. . Ч 1213 3. Некоторые важные тензоры. К ним относятся: а) Метрический тензор gq. Согласно нашим обозначениям он лежит в Т°2 (L) и в силу г) п. 1 § 3 может представлять скалярное произведение на L. Его значение на паре векторов а1, Ь' равно ^gifl'b1 или просто gija‘b'. Таким образом, компоненты метриче- ского тензора — это элементы матрицы Грама исходного базиса L относительно соответствующего скалярного произведения. б) Матрица Л/. Это — элемент Т\ (L), т. е., в силу в) п. 1 § 3, линейное отображение L в себя. Оно переводит вектор а1 в вектор с i-й координатой £ Aja’ или просто Л}а . Тензор валентности р + q можно представлять себе в виде «р + ^-мерной матрицы», обычные матрицы плоские. 267
в) Тензор Кронекера 6/. Это элемент Т\ (L), представляющий тождественное отображение L в себя. г) Структурный тензор алгебры. Согласно д) п. 1 § 3 он лежит в Т\ (L) и потому записывается покомпонентно в виде у»/- Он задает билинейное умножение в £ по формуле а1 • Ь1 = ск = у?,а‘7>/. Полная запись: а'е.) 6Ч) = S (Z. Y^'^Q ek- 4. Преобразование компонент тензора при замене базиса в L. Пусть Л‘ — матрица замены базиса в L: е'к — Alkep Bi — матрица перехода от базиса {ек}, двойственного {е*}, к базису {e'k}, двойст- венному {ek}- Нетрудно убедиться, что В — (Л*)”1: эту матрицу на- зывают контраградиентной к А. Координаты а'! в базисе {el} вектора, первоначально задан- ного координатами а1 в базисе {ej, будут B'kak. Аналогично, координаты bt в базисе {eri} функционала (или «ковектора»), первоначально заданного координатами bi в базисе {е1}, будут A*bk. Чтобы найти координаты Т'1^'"1^ в штрихованном тензорном базисе тензора, первоначально заданного координатами т{' ^’До- статочно теперь заметить, что они Преобразуются так же, как координаты тензорного произведения (/-векторов и р-ковекторов, т. е. = _ AipBK ... В^Т^'--^. '1 ••• 'р ’1 'р Ki % о ••• 'р Не забывайте, что справа подразумевается суммирование по парам одинаковых индексов. В классическом изложении эту формулу кладут в основу опре- деления тензоров. Именно, тензором типа (р, у) на п-мерном пространстве назы- вают отображение Т, которое каждому базису L ставит в соответ- ствие семейство из пр+<1 компонент—скаляров ”' {ч, причем та- кое, что при замене базиса посредством матрицы А замена ком- понент тензора происходит по выписанным выше формулам. 5. Тензорные конструкции в координатах. а) Линейные комбинации тензоров одинакового типа. Здесь формулы очевидны: (аТ + ЬТ'Ъ {ч — аТ!У -+ bfl' - к Ц---1Р б) Тензорное умножение. Согласно определению в п. 2 § 3 (Г 0 Т')^= Т1' ” >q'. ц ••• 1рЦ • «р' Ч ••• ‘р ‘j ••• ‘р' S68
В частности, разложимый тензор имеет компоненты Л. ••• Т/рТ1'... ... т'ч. в) Перестановки. Пусть о — перестановка индексов 1,..., р, т — перестановка индексов 1, 7; fa t : Tp(L)-^Tqp(L) — линейное отображение, отвечающее этим перестановкам, как в п. 3 § 2, Тогда для любого Т ^Tp(L) имеем г) Свертка. Пусть ие{1, ..., р}, 6е{1, ..., q}. Как в п. 8 § 2, имеется отображение Tqp (L)-> Тр-\ (L), «уничтожающее» a-fi множитель L* и 6-й множитель L с помощью отображения свертки L*®L-+№, которое является обычным скалярным произведением векторов и функционалов: (Ы)®{а')у—>Ь1а1. Поэтому, обозначая через Т’ тензор Т, свернутый по паре индексов (а-й нижний, 6-й верхний), получаем Т'Л ••• Ib-db+l = T-'l •" !b-iklb+i ••• !ч ‘i ••• ‘a—1'a+i •" lp '1 la-ik‘a+l •” lp (справа суммирование no k). Итерируя эту конструкцию, получим определение свертки по нескольким парам индексов. Мы уже убедились, что многие формулы тензорной алгебры пишутся в терминах тензорного умножения и последующей свертки по одной или нескольким парам индексов. Повторим их для за- крепления: gl!aibl — свертка ((gZ/) ® (aft) ® (6')). Скалярное произведение: 6(аг — свертка ((6Z) ® (а')). Координаты тензора в новом базисе, или, с «активной точки зре- ния», образ тензора при линейном преобразовании основного про- странства: Г',1 ilQ — свертка ((Л ® ... ®) А) (В ® ... ® ВУ ®Т). । ••• ‘р Умножение в алгебре: а1 • Ь' — свертка ((структурный тензор) ® (а1) ® (6'У. Еще один пример — умножение матриц: (л/) (в0 = (л'4) - свертка (Д' ® В[). Еще раз напомним, что для полного определения свертки следует указать, по каким индексам она производится; в приведенных при- мерах это либо очевидно, либо ясно из приведенных ранее полных формул. В общем, можно сказать, что операция свертки в классическом языке тензорной алгебры играет такую же унифицирующую роль, 269
как операция умножения матриц в языке линейной алгебры. В § 4 ч. 1 мы подчеркивали, что теоретико-множественные опера- ции разной природы единообразно описываются с помощью ма- тричного умножения. К тензорной алгебре и свертке, скомбиниро- ванной с тензорным умножением, это замечание применимо в еще большей мере. д) Подъем и опускание индексов. Согласно определению в раз- деле в) п. 8 § 2 подъем о-го индекса и опускание 6-го индекса — это линейные отображения Tq(L)-+Tqt\(L), Tqp(L)-+TqP+\(L), которые индуцируются некоторыми изоморфизмами g: L*—>L или g->: следует «заменить» в произведении L*®p&)L®q а-п множитель L* на L или соответственно 6-й множитель L на L*. В соответствии с соглашениями в конце п. 2 этого параграфа компоненты полученных тензоров следует записывать в виде Т ‘а. Т. ,!l--!b-l ’b + l-'-iq. '1 ‘а-1 ‘а+1 ” 1Р ’ '1 ”• ‘р Н Если условиться применять после отображения подъема (спуска) индекса отображение перестановки, перегоняющее новый сомножи- тель L направо, a L* налево, пока он не станет соседствовать со старыми сомножителями, то можно сохранить прежний вид записи компонент. Как мы уже упоминали, изоморфизмы g: L*—>L и g~': L-^L* в приложениях чаще всего происходят из симметричной невырож- денной билинейной формы gij на L. Поскольку она сама является тензором, операции подъема и опускания индексов можно приме- нять и к ней. Опишем этот формализм подробнее. Форма gij ставит в соответствие вектору а‘ линейный функ- ционал Координаты этого функционала в двойственном базисе L* суть gija‘ (суммирование по /), или ввиду симметрии gi/al. Иными словами, опускание (единственного) верхнего индекса тензора а‘ с помощью метрического тензора gi, приводит к тензору ai~ gij0-1- Отсюда сразу же получается общая формула для опускания любого числа индексов у разложимого тензора и затем по линей- ности у любого тензора: Т П+1 ••• н — п ' Р 'Т, . В частности, мы можем воспользоваться ею для вычисления тензора gi!, получающегося из Цц подъемом индексов. Действи- тельно, Q. gii = gikgiiSitl- 270
Прочтем здесь правую часть как формулу для (i, /)-го элемента матрицы, получающейся умножением матрицы (gift) на матрицу gjiSkt^- Так как слева также стоит матрица (gik), очевидно, gltgkl = &/> т. е. матрица (gkt) обратна к матрице (gij) (учесть симметрич- ность). Это же вычисление показывает, что g{ есть тензор Кро- некера. Поэтому общая формула для подъема индексов имеет вид 7’. { ‘ь+i ••• Vi ••• !<i — g‘T+i‘b+i . . _ £Р1рр. Если мы хотим опустить (соответственно поднять) другие на- боры индексов, формулы очевидным образом видоизменяются. § 5. Симметричные тензоры 1. Пусть L — фиксированное линейное пространство и T^(L) = = L® ч, q 1. В п. 3 § 2 мы показали, что кажд-эй перестановке о из группы S9 перестановок чисел 1, ..., q можно поставить в соот- ветствие линейное отображение fa : Т% (L) -► Eg (L), которое дейст- вует на разложимых тензорах по формуле fa (Л ® ® /q) == /а(1) ® • О Назовем тензор Т <=Tq(L) симметричным, если fa(T)= Т для всех о е Sq. Очевидно, симметричные тензоры образуют линейное под- пространство в Tq0(L). Все скаляры удобно считать симметрич- ными тензорами. При отождествлении из г) п. 1 § 3 симметричные тензоры из T2(L*) отвечают симметричным билинейным формам на L. Обозначим через Sq(L) подпространство симметричных тензо- ров в Tq(L). Мы построим сейчас проектор S: T^(L)->-T'-t(L), образ которого будет совпадать с Sq(L), предполагая, что характе- ристика основного поля равна нулю или хотя бы не делит q\. Он называется отображением симметризации. В классических обозна- чениях вместо S(T) пишут Т^11о>. 2. Предложение. Положим S = ?F £ fa (/-)-> aeS9 Тогда S2 — S и Im S = Sq(L). Доказательство. Очевидно, результат симметризации вся- кого тензора симметричен, так что ImScrS^(L). Наоборот, на симметричных тензорах симметризация является тождественной операцией, так что если Т ^Sq(L), то Т — S(T). Это показывает одновременно, что lmS = S’(L) и что S2 = S. 27 Ь
3. Пусть {еь еп}— базис пространства L. Тогда разложи- мые тензоры ei{ ® ... ® образуют базис (L), а их сим- метризации 5(6^® ... ® порождают S4(L). Введем обозна- чение S(et[® ... ®%) = ег, ... eiq. Формальное произведение е1{ ... eiq не меняется при перестановке индексов, и можно условиться выбирать в качестве канонической записи таких симметричных тензоров запись где щ О, Oi + ... +an = q; здесь число щ показывает, сколько раз вектор Ci фигурирует в et[ ® ... ® 4. Предложение. Тензоры е S5 6 7 * 9 (L), at + ... -|- ап = q, образуют базис в пространстве Sq(L), которое, таким образом, можно отождествить с пространством однородных многочленов степени q от элементов базиса L. Доказательство. Мы должны лишь проверить, что тензоры ... е“п линейно независимы в (L). Если °> то S (У. Са,... ап ei_®> • • • ® в, ® ... ® еп ® ... ® ед) = 0. Собирая в левой части подобные члены, нетрудно убедиться, что коэффициентами при элементах тензорного базиса пространства T„(L) окажутся скаляры са{...ап, умноженные на целые числа, состоящие из произведений простых чисел q. Поскольку харак- теристика Ж по предположению больше q\, из равенства нулю этих коэффициентов следует, что все са1...ап равны нулю. 5. Следствие, dim S4 (L) — ( ” 1 ) . оо 6. Положим S (L) — S4 (L). В силу предложения п. 4 S(L) 9 = 1 можно отождествить с пространством всех многочленов от эле- ментов базиса L. На этом пространстве имеется структура алгебры, умножением в которой является обычное умножение многочленов. Однако сразу, возможно, не ясно, не зависит ли это умножение от выбора исходного базиса. Поэтому мы введем его инвариантно. Поскольку ниже приходится рассматривать все Sq(L) одновре- менно, мы считаем, что характеристика Ж равна нулю. 7. Предложение. Введем на пространстве S(L) билинейное ум- ножение по формуле Т(Г^8Ц\®Т2), fe=Sp(L), g^S4(L). Оно превращает S(L) в коммутативную ассоциативную алгебру над полем Ж. В представлении симметричных тензоров в виде 272
многочленов от элементов базиса L это умножение совпадает с умножением многочленов. Доказательство. Проверим сначала, что для любых тен- зоров T\^Tq(L), Tz^To(L) имеет место формула S (S (Ту) ® Т2) = S (7\ ® .5 (Т2)) = S(7\® Т2). В самом деле, $(Л)® Т2 = ± £ /о(7'1)®Г2, откуда 5($(Л)® T'2) = 7f X 5^(Л)®7'2)- a<=Sp Но S(fa(Ti)® T2) = S(Tt ® Т2) для любых oeSp. Это очевидно для разложимых тензоров Т\, Т2 и следует для остальных по ли- нейности. Поэтому сумма справа состоит из р\ слагаемых S(T\®T2), так что S(S (7’1)®7’,) = S(7’1®7’2). Аналогично устанавливается второе равенство. Отсюда легко вывести, что на симметричных тензорах опера- ция (Т{, T2)v-^S(Ti®T2)=T\T2 ассоциативна. Действительно, (7’17’2) Т3 = S (S (7\ ® Т2) ®T3) = S (Tt ®Т2® Т3) и аналогично 7\ (Т2Т3) = S(7\® S (Т2 ® Г3)) = S (Г, ® Т2 ® Т3). Кроме того, она коммутативна: формула S(7\ ® Т2) = S(T2 ® Tt) очевидна для разложимых тензоров и следует для остальных по линейности. Из этих утверждений следует, что • • • <”)(^* • • • епП) = <‘+6' • ‘ • <П+ЬП> что завершает доказательство. 8. Построенная выше алгебра S(L) называется симметрической алгеброй пространства L. Элементы алгебры S(L*) можно рассматривать как полиноми- альные функции на пространстве L со значениями в поле эле- менту f е L* ставится в соответствие он сам как функционал на L, а произведению элементов в S(Z.*) и их линейной комбинации — произведение и линейная комбинация соответствующих функций. Не вполне очевидно, что разные элементы S(Z,*) различаются так- же как функции на L. Мы оставляем этот вопрос читателю в ка- честве упражнения. Для симметрических алгебр над конечными полями, которые мы введем ниже, это уже не так: например, функ- ция хр— х тождественно равна нулю в поле Ж из р элементов. 273
9. Второе определение симметрической алгебры. В принятом нами определении симметрической алгебры с помощью оператора S используется деление на факториалы. Это невозможно над по- лями конечной характеристики и в теории модулей над кольцами, где формализм тензорной алгебры также существует и весьма по- лезен. Поэтому мы вкратце опишем другое определение симметри- ческой алгебры пространства L, в котором она реализуется не как оо подпространство, а как фактор пространство Z’o(L) = ®7'o (L). р=0 Для этого рассмотрим двусторонний идеал 7 в тензорной ал- гебре To(L), порожденный всеми элементами вида T-fo(T), T^TP(L), aeSp> р=1, 2, 3, ... Он состоит из всевозможных сумм таких тензоров, слева и справа тензорно умноженных на любые элементы T'o(L). Нетрудно видеть, оо что I — ф 1Р, где IP = I (L), т. е. этот идеал градуирован. Положим S(L) = TO(L)/1 как факторпространство. То же рассуждение, что в § 11 ч. 3, по- казывает, что S(L) = ®SP(L), Sp(E) — Tq(L)/Ip. р-0 Благодаря тому, что 7—идеал, в S(L) можно ввести умножение по формуле (7’1 + 7)(7’2 + 7) = 7’1®Г2 + /. Оно билинейно и ассоциативно, так как это верно для тензорного умножения. Кроме того, оно коммутативно, ибо если 7\, Т2 разло- жимы, то Т2 ® Т\ = fa(Ti ® Т2) для подходящей перестановки о и, значит, Ti®T2—Т2®Т\^1. Таким образом, S(T) есть ком- мутативная ассоциативная J^-алгебра. Можно показать, что есте- ственное отображение L-+S (L): I ь—> I + 7 является вложением и что в терминах любого базиса пространства L элементы S(L) одно- значно представляются как многочлены от этого базиса. Элементы SP(L) отвечают однородным многочленам степени р. Если характеристика Ж равна нулю, то сквозное отображение S(L)-»T0(L)-»S(L) является изоморфизмом алгебр, сохраняющим градуировку. По- скольку S(L) существует в более общей ситуации, для алгебраи- ческих нужд симметрическую алгебру удобно вводить именно та- ким способом. 274
§ 6. Кососимметричные тензоры и внешняя алгебра линейного пространства I. В той же ситуации, что и в п. 1 § 5, назовем тензор Т е е 7"’ (L) кососимметричным (или антисимметричным), если fa(T) = = е(о)7’, где е(о)— знак перестановки а, для всех Оче- видно, кососимметричные тензоры образуют линейное подпростран- ство в Тд (L)- Все скаляры удобно считать одновременно кососим- метричными и симметричными тензорами. При отождествлении из г) п. 1 § 3 кососимметричные тензоры из Тд [L*) отвечают симплек- тическим билинейным формам на L. Обозначим через Л’(£) подпространство кососимметрических тензоров в Тд (L). По аналогии с § 5 построим линейный проектор А: Тд (L) -> Тд (L), образ которого совпадает с Л^Л). Как и там, мы предполагаем пока, что характеристика поля скаляров не де- лит q\. Проектор А будет называться антисимметризацией или альтернированием. В классических обозначениях вместо А(Т) пи- шут г!’1 2. Предложение. Положим Тогда А2 = А и Im А = Л’ (L). Доказательство. Прежде всего проверим, что результат альтернирования всякого тензора кососимметричен. Действитель- но, поскольку fo и е(а) мультипликативны по а и е(а)2 = 1, имеем = £ е(т)/т(гЛ = А- £ е(т)ЦГ) = \ Tt&Sq J = £ е (°т) fov(T) = 8 (а) АТ. Далее, А является проектором, потому что ^2 = '(?0г £ = £ е(РПр = ^- peSq Действительно, любой элемент р ровно q\ способами можно представить в виде произведения от: о выберем любым, т находим из равенства т = о^р. Отсюда, как в предложении п. 1 § 5, следует, что Im Л = Л9(Ь). 3. Пусть {ei, ..., еп}—базис пространства L. Тогда разложи- мые тензоры et] ® ... ® образуют базис T^(L), а их антисим- метризации А (е1( ® ... ® порождают №(L). Введем обозна- чение A (eZ) ® ... ® eZ(?) = е1} Л • - • Л (значок Л называется символом «внешнего умножения»). 275
Заметим теперь, что в отличие от симметрического случая пе- рестановка любых двух векторов в Л • Лб меняет знак этого произведения, ибо этот тензор антисимметричен. Отсюда сле- дуют два вывода: а) eZ| Д ... Де< =0, если ia = ib для некоторых а, Ь, при условии, что char Ж ф 2. б) Пространство №(L) порождено тензорами вида eZi д ... ...Де,, где 1 < i2 < ... < iQ п. Отсюда, в частности, я сразу же следует, что Л"1 (L) = 0 при пг > п = dim L. Следующий результат параллелен предложению п. 4 § 5. 4. Предложение. Тензоры е^ Д ... Д eZp е A4 (L) при ys^n, 1 ii < ii < < iq п образуют базис пространства A.q(L). Доказательство. Нужно только проверить, что эти тен- зоры линейно независимы в Tq(L)- Если Л - Лег<7 = 0, то ® ... ®eZp) = 0. Но так как среди индексов ц, ..., i, нет одинаковых и они распо- ложены в порядке возрастания, в результате их перестановок мы получим в сумме слева линейную комбинацию различных элемен- тов тензорного базиса Т% (L) с коэффициентами вида ±~р cz, . Эта сумма может быть равна нулю, только если все с, ... 1 левые. ’ lq' ну- 5. Следствие, dim Л17 (L) = ( ), dim ф Д'5 6 7 (L) — 2п. хч ' 9-о п 6. Положим A(L) =фЛ,(£). По аналогии с симметрическим случаем введем на пространстве антисимметрических тензоров опе- рацию внешнего умножения и покажем, что она превращает Д(Л) в ассоциативную алгебру, называемую внешней алгеброй, или алгеброй Грассмана, пространства L. 7. Предложение. Билинейная операция Tt /\ Т2= A (Т, ® Т2); Ti <= Лр (L), Т2е Д'7(£), на A(L) ассоциативна, Л Т2^ Lp+q(L), и Т2 АД = (—Д Т2 (это свойство иногда называют косокоммутативностью). |П/2] В частности, подпространство Л+ (L) — ф Л29 (L) является ?=о центральной подалгеброй Л(Е). Доказательство. По аналогии с симметричным случаем проверим сначала, что для всех Ti^Tq(L), T2sTq(L) имеют ме- 276
сто формулы А (Л (Л) 0 Т2) = A (Tt 0 А (Т2)) = А (Тг 0 Г2). В самом деле, A(Ti)®T2~ £ e(<y)fa(Ti)®T2, aeSp откуда A(A(Ti)® Т2) = £ e(<f)A(fo(Tt)® Т2). oeSp Рассмотрим вложение Sp-+Sp+q, >5, где ~/Л_ При (У (/) \ ф . U при I > р. Очевидно, fa (Ti) 0 T2 = fe{Ti 0 Тг), кроме того, А и fg коммути- рует, так что Afg (Ti 0 Тг) = fgA (Ti ®Тг) = г (б) A (Ti ®Тг) = ь (a) A (Ti ® Тг). Поэтому Д(Л(Т1)0Т2) = -1- £ е2(о)А(7’,07’2) = А(7’1®7’2). aeSp Аналогично доказывается второе равенство. Теперь ассоциатив- ность внешнего умножения можно проверить так же, как в сим- метричном случае: (Ti Д Т2)/\Т3 = A (A (Ti 0 Т2) 0 Т3) = A (Ti ®Т2® Т3), Тх Л (Т2 /\ Т3) = А (Т, 0 А (Т2 0 Т3)) = A (Ti ® Т2 0Г3). Равенство A (Tt 0 Т2) = (- 1)PQ А (Т2 0 Tt) при Ti <= Гр (L), Тг е Tq0(L) следует из того, что Т2 0 Ti = fa(Ti ® Тг), где о — перестановка, являющаяся произведением pq транспозиций: сомножители Т2 сле- дует по очереди переводить левее Ti, меняя их местами с левыми соседями из Ть 8. Второе определение внешней алгебры. Как и в симметри- ческом случае, принятое нами определение внешней алгебры стра- дает тем недостатком, что оно требует деления на факториалы. Второе определение, избавленное от этого недостатка и реализую- щее А (Л) как факторпространство, а не подпространство T0(L), строится в полной аналогии с симметричным случаем. Рассмотрим двусторонний идеал J в алгебре Ta(L), порожден- ный всеми элементами вида T-E(o)fc(T), T^TPO(L), u<=Sp, р=1, 2, 3, ... оо Нетрудно убедиться, что 7 = ф/р, где Jp = J f|Тд (L), т. е. это р=0 277
градуированный идеал. Положим A(L)—T0(L)/J как фактор- пространство. Тогда оо Л(7.) = ®ЛР(£), Лр(7.) = Г0р(7.)/7р. р=0 Поскольку J — идеал, в Л (7.) можно ввести умножение по формуле (Г1 + /)Л(7'2 + /)=7'1®7'2 + /. Оно билинейно и ассоциативно, так как это верно для тензорного умножения. Кроме того, оно косокоммутативно, ибо для Ti е Го (L), T2^To(L) имеем Г1®Г2— (—1)Р9Г2 ® Tj е 7. Нетрудно убедиться, что построенная таким образом алгебра изоморфна алгебре Клиффорда пространства L с нулевым ска- лярным произведением, введенной в § 15 ч. 2. Действительно, ото- бражение о: L-*A(L), /4-7, удовлетворяет условию о(1)2— = а(/)Ла(/) = 0 для всех /, ибо а(/)Ла(/) = —а(/)Ла(/). По- этому по теореме п. 2 § 15 ч. 2, существует единый гомоморфизм Jif-алгебр С(£)->Л(7,) такой, что а совпадает с композицией L С (L) Л (7,), где р — каноническое отображение. Поскольку L порождает T0(L) как алгебру, a(L) порождает Л(£), так что C(7.)->A(L) сюръективен. Мы знаем, что dimC(7,) = 2n. Поэтому для проверки того, что это изоморфизм, достаточно убедиться, что dim Л (L) =2". Это можно сделать, установив, что базис A’(L) образует элементы вида А ... Д eI(?, 1 й < ... < iq п, где {ei, ..., еп} —базис L. Эту проверку мы опустим. Как и в симметричном случае, если характеристика Ж равна нулю, сквозное отображение Л (7.)->Г0 (L)-> Л (7.) также является^ изоморфизмом алгебр, сохраняющим градуировку. Поскольку Л(7.) определена в более общей ситуации, для алге- браических нужд внешнюю алгебру вводят именно таким спосо- бом. В приложениях к дифференциальной геометрии или анализу, где Ж = R или С, можно пользоваться нашим исходным опре- делением. 9. Внешнее умножение и определители. Пусть L — п-мерное пространство. Согласно следствию п. 5 пространство Л" (7.) одно- мерно: это максимальная ненулевая внешняя степень L. Согласно п. 7 § 2 любой эндоморфизм f: индуцирует эндоморфизмы тензорных степеней f®p = f ® ® f: Гр (7.) -> Гр (L). р Легко убедиться, что f® р коммутирует с оператором альтерниро- вания А и потому переводит ЛР(Г) в Лр(7,). Ограничение /® р на 278
Ap(L) естественно обозначить /Ар В частности, при р — п отобра- жение /л р : Л" (L) -> Лп (£) должно быть умножением на скаляр d(f), ибо An(L) одномерно. 10. Теорема. В описанных обозначениях d(f) = Aetf. Доказательство. Выберем базис ei..........вп пространства L и зададим f матрицей в этом базисе: Внешнее произведение щ Л ... Л еп является базисом Лп(£), и число d(f) находится из равенства fAn(eiA ••• Л e„) = d(f)e1 Л ••• Л еп. Но /Лп(е,А Ae„) = ^(f(ei)® ... ®f(en)) = f(ei)A ... Af(e„) = = ( Z a\'et ) Л • • • Л ( Z а^е. Y Согласно таблице умножения во внешней алгебре а'е, /\ а122 е. Д ... А = 1 *1 12 п П Се (сг)сгр ... а'«е( Л ... Д еп, если {/,, .... i, J = {1, •.., п}, (0 в остальных случаях, где о — перестановка, переводящая Д в k, 1 k п. Поэтому полная сумма коэффициентов е (о) a't' ... совпадает со стан- дартной формулой для определителя det (а)), что завершает до- казательство. 11. Следствие. Векторы е{, ..., e'n^L линейно зависимы тогда и только тогда, когда е\ Д ... Д е'п = 0. Действительно, пусть f: L-+L — эндоморфизм, переводящий е(- в е\, где (et...еп} — некоторый базис L. Тогда линейная за- висимость {ejj равносильна тому, что det f = 0, т. е. е\ Д ... Д е'п = = 0. 12. Разложимые р-векторы. Элементы Т'еЛ'Д) принято на- зывать р-векторами. Назовем р-вектор Т разложимым, если су- ществуют такие векторы щ, ..., ер е L, что Т = щ Л ... А ер. Для любого р-вектора Т назовем его аннулятором множество Ann Т — {е е L | е Д Т = 0}. Очевидно, Ann Т является подпространством в L. 13. Теорема. Пусть Т{, Т2 — разложимые р-вектор и q-вектор соответственно, L\, L2 — их аннуляторы. Тогда 279
) Д е2 Д ... Д еп = 0. a) L\ zd L2 в том и только о том случае, когда Тх делится на Т2, т. е. Т{ = Т Л Т2 для некоторого Те Ap-?(L). б) Li П Ь2 — {0} в том и только в том случае, когда Тх в) Если Lt П Е2 = {0}, то Lx + L2 = AnnfT] Л Т2). Доказательство, а) Если хЛ7'2 = 0, то хЛ(ТАТ^= = ±Т /\(х /\Т2)= 0, так что из делимости Тх на Т2 следует, что L2c Lx. Для доказательства обратного утверждения вычислим аннуля- тор р-вектора ех Л ... Л ер. Если е\, ..., ер линейно зависимы, то один из векторов е{, скажем ех, линейно выражается через осталь- ные, и тогда е, Д ... Д ер = (g а'е,- Будем считать, что ех Л ... Лер отличен от нуля, и покажем, что тогда Ann (в] Л ... Л еР) совпадает с линейной оболочкой векто- ров ех, ..., ер. Ясно, что эта линейная оболочка содержится в анну- ляторе, ибо е, А (ех А ... Дер) = = ± (е, A ef) А fa Л • • • Л е^ Л е/+1 Л ... Л ер) = 0. Дополним линейно независимую систему векторов {ej, ..., ер} до базиса {ех, ..., ер, еР+1, ..., еп} пространства L и покажем, что п если У alet е Ann fa Д ... Д ер), то а1 = 0 при 1> р. В самом деле, Ql «Ч) Л fa Л ... Аер)= , alet Д е2 А •.. Л ер, и (р -J- 1) -векторы ei Л ех Л ... Л ер, р + 1 t и, линейно не- зависимы. Пусть теперь Lx о L2, Тх = ех Л ... Лер, Д ... Д е'. Так как линейная оболочка {е', ..., e'q} содержится в линейной оболочке {еь ..., ер}, мы можем выбрать в ней базис вида fa, ..., e'q, е'+1, ..., ер) и выразить е/ линейно через этот базис. Для Тх получится выражение ае\ Д ... Д eq А е'9+х А ... А ер, где а—определитель перехода от штрихованного базиса к нештрихо- ванному. Поэтому Тх делится на Т2. б), в). Если (е1 Д ... Д ер) Д (е\ А • • • Л«') ¥= 0, то векторы fa, ..., ер, е', ..., e'q{ линейно независимы. Следовательно, ли- нейные оболочки {е{, ..., ер] и {е\, ..., e'q], т. е. аннуляторы Тх и Т2 пересекаются лишь по нулю. Это рассуждение, очевидно, об- ратимо. Характеризация аннулятора разложимого р-вектора, дан- ная в доказательстве утверждения а), доказывает последнее утверждение теоремы. 280
14. Следствие. Рассмотрим отображение Ann- (Разложимые ненулевые р-векторы ' ус точностью до умножения на скаляр) мерные подпространства в L). Оно является биекцией. Доказательство. Ясно, что если два ненулевых разло- жимых вектора пропорциональны, то их аннуляторы совпадают. Поэтому описанное отображение определено корректно. Любое р-мерное подпространство £1 с: L лежит в образе отображения, ибо если {ei, ..., ер}— базис L(, то А1 = Апп(е1А ... Аер). На- конец, это отображение инъективно в силу утверждения а) тео- ремы п. 13: если Ann Т\ = Ann Т2, то Т\ — Т Л Т2 и Т является О-вектором, т. е. скаляром. 15. Многообразия Грассмана. Многообразием Грассмана, или грассманианом Gr(p, L), называется множество всех р-мерных ли- нейных подпространств пространства L. В случае р = 1 получается подробно изученное нами проективное пространство P(L). След- ствие п. 14 позволяет нам для любого р реализовать Gr(p, L) как подмножество в проективном пространстве Р(Л₽(А)). В самом деле, отображение, обратное к Ann, дает вложение Ann-': Gr(p, £)->Р(Л₽ (£)). Выпишем его в более явном виде. Выберем базис {ei, ..., еп} в L и рассмотрим линейную оболочку р векторов Ха/ей /=1.............. i=*l Базис Л₽(£) образуют р-векторов Л • • - Л eip 11 . ... < Отображение Ann-1 ставит в соответствие нашей ли- нейной оболочке прямую в Лр(£), порожденную р-вектором (,S ... л (.2 ф ). ч-1 17 v,p“‘ р/ Однородными координатами соответствующей точки в Р(Лр(£)) являются коэффициенты разложения этого р-вектора по А Л ... Л е1р}-. Р / п \ Л I Е ) = Е Л'1 " Л • • А /“1 X/-I 1 / !</,<...<«р<п р В точности такое же вычисление, как в доказательстве теоремы п. 10, показывает, что Д1‘ 1р совпадает с минором матрицы (а)), образованным строками с номерами и, ..., iP. Хоть один из этих миноров отличен от нуля в точности тогда, когда ранг матрицы (а‘) имеет наибольшее возможное значение р, т. е. когда линей- ная оболочка наших р-векторов действительно р-мерна. 281
Вектор (... : Af' fp : ...) называется вектором грассмановых координат р-мерного подпространства, натянутого на Из этой конструкции ясно, что для характеризации образа Gr(p, L) в Р(Лр(£)) нам нужно иметь критерии разложимости р-векторов. Поэтому мы займемся сейчас этой задачей. 16. Теорема, а) Ненулевой р-вектор Т разложим тогда и только тогда, когда dim Ann Т = р; для остальных ненулевых р-векторов dim AnnT < р. б) Выберем базис {еь ..., еп} в пространстве L и представим любой р-вектор Т коэффициентами его разложения по базису {<?<-, Д ... Л е(р| 1 <ii < «2 < .. • < /Р<п} в ЛР(А): т = тц - iPeii Л ... Ле.^ Тогда существует такая система полиномиальных уравнений от Т‘1 " 'р с целыми коэффициентами, зависящая только от п и р, что разложимость Т равносильна тому, что {ТА •••'₽} есть решение этой системы. Доказательство. То, что dim Ann Т = р для разложимых р-векторов, мы знаем из доказательства теоремы п. 10. Пусть dim Ann Г = г и Ann Г порождено векторами е1( ..., ег. Дополним их до базиса {ei, ..., еп} в £ и положим 7= Л ... Лбу Условие et Л Т = 0 для всех i = 1, ..., г означает, что 7'‘г”‘р = 0, если только {1....г} ф {ц, tp}. Отсюда сразу же следует, что если Т =# 0, то г р и что Т делится на в\ Л ... Л ег. По- этому при r — р р-вектор Т пропорционален ei Л ... Ле, и, зна- чит, разложим. б) Воспользовавшись этим критерием, мы можем теперь запи- сать условие разложимости Т в виде требования, чтобы следую- щая линейная система уравнений относительно неизвестных х1, ... ..., имела р-мерное пространство решений: ( Е * Л (Е Т1' •" ‘р efl Л • •. Л е,р) == 0. В ней п неизвестных и ( уравнений. Ее матрица состоит из целочисленных линейных комбинаций Ранг этой ма- трицы всегда п—р, ибо dim Ann Т р. Поэтому условие разло- жимости равносильно тому, чтобы ранг был п—р, т. е. обраще- нию в нуль всех ее миноров (п — р-}-1)-го порядка. Это и есть искомая система уравнений на грассмановы координаты разложи- мого тензора. 282
Рассмотрим несколько примеров и частных случаев; 17. Предложение. Любой (п—1) -вектор Т разложим. Доказательство. Очевидно, х Л Т = [(х)в! Л ... Л еп,. где f(x)—линейная функция на L; {<?i, ..., еп}—фиксированный базис L. Значит, dim Ann Т = dim Kerf п— 1. Но если Т0, то f =Н= О, так что dimKerf = n—1. В силу утверждения а) теоремы п. 16 Т разложим. В терминах грассмановых многообразий это означает, что имеется биекция (гиперплоскости в А)-*-Р(Лп-1А). Но гиперплоскости в L — это точки Р(Л*). Поэтому Р(Г)^Р(ЛП"1(£)) (канонический изоморфизм). Ниже мы обобщим этот результат. 18. Предложение. Ненулевой бивектор Т е A2(L) разложим тогда и только тогда, когда Т Л Т = 0. Доказательство. Необходимость очевидна. Для доказа- тельства достаточности проведем индукцию по п, начиная с три- виального случая п = 2. Пусть {е|( ..., e„+i} — базис L. Разло- жив Т по ei Л в/, мы можем представить Т в виде Т — еп+1 Л Т, ф- 4- Т2, где Ti и Т2 разлагаются по е,-, е,- Л в/, 1 I, j п. Из усло- вия Т Л Т — 0 следует, что Т2АТ2 + 2еп+, ДТ, АТ2 = 0, ибо (е„+1 Л Pi)A(en+l Л 7'1)= 0 и Т2 лежит в центре Л(А). Но Т2А Т2 не может содержать членов с en+i, поэтому Т2 А Т2 — еп+1 А А Т2 = 0. Поскольку Т2 ЛТ2 = 0, по индуктивному предположению Т2 раз- ложим. Так как Л Л Т2 не содержит членов с en+i, имеем 7\ Л Т2= = 0. Значит, Т\ лежит в двумерном аннуляторе Т2, и Т2 = Т\ А Поэтому Т = еп+\ А + Т\ А Т\ — (еп+| ф- Т\) А Т\, что и завершает доказательство. Этот результат снова дает информацию о грассмановых много- образиях, на этот раз о Gr(2, L): 19. Следствие. Каноническое отображение Gr(2, L)->Р(Л2(L)) отождествляет при п^З грассманиан плоскостей в L с пересече- нием квадрик в Р(Л2(Р)). Доказательство. Плоскости в L отвечают прямым разло- жимых 2-векторов A2(L). Условие разложимости 2-пектора X Л et, согласно предложению п. 18 имеет вид <<2 (.£ ЛеЛ л ( £ Ti'1'ej, Ле/,)«0, т. е. i2, Д, /2) = 0, 283
где каждая сумма слева отвечает одной четверке индексов 1 kt < k2 < k3 < ^4 п и е(Л, t2, /1, /2) есть знак перестановки множества {ib t2, /1, /2} = {ki, k2, k3, fe4}, размещающей эту чет- верку в порядке возрастания. В частности, при п = 4 получается одно уравнение: yl2j’34_у13у24 | у14у23 —-() Иными словами, Gr(2, JSf4) есть четырехмерная квадрика в P(A2(JJf4)) == Она называется квадрикой Плюккера. 20. Внешнее умножение и двойственность. Пусть dim L — и. Согласно следствию п. 5 и известной симметрии биномиальных коэффициентов dimA₽(L)=(") = (n2.p) = dimA'’-p(L) для всех 1 р п. Это наводит на мысль, что между AP(L) и A"~P(L) должен существовать либо канонический изоморфизм, либо каноническая двойственность. С точностью до небольшой де- тали верно второе. Рассмотрим операцию внешнего умножения Ар (L) X А"~р (L)-> A" (L): (Tit Т2)->Л А Т2. Поскольку она билинейна, она определяет линейное отображение Ар(£)->2’(Ап-₽£, Л"£) (Л"~р (£))’ ® Л"£ (последний изоморфизм — частный случай описанного в п. 5 § 2). Ядро этого отображения нулевое. Действительно, пусть {eit ... ..., еп} — базис L. Положим Т\ Л Т2 = (Ть Т2) ех/\ ... Ле„, где 7’1еАр(£), 7'2еЛ'!-р(£). Очевидно, (Т1г Т^) —билинейное ска- лярное произведение между Лр(£) и Л"~р(£). Построим в Лр(£) и Лп-Р(£) базисы из разложимых р-векторов и (п — р)-векторов {е,, Д ... Л е1р}, {ел Д ... Д е1п_р], 1 < й < ... < iP < n, 1 /I < ... < jn-p п. Отождествим Лр(£) и Лп-Р(£) с помощью линейного отображения, которое ставит в соответствие р-вектору Л .. • A £ip (п — р)-вектор ец Д ... Д в/п_р, для которого {й, ..., iP, ji, .... jn-p} — {1.«}• Тогда (Гь Т2) будет ска- лярным произведением на Лр(£) с диагональной матрицей Грама вида diag(±l, ..., ±1). Оно невырождено, в частности, его левое ядро равно нулю. Итак, мы построили канонические изоморфизмы Лр (£)-► (Лп-₽ (£))* ® Л" (£). При р = п—1 получаем Лп-1(£)->£*® Лп(£), что и объясняет изоморфизм Р(Л"_| (£))-> P(L*) из п. 18: тензорное умножение L* на одномерное пространство An(L) «не меняет» множество прямых. В следующем параграфе мы продолжим изучение связи внеш- него умножения с двойственностью, введя в рассмотрение внешнюю алгебру Л(£*). 284
§ 7. Внешние формы 1. Пусть L — конечномерное линейное пространство над полем Ж, L* — двойственное к нему пространство. Элементы р-й внешней степени AP(L*) называются внешними р-формами на пространстве L. В частности, внешние 1-формы — это просто линейные функционалы на L. Для произвольного р можно установить два варианта этого результата: 2. Теорема. Пространство №(L*) канонически изоморфно: а) (ЛР(Л))*, т. е. пространству линейных функционалов на р-векторах', б) пространству кососимметрических р-линейных отображений F : L X • • • X L -> Ж, т. е. отображений со свойством F •••» la (pl) = е (°)F (1\, . . Zp) для всех и е Sp. Доказательство. Согласно принятому нами определению Ар (L’) с Г ® ® Г = П(L*). В п. 4 § 2 мы отождествили T%(L*) с пространством всех р-линей- ных функций на L*. При этом отождествлении внешние формы становятся кососимметрическими р-линейными отображениями L. В самом деле, достаточно проверить это на разложимых формах. Для них имем (fi Л • • Л fp)(Zi, .... = ...,lp) = = 'Д" X 8 (т) ft(i) (Zi) . . . ft (р) (Zp). TeSp Поэтому (fl Л • • • A fp)(Za(i), • • •, Z0(p)) =^2 8(x) ft(i)(Zc(l)) • • • ft (p)(Zo(p))=* reSp Xi e(TO) f^Oin(Zcd)) • • • fvHp)(lc(p)) — x^sp = e(<A ••• Afp)(Z„ .... Zp) Поэтому мы построили линейное вложение Лр(£*)->(кососим- метрические р-линейные формы на L). Чтобы проверить, что оно является изоморфизмом, достаточно установить совпадение размерности правой части с dim Ар (£*) = (Но если в L выбран базис {ец ..., еп}, то любая кососимметрическая р-ли- нейная форма F на L однозначно определяется своими значе- ниями F (ец, ..., е(р), I < il < ... < tp < л, и их можно выби- рать любыми. Поэтому размерность пространства таких форм равна ( п ). Это доказывает утверждение б) теоремы. 2S5
Для доказательства утверждения а) отождествим L* ® . ® L* р с (L® ... ® L)* снова с помощью конструкции п. 4 § 2 и огра- ничим каждый элемент Лр(£*) (как линейную функцию на L® ... ® L) на подпространство р-векторов AP(L). Мы получим линейное отображение Ap(L*)->-(Ap(L))*. Поскольку размерности пространства слева и справа совпадают, достаточно проверить, что оно сюръективно. Пространство линейных функционалов на Лр(£) , 1 я порождено функционалами вида о{, где I={ii, .£₽}<={!, .... п}, Л ... Де(р) = 1, 6/О/, Л ••• Ле/р) = 0, если {/1, ..., /Р} #= /. Мы утверждаем, что такой функционал явля- ется образом р-формы е‘] Д ... Ле‘реА₽(£), где, как обычно, {е1} означает базис, двойственный к {е,}. Действительно, значение е'1 Д ... Д е1р на Д ... А е!р равно А (е£' ® ... ® е'р) (A(e/t ® ... ® е/р)) = = W S е и,)--- c.x^sp Справа отличны от нуля лишь те слагаемые, для которых ia(1) = = /ко, ..., Мр) =/т(р), так что вся сумма равна нулю, если {й, ..., ip} ¥= {/1, ..., /р}. Если же эти множества совпадают, то вся сумма равна -7-^5- У е(сг)2 = -^-, (р!)2 1—1 ' ’ pl a<=sp когда {й, ..., ip} = {/1, ..., /р} упорядочены по возрастанию. По- этому ег‘ Д ... /\е1р как функционал на Лр(£) равен что завершает доказательство. 3. Замечания, а) Принятый нами способ отождествления Ap(L*) с (Лр(£))* отвечает билинейному отображению Лр (Г)ХЛР (£)->Х, которое на произвольных парах разложимых р-векторов можно представить в виде (Г1 Л • • • Л fp, й Л • • • Л lp) =~ det (f'(/,.)), f1 е L*, lj e L. Действительно, обе стороны полилинейны и косо- симметричны в отдельности по fl и й; кроме того, они совпадают для (Г, .... fp) = (e\ .... е‘р), (1Ь ..., /р) = (еЛ..е/р), как было проверено в предыдущем доказательстве.
Иногда в этом скалярном произведении отбрасывают множи- тель б) Одно из отождествлений, установленных в теореме, иногда принимают в качестве определения внешней степени. Например, Лр(£) часто, особенно в дифференциальной геометрии, вводят как пространство кососимметрических р-линейных функционалов на L*. Общность этой конструкции — промежуточная между общно- стью первого и второго определений внешней степени из § 6: по- скольку она не требует деления на факториалы, она годится для линейных пространств над полями конечной характеристики, а также для свободных модулей над коммутативными кольцами. Но при переходе к общим модулям лишняя дуализация мешает, и второе определение становится предпочтительным. Результат, аналогичный теореме п. 2, справедлив также для симметрических степеней, и наше предшествующее замечание от- носится и к ним. В частности, SP(L) можно определить как про- странство симметричных р-линейных функционалов на L* для пространств над любыми полями и свободных модулей над ком- мутативными кольцами. В самом общем случае, однако, правиль- ное определение Sp(L)— это определение из п. 9, § 5. 4. Внутреннее произведение. Внутренним произведением назы- вается билинейное отображение L X Ap (Z,*) -> Ар-> (Г): (/, F) i (/) F, которое определяется следующим образом. Рассмотрим F е AP(L*) как кососимметричную р-линейную форму на L, и аналогично i(l)F. Тогда по определению /(/)F(/,...Zp-i) = F(Z, /и - /Р_1). Очевидно, правая часть (р — 1)-линейна и кососимметрична как функция от /1, ..., /р-1, а также билинейна как функция от F, I, так что определение корректно. При р = О удобно считать, что i(/)F = 0. Вместо i(l)F пишут также / i F. § 8. Тензорные поля 1. В этом параграфе мы кратко опишем типичные дифферен- циально-геометрические ситуации, в которых используется тензор- ная алгебра. Рассмотрим некоторую область U с R” в координатном вещест- венном пространстве и кольцо С бесконечно дифференцируемых функций с вещественными значениями на U. В частности, коор- динатные функции х‘, /== 1, ..., п, принадлежат С. 2. Определение. Касательным вектором Ха к U в точке asU называется любое линейное отображение Ха: C->R, удовлетворяю щее условиям: Xaf — 0, если f постоянна в некоторой окрестности о; Xa(fg) = Xof-g(a) + f(a)-Xag. 267
Если Ха, Ya — два касательных вектора в точке а, то любая их вещественная линейная комбинация также является касательным вектором в этой точке: (сХа + dY а) (fg) = сХа (fg) + dYa (fg) = = cXaf • g (a) + cf (a) Xag + dYaf • g (a) + df (a) Yag = = (cXa + dYa) f-g(a) + f (a) (cXa + dYa) g. Поэтому касательные векторы образуют линейное пространство, которое обозначается Та и называется касательным пространством к U в точке а. Значение Xaf называется производной функции f по направлению вектора Ха. Можно доказать, что пространство Та п-мерно. 3. Определение. Векторным полем в области U называется та- кое семейство касательных векторов X = {Xa е To|a е U}, что для любой функции f ge С функция на U a^Xaf также принадлежит С. Обозначим эту функцию через Xf. Очевидно, касательное поле определяет линейное отображение X: С-^С, нулевое на постоян- ных функциях и такое, что X (fg) = Xf • gf-Xg для всех f, g e C. Такие отображения называются дифференцированиями кольца С в себя. Наоборот, каждому дифференцированию X: С^-С и точке а е U отвечает касательный вектор Ха в этой точке: Xaf = (Xf) (а). Это устанавливает биекцию между векторными полями на Й и дифференцированиями кольца С. Сумма векторных полей X + У, определенная формулой (X + Y)f = Xf -f- Yf для всех f е С, является векторным полем. Произведение fX, определяемое формулой (fX)g = f(Xg), где X — векторное поле, f, geC, является векторным полем. В частности, m любая линейная комбинация векторных полей £ f‘Xh f‘<=C, яв- i=i ляется векторным полем. 4. Пример. Пусть , i=l.........п, — классические опера- торы частных производных. Все они являются векторными полями на U. Имеет место следующий фундаментальный результат, кото- рый мы приведем без доказательства: 5. Теорема. Всякое векторное поле X в связной области U с R" п однозначно представляется в виде 5 fl -^7 , где х1, ..., хп — ко- дх ординатные функции на R". 6. На алгебраическом языке это означает, что множество всех векторных полей Т в связной области U является свободным моду- лем ранга п над коммутативным ассоциативным кольцом С беско- нечно дифференцируемых функций на U. 288
Свободные модули конечного ранга над коммутативными коль- цами образую! категорию, по своим свойствам чрезвычайно близ- кую к категории конечномерных пространств над полем. Для них, в частности, проходит вся теория двойственности и все конструк- ции тензорной алгебры из этой части курса. Другой вариант, не требующий переноса тензорной алгебры на кольца и модули, но взамен предполагающий развитие некоторой геометрической техники, состоит в том, чтобы рассматривать каж- дое векторное поле X как семейство векторов {Ха | а е U}, лежа- щих в семействе конечномерных пространств {Га}. Тогда все нуж- ные нам операции тензорной алгебры можно строить «поточечно», определив, скажем, X ® У как {А'п ® Уа|а<= U}. Оба варианта построения тензорной алгебры совершенно экви- валентны; в приводимых ниже определениях мы будем исходить из первого. 7. Обозначим через Г* С-модуль С-линейных отображений Г = 3?С(Т, С). Он состоит из отображений со; S->-C со свойством Ст \ т для всех X, е Т, f‘ е С. Сложение и умножение на элементы про изводится по стандартным формулам. С-модуль Г* часто обозна- чается Q1 или &’([/) и называется модулем (дифференциальных) 1-форм в области U. Каждая функция f^C определяет элемент dfeQ1 по формуле (df)(X) = Xf, Хе=Т. Он называется дифференциалом функции f. В частности, мы можем построить дифференциалы координатных функций dx', dxn е ей1. Из теоремы п. 5 легко следует 8. Предложение. Любая 1-форма вей1 однозначно представ- п ляется в виде линейной комбинации £ ft dx1. !=i 9. Элементы тензорного произведения С-модулей Т* ® ... ®>7' называются тензорными полями типа р ч (p,q), или р раз ковариантными и q раз контравариантными тен- зорными полями в области U. В дифференциальной геометрии, впрочем, слово «поля» часто опускают и называют тензорные поля просто тензорами. Из теоремы п. 5 и предложения п. 8 следует, что всякий тензор типа (р, q) однозначно задается своими компонентами по формуле 7 = У Т'Л"1,4 dxil<8> ...®dx‘p ® ®...® -Д-, — dxh дх'ч 289
где lk, Ji независимо пробегают значения от 1 до п. В классических обозначениях опускаются все символы в правой части, кроме компонент т\1,1‘г: этот знак и служит обозначением тензора. Под- 1 р / I черкнем еще раз, что здесь Г}1 " л суть не числа, а вещественные 1 р бесконечно дифференцируемые функции на U. 10. Замена координат. Первый вклад анализа в изучение тен- зорных полей состоит в возможности делать нелинейные замены координатных функций в U: переходить от х1, ..., хп к у1, , уп, где у‘ — у‘(х1, ..., хп) — бесконечно дифференцируемые функции такие, что обратные функции xl~xl(yi, ..., уп) определены и бесконечно дифференцируемы. Дело в том, что компоненты вектор- ных полей н 1-форм при этом все равно преобразуются по клас- сическим формулам линейно, только с коэффициентами, изменяю- щимися от точки к точке: согласно формуле дифференцирования сложной функции имеем д _ dyk д дх1 ~ дх1 dyk (справа подразумевается суммирование по k), а также dx' = d-^dyk dyk (то же соглашение). Поэтому тензор т\1в новых координатах имеет компоненты — дх1' дх1Р ду1'1 , ду1^ у/, /„ ' , i'l , t'n ’’ , i'g ll — lp 1 4 ду ‘ ду 4 ах дх 4 к (то же соглашение с суммированием справа). Все алгебраические конструкции и языковые соглашения § 4 можно теперь перенести на тензорные поля. Мы закончим этот параграф несколькими примерами тензор- ных полей, играющих особенно важную роль в геометрии и физике. 11. Метрический тензор. Этот тензор, обозначаемый gy или, п в более полной записи, У gt/ dx1 ® dx1, предполагается симме- тричным и невырожденным в каждой точке a^U, т. е. det(go(a))=/= =/= 0. Он задает ортогональную структуру в каждом касательном пространстве Та, и пары (U, gq) (а также обобщения на случай многообразий, «склеенных» из нескольких областей U) составляют основной объект изучения римановой геометрии, а в случае п = 4 и метрики сигнатуры (1, 3) — общей теории относительности. Метрика используется для измерения длин дифференцируемых кривых {х*(0., •••> х"(0 Ро С * С Л}: Длина задается формулой 290
SV / k r.\\ dx1 dx1 , glj(X dt, a также для поднятия и опускания ин- to дексов тензорных полей. 12. Внешние формы и форма объема. Элементы из Ар(й1)> т. е. кососимметрические тензоры типа (р, 0), называются внеш- ними р-формами в U, а внешние n-формы называются формами объема. Это название объясняется возможностью определить «кри- волинейные интегралы» •-г xn)dxl/\ ... Л dxn по любой v подобласти U, обладающие свойствами меры. В случае f = 1 зна- чение такого интеграла есть евклидов объем области V, свойства которого мы описали в § 5 ч. 2. При р < п можно определить интеграл от любой формы ее е Лр(£2‘) по «р-мерным дифференцируемым гиперповерхностям» в U. Все модули внешних форм связаны замечательными операто- рами «внешнего дифференциала» dp: Лр->Лр+1, который в коор- динатах задается формулой dp(y ft.... tdx1' Л ... /\dxlp] = У ——dx‘p+l л dx‘l Д ... * р ) dxip+i ... A dx'p. Эти операторы удовлетворяют условию dp+*.° dP = 0 и входят в формулировку обобщенной теоремы Стокса, связывающей интеграл по р-мерной гиперповерхности с границей V с интегралом по ее границе dV: dap~l = top_|. vp dVp Особую роль играют внешние 2-формы <о2, удовлетворяющие условию d<o2 = 0. В их терминах инвариантно формулируется аппарат гамильтоновой техники. § 9. Тензорные произведения в квантовой механике 1. Объединение систем. Роль тензорных произведений в кван- товой механике объясняется следующим фундаментальным поло- жением, которое продолжает серию постулатов, сформулированных в п. 8 § 6 и пп. 1—6 § 9 ч. 2. Пусть Ж\, ..., Жп— пространства состояний нескольких кван- товых систем. Тогда пространство состояний системы, получаю- щейся в результате их объединения, является некоторым подпро- странством Ж с.Ж\® ... ® Жп- Строго говоря, в бесконечномерном случае вместо тензорного произведения справа должно стоять пополненное тензорное про- изведение гильбертовых пространств, но мы пренебрежем этой тонкостью, работая, как обычно, с конечномерными модулями. 291
Какое именно подпространство в ® ... отвечает объ- единенной системе, приходится решать на основе дальнейших правил, к которым мы обратимся ниже. Здесь же мы рассмотрим случай <5^ = <9^| =5^1 ® ... ®Жп и попытаемся объяснить, как уже первый постулат квантовой механики — принцип суперпози- ции — приводит к совершенно неклассическим связям между си- стемами. Для этого яснее представим себе, каковы могут быть состояния объединенной системы. Пусть if, 6= Ж-— некоторые со- стояния подсистем. Тогда разложимый тензор ift ® ... ® явля- ется одним из возможных состояний объединенной системы, и мы можем считать, что оно отвечает случаю, когда каждая из под- систем находится в своем состоянии ip,-. Но такие разложимые состояния далеко не исчерпывают всех векторов в ® ... ®3№п. допустимы их произвольные линейные комбинации. Когда объеди- ненная система находится в одном из таких неразложимых состоя- ний, представление о ее подсистемах теряет смысл, ибо они и их состояния не могут быть однозначно выделены. Иными словами, в подавляющем большинстве состояний объединенной системы подсистемы существуют лишь «виртуально». Важно подчеркнуть, что этот вывод никак не использует пред- ставлений о взаимодействии подсистем в классическом смысле слова, подразумевающем обмен энергией между ними. Эйнштейн, Розен и Подольский предложили мысленный эксперимент, в ко- тором две подсистемы объединенной системы после ее распада оказываются сильно разделены пространственно, и наблюдение над одной подсистемой позволяет мгновенно «перевести в опреде- ленное состояние» вторую подсистему, хотя классическое взаимо- действие между ними требует конечного времени. Это следствие постулатов суперпозиции и тензорного произведения резко про- тиворечит классической интуиции. Тем не менее их принятие при- вело к огромному количеетву теоретических схем, правильно объяс- няющих действительность, и приходится доверять им и вырабаты- вать новую интуицию. Заметим попутно, что описание взаимодействия требует введе- ния гамильтониана объединенной системы. В простейшем случае он имеет «свободный» вид Я1 ® id ® ... ® id -|- id ® Н2 ® ... ® id + ... + id ® ... ®> Нп, где Нс 3^13^, — гамильтониан i-й системы, id — тождественные отображения. В этом случае говорят, что системы не взаимодейст- вуют. Некоторое объяснение этому состоит в замечании, что если объединенная система имеет такой гамильтониан и в начальный момент времени находится в разложимом состоянии ipi ® ... ® то в любой момент времени t она будет находиться в разложимом состоянии ® e~‘tHn (гр„), т. е. ее подсистемы будут развиваться независимо друг от друга. В общем случае гамильто- ниан представляет собой сумму свободной части и оператора, ко- торый отвечает за взаимодействие. 292
2. Неразличимость. Имеются два фундаментальных случая, когда пространство состояний объединенной системы не совпадает с полным пространством Ж\® ... ®3ёп. В обоих случаях объеди- няемые системы тождественны, или неразличимы, скажем, явля- ются элементарными частицами одного типа; в частности, 5^ = ... ______ 'Ур _ 'УР ... —аир— vw* а) Бозоны. По определению, система с пространством состоя- ний Ж называется бозоном, если пространство состояний объеди- нения п систем есть п-я симметрическая степень Sn(3S). Согласно эксперименту бозонами являются фотоны и альфа- частицы (ядра гелия). б) Фермионы. По определению, система с пространством со- стояний Ж называется фермионом, если пространство состояний объединения п таких систем есть п-я внешняя степень A”(^). Согласно эксперименту фермионами являются электроны, про- тоны, нейтроны. 3. Числа заполнения и принцип Паули. Пусть {фь ..., фт} — базис пространства состояний бозонной или фермионной системы. Тогда элементы симметризованного (или антисимметризованного) тензорного базиса в S"(<9^) (или Л"(<9^)) физики записывают в виде Г S (ф, 0 ... 0 ф, 0 ... 0 фт 0 ... 0фте) в S"(3^)> - I О. ш I Oi...ат)~ < j А (фф 0 ... 0 Ф1 0 ... 0 фт 0 ... 0 фт) в Л" I “1 В обоих случаях fli + ... + ат = п, но для бозонов числа а, могут принимать любые целые неотрицательные значения, а для фермио- нов— только 0 или 1: иначе соответствующие антисимметризации равны нулю и не определяют квантовое состояние. Числа щ называются «числами заполнения» соответствующего состояния. Подразумевается, что в состоянии | аь ..., агп) объ- единенной системы можно условно считать, что а,- подсистем на- ходятся в состоянии ф,-. Поскольку, однако ни в фермионном, ни в бозонном случае объединенная система вообще не может нахо- диться в состоянии, описываемом разложимым тензором ф, ® ... ... ® фт, кроме случая, когда все ф,- одинаковы (для бозонов), эТо означает, что даже в базисных состояниях |ai, ..., ат) нельзя сказать, «которая» из подсистем находится, скажем, в состоянии фь Подсистемы являются неразличимыми. Условие а,- = 0 или 1 в фермионном случае интерпретируется как утверждение о том, что две подсистемы не могут находиться в одинаковом состоянии. Это знаменитый «принцип запрета» Паули. Когда число п очень велико, ряд физически важных утвержде- ний о пространствах S” (<?£>) и Л"(<Э&) делается в вероятностных терминах, скажем, в терминах доли состояний |сь ..., а„> с теми или иными условиями относительно чисел заполнения. Поэтому 293
часто говорят, что бозоны и фермионы подчиняются разным ста- тистикам— соответственно Бозе — Эйнштейна или Ферми. 4. Случай переменного числа частиц. В процессе эволюции квантовой системы составляющие ее «элементарные подсистемы», или частицы, могут рождаться или уничтожаться. Для описания таких эффектов в бозонном и фермионном случае используются оо соответственно пространства состояния (<9^) (точнее, попол- £=1 оо некие этого пространства) или фАг(Ж), т. е. полная симметри- 1-0 ческая или внешняя алгебра одночастичного пространства Ж Оператор, умножающий векторы из Sn{2/S) (соответственно, из Лп(<9^)) на п (п = 0, 1, 2, 3, ...), называется оператором числа частиц. Его ядро — подпространство С = 8°(3№) или Л°(3@)— на- зывается вакуумным состоянием-, в нем частиц нет. Совершенно фундаментальную роль играют также специальные операторы рождения и уничтожения частиц. Оператор о-(фо) уничтожения бозона в состоянии фое<9^ действует на состояние 5(ф]® ... ®ф«) по формуле а“(Фо)5(Ф1 ® • •• ® фп) = д/л+ 1 У, (Фо, Фа(1))®ф0(2) О ... °^sn ... ® фо (П), где (фо, фа(о) — скалярное произведение в Ж. Оператор а+(ф0) рождения бозона в состоянии ф0 е <9^ определяется как сопряжен- ный к а-(фо) в смысле эрмитовой геометрии. Аналогичные фор- мулы можно написать в фермионном случае. Роль этих стандарт- ных операторов тензорной алгебры объясняется тем, что в их терминах удобно записывать операторы важных наблюдаемых, в первую очередь гамильтонианы. УПРАЖНЕНИЯ В следующей серии упражнений изложены основные факты теории тензор- ного ранга, важной для оценок сложности вычислений. Основы этой теории зало- жил Ф. Штрассеи. . 1. Пусть В|, ..., L„ — конечномерные линейные пространства над полем Ж, I е L,® ... ®Ln, t =/= 0. Рангом rk t тензора t называется такое наименьшее чис- ло г, что для подходящих векторов е Llt j = 1, ..., г, t = f /(/’®... ®4У)- /=i Очевидно, при п = 1 имеем rk t = 1 для любого t 0. Пусть f ei*0£!=2’|L|. В2) (см- п. 5 § 2). Доказать, что rk t = dim Im t, t: Lt > £2. Вывести отсюда следующие факты: а) при п = 2 ранг t остается инвариантным при расширении основного поля; 294
б) при п — 2 множество {(| гк / г} задается конечной системой уравнений Р;- , (t1' " 1/г) = 0, где Pj г —многочлены от координат. Оба этих факта перестают быть верными для случая п = 3, который пред- ставляет основной интерес в теории сложности вычислений; см. ниже упражне- ния 4 — 9. 2 2. Пусть L = ф Сеч/ — пространство комплексных матриц размера г, /=1 2X2. Доказать, что /2 \ rk( £ aij^>ajk^>aki]==7- \i. j. А=1 / Указание. Воспользоваться упражнением 12 к § 4 ч. 1. Это же указание относится к следующей задаче. 3. Доказать, что rk( S aij®ajk®aki}^cNl°Si7 \i, j, Л = 1 / N для подходящей константы с. (Здесь L = ф интересующий нас тен- /=1 зор есть tr А ® А ® А, А — (а,-,) — общая матрица (V-ro порядка.) 4. Пусть L — некоторая конечномерная ^-алгебра,/. 0 £-> L: а®Ь ь—> аЪ— х ее закон умножения. Рассмотрим этот закон как тензор t е L* ® L* ® L. (Его координаты — структурные константы алгебры.) Вычислить rk t для случая УС = R, L = С. 5. В обозначениях предыдущей задачи пусть L = УСп, умножение покоорди- натное: (аь ..ап) (bi.....bn) = (aibi....anbn). Вычислить rk t. 6. Пользуясь результатами упражнений 4 и 5, убедитесь, что ранг тензора структурных констант алгебры С над R падает при расширении основного поля до С. Указание. С 0 С изоморфна С2 как С-алгебра. R 7. Пусть L = Се, Ф Се2- Доказать, что тензор t = е, 0 е, 0 е, + ei 0 е2 0 е2 + е2 0 е, 0 е2 имеет ранг 3. 8. Доказать, что тензор t нз предыдущего упражнения является пределом некоторой последовательности тензоров ранга 2. Указание. t + ее2 0 е2 0 е2 = -^ [е, 0 et 0 (—е2 + ее,) + (е, + ее2) 0 (е, + ее2) ® е2]. 9. Вывести из упражнений 7 и 8, что множество тензоров ранга 2 в L® L® L не задается системой уравнений вида где Pj — многочлены. 10. Назовем предельным рангом brk(Z) тензора t такое наименьшее число s, что / можно представить в виде предела последовательности тензоров ранга s. Доказать, что для общей матрицы А порядка 3X3 brk (tr А ® А 0 Д)< 21. 295
11. Чему равны rk (tr А ® А ® Л), brk (tr А ® А ® Л), где Л—общая матрица порядка N X Nt (К моменту, когда пишутся эти стро- ки, ответ не известен даже для N = 3.) 12. Пусть L — n-мерное линейное пространство над полем JSf, М с А2(£)— произвольное подпространство. Предположим, что для каждого v е L, v ф О, существует ге е /. с 0 v /\ w е М. Доказать, что в L можно выбрать такой базис ei, ..., е„, что Л4 + А2 (£/) = Л2 (£), l<i<n, где L{ = ф Же.. j i В случае поля JSf — Fp из р элементов известно весьма непростое комби- наторное доказательство этого результата (Vaughan-Lee М. R. — J. Al- gebra, 1974, 32, р. 278—285), допускающего теоретико-групповую интерпретацию. Желательно найти более прямой подход.
ПРЕДМЕТНЫЙ Аксиома Дезарга 243 — Паппа 243 Аксиомы трехмерного проективного пространства 241 — проективной плоскости 242 Алгебра внешняя 192, 276, 277 — гомологическая 88 — Грассмана 192, 276 — Клиффорда 189 — Ли 34, 38 -----классическая 35 ----gl(n, X) 35 ----о(п, Ж} 35 ----si (и, Ж} 35 ----su(n) 35 — — u(n) 35 — над полем ассоциативная 189 — симметрическая 273, 274 — тензорная 266 Алгоритм ортогонализации Грама— Шмидта 111 Альтернатива Фредгольма конечно- мерная 50 Альтернирование тензора 275 Амплитуда вероятности 131 Аннулятор р-вектора 279 Антисимметризацня тензора 275 Аппроксимация 114 Базис пространства 14 ---- гиперболический 186 ----двойственный 24 — — жорданов 59 ----ортогональный 106 ---- ортонормированный 106 ----симплектический 107 — тензорный 257 Базисы одинаково ориентированные 46, 177 ---- пространственно ориентирован- ные 178 Бозон 293 Буст 179 УКАЗАТЕЛЬ Валентность тензора 264 Вектор грассмановых координат 282 — касательный 287 — корневой 61 — собственный 56 — состояния 130 — циклический 67 Векторы одинаково временно ориен- тированные 176 — ортогональные 98 Величина случайная 126 --- нормированная 126 Величины случайные независимые 126 Вероятность 129 Вершина выпуклого множества 214 Вес билинейной формы 114 Возмущение 152 Вычитание внешнее 194 Гамильтониан 150 — невозмущенный 152 Геометрия ортогональная 98 — симплектическая 98 — эрмитова 98 Гиперплоскость 224 — касательная 228 — полярная 227 Гиперповерхность алгебраическая 246 Гомотетия 22 Грань верхняя 20 — выпуклого множества 213 Грассманиан 281 Группа аффинная 201 — Витта 189 — движений 202 — классическая 33 — линейная полная 24, 34 --- специальная 34 — Лоренца 135, 173, 178 — ортогональная 34 --- специальная 34 — проективная 231 — Пуанкаре 202 297
Группа симплектическая 183 — унитарная 34 --- специальная 34 Движение аффинного евклидова про странства 202 ---------- несобственное 204 ---------- собственное 204 — непрерывное 44 Двойственность тензорных произве- дений 260 Действие 151 — симметрической группы на тензо- рах 260 — транзитивное 193 — эффективное 193 Дельта-функционал Дирака 13 Дельта-функция 9 Деформация 44 Диагональ главная 27 Диаграмма 84 — коммутативная 84 Дисперсия 149 Дифференциал отображения в точке 27 — функции 289 Дифференцирование кольца 288 Длина вектора 118, 129 — флага 18 Дополнение ортогональное 53, 102 — прямое 43 Зависимость линейная 16 Замыкание проективное 225 Значение собственное 56 — среднее 149 Идеал 247 — градуированный 247 — двусторонний 274 — конечно порожденный 248 —, порожденный множеством 248 Излучение фотонов 152 Изометрия линейных пространств 99 Изоморфизм 23 — в категориях 83 — естественный 23 — канонический 24 — проективный 230 — функторный 87 Инвариант линейного оператора 33 Индекс оператора 50 Интервал времениподобный 172 — пространственноподобный 172 — светоподобный 172 Карта аффинная 221 298 Категория 83 — абелевых групп 83 — групп 83 — дуальная 85 — линейных пространств 83 — множеств 83 — функторов 87 Квадрат коммутативный 84 Квадрика аффинная 219 — полярная 227 Кватернионы 168 Клетка жорданова 58 — циклическая 67 Ковариация 126 Кольцо градуированное 247 Комбинация линейная 8 ------ тензоров одинакового типа 268 — точек барицентрическая 198 Коммутатор 34 — в Х-алгебре Ли 38 — групповой 37 Комплекс 84 — ацикличный 85 — точный 85 -в члене 85 Комплексификация линейного про- странства 80 — проективного пространства 229 Композиция морфизмов 83 — функторов 87 Компонента градуированного про- странства однородная 246 — группы Лоренца 178 — тензора 267 Конец стрелки 83 Конус асимптотических направлений 158 — световой 173 Конфигурации в аффинном простран- стве аффинно конгруэнтные 208 ------ --- метрически конгруэнтные 208 — проективно конгруэнтные 232 Конфигурация 208 — Дезарга 240 — координатная 208 — Паппа 240 — проективная 232 Кообраз 50 Координата тензора 267 Координаты аффинные 197 — барицентрические 199 — вектора 14 — точки однородные 220 Коразмерность подпространства 49 Косокоммутативность 276 Коэффициент корреляции 126 — Фурье 115 Коядро 50 Критерий Сильвестра 113 — цикличности пространства 67
Круг 71 Лемма о змее 91 — Цорна 20 Линия мировая инерциального на- блюдателя 172 Логарифм оператора 76 Матрица 27, 267 — антисимметричная 35 — антиэрмнтова 35 — блочная 28 — Грама 96 ---положительно определенная 113 — диагональная 27 — Дирака 36 — единичная 28 — жорданова 58 — квадратная 27 — композиции линейных отображе- ний 30 — контраградиентная 268 — кососимметричная 35 — косоэрмитова 35 — линейного оператора 29 — — отображения 29 — ортогональная 34, 134, 135 — Паули 36, 164 — перехода 32 — псевдоортогональная 135 — псевдоунитарная 135 — симметричная 35 — скалярная 28 — транспонированная 28 — треугольная верхняя 27, 28 ---нижняя 28 — унитарная 34, 135 — эрмитова 35 — эрмитово антисимметричная 35 ---симметричная 35 — сопряженная 34 Медиана системы точек 212 Метод наименьших квадратов 121 — Штрассена 37 Метрика 69, 96 — дискретная 69 — естественная 69 — кэлерова 244 Многогранник 213 Многообразие алгебраическое 246 — Грассмана 281, 283 Многочлен, аннулирующий оператор 59 — Гильберта 252 — Лежандра 116, 143 — минимальный 60 — однородный 245 Многочлен тригонометрический 114 — Фурье 114, 115, 143 — характеристический 56 — Чебышева 117, 145 — Эрмита 117, 144 Множество выпуклое 71 — измеримое 122 — линейно упорядоченное 19 — частично упорядоченное 19 Множитель Лоренца 176 — фазовый 130 Модуль 248 — градуированный 248 — конечно порожденный 249 — нётеров 249 Монотонность размерности 18 Морфизм категории 83 — нулевой 84 — функторный 87 Наблюдаемая 148 — импульса 150 — координаты 150 — проекции спина 150, 167 — энергии 150 — — квантового осциллятора 150 Направление 164 Направления асимптотические 157 Направленность времени 172 Начало стрелки 93 Независимость линейная 16 Неравенство Коши — Буняковского— Шварца 118, 128 — Минковского 74 — треугольника 118, 129 --- в обратную сторону 175 Норма вектора 70 — линейного оператора индуциро- ванная 72, 146 Оболочка аффинная 206 — линейная 16 — проективная 223 Образ линейного отображения 26 — обратный 86 Образующие конуса 158 — мультипликативные 189 Объект категории 83 ---инъективный 83 --- проективный 83 Объем п-мерный 122 ---шарового кольца 125 Овеществление линейного простран- ства 77 Ожидание математическое 126 Окружность 71 Оператор Гамильтона 150 — диагонализируемый 56 299
Оператор кограничный 92 — линейный 21 — неотрицательный 146 — нильпотентный 61 — нормальный 145 — ортогональный 133 — рождения частиц 294 — самосопряженный 138, 139 — симметричный 139 — сопряженный 139 — унитарный 133 — уничтожения частиц 294 — числа частиц 294 — эрмитов 139 Определитель линейного оператора 33 Опускание индексов тензора 263,270 Ориентация пространства 46, 166 ------Минковского 177 Оси квадратичной формы главные 156 Отклонение среднеквадратичное 149 Отношение двойное 235 — перспективное 237 — порядка 19 Отображение антилинейное 82 — аффинио линейное 195 — аффинное 195 — билинейное 51, 95 — двойственное 52 — двойственности 227 — линейное 21 ------ нулевое 22 -ограниченное 72 тождественное 22 — полилинейное 95, 254 ------ универсальное 254 — полулинейное 82 — полуторалинейное 96 — симметризации 271 — сопряженное 52 — Хопфа 222 Отражение 136 — времени 180 — пространственное 180 Пара базисов двойственная 52 Параболоид гиперболический 157 — эллиптический 156 ------п-мериый 158 Парадокс близнецов 176 Параллелепипед со сторонами {Zi, ... .... М 123 Пары наблюдаемых канонически со- пряженные 149 Пересечение подпространств транс- версальное 40 Перестановка 269 Перпендикуляр к двум подпростран- ствам общий 210 Печка 148 План производства 212 ---, оптимальный по прибыли 213 Плоскость гиперболическая 185 — проективная 220 Поглощение фотонов 152 Подгруппа операторов однопарамет- рическая 75 — ортохронная 173 Подмногообразие линейное 47 Подмножество выпуклое 71 — ограниченное 70 Подпространства аффинные парал- лельные 205, 206 — ортогональные 98 Подпространство аффинное 205 — вещественное 230 — градуированное 247 — изотропное 102, 181 —, инвариантное относительно опе- ратора 56 — линейное 10 — направляющее 205 — , натянутое на векторы 16 — невырожденное 102 — , порожденное векторами 16 — проективное 223 — собственное 56 — состояний квантовой системы 129 Подсемейство максимальное 17 Подъем индексов тензора 263, 270 — поля скаляров 86, 258 Покрытие проективного пространства аффинное 220 Поле векторное 288 — тензорное 289 Положение общее подпространств 40 --- точек 233 — равновесия механической системы 159 Полупространство 213 Поляризация квадратичной формы 10 Последовательность Коши 70 — линейных пространств точная 54 — сходящаяся 70 — точная 85 — фундаментальная 70 Постоянная Планка 151 Правила Фейнмана 131, 132 Преобразование Кэли 146 Приведение билинейной формы к каноническому виду 109 — квадратичной формы к канониче- скому виду ПО, 111, 114 — матрицы к каноническому виду 108 Принцип неопределенности Гейзенбер- га 149 — Паули 293 — проективной двойственности 226 — суперпозиции 130, 292 300
Проективизация 230 Проектор 42 — самосопряженный 141 Проекция вектора ортогональная 119 — из центра 236 Произведение векторное 167 — внутреннее 287 — Кронекера 37 — морфизмов 83 — скалярное 96 антисимметричное 98 невырожденное 99 симметричное 98 симплектическое 98 эрмитово 98 — симметричное 98 — тензорное 37 -----линейных отображений 262 — — пространств 255 Производная по направлению 288 Пространства изометричные 99 — изоморфные 23 Пространство анизотропное 185 — - аффинное 94, 193 ------евклидово 202 — банахово 70 — бесконечномерное 14 — векторное 7 — вероятностное конечное 126 — гильбертово 127 — гиперболическое 185 — главное однородное 194 —, двойственное к данному 10, 51 — евклидово 117 — касательное 288 — когомологий 91 — комплексное сопряженное 81 — конечномерное 14 — координатное одномерное 8 — — п-мерное 8 — линейное 7 — —, ассоциированное с аффинным пространством 193 — — градуированное 246 ------над телом 242 нормированное 70 полное 70 — метрическое 68, 69 полное 70 — Минковского 158, 171 — нульмерное 8 — ортогональное одномерное нуле- вое 101 ------- отрицательное 101 -------положительное 101 — проективное 94, 220 ----- двойственное 226 -----координатное и-мерное 220 -----трехмерное вещественное 170, 171 Пространство рефлексивное 26 — симплектическое 181 — сопряженное 10 — спиноров 163 — унитарное 126 — физическое инерциального наблю дателя 173 — функций 8, 9 — циклическое 67 Прямая проективная 220 Пфаффиан 184 Разбиение проективного простран ства клеточное 237 Разложение оператора полярное 147 ---- спектральное 142 Размерность алгебраического много- образия 253 — линейного пространства 14 — проективного пространства 220 Ранг матрицы 37 — семейства векторов 16 — скалярного произведения 99 — тензора 264, 294 ---- предельный 295 Расположение подпространств взаим- ное 40 Расстояние между множествами 119, 132 — — точками 69 — от точки до подпространства 209 Расширение группы аффинное 202 Ряд абсолютно сходящийся 70 — Пуанкаре 251 — теории возмущений 154 — Фурье 116 Свертка тензора 262, 269 ---- по индексам 263 ---- полная 263 Сдвиг 193 Семейство векторов линейно зави- симое 16 -------независимое 16 Сигнатура квадратичной формы ПО — пространства 104 Символ Кронекера 9 Симметризация тензора 271 Симплекс замкнутый 201 ----вырожденный 201 — («—1) -мерный стандартный 201 Система аффинных координат 197 — координат барицентрическая 199 — — инерциальная 173 — образующих идеала 248 ---- модуля однородная 249 — уравнений нормальная 122 След линейного оператора 33 301
Сложение матриц 29 Сопряжение 33 — дифференциальных операторов формальное 143 Состояние вакуумное 294 — квантовой системы 130 ------- базисное 131 -------возбужденное 152 •------вырожденное 152 ------- основное 152 ------- стационарное 151 Спаривание пространств 51 ---каноническое 51 Спектр квантовой системы энергети- ческий 151 — оператора 58 --- простой 58 — самосопряженного оператора 161 Спуск поля скаляров 78 Среднее арифметическое 13 — взвешенное 14 — квадратичное взвешенное 114 Статистика Бозе — Эйнштейна 293 — Фермн 293 Степень внешняя 287 — вырождения 151 — многообразия 253 Столбец матрицы 27 Стрелка 83 Строка матрицы 27 Структура комплексная 78 --- каноническая 78 ---сопряженная 81 Сумма линейных отображений пря- мая 44 — подпространств 38 --- прямая 41 -------внешняя 43 Суперпозиция 130 Сфера 69 Сходимость по норме 70 Тело 242 — кватернионов 168 Температура 125 Тензор 264, 268 — антисимметричный 275 — ковариантный 264 — контравариантный 264 — кососимметричный 275 — Кронекера 268 — метрический 267, 290 — симметричный 271 — смешанный 264 — структурный 265, 268 Теорема Витта 186 — Гамильтона — Кэли 60 — Дезарга 257 — инерции 105 — о продолжении базиса 17 Теорема о продолжении отображений 88, 89 ------точности функтора 89, 90 — Паппа 241, 243 — Фишера — Куранта 162 — Шаля 204 — Эйлера 137 — Якоби 114 Теория возмущений 152 — Морса 160 — относительности специальная 171 Тип тензора 264 Топология слабая 73 Точка аффинного пространства 193 — вещественная 230 — внутренняя 213 — критическая 160 — невырожденная 160 — проективного пространства 220 — центральная 216 Точность функтора тензорного умно- жения 264 Тройка точная 85 Углы Эйлера 170 Угол между векторами 119, 129 ------прямой и аффинным подпро- странством 212 ------прямыми 212 Умножение внешнее 275 — матриц 30 — на скаляр 22, 29 — тензорное 265 Уравнение Шрёдингера 151 Уровень энергетический 151 Условие Гильберта 13 — Коши 13 — линейное 10 Факторпространство 48 Фермион 293 Фильтр 148 Фильтрация возрастающая 18 — убывающая 18 Флаг пространства 18 --максимальный 18 Форма 95, 245 — билинейная 108 — квадратичная 109 ------ положительно определенная 113 — нормальная жорданова 59 — объема 291 — полилинейная 95 Функтор 85 — ковариантный 85 — контравариантный 85 —, представляющий объект катего- рии 87 — тензорного умножения 264 302
Функционал линейный 10 Функция аффинно линейная 195 — квадратичная 215 — линейная 10 — полилинейная 95 Характеристика эйлерова 91 Центр 216 Цепь 19 Цилиндр параболический 157 Часть анизотропная пространства 188 — квадратичная квадратичной функ- ции 215 — линейная аффинного отображения 195 --- квадратичной функции 215 Число заполнения 293 Шар замкнутый 69 — открытый 69 Шар п-мерный 124
Эквивалентность норм 72 Эксперимент Штерна — Герлаха 165 Экспонента ограниченного оператора 7 5 Элемент максимальный 20 — наибольший 20 — однородный 246 Эллипсоид п-мерный 124 Энергия 125 Ядро линейного отображения 26 ------- левое 102 — правое 102 — скалярного произведения 99 4-модуль 248 — градуированный 248 р-вектор 279 — разложимый 279 р-форма внешняя 285, 291 о-процесс 239 ф-функция 130 1-форма дифференциальная 289