Предисловие
Глава 1. Определители
§ 1.2. Основные задачи теории систем линейных уравнений
§ 1.3. Определитель n -го порядка
§ 1.4. Свойства определителей
§ 1.5. Алгебраические дополнения и миноры
§ 1.6. Практическое вычисление определителей
§ 1.7. Правило Крамера
§ 1.8. Миноры произвольного порядка. Теорема Лапласа
§ 1.9. О линейной зависимости между столбцами
Задачи
Глава 2. Линейные пространства
§ 2.2. Линейная зависимость
§ 2.3. Базис, координаты, размерность
§ 2.4. Подпространства
§ 2.5. Линейные оболочки
§ 2.6. Гиперплоскости
§ 2.7. Морфизмы линейных пространств
Задачи
Глава 3. Системы линейных уравнений
§ 3.2. Нетривиальная совместность однородной линейной системы
§ 3.3. Условие совместности общей линейной системы
§ 3.4. Общее решение линейной системы
§ 3.5. Геометрические свойства совокупности решений линейной системы
§ 3.6. Методы вычисления ранга матрицы
Задачи
Глава 4. Линейные функции векторного аргумента
§ 4.2. Линейные операторы и их матричная запись
§ 4.3. Действия над линейными операторами
§ 4.4. Соответствующие действия над матрицами
§ 4.5. Дальнейшие свойства умножения матриц
§ 4.6. Область значений и нуль-многообразие линейного оператора
§ 4.7. Линейные операторы, переводящие пространство К_n в себя
§ 4.8. Инвариантные подпространства
§ 4.9. Собственные векторы и собственные значения
Задачи
Глава 5. Преобразования координат
§ 5.2. Последовательные преобразования
§ 5.3. Преобразование координат вектора при изменении базиса
§ 5.4. Преобразование коэффициентов линейной формы
§ 5.5. Преобразование матрицы линейного оператора
§ 5.6. Тензоры
Задачи
Глава 6. Каноническая форма матрицы линейного оператора
§ 6.2. Алгебры; алгебра многочленов от одного переменного
§ 6.3. Каноническая форма матрицы произвольного оператора
§ 6.4. Элементарные делители
§ 6.5. Некоторые следствия
§ 6.6. Вещественная жорданова форма
§ 6.7. Спектры, корпусы и многочлены
§ 6.8. Функции от оператора и их матричная запись
Задачи
Глава 7. Билинейные и квадратные формы
§ 7.2. Квадратичные формы
§ 7.3. Приведение квадратичной формы к каноническому виду
§ 7.4. Канонический базис билинейной формы
§ 7.5. Построение канонического базиса по методу Якоби
§ 7.6. Сопряженные линейные операторы
§ 7.7. Изоморфизм пространств с выделенной билинейной формой
§ 7.8. Полилинейные формы
§ 7.9. Квадратичные и билинейные формы в вещественном пространстве
Задачи
Глава 8. Евклидовы пространства
§ 8.2. Определение евклидова пространства
§ 8.3. Основные метрические понятия
§ 8.4. Ортогональный базис
§ 8.5. Задача о перпендикуляре
§ 8.6. Общая теорема об ортогонализации
§ 8.7. Определитель Грама
§ 8.8. Несовместные системы линейных уравнений и метод наименьших квадратов
§ 8.9. Сопряженные операторы и изометрия
Задачи
Глава 9. Комплексные пространства со скалярным произведением
§ 9.2. Скалярное произведение в комплексном пространстве
§ 9.3. Нормальные операторы
§ 9.4. Применение унитарного пространства к теории операторов в евклидовом пространстве
Задачи
Глава 10. Квадратичные формы в евклидовом и унитарном пространствах
§ 10.2. Экстремальные свойства квадратичной формы
§ 10.3. Задача о паре квадратичных форм
§ 10.4. Приведение общего уравнения поверхности 2-го порядка к каноническому виду
§ 10.5. Геометрические свойства поверхностей 2-го порядка
§ 10.6. Анализ поверхности по ее общему уравнению
§ 10.7. Эрмитово-квадратичные формы
Задачи
Глава 11. Конечномерные алгебры и алгебры матриц
§ 11.2. Представления абстрактных алгебр
§ 11.3. Неприводимые представления и лемма Шура
§ 11.4. Основные типы конечномерных алгебр
§ 11.5. Строение левого регулярного представления простой алгебры
§ 11.6. Структура простых алгебр
§ 11.7. Структура полупростых алгебр
§ 11.8. Строение представлений простых и полупростых алгебр
§ 11.9. Некоторые дальнейшие результаты
Задачи
Глава 12. Категории конечномерных пространств
§ 12.2. Случай, когда все данные алгебры Re_alpha - полные
§ 12.3. Все данные алгебры Re_alpha - одномерные
§ 12.4. Все данные алгебры Re_alpha - простые
§ 12.5. Все данные алгебры Re_alpha - полные алгебры диагональных матриц
§ 12.6. Категории и прямые суммы
Ответы и указания к задачам
Предметный указатель
Текст
                    Г. Е. ШИЛОВ
МАТЕМАТИЧЕСКИЙ
АНАЛИЗ
КОНЕЧНОМЕРНЫЕ
ЛИНЕЙНЫЕ
ПРОСТРАНСТВА
Допущено Министерством
высшего и среднего специального образования CCQP
в качестве учебного пособия
для студентов университетов
ИЗДАТЕЛЬСТВО «НАУКА»
ГЛАВНАЯ РЕДАКЦИЯ
ФИЗИКО-МАТЕМАТИЧЕСКОЙ ЛИТЕРАТУРЫ
MOCK В А 19 6 9


517.2 Ш59 УДК 517 Математический анализ (конечномерные линейные пространства). Г. Е. Шилов. Книга представляет собой существенно переработанный вариант книги того же автора «Введение в теорию линейных пространств» (Гостехиздат, 1952 и 1956). Издание соответствует в основном программе университетского курса линейной алгебры и рассчитано в первую очередь на студентов математических, физических и других естественнонаучных специальностей. Для ее чтения необходимо, как правило, владение лишь элементарной математикой; в отдельных случаях используются сведения из математического анализа с соответствующими, отсылками. В главе 1 излагается теория определителей. В главах 2—7 рассматривается аффинная теория линейных пространств (над произвольным числовым полем), в главах 8—10 — теория евклидовых и унитарных пространств. В главе 11 описываются алгебры линейных операторов в конечномерных пространствах и в главе 12 — соответствующие категории. Георгий Евгеньевич Шилов МАТЕМАТИЧЕСКИЙ АНАЛИЗ Конечномерные линейные пространства М., 1969 г., 432 стр. с илл. Редакторы: М. С. Агранович, //. П. Рябенькая Техн' редакторы: В. Н. Крючкова, Л. А. Пыжова. Корректор Т. С. Вайсберг. Сдано в набор 3/111 1969 г. Подписано к печати 2/VI 1969 г. Бумага 84хЮ81/32. Физ. печ. л. 13,5. Условн. печ. л. 22,68. Уч.-изд. л. 21,25. Тираж 75 000 экз. T-06953. Цена книги у2 коп. Заказ №35 19. Издательство «Наука» Главная редакция физико-математической литературы Москва, В-71, Ленинский проспект, 15. Ордена Трудового Красного Знамени Первая Образцовая типография имени А. А. Жданова Главполиграфпрома Комитета по печати при Совете Министров СССР Москва, Ж-54, Валовая, 28 22-69
ОГЛАВЛЕНИЕ Предисловие 7 Глава 1. Определители 9 § 1.1. Числовые поля 9 § 1.2. Основные задачи теории систем линейных уравнений 11 § 1.3. Определитель п-го порядка 13 § 1.4. Свойства определителей 17 § 1.5. Алгебраические дополнения и миноры 21 § 1.6. Практическое вычисление определителей 25 § 1.7. Правило Крамера 26 § 1.8. Миноры произвольного порядка. Теорема Лапласа 30 § 1.9. О линейной зависимости между столбцами .... 33 Задачи 39 Глава 2. Линейные пространства 42 § 2.1. Определение 42 § 2.2. Линейная зависимость 47 § 2.3. Базис, координаты, размерность 51 § 2.4. Подпространства 55 § 2.5. Линейные оболочки 64 § 2.6. Гиперплоскости 66 § 2.7. Морфизмы линейных пространств 69 Задачи 73 Глава 3. Системы линейных уравнений 74 § 3.1. Еще о ранге матрицы 74 § 3.2. Нетривиальная совместность однородной линейной системы 76 § 3.3. Условие совместности общей линейной системы ... 78 § 3.4. Общее решение линейной системы 79 § 3.5. Геометрические свойства совокупности решений линейной системы 81 § 3.6. Методы вычисления ранга матрицы 83 Задачи 88 Глава 4. Линейные функции векторного аргумента 91 § 4.1. Линейные формы 91 § 4.2. Линейные операторы и их матричная запись ... 94 1*
4 ОГЛАВЛЕНИЕ § 4.3. Действия над линейными операторами 98 § 4.4. Соответствующие действия над матрицами 101 § 4.5. Дальнейшие свойства умножения матриц 106 § 4.6. Область значений и нуль-многообразие линейного оператора 112 § 4.7. Линейные операторы, переводящие пространство Кп в себя 118 § 4.8. Инвариантные подпространства 127 § 4.9. Собственные векторы и собственные значения . . .129 Задачи 135 Глава 5. Преобразования координат 140 § 5.1. Формулы перехода к новому базису 140 § 5.2. Последовательные преобразования 142 § 5.3. Преобразование координат вектора при изменении базиса 143 § 5.4. Преобразование коэффициентов линейной формы . . 146 § 5.5. Преобразование матрицы линейного оператора . . . 147 § 5.6. Тензоры 149 Задачи 155 Глава 6. Каноническая форма матрицы линейного оператора 157 § 6.1. Каноническая форма матрицы нильпотентного оператора 157 § 6.2. Алгебры; алгебра многочленов от одного переменного 161 § 6.3. Каноническая форма матрицы произвольного оператора 167 § 6.4. Элементарные делители 172 § 6.5. Некоторые следствия 179 § 6.6. Вещественная жорданова форма 181 § 6.7. Спектры, корпусы и многочлены 186 § 6.8. Функции от оператора и их матричная запись . . . 196 Задачи 204 Глава 7. Билинейные и квадратные формы 207 § 7.1. Билинейные формы 207 § 7.2. Квадратичные формы 211 § 7.3. Приведение квадратичной формы к каноническому виду 214 § 7.4. Канонический базис билинейной формы 220 § 7.5. Построение канонического базиса по методу Якоби 223 § 7.6. Сопряженные линейные операторы 227 § 7.7. Изоморфизм пространств с выделенной билинейной формой 231 § 7.8. Полилинейные формы 235 § 7.9. Квадратичные и билинейные формы в вещественном пространстве 237 Задачи 244
ОГЛАВЛЕНИЕ 5 Глава 8. Евклидовы пространства 246 § 8.1. Введение 246 § 8.2. Определение евклидова пространства 248 § 8.3. Основные метрические понятия 249 § 8.4. Ортогональный базис 256 § 8.5. Задача о перпендикуляре 257 § 8.6. Общая теорема об ортогонализации 261 § 8.7. Определитель Грама 266 § 8.8. Несовместные системы линейных уравнений и метод наименьших квадратов 271 § 8.9. Сопряженные операторы и изометрия 274 Задачи 278 Глава 9. Комплексные пространства со скалярным произведением 284 § 9.1. Эрмитовы формы 284 § 9.2. Скалярное произведение в комплексном пространстве 292 § 9.3. Нормальные операторы 298 § 9.4. Применение унитарного пространства к теории операторов в евклидовом пространстве 302 Задачи 312 Глава 10. Квадратичные формы в евклидовом и унитарном пространствах 313 § 10.1. Основная теорема о квадратичных формах в евклидовом пространстве 313 § 10.2. Экстремальные свойства квадратичной формы . . .316 § 10.3. Задача о паре квадратичных форм 325 § 10.4. Приведение общего уравнения поверхности 2-го порядка к каноническому виду 329 § 10.5. Геометрические свойства поверхностей 2-го порядка 333 § 10.6. Анализ поверхности по ее общему уравнению . . . 345 § 10.7. Эрмитово-квадратичные формы 354 Задачи 356 Глава 11. Конечномерные алгебры и алгебры матриц .... 358 § 11.1. Еще об алгебрах 358 § 11.2, Представления абстрактных алгебр 359 § 11.3. Неприводимые представления и лемма Шура . . . 360 § 11.4. Основные типы конечномерных алгебр 362 § 11.5. Строение левого регулярного представления простой алгебры 365 § 11.6. Структура простых алгебр 368 § 11.7. Структура полупростых алгебр 371
6 ОГЛАВЛЕНИЕ § 11.8. Строение представлений простых и полупростых алгебр 376 § 11.9. Некоторые дальнейшие результаты 381 Задачи 382 Глава 12. Категории конечномерных пространств 384 § 12.1. Введение 384 § 12.2. Случай, когда все данные алгебры £>а— полные . . . 388 § 12.3. Все данные алгебры $Ва— одномерные 391 § 12.4. Все данные алгебры $За— простые 397 § 12.5. Все данные алгебры 33а— полные алгебры диагональных матриц 405 § 12.6. Категории и прямые суммы 411 Ответы и указания к задачам 415 Предметный указатель 430
ПРЕДИСЛОВИЕ Эта книга предназначена в качестве учебного пособия для студентов младших курсов математических и физических специальностей. В ней излагается материал, обычно входящий в курс линейной алгебры и в дальнейшем обслуживающий различные разделы математического анализа. Следует заметить, впрочем, что название «линейная алгебра» давно уже не соответствует реальному содержанию курса, который представляет собой синтез идей алгебры, геометрии и анализа. И хотя анализ в точном смысле слова (т. е. отдел математики, связанный с пределами, дифференцированием, интегрированием) присутствует в книге явно лишь на втором плане, на самом деле он-то и является настоящим организатором курса, поскольку проблемы «линейной алгебры» можно считать «конечномерными проекциями» основных проблем анализа и в то же время «опорой» для них. Книга написана на основе нашей старой книги «Введение в теорию линейных пространств» (Гостехиздат, 1952 и 1956; далее ее именуем ВЛП). Различие между ВЛП и новой книгой, в кратких словах, следующее. В ВЛП речь шла исключительно о вещественных пространствах; в новой книге рассматриваются пространства над произвольным числовым полем, вещественный и комплексный случаи излагаются как специфические случаи общей теории, находящиеся в тесной связи друг с другом. Введена глава о жордановой форме матрицы линейного оператора в комплексном и вещественном пространстве. Для комплексного пространства со скалярным произведением рассмотрены канонические формы матриц нормальных операторов, из которых, как частные случаи, получаются канонические формы матриц эрмитовых, антиэрмитовых и унитарных операторов и их вещественных аналогов. Книга ВЛП заканчивалась большой главой о геометрии бесконечно-мерного гильбертова пространства; здесь такой главы нет (в ряде
8 ПРЕДИСЛОВИЕ других книг можно найти более систематическое изложение этого материала, относящегося скорее уже к функциональному анализу). Зато добавлены две новые главы, непосредственно примыкающие к основному содержанию курса: глава о структуре матричных алгебр (написанная по просьбе автора А. Я. Хелемским) и глава о строении матричных категорий (содержание которой взято из статьи И. М. Гель- фанда и автора, Вестник МГУ, Математика и механика, 1.963, № 4). Эти две главы, хотя и вполне элементарны по методам, все же несколько выше но уровню, чем остальные; они представляют линейную алгебру в ее развитии и могут быть использованы в факультативных занятиях. Каждая глава книги заканчивается рядом задач. В некоторой, но весьма небольшой мере они помогают выработке необходимых технических навыков (для этой цели лучше использовать ряд распространенных задачников с богатым выбором упражнений). В основном имеющиеся в книге задачи предназначены для иллюстрации и некоторого развития основного текста; циклы из некоторых задач могут служить темами для докладов на семинарах. Для этой же цели предназначены отдельные необязательные параграфы основного текста, выделенные звездочкой. Автор считает своим приятным долгом отметить тщательную работу М. С. Аграновича и принести ему благодарность за ряд весьма ценных замечаний. Автор благодарит также И. Я. Дорфман за проверку всех задач. Автор
ГЛАВА 1 ОПРЕДЕЛИТЕЛИ § 1.1. Числовые поля 1.11. Как и большая часть математики, линейная алгебра использует числовые системы (числовые поля). Числовым полем называют всякую совокупность К объектов, называемых числами, в которой можно производить с этими объектами четыре арифметических действия. Перечислим необходимые сведения об этих действиях (аксиомы поля). а. Каждой паре чисел а и Р отвечает число а+р, называемое суммой чисел а и Р, причем 1) а + (3 = Р + а для любых а и Р из К (переместительность, или коммутативность сложения); 2) (а 4- (3) +7==а+ (P + Y) Для любых а, р, у из К (сочетательность, или ассоциативность сложения); 3) существует число 0 (нуль) такое, что 0 + а = а для любого а из К; 4) для любого а из К существует число (3 из К такое, что a+[3 = 0 (противоположный элемент). Разрешимость уравнения а-|-[3 = 0 при любом а позволяет ввести операцию вычитания: разность а— [3 по определению есть сумма числа а и решения у уравнения (3 + у = 0. б. Каждой паре чисел а и Р отвечает число а-[3 (или оф), называемое произведением чисел а и р, причем 5) ар = Ра для любых а и Р из /^ (коммутативность умножения); 6) (а$)у = афу) для любых a, P, у из К (ассоциативность умножения); 7) существует число 1 (=^=0) такое, что l-a = a для любого числа а из К; 8) для любого а=£0 существует число у из К такое, что ау=1 (обратный элемент),
10 ГЛ. 1. ОПРЕДЕЛИТЕЛИ [1.12 Разрешимость уравнения a^^l при любома=^=0 позволяет ввести операцию деления на число а=^=0: частное ftyoc есть произведение числа (3 и решения у уравнения ау— 1. Числа 1 — 1=2, 2-j-l=3 и т. д. называются натуральными; предполагается, что ни одно из них не равно 0*). Натуральные числа, им противоположные и 0 образуют, по определению, совокупность целых чисел поля К. Частные p/q, где р и q — целые и (]Ф0, образуют совокупность рациональных чисел поля К. Два поля К и К' называются изоморфными, если между ними можно так установить взаимно однозначное соответствие, что сумма и произведение чисел поля К соответствуют сумме и произведению соответствующих чисел поля /<". (В этом случае результаты остальных операций — разности и частного — также будут соответствовать друг другу.) 1.12. Наиболее часто встречаются следующие примеры конкретных числовых полей. а. Поле рациональных чисел, т. е. отношений p\q, где р и q ф. 0— обычные целые числа с обычными арифметическими правилами действий. (Заметим, что одни только целые числа не образуют числового поля, так как в этом случае не выполнена аксиома 8).) Из сказанного выше следует, что в каждом поле Л'имеется часть (подполе), изоморфная полю рациональных чисел. б. Поле вещественных чисел, имеющее геометрическим образом совокупность всех точек прямой. Аксиоматика поля вещественных чисел получается добавлением к аксиомам 1)—8) аксиом порядка и аксиомы о точной верхней грани**). в. Поле комплексных чисел a-^-ib, где а и Ь вещественны (символ / не есть вещественное число), с правилами *) Из двух элементов, положим N и £, можно устроить поле по правилам /V + /V-/V, #+-£ = £, £ + £ = #, N-N--=N, N ■£ --=- N, £•£ — £. В соответствии с нашими обозначениями мы должны положить /V = 0, £=1, и тогда 2 = 1-|-1=0. Для исключения таких числовых систем мы и требуем, чтобы все натуральные элементы поля были бы отличными от 0. **) Теория вещественных чисел подробно излагается в нашей книге «Математический анализ (Функции одного переменного)», «Наука», 1969, гл. I. В дальнейшем обозначаем эту книгу через ФОП,
1.21] § 1.2. ЗАДАЧИ ТЕОРИИ СИСТЕМ ЛИНЕЙНЫХ УРАВНЕНИЙ И действий (ФОП, 2.71): (аг + ibx) + (а2 -4- ib2) = (ах + а2) + / (Ьг + ft2), (аг + ibx) • (а2-;- ib2) = {ala2 — blb2) + i{axb2 + a2bx). Для чисел вида а + /0 эти действия приводятся к одноименным действиям над вещественными числами а\ мы пишем коротко а -г /0 — а и называем эти комплексные числа вещественными. Можно сказать, что поле комплексных чисел содержит часть (подполе), изоморфную полю вещественных чисел. Комплексные числа вида 0-\-ib называются (чисто) мнимыми и короче обозначаются ib. Из правила умножения следует, что /2 = /./ = (0 + /1)(0 + Л)= —1. 1.13. Поле вещественных чисел в дальнейшем обозначается через R. Поле комплексных чисел обозначается через С. Согласно так называемой основной теореме алгебры (ФОП, 4.86), в поле С не только выполнимы четыре арифметические операции, но и разрешимо любое алгебраическое уравнение z» + fll2»-l+...+fl||==(). Поле R вещественных чисел не обладает этим свойством: например, уравнение л:2 + 1 = 0 не имеет решений в поле R. Многие из дальнейших построений справедливы для любого числового поля. Любое числовое поле мы будем обозначать в дальнейшем буквой К. Если некоторое предложение верно для поля /С, оно автоматически верно для поля R и поля С, которые являются частными случаями поля К. § 1.2. Основные задачи теории систем линейных уравнений 1.21. В этой и двух следующих главах мы будем заниматься изучением систем линейных уравнений. В самом общем случае такая система имеет следующий вид: апх1 -f а12х2 + . . . + а1пхп = blt \ «*i*i + Д*2*2 + • . . + aknxn - bk.
12 ГЛ. 1. ОПРЕДЕЛИТЕЛИ [1.21 Здесь через xY, х2, . . . , хп обозначены неизвестные (элементы поля К), подлежащие определению (заметим, что число неизвестных не предполагается обязательно равным числу уравнений). Числа аи, а12, . . . , акпУ взятые из поля Ку называются коэффициентами системы. Первый индекс коэффициента указывает номер уравнения, в котором фигурирует данный коэффициент, а второй индекс—номер неизвестного, при котором этот коэффициент поставлен*). Числа Ьъ Ь2} . . . , bky стоящие в правых частях равенства (1), ввятые из того же поля /С, называются свободными членами системы; как и коэффициенты, они предполагаются известными. Решением системы называется всякая совокупность чисел съ с2, . . . , сп из того же поля /С, которая, будучи подставлена в систему (1) на место неизвестных х1у х2} . . . , хп, обращает все уравнения системы в тождества **). Не всякая система линейных уравнений вида (1) имеет решение. Например, система 2^ + 3*2 = 5, \ 2*!+ 3*2 = 6 J ( ' заведомо не может иметь ни одного решения. Действительно, какие бы числа сь с2 мы ни подставили на место неизвестных х1} х2у левые части уравнений системы (2) окажутся совпадающими, в то время как правые части различны. Поэтому оба уравнения системы (2) такой подстановкой не могут быть одновременно обращены в тождества. Систему уравнений вида (1), имеющую (хотя бы одно) решение, мы будем называть совместной; систему, не имеющую решений, будем называть несовместной. Совместная система может иметь одно решение или более чем одно; в последнем случае для различения решений мы будем указывать их номера индексами наверху в скобках; например, первое решение с^\ с21}, . . . , с£\ второе решение с[2\ с{2\ . . . , с{2) и т. д. Решение с{?\ с(21}, . . . , с{пи и с[2\ с22), . . . , с{2) считаются различными, если хотя бы одно из чисел c\v не совпадает с соответствующим числом *) Поэтому, например, запись a3i должна читаться так: «а—три — четыре» (а не «а — тридцать четыре»). **) Подчеркнем, что совокупность чисел съ с2, ... , сп составляет одно решение системы (а не п решений).
1.31] § 1.3. ОПРЕДЕЛИТЕЛЬ tt-ГО ПОРЯДКА 13 cj2) (/=1, 2, ..., п). Например, система 2л:1 + 3л:2 = 0, (3) имеет различные решения с\ (1) (1). о, з, .(2) — 2 (а также бесконечное множество других решений). Если совместная система имеет единственное решение, она называется определенной; если совместная система имеет по крайней мере два различных решения, она называется неопределенной. 1.22. Мы можем сформулировать теперь те основные задачи, которые возникают при изучении системы (1): I. Выяснить, является система (1) совместной или несовместной. II. Если система (1) совместна, то выяснить, является ли она определенной. III. Если система (1) совместна и определенна, то найти ее единственное решение. IV. Если система (1) совместна и неопределенна, то описать совокупность всех ее решений. Основным математическим инструментом для изучения линейных систем является теория определителей; мы переходим теперь к ее изложению. § 1.3. Определитель л-го порядка 1.31. Пусть дана квадратная матрица, т. е. таблица из я2 чисел (элементов поля К) я,у(*\ У=1, 2, .. . , п): -1/1 (4) Число п, указывающее количество строк и столбцов матрицы (4), называется ее порядком. Числа а/у- называются элементами матрицы А\ первый и второй индексы у элемента а^ указывают соответственно номер строки и столбца, в которых расположен этот элемент. Элементы ап, а22, . . . , апп образуют главную диагональ матрицы Л. Рассмотрим любое произведение п элементов, расположенных в различных строках и различных столбцах матрицы (4),
14 ГЛ. 1. ОПРЕДЕЛИТЕЛИ 11.31 т. е. по одному в каждой строке ив каждом столбце. Такое произведение можно записать в виде <*«,! Яа,2 • • • <**„„• (5) Действительно, в качестве первого сомножителя мы всегда можем взять элемент, стоящий в первом столбце матрицы (4); если обозначить через аг номер строки, в которой находится этот элемент, то индексы этого элемента будут ах и 1. Аналогично в качестве второго сомножителя можно взять элемент, стоящий во втором столбце; его индексы будут а2 и 2, где а2—номер той строки, в которой расположен этот второй элемент; и т. д. Таким образом, индексы а1? а2, . . . , ап являются номерами строк, в которых расположены сомножители произведения (5), в соответствии с принятым порядком их записи по возрастанию индексов столбцов. Так как по условию элементы аа1, а0 2, . . ., аа п расположены в различных строках матрицы (4), по одному в каждой строке, то числа а1у а2, . . . , ап все различны и представляют собой некоторую перестановку чисел 1, 2, ..., п. Назовем «беспорядком) в этой последовательности аь а2, . . . , ап такое расположение индексов, когда старший индекс стоит раньше младшего. Число всех «беспорядков» обозначим через N(а1у а2, ... , ап). Например, в перестановке четырех цифр 2, 1, 4,3 — два «беспорядка» (2 впереди 1, 4 впереди 3); таким образом, N(2, 1, 4, 3) = 2. В перестановке 4, 3, 1, 2 — пять «беспорядков» (4 впереди 3, 4 впереди 1, 4 впереди 2, 3 впереди 1, 3 впереди 2); поэтому tf(4, 3, 1, 2) = 5. Если число беспорядков в последовательности а1у .. . , ап четно, поставим перед произведением (5) знак-}-; если это число нечетно, поставим перед этим произведением знак — . Иными словами, условимся перед каждым произведением вида (5) писать знак, определяемый выражением (_ \у\т «zlf а2, ... , а;1).
Число всех произведений вида (5), которые можно составить из элементов данной матрицы /z-ro порядка, равно числу всех возможных перестановок чисел 1, 2, . . . , п, которое, как известно, равно п\. Теперь введем следующее определение: Определителем матрицы (4) называется алгебраическая сумма, состоящая из п\ всевозможных произведений вида (5), перед каждым из которых поставлен знак, определенный по указанному выше правилу: D = 2J(-l)"(ai'a|i -'a»}aailaa22...aann. (6) В дальнейшем произведения вида (5) мы будем называть членами определителя. Элементы a(j матрицы (4) будем называть элементами определителя. Определитель матрицы (4) обозначается одним из следующих символов: D- Лп 21 а., о. •п\ . а, = det|!ai}|| = detj|a/y.[!/,/= i,2, ...,«■ (7) Например, для определителей 2-го и 3-го порядка мы получаем следующие выражения: ап аи ап апа22—а21а121 — ДцЙ.22^33 ~Г #21С32Й13 "f" Й31^12Й23 —031^22^13 — ^21^12^33 ^11^32^23* Роль определителей при решении систем линейных уравнений мы покажем на примере системы из двух уравнений с двумя неизвестными. Если дана система ^21*^1 ~~Г~ ^22*^2 =~ ^2' то, исключая обычным образом одно из неизвестных, можно легко получить формулы bia-i-i — b.2al2 ы _ onb2 — о.пЬг *\ = «11^22 —a21«12 *., #11^22— a21012 в предположении, что знаменатели этих отношений отличны от нуля. Числители и знаменатели получающихся дробей представляют собой
16 ГЛ. 1. ОПРЕДЕЛИТЕЛИ [1.32 определители 2-го порядка: ^1^22 — ^2<312 — Оказывается, что аналогичные формулы имеют место и для решения систем с любым числом неизвестных (см. § 1.7). #21 #22 t>2 Я2о 1.32. Правило для определения знака данного члена определителя можно сформулировать несколько иначе, в геометрических терминах. В матрице (4) в соответствии с нумерацией элементов естественно выделяются положительные направления: слева направо — вдоль строк, сверху вниз — вдоль столбцов. Вместе с этим и косые отрезки, соединяющие два каких-либо элемента матрицы, можно снабдить указанием направления: будем говорить, что отрезок, соединяющий элемент а^ с элементом akm} имеет положительный наклон, если его правый конец расположен ниже левого, и отрицательный наклон, если его правый конец лежит выше, чем левый. Теперь проведем мысленно в матрице (4) все отрезки, соединяющие попарно элементы attli, #а22, ••• , #апл произведения (5) и при этом имеющие отрицательный наклон. Будем ставить перед произведением (5) знак +, если число всех таких отрезков четно, и знак—, если их число нечетно. Например, в случае матрицы 4-го порядка перед произведением а21а12<243Яз4 должен быть поставлен знак +, так как в матрице имеется два отрезка отрицательного наклона, соединяющих элементы данного произведения: Яи fe>) ^13 Ям &2П U22 #23 ^24 Й41 С42 ^4з) #44 а перед произведением ^4iQ32ai3a24 должен быть поставлен знак —, так как в матрице имеется пять отрезков с отрицательным
1.41] § 1.4. свойства определителей 17 наклоном, соединяющих его элементы: В этих примерах количество отрезков отрицательного наклона, соединяющих элементы данного члена, равно числу «беспорядков» в расположении первых индексов элементов, составляющих в произве- нии данный член: в первом примере последовательность первых индексов 2, 1, 4, 3 имеет два «беспорядка», во втором примере последовательность первых индексов 4, 3, 1,2 имеет пять «беспорядков». Покажем, что второе определение знака члена определителя равносильно первому. Для этого достаточно показать, что число «беспорядков» в последовательности первых индексов элементов данного члена (при натуральном порядке вторых индексов) всегда равно числу отрезков отрицательного наклона, соединяющих элементы данного члена в матрице. Но это почти очевидно: наличие отрезка отрицательного наклона, соединяющего элементы aaii и aa.jy означает при / < у, что а,- > а,-, т. е. наличие «беспорядка» в расположении первых индексов. См. задачи 1—3 (в конце этой главы). § 1.4. Свойства определителей 1.41. Операция транспонирования. Определитель \ап а21 . #12 #22 • а1п а2п . . • аш\ • Я/12 • апп\ полученный из определителя (7) заменой строк на столбцы с теми же номерами, называется транспонированным по отношению к определителю (7). Покажем, что величина транспонированного определителя совпадает с величиной исход- ного определителя. Действительно, определители (7) и (8) состоят, очевидно, из одних и тех же членов; поэтому нам
достаточно показать, что одинаковые члены обладают в определителях (7) и (8) и одинаковыми знаками. Транспонирование матрицы определителя, очевидно, есть результат ее поворота (в пространстве) на 180° вокруг диагонали яп, д22, . . ., апп. При этом повороте каждый отрезок с отрицательным наклоном (например, образующий угол а < 90° со строками матрицы) переходит снова в отрезок с отрицательным наклоном (именно, образующий со строками матрицы угол 90° — а). Поэтому число отрезков с отрицательным наклоном, соединяющих элементы данного члена, после транспонирования не изменится; следовательно, не изменится и знак этого члена. Таким образом, знаки всех членов сохранятся; тем самым величина определителя остается неизменной. Доказанное сейчас свойство определителя устанавливает равноправие его строк и столбцов. Поэтому дальнейшие свойства определителей мы будем формулировать и доказывать только для столбцов. 1.42. Свойство антисимметрии. Под антисимметрией относительно столбцов понимают свойство определителя менять знак при перестановке двух столбцов. Рассмотрим сначала случай, когда переставляются два соседних столбца определителя, например у'-й и (у+1)-й. Определитель, полученный после перестановки столбцов, будет состоять, очевидно, из тех же самых членов, что и исходный определитель. Рассмотрим какой-нибудь из членов исходного определителя. Этот член в своем составе имеет элемент из у'-го столбца и элемент из (y-f-l)-ro столбца. Если отрезок, соединяющий эти два элемента, имел отрицательный наклон, то после перестановки столбцов его наклон станет положительным, и наоборот. Что же касается остальных отрезков, соединяющих попарно элементы выделенного члена, то после перестановки столбцов характер наклона каждого из них останется неизменным. Следовательно, количество отрезков с отрицательным наклоном, соединяющих элементы данного члена, при перестановке столбцов заведомо изменяется на единицу; поэтому каждый член определителя, а следовательно, и сам определитель, при перестановке столбцов меняет знак. Пусть теперь переставляются не соседние столбцы, а, например, у-й столбец с &-м столбцом, причем между
Ь44] § 1.4. свойства определителей 19 ними находится т других столбцов и у<&. Эту перестановку можно осуществить последовательными перестановками соседних столбцов в следующем порядке: сначала у-й столбец переставляется с (у + 1)-м, далее с (у+2)-м, (у + 3)-м,... . ..,&-м, затем получившийся (k— 1)-й столбец (ранее бывший &-м) переставляется с (k — 2)-м, (&— 3)-м, ..., у-м. Всего понадобится т-\- 1 + т--= 2т-~-1 перестановок соседних столбцов; после каждой из них, по доказанному, определитель изменяет знак и, следовательно, после конца процесса будет иметь знак, противоположный начальному (поскольку 2т-\-\ при любом целом т есть нечетное число). 1.43. Следствие. Определитель, имеющий два одинаковых столбца, равен нулю. В самом деле, переставляя эти столбцы, мы не изменим определителя; с другой стороны, по доказанному, он должен изменить свой знак. Таким образом, D= —D, откуда следует, что D = 0. См. задачу 4. 1.44. Линейное свойство определителя. Это свойство формулируется следующим образом: а. Если все элементы j-го столбца определителя D представлены в виде «линейной комбинации» двух слагаемых djj.^Xbi + iiCi (/-1, 2, . . ., п) (к и (я — фиксированные числа), то определитель D равен такой же линейной комбинации двух определителей: D^KD^-ixD^ (9) причем у каждого из этих двух определителей все столбцы, кроме j-го, такие же, как у определителя D, а j-й столбец состоит у определителя Dx из чисел bi} у определителя D2 — из чисел ct. Действительно, всякий член определителя D можно представить в виде <1ах\а*г2- • -До,-/. • -йапп = ^1^2. • •(^boLj + V'Caj). . . аапП = = kaai\aa22. . -bay • • Я«пл+ Н'ла11Да22- • -Caj- • -^апп- Собирая вместе первые слагаемые (с теми знаками, которые
20 ГЛ. 1. ОПРЕДЕЛИТЕЛИ [1.45 имели соответствующие члены первого определителя) и вынося за скобки число %} получим в скобках, очевидно, определитель Dx; аналогично, собирая вторые слагаемые и вынося за скобки число |1, получим определитель D2. Таким образом, формула (9) установлена. Эту формулу удобнее записать в несколько ином виде. Пусть D — произвольный фиксированный определитель. Обозначим через Dj(pf) определитель, который получается при замене элементов у-го столбца определителя D на числа pi (/=1, 2, ..., п). Исходный определитель можно записать в форме D (djj). Тогда доказанное нами равенство (9) принимает вид Dj(ibi + iLci) = %Dj(bi) + \JiDj(ci). б. Линейное свойство определителя без труда распространяется на тот случай, когда каждый элемент у-го столбца есть линейная комбинация любого фиксированного числа слагаемых: <*ij=bbi + iLci+...+%fi; в этом случае D; (atJ) = Dj (Ui + №+ ... + т/,.) = = bDJ(bi) + \iDJ(ci)+ ...+TDj(fi). (10) 1.45. Следствие. Общий множитель всех элементов некоторого столбца определителя можно вынести за знак определителя. В самом деле, если aij~'kbi, то по формуле (10) DJ(aiJ)=Dj(Ui)^%Dj(bi), что и утверждается. 1.46. Следствие. Если некоторый столбец определи- теля состоит целиком из нулей, то определитель равен нулю. В самом деле, 0 есть общий множитель элементов данного столбца; вынося его за знак определителя, получим Dy(0) = Dy(0.1) = 0-Dy(l) = 0. См. задачу 5. 1.47. Прибавление к одному столбцу другого столбца с произвольным множителем. а. Определитель не изменится, если к элементам одного из его столбцов прибавить соответствующие элементы любого другого столбца, умноженные на фиксированное число.
1*51] § 1.5. АЛГЕБРАИЧЕСКИЕ ДОПОЛНЕНИЯ И МИНОРЫ 21 Пусть к у-му столбцу прибавляется &-й (кф]), умноженный на число \. В полученном определителе у-й столбец будет состоять из элементов вида а^--\-Ха{к (/=1,2, . . ., я). В силу формулы (9) Dj (au+%aik) = Dj (а„) + X Dj (aik). Во втором определителе у-й столбец состоит из элементов aik} т. е. совпадает с k-м столбцом. По следствию 1.43 Df(aik) = 0, откуда Dj{aij+'kaik) = Dj{aij)i что и требуется. б. Разумеется, свойство а можно сформулировать в более общей форме: определитель D не изменится, если к элементам его j-го столбца прибавить соответствующие элементы k-го столбца, умноженные на число Ху затем элементы 1-го столбца, умноженные на число [X, . . ., элементыр-го столбца, умноженные на число т (кф], I ф], . .., рф})- См. задачу 6. 1.48. Все свойства, доказанные нами в этом параграфе для столбцов определителя, в силу неизменности определителя при транспонировании (1.41) остаются справедливыми и для его строк. § 1.5. Алгебраические дополнения и миноры 1.51. Рассмотрим произвольный, например у-й, столбец определителя D. Пусть а/у-—некоторый элемент этого столбца. В правой части равенства (6) задающего определитель D, соберем все члены, содержащие элемент а,-., заключим их в скобки и вынесем за эти скобки элемент а/у-. Величина, оставшаяся в скобках, обозначается через Atp она называется алгебраическим дополнением элемента atj- в определителе D. Так как в каждый член определителя D входит элемелт из у-го столбца, то равенству (6) можно придать теперь вид D = ауАг/ + a2JA2/ + . . . + anJAnJ, (11)
22 ГЛ. 1. ОПРЕДЕЛИТЕЛИ [1.52 Формула (11) называется формулой разложения определителя D по элементам j-го столбца. Разумеется, аналогичную формулу можно написать и для любой строки определителя D; например, для /-й строки мы получим такое равенство: D = anAil + ai2Ai2+ . . .+ainAin. (12) Мы получили теорему. Теорема. Сумма всех произведений элементов какого* нибудь столбца (или строки) определителя D на соответствующие алгебраические дополнения равна самому определителю D. Формулы (11) и (12) можно использовать для вычисления определителя. Но при этом необходимо уметь вычислять алгебраические дополнения; правила для их вычисления мы приведем в 1.54. 1.52. Отметим одно следствие формул (11) и (12), которое будет в дальнейшем использовано. Равенство (11) выполняется тождественно относительно величин aljy a2j-, . . ., anj\ поэтому оно останется справедливым, если заменить в нем а/у.(/=1, 2, ..., п) на любые другие величины. При такой замене величины Л1у-, Л2у-, . . ., Ап} остаются неизменными, поскольку они не зависят от элементов a{j. Заменим в правой и левой частях равенства (11) элементы а1у., а2,, . . ., anj- на соответствующие элементы какого-нибудь другого, например /е-го, столбца. Тогда определитель слева в (11) будет иметь два одинаковых столбца и по 1.43 будет равен нулю. Мы получаем равенство (при k ф j) aikAl/+a2kA2/ + • • •+ankAn/=°- (13) Аналогично из формулы (12) при / Ф i получаем <*iiA-i + <*i2Ai2+ • • • +amAin = °- О4) Итак, мы доказали теорему: Теорема. Сумма всех произведений элементов какого- нибудь столбца (или какой-нибудь строки) определителя D на алгебраические дополнения соответствующих элементов другого столбца (строки) равна нулю. 1.53. Если зачеркнуть в матрице л-го порядка некоторую строку и некоторый столбец, то оставшиеся элементы, ее-
1-53] § 1.5. АЛГЕБРАИЧЕСКИЕ ДОПОЛНЕНИЯ И МИНОРЫ 23 тественно, образуют некоторую матрицу (п—1)-го порядка. Определитель этой матрицы называется минором данной матрицы п-го порядка (а также минором ее определителя D). Если были зачеркнуты /-я строка и у'-й столбец, то полученный минор обозначается через M{j- или M(j(D). Мы докажем, что имеет место равенство Аи=(-\)*Ши, (15) с помощью которого вычисление алгебраических дополнений сводится к вычислению соответствующих миноров. Доказательство равенства (15) проведем сначала для случая /=1, у=1. Соберем в правой части равенства (6) все члены, содержащие элемент аХ1. Рассмотрим один из таких членов. Очевидно, что произведение всех его элементов, за исключением аП} дает некоторый член с минора Ми. Так как в матрице определителя D нет отрезков с отрицательным наклоном, соединяющих элемент ап с остальными элементами выделенного члена, то знак, который приписывается члену а1Хс определителя D, совпадает со знаком, который приписывается члену с в миноре Мп. Выбирая должным образом член определителя D, содержащий элемент а11} и зачеркивая alv можно получить любой член минора Мп. Поэтому рассматриваемая алгебраическая сумма всех членов определителя D, содержащих ап, равна произведению ПцМп. Но согласно 1.51 эта сумма равна произведению апАп. Следовательно, Ли = МП} что и требуется. Теперь мы докажем формулу (15) при любых / и у. То обстоятельство, что при /=у=1 эта формула справедлива, будет нами существенно использовано. Рассмотрим элемент a{-j=ay расположенный на пересечении /-й строки и у-го столбца определителя D. Переставляя последовательно соседние строки и столбцы, мы можем перевести элемент а в левый верхний угол матрицы; для этого понадобится /—1+у—1— / + у — 2 перестановок. В результате мы получим определитель Dx с теми же членами, какие будет иметь исходный определитель D, если его умножить на (—1)|Ч-/-2=(—1)|ЧЛ Минор Mn(Dl) определителя Dx, очевидно, совпадает с минором M{j(D) определителя D. По доказанному, в определителе Dx члены, содержащие элемент а, составляют в сумме величину аМп (Ог). Поэтому в составе исходного определителя D члены, содержащие элемент at-= a,
24 ГЛ. 1. ОПРЕДЕЛИТЕЛИ [1.54 образуют в сумме величину (_1 )i+/aMn (DJ = atJ (-\)i+mu (D). Но согласно 1.51 эта же сумма равна произведению fl/уДу. Следовательно, А^-=(—\)Hj'Mij'f тем самым формула (15) доказана полностью. 1.54. Формулы (11) и (12) можно теперь записать соответственно в форме D= (_1)1+Ув1уЖ1у+ (-\)*+/atjMy+ ...+ (-1)»+ЧД/, 0=(-\У+1апМп + {-\)"-*а,,Мь+ .. . +(-\)'+»aiaMia, в которой они обычно и употребляются. 1.55. Примеры. а. Определитель третьего порядка допускает шесть различных разложений (три по строкам и три по столбцам). Например, разложение по первой строке имеет вид «11 «12 «13 «21 «22 «23 «31 «32 «33 б. Определитель п-го порядка = «11 «22 «23 «32 «33 — «12 «21 «23 «31 «33 + «13 «21 «22 «31 «32 Dn О О «21 «22 0 ... О «31 «32 «33 • • • ° Я/11 «Л2 ««3 • • • «; называется треугольным. Разлагая его по первой строке, получим, что определитель Dn равен произведению элемента ап на треугольный определитель (п—1)-го порядка 022 0 • • • О «32 «33 • • • ° Яп-: 1п2 ипЗ Определитель D„_i снова разложим по первой строке; получим /)w_1 = (222Dw_2, где D„«2 — треугольный определитель (п — 2)-го порядка. Продолжая таким образом далее, в конце концов получим Dn = all a22 ... апп, т. е. треугольный определитель равен произведению элементов, стоящих на его главной диагонали.
Ь62] § 1.6. ПРАКТИЧЕСКОЕ ВЫЧИСЛЕНИЕ ОПРЕДЕЛИТЕЛЕЙ 25 § 1.6. Практическое вычисление определителей 1.61. Формула (12) приобретает особенно простой вид, когда все элементы /-й строки, кроме одного, например aik, равны нулю. В этом случае D=aikAih, (16) и вычисление определителя D п-го порядка непосредственно приводится к вычислению определителя (п — 1)-го порядка. Но если при а;кфО в /-й строке есть элемент а/у-, также не равный нулю, то мы можем вычесть из у-го столбца опре- aif делителя D k-Pi столбец, умноженный на X— —; в резуль- aik тате мы получим определитель, равный исходному (1.47), у которого у-й элемент /-й строки уже равен нулю. Повторяя аналогичные операции, мы можем от любого определителя с фиксированным элементом а1кФО перейти к определителю, у которого все элементы /-и строки, кроме aik, равны нулю, и вычислить его по формуле (16). Разумеется, аналогичные преобразования можно производить и со столбцами определителя. 1.62. Пример. Вычислим определитель 5-го порядка D = В третьем столбце этого определителя уже имеется два нуля. Чтобы получить в этом столбце еще два нуля, нужно ко второй строке прибавить утроенную пятую, а из четвертой строки вычесть учетверенную пятую. После этой операции и разложения определителя по третьему столбцу мы получаем 2 1 3 2 0 5 0 — 1 6 —3 0 3 0 —4 — 1 — 1 7 5 1 2 3 —2 с; о 2 3 =(-1) 2 5 ( 1 —9 ( 3 -1 ( 2 18 ( 0 -3 - 3 + 5.(-1) 3 —1 3 3 13 7 3 5 —5 3 —7 —10 1 2 3 —2 5 —1 1 —9 \2 3 —1 £ 2 18 —7 = 3 \ 7 ) -5 ' —10 = — -2 5 -1 1 —9 13 3—1 5 2 18 —7 3 7 —5 — 10
26 ГЛ. I. ОПРЕДЕЛИТЕЛИ [1.71 Теперь проще всего получить три нуля в первом столбце: для этого мы прибавим к первой строке удвоенную вторую, а из третьей и четвертой строк вычтем вторую, соответственно утроенную и удвоенную: D = 2 5 1 —9 3 —1 2 18 1)1 + 2 — 1 3 13 7 5 -5 —7 —10 -13 25 26 —34 36 —33 = — 17 —26 —24 0 1 0 0 • — 13 -9 26 36 25 13 —34 —33 17 7 —26 -24 Чтобы легче было вычислить полученный определитель 3-го порядка, постараемся уменьшить абсолютные величины его элементов. Для этого после вынесения из второй строки общего множителя 2 прибавим вторую строку к первой и из третьей строки вычтем удвоенную вторую: D = 2 13 25 13 —17 36 —33 17 -13 -24 -2 0 13 - 10 8 -17 1 4 — 13 2 = 2-4 0 13 10 2 -17 1 1 -13 2 В первой строке имеется уже один нуль. Чтобы получить еще один нуль, вычтем из второго столбца удвоенный третий; после этого определитель легко вычисляется до конца: D = 8 = 8-3 О 13 10 13 10 2 1 17 —13 1 2 3 -1 -8 0 13 10 8(—1)1 + 3 13 9 10 —3 8-3(—13—30) = —8-3-43 = —1032. См. задачи 7—10. § 1.7. Правило Крамера 1.71. Мы можем перейти теперь к решению систем линейных уравнений. Рассмотрим сначала систему специального вида апх1 + а12х2-\ ...+а1пхп =Ьг, \ «21*1 + а22х2 4- . . . + а2пхп - ft2, { ani*i + 0*2*2 + • • • + аппхп = Ьп ) с числом неизвестных, равным числу уравнений. Коэффициенты a{j (/, У=1, 2, . . ., п) образуют основную матрицу системы, относительно которой мы предположим, что ее определитель D отличен от нуля. Мы покажем, что такая (17)
1.71] § 1.7. ПРАВИЛО КРАМЕРА 27 система всегда совместна и определенна, и получим формулу для вычисления ее единственного решения. Допустим сначала, что система (17) имеет некоторое решение с1У с2, ..., сп\ справедлива, следовательно, система равенств allcl + аис2 + . . . -[- а1псп = bv ^21^1 "i- ^22^2 i • • • ~Т ^2п^п — 2» (18) anlCl "Г ««2С2 -Г annCn = t>n. Умножим первое из равенств (18) на алгебраическое дополнение Ап к элементу ап в матрице системы, далее умножим второе равенство на Л21, третье — на А31 и т. д., пока не дойдем до последнего равенства; затем все полученные равенства сложим. В результате мы получим следующее соотношение: (апАп + а21А.п fl«Ai)crr Ь(Й12^11 + й22^ 21 <Wl,l)C2T + (ainAll + «2,И21 + • • • + ^,Al) Сп = = Mn-!-M2i-r...+M«i- (19) В силу теоремы 1.51 коэффициент при сх в соотношении (19) равен самому определителю D; в силу теоремы 1.52 коэффициенты при всех остальных су- {]ф\) обращаются в нуль. Выражение в правой части есть разложение определителя Di = In a« rrt по первому его столбцу; поэтому равенство (19) можно теперь записать в виде D-c^^ — D^ откуда fl~ D ■ Совершенно аналогично можно получить выражение (У=1, 2, ..., п), (20) D
28 ГЛ. 1. ОПРЕДЕЛИТЕЛИ [1.72 где DJ = *l,/-l bl aUJ '2,/-1 ' + 1 ^2 Й2,/+1 In '2л '/ii/-l ^71 Й«,/+1 = Я/&) есть определитель, полученный из определителя D заменой его /-го столбца на столбец из чисел bly Ь2, ..., Ьп. Мы получили следующий результат: Если решение системы (17) существует, то оно выражается через коэффициенты системы и правые части по формулам (20). В частности, мы получаем, что решение системы (17), если оно существует, единственно. 1.72. Теперь остается показать^ что решение системы (17) всегда существует. Подставим величины */ = %• (7=1, 2, ..., п) в систему (17) на место неизвестных х1у х2, ..., хп. Покажем, что все уравнения системы (17) при этом обращаются в тождества. Действительно, для /-го уравнения мы получаем 0i D, Dn ailcl + ai2c2+ . ..+аысп = ап — +а!2-^+ ...+ain — = = ~о K'l (Мп + М21 + • • • + M„i) + + А/2 (Ml2 + М22 Т ■ • • + Мя2) + + ain (Ml„ + М*. + • • • T MnJ] = "д [&1 («/ИИ + fl/2^12 + • • • + */,A>i) + + */(в/И/1+А|.2/1|.. + *B(fl«A + e/A2 + А/И/я) + fl/AB)]- Из всех скобок, служащих коэффициентами при величинах bv b2, ..., £„, отлична от нуля в силу теорем 1.51 и 1.52 только одна, именно та, которая стоит при величине Ь(\
1.74] § 1.7. ПРАВИЛО КРАМЕРА 29 она равна самому определителю D. Следовательно, полученное выражение приводится к виду т. е. совпадает с правой частью /-го уравнения системы, 1.73. Итак, величины Cj действительно образуют решение системы (17). Тем самым мы установили следующее правило для получения решения системы (17) [правило Крамера): Если определитель системы (17) отличен от нуля, то она имеет одно и только одно решение: значение неизвестного Xj равно дроби, знаменателем которой является определитель системы (17), а числителем — определитель, получающийся заменой j-го столбца в определителе системы (17) на столбец из правых частей системы (/'=1, ..., /z). Отыскание решения системы (17), таким образом, сводится к вычислению определителей. См. задачу 11. Способы решения более общих систем (с определителем, равным нулю, или с числом уравнений, не равным числу неизвестных) будут даны в двух следующих главах. 1.74. Замечание. Иногда встречаются системы линейных уравнений, свободные члены которых являются не числами, а векторами (в аналитической геометрии, в механике). Теорема Крамера и ее вывод остаются справедливыми и для этого случая; следует иметь только в виду, что и значения неизвестных хъ х2} ..., хп также будут не числами, а векторами. Например, система x1 + x2 = i — 3j\ x1 — x2 = i + 5j имеет решение (единственное) cx = i + j\ c2 = — 4j.
30 ГЛ. 1. ОПРЕДЕЛИТЕЛИ [1.81 § 1.8. Миноры произвольного порядка. Теорема Лапласа 1.81. Теорема 1.51 о разложении определителя по строке или столбцу является частным случаем более общей теоремы о разложении определителя по целой совокупности строк или столбцов. Прежде чем сформулировать эту общую теорему (теорему Лапласа), введем некоторые новые определения. Пусть в квадратной матрице п-го порядка указаны произвольно k^n различных строк и столько же различных столбцов. Элементы, стоящие на пересечениях этих строк и столбцов, образуют квадратную матрицу порядка k; ее определитель называется минором k-го порядка данной матрицы /z-ro порядка (а также минором &-го порядка определителя D) и обозначается через где iv /2, . . ., ik — номера выделенных строк, a jv /2, . . ., jk — номера выделенных столбцов. Если зачеркнуть в исходной матрице строки и столбцы, в которых лежит минор Ж, то оставшиеся элементы снова образуют квадратную матрицу порядка п — k\ ее определитель называется минором, дополнительным к минору М, и обозначается символом Тл ._ Тл [и (г, • • •. h m — m Ju j2 /fc, где индексы указывают номера вычеркнутых строк и столбцов. В частности, если исходный минор имеет порядок 1, т. е. совпадает с некоторым элементом ai}- определителя D, то дополнительный минор совпадает с минором Ж/у-, о котором шла речь в 1.53. Рассмотрим минор м1 = ж!; !•.;:;;£, лежащий в первых k строках и первых k столбцах определителя D; минор, дополнительный к нему, есть минор Af^Af^Aflii;:::;^. Выделим в правой части формулы (6) все те члены определителя, в которых первые k элементов принадлежат ми-
1.81] § 1.8. миноры произвольного порядка 31 нору М1% а следовательно, остальные п — к элементов — минору Мх. Фиксируем сначала один из таких членов с тем, чтобы определить знак, который должен быть ему приписан; обозначим этот члеп через с. Первые к элементов этого члена определяют некоторый член сл минора Мг; обозначим через Nx число соответствующих отрезков отрицательного наклона; тогда знак, который должен быть поставлен перед членом сл в миноре уИх, определяется выражением (— 1)лг». Остальные п — к элементов члена с определяют некоторый член с2 минора М2\ знак, который должен быть поставлен перед этим членом в миноре Л42, определяется выражением (—1)^2, где N2— число соответствующих отрезков отрицательного наклона в миноре М2. Поскольку в матрице определителя D нет ни одного отрезка с отрицательным наклоном, который соединял бы элемент минора М1 с элементом минора М2У общее число отрезков отрицательного наклона, соединяющих элементы члена с, равно сумме N1J-N2. Поэтому знак, который следует поставить перед членом с в определителе D, определяется выражением (— 1 )A'i+ Л"г ^ следовательно, равен произведению знаков членов сг и с2 в минорах Мх и М2. Заметим, далее, что произведение любого члена минора М1 на любой член минора М2 дает нам один из выделенных членов определителя D. Отсюда вытекает, что сумма всех выделенных членов в выражении определителя D по формуле (6) равна произведению миноров Мх и М2. Теперь мы получим похожий результат для произвольного минора АД _ АЛ1У '.2 '> с дополнительным минором Л12. Переставляя последовательно соседние строки и столбцы, мы можем минор Мх перевести в левый верхний угол определителя D; для этого понадобится всего (/j—l)-i-'(/2 -2) 4- ... +(/* — k) + (j\—\) + + (у2 — 2) 4 • • • + (Л — ^) перестановок. В результате мы получим определитель Dx с теми же членами, какие будет иметь исходный определитель D, если его умножить на (— 1)'Ч где / = /\ + '2+ ••• +''*, У = Л +Л+ ••• +Л- По доказанному, в определителе Dx сумма всех тех членов, первые к элементов которых входят в минор Mv равна произведению МХМ2. Отсюда следует, что сумма соответ-
32 ГЛ. 1. ОПРЕДЕЛИТЕЛИ [1.81 ствующих членов определителя D равна произведению (-1)'+У^2=^И2, где величина Л2= (—\)i+fМ2 называется алгебраическим дополнением минора Мх в определителе D. Иногда употребляют обозначение а — 1М' h '> л2 — ^/i, /2 /л • Фиксируем теперь в определителе D строки с номерами *i> **2> • • •> h- ^ каждый член определителя D входят некоторые элементы из этих строк. Если собрать вместе все такие члены, у которых элементы выделенных строк принадлежат к фиксированным столбцам с номерами j\, /2, . . ., jk, то, по доказанному, сумма всех этих членов будет равна произведению минора м1у {? '> /w/i. и. •••, ik на соответствующее алгебраическое дополнение. Все члены определителя, таким образом, можно разбить на группы, каждая из которых определяется заданием k столбцов. Сумма членов в каждой группе равна произведению соответствующего минора и его алгебраического дополнения. Поэтому весь определитель представляется в виде суммы Д=2(-1)/+/^:±::::/^;±::::& (21) причем суммирование производится при фиксированных индексах iv /2, . . . , ik (индексы выбранных строк) по всем возможным значениям индексов столбцов j\} /2, . . . , jk (1^У1<у2< ... <Jk^n). Свойство определителя D, выражающееся равенством (21), и называется теоремой Лапласа. Очевидно, формула (21) действительно является обобщением формулы разложения определителя по одной строке, полученной в 1.54. Аналогичная формула справедлива для разложения определителя D по фиксированной системе столбцов.
1-91] § 1.9. о линейной зависимости между столбцами 33 1.82. Пример. Определитель вида D а1г . °21 • 0 .. • a2k . 0 ai,k+i a2, k + l ak,k+l ak + l, k+l 0 0 a «, k+i In '2n 'kn 'k+l, n все элементы которого, находящиеся в первых к столбцах и последних п — к строках, равны нулю, называется квазитреугольным. Для его вычисления разложим определитель по первым k строкам с помощью теоремы Лапласа. В сумме (21) останется только одно слагаемое, и мы получим Я = и ki ik kk а ft+i./f + i п, k + l k + l, n См. задачу 12. § 1.9. О линейной зависимости между столбцами 1.91. Пусть нам дано несколько, например т} числовых столбцов по п чисел в каждом: А = «и «21 • ki ' ^2 — Д12; j «22 • \ап*\ !» • • • » Лл ~ а1т } а2т\ • ! апт \ Умножим каждый элемент первого столбца на некоторое число Ях, каждый элемент второго столбца — на число Я2, . . . . . . , каждый элемент последнего, /#-го, столбца на число Хт и сложим соответствующие элементы полученных столбцов. В результате получится некоторый новый числовой столбец, элементы которого мы обозначим буквами с1у с2, . . . , сп. Все эти действия можно наглядно представить с помощью 2 Г. Е. Шилов
34 ГЛ. 1. ОПРЕДЕЛИТЕЛИ [1.92 следующей схемы: к «11 [Й21 Г i U/n I ] l |-fX2! 1 1 au\ 22 апъ\ + +к Лт 2 т С, или, короче, MitM2+ ••• + **A» = C где через С обозначен получившийся столбец. Этот столбец С называется линейной комбинацией взятых столбцов А1У А2у . . . , Ат\ числа Хх, Х2, . . . , \т называются коэффициентами этой линейной комбинации. Частными случаями линейной комбинации являются сумма столбцов (когда коэффициенты Xv . . . , Xm равны 1) и произведение столбца на число (когда пг—\). Теперь представим себе, что наши столбцы взяты не сами по себе, а входят в состав некоторого определителя D п-го порядка. Докажем следующую теорему. Теорема. Если один из столбцов определителя D является линейной комбинацией других столбцов, то D —0. Доказательство. Пусть, например, q-Pi столбец определителя D является линейной комбинацией /-го, &-го, . . . . . . , р-го столбцов этого определителя с коэффициентами, соответственно, Ху, \k, . . . , X Тогда, вычитая из q-ro столбца у'-й столбец, умноженный на Ху, затем k-Pi столбец, умноженный на ^, . . . , наконец, р-й столбец, умноженный на Хр, мы согласно 1.476 не изменим величины определителя D; но в результате q-Pi столбец будет состоять из одних нулей, откуда вытекает, что D = 0. Замечательно, что справедлива и обратная теорема: если заданный определитель D равен нулю, то один (по меньшей мере) из его столбцов является линейной комбинацией других столбцов. Доказательство этой теоремы требует некоторых предварительных построений, к которым мы и переходим. 1.92. Пусть опять имеется m числовых столбцов по п элементов в каждом. Мы можем записать их в виде матрицы
1-93] § 1.9. о линейной зависимости между столбцами 35 с п строками и т столбцами: IKl а\2 • • • Я1т| ап1 йп2 • • • ^«т Если фиксировать некоторое число к столбцов этой матрицы и такое же число к ее строк, то элементы, стоящие на пересечениях указанных столбцов и строк, образуют квадратную матрицу &-го порядка. Ее определитель называется минором к-го порядка матрицы А; он может быть равен нулю или отличен от нуля. Если среди чисел atj есть отличные от нуля (что мы всегда будем предполагать), то всегда можно указать натуральное число г, обладающее такими свойствами: а) у матрицы А имеется минор г-го порядка, отличный от нуля; б) всякий минор матрицы Л, имеющий порядок г-\-\ или выше (если вообще таковые существуют), равен нулю. Число г, обладающее указанными свойствами, называется рангом матрицы А. Если все aik равны нулю, то ранг матрицы считается равным нулю (г = 0). В дальнейшем мы предполагаем, что г > 0. Тот минор г-го порядка, который отличен от нуля, называется базисным минором матрицы А. (Разумеется, у матрицы А может быть и несколько базисных миноров; но все они имеют один и тот же порядок г.) Столбцы, на которых построен базисный минор, называются базисными столбцами. 1.93. Имеет место следующая важная теорема: Теорема (о базисном миноре). Любой столбец матрицы А является линейной комбинацией ее базисных столбцов. Доказательство. Предположим для определенности, что базисный минор матрицы А расположен в первых г строках и первых г столбцах матрицы А. Пусть 5 — любое целое число от 1 до т, а к — любое целое число от 1 до п. 2*
36 ГЛ. 1. ОПРЕДЕЛИТЕЛИ [1.93 Рассмотрим определитель (r-fl)-ro порядка \ап «21 ап aki «12 ' а22 . «г2 • ak2 . . • «ir • «2r • arr • Чг «15 «25 flrs «*5 Если k^r} определитель D, очевидно, равен нулю, так как в нем имеются две одинаковые строки. Аналогично D — 0 при s^r. Если k > г и s > г, то определитель D также равен нулю как минор (г-\-\)~го порядка матрицы ранга г. Следовательно, D — 0 при любых значениях k и 5. Разложим определитель D по последней строке; мы получим равенство akiAhi + akiAkz + • • • + akrAkr + aksAks = 0, (22) где числа Akl> Ak2, ..., Акг, Aks означают соответственно алгебраические дополнения элементов ак1, ak2J ..., akr aksy находящихся в нижней строке определителя D. Эти алгебраические дополнения не зависят от числа ky так как образуются с помощью элементов я,-• с i^Lr\ поэтому мы можем ввести обозначения Ak\ — cv Ak2= c2, ..., Akr=cr, Aks = cs. Подставляя в равенство (22) последовательно значения /5=1, 2, ..., /z, получим систему равенств с1а11 + с2а12 + . . . + cralr + ^яи = О, С1«21 "Г ^2«22 + • • • + Сга2Г + Csa2s = °> сгап1 + с2ап2 + . . . + cranr + c6ans = 0. Число с5 = Л^5 отлично от нуля, так как Aks есть базисный минор матрицы А. Разделив каждое из равенств (23) на с5, перенеся все слагаемые, кроме последнего, в правую С) часть и обозначив через %f (y=l,2, ..., г), мы получим «15=^1«11 + ^2«12 + • • • + ^г«1г> ) ««5 = Ми1 + Кап2 + ' • • + Капг- ' (23)
1-95] § 1.9. о линейной зависимости между столбцами 37 Эти равенства показывают, что s-Pi столбец матрицы А является линейной комбинацией первых г столбцов этой матрицы (с коэффициентами Xlt Х2, . . ., Хг). Поскольку 5 может быть любым числом от 1 до т, наша теорема полностью доказана. 1.94. Мы можем теперь доказать сформулированное в конце 1.91 обращение теоремы 1.91. Теорема. Если некоторый определитель D порядка п равен нулю, то у него имеется столбец, который является линейной комбинацией других столбцов. Доказательство. Рассмотрим матрицу определителя D. Поскольку D = 0, базисный минор этой матрицы имеет порядок г < п. Поэтому после выделения г базисных столбцов мы сможем найти еще по меньшей мере один столбец, не попавший в число базисных. В силу теоремы о базисном миноре он представляет собой некоторую линейную комбинацию базисных столбцов. Итак, мы нашли в определителе D столбец, который является линейной комбинацией других столбцов, что и утверждалось. Заметим, что в состав этой линейной комбинации можно включить и все оставшиеся столбцы определителя D, поставив перед ними, например, нулевые коэффициенты. 1.95. Полученные результаты можно сформулировать в несколько более симметричном виде. Если коэффициенты %lt Я2, . . ., %т линейной комбинации т числовых столбцов Аъ Л2, ..., Ат (1.91) взять равными нулю, то очевидно, что в результате получится нулевой столбец, т. е. столбец, состоящий из одних нулей. Но возможно, что нулевой столбец получается из заданных столбцов не только таким способом, а и с помощью коэффициентов Хх, Х2, ..., Хт, из которых не все равны нулю. В этом случае взятые столбцы Аг, Л2, ..., Ат называются линейно зависимыми. Например, столбцы I1! 2 3 .141 » ^2 — |2 4 6 |8 » ^з — 1 Ml 1 1 lj
38 ГЛ. I. ОПРЕДЕЛИТЕЛИ [1.9F линейно зависимы, так как нулевой столбец равен линейной комбинации 2.Л1-1-Л2 + 0-Л3. Определение линейной зависимости можно сформулировать более подробно так: столбцы А = 11 «о 21 п\ А2 = 1/я '2т называются линейно зависимыми, если существуют величины Kv %2, ..., Хт, не все равные нулю, такие, что удовлетворяется система уравнений Vn + V12 + • • • + Kaim = О, ^21 + ^2^22 + • • • + hma2m = О, Kani + Кап2 + • • • + Капт = °> гли, что то же самое, £суш одия из столбцов Лг, А2, . . ., Лт, например последний, является линейной комбинацией остальных, 4. = Mi + Mi+---+b«-i4.-i, (25) то столбцы Аг, А2, ..., Лт линейно зависимы. Действительно, соотношение (25) равносильно соотношению Mi + Mi+•■•+*—И«-1 + (-1М» = 0; следовательно, существует линейная комбинация столбцов Аг, Л2, ..., Ат, коэффициенты которой не все равны нулю (в частности, последний коэффициент равен —1) и которая дает в результате нулевой столбец; это и означает линейную зависимость столбцов Ах, А2, ..., Ат. Обратно, если между столбцами Av А2, . . ., Ат имеется линейная зависимость, то (по меньшей мере) один из этих *) Здесь в правой части символ 0 означает нулевой столбец.
ЗАДАЧИ 39 столбцов является линейной комбинацией остальных. В самом деле, пусть в равенстве М, + Ц+... + 1..Л.1ти = о. . (26) выражающем линейную зависимость столбцов Аг, А2, . . ., Ат, отличен от нуля, например, коэффициент Кт. Тогда соотношение (26) равносильно соотношению А — h. Л hi. Л ^т-\ д которое показывает, что столбец Ат является линейной комбинацией столбцов Ах, А2, ..., Am_v Итак, столбцы А}, А>, ..., Ат линейно зависимы тогда и только тогда, когда один из этих столбцов является линейной комбинацией остальных столбцов. 1.96. Теоремы 1.91 и 1.94 показывают, что определитель D равен нулю тогда и только тогда, когда один из его столбцов является линейной комбинацией остальных столбцов. Используя полученный в 1.95 результат, мы можем сформулировать следующую теорему: Теорема. Определитель D равен нулю тогда и только тогда, когда между его столбцами существует линейная зависимость. 1.97. Так как при транспонировании определителя его величина не меняется (1.41), а столбцы заменяются строками, то во всех формулировках настоящего параграфа столбцы можно заменить на строки. В частности, имеет место следующий результат: Определитель D равен нулю тогда и только тогда, когда между его строками существует линейная зависимость. См. задачи 13—14. ЗАДАЧИ 1. С каким знаком в определитель 6-го порядка входят члены: 3) tf23tf3ltf42tf5etfl4tf65» б) a92a49aiAanaMa2-9? 2. Выписать все члены, входящие в состав определителя 4-го порядка со знаком — и содержащие множителем а2%.
40 ГЛ. 1. ОПРЕДЕЛИТЕЛИ 3. С каким знаком входит в определитель n-го порядка член А = 4. Показать, что из п\ членов определителя ровно половина /л' \ ( -^ J получает по определению § 1.3 знак + , а вторая половина — знак —. . .5. Вычислить определитель am -\-bp an-\- bq cm -)- dp en + dq разложив его на слагаемые. 6. Числа 20 604, 53 227, 25 755, 20 927 и 78 421 делятся на 17. Доказать, что определитель 2 0 6 0 4 5 3 2 2 7 2 5 7 5 5 2 0 9 2 7 7 8 4 2 1 также делится на 17. 7. Вычислить определители Д,= 246 427 327 1014 543 443 -342 721 621 8. Вычислить определитель 1 2 1111 13 111 114 11 1115 1 11116 Я(х) = 2 3 1 2-х2 2 3 2 3 15 2 3 1 9 — х* 9. Вычислить определитель л-го порядка х а а ... а Д = а х а а а х а а а . х 10. Вычислить определитель Вандермонда A (*i. #2» • • •» хп) ~~ 1 1 Х\ Х2 2 2 Xi Х2 Л-1 Л-1 Xi х% .. 1 .. хп . xl • хп
ЗАДАЧИ 41 11. Решить систему уравнений *i + 2*2 + 3*з + 4*4 + 5*5 = 13, 2*i + *2 + 2*з + 3*4 + 4*5 = 10, 2*!+ 2*а+ *3 + 2*4 + 3*5 = 11> 2*х+ 2*2+ 2*3+ *4 + 2*5= 6, 2*!+ 2*2+ 2*3+ 2*4+ *5= 3. 12. Сформулировать и доказать теорему, находящуюся в таком же логическом отношении к теореме Лапласа, в каком теорема 1.52 находится к теореме 1.51. 13. Построить четыре столбца из четырех чисел в каждом, которые не были бы линейно зависимыми. 14. Показать, что если строки некоторого определителя п-го порядка линейно зависимы, то линейно зависимы и его столбцы.
ГЛАВА 2 ЛИНЕЙНЫЕ ПРОСТРАНСТВА §2.1. Определение 2.11. В аналитической геометрии и в механике используются направленные отрезки — векторы. Для векторов установлены по определенным правилам действия: известно, что означает сумма двух векторов и что означает произведение вектора на вещественное число*). При этом выполняются обычные законы арифметики. Определение линейного пространства обобщает определение совокупности всех векторов. Обобщение производится, во-первых, путем отвлечения от конкретной природы объектов (направленных отрезков) с сохранением свойств действий над ними, во-вторых, путем отвлечения от конкретной природы допустимых множителей (вещественных чисел). Таким образом, получается следующее определение: Множество К называется линейным (аффинным) пространством над полем /\, если а) имеется правило (прав и л о сложения), которое позволяет для каждых двух элементов х и у из К построить третий элемент z £ K*;i:), называемый суммой элементов х пуп обозначаемый х-^у\ б) име- *) Мы не касаемся пока других векторных операции — скалярного и векторного произведений. Во всяком случае оба эти произведения не могут играть той роли, которую играет обычное произведение в поле вещественных чисел; скалярное произведение векторов уже не есть вектор; векторное произведение векторов хоть и есть вектор, но эта операция, в отличие от умножения вещественных чисел, некоммутативна. **) Мы используем здесь и в дальнейшем некоторые обозначения теории множеств. Запись а£А означает, что элемент а входит в множество Л; запись B<z.A означает, что множество В является частью множества А (причем В может и совпадать с А). Два соотношения BczA, Ad В равносильны утверждению, что множества А и В совпадают. Знаки £, с называются знаками включения.
2.14) §2.1. ОПРЕДЕЛЕНИЕ 43 ется правило (правило умножения на число), которое позволяет построить для каждого элемента х £ К и любого числа X g К элемент и g К, называемый произведением элемента х на число К и обозначаемый Хх; в) правила а) и б) удовлетворяют аксиомам, перечисленным в 2.12— 2.13. Элементы линейного пространства мы будем называть векторами, невзирая на то, что по своей конкретной природе они могут быть вовсе и не похожи на привычные нам направленные отрезки. Геометрические представления, связанные с названием «векторы», помогут нам уяснить и часто предвидеть нужные результаты, а также находить прямой геометрический смысл в различных фактах из алгебры и анализа, который без того не был бы очевидным. В частности, в следующей главе мы получим простую геометрическую характеристику всех решений однородной или неоднородной системы линейных уравнений. 2.12. Предполагается, что правило сложения обладает следующими свойствами: 1) х-\-у=у + х для любых х и у из К; 2) (x-\-y)+z = x + (y + z) для любых х, у, z из К; 3) существует элемент 0 (нуль-вектор) такой, что х -j- 0 = х для любого х g К; 4) для каждого х g К существует элемент у £ К такой, что х-{-у = 0 (противоположный элемент). 2.13. Предполагается, что правило умножения на число обладает следующими свойствами: 5) \-х—х для любого х £К; 6) а($х) = (оф) х для любого х g К и любых а и Р из К\ 7) (а+ Р) х — ах~- $х для любого дг^К и любых а и р из К\ 8) а (х -\~у) = ах -р ау для любых х и у из К и любого 2.14. Из аксиом 1) — 8) можно получить в первую очередь следующие теоремы: а. Теорема. В любом линейном пространстве существует единственный нуль. Доказательство. Существование хотя бы одного нуля утверждается в аксиоме 3). Допустим, что в пространстве К
44 ГЛ. 2. ЛИНЕЙНЫЕ ПРОСТРАНСТВА [2.14 имеются два нуля: 0Х и 02. Полагая в аксиоме 3) х = 0lf 0 = 02, мы получаем Ох + 02 = 0!. Полагая в той же аксиоме * = 02, 0 = 01? мы получаем 02 + 01 = 02. Сравнивая первое из полученных равенств со вторым и пользуясь аксиомой 1), находим 01 = 02, что и требовалось. б. Теорема. В любом линейном пространстве для каждого элемента существует единственный противоположный элемент. Доказательство. Существование хотя бы одного противоположного элемента утверждается в аксиоме 4). Допустим, что для некоторого элемента х имеется два противоположных элемента ух и у2. Прибавим к обеим частям равенства #-1-^ = 0 элемент у2\ используя аксиомы 2) и 3), мы получаем у2 + (* +уг) = (у2 -\-х) +уг = 0 +уг =уъ у2+{х+у1)=у2-^0=у2, откуда уг=у21 что и требовалось. в. Т е о р ем а. Для всякого элемента х в любом линейном пространстве имеет место равенство 0-д: = 0 (в правой части равенства 0 означает нуль-вектор, в левой — число 0). Доказательство. Рассмотрим элемент О-лг+1-д:; используя аксиомы 7) и 5), мы получаем 0.х+\-х = (0+\)х=\-х = х, 0-х+\-х = 0-х + х9 откуда х = 0-х + х; прибавляя к обеим частям равенства противоположный к х элемент у, находим 0 = х+у = (0-х + х)+у = 0-х+(х+у) = 0-х + 0 = 0-х,
2.15] §2.1. ОПРЕДЕЛЕНИЕ 45 откуда 0 = 0-х, что и требуется. г. Теорема. Для всякого элемента х в любом линейном пространстве противоположным элементом служит Доказательство. Составим сумму х -\-у; используя аксиомы и теорему в, находим х+у=\-х + (—\)-х = (\—\)-х = 0.х = 0, что и требуется. д. Мы будем обозначать теперь элемент, противоположный к данному элементу х} через —х; доказанная теорема г делает естественным это обозначение. Наличие противоположного элемента позволяет ввести операцию вычитания. Именно, разность х—у определяется как сумма х и —у. Это определение согласуется с определением вычитания в арифметике. 2.15. Линейное пространство над полем R вещественных чисел мы будем называть вещественным и обозначать через R. Линейное пространство над полем С комплексных чисел мы будем называть комплексным и обозначать через С. Если указаны 'природа элементов х, у, z, ... и правила действий над ними [причем должны быть выполнены аксиомы 1) — 8)], мы будем называть линейное пространство конкретным и использовать для него, как правило, индивидуальное обозначение. В дальнейшем для нас будут особенно важны следующие три типа конкретных пространств: а. Пространство V3. Элементы этого пространства— свободные векторы в пространстве, рассматриваемые в аналитической геометрии. Каждый вектор характеризуется длиной и направлением*). Сложение векторов определено обычным образом по правилу параллелограмма. Умножение вектора на вещественное число К определено также обычным образом (именно, длина вектора умножается на |Х|, *) За исключением нуль-вектора, длина которого равна нулю4 а направление произвольно.
46 ГЛ. 2. ЛИНЕЙНЫЕ ПРОСТРАНСТВА [2.16 направление при к > 0 остается неизменным, при X < О заменяется на противоположное). Легко проверить, что все аксиомы 1)—8) здесь выполнены. Аналогичные совокупности векторов на плоскости и на прямой, также представляющие собой линейные пространства, обозначим соответственно через V2 и Vx; Vly V2} V3—линейные пространства над полем R. б. Пространство Кп. Элемент этого пространства — любая совокупность х = (Ъ>1, |2, . . ., |;|) n чисел из поля К. Эти числа £х, |2, ..., £;1 будем называть координатами элемента х. Действия сложения и умножения на число Х£К производятся по следующим правилам: (li, £2> •••> £„) + (Л1» л2* • • •> л«) = Легко проверить, что аксиомы 1) — 8) удовлетворены. В частности, элемент 0 есть совокупность п нулей: О = (0,0, ...,0). Фактически мы имели дело с элементами этого пространства в § 1.9; только мы записывали тогда их не в форме числовой строки, а в форме столбца. Если К есть поле R вещественных чисел, обозначение Кп заменяется на Rn. Если К есть поле С комплексных чисел, обозначение Кп заменяется на Сп. в. Пространство R(a,b). Элемент этого пространства— любая вещественная непрерывная функция x = x(t), определенная на отрезке a^.t^b. Действия сложения функций и умножения их на вещественные числа определяются по правилам анализа; выполнение аксиом 1)—8) очевидно. При этом элемент 0 есть функция, тождественно равная нулю. Пространство R (ау Ь) есть линейное пространство над полем R вещественных чисел. г. Пространство С(а,Ь) соответственно есть пространство всех комплекснозначных непрерывных функций на отрезке a^t^b. Это пространство есть линейное пространство над полем комплексных чисел. 2.16. Заметим, что все свойства элементов конкретных пространств (например, векторов пространства V3), основанные только на аксиомах 1) — 8), справедливы и для элементов любых линейных пространств. Например, анализируя
2.21] § 2.2. линейная зависимость 47 доказательство теоремы Крамера о решении системы линейных уравнений Я 11*1 "Г Я 12*2 + • • • + а1пХп ^ К \ «21*1 + «22*2 + ' ' ' + 4n*n = bV I anlXl "Г ап2Х2 ~Г • • • + Янн*/! — */и J мы можем заметить, что в той части, которая касалась величин Ьъ Ь2, ..., Ью оно основывалось только на том факте, что эти величины можно было складывать и умножать на числа из К, причем использовались правила 1)—8). Это позволило обобщить теорему Крамера на системы, в которых величины Ьг, Ь2, ..., Ьп суть векторы (элементы пространства \/3), как мы уже указывали в 1.74. Это позволяет, далее, утверждать, что теорема Крамера справедлива и для систем, в которых величины bv b2, . . ., bn являются элементами произвольного линейного пространства К. Отметим только, что значения неизвестных хъ х2, ..., хп будут тогда также элементами этого пространства К, линейно выражающимися через величины bv b2, ..., bn. См. задачи 1—3. 2.17. Замечание. В аналитической геометрии иногда бывает удобно рассматривать векторы не свободные, а закрепленные своим началом в начале координат. Такое рассмотрение удобно тем, что при этом каждый вектор ассоциируется с некоторой точкой пространства — своим концом и каждая точка пространства может быть определена соответствующим вектором — так называемым радиусом-вектором этой точки. Имея в виду эту картину, мы будем иногда называть элементы линейного пространства не векторами, а точками. Разумеется, такая перемена названия не сопровождается никакими изменениями в определениях и апеллирует лишь к нашим геометрическим представлениям. § 2.2. Линейная зависимость 2.21. Пусть xv х2% ..., xk — векторы линейного пространства К над полем К и av a2, ..., ал — числа из поля К. Вектор у - аххх + а2х2 + . . . + a^xk
48 ГЛ. 2. ЛИНЕЙНЫЕ ПРОСТРАНСТВА [2.22 называется линейной комбинацией векторов xv х2, ..., xk; числа av а2, ..., ал— коэффициенты этой линейной комбинации. Если а1 = а2= . . . =aft = 0, то в силу теоремы 2.14 в мы получаем, что у = 0. Но может быть и так, что существует линейная комбинация векторов xv x2, ••-, xki в которой не все коэффициенты равны нулю и которая, тем не менее, дает в результате нуль-вектор; в этом случае векторы xv х2у ..., xk называются линейно зависимыми. Иными словами, векторы xv х2} .. ., xk называются линейно зависимыми, если существуют числа av a2, . .., ak, не все равные нулю и такие, что агхг + а2х2 + . . . + akxk = 0. (3) Если же равенство (3) возможно в единственном случае, когда a1 = a2= . . . =ал = 0, векторы хъ х2, ...yxk называются линейно независимыми. 2.22. Пример ы. а. В линейном пространстве V3 линейная зависимость двух векторов означает, что они параллельны одной и той же прямой; линейная зависимость трех векторов — что они параллельны одной и той же плоскости. Всякие четыре вектора линейно зависимы. б. Выясним, что означает линейная зависимость векторов xv х2} ..., xk линейного пространства Кп. Пусть вектор х{ имеет координаты \([\ £2/}, ..., \{£ (/=1, 2, ..., k)\ тогда линейная зависимость «1*1 + а2*2 -г • • • + akxk = О означает, что выполняется п равенств «^"Н-а^'Ч--.-+«*&*' = О, [ (4) Ъ&+а№+ .'••'+*£}?> = 6, J причем среди постоянных alt a2, ..., ak имеются отличные от нуля; это — то самое определение линейной зависимости, которое мы дали в 1.95 для числовых столбцов.
2.22] § 2.2. линейная зависимость 49 Таким образом, вопрос о линейной зависимости векторов xv х2, . .., хк в общем случае сводится к вопросу о существовании ненулевого решения у однородной системы уравнений с коэффициентами, равными соответствующим координатам данных векторов. В следующей главе этот вопрос будет полностью решен (3.21), и тем самым будет получено правило, позволяющее судить о линейной зависимости или независимости данных векторов пространства Кп по их координатам. в. Но в некоторых случаях мы можем и теперь уже делать выводы о линейной зависимости или независимости данной системы векторов. Пусть, например, в пространстве Кп взяты п векторов ^ = (1,0,0, ...,0), е2=(0, 1,0, ...,0), ... ..., *„=(<>, 0,0, ...,0, 1). Система (4) для этих векторов принимает вид a1-l+a3-0+a3-0+...-fa/I-0 = 0> \ а1.0 + а2-1+а3-0+...+а/1-0 = 0> 1 а^О + о^.О + ад-О-г- . . . +ая.1 =0 J и, очевидно, допускает единственное решение а1 = а2=... . . . =ап — 0. Таким образом, векторы е19 е2, .. ., еп в пространстве Кп линейно независимы. См. задачу 4. г. Линейная зависимость векторов хх — хх (t)y x2 = = д:2 (/), ..., xk = xk (t) пространства R(a,b) (или С (a, b)) означает, что между функциями xx(t), x2(t)y ..., xk (t) имеется соотношение а1х1 (t) + a2x2 (/)+...+ akxk (t) = 0, причем вещественные (комплексные) постоянные а1у а2, ... . . ., ak не все равны нулю. Например, функции хх (t) = cos2 /, Ar2(0 = sin2/, x3 (t) = 1 линейно зависимы, так как имеет место соотношение *1(0 + *2(0-*8(0 = о.
50 ГЛ. 2. ЛИНЕЙНЫЕ ПРОСТРАНСТВА [2.23 Проверим, что функции 1, t, t2} . .., tk линейно независимы. Допустим, что существует соотношение (Vl+cV+...+а^ЕЕЕЕО. (5) Тогда, последовательно дифференцируя k раз равенство (5), мы получим систему k-\-\ уравнений относительно величин а0, а1} . . ., ak с определителем, заведомо отличным от нуля (1.556); решая систему по правилу Крамера (1.73), мы получаем, что а0 = <хг = ... = ak = 0. Следовательно, функции 1, t, t2} . . ., tk линейно независимы в пространстве R(ayb), что мы и утверждали. См. задачу 5. 2.23. Отметим два простых свойства систем векторов, связанных с линейной зависимостью. а. Лемма. Если некоторые из векторов х1} х2, . . ., xk линейно зависимы, то и вся система х1у хъ . . ., xk линейно зависима. Доказательство. Без ограничения общности можно принять, что линейно зависимы векторы xv х2У ..., х.- U < &)\ таким образом, имеет место соотношение аххх + а2х2 + . . . + ajXj = 0, где среди постоянных av a2, ..., а- имеются отличные от нуля. В силу теоремы 2Л4в и аксиомы 2.12 3) справедливо равенство аххг-!-а2х2 + . . . -\-a/xJ+0-x/+1+ . . . +0-x/j = 0; оно показывает, что векторы xv л*2, ..., xk также линейно зависимы, так как среди постоянных аъ а2, . . ., ау, 0, . . ., 0 имеются отличные от нуля. б. Лемма. Векторы хх, х2} . .., xk линейно зависимы тогда и только тогда, когда можно представить один из этих векторов в виде линейной комбинации других. Предложение, аналогичное сформулированному, уже встречалось нам прежде: мы доказывали его в 1.95 для числовых столбцов. Если мы просмотрим еще раз это доказательство, то увидим, что оно основано только на возможности производить со столбцами операции сложения и умножения
2.32] § 2.3. БАЗИС, КООРДИНАТЫ, РАЗМЕРНОСТЬ 51 на число. Следовательно, это доказательство можно провести для элементов любого линейного пространства. Вместе с этим и наша лемма оказывается справедливой для любого^ линейного пространства, что нам и требуется. § 2.3. Базис, координаты, размерность 2.31. Система линейно независимых векторов ev е2, . .., еп некоторого линейного пространства К образует, по определению, базис пространства К, если для всякого вектора л;£К существует разложение * = &i*i + S2'2+- ••+&„'„ (£,€*, У=1, .... л). (6) Легко видеть, что при указанных условиях коэффициенты разложения (6) определяются единственным образом. Действительно, если бы для некоторого вектора х можно было написать два разложения * = £i*i+E2*2+ •••+£,,*„. * = Л1*1 + Л2*2+--- +ЛА> то, вычитая почленно, мы получили бы равенство О = (Si —Лх) ei + (£2 — Л2) е2+ ...+ (£„ —л„) еп, из которого в силу предположенной линейной независимости векторов ev е2, ..., еп мы получили бы, что Si = 4i. i2 = л2, • ••> £я = л„- Эти единственным образом определяемые числа |х, £2, . . ., %п называются координатами вектора х относительно базиса ev е2у . . ., еп. 2.32. Примеры. а. В пространстве V3 хорошо известный базис образует тройка единичных взаимно ортогональных векторов *, /, k. Координаты |х, £2, £3 вектора х относительно этого базиса суть проекции вектора х на координатные оси. б. В пространстве К,, примером базиса служит система векторов *?! = (!, О, ..., 0), е2 = (0, 1, ..., 0), ... . . ., е;| = (0, 0, . . ., 1), рассмотренная уже нами в 2.22в. Действительно, для любого вектора x = (%lii)2, ...,£„)£#„,
52 ГЛ. 2. ЛИНЕЙНЫЕ ПРОСТРАНСТВА [2.33 очевидно, имеет место равенство jc = 61(1,0, ...,0) + £2(0, 1, .... 0) + ...+g„(0, 0 1), которое и доказывает в соединении с уже известной линейной независимостью векторов ev е2у ..., епУ что эти векторы образуют базис в пространстве Кп. В частности, оказывается, что числа %v |2> •••» 6л являются как раз координатами вектора х относительно базиса ev е2} ..., еп. в. В пространстве R (а, Ь) базиса — в том смысле, как он нами здесь определен,— не существует; доказательство этого утверждения будет дано в 2.36в. 2.33. Основное значение базиса линейного пространства состоит в том, что линейные операции в пространстве, вначале заданные абстрактно, при задании базиса становятся обычными линейными операциями с числами — координатами взятых векторов относительно этого базиса. Именно, имеет место следующая теорема: Теорема. При сложении двух векторов пространства К их координаты (относительно любого базиса) складываются. При умножении вектора на число все его координаты умножаются на это число. Действительно, пусть * = 6l*l + &2*2 + • • • + £„*„, У = T)l*l + ^2 + • • • + Чпеп* Тогда в силу аксиом 2.12—2.13 Хх = %1ге1 + М2е2 + ... + №>пеп> что и требуется. См. задачи 6—7. 2.34. Если в линейном пространстве К можно найти п линейно независимых векторов, а всякие л+1 векторов этого пространства линейно зависимы, то число п называют
2.35] § 2.3. базис, координаты, размерность 53 размерностью пространства К; само же пространство К называют n-мерным. Мы будем в дальнейшем для п-мерного пространства над полем К использовать обозначение К„ (над полем R — соответственно R„, над полем С — соответственно Сп). Линейное пространство, в ^котором можно указать сколь угодно большое число линейно независимых векторов, называется бесконечномерным. Теорема. В пространстве К размерности п существует базис из п векторов; более того, любая совокупность из п линейно независимых векторов пространства К является базисом этого пространства. Доказательство. Пусть е1У е2, ..., еп — система из п линейно независимых векторов заданного я-мерного пространства К. Если х — некоторый вектор пространства К, то совокупность из /2-f-1 векторов ху е1У е2, ..., еп линейно зависима; существует соотношение вида а0х + ахех + .. . -f anen = О, (7) причем среди коэффициентов а0, av . .., ап имеются отличные от нуля. Можно утверждать, что коэффициент а0 заведомо отличен от нуля: действительно, в противном случае мы получили бы линейную зависимость между векторами ег, е2У ..., еп, которая, по предположению, не имеет места. Но в таком случае обычным путем, т. е. разделив уравнение на а0 и перенеся все остальные члены вправо, мы получим, что х линейно выражается через векторы е1у е2у . .., еп. Поскольку х — любой вектор пространства К, мы доказали, что векторы ev е2, ..., еп образуют базис в этом пространстве, что и требовалось. 2.35. Следующая теорема является обратной по отношению к теореме 2.34. Теорема. Если в пространстве К имеется базис, то размерность этого пространства равна числу базисных век* торов. Доказательство. Пусть векторы ev е2} ..., еп образуют базис пространства К. По самому определению базиса векторы еъ е2} ..., еп линейно независимы; следовательно, у нас уже имеется п линейно независимых векторов. Покажем, что всякие п-\-\ векторов пространства К линейно зависимы.
54 гл. 2. линейные пространства [2.36 Пусть в пространстве К заданы п-\-\ векторов %2 = Ь1 в1 ~Г Ъ2 в2 \ • • • "Т ЪП еПУ п + 1 Z<r1,el + Vr"e2+ . .. +1Гие„. Выписывая в отдельный столбец координаты каждого из этих векторов, составим матрицу с п строками и п+1 столбцами А = (Л+1) 1 I? IIs (1) £(2) £(Л+1) »2 Ь2 • • • Ь2 (1) t(2) £(/ Ъл • • • Sn П+1) Базисный минор {1.92) матрицы А имеет порядок г^Сл. Если г = 0, то линейная зависимость очевидна. Пусть г > 0. После указания г базисных столбцов мы сможем найти еще по меньшей мере один столбец, не попавший в число базисных. Но тогда согласно теореме о базисном миноре этот столбец является линейной комбинацией базисных столбцов. Соответствующий вектор пространства К является линейной комбинацией других векторов (из числа заданных xv х2} ..., хп + 1). Но в таком случае векторы xv х2у ... •••> xn + v согласно 2.236, линейно зависимы, что и требовалось. 2.36. Примеры. а. Пространство V3 трехмерно, поскольку оно обладает базисом из трех вектороз *, у, k (2.32а); соответственно V2 двумерно, Vx одномерно. б. Пространство Кп /г-мерно, поскольку оно обладает базисом из п векторов ev e2J ..., еп (2.326). в. В пространствах R(ayb) и С (ау Ь) имеется сколь угодно большое число линейно независимых векторов (2.22г), и, следовательно, эти пространства бесконечномерны. Поэтому они не имеют базиса: наличие базиса привело бы к противоречию с теоремой 2.35. г. Всякое комплексное линейное пространство С является, очевидно, и вещественным, поскольку область комплексных
2.42] § 2.4. ПОДПРОСТРАНСТВА 55 чисел включает в себя область вещественных чисел. Однако размерность пространства С как комплексного пространства не совпадает с размерностью того же С как вещественного пространства: если векторы ev ..., еп линейно независимы в С как в комплексном пространстве, то в С как вещественном пространстве будут линейно независимы векторы ev iev ..., еп, ienJ так что размерность С как вещественного пространства (если она конечна), вдвое больше, чем размерность С как комплексного пространства. См. задачу 8. § 2.4. Подпространства 2.41. Допустим, что некоторая совокупность L элементов линейного пространства К обладает следующими свойствами: а) если лг^Ь, у £ L, то x-'ry£L; б) если x£Ly X— элемент поля К, то Хх G L. Таким образом, нам задана совокупность элементов, и в ней определены линейные операции. Покажем, что мы получаем здесь также л и н е й н о е пространство. Для этого нужно проверить для совокупности L с операциями а) — б) выполнение аксиом 2.12— 2.13. Аксиомы 1), 2), 5)—8) удовлетворяются, поскольку они удовлетворяются вообще для всех элементов пространства К. Остается проверить аксиомы 3) и 4). Пусть .v — любой элемент из L; тогда по условию Хх £ L при любом вещественном X. Возьмем Х = 0; тогда, поскольку по теореме 2.14в 0-.*:=: О, нуль-вектор принадлежит совокупности L. Тем самым выполнена аксиома 3). Возьмем теперь X =—1; поскольку по теореме 2.14г (—1) х есть элемент, противоположный элементу х} совокупность L вместе с каждым элементом х содержит и противоположный элемент. Таким образом, выполнена и аксиома 4), и наше утверждение полностью доказано. Поэтому всякая совокупность LciK, удовлетворяющая условиям а) и б), называется линейным подпространством (или просто подпространством) пространства К. 2.42. При м с р ы. а. Нуль-вектор пространства К образует, очевидно, наименьшее возможное подпространство пространства К.
56 ГЛ. 2. ЛИНЕЙНЫЕ ПРОСТРАНСТВА [2.42 б. Все пространство К — наибольшее возможное подпространство пространства К. Эти два подпространства — нуль-вектор и все пространство— называют иногда тривиальными подпространствами; и тогда все остальные подпространства называют нетривиальными. в. Пусть Lx и L2— два подпространства одного и того же линейного пространства К. Совокупность всех векторов лг^К, принадлежащих одновременно к Lx и L2, образует подпространство, называемое пересечением подпространств Lx и L2. Совокупность всех векторов вида y-\-z, где^уёЦ, г^Ц, образует подпространство, называемое суммой подпространств Ц и L2. г. В пространстве V3 все векторы, параллельные какой- либо плоскости (или какой-либо прямой), образуют подпространство. Если говорить не о векторах, а о точках (2.17), то подпространствами пространства V3 являются совокупности точек, расположенных на плоскости (или прямой), проходящей через начало координат. д. В пространстве Кп рассмотрим совокупность L тех векторов д; = (^1, £2, ..., |Л), координаты которых удовлетворяют системе линейных уравнений tfn*i + 012*2 + • • • + а1пхп = О, 021*1 ~Ь 022*2 + • • • + а2пХп — 0> 0*1*1 + 0*2*2 + • • • + Чп*п = О с коэффициентами из поля К и со свободными членами, равными 0. Такая система называется однородной линейной системой. Однородная линейная система всегда совместна, так как имеет очевидное «нулевое» решение хх = х2 = • .. = = *я = 0. Пусть с?\ с(}\ . . . , с%} и с[2\ 42\ • • • 1 ^ii2) —два решения такой системы; образуем числа с1 — с1 ^Г Ll > с2 — с2 Ч с2 > • • • » сп — сп ~Тсп • Утверждается, что сх> с2, . . . , сп снова образуют решение системы (8). Действительно, подставляя эти числа в /-е (8)
2.43] § 2.4. ПОДПРОСТРАНСТВА 57 уравнение этой системы, мы получаем с/1с1 + с,-2с2+ ...+aiacn = = ап (с'1' + с?>) + ai2 (с',1» + 42') +...+ain (c«> + с|») =, = (fl/1ciu + алс™ + • • • + «/„с"') Н- + (a.^ci" + crtc«> + ... + e,„c<») = О, что и требовалось. Это решение мы будем называть суммой решений ci1*, с[1\ . . . , с^ и с[2\ с[2\ . . . , с^2). Аналогично, если ^1, с^ • • • » с« — произвольное решение системы (8), то числа Кс1у Хс2, . . . , Хсп при фиксированном Я £ Л" образуют также решение системы (8); это решение мы будем называть произведением решения clt с2, . . . , сп на число к. Таким образом, решения однородной системы с коэффициентами из поля К можно складывать друг с другом и умножать на числа из того же поля К. Тем самым совокупность L есть подпространство пространства Кп и, следовательно, является линейным пространством. Мы будем называть его пространством решений системы (8). В 3.41 мы вычислим размерность этого пространства и построим его базис. См. задачу 9. 2.43. Отметим некоторые свойства подпространств, связанные с определениями §§ 2.2—2.3. Прежде всего, всякое линейное соотношение, связывающее векторы х, у, . . . , z в подпространстве L, справедливо и во всем пространстве К, н обратно; в частности, факт линейной зависимости векторов х> у, . .. , z £ L выполняется одновременно в подпространстве L и в пространстве К. Если, например, в пространстве К всякие п-\-\ векторов линейно зависимы, то это утверждение и подавно будет выполнено в подпространстве L. Отсюда вытекает, что размерность любого подпространства L в n-мерном пространстве К не превосходит числа п. В этом случае согласно теореме 2.34 в каждом подпространстве LcK можно построить базис из такого числа векторов, какова размерность под прост ран-, ства L.
58 ГЛ. 2. ЛИНЕЙНЫЕ ПРОСТРАНСТВА [2.44 Если в пространстве К выбран базис ev еъ . . . , еп, то в общем случае, разумеется, нельзя выбрать базисные векторы подпространства L прямо из числа векторов ev е2, . . . , еп хотя бы потому, что в подпространство L может не входить ни один из них. Но можно утверждать, что если выбран базис /\, /2, . . . , fL в подпространстве L [имеющем для определенности размерность I < п)} то всегда можно дополнительно выбрать векторы fl + 1> . . . , /;/ во всем пространстве К так, что система fv /2, ...,//, . . . , fn будет базисом во всем К. Для доказательства будем рассуждать так. В пространстве К существуют векторы, которые линейно не выражаются через Д, /о, . . . , ft\ действительно, если бы таких векторов не было, то векторы /х, /2, . . . , /\ — но условию линейно независимые — составляли бы базис пространства К и по теореме 2.35 размерность К была бы равна /, а не п. Обозначим через // + 1 любой из векторов, не выражающихся линейно через Д, /2, . . . , /,. Система fv /2, . . . , /,, /1 + 1 линейно независима; в самом деле, если бы существовало соотношение вида то при а/ + 1=т^0 мы получили бы, что вектор // + 1 можно линейно выразить через /х, /2, . . . , fh а при <%1 + 1 = 0 получили бы, что векторы /х, /2, . . . , ft линейно зависимы; оба эти вывода противоречат построению. Если теперь всякий вектор пространства К линейно выражается через /1} /2, . . . , /1У fl + v то система /lf /2, . . . , flt // + 1 образует базис в К (и / —J— 1 = /г), и наше построение закончено. Если /+1 < п> то имеется вектор // + 2, не выражающийся линейно через fv /2» • • • у //> fi + i- Таким образом можно продолжить построение; в конечном счете (через п — / шагов) мы получим базис пространства К- См. задачу 10. 2.44. Будем говорить, что векторы gly ... , gk линейно независимы над подпространством LcK, если из соотношения «ift + • • • т ak%k € L, аъ . . . , ak G AT, следует аг = . . . = ak = 0. Если L — нулевое подпространство, то линейная независимость над L означает обычную линей-
2.45] § 2.4. ПОДПРОСТРАНСТВА 59 ную независимость. Линейная зависимость векторов^, . . . , gk над подпространством L означает, что существует линейная комбинация ^-1^1+. . .+^/г^/г, лежащая в L, причем среди коэффициентов а1у . . . , ak имеются отличные от 0. Наибольшее возможное число векторов пространства К, линейно независимых над подпространством LcK, называется размерностью К над L. Если векторы gv . . . , gk линейно независимы над пространством LcK, a /l5 . . . , fL — векторы, линейно независимые в подпространстве L, то векторы gl} . . . , gk, /x, . . . , ft линейно независимы в пространстве К- Действительно, если бы имело место равенство ai/l+ . . . -f-a//i + pift + ... +P/kft = 0, то, написанное в форме Pift + • • • + Р*& = - (a/i + • • • + «,/,) € L, оно привело бы к заключению, что рх = . . . = pft = 0 в силу предположенной линейной независимости векторов gly . . . , gk над L; отсюда аг= . . . =af = 0 в силу линейной независимости векторов /г, . . . , ft. Векторы // + 1, ...,/„, построенные в 2.43, линейно независимы над подпространством L: действительно, если бы имело место равенство ai + ifi + i+ • • • +*nfn = <hfi+ • • • +<*//i. причем среди чисел а/ + 1, . . . , aw были бы отличные от 0, то векторы fv ...,/„ оказались бы линейно зависимыми в противоречии с построением. Размерность пространства К над L, следовательно, не меньше, чем п — /. С другой стороны, она не может быть и больше, чем п — /, так как если бы нашлось п — /+1 векторов, например, hly ... , hn_l+ly линейно независимых над L, то в пространстве К были бы линейно независимы векторы hv . . . , hn_l + ly fly . . . , fu число которых больше, чем п. Таким образом, размерность К над L в данном случае равна п — /. 2.45. Прямая сумма. Говорят, что пространство L является прямой суммой своих подпространств Ц, . . . , Lmt если:
60 ГЛ. 2. ЛИНЕЙНЫЕ ПРОСТРАНСТВА [2.46 а. Для всякого x£L существует разложение х = хг-\- . . . -у-хтУ хх £ Ц, . . . , хт £ Lm. б. Это разложение единственно: если * = *!+... +Хт=Уг+ . . . +^, где Xj £ LJy у; £ Ly, у=1, . . . , /и, то аг1=^1, . .. , Дги=^|Я. Впрочем, справедливость последнего условия следует из более простого требования: б'. Если имеется разложение 0 = гг+...+гт, где ^СЦ, ... , гт €ЬЯ, то Zl= ...=*m = 0. Действительно, пусть выполнено условие б' и дано разложение б. Вычитая, находим 0 = {х1-у1)+... + (хт-Ут); применяя б',-получаем xx=yv ..., хт—ут. Обратно, б' следует из б, если положить дг = 0, atx— . . . = хт = 0. Из б следует, что всякие два из подпространств Lx, . . . , Lm имеют общим один лишь элемент 0. Действительно, если бы мы имели z £Lk и z£L-y то из сравнения двух разложений z = z+0y z£Lj, 0€Ц, z = 0 + *, 0€Ly> *€Ц, и условия б вытекало бы, что z = 0. Так, /г-мерное пространство К„ есть прямая сумма п одномерных подпространств, определенных любыми п линейно независимыми векторами. Кроме того, пространство К„ можно представить разными способами в форме прямой суммы и неодномерных подпространств. 2.46. Пусть в /г-мерном пространстве К„ фиксировано подпространство L. Покажем, что всегда существует подпространство МсК„, которое в прямой сумме с L дает все К„. Для доказательства используем векторы /i + 1, . . . , /„, построенные в 2.43, линейно независимые над подпространством L. Пусть М — подпространство, составленное из всех
2.47] § 2.4. ПОДПРОСТРАНСТВА 61 линейных комбинаций векторов // + 1, . . . , /„; покажем, что оно удовлетворяет нашему требованию. Действительно, поскольку векторы /ъ . . . , /п образуют базис в К„ {2-43), каждый вектор х £ L допускает разложение *^<Vi+ • • • +<*ifi + <*i + ifi + i+ • • • +<*>г/п=У + г> где у = а^ + • • • +oclfl £ L, z = al + 1fl + 1 + ... + «,/„ € M. При этом из х — 0 следует ау. = 0 (/=1, . . . , /z) в силу линейной независимости векторов /\, . . . , //г Следовательно, условия 2.45а,б' выполнены, и К„ есть прямая сумма L и М. 2.47. а. Если размерность пространства Lk равна rk (Л=1, ... , т) и в каждом пространстве ЬЛ выделены гй линейно независимых векторов fkv .. . fkr то каждый вектор х суммы L = Lx-f-. . .+Ц можно линейно выразить через все эти векторы. Следовательно, размерность суммы пространств Ц, . . . , Lk не больше суммы их размерностей. Если сумма Lx+ . . . + Ц прямая, то все векторы/Л1, . . . , fkr (k—\} . . . , m) линейно независимы, так что в этом случае размерность суммы равна сумме размерностей. б. В общем случае размерность суммы определяется через размерности слагаемых более сложным образом; мы рассмотрим только вопрос о размерности суммы двух конечномерных подпространств Р и Q пространства К. Пусть р и q обозначают размерности этих подпространств. Обозначим через L пересечение подпространств Р и Q и через / его размерность. Выберем в L базис ev еъ .. . , et и, используя соображения 2.43, дополним его векторами fi + i, Л+2» • • • > fp до полного базиса подпространства Р и векторами gl + v ^+2, • • • , gq ДО полного базиса подпространства Q. Каждый вектор суммы P + Q по самому определению есть сумма вектора из Р и вектора из Q и поэтому может быть линейно выражен через векторы ev е2у . .. , eL9 fi + ъ • • • , /я» gi + v • • • » £q- Покажем, что эти векторы образуют базис подпространства P + Q. Для этого нам остается проверить их линейную независимость. Допустим, что существует линейное соотношение вида (*!*!+ • • • +а^-гР* + 1Л+1+ • • -+Ыр + + yi + igi + i+ • • - +yqgq = 0, (9)
62 ГЛ. 2. ЛИНЕЙНЫЕ ПРОСТРАНСТВА [2.48 причем среди коэффициентов а1} . . . , уд имеются отличные от нуля. Мы можем тогда утверждать, что имеются отличные от нуля числа в совокупности у1 + 1} . . . , уду так как в противном случае векторы ev е2} . . . , el} fi + v • • • > fp оказались бы линейно зависимыми, что невозможно ввиду того, что они образуют базис подпространства Р. Следовательно, вектор -^ = 7^4-1^4-1+ •••+yqgq¥=0, (10) иначе векторы gt + v . . . , gq оказались бы линейно зависимыми. Но из (9) вытекает, что в то время как (10) показывает, что at^Q- Таким образом, х принадлежит и Р и Q и, следовательно, входит в подпространство L. Но тогда Поскольку векторы ev еъ . . . , еь, gL + 1, . . . , gq линейно независимы, у1 + 1 = . . . = yq = 0. Полученное противоречие показывает, что векторы ev е2У . . . , еь // + 1, . . . , /ру gi + u • • • у £q действительно линейно независимы. Согласно теореме 2.35 размерность подпространства P + Q равна числу базисных векторов еъ . . . , ely /f + 1, ...,/_, Sl + ъ ••• » Sq\ но это числ0 равно p-\-q—/. Итак, размерность суммы двух подпространств равна сумме их размерностей за вычетом размерности пересечения. в. Следствие. Если в n-мерном пространстве Rn выделены два подпространства Rp и R , размерности которых р и q в сумме превышают число п, то пересечение R и Rq имеет размерность не меньшую, чем p-\-q— п. 2.48. Фактор-пространства. а. Пусть в линейном пространстве К выделено подпространство L. Назовем элемент х £ К сравнимым с элементом у £ К (точнее, сравнимым относительно L), если х—у g L. Очевидно, в этом случае иу сравним с х, так что отношение сравнения симметрично. Всякий лг^К сравним сам с собою. Далее, если х сравним с у, а у сравним с z, то и х сравним с zy так как *_z = (x— y) + (y—2)gL.
2.49] § 2.4. ПОДПРОСТРАНСТВА 63 б. Совокупность всех элементов у£К, сравнимых с данным элементом х £ К, называется классом и обозначается через X. В силу сказанного класс X содержит сам элемент дг, и всякие два элемента j/gX, z g X сравнимы друг с другом. Наконец, если ы(£Х, то и не сравним ни с одним элементом из класса X. Поэтому два класса X и Y или не имеют общих элементов, или полностью совпадают. Одним из классов является все подпространство L; поскольку оно содержит нулевой элемент пространства К, этот класс обозначается через 0. в. Все пространство К разбивается в совокупность непересекающихся классов X, Y, ... Эту совокупность классов мы обозначим через K/L. Введем в множестве К L линейные операции следующим образом. Пусть X и Y — классы, а и Р — элементы поля /С; мы желаем определить класс aX + PY. Для этого выберем произвольно элементы х £ X и у £ Y и найдем класс Z, который содержит элемент z = ах -\- $у; этот класс и обозначим aX-r($Y. Проверим, что он определен однозначно. Если в классе X мы возьмем элемент хъ а в классе Y—элемент у1у то (axY + Р^) — (ах + рдг) = а (хх — х) + Р (уг—у) лежит в подпространстве L вместе с хг — х и уг—у; это означает, что ахх -j- $уг лежит в том же классе, что и ах -Ь $у. В частности, мы определили сложение классов X, Y и умножение их на числа а£К. Покажем, что эти операции удовлетворяют аксиомам линейного пространства 2.12—2.13. Действительно, из справедливости 2.12 1)—2) и 2.13 5)—8) для элементов пространства К следует сразу выполнение этих же свойств для классов. Нулем пространства K/L является класс 0 (состоящий из всех элементов пространства L). Противоположным к классу X является класс, состоящий из элементов, противоположных к элементам класса X. Таким образом, для совокупности классов выполнены и аксиомы 2.12 3)—4). Построенное здесь линейное пространство K/L называется фактор-пространством пространства К по подпространству L. 2.49. Теорема. Пусть К = Кп есть п-мерное линейное пространство над полем К\ L = LLc:K есть 1-мерное подпро-
64 ГЛ. 2. ЛИНЕЙНЫЕ ПРОСТРАНСТВА [2.51 странство в К. Тогда фактор-пространство K/L имеет размерность п — /. Доказательство. Выберем произвольно базис fiy • • • у fi B подпространстве L и дополним его, как в 2.43, векторами /1 + г, ...,/„ до базиса всего К. Рассмотрим классы Х/ + 1Э/ль ••• > Х„ЭЛ и покажем, что они образуют базис в пространстве K/L. Для любого х £ К существует представление п поэтому для класса X Э * существует представление Х= 2 aftXft. Покажем, что классы Х/ + 1, . . . , Хп линейно независимы. Если бы мы имели при некоторых сс/ + 1, . . . , ап из К «(+A+1+...+a,X„ = 0€K/L, то, в частности, выполнялось бы соотношение az + i// + i+-..+aii/n€L; но так как // + 1, ..., /„ линейно независимы над L (2.44), то а/ + 1 == . . . =а/1 = 0, что и требовалось. Таким образом, Х/ + 1, ..., Хл образуют базис в K/L; но тогда их число п — / есть размерность пространства K/L (2.35). Теорема доказана. § 2.5. Линейные оболочки 2.51. Важным способом построения подпространств является образование линейной оболочки заданной системы векторов. Пусть х, уу z} ...—некоторая система векторов линейного пространства К; линейной оболочкой системы х, у, z, ... называется совокупность всех (конечных) линейных комбинаций ax+$y+yz+... (И) с коэффициентами а, [5, у} ... из поля К. Легко проверить, что для этой совокупности выполнены условия 2.41 а, б; поэтому линейная оболочка системы х, у, z, ... есть под
2.53] § 2.5. ЛИНЕЙНЫЕ ОБОЛОЧКИ 65 пространство пространства К. Это подпространство, очевидно, содержит векторы ху уу zy ... С другой стороны, всякое подпространство, содержащее векторы ху уу zy ..., содержит и все их линейные комбинации (И); следовательно, линейная оболочка векторов х, у, z, ... есть наименьшее подпространство, содержащее эти векторы. Линейная оболочка векторов ху уу zy ... обозначается через L(xyyy z, .. .). 2.52. Пример ы. а. Линейная оболочка векторов е1у е2У ..., ^образующих базис некоторого пространства К, очевидно, совпадает со всем пространством К. б. Линейная оболочка пары (неколлинеарных) векторов пространства V3 состоит из всех векторов, параллельных плоскости этих векторов. в. Линейная оболочка системы функций 1, ty t2y . . ., tk пространства К(ау b) (К есть R или С) совпадает с совокупностью всех многочленов от t не выше &-й степени. Линейная оболочка бесконечной системы функций 1, ty t2y . . . состоит из всех многочленов (любой степени) от переменного t с коэффициентами из поля К. 2.53. Отметим два простых свойства линейных оболочек. а. Лемма. Если векторы х'у у'у ... принадлежат к линейной оболочке векторов ху уу . . ., то вся линейная оболочка L(x'y у'у ...) содержится в линейной оболочке Ч*. У, ...)• Действительно, поскольку векторы х'у у'у ... принадлежат к подпространству L(xy yy ...), все их линейные комбинации, совокупность которых и составляет линейную оболочку L(x'y у'', ...), также принадлежат к подпространству Ь(дг, уу .. .). б. Лемма. Всякий вектор системы ху уу ..., линейно зависящий от остальных векторов этой системы, можно из нее исключить без изменения линейной оболочки. Действительно, если, например, вектор х линейно зависит от векторов уу zy . . . , то это означает, что х £ L (yy zy. ..). Отсюда и из леммы а вытекает, что L(xy yy zy ...)cz ^ I- Cv, z, . • .)• С другой стороны, очевидно, Цуу zy . . . )<z czL(xyy} z, ...). Оба включения вместе показывают, что L {уу z, . . ,) = L(x, у, z, ...), что и требуется. 3 Г. Е. Шилов
66 ГЛ. 2. ЛИНЕЙНЫЕ ПРОСТРАНСТВА [2.54 2.54. Поставим вопрос о построении базиса линейной оболочки и определении ее размерности. При решении этого вопроса мы будем предполагать, что число векторов ху уу . . ., порождающих линейную оболочку L(xy уу ...), конечно (хотя некоторые из заключений и не будут существенно требовать такого предположения). Допустим, что среди векторов ху уу ..., порождающих линейную оболочку L(ху уу . . .), мы смогли найти г линейно независимых векторов,— обозначим их через х1у х2У ... , хГУ— через которые может быть линейно выражен любой вектор из системы х, уу . .. В этом случае мы можем утверждать, что векторы х1у х2у ...ухг образуют базис пространства L (ху уу . . .). Действительно, всякий вектор z с L (ху уу . . .) по самому определению линейной оболочки линейно выражается через конечное число векторов из системы х, уу . . .; но каждый из векторов этой системы по условию линейно выражается через х1у х2у . . ., хг; поэтому в конечном счете и вектор z может быть линейно выражен непосредственно через векторы х1у х2У ..., хг. В соединении с предположенной линейной независимостью векторов х1у х2, ...ухг мы получаем выполнение для них обоих условий, содержащихся в определении базиса (2.31)у что и требовалось. Согласно теореме 2.35 размерность пространства L(xyyy ...) равна числу г. Поскольку в г-мерном пространстве не может существовать более чем г линейно независимых векторов, мы можем сделать относительно размерности г пространства L(xy уу ...) следующие выводы: а. Если число порождающих векторов ху уу ... больше числа г, то векторы ху уу ... линейно зависимы; если их число равно числу г, то они линейно независимы. б. Всякие г-\-\ векторов из системы ху уу ... линейно зависимы. в. Размерность пространства L(xy yy ...) можно определить как максимальное число линейно независимых векторов в системе ху уу ... § 2.6. Гиперплоскости 2.61. Как мы уже видели в 2А2гу геометрический образ, соответствующий понятию подпространства, для пространства V3 в «точечной» (а не «векторной») интерпретации есть
2.62] § 2.6. ГИПЕРПЛОСКОСТИ 67 плоскость (или прямая), проходящая через начало координат. Но плоскости и прямые, не проходящие через начало координат, желательно было бы также включить в круг наших рассмотрений. Замечая, что такие плоскости и прямые получаются из плоскостей и прямых, проходящих через начало координат, параллельным перемещением в пространстве, т. е. сдвигом, мы естественно приходим к следующему общему построению. Пусть L — некоторое подпространство линейного пространства К и х0— фиксированный вектор, вообще говоря, не принадлежащий L. Рассмотрим совокупность Н всех векторов х, которые получаются по формуле х = х0+у, когда вектор у пробегает все подпространство L. Совокупность Н называется результатом сдвига подпространства L вдоль вектора х0 или гиперплоскостью. Заметим, что гиперплоскость сама, вообще говоря, не образует подпространства. 2.62. Примеры. а. В пространстве \/3 совокупность всех векторов, выходящих из начала координат и кончающихся на некоторой плоскости y> образует гиперплоскость. Легко проверить, что эта гиперплоскость является подпространством в том и только в том случае, когда плоскость у проходит через начало координат. б. В пространстве Кп рассмотрим совокупность Н тех векторов х = (£,1У £2, ..., £„), координаты которых удовлетворяют совместной системе линейных уравнений «11*1 + ^12*2 + • - • + fliA = К аЪ\*\ ~\~ ai2X2 "Г" • - • ~t~ a2nXn ~ ^2» ■aklXl+ak2X* + '• -+aknXn-bk, и совокупность L тех векторов у = (%, г]2, ..., r]J, координаты которых удовлетворяют однородной системе линейных (12) 3*
2.72] § 2.7. морфизмы линейных пространств 69 элемент подпространства L', можно представить в виде хг-\-у1, где уг g L (поскольку V есть сдвиг подпространства L на вектор д^); отсюда следует, что хг= —ух и поэтому х1 входит в L, что мы и утверждали. Но в таком случае и всякий вектор у' £ L' входит в подпространство L, так как представляется суммой вектора хг£ L и некоторого вектора y£L. Следовательно, имеет место включение L'cL. В силу полной симметрии условия аналогично можно доказать, что LcL', откуда вытекает, что L = L', что и утверждалось. В дальнейшем гиперплоскости размерности 1 будем называть прямыми линиями, гиперплоскости размерности 2 — плоскостями. См. задачи 11—14. § 2.7. Морфизмы линейных пространств 2.71. Пусть каждому вектору х' линейного пространства К' по некоторому правилу со поставлен в соответствие вектор х" линейного пространства К". Правило со называется морфизмом (или линейным оператором), если выполняются следующие соотношения: а) со (х' -г у') =:со (*')-]- со (у') для любых х\ у' из К'; б) со (ал:') ~а со (х') для любых лг'ёК' и любого а£Л\ Если морфизм со отображает пространство К' на все пространство К'', он называется эпиморфизмом. Если морфизм со отображает пространство К' хотя бы и не на все К", но взаимно однозначно (так что из х' Фу' следует со {х') Ф ф<£>{у')), он называется мономорфизмом. Если морфизм со отображает пространство К' взаимно однозначно на все пространство К'', т. е. является одновременно моно- и эпиморфизмом, он называется изоморфизмом, а сами пространства К' и К" называются изоморфными (точнее, К-изоморфными). Общепринятое обозначение морфизма: со: К'-* К". 2.72. П'р и м е ры. а. Пусть L есть подпространство пространства К. Отображение со, которое каждому вектору х £ L ставит в соответствие этот же вектор х в пространстве К, есть морфизм
70 ГЛ. 2. ЛИНЕЙНЫЕ ПРОСТРАНСТВА [2.73 L в К, и именно мономорфизм (причем, если L^=K, не эпиморфизм). Этот морфизм со называется вложением L в К. б. Пусть L есть подпространство пространства К и K/L — фактор-пространство пространства К по подпространству L (2.48). Отображение со, которое каждому вектору л* € К ставит в соотвегствие класс XcK/L, содержащий элемент х, есть морфизм К в К/Ь, и именно эпиморфизм (причем, если L^O, не мономорфизм). Этот морфизм со называется каноническим отобраокением К на K/L. 2.73. а. Пусть пространство К' /2-мерно и обладает базисом е[, ..., е'п. В пространстве К" выберем произвольно векторы е\, .... е"п. Поставим в соответствие любому век- п тору х = У £*<?*€ К' вектор *>(*') = *" = 2**4; с теми же коэффициентами \k(k—A, ..., п). Покажем, что отображение (й(х')-х" есть морфизм про* странетва К' в пространство К". Пусть в пространстве К' выбраны два вектора п гг_ тогда по 2.33 Согласно определению отображения со /е= 1 /г= 1 Далее, /о=1 /г=1 ^1
2.74) § 2.7. морфизмы линейных пространств 71 так что условие 2.71а) выполнено. Аналогично при любом а е к о) (ад;') = о (a jg lke'k) = <*>('£ a\keh n n = 2 alke"k = а 2 £/A = а со (д:'), Л = I /V = I так что выполнено и условие 2.716). Следовательно, со (х') = #" есть морфизм К' в К", что и утверждалось. б. Выясним, при каком условии морфизм со, описанный в а, является эпиморфизмом. Очевидно, необходимым и достаточным условием для этого является возможность представ- п ления в форме V \ке\ любого вектора х" £ К", иными сло- вами, тот факт, что К" совпадает с линейной оболочкой векторов е"1} . . ., е"п. в. Выясним, при каком условии морфизм о), описанный в а, является мономорфизмом. Для этого необходимо и достаточно, чтобы векторы ^^ke'k\ ]£] т]^', различающиеся хотя бы по одной паре координат (т. е. такие, что \k Ф \\k хотя бы при одном значении &), были бы различными векторами пространства К". Но это равносильно линейной независимости векторов ё[, ..., е"ПУ следовательно, морфизм со тогда и только тогда является мономорфизмом, когда векторы е\, . . ., е"п линейно независимы. г. Как следствие получаем: морфизм со, описанный в а, является изоморфизмом тогда и только тогда, когда векторы е"и ..., е"п линейно независимы и их линейная оболочка совпадает со всем пространством К". Иначе говоря, морфизм со является изоморфизмом тогда и только тогда, когда векторы el, . . ., е"п образуют базис пространства К". 2.74. Теорема. Любые два n-мерных пространства К' и К" (над одним и тем же полем К) К-изоморфны. Доказательство. Пусть е[, ..., е'п — базис в пространстве К' и е"1у . .., е"п — базис в пространстве К". С помощью этих систем векторов построим морфизм со, как указано в 2.73а. В силу 2.7Зг он является изоморфизмом, что и требуется.
72 ГЛ. 2. ЛИНЕЙНЫЕ ПРОСТРАНСТВА |2.?5 2.75. Следствие. Всякое л-мерное линейное пространство над полем К /С-изоморфно пространству Кп (2.156). В частности, всякое л-мерное комплексное пространство С-изоморфно пространству Сп; всякое л-мерное вещественное пространство /^-изоморфно пространству Rn. 2.76. Дальнейшие свойства моно- и эпиморфизмов. а. Пусть имеется морфизм со: К'—►К". Рассмотрим совокупность всех векторов co^'JgK", когда х' пробегает все К'. Эта совокупность есть, очевидно, подпространство L"с: К"'. Оно называется областью значений морфизма со. Ясно, что отображение со пространства К' в L" является эпиморфизмом. Если морфизм со: К'—*К" был мономорфизмом, то морфизм со: К'—>L" есть изоморфизм. б. Пусть имеется морфизм со: К'—*К". Рассмотрим совокупность L' всех векторов лг'£К', для которых со(лг') — 0. Совокупность L' есть, очевидно, подпространство в пространстве К'; оно называется ядром, или ну ль-многообразием морфизма со. Построим фактор-пространство K7L' (2.48). Все элементы х', лежащие в одном и том же классе X'gK'/L' переводятся морфизмом со в один и тот же элемент пространства К"; действительно, для двух таких элементов х' и у' мы имеем х'—у' =z'£L', откуда со (х') — со (у') = со (zf) = 0, со (х') = = со {у'). Поставим в соответствие каждому классу X' £ К'/Ь' элемент х" = со (xf) £ К", где х' g X'—любой элемент; мы только что видели, что х" определен при этом однозначно. Положим х" = Q(X'). Отображение й, как легко видеть, есть морфизм пространства K7L' в К"; он является мономорфизмом, так как из X'^=Y', x'gX', у' £Y' следует Q (X') — Q (У) = со (*') — со {у') = со (*' —у') Ф 0. Таким образом, любой морфизм со: К'—*К" порождает мономорфизм Q: K7L'—*-К". Если морфизм со был эпиморфизмом, то, очевидно, и мономорфизм Q является эпиморфизмом, так что эпиморфизм со: К'—*К" порождает изоморфизм Q: K7L'—*К". Мы продолжим изучение м орфизмов в гл. 4.
ЗАДАЧИ 73 ЗАДАЧИ 1. Образует ли совокупность векторов на плоскости, начала которых находятся в начале координат, а концы — в пределах первой четверти, линейное пространство (с обычными операциями)? 2. Образует ли линейное пространство совокупность всех векторов на плоскости с исключением векторов, параллельных некоторой заданной прямой? 3. Рассмотрим совокупность Р одних положительных вещественных чисел. Введем операции по следующим правилам: под •сложением» двух чисел будем понимать их (обычное) умножение, а под произведением элемента г £ Р на вещественное число Я будем понимать (обычное) возведение числа г в степень Я. Является ли Р с указанными операциями линейным пространством? 4. Показать, что в случае п заданных векторов в пространстве Кп критерием линейной независимости их служит неравенство нулю определителя, составленного из координат этих векторов. 5. Показать, что в пространстве R (а, Ь), где 0 < а < Ь, функции /ai, /*2, ..., t*k линейно независимы, если аъ а2, ..., ak — различные вещественные числа. 6. Относительно системы векторов ех, е2, ..., еп линейного пространства К известно следующее: а) Каждый вектор х £ К допускает разложение * = ll«l + S2*2+ ■••+£,,*«■ б) Для некоторого фиксированного вектора х0 £ К это разложение единственно. Доказать, что система elf ..., еп образует базис пространства К. 7. Существует ли базис у пространства Р (задача 3)? 8. Какова размерность пространства Р (задача 3)? 9. В пространстве V3 взяты два различных двумерных подпространства Li и L2 (две различные плоскости, проходящие через начало координат). Что собой представляют их пересечение и сумма? 10. Доказать теорему: если размерность подпространства LcK совпадает с размерностью пространства К, то L==K. П. Определен ли однозначно самой гиперплоскостью вектор сдвига *0, фигурирующий в ее построении? 12. Показать, что всякая гиперплоскость НсК обладает следующим свойством: если х £ Н, у £ Н, то ах-\-(\—а) у £ Н при любом вещественном а. Обратно, если некоторое подмножество Н CZ К обладает сформулированным свойством, то Н есть гиперплоскость. Какая геометрическая характеристика гиперплоскости содержится в этом свойстве? 13. Гиперплоскости Нх и Н2 имеют размерности соответственно р и q. Какой (наименьшей) размерности нужно взять гиперплоскость Н3, чтобы она, будучи должным образом расположена в пространстве, содержала в себе и Hx и Н2? 14. Аналогичная задача для трех гиперплоскостей Hlf H2, Н3 с размерностями р, q и г. 15. Согласно теореме 2.74 одномерные пространства Rx и Р (задача 3) изоморфны. Как можно осуществить этот изоморфизм?
ГЛАВА 3 СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ §3.1. Еще о ранге матрицы 3.11. Мы уже несколько раз встречались с матрицами в нашем изложении. В этом параграфе мы остановимся более детально на тех свойствах матрицы, которые связаны с понятием ранга {1.92). Это позволит нам дать общее решение задачи о системах линейных уравнений, сформулированной в § 1.2. Напомним основные определения из § 1.9. Пусть дана матрица с п строками и к столбцами, заполненными числами a(j (i — индекс строки, j—индекс столбца, /=1, 2, ... , пу j=\, 2, . . . , к) из поля К: ап а12 . . . alk д _ a2i агг • • • a2k || ап1 ап2 . . . ank Если в этой матрице выбрать произвольным образом т строк и т столбцов, то элементы, стоящие на пересечениях этих строк и столбцов, образуют квадратную матрицу порядка т. Определитель этой матрицы называется минором т-го порядка матрицы А. Натуральное число г называется рангом матрицы Л, если у нее имеется минор порядка г, отличный от нуля, а все имеющиеся миноры порядка г + 1 и выше равны нулю. Если матрица А имеет ранг г > О, то всякий ее минор r-го порядка, отличный от нуля, называется базисным минором. Столбцы и строки матрицы, на пересечениях которых находятся элементы базисного минора, называются базисными столбцами и строками. Наши дальнейшие рассмотрения будут основаны на возможности придать любому столбцу из п чисел геомет- • (1)
3.12J §3.1. ЕЩЕ О РАНГЕ МАТРИЦЫ 75 рический смысл вектора в л-мерном пространстве Кп (2.156). Сама матрица А в этой геометрической трактовке отвечает определенной совокупности k векторов пространства Кп\ обозначим через х;- вектор, соответствующий у-му столбцу матрицы А (у=1, 2, . . . , k). Любое линейное соотношение между столбцами матрицы мы можем истолковать как такое же линейное соотношение между соответствующими векторами (2.226). Образуем в пространстве Кп линейную оболочку векторов xv x2J . . . , xk (2.51). Покажем, что векторы, отвечающие базисным столбцам матрицы А,—пусть для определенности первые г ее столбцов являются базисными — образуют базис этой линейной оболочки. Для этого достаточно показать, во-первых, что векторы xv дг2, . . . , хг линейно независимы и, во-вторых, что через них может быть линейно выражен любой из оставшихся векторов хг+1у . . . , xk (2.54). Проверим сначала первое из этих утверждений. Линейная зависимость векторов хъ х2, . . . , хг была бы равносильна линейной зависимости г первых столбцов матрицы А. Но тогда в силу теоремы 1.96 любой определитель г-го порядка, построенный на этих столбцах и каких-нибудь г строках матрицы А, был бы равен нулю. В частности, был бы равен нулю базисный минор матрицы А, что противоречит его определению. Таким образом, первое утверждение доказано. Второе утверждение мы фактически доказали в 1.93; сформулированное там для столбцов матрицы А} оно составило содержание «теоремы о базисном миноре». Тем самым мы полностью доказали, что векторы xv х2> . . ., хг образуют базис пространства L(x1} х2, ... , xk). В силу теоремы 2.35 размерность этого пространства равна числу г, т. е. равна рангу матрицы А. Мы получили следующий важный результат: Теорема. Размерность линейной оболочки векторов, определенных столбцами матрицы А, равна рангу этой матрицы. Векторы, отвечающие базисным столбцам матрицы А, образуют базис линейной оболочки. 3.12. Дальнейшие предложения представляют собой очевидные следствия из 2.54а — в. а. Теорема. Если ранг матрицы А меньше, чем число ее столбцов (г < k), то столбцы матрицы А линейно зависимы.
76 ГЛ. 3. СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ 13.13 Если ранг матрицы А равен числу столбцов (r = k), то столбцы матрицы А линейно независимы. б. Теорема. Всякие г + 1 столбцов матрицы А ранга г линейно зависимы. в. Теорема. Ранг любой матрицы равен максимальному числу ее линейно независимых столбцов. Это последнее предложение имеет большое принципиальное значение, так как оно содержит в себе новое определение ранга матрицы. 3.13. Если транспонировать матрицу Ау т. е. перейти от матрицы А к матрице А', строки которой являются столбцами матрицы А, то ранг транспонированной матрицы А' будет, очевидно, таким же, каков был ранг матрицы А. Но согласно теореме 3.12в ранг матрицы А равен максимальному количеству ее линейно независимых столбцов, или, что то же самое, строк матрицы А'. Мы приходим к несколько неожиданному заключению: Теорема. Максимальное количество линейно независимых строк любой матрицы совпадает с максимальным количеством ее линейно независимых столбцов. Заметим, что эта теорема нетривиальна; любое прямое ее доказательство потребовало бы цепи рассуждений, эквивалентной доказательству теорем 1.93 и 3.11. 3.14. Отметим еще следующий результат, который вытекает из теоремы 3.11 и леммы 2.536: Теорема. Если один из столбцов матрицы А является линейной комбинацией других ее столбцов, то его можно вычеркнуть из этой матрицы, не меняя ее ранга. См. задачи 1—2. § 3.2. Нетривиальная совместность однородной линейной системы 3.21. Пусть дана однородная линейная система апхг + а12х2 + . . . + а1пхп = О, а2\Х1 ~Г Я 22*2 ~Г • • • "Т а2пХп == О» ahlxi + ак2Х2 + • • • + aknxn — О- (2)
3.22) § 3.2. НЕТРИВИАЛЬНАЯ СОВМЕСТНОСТЬ 77 Как мы уже знаем, эта система всегда совместна, так как обладает нулевым решением хг = х2 = . . . =хп = 0. Основная задача, с которой приходится встречаться при изучении однородных линейных систем, следующая: при каких условиях однородная система «нетривиально совместна», т. е. имеет, кроме нулевого, еще другие решения'? Результаты § 3.1 позволяют сразу решить эту задачу. Действительно, существование ненулевого решения системы (2), как мы видели в 2.226, равносильно линейной зависимости столбцов матрицы II «И «12 • ' • а\п 1 л «21 «22 * * * а2п || ukl uk2 * * * ukn [I а по теореме 3.12а эта линейная зависимость имеет место тогда и только тогда, когда ранг матрицы А меньше числа столбцов. Итак, мы получаем следующую теорему: Теорема. Если ранг матрицы А равен числу я, система (2) не имеет ненулевых решений; если же ранг матрицы А меньше /г, ненулевые решения системы (2) заведомо существуют; в этом и только в этом случае наша система нетривиально совместна. 3.22. В частности, если число уравнений в системе (2) меньше числа неизвестных (k < я), то ранг матрицы А заведомо меньше п и ненулевые решения всегда существуют. Если k — n} то решение вопроса о существовании ненулевых решений зависит от величины detA: если deM^O, ненулевых решений нет (г = п)} если det A = 0, ненулевые решения есть (г < п). При k > n нужно рассмотреть все возможные определители /2-го порядка, которые получаются при выборе п произвольных строк матрицы А; если все эти определители равны нулю, то г < п и имеются ненулевые решения; если же среди этих определителей есть хотя бы один отличный от нуля, то г = п и имеется только нулевое решение. См. задачу 3.
78 ГЛ. 3. СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ I3-3* § 3.3. Условие совместности общей линейной системы 3.31. Пусть дана общая линейная система уравнений «Ц-^1 ~~Г #12*2 ••• | а1пХп ^11 "i~ "-о*)"^ ь 22^2 «2пХn — ^2> (3) + aknXn = h> С этой системой мы сопоставим две матрицы: матрицу i4--= j/i <721 <722 «о, [| ак\ ак2 к и «11 «21 йк\ «12 ' «22 ' «*2 ' • • «1// . . а.2„ • акп ', &2 »* называемую основной матрицей системы (3), и матрицу А = называемую расширенной матрицей системы (3). Важная теорема о совместности системы (3) гласит: Теорема (Кронекер и Капе л л и). Система (3) сов- местна тогда и только тогда, когда ранг расширенной матрицы, этой системы равен рангу основной матрицы. Доказательство. Допустим сначала, что система (3) совместна; если с]? с2, ..., сп — некоторое ее решение, то имеют место равенства Япс1 + «12с2+ • •• + <*1псп = Ь19 «21С1 — «22С2 'Г • • • + а2пСп == «2> aklCl + ak2C2+ • I К U И R Но эти равенства означают, что последний столбец матрицы Ах есть линейная комбинация остальных столбцов этой матрицы (с коэффициентами cv c2, ..., сп). В силу теоремы 3.14 последний столбец матрицы Ах можно вычеркнуть без изменения ее ранга. Но при вычеркивании последнего столбца
3.41] § 3.4. ОБЩЕЕ РЕШЕНИЕ ЛИНЕЙНОЙ СИСТЕМЫ 79 матрица Ах переходит как раз в матрицу А. Следовательно, если система (3) совместна, матрицы А и Ах имеют одинаковый ранг. Допустим теперь, что матрицы А и Ах имеют одинаковый ранг, и покажем, что система (3) совместна. Пусть г — ранг матрицы А (следовательно, и матрицы Ах). Рассмотрим г базисных столбцов матрицы А; они будут базисными столбцами и матрицы Av По теореме 1.93 последний столбец матрицы AY есть линейная комбинация базисных столбцов, а следовательно, и линейная комбинация всех столбцов матрицы А. Если мы коэффициенты этой последней линейной комбинации обозначим через съ с2, ..., сПУ то получим, что выполняются равенства апс1+а12с2 + .. . +а1псп = Ь1ч а21с1 --}- о22с2 4- . . . 4- а2псп == /;2, afclCl "Г Я*2С2 "Г • • • + aknCn = &к' J Таким образом, система (4) удовлетворяется значениями Х\ — Cl> X2~ C2i • • • •> Хп= Сп и, следовательно, совместна. Теорема доказана. § 3.4. Общее решение линейной системы 3.41. Теорема Кронекера — Капелли, устанавливая общее условие совместности линейной системы, не дает способа, получения решений этой системы. В этом параграфе мы выведем формулу, заключающую в себе общее решение линейной системы. Общим решением системы (3) называется совокупность выражений вида (у=1, . .. , п), где в правых частях стоят функции, зависящие от коэффициентов a{j системы (3), ее свободных членов bj и неопределенных параметров д1у . . . , qs, такие, что при произвольно фиксированных значениях параметров q. (из поля К) получающиеся величины Xj= сj (j= 1, ,,. , п) образуют решение системы (3), (4)
80 ГЛ. 3. СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ [3.41 причем любое решение системы (3) получается этим путем при некотором выборе значений параметров qly . . . , qs из К, В 2.626 мы видели, что совокупность всех сумм вида х0-~уу где х0— какое-либо частное решение этой системы, а у пробегает совокупность всех решений соответствующей однородной системы, есть совокупность всех решений системы (3). Теперь этот факт можно выразить следующим образом: общее решение неоднородной системы (3) есть сумма какого-либо частного решения этой же системы и общего решения соответствующей однородной системы. Пусть дана совместная линейная система (3) с основной матрицей Л^Ца^Ц ранга г. Можно предположить, что базисный минор М матрицы А расположен в ее левом верхнем углу; если бы это было не так, мы смогли бы достичь желаемого расположения некоторой перестановкой строк и столбцов матрицы Л, что равносильно некоторой перестановке уравнений и неизвестных в системе (3). Рассмотрим первые г уравнений системы (3), причем перепишем их следующим образом: апх1 + а12х2+ ... +alrxr =bl — alt r+1xr + 1 — ... — alnxn, ^21^1 I &2<1Х2 I • • • I ^2ГХГ == ^2 ^2, Г + \ХГ + 1 * * • ^2пХП » аг1Х1~\~аг2Х2~\- • • • -\~агГХГ — "Г ar, Г + 1ХГ + 1 ' * ' аГПХП- Придадим неизвестным xr+l} . . . , xn совершенно произвольные значения cr + 1, . . . , cn. Тогда система (5) превращается в систему г уравнений для г неизвестных xiy х2У . . . , хг с определителем М} отличным от нуля (базисным минором матрицы А). Эту систему можно разрешить по правилу Крамера 1.73; существуют, следовательно, числа cv с2, . . . , спУ которые при подстановке их в систему (5) на место неизвестных х1У х2у . . . , хп обращают все уравнения этой системы в тождества. Покажем, что эти значения cv с2, . . . , сп удовлетворяют и всем прочим уравнениям системы (3). Первые г строк расширенной матрицы Аг системы (3) являются базисными строками этой матрицы, так как ранг расширенной матрицы в силу условия совместности равен г и в первых г строках матрицы Ах содержится отличный от нуля минор М. В силу теоремы 1.93 (в применении к строкам) каждая из последующих строк матрицы Аг есть линейная комбинация ее первых г строк. Для системы (3) это означает, что каждое уравнение системы (3), начиная с (г-[- 1)-го, есть (5)
3.51] § 3.5. свойства совокупности решений 81 линейная комбинация первых г уравнений этой системы. Следовательно, если первые г уравнений системы (3) удовлетворяются значениями х1 = с1, ..., хп=^спУ то все остальные ее уравнения также удовлетворяются этими значениями. 3.42. Чтобы записать построенное решение системы (3) в виде некоторой формулы, обозначим через My (а,) определитель, получающийся из базисного минора М — det||a/;-|| (iy у=1, 2, . . . , г) заменой его у-го столбца на столбец из величина^ а2, . . . , ah . .., аг Тогда, записывая решение системы (5) с помощью формул Крамера, мы получим *j = "лГ Ml Wi ~" ais + icr + i - • ' ' — aincn) = (7=1, •••> г), Xj==cf(j=r+\y . .. , h). Эти формулы выражают значения неизвестных Xj=c, (у=1, 2, . . . , г) через коэффициенты системы, свободные члены и произвольные величины (параметры) сг + 1, сг+2, . . . , сп. Покажем, что в формулах (6) содержится любое решение системы (3). Действительно, пусть cj, с°, . . . , с°+1, . . . , с°— произвольное решение системы (3). Очевидно, оно является также решением системы (5). Но по правилу Крамера из системы (5) величины с?, с\, . . . , с? определяются через величины с°+1, . . . , с„ однозначно и именно по формулам (6). Таким образом, при cr+1 = cj!+1, ..., сп = с\ формулы (6) дают нам как раз взятое решение с?, с°, . . . , с°, что и требовалось. Таким образом, формулы (6) дают общее решение системы (3). См. задачи 4—7. § 3.5. Геометрические свойства совокупности решений линейной системы 3.51. Рассмотрим сначала случай однородной линейной системы (2); мы уже знаем, что совокупность всех решений такой системы образует линейное пространство (2.42д). Обозначая это пространство через Z., вычислим его размерность и построим его базис.
82 ГЛ. 3. СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ [3.52 Формулы (6) в данном случае приобретают вид — Мс~ cr + 1Mf(aijr+1)+ . . .+c„M;(ain) (У= 1, 2, ...,г), (7) так как M/(bi)^M/(0) = 0. Каждому решению (cv с2, . . . , сг, сг+1, . . . , сп) системы (2) поставим в соответствие вектор (сг+1, . . . , сп) пространства Кп_г. Так как числа сг+1, . . . , сп могут быть взяты произвольно и однозначно определяют решение системы (2), то соответствие между пространством решений системы (2) и пространством Кп__г получается взаимно однозначным. Поскольку при этом соответствии, как легко проверить, сохраняются линейные операции, это соответствие является изоморфным. Итак, пространство L решений однородной системы линейных уравнений с п неизвестными и с рангом г матрицы коэффициентов изоморфно пространству Кп_г. В частности, размерность пространства L равна числу п — г. 3.52. Любая система из п — г линейно независимых решений однородной линейной системы уравнений, являющаяся вследствие теоремы 2.34 базисом в пространстве всех решений, называется фундаментальной системой решений. Для построения фундаментальной системы решений мы можем воспользоваться любым базисом пространства Кп_г\ в силу изоморфизма соответствующие решения системы (2) будут образовывать базис и в пространстве всех решений этой системы. Простейший базис пространства Кп_г образуется векторами еЛ = (1, 0, ..., 0), е2 = (0,1, ..., 0), ..., еп_г = — (0, 0,. . . , 1) (2.326). Чтобы получить решение системы (2), соответствующее, например, вектору ev нужно в формулах (7) подставить сг + 1 — 1, сг+2 = . . . = сп = 0 и определить соответствующие значения с( = с^ (/=1, 2, ... , п). Аналогично строится решение, соответствующее любому другому вектору ej (/ =2, . . . , п — г). Построенная так совокупность решений системы (2) называется нормальной фундаментальной системой решений. Если обозначить эти решения через ха\ х{-\ ..., х(п~г\ то по определению базиса для любого решения х мы будем
3.61J § 3.6. МЕТОДЫ ВЫЧИСЛЕНИЯ РАНГА МАТРИЦЫ 83 иметь равенство х = агх{1) + а2х{2) + . . . + ап_гх{п~г). (8) Поскольку в формуле (8) заключено любое решение системы (2), эта формула дает общее решение системы (2). См. задачу 8. 3.53. Переходим теперь к рассмотрению неоднородной системы (3) в общем случае. Как было показано в 2.626, геометрический образ Я, отвечающий совокупности всех решений неоднородной системы, есть гиперплоскость в я-мерноу пространстве Кп, полученная сдвигом подпространства L решений соответствующей однородной системы (по доказанному изоморфного пространству Rn_r) на некоторый вектор х0, являющийся произвольным частным решением неоднородной системы. Из этого мы выводим прежде всего, что размерность гиперплоскости Н совпадает с размерностью подпространства L. Далее, если г — ранг основной матрицы системы (3), то любой вектору подпространства L можно представить в виде суммы У = *1У{1) + ЪУ{*)+ • • • +*п-гУ{п~г)> где у1}, у2), . . . , у(п~г) — базисные векторы подпространства L (фундаментальная система решений). Следовательно, любой вектор х гиперплоскости Н можно представить в виде суммы х = Хо+У = Хо + а1у{1) + а2у™+...+ап_гу<»-гК Этот результат на языке решений систем (3) и (2) согласуется с принципом, установленным в 3.41: Общее решение неоднородной системы (3) равно сумме любого частного решения этой системы и общего решения соответствующей однородной системы (2). См. задачу 9. § 3.6. Методы вычисления ранга матрицы 3.61. Для практического использования развитых в предыдущих параграфах методов решения систем линейных уравнений необходимо уметь вычислять ранг матрицы и находить ее базисный минор. Очевидно, что определение ранга матрицы,
84 ГЛ. 3. СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ [3-61 данное в 1.92, само по себе не может служить разумным способом практического вычисления ранга; например, в квадратной матрице 5-го порядка можно выделить один минор 5-го порядка, 25 миноров 4-го порядка, 100 миноров 3-го порядка и 100 миноров 2-го порядка; понятно, что если бы мы пожелали найти ранг этой матрицы с помощью прямого вычисления величины всех ее миноров, это была бы весьма трудоемкая задача. В этом пункте будут даны простые способы подсчета ранга матрицы и определения ее базисного минора. Эти способы основаны на изучении некоторых операций со столбцами и строками матрицы, которые не изменяют ее ранга; мы будем называть эти операции элементарными операциями. Поскольку ранг матрицы, как мы уже указывали, не меняется при транспонировании, мы будем определять эти операции только для столбцов матрицы. В связи с этим при доказательствах мы будем использовать геометрическую интерпретацию матрицы с п строками и к столбцами как матрицы из координат некоторой системы k векторов х1} х2у •. . , хк л-мерного пространства R„ и теорему 3.11} согласно которой ранг этой матрицы равен размерности линейной оболочки векторов xv х2} . . . , xk. а. Перестановка столбцов. Пусть в матрице А произвольно переставлены ее столбцы; покажем, что эта операция не изменяет ее ранга. Действительно, размерность линейной оболочки векторов х1У х2> - • • , хк не зависит от того, в каком порядке они записаны; следовательно, и ранг матрицы не зависит от порядка ее столбцов. б. Отбрасывание ненулевого общего множителя элементов данного столбца. Допустим, что речь идет об отбрасывании общего множителя X Ф О у элементов первого столбца матрицы А Эта операция равносильна замене системы векторов Xxv х2} - - - , xk на систему xv х2у . . . , хк\ но очевидно, что размерности линейных оболочек этих систем одинаковы (так как сами линейные оболочки совпадают). Поэтому ранг матрицы А не меняется в результате этой элементарной операции. в. Прибавление к одному столбцу другого столбца с произвольным множителем. Пусть к у-му столбцу матрицы А прибавлен /я-й столбец этой же матрицы, умноженный на число X. Это означает, что система векторов хъ . . . , Хр . . . , хт, . .. , xk заменена на систе-
3.62) § 3.6. МЕТОДЫ ВЫЧИСЛЕНИЯ РАНГА МАТРИЦЫ 85 му #i, • • • , xf+Xxmy ..., хтУ ..., xk. Покажем, что линейные оболочки LY и L2 обеих этих систем совпадают. Действительно, все векторы второй системы входят в линейную оболочку векторов первой системы; поэтому в силу леммы 2.53а L2czL1. С другой стороны, равенство xf = (Xj+Kxm) — Xxm показывает, что вектор Xj входит в линейную оболочку векторов второй системы; так как все остальные векторы первой системы, очевидно, также входят в эту линейную оболочку, то L1c:L2. Отсюда вытекает, что Ll=^L2. Поэтому ранг матрицы А не меняется в результате рассматриваемой элементарной операции. г. Зачеркивание столбца, состоящего из одних нулей. Столбец из одних нулей отвечает нулевому вектору пространства Rn. Очевидно, что от зачеркивания нулевого вектора в системе х1} х2} . . . , xk линейная оболочка L (х1у х2у . . . , xk) не может измениться; вместе с нею не может измениться и ранг матрицы А. д. Зачеркивание столбца, являющегося линейной комбинацией других столбцов. Законность этой элементарной операции была доказана в 3.14. Подчеркнем еще раз, что все предложения, доказанные в а — д для столбцов матрицы Д справедливы также и для ее строк. 3.62. Подсчет ранга матрицы и отыскание базисного минора. Покажем,, как можно подсчитать ранг заданной матрицы А и найти ее базисный минор, используя операции, перечисленные в а — д. Если матрица А состоит из одних нулей, то ее ранг, очевидно, равен нулю. Допустим, что в матрице А имеется элемент, отличный от нуля; тогда, переставляя строки и столбцы, можно перевести этот элемент в левый верхний угол матрицы. Затем, вычитая из каждого столбца первый столбец с некоторым коэффициентом, можно обратить в нуль все остальные элементы первой строки. Больше мы не будем менять элементы первой строки и первого столбца *). Если среди остальных элементов (т. е. не принадлежащих к первой строке или к первому столбцу) нет *) Но, может быть, будем переставлять их.
86 ГЛ. 3. СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ [3.62 элементов, отличных от нуля, то ранг матрицы Д очевидно, равен 1. Если среди них имеется элемент, отличный от нуля, то, переставляя строки и столбцы, можно перевести его на пересечение второй строки и второго столбца и, так же как и раньше, обратить в нуль все следующие за ним элементы второй строки; отметим, что указанные операции не затрагивают первой строки и первого столбца. После этого вторую строку и второй столбец мы оставляем в покое. Продолжая таким образом далее, мы приведем матрицу А к одному из следующих двух видов (считая, что количество столбцов матрицы А не больше количества ее строк, чего всегда можно добиться транспонированием): а= ИЛИ о^ С21 1 С31 сп ck + l, 1 1 °nl At" С ) а2 С32 Ck2 Ck + 1, Сп2 04 ^21 СЯ1 ! Ст\ С„1 0 0 а3 CkS 2 Ck + 1, 3 ' СпЗ 0 0 . а2 0 сЯ2 а3 . ст2 Ст?, ' Сп2 СиЗ ' . 0 . 0 . 0 . ak • • С/г + 1, • Cnk .. 0 . . 0 . . 0 . . . 1 • • ал • • Спт 0 .. 0 . . 0 . . 0 . . ,0 .. 0 ... J 0 о 0 0 0 0 причем числа а1У а2, ... отличны от нуля. В первом случае ранг матрицы А1 равен k и базисный ми нар (в преобразованной матрице) стоит в левом верхнем углу; во втором случае ранг матрицы А2 равен т (числу столбцов) и базисный минор (в преобразованной матрице) стоит в первых т строках. Ранг матрицы Ау таким образом, определен; положение базисного минора можно восстановить, если проследить в обратном порядке за всеми операциями, которые производились с матрицей А.
3.62] § 3.6. методы вычисления ранга матрицы 87 Для примера рассмотрим следующую матрицу с пятью столбцами и шестью строками: А —2 —1 0 1 2 6 3 1 —1 — 10 2 — 1 —2 —7 —2 —2 -5 -5 -1 | —2 —1 8 1 -4 —1 3 2 -1 1 — 1 —2 2 1 1 3 0 -1 !—2 —1 1—2 —2 0 -5 6 —2 — 1 8 2 —4 —7 3 —5 —1 — 1 — 1 1 — i 2 1 1 2 6-2—1 _2 —1 0 —5 —1 3 1—18 1 __1 о 2—4 —1 __1 _2—7 3 2 —2 —2 —5 —1 1 Во второй строке матрицы А имеется один нуль; используя общий метод, мы можем получить в ней еще три нуля. Для удобства вначале переставим вторую строку с первой, а затем первый столбец со вторым (чтобы в левом верхнем углу оказался наименьший по абсолютной величине элемент—1). Мы получаем*): А ~ Теперь для получения трех новых нулей в первой строке вычтем из второго, четвертого и пятого столбцов первый столбец с множителями 2, 5 и 1: А~ Далее проще всего добиваться новых нулей в третьей строке; мы вначале переставим ее со второй строкой, затем прибавим к третьему и четвертому столбцам второй со множителями 1 и —3: 0 0 -3 -1 4 3 1-1 2 1 0 -2 1 ~2 0 —3 1 —1 3 2 0 6 — 1 2 —7 —5 0 — 12 3 —4 • 13 9 °11 -3 0 -1 4 3 1 А ~ 1 ~1 1 1 2 1 0 —2 —2 0 1 —3 — 1 3 2 0 — 1 6 2 —7 -5 0 3 — 12 —4 13 9 I 1-1 0 1 1 2 —3 ! о -1 i-2 3 1—2 2 0 0 3 1 -4 -3 0 0 -3 —1 4 3 0 0 —3 — 1 4 3 = АХ. *) Знак - между двумя матрицами означает в данном случае равенство их рангов.
88 ГЛ. 3. СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ Четвертый и пятый столбцы полученной матрицы А1 пропорциональны третьему, и их можно зачеркнуть. Оставшаяся матрица имеет, очевидно, ранг 3; вместе с ней имеет ранг 3 и исходная матрица А. Базисный минор матрицы Ах расположен в ее первых трех строках и первых трех столбцах. Возвращаясь по цепочке преобразованных матриц к исходной матрице, мы легко можем проверить, что все произведенные преобразования не влияют на абсолютную величину этого минора. Следовательно, и в исходной матрице минор, стоящий в первых трех строках и первых трех столбцах, является базисным. См. задачу 10 *). ЗАДАЧИ 1. Доказать теорему: для того чтобы матрица m-го порядка || а,у | f имела ранг г «^ 1, необходимо и достаточно, чтобы существовали числа аъ ...,ат и blt b2t ..., bm такие, что а,-у=а,-&;- (/, / = 1, 2, ..., т). 2. В я-мерном пространстве Кп взяты k линейно независимых векторов Хц *2, ...,*£. Показать, что линейная оболочка L = = L (*!, *2, •••» *k) определена однозначно, если известны значения всех миноров fc-ro порядка матрицы Л = ||а//)|| из координат векторов хъ *2, ..., xk в некотором базисе ev еъ ..., еп. 3. Показать, что система (2) при k — n имеет решение ci = ^/i» c2=Ai2i ... t cn = Ain (Ki</z), где Aik—алгебраическое дополнение элемента a[k (i фиксировано), если ранг матрицы А меньше п. Примечание. Это обстоятельство позволяет легко строить ненулевые решения системы (2) в случае, когда ранг матрицы системы равен п— 1. 4. Решить систему уравнений *1+ *2 + *3 + *4 + *5= 7, 3*! + 2*2+ *з + *4-—3*5 = — 2, х2 +2*з+ 2х4+ 6*5= 23, 5*! + 4*2 + 3*з + 3л:4— *5 = 12. 5. Исследовать решения системы te+ У + 2=1, * + ^/ + г = %, х+ y + Kz = X2 в зависимости от значения X. 6. При каком условии три прямые а^ + б^+^а-О, ctoX-^b2y-{- + с2 = 0, а3х-\-Ь3у-\-с3 = 0 проходят через одну точку? 7. При каком условии п прямых alx-{-b1y-\-cl = 0, й2х + Ь2у-\- + с2 = 0, ..., anx-{-bfly + cn = 0 проходят через одну точку? *) Далее в книге указания на относящиеся непосредственно к тексту задачи уже не делаются.
ЗАДАЧИ 89 8. Написать нормальную фундаментальную систему решений для системы уравнений *1+ *2 + *3+ *4 + *5 = 0, Зхх + 2х2+ *3 + *4 —3*5 = 0, х2 + 2*з + 2*4 + 6*5 = О» 5*! + 4*2 + 3*з + 3*4— *5 = 0- 9. Написать 'общее решение системы задачи 4, используя нормальную фундаментальную систему решений соответствующей однородной системы, найденную в задаче 8. 10. Определить ранг и базисный минор следующих матриц: л= 11. Пусть в матрице Л имеется минор М r-го порядка, отличный от нуля, а всякий минор (г + 1)-го порядка, включающий все элементы минора М, равен нулю. Доказать, что тогда ранг матрицы А равен числу г. 12. Построить матрицу 1 —2 2 —1 —2 -5 6 0 — 1 —1 3 1 8 -1 1 — 1 0 —4 2 — 1 — 1 —2 | -2 -2 3 —1 —7 —5 2 1 ;• А*А 10 10 0 110 0 0 0 110 0 0 0 1 10 0 10 11 А = |Дц а12 1 Q21 °22 013 023 с заданными значениями миноров ап а12 а21 а22 =р, ! 0ц Qi3 021 ^23 = Q. 13. Для квадратной системы уравнений п 2 k = ] ajkxk-- 1 = bj (/ = l, . 012 013 fl22 023 ... n) R. (9) доказать «альтернативу Фредгольма»: или система (9) имеет решение, притом единственное, для любых bv ..., bn, или однородная система 2 0/Л 0 (/=1, ...,л) имеет ненулевое решение. 14. Доказать, что система уравнений 0ii*i+• Лплп = Ьи °/*+1, 1*1+ ••• +0/1 + 1, л*л =^/1+1
90 ГЛ. 3. СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ при условии ап ... а1п . а, 7^0 разрешима тогда и только тогда, когда . fli bi = 0. ап\ • •• апп °п а/; + 1, 1 • • • ап + 1, п bn+i 15. (Задача об исключении неизвестных.) Доказать, что содержащая параметры уъ ..., yk система .Y, 4- . . . + 0„ f t n Xn = bn 4. г l IJ] + . . . + &/l+ lf д, [Jk ~T Cw + 1 tf/z + l, 1 -M при условии -/о A«/z I разрешима тогда и только тогда, когда параметры yv ..., у^ удовлетворяют уравнению Ух bi • (*пп bnl + ---+УМ «11 • • • «i,i . . . О, 1ЛМ а« + 1. 1 • • • аи + 1. п Ьп+1. 1 '//+1, 1 ... а Лк 'nk nil, п ип + 1, k + Oil + .. . fli . о, fl«rl, 1 • • • an + l. П CH + l
ГЛАВА 4 ЛИНЕЙНЫЕ ФУНКЦИИ ВЕКТОРНОГО АРГУМЕНТА В общем курсе математического анализа изучаются функции одного или нескольких вещественных переменных. В случае функции, например, трех вещественных переменных можно говорить о функции, аргументом которой является вектор пространства V3. Мы будем здесь изучать функции, аргументом которых будет вектор произвольного линейного пространства. При этом мы ограничимся пока простейшими типами таких функций, а именно, линейными функциями. Мы будем рассматривать линейные числовые функции векторного аргумента, т. е. функции, значения которых суть числа, и линейные векторные функции векторного аргумента, значения которых суть векторы. Векторные линейные функции, называемые иначе линейными операторами, имеют важное значение в линейной алгебре и ее приложениях. §4.1. Линейные формы 4.11. Числовая функция L (х) векторного аргумента ху определенная на линейном пространстве К над числовым полем /С, называется линейной формой^ если она удовлетворяет следующим условиям: а) L (х-\-у) — L (x)-\-L(y) для любых х, у £К; б) L (ax) = aL (х) для любого х £К и любого а£К. Иначе говоря, линейная форма L(x) есть морфизм линейного пространства К в одномерное пространство К1 = К. (2.71). Из условий а) — б) по индукции легко получить формулу £-(ai*i+a2*2+ ... + akxk) = = a1L(x1)-\-a2L(x2)+ . . . +akL(xk), (1)
92 ГЛ. 4. ЛИНЕЙНЫЕ ФУНКЦИИ ВЕКТОРНОГО АРГУМЕНТА [4.12 справедливую для любых xv x2, . ..,л:л€К и любых чисел а1у а2, .. ., ak из К. 4.12. Примеры. а. Пусть в /г-мерном пространстве К выбран базис, так что каждый вектор х £ К может быть задан своими координатами £х, £2, ...,£„. Тогда Ь(х) = £,г (первая координата) есть, очевидно, линейная форма от х. б. Более общей линейной формой в том же пространстве является выражение с произвольно фиксированными коэффициентами 1А, /2, . . ., 1п. в. В пространстве К (а, Ь) (где К есть R или С) примером линейной формы является выражение L(x)=x(tQ), где /0 — фиксированная точка отрезка а^!/^#. г. В том же пространстве можно рассматривать линейную форму вида ь L (x) = [l(t)x{t)dt, а где / (/)— фиксированная непрерывная функция. д. В пространстве V3 скалярное произведение (х, х0) вектора х с фиксированным вектором #0g Учесть линейна-я форма от х. Линейные формы, заданные в бесконечномерных пространствах, обычно называют линейными функционалами. 4.13. Найдем общий вид линейной формы L (х) в л-мер- ном линейном пространстве К„. Пусть ег, е2, ...,еп — произвольный базис пространства К„. Обозначим число L (ek) п через lk (k = 1, 2, . .., п). Тогда для любого х = 2 lkek B СИЛУ формулы (1) /(*) = /(£ tkek)= 2 £*/(«*) = 2 Iklk* \k=i J k=\ k=\
4.15] §4.1. ЛИНЕЙНЫЕ ФОРМЫ 93 т. е. значения линейной формы f(x) линейно выражаются через координаты вектора х с фиксированными коэффициентами /1? /2, . . ., 1п. Таким образом, в примере 4.126 мы имели самый общий вид линейной формы в /z-мерном пространстве. 4.14. В комплексном линейном пространстве С рассматривают еще один вид линейной формы, называемый линейной формой 2-го рода. Линейная форма, определенная в 4.11, называется в этом случае формой 1-го рода. Числовая функция L (х) аргумента х, определенного на комплексном линейном пространстве С, называется линейной формой 2-го рода, если она удовлетворяет следующим условиям: а) L (x+y) = L (x) + L (у) для любых х,у£С; б) L (ах) = a L (х) для любого х g С и любого комплексного числа a = a1 + *ot2; число a = ax — la2 есть здесь комплексно сопряженное к числу а. Формула, аналогичная (1), в случае формы 2-го рода имеет вид L(a1x1+ ... + akxk) = a1L(x1)+... + akL(xk) (2) для любых хх, . .., xk из С и любых комплексных ах,. . ., ад. 4.15. Примером линейной формы 2-го рода в /z-мерном комплексном пространстве Сп с базисом е1У ...,£„ служит функция п L (х) = 2 lk 1» k=\ где /х, . . ., ln — произвольно фиксированные комплексные числа, а £х, . . ., \п— координаты вектора х в базисе ег, . . ., еп. Покажем, что эта формула дает общий вид линейной формы 2-го рода на пространстве Сп. Пусть L (х) — произвольная линейная форма 2-го рода; положим 1г —L (г1), . . ., /л = L (еп). Тогда для любого х g Cn по формуле (2) что и требуется.
94 ГЛ. 4. ЛИНЕЙНЫЕ ФУНКЦИИ ВЕКТОРНОГО АРГУМЕНТА [4.21 § 4.2. Линейные операторы и их матричная запись 4.21. Линейная форма L(x), определенная в линейном пространстве К, как мы указывали, является морфизмом пространства К в одномерное пространство Kv Рассмотрим теперь морфизм А — А (х) линейного пространства X в любое линейное пространство Y над тем же самым полем К. Будем писать иногда короче: Ах вместо А (х). Согласно определению, функции А (х) удовлетворяет условиям: а) А {х -\-у) = Ал* -- ку для любых х и у из X; б) к(ах)--акх для любого х g X и любого числа а. Как и для линейных форм, из условий а), б) следует более общая формула в) А (аххх -j- • • • + oikxk) = alkxl --...-}- ockkxk для любых хъ . . ., хк из X и любых ctj, . . ., ак из К. Морфизм А называют также, как отмечено в 2.71, ли*, нейным оператором, действующим из X в Y. 4.22. Пример ы. а. Оператор, который каждому вектору х пространства X ставит в соответствие нуль-вектор пространства Y, является, очевидно, линейным оператором. Он называется нулевым оператором. б. Пусть имеется некоторый линейный оператор А, действующий из пространства X в пространство Y. Положим по определению Вх -——Ал*. Полученный оператор В, как легко видеть, также является линейным оператором, переводящим X в Y; он называется оператором, противоположным оператору А. в. Пусть векторам базиса е1у ...уеи пространства X произвольно поставлены в соответствие векторы Д,...,/„ пространства Y. Тогда существует и единствен линейный оператор А, переводящий X в Y и при этом каждый вектор ek переводящий в соответствующий вектор fk(k^\, . . ., п). Действительно, если искомый оператор А существует, то п для любого вектора х = У %кек £ X выполняется равенство А* = А ( 2 1кек) - 2 lkhek = 2 "V*.
4.23] § 4.2. линейные операторы и их матричная запись 95 чем доказана единственность оператора А. С другой сто- п роны, для любого х= 2 \иек € X мы можем положить по определению п k=\ Получающийся при этом оператор А, как легко проверить, является линейным оператором, переводящим X в Y и при этом переводящим каждый вектор ek в соответствующий вектор fk{k~\, . . ., /г), что нам и требуется. г. Поставим в соответствие каждому вектору х пространства X этот же вектор х. Мы получим линейный оператор И, действующий из X в X. Этот оператор называется тождественным, или единичным, оператором. 4.23. Матричная запись линейных операторов. Пусть А есть линейный оператор, действующий из пространства X размерности п в пространство Y размерности т. Фиксируем в пространстве X базис еъ ..., еп и в пространстве Y базис /\, . . . ,//л. Вектор ех переводится оператором А в некоторый вектор кех пространства Y, который, как всякий вектор этого пространства, мы можем разложить по базисным векторам: Аналогично оператор А действует на остальные базисные векторы: Ae2 = aiI>/i + <42)/2+---+«i?)/„, Эти формулы можно записать короче: т Afy=2fl</>/J- (у =1,2, ...,«). (3) Коэффициенты а\]) (/= 1, . . ., т, j— 1, . . ., п) определяют
96 ГЛ. 4. ЛИНЕЙНЫЕ ФУНКЦИИ ВЕКТОРНОГО АРГУМЕНТА [4.23 матрицу из т строк и п столбцов или, короче, /я хл-матрицу А= А <*./> г(1) „(2) аа) а12) (П) которая называется матрицей оператора А в базисах {е\ = = \ег, . . ., еп) и {/} = {/х, . . ., fm). Столбцами этой матрицы служат координаты векторов Аех, Ае2, . . ., Аеп относительно базиса /ь ...,/m. Пусть теперь * = 2 £/*V— произвольный вектор и у=> 3= 1 m = A^=2T)///J выясним, как выражаются координаты т],. /= 1 вектора у через координаты £. вектора х. Мы имеем /71 / П \ П У = .2 Л/Л = А* = A J £/у = 2 S/A, 1=1 \J=1 / J=l л /7i m f n \ = 2£/2«;V,= 2 2«;%-k ■'/ Сравнивая коэффициенты при векторе /,-, находим Л,= 2«<% (1 = 1,2, .... да). (4) ; = В раскрытом виде аПоЛ 42 — а2 bi • I "2 Ъп> (5) Г]И=<1^1 + Й^2+ •••+«„. Следовательно, зная матрицу оператора А в базисе е1у е2у . . ., еПУ можно определить результат применения опера- п тора к любому вектору х = 2 lkek пространства X: координаты, вектора у = Ах линейно выражаются через координаты вектора х по формулам (5). Заметим, что матрица коэффициентов в формулах (5) совпадает с матрицей А{е^)ш
4.24] § 4.2. ЛИНЕЙНЫЕ ОПЕРАТОРЫ II ИХ МАТРИЧНАЯ ЗАПИСЬ 97 Пусть теперь || я^ || *) — произвольная /я хя-матрнца. Если п т х = У] \,е,, мы можем построить вектор у = 2 %Лпо Ф°Рг мулам (5). Легко проверить, что оператор А, задающий этот переход от вектора х к вектору у, является линейным оператором. Построим матрицу оператора А в базисе е1у с2, ..., еп. Вектор ех имеет координаты \х — 1, £2 = ... =$п = 0; в силу формул (5) координатами вектора f1 = Ae1 будут числа а{^\ а£\ . . ., а£\ так что Д = Аег = а^ег + а™е2 + . . . + а<»еп. Аналогично fJ = AeJ=ape1 + ape2+...+a<!>en (у=1, 2, ..., т). Следовательно, матрица оператора А совпадает с исходной матрицей || a(J} \\. Итак, каждая тхп-матрица является матрицей некоторого линейного оператора А, действующего из п-мерного пространства X в m-мерное пространство Y, с фиксированными базисами е1} ..., еп в пространстве X и /х, . . ., fm в пространстве Y. Тем самым между линейными операторами, действующими из пространства X (с фиксированным базисом е1у ...уеп) в пространство Y (с фиксированным базисом /х, . ..,/от), и /wx/z-матрицами, заполненными числами из поля К} устанавливается взаимно однозначное соответствие, осуществляемое с помощью формул (3) или, что то же, (4). Заметим, что оператор А можно было бы восстановить по матрице Л — || яУ> || (и притом однозначно), исходя непосредственно из формул (5). В этих формулах /-й столбец матрицы А представляет собой набор координат вектора /j = Aej. 4.24. Примеры. а. Матрица нулевого оператора (4.22а) в любом базисе пространства X и любом базисе пространства Y, очевидно, состоит из одних нулей. *) Верхний индекс — номер столбца, нижний — номер строки. 4 Г. Е. Шилов
98 ГЛ. 4. ЛИНЕЙНЫЕ ФУНКЦИИ ВЕКТОРНОГО АРГУМЕНТА [4.31 б. Если ]| а{р || есть матрица оператора А, то матрицей противоположного оператора (4.226) является, очевидно, матрица || — а\'} ||. в. Пусть т^п и оператор А переводит векторы базиса е1у ..., еп пространства X в линейно независимые векторы '/г, ...,/„ пространства Y. Дополним векторы /х, ...,/„ до полного базиса пространства Y векторами /„ + 1, . . ., f,;r Тогда матрица оператора А в базисах е примет, очевидно, следующий вид: 1' еп « fv •••> fn т / 1 / п \ / ii о . |(0 1 . 1 \ \ 0 0. joo . 0 0 . . 0 1 • ° • 1 '1 • о) • 0 ; г. В частности, матрица тождественного оператора в базисе ev . . . , еп пространства X, как области он пня, и в том же базисе е области значений, имеет вид И 0 0 1 1» еп пространства 0 0 (4.22г) редсле- X. как (5') ли еди- Матрица Е вида (о') называется тождественной и ничной пх л-матрицей. § 4.3. Действия над линейными операторами Мы рассмотрим зДесь действия сложения операторов, умножения оператора на число и умножения операторов друг на друга. Два оператора А и В, действующих из пространства X в пространство Y, будем считать равными (и писать А = В), если Ax=B.v для каждого х£Х. 4.31. Сложение операторов. Пусть даны два линейных оператора А и В, отображающих пространство X
4.32] § 4.3. действия над линейными операторами 99 в пространство Y. Оператор С = A-f В определяется по формуле Слг = (А -г В) х = Ах -f Bx. (6) Очевидно, что С также отображает пространство X в пространство Y. Покажем что С — снова линейный оператор. Пусть х — a,1x1Jra2x2; тогда С (аххг -у- а2х») = А (а1х1 + а2лг2) -|- В (а1х1 + а2х2) = = ах Ajq -— а2Ал:2 -}- с^Вл^ + а2Вл;2 = = ах (Ахг -г Вхг) -f а2 (Ал:2 -f Вл:2) = 0^0^ -f- а2Сл;2. Таким образом, оба условия 4.21а)—б) выполнены. Линейный оператор С, определенный равенством (6), называется суммой операторов А и В. Легко проверить следующие равенства: A-f В = В + А, (А + В)+С = А + (В + С), A-f 0 = А, A-f (—А) = 0. Здесь А, В, С — произвольные линейные операторы, 0 — нулевой оператор (4.22 а), — А — оператор, противоположный к оператору А, т. е. переводящий каждый вектор х£Х в Еектор—Ал: (4.22 6). 4.32. Умножениеоператора на число. Если А — линейный оператор, действующий из пространства X в пространство Y, и к— число из поля /С, то оператор В = Я,А, называемый произведением оператора А на число Я, определяется формулой Вх = (КА)х = 'к(Ах). Легко проверить, так же как в 4.31, что построенный оператор является линейным. При этом имеют место соотношения ММ)'=(ЬЛ2)А, ЬА = А, (*,!-!-Х«) А = Х1А-гЛ2А, к (A -\-B) = kA-lrkB. 4* (7) (7';
100 ГЛ. 4. ЛИНЕЙНЫЕ ФУНКЦИИ ВЕКТОРНОГО АРГУМЕНТА [4.33 Соотношения (7) — (7') показывают, что совокупность всех линейных операторов, действующих из линейного пространства X в линейное пространство Y, образует новое линейное пространство. 4.33. Умножение операторов. Если А — линейный оператор, действующий из пространства X в пространство Y, а В — линейный оператор, действующий из пространства Y в пространство Z (все пространства над одним и тем же числовым полем /С), то мы определяем оператор Р = ВА, называемый произведением оператора В на оператор А, как оператор, действующий из пространства X в пространство Z по формуле Р* = (ВА)л; = В(Ал;) (т. е. сначала на вектор х действует оператор А, а затем на результат, лежащий в пространстве Y, действует оператор В). Построенный оператор Р является снова линейным, так как Р (ос^ + о^лгз) = В [A (a1x1Jra2x2)] = В (с^Ал^-г-о^Ал^) = = ахВ Ахх + а2ВАл;2 = о^Рл^ -|- ос2Рл;2. 4.34. Легко проверяются следующие соотношения: а) X (ВА) = (ХВ) А для любых операторов А и В с указанными свойствами и любого Х£К; б) (А + В) С = АС-{-ВС для любых операторов А и В, действующих йз пространства Y в пространство Z, и любого С, действующего из X в Y; в) А (В + С) = АВ + АС для любых операторов В и С, действующих из X в Y, и любого А, действующего из Y в Z; г) (АВ)С=А(ВС) для любых операторов: С — из пространства X в пространство Y, В — из пространства Y в пространство Z, А — из пространства Z в пространство W. Проверим, например, равенство г). В соответствии с принятым нами определением равенства операторов мы должны для любого вектора х£Х доказать равенство [A (BC)]*==[(ABJC]*.
4.42] § 4.4. СООТВЕТСТВУЮЩИЕ ДЕЙСТВИЯ НАД МАТРИЦАМИ 101 По по самому определению произведения операторов [А (ВС)] х = А [(ВС) х] = А [В (С*)], [(АВ)С]а: = (АВ)(Сл;)> откуда и вытекает требуемое равенство. Справедливость всех остальных равенств проверяется аналогично. § 4.4. Соответствующие действия над матрицами Выясним, как отражаются действия над операторами, описанные в § 4.3, на матрицах этих операторов. 4.41. Сложение операторов. Пусть даны два линейных оператора А и В, отображающих пространство X с базисом ех, . . . , еп в пространство Y с базисом /х, . . . ,fm. Пусть, далее, оператору А в этих базисах соответствует матрица А=\\а(;п\\, а оператору В — матрица fi=||ft^')||; следовательно, т т Kej = 2 а? /,-, Be, = £ #'Л (У = 1, 2, . . . , я). ; I = 1 * = 1 В таком случае т (А + В)еу=А*у + В*у= S (ap + bp)U J J J i=\ откуда следует, что оператору A-j-В соответствует матрица Wa\j) Л-Ь(Р\\. Такая матрица называется суммой матриц \\а(с]'у\\ и \\Ь(1П'\\. Таким образом, сумма А-\-В определена для всяких двух матриц А и В с одинаковым числом строк и с одинаковым числом столбцов. 4.42. Умножение оператора на число. При тех же условиях m Следовательно, оператору Л-А соответствует матрица Цл-арН, получающаяся умножением всех элементов матрицы Ца^Н
102 ГЛ. 4. ЛИНЕЙНЫЕ ФУНКЦИИ СЕКТОРНОГО АРГУМЕНТА [4.43 на число К. Такая матрица называется произведением матрицы Ия/'Ч! на число X. Поскольку /гахя-матрицы и линейные операторы, действующие из /z-мсрного пространства в /«-мерное, соответствуют друг другу взаимно однозначно (4.23), действия с операторами соответствуют одноименным действиям с матрицами и действия с операторами подчиняются правилам (6)—(7), мы можем сделать вывод, что действия с матрицами также подчиняются правилам (6) — (7), что, впрочем, легко было бы проверить и непосредствен.но. Тем самым мы получаем, что совокупность всех m X п-матриц образует линейное пространство. По самому построению оно изоморфно линейному пространству всех линейных операторов, действующих из л-мер- ного пространства X в /и-мерное пространство Y. 4.43. Умножение операторов. Выберем в пространствах X, Y, Z базисы: в пространстве X — базис ех, . . ., е1:, в пространстве Y — базис Д, . . . ,/т, в пространстве Z — базис gi, . . . , gq. Пусть оператор В, действующий из X в Y, имеет тхл-матрицу ||^у)Ц, так что m B^=S»|/,/i (У =1,...,/!), а оператор А, действующий из Y в Z, имеет <7Х/я-матрицу ||ЯдР||, так что /:=1 Для произведения Р = АВ мы получаем m (АВ)*у=А(Веу) = А £ #>/,■ = J J i=\ m m q q / m \ = 2*W,= 2 bf 2 ei"^= 2 ( 2 af b<J>)gk. Следовательно, элементы p(^ матрицы Р оператора Р = АВ имеют вид m P& = 2 4" W> (j=\,2,...,n;k=\,...,q). (8)
4.44] § 4.4. СООТВЕТСТВУЮЩИЕ ДЕЙСТВИЯ НАД МАТРИЦАМИ 103 Это и есть интересующий нас результат. Его можно выразить так: элемент матрицы Р, стоящий на пересечении ее k-u строки и j-го столбца, равен сумме произведений всех элементов k-й строки матрицы А на соответствующие элементы j-го столбца матрицы В. Матрица Р=\\р{^\\, которая получается из матриц \\а^]\\ и \\Ь1!)\\ по формуле (8), называется произведением первой из этих матриц на вторую. Заметим, что число столбцов первой матрицы должно быть равно числу строк второй матрицы, иначе произведение матриц не будет иметь смысла. При выполнении этого условия матрица-произведение имеет столько строк, сколько их имеется у первой матрицы, и столько столбцов, сколько их имеется у второй матрицы. Более выразительна mxn-заиисъ: произведение ^х/-матрицы А на /яхл-матрицу В определено, если /=/и, и в этом случае произведение АВ есть #х л-матрица. Оба произведения АВ и ВА определены, если l — m,q — n\ в этом случае АВ есть квадратная пхл-матрица, а ВА есть также квадратная mx/я-матрица. Если, наконец, п = m=p = q, т. е, обе матрицы А и В суть квадратные п хл-матрицы, то АВ и ВА — также квадратные п хя-матрицы. Однако они не обязаны быть равными. Например, 10 111 |l Of 111 О1 И 0 0 = 0 0 1 0 J 11 0| |о о] 1° Ml 1 0 1|| |0 0| Таким образом, умножение квадратных матриц, вообще говоря, некоммутативно. Что касается сочетательного и распределительного законов, то здесь положение более благополучное: умножение операторов, как мы видели в 4.34, подчиняется сочетательному и распределительным законам; поскольку матрицы и операторы находятся во взаимно однозначном соответствии и умножение матриц соответствует умножению операторов, мы можем сделать вывод, что сочетательный и распределительные законы удовлетворяются также и для умножения матриц. 4.44. Примеры. В следующих примерах индексы элементов матриц пишутся внизу, так что элемент ajk матрицы Л=||ЯуЛ|| стоит на пересечении ее j-Pi строки и /е-го столбца. Формула
104 ГЛ. 4. ЛИНЕЙНЫЕ ФУНКЦИИ ВЕКТОРНОГО АРГУМЕНТА [4.44 умножения Р=АВ [см. 4.43 (8)] в этих обозначениях принимает вид т / = i а. Умножим /ихя-матрицу Л=||яу.л|| слева на тхт-мат- ри-цу 5Г5=||^уЛ||, в которой все элементы bjk равны 0, кроме одного элемента brs, равного 1. По общему правилу (8) мы получим /яхл-матрицу (s) Д.И = И 'rs 1 * ... 1 ... flllfl12 * • • ain fl5l a52 ' • • asn amiam2' ••<*mn\ = (r) 0 0 . .. 0 a5l a82 • . . Ur. **sn | 0 0 . .. 0 так что в г-й строке матрицы BrsA стоят элементы 5-й строки матрицы Л, а остальные элементы матрицы BrsA равны 0. б. Умножим /яхл-матрицу Л = ||ЯуЛ|| справа на лхл-мат- рицу Сд1=\\с-к\\, в которой все элементы с;7г равны 0, кроме одного элемента cqt, равного 1. По общему правилу (8) мы получим /#Хя-матрицу АС gt 12д ' • ат\ • • • amq * * * атп i (?) (t) . .1. . о . о . (О '1<7 0 ... атд ... 0 так что в ^-м столбце матрицы AC t стоят элементы q-ro столбца матрицы А, а остальные элементы матрицы ACqt равны 0.
4.44] § 4.4. соответствующие действия над матрицами 105 в. При тех же Brs, A, Cgt получае: Br,ACqi = (г) 'rs' it) о sq О ... О ... О так что операция BrsACqt приводит к /#Х л-матрице, в которой все элементы равны нулю, кроме стоящего на пересечении г-й строки и /-го столбца, который равен asq. г. На какую /wX/w-матрицу D нужно умножить слева /wx/z-матрицу Л, чтобы матрица DA совпала с матрицей Л, в которой переставлены местами г-я и 5-я строки? Пример а показывает, как получить матрицу, в которой г-я строка есть 5-я строка матрицы Л,— умножением слева на /ях/я-матрицу Brs. Но остальные строки в результате равны 0. Теперь ясно: чтобы получить требуемую матрицу, нужно матрицу А умножить слева на тх/^-матрицу (г) (s). 1 (г) D = Brs + Bsr+2BjV J ^=r (s) . 0 . 1
106 ГЛ. 4. ЛИНЕЙНЫЕ ФУНКЦИИ ВЕКТОРНОГО АРГУМЕНТА [4.51 д. На какую п хя-матрицу G нужно умножить справа т х /z-матрицу А, чтобы матрица AG совпала с матрицей Л, в которой переставлены местами q-Pi и t-Pi столбцы? Аналогично г мы получаем o=cgt + ctq+ 2cftft. Ьфц е. На какую /я X/я-матрицу F нужно умножить слева /ихя-матрицу Л, чтобы получившаяся матрица совпала с матрицей Л, в которой к г-й строке прибавлена s-я строка с коэффициентом А,? После сказанного в а ответ очевиден: F=E-\-'kBrs. ж. На какую лхл-матрицу Н нужно умножить справа /яхя-матрицу Л, чтобы получившаяся матрица совпала с матрицей Л, у которой к ^-му столбцу прибавлен q-Pi столбец с коэффициентом \х? Ответ очевиден: Н = E-\-\iCgt. § 4.5. Дальнейшие свойства умножения матриц 4.51. Умножение матриц, разбитых на блоки, В некоторых случаях бывает удобно разбивать перемножаемые матрицы на блоки и действовать далее с блоками. Предположим, что нам дана /яхл-матрица Л и лхр-мат- рица £, которые разбиты на блоки: А = (т) * 11 21 Л12 Л 22 , В = (п) \ В 11 в 21 В12 в 22 Предположим, что в каждой блок-строке матрицы А столько же блоков, сколько в блок-столбцах матрицы Ву и при этом
4.52] § 4.5. дальнейшие свойства Умножения матриц 107 ширина люборо блока AJk матрицы А совпадает с высотой любого блока Bks матрицы В. Тогда все произведения AJkBks имеют смысл; это — прямоугольные матрицы, размеры которых зависят от индексов у и s, но не зависят от индекса k. Интересующее нас правило умножения матриц состоит в следующем: матрицу АВ можно составить из блоков, построенных из блоков матриц А и В так же, как элементы матрицы АВ составляются из элементов матриц А и В: \AnBll + AliBn+... Л Я J- |/i21 пп ... АпВ12+ ... . . . 1 ' ' ' Действительно, пусть / — номер блок-строки матрицы А, содержащей k-ю строку самой матрицы А, и у—номер блок-столбца матрицы В, содержащего </-й столбец матрицы В. По общему правилу 4.43 элементы матрицы Р = АВ имеют вид Pkq=ak\blq + '•• +aknhng = = (G*i<4+ ••• +<*kpbpq)+ ... +(akrbrg+ ... +aknbng)t где скобки расставлены в соответствии с шириной блоков матрицы А (и высотой блоков матрицы В). Будем нумеровать строки и столбцы блоков теми же номерами, что и в самой матрице А. В первой скобке стоит элемент, стоящий на пересечении k-й строки и q-\o столбца блока AilB1J-, во второй скобке — элемент, стоящий на пересечении k-Pi строки и q-ro столбца блока Ai2By, и т. д.; в результате получается элемент, стоящий на пересечении &-й строки и q-vo столбца блока АпВу+ ... -\-AirBr-, что и утверждалось. 4.52. Умножение квази дна тональных матриц. Матрица называется квазидиагональной, если она
108 ГЛ. 4. ЛИНЕЙНЫЕ ФУНКЦИИ ВЕКТОРНОГО АРГУМЕНТА [4.52 имеет вид А = 41 L22 причем необозначенные блоки состоят из нулей. Предположим, что блок Akk представляет собой mk х/^-матрицу (4=1, ..., s). Рассмотрим квазидиагональную матрицу 8 = В 11 В 22 у которой блок Bkk представляет собой /^Х/^-матрицу (k = \, ... , s). Матрицы А и В можно перем-ножить по правилу 4.51, которое в данном случае немедленно приводит к результату ^iAi АВ A R \£ss (9)
4.54] § 4.5. ДАЛЬНЕЙШИЕ СВОЙСТВА УМНОЖЕНИЯ МАТРИЦ 109 Таким образом, в данном случае матрица АВ снова есть квазидиагональная матрица, причем блок AkkBkk имеет mk строк и pk столбцов. 4.53. Произведение транспонированных матриц. Пусть дана /яхл-матрица А = \\a.-k\\. Транспонированной по отношению к А называется пх/я-матрица A' =||^pg|[", для которой а'ря=адр (/> = 1, . . . , л; q = 1, . . • , m). Пусть А есть /яхл-матрица и В есть п хр-матрица, так что произведение Р = АВ определено и является тхр-мат- рицей. Определено и произведение транспонированных матриц В'А', которое представляет собой /?х/«-матрицу. Покажем, что справедлива формула В'А' = (АВ)'. (10) Для доказательства обозначим элементы матриц А, В, Р = = АВ, А\ В', Р' соответственно через о,,.-, b;-, /?,у, a}}- = :==ajh Ь'ц — Ъ^, Pij=Pji. Равенство (8), определяющее элементы pik, мы можем переписать в виде п п п Pik=Pki= 2 aijbjk= 2 Я/**л/= 2 b'kia)i. / = 1 / = 1 /=.1 Суммирование проводится по индексу у при фиксированных индексах / и k. Фиксированные индексы указывают, что для образования элемента ры в матрице В' используется k-я строка, а в матрице А'—/-й столбец. В результате образования суммы произведений соответствующих элементов получается элемент p'kh лежащий на пересечении &-й строки и /-го столбца матрицы Р'. Но по определению произведения матриц это и означает, что матрица Р' есть произведение матрицы В' на матрицу А'. Тем самым равенство (10) доказано. 4.54. Миноры произведения двух матриц. Пусть даны /ихл-матрица Л = ||ау7г|| и лхр-матрица £ = ||&у7г||; построим /wxp-матрицу p = AB = ^p-k\\. Фиксируем в матрице Р строки с номерами ах ^ . . . ^ak и столбцы с номерами Pi^...^P* (k^m; k^p) и поставим себе
110 ГЛ. 4. ЛИНЕЙНЫЕ ФУНКЦИИ ВЕКТОРНОГО АРГУМЕНТА [4.54 целью вычислить минор М = Af^[ [ [ [ ^';. (АВ), построенный на фиксированных строках и столбцах: л*з::::::йия) = я«,Ар, + • • • -Т-Я^л&лр» • • • Яа, Ар/, -f . . . -frt^Aft,, ^/.■APi + * * * + UQLknbn$x • • • #«;,-АР/ + a<xknbn$i; Для вычисления используем линейное свойство определителя (1.44). Столбец минора Ж с номером v является суммой к «элементарных» столбцов с элементами вида До^Ар (r#e индексы столбца / и v фиксированы, индекс строки у изменяется от 1 до к). Поэтому весь минор М равен сумме кк «элементарных» определителей, составленных только из «элементарных» столбцов. В каждом из элементарных столбцов множитель Ь-,л вдоль столбца не V меняется и его можно вывести за знак «элементарного» определителя. После этого каждым из «элементарных» определителей принимает следующий вид: */iPA.P.- • А.Р/ ... а, ■OL2ii: &OL};ix ^a/-/2 • • • aaf.ik (12) где /1? ... , ik — некоторые числа от 1 до п. Если среди этих чисел есть одинаковые, то соответствующий элементарный определитель равен 0. Между прочим, так всегда будет, если п < к. Поэтому если в матрице АВ есть вообще миноры порядка k > п, то все они равны 0. Возвращаясь к случаю k^.n, мы видим, что следует рассматривать лишь такие элементарные определители, для которых все индексы /х, . . . , ik различны. В этом случае определитель ^i'/; at, Щ: . а «2*/с -a/f«k
4.54J § 4.5. дальнейшие свойства умножения матриц 111 с точностью до знака совпадает с минором ^7tV °/V. " •" ' 7л" » где A^A^S • • • ^Л СУТЬ индексы /15 . . ., ik, переставленные в порядке возрастания. Выясним, какой именно знак нужно поставить перед минором А1^\\' \ \ \ \ °^, чтобы получить в точности минор AtfW ;;; ;^ . Для этого будем последовательно переставлять в миноре Ж*1; \t \ \\ \ ?£ соседние столбцы с тем, чтобы в результате получить их нормальное расположение (т. е. совпадающее с расположением столбцов в самой матрице А). При каждой перестапозке двух соседних столбцов минор Ж*1/"*; ;;; ; ?п" изменит знак; с другой стороны, при этом число «беспорядков» в перестановке индексов /х, /2, . . . , in изменится на единицу. Так как в окончательном расположении столбцов нижние индексы идут в натуральном порядке, без ((беспорядков», то число последовательных перемен знака равно числу «беспорядков:, в перестановке индексов /х, /2, ..., /„*). Обозначим это число через N(i). Тогда выражение (12) приобретает следующий вид: (-i)'V(,',*«lPA-p, • • • bh3Ml:::.\t W- (Щ Чтобы получить величину М, мы должны сложить все выражения вида (13). Будем сначала складывать выражения с одним и тем же набором ix < . . . < ik, так что числа /х, . . . , ik представляют некоторую перестановку в этом наборе. При этом общий множитель М"у '.'.'.', ?* (Л) можно вынести за скобки. В скобках остается величина 2(-,)л,(0^рЛ.р. •■■*«•*»*. которая, очевидно, есть минор Ml$[t \\\ \ \fl: (В). Окончательно мы получаем формулу Mrt:::; ft (АВ) = 2<-/ ;::; ?* (АЩ\, ;:;; & (В). (14) Суммирование производится здесь по всем наборам номеров h < i-i < • - • < hi причем сами эти числа могут изменяться . *) Предполагается, что при каждой перестановке индексов меньший индекс становится впереди большего и тем самым число беспорядков уменьшается ровно па единицу.
112 ГЛ. 4. ЛИНЕЙНЫЕ ФУНКЦИИ ВЕКТОРНОГО АРГУМЕНТА (4.61 от 1 до п. Общее число слагаемых в этой сумме равно п k\(n — k)\ ' Сформулируем результат в виде теоремы. Теорема. Каждый минор k-го порядка матрицы АВ может быть выражен через миноры того же порядка матриц А и В по формуле (14). § 4.6. Область значений и нуль-многообразие линейного оператора 4.61. Пусть дан линейный оператор А, действующий из линейного пространства X в линейное пространство Y. Мы используем здесь обозначение 2.71 А: X—>Y. Пусть п — размерность пространства X, a m — размерность пространства Y. Выберем произвольно базис ех, . . . , еп в пространстве X и базис Д, . . . , fm в пространстве Y. Тогда оператору А можно поставить в соответствие по правилу 4.23 /яХл-матрицу А = || а^ || , / = = 1, . . . , m, j— 1, . . . , п. Обозначим через Т (А) область значений оператора А, т. е. совокупность всех векторов у = Ах, х£Х. Поставим задачу: вычислить по матрице А размерность подпространства Т(А). Полагая п мы получаем п у = Ах=% lkkek; k= l следовательно, область значений оператора А совпадает с линейной оболочкой векторов Аех, Ае2, . . . , Аеп. Размерность линейной оболочки L(Ael5 Ae2, ... , Аеп) согласно 2.54в равна максимальному количеству линейно независимых векторов в системе Аеъ Ае2, . . . , Аеп. Мы знаем, что в столбцах матрицы оператора А выписаны координаты векторов Aei относительно базиса {/}; таким образом, вопрос о максимальном количестве линейно независимых векторов в системе Аеу. (у=1, 2, . . . , п) немедленно сводится к вопросу о максимальном количестве линейно независимых столбцов у матрицы оператора А. Но это послед-
4.63] § 4.6. ОБЛАСТЬ ЗНАЧЕНИЙ И НУЛЬ-МНОГООБРАЗИЕ 113 нее в силу 3.12в равно рангу матрицы оператора А. Итак, размерность области значений линейного оператора А, действующего из n-мерного пространства X в m-мерное пространство Y, равна рангу матрицы оператора А в любом базисе {р.} пространства X и любом базисе {/} пространства Y. Заметим, что выбор базисов в данном случае безразличен: следовательно, ранг матрицы оператора А не зависит от выбора базисов, т. е. зависит только от самого оператора А. В дальнейшем мы будем ранг матрицы оператора А (в любых базисах) называть просто рангом оператора А и обозначать через Гд. 4.62. Теперь обозначим через N (А) нуль-многообразие оператора А, т. е. совокупность всех тех векторов лг£Х, для которых Алг^О. Поставим задачу: по матрице А = || ар \\ оператора А вычислить размерность подпространства N (А). Пусть х = 2 \iei £N (А). Тогда система (5] мает вид а^+а'П*+.••+«„ = О, в?,£1+в(,*,Е2+---+в(.п,5в = 0> прини- (15) Очевидно, что и обратно, всякий вектор х£Х, координаты которого удовлетворяют системе (15), входит в нуль-многообразие оператора А. Таким образом, вопрос о размерности нуль-многообразия оператора А равнозначен вопросу о размерности подпространства решений системы (15). В силу 3.51 размерность лА этого подпространства равна числу п — г, где г — ранг матрицы из коэффициентов системы, или, что то же самое, ранг оператора А; таким образом, пА =п — гА. Итак, размерность нуль-многообразия оператора А равна дополнению ранга оператора А до размерности пространства X, из которого действует оператор А. 4.63. В частности, если морфизм А: X—► Y есть эпиморфизм, то T(A) = Y и, следовательно, rA—m. Если
114 ГЛ. 4. ЛИНЕЙНЫЕ ФУНКЦИИ ВЕКТОРНОГО АРГУМЕНТА [4.64 морфизм А: X—>Y есть мономорфизм, то N(A) —Ои, следовательно, Га^п. Верны и обратные утверждения. Именно, если ранг матрицы А равен числу т ее строк, то размерность Т(А) совпадает с размерностью всего Y, откуда следует, что T(A) = Y. Поэтому морфизм А есть эпиморфизм тогда и только тогда, когда r\--m. Если ранг матрицы Л равен числу п ее столбцов, то векторы fl~Ael, ... ... , fH — Aen являются линейно независимыми и, следовательно, оператор А является мономорфизмом (2.73в). Поэтому морфизм А есть мономорфизм тогда и только тогда, когда г\ —п. 4.64. Следующее предложение есть обращение результатов 4.61—4.62: Теорема. .Пусть X есть n-мерное пространство, Y — произвольное пространство. Каковы бы ни были подпространства NcX и Тс Y, сумма размерностей которых равна /z, существует линейный оператор А: X—*Y, для которого N (А) - N* Т (А) = Т. Доказательство. Обозначим размерности подпространств N и Т соответственно через k и m — n — k. В подпространстве Т выберем т линейно независимых векторов /l5 /о, . . . , fm. Выберем, далее, произвольный базис ех, *\>, . . . , еп в пространстве X так, чтобы первые k векторов базиса лежали в подпространстве N (2.43). Определим оператор А условиями Ае( -О (/=1, 2, ... , k), \ A*/ + *=/i U-1, 2, ... , /я). / ( } Покажем, что оператор А удовлетворяет поставленным требованиям. Прежде всего, очевидно, что Т (А) есть линейная оболочка векторов //(/ — 1, 2, ..., т) и, следовательно, совпадает с подпространством Т. Затем всякий вектор подпространства N по условию принадлежит к N(A); нам остается показать, что любой вектор пространства N (А) входит в N. Допустим, что для некоторого п х = 2 i^t С-!
4.66] § 4.6. ОБЛАСТЬ ЗНАЧЕНИЙ И НУЛЬ-МНОГООБРАЗИЕ 115 будет Алс = 0. Используя условия (16), мы получаем О = Ах = A (g^ +...+ l„en) = lk + 1A +...+ %„fa. Поскольку Д, /2, • • • , fm линейно независимы, мы имеем S* + i = •• • =£,,="0. Но тогда ^ = ^it...t^^N, что и утверждалось. 4.65. Следующая теорема о ранге произведения двух матриц вытекает из свойств только что введенных геометрических характеристик. Теорема. Ранг произведения АВ матриц А и В не превосходит ранга каждого из сомножителей. Доказательство. Естественно, мы предполагаем, что число столбцов матрицы А совпадает с числом строк матрицы В, иначе их нельзя было бы перемножить. Пусть А есть /их л-матрица, а В есть п Х/?-матрица. Введем в рассмотрение линейные пространства X, Y, Z с размерностями, соответственно, п, m и р. В пространстве X выберем базис е1ч . . . , еп, в пространстве Y — базис /\, . . . , /т, в пространстве Z — базис gly . . . , g Используя их, можно матрице А поставить в соответствие линейный оператор А: X—*Y, а матрице В — линейный оператор В: Z—>Х. Произведению АВ матриц А и В отвечает линейный оператор АВ: Z—*Y. Область значений оператора АВ в силу самого его определения содержится в области значений оператора А. Поскольку согласно 4.61 размерность области значений любого оператора равна рангу соответствующей матрицы, мы получаем, что ранг произведения двух матриц не превосходит ранга первого множителя. Чтобы доказать, что он не превосходит также и ранга второго множителя, перейдем к транспонированным матрицам; используя 4.53, мы получим ранг АВ = рангу (АВ)' ярангу В'А' Яранга В' = рангу В, что и требуется. 4.66. Ранг произведения двух матриц может быть и меньше, чем ранг каждого из сомножителей. Например, матрицы ]1 0! J0 0 , в = 10 11 0 0
116 ГЛ. 4. ЛИНЕЙНЫЕ ФУНКЦИИ ВЕКТОРНОГО АРГУМЕНТА [467 обе имеют ранг, равный единице, а их произведение II О О II ЛНоо| имеет нулевой ранг. Поэтому представляет интерес следующая теорема, дающая оценку ранга произведения двух матриц не сверху, а снизу. Теорема. Пусть А есть mxn-матрица ранга гл и В есть пхр-матрица ранга гв. Тогда ранг mXp-матрицы АВ не меньше гЛ + гв — п. Доказательство. Покажем сначала, что любой оператор А: X —> Y ранга г переводит всякое ^-мерное подпространство Х'сХ в подпространство Y'czY, размерность которого не ниже г — (п — k). Выберем базис ех, е.2, ...,еп> в пространстве X так, чтобы первые k векторов базиса лежали в подпространстве X' (2.43). Координаты векторов Аех, Ае2, ..., Аек, порождающих подпространство Y', в матрице оператора А занимают k первых столбцов. По условию в матрице оператора А имеется г линейно независимых столбцов. Эти столбцы разобьем на две группы: в первую группу отнесем те, которые имеют номера от 1 до k, а во вторую группу — те, которые имеют номера от k-\-\ до п. Численность второй группы не больше п—k\ следовательно, численность первой группы не меньше г — (п — k). Таким образом, подпространство Y' имеет не менее г — (п — k) линейно независимых векторов, что и утверждалось. Пусть теперь А: X —> Y и В: Z —> X — линейные операторы, соответствующие перемножаемым матрицам. Оценка ранга матрицы оператора АВ согласно 4.61 есть оценка размерности области значений этого оператора. Оператор В переводит все пространство Z в подпространство Т(В)сХ размерности гв. По доказанному оператор А переводит подпространство Т (В) в подпространство, размерность которого не ниже гА — (п — rB) = rA-\-rB— п. Таким образом, область значений оператора АВ, а с ней и ранг матрицы АВ, имеют величину не ниже гА-\-гв—п, что и требовалось. 4.67. Следствие. Если одна из перемножаемых матриц, т. е. тхп-матрица А или п Хр-матрица В, имеет ранг, равный п, то ранг произведения равен рангу второй матрицы.
4.68] § 4.6. ОБЛАСТЬ ЗНАЧЕНИЙ И НУЛЬ-МНОГООБРАЗИЕ 117 Действительно, в этом случае оценки ранга произведения сверху и снизу, полученные в теоремах 4.64 и 4.65, дают одинаковый результат, равный рангу второй матрицы. 4.68. Пусть дан линейный оператор А, переводящий линейное пространство X в линейное пространство Y. Линейный оператор В, переводящий линейное пространство Y в линейное пространство X, называется левым обратным к оператору А, если ВА-Е есть единичный оператор в пространстве X. Оператор А в этом случае называется правым обратным к оператору В. В каком случае оператор А(В) имеет левый (правый) обратный? На этот вопрос отвечает теорема: Теорема. Оператор А: X —► Y имеет левый обратный тогда и только тогда, когда А есть мономорфизм. Оператор В: Y—*Х имеет правый обратный тогда и только тогда, когда В есть эпиморфизм. Доказательство. Пусть А есть мономорфизм и Т (A)cY — его область значений. Каждому у £ Т (А) отвечает х £ X, для которого Ах=у, причем х определяется однозначно по у в силу предположенной мономорфности А. Пусть QcY есть подпространство, дающее в прямой сумме с Т (А) все пространство Y (2.46). Определим оператор В: Y—► X по следующему правилу. Для у £ Т (А) положим By равным тому (единственному) х, для которого Ах~у\ для у £ Q положим В^ = 0; для у=Ух-\-у2, где ^i€T(A), y2 £ Q, положим Ву=Ву1. Оператор В, как легко видеть, линейный, и для каждого х £ X мы имеем ВАл; = л:, так что В есть левый обратный для А. Если А не есть мономорфизм, то существует вектор х £ X, отличный от 0 и такой, что Ад: = 0. Тогда для любого В: Y—*Х мы имеем (BA)j; = B(Aa;) = B(0) = 0> так что левого обратного для оператора А заведомо не существует. Пусть В: Y—>Х есть эпиморфизм и пусть N (В) с Y есть нуль-многообразие оператора В, a QcY в прямой сумме с N(B) дает все пространство Y. Так как Х = B(Y) = B(N(B) + Q) = = B(Q), то отображение В: Q —-* X есть также эпиморфизм и, более того, изоморфизм, так как никакой элемент у £ Q, отличный от 0, не переходит при воздействии оператора В
118 ГЛ. 4. ЛИНЕЙНЫЕ ФУНКЦИИ ВЕКТОРНОГО АРГУМЕНТА [4.69 в нуль. Определим оператор А: X —+ Y по следующему правилу: для любого х £ X вектор Ах есть тот (единственный) вектор у £ Q, для которого tiy = x. Оператор А, очевидно, линеен, и для каждого х £ X мы имеем ВАд: = х, так что А есть правый обратный для В. Если В: Y —*■ X не есть эпиморфизм, то для вектора х £ X, не входящего в Т (В), и любого оператора А: X—>Y мы имеем ВАдг^д:, так что В не имеет правого обратного. Теорема доказана. 4.69а. Мы знаем (4.43), что результатом умножения /zx/w-матрицы Р на т х /z-матрицу А является квадратная /zx/2-матрнца S = PA. Если S — единичная лхл-матрица (4.24г), то матрица Р называется левой обратной для матрицы А. Аналогично результатом умножения /юхл-матрицы А на п X /«-матрицу Q является квадратная m X /«-матрица T=AQ, и если Т—единичная тх/«-матрица, то Q называется правой обратной для матрицы А. б. Используя результаты 4.63, можно сформулировать теорему 4.68 в терминах ранга матрицы. Теорема. Тогда и только тогда некоторая m X п-матри- ца А имеет левую обратную, когда ее ранг равен числу п\ тогда и только тогда она имеет правую обратную, когда ее ранг равен числу т. § 4.7. Линейные операторы, переводящие пространство К„ в себя 4.71. Рассмотрим линейный оператор А, переводящий пространство X в себя (так что в 4.21 следует положить Y = X). Будем называть такой оператор А действующим в пространстве X. Пусть оператор А действует в /z-мерном пространстве X — К„. Выберем в пространстве X базис ег, ..., еп и этот же базис в X используем для построения матрицы операто-
4.72] § 4.7. ОПЕРАТОРЫ, ПЕРЕВОДЯЩИЕ ПРОСТРАНСТВО В СЕБЯ 119 ра А. В соответствии с 4.22, матрица Л оператора А строится по формулам п Aek = ^a^eh (17) /=i так что коэффициенты а(У образуют на этот раз квадратную п х/г-матрицу; она называется матрицей оператора А в базисе {е} = \ег, ..., еп}. Мы будем ее иногда обозначать через Л(е). Соответствующая формула для координат вектора у = Ах, у = Ут1^у, *=.2£ чег имеет вид (4.23): / = 1 18) При фиксированном базисе (ev ..., £j={е} получается взаимно однозначное соответствие между всеми линейными операторами, действующими в пространстве К„, и всеми квадратными п хя-матрицами, заполненными элементами из поля К. 4.72. Примеры. а. Оператор, который каждому вектору пространства X ставит в соответствие нуль-вектор, очевидно, является линейным. Он называется нулевым оператором (ср. 4.22а). Матрица нулевого оператора в любом базисе, очевидно, состоит из одних нулей. б. Единичный или тождественный оператор Е, ставящий в соответствие каждому вектору х £ X сам вектор х, мы рассмотрели в 4.22г. Матрица единичного оператора имеет вид (4.24г) Е = 1 О О О 1 О О 0 1 0 0 0 Такая матрица называется единичной.
120 ГЛ. 4. ЛИНЕЙНЫЕ ФУНКЦИИ ВЕКТОРНОГО АРГУМЕНТА [4.72 в. Оператор А, который переводит каждый вектор х в %х, где К — фиксированное число из поля К, очевидно, линеен; он называется оператором подобия (с коэффициентом подобия X), Аналогично предыдущему матрица оператора подобия в любом базисе имеет вид IU 0 ... О II о а, ... о 0 0 ... к\\ II II г. На евклидовой плоскости V2 векторы можно определять полярными координатами: л; = {ф, р}. Оператор А, переводящий вектор д: = {ф, р} в Ал; = {ф4-фо> р} (Фо — Фик_ сированный угол), является, как легко проверить с помощью чертежа, линейным. Этот оператор называется оператором поворота на угол ф0. Для построения матрицы оператора поворота выберем в плоскости V2 базис из двух единичных взаимно ортогональных векторов ег, е2. Построив чертеж, легко проверим, что вектор ех после поворота на угол ф0 перейдет в вектор созф0 ^1 + з1пф0 £2, а вектор е2—в вектор — sin ф0 £]_-(-созф0 е2. Следовательно, матрица оператора поворота в любом из указанных базисов имеет вид | cos ф0 — sin ф0 || I sin ф0 cos ф0 |" д. Пусть еи е2, ..., еп — некоторый базис в я-мерном п пространстве К„. Поставим в соответствие вектору х = 2 \kek m вектор Рх = y\'E)kek, где m < п. Оператор Р—линейный оператор; он называется оператором проектирования на подпространство Кот, порожденное векторами е1? е2, ..., ет. Для построения матрицы оператора проектирования заметим, что под его воздействием векторы е1? е2, . .., ет переходят в себя, а векторы ет+1, ..., еп — в нуль. Поэтому матрица оператора проектирования в базисе е1? е21 . . ., еп
4.73] § 4.7. ОПЕРАТОРЫ, ПЕРЕВОДЯЩИЕ ПРОСТРАНСТВО В СЕБЯ 121 имеет вид m-я строка 1 * ° 0 1 0 0 0 0 0 0 ... 0 0 . ... 0 0 . ...10. ... 0 0 . ...0 0. . 0 1 • ° .. 0 . 0 . 0 е. Пусть еъ е2, ..., еп — базис в /z-мерном пространстве Кл и даны п фиксированных чисел л^, К2, ..., Кп. Определим оператор А для векторов базиса условиями Ае1 = 'к1е1, Ае2 = Х2е2, ..., Аеп — %пеп и для любого другого вектора п п x = y\c,kek, естественно, по линейности условием Ал'^'УА,^^. Полученный оператор называется диагональным относительно базиса еъ . . ., еп или диагонализируемым оператором. Матрица диагонального относительно базиса еъ . . ., еп оператора в этом же самом базисе е1? е2, " Кг 0 ... 0 0 А. о 0 0 ... К Элементы, отличные от нуля, могут находиться в этой матрице только на главной диагонали. Такая матрица называется диагональной; отсюда и название оператора. Заметим, что в другом базисе /1? . .., /„ матрица оператора, диагонального относительно базиса е1? ..., еп1 уже не будет, вообще говоря, диагональной. 4.73а. Линейные операторы, действующие в пространстве X, можно по общим правилам 4.3 J—4.32 складывать друг с другом и умножать на числа, причем снова получаются линейные операторы, действующие в X. Равенства (7) и (7') показывают, что при введенных там операциях сложения и умножения на числа совокупность всех линейных операторов, действующих в пространстве X, сама становится линейным пространством над тем же полем К. Кроме того, для операторов, действующих в простран-
122 ГЛ. 4. ЛИНЕЙНЫЕ ФУНКЦИИ ВЕКТОРНОГО АРГУМЕНТА [4.73 стве X, всегда определена и операция умножения 4.33, в результате которой также получается оператор, действующий в пространстве X. В частности, если В — любой оператор, то (BE) х = В (Ел:) = Вл; = Е (В*), так что ВЕ=ЕВ=В. Определим степени данного оператора А по правилам А1-А, А2=АА, А3 = А2А = (АА) А = А (АА) =-- АА2, •••••• Ам = An_1A = АА""1. При этом имеет место формула km+n = kmkn (/я, /i=l,2, ...), (19) которую легко доказать по индукции. Еще положим по определению А0 = Е (тождественный оператор). Очевидно формула (19) остается справедливой и в том случае, когда один из показателей обращается в нуль. б. Пусть пространство X конечномерно, Х = К„. Фиксируем в пространстве X произвольно базис еъ . .., еп. Тогда каждому линейному оператору А, действующему в пространстве X, можно поставить в соответствие матрицу оператора А в этом базисе. В соответствии с правилами 4.41—4.43 вместе с операторами складываются, умножаются и возводятся в степени и соответствующие им матрицы. В этом случае легко можно найти размерность линейного пространства всех матриц /2-го порядка. Именно, матрицы Ejk, имеющие один-единственный элемент, отличный от нуля, для определенности 1, на пересечении у-й строки и /г-го столбца, очевидно, линейно независимы; с другой стороны, каждая матрица /2-го порядка есть линейная комбинация указанных матриц Ejk. Таким образом, матрицы E-k образуют базис в пространстве всех матриц /2-го порядка. Поскольку число
4.74] § 4.7. операторы, переводящие пространство в себя 123 матриц Ejk равно л2, это число п2 и есть размерность пространства всех матриц /2-го порядка (2.35). Ту же размерность пл имеет, очевидно, и пространство всех линейных операторов, действующих в пространстве К„. 4.74. Примеры. а. Умножение на комплексное число со=а + *Р есть линейное преобразование на плоскости z — л: + iy, которое можно записать с помощью вещественной матрицы 2-го порядка. Из формулы умножения (а+/р) (x-\-ly) = {ax—$y)-\-i ($x-\-ay) следует, что в базисе 1, / соответствующая матрица имеет вид Таким образом, комплексным числам со = а + *Р взаимно однозначно ставятся в соответствие вещественные матрицы со 2-го порядка; нетрудно видеть, что при этом сумме и произведению чисел отвечают сумма и произведение соответствующих матриц. Говорят, что вещественные матрицы со образуют точное представление поля комплексных чисел. б. Обозначим через ВЛ(&^0) оператор «сдвига на k шагов по индексу»; по определению, он переводит каждый базисный вектор ет в базисный вектор етл_к, если т — k > О, и в 0, если т — k^O. Очевидно, В0 = Е, ВЛ-ВГ^ВЛ+Г; в частности, Bi = B^. Матрица оператора Вх имеет вид 10 1 0 ... О || 0 0 1 ... О 0 0 0 ... 1 ||о о о ... оI Матрица оператора Bk имеет вид (k < п) 1° ' 0 . 1° ' |о . ..10.. ..0 1 .. .. 0 0 .. .. 0 0 .. • ° . 1 • о|
124 ГЛ. 4. ЛИНЕЙНЫЕ ФУНКЦИИ ВЕКТОРНОГО АРГУМЕНТА [4.75 4.75. Определитель произведения двух мат- р и ц. Пусть А 7* B = \\bjk,h — две произвольные пхп- матрицы, С = АВ—их произведение. В силу теоремы 4.54, примененной к минору Л4}*---»л (АВ), т. е. к самому опреде- 1 , . . . , П. лителю матрицы АВ, мы получим det AB = det Л- del В. Таким образом, справедлива теорема: Теорема. Определитель произведения двух п X п-матриц равен произведению определителей этих матриц. Существуют и прямые (т. е. не опирающиеся на предложения типа 4.54) доказательства этой теоремы. Вот одно из них. Рассмотрим определитель порядка 2п D = В силу 1.82 определитель D равен произведению определителей матриц Ьц • ь21 . Ьп\ • 0 . 0 . 0 . .. ь1п • • ь2п • • ьпп . 0 . 0 . 0 — 1 0 0 «11 а21 в/11 0 . -1 . 0 . а12 . а22 .. ап2 . .. 0 . 0 ..—1 • • а\п • а2п • а>пп А--= «и \ап1 и В = 'и ... ь1п ьп1 ... ьпп Но можно и другим путем получить величину определителя D. Используя числа —1, стоящие в первых п строках и в последних п столбцах определителя D, можно обратить в нуль все элементы, лежащие в последних п строках и в последних п столбцах определителя D. Для этого нужно к (я+1)-й строке определителя D прибавить первую, умноженную на ап\ затем вторую, умноженную на а12; ... ...; я-ю, умноженную на а1п, далее к (я + 2)-й строке прибавить первую, умноженную на а21, вторую, умноженную на а22, ...; 2я-ю, умноженную на а2п и т. д., пока не дойдем до последней, 2я-й, строки. В результате мы получим D = bn ... bin -1 0 ... 0 b2l ... b2n 0—1 ... 0 bnl ... bnn 0 0 ...-1 bnan + b21a12+ ... +bnlaln ... Ь1пап+...+Ьппа1п 0 0 ... 0 bua21+b2la22+...+bnla2n ... bVla21+ .. .+bnna2n 0 0 ... 0 Ьцап1+Ь21ап2+ .. .+bnlann ... binanl+... + bnnann 0 0 ... 0
4.76) § 4.7. ОПЕРАТОРЫ, ПЕРЕВОДЯЩИЕ ПРОСТРАНСТВО В СЕБЯ 125 откуда по теореме Лапласа 1.81, разлагая определитель D по последним п строкам, мы будем иметь D=(-l) _1\1 + ... + Л -1 0... 01 0-1 ... 0 о о —i | \bnan+... + bnlaln ... blnan+... + bnnaln \bna21 + ... + bnla2n ... blna21+... + bnna2n \bnanl+... + bnlann... blnanl+...+ bnnann nPnn nPnl • • • a2lbln+ • •• +<*2nb nn <*mbii+ ---+annbnl ... anlbln + ...+annbnn = det(i4, B). Сравнивая этот результат с полученным выше значением определителя D, убеждаемся в справедливости теоремы. В частности, отметим, что если обе перемножаемые матрицы Л и В невырождены (т. е. deM=^=0, det£=^0), то и матрица ЛВ невырождена; если хотя бы одна из матриц, например Л, вырождена, det Л = 0, то и detAB=0. Впрочем, это утверждение можно вывести и из 4.67. 4.76. Обратный оператор. В соответствии с определением 4.68 оператор В, действующий в пространстве X, называется левым обратным к оператору А, действующему в том же пространстве X, если ВА = Е. Оператор А в этом случае называется правым обратным к В. а. Возможно, что оператор А имеет много левых обратных и ни одного правого, или наоборот, много правых обратных и ни одного левого (см. задачу 25). Допустим, что оператор А обладает левым обратным Р и правым обратным Q; тогда справедливо равенство Р = РЕ = Р (AQ) = (PA) Q = EQ = Q. (20) Фиксируем Q; мы видим, что любой левый обратный оператор Р совпадает с Q и тем самым определен единственным образом. Точно так же в рассматриваемом случае правый обратный Q также определен единственным образом. Этот оператор P = Q, определенный единственным образом и одновременно и правый, и левый обратный к оператору А, называется обратным оператором к оператору А и обозна-
126 гл. 4. линейные функции векторного аргумента [4.77 чается через А"1. Сам оператор А, обладающий обратным, называется обратимым оператором. б. Рассмотрим случай оператора А в л-мсрном пространстве Х^К„. Пусть А — матрица оператора А в некотором фиксированном базисе еъ . .., еп. Возможно одно из двух: или det/l=7^0, или det^ = 0. В первом случае ранг матрицы А равен п и по 4.696 матрица А обладает и левой обратной матрицей, и правой обратной матрицей. Соответственно и оператор А обладает и левым обратным, и правым обратным. По а оператор А является обратимым оператором. Если же det^=^-0, то по тому же 4.696 матрица А не имеет ни левой, ни правой обратной; так же и соответстт вующий оператор А, действующий в пространстве К„, не имеет ни левого, ни правого обратного. 4.77. Матрица обратного оператора. Пусть А — обратимый оператор в /2-мерном пространстве X и В —А"1 — его обратный оператор. Выберем базису, . . ., еп и обозначим через Ца^Ц vi \Ь{'1-\ матрицы операторов А и В в этом базисе. Найдем явное выражение элементов Ь(!/ через элементы а(/\ Фиксируя номер строки /, последовательно выписываем выражения элементов /-й строки матрицы Е—АВ по формулам (8): ft(})«(i)-r*(?)fl(2)+ • • • +*(7)я(А) = 0, b^a^ + bfa^ + . .'. +b(Ta(!l) = Г, Ь^а^ + Ь{¥а{? +.'..+ Vfa™ = 0. Неизвестные Ь(}\ . . . , b(f определяются из этой системы уравнений по правилу Крамера 1.73, так как по условию (let А Ф0. Разлагая определитель в числителе по у-му столбцу, получаем где A(f — алгебраическое дополнение элемента a{f в матрице А. Итак, элемент Ь(р обратной матрицы равен отношению алгебраического дополнения элемента a(j] исходной матрицы к ее определителю.
4.82] § 4.8. инвариантные подпространства 127 Ми получаем теорему: Теорема. Для всякой невырожденной матрицы А = \\а(Р\\ существует и единственна обратная матрица B = \\bi!i\\, для которой АВ = ВА = Е. Элементы матрицы В вычисляются по формулам (21). 4.78. Оператор, обратный к оператору А, мы обозначили через А""1. Далее, (А-1)* обозначается через A~k. Легко доказать по индукции, что формула (19) распространяется также и на все отрицательные показатели. Аналогичные обозначения применяются для степеней обратной матрицы. Распространение формулы (19) на отрицательные показатели для матриц вытекает непосредственно из справедливости этого распространения для операторов. § 4.8. Инвариантные подпространства 4.81. Пусть в линейном пространстве К задан линейный оператор А. Введем следующее определение. Подпространство К' пространства К называется инвариантным относительно оператора А, если из х £ К' следует AxgK'. В частности, тривиальные подпространства — нулевое, и все пространство — являются инвариантными для всякого линейного оператора; нас будут интересовать, естественно, нетривиальные инвариантные подпространства. 4.82. Рассмотрим с этой точки зрения примеры линейных операторов, указанные в 4.72. а — в. Для операторов в примерах 4.72а — в (нулевой оператор, тождественный оператор и оператор подобия) каждое подпространство является инвариантным. г. Оператор поворота (4.72г) на угол (р0фщтс, m целое— не имеет нетривиальных инвариантных подпространств. д. Оператор проектирования (4.72д) имеет, например, следующие инвариантные подпространства: подпространство m К' из векторов х — 2 $ье*и которые не изменяются, и
128 ГЛ. 4. ЛИНЕЙНЫЕ ФУНКЦИИ ВЕКТОРНОГО АРГУМЕНТА [4.83 п подпространство К" из векторов у= 2 ^>kek> которые k = m+ 1 переходят в нуль. е. Каждое подпространство, порожденное некоторыми из базисных векторов еъ £2, . . . , еп1 является инвариантным для диагонального оператора (4.72е). 4.83. Пусть оператор А имеет в л-мерном пространстве Кп инвариантное /w-мерное подпространство Кт. Выберем базис еъ ... , еп пространства К„ так, чтобы его первые т векторов еъ . . . , ет лежали в подпространстве Кт. Тогда мы будем иметь и, следовательно, матрица оператора А в указанном базисе будет иметь вид < . . 0 . 0 . n(l) n (1) п(т) п(т) \j и m+1 0 п(п) v ит+1 а(1) 1 аШ) • • ип а(п) В первых m столбцах матрицы все элементы (гп-\-\)-и и следующих строк равны 0. Обратно, если матрица оператора А имеет такой вид, то подпространство, определяемое векторами еъ . . . , ет, является инвариантным для оператора А. 4.84. Предположим, что пространство К„ можно представить в виде прямой суммы инвариантных подпространств Е, F, . . . , Н (2.45). Выберем базис пространства Кп так, чтобы векторы elt . . . , ег лежали в Е, Л, • • • , Л » » F> hv . . . , ht » » Н.
4-91) § 4.9. СОБСТВЕННЫЕ ВИКТОРЫ И СОБСТВЕННЫЕ ЗНАЧЕНИЯ 129 Тогда матрица оператора А примет квазидиагональный вид Ае А! II I Ah \ Диагональные квадраты матрицы А заполняются элементами a(lk}, b(l\ . . . , c('k} в соответствии с формулами а/у= 2 <л- /5=1 аау=2 4'а*; Jfe=l вне диагональных квадратов в матрице Л всюду стоят нули. Обратно, если матрица оператора А в некотором базисе имеет квазидиагональную структуру, то пространство К„ разлагается в прямую сумму подпространств, порожденных соответствующими группами базисных элементов. § 4.9. Собственные векторы и собственные значения 4.91. Особую роль играют одномерные инвариантные подпространства оператора А; они называются иначе инвариантными, или собственными, направлениями. Всякий (ненулевой) вектор, принадлежащий к одномерному инвариантному направлению оператора А, называется собственным вектором оператора А; иначе говоря, вектор хфО называется собственным вектором оператора А, если оператор А переводит вектор х в коллииеарный ему вектор: Ах = Хх. (22) 5 Г. Е. Шилов
ГЛ. 4. ЛИНЕЙНЫЕ ФУНКЦИИ ВЕКТОРНОГО АРГУМЕНТА [4-92 Число Я, фигурирующее в этом равенстве, называется собственным значением [собственным числом) оператора А, соответствующим собственному вектору х. 4.92. Обратимся опять к примерам 4.72. а — в. В примерах 4.72а — в каждый ненулевой вектор пространства есть собственный вектор соответствующего оператора с собственными значениями соответственно 0, 1, X. г. Оператор поворота (4.72г) на угол, не равный /ил с целым ш, не имеет собственных векторов. д. Оператор проектирования (4.72д) имеет собственные m n векторы вида х = 2 \ьеъ. и У~ 2 ^Л с собственными k— I k-m+\ значениями соответственно 1 и 0. Можно проверить, что иных собственных векторов у оператора проектирования нет. е. Диагональный оператор (4.72е) по самому определению имеет собственные векторы ev е2, . . . , еп с собственными значениями соответственно Xv Х2, . . . , Хп. 4.93. Укажем два простых свойства собственных векторов. а. Лемма. Собственные векторы хъ х2, ... , хт оператора А с попарно различными собственными значениями Х1у Я2, ... , Хт линейно независимы. Это утверждение мы докажем индукцией по числу т. Очевидно, что для т=\ лемма верна. Допустим, что лемма верна для всяких т—1 собственных векторов оператора А; покажем, что она продолжает оставаться верной и для всяких т собственных векторов оператора А. Предполагая противное, допустим, что между т собственными векторами оператора А имеется линейная зависимость агхг + ос2л;2 + . .. + ятхт = 0, где, например, ах^=0. Применяя к этому равенству оператор А, получаем а1Х1х1 + а2К2х2 + . . . + ат\тхт = 0. Умножим первое равенство на Хт и вычтем из второго; мы получим «1 (*1 — Хт) Х1 + «2 (*2 — Ю Х2 + • • • •••+a*-i(*«-i —*J*«-i = °.
4.94J § 4.9. СОБСТВЕННЫЕ ВЕКТОРЫ И СОБСТВЕННЫЕ ЗНАЧЕНИЯ 131 откуда по индуктивному предположению все коэффициенты должны быть равны нулю. В частности, ах (Ах — Х/я) = 0, что противоречит условиям ахФ®, Хх фХт. Следовательно, наше предположение неверно и векторы хг, х2, . . . , хт линейно независимы. В частности, в n-мерном пространстве линейный оператор А не может иметь более п собственных векторов с различными собственными значениями. б. Лемма. Все собственные векторы линейного оператора А, отвечающие данному собственному значению X, образуют подпространство К(Х) с К • В самом деле, если Ах1 = Кх1 и Ад:2 = Ял:2, то А (ахх + рл:2) = аАл^ -f Р Ал;2 = аКх1 + рАл;2 = X (axL + Рл;2), чем утверждение леммы доказано. Подпространство К(Х) называется собственным подпространством оператора А, отвечающим собственному значению X. 4.94. Мы укажем здесь, как можно вычислить координаты собственных векторов оператора А, заданного своей матрицей в некотором базисе еъ ..., еп пространства К„. Допустим, п что вектор х= 2 \kek есть собственный вектор оператора А, /5=1 так что Ах = Кх с некоторым К. Используя формулы 4.23 (5), мы можем это равенство переписать в координатной форме: 4i = <ti + a?%+■■■ + <%„ •••••••• или аПх +(ei2,-A.)ga+...+ «„ =0, I (23) «i + «* + • • • + «' - M i„ = o. J Эта однородная система уравнений относительно величин £ь £2, . . ., |„ допускает ненулевое решение в том и только 5*
132 ГЛ. 4. ЛИНЕЙНЫЕ ФУНКЦИИ ВЕКТОРНОГО АРГУМЕНТА И-95 в том случае, когда ее определитель равен нулю (3.21): а^ — Х а[2) ... а[п) I а(2и а^ — Х . . . a<m L=o. (24) п(1) />(2) п(П) 1 Многочлен /2-й степени относительно X, стоящий в левой части этого уравнения, называется характеристическим многочленом матрицы Л. Всякому его корню Х0 £ К отвечает собственный вектор, который определяется после подстановки в (23) вместо X величины Х0 путем решения получившейся совместной системы относительно величин gl512, . . ., £м. Полученный результат показывает, между прочим, что хотя матрица оператора А зависит от выбора базиса е1у . . ., сп, но корни характеристического многочлена этой матрицы уже не зависят от выбора базиса. Мы еще вернемся к этому вопросу в 5.53. 4.95. Разберем некоторые возможности, которые могут представиться при решении характеристического уравнения (24). а. Случай отсутствия корней в поле К. Если уравнение А (X) в поле К вовсе не имеет корней, то линейный оператор А не имеет в пространстве К„ собственных векторов. Например, оператор поворота на угол ц>0фтп (т = 0, ±1, ±2, ...) на плоскости ]/2, как мы уже отметили, не имеет собственных векторов. Этот факт, геометрически очевидный, легко устанавливается алгебраически. В самом деле, уравнение (24) для оператора поворота имеет вид I cos ф0 — X — sin ф0 I 0 I sin ф0 cos ф0 — ^| или после раскрытия определителя 1 —2Х cos ф0 -!- >.2 = О, и если у0ф пт(т = 0, ±1, ±2, ...), то это уравнение не имеет вещественных корней. б. Если К=С есть поле комплексных чисел, то в силу основной теоремы алгебры уравнение (24) всегда имеет корень Д(Ь) =
4.95] § 4.9. СОБСТВЕННЫЕ ВЕКТОРЫ И СОБСТВЕННЫЕ ЗНАЧЕНИЯ 133 Х0£К. Таким образом, в пространстве Сп всякий линейный оператор имеет (хотя бы один) собственный вектор. в. Случай наличия п различных корней. Если все п корней Хх, Х2, ..., Хп уравнения Л (К)> = 0 лежат в поле К и различны, то мы сможем в пространстве Кп найти п различных собственных векторов оператора А, решая систему (23) последовательно при Х = ХЬ Х2, . . ., Хп. В силу леммы 4.93а собственные векторы /х, /2, ..., fn будут линейно независимы. Примем их за новый базис и построим матрицу оператора А в этом новом базисе. Поскольку А/2 - Ь2/2, А/„ = hfn> матрица A(f) имеет вид !| >-i о ... о || j 0 0 ... i., I Используя определение диагонализируемого оператора (4.72е), мы можем сформулировать полученный результат следующим образом: в пространстве К„ всякий линейный оператор, характеристический многочлен матрицы которого (в каком-либо базисе) имеет п различных корней в поле К, является диагонализируемым; матрица этого оператора, построенная в базисе из его собственных векторов, диагональна, и ее диагональные элементы суть собственные значения оператора. г. С другой стороны, если оператор А в некотором базисе Д, ..., /п пространства К„ имеет диагональную матрицу (25) с произвольными, необязательно различными числами А,1? . . ., Хп на диагонали, то векторы fx, . . ., fn — собственные, а числа %х, ..., Хп — соответствующие собственные значения. Покажем, что у оператора А в этом случае нет иных собственных значений (отличных от чисел XL, ..., Хп). Действительно, если X—собственное значение, отвечающее
134 ГЛ. 4. ЛИНЕЙНЫЕ ФУНКЦИИ ВЕКТОРНОГО АРГУМЕНТА [4.95 собственному вектору /= 2 Р///» то> ВЬ1леляя в равенстве А/= А (| Ру//.) = | Р/.А/} = S f}/Vy = слагаемое по вектору /., мы получаем Щ=Щ (У=1, •••>")• (26) Среди чисел pif ..., р^ есть хотя бы одно отличное от нуля; пусть, например, pj^O. Тогда равенство (26) при j — 1 дает ?ъ — Xl5 что и требуется. д. Случай кратного корня. Пусть X — Х0 — некоторый корень уравнения (24) кратности г^\. Возникает следующий вопрос: какова размерность соответствующего собственного подпространства К(Х°\ или, иными словами, сколько линейно независимых решений допускает система (23) при Х = Х0? Зная ранг матрицы системы, мы бы могли точно ответить на этот вопрос (3.51). Но мы желаем связать этот ответ только с кратностью г корня ^0. В примерах 4.72а—в и е, как легко убедиться, размерность каждого собственного подпространства K(Xq) совпадает с кратностью соответствующего собственного значения Х0 как корня характеристического многочлена оператора А. Однако в общем случае это не так. Рассмотрим оператор А в R2, заданный матрицей А = К о с произвольным [д, =т^0. Характеристический многочлен имеет вид (Х0 — X)2; он имеет двойной корень Х = Х0. Система (23) в данном случае принимает вид 0.^ + 0.^ = 0, li-Sx + O-^O и имеет единственное (с точностью до числового множителя) решение &i = 0, &2=1.
Таким образом, собственное подпространство оператора А, соответствующее собственному значению Х = Х0, имеет размерность 1, меньшую, чем кратность корня Х0. Можно доказать, что в общем случае размерность собственного подпространства K(Xq) не превышает кратности корня Х0 (см. задачу 11 к гл. 5). Полный ответ на вопрос о размерности пространства Кх для случая К—С мы дадим в гл. 6 в результате определения канонической формы матрицы оператора А. ЗАДАЧИ 1. Определив естественным образом сложение линейных форм и умножение линейной формы на вещественное число, построить из линейных форм, определенных на линейном пространстве К, новое линейное пространство К*. Какова размерность пространства К*, если размерность пространства К равна я? 2. Выяснить, какие из следующих векторных функций в пространстве У3 являются линейными операторами: а) Ах = х-\-а (а—фиксированный ненулевой вектор); б) Ах = а\ в) Ах = (а, х)а*)\ г) Ах = (а л') х *)' д) Ах = Ц, Ь + Ез. &}). где х = Ц1, £2, У; е) A^ = (sing1, cos S2» 0)'» ж) A^ = (2g1-g2, Ь + Ез. Ei). 3. Будут ли линейными операторами в пространстве всех многочленов от t а) умножение на t, б) умножение на t2, в) дифференцирование? 4. Составить матрицу оператора А в У3» переводящего векторы *! = ((), 0, 1) в £/! = (2, 3, 5), *2 = (0, 1, 1) в у2 = (\, 0, 0), *з = 0, 1, 1) в и, = (0, 1, -1) в базисе а) е1 = (1, 0, 0), е2 = (0, 1, 0), е3 = (0, 0, 1); б) Xi, А'2, Х3. 5. В трехмерном пространстве обозначим через А оператор поворота на 90° вокруг оси ОХ (от OY к OZ), через В — оператор поворота на 90° вокруг оси OY (от 01 к ОХ), через С—на 90° вокруг *) Здесь (а, х) означает обычные скалярные произведения векторов а и х, т. е. число, равное произведению их длин и косинуса угла между ними.
136 ГЛ. 4. ЛННКЙНЫЕ ФУНКЦИИ ВЕКТОРНОГО АРГУМЕНТА оси OZ (от ОХ к OY). Показать, что А4 = В4=С4--Е, АВ ф ВА, А2В2 = В2А2. Имеет ли место равенство АВАВ-=А2В2? 6. В пространстве всех многочленов от t обозначим через А оператор дифференцирования, а через В—оператор умножения на независимое переменное: АР(0 = Я'(0. ВР(0 = *Р(/). Имеет ли место равенство АВ = ВА? Найти оператор АВ—ВА. 7. В предположении, что АВ = ВА, доказать формулы (А + В)2 = А2 + 2АВ + В2, (А + В)3 = А3 + ЗА2В + ЗАВ2 + В3. Как следует изменить эти формулы, когда АВ Ф ВА? 8. В предположении, что АВ — ВА = Е, доказать формулу А'ЛВ — BAm = mAm-1 (m=l, 2, ...). 9. Найти размерность линейного пространства L (К,;, Кт) всех линейных операторов, действующих из /i-мерного пространства Кп в m-мерное пространство К,л, н построить базис пространства L(K„, Km). 10. Найти произведение матрицы Л на матрицу В: 1 2 3'i (1—1 —2 —4 А = 2 4 6 3 6 9 В —2 2 11. Выполнить действие возведения в п-ю степень матриц |j 1 1 jj jj cos ф —sin ф j] II0 1 il |] sin ф cos ф ii 12. Найти все матрицы А 2-го порядка, удовлетворяющие условию Л2 = |;0 о \:0 О 13. а) б) ычислить АВ —ВА, || 1 2 2 Л = ||2 1 2 [12 3 Л = ' где j ;!• Н ii i 2 1 о ; || 1 121 -12 1 и В — \\ | 4 1 1' —4 2 0 1 2 1 * 3 12 3—2 4 -3 5 - -1 14. Сумма диагональных элементов ап-\-... -\-апп матрицы А = !| ajk [называется следом матрицы А и обозначается sp А. Проверить формулы sp (Л + В) = sp A-Y sp Б, sp (АВ) = sp (ВА). 15. Используя задачу 14, доказать, что для операторов А и В, действующих в пространстве К;|, равенство АВ—ВА —Е невозможно.
ЗАДАЧИ 137 Примечай и е. Результат задачи 6 показывает, что в рассматриваемом случае предположение о конечномерности пространства Кп существенно. 16. Для данной- квадратной матрицы С 2-го порядка с spC = 0 (см. задачу 14) найти представление в форме С = АВ — ВА, где А и В — (неизвестные) матрицы 2-го порядка. 17. Пусть в я-мерном пространстве даны т линейно независимых векторов п i-\ и оператор А действует в линейной оболочке L(xlt ..., хт) по формулам У/ = Ах; 2 аЦ\ (/=1. 2, m). Показать, что каждый минор m-го порядка в матрице из координат векторов у J (относительно базиса е1у ег, ..., еп) равен произведению соответствующего минора в матрице из координат векторов х,- на detail. 18. Доказать, что если в матрице А ранга г базисный минор расположен в левом верхнем углу, то отношение любого минора М r-го порядка к минору, находящемуся в тех же столбцах, что и минор Л1, но в первых г строках, зависит только от номеров столбцов минора М. 19. Доказать, что если А — матрица ранга г, то любой определитель 2-го порядка, составленный из миноров r-го порядка матрицы Л, вида M'i\:li\ ':' М ky, kn k, ' t » 2' •' ■ » 7* 1 ' •'' равен нулю. 20. Доказать, что каждый минор k-vo порядка матрицы ABC равен сумме произведен nii некоторых миноров /г-го порядка матриц А, В и" С. 21. Для матриц 1 21] 2 5||' !] V. V, V» - V* • 1 н i Чг хи - -1и -'/■> - 12—3] 0 1 2 0 0 l| V-2 V»j -V* -Vs V» -V2 ■V. 7S найти обратные матрицы,
138 ГЛ. 4. ЛИНЕЙНЫЕ ФУНКЦИИ ВЕКТОРНОГО АРГУМЕНТА 22. Для любой невырожден иной матрицы А доказать равенство (Л')-* = (Л-1)'. 23. Найти все решения уравнения ХА = 0, где А — данная матрица 2-го порядка, X — искомая матрица 2-го порядка, 0— нулевая матрица (матрица, все элементы которой равны нулю). 24. Пусть А = \а{р \ — л юб а я квадратная матрица /z-ro порядка и А\]) — алгебраическое дополнение элемента я{-7) в определителе матрицы А. Матрица Л = ||Л")|| называется присоединенной для матрицы А. Показать, что АА = АА = (det А)-Е. 25. Пусть Р — линейное пространство всех многочленов от аргумента t. Рассмотрим операторы А и В, определенные условиями A [a0 + ait+.. .+antn] = al + a2t+... +ant"-\ В [a0 + ait+... + ant"] = a0t + a1t*-+-... +aHt" + K Показать, что А и В — линейные операторы и что АВ = Е, ВА ф Е. Обладает ли оператор А обратным? 26. Показать, что оператор В в задаче 25 имеет бесконечное число левых обратных. 27. Если А — невырожденный линейный оператор в я-мерном линейном пространстве, то всякое подпространство, инвариантное относительно А, будет инвариантным и относительно А-1. 28. Если линейные операторы А и В перестановочны (т. е. АВ = ВА), то всякое собственное подпространство оператора В является инвариантным подпространством для оператора А. 29. Если прямая сумма (2.45) собственных подпространств оператора А совпадает со всем пространством К и каждое собственное подпространство оператора А является инвариантным для оператора В, то А и В перестановочны. 30. Если х и у — собственные векторы оператора Ас различными собственными значениями, то ах-\-$у(а ^ О, р ф. 0) заведомо не является собственным вектором оператора А. 31. Если каждый вектор пространства К является собственным вектором для оператора А, то А = КЕ (А£/С). 32. Если линейный оператор А перестановочен со всеми линейными операторами, действующими в данном пространстве, то А = ЯЕ. 33. Если линейный оператор А имеет собственный вектор е0 с собственном значением Я.с, то для оператора А2 вектор е0 также является собственным с собственным значением, равным Ко. 34. Если линейный оператор А не имеет собственных векторов, то оператор А2 может их иметь (пример: оператор поворота на 90° в плоскости). Показать, что если оператор А2 в пространстве Rn имеет собственный вектор с неотрицательным собственным значением Я = |л2, то оператор А также имеет собственный вектор.
ЗАДАЧИ 139 35. Найти собственные значения и собственные векторы операторов, заданных следующими матрицами: а) 1| 2 -1 0-1 II0 2 12 —1 0 1 0 1 — 1 0 1 0 —1 3 I || !; б) i ; и Г) — 1 —2 2 0 1 0 0 0 1 ; | 0 0 1—1 — 1 0 1 —1 i 0 0 0 0 0 0 0 1 в) 36. Проверить выполнение следующих фактов: а) соотношение N (A) ZD Т (А) необходимо и достаточно для того, чтобы имело место равенство А2 = 0; б) для любого оператора А имеем N (А) с N (А2) с N (А3) с ...; в) для любого оператора А имеем Т (A) ZD T (A2) ZD T (A3) ZD...; г) если Т (А*) с N (Ат), то Т (А) с N (A"2**-*), T (A" + *-i) с N (А). 37. Показать, что каждый линейный оператор А ранга г может быть представлен в виде суммы г линейных операторов ранга 1. 38. Найти все инвариантные подпространства диагонального оператора с различными диагональными элементами и доказать, что их число равно 2п.
ГЛАВА 5 ПРЕОБРАЗОВАНИЯ КООРДИНАТ Известно, какую большую роль при решении геометрических задач средствами аналитической геометрии играет правильный выбор системы координат. В значительно более обширном круге вопросов, которые открываются в связи с геометрией я-мерного линейного пространства, роль правильного выбора системы координат будет также весьма велика. Эта глава посвящена правилам, по которым совершается преобразование координат в я-мерном линейном пространстве. Результаты, полученные здесь, послужат, в частности, основой для классификации квадратичных форм, которая будет проведена в седьмой главе. §5.1. Формулы перехода к новому базису 5.11. Пусть { е } = { еъ е2, . .., еп } — некоторый базис в л-мерном пространстве Кп и {/} = {Д, /2, . . ., fn } —некоторый другой базис в том же пространстве. Векторы системы {/} однозначно определяются своими разложениями по векторам исходного базиса: Л Prt)el-}rP(l)e2 + f„=PlVe1 + plVe2-{ J- пС1)Р i P n *nJ (i) или, короче, //=2р7Ч- (7=1, 2, ..., п). /=1 В формулах (1) или (2) коэффициенты /;(/} (i, j— l, 2, определяют матрицу (2) р=\\р1Н = Р(Г р? ■ р1Т „(1) „(«) ■ К'
5.13) § 5.1. ФОРМУЛЫ ПЕРЕХОДА К НОВОМУ БАЗИСУ 141 которая называется матрицей перехода от базиса {е} к базису {/}. Как и ранее в аналогичных случаях (§ 4.2 и далее), мы выписываем координаты векторов/• (относительно базиса { е }) в столбцах матрицы Р. Определитель D матрицы Р отличен от нуля; действительно, в противном случае ее столбцы, а с ними и векторы /1? /2, . . ., /„ были бы линейно зависимыми (3.12а). Матрицу с определителем, отличным от нуля, мы уже назвали ранее невырожденной. Таким образом, переход от одного базиса n-мерного пространства К„ к другому базису всегда осуществляется с помощью некоторой невырожденной матрицы. Формулы (1) вместе с матрицей Р задают и соответствующий линейный оператор Р, определяемый из соотношений f- = Рв;(i = 1, 2, ..., п). Он также называется опера- тором перехода от базиса { е} к базису {/}. 5.12. Обратно, пусть ^e} = {ev e2, ..., еп} — заданный базис /z-мерного пространства К„ и Р=\р(?1 — невырожденная матрица порядка п. Построим по формулам (1) систему векторов /]_, /2, . . ., /м. Очевидно, что эти векторы линейно независимы, поскольку столбцы всякой невырожденной матрицы линейно независимы (З.Г2а). Следовательно, векторы /и Л» •••»/« образуют новый базис пространства К„. Итак, всякая невырожденная матрица Р = \\р{^\ определяет по формулам (1) переход от одного базиса n-мерного пространства Кп к другому базису. 5.13. Отметим один частный случай перехода к новому базису: именно, тот, когда каждый из векторов fk совпадает с соответствующим вектором ek, умноженным на некоторое число У^кфО (k=\, 2, ..., п). Формулы (1) принимают вид /i= Vi. /„ = Ке,„
142 ГЛ. 5. ПРЕОБРАЗОВАНИЯ КООРДИНАТ [5-21 и матрица Р имеет диагональную форму В частности, при Хг = Х2= . . . = Хп = 1 получаем матрицу тождественного преобразования — единичную матрицу (3) при тождественном преобразовании исходный базис не изменяется. § 5.2. Последовательные преобразования 5.21. Пусть p = \\p(pj— матрица перехода от базиса {е} = {е1, е2, ..., еп) к базису {/} = {/lf /2, ..., /п\ и Q = 1я{)У\\ — матрица перехода от базиса {/} к базису {g\ = = {gi, g2, • • • , gn}- Определим матрицу перехода от базиса {е) непосредственно к базису {g}. Формула перехода от базиса {е} к базису {/} имеет вид (2) /,= 2/>(/Ч- (У=1, 2, .... п) 1=1 и от базиса {/} к базису {g} соответственно Подставляя (4) в (5), получаем (*=1, 2, .... л). (4) (5) (6)
5.31] § 5.3. ПРЕОБРАЗОВАНИЕ КООРДИНАТ ВЕКТОРА 143 С другой стороны, если Т=[^\ означает искомую матрицу перехода от базиса {е\ к базису {g}, то мы можем написать 4k=%tf*i (*=1.2, -.., п). (7) Сравнивая (6) и (7), мы получаем t<? = %РЧУ)} (I, А=1, 2, ..., п). (8) Полученная формула (8) только обозначениями индексов (но не их ролью) отличается от формулы 4.43 (8). Следовательно, искомая матрица Т есть произведение матрицы Р на матрицу Q. 5.22. Рассмотрим следующий частный случай последовательных преобразований. Систему уравнений (1), поскольку матрица Р не вырождена, можно разрешить относительно векторов ev ..., еп\ получающаяся при этом система равенств вида ^а1тй72т-та, I (9) определяет, очевидно, переход от базиса {/} к базису {е}. Последовательный переход от базиса {е} к базису {/} с помощью матрицы Р и затем от базиса {/} к базису \е} с помощью матрицы Q=||^/')|| есть переход от базиса \е\ к нему же самому, т. е. в конечном счете тождественное преобразование с единичной матрицей; поэтому здесь PQ — E. § 5.3. Преобразование координат вектора при изменении базиса 5.31. Пусть {е} = {е19 е2, . . ., еп) и {/} = {/1>/2> ...,/„}- два базиса в л-мерном линейном пространстве Км. Для любого вектора х £ К„ имеют место разложения ^ = 5Л + 52^2+---+5/,^ = Л1/1+Л2/2+---+Л;,/и. (Ю)
144 ГЛ. 5. ПРЕОБРАЗОВАНИЯ КООРДИНАТ [5.31 где £15 £2, ..., £„— координаты вектора х относительно базиса {е} и r^, rj2, ..., г\п — его координаты относительно базиса {/}. Поставим задачу вычислить координаты вектора х относительно базиса {/} по известным его координатам относительно базиса {е}. Пусть нам дана матрица Я=||у;0|| перехода от базиса {е\ к базису {/}. Тогда векторы \е\ выражаются через векторы {/} по формулам (9) или, короче, п е /=2^/}Л (7=1. 2, ..., л), (11) k=l где Q^U^II — матрица, обратная к матрице Р. Подставляя формулы (11) в разложение (10), мы получаем п п х = 2 l/ej = 2 4kfk = /=i /\k=\ j k=\ \/ = i V откуда в силу единственности разложения вектора х по базису {/} п Л* = 2 ?i/}£/ (ft=l, 2, ..., л). (12) /=i В раскрытом виде получается система равенств Ли — Чп Ъ1 "Г Уя Ь2 I '"Т 7л 5/z- Таким образом, координаты вектора х относительно базиса {/} линейно выражаются через координаты вектора х относительно базиса {е\; коэффициенты этих линейных выражений образуют матрицу, транспонированную по отношению к матрице перехода от базиса {/} к базису {е} (т. е. транспонированную по отношению к матрице, обратной к матрице Р). Используя обозначение обратной матрицы Р~1 и транспонированной Р', можно записать матрицу S, определяемую соотношениями (12), формулой S = (Р~1)'.
5.33] § 5.3. ПРЕОБРАЗОВАНИЕ КООРДИНАТ ВЕКТОРА 145 5.32. Имеет место и обратная теорема: Пусть £15 £2, ..., 1п — координаты произвольного вектора х относительно базиса {е\ — {е1, е2, ..., еп) п-мерного пространства К„ и величины г^, г|2, . . ., цп определены посредством равенств Л1 — 5llSl + ^l2b2"i" • • • -TSln$ni TJ2 = ^21bi "Г ^22b2 "Г • • • ~T S2nbn> Цп — Snlbl + Sn2b2 + • • • + Snribm где det || sjk || Ф 0. Тогда в пространстве Kv/ можно найти новый базис {/} — {/*!, /2, ..., /„} таким образом, чтобы числа г]!, г|2, ..., Л,! стала координатами вектора х относительно базиса {/}. Доказательство. Введем матрицу S =\\ sjk || и матрицу Р^=(6")"1, элементы которой обозначим через р(-1\ С помощью матрицы Р построим новый базис по формулам (1). Утверждается, что этот базис и есть искомый. Действительно, составим формулы перехода (12) к координатам вектора х относительно нового базиса. Как мы видели, эти формулы записываются с помощью матрицы (Я-1)'. В данном случае эта матрица совпадает с матрицей S, так как (/>-1)' = ([(5')-1]-1)' = (5')' = 5. Следовательно, величины 1]1, rj2, . . ., цп и координаты вектора х относительно базиса {/} — одни и те же для любого вектора х, что и требовалось. 5.33. Аналогично 5.21 можно построить матрицу последовательного преобразования координат. Пусть £15 £2, ...,£„ — координаты вектора х относительно базиса {е} и величины г|1? г)2, . . ., цп и тх, т2, . . ., %п определены посредством равенств л), Л/= IjPjili / = 1 п ч = 2 яим (7=1, 2, (*=1, 2,
146 ГЛ. 5. ПРЕОБРАЗОВАНИЯ КООРДИНАТ [5.33 соответственно с невырожденными матрицами Р=||р.. || и Q=i\\qkj [|. Тогда можно выразить величины {т} непосредственно через величины {£} по формулам п п п **=2 2qkjPjili= 2 tkiit (*=i, 2, ..., л), «■ = 1 /=1 « = 1 где величины tki (/, &=1, 2, . . ., /г) образуют матрицу 7\ равную произведению матрицы Q на матрицу Р. § 5.4. Преобразование коэффициентов линейной формы Пусть в пространстве К„ задана линейная форма L (х). Как мы видели в 4.13, когда в пространстве К,, выбран базис {е\ = {е1, е2, . .., еп}, значения формы L (х) можно вычислять по формуле /5=1 где %k(k=\, 2, ..., п) — координаты вектора х относительно базиса {е}, a lk — L(ek) (я—1, 2, ..., п). Коэффициенты lk, очевидно, зависят от выбора базиса {е}. Мы выведем здесь правило, по которому совершается преобразование коэффициентов линейной формы при переходе к новому базису. Допустим, что формулы п /,= 2/>!'Ч- (y=l, 2, ...,п) (13) «=1 определяют переход от базиса {е\ к новому базису {/}. Найдем коэффициенты линейной формы L (х) в базисе {/}. Эти коэффициенты суть числа Xy = L(/y); вычисляя эти числа с помощью формулы (13), находим K-L(ff)=tp(ii)L(ei)=tp'ihlr i=I i=l Таким образом, коэффициенты линейной формы преобразуются так же, как преобразуются базисные векторы.
5.51] § 5.5.ПРЕОБРАЗОВАНИЕ МАТРИЦЫ ЛИНЕЙНОГО ОПЕРАТОРА 147 § 5.5. Преобразование матрицы линейного оператора 5.51. Пусть дан линейный оператор А в л-мерном пространстве К„. Обозначим через А{е) = || а\!) || матрицу оператора А относительно базиса {е} = {ev e2, . .., еп) и через А/)= II aqp) II его матрицу относительно базиса {/} = = {/i» /2» •••» /«}• Предположим, далее, что формулы перехода от базиса {е} к базису {/} имеют вид п Д=2Р/*'^ (*=», 2, .... л). (Н) /=1 Матрицу перехода ||р(/Л)|| обозначим через Р. Установим связь между матрицами A{e)i A{f) и Р. Матрица Л(/?) = || а\^ \\ определяется из системы равенств Ае~ 2 аФе( (у = 1, 2, ..., л), (15) а матрица Аф — ||oc(/Jm || — из системы равенств А/. = 2 «Г/* («=1, 2, ..., п). Заменим в последней формуле векторы fk их выражениями через векторы е. по формулам (14), изменив индекс суммирования j на /: А/, = 2 аГ 2 Р',4 = 2 ( 2 /f Ч"") <"/• Теперь применим оператор А к обеим частям формулы (14) и используем выражение векторов Аеу- из (15): п п п п /=1 /=1 /=1 /=1 п / п \ *=1 \/=i /
148 гл. 5. преобразования координат [5.52 Сравнивая коэффициенты при et в двух последних разложениях, находим п п к=\ /=1 или в матричной форме РАф = А{е)Р. (16) Это и есть искомая связь между матрицами А{е), A{j) и Р. Умножая обе части слева на матрицу Я"1, получаем выражение матрицы Ацу Аф — Р А{е)Р. 5.52. Используя теорему о произведении определителей (4.75), получаем из (16) следующее соотношение: detPdeM(/) = deM(e)detP или, так как detP=^0, det Л(<?) = det Аф. Итак, определитель матрицы оператора не зависит от выбора базиса в пространстве. Поэтому мы можем говорить об определителе оператора, подразумевая под ним определитель матрицы этого оператора в произвольном базисе. 5.53. Кроме определителя, существуют и другие функции от элементов матрицы оператора, остающиеся неизменными при переходе к новому базису. Чтобы построить такие функции, рассмотрим оператор А — ХЕ, где X— параметр, взятый из поля К. Матрицей этого оператора в базисе {е} является, очевидно, матрица А(е) — ХЕ, а в базисе {/}—■ матрица Аф — ХЕ. По доказанному, при любом X det (А{е) — ХЕ) = del (Аф—\Е). Справа и слева стоят многочлены n-Pi степени от X. Так как эти многочлены совпадают тождественно, то у них коэффициенты при любой степени X должны быть одинаковыми. Эти коэффициенты суть некоторые функции от элементов матрицы оператора, которые, следовательно, остаются неизменными при изменении базиса. Выясним вид этих
$.61] § 5.6. ТЕНЗОРЫ 149 функций. Определитель матрицы А(е) — КЕ имеет вид И])- а<1) аа) -к а[» а\? • — X . , . а[т . . а™ а(п)- -к Коэффициент Дг при Я"-1, как легко вывести из определения определителя, равен (со знаком (—I)""1) сумме диагональных элементов a[v — й? +...+ а^\ это число называется следом оператора А. Коэффициент Д2 при Я""2 есть сумма всех диагональных миноров 2-го порядка*), взятая со знаком (—1)"~2; аналогично коэффициент ДЛ при \n-k есть сумма всех диагональных миноров k-vo порядка, взятая со знаком (—\)n~k. Наконец, коэффициент Дп при К° — свободный член — равен, очевидно, самому определителю оператора. Многочлен det (А(е) — ХЕ), который, как мы доказали, не зависит от выбора базиса в пространстве, называется характеристическим многочленом оператора А. § 5.6*. Тензоры 5.61. Координаты вектора, коэффициенты линейной формы, элементы матрицы линейного оператора являются примерами геометрических величин, называемых тензорами. Прежде чем перейти к соответствующему определению, несколько рационализируем нашу систему обозначений. Векторы базиса /z-мерного пространства К„ будем обозначать, как и раньше, символами еъ е2, ..., еп (с индексами внизу). Координаты векторов х,у, . . . будем обозначать соответственно символами I1, £2, ..., |и; г]1, Г]2, ..., ту1, ... (с индексами вверху). Коэффициенты линейной формы L (х) обозначим lv /2, . . . ,1п (с индексами внизу). Элементы матрицы линейного оператора обозначим через а\\ при этом верхний индекс обозначает номер строки, *) Минор М1^ {•*; ;;;• \к называется диагональным, если ii = j\,
150 ГЛ. 5. ПРЕОБРАЗОВАНИЯ КООРДИНАТ [5-61 нижний — номер столбца (в отличие от обозначений, принятых в 4.23). . Целесообразность такого расположения индексов определяется следующим соглашением о суммировании: если имеется сумма п одночленных выражений, причем индекс суммирования / встречается в общем члене суммы два раза—один раз наверху, другой раз внизу,— знак суммы мы будем опускать. Например, разложение вектора х по базису {е1? еъ . . ., еп) после нашего соглашения приобретает вид x = Ve{ (знак суммирования по / опущен, но подразумевается). Выражение линейной формы / (х) через координаты вектора и коэффициенты формы принимает такой вид: f{x) = l,V. Результат применения оператора А к базисному вектору е{ принимает следующий вид: Ае{ = a[ej (подразумевается суммирование по индексу у). Координаты y\J вектора Ад: выражаются через координаты вектора х следующим образом: (подразумевается суммирование по индексу /). Величины, относящиеся к новой системе координат, мы будем обозначать теми же символами, но со штрихами при индексах. Так, новые базисные векторы мы будем обозначать через ех>, е2', . .., еп>, новые координаты вектора х — через I1', £2', ..., Ъ/1' и т. д. Элементы матрицы перехода от базиса ei к базису е^ обозначим через р\,, так что et-=Pli-et (17) (суммирование по индексу /). Коэффициенты матрицы обратного перехода обозначим через gf: ei = ql'er (18)
5.62] § 5.6. ТЕНЗОРЫ 151 (суммирование но /'). Матрица q\' обратна к матрице р[, что можно записать в виде равенства , f 0 при ьф), 111 { 1 при i =j х или равенства f 0 при i ф)\ М = , _. „ i (20) \ 1 при i =j . Для сокращения записи величину, зависящую от индексов / и у так, что она равна нулю при различных значениях индексов и единице при совпадающих значениях индексов, обозначают 6J-; таким образом, равенство (19) можно записать в виде (21) а равенство (20)- -В ?Wi виде Ml =ц, = б{:. (22) 5.62. Чтобы показать преимущества пользования новыми обозначениями, выведем заново формулы преобразования координат4 вектора, коэффициентов линейной формы и элементов матрицы оператора при переходе к новому базису. Пусть х = Ъ)(е1• — \vev. Подставляя вместо величин еи равные им величины ql-er (18), получаем x = ll'qi;ei. = li'ei: Поскольку ег—базис, £'' = #£'• (23) Это и есть формула преобразования координат вектора. Пусть дана линейная форма L (х). Числа 1Г определяются, как обычно, равенствами l., = L(er). Подставляя вместо ег выражение р\,е{ (17), получаем h = L(p\.ei)=p\.L(ei)^piidi. Итак, li>=P\>li\ (24) это и есть интересующая нас формула.
152 гл. 5. преобразования координат [5.63 Наконец, пусть дан оператор А. Элементы его матрицы в новом базисе определяются из равенств Аег - а£ег. Подставив сюда вместо ег (е^) равные им величины Pr^iiP^j) О?), получим Рг^1=4р)'^г Но ке( = a[ej, так что в результате $-<>{*/== al'-P're/. Поскольку е-—базисные векторы, pii.a{ = a{:pir. Чтобы получить отсюда я£, умножим обе части равенства на q)' и по индексу j произведем суммирование. В силу формулы (22) мы получим p\.a\q)' = a}:.p\.q)' - a[.bk^ Согласно определению величины Щ'. при суммировании по у" нужно учесть только одно слагаемое, отвечающее значению / = k'. При этом б**' — 1 и, следовательно, ai:=p',qfai. (25) Это и есть искомая формула. Нетрудно проверить, что все три полученные нами теперь формулы преобразования совпадают с формулами, полученными нами ранее обычным путем (§§ 5.3, 5.4, 5.5). Формулы (23,) (24) и (25) имеют много общего. Прежде всего, эти формулы линейны относительно преобразуемых величин. Далее, коэффициентами этих формул служат или элементы матрицы перехода от старого базиса к новому, или элементы матрицы обратного перехода, или, наконец, и те и другие. 5.63. Теперь можно перейти к определению тензора. Тензоры разделяются на ковариантные, контравириантные и смешанные. Кроме того, каждый тензор имеет определенный ранг. Начнем с определения ковариантного тензора, для определенности, третьего ранга^
5.63] § 5.6. ТЕНЗОРЫ 153 Пусть имеется правило, позволяющее в каждой системе координат л-мерного пространства К,; построить п3 чисел T;jk (составляющих), каждое из которых определяется при придании индексам /, у, k определенных значений от 1 до п. Эти числа Tijk образуют по определению ковари- антный тензор третьего ранга, если преобразование величин Tljk при переходе к новому базису производится по формуле Ti'i'k'=plp[pkk'TiJk. Аналогично определяется ковариантный тензор любого другого ранга: тензор /я-го ранга имеет не п3, а птп составляющих, и в формуле преобразования стоит не три множителя вида pj/, a m таких множителей. Коэффициенты линейной формы, которые преобразуются, как мы видели, по формуле (24), дают пример ковариант- ного тензора первого ранга. Определим теперь контравариантный тензор третьего ранга. Пусть имеется правило, позволяющее в каждой системе координат построить п3 чисел TiJk, каждое из которых определяется при придании индексам /, у, к числовых значений от 1 до /2. Эти числа T'Jk образуют по определению контр авариантный тензор третьего ранга, если преобразование величин TlJk при переходе к новому базису производится по формуле T£'i'k' = tfqj'qkk'TV>', Аналогично определяется контравариантный тензор любого другого ранга. В частности, координаты вектора х образуют контравариантный тензор первого ранга. Введенные нами термины «ковариантный) и (^контравариантный) объясняются очень простым образом. «Ковариантный > означает (изменяющийся так же/, как изменяются базисные векторы, т. е. с использованием коэффициентов р\,. (Контравариантный) означает «изменяющийся в обратном направлении/, т. е. с использованием коэффициентов <#'. Существуют еще и смешанные тензоры. Например, п3 чисел Тф заданные в каждой системе координат, образуют смешанный тензор третьего ранга, два раза ковариантный и один раз контравариантный, если преобразование этих величин при переходе к новому базису производится но
ЗАДАЧИ 155 Здесь по индексу / подразумевается суммирование; в итоге величины Tj~Tjj зависят только от индекса j. В результате свертывания снова получается тензор, ранг которого на две единицы меньше исходного. Проверим это на рассмотренном примере. Мы имеем Здесь при суммировании по индексу k достаточно ограничиться только значением k=i; поскольку 6j'=l, мы получаем Tj, = pirTi£!=p!rT/f что и требовалось. Что получится, если свернуть смешанный тензор второго ранга Т[ по его двум индексам? Величина Т= Т/уже не имеет ни одного индекса, т. е. в каждой системе координат она образует только одно число. Это число — одно и то же в любой системе координат; действительно, т = ?Li>=Mi rj=6<r';=г j = г. Такая числовая величина, не зависящая от системы координат, называется инвариантом. Следовательно, операция свертывания дает возможность получать инварианты тензоров. Например, если тензор а\, соответствующий линейному оператору А, свернуть по его индексам, то полученный инвариант ali будет следом — суммой диагональных элементов матрицы оператора А. Инвариантность этой величины была уже доказана нами другим способом (5.53). Еще пример: матрица с{- произведения двух операторов с матрицами соответственно af и Ь\ есть смешанный тензор второго ранга, который получается при свертывании тензора четвертого ранга afb[ по индексам k и /. ЗАДАЧИ 1. Вектор х £ К,; имеет относительно базиса elt е2, •••, вп координаты аъ £2» •••» £л- Как построить базис в Км, чтобы координаты вектора х относительно этого нового базиса стали равными 1, 0, 0, ... ..., О? 2. В л-мерном пространстве Кп выбран базис elt е.ъ ..., еп. Доказать, что каждое подпространство К' С К„ может быть задано как совокупность всех векторов х £ К„, координаты которых (относи-
156 ГЛ. 5. ПРЕОБРАЗОВАНИЯ КООРДИНАТ тельно базиса el9 е2, ..., еп) удовлетворяют системе уравнений вида 2 fl//5/ = 0 (i=1, 2, ..., Л). 3. (Продолжение.) Доказать, что каждая гиперплоскость НсК„ может быть задана как совокупность всех векторов .v £ K;|, координаты которых (относительно базиса еъ е2, ..., еп) удовлетворяют системе уравнений вида п 2 aijlj=bi (/=1, 2, ..., Л). 4. На плоскости выбрано три базиса; координаты вектора х относительно каждого из них равны соответственно £1э £2; 1li> Л*; Ti» тг» Дано *h = anli + ai2?2' t! = бц?! -4- 612t2; % = ctnix + fl-22|2; t2 = b2llt -f b22§2; Л = ||а|У||, B = ||ftl7||. Выразить координаты tx, т2 через координаты %, rj2. 5. Для данной линейной формы / (л;) ~ 0 в пространстве К« выбрать базис gv g.2, ..., gn так, чтобы для всякого вектора п х~ V r^g^ имело место равенство 6. Пусть оператор А, действующий в /г-мерном пространстве R, имеет /г-мерное инвариантное подпространство R'. Тогда, считая временно, что оператор А определен только в подпространстве R', мы можем построить для пего характеристический многочлен /г-й степени. Показать, что этот многочлен является делителем характеристического многочлена оператора Л, действующего во всем пространстве R. 7. Пусть X --=- Х() есть /-кратный корень уравнения с1е{||Л((,) — кЕ1\==0. Показать, что размерность т собственного подпространства #(/'о) оператора А, отвечающего корню А,0, не превышает г. 8. Показать, что величины 6/ образуют тензор второго ранга, один раз ковариаитный и один раз контравариантпый. 9. Система величин Sjj определяется в каждой системе координат путем решения системы уравнений T'*Sl7 = 6*, где T'lk — ковариаитный тензор второго ранга, причем det ![ Tik \\ ф 0. Показать, что S,,- — ковариаитный тензор второго ранга. 10. Если /,- и Z' имеют тот же смысл, что и в тексте, какоц геометрический смысл имеет свертка теняора по обоим его индексам?
ГЛАВА 6 КАНОНИЧЕСКАЯ ФОРМА МАТРИЦЫ ЛИНЕЙНОГО ОПЕРАТОРА Два оператора А и В, действующие в я-мерном пространстве К„, называются эквивалентными, если существуют такие два базиса в К„, что матрица оператора А в первом базисе совпадает с матрицей оператора В во втором базисе. Очевидно, что эквивалентные операторы определяют в пространстве K,z одинаковые по своим свойствам линейные преобразования. Но как узнать по матрицам операторов А и В в одном и том же базисе, являются ли они эквивалентными? В этой главе для данного линейного оператора А в л-мер- ном пространстве (комплексном или вещественном) мы укажем базис, в котором матрица А оператора А примет <канонический > вид — в некотором смысле наиболее простой из всех возможных. При этом канонический вид может быть получен непосредственно по элементам матрицы оператора А в произвольном базисе. И оказывается, что если операторы А и В эквивалентны, то канонический вид их матриц совпадает. Таким образом, необходимым и достаточным условием эквивалентности операторов является совпадение их канонических матриц. Мы начинаем построение с одного частного класса операторов (§ 6.1); общий случай будет рассмотрен в § 6.3. §6.1. Каноническая форма матрицы нильпотентного оператора 6.11. Линейный оператор В, действующий в я-мерном пространстве K,z, называется нильпотентным, если при некотором натуральном г выполняется равенство W = 0, иначе говоря, если Вгд:---0 при любом лг£К„. Предположим, что В — нилыютентный оператор и Вг = 0; будем считать при
158 ГЛ. 6. КАНОНИЧЕСКАЯ ФОРМА ЛИНЕЙНОГО ОПЕРАТОРА [6.11 этом, что Вг-1^0, т. е. имеются векторы х £К,п для которых ВГшт1хфО. Назовем высотой вектора х £ К„ наименьшее из чисел т, при которых Втх — 0. Все векторы х £ К„, но нашему предположению, имеют высоту ^г, причем имеются векторы с высотой, равной г. Для любого k^r обозначим через Hfe совокупность всех векторов высоты ^ k. Очевидно, Hfe есть подпространство в К„: если х £ Hk и ,у6Нл, то Влл; = 0, Bky = О, откуда при любых a g К и Р £ /С также В* (ал; 4- Р^у) — 0> так чт0 высота вектора ах + |3у не превосходит /г и ал; + Рз> 6 Hfe. Очевидно, далее, что Hr —K„ и 0 = Н0 ^ Нх ст . . . ^ НГ_Х <^ НГ = К„. Размерности этих пространств обозначим соответственно через т0 = 0 ^ ^я^^. . .^тг = п. Будем строить базис в пространстве Кп следующим образом. Как мы видели, Иг_1 не совпадает со всемК„ = Нг. Поэтому можно найти векторы /\, ..., fPi, лежащие в Нг и линейно независимые над Нг_1 (2.44) (p1 = mr — /«r_i). Векторы B/l5 ..., B/Pi лежат в Hr-1 и линейно независимы над Нг_2: действительно, если бы мы имели \ъ/г + . . . + cPlB/Pi = g£ Hr_2, то, применяя ВГ~2, мы получили бы, что c1B-1/1+...+cPiB-1/Pi^0, или, что то же, Ci/i+...+cPi/p.€H'-\ что по построению не имеет места. Отсюда видно, что размерность тг_1 — /яг_2 пространства Ыг_г над Нг_2 равна или больше размерности тг — тг_1 пространства Нг над Нг_1. Дополним векторы B/l5 . . ., B/Pl векторами fPl + \, •••, fPi в Hr-1 до максимальной системы, линейно независимой над Нг-2 {Р2 = mr-i — mr-2l- Применяя ко всем этим векторам оператор В, получаем векторы в Нг_2 в2Л, .... в%,, в/Р1+1, ..., в/р„ линейно независимые над Нг_3, что доказывается аналогично предыдущему. Отсюда тг_2—тг_3^тг_1 — тг_2, и можно построить в пространстве Нг_2 векторы /P2_|_i, ..., /Рз, образующие вместе с предыдущими полную систему, линейно независимую над Нг_3.
6ЛЗ) § 6.1. ФОРМА НИЛЬПОТЕНТНОГО ОПЕРАТОРА 159 Переходя таким же образом в подпространства Нг_3, . . . ..., Н0 — (0), мы и получаем, в конце концов, полную систему п линейно независимых векторов. 6.12. Полученную систему векторов можно записать в таблицу /i> • • • > Ipx > B/i,...,B /Pt, /Pl+i,..., fPif B-1/!, ...,B-yPi,B-2/Pl+1, ...,B-%2, ... Векторы, стоящие в первой строке таблицы, имеют высоту г, векторы следующей строки — высоту г—1 и т. д.; векторы последней строки имеют высоту 1, т. е. оператором В переводятся в 0. Каждый столбец таблицы определяет инвариантное подпространство оператора В; первые рг инвариантных подпространств имеют размерность г (каждое), следующие Рч—Pi подпространств — размерность г—1 (каждое) и т. д. Последние (одноэлементные) столбцы определяют одномерные инвариантные подпространства. Все пространство К„ есть прямая сумма рг указанных подпространств. 6.13. Напишем матрицу оператора В в подпространстве, определяемом векторами первого столбца. В качестве базиса возьмем векторы Br~1f1, Br~2/Il ..., B/l5 /x; в таком порядке они располагаются по возрастанию высоты. В этой записи первый вектор базиса оператором В переводится в 0, второй — в первый, . .., г-н переводится в (г—1)-й: поэтому матрица оператора В согласно 4.23 содержит по г строк и столбцов и имеет вид 10 10 0 0 1 0 0 0 | 0 0 0 . . . 0 0 1 ..00 . . 0 1 ... о о ||
160 ГЛ. 6. КАНОНИЧЕСКАЯ ФОРМА ЛИНЕЙНОГО ОПЕРАТОРА [6.14 с отличными от нуля элементами, именно, равными 1, над главной диагональю. Аналогичный вид имеет матрица оператора В в остальных инвариантных подпространствах, соответствующих остальным столбцам таблицы; отличие от матрицы (1) может состоять лишь в числе строк и столбцов. 6.14. Матрица оператора В во всем пространстве К„ будет квазидиагональной (-4.52) с указанными блоками на диагонали: В = 0 10. 00 1. 000 . 000 . ..0 0 ..00 ..0 1 ..00 0 10. 0 0 1. 00 0. 0 0 0. .00 .00 ..0 1 .00 !о 1 0 0 0 •(2) Число блоков размера г равно ръ число блоков размера г—1 равно р2—ръ ..., число блоков размера 2 равно рг_г—рг_2> число блоков размера 1 равно pr—pr_i- Разумеется, если для некоторого j мы имеем pr_J + 1 = pr„j, то в матрице (2) блоков размера j не будет вовсе.
6.21] § 6.2. алгебры; алгебра многочленов 161 § 6.2. Алгебры; алгебра многочленов от одного переменного 6.21. Приведем некоторые определения из теории алгебр. Линейное пространство К над числовым полем К называется алгеброй (точнее, алгеброй над К), если в К установлена операция умножения, приводящая в соответствие каждой паре элементов х, у из К элемент z £ К (обозначаемый Х'у или ху) и удовлетворяющая следующим условиям: 1) а (ху) = (ах) у = х (ау) для любых х и у из К и а £ К\ 2) (xy)z = x(yz) для любых х, у, z из К (ассоциативный закон); 3) (х +у) z = xz+yz для любых х, у, z из К (дистрибутивный закон). Вообще говоря, умножение может не быть коммутативным, так что хуФух. Если умножение коммутативно, т.е. выполнено условие 4) ху=ух для любых х и у из К, то алгебра К называется коммутативной. Пусть 0 есть нуль-вектор пространства К. Тогда для любого х£ К 0-л::=(0 + 0)л: = 0-л;+0.л;, откуда следует, что 0-л; = 0. Элемент е£К называется левой единицей, если ех = х для любого х £ К; правой единицей, если хе = х для любого х £ К; двусторонней единицей, или просто единицей в К, если ех = хе = х для любого х g К. Элемент х £ К называется левым обратным к элементу у £ К, если .эту есть единица алгебры К; в этом случае^ называется правым обратным к х. Если элемент z обладает и левым и правым обратными, то они могут быть лишь единственными и совпадают друг с другом (ср. 4.76а). Элемент z называется в этом случае обратимым, ему обратный обозначается через z'1. Произведение zu обратимого элемента z и обратимого элемента и есть обратимый элемент с обратным u~1z~1. Если элемент и обратим, то уравнение ux — v имеет решение х — u~xv\ поскольку оно получается из самого уравнения 6 Г. Е. Шилов
162 ГЛ. 6. КАНОНИЧЕСКАЯ ФОРМА ЛИНЕЙНОГО ОПЕРАТОРА [6.22 умножением на и *, оно единственно. В коммутативном случае употребляют запись х = — или x — v\u\ этот элемент называют частным элементов v и и. Для частных справедливы обычные арифметические правила действий: -)—- = -i-^ v—t (если их и и2 обратимы); их ш U2 UiU-2 (если их и */2 обратимы); (если uv u2, v2 обратимы), доказательства которых мы предоставляем читателю. Алгебра К по определению имеет размерность п, если эту размерность п имеет соответствующее линейное пространство К. 6.22. Пример ы. а. В любом линейном пространстве К положим х*у = О для любых х£К, у£ К. Мы получим алгебру. Такая алгебра называется тривиальной. б. Примером нетривиальной коммутативной алгебры над полем К является совокупность П всех многочленов с коэффициентами из К, с обычными операциями сложения и умножения. В этой алгебре есть единица, именно, многочлен е(%), у которого л0--1, а остальные коэффициенты равны 0. р. Линейное пространство L (К„) из всех матриц п-го порядка с элементами из К с обычным матричным умножением дает пример конечномерной некоммутативной алгебры размерности п2 (4.736). Эта алгебра обладает единицей, которой является единичная матрица Е. г. Более общим примером некоммутативной алгебры с единицей является линейное пространство В (К) всех линейных операторов, действующих в линейном пространстве К, с обычным для операторов действием умножения (4.33). 6.23а. Пространство LcK называется подалгеброй алгебры К, если из х £ Ь, .у € L следует xy£L. Подпро-
6-24l § 6.2. алгебры; алгебра многочленов 163 странство Lc К называется правым идеалом в К, если из *€L, у £ К следует ху £ L, и левым идеалом в К, если из *£L, y£K следует yx£L. Идеал, одновременно левый и правый, называется двусторонним идеалом. В коммутативной алгебре нет различия между левыми, правыми и двусторонними идеалами. Во всякой алгебре К. имеются два очевидных двусторонних идеала: один, обозначаемый (0),— состоящий из единственного элемента 0, второй — состоящий из всех элементов х g К. Все остальные идеалы, односторонние и двусторонние, называются собственными идеалами. Всякий идеал есть подалгебра; обратное, вообще говоря, несправедливо. Так, совокупность всех многочленов Р(^), удовлетворяющих условию Р(0) = Р(1), есть подалгебра алгебры П, не являющаяся идеалом. Совокупность всех многочленов Р(Х), удовлетворяющих условию Р (0) — 0, есть собственный идеал в алгебре П. б. Пусть LcK есть подпространство в алгебре К. Рассмотрим фактор-пространство K/L (2.48), т. е. линейное пространство из классов X элементов х £ К, взаимно сравнимых относительно подпространства L. Если L — двусторонний идеал в К, то для классов X £ K/L, кроме линейных операций, можно ввести операцию умножения. Именно, имея классы X и Y, выберем произвольно элементы дг£Х, y£Y и под произведением XY будем понимать класс, содержащий произведение ху. Проверим однозначность этого определения. Если в классе X мы возьмем элемент х', а в классе Y элемент у', то мы будем иметь х'у' — ху = х' (у'—у)-\~ (х' — х)у; этот элемент лежит в идеале L вместе с у'—у и х' — X. Из условий 6.21, 1) — 3), выполненных в алгебре К, немедленно следует выполнение аналогичных условий для классов Х£К/Ь; поэтому фактор-пространство K/L с введенным в нем умножением является также алгеброй. Алгебра K/L называется фактор-алгеброй алгебры К по двустороннему идеалу L. Очевидно, она коммутативна, если коммутативна алгебра К. 6.24. Пусть имеются две алгебры К' и К" над полем /С. Морфизм со линейного пространства К' в пространство К* (2.71) называется морфизмом алгебры К' в алгебру К", если 6*
164 ГЛ. 6. КАНОНИЧЕСКАЯ ФОРМА ЛИНЕЙНОГО ОПЕРАТОРА [6.25 наряду с условиями морфизма пространств (2.71) а) со (х' +у') = со (х') + со (у') для любых х\ у' g К', б) со (ах') = асо (х') для любого х' £ К' и любого а£К выполняется также условие в) со (х'-у') = со (л;')-со (у') для любых л;', УёК'. Если морфизм со есть эпиморфизм или мономорфизм, или изоморфизм пространства К' в пространство К" (2.71), то при выполнении условия в) он соответственно называется эпиморфизмом, мономорфизмом, изоморфизмом алгебры К' в алгебру К". 6.25. Приме ры. а. Пусть L—подалгебра алгебры К. Отображение со, которое каждому вектору х £ L ставит в соответствие этот же вектор х в алгебре К, есть морфизм алгебры L в алгебру К, и именно мономорфизм. Как и в аналогичном случае в 2.72, этот мономорфизм называется вложением L в К. б. Пусть L — двусторонний идеал алгебры К и K/L —■ соответствующая фактор-алгебра (6.236). Отображение со, которое каждому вектору х £ К ставит в соответствие класс XgK/L, содержащий элемент х, есть морфизм алгебры К в алгебру K/L, и именно эпиморфизм. Как и в аналогичном случае в 2.726, этот эпиморфизм называется каноническим отображением К на K/L. в. Пусть имеется мономорфизм со алгебры К' в алгебру К". Совокупность всех векторов со(д;')£К" есть подалгебра L"аК"', и мономорфизм со есть изоморфизм алгебры К' в алгебру L". г. Пусть имеется морфизм со алгебры К' в алгебру К". Покажем, что совокупность L' всех векторов х' £К', для которых со (л;') —0, есть двусторонний идеал алгебры К'. Действительно, L' есть подпространство в К' (2.766); далее, если Jt'gL', /еК', то со (лЛ/) = со (*') •(!)(/) = О, так что х'-у' £ L' и аналогично y'-x'^U, что и требовалось. Далее, мономорфизм Я пространства К!/V в пространство К", ставящий в соответствие каждому классу X' g K/V элемент со (л;'), х' gX' (2.766), в данном случае есть мономорфизм алгебры K'/L' в алгебру К". Действительно, выбирая х' £Х', /6 Г, мы имеем *'/£ Х'У и Q (Х'У) = со (*'/) - со (*') X
6.25] § 6.2. алгебры; алгебра многочленов 165 XG) (у') = Q (X') Q (Y'). В частности, если морфизм о> есть эпиморфизм алгебры К' в алгебру К", то морфизм Q есть изоморфизм алгебры K/Lf с алгеброй К". д. Пусть А — линейный оператор, действующий в пространстве К. Так как для линейных операторов в пространстве К определены операции сложения и умножения, то т каждому многочлену Р (X) = V акХк £ П мы можем поставить /5 = 0 в соответствие оператор т k = o действующий в том же пространстве К. При этом соответствии сложению и умножению многочленов отвечает сложение и умножение соответствующих операторов в смысле § 4.3. В самом деле, пусть т m m р (К)=рх (К)+р2 (X) = ^ а^к + 2 ьк%* = 2 («*+**) **; Л = 0 Л = 0 & = 0 тогда m m m ^(А)= 2 («* + »*)А*= 2 «*А*+ 2 »*А*=/>1(А)+/>а(А). £=0 Л=0 А = 0 Аналогично пусть m m mm q (К) = px (X) />2 (X) = ^ «**■* 2 biy = 22 fl**A*+/; /г = 0 /=0 k = 0 /=0 тогд.а по распределительному закону для операторов (4.33) mm mm Q(A)= 2 2 «**/*+'= 2 a*A* 2 */a>=p1(A)p2(A). Л = 0 /=0 & = 0 /=0 В частности, операторы Р(А) и Q(A) всегда коммутативны, каковы бы ни были многочлены Р(к) и Q(K). Мы получили морфизм алгебры многочленов П (6.226) в алгебру линейных операторов В (К) (6.22г). Вообще говоря, этот морфизм не есть эпиморфизм (хотя бы потому, что операторы вида Р (А) коммутируют друг с другом, а вся алгебра В (К), за исключением тривиального случая К = К1, некоммутативна).
166 ГЛ. 6. КАНОНИЧЕСКАЯ ФОРМА ЛИНЕЙНОГО ОПЕРАТОРА [6.26 е. Существует изоморфизм между алгеброй В (Кп) всех линейных операторов, действующих в пространстве Кп, и алгеброй L (Кп) всех матриц п-\о порядка с элементами из поля К; мы осуществляем его, фиксируя в пространстве Кп базис е1} . .., еп и ставя в соответствие каждому оператору А £ В (Кп) его матрицу в этом базисе. Обе эти алгебры имеют одинаковую размерность п2. 6.26. В коммутативной алгебре П всех многочленов Р{Х) с коэффициентами из поля К (6.226) совокупность всех многочленов вида P(X)Q0(X), где Q0(X)—фиксированный многочлен, а Р(X)— любой многочлен, очевидно, является идеалом. Мы покажем, что каждый идеал 1=^0 алгебры П имеет такую структуру, т. е. получается из некоторого многочлена Qo (M умножением на любой многочлен Р(Х). Для доказательства найдем в идеале / отличный от 0 многочлен наименьшей возможной степени, например q, и обозначим его через Q0{X). Мы утверждаем теперь, что любой многочлен Q(X)£I имеет вид P(X)Q0(X), где Р(Х)£П. Действительно, по правилу действий с многочленами*) можно написать Q(X)^P(X)Q0(X) + R(X), (3) где Р(Х)— частное от деления Q (X) на Q0(X), a R (X) — остаток, имеющий степень, меньшую степени делителя, т. е. меньшую, чем число q. Многочлены Q (X) и Q0 (X) принадлежат идеалу /. Но тогда, как видно из равенства (3), и многочлен R (X) принадлежит идеалу /. Так как степень R {X) меньше q, а многочлен Q0 (X) в идеале имеет наименьшую возможную степень q среди многочленов, отличных от 0, то R {X) = 0, что и утверждалось. Многочлен Q0 (X) называется порождающим идеал /. 6.27. Многочлен Q0 (X) определяется идеалом I единственным образом с точностью до числового множителя. Действительно, если бы наряду с С?0 (X) тем же свойством *) См., например, А. Г. К у р о ш, Курс высшей алгебры, «Наука»» 1965, гл. 5.
6.31] § 6.3. ФОРМА ПРОИЗВОЛЬНОГО ОПЕРАТОРА 167 обладал многочлен Qt(X), то, по доказанному, мы имели бы Q1(l) = P1('k)Q0(X), Qofr) = P0(b.)Q1{b). Из этих равенств вытекает, что степени многочленов Ql (X) и Q0 (X) одинаковы и что Рх (к) и Р0 (X) не содержат X, т. е. являются числами; это и утверждалось. 6.28. Пусть имеются многочлены Qx (X), ...tQm(X), не все равные 0 и не имеющие общего делителя степени ^ 1. Покажем, что существуют такие многочлены РЧ(Х), ... ..., Р°т(Ь), ЧТО Действительно, пусть /—совокупность всех многочленов вида P1(X)Q1(X)+...+Pm(X)Qm(X) при любых Рх (X), . . ., Рт (X) из П. Очевидно, совокупность / есть идеал в П. По 6.26 идеал / порожден одним многочленом т QoM=2PlMQk{b)- (5) При этом, в частности, Q, (X) = S, (X) Q0 (Я), ..., Qm (X) = Sm (X) Q0 (X), где Sx (X), .. . ,£,л (X) — некоторые многочлены. Эти равенства показывают, что С?0 (X) есть общий делитель многочленов Qi(X), ..., Qm(X). Но тогда из предположения следует, что степень многочлена С?0 (X) равна 0, т. е. что С?0 (X) есть постоянная а0. При этом а0фО, так как иначе /--0. Умножая (5) на 1/«0, получаем (4), что и требуется. § 6.3. Каноническая форма матрицы произвольного оператора 6.31. Рассмотрим линейный оператор А в л-мерном пространстве К„. Указанное в 6.25д отображение со (Р {X)) = Р (А) есть эпиморфизм (6.23) алгебры П всех многочленов с коэффициентами из поля К в алгебру Пд линейных операторов вида
168 ГЛ. 6. КАНОНИЧЕСКАЯ ФОРМА ЛИНЕЙНОГО ОПЕРАТОРА [6.32 Я (А) в пространстве К„. В силу 6.25 г алгебра Пд изоморфна фактор-алгебре П/7, где /—идеал, состоящий из всех многочленов Р (X), для которых (о (Р (X)) — Р (А) — 0. Мы выясним сейчас структуру этого идеала. 6.32. В 6.22 мы видели, что совокупность всех линейных операторов, действующих в пространстве К„, представляет собой снова алгебру над тем же полем К, размерности л2. Фиксируя оператор А, рассмотрим последовательность операторов В этой последовательности первые п2-\- 1 членов линейно зависимы. Пусть, например, т ^ ckAk = 0 (m^n2). Это означает, что в установленном выше соответствии (6.31) т многочлену Q (X) — V ckXk соответствует нулевой оператор. k = 0 Всякий многочлен Q(X), для которого оператор Q(A) есть нулевой оператор, будем называть аннулирующим многочленом оператора А. Мы доказали, что у всякого оператора А есть аннулирующий многочлен степени ^ п2. 6.33. Совокупность всех аннулирующих многочленов оператора А есть идеал в алгебре П. В силу 6.26 имеется многочлен Q0(X), определенный с точностью до множителя, такой, что все аннулирующие многочлены имеют вид P(X)Q0(X), где Р(X)—любой многочлен из П. В частности, Q0 (X) сам является аннулирующим многочленом. Среди всех аннулирующих многочленов он имеет наименьшую степень и поэтому называется минимальным аннулирующим многочленом для оператора А. 6.34. Т е о р е м а. Пусть аннулирующий многочлен Q (X) оператора А разложен в произведение двух взаимно простых множителей: Q(X) = Q1(X)Q2(X).
6.34] § 6.3. ФОРМА ПРОИЗВОЛЬНОГО ОПЕРАТОРА 169 Тогда пространство К„ можно разложить в прямую сумму двух подпространств, К„ = Т\ + Т2, инвариантных относительно оператора А [так что АТ^сТ^ AT2czT2), причем для любых хх £ Tl5 л:2 £ T2 Q1(A)x2^0, Q2(A)x1^0) та/с что Qx (Я,) [Q2 (X)] есть аннулирующий многочлен для оператора А, действующего в подпространстве Т1[Т2]. Доказательство. В силу 6.28 существуют такие многочлены Рг{Х) и Р2(Х), что Используя морфизм 6.25д, находим P1(A)Q1(A) + P2(A)Q2(A)^E. Обозначим через ТЛ (Л = 1,2) область значений оператора Qk (А), т. е. совокупность векторов вида Qk (A) х, x £ К„ {4.61). Очевидно, из j/ = Qfe (A) x £ ТЛ следует А^у =■- Qfe (А) Ад; £ ТЛ, так что подпространство Tk инвариантно относительно оператора А. Мы имеем для любого хх £ Тх и некоторого _у £ Kn Q2 (А) хг = Q2 (A) Qx (A)y = Q (А)у = О, и аналогично для любого х2 £ Т2 и некоторого г £ Kn Q1(A)^2 = Q1(A)Q2(A)2r=Q(A)2r = 0. Далее, для любого х £Кп имеет место равенство * = (?! (А) Рх (А) д:+ Q2 (A) P2 (A) x = хх + х2, где xk = Qk(A) Pk(A) х £Tk(k=], 2), оно показывает, что подпространства Т1 и Т2 в сумме дают все К„. Пусть х0£Т1Г[Т2. Тогда Qx (A) x0 = Q2(A) *0 = 0 и, Следовательно, д:0 = Рг (A) Q, (А) х0 + Р2 (A) Q2 (А) х0 = 0.
170 ГЛ. 6. КАНОНИЧЕСКАЯ ФОРМА ЛИНЕЙНОГО ОПЕРАТОРА [6.35 Таким образом, T1f|T2^-0 и сумма К„ = Т1 + Т2 — прямая. Разумеется, не исключена возможность, что одно из подпространств Tj, To состоит только из одного нулевого вектора. 6.35. 3 а м е ч а н и е. По построению оператор Qx (А) аннулирует подпространство Т2, а оператор Q2 (А) аннулирует подпространство Тх. Покажем, что всякий вектор х, аннулируемый оператором Qr (А), лежит в Т2 и всякий вектор х, аннулируемый оператором Q2{А), лежит в Tj.Пусть Q1(A)x = 0. Мы имеем х = хх--х2, где хх £ Tl5 х2 £ Т2. Так как Ql(A)x2 = 01 то и Q1(A)xl^Ql(A)x — Ql(A)xl = 0". Но и Q2(A)x1 = 09 поскольку ^i6^i- Следовательно, хх = Рг (A) Qx (А) хх + + Р2 (A) Q2 (A) xi -= 0, х = х2 £ Т2. Аналогично из Q2 (А) л: = О следует л*£Ть что и утверждалось. 6.36. Разлагая многочлены Qx (X) и Q2 (X) далее на взаимно простые множители, получаем возможность разбивать пространство Кп на более мелкие инвариантные относительно оператора А подпространства, аннулируемые соответствующими множителями многочленов Qx (К) и Q2{'k). Пусть многочлен Р (К) допускает в поле К разложение вида m жм = п (*-*/'. (в) y' = i где %j — все (различные) корни многочлена, а гу.—их кратности. Такое разложение всегда возможно, в частности, в поле С комплексных чисел. Разложение (6) есть разложение на m попарно взаимно простых множителей (X — KjYj. Применяя результат 6.34, получаем следующее утверждение: Теорема. Если аннулирующий многочлен оператора А имеет вид (6), то пространство Кп разлагается в прямую сумму m подпространств Тх, . . ., Т/л, инвариантных относительно оператора А, причем подпространство Tk аннулируется оператором В&', где Вл-А — ХкЕ. 6.37. В каждом ненулевом пространстве Tft, согласно 6.14у можно выбрать базис, в котором матрица оператора Bk (по построению нильпотентного в пространстве Tk) примет канонический вид (2). В этом же базисе матрица оператора
6.37] § 6.3. ФОРМА ПРОИЗВОЛЬНОГО ОПЕРАТОРА 171 A = Bk-\-XkE примет вид К 1 о . 0 %k 1 . 0 0 0. 0 0 0. ..0 0 ..0 0 ■ • К 1 К 1 о . 0 кк 1 . 0 0 0. 0 0 0. .00 .00 ■ ■К 1 . . 0 Кк \ К (7) Матрица оператора А во всем пространстве Кп = Т1~ . . . -\-Тт в базисе, который получается объединением всех канонических базисов, построенных в пространствах Тх, .... Тт, приобретает окончательную форму 1^1 ... 0 о хг... о 7(A) 0 0 ... 1 0 0... А,! К 1 ох, . о . о о о . о о . . А,, *i \К 1 • о хт. 0 0. 0 0. 1 .. 0 .. 0 .. 1 (8)
172 ГЛ. 6. КАНОНИЧЕСКАЯ ФОРМА ЛИНЕЙНОГО ОПЕРАТОРА [6.41 Формулируем окончательный результат: Теорема. Для любого оператора А в n-мерном пространстве К„, имеющего аннулирующий многочлен вида (6) (в частности, для любого оператора А в n-мерном комплексном пространстве CJ, существует базис, в котором матрица оператора А записывается в форме (8). Матрица (8) называется нормальной формой Жордана оператора А, а соответствующий базис — базисом Жордана. В случае К„ — Сп комплексные числа Хи . .., Хт можно упорядочить по какому-либо правилу: например, в порядке возрастания модулей, а при равных модулях — в порядке возрастания аргумента G, меняющегося в промежутке 0^6 < 2я. Для оператора А, действующего в пространстве КпфСпУ представление (8) возможно не всегда. Мы рассмотрим в § 6.6 каноническую форму матрицы оператора А, действующего в пространстве KW = R/Z. § 6.4. Элементарные делители 6.41. Матрицу (8) можно задать таблицей К "i1'- ■■-, пм \ %2; п<?\ ..., пЫ I ^ ^ д w ^ ^ л(*, j ^ до в которой для каждого диагонального числа %k указаны размеры п^\ ..., п^г) ^соответствующих «элементарных жордановых клеток» вида \К i о oa,fci 0 0 0 1 0 0 0 ... 0 ... 0 ... 1 • •• к встречающихся в матрице (8). Мы хотим выяснить, как построить таблицу (9) и тем самым восстановить вид матрицы J (А) оператора А по известной его матрице Л в каком-либо базисе пространства К„. j> nSp строк, (Ю)
6.43] § 6.4. ЭЛЕМЕНТАРНЫЕ ДЕЛИТЕЛИ 173 6.42. Как мы знаем (5.53), характеристический многочлен оператора А не зависит от выбора базиса. Составим его для жорданова базиса; так как под главной диагональю стоят нули, мы получаем det(A — XE) = dei\\J(A) — ХЕ \\ = к=\ Мы видим, что числа Xk суть корни характеристического многочлена, а суммы гк = n[k) + • • • + n{rk) — их кратности. Таким образом, вычисляя характеристический многочлен (что можно сделать по матрице А) и находя его корни, мы получаем величины Xk и rk = n{k) -f- .. . -(- nS^ таблицы (9). 6.43. Далее (здесь и в 6.44) мы укажем, как по матрице А оператора А в исходном базисе вычислить сами числа n{jk). Поскольку J (А) и А — матрицы одного и того же оператора А, взятого в разных базисах, согласно 5.51 справедливо равенство У(А) = Т"МГ, где Т—невырожденная матрица. Поэтому и J(A) — XE=T~1 (А — ХЕ) Т. Миноры фиксированного, например р-го, порядка матрицы А—ХЕ представляют собой некоторые многочлены от X степени ^р. Обозначим через / (А) идеал в алгебре П, порожденный всеми этими минорами. Аналогичный смысл имеет идеал Ip(J(A)). Покажем, что эти идеалы совпадают. Действительно, каждый минор р-го порядка матрицы J (А) — ХЕ согласно 4.54 является суммой произведений миноров р-го порядка матриц А — ХЕ, 7"1 и Т. Но элементы матриц Т и Т"1 суть числа; таким образом, всякий минор р-го порядка матрицы J (А) — ХЕ есть просто линейная комбинация миноров р-го порядка матрицы А — ХЕ и тем самым входит в идеал 1р(А). По симметрии каждый минор р-го порядка матрицы А — ХЕ входит в идеал / (У(А)). Тем самым / (А) = = /я(/(А)), что и утверждалось. Пусть D (X) — порождающий многочлен этого идеала; он может быть определен как общий наибольший делитель
174 ГЛ. 6. КАНОНИЧЕСКАЯ ФОРМА ЛИНКЙНОГО ОПЕРАТОРА [6-43 многочленов, порождающих идеал / (А) (6.26). Таким образом, наибольший общий делитель миноров p-vo порядка у матрицы J (А) — ХЕ тот же, что и у миноров р-го порядка матрицы А — ХЕ, и поэтому может считаться известным. Вычислим непосредственно наибольший общий делитель миноров /;-го порядка матрицы J (A) — ХЕ. Опять-таки вместо матрицы J (А) — ХЕ при этом можно рассматривать матрицу вида P(J(A) — XE)Q, где Р и Q — обратимые числовые матрицы (не содержащие X). Операции перестановок строк, столбцов, прибавления к одному столбцу другого с произвольным множителем в матрице ./(А) — ХЕ приводят как раз к такого рода матрицам (4.44). Мы утверждаем, что элементарную клетку Хк — Х 1 0 . 0 Хк — X 1 . 0 0 0. 0 0 0. 0 0 1 .. Хк- указанными операциями можно преобразовать к виду (*> и (*) строк. (12) А именно, для получения требуемого результата следует вначале из второй строки вычесть первую, умноженную на Xk — X, из третьей — вторую, умноженную на Xk — X, и т. д.; (А>) мы получим матрицу {р = пу}) Xk-X -(Х,-Х)« 1 0 0 1 (—\)р-2(Хк — Х)Р~1 0 0 ... 1 (—))!'-1(Хк — Х)Р 0 0 ... 0 Если теперь из первого столбца вычесть второй, умноженный на Xk — л, затем третий, умноженный на — (Хк — а)2, ... . . ., (р— 1)-й, умноженный на (— \)г~2 (Хк — а)^"1, мы получим
6.43] § 6.4. ЭЛЕМЕНТАРНЫЕ ДЕЛИТЕЛИ 175 матрицу 1 О О 1 О О к)г О О (13) (-1К_1(А/г из которой матрица (12) получается перестановкой столбцов. Теперь подсчитаем общий наибольший делитель миноров р-го порядка у матрицы J (К) с клетками вида (12) на главной диагонали. Так как у этой матрицы вне главной диагонали стоят нули, то отличными от нуля могут быть лишь миноры с одинаковым набором номеров строк и столбцов; такой минор равен произведению своих диагональных элементов. В матрице J (к) среди элементов на главной диагонали имеется некоторое число, положим N, биномов вида а остальные п — N элементов главной диагонали равны 1. Число N есть полное число жордановых клеток в матрице J (А), т. е. N--rl-\- . . . -\-rtn. С другой стороны, среди миноров до порядка п — N заведомо имеются равные 1, откуда следует, что D (к) ^ 1 при р^п — ЛЛ Можно заменить матрицу J (X) более простой диагональной матрицей Л(1) {kk-k)ni /(*) = (*1-м .(1) (К-Ъ)п (9) (К-*) Am) тогда многочлен Dp(k), сосчитанный для матрицы J (к), будет совпадать с многочленом Dv _ (п_А)(к), сосчитанным для матрицы J (к). Очевидно, наибольший общий делитель
176 ГЛ. 6. КАНОНИЧЕСКАЯ ФОРМА ЛИНЕЙНОГО ОПЕРАТОРА [6.44 миноров р-го порядка матрицы I(X) имеет вид т Д,М = П(л,—ХГЛ''), (14) где rrij^O. Спрашивается, каково значение, например, показателя т1(р). Эта величина есть наименьший показатель, с которым К1 — X входит во все миноры р-го порядка. Пели p^/z(2)-f- ... -\-п{т\ то имеется минор р-го порядка, не содержащий вообще К1 — Я, так что при этих р мы имеем т1(р) = 0. Дляр = /2(2)+ ••• -\-п{т)-\-\, учитывая, что по- казатели п^,..., п^ идут в убывающем порядке, мы имеем В дальнейшем на каждую единицу увеличения р показатель т1(р) будет увеличиваться соответственно на л^1р ^г'-г» *• » наконе1*> ПРИ Р = п мы получим т1{р)^п[^+ ... +/|П>. Аналогично, mj(p) = n^+ ...+п^ (1<у<т). 6.44. Отношение Е (X) = ,.ч называется элементар- У Dp \К) ным делителем оператора А; вместе с многочленами D (К) элементарные делители не зависят от выбора базиса, и их можно вычислять по матрице оператора А в любом базисе. Из сказанного в 6.43 видно, что элементарные делители имеют вид m 0) с корнями, кратности которых равны размерам (последовательных) жордановых клеток. Таким образом, вычислив эле-
6.45] § 6.4. элементарные делители 177 ментарные делители, мы получаем числа /г(/) и тем самым решаем задачу, поставленную в 6.43. 6.45. Приме ры. а. У жордановой матрицы 10-го порядка 1 1 О О 1 1 О 0 1 1 1 О 1 2 1 О 2 2 1 О 2 имеются три клетки, отвечающие корню Я,1=1, размеров две клетки, отвечающие корню Х2 — 2, раз- 3, 2 и 1 меров 2 значения поэтому элементарные делители имеют E9Ck) = (\-k)s(2-\)*, Ев(Х) = (\-\)*(2-%)\ Еч{\)=\-к, £,(Х)=...=£1(Х)=1. б. У некоторой матрицы Л = ||а/7г|| 10-го порядка элементарные делители (вычисленные, как указано в 6.43 и 6.44, по минорам матрицы А—ХЕ) оказались равными £9(Х) = (3-Х)*(4-Х)3, £8(Х) = (3-Х)8(4-Я,), £,(%) = 4 Е6 (к) = 4 К = Е1(Ь) = \.
178 ГЛ. 6. КАНОНИЧЕСКАЯ ФОРМА ЛИНЕЙНОГО ОПЕРАТОРА [6.46 Напишем выражение матрицы У (А). В соответствии с результатом 6.44 матрица У (А) имеет две клетки, отвечающие корню Х1 = 3, размеров 2 и 2, и четыре клетки, отвечающие корню Х2 — 4, размеров 3, 1, 1, 1. Таким образом, мы имеем /(А) = 3 1 О 3 3 1 О 3 4 1 4 1 4 4 4 6.46. Итак, зная элементарные делители оператора А, мы можем определить все величины nf\ а вместе с ними—■ структуру жордановой матрицы оператора А. В частности, мы видим, что жорданова матрица оператора А определяется однозначно самим оператором А. С другой стороны, поскольку элементарные делители оператора А определяются через миноры матрицы А—ХЕ в любом базисе, два эквивалентных оператора А и В, т. е. имеющих в двух (разных) базисах одну и ту же матрицу, имеют одну и ту же каноническую жорданову форму. Очевидно и обратное: если два оператора имеют одну и ту же каноническую форму, то они эквивалентны. Тем самым проблема эквивалентности линейных операторов (в комплексном пространстве), поставленная в начале этой главы, полностью решена.
6.52) § 6.5. НЕКОТОРЫЕ СЛЕДСТВИЯ 179 § 6.5. Некоторые следствия 6.51. Если известно, что оператор А приводится к диагональному виду, т. е. его матрица в некотором базисе имеет вид a-i то матрица Л и есть жорданова матрица оператора А (все жордановы клетки имеют размер 1). В частности, все элементарные делители имеют простые корни. Обратно, если все элементарные делители некоторого оператора А имеют только простые корни, жорданова матрица У (А) имеет клетки только размера 1 и, следовательно, диагональна. 6.52. Имея жорданову форму оператора А, можно написать его минимальный аннулирующий многочлен. Пусть оператор В в некотором базисе ег, .. . , ер имеет матрицу 0 1 0 0 0 1 | 0 0 0 0 0 0 ... 0 0 ...0 0 ...0 1 ..0 0 Это означает, что Вех = 0, Ве2 — еъ ... откуда следует, что В?х = 0 при любом х = \ckek. Та B^ = Vi» КИМ
180 ГЛ. 6. КАНОНИЧЕСКАЯ ФОРМА ЛИНЕЙНОГО ОПЕРАТОРА [6.52 образом, аннулирующий многочлен оператора В имеет вид №. Минимальный аннулирующий многочлен, как делитель №, должен иметь вид Х'л, т^.р\ но поскольку ВР'1ер = ехФ 0, мы видим, что %р и есть минимальный аннулирующий многочлен. Пусть оператор А в том же базисе еъ .. матрицу е имеет К 1 о 0 Х0 1 0 0 0 0 0 0. ..0 0 ...0 0 • ■и .. 0 Х0 так что A = B-f^0E. По доказанному (А — ХоЕ)р=Вр = 0, так что для оператора А аннулирующим многочленом является (К0 — К)Р; он является и минимальным в силу той же аргументации. Пусть оператор А имеет матрицу к 1 0 %п 0 0 0 0 0 . 1 . ^о • 0 . .. 0 1 .. 0 .. о • V \ %0 1 . о К . 0 0. .. 0 .. 0 • • ^0 причем числа p1^p27^ • • • 7^РГ СУТЬ Разм^ры ее диагональных клеток. Многочлен Q(X), аннулирующий оператор А, должен по отдельности аннулировать каждую его клетку (ср. 4.52). Этим свойством обладает многочлен (Х0 — Х)р1. По указанным выше причинам он является и минимальным аннулирующим многочленом. Наконец, в общем случае, когда оператор А обладает жордановой матрицей с таблицей *i; л!Х)> ^Х)> 5^ UPi » К\ п[г > П(от) >
6.61] § 6.6. ВЕЩЕСТВЕННАЯ ЖОРДАНОВА ФОРМА 181 аннулирующим многочленом является многочлен т , <?(*.)= П(Ь*-Ь) 1 • (15) k=l Он является и минимальным аннулирующим многочленом оператора А, так как ни один из показателей n[k) не может быть здесь понижен по указанным выше соображениям. Итак, минимальный аннулирующий многочлен матрицы А есть многочлен (15). Его степень равна п{^ + ...-{-п[т) — сумме размеров максимальных жордановых клеток, отвечающих каждому корню характеристического многочлена. Заметим, что это число не превосходит размера всей матрицы А (т. е. числа п — размерности пространства, в котором действует оператор). Характеристический многочлен det (А— ХЕ) оператора А (6.42) содержит многочлен Q(X) в качестве делителя и поэтому также является аннулирующим (это утверждение называется теоремойГамильтон а — К эли). Вообще говоря, характеристический многочлен det (Л — КЕ) не является минимальным аннулирующим многочленом оператора А. Если оказывается, что минимальный многочлен совпадает с характеристическим, то это означает, что каждый характеристический корень используется только в одной жордановой клетке, размера, равного кратности корня. § 6.6. Вещественная жорданова форма 6.61. Рассмотрим оператор А в вещественном л-мерном пространстве Яп. Канонический базис, в котором матрица оператора А записывалась бы в жордановой форме (8), вообще говоря, не существует, хотя бы потому, что характеристический многочлен оператора А может иметь невещественные корни. Тем не менее в вещественном пространстве можно найти некоторую замену жордановой матрице (8). Пусть Л— \\а^}\\ есть матрица оператора А в некотором базисе еъ ... ,еп пространства R„. Рассмотрим комплексное л-мерное пространство С^, состоящее из векторов х = а1е1+...-\-апеп, где ах, ..., ап — произвольные комплексные числа. Матрица Л
182 ГЛ. 6. КАНОНИЧКСКАЯ ФОРМА ЛИНЕЙНОГО ОПЕРАТОРА [6-62 задает в пространстве С;| линейный оператор А по формулам п п / п \ /=1 / = 1 \*=1 / для векторов х с вещественными составляющими а- эти формулы определяют сам оператор А. 6.62. Начнем с оператора А, у которого аннулирующий многочлен имеет специальный вид где т —положительное число. Для оператора А определены операторные полиномы Q (А ) с комплексными коэффициентами. В частности, имеют смысл многочлены (A-j-/т E)f и (А — /тЕ)Л Полином Р(^)— = (к2-\-х2)Р остается аннулирующим и для оператора А. Разложению (Х2^-х2)р = (Х— ix)P (к -|- 1т)Р, согласно 6.34, отвечает разложение пространства Сп в прямую сумму инвариантных относительно оператора А подпространств С1п и Q, в которых он имеет аннулирующие многочлены соответственно (л — h)P и (Х-\-п)Р. Более того, если подпространство С„ состоит из векторов х=а1е1+...+апеп с некоторыми аъ . . ., а„, то подпространство Q состоит из векторов х = cXi^i -f- . . . -f- <xnen, где числа а- комплексно сопряжены к числам а-. Действительно, если (А — 1хЕ)р х = 0, то, переходя к комплексно сопряженным числам во всех членах левой части, получаем, что (A -\-ix ЩРх = 0, и обратно; последним равенством, по 6.35, однозначно определяется подпространство С~. Отсюда следует, между прочим, что п четно, п — 2т, где т — размерность каждого из подпространств С„ и С~. Пусть ff — жорданов базис оператора А в пространстве С* (6.37). Поскольку в этом базисе матрица опера-
6.62] § 6.6. ВЕЩЕСТВЕННАЯ Ж0РДАИ0ВА ФОРМА 183 тора А имеет вид [6.37 (7)] п. /т 1 /т 1 /х IX 1 /х /X оператор А действует на базисные векторы по формулам А/1 -/т/1, .... АД = 1т/1 A/J =/?+/тД ..., А/?^Л-г/тЛ, А/^Д.х + гхД, ...,A/^=/nV,+'Vv Для совокупности сопряженных векторов /* £ С£ справедливы сопряженные формулы А/| = -/т/},_ .... АЛ =—«7?^ A/J-Zi-ix/i, ..., АЛ=Л-*тЛ, А //г, —УА1,_ 1 1^ Jnx, • • • 5 А/П|, — /л7_ 1 LTfn(/' Мы видим, что, векторы /^ образуют жорданов базис для оператора А в пространстве С~. Таким образом, векторы/^ и ff образуют жорданов базис для оператора А во всем пространстве Сп. Мы построим теперь базис в вещественном пространстве R„, заменяя каждую пару комплексных векторов ff и ff на пару вещественных векторов gf = = у (/f + If) и А? - ^ (/f-7f)• Из формул A/f^/ti-Hx/f (/J =75 = 0), PJf=ft-i-itT$
184 ГЛ. 6. КАНОНИЧЕСКАЯ ФОРМА ЛИНЕЙНОГО ОПЕРАТОРА [6.62 получаем А{у(//Ч7/) }=Ag? = gf-i-rhf (£* = й* = 0), А {Ti Vi -W}s AA*=-A*-* +T*?- Поэтому для векторов £•*, /г* получаются формулы Agi = — Th\, А/г? = xgl А^ = rf —тА*. АА* = А# Пк g^-i —тА*, nnk-i +1gnk. (16) AAK„fc = При этом, обратно, /f = gf + lhf, Jf=gf-ihf. Таким образом, линейная (комплексная) оболочка всех векторов gf и hf та же, что и линейная оболочка всех векторов ff и ff. А так как число тех и других одинаково, то векторы gf и Щ линейно независимы над полем С вместе с векторами ff и ff. Тем более векторы gf и Щ линейно независимы над полем /?, т. е. в вещественном линейном пространстве Rn. Из формул (16) следует, что матрица оператора А в базисе gf, hf состоит из диагональных клеток вида О — т т 1 О О О — т О 1 т 1 О О о — т размеров соответственно 2пх, О — т 2/2, т 1 О О О — т (17)
6.63] § 6.6. ВЕЩЕСТВЕННАЯ ЖОРДАНОВА ФОРМА 185 6.63. Переходим к рассмотрению общего случая. Пусть А —линейный оператор в вещественном /2-мерном пространстве Rn и Р(X)— его аннулирующий многочлен. В вещественной области многочлен Р(к) допускает разложение вида т s k=i /=i где Xk (k = 1, . .., т) — различные вещественные корни многочлена Р(Х), а ау. + /Ту=Ау; а-— /ту.= Яу—различные невещественные корни; все числа ту- положительны. В соответствии с общей теорией (6.36) пространство R„ допускает разложение в прямую сумму инвариантных относительно А подпространств m s R=2 e,+ 2f,, причем аннулирующим многочленом для оператора А в подпространстве Е^ служит многочлен (X— Хк)г^, а в подпространстве F-— многочлен [(X— о )2-гт*]р1. В подпространстве Ek оператор А приводится к жордановой форме вида (7). В подпространстве Fy- обозначим Ву—- А — ауЕ; тогда для оператора Ву. в подпространстве Fy- многочлен (X2-\-T*)pJ будет аннулирующим и по предыдущему можно будет построить базис, в котором матрица оператора Ву. будет состоять из клеток вида (17) (с заменой т на ту). В этом же базисе матрица оператора А = Ву.-г-а-Е будет состоять из клеток (18) Итак, в пространстве Яп можно выбрать базис, в котором матрица оператора А состоит из диагональных клеток вида (10) и (18). Обозначим эту матрицу через JR(A) (вещественная жорданова матрица). оj т,. 1 0 -т, ст, 0 1 оj %j l 0 -т, Oj 0 1 • • • °/ ri -1j О j
186 ГЛ. 6. КАНОНИЧЕСКАЯ ФОРМА ЛИНЕЙНОГО ОПЕРАТОРА (6.64 6.64. Структуру матрицы JR (А) можно восстановить по элементарным делителям оператора А, вычисленным по минорам матрицы А — ХЕ в исходном базисе (§ 6.4). Поскольку многочлены Dp(k) и Ер(к) получаются из миноров матрицы Л — ХЕ рациональными операциями, многочлены Ер(Х) имеют вещественные коэффициенты и, следовательно, имеют вид т , s k=l /' = 1 (?=1,2, ...,/1—1). Каждому показателю nqk) отвечает жорданова клетка вида (10) размера nqk). Каждому показателю/^ отвечает клетка вида (18) размера 2p(J}. 6.65. Формулируем окончательный результат в виде следующей теоремы: Теорема. Для любого оператора А в вещественном п-мерном пространстве Rtl существует базис, в котором матрица JR(A) оператора А квазидиагональна и состоит из диагональных клеток вида (10) и (18). Здесь Xk— вещественные характеристические корни оператора А, а/Г1т- и о.— iX-— комплексные его корни. Размеры клеток однозначно определяются по элементарным делителям оператора, как указано в 6.64. § 6.7. Спектры, корпусы и многочлены В различных вопросах анализа и алгебры встречается необходимость вычисления различных функций, в частности, многочленов, от заданных линейных операторов в конечномерном пространстве. Функции от операторов обладают рядом специфических свойств. В ближайших двух параграфах строится исчисление таких функций. Естественной арифметической моделью для функций от одного оператора является алгебра корпусов, с которой мы и начинаем теорию. 6.71. Будем называть спектром и обозначать символом S конечную совокупность точек Х1у . . ., Хгп. При этом будем считать, что каждой точке Xk приписано под названием «кратности» некоторое натуральное число rk (k=\, ...,/я).
6.71] § 6.7. спнжтры, корпусы и многочлены 187 Все это будем записывать так: s^iK1' ■■■>Kr]. Предположим, что каждой точке Xk поставлен в соответствие набор из rk чисел из К, которые мы обозначим /(Ял), /' (^/с)> • • •» /{П:~1) (Хл). Такой набор чисел мы будем называть корпусом/, заданным на S*). Пусть Q (S) — совокупность всех корпусов на множестве S. Введем в Q (S) следующие операции: а. Сложение. Суммой двух корпусов /= \/М (Kk)\ и g= {gti) (Xk)} будем называть корпус / + £\ определенный набором чисел (f+g)u4h)=fU)(h)+g{i)(h)> * = 1, -..,/», у=1, ...,гл —1. б. Умножение на ч и с л о. Пусть а £ К; произведением а/ корпуса /=[/"(/) (Xk)\ на число а будем называть корпус, определяемый набором чисел (*f)«4h)=*fU)(h). Очевидно, операции а и б превращают совокупность Q (S) в линейное пространство. Нулем этого пространства являются корпус 0 со всеми нулевыми составляющими. в. Введем теперь операцию умножения. Произведением /g корпусов /— {/О (Kk)\ и g = {g{i) (Xk)} называется корпус, определяемый формулами (fg)' ih) =/(Ю g (h) +f (K)g(K) / = o A = l, .. P = 0, 1, r' — Cp-j ., m, ...,/■*- p! ! (P - /)! -1, Легко проверить, что операция умножения коммутативна и удовлетворяет условиям 6.21 Г) —3). Таким образом, Q(S) — коммутативная алгебра над полем К. В этой алгебре есть единица, корпус с, который обладает свойством е/ = / для *) Принят также термин джет (англ. jet означает «струя»).
188 ГЛ. 6. КАНОНИЧЕСКАЯ ФОРМА ЛИНЕЙНОГО ОПЕРАТОРА [6-72 любого /£ Q (S). Именно, можно положить { 1 при у = 0, /г=1, ...,/я, еуп ал = > *' \ О при 0<у<гл> *=1, ..., т. Для случая, когда точки Хг, . . ., Хт принадлежат полю Ку мы свяжем в этом параграфе алгебру Q(S) с алгеброй всех р многочленов P(k)= ^ akXk с коэффициентами из поля К. 6.72. Будем предполагать, что поле К содержит бесконечное множество различных элементов. При этом условии установим вначале некоторые теоремы о восстановлении коэффициентов многочлена по его значениям. р а. Пусть Р(К)= 2 ak№— многочлен с коэффициенте тами из поля К, аргумент которого X также может принимать значения в поле К. Покажем, что значения Р(К) позволяют однозначно восстановить его коэффициенты я0,. . ., ар. Пусть Х0, %!, . . ., X —различные элементы поля К; рассмотрим равенства Эти равенства можно рассматривать как уравнения относительно величин а0, av . . ., а с определителем, отличным от 0; по теореме 1.73 она обладает единственным решением, что и требуется. б. Отсюда следует, что если два многочлена Р(К) = р р = 2 ak^k и Q(^)~ 2 bk№ совпадают при каждом значено k=o нии Х£К, то ak = bk (& = 0, 1, ...,/5). 6.73. Далее нам понадобится понятие производной от многочлена P(k), понятие высших производных и формула Тейлора. R анализе эти понятия вводятся для случая многочлена Р(К) от вещественного (или комплексного) аргумента.
6.73] § 6.7. спектры, корпусы и многочлены 189 Здесь мы рассматриваем многочлены с аргументом X, меняющимся в произвольном поле К; поэтому мы должны ввести соответствующие определения независимо (причем не опираясь на понятие предела, которого в поле К может и не быть). а. Фиксируем точку (i g К и напишем равенство Ё«^*= £«*№+(*—!*)]*= £Ц£>(а.-ю\ (19) k = 0 k=0 k = 0 где ■ fe. t (k — 0, 1, ...,/?) — многочлены от ц, которые получаются после развертывания [|i-|-(>v — \i)]k по степеням (i и (X — (i) и приведения подобных членов. Многочлены bk(\i) получают следующие наименования: р bQ(\i)= 2 ak\ik^^>(\i) —сам многочлен P(|i); р b1(\i)^ 2 kak\ik'1 = Р' (|i) —первая производная ^=1 многочлена P(|i), р Ь2 (|i) = 2 /г (/г—1) afe|.i*~2 = P" (\i) — вторая производная k = 2 многочлена P(|i), b (\i)^p(p—1) ... \ - а р = PW (\i)—р-я производная многочлена P(|i). Для многочлена степени р положим Р{^ (|i) = 0 при д > р. Равенство (19) в приведенных обозначениях принимает форму р W = E-Fp(W(|A)(b-|i)* (2°) и называется формулой Тейлора для многочленов Р(Х). б. В частности, для многочлена Р (к) = (X—а)Р (а£К) мы имеем Р(а) = Р' (а)= .. .=Р{Р~1] (fl) = 0, P^)(A,)=p!f P(*>(b) = 0 при ? >/?.
190 ГЛ. 6. КАНОНИЧЕСКАЯ ФОРМА ЛИНЕЙНОГО ОПЕРАТОРА [6.74 в. Более общим образом, если Р (X) = (X— a)PQ(X), мы имеем также Q (%) = 2 bk (к - а)\ Р (к) = 2 Ьк (X - а)к+Р, 6=0 /г = 0 так что р (а) = Р' (а) = . . . = Р{р~1) (а) = 0. (21) г. Обратно, если известно, что выполнены условия (21), то это означает, что s РМ = 2*-^Р{к)(а)(Ь-а)к = s ^(Х-а)Р^ ^-P{k)(a)^-a)k-P=(K-a)PQ(X)9 где Q{X)— некоторый новый многочлен. 6.74. Заметим, что представление многочлена Р {X) в форме где bk(\i) — некоторые многочлены от jli, может быть лишь единственным. Действительно, зафиксируем \i = \i0 и придадим величине X последовательно различные значения Я„, ... , X . Тогда т -— X— \i примет последовательно различные значения Х0— |и0, XY— |и(), ... , Хр — |л0, и при этих значениях т оказываются известными значениями многочлена р У1 Ьк (fi0) %k (которые равны Р(Х0), ..., Р(к))\ в силу 6.72а величины bk (ц0) определены однозначно. Так как это верно при любом \х = \i0 £ /Г, то однозначно определены и сами многочлены £fr (\i) (& = 0, 1, ... , р). 6.75а. Пусть даны два многочлена Р (X) и Q(X). Проверим справедливость формул (P + Q)(W(|A) = ^fc,(fi)H-Q(*>(|i)> (22) к (PQYk) (ц) = 2 с£р'/> (Ю Q(*~y) (и), (23) /=o гле С/ = 7П|5=77! (* = 0, 1, ...).
6.75] § (3.7. спектры, корпусы и многочлены 191 Действительно, мы имеем по определению р (Р + Q) (К) = £ -L (Р + СГ (ц) (% - ц)*, fe=0 />(^) = Етг'>,*)(|*)(^-|А)*, k=0 k\ р ^ 1 0(М = Х^<?(*}(ЖЬ-|*)\ А' = О Р fe! /5=0 В силу теоремы единственности 6.7^ получаем формулы (22). Далее, аналогично р fe= 0 с другой стороны, р р /=0 '' s = 0 S- РIX) Q (I) = V V 1 р«/. (и) qw) (|i) (Х-,*)•'+/ = / = 0 А' = 0 ''' в силу теоремы единственности 6.74 имеем к -1- («?)'*> (|х) = X j!(^y)! Р"> (n)Q«*"'> (ц), откуда и вытекает (23). б. В частности, из формулы (23) вытекает следующее важное предложение: Если P(k)(\i) = 0 при /^ = 0, 1, . . . , т, то для любого многочлена Q(k) также (PQ){k) (\х) = 0 при k = 0, 1, . . . , m.
192 ГЛ. 6. КАНОНИЧЕСКАЯ ФОРМА ЛИНЕЙНОГО ОПЕРАТОРА [6.76 6.76. Пусть теперь заданы некоторый спектр S^l^i1, ... , Я^}, Xj£K, и алгебра соответствующих корпусов Q(S) (6.71). Каждому многочлену Р(к) отвечает следующий корпус Р из Q(S): точке Xk ставятся в соответствие числа Р(кк), Я'(*л). ••• , P'^-^ih), ™е р(у) (*) — производные от многочлена Р(Я), определенные в 6.73а. Формулы (22) и (23) показывают, что обычным действиям сложения и умножения многочленов отвечают определенные в 6.71 действия над корпусами. Таким образом, отображение Р (к)—>Р есть морфизм (6.24) алгебры многочленов П в алгебру корпусов Q(S). Покажем, что этот морфизм является эпиморфизмом; иначе говоря, для любого корпуса / можно найти такой многочлен Р(Х), что (k=\, ... , т). Достаточно рассмотреть случай, когда числа /{J) (kk) отличны от нуля только для какого-нибудь одного значения к — къ а для остальных значений равны 0; если мы решим поставленную задачу для такого случая, т. е. для каждого А=1, ... , т построим многочлен Рк(к), удовлетворяющий условиям Р% (Ю =/(**), • • • . Р^~1] (К) =f{r"-1) (Xk), (24) П''(^) = 0. s^k, j=\, ... , rs-\, (25) то искомое решение можно будет получить по формуле Р(к) = Р1(Ъ.)+...+Ра(%). Итак, нам требуется найти многочлен Pk (К), удовлетворяющий условиям (24)—(25). Будем искать его в форме Pk(b) = Qk(b)Rk(b), (26) где Qk (X) — новый искомый многочлен, а Я*М=П <*-**)"• (27) В силу 6.726 и 6.756 мы имеем /#'(*,)= 0 {зфк, /=0, 1, ..., rs-V;
6.77] § 6.7. спектры, корпусы и многочлены 193 отсюда, каков бы ни был многочлен Qk(k), мы получаем, снова применяя 6.756, что Р^(К) = 0 (s^k, у=0, 1, ... , rs—\), так что условие (25) заведомо выполнено. Мы должны подчинить многочлен Рк(Х) условиям (24). Заметим, что Поэтому из условия величина Qk(Kk) однозначно определяется. Далее из условия /' (Хк) = Р'к(кк) = Q'k (кк) Rk (Кк) + Qk (Kk) R'k (kk) при известном уже Qk (Kk) однозначно определяется Q'k (кк)\ продолжая таким образом дальше, мы получаем возможность однозначно определить все числа Qk (А,л),ф*(А.л), • • ., Qkr'!~1) Скк). А имея их, мы можем определить и искомый многочлен Qk (X) по формуле Тейлора <?* М = L jr <ЯР (К) ^-КУ- (28) Возвращаясь по цепочке наших рассуждений, мы видим, что многочлен Рк (к), определенный формулами (26) — (28), удовлетворяет требуемым условиям (24) — (25). 6.77. Применяя 6.25г, получаем, что алгебра Q(S) всех корпусов на данном спектре изоморфна фактор-алгебре П/7, где /—идеал в П, образованный теми многочленами, для которых /х/>(Ьл) = 0, А=1, ... , т, у=1, ... , rk. Из 6.73г следует, что каждый многочлен Р (X) £ / делится на многочлен m Т(Х) = Ц (K-XkYK (29) /г=1 из 6.73в следует, что каждый многочлен Р(Х), делящийся на Т(к), входит в /. Идеал /, как и всякий идеал в алгебре П, порождается входящим в него многочленом наименьшей 7 Г. Е. Шилов
194 ГЛ. 6. КАНОНИЧЕСКАЯ ФОРМА ЛИНЕЙНОГО ОПЕРАТОРА |6.78 степени (в.26). Таким многочленом является сам многочлен Т(Х). Следовательно, алгебра Q{S) изоморфна фактор-алгебре П//, где /—идеал, порожденный многочленом Т(Х). 6.78. Применим результат 6.77 к решению следующей задачи: описать все обратимые (6.21) элементы алгебры Q(S). Очевидно, корпус /, для которого хотя бы при одном значении у имеет место равенство f (Xk) -= 0, не может быть обратимым, поскольку в этом случае для любого корпуса g мы имеем (fg) (К) =f(h) g (К) = 0ф\=е (Xk). Рассмотрим корпус /, для которого /(Хк)фО (k= 1, ... , m). Пусть Р (X)— многочлен, для которого (6.76) f(bk) = P(h), •-.,firi<-1)(h) = Pirk-1)(h) (*=*. ... ,/и). Этот многочлен, таким образом, не имеет общих множителей с многочленом Т (X) (29); поэтому, согласно 6.28, существуют такие многочлены Q(X) и S(X), что P(X)Q(X)+T(X)S(X) = \. (30) Пусть q — корпус, отвечающий многочлену Q(X). Применяя к равенству (30) эпиморфизм П—+Q(S), построенный в 6.76, и используя тот факт, что при этом эпиморфизме многочлен Т (X) переходит в 0, мы получаем /4=1, т. е. корпус /обратим в алгебре Q(S). Итак, корпус f £Q(S) обратим. Как мы знаем из 6.21, для обратимого корпуса и разрешимо, притом единственным образом, любое уравнение вида их = v, где v — известный корпус, а х— неизвестный корпус. Для частного х = — можно найти явное выражение, последова-
6.79[ § 6.7. спектры, корпусы и многочлены 195 тельно решая уравнения. uCkk)xCkk)=v(kk), /=0 /5=1, . . . , /Я, Г = 0, 1, . . ., Гл. 6.79а. Спектр 5={Х[1, ... , Я,г™} с комплексными Я15 . . . , Я^ называется симметричным, если для любого невещественного Ял — ал-| ixk в 5 содержится и комплексно сопряженное число Хк = ок — iik с той же кратностью rk. Корпус / = {/{J) (Xk)\ на симметричном спектре S называется симметричным, если числа /(у) (Я*) комплексно сопряжены числам f(J) (Ял) (у = 0, 1, ... , гл). Если Р (Я)— многочлен с вещественными коэффициентами, то на симметричном спектре S корпус, образованный числами P(J) (Kk) (&= 1, ... , m, у—1, • •• , гк), симметричен, поскольку производные P{J) (к) также имеют вещественные коэффициенты и поэтому р^(11г)=1*Щ~к). (31) Обратно, для симметричного корпуса /={/(у)(^л)} на симметричном спектре S~{Xi\ ... , Я^?1} всегда можно найти многочлен Р0 (Я) с вещественными коэффициентами, для которого Р^ (Ял)=/(у) (ЯА) (£ = 1, . . . , /я, у = 1, . • ., гк). Действительно, по 6.76 можно построить многочлен Р(Я) с комплексными коэффициентами, удовлетворяющий требуемым условиям. Обозначим через Р (Я) многочлен с комплексно сопряженными коэффициентами. Тогда -1 [/*> (Я,) + Р</> (Я,)] = 1 [/*/> (Я,) +Р^МЯ,)] - = у[/;у)(Я,)+/уЧЯ,)]^Л')(Я,), т. е. многочлен Р0 (Я) = у [Р(Я) + Р(Я)], имеющий вещественные коэффициенты, удовлетворяет требуемому условию. б. Симметричные корпусы / на симметричном спектре S, очевидно, образуют алгебру над полем вещественных чисел. 7*
196 ГЛ. 6. КАНОНИЧЕСКАЯ ФОРМА ЛИНЕЙНОГО ОПЕРАТОРА [6.81 В силу б.25г эта алгебра изоморфна фактор-алгебре П//, где П — алгебра всех многочленов с вещественными коэффициентами, а /сП — идеал, образованный теми многочленами Р (К) £ П, для которых Р(/)(^) = 0, А=1, ... , тп, у=1, ... , rk, т. е. идеал, порожденный (вещественным) многочленом m /е=1 § 6.8. Функции от оператора и их матричная запись В этом параграфе строится исчисление функций от операторов: для каждого линейного оператора А, действующего в л-мерном пространстве Сп (или RJ, указываются матрицы Р (А) любого многочлена Р(А) или рациональной функции п,Лч- 0. (А) и правила действий над ними. В последнем пункте дается расширение операторного исчисления на аналитические функции. 6.81. Пусть дан оператор А в пространстве К,г Алгебра Пд всех операторов Р(А), где Р (К) есть некоторый многочлен, как мы знаем из 6.31—6.33, изоморфна фактор- алгебре П//д, где П — алгебра всех многочленов, а /А — идеал, порожденный минимальным аннулирующим многочленом Т(Х) оператора А. Пусть известно, что многочлен Т (Х) допускает в поле К разложение на множители m Т(К) = Л (X-XkY*. (32) /е=1 В силу 6.77 фактор-алгебра П//д изоморфна алгебре Q (S) всех корпусов, определенных на спектре S = Sa = = {Хгг1, .. . , К?) (спектре оператора А). Следовательно, и алгебра Пд изоморфна алгебре Q(Sa)» Явный вид этого изоморфизма можно получить следующим образом: каждому корпусу /£Q(Sa) отвечает класс много-
6.821 § 6.8. функции от оператора 197 членов Р(Х)£П таких, что (А=1, ... , т, у=0, 1, ... ,гк_г), (33) и каждому из этих многочленов отвечает один и тот же вполне определенный оператор Я (А) £Пд, который мы будем обозначать /(А). Далее мы укажем явный вид матрицы оператора Р(А) при заданных значениях (33), если матрица А дана в жор- дановой форме. 6.82. Пусть известно, что в некотором базисе пространства К„ оператор А записывается матрицей /2-го порядка специального вида (34) Х0 1 . 0 Х0 . 0 0 . 0 0 . .. 0 .. 0 .. 1 .. X, г. е. имеет вид X0E-f В, где В имеет матрицу В = 10 1 . 0 0 . 10 0 . 0 0 . . 011 . 0 . 1 . 0 Из 4.746 мы знаем, что матрица Bk имеет вид В* = 0 . 0 .. 0 .. 0 . k+1 .010. .001. .000. .000. . 0 . 0 . 1 . 0 k+1 (диагональ из единиц удалена от главной диагонали на k шагов).
198 ГЛ. 6. КАНОНИЧЕСКАЯ ФОРМА ЛИНЕЙНОГО ОПЕРАТОРА [6.83 Пусть PiX) — произвольный многочлен степени р; применяя формулу Тейлора (20), мы можем написать рм= E>*w^--v. k = 0 Заменяя X на символ оператора А, получаем равенство р р m=L рР,*)(^)(А-Х0Е)* = £ ±я<*>(Ь0)В*. к=0 ' к=0 Учитывая выражения матриц Вк, находим матрицу Р(А) = 2! (n-l)!^"1'^) 0 Р(Х0) Р'(Х0) ... j-L-/>(»-« (я,0) о о о Р(К ■ (35) Заметим, что для построения матрицы Р(А) от многочлена Р (X) нам понадобились только значения Р(Х0), Р' (Х0), ... ..., Р(п~1] (к0), где /г — порядок матрицы А. 6.83. Пусть теперь А записывается квазидиагональной матрицей А п-го порядка, состоящей из т диагональных клеток вида (34), где XQ пробегает значения Xl5 ..., Хт1 с размерами соответственно пх, ..., пт. В силу правил действий с квазидиагональными матрицами (4.52) вычисление Р(А) можно вести независимо для каждой диагональной клетки. Применяя 6.82, получаем: матрица Р(А) получается путем замены каждой диагональной клетки (34) матрицы А на клетку (35). Таким образом, для построения матрицы Р(А) нам требуются в данном случае значения P{J) (kk), k= 1, . . ., /и, j= 1, . . ., nm. 6.84. Пусть К—С есть поле комплексных чисел. Тогда для любого оператора А, действующего в пространстве К„ = Сп, минимальный аннулирующий полином имеет разложение (32), и существует базис, в котором матрица оператора А записывается квазидиагональной матрицей
6.85J § 6.8. функции от оператора 199 с клетками вида К 1 0 . 0 0 0. 0 0 0. . 0 . 0 . 1 . к (36) размера n)l)^,rk (6.37). Таким образом, оператор А определяет спектр Sa =■ {^Л . . •, km}. Если /—любой корпус на спектре Sа, то соответствующий оператор /(А) в силу рассуждений 6.81—6.83 имеет вид квазидиагональной матрицы, в которой каждая клетка вида (36) заменена на клетку ПК) ПК) ^/"(К) •■■ о /(К) ПК) ••• -J—/К-0 |i] <л'* —2>1 / К-«) (L (37) о оо ... /{К Этим задача изоморфизма алгебры Пд с алгеброй Q(S^) решена в явном виде. 6.85а. Остановимся еще на функциях от оператора, матрица которого в некотором базисе имеет вид (6.62) сг т 10 —т а 0 1 о т —т а (38) а т —т о где а и т — элементы из поля К.
200 ГЛ. 6. КАНОНИЧЕСКАЯ ФОРМА ЛИНЕЙНОГО ОПЕРАТОРА [6-85 Положим 1 0 0 1 л а т т а Матрицу Л можно записать в форме блок-матрицы с двустрочными квадратными блоками: Л 0 0 0 Е 0 Л Е 0 0 0 0 0 0 0 0 Л Е 0 Л Л 0 0 0 0 Л 0 0 о о о о Л О О Л + 0£ 0 . 0 0 Е . 0 0 0. 0 0 0. . . 0 0 [ .00 . 0£ . оо| Поэтому, так же как и выше, и на основании правила умножения блок-матриц (4.51) матрицу Р (А) можно записать в форме блок-матрицы с блоками того же размера р(к) Р(Л) Р'(Л) уР"(Л) ... ^^/><«-*> (Л) 0 Р(Л) Р'(Л) ... Im 1 оиР(и-2)(Л) (т — 2)! 0 0 О Р(Л) . (39) б. Если матрица Л квазидиагональна и состоит из диагональных клеток вида (34) и (38), то, так же как в 6.83, выводим, что матрица Р (А) получается заменой каждой диагональной клетки матрицы А на соответствующую клетку вида (35) или (39). в. Отметим случай, когда в a K—R и числа а и т вещественны. В этом случае для вещественного многочлена Р (к) можно явно указать в;-ц матриц Р(к) (Л), фигурирующих в формуле (39). Действительно, если ввести матрицу 0 1 — 1 0 то, как легко проверить, мы имеем /2=—Е> так что алгебра вещественных матриц Re X ImA, A = aE + xI о т — т о — \тХ ReX X = G -f- /T,
6.87J § 6.8. функции от оператора 201 изоморфна обычной алгебре комплексных чисел X (ср. 4.74а). Поэтому для любого многочлена Р (X) с вещественными коэффициентами Р(А) = Р(оЕ + %1)=: и соответственно pto(A) = P{k)(aE + xI) = ReP(X) \тР(Х) — \тР(Х) ReP(X) X = о + /т, RqP^(X) Im/**>(X) — \тР^(Х) Re/><*>(*,) 6.86. Пусть K=R; тогда для любого оператора А, действующего в пространстве K„ = R„, минимальный аннулирующий многочлен Т(Х) имеет вещественные коэффициенты и, следовательно, определяет симметричный спектр 5д. Алгебра операторов Р (А) изоморфна фактор-алгебре П//г, где П—алгебра многочленов с вещественными коэффициентами, а /г — идеал, порожденный многочленом Т(к). Эта фактор-алгебра изоморфна алгебре симметричных корпусов на спектре ST (6.79). С другой стороны, для оператора А существует базис, в котором матрица А оператора А ква- зидиагональна с диагональными клетками вида (34) или (38). Если теперь /—любой симметричный корпус на спектре 6"д, то соответствующая ему матрица f(A), в соответствии со сказанным выше, получается заменой каждой клетки (34) на (37) и каждой клетки (38) размера, положим, 2/я, на блок- матрицу 1 /(«-1>(Л) /(Л) /' (Л) 0 /(Л) (/71-1)! 1 (т — 2)! /(«-«) (Л) 0 0 ... /(Л) где двустрочные квадратные блоки f(k) (Л) имеют вид /(*>(Л) Refk)(l) 1т/(*>(Л) Im/<*>(&') Re/l*>(X) 6.87. Пусть А — линейный оператор в пространстве С„; какие операторы Р (А) (где Р (К) многочлен) обратимы?
202 ГЛ. 6. КАНОНИЧЕСКАЯ ФОРМА ЛИНЕЙНОГО ОПЕРАТОРА [6.88 Из выражения матрицы оператора Я (А) в жордановом базисе оператора А (36) видно, что т k detP(A)= П ^ (**)]"*, 2 пь = п. к• = 1 /1=1 Поэтому оператор Р (А) обратим в алгебре В (Сп) всех линейных операторов, действующих в пространстве Ся, тогда и только тогда, когда Р(Хк)фО, k---\, . .., т. Покажем, что при выполнении этого условия обратный оператор [Я (А)]"1 имеется уже в алгебре Пд. Действительно, в данном случае корпус р, отвечающий многочлену Р (X) в алгебре корпусов Q(S\), т. с. составленный из чисел гк-\ обратим в алгебре Q(Sa) (6-78); а так как алгебра Q(Sa) изоморфна алгебре Пд (6.81), то оператор Я (А) обратим в алгебре Пд. По тем же соображениям изоморфизма между алгебрами Q(Sa) и Пд в этом случае для любого многочлена Q(X) разрешимо в алгебре 11 д уравнение P(A).z(A)= 0(A) с неизвестным многочленом z (а). В соответствии с результатами 6.78 и 6.84 матрица искомого оператора z (А) в жордановом базисе оператора А клетки (36) на клетку вида 0.(Ял) [<Ш\ P(h) получается заменой каждой 0 P(h) 0 ОЛХ) [p(Dj}.=ik (40) истолковать еще и \ 6.88. Полученный результат можно следующим образом. Пусть S = \ХГХ\ ..., Хг,™\— некоторый спектр в комплексной плоскости. Обозначим через Т (S) совокупность всех комплексных рациональных функций f(X)=^*, где Q (X) и Р (X)—многочлены, причем МНОГОГО)
ft.891 § 6.8. функции от оператора 203 член Р (а) не имеет корней в точках множества 6*. В совокупности Т {S) введем по обычным правилам операции сложения, умножения на комплексные числа и умножения функций друг на друга, после чего совокупность Т(S) становится алгеброй над полем С. Далее заметим, что каждая функция /(а) £ Т(S) обладает производными /' (а), /"(X), ... в обычном смысле анализа. Если поставить в соответствие каждой функции /(a) £ T(S) корпус где f(J) (а) означает обычную производную от функции/(Л), то это соответствие будет морфизмом алгебры T(S) рациональных функций в алгебру Q (S) корпусов на спектре 6*, и именно эпиморфизмом, поскольку корпусы, отвечающие даже только многочленам Q(X), заполняют всю алгебру Q{S) (6.76). Пусть теперь спектр S = Sa есть спектр некоторого оператора А, действующего в пространстве Сп. Тогда алгебра Пд операторов Р (А) изоморфна алгебре корпусов Q(6*a), и мы можем имеющийся эпиморфизм Т (S a)—>Q(Sa) продолжить до эпиморфизма T(Sa) —*Па- Иными словами, мы можем поставить в соответствие каждой рациональной функции f (к) £ Т(S) линейный оператор /(А) £ Пд так, что соответствие /(а) —>/(А) будет снова эпиморфизмом. Матрица оператора /(А) строится по приведенному выше правилу (40). 6.89*. Вместо алгебры рациональных функций мы можем рассмотреть алгебру аналитических функций. Именно, пусть W(S) — совокупность функций /(а), аналитических в точках ^■1» • • •» ^т (т- е- аналитических каждая в некоторой окрестности указанных точек). Совокупность W(S) с обычными операциями сложения и умножения есть снова алгебра над полем С (содержащая алгебру T(S)). У аналитических функций также имеются производные любого порядка (в обычном смысле анализа); пользуясь ими, мы можем распространить эпиморфизм T(Sa)—*Па, построенный в 6.88, до эпиморфизма W (Sа) —► Па-Существенно, что в сферу действия этого эпиморфизма втягиваются теперь многие трансцендентные функции, встречающиеся в анализе, например, eu, sin оЛ, cosg)a и др. Если обозначить через /(А) оператор, отвечающий функции /(а)£№ (Sa), to матрица его в жордановом
204 ГЛ. 6. КАНОНИЧЕСКАЯ ФОРМА ЛИНЕЙНОГО ОПЕРАТОРА базисе оператора А вычисляется по тому же правилу (37). Отметим, например, формулу e(tx+tt)k — etxkettk вытекающую непосредственно из тождества e^ti + t^ *• = е^хе(^ и из того факта, что отображение W(Sa)~► Па является эпиморфизмом. Результаты 6.87— 6.89, относящиеся к линейным операторам в комплексном пространстве, можно перенести на линейные операторы в вещественном пространстве, используя вещественную жорданову форму и метод 6.85 — 6.86. В таком переносе уже не требуется использование никаких новых идей и мы можем предоставить его читателю. ЗАДАЧИ 1. Матрица оператора А в некотором базисе еъ ...,еп имеет вид II % II U U II 1 к II В каком базисе она будет иметь нормальную жорданову форму? 2. Доказать, что матрица А и матрица А' (полученная транспонированием матрицы А) всегда эквивалентны. 3. Найти жорданову форму матрицы || __2 —1—13 2 || —4 1—1 3 2 1 1 о —3 —2 . —4 —2—1 5 1 II 1 1 1 —3 0 || 4. Эквивалентны ли операторы, заданные матрицами 1 1 0 0 1 0 0 0 2 . в = \
ЗАДАЧИ 205 5. Найти элементарные делители матриц п-го порядка Аг = Ал = 0 0 /г —1 п — 2 п п— 1 О п Л,= 112 3.. 0 12.. 0 0 1. J 0 0 0 . п II . п — \ . 0 1 | 0 0 0 ... п 6. Показать, что все матрицы > -™4 — 111. 0 2 2. 0 0 3. 0 0 0. . 1 II . 2 . 3 • п 1! А = элементами а™ а аи 0 а 0 0 0 0 > а13> ^13 • я2з • а . 0 . • «1Л .. а2п • а3п .. а квивал с любыми элементами д12, fli3, • • • эквивалентны, если элементы а12, д23, ..., ап_1п отличны от нуля. 7. Найти жорданову форму матрицы Л, удовлетворяющей уравнению Р(А) = 0у где многочлен Р (X) не имеет кратных корней. 8. Найти жорданову форму матрицы Л, удовлетворяющей уравнению Р(Л) = 0, где Р (К) — произвольный многочлен. 9. Если аннулирующий многочлен оператора А есть многочлен 2-й степени, то любой вектор х пространства R лежит в инвариантной (относительно А) плоскости или прямой. 10. Найти все матрицы, коммутирующие с матрицей а 10 ... 00 0 а 1 ... 0 0 Ат(а) = 0 0 0 0 0 0 . а 1 . 0 а т строк. 11. Найти все тХя-матрицы В> удовлетворяющие условию ВАп(а) = Ат(а)В. 12. Найти все матрицы, коммутирующие с квазидиагональными матрицами вида [а) (а) ... •• АтЛа) тк
206 ГЛ. 6. КАНОНИЧЕСкАЯ ФОРМА ЛИНЕЙНОГО ОПЕРАТОРА 13. Найти все матрицы, коммутирующие с квазидиагональными матрицами вида Mm.W 0 ... О II О Ат2(а2) ... о II о о ••• лт,.М1 где все числа а1у а2, ..., ak различны. 14. Найти все матрицы, коммутирующие с общей жордановои матрицей (8). 15. При каком условии всякая матрица, коммутирующая с некоторой матрицей А, есть многочлен от Л? 16. Показать, что в вещественном пространстве R„ размерности л^2 каждый линейный оператор имеет инвариантную плоскость.
ГЛАВА 7 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ В этой главе мы будем изучать числовые линейные функции двух векторных аргументов. В отличие от случая линейных числовых функций одного аргумента теория линейных числовых функций двух аргументов — билинейных форм — имеет богатое геометрическое содержание. Положив в выражении билинейной формы второй аргумент равным первому, мы получаем новый важный класс функций одного переменного, уже нелинейных — квадратичных форм. В §§ 7.1—7.8 рассмотрения ведутся в линейном пространстве К над произвольным числовым полем /С, в § 7.9 — в вещественном линейном пространстве. § 7.1. Билинейные формы 7.11. Числовая функция А (л:, у) от двух векторных аргументов л*, у в линейном пространстве К называется билинейной функцией или билинейной формой, если она является линейной функцией от х при каждом фиксированном значении у и линейной функцией от у при каждом фиксированном значении х. Иными словами, А (л*, у) есть билинейная форма от х и у, если для любых х, у и z из К и любого а£К удовлетворяются равенства А (* +z, у) = А (х, у) + А (z, у), А (ал% у) = аА(х, у), А(х, y + z) = A(x, у)+А(х, г), А (х, осу) — а А (л*, у). Первые два из этих равенств означают линейность функции А (л:, у) по первому аргументу, последние два—линейность по второму аргументу. (и
208 ГЛ. 7. БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [7.12 Из определения билинейной формы, используя равенства (1), легко получим общую формулу / k m \ k m А 2 «,*„ 23 Р/У/ =22 «/Ру А (х,, Л.), (2) \/=1 j= 1 / /=|j=l в которой ATj, х2, ..., хл, д^, .., ут— произвольные векторы пространства К, а ах, а2, .. . ., ал, рх, Р2, ..., $т — любые числа из К. Билинейные формы, заданные в бесконечномерных пространствах, называют обычно билинейными функционалами. 7.12. Приме ры. а. Если L1(x) и L2(x)—-линейные формы, то А(х, у)~ = LL (x)-L2 (у) является, очевидно, билинейной формой от х и у. б. В л-мерном линейном пространстве с фиксированным базисом еъ е2, ..., еп примером билинейной формы является функция п п где х = 2 S/^m .У — 2 ЛЛ — произвольные векторы и я//г (/, &=1, 2, ..., л)— фиксированные числа. 7.13. Общий вид билинейной формы в л-м е р- ном линейном пространстве. Пусть в л-мерном линейном пространстве Кп задана билинейная форма А (л:, у). Выберем в К„ произвольный базис еъ е2, ..., еп. Положим A(eh ek) = aik(i, k = 1, 2, ..., л). Тогда для любых п п *= 2 heh У=1& 4kek согласно формуле (2) I п п А(х, у) = А 2 Б,-*/, 2 ЛЛ \ / = 1 а? = i п п п п = 23 23 1,-л*А(*,-. <у = S S «,•*!,•%; (3)
7.14) § 7.1. билинейные формы 209 Таким образом, в примере б мы имели самый общий вид билинейной функции в л-мерном линейном пространстве. Коэффициенты aik образуют квадратную матрицу. ап а12 ... а1п а2Х а22 • • • а2п i а„л а„0 . . . а„„ которую мы будем называть матрицей билинейной формы А(х, у) в базисе {е} = {elt e2, ..., еп). 7.14. Симметричные билинейные формы. Билинейная форма называется симметричной, если для любых векторов х и у А(х, у) = А{у, х). Если билинейная форма А (х, у) в л-мерном пространстве К„ симметрична, то aik = A(eh ek) = A(ek, e()=aki; следовательно, матрица Л{е) симметричной билинейной формы в любом базисе ev е2, . .. , еп пространства К„ совпадает с транспонированной матрицей Л{е). Легко проверить, что верно и обратное: если в некотором базисе {е} = = {ег, е2, ... , еп} А{е)=Л(е), то форма А (х, у) симметрична; в самом деле, в этом случае п А (.у, х)= 2 aikr\ilk = i, k=\ п п = 2 <tkii\ilk= 2 а'£к1мк = А(х, у), i, k=l k, l=\ что и утверждалось. В частности, мы получаем: если матрица билинейной формы А(х, у), вычисленная в некотором базисе, совпадает с транспонированной матрицей, то в любом другом базисе пространства Кп матрица этой фор,мы также совпадает с транспонированной. Матрицу, совпадающую с транспонированной матрицей, мы будем называть в дальнейшем симметричной. =н«»и,
210 ГЛ. 7. БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ (7.15 7.15. Преобразование матрицы билинейной формы при переходе к новому базису. а. При переходе к новому базису матрица билинейной формы, разумеется, изменяется; найдем закон ее изменения. Пусть А(е) = || dji || — матрица билинейной формы А (л:, у) в базисе {e\ = {ev е2, ..., еп} и Л(/) =-1| Ь/л ||— матрица той же формы в базисе {/} = {/lf /2, ..., fn) (/, у, /г, /=1, 2, ..., п), и пусть формулы перехода от одного базиса к другому имеют вид п /,= 2^4 (/=1, 2, ...,я) с матрицей перехода Р=^\\р(Р\\. В таком случае */* = А (fn А) = А ( S />}% S Р\к}е) = \/=i /=i / = 2 Pfp^(ej% eL)= 2 P}Vi%. Полученную формулу мы запишем в виде ** = 2 2р;/,Ч^). (*) где р//')'=р}/) — элемент матрицы Р', транспонированной по отношению к матрице Р. Формула (4) отвечает следующему соотношению между матрицами (4.43): Аф = Р'АмР. (5) б. Так как матрицы Р и Р' невырождены, то в силу 4.67 ранг матрицы Аф равен рангу матрицы А(е)\ следовательно, ранг матрицы билинейной формы не зависит от выбора базиса. Поэтому имеет смысл понятие ранга билинейной формы, определяемого как ранг матрицы этой формы в любом базисе пространства К„. Если форма А (х, у) имеет ранг п, равный размерности пространства К„, она называется невырожденной формой. в. Пусть А(х,у) — невырожденная форма; покажем, что для каждого вектора х0Ф0 существует вектор у0 £ К„, для которого А (д:0, у0)ф0. Допустим противное, т. е. что
7.15] § 7.2. квадратичные Формы 211 А (л*0, у) ^ О при каждом у£К,г Построим базис еъ . . . , еп в пространстве К„ так, что ег = х0. Тогда в матрице формы А (л:, у) в этом базисе мы будем иметь при любом т= 1, . . . , п fli« = A(e1> ет) = к(х0, ет) = 0, так что вся первая строка матрицы состоит из нулей. Но тогда ранг этой матрицы < я, что противоречит предположению о невырожденности формы. Это доказывает утверждение. г. Заметим, что форма А (х, у), невырожденная во всем пространстве К, может быть вырожденной на подпространстве К' с К. Так, в пространстве R2, где x = (%v 52)> ^ = 011» %)> форма А(л-, у) = 11Ц1 — 12Ц2 невырождена; однако на подпространстве R'2 с R2, где £1 = £а (и % — г|2), она тождественно равна 0. д. Для определителей наших матриц в силу теоремы об определителе произведения матриц (4.75) получается соотношение deM(/) = deti4(e)(detC)2. (6) § 7.2. Квадратичные формы В аналитической геометрии на плоскости одна и? основных задач состоит в приведении общего уравнения кривой 2-го порядка к каноническому виду путем перехода к некоторой новой системе координат. Уравнение центральной кривой 2-го порядка с центром в начале координат * = 0, у = 0, как известно, имеет вид Ах'* + 2Вху + Су* = D. (7) Преобразование координат производится по формулам х = апх' + а12у\ у=апх' +а2*у', где а1Ъ а12, a2i» а22 — некоторые числа (обычно синусы и косинусы угла поворота осей)- В результате уравнение (7) приобретает более простой вид: Л'*'24-ВУ2 = 0. Аналогичная задача может быть поставлена в пространстве любого числа измерений. Теория квадратичных форм, излагаемая далее, основной своей целью имеет решение этой задачи и задач, связанных с нею.
212 ГЛ. 7. БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [7.21 7.21. Введем следующее определение. Квадратичной формой в линейном пространстве К называется функция А (дг, х) от одного векторного аргумента дг£К, которая получается из произвольной билинейной формы А (дг, у) заменой у на х. В л-мерном линейном пространстве К„ с фиксированным базисом { е } = { ev е2, .. ., еп } каждая квадратичная форма в силу формулы (2) имеет вид А (х, х) = 2 2 alkUk, (8) /=1 /5=1 где £х, £2, ..., £„ — координаты вектора д; относительно базиса {е}. И наоборот, если задана функция А (дг, д:) от вектора х, определяемая в базисе {е} формулой (8), то эта функция представляет собой квадратичную форму от вектора х. Действительно, мы можем ввести билинейную форму п п /=1Л=1 где %, т]2, . • • , т)л — координаты вектора ^у относительно базиса {е}; тогда очевидно, что квадратичная форма В(дг, дг) совпадает с функцией А (л;, л;). 7.22. Заметим, что в двойной сумме (8) можно совершить приведение некоторых подобных членов: при i=fck мы имеем aikhlk + akilkli = i<*ik + aki) hh = biblilb где bik = aik + aki- Для i~k полагаем bu=au- В результате двойную сумму можно записать с меньшим числом слагаемых: п А (х, дс) = 2 2 */»5Д*. k-l i <&
7.22] § 7.2. КВАДРАТИЧНЫЕ ФОРМЫ 213 Отсюда следует, что 'две различные билинейные формы п п А (х, у) = S aikli4k и С (*, jO = 2 сд&ти можно иногда после замены у на х привести к одной и той же квадратичной форме; для этого нужно только, чтобы имело место равенство aik-\- aki = cik-\- cki для любых / и k. Таким образом, вообще говоря, нельзя однозначно восстановить по квадратичной форме породившую ее билинейную форму. В одном случае исходная билинейная форма восстанавливается однозначно: именно, если известно, что она была симметричной. В самом деле, если aik = aki, то из уравнения aik-\- aki — bik (при i Ф k) коэффициенты aih однозначно определяются: bik (9) и при / = А аи = bih а вместе со всеми aik однозначно определяется и вся билинейная форма. Это утверждение можно доказать и не прибегай к базису и координатам; в самом деле, по определению билинейной формы А(х+у, х+у) = А(х, х) + А(х, у) + А(у, х)+А(у, у) и при условии симметрии А(аг, <у)=у[А(дг> у) + А(у, *)]=" = -%[А(х+у, х-\-у) — А(х, х) — А(у,у)]\ таким образом, значение билинейной формы А (дг, у) для любой пары векторов дг, у однозначно определяется по значениям квадратичной формы на векторах дг, у и х-{-у. С другой стороны, чтобы получить из билинейных форм все возможные квадратичные формы, достаточно иметь одни лишь симметричные билинейные формы. В самом деле, если А(х, у) — произвольная билинейная форма, то Ai (*> У) = т [А (*> У) + А 0>> *)]
214 ГЛ. 7. БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [7.23 есть симметричная билинейная форма, и А^х, *) = y[A(*, *) + A(*, *)] = A(*, л:), т. е. квадратичные формы Ах (х, л:) и А (х, х) совпадают. 7.23. В силу всех этих соображений при использовании билинейных форм для изучения свойств квадратичных форм достаточно ограничиться рассмотрением одних только симметричных билинейных форм и соответственно симметричных матриц ||аул|[, aJk = akJ. Симметричная матрица Л = ||ау7г|| симметричной билинейной формы А (х, у), отвечающей квадратичной форме А (х, х), называется матрицей формы А(х, х). При изменении базиса матрица А квадратичной формы А (х, х), совпадающая с матрицей соответствующей симметричной билинейной формы А (х, у), меняется так же, как и эта последняя: Аф — Р А{е)Р, где Р—матрица перехода от базиса {е} к базису {/}. В частности, ранг матрицы квадратичной формы не зависит от выбора базиса. Поэтому можно говорить о ранге квадратичной формы А (х, JC), подразумевая под ним ранг матрицы этой формы в любом базисе пространства К„. Квадратичная форма ранга л, равного размерности пространства, называется невырожденной. § 7.3. Приведение квадратичной формы к каноническому виду 7.31. Пусть дана произвольная квадратичная форма А (я, л;) в я-мерном линейном пространстве К„. Покажем, что в пространстве К„ существует базис {/} = {/х, /2, ... , /п\, п в котором для каждого вектора х = 2 Лл/л значение квад- k= 1 ратичной формы А (х, х) вычисляется по формуле А(х, х) = ^1 + ^1)1+ ... +X,rfn, (10) где Х1? К2у ••• 1 кп —некоторые фиксированные числа.
7.31] § 7.3. приведение формы к каноническому виду 215 Всякий базис, обладающий этим свойством, будем называть каноническим базисом формы А (х, х), а выражение (10) — каноническим видом формы А (л\ х); в частности, числа Кх, к.>, . . . , %п будем называть каноническими коэффициентами формы А (л:, х). Пусть {еъ е2, ..., еп} — произвольный базис про- п странства К„; если х — 2 £а» то» как мы Уже знаем, форма А (л:, х) имеет следующий вид: А(х, х)=2 2 bikUk- (И) Согласно 5.32 наше утверждение будет доказано, если мы сможем написать формулы *ll =Pllll+Pl2%2+ • • ' +РшЪпЛ 42=^2151+^2^2+ ' '• + />2«S/«» I (1Г) Tl/i=Ail5l + /^2 + ' ' ' + Ai«£« J с невырожденной матрицей P=||/?/.fe|| и такие, что, выражая координаты {£} в формуле (11) через величины {г|}, мы преобразуем формулу (11) к виду (10). Будем вести доказательство индукцией но числу координат, фактически входящих в формулу (11) (т. е. с отличными от нуля коэффициентами). Предположим, что каждая форма, содержащая m—1 координат (например, с;,, |.2, ..., |W_A), может быть приведена к каноническому виду (10), с п = т—1 преобразованием (1Г), также с п-=/п—\. Если в формулу (11) фактически входит лишь одна координата, например £1? т. е. формула (11) имеет вид А (а:, х)-ЬпЦ то это предположение, очевидно, выполняется (можно взять рпф0 произвольно). Пусть теперь имеется форма (11),фактически содержащая/» координат |ъ £2, . . . , £/Л. Допустим вначале, что среди чисел Ьп, &32, . . . , Ьтт имеется число, отличное от нуля; предположим для определенности, что Ьтгп^-0. Выделим в форме (11) группу членов, содержащих координату £Л;
216 ГЛ. 7. БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ (7.31 эта группа имеет вид ЬщЛгЪт + ^2тЪ2Ът + • • • +^-1, т Ъ/л-15/я ~Г" ^тпЛт =* — /7 ( ^1т £ I ^2/я i I I bm-Um* it ^2 _r + A1(*, *) (12) где через Ах (л:, л:) обозначена квадратичная форма, зависящая только от величин £х, £2, . . . , \m_v Рассмотрим следующее преобразование координат: Т2 = Ь2» Тю-1 — Ь/л-1» т ^1/я £ | ^2/я £ | | ^m-Urn £ it 1/л оь bl ~Г Ob Ъ2 "Г • • • "Г 9Ь 5/я-1 "Г Ъ/я- ^итт ^итт ^итт Матрица этого преобразования невырождена (ее определитель равен 1). В новых координатах форма А (л;, лг) очевидно, принимает вид А(лг, лг) = В(*, х) + Ьятх*1, где квадратичная форма В (л:, л:) зависит только от величин xv т2, ..., гт_1. В силу предположения индукции существует новое преобразование Л1 =Pli*l+Pl2X2+ • • • +Ph m-lXm-l, ^ =P21T1+/?22T2+ • • • +Р2, т-1Хт-Ъ (13) Л/л-г —Рт-1, 1Т1 "ЬЛя-1, 2Т2+ • • • +Р/Я-1, /я-1Т/л-1 с невырожденной матрицей Р= Ц/^.Ц , которое приводит форму В (л:, х) к каноническому виду В (л:, х) = X^f + Vl* + • • • + ^-ii-i. Если мы добавим к равенствам (13) еще одно равенство то получим невырожденное преобразование координат х1у
7.31] § 7.3. приведение формы к каноническому виду 217 форма А (л:, х) примет канонический вид А(х, *) = В(*, х)+Ьттт*1=> Прямой переход от координат {£} к координатам { ц} в силу 5.33 осуществляется с помощью матрицы, равной произведению матрицы перехода от координат {т} к координатам {г\\ на матрицу перехода от координат {£ } к координатам {т}. Так как обе эти тхт- матрицы невырождены, то и тхт- матрица-произведение тоже невырождена. Нам остается рассмотреть случай, когда в форме А(х, х) с т координатами \х, £2, . .. , \т все числа аи, а22' • • • » атт равны нулю. Рассмотрим один из членов Д/у-ъ/Е/ с отличным от нуля коэффициентом а/;-; например, пусть а12ф0. Произведем следующее преобразование координат (для удобства рассуждения выпишем переход от новых координат к старым): u = i\-vt, \ <14> gy=£j (j=3,...,m). ) Определитель матрицы преобразования (14) равен —2, и, таким образом, это преобразование снова невырожденное. Член a12Si^2 преобразуется следующим образом: а12^1^2 = а12^1 #12^2 \ поэтому в преобразованной форме появятся сразу два квадрата координат с ненулевыми коэффициентами (очевидно, что сократиться с остающимися членами эти квадраты не смогут, ибо все остающиеся члены содержат координату \] с />2). Таким образом, в координатах \'( к форме (11) уже можно применить наш индуктивный метод. Итак, форма (11), с любым числом т^п фактически входящих в нее координат £., приводится к виду (10) преобразованием (1Г), где п заменено на т. Дописывая при необходимости равенства г\т + 1 = 1т + 1, •••,'Пл==1л» мы можем дополнить систему (И') до требуемой системы из п уравнений с невырожденной матрицей Р=\\ p(j- || , ij= 1, . . ., я, чем доказательство и завершается.
218 ГЛ. 7. БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [7.32 Идея нашего доказательства — последовательное выделение полных квадратов — может быть применена и для фактического приведения данной квадратичной формы к каноническому виду. В § 7.5 будет описан другой метод, позволяющий непосредственно получить векторы искомого канонического базиса и канонический вид формы. 7.32. П р и м е р. Приведем к каноническому виду форму А(*. *) = Ei + 66!g2+ 5El-46,E3-12S263+4g;-4g2g4-8g8E4-6!- Дополняем группу членов, содержащую |ь до полного квадрата и полагаем *h = £i + 3?2-2!3. Тогда форма преобразуется к виду А(*. дг) = л! — 4Б5 — 4£2g4 — 86sg4-й- Далее дополняем группу членов, содержащую |2, А° полного квадрата и полагаем после чего мы будем иметь А(х, х) = и}\ — гЦ — 86з64- Квадраты координат |3 и g4 отсутствуют. Поэтому мы полагаем так что lili = r)t—r\l Таким образом, форма А (х, х) приведена к каноническому виду А(х, x) = K\i — t\l — Sr\l + Sr\i преобразованием 4i = 5i + 3Eo-258, ti2-2g2 + g4f « - 1 * 1 ! - « - ! * _L ! P ЛЗ — ТГ S3 ■ "2" S4> 44 ~-— ~ ЪЗ + 7Г ^4» которое, как видно из построения, невырождено. 7.33а. Ни канонический базис, ни канонический вид квадратичной формы не определены однозначно. Например, любая перестановка векторов канонического базиса приводит вновь к каноническому базису. В § 7.5, между прочим, будет показано, что для данной квадратичной формы можно построить канонический базис, взяв первый вектор этого базиса
7.33] § 7.3. приведение формы к каноническому виду 219 в пространстве произвольно (за некоторыми редкими исключениями). Далее, если форма А (л;, х) записана в каноническом виде (Ль Лг> • • • »Лл — координаты вектора л:), то преобразование координат т]1 = а1т1, Л„ = аптп (cq, а2, . .. ,а„— фиксированные числа, все отличные от нуля, т1? т2, . ..,тл — новые координаты) приводит форму А (л:, л:) к новому виду, также каноническому, но с другими коэффициентами: А (*, *) = (К,а\) т{ + (12а\) т; + . .. + (кп*\) х\. Поэтому встает вопрос об описании всех канонических видов, к которым можно привести данную квадратичную форму. Этот вопрос будет уточнен, если мы сузим определение канонического вида (например, как это будет сделано в вещественном пространстве, 7.93) или сузим класс допустимых преобразований координат (например, как это будет сделано в евклидовом пространстве (10.12)). б. Заметим, что в приведенном примере число коэффициентов, отличных от 0, осталось неизменным. Вообще, число ненулевых канонических коэффициентов, очевидно, есть ранг матрицы квадратичной формы в соответствующем каноническом базисе. Поскольку ранг матрицы квадратичной формы не зависит от выбора базиса (7.23), число ненулевых канонических коэффициентов квадратичной формы не зависит от выбора канонического базиса. Это число, очевидно, совпадает с рангом квадратичной формы (7.23). Зная матрицу формы А(х,х) в каком-либо базисе {е}, мы можем предсказать число ее ненулевых канонических коэффициентов— это число есть ранг формы А (л:, л:), который можно вычислить как ранг матрицы формы А (х, х) в базисе \е\. В частности, у невырожденной формы (7.23) в любом каноническом базисе все ее канонические коэффициенты отличны от 0.
220 ГЛ. 7. БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [7.41 § 7.4. Канонический базис билинейной формы 7.41а. Вектор хг называется сопряженным с вектором^ относительно билинейной формы А(х,у), если A(*i,.yi) = 0. б. Пусть \\а;-к\\—матрица формы А(х,у) в каком-либо базисе е1у ...,еп. Если x1 = ^llkekJ Уг^^^/у то условие сопряженности векторов хг и уг записывается в виде п А(х1,у1) = 2 aJkljr\k = 0. /. k=\ в. Если векторы хг, х2, ... , xk сопряжены с векторомylf то также сопряжен с вектором уг любой вектор подпространства L(xv х2, . . ., xk) — линейной оболочки векторов Xi, Х2, « « • , Xfo. Действительно, в силу свойств билинейной формы A(a1*1 + a2*2+ ... +cckxk,y1) = = аг А (хг, уг) + а2А (х2, уг) + ... + алА (хк, уг) = 0. Если вектор у1 сопряжен с каждым вектором некоторого подпространства K'czK, мы будем называть этот вектор сопряженным к подпространству К'. г. Совокупность К" всех векторов у1 £ К, сопряженных к подпространству К', очевидно, является, подпространством пространства К. Это подпространство К" мы будем называть сопряженным к К'. 7.42. Базис ег, е2, ---,еп пространства К называется каноническим базисом для билинейной формы А(х,у), если базисные векторы взаимно сопряжены: A {eh ek) — 0 при / Ф k. Пример. В пространстве V3 в качестве билинейной формы А (дс, у) рассмотрим скалярное произведение векторов х и у. Сопряженность векторов относительно этой билинейной формы равнозначна, очевидно, их ортогональности. Каноническим базисом в этом случае служит любой ортогональный базис пространства V3. 7.43. Матрица билинейной формы в каноническом базисе имеет диагональный вид, так как aik = A (eh ek) = 0 при 1фк. Диагональная матрица совпадает со своей транспонированной, поэтому билинейная форма, обладающая канони-
7.44) § 7.4. канонический базис билинейной формы 221 ческим базисом, должна быть симметричной*). Покажем, что каждая симметричная билинейная форма А(х,у) обладает каноническим базисом. Рассмотрим квадратичную форму А (х, х), соответствующую данной билинейной форме А(х,у). Мы знаем, что в пространстве К существует базис ех, е2, ...,еп, относительно которого квадратичная форма А (л:, х) записывается в каноническом виде п А(х, *)=2Щ Соответствующая симметричная билинейная форма А(х,у) согласно формуле (9) имеет канонический вид A(x,y)=flXilir]i. (15) п \ где д>= 2 Л/^/)» ее матрица, следовательно, диагональ- /=i / ная. Но это и означает, что базис еъ е2, . . ., еп является каноническим для формы А(х,у). 7.44. В аналитической геометрии доказывается, что геометрическое место середин хорд кривой 2-го порядка, параллельных заданному вектору, есть прямая линия. Приведем доказательство этой теоремы. На плоскости хъ х2 уравнение кривой 2-го порядка имеет вид anxl + 2а12хгх2 + а22х\ + Ь1х1 + Ь2х2 + с = 0> или А (л;, x) + L(x) + c = 0, где А (*, х) = апх\ + 2а12ххх2 + а22х\ есть квадратичная, а L(x) = b1x1 + b2x2 — линейная форма от вектора х = (лг1? х2). *) Вспомним, что симметричность или несимметричность билинейной формы — факт, не зависящий от выбора базиса (7.14).
222 ГЛ. 7. БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [7.45 Пусть вектор х определяет середину хорды, параллельной фиксированному вектору е. Это означает, что для некоторого /=^=0 удовлетворяются равенства А (х Н- te, x + te) + L(x + te) + c = 0, \ A(x — te, x — te) + L(x — te) + c--=0. J ^ Пусть A(x,y)— симметричная билинейная форма, отвечающая квадратичной форме А(х, х); тогда равенства (16) можно записать так: А (д:, х) + 2/ А (х, е) + t2A (е,е) + L (*) + t L (е) + с = 0, А (я, х) — 2/ А (х, е) + /2А (е,е) + L (х) — / L (е) + с = 0. Вычитая второе из первого и сокращая на 2/, находим 2A(jc, e)+L(e) = 0. (17) Полученное уравнение линейно относительно х и, следовательно, определяет прямую в плоскости хг, х2, что и доказывает теорему. Если х' — другая точка этой же прямой, так что 2А(х\е)+Це) = 0, (18) То, вычитая (17) из (18), мы получаем А (х — х\ е) = 0, т. е. вектор е и вектор х — х', определяющий направление полученной прямой, сопряжены друг другу в смысле 7.4J относительно билинейной формы А(х,у). 7.45. Пусть еъ . . ., ek — канонический базис формы А (х,у) в ^-мерном подпространстве К'с:К. Пусть еъ . . . , гк — соответствующие канонические коэффициенты. Выразим числа A(x,ej) через координаты вектора лг£К'. Мы имеем / * \ A(xf ej) = Al 2 l)er */) = k = 2 lj A (*/, *,-) = lt A (eh et) = е&, /=' так что числа А (х, efi однозначно определяются координа-
7.52] § 7.5. построение базиса по методу якоби 223 тами вектора х. Если форма А (х, у) невырождена в подпространстве К', то числа Е; отличны от нуля; в этом случае справедливо и обратное—значения формы k{x,ei) однозначно определяют координаты вектора х. § 7.5. Построение канонического базиса по методу Якоби 7.51. Построение канонического базиса, приведенное в 7.31, имеет тот недостаток, что оно не дает возможности непосредственно, по элементам матрицы Аф симметричной билинейной формы А {х,у) в заданном базисе {/} = {/\//2, • • -,/п} указать коэффициенты Xi и координаты векторов канонического базиса. Метод Якоби, излагаемый далее, позволяет находить эти коэффициенты и координаты векторов искомого канонического базиса. Но при этом на матрицу Л{^ мы наложим следующее дополнительное условие: угловые миноры матрицы A(f) до (п—1)-го порядка включительно У) 6i «11. б2 А-1 11 а с 21 12 '22 1, п-1 '2, п-1 1,2 п-1, п-1 все должны быть отличными от нуля. 7.52. Векторы ех, е2, • . ., еп мы построим по формулам *i=/i. ^2=ail)/i+/2. ^s = ai27i + a(22,/2+/3, лк) (к) ек + 1 = «Г/\ + <>А + аУА+ ••• +а{*>Л+Д+1, г/Ш-1) Л +аГ1,Л+аГ1,/з+ • • • +<п-Г/п-1+/п, J (19) где коэффициенты a\k) (i—\,2,...,k; k= 1, 2, . . ., п—1) еще должны быть определены.
224 ГЛ. 7. БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [7.52 Заметим прежде всего, что Л.Л» ••■»/* к векторам помощи матрицы 1 0 а<Х) 1 а^"Х) а^~1) е1? е2, . . 0 0 r,(k-l) u-з . • • переход •I Ч 0 0 ak-l от векторов совершается при 0 0 1 с определителем, равным единице; поэтому для k= 1, 2, . . ., п векторы /1? Д, . . ., Д могут быть линейно выражены через /г» L [Л, Л, ■ • •, Л] следовательно, совпадает с линейная линейной оболочка оболочкой ц, 1' г2> ■)■ Коэффициенты a$k) (I = 1, 2, . . . , k) мы подчиним условию, чтобы вектор ££+1 был сопряжен с подпространством 2 » * ■Л + 1 Для этого необходимо и достаточно, чтооы выполнялись равенства A (ek + 1, Д) = О, А (еА + 1> /2) = 0, . . ., A (ek+l, Д) = 0. (20) Действительно, из условий (20) вытекает, что вектор ек+1 сопряжен с линейной оболочкой векторов Д, Д, . . . , Д, которая но доказанному совпадает с линейной оболочкой векторов еъ е2, . . ., ek. Обратно, если вектор ek + 1 сопряжен с подпространством L [еъ е2, . . ., ek], то он сопряжен с каждым вектором этого подпространства и, в частности, с векторами Д, Д, ..., Д; поэтому выполняются равенства (20). Подставляя в формулы (20) выражение ek + 1 (19) и пользуясь определением билинейной формы, получаем систему уравнений относительно величин а^)(/=1, 2, . . ., k): А (ек+1. Д) = а* А (Л, Л) + а</> А (Д, Д) + ... ••• + <4*,А(Д,Д) + А(Д+1)Д) = 0, А (ек+1, /2) = < А (Д, Д) + а<2*> А (Д, Д) + . .. .. . + < А (Д, Д) + А (Д+1, Д) = 0, А*(е*+1, Д) ='oi*» А (Д,'Д) + а<*> А (Д, Д) +.'..' •••+^,А(Д,Д) + А(Д+1)Д) = 0. Эта неоднородная система уравнений с коэффициентами А (//, /}) = Я//(*\ У= 1, 2, . . . , /г) имеет по условию отличный (21)
7.53] § 7.5. построение базиса по методу якоби 225 от нуля определитель и поэтому однозначно разрешима; следовательно, можно определить величины а^ и тем самым построить искомый вектор ek+1. Для определения всех коэффициентов a\k) и всех векторов ek нужно при каждом k разрешить соответствующую систему (21), следовательно, всего разрешить п—1 систем линейных уравнений. 7.53. Обозначим координаты вектора х в построенном базисе еъ е2, . . ., еп через £1? £2, . . ., £я и координаты вектора у в этом базисе соответственно через г)х, т]2, . . . , г\п. Билинейная форма А (х, у) в этом базисе принимает вид п А(*,.У)=2*/5«Л/. (22) Чтобы вычислить коэффициенты hj, будем рассуждать следующим образом. Рассмотрим нашу билинейную форму А(х,у) только в подпространстве Lm = L(el, е2, . . ., ет)} где т^п. Форма А(х,у) в базисе /i,/2, . . . , fm подпространства Lm имеет, очевидно, матрицу IIаг1 а12 ... а1т [I #21 #22 * * * а2т II ит\ ит2 * * * итт а в базисе еъ е2, . . ., ет — матрицу Матрица перехода от базиса /х,/2, . . .,/т к базису еъ е2, ...,ет, отвечающая формулам перехода (19), имеет, как мы видели, определитель, равный 1. В силу формулы 8 Г. Е. Шилов
226 ГЛ. 7. БИЛИШ-ЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [7.54 7.15 (6) мы должны иметь det tfoi a 22 1/л 2/л = dct \ или, используя обозначения угловых миноров 7.51, Sm = Kh ---К (/и=1, 2, .. ., /г). Из формулы (23) непосредственно вытекает, что &2 л Йя л б, Х1 = б1 11 ^ к = 1 кп fi/i-i (23) (24) Формулы (24) позволяют найти коэффициенты билинейной формы в каноническом базисе, не вычисляя самого базиса. 7.54. Обратим внимание на /мо формулу в системе (19); запишем ее в форме Л + 1 = -аГ/1 аГЛ + ^1 = йт«| В этой формуле вектор gk лежит в подпространстве L (/*1? ...,Д), а рл + 1 сопряжен к этому подпространству. Коэффициенты a[k), . . ., a(kk) определяются, причем единственным образом, из системы (21), при условии, что detHA^/^H^O (/, у=1, ...,Л), или, что то же, при условии, что форма А (х,у) на подпространстве L (/х, . . . ,/л) невырождена. Так как вектор /л + 1 был в этом построении произвольным, то, обозначая f = fk + li g=gk, h — ek + 1, L (Л,... ,Д) = K'cK, мы приходим к следующей теореме: Теорема. Пусть вектор / не принадлежит к подпространству К'сК, на котором форма А(х,у) невырождена. Тогда существует (и единственно) разложение f=g+h, (25) где g(zK', a h сопряжен с пространством К'. 7.55. Обозначим через К" подпространство, сопряженное к подпространству К' относительно формы А(х,у). Наличие разложения (25) вместе с его единственностью показывает, что все пространство К есть прямая сумма подпро-
7.61 J § 7.6. СОПРЯЖЕННЫЕ ЛИНЕЙНЫЕ ОПЕРАТОРЫ 227 страпств К' и К" (2.45). Итак, имея подпространство К'сК, на котором (заданная во всем пространстве К) форма А(х,у) невырождена, можно осуществить прямое разложение К-К' + К", где подпространство К" сопряжено с К' относительно формы А (х, у). § 7.6. Сопряженные линейные операторы 7.61. Фиксируем в пространстве К„ билинейную невырожденную симметричную форму, которую будем обозначать в этом параграфе через (х,у). Пусть А и В — линейные операторы, действующие в пространстве К„. Образуем функции А (л*, У) и В(х,у) от двух векторов х,у по формуле А (а:, у) = {Ах, у), В (*, у) = (*, By). Проверим, что полученные функции А(х,у) и В(х,у)— билинейные формы. Действительно, на основании определений линейного оператора [4.21) и билинейной формы (7.11) имеют место равенства A (atx + х2,у) --= (А (хг + х2),у) = (Ахг + Ах2,у) = -■= (А*ъ у) + (А*2, у) -= А (л-1? у) + А (*2, у)9 А {ах, у) = (А (ал;), у) = (а А (л:), у) = а (Ал:, j/)--=aA (л:, у), которые показывают, что А(х,у) линейна по первому аргументу. Линейность А (л;, у по второму аргументу следует из того, что (х,у) линейна по у. Таким образом, А (л;, у—- билинейная форма. Аналогично и В (л;, у— билинейная форма. Пусть е1, ...,еп — канонический базис для формы (х,у): (ер ек) = О при )фк, (е,„ ет) = вт £К,гтф 0. Сравним в этом базисе матрицу оператора А и формы А {х,у). Матрица Цд^Ц оператора А определяется из формул п Ае = 2 alkheki у = 1, ... , /г (здесь верхний индекс указывает номер строки, нижний—- номер столбца). Матрица \\aJk\\ формы А (л;, у (первый индекс— номер строки, второй — номер столбца) определяется 8*
228 ГЛ. 7. БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [7-62 из формул а/т = А («/. ет) = (А ер е,п) = ( 2 < ек, е,Л = = а$ (ет, ет) = ета£. (26) Следовательно, m-ti столбец матрицы \\а-т\\ получается умножением т-го столбца матрицы Ня^П при каждом т=\, . . ., п на канонический коэффициент гт формы (х,у). Для матрицы Hft^H оператора В (в том же базисе ех, ..., еп) и матрицы \\bjkW формы В(х,у) аналогично получаем = [ер £{ ЬГе?) = bfl) (e;, еу) = еу^'»\ (27) т. е. у-я строка матрицы || bjm || получается умножением у-го столбца матрицы оператора В при каждом j= 1, . . . , п на соответствующий канонический коэффициент еу-. 7.62. Пусть, обратно, в пространстве К„ заданы билинейные формы А (а:, у) и В(х, у); мы утверждаем, что существуют линейные операторы А и В такие, что А(х, у) = (Ах, у), В(х, у) = (х, By), причем они определены единственным образом. Для доказательства зададим операторы А и В в каком- либо базисе еъ . . . , еп матрицами соответственно из чисел По этим операторам построим формы Ах (х, у) = (Ах, у) и Bi (х, у) = (х, By). По доказанному, в базисе ех, . . . , еп матрица формы А1(х} у) совпадает с матрицей формы А (х, у), а матрица формы В1 (х, у) совпадает с матрицей формы В (л;, у). Но тогда для любых х и у из Кл (Ах, у) = Аг (х, у)^А (х, у), (х, By) = Вх (х, у) = В{х, у), так что операторы А и В удовлетворяют требуемым условиям. Для доказательства единственности нам достаточно
7.63] § 7.6. СОПРЯЖЕННЫЕ ЛИНЕЙНЫЕ ОПЕРАТОРЫ 229 проверить, что если некоторый оператор А удовлетворяет условию (Ал:, у) = 0 (при любых х, у из KJ, (28) то АлгееееО (29) при каждом лг£К„, т. е. А — нулевой оператор. Пусть для некоторого х0£Кп мы имеем Ал:0=^=0. Тогда, поскольку форма (л:, у) невырождена, в силу 7.15в существует вектор у0€Кп такой, что (Ал:0, у0) Ф 0; это противоречит (28), откуда и следует требуемая единственность. 7.63. Теперь мы установим следующую важную теорему. Теорема. Если в пространстве К„ выделена невырожденная билинейная симметричная форма (х, у), то для каждого линейного оператора А существует и единствен линейный оператор А', удовлетворяющий уравнению (Ах,у) = (х, А'у) при любых х и у из Кп. Матрица оператора А' в любом каноническом базисе формы (л:, у) получается из матрицы оператора А транспонированием, умножением т-й строки на гт и делением j-го столбца на еу- (у, т= 1, . . . , п). Доказательство. По заданному оператору А построим форму А (х, у) — (Алг, у) и затем определим оператор А' из уравнения (Ал:, у) = А(х, у) = (х, А'у). Существование и единственность оператора А' следуютиз 7.62. Матрица || а^ || оператора А, матрица || ajm || формы А (х,у) и матрица ||а/(т)|| оператора А' связаны в любом каноническом базисе формы (л:, у) формулами (26)—(27) так что ajm em ч ь а/'(т) = ^ = 77<, (3°) и теорема полностью доказана,
230 ГЛ. 7. БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [7.64 Оператор А' называется сопряженным к оператору А относительно формы (х, у). 7.64. Операция перехода к сопряженному оператору А —► А' обладает следующими свойствами: а) (А')' —А для любого оператора А; б) (А + В)' = A'-i-B' для любых А и В; в) {ХА)' = КА' для любого оператора А и любого хек-, г) (АВ)' = В'А' для любых А и В. Равенство а) вытекает из определения (А')': (х, (А'Уу) = (А'х,у) = (х, Ау) и единственности оператора, определяемого билинейной формой (7.62). Аналогично получаются и остальные утверждения; так, б) вытекает из соотношений (л, (А + В)'у) = ((А + В) х, у) - (Ах, у) + (В*, у) = = (*, А'у) + (х, В'у) = (х, (А' + В')у); в) вытекает из соотношений (л, CkA)'y) = (kAx, у) = Х(Ах, y) = K(x, A'y) = {xt ХА'у), и, наконец, г) — из соотношений (х, (АВ)'у) = (АВх, у) = (Вх, A'y)--=(x, В'А». 7.65. Отметим еще одну связь между операторами А и А'. Пусть подпространство К'сКи инвариантно относительно оператора А; это означает (4.81), что каждый вектор х £ К' переводится оператором А снова в вектор из того же подпространства К'. Пусть К" — подпространство, сопряженное к К' (7.41 г). Покажем, что оператор А' инвариантен относительно подпространства К". Пусть ^уё К", так что (у,х) — 0 для любого л£К'. Мы имеем (А'у, х) = (у, Ал) = 0, так как Ал* вместе с х лежит в К'; но это означает, что вектор А'у сопряжен всем векторам х £ К' и входит тем самым в К", что и требуется.
7.72] § 7.7. изоморфизм пространств 231 § 7.7. Изоморфизм пространств с выделенной билинейной формой 7.71. Определение. Два линейных пространства К' и К" над одним и тем же числовым полем К с выделенными в них билинейными симметричными формами A(xf, у') и А (х", у") называются А-изоморфными, если они изоморфны как линейные пространства над полем К (2.71), — т. е. существует взаимно однозначное отображение (морфизм) (ах' = х", сохраняющее линейные операции,—и, кроме того, для соответствующих друг другу пар элементов сол*' —л;", coy' =у" значения форм А (х', у') и А [х", у") совпадают: А (сод:', coy') = А (xf, у'). 7.72. Имеет место следующая теорема: Теорема. Для того чтобы конечномерные линейные пространства К' и К", снабженные формами А (х', у') и A(v", у'|, были А-изоморфны, необходимо и достаточно, чтобы К' и К" были равной размерности п и чтобы в К' и К" существовали канонические базисы форм А (х', у') и А (х", у") с одинаковым набором канонических коэффициентов ех, . . . , е„. Доказательство. Предположим, что пространства К' и К", снабженные формами А (х', у') и А{х",у"), являются А-изоморфными. Тогда они изаморфны как линейные пространства и, следовательно, имеют равную размерность (2.71). Возьмем произвольный канонический базис ех, . . ., еп формы А (л:', у') в пространстве К'. Мы имеем ' { £; ПРИ I — }. Пусть е[, ..., е'п — векторы в К", отвечающие векторам е[, . . ., еп пространства К' в силу имеющегося А-изомор- физма. По условию А „ „ | ° ПРИ %1Фи A (eh е.) = ■ . V ' ( Е{ При I rrry. Мы видим, что у формы А (х", у") имеется канонический базис в пространстве К" с тем же набором канонических
232 ГЛ. 7. БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [7.73 коэффициентов е1? . . . , е„, что и у формы А (х', у'). Таким образом, необходимость условия теоремы установлена. Для доказательства достаточности рассмотрим канонические базисы е[, . . ., е'п (в К') и^[, . . ., е"п (в К") с одинаковым набором канонических коэффициентов, так что Г 0 при ьф], А(". '/) = А (".'/) =\в/ при, = у. Положим для любого лг'=2£/в/€К' ** = <D(*') = 2V]f6K' с теми же координатами £.. Такое соответствие определит изоморфизм пространств К' и К" (2.74). Мы имеем, далее, при у' = 2л***. /' = ю (.у') = 21л*^ А (х', Л = 2е&т1* = А(Л Л. так что изоморфизм со является и А-изоморфизмом. Теорема доказана. 7.73. Пусть имеется /z-мерное пространство Кп с фиксированной невырожденной билинейной формой А (д;, у). Рассмотрим А-изоморфизм пространства К„, т. е. линейное обратимое отображение у—-+Qx, не изменяющее форму А(дг, у): A(Q*, Q^f) = A (jc, у). (31) Будем далее форму А (д;, у) короче обозначать через (дг, у). Обозначая через Q' оператор, сопряженный к оператору Q относительно формы (дг, у) (7.63), имеем (Q*, Qy) = (Q'Qx, у). (32) Так как оператор Q' невырожден вместе с оператором Q, из (32) следует Q'Q = E, (33) т. е. Q' является обратным оператором для оператора Q. Обратно, из (33) следует (32) и далее (31), так что равенство (33) полностью определяет класс операторов, не изменяющих форму (д:, у). Эти операторы будем называть инвариантными относительно формы (д:, у).
7.76] § 7.7. изоморфизм пространств 233 7.74. Вместе с оператором Q обратный оператор Q"1 = Q' также является инвариантным, так как для любых х и у (Q'x, Q'y) = (QQ'x, у) = (х, у). Произведение двух инвариантных операторов Q и Т также является инвариантным оператором, так как для любых х иу (QT*, QTy) = (Tx, Ту) = (х, у). 7.75. Применяя инвариантный оператор Q к векторам еъ . . ., еп канонического базиса формы (х, у) с коэффициентами в!, ..., ея, мы получаем векторы /^Q^, ...,f„ = Qe„. (34) При этом ( 8, При k=j, </„/»> = «*„ Qek) = (ef, ek)= ( Q' ^ кф. Таким образом, /ь • -.,/„ естб также канонический базис формы (х, у) с теми же каноническими коэффициентами ei> • • •» 8«- Обратно, если /ь ..., /„ есть канонический базис формы (л:, у) с теми же каноническими коэффициентами ех, ..., ея, что и в базисе ех, ..., ея, то оператор Q, определенный по формулам (34), является инвариантным. Действительно, мы имеем ( е- при k = j, (Q'/.Q'*) = (/y./») = ^'») = {onPH*^y. Мы видим, что равенство (31) справедливо для любой пары базисных векторов. Отсюда, по линейности, оно справедливо для любой пары векторов х, у из К„, что и требуется. Итак, инвариантный оператор Q характеризуется тем, что всякий канонический базис пространства Кп (относительно формы (х, у)) он переводит снова в канонический базис с теми же самыми каноническими коэффициентами. 7.76. Найдем условия, определяющие матрицу любого инвариантного оператора в каноническом базисе формы (х,у). Пусть еъ ..., еп — такой базис и е1? ..., гп — соответствующие канонические коэффициенты. Пусть, далее,
234 ГЛ. 7. БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [7.76 Q-s= \\ q(J> \\—матрица оператора Q в этом базисе. Матрица сопряженного оператора имеет вид (7.63) .</> </) е J „«) Q' = \\<ii !l, 4i -j-яТ- Равенство (33) теперь можно записать в координатной форме 2-'Л <7* -2-е^/ ^* -6/ -\ о при у=И=*. Иначе говоря, Lrtfw /=l — при у = А, [ 0 при ]ф k. (35) Равенство (35) эквивалентно (33) и поэтому также может служить определением инвариантного оператора Q. Итак, матрица инвариантного оператора в любом каноническом базисе формы (л:, у) {инвариантная матрица) характеризуется тем, что сумма квадратов элементов ее у-го столбца с коэффициентами ej-1, •••, е^1 равна числу еу1 (у=1, ..., п), а сумма произведений соответствующих элементов двух различных столбцов с коэффициентами еь . . ., гп равна 0. Так как из (33) следует также QQ' = Е, то имеют место и равенства m m 2^4 kllm — 2^ 1—4k(l k — °m> k=i fe=i или (35') Мы получаем вторую характеристику инвариантной матрицы: сумма квадратов элементов ее у'-й строки с коэффициентами Ej, . . . , гп равна числу еу-, сумма произведений соответствующих элементов двух различных строк также с коэффициентами гъ . . . , гп равна 0,
7.82] § 7.&. полилинейные формы 235 § 7.8*. Полилинейные формы 7.81. По аналогии с билинейными формами можно рассматривать линейные функции от большего числа векторов (трех, четырех и более). Все они называются полилинейными формами. Определение. Функция А (хъ . . ., xk) от к векторных аргументов хъ xk, меняющихся в линейном пространстве К, называется полилинейной (точнее, k-линейной) формой, если она линейна по любому аргументу Xj(j— 1, . . . , k) при фиксированных значениях остальных аргументов хъ ... • • • » -^/-1» -*7Ч1' • • • > xk- Полилинейная форма A(jcx, х2, •••, xk) называется симметричной, если она не изменяется при перемене местами любых двух своих аргументов, и антисимметричной, если при перемене местами двух своих аргументов она изменяет знак. Примером полилинейной антисимметричной формы от трех векторов х, у, z (трилинейной формы) в пространстве V3 является смешанное произведение этих векторов. Примером полилинейной антисимметричной формы от п векторов в пространстве КУП xi — \а\ъ й12» . . . , а1п), X2z= )#2l» fl22» ' * • » ^2и|» Хп ~ \ап1> ап2> • • • » апп) является определитель А (х1, х2, • • • , хп) 11 12 "In п\ (36) Несколько более общим примером является произведение определителя (36) на фиксированное число а £ К- 7.82. Покажем, что всякая полилинейная антисимметричная форма А (хг, х2, хп) от п векторов хх, х{ . . . , хп в n-мерном линейном пространстве К„ с фиксированным базисом ех, е2, . . . , еп равна определителю (36) с некоторым постоянным множителем а£/(.
236 ГЛ. 7. БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [7.82 Обозначим через а величину А (е1г е2, ... , еп). Тогда легко подсчитать величину А (е^, е{^ . . . , ei ), где /1? /2, . .. ... , /„ — любые целые числа от 1 до п. Если среди этих чисел имеются два равных, то величина А (е,-, eiy ... , е( ) равна нулю, ибо при перестановке соответствующих аргументов она не изменяется, в то время как по свойству антисимметрии она должна изменить знак. Если все числа /1? /2, . . . , in различны, то, произведя столько перестановок соседних аргументов, сколько беспорядков в последовательности индексов /1? /2, ..., /„*),— обозначим это число через 7V, — можно добиться нормального расположения аргументов; отсюда А К, eit, .... *,и) = (-!)%. Пусть теперь п xi=2aVej (/=1> 2, ... , л) /=i есть произвольная система п векторов пространства К„. Составим полилинейную форму А (лг1? х2, ..., хп): А (х1, х%, • • • , хп) = Vi = l '2=1 «n=l J n «i, /2. .... /n=l Так как в каждом слагаемом получившейся суммы N означает число беспорядков в расположении вторых индексов элементов при нормальном порядке первых индексов, то каждое слагаемое есть один из членов определителя (36) с положенным этому члену знаком. Сумма всех этих членов равна поэтому самому определителю (36). Таким образом, наше утверждение доказано. *) Ср. доказательство теоремы 4.54.
7.91) § 7.9. формы в вещественном пространстве 237 В частности, мы показали, что смешанное произведение трех векторов х, у, z пространства V3 в любом базисе записывается как определитель 3-го порядка из координат этих векторов с коэффициентом, равным смешанному произведению базисных векторов. § 7.9. Квадратичные и билинейные формы в вещественном пространстве 7.91. У вещественных чисел определены знаки (-[-или —), поэтому для билинейных и квадратичных форм в вещественном пространстве теория может быть продвинута несколько далее, чем в пространстве над произвольным полем К. Согласно общей теореме 7.31 квадратичная форма А (х,х) в некотором базисе приводится к каноническому виду А(х, x) = X1r\l+...+kni\*. Среди чисел Kv . . . , Хп имеется столько отличных от нуля, каков ранг формы А (х, х) (7.33 б). Они положительны или отрицательны. Оказывается, что число положительных и число отрицательных канонических коэффициентов также не изменяются при изменении канонического базиса. Теорема. (Теорема инерции квадратичных форм.) Число положительных и число отрицательных коэффициентов в каноническом виде квадратичной формы А(х, х) являются инвариантами формы (т. е. не зависят от выбора канонического базиса). Доказательство. Пусть задана квадратичная форма А(х, х). В некотором базисе {е\ = {ev e2t ..., еп) она имеет вид А (*, *) = 2 aikUkf Л k=i где £1? £2, ..., \п— координаты вектора х относительно базиса {е\. Допустим, что она обладает двумя каноническими базисами {/} = {Д, /2, . . . , /„} и {g} = {gv g2, . . . , gn). Обозначим через v)v т)2, . .. , г\п координаты вектора х в базисе {/} и через хъ т2, ... , хп — в базисе {g}. Соответствующие формулы преобразования координат пусть
238 ГЛ. 7. БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [7.91 будут следующими: Л1 = Ьп1х-\- Ьи1»-\- .. . +blnt„; t1 = c115i ~\-cl2lo + ... +cln%n, Л Г)2 = ^2l?l~i_^2-2r-2-i- • • • -\-Ь?п±П> Т2 — С21*1 + С22*2 + • • • + С2//£//» I /37) Ч/ = b,llU 'I" ^,/2?2 -Г . • • -f ^,«S/i'. T;l = Crtlg! + C„2g.2 + . . . + Cn„g„. ; В базисе {/} форма А (х, х) имеет вид А(*, х) = ахЛ1+ • •• Н-алПл — a^ + i^+i—• • • — «яЛт> (3^> а в базисе {^j соответственно А (х, а:) ^ - PiT?^P2x?+ . . . + Рят*-Ря + 1т«+1- . . . -IV*- (39) Числа ах, а2, . . . , ат, рх, р.2, . . . , Р^ пред платаются поло ж и т е л ь н ы м и. Мы покажем, что к = р, т — q. Приравнивая правые части равенств (38) и (39) и перенося отрицательные члены в противоположные части равенства, мы получаем a^i + aoiiH- . . . +а,г!| + Ря+1^+1+ . . . + Р,т5 = - a* + i*lLi + • • • + «яЛт -!- Pit! + • • . + Ря^. (40) Допустим, что &</?. Рассмотрим тогда векторы х, удовлетворяющие условиям: 4i = 0, Л2 = 0, ... , Ла = 0. \ (4П Vi = 0' ••• ' ^ = °» Vi = 0' ••- тя = °- I Этих условий, очевидно, меньше чем л, так как к <р. Подставляя выражения y]1? . . . , г]^, т +1, . . . , tw через координаты {£} по формулам (37), мы получаем однородную систему линейных уравнений относительно координат {£}; число уравнений меньше числа неизвестных, и, следовательно, эта однородная система допускает ненулевое решение х~ {^i, ?2> • • • ■> £,/}• Но, с ДРУГОЙ стороны, всякий вектор х, удовлетворяющий условиям (41), в силу равенства (40) удовлетворяет и условиям т1 = т2= . .. =тя = 0. Вектор, для которого тх = т2 = . . . = хр = тр+1 — . . . = тп = 0, необходимо есть нуль-вектор, и для него все координаты {£} также должны быть равны нулю. Полученное противо-
7.92] § 7.9. ФОРМЫ В ВЕЩЕСТВЕННОМ ПРОСТРАНСТВЕ 239 речие показывает, что предположение k <C p не может осуществиться. В силу полной симметрии чисел k и р в рассматриваемой задаче также не может осуществиться и предположение /? < &. Отсюда k=p. Далее, если рассмотреть условия *i = 0, т2 = 0, . .. , хр = 0, *!* + ! = 0. ■■-.Л« = 0. Ля + 1 = 0, • .-,Л|, = 0, тем же приемом можно опровергнуть предположение т < q и по симметрии q < /я. Таким образом, окончательно получаем, что k=p, m = q, что и требовалось. 7.92. Полное число членов, входящих в канонический вид квадратичной формы А (х, х), т. е. ее ранг (7.336), называется также се индексом инерции; число положительных членов называется положительным индексом инерции, число отрицательных членов — отрицательным индексом инерции. Если при этом положительный индекс инерции равен размерности пространства, форма называется положительно определенной; иными словами, квадратичная форма положительно определенная, если все п ее канонических коэффициентов положительны. Тем самым положительно определенная форма в каждой точке пространства, кроме начала координат, принимает положительное значение. И обратно, если некоторая квадратичная форма в /z-мерном пространстве принимает всюду, кроме начала координат, положительные значения, то ее ранг равен п и положительный индекс инерции также равен п, т. е. форма положительно определенная. Действительно, для формы ранга, меньшего п, или имеющей меньшее, чем я, число положительных канонических коэффициентов, легко указать точки в пространстве, отличные от начала координат, где эта форма принимает отрицательное значение или нулевое. Например, форма ранга 2 в трехмерном пространстве А (л:, х) = Ц + Ц принимает нулевое значение на любом векторе с координатами сх-^0, 12ф0, £3 = 0. Форма ранга 3 в трехмерном пространстве А (л, х) = Ц-Ц + и принимает на тех же векторах отрицательные значения.
240 ГЛ. 7. БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [7.93 7.93. Теорема инерции, доказанная нами для квадратичных форм, непосредственно переносится и на симметричные билинейные формы: именно, число положительных и отрицательных коэффициентов канонического ей а (22) билинейной формы А (л:, у) не зависит от выбора канонического базиса. Поэтому для симметричной билинейной формы имеют смысл понятия положительного и отрицательного индексов инерции. Значения положительного и отрицательного индексов инерции билинейной формы А (х, у) и, следовательно, квадратичной формы А(х, х) могут быть определены по знакам угловых миноров матрицы формы в каком-либо базисе (если только эти миноры отличны от нуля) по формулам (24). Заметим, что в вещественном пространстве Rn всегда можно для данной квадратичной формы А (а:, х) найти канонический базис такой, что все канонические коэффициенты будут числами -\-\ или —1. Для этого, приведя форму А (л:, х) к виду А (л:, дг) = Х1т?+ ••• +^Др — — l^iTp+i— • • • — JVp+<7> г^е К • • •» V M-i. • • •» Vq положительны, мы совершим еще одно преобразование координат bp + i=l H-l^ + l» •••> Ър + д = V V'q^p + q* После этого преобразования форма принимает вид А (Л*, X) — С>1 -(-•••+ §р Ър+1 • • • Ьр+<7« Отсюда легко следует, что числа р и q в вещественном пространстве — единственные инварианты квадратичной фор' мыА(х,х) и соответствующей билинейной формы А(х,у): Теорема. Два пространства R' и R" с выделенными в них симметричными билинейными формами А {х', у') и А (х", у") являются А-изоморфными тогда и только тогда, когда пространства R' и R" имеют одинаковую размерность, а индексы инерции р', q формы А{х',у') совпадают соответственно с индексами инерции р", q" формы А (х", у"). Доказательство непосредственно следует из приведенных выше соображений и теоремы 7.72. 7.94. Следующие определения соответствуют определениям, приведенным в 7.92 для квадратичных форм.
7.95] § 7.9. формы в вещественном пространстве 241 Билинейная форма А (х, у) называется невырожденной, если ее ранг равен числу измерений пространства, иными словами, если в канонической записи формы А (х, у) А(х, у) = Л^ть + . .. + КЪпЧп все коэффициенты А,1? А,2, . .., Хп отличны от нуля. Если все эти коэффициенты, кроме того, положительны, форма А(х,у) называется положительно определенной. Положительно определенная билинейная форма А (х, у) характеризуется тем, что соответствующая квадратичная форма А (х, л:), согласно 7.92, принимает при каждом х фО положительное значение. По самому определению положительно определенная форма в пространстве Rn невырождена. Но так как в силу свойства А (л:, л;) > 0 она остается положительно определенной и на любом подпространстве R'c:R„, то в отличие от общей билинейной формы (7.15г) положительно определенная форма остается невырожденной на любом подпространстве R'c:R„. Если /х, ..., fk — любые k линейно независимых векторов, определитель D а (Л, Л) ... л (Л, Д) заведомо отличен от нуля. Ниже мы увидим, что число D всегда положительно. 7.95. Одним из важных примеров симметричной положительно определенной билинейной формы в пространстве V3 является скалярное произведение векторов х и у. Действительно, из определения скалярного произведения непосредственно вытекают соотношения (*, у) = (у, х), (х, х) = \х\2 > 0 при х Ф 0; первое из них показывает, что билинейная форма (л;, у) симметрична; второе — что соответствующая квадратичная форма принимает при каждом х т= 0 положительное значение и, следовательно, билинейная форма (ху у) положительно определена. В дальнейшем симметричные положительно определенные билинейные формы будут играть исключительную роль: именно, используя такие формы, мы в общем линейном пространстве получим возможность ввести понятия длин векторов и углов между векторами (гл. 8).
7.98J § 7.9. формы в вещественном пространстве 243 Lm тоже положителен. Но определитель формы А (х, у) в исходном базисе подпространства Lm есть как раз минор М. Следовательно, М > 0, и теорема полностью доказана. 3 а м е ч а м и е. Вместо углового минора во второй части доказательства можно было взять любой диагональный минор (5.53) без существенного изменения рассуждений. Таким образом, у матрицы положительно определенной формы любой диагональный минор положителен. 7.97. Для положительно определенной формы А (х, у) всегда существует канонический базис ег, ...,etn в котором все канонические коэффициенты равны -f- 1 (7.93). Поэтому два n-мерных вещественных пространства R'n и R"n с выделенными в них положительно определенными формами А (х\ у') и А (л*", у") в силу теоремы 7.72 всегда к-изоморфны. 7.98. В приложениях линейной алгебры к анализу (именно, в теории условных экстремумов) часто требуется решить следующую задачу: зная матрицу /4=||а;к|| билинейной симметричной формы А (дг, у), узнать, будет ли эта форма положительно определенной на подпространстве, заданном системой k независимых линейных уравнений 2 М/=о (i = l, 2, .... к\ к < п). Оказывается, что необходимым и достаточным условием для этого является положительность угловых миноров матрицы О 0 ... О Ьп Ьп ... bln А = (-1)* О Ь2\ Ь^ 0 *11 ьи 0 . h\ • ьгг • • • 0 bkl bk2 . .. bkl an al2 . .. bfo2 a2\ o.22 . • bkn . aln • <hn • • bkn anl an2 порядка 2fc + l, 2fc + 2, ..., k + n *) См. заметку Р. Я. Шостака в журнале «Успехи математических наук», 1954, т. 9, вып. 2 (60), стр. 199—206.
244 ГЛ. 7. БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ ЗАДАЧИ 1. Образуют ли элементы матрицы билинейной формы тензор (5.61), и если да, то какого типа? 2. Преобразовать квадратичную форму Ъ&ЛЫя + ЪЛх к каноническому виду. 3. Пусть р — положительный индекс инерции квадратичной формы A (jc, х) (заданной в пространстве R„) и q — ее отрицательный индекс инерции. Пусть заданы р положительных чисел Ях, Я2, ..., кр и q отрицательных чисел \лъ |о12, ..., \iq. Показать, что существует базис, в котором форма A (jc, jc) принимает вид А (*, x) = Xix\+ *2т| +... + VJ+ ^iTp+i+ • • • +N*l+g- 4. Показать, что у квадратичной формы ранга г всегда имеется по крайней мере один диагональный минор ранга г, отличный от нуля. 5. Преобразовать билинейную форму А (*, у) = £i% + Ел* + £2% + ЗЕоЛг + 2^з + 2?зЛ2 + 5?3Лз к каноническому виду. 6. Применить метод Якоби для преобразования билинейной формы А (*, у) = E^i —1^2 — ?гЛ 1 + 1хЪ + £зЛ 1 + 25аЛз + 2?зЛг + £зЛз + 5гЛ2 к каноническому виду. 7. Сформулировать условия, при которых симметричная матрица II Я/б II определяет отрицательно определенную билинейную форму. 8. Дана симметричная матрица А = \\ aik ||, обладающая свойствами flu > О, аи а12 #21 fl22 >0, ..., det||fl/fc|| >0. Доказать, что апп > 0. 9. Доказать теорему: полилинейная антисимметричная форма от /г + 1 векторов в /г-мерном пространстве Кп тождественно равна нулю. 10. Доказать теорему: полилинейная антисимметричная форма A (jcl, ..., jc„_j) от /г—1 векторов в /г-мерном пространстве записывается в любом базисе как определитель, первые п — 1 строк которого заполнены координатами векторов-аргументов, а последняя, /г-я, строка заполнена п фиксированными числами. И. Доказать, что всякая антисимметричная билинейная форма A (jc, y)^0 может быть всегда приведена к «каноническому виду» А (*, у) = охх2 — о2г1 + а3т4 — а4т3 + ... + o2k _ xx2k + o2kx2k _ х. 12. Доказать теорему: вещественная квадратичная форма А (х, #) = = Zj cifkXfXk неотрицательна при всех x£Rn тогда и только тогда, когда все диагональные миноры матрицы ^ = ||a;fe|| неотрицательны.
ЗАДАЧИ 245 Примечание. Для матрицы L . угловые миноры 6Х и ба равны 0, а соответствующая форма не является неотрицательной. Таким образом, условия 6L ^^ 0, б2^0 недостаточны для неотрицательности формы. 13. Пусть в пространстве Кл задана невырожденная билинейная симметричная форма A (jc, у). Пусть К'сК— подпространство размерности г. Доказать, что сопряженное подпространство К"сК имеет размерность п — г. 14. В пространстве R2 задана симметричная билинейная форма (jc, y) = %{(\i—^V Найти оператор, сопряженный (относительно этой формы) к оператору поворота с матрицей А = cos a sin а -sin а cos а 15. Пусть в пространстве К« выделена невырожденная форма (jc, у). Для квадратной системы линейных уравнений п 2 *//£*=*/ (/=1. ••■•п) (43) доказать «теорему Фредгольма»: система (43) имеет решение для тех и только для тех векторов b={bu ...,&„}, которые сопряжены ко всем решениям однородной системы 2*/*Л* = 0. (44) где || a)k || — матрица, сопряженная с || ajk \\ относительно формы (jc, у). Отсюда вывести, что число независимых линейных условий на вектор Ъ, необходимое и достаточное для разрешимости системы (43), равно размерности пространства решений однородной системы п 2*/*Б*=0 (/=1, ... , п). (45) k= 1 Примечание. Для общей системы j±aJklk=bj (/=1, ... , т) (46) k=i две указанные характеристики уже не совпадают: их разность, называемая индексом системы (46), равна т—п. 16. Показать, что всякая неотрицательная билинейная форма ранга г в пространстве R„ может быть представлена как сумма г неотрицательных билинейных форм ранга 1. 17. Показать, что всякая билинейная форма ранга 1 в пространстве К/; имеет вид A (jc, y) = f (x)-g(y), где / (jc) и g(x)— линейные формы. 18. Если А(х, у) = 2 ajkij^k и В (jc, y) = 2Libjkljr[k — неотрицательные билинейные формы в пространстве R„, то форма С (jc, y)=* ~^jajkbjk^jr\k также неотрицательна.
ГЛАВА 8 ЕВКЛИДОВЫ ПРОСТРАНСТВА §8.1. Введение Большое многообразие фактов, которыми богата геометрия, в значительной мере объясняется возможностью различных измерений — в основном возможностью измерения длин отрезков и углов между прямыми. В общем линейном пространстве мы еще не имеем способа производить такие измерения; и это, разумеется, суживает область нашего исследования. Желая наиболее естественным образом распространить на общие линейные пространства методы, связанные с возможностью измерений, мы обратимся к определению скалярного произведения двух векторов, принятому в аналитической геометрии (и пригодному, конечно, только для обычных векторов — элементов пространства V3). Это определение гласит: скалярное произведение двух векторов есть произведение длин этих векторов и косинуса угла между ними. Следовательно, это определение уже основано на возможности измерения длин векторов и угла между ними. Но, с другой стороны, зная скалярное произведение любой пары векторов, мы можем восстановить длины их и угол между ними; действительно, квадрат длины вектора равен скалярному произведению этого вектора с самим собой, а косинус угла между двумя векторами — отношению их скалярного произведения к произведению их длин. Следовательно, в понятии скалярного произведения потенциально заключены и возможность измерения длин, и возможность измерения углов, а вместе с ними и вся область геометрии, связанная с измерениями («метрическая геометрия»). В общем линейном пространстве нам легче будет сначала ввести понятие скалярного произведения двух векторов и затем из имеющегося уже понятия скалярного произведе-
§8.1. ВВЕДЕНИЕ 247 ния получить определения длины вектора и угла между векторами. Посмотрим, какие свойства обычного скалярного произведения можно использовать для построения аналогичной величины в общем линейном пространстве. Вначале ограничимся случаем вещественных пространств. В 7.95 мы уже видели, что в пространстве V3(2.15 a) скалярное произведение (х, у) есть билинейная форма от векторов х и у, симметричная и положительно определенная. Формы с такими свойствами, вообще говоря, имеются и в общем вещественном линейном пространстве. Рассмотрим в вещественном линейном пространстве произвольную фиксированную билинейную форму А (х,у), симметричную и положительно определенную. Назовем ее (скалярным произведением» векторов х и у. После этого определим длину каждого вектора и угол между каждыми двумя векторами по тем же правилам, по которым длина вектора и угол между векторами вычислялись через скалярные произведения в пространстве V3. Разумеется, только дальнейшее исследование может показать, насколько удачно это определение; и мы увидим на протяжении этой и следующих глав, что приведенное определение на самом деле позволит распространить на общие линейные пространства методы метрической геометрии и тем самым значительно усилить средства исследования математических объектов, встречающихся в алгебре и анализе. Отметим здесь одно существенное обстоятельство. Исходную билинейную и положительно определенную форму можно выбрать в данном линейном пространстве многими различными способами. Длина некоторого вектора л', вычисленная с помощью одной такой формы, будет отличаться от длины этого же вектора х, вычисленной с помощью другой формы; то же относится и к углу между двумя данными векторами. Таким образом, длина вектора и угол между векторами не определяются однозначно. Но эта неоднозначность не должна нас смущать; ведь ничего нет удивительного в том, что одному и тому же отрезку на прямой, измеренному различными масштабами, приписываются в результате этих измерений в качестве его длины различные числа. Можно сказать, что выбор исходной билинейной Симметричной и положительной формы аналогичен выбору
248 ГЛ. 8. ЕВКЛИДОВЫ ПРОСТРАНСТВА [8.21 такого «масштаба» для измерения длин векторов и углов между ними. Вещественное линейное пространство с выбранной в нем «масштабной» билинейной симметричной положительно определенной формой будем в дальнейшем называть евклидовым. Линейное пространство без заданной «масштабной» формы будем называть аффинным. Случай комплексного пространства мы рассмотрим в гл. 9. § 8.2. Определение евклидова пространства 8.21. Вещественное линейное пространство R называется евклидовым, если 1) имеется правило, которое позволяет построить для каждых двух векторов х иу из R вещественное число, называемое скалярным произведением векторов х и у и обозначаемое (х, у); 2) это правило удовлетворяет следующим требованиям: а) (х, у) = (у, х) (переместительный закон), б) (х, y-{-z) = (x, у)-\-(х, z) (распределительный закон), в) (Хх, у) = Х(х, у) для любого вещественного числа X, г) (х, х)уО при хфО и (х, х) = 0 при х = 0. Аксиомы а) — г) утверждают в совокупности, что скалярное произведение векторов х и у есть билинейная форма (б — в), симметричная (а) и положительно определенная (г). И обратно, всякая форма, обладающая этими свойствами, может быть принята за скалярное произведение. Поскольку скалярное произведение векторов х иу является билинейной формой, для него имеет место формула 7.11(2). В данном случае эта формула принимает следующий вид: (k m \ k m 1 а,-*,, 2 P/Jy =2 2 «/Ру (*/. У;)- 0) Здесь хъ х2, ... , xk, yv y2, ... , ^ — произвольные векторы евклидова пространства R, av a2, ... , ал> Pi, Рг> •••» Р/л — любые вещественные числа. 8.22. Примеры. а. В пространстве V3 свободных векторов (2.15а) скалярное произведение вводится по правилам аналитической геометрии. Условия а) — г) выражают собой основное
8.31] § 8.3. основные метрические понятия 249 свойства скалярного произведения; они доказываются в векторной алгебре. б. В пространстве Rn (2.156) мы введем скалярное произведение векторов х=(1г, £2, ... , 1п) иу = (г)г, г|2, .. . , г\п) так: (*, у) = 1^ + 12Ц2 + . . . + lnt]n. (2) (Это определение обобщает известную формулу выражения скалярного произведения векторов в трехмерном пространстве через координаты сомножителей в ортогональной системе координат.) Легко проверить, что требования а) — г) удовлетворяются. Заметим, что формула (2) — не единственный способ введения скалярного произведения в Rn. Все возможные способы введения скалярного произведения (т. е. симметричной билинейной положительно определенной формы) в пространстве Rn мы описали фактически в 7.96. в. В пространстве /?(а, Ь) вещественных непрерывных функций на отрезке а^^^£ (2.15в) мы можем ввести скалярное произведение функций х (t) и у (t) по формуле ь (*, у) = J х (t) у (t) dt. (3) а Легко проверить, применяя основные правила интегрирования, что требования а) — г) удовлетворяются. В дальнейшем будем обозначать пространство R(a, Ь) со скалярным произведением по формуле (2) через /?2 (#, Ь). § 8.3. Основные метрические понятия Имея скалярное произведение, мы можем дать определение и основных метрических понятий — длины вектора и угла между двумя векторами. 8.31. Длина вектора. Длиной вектора х в евклидовом пространстве R мы будем называть величину \x\=+VWx). (4)
250 ГЛ. 8. ЕВКЛИДОВЫ ПРОСТРАНСТВА [8.32 Примеры. а. В пространстве V3 наше определение длины вектора приводит к обычному значению длины вектора. б. В пространстве Rn для вектора х = (\±, £2, ..., £л) получается выражение длины в виде 1*1=+КБ!+£!+■•• + &;;. в. В пространстве R2(a, b) длина вектора х = д;(/) оказывается равной а Эту величину обозначают иногда || х (t) \\ и называют нормой функции х (t) (чтобы избежать ложных ассоциаций, связанных со словами <длина функции.)). 8.32. Из аксиомы г) вытекает, что у каждого вектора х евклидова пространства R существует длина; у всякого вектора х Ф 0 длина положительна, у нуль-вектора длина равна нулю. Равенство | ах | = V(ax, ах) = V&2 (х, х) = \ a \V{x, x) = \a\\x\ (5) показывает, что абсолютную величину числового множителя мож*о выносить за знак длины вектора. Вектор х, имеющий длину 1, называется нормированным. Всякий ненулевой вектор у можно нормировать, т. е. умножить на такое число А,, чтобы в результате получился нормированный вектор. Действительно, уравнение (^1=1 относительно X имеет решение, например, Множество FczR называется ограниченным, если длины всех векторов х £ F ограничены фиксированной константой. Примерами ограниченных множеств являются единичный шар пространства R — совокупность всех векторов х £ R с длиной, не превышающей единицы, а также единичная сфера — совокупность всех векторов х £ R с длиной, равной 1.
8.34] § 8.3. основные метрические понятия 251 8.33. Угол между векторами. Углом между парой векторов х и у мы будем называть тот угол (в пределах от 0 до 180°), косинус которого равен отношению т—j-\—i • I х II У I Для обычных векторов (в пространстве V3) наше определение согласуется с обычным выражением угла между векторами через скалярное произведение. Чтобы это определение можно было применить в общем евклидовом пространстве, необходимо доказать, что указанное отношение по абсолютной величине не превосходит единицы, каковы бы ни были векторы х и у. Для доказательства этого утверждения рассмотрим вектор Хх—у, где X— вещественное число. В силу аксиомы г) при любом X (Хх—у, Хх—у)^0. (6) Используя формулу (1), мы можем написать это неравенство в виде Х*(х, х)-2Х(х,у) + (у,у)^0. (7) В левой части неравенства стоит квадратный трехчлен относительно X с постоянными коэффициентами. Трехчлен этот не может иметь различных вещественных корней, так как тогда он не мог бы сохранять знака для всех значений X. Поэтому дискриминант {х,у)2 — (х, х) (у, у) этого трехчлена не может быть положительным. Следовательно, {х,у)2<{*, х) {у, у), откуда, извлекая квадратный корень, получаем К*. .у)К1*1Ы. (8) что и требовалось. Неравенство (8) называют неравенством Коша — Буня- ковского. 8.34. Выясним, когда в неравенстве (8) возможен знак равенства. Если векторы х и у коллинеарны, т. е., например, у = Хх, X£R, то, очевидно, \(х,у)\ = \(х,Кх)\ = \Ц(х,х) = \Х\\х\* = \х\\у\.
252 гл. 8. евклидовы пространства [8.35 Покажем, что и обратно, если неравенство (8) для некоторой пары векторов х и у обратилось в равенство, то эти векторы х и у коллинеарны. Если имеет место равенство К*..у)1 = МЫ. то дискриминант квадратного трехчлена (7) равен нулю и, следовательно, трехчлен имеет один вещественный корень XQ. Мы получаем, таким образом, V0(x, х) — 2Х0(х,у) + (у,у) = (Х0х—у, Кх—у) = °, откуда в силу аксиомы г) находим, что Х0х—у = 0, или у = XQx. Итак, абсолютная величина скалярного произведения двух векторов тогда и только тогда равна произведению их длин, когда эти векторы коллинеарны. Примеры. а. В пространстве V3 неравенство Коши — Буняковского, очевидно, вытекает из самого определения скалярного произведения как произведения длин векторов и косинуса угла между ними. б. В пространстве Rn неравенство Коши — Буняковского имеет вид |svJ<l/ tv,y £л?; (9) оно справедливо для любой пары векторов л: = (^1, £2, •••» £«) и У — Oli» Лг» •••>г\п) или» чт0 то же самое, для любых двух систем вещественных чисел |1? £2, ..., \п и r\v r]2, ..., г\п. в. В пространстве /?2 (я, Ь) неравенство Коши — Буняковского имеет вид I ь ^x(t)y(t)dt Iа 8.35. Ортогональность. Векторы х и у называются ортогональными, если (х,у) = 0. Таким образом, понятие ортогональности векторов х и у совпадает с понятием сопряженности (7.41а) этих векторов относительно билинейной формы (х,у). Если х Ф 0 и у Ф 0, то это определение в соответствии с общим определением угла между < x2(t)dt V] y*(t)dt. (Ю)
8.36] § 8.3. основные метрические понятия 253 двумя векторами (8.33) означает, что х и у образуют угол в 90°. Нулевой вектор оказывается ортогональным к любому вектору х £ R. Примеры. а. В пространстве Rn (8.22 б) условие ортогональности векторов х = (llt 52 L) и У = Oil» Лг, • • •, Л«) имеет ВИД Si^i + Е2Л2 + ... + Е«*Пи = о- Например, векторы ех= (1, 0, . . ., 0), е2 = (0, 1, 0, . . ., 0), ... ...5 etl~(0, 0, ..., 1) попарно взаимно ортогональны. б. В пространстве /?2(#, Ь) условие ортогональности векторов x — x(t) ny—y(t) имеет вид ъ ^x(t)y(t)dt = 0. а Читатель легко проверит, вычислив соответствующие интегралы, что в пространстве R2(—я, я) любые два вектора «тригонометрической системы/; 1, cos/, sin/, cos 2/, sin 2/, ..., cos nt, sin/z/,... взаимно ортогональны. 8.36. Приведем несколько простых утверждений, связанных с понятием ортогональности. а. Лемма. Взаимно ортогональные ненулевые векторы xv x2, • • •, xk линейно независимы. Доказательство. Допустим, что эти векторы линейно зависимы; тогда имеет место равенство С1х1 + С2х2 -f . . . + Ckxk = 0, где, например, Схф0. Умножим это равенство скалярно на л:1; в силу предположения о взаимной ортогональности векторов хъ х2, ..., xk мы получим С1(х1, х1) = 0. Отсюда (х1х1) = 0 и, следовательно, хг есть нулевой вектор в противоречие с предположением. Результат этой леммы мы будем тогда использовать в такой форме: если сумма взаимно ортогональных векторов равна нулю, то каждое из слагаемых равно нулю.
254 гл. 8. евклидовы пространства [8.37 б. Лемма. Если векторы yL, у2, ..., ук ортогональны к вектору х, то любая линейная комбинация о.хух -- сх,.,у2 + . .. *..-\-akyk также ортогональна к вектору х. Действительно, (aj>'i + . . . + akyk, x) = аг (уъ х) + . . . + ак (yk, x) = 0; следовательно, вектор а1у1-\- . . . -ra,kyk ортогонален к вектору х, что и утверждалось (ср. 7Ale). Совокупность всех линейных комбинаций а1у1-\-а2у2-\-... . . . + cx,kyk образует подпространство L = L (yv у2, . . ., yk)— линейную оболочку векторов уъ у2, . .., yk (2.51). Следовательно, вектор х ортогонален к каждому вектору подпространства L. В таких случаях мы будем говорить, что вектор х ортогонален к подпространству L. Вообщ,е, если F cz R — произвольное множество векторов в евклидовом пространстве R, то мы будем говорить, что вектор х ортогонален к множеству F, если он ортогонален к любому вектору из F. Совокупность G всех векторов jt, ортогональных к множеству F, в силу той же леммы б сама составляет подпространство в пространстве R. Чаще всего такая ситуация встречается в том случае, когда F есть подпространство; тогда подпространство G называется ортогональным дополнением подпространства F. 8.37. Теорема Пифагора и ее обобщение. Пусть векторы х и у ортогональны; тогда по аналогии с элементарной геометрией вектор х -гу можно называть гипотенузой прямоугольного треугольника, построенного на векторах х и у. Умножая х-~у скалярно на себя и Используя ортогональность векторов х и у, мы получаем I х +у |2 - (х + у, х +у) = (х, х) + 2 (х, у) + (у, у) = = (*> *) + (}>,У)=-\х\2+\у\2. Мы доказали тем самым в общем евклидовом пространстве теорему Пифагора: квадрат гипотенузы равен сумме квадратов катетов. Нетрудно обобщить эту теорему на случай любого числа слагаемых. Именно, пусть векторы хъ х2, • . . ..., хк взаимно ортогональны и z — хг~\- х2-[г . . . -J- хк\
8.39J § 8.3. основные метрические понятия 255 тогда М2=(*1 + *2+ • •• +*Л, *! + Х2+ ... +Xk) = = |^l|2+l*2|2+... + l^|2. ("J 8.38. Неравенства треугольника. Если х и у — произвольные векторы, то по аналогии с элементарной геометрией вектор х-\-у естественно называть третьей стороной треугольника, построенного на векторах х и у. Используя неравенство Коши — Буняковского, мы получаем | х +у |2 = (х+у, х +у) = (х, х) + 2 (х, у) + (у, у), <\х\* + 2\х\\у\ + \у\*=(\х\ + \у\)*9 >\х\*-2\х\\у\+\у\*=(\х\-)у\)*9 или 1*+.У|<И + Ы. (12) \х^У\>\\х\-\у\\. (13) Неравенства (12) — (13) называются неравенствами треугольника. Геометрически они означают, что длина любой стороны всякого треугольника не больше, чем сумма длин двух других сторон, и не меньше, чем абсолютная величина разности длин этих сторон. 8.39. Мы могли бы, далее, последовательно переносить на евклидово пространство остальные теоремы элементарной геометрии. Но в этом нет нужды. Введем понятие евклидова изоморфизма между евклидовыми пространствами R' и R": именно, мы будем говорить, что R' и R" евклидово- изоморфны, если они изоморфны как вещественные линейные пространства (2.71) и, кроме того, для любой пары соответствующих векторов х', у' в R' и х", у" в R" выполняется равенство (*', /) = (х", у"). Очевидно, что всякая геометрическая теорема, — так мы будем называть теорему, основанную на понятиях линейного пространства и скалярного произведения, — доказанная для пространства R', будет справедлива и для изоморфного ему пространства R". Теперь заметим, что в силу теоремы 7.97 всякие два евклидова пространства равной размерности
256 ГЛ. 8. ЕВКЛИДОВЫ ПРОСТРАНСТВА [8.41 п евклидово-изоморфны. Следовательно, всякая геометрическая теорема, справедливая в /z-мерном евклидовом пространстве R^ будет справедливой и в любом другом л-мер- ном евклидовом пространстве R'„. Геометрические теоремы элементарной геометрии, т. е. геометрические теоремы в пространстве R3, по доказанному, остаются справедливыми в любом трехмерном подпространстве любого евклидова пространства. Таким образом, все геометрические теоремы элементарной геометрии справедливы в любом евклидовом пространстве. § 8.4. Ортогональный базис 8.41. Теорема. В n-мерном евклидовом пространстве Кп существует базис из п ненулевых взаимно ортогональных векторов. Доказательство. Для билинейной формы (х, у), как и для всякой симметричной билинейной формы в /2-мерном пространстве, существует канонический базис (7.43) Уъ Уъ •••» Уп- Условие {У{,Ук)~® каноничности базиса при 1ф\г есть в данном случае условие ортогональности векторов у{ и yk\ таким образом, канонический базис Уъ Уъ •••» Уп образуется в данном случае из п взаимно ортогональных векторов. Это и доказывает теорему. В § 8.6 мы рассмотрим способы эффективного построения ортогонального базиса. 8.42. Векторы уъ у2, . . ., уп ортогонального базиса удобно нормировать, разделив каждый из них на его длину. Мы получаем после этого в пространстве R ортогональный и нормированный базис (иногда говорят «ортонормирован- ный» или «ортонормальный» базис). Пусть еъ е2, ..., еп — произвольный ортогональный нормированный базис в евклидовом пространстве Rn. Каждый вектор х £ Rn можно представить в виде x = l1e1 + l2e2+...+lnen1 (14) где £1? £2, ..., \п— координаты вектора х. Мы будем также называть эти координаты коэффициентами Фурье вектора х относительно ортогональной и нормированной системы еъ е2, ..., еп. Умножая равенство (14) скалярно на
8.51] § 8.5. задача о перпендикуляре 257 €iy находим выражение коэффициента ?-,•: &,•=(*,*/) (/= 1, 2, ...,л). (15) Если ^ = T]i^i + rl2^2+ • • • + rbA*— любой другой вектор пространства Rn, то по формуле (1) мы получаем (*, У) = li*\i + h^2 + • • • + 5„ЛЛ- (16) Итак, в нормированном ортогональном базисе скалярное произведение двух векторов равно сумме произведений их соответствующих координат — коэффициентов Фурье. В частности, полагая у — х, получим \х\* = (х,х) = Ц + Ц+...+11 (17) § 8.5. Задача о перпендикуляре 8.51. Рассмотрим в евклидовом пространстве R некоторое конечномерное подпространство R' и вектор /, вообще говоря, не входящий в подпространство R'. Поставим задачу найти разложение /=*+А, (18) где вектор g принадлежит подпространству R', а вектор h ортогонален к этому подпространству. Вектор g, участвующий в разложении (18), называется проекцией вектора f на подпространство R', а вектор h — перпендикуляром, опущенным из конца вектора f на подпространство R'. Такие названия связаны с привычными нам геометрическими ассоциациями*). Решение этой задачи фактически было дано еще в 7.54, для любой симметричной билинейной формы, невырожденной на подпространстве R'. Так как положительно определенная форма (х, у) невырождена на любом подпространстве R'czR (7.94), то существование решения нашей задачи, вместе с единственностью, следует из 7.54. Как мы видели в 7.55, наличие разложения (18) показывает, что все пространство R есть прямая сумма подпространства R' и его ортогонального дополнения R". *) И предназначены только для того, чтобы вызывать такие ассоциации. Поскольку понятие «конец вектора» не фигурирует в пашей аксиоматике, не следует искать в этом названии логического смысла. 9 Г. Е. Шилов
258 ГЛ. 8. ЕВКЛИДОВЫ ПРОСТРАНСТВА [8.52 Прямая сумма, слагаемые которой ортогональны, называется ортогональной прямой суммой; мы построили, таким образом, разложение R в ортогональную прямую сумму R' и R". Если размерность пространства R равна п, а размерность R' равна &, то размерность R" равна п — k, поскольку размерность прямой суммы есть сумма размерностей слагаемых (2.47а). Заметим, что задача решается и в том случае, когда вектор / лежит в подпространстве R'. В этом случае решение имеет вид /=/+о. Другого решения, очевидно, нет: если бы мы имели / = g-\-h, g€.R', h£R", то было бы также h=f—g£R', откуда h = 0, g = f. 8.52. Применяя к разложению (18) теорему Пифагора (8.37), получаем 1/12 = кГ2+И2. (19) откуда вытекает, что справедливо неравенство 0<|А|<|/|, (20) геометрически выражающее тот факт, что длина перпендикуляра не превосходит длины наклонной. Отметим те случаи, когда в одном из неравенств (20) имеет место знак равенства. Условие 0 -- \h\ равносильно условию /= g-{- 0 = g, которое означает, что/ входит в подпространство R'. Условие |/z| = |/|, согласно теореме Пифагора, показывает, что g—О и, следовательно, /=0 + й = й; таким образом, / ортогонален к подпространству R'. Итак, равенство \h\~0 означает, что вектор / входит в подпространство R'; равенство |/&| = |/| означает, что вектор/ ортогонален к этому подпространству. При всяком ином расположении вектора / длина вектора h будет положительной величиной, меньшей чем длина вектора /.
8.53] § 8.5. задача о перпендикуляре 259 Пусть теперь еъ ..., ek — ортонормальный базис в под- k пространстве R' и пусть g = ^a-gj. Тогда по 8.42 (17) /=1 Подставляя это значение \g\2 в равенство (19), получаем В частности, для любой (конечной) ортогональной нормированной системы £1? е21 . . ., ek и любого вектора / мы получаем неравенство 2>К1Л2. которое называется неравенством Бесселя. Геометрический смысл его очевиден: квадрат длины вектора / не меньше, чем сумма квадратов его проекций на любые k взаимно ортогональных направлений. 8.53. В приложениях требуется иногда дать эффективное решение задачи о перпендикуляре, когда в подпространстве R' дан некоторый (вообще говоря, не ортогональный и не нормированный) базис {Ьъ /?2, •••, bk} — {b\. Чтобы получить это решение, разложим искомый вектор g по базису {/;}, и подчиним вектор h=f—g условию ортогональности со всеми векторами Ьъ Ь2, ..., bk. Мы получим следующую систему уравнений: {b,bl) = (f-g,bl) = = (/, *i) - Pi Фъ bt) - р2 (Ьг, Ьг) - ... - pft (bk, bt) = 0, (h,b2) = (f-g,b2) = = (/, b2) - Px (blt 1>г) - р2 (b,, bt)—...— p, (bk, bt) - 0, [h,bk) = (f-g,bk) = = (/. bh) - Pi (bt, bk) - p2 (bi% bk)-...-fo (bk, bk) = 0 9*
260 ГЛ. 8. ЕВКЛИДОВЫ ПРОСТРАНСТВА [8.54 с определителем I (*1, Ьг) (ft2> Ьг) ... (&л, Ьх) I д I (*1, &2) (*2> &2> • '• (*А> &2> - \(bi,bk) \blih)\\.\bhX) I Определитель D, как определитель матрицы положительно определенной формы (х, у) в базисе Ьъ ..., йл, отличен от нуля (7.96). Разрешая систему по правилу Крамера, получаем выражения для коэффициентов |J. (у'=1, 2, ..., п): (Ьг, Ьг) ... (/>,•_!, Ьг) (/, Ьг) (&/+1> ftx) ... (ft*, &х) I (*1,*2) ••• (&/-1, »2) (f,b2)(bJ+1,b2) ... (ft„ft2) (их, ftk)'.!. '(ft,_lf йа)' i/,'ftA') (&/+1i ьк)'..'. \bk, ьк) I 8.54. Задачу о перпендикуляре можно поставить не только для подпространства, но и для гиперплоскости. В этом случае она формулируется так: в евклидовом пространстве R даны гиперплоскость R", полученная параллельным сдвигом некоторого подпространства R', и вектор /; требуется доказать, что существует и единственно разложение /=g+h, (21) где g принадлежит гиперплоскости R"*), а вектор h ортогонален подпространству R'. Геометрический смысл этого разложения ясен из рис. 1,я. В разложении (21) слагаемые, вообще говоря, уже не ортогональны. Эту задачу легко свести к задаче 8.51. Действительно, если в гиперплоскости R" фиксировать любой вектор /0 и вычесть его из обеих частей равенства (21), то мы получим задачу о разложении вектора /—/0 на слагаемые g—/0 и /г, первое из которых принадлежит подпространству R', а второе ортогонально к этому подпространству (см. рис. 1, б). В силу результата 8.51 такое разложение существует; *) Геометрически это означает, что конец вектора g лежит в гиперплоскости R" (а его начало, как всегда,— в начале координат). Не следует представлять себе весь вектор g лежащим в гиперплоскости R"! h=i
8-6,l § 8.6. ОБЩАЯ ТЕОРЕМА ОБ ОРТОГОНАЛИЗАЦИИ 261 Двух разложений указанного™ { h СЛУЧЗе НЗЛИЧИЯ мы „мели бы /=^ + А1 = ^ + й2 ° = tei—gi) + {hl — ha). Здесь gl-gi принадлежит подпространству R', a h __h ортогонально этому подпространству. Отсюда * „ с=А1—А, = о, что и требуется. отсюда ft_g^ § 8.6. Общая теорема об ортогонализации вом?ро;т^анстТеСг1Н1еОРзТн0ач0енаЛЬНЫХ СИСТем В ев™" теорема: основное значение имеет следующая общая Пу1?°£Х' (ТГРеМа °б оР.^гоналнзации.) 2. -., хк, ...-некоторая последовательность
262 ГЛ. 8. ЕВКЛИДОВЫ ПРОСТРАНСТВА [8.61 векторов евклидова пространства R (конечная или бесконечная). Обозначим через Lk — L (хх, х.2, ..., хк) линейную оболочку первых k векторов этой системы. Утверждается, что существует система векторов уг, у2, ..., yk, ..., обладающая следующими свойствами: 1) Для любого натурального k линейная оболочка L'k векторов у1} у2, ..., yk совпадает с подпространством Lk. 2) Для любого натурального k вектор yk + i ортогонален к подпространству Lk. Доказательство. Положим yx = xv Очевидно, что при этом выполнено условие Далее будем доказывать теорему по индукции: предположим, что уже построено k векторов уъ у2, . . ., ук, удовлетворяющих поставленным условиям, и построим вектор ук + 1 так, чтобы он также обладал требуемыми свойствами. Пространство Lk конечномерно, и поэтому в силу 8.51 существует разложение **+1 = Л + А*. (22) где вектор gk входит в подпространство Lk, а вектор hk ортогонален к этому подпространству. Мы положим yk + 1 — hk. Проверим выполнение условий теоремы ортогонализации для определенного таким образом вектора yk+v Подпространство Lk, по предположению индукции, содержит векторы уъ у2, . . ., ук; поэтому и более широкое подпространство Ц + 1 содержит эти векторы; кроме того, из формулы (22) вытекает, что Ц + 1 содержит вектор hk=yk + 1. Таким образом, подпространство Lk + 1 содержит все векторы Уъ • • •» Ук + ъ а вместе с ними и всю их линейную оболочку L'k+1. Но и обратно, подпространство L'k+1 содержит векторы Хц х2, ..., хк и, как показывает равенство (22), содержит и вектор хклЛ\ отсюда вытекает, что L'k+1 содержит все подпространство Lk + 1. Следовательно, Lk+1 = Lk + lJ и первое условие теоремы ортогонализации выполнено. Выполнение же второго условия очевидно по самому построению вектора yk + 1 = hk. Индукция, таким образом, проведена, и тем самым теорема полностью доказана.
8.64] § 8.С. ОБЩАЯ ТЕОРЕМА ОБ ОРТОГОНАЛИЗАЦИИ 263 8.62. Неравенство (20) в данном случае принимает вид 0<l.V* + i|<|** + i|- (23) При этом, как показано в 8.52, равенство 0 = |j;fe + 1| означает, что вектор xk + l принадлежит к подпространству Lk и, следовательно, связан линейной зависимостью с векторами хъ х2, ..., хк. Противоположное равенство \Ук + \ I ~ I xk-\ 11 означает, что вектор xk + 1 ортогонален к подпространству Lk, и, следовательно, ортогонален к каждому из векторов xv х2, ..., xk. 8.63. Заменами е. Всякая система векторов гъ z2, ... .. ., zk, . . ., удовлетворяющая условиям теоремы ортогонализации, совпадает с точностью до числовых множителей с системой з>1, >'-2, • • •, У^ - - - ■> построенной при доказательстве этой теоремы. Действительно, вектор zk + l должен принадлежать к подпространству Lk + 1 и при этом должен быть ортогонален к подпространству Lk. Первое из этих условий приводит к существованию разложения *А + 1 = С1У1 + С'2У2 + ••• + Ckyk + Ck + 1yk + 1 =yk + Ck + 1yk + l9 ™e Ук = с1Ух+ • • - + с^леЦ, a ck + 1yk + 1 ортогонален к Ц. Второе условие в силу 8.52 приводит к утверждению, что yk = 0 и, следовательно, Zk + 1~ Ск + 1Ук + И что и требуется. 8.64*. Многочлены Лежандра. Рассмотрим в евклидовом пространстве /?2 (—1, -;-1) систему функций x0(t)=^\, x1(t) = t, . .., xk(t) = tk, ... и применим к ней теорему ортогонализации. Подпространство Lk = L (1, t, ... ..., fk) в данном случае, очевидно, совпадает с совокупностью всех многочленов степени n^k. Функции л:0(/), ... ..., xk(() линейно независимы (2.22г), поэтому функции «Уо(0, ЗМО* •••> получаемые путем ортогонализации, все отличны от нуля в силу 8.52. По самому построению функция yk (/) должна быть многочленом k-vi степени от t. В частности, непосредственное вычисление по методу
264 гл. 8. евклидовы пространства [8.64 теоремы ортогонализации дает J>o(0 = l, yi(*) = t, y2(t) = t*-±, y3(*) = t*-jt и т. д. Эти многочлены были введены в 1785 г. французским математиком Лежандром в связи с задачами теории потенциала. Общая формула для многочленов Лежапдра была найдена Родригом в 1814 г. Именно, оказалось, что многочлен yn(t) с точностью до числового множителя равен многочлену Рп W ■■= Щй №-')"] (л = 0, 1, 2, ... )• (24) Мы воспользуемся для доказательства этого предложения замечанием 8.63. Именно, мы покажем, что многочлен pn(t) удовлетворяет условиям теоремы ортогонализации; в силу указанного замечания мы будем для каждого п иметь равенство Pn(t) = cnyn(t), что нам и нужно. а. Линейная оболочка векторов pQ(t), Pi(t), ..., pn(t) совпадает с совокупностью всех многочленов до п-й степени. В самом деле, как видно из формулы (24), многочлен pk(t) есть, очевидно, многочлен точно k-Pi степени от t; в частности, Ро (0 = Яоо> с2 \ (25) Рг (0 = а2о + а2^ + <W Pk (О = аы + ak\t + ■■■+ akktk, • •• •• Pn (0 = *n0 + *Ш* + • • • + ***** + • • • + в«/. причем старшие коэффициенты aQQ, alv . .., ann отличны от нуля. Таким образом, все многочлены Ро(0>/МО> • • •» Рп (0 входят в линейную оболочку функций 1, t, ...,/", которая, очевидно, есть совокупность Ln всех многочленов от t не выше п-и степени. Так как матрица линейных соотношений (25) имеет определитель а00аи. . .апп, отличный от нуля, то и, обратно, функции 1, /, /2, ..., tn могут быть линейно выражены через pQ(t), Pi(t), • •-, Р,Л*)> поэтому линейная оболочка L[p0(t), Pi(t), ..., Pn(i)\ совпадает
8.64] § 8.6. ОБЩАЯ ТЕОРЕМА ОБ ОРТОГОНАЛИЗАЦИИ 265 с линейной оболочкой 1(1, t, t2, ..., tn) и, следовательно, совпадает с совокупностью Lm что и требовалось. б. Вектор pn(t) ортогонален к подпространству Ln_v Достаточно проверить, что многочлен рп (t) ортогонален в /?2(—1, 1) к функциям 1, t, ..., tn~x. При доказательстве мы будем использовать формулу интегрирования по частям в определенном интеграле, предполагаемую известной из анализа. Производные, входящие в эту формулу, для многочленов суть те же самые производные, которые мы рассматривали в 6.73а с чисто алгебраической точки зрения. В частности, многочлен [(*а-1)»] = (*-1)»(*+1)» в силу 6.7Зв при t = ±\ имеет равные 0 производные порядков 0, 1, . . ., п— 1. Итак, будем вычислять скалярное произведение tk и pn(t). Интегрируя по частям, мы получаем + 1 (tk,PnV))= ^tk[(t*-\)»}Mdt = -1 +1 Внеинтегральный член полученного выражения в силу сказанного выше обращается в нуль. Оставшийся интеграл снова берем по частям, и продолжаем этот процесс, пока показатель при t не снизится до нуля: (<*, рп(0) = -«*-1 [са- 1)"](п_2)|!| + +1 + ft(ft —1)J t*-*[{p — !)»]<»-»<tt + 1 ±k\ \{{t2— 1)"]<в-*>Л = ±Л![(^— l)»]«»-ft-n ::-<>, - 1 что и требуется.
266 ГЛ. 8. ЕВКЛИДОВЫ ПРОСТРАНСТВА [8.71 Итак, мы доказали, что для каждого п многочлен yn(t) с точностью до числового множителя совпадает с многочленом pn(t)--=[(t2—\)"]{n). Вычислим значение рп(\). Для этого применим к функции (t2—\)п = (t - - \)п (t—\)п правило /z-кратного дифференцирования произведения: [(t+l)»(t-\)»]™ = ==(^+i)"[(^-i)«]t«> + ci[(^+i)"n^-1)1(,I"1,+ "-=i = (t+\)nn\-rClnn(t+\)n"1n(n—\). . .2{t— 1) + ... При подстановке / = 1 все члены этой суммы, начиная со второго, обращаются в нуль. Мы получаем, следовательно, Pj\) = 2nnl. Для вычислительных целей удобнее иметь значения наших ортогональных функций равными 1 при / = 1. Чтобы достичь этого, мы должны ввести числовой множитель :—-. . Именно 2пп\ полученные после этого многочлены и называются многочленами Лежандра; многочлен Лежандра степени п обозначается символом Pn(t), так что Рп Ю = 2^ [С8-!)"]01*. § 8.7. Определитель Грама 8.71. Определителем Грама называется определитель вида (*i> *i) (#1, х2) • . • (л'^. xkl G (хг, х2, ..., х, \ = I(л"2' х^ (ЛГо-' х^ " ' (ЛГ2' х^ \*ki XV (Xjii x2i (**. Xk) где .v1} х2, ..., xk — произвольные векторы евклидова пространства R. Мы знаем, что в случае линейно независимых векторов хъ Хо, ..., хп этот определитель положителен (7.96). Для вычисления определителя Грама применим к векторам xLj х2, • • •, хк процесс ортогонализации. Пусть, на-
8.71] § 8.7. определитель грама 267 пример, з>1 = *i " вектор у., ■= a1yl -f х2 ортогонален к^. Заменим на всех местах определителя вектор х1 на ух. Далее прибавим ко второму столбцу первый столбец определителя Грама, умноженный на аг (отнеся аг ко второму множителю скалярных произведений), и затем прибавим ко второй строке первую строку определителя, умноженную на аг (отнеся аг к первому множителю скалярных произведений). В результате на всех тех местах определителя, где был вектор х2, будет находиться вектор у2. Далее, пусть у3 —- Р1вух -|- $2у., ~|- х3 ортогонален к ух и у2\ прибавим к третьему столбцу первый, умноженный на (515 и второй, умноженный на |$2; ту же операцию произведем со строками. В результате х3 на всех местах будет заменен на у3. Мы можем продолжать этот процесс далее, пока не дойдем до последнего столбца. Так как наши операции не изменяют величины определителя, то в результате мы получим 0>i, уг) 0 ... О О (у2, у2) ... О и (xv х2, . . ., xk) — О 0 ... (yk,yk) = (Уг> Уг) (У* У2>- • Лук> У к)- (26) В силу результата 8.62 мы получаем следующее неравенство: 0<G(xl5 х2, ..., xk)^(xv хх)(х2, x2)...(xk, xk). (27) Выясним, в каких случаях величина G(xvx2, ...,xk) может принимать крайние значения 0 или (хг, хг) . . . (xk, xk). Из выражения определителя Грама (26) вытекает, что он равен нулю в том и только в том случае, когда один из векторов yv у2, . . ., ук равен нулю. Но в силу 8.62 это эквивалентно линейной зависимости векторов xv х2, . . ., хк. С другой стороны, равенство определителя Грама правой части неравенства (27) возможно в силу формулы (26) и 8.62 только в том случае, когда векторы хг, х2, ..., хк взаимно ортогональны. Итак, мы доказали следующую теорему: Теорема. (Теорема об определителе Грама.) Определитель Грама векторов хх, x2, ..., xk равен нулю^
268 ГЛ. 8. ЕВКЛИДОВЫ ПРОСТРАНСТВА [8.72 если эти векторы линейно зависимы, и положителен, если они линейно независимы; он равен произведению квадратов длин векторов хг, х2, ..., xk, если они взаимно ортогональны, в противном случае он меньше этой величины. 8.72. Объем ^-мерного гиперпараллелепипеда. Площадь параллелограмма, как известно из планиметрии, равна произведению его основания на высоту. Если параллелограмм построен на двух векторах хъ х2, то можно принять за основание длину вектора xv за высоту — длину перпендикуляра, опущенного из конца вектора х2 на ось вектора х±. Аналогично объем параллелепипеда, построенного на векторах xv x2, х3, равен произведению площади основания на высоту; площадь основания есть площадь параллелограмма, построенного на векторах хъ х2, а высота есть длина перпендикуляра, опущенного из конца вектора х3 на плоскость векторов хъ х2. Эти соображения делают естественным следующее индуктивное определение объема ^-мерного гиперпараллелепипеда в евклидовом пространстве. Пусть дана система векторов хъ хъ . . ., xk в евклидовом пространстве R. Обозначим через hj перпендикуляр, опущенный из конца вектора х.-+1 на подпространство L(xt, х2, ..., Xj) (у=1, 2, ...,&—1). Введем, далее, следующие обозначения: Vi= \xi\ (одномерный объем — длина вектора хг), V2 = V'^- J /гх J (двумерный объем — площадь параллелограмма, построенного на векторах хг, х2), V3= V2-\h2\ (трехмерныйобъем — объем параллелепипеда, построенного на векторах хъ х2, х3), Vk= Vk_l-\hk_1\ (^-мерный объем — объем гиперпараллелепипеда, построенного на векторах хг, х2, ... .. ., xk). Очевидно, что объем Vk может быть вычислен по формуле Vk=v[xi,x2, ..., *a] = |*iMaiI---Ia*-iI-
8.73] § 8.7. ОПРЕДЕЛИТЕЛЬ ГРАМА 269 Используя формулу (26), мы можем выразить величину Vk через векторы xv х2, .. ., xk: VI \xli xv \xi, X2) (x2, xi) (x2, x2) .. (xl} xk) • • (X2i Xk> \Xk> XV \Xfr X2/ • • • \Xk> Xk) образом, определитель Г рама от k векторов xk равен квадрату объема k-мерного гиперпа-, Таким раллелепипеда, построенного на этих векторах, 8.73. Пусть Ър ортогонального и нормированного базиса координаты вектора Xj относительно *i, *2, •••» еп (У=1» 2, —, Л; /= 1, 2, —, л). Выражая скалярные произведения векторов через координаты, мы получим следующую формулу: VI Бда+.-.+Бда Si Si -r (k)t(k) + IPZX Матрица определителя VI, как легко убедиться, есть из координат векторов произведение &х#-матрицы А х1> XD • • •> хк si1' й1» t(2) t(2) bl b2 £<*) £(*> £(*) bl b2 • • • 5я _ и транспонированной к ней ях&-матрицы t(i) b?i £(2) Ь/г (28) Л' = Е1" Е1г) • • • If £<1) £(2) £(Л) Ь2 Ь2 ' * ' Ь2 £(1) 6(2 Ья Ья £(/ Ьл (Л)
270 ГЛ. 8. ЕВКЛИДОВЫ ПРОСТРАНСТВА [8.74 Применяя формулу 4.54 (\4) к определителю V\, находим vl = M\\ \\ \\\\\(АА') = 2 м};/;;:\(А)М\\;;;:1к(А'), где суммирование распространяется на все наборы номеров ix < . . . < ik, принимающих значения от 1 до п. Так как м',*;:::;^ и') = <•.•■::** И), то vl= S [м1;::::Х(А)]*. h Ч,- Итак, квадрат объема k-мерного гиперпараллелепипеда, построенного на векторах х- (j■-- 1, 2, . . ., k), равен сумме квадратов всех миноров k-го порядка в матрице из координат векторов х- относительно (любого) ортогонального и нормированного базиса еъ е2, ..., еп. 8.74. В случае k = n матрица || ^/} || имеет только один минор &-го порядка, равный определителю матрицы || ^у) ||. Поэтому объем n-мерного гиперпараллелепипеда, построенного на векторах хи х2, • • •, хп, равен (по абсолютной величине) определителю из координат векторов х{ (/ = 1,2, . . ., п) относительно (любого) ортогонального и нормированного базиса. 8.75. Неравенство Ада мара. Из результата 8.74 можно получить одну важную оценку абсолютной величины произвольного определителя k-vo порядка I fell fet2 * * * fel/г r\ »21 fe22 • • ' fe2/e I fefcl fe/z2 • • • fefc/г I Будем рассматривать числа |а, |/2, . . ., lik (l= 1, 2,. . ., k) как координаты вектора xi в ортогональном нормированном
8-81] § 8.8. несовместные системы 271 базисе ^-мерного евклидова пространства. Результат 8.74 дает нам возможность истолковать абсолютную величину определителя D как объем /^-мерного гиперпараллелепипеда, построенного на векторах хг, х2, . .., хк, и использовать выражение объема через определитель Грама D2— = G(x1, х2, ..-, xk). Применяя теорему 8.71, получаем k к D2 < (х\, xj (х2, л\2) . . . (хк, хк)=- П 2 ЪЬ- Это неравенство носит название неравенства Лдамара. Отметим, что оно обращается в равенство в силу теоремы 8.71 в том и только в том случае, когда векторы xv x.y, ..., хк взаимно ортогональны. Неравенство Адамара имеет прозрачный геометрический смысл: объем гиперпараллелепипеда не превосходит произведения длин его ребер; он равен этому произведению в том и только в том случае, когда его ребра взаимно ортогональны. § 8.8. Несовместные системы линейных уравненлй и метод наименьших квадратов 8.81. Пусть дана несовместная система линейных уравнений 011*1 + «12*2 +•••-!- «1,Л = *1, \ #21-^1 ~Г Я22*2 ~Г ' ' ' ~Г a2mXm ™ ^2> I /ОП\ ап1Х1 + аи2*2 + • ' ' + anmXm ~ bп' ) Поскольку она несовместна, ее нельзя решить, т. е. нельзя найти такие числа сг, с2, ..., ст, чтобы при подстановке этих чисел вместо неизвестных хх, х2, ..., хт удовлетворялись бы все уравнения системы (29). Если подставить какие-нибудь числа \х, \2, . .., \т вместо неизвестных хх, х2, ..., хт в левые части уравнений (29), то мы получим результаты ух, у2, ..., уп, отличные от чисел ЬЛ, Ь2, ..., Ьп. Поставим себе задачу: при известных значениях чисел ajk и bk(k=\, . .., п\ у'=1, ..., т) определить числа |l5 £2, ..., \m так, чтобы
272 ГЛ. 8. ЕВКЛИДОВЫ ПРОСТРАНСТВА [8.82 квадратичное уклонение результатов у1? у2, . .., уп от дан* ных величин bv b2, . . ., bn> определяемое выражением 6Я= 2 (?/-*/)", (зо) оказалось наименьшим из возможных, а также найти это минимальное уклонение. Такая задача возникает на практике, когда, например, коэффициенты \f линейной зависимости величины b от величин alt а2, ..., ат b = lia1 + l2a2+ ... +Ътат должны быть найдены из результатов измерений величин Ау(/=1, 2, ..., т) и соответствующих значений Ь. Если при i-м измерении получены значения а,у для величины а}- и &,- для величины Ь, то мы должны составить уравнение Eifl/i + 52fl|2+ • • • +E«fl/i« = Ь/; (31) п измерений приводят к системе п уравнений (31), т. е. к системе вида (29). Эта система вследствие неизбежных ошибок измерений будет, вообще говоря, несовместной, и задача определения коэффициентов £i» £2» •••» 5/я» таким образом, не сводится к задаче решения системы уравнений (29). Возникает задача определить коэффициенты 5/ так, чтобы каждое уравнение удовлетворялось, хотя бы и приблизительно, но с общей наименьшей погрешностью. Если за меру погрешности взять среднее квадратичное из уклонений величин т i = l от известных bj, определяемое формулой (30), то мы и придем к сформулированной выше задаче. Знание величины б"2 в этом случае также полезно: оно помогает оценить надежность измерений. 8.82. Решение получается немедленно, если истолковать задачу геометрически в вещественном пространстве Rn. Рассмотрим т векторов а1У я2, ..., ат, компоненты которых выписаны в столбцах системы (29) Составляя линейную комбинацию \1а1 + . . . + \тат, мы получим вектор V^iVi» •••» Чт)- Нужно определить числа £х, . .., 1^т так, чтобы вектор у по норме имел наименьшее возможное отклонение от заданного вектора Ь= [Ьъ Ьъ . . ., Ьп}.
8.84] § 8.8. несовместные системы 273 Совокупность всех линейных комбинаций векторов av . . ., ат образует подпространство L = L (аъ а2, . . ., ат). В этом подпространстве наименьшее расстояние до вектора b имеет проекция вектора Ь на подпространство L. Числа £1? ..., \т, следовательно, должны быть выбраны так, чтобы линейная комбинация t)1al -\- . . . -\-\тат привела к проекции вектора b на подпространство L. Но решение этой задачи нам известно; оно дается формулами 8.53, именно, мы имеем (а19 аг) ... (fly.!, аг)(Ь, аг) (fl/+1, аг)...(ат, Ьг) *j D (аг, ат) ... (fly.!, flj (*, flj (fl/+1, flj. . .(am, bm) где D — определитель Грама G(a1, fl2, ..., am). 8.83. Результаты 5.72 дают нам возможность оценить и само уклонение б. Действительно, величина б есть высота (/»+ 1)-мерного параллелепипеда, построенного на векторах а1} ..., flOT, b, и равна поэтому отношению объемов V(аъ а2, ..., ат, Ь) V(av a2, ..., ат) Записывая каждый из объемов с помощью определителя Грама, находим окончательно g2_G(flt, g2, ..., ат% b) G(fllt fl2. •••• аю) Тем самым поставленная нами задача полностью решена. 8.84. В вычислительной практике часто встречается следующая задача (интерполирование с наименьшей квадратичной погрешностью): на отрезке a^^t^b дана функция fo(t)\ указать многочлен Р (t) степени k, k < n, для которого квадратичное уклонение от функции f0 (/), измеряемое величиной &2(fo> P)=2 [fo(tj)-P(tj))2* /=о становится наименьшим. Здесь /0, tv .., ^ — некоторые фиксированные точки отрезка а<Ц*^Ь. Простое решение этой задачи на основании геометрических соображений было предложено М. А. Красносельским.
274 ГЛ. 8. ЕВКЛИДОВЫ ПРОСТРАНСТВА [8.91 Бредем евклидово пространство R, образованное из функций f (t), рассматриваемых только в точках tlh tv ..., tn, со скалярным произведением п (Л й=2 fVj)e(tj). / = 0 Тогда наша задача сводится к определению проекции вектора f0(t) на подпространство всех многочленов степени, не превосходящей к. Коэффициенты искомого полинома Р0 (/) ---£0-t-£if-r • • • +6/^Л даются теми же формулами, что и в разобранной выше задаче: 6/= D (1, 1) (/, 1) ... (//-1, 1) (/0, 1) (*/+i, 1) ... (t\ 1) (1, О (Л о ... (/'-1, о (/0, t) (t'4 0 ... (**, О (1, **) а, **) . . . (<>-!, <*) (/0, /*) (/А 1, **). . . (/*', **) где D определитель Грама D(l, /, ..., tk). Само наименьшее квадратичное уклонение б2 можно вычислить по формуле § 8.9. Сопряженные операторы и изометрия 8.91. Операторы, сопряженные относительно форм ы (л:, у). Сформулируем здесь результаты § 7.6 о связи между линейными операторами и билинейными формами в применении к случаю, когда фиксирована форма (л;, у) — скалярное произведение векторов л: и у. Пусть А и В — линейные операторы в евклидовом пространстве Rrr Образуем билинейные формы А (х, у) и В (л;, у) по формулам А (х, у) - (А*, у), В (х, у) - (х, By). (32) Так как каноническим базисом формы (х, у) является любой ортонормальный базис пространства и канонические коэффициенты формы (х, у) в любом таком базисе все равны 1, то в силу 7.61 матрица || aJfi \\ формы А (л*, у) в любом ортонормальном базисе совпадает с матрицей || а)Р \\ оператора А, а матрица \\bJk\\ формы В (л;, у) транспонирована по отношению к матрице || Щк) || оператора В. Обратно (7.62), если в пространстве Rn заданы билинейные формы А (х, у) и В (л:, у), то существуют и единственны такие
8-93] § 8.9. сопряженные операторы и изомётрия 275 линейные операторы А и В, что выполнены равенства (32). Далее, применяя результаты 7.63 к форме (х, у), получаем следующий результат: Теорема. Для каждого линейного оператора А в евклидовом n-мерном пространстве R;/ существует и единствен сопряженный оператор — линейный оператор А', удовлетворяющий уравнению (Ах, у) = (х, к'у) при любых х и у из Rn. Матрица оператора А' в любом ортогональном и нормированном базисе пространства Rn транспонирована по отношению к матрице оператора А. 8.92. С помощью операции сопряжения в евклидовом пространстве вводятся следующие классы операторов. а. Симметричные операторы, определяемые равенством А'=А. Симметричный оператор характеризуется тем, что в орто- нормальном базисе его матрица не меняется при транспонировании. б. Антисимметричные операторы, определяемые равенством А'- —А. Антисимметричный оператор характеризуется тем, что в ортонормальном базисе его матрица после транспонирования изменяет знак. в. Нормальные операторы, определяемые равенством А'А = АА\ Очевидно, нормальные операторы включают в себя и симметричные и антисимметричные. Изучение введенных классов операторов будет произведено в § 9.4. 8.93. Теперь сформулируем для евклидова пространства R„ результаты 7.73—7.76 относительно инвариантных операторов. Рассматриваются линейные обратимые отображения Q пространства R,; в себя, не изменяющие скалярного произведения: (Qx, Qy) = (x} у).
276 ГЛ. 8. ЕВКЛИДОВЫ ПРОСТРАНСТВА [8.94 Эти отображения, названные в 7.73 инвариантными относительно формы (дс, у), здесь будем называть изометрическими. Изометрический оператор Q характеризуется равенством 7.75(33) Q'Q = E, где Q' — оператор, сопряженный к Q относительно формы (х, у), т. е. оператор, сопряженный к Q в смысле 8.91. Обратный оператор Q-1 = Q' к изометрическому оператору Q также изометричен. Произведение двух изометрических операторов является изометрическим оператором (7.74). Согласно 7.75 изометрический оператор Q характеризуется тем, что любой ортонормированный базис еъ ..., еп переводится этим оператором снова в ортонормированный базис /х = Q^i, ..., fn = Qen- Матрица Q=|[^')|] изометрического оператора Q в любом ортонормированном базисе называется ортогональной матрицей. Ортогональная матрица характеризуется условиями 7.76(35), имеющими в данном случае вид &4<qk ~\ 0 при ;фк, или же условиями 7.76(35'), имеющими вид [ 1 при j=mi 2 4k4k \ 0 при j-фт, т. е. сумма квадратов элементов любой строки (любого столбца) равна 1, сумма произведений соответствующих элементов двух разных строк (столбцов) равна 0. 8.94. В силу равенства Q~1 = Q\ обращением формул перехода от ортонормального базиса е19 ..., епк другому ортонормальному базису /1? ..., /п f1 = q?e1+...+fl>en, \ \ (33)
8.95] § 8.9. сопряженные операторы и изометрия 277 служат формулы [ (34) В силу 5.31 координаты r\k вектора х в базисе fv ..., fn выражаются через координаты £у этого же вектора в базисе ev ..., еп по формулам \ (35) Ч„ = <№+...+«„ ) с обратными формулами \ (36) ln = tiPr\1+...+<tf>1]n. ) 8.95. Рассмотрим здесь еще следующую задачу. Пусть заданы т < п числовые строк q{p (/= 1, ..., п; /=1, ...,/#), удовлетворяющих условиям <£..., f 1 при У=А, у д(/>д(/о = <' ^ у ,tift'4 \ 0 при у^А. Требуется найти еще п — т числовых строк q{f\ s=m+\, .. ., п, так, чтобылхл-матрица Ц^'ЧК*, У= 1, • • •, л) была ортогональной. Решение получается просто из геометрических соображений. Интерпретируя заданные строки q{/} как координаты т векторов в евклидовом пространстве Rn со скалярным произведением (8.226) п (№i. •••, У, (Ль ••., т|и))= 2 S/Л/, мы видим, что нам заданы т ортогональных и нормированных векторов qv ...yqmw задача состоит в том, чтобы дополнить их до ортонормального базиса в пространстве Rn. В этой геометрической формулировке задача становится очевидно разрешимой: например, можно дополнить векторы
278 Гл. 8. евклидовы пространства [8.96 Яъ •••» Ят произвольно до системы п линейно независимых векторов и далее провести ортонормализацию. 8.96. Рассмотрим еще некоторые свойства симметричных операторов. а. Если подпространство R'ciR инвариантно относительно оператора А, то ортогональное дополнение подпространства R', на основании 7.65, инвариантно относительно сопряженного оператора А'. Поэтому, если А — симметричный оператор, то из инвариантности относительно А подпространства R' следует инвариантность относительно А и ортогонального дополнения к подпространству R'. б. Покажем, что на плоскости (п = 2) всякий симметричный оператор имеет собственный вектор. Действительно, в данном случае уравнение для собственных значений |аи — К а12 I I а21 °22 ^ I есть квадратное уравнение с дискриминантом (ап + а22)2 —4(ona2, —a21a12) = (air-a22)2 + 4af2>0, поэтому его корни вещественны. в. Пользуясь а и б и существованием инвариантной плоскости у всякого оператора в вещественном пространстве (вытекающим из выражения вещественной жордановой формы 6.63 (18)), можно доказать, чтов пространстве Y((l всякий симметричный оператор имеет ортогональный базис из собственных векторов. Мы в дальнейшем получим этот результат из общих соображений, не опираясь на вещественную жорданову форму (9.45). ЗАДАЧИ 1. Назовем скалярным произведением двух векторов пространства V3 произведение их длин. Будет ли пространство евклидовым? 2. А если назвать скалярным произведением двух векторов того же пространства произведение их длин на куб косинуса угла между ними? 3. А если назвать скалярным произведением удвоенное обычное скалярное произведение этих векторов? 4. Найти угол между противоположными ребрами правильного тетраэдра.
ЗАДАЧИ 279 5. Найти углы в треугольнике, образованном в пространстве R2 (—1, 1) векторами xl(t)--\, x2(t) — t и x.A(t)—\—t. 6. Написать неравенства треугольника в пространстве С2 (я, Ь). 7. Определить косинусы углов между прямой £i —£о-—... =£„ и осями координат в пространстве Rn. 8. В пространстве Rx разложить вектор / на сумму двух векторов, один из которых лежит в линейной оболочке векторов/?/, а другой ортогонален к этому подпространству: а) / = (5, 2, -2, 2)\ Ьх-:{2, 1,1, -1), Ь2 = (\, 1, 3, 0); б) /-(-3, 5, 9, 3), V-(l, !• !• 0. Ь2 = (2, -1, 1, 1), Ь8 = (2, -7, -1, -1). 9. Доказать, что из всех векторов подпространства R'(8.51) наименьший угол с вектором / образует вектор g. 10. Доказать, что если вектор gu в подпространстве R' ортогонален к проекции g вектора / на это подпространство, то g0 ортогонален и к самому /. 11. Показать, что перпендикуляр, опущенный из начала координат на гиперплоскость Н, имее! наименьшую длину из всех векторов, соединяющих начало координат с этой гиперплоскостью. 12. В пространстве V.A с базисом I, у, k задана система векторов *! = /, x2 = 2i, x3 = 3i, xA = 4i — 2j, x& = — i + \0j\ xC} = i+J+bk. Построить ортогональные векторы уъ у2, ..., уг, (8.61). 13. В трехмерном подпространстве пространства /?4, порожденном векторами (1, 2, 1, 3), (4, 1, 1, Г), (3, 1, 1,0), построить ортогональный базис, используя метод теоремы ортогонализацми. 14. Пусть даны подпространства R' и R" евклидова пространства R. Рассмотрим перпендикуляры, опущенные из концов единичных векторов e'£R' на R", и пусть т (R', R")— максимум из их длин; аналогично определяем величину т (R", R'). Неотрицательная величина 0 = max {m(R', R"), m (R", R')} называется раствором подпространств R' и R". Показать, что при 0 < 1 размерности подпространств R' и R" равны (М. А. Красносельский и М. Г. Крейн). 15. Найти старший коэффициент Ап многочлена Лежандра Pn{t). 16. Показать, что многочлен Лежандра Р;/(/)ссть четная функция при четном п и нечетная функция при нечетном п. Найти, в частности, 17. Доказать, что в разложении многочлена tPn^1(t) по многочленам Лежандра tPn_1(t) = a0Pu(t) + a1Pl(t)+...+anPn(t) коэффициенты д0, аг, ..., аи_3 и ап_х равны нулю. 18. Найдя коэффициенты ап_.2 и ап в разложении многочлена tPn-i(t) из задачи 17, получить рекуррентную формулу nPn(t) = (2n-l)tPn_1(t)-(n-l)Pn_2(t)-
280 ГЛ. 8. ЕВКЛИДОВЫ ПРОСТРАНСТВА 19. Найти многочлен Q (t) = tn-{-b1tn-1+ ... +bn_1t-{-bn, для которого интеграл + 1 J Q2(t)dt -1 достигает наименьшего значения. 20. Найти норму многочлена Лежандра Рп (t). 21. Показать, что для любого линейного оператора А, действующего в я-мерном евклидовом пространстве R„, отношение k(A)=V^AXl' A*2' "•' А*я1 V[xlt х2, ..., хп] постоянно (т. е. не зависит от выбора векторов хъ х2> . ..,*„), и найти его величину («коэффициент искажения»). 22. Показать, что для любых двух линейных операторов А и В имеет место равенство k (AB) = 6 (A) k (В). 23. Пусть хъ х2, ..., xk> t/, г—векторы евклидова пространства R. Доказать неравенство У[хъ х2, ..., xk, у, г] ^ V [х1у х2у ..., xk, г] V [хъ х2, ..., xki у] ^ V [х19 хъ ..., xk] 24. Пусть хъ х2, ..., хт — векторы евклидова пространства R. Доказать неравенство V [хъ х2, ..., хм] < Д {V [хъ ,,.txk^xk+1 хт]}т . k=i Каков его геометрический смысл? 25. (Продолжение.) Доказать неравенства, уточняющие неравенство Адамара: 1 т —— У[хъ Ч ^л]<П{^[^1. •••♦ Ч-ъ Xk + b •••• Хт]}™ < 1-2 XI к[*1» ••• ♦ хк-ъ хк + ъ •••» xl-i> х1+ъ •••» хт\) ^ 1<&</<т < П {Vl*s»Xs2, ...,^г]} 1 <: St < «2 < • • .<sr<m 1-2. . .(я-г) (m- 1) (m-2) ... г < П {п**- **,1Г~'<11>«1 l<S!<s2<m s=l (М. К. Фаге).
ЗАДАЧИ 281 26. Если \а{-к]^М, то по неравенству Адамара det || a;k || ^ <Ai"ii"/2. Показать, что эта оценка не может быть улучшена для п = 2т. 27. Если N (А) и Т (А) — соответственно нуль-многообразие и область значений оператора А, то ортогональные дополнения этих подпространств суть соответственно область значений и нуль-многообразие оператора А. 28. Показать, что для каждого элемента a;k ортогональной матрицы А соответствующее алгебраическое дополнение A{k = a;k det A, 29. Показать, что сумма квадратов всех миноров /г-го порядка, расположенных в k фиксированных строках ортогональной матрицы, равна 1; сумма произведений всех миноров k-то порядка в одной группе строк на соответствующие миноры k-vo порядка другой группы строк равна 0. 30. Некоторый линейный оператор Q сохраняет длину каждого вектора; показать, что он является изометрическим. 31. Оператор А, сохраняющий ортогональность любых двух векторов х, у (так что из (х, у) = 0 вытекает (Ах, At/) = 0), называется равноугольным оператором. Всякий изометрический оператор является равноугольным. Кроме того, равноугольными являются оператор подобия {кх — Хх для любого х) и произведение оператора подобия на изометрический оператор. Доказать, что всякий равноугольный оператор есть произведение оператора подобия и изометрического оператора. 32. Показать, что при п ^ 3 всякий линейный оператор Q, действующий в я-мерном пространстве R„ и не изменяющий площади любого параллелограмма, так что V[x,y]=V[Qx,Qy]9 есть изометрический оператор. 33. Показать, что при k < n всякий линейный оператор Q, действующий в я-мерном пространстве R„ и не изменяющий объема любого /г-мерного гиперпараллелепипеда, является изометрическим (М. А. Красносельский). Замечание. Для k = n утверждение задачи 33 уже не имеет места, так как в этом случае всякий оператор Q с detQ=± 1 будет удовлетворять условию задачи. 34. В евклидовом пространстве R„ заданы конечные множества F = {*!, х2, ...,xk) и (/ = {#!, у2, •••'*/&}• Для того чтобы существовал изометрический оператор Q, переводящий одновременно каждый вектор х,- в соответствующий вектор yl(i = \, 2, ..., k)t необходимой достаточно, чтобы имели место равенства (*/. */) = (уь У/) (*» i =l» 2 *)• 35. Углы между двумя подпространствами. В евклидовом пространстве R заданы два подпространства R' и R". Пусть нормированный вектор г' пробегает единичную сферу подпространства R', а нормированный вектор г" независимо от г пробегает единичную сферу подпространства R". Угол между г' и г" на некоторой паре е' = е', е" = е" достигает минимума, который мы обозначим
282 ГЛ. 8. ЕВКЛИДОВЫ ПРОСТРАНСТВА через q?x. Пусть, далее, е' меняется по своей единичной сфере, оставаясь ортогональным к e'v и е" меняется по своей единичной сфере, оставаясь ортогональным к е"у Угол между в' we" при этих условиях достигнет минимума ф2 :> фх на некоторой паре е' = е[л, е" — е"0. Пусть, далее, е' меняется по своей единичной сфере, оставаясь ортогональным к е\ и е',, и &" меняется по своей единичной сфере, оставаясь ортогональным к е" и е"2\ мы получим новый минимум утла Фз^ф-2 и новую пару р'3 и е". Продолжая этот процесс далее, мы получим некоторую совокупность углов фь ф2, ..., ф^, число которых равно наименьшей из размерностей подпространств R' и R". Углы фх, q2,... .... цк называются углами между подпространствами R' и R". Показать, что: а) углы фх, ср2, ..., ф^ определены однозначно и не зависят от выбора векторов e'v e"v е',, e"0, ..., если по построению эти векторы не определены однозначно; б) углы ц\, ф2, ..., цк определяют подпространства R' и R" с точностью до положения в пространстве; иными словами, если имеются две пары подпространств R', R" и S', S" и углы между подпространствами R' и R" такие же, как между подпространствами S' и S", то существует изометрический оператор, переводящий одновременно S' в R' и S" в R"; в) для любых наперед заданных углов 0^ ц^ ^ ф2 ^ ... ^ ф& ^ я/2 можно построить пару под