Текст
                    В. В. Воеводин
Вл. В. Воеводин
ЭНЦИКЛОПЕДИЯ
ЛИНЕЙНОЙ АЛГЕБРЫ
Электронная система
ЛИНЕАЛ
Рекомендовано Научно-методическим советом по математике
Министерства образования и науки Российской Федерации
в качестве учебного пособия для студентов университетов
и технических вузов
Санкт-Петербург
«БХВ-Петербург»
2006


УДК 519.6@75.8) ББК 22.143я73 В63 Воеводин, В. В. В63 Энциклопедия линейной алгебры. Электронная система ЛИНЕАЛ / В. В. Воеводин, Вл. В. Воеводин. — СПб.: БХВ-Петербург, 2006. — 544 с: ил. ISBN 5-94157-881-4 Учебно-методический комплекс по линейной алгебре представляет собой книгу, компакт-диск и интернет-версию. Его особенностью является объединение традиционной, электронной и дистанционной форм образования. Впервые линейная алгебра представлена как семантически структурированная область математики, что, учитывая обширность приведенного материала, позволяет формировать различные по тематике и уровню сложности курсы, обеспечивает быстрый поиск необходимых сведений, а с помощью электронной справочно-поисковой системы, представленной на компакт-диске и в интернет-версии, — ризуализацию логических связей между отдельными элементами линейной алгебры. Математическая часть материала построена на использовании матрично-векторного аппарата. Для студентов, аспирантов, преподавателей, научных сотрудников и инженеров УДК 519.6@75.8) ББК22.143я73 Группа подготовки издания: Главный редактор Екатерина Кондукова Зам. главного редактора Татьяна Лапина Зав. редакцией Григорий Добин Редактор Алексей Семенов Компьютерная верстка Ольги Сергиенко Корректор Зинаида Дмитриева Дизайн серии Игоря Цырульникова Оформление обложки Елены Беляевой Зав. производством Николай Тверских Лицензия ИД №02429 от 24.07.00. Подписано в печать 21.07.06. Формат 70x1001/ie. Печать офсетная. Усл. печ. л. 43,86. Тираж 2500 экз. Заказ № 740 "БХВ-Петербург", 194354, Санкт-Петербург, ул. Есенина, 5Б. Санитарно-эпидемиологическое заключение на продукцию № 77.99.02.953.Д.006421.11.04 от 11.11.2004 г. выдано Федеральной службой по надзору в сфере защиты прав потребителей и благополучия человека. Отпечатано с готовых диапозитивов в ОАО "Техническая книга" 190005, Санкт-Петербург, Измайловский пр., 29 ISBN 5-94157-881 -4 ® Воеводин В. В., Воеводин Вл. В., 2006 © Оформление, издательство "БХВ-Петербург", 2006
Оглавление Предисловие 13 Почему появилась именно эта книга? 13 ЧАСТЬ I. МАТЕМАТИЧЕСКИЕ СВЕДЕНИЯ ПО ЛИНЕЙНОЙ АЛГЕБРЕ 23 1. Множества, элементы, операции 25 1.1. Вещественные и комплексные числа 25 1.1.1. Вещественные числа 25 1.1.2. Геометрическое представление комплексных чисел 26 1.1.3. Алгебраическое представление комплексных чисел 29 1.1.4. Модуль и сопряжение 30 1.1.5. Тригонометрическое представление комплексных чисел 31 1.1.6. Степени и корни 32 1.1.7. Общепринятые названия , 34 1.2. Множества и элементы 34 1.2.1. Множества и операции над ними 34 1.2.2. Декартово произведение 37 1.3. Эквивалентность и равенство 38 1.3.1. Бинарное отношение 38 1.3.2. Эквивалентность 39 1.4. Алгебраические операции и их свойства 41 1.4.1. Алгебраические операции 41 1.4.2. Обратные операции 43 1.5. Группы 46 1.5.1. Общая группа 46 1.5.2. Подгруппа 48 1.5.3. Смежные классы 49 1.5.4. Нормальный делитель 50
Оглавление 1.5.5. Абелева группа 52 1.5.6. Конечная группа 53 1.5.7. Циклическая подгруппа 53 1.6. Кольца и поля 55 1.6.1. Кольцо 55 1.6.2. Делители нуля 57 1.6.3. Поле и числа 57 1.7. Линейные пространства 60 1.7.1. Линейное пространство 60 1.7.2. Подпространство 62 1.7.3. Изоморфные пространства 63 1.7.4. Арифметическое пространство 66 1.7.5. Естественный базис 67 1.7.6. Конечномерные и бесконечномерные пространства 67 2. Система векторов 69 2.1. Линейная оболочка и линейная зависимость 69 2.1.1. Линейная комбинация и оболочка 69 2.1.2. Линейная зависимость и независимость 70 2.1.3. Представление одних векторов через другие 72 2.1.4. Снова конечномерные и бесконечномерные пространства 76 2.2. Эквивалентные системы, ранг, базис 76 2.2.1. Эквивалентные системы 76 2.2.2. База и ранг системы 78 2.2.3. Структура арифметического пространства 80 2.2.4. Структура общего конечномерного пространства 81 2.2.5. Базис и координаты 82 3. Матрицы и операторы 85 3.1. Конечные суммы и произведения ; 85 3.1.1. Конечные суммы < 85 3.1.2. Конечные произведения 86 3.2. Матрицы и операции над ними 87 3.2.1. Матрицы 87 3.2.2. Операции над матрицами 88 3.2.3. Диагональные матрицы 92 3.2.4. Перестановочные матрицы 93 3.2.5. Кольца и линейные пространства 94 3.2.6. Компактная форма матрицы 96 3.3. Транспонирование, сопряжение, след матрицы 98 3.3.1. Транспонирование и сопряжение матрицы 98 3.4. Элементарные матрицы и преобразования 100 3.4.1 Матрицы перестановок 100 3.4.2. Элементарные матрицы масштабирования ^ 103
Оглавление 3.4.3. Элементарные неунитарные матрицы 104 3.4.4. Элементарные матрицы и преобразования 104 3.4.5. Эквивалентность и ранг 106 3.4.6. Матрицы типа Nr и Мг 107 3.5. Матрицы специального вида 108 3.5.1. Треугольные матрицы 108 3.5.2. Трапециевидные матрицы 109 3.5.3. Почти треугольные и ленточные матрицы 109 3.5.4. Профильные матрицы 110 3.5.5. Блочные матрицы 111 3.6. Метод Гаусса 113 3.6.1. Шаги метода Гаусса 113 3.6.2. Преобразование матрицы к простейшему виду 115 3.6.3. Преобразование специальных матриц 119 3.6.4. Выбор ведущего элемента 120 3.7. Операторы 121 3.7.1. Линейные операторы 121 3.7.2. Матрица линейного оператора 125 3.7.3. Изоморфизм линейных операторов и матриц 126 4. Определители 131 4.1. Определитель и его свойства 131 4.1.1. Перестановки 131 4.1.2. Определитель и его простейшие свойства 133 4.1.3. Определители некоторых матриц 136 4.1.4. Определитель и линейная зависимость 137 4.1.5. Вычисление определителя 138 4.2. Миноры и алгебраические дополнения 138 4.2.1. Разложение определителя 138 4.2.2. Определители некоторых блочных матриц 142 4.2.3. Определитель произведения матриц 143 4.3. Ранг матрицы 146 4.3.1. Ранг и независимость 146 4.3.2. Ранг и ведущие миноры и 147 4.3.3. Матрицы полного и малого ранга 149 4.3.4. Свойства ранга 151 4.4. Невырожденные матрицы 153 4.4.1. Невырожденная или неособенная матрица 153 4.4.2. Обратная матрица 154 4.4.3. Вычисление обратной матрицы 157 4.4.4. Модификация обратной матрицы 158 4.4.5. Вполне положительные и ассоциированные матрицы : 160 4.4.6. Симметричные и кососимметричные матрицы 161
6 Оглавление 5. Расстояния, углы, объемы 163 5.1. Скалярное произведение 163 5.1.1. Евклидово и унитарное пространство 163 5.1.2. Свойства скалярного произведения 164 5.1.3. Матричное представление 167 5.2. Ортогональные и биортогональные системы векторов 167 5.2.1. Нормированные и ортогональные векторы 167 5.2.2. Ортонормированный базис 170 5.2.3. Биортонормированные системы и базисы 172 5.2.4. Изоморфизм пространств со скалярным произведением 172 5.2.5. Ортогональность и сопряженные матрицы 174 5.3. Ортогональность на множествах 175 5.3.1. Ортогональное дополнение 175 5.3.2. Снова биортонормированные системы и базисы 177 5.3.3. Сумма, прямая сумма и пересечение подпространств 178 5.3.4. Ортогональная сумма подпространств 181 5.4. Измерения в линейном пространстве 183 5.4.1. Длина и расстояние 183 5.4.2. Угол 184 5.4.3. Перпендикуляр и проекция 186 5.4.4. Объем 191 6. Системы линейных алгебраических уравнений 195 6.1. Основные понятия и формы записи 195 6.1.1. Основные понятия и простейшие факты '. 195 6.1.2. Матрично-векторная запись 196 6.1.3. Эквивалентные системы 197 6.2. Приведение системы к каноническому виду 197 6.2.1. Метод Гаусса 197 6.2.2. Каноническая система уравнений 199 6.3. Основные факты 200 6.3.1. Теорема Кронекера-Капелли 200 6.3.2. Общие свойства решений системы 201 6.3.3. Критерии и формулы 203 6.4. Альтернатива и теорема Фредгольма 205 6.4.1. Образ и ядро матрицы 205 6.4.2. Альтернатива и теорема Фредгольма 207 6.5. Псевдорешение и псевдообратная матрица 209 6.5.1. Нормальное решение 209 6.5.2. Псевдорешение 210 6.5.3. Нормальное псевдорешение 211 6.5.4. Псевдообратная матрица 212 6.6. Свойства псевдообратной матрицы 214 6.6.1. Столбцы и строки матриц А, А*9А+ 214 6.6.2. Свойства минимальности , 217
Оглавление 6.6.3. Матричное определение А' 218 6.6.4. Скелетное разложение и матрица А+ 219 6.6.5. Проекторы 223 6.6.6. Сопряженные системы уравнений 224 6.7. Линейные многообразия и линейные системы 225 6.7.1. Плоскость 225 6.7.2. Гиперплоскость и прямая : 226 6.7.3. Геометрическая интерпретация систем уравнений 229 6.8. Матрица и определитель Грама 231 6.8.1. Проекция на линейную оболочку 231 6.8.2. Матрица и определитель Грама 232 6.8.3. Ортогональные системы и определитель Грама 234 7. Многочлены 237 7.1. Многочлены и операции над ними 237 7.1.1. Группа многочленов 237 7.1.2. Кольцо многочленов 239 7.1.3. Деление многочленов 240 7.2. Основная теорема алгебры 242 7.2.1. Корни многочленов 242 7.2.2. Различные представления многочленов 243 7.2.3. Алгебраически замкнутое поле 246 7.2.4. Многочлен как функция 248 7.2.5. Вещественные многочлены 252 8. Спектральные свойства матриц 255 8.1. Эквивалентные и подобные матрицы 255 8.1.1. Преобразование координат 255 8.1.2. Эквивалентные матрицы 257 8.1.3. Подобные матрицы 259 8.2. Спектр матриц 260 8.2.1. Собственные значения и собственные векторы 260 8.2.2. Характеристический многочлен 265 8.2.3. Кратность собственных значений 269 8.3. Матрицы простой структуры 271 8.3.1. Строение матрицы простой структуры 271 8.3.2. Свойства матрицы простой структуры 272 8.3.3. Ортогональность в собственных векторах 275 9. Структура матриц общего вида 281 9.1. Инвариантные подпространства 281 9.1.1. Общие свойства инвариантных подпространств 281 9.1.2. Критерии инвариантных подпространств 283 9.1.3. Нахождение инвариантных подпространств 285
Оглавление 9.2. Подобие треугольной и блочно-диагональной матрице 286 9.2.1. Вспомогательные утверждения для общего случая , 286 9.2.2. Инвариантные подпространства и блочные матрицы 287 9.2.3. Вложенные инвариантные подпространства 290 9.2.4. Подобие треугольной матрице 292 9.2.5. Подобие блочно-диагональной матрице 294 9.3. Вещественное подобие блочным матрицам 295 9.3.1. Вспомогательные утверждения для вещественного случая 295 9.3.2. Вещественное подобие блочно-треугольной матрице 297 9.3.3. Вещественное подобие блочно-диагональной матрице 299 9.4. Матричные многочлены 302 9.4.1. Кольцо матричных многочленов 302 9.4.2. Инвариантные, спектральные и другие свойства 303 9.4.3. Нильпотентная матрица 306 9.4.4. Теорема Гамильтона-Кэли 307 9.5. Каноническая форма Жордана 309 9.5.1. Многочлены и разложение пространства 3.09 9.5.2. Корневые векторы 311 9.5.3. Высота корневого вектора 312 9.5.4. Корневой базис Жордана 314 9.5.5. Каноническая форма Жордана 316 9.5.6. Некоторые следствия 318 10. Нормальные матрицы 321 10.1. Нормальные матрицы общего вида 321 10.1.1. Простейшие нормальные матрицы 321 10.1.2. Собственные векторы нормальной матрицы 322 10.1.3. Инвариантность ортогонального дополнения 324 10.1.4. Нормальные матрицы и многочлены 326 10.2. Унитарные матрицы и преобразования 327 10.2.1. Унитарные матрицы 327 10.2.2. Критерии унитарности 328 10.2.3. Унитарные преобразования 331 10.2.4. Метрические свойства 333 10.2.5. Ортогональные матрицы и преобразования 335 10.3. Эрмитовы и косоэрмитовы матрицы 337 10.3.1. Эрмитовы матрицы 337 10.3.2. Критерии эрмитовости 339 10.3.3. Вещественные симметричные матрицы 340 10.3.4. Косоэрмитовы матрицы...» 341 10.3.5. Вещественные кососимметричные матрицы 342 10.3.6. Эрмитово разложение матрицы 343 11. Мультипликативные представления матрицы 347 11.1.1 [/-разложение матрицы 347 11.1.1. Элементарные преобразования и треугольные матрицы 347
Оглавление 11.1.2./^-разложение общей матрицы 349 11.1.3. //(/-разложение профильной матрицы 352 11.1.4. Блочное L (/-разложение 352 11.1.5. //(/-разложение эрмитовой матрицы 355 11.1.6. Перестановки 357 11.1.7. Эквивалентные знаковые утверждения 360 11.2. ?/?-разложение матрицы 362 11.2.1. Матрицы вращения 362 11.2.2. Матрицы отражения 364 11.2.3. ^-разложение общей матрицы 367 11.3. Сингулярное разложение матрицы 369 11.3.1. Сингулярные числа матрицы 369 11.3.2. Сингулярные базисы матрицы 370 11.3.3. Сингулярное разложение матрицы 371 11.3.4. Сингулярное разложение в различных свойствах 372 11.4. Другие представления матрицы 375 11.4.1. Полярное разложение матрицы 375 11.4.2. Полярное разложение в различных свойствах 377 11.4.3. Кронекерово произведение матриц 379 11.4.4. Спектральные свойства кронекерова произведения 380 11.4.5. Специальные кронекеровы произведения 382 12. Билинейные формы 385 12.1. Билинейные и эрмитовы билинейные формы 385 12.1.1. Билинейные формы 385 12.1.2. Симметричные и кососимметричные билинейные формы 386 12.1.3. Эрмитовы билинейные формы 388 12.1.4. Симметричные и кососимметричные эрмитовы формы 390 12.2. Конгруэнтные преобразования 391 12.2.1. Матрица билинейной формы 391 12.2.2. Зависимость от выбора базиса 392 12.2.3. Конгруэнтные матрицы и преобразования 393 12.2.4. Унитарные конгруэнтные преобразования 395 12.2.5. Общие конгруэнтные преобразования 396 12.2.6. Билинейные формы в паре базисов 400 12.3. Квадратичные формы 402 12.3.1. Квадратичная и полярная формы 402 12.3.2. Эрмитова квадратичная форма 403 12.3.3. Матрица квадратичной формы 404 12.3.4. Матрица эрмитовой квадратичной формы 405 12.3.5. Представления через скалярные произведения 406 12.4. Закон инерции квадратичных форм 408 12.4.1. Главные оси и канонические базисы 408 12.4.2. Закон инерции квадратичных форм 410 12.4.3. Общий базис пары квадратичных форм 412
10 Оглавление 12.5. Знакоопределенные матрицы 413 12.5.1. Общие свойства знакоопределенных матриц j 413 12.5.2. Спектральные свойства знакоопределенных матриц 416 12.5.3. Сохранение знакоопределенности , 418 12.5.4. Матричные неравенства 420 12.5.5. Квадратный корень из матрицы 422 12.5.6. Приведение пары эрмитовых матриц 425 12.5.7. Обобщенная проблема собственных значений 427 12.6. Билинейно метрические пространства 428 12.6.1. Изотропные векторы 428 12.6.2. Числовые области матриц * 429 12.6.3. Критерии изотропности 431 12.6.4. Билинейно метрическое пространство 433 12.6.5. Ортогональность и ортогональное дополнение 434 12.6.6. Свойства матрицы и определителя Грама 436 12.6.7. Нулевые подпространства 438 12.6.8. Невырожденные пространство и подпространство 439 12.6.9. Свойства невырожденного подпространства 440 12.7. Ортогональные, псевдоортогональные и другие базисы 443 12.7.1. Ортогональный базис 443 12.7.2. Псевдоортогональный базис 446 12.7.3. Двойственные, псевдодвойственные и другие базисы 447 12.8. Ортогонализация 449 12.8.1. Общий процесс псевдоортогонализации 449 12.8.2. Ортогонализация Грама-Шмидта 453 12.8.3. Псевдодвоиственная и двойственная ортогонализация 453 12.8.4. Последовательность Крылова и минимальный многочлен 456 12.8.5. Трехчленные процессы ортогонализации 459 13. Векторные и матричные нормы 465 13.1. Метрическое пространство 465 13.1.1. Расстояние и предел 465 13.1.2. Окрестность и замыкание 467 13.1.3. Полное пространство ..; 468 13.2. Нормированное пространство 470 13.2.1. Норма и метрика ^ 470 13.2.2. Конкретные нормы 472 13.2.3. Свойства нормы 475 13.2.4. Сходимость последовательностей 475 13.2.5. Полнота нормированных пространств 479 13.2.6. Свойства нормированных пространств 480 13.3. Матричные нормы 483 13.3.1. Аддитивная и мультипликативная нормы 483 13.3.2. Согласованная и подчиненная нормы 485
Оглавление 13.3.3. Конкретные матричные нормы 487 13.3.4. Евклидова и спектральная нормы 489 ЧАСТЬ II. ЛИНЕАЛ — НОВЫЕ ВОЗМОЖНОСТИ ИЗУЧЕНИЯ ЛИНЕЙНОЙ АЛГЕБРЫ 491 14. Сведения о компакт-диске с системой ЛИНЕАЛ 493 14.1. Системные требования 493 14.2. Архитектура системы 493 14.3. Порядок работы с энциклопедией 493 14.4. Что делать, если что-то не работает 494 15. Небольшие иллюстрации к руководству по системе ЛИНЕАЛ 497 15.1. Как узнать, оказывает ли статья А влияние на появление статьи В 497 15.2. Что означают уровни сложности статей 497 15.3. Как строятся графы связей по параграфам и главам 498 15.4. Как связаны сложности параграфа-предшественника и параграфа-следствия.. 499 15.5. Как ознакомиться с содержанием ссылок 499 15.6. Какие установить метки у статей 500 15.7. Как увидеть содержание статей 500 15.8. Какие операции можно проводить с выборками 501 15.9. Как выбрать определения из заданной совокупности статей 502 15.10. Как подготовить памятные записи по лекциям 503 15.11. Как установить связи конкретной статьи с другими статьями 504 15.12. Что означает красная кнопка в выборке структурного указателя 505 15.13. Что является главным в системе ЛИНЕАЛ 505 16. Примеры использования системы ЛИНЕАЛ 507 16.1. Построение расширенного пополнения 507 16.2. Составление цикла лекций на заданную тему 508 16.3. Определение узких мест цикла лекций 512 16.4. Определение ключевых точек цикла лекций 514 16.5. Оператор и псевдообратная матрица 516 16.6. Знакомство с первыми двумя разделами 518 16.7. Вся предметная область и работа с графами 520 17. Предметный указатель 529 18. Список литературы 543
Предисловие Почему появилась именно эта книга? Книга, с которой вы сейчас знакомитесь, не обычна во многих отношениях. На первый взгляд кажется, что это справочник по базовым сведениям в области линейной алгебры. Действительно, книга может выполнять такую функцию. Но различных справочников по линейной алгебре уже издано достаточно много. Так зачем же читателю предлагается еще один и какая в нем новизна? Математическую литературу, а справочную и учебную особенно, наиболее ярко характеризуют три составляющие: содержание материала, его структура и возможные способы освоения всего того, что в ней представлено. В данной книге заметные новинки имеются во всем. Знакомясь детально с содержанием отдельных разделов, легко видеть, что в ней можно найти практически любую информацию, которая дается в большинстве типовых курсов линейной алгебры. Чтобы начинать читать книгу, вполне достаточно владеть знаниями по математике в объеме школьной программы. Но тогда что это — обычный учебник? Безусловно, математическую часть справочника вполне можно рассматривать как традиционный учебник или, точнее, традиционное учебное пособие по расширенному теоретическому курсу линейной алгебры. Однако в форму представления материала внесены существенные и не совсем привычные для учебной литературы изменения. Весь материал детально структурирован. Выделены и представлены в самостоятельном виде не только определения и важнейшие результаты, оформляемые обычно как леммы и теоремы, но и все даже самые мелкие факты, имеющие сколько-нибудь заметное значение. Это позволяет тщательно контролировать процесс обучения и не поддаваться обольщению его упрощения за счет явного или неявного пропуска различных деталей, иногда весьма важных. Представленный материал достаточно обширен. На его основе в действительности можно построить не один жестко очерченный теоретический курс линейной алгебры, а множество различных курсов, в том числе посвященных специальным темам.
14 Предисловие Математическая часть материала в книге почти целиком построена на использовании алгебраического или, даже точнее, матрично-векторного аппарата. Обратиться к по- , добному представлению побудили следующие соображения. Для решения задач из многочисленных приложений нередко приходится использовать факты и методы линейной алгебры совместно с различными сведениями из общей алгебры, математического анализа, аппроксимации функций, интегральных и дифференциальных уравнений. Кроме этого, линейная алгебра, конечномерная по своей природе, прекрасно иллюстрирует различные положения из формально далеких от нее областей, имеющих дело с бесконечномерными объектами: математическая физика, теория операторов, экстремальные задачи, функциональный анализ. Перечень связанных с линейной алгеброй областей, конечно, можно продолжить. При построении курса линейной алгебры все это вызывает большой соблазн включить в него различные факты и терминологию из смежных дисциплин. Тем более, что принятие подобных решений кажется вполне обоснованным: линейная алгебра выглядит при этом менее абстрактной ~и не изолированной от других предметов, при переходе к более сложным разделам математики оказываются подготовленными как необходимая терминологическая база, так и нужный иллюстративный материал и т. п. Подобные расширения курса линейной алгебры практикуются не так уж редко. Но жизнь заставляет усомниться в целесообразности этого. Многолетнее общение с выпускниками разных вузов, в том числе самых элитных в отношении математического образования, показывает потрясающую беспомощность большинства из них в тех ситуациях, когда требуется грамотно решить самые простые прикладные алгебраические задачи. Но ведь именно задачи линейной алгебры составляют вычислительный фундамент большинства проблем, решаемых на современной вычислительной технике! Так что же делать для исправления ситуации? Наверное, невозможно найти в общем случае однозначный ответ на этот вопрос. Но, по-видимому, в любых конкретных условиях его найти можно. Первое, с чего надо начинать формирование курса линейной алгебры, — это четко сформулировать его главную цель. Именно главную, а не одну из многих. После этого надо сделать второй шаг и найти ответ на вопрос о том, насколько в действительности необходимы те или иные изменения курса линейной алгебры в интересах других дисциплин. И, наконец, стоит подумать о повышении эффективности самого процесса освоения материала, в том числе и теоретического. Многие решения, которые приняты в настоящей книге, вызваны общей обеспокоенностью состоянием образования в .вычислительных науках. Поэтому здесь предполагается, что главная цель изучения линейной алгебры состоит в формировании основ вычислительного фундамента. Эта цель никак не сказалась на структуре представленного материала, но она очень сильно повлияла на выбор терминологической базы и аппарата проведения исследований. Матрично-векторный аппарат кажется вполне естественным для описания линейной алгебры. Он достаточно нагляден и конструктивен. Более того, этот аппарат, а не какой-либо иной, наиболее часто используется в линейной алгебре при решении различных теоретических проблем и разработке численных методов. Поэтому и использование связанной с ним терминологии выглядит естественно. Существенное же вве-
Предисловие 15 дение в линейную алгебру любой не связанной с матрично-векторным аппаратом терминологии и другой посторонней атрибутики мало помогает для ее собственного развития, но приводит к ощутимым издержкам. Издержки связаны, прежде всего, с психологическими аспектами восприятия материала. Процесс преподавания курса линейной алгебры в вузах приходится на самые первые семестры. В данный период на обучающихся обрушивается поток новых сведений и новой терминологии. Но в этот же период у них начинает формироваться научный интерес. Если в потоке новой информации не будет заметен матрично-векторный аппарат, то он, скорее всего, и не станет восприниматься в дальнейшем как один из важнейших элементов вычислительного дела. На наш взгляд, при этом будет отходить на второй план и вычислительная значимость самой линейной алгебры. Высказанные соображения во многом определили формат и построение математической части книги. Конечно, читатель увидит элементы из многих других дисциплин: общей алгебры, теории операторов, различных пространств, в том числе линейных, метрических, полных, нормированных и т. п. Но это именно элементы. Основной смысл их введения — наметить связующие "мостики", в первую очередь терминологические, между линейной алгеброй и смежными математическими областями. Влияние некоторых "мостиков" может в действительности распространяться очень глубоко. Однако оно не сопровождается постоянным использованием характерной для этих "мостиков" терминологии. Практически все построение линейной алгебры выполнено с помощью матрично-векторного аппарата без сколько-нибудь серьезного использования указанных элементов. Есть лишь одно исключение и связано оно с псевдообратной матрицей. Это понятие также можно было бы ввести чисто алгебраическим способом. Но подойти к нему наглядно, применяя лишь матричную технику, не просто. А вот используя понятие оператора, псевдообратную матрицу можно ввести очень изящно и вполне естественным образом. Как бы ни описывать линейную алгебру, она все равно остается сложной, трудновос- принимаемой, абстрактной наукой. Хотя первая часть настоящей книги вполне может служить самостоятельным справочным или учебным пособием по теоретическим вопросам линейной алгебры, ее написание не является единственной целью выпуска книги в свет. Основной замысел состоит в том, чтобы на примере линейной алгебры продемонстрировать принципиально новые методы освоения сложного теоретического материала. Этот замысел подробно обсуждается в части II книги. Более того, он доведен до практического воплощения и реализован в виде специальной программной системы, записанной на прилагаемом к книге компакт-диске. Прежде чем обсуждать основной замысел детально, выскажем несколько общих соображений по поводу математического образования. Профессиональное математическое образование — одно из наиболее ярких достижений российской высшей школы. Однако в современных условиях приходится прилагать немало усилий, чтобы сохранить завоеванные позиции. Как и образование в целом, математика оказалась под жестким давлением времени. Развитие науки заставляет вводить в процесс обучения новые дисциплины. Из-за этого основные математические курсы сокращаются, а их изложение часто становится в какой-то мере
16 Предисловие поверхностным и менее детальным. Сама математика развивается сейчас настолько бурно, что ее достижения не удается отразить даже в специальных курсах. При этом образовательные средства практически не меняются в течение многих десятилетий: те же лекции, семинары, экзамены, контрольные и т. п. По существу основными носителями знаний, по-прежнему, являются преподаватель и книга. Естественно возникает вопрос: "Как сделать доступ к профессиональным математическим знаниям более эффективным?". Линейная алгебра является одним из самых устоявшихся разделов высшей математики, по крайней мере, в базовой ее части. За последние три-четыре десятилетия содержание курсов по линейной алгебре меняется очень мало. Если проанализировать изданные за этот период учебники и учебные пособия, то нетрудно заметить, что они мало чем отличаются друг от друга. Несколько меняется терминология, меняется порядок изложения материала, меняются акценты. Но в целом объем излагаемого материала остается почти одним и тем же. Различные варианты учебников и учебных пособий отражают скорее различия во взглядах авторов на характер изложения материала, чем различия в объемах описываемых знаний. Ясно, что на пути подобных модификаций курсов нельзя существенно повысить уровень освоения материала. Весь опыт преподавания не только линейной алгебры, но и многих других дисциплин показывает, что эффективность освоения материала при традиционном использовании связки книга-преподаватель практически достигла своего предела. Следовательно, для дальнейшего повышения эффективности необходимо привлечение каких-то новых технологий. Как будто бы ответ на вопрос, что это за технологии, ясен. Ведь всюду только и говорится о компьютеризации знаний, электронных образовательных средствах, информатизации образования, дистанционном обучении. Продолжать этот перечень можно по всему списку знакомых терминов. Но если ответ ясен, то почему не видно обилия компьютерных учебников? И в чем причина того, что электронные образовательные средства так трудно внедряются в процессы обучения? Конечно, можно говорить о недостаточном техническом оснащении вузов. Но во многих вузах этой проблемы нет. На наш взгляд, поиск ответов на многочисленные вопросы, касающиеся электронных образовательных средств, надо начинать совсем с другого конца. А именно с вопроса: "А чем конкретно не устраивает книга как источник знаний?". Без обстоятельного ответа на него невозможно построить эффективные образовательные средства нового типа. К сожалению, многочисленные публикации и обсуждения этой темы почти всегда сводятся к констатации лишь каких-то общих методологических положений и оценок. Они содержат мало конкретных предложений. А это, в свою очередь, не позволяет разрабатывать практически реализуемые новые формы представления знаний. Во всяком случае, пытаясь создать такие формы для линейной алгебры, подходящие конструктивные идеи обнаружить не удалось. Тем не менее на примере теоретического курса линейной алгебры попробуем понять, чем может не устраивать книга как источник знаний и чем может оказаться полезен компьютер при выборе других форм представления знаний. Пытаясь разобраться с линейной алгеброй по обычному книжному материалу, любой читатель, будь он студентом или крупным специалистом, постоянно встречается с
Предисловие 17_ трудностями поиска ответов на вопросы, связанные с логической предысторией и использованием того или иного факта. Традиционный книжный материал плохо приспособлен для подобного поиска, так как любые ссылки в нем, как правило, связываются только с нумерацией страниц в книге, да и то не всегда строго. Некоторое исключение представляют лишь хорошие справочники. Но удобство пользования ими достигается за счет очень тщательного структурирования материала и удачного выбора многомерной нумерации всей совокупности излагаемых в справочнике фактов. Однако учебники и учебные пособия по такой схеме не создаются. А, собственно говоря, что мешает их так создавать? Скорее всего, лишь традиции и инерция привычки. Линейная алгебра устроена логически достаточно сложно. Весь материал в ней можно разбить на фрагменты, которые представляют описание каких-либо фактов, вводят новые определения или просто комментируют что-то. Каждый из фрагментов может сопровождаться примерами, доказательствами, списком литературы или любым другим необходимым материалом. Все фрагменты логически связаны друг с другом, показывая, какие из них на базе каких строятся. Такую структуру невозможно эффективно отразить в книге. Значит, новые возможности надо искать на пути перевода традиционного книжного материала в подходящим образом организованную электронную базу. Правда, при этом возникает много вопросов: как создавать такую базу, как с ней работать и т. п. Ведь очевидно, что если книгу представить в электронном виде без существенных переделок, то мало что изменится. Скорее всего, станет только хуже, поскольку читать текст с экрана и не удобно, и утомительно. Безусловно, использование компьютера очень эффективно в организации различных видов поиска. Но не очень ясно, что стоит искать, если иметь в виду тот материал, который дается в книге. Компьютер незаменим при организации всякого рода счета. Но в теоретическом курсе линейной алгебры никакого счета нет. С помощью компьютера легко показывать различные рисунки, фотографии, схемы, таблицы. Но линейная алгебра является в высшей степени абстрактной наукой. Многомерность ее объектов не позволяет в полной мере использовать иллюстративный материал для сопровождения процесса обучения. Конечно, на начальном этапе освоения линейной алгебры какие-то положения можно иллюстрировать соответствующими примерами из аналитической геометрии. Но это только на начальном этапе. Возможно, что именно отсутствие достаточного числа иллюстративных элементов, не позволяющее видеть предмет целиком как некоторую совокупность взаимосвязанных образов, делает затруднительным изучение абстрактных дисциплин. О попытках найти такие образы в линейной алгебре стоит сказать несколько подробнее. Тем более что возможность их использования выходит далеко за рамки линейной алгебры. С целью облегчения процесса освоения линейной алгебры был написан справочник [3]. В нем содержится много самого разного материала, в том числе приводятся весьма подробные сведения по теоретическому курсу линейной алгебры. Эти сведения представляют собой большое число утверждений, содержащих описание отдельных фактов и определений. Никаких доказательств не приводится. Система утверждений в справочнике систематизирована достаточно глубоко. Поэтому по ней относительно легко находить почти любой факт и понятие из общеобразовательного курса линей-
18 Предисловие ной алгебры. Возможно, именно этим обстоятельством объясняется тот факт, что в свое время справочник оказался популярным среди студентов и аспирантов, особенно в период подготовки к экзаменам. Собственно говоря, последнее обстоятельство и стало главным импульсом, подтолкнувшим к принятию решения создать некоторую программную систему, поддерживающую процесс освоения нового материала, причем создать на новой методологической и технической основе [2]. Выбор линейной алгебры в качестве предметной области оказался совершенно естественным. Этот курс в той или иной мере читается практически в каждом вузе. Кроме этого, по данному курсу нами был накоплен достаточно большой как педагогический опыт, так и общий багаж знаний. Важным фактором, определяющим принятие решения, было и то, что у нас имеется квалифицированный коллектив, владеющий современными программными и сетевыми технологиями. Основная идея состоит в следующем. Допустим, что теоретический курс разбит на конкретные фрагменты, которые надо освоить в процессе обучения. Пусть они представляют определения, понятия и факты. Ясно, что все они каким-то образом связаны. между собой. Построим ориентированный граф. В качестве вершин возьмем отдельные фрагменты. Дуги будем проводить следующим образом. Пусть вершина соответствует некоторому понятию. Каждое новое понятие всегда возникает как следствие совместного рассмотрения нескольких уже введенных ранее понятий. Проведем дуги из вершин, инициирующих новое понятие, в соответствующую ему вершину. Каждый новый факт связывает или использует в своей формулировке также несколько введенных ранее понятий. Проведем *аким же способом дуги, соответствующие этим понятиям и факту. Кроме этого, в процессе доказательства справедливости конкретного факта могут быть использованы какие-то другие, ранее установленные факты. И это использование отметим дугами. Назовем построенный граф — графом причинно-следственных отношений предметной области. Имея граф причинно-следственных отношений предметной области, тексты фрагментов с различными пояснениями, а также структурный, предметный и некоторые другие каталоги, характеризующие всю совокупность фрагментов, можно решать большое число самых разных задач, полезных как для лекторов курсов, так и для лиц, изучающих эти курсы. По каталогам можно выбрать совокупность нужных понятий и фактов. Тем самым определяется содержательная часть требуемого курса. Вместе с дугами она позволяет построить его граф причинно-следственных отношений. Разобьем все множество фрагментов графа на отдельные группы, в каждой из которых фрагменты не связаны между собой дугами. Перенумеруем группы последовательно по направлению дуг. Такое представление графа принято называть параллельной формой. Фрагменты в каждой группе можно изучать независимо, а сами группы последовательно в порядке роста номеров. Фрагменты группы с наименьшим номером являются базовыми. Они задают для предметной области исходные сведения. В частности, для линейной алгебры, описанной в настоящей книге, в базовые входят лишь сведения, касающиеся вещественных чисел, простейших тригонометрических функций и определения произвольных множеств. Проходя по дугам графа вперед и
Предисловие назад, значительно легче представить в целом структуру предметной области, чем читая книгу много раз. Сразу видно, какие доказательства в данном курсе можно проводить полностью, а в каких неизбежно будут пропуски. Параллельная форма графа показывает, какие темы не связаны между собой и насколько их изложение можно разносить друг от друга. Сам по себе граф показывает, на что опирается каждый конкретный фрагмент и что опирается на него. Это как раз та информация, которую очень трудно получить из обычного книжного текста. Имея граф причинно- следственных отношений, структуру предметной области уже легко визуализировать. Для этого компьютерные технологии подходят как нельзя лучше. Работа с графом и каталогами очень многогранна и ее разнообразие ограничивается только фантазией пользователей и разработчиков соответствующих систем. Заметим, что каждый лектор при изложении своего курса явно или неявно следует какому-то графу: выбирает необходимую совокупность понятий и фактов (вершины графа), выстраивает их в логически связанную последовательность и проводит доказательства (дуги графа). Вообще говоря, это означает, что граф предметной области определяется неоднозначно. Он зависит от выбора как состава фрагментов, так и связей между ними. Для одной и той же предметной области и то, и другое можно выбирать из различных соображений. Если, например, поставить цель как можно быстрее доказать теорему о приведении матрицы к жордановой форме, то это определяет один набор фрагментов и связей. Различные способы введения понятия определителя матрицы и изучения его свойств задают другие наборы, причем различные для разных способов. Каждый конкретный граф причинно-следственных отношений всегда является ациклическим. Если проанализировать различные курсы по одной и той же дисциплине, особенно традиционной, то можно заметить следующее. Конкретные совокупности понятий и фактов почти всегда выбираются из одной и той же известной совокупности и очень редко "разбавляются" чем-то новым. Почти всегда при изложении понятий и фактов сохраняется одно и то же отношение предшествования. Как правило, меняются местами только те сведения, которые на самом деле не связаны друг с другом. Если объединить различные множества фрагментов, появляющиеся при достижении разных частных целей, то очерчивается некоторая их совокупность, из которой при необходимости можно выбрать что-то конкретное. Теперь соберем вместе все значимые понятия и факты, используемые в различных курсах по одной и той же дисциплине. Возьмем их в качестве вершин графа. Установим описанным выше способом дуги. Если окажется, что в какую-то вершину входит большое число дуг, разобьем соответствующее понятие или факт на более мелкие. Будем добиваться того, чтобы в каждую вершину входило лишь небольшое число дуг. И, конечно, будем следить за тем, чтобы граф был ациклическим. Далее, мы можем пометить вершины графа, указав, например, уровень их сложности, степень общности и т. п. Мы можем присоединить к графу дополнительные вершины, соответствующие иллюстрирующим примерам, комментариям, доказательствам и т. п., пометив их надлежащим образом. Тем самым будет построен некоторый объединенный курс предметной области и его причинно-следственный граф. Собственно говоря, как раз такой курс и представлен в настоящей книге. В свою очередь, у каждого
2Ю Предисловие читателя есть возможность самостоятельно выбрать из этого курса нужный ему материал в соответствии с собственным представлением о том, что необходимо. О технике такого выбора и других возможностях работы с объединенным курсом подробно рассказывается в части II книги. На всех этих идеях сконструирована и реализована электронная энциклопедия ЛИНЕАЛ, предназначенная для получения базовых теоретических сведений в области линейной алгебры. Именно она представлена на прилагаемом к книге компакт- диске. Энциклопедия рассчитана на широкий круг пользователей — от студента младших курсов до аспиранта, научного работника и преподавателя, Для работы с ней необходимо знать азы пользования персональным компьютером и иметь самые начальные математические знания. Ничего другого для теоретического освоения линейной алгебры не требуется. Традиционно для энциклопедий все отдельные фрагменты названы статьями. Материал разбит на 13 разделов, 60 глав, 253 параграфа и 1531 статью, которые объединяются в единое целое 8525 связями. По содержанию статьи представляют 152 комментария, 417 определений и 962 описания различных лемм, теорем и других фактов. Работая в течение многих лет в высшей школе, мы пришли к вполне определенным выводам относительно того, как должны быть устроены образовательные средства. Главный из них состоит в том, что необходимо обеспечить максимально возможную взаимозаменяемость учебных средств на бумажных и электронных носителях. Это диктуется, в первую очередь, значительным различием условий доступа к знаниям в отдельных регионах России. В крупных городах, в которых имеется хорошая возможность использования сети Интернет, доступны любые виды получения знаний, в том числе дистанционные. Однако в вузах, где нехватает даже обычных персональных компьютеров, неизбежен крен в сторону использования традиционных образовательных средств. К тому же, в силу привычки или наличия каких-то трудностей общения с компьютером, работа с книгой может оказаться для человека более комфортной. Поэтому различные условия реализации процесса образования могут возникать по самым разным причинам. Но они не должны быть препятствием к обеспечению возможности получения образования одного и того же или почти одного уровня качества. Суммируя сказанное, видится следующая иерархия построения образовательных средств. Ее основу составляют учебные пособия на бумажных носителях. В них должны быть отражены как основные, так и многочисленные дополнительные сведения, необходимые для глубокого изучения предмета. Число различных пособий должно определяться уровнем и темпом развития дисциплины. Для установившихся предметных областей различных учебных пособий, на наш взгляд, не должно быть много. Над этими учебными пособиями необходимо иметь небольшое число согласованных с ними учебников, описывающих базовые знания и основные методологические приемы освоения материала. Учебники должны быть изданы на бумажных носителях. Среди них должен быть, па крайней мере, один, глубоко структурированный и построенный в виде справочника. В свою очередь, над ним должна быть создана и эффективно функционировать программная система, обеспечивающая новые методы изучения материала. Эта система должна быть реализована в двух вариантах: как автономная — для персонального компьютера и как интернет-версия. Важно, чтобы для
Предисловие 21 пользователя стиль работы с обоими электронными вариантами был одним и тем же. Наличие интернет-версии позволяет оперативно вносить в систему изменения и дополнения. Конечно, наряду с учебниками примерно по тому же принципу должны быть созданы задачники и программные системы, контролирующие процессы выполнения упражнений. И, наконец, завершать иерархию образовательных средств должна доступная из сети Интернет информационно-справочная система, оперативно отражающая последние достижения в предметной области. В ее создании имеется своя специфика и мы не будем обсуждать здесь соответствующие проблемы. В качестве заключения отметим, что предлагаемая читателю книга представляет попытку объединения традиционной, электронной и дистанционной форм образования в конкретной математической области — теоретической линейной алгебре. Первую часть книги можно рассматривать как справочник, как расширенный учебник или как традиционное учебное пособие на бумажном носителе. Суть не в названии, а в том, как данный материал может быть использован. Компакт-диск и вторая часть книги представляют упоминавшуюся систему ЛИНЕАЛ и описание работы с ней. Эта же система ЛИНЕАЛ доступна в сети Интернет по адресу http://lineal.guru.ru. Важно подчеркнуть, что во всех трех вариантах используется один и тот же математический материал, а обе электронные версии полностью идентичны не только по стилю работы и предоставляемым возможностям, но даже по форме визуальных изображений на экранах компьютеров. Идеи, заложенные в систему ЛИНЕАЛ, достаточно универсальны. Они применимы к любой предметной области, как естественно-научной, так и гуманитарной, которую можно представить как совокупность объектов, объединенных логическими связями. Чтобы облегчить создание новых систем, программная оболочка системы ЛИНЕАЛ сделана не зависящей от предметной области. В ближайшее время появится аналогичная система в области параллельных вычислений. Она называется ПАРАЛЛЕЛЬ и будет доступна в сети Интернет по адресу http://parallei.guru.ru. Заметим, что для параллельных вычислений разработана и уже функционирует в течение многих лет доступная в сети Интернет информационно-справочная система PARALLEL.RU, оперативно отражающая последние достижения и события в области параллельных вычислений. По своим функциям эта система давно превратилась в интернет-центр, объединяющий сообщество специалистов в области параллельных вычислений. Она же по данной дисциплине представляет вершину иерархии образовательных средств, о чем говорилось выше. Реализация высказанной в [2] идеи создания электронных энциклопедий, пригодных к тому же для использования в целях образования, осуществлялась и долго, и трудно. Чтобы обеспечить достижение поставленной цели, необходимо было пройти два важнейших предварительных этапа. Во-первых, провести тщательное структурирование и разбиение на нужные фрагменты всего материала из линейной алгебры, установить причинно-следственные отношения между отдельными фрагментами. И, во-вторых, понять, какие функциональные операции должна выполнять система, разработать общие принципы ее построения, включая визуализацию и пользовательский интерфейс. Оба этапа тесно связаны между собой. Поэтому при поиске приемлемых решений их пришлось проходить неоднократно, изменяя каждый раз и то, и другое.
_22 Предисловие Вся работа по программированию, в том числе оформлению системы в виде интернет-версии и компакт-диска, выполнена сотрудником лаборатории параллельных информационных технологий Научно-цсследовательского вычислительного центра Московского государственного университета Брызгаловым П. А. Авторы выражают ему свою искреннюю благодарность. Мы благодарны также сотруднику той же лаборатории к. ф.-м. н. Антонову А. С, оказавшему существенную помощь в работе над формульными выражениями для интернет-версии и компакт-диска. Наша искренняя благодарность сотруднику факультета ВМиК МГУ профессору Икрамову X. Д. за множество ценных замечаний по математической части энциклопедии. Мы выражаем благодарность Российскому фонду фундаментальных исследований и отделению математических наук Российской академии наук. Значительная часть из того, что вошло в данную книгу, было получено в рамках выполнения грантов от этих организаций. Без поддержки этих организаций написать книгу и создать электронную версию системы ЛИНЕАЛ было бы значительно сложнее. И, наконец, нашу особую признательность мы хотим выразить нашим постоянным помощникам Гамаюновой Т. С. и Воеводиной С. Н. Без их самоотверженной работы по набору текста, его проверке, подготовке оригинал-макета и коррекции материала книга появилась бы гораздо позднее. Электронные системы в науке и образовании — перспективная и динамично изменяющаяся область. Многое в ней не установилось и во многом не ясны пути ее развития. Мы надеемся, что эта электронная книга-энциклопедия даст новый импульс в поиске нужных решений по повышению эффективности процесса освоения знаний. Валентин Воеводин и Владимир Воеводин
Математические сведения по линейной алгебре 1. Множества, элементы, операции 2. Система векторов 3. Матрицы и операторы 4. Определители 5. Расстояния, углы, объемы 6. Системы линейных алгебраических уравнений 7. Многочлены 8. Спектральные свойства матриц 9. Структура матриц общего вида 10. Нормальные матрицы 11. Мультипликативные представления матрицы 12. Билинейные формы 13. Векторные и матричные нормы
1. Множества, элементы, операции 1.1. Вещественные и комплексные числа 1.1.1. Вещественные числа 1.1-1.3 Операции над вещественными числами Над вещественными (действительными) числами я, Ъ выполняются следующие алгебраические операции и для них используются следующие обозначения: • сложение а + Ь\ • вычитание а - Ь; • умножение ab9a- b,a* b; • деление -,a/b,a:b; Ъ j • обратная величина b~l,—,\/b. Ъ Операции деление и обратная величина определены при Ъ ф 0. Других ограничений на числа a, b нет. Выбор обозначений определяется только соображениями удобства использования. Дополнение. Предполагается, что читателю известны простейшие свойства вещественных чисел. В частности, известны символика и свойства операций над ними. 1.1-2.3 Алгебраические свойства вещественных чисел Операции над вещественными числами обладают следующими свойствами: а + b = b + a, ab = ba\ {а + b) + с = а 4- (b + с), (ab)c = a(bc)\ a(b + c) = ab + ac.
Часть I. Математические сведения по линейной алгебре Первое свойство называют коммутативностью (перестановочностью)', второе — ассоциативностью (сочетательностью), третье — дистрибутивностью (распределительностью) умножения относительно сложения. Дополнение. Эти свойства операций над вещественными числами являются базовыми. С похожими свойствами других операций над другими объектами мы будем встречаться неоднократно. 1.1-3.3 Свойства чисел 0,1, -1 По отношению к вещественным числам 0, 1, — 1 и числам а, Ь всегда выполняются равенства: Дополнение. Числа 0,1, - 1 играют особую роль на множестве вещественных чисел. Именно поэтому они здесь выделены. 1.1-4.3 Пара вещественных чисел и угол Если вещественные числа а, Ъ не равны нулю одновременно, то существует такой угол ф, что cos ф = «/(о2 + b2I'2, sin ф = bltf + б2I'2. Дополнение. Если вещественные числа a, b не равны нулю одновременно, то существуют два числа Сумма их квадратов равна 1. Поэтому одно из них можно считать косинусом некоторого угла ф, а другое синусом roto же угла. По традиции косинусом считают первое число. 1.1.2. Геометрическое представление комплексных чисел 1.1-5.3 Комплексное число Комплексным числом называется упорядоченная пара (а, Ь) вещественных чисел а, Ь. 1.1-б.3 Действительная и мнимая части Если упорядоченная пара (а, Ь) представляет комплексное число z, то число а называется вещественной частью комплексного числа z и обозначается Re z, число Ъ называется мнимой частью комплексного числа z и обозначается Im z.
1. Множества, элементы, операции 27 1.1-7.3 Равные комплексные числа Два комплексных числа (а, Ъ) и (с, d) называются равными, если а = c,b = d. 1.1-8.3 Операции сложения и умножения Над комплексными числами вводятся следующие алгебраические операции: сложение (а, Ь) + (с, d) = (а + с, Ъ + б/); умножение (а, й) • (c,d) = (ас - bd, ad + be). 1.1-9.3 Алгебраические свойства комплексных чисел Для любых комплексных чисел и, v, z выполняются равенства: и + v = v + и, uv - vu; (и + v) + z = и + (v + z), (uv)z = u(vz); u(v + z) = uv + uz. Другими словами, операции сложения и умножения над комплексными числами обладают свойствами, аналогичными коммутативности, ассоциативности и дистрибутивности операций сложения и умножения над вещественными числами. Дополнение. Эти равенства легко проверяются непосредственно, исходя из определения 1.1-8 операций над комплексными числами и свойств 1.1-2 операций над вещественными числами. 1.1-10.3 Нулевые мнимые и вещественные части Операции сложения и умножения над комплексными числами с нулевыми мнимыми частями всегда дают комплексные числа с нулевыми мнимыми частями, при этом Дополнение. Эти равенства легко проверяются непосредственно, исходя из определения 1.1-8 операций над комплексными числами и свойств 1.1-2, 1.1-3 операций над вещественными числами. 1.1-11.3 Комментарий (комплексные и вещественные числа) Последние формулы говорят о том, что с точки зрения операций сложения и умножения комплексные числа с нулевой мнимой частью отличаются только символикой от вещественных чисел. Поэтому ничто не мешает рассматривать комплексные числа с нулевой мнимой частью как вещественные числа. 1.1-12.3 Отображение вещественных чисел на комплексные Комплексное число вида (а, 0) отождествляется с вещественным числом а.
Часть I. Математические сведения по линейной алгебре 1.1-13.3 Комплексные числа 0,1, -1 Комплексные числа вида @, 0), A,0), (-1,0) называются соответственно нулем, единицей и минус единицей и обозначаются 0,1, - 1. 1.1-14.3 Вычитание комплексных чисел Дл? любых комплексных чисел и, v существует единственное комплексное число z такое, что v + z = и. Если и = (a, b\ v = (c,d)9Toz = (a-c,b- d). Число z обозначается и - v, а операция получения z из щ v называется вычитанием v из м. Дополнение. Одно из чисел z указано явно. Допустим, что для заданных комплексных чисел w, v существуют два комплексных числа zb z2 таких, что V + Z\ - U, V + Z2 = U. Пусть z представлено в виде пары вещественных чисел (e,f). Должно выполняться равенство v + z = u или согласно 1.1-7 два равенства с + е = я, </+/=&. Из свойств операций над вещественными числами следует, что e = a-c,f=b-d и число z определяется единственным образом. 1.1-15.3 Вычитание, сложение и умножение на -1 Для любых комплексных чисел и, v имеет место формула и - v - и + (- l)v. Дополнение. Эта формула проверяется непосредственно, исходя из определений операций сложения, вычитания и умножения комплексных чисел, а также принимая во внимание символику 1.1-13 комплексного числа- 1. 1.1-1 б.3 Деление комплексных чисел Для любых комплексных чисел м, v, v * 0, существует единственное комплексное число z такое, что vz = и. Если и = (a, b), v = (с, d), то ас + bd be-ad Число z обозначается w/v, а операция получения z из w, v называется делением и на v. Дополнение. Пусть z представлено в виде пары вещественных чисел (e,J). Должно выполняться равенство vz = и. Представив произведение vz в виде пары веще- , ственных чисел, мы получаем согласно 1.1-7,1.1-8 два равенства ce-df=a, cf+de = b.
1. Множества, элементы, операции 29 Отсюда находим, что число z единственное и задается формулой [ac + hd hc-ad 1.1-17.3 Деление, обращение и умножение Для любых комплексных чисел м, v, v =? 0, имеет место формула ulv = mA/v). Дополнение. Эта формула проверяется непосредственно, исходя из определения операций умножения и деления комплексных чисел, а также принимая во внимание символику 1.1-13 комплексного числа 1. 1.1-18.3 Обратная величина Если комплексное число v Ф 0, то число 1/v называется обратной величиной числа v и обозначается v. 1.1-19.3 Свойства комплексных чисел 0,1, - 1 По отношению к комплексным числам 0, 1,- 1 и комплексным числам и, v всегда выполняются равенства w0 = 0w = 0, w + 0 = 0 + w = w, lu = u\=u; ulv = w(l/v) = uv~ \ - v = (- l)v, и - v = и + (- \)v. Дополнение. Все эти равенства проверяются непосредственно, исходя из определений операций над комплексными числами и принимая во внимание символику 1.1-13 комплексных чисел 0, 1, - 1. 1.1-20.3 Комментарий (комплексные и вещественные числа) Таким образом, мы видим, что имеется полное сходство между вещественными и комплексными числами по свойствам алгебраических операций. 1.1.3. Алгебраическое представление комплексных чисел 1.1-21.3 Мнимая единица Комплексное число (О, I) называется мнимой единицей и обозначается буквой /. 1.1-22.3 Квадрат мнимой единицы Имеет место равенство /2 = (- 1, 0). Дополнение. Равенство проверяется непосредственно.
Часть I. Математические сведения по линейной алгебре 1.1-23.3 Алгебраическое представление комплексного числа Любое комплексное число z = (а, Ъ) может быть представлено в виде что символически записывается следующим образом: z - a + ib. Дополнение. Пусть комплексное число z задано парой вещественных чисел (я, Ь). Равенство проверяется непосредственно, исходя из определения операций над комплексными числами. Согласно 1.1-12 числа (д, 0) и F, 0) отождествляются соответственно с а и b, a согласно 1.1-21 число @,1) обозначается /. Отсюда символическая запись z = а + ib. 1.1-24.3 Комментарий (символическая запись) Символическая запись комплексных чисел в форме z = а + ib очень удобна с точки зрения выполнения алгебраических операций над ними. Для комплексных чисел, заданных в символической форме, операции сложения, вычитания, умножения и деления производятся по обычным правилам выполнения этих операций над двучленами вида а + ib. Надо лишь принять во внимание, что /2 отождествляется с вещественным числом - 1, и всегда приводить подобные члены, т. е. группировать отдельно вещественные и мнимые части комплексных чисел. Например, (а + ib)(c + id) = ac + iad + ibc + i2bd =ac + iad + ibc -bd= (ac -bd) + i(ad + be). 1.1.4. Модуль и сопряжение 1.1-25.3 Модуль комплексного числа Для комплексного числа z = а + ib неотрицательное число г = (а2 + Ь2)т называется модулем комплексного числа z и обозначается Ы. 1.1-26.3 Нулевые модуль и число Модуль комплексного числа z равен нулю тогда и только тогда, когда z = 0. Дополнение. По определений z = 0 означает, что а = 0 и b = 0. Но это возможно тогда и только тогда, когда а2 + Ь2 = 0 или когда Ы =0. 1.1-27.3 Сопряженное комплексное число Для комплексного числа z = a + ib число а - ib называется сопряженным и обозначается z .
/. Множества, элементы, операции 31_ 1.1-28.3 Произведение числа на сопряженное Имеет место равенство z 1 = \z\2. Дополнение. Равенство проверяется непосредственно, исходя из определений умножения комплексных чисел, сопряженного комплексного числа и модуля комплексного числа. 1.1-29.3 Деление и сопряжение Для комплексных чисел м, v, v ф О, выполняется соотношение w/v = (l/|v|2)wv. Дополнение. Равенство проверяется непосредственно, исходя из определений соответствующих операций над комплексными числами и принимая во внимание символику 1.1-13 комплексного числа 1. 1.1-30.3 Свойства сопряжения Операция сопряжения комплексных чисел обладает следующими свойствами: z =z\ z= 1 тогда и только тогда, когда Im z = 0; z+ 1 = 2Rez, z-~z = 2Imz; u±v =w±v, wv = wv, u/v = u/v. Дополнение. Все равенства проверяются непосредственно, исходя из определений. 1.1.5. Тригонометрическое представление комплексных чисел 1.1-31.3 Тригонометрическое представление комплексного числа Любое комплексное число z = a + ib может быть записано в виде z = r(cos ф + / sin ф). Здесь г есть вещественное неотрицательное число. Оно равно \z\. Угол ф называется аргументом числа z и обозначается arg z. Дополнение. Если z = а + ib, то с учетом обозначений 1.1-25, 1.1-4 его можно записать в эквивалентных формах z = а + ib = (а2 + b2f2 ( 2 +* |/2 + i + 1 = |z|(cos9 + / s
32^ Часть I. Математические сведения по линейной алгебре Формально промежуточные преобразования верны лишь в случае z ф 0. Если же z = 0, то последнее представление становится очевидным. 1.1-32.3 Определенность аргумента Если комплексное число z не равно нулю, то arg z определяется с точностью до числа 2nk9 где k = 0, ± 1, ± 2,.... Если z равно нулю, то arg z не определен. Дополнение. Если z * 0, то множество возможных значений arg z следует из того, что синус и косинус как функции вещественного аргумента имеют период 2я. Если z = 0, то arg z не определен, исходя из формы представления числа z. Так как Ы = 0 в этом случае, то каким бы ни брать угол ф, произведение комплексного числа cos ф + / sin ф и вещественного числа 0 будет равно 0. 1.1-33-3 Свойства модуля и аргумента Если w, v суть комплексные числа, то |wv|= Iwllvl, argwv = argw + argv; \ulv\ = |w|/|v|, arg u/v = arg u - arg v, v * 0. Дополнение. Все равенства проверяются непосредственно, исходя из определений и свойств тригонометрических функций. Рассмотрим для примера одно из них. Пусть u = |w|(cos ф +1 sin ф), v = |v|(cos у +/ sin vj/). Тогда uv = Ы |v l((cos ф • cos \j/ - sin ф • sin у) + /(sin ф • cos \|/ + cos ф • sin \j/)). Откуда вытекают первые равенства. Вторые равенства доказываются аналогично. 1.1.6. Степени и корни 1.1-34.3 Формула Муавра Если z = r(cos ф + i sin ф), то для любого п = 0, 1,2, ... z" = /'(cos жр + i sin жр). Это соотношение называется формулой Myaepa. Дополнение. Формула Муавра является прямым следствием л-кратного применения первых равенств из 1.1-33 при п > 0. При п = 0 формула очевидна. 1.1-35.3 Корень из комплексного числа Корнем п-й степени из комплексного числа z называется комплексное число а такое, что a" = z. l
1. Множества, элементы, операции 33 1.1-36.3 Корень из нуля Если z = 0, то существует единственный корень /i-й степени из z и он равен нулю. Дополнение. Если z = О, то не нулевого корня я-й степени из z существовать не может, т. к. будучи возведенным в n-ю степень он обязательно даст не нулевое число. 1.1-37.3 Все корни из комплексного числа Для ненулевого числа z = r(cos <p + / sin ф) существует ровно п различных корней а0, аь . •., а«-1 л-й степени: а, =rUn\ cos-1- + /sm- V п п ) Дополнение. Пусть а — корень л-й степени из z и а = p(cos G + sin 0). В силу 1.1-34 а" = p"(cos я0 + / sin я0). Поскольку а" = z, то согласно 1.1-32 р" = г, W0 - ф + 2яЛ, * = 0, ± 1, ± 2, .... Так как р > 0, г > 0, то существует единственный положительный корень л-й степени из положительного числа г. Это — арифметический корень р = г1/". Для 0 получаем: 0 = (ф + 2пк)/п. При к = 0, 1, ..., п- 1 числа ]/п/ ф + 2дА: . . ф + 2тг?ч а. = г1'"(cos-*- +1 sin- ) п п различны, так как их аргументы различны и отличаются друг от друга меньше, чем на 2тт. При к > п числа а* совпадают с какими-то из первых. 1.1-38.3 Все корни из 1 Комплексные числа 2пк . . 2пк . Л Л t Ек =COS + 1 Sin Д = 0, 1, ..., П-\ п п образуют совокупность всех корней и-й степени из числа 1. При к = 1 корень называется первообразным. Дополнение. Для z=l имеем г=1,ф = 0. Поэтому справедливость этого утверждения является прямым следствием утверждения 1.1-37. 1.1-39.3 Представление всех корней из комплексного числа Все корни w-й степени из ненулевого комплексного числа получаются умножением одного из этих корней на все корни л-й степени из 1. 2 Зак 740
34 Часть I. Математические сведения по линейной алгебре Дополнение. Пусть z - r(cos ф + / sin ф) и а* для ? = О,1,..., я - 1 являются согласно 1.1-37 корнями и-й степени из z. В соответствии с 1.1-33, 1.1-38 имеем: 1.1.7. Общепринятые названия 1.1-40.3 Алгебраическая, геометрическая и тригонометрическая формы Форма представления комплексного числа в виде упорядоченной пары (а, Ь) называется геометрической, в виде a + ib — алгебраическойу в виде r(cos ф + / sin ф) — тригонометрической. 1.1-41.3 Комментарий (формы представления чисел) Различные формы представления комплексных чисел не имеют принципиальных различий. Их применение определяется лишь удобством выполнения операций над числами, а также удобством интерпретации как самих комплексных чисел, так и операций над ними. 1.1-42.3 Поле вещественных чисел Множество вещественных чисел со свойствами 1.1-1—1.1-3 алгебраических операций называется полем вещественных чисел. 1.1-43.3 Поле комплексных чисел Множество комплексных чисел со свойствами 1.1-7—1.1-19 алгебраических операций называется полем комплексных чисел. 1.1-44.3 Связь полей между собой Поле вещественных чисел входит в поле комплексных чисел. Дополнение. Это следует из того, что при соглашении 1.1-12 выполнение операций 1.1-1^-1.1-3 оставляет мнимую часть чисел нулевой. 1.2. Множества и элементы 1.2.1. Множества и операции над ними 1.2-1.3 Комментарий (характеристические свойства) В этом курсе мы будем рассматривать те или иные совокупности объектов, объединенных некоторым общим признаком. Число различных видов объектов будет невелико. Однако большое число признаков или, как их называют иначе, характеристик
7. Множества, элементы, операции 35 ческш свойств, связывающих объекты, порождает огромное разнообразие их совокупностей. Мы уже знаем совокупности натуральных, целых, рациональных, вещественных и комплексных чисел, В ближайшее время познакомимся с другими совокупностями. 1.2-2.3 Множество и элементы Совокупность объектов, объединенных общим признаком (характеристическим свойством), называется множеством, а сами объекты — элементами множества. Дополнение. Понятию множества нельзя дать строгого определения. Для того чтобы определить какое-либо понятие, прежде всего необходимо указать, каким образом оно связано с более общими понятиями. Для понятия множества сделать это невозможно, т. к. для него более общего понятия в математике нет. Поэтому вместо строгого определения понятия множества можно привести лишь его иллюстрации на примерах. Мы уже знаем множества вещественных и комплексных чисел. В первом случае элементами множества являются вещественные числа, во втором — комплексные. Говоря о совокупности точек некоторой окружности на плоскости, мы говорим об объектах или, другими словами, элементах — точках плоскости, которые объединены тем свойством, что все они равноудалены от некоторой фиксированной точки. Изучая конструкцию какого-либо механизма, мы можем рассматривать совокупность всех его деталей. При этом отдельным элементом этой совокупности может быть любая деталь, а признаком, объединяющим эти элементы, — тот факт, что все они принадлежат вполне определенному механизму. С примерами различных множеств мы будем встречаться постоянно. 1.2-3.3 Комментарий (перенумерация элементов) Одной из самых первых операций, связанных с элементами произвольных множеств, является их перенумерация. Она нужна, прежде всего, для того чтобы иметь возможность отличать элементы друг от друга, причем даже в том случае, когда по своей природе сами элементы полностью совпадают. Наиболее часто номера элементов изображаются с помощью индексов. Сложность построения индексных выражений и их расположение по отношению к элементам может быть различной. Например, если мы хотим пометить элемент а двумя индексами /,у, то можно встретить любое из следующих обозначений aitj9 aij9 а/, а), /я, а[., a(i, j\ ai + j и т. п. Как правило, в качестве значений отдельных индексов берутся целые числа, чаще всего натуральные. 1.2-4.3 Пустое множество Множество, не содержащее ни одного элемента, называется пустым множеством и обозначается 0.
Зб> Часть /. Математические сведения по линейной алгебре 1.2-5.3 Комментарий (обозначения) Как правило, мы будем обозначать множества прописными латинскими буквами: А, В,..., а их элементы — малыми: а, Ь9.... Мы будем писать х е А, если элемент х принадлежит множеству А, и х ё А, если элемент х не принадлежит множеству А, Для множеств натуральных, целых, рациональных, вещественных и комплексных чисел используются, соответственно, специальные обозначения: N, Z, Q, R и С. 1.2-6.3 Подмножество Множество S называется подмножеством множества X, если из х е S следует х е X для любого элемента jc из множества 5. Этот факт обозначается символом SaX. Дополнение. Если согласно утверждению 1.1-12 вещественное число а отождествлять с комплексным числом вида (а, 0), то в качестве примера подмножества можно привести множество вещественных чисел как подмножество комплексных чисел. 1.2-7.3 Пустое множество как подмножество По определению пустое множество является подмножеством любого множества. 1.2-8.3 Известные множества чисел Имеют место включения NcZcQcRcC Дополнение. Эти включения очевидны. В самом деле, любое натуральное число является целым, любое целое можно рассматривать как рациональное со знаменателем 1, рациональное число является вещественным, а вещественное— комплексным с нулевой мнимой частью. 1.2-9.3 Равные множества Два множествами Y называются равными, если каждое из них является подмножеством другого. Этот факт обозначается символом Х= Y. 1.2-10.3 Объединение множеств Объединением (суммой) множествен У называется множество всех элементов, которые принадлежат хотя бы одному из множествXили Y. Объединение множествен Y обозначается ей У. Дополнение. Пример: объединение множеств чисел х > 0 и jc < 1 есть множество всех вещественных чисел.
1. Множества, элементы, операции 37 1.2-11.3 Пересечение множеств Пересечением множеств X и Y называется множество всех элементов, одновременно принадлежащих кгкХ, так и Y. Пересечение множествен YобозначаетсяXn Y. Дополнение. Пример: пересечение множеств чисел х > О и х < 1 есть множество вещественных чисел 0 < jc < 1. 1.2-12.3 Разность множеств Разностью множеств X и Y называется множество всех элементов из X, которые не содержатся в Y. Разность множествен YобозначаетсяX\Y. Дополнение. Пример: разность множеств чисел х > О и х < 1 есть множество вещественных чисел х > 1. 1.2.2. Декартово произведение 1.2-13.3 Декартово произведение множеств Декартовым произведением множествXnYназывается множество всех упорядоченных пар (х, у), в которых х еХ9у е Y. Это множество пар обозначается Хх Y. Дополнение. Пусть X и Y суть множества вещественных чисел. Тогда множество всех комплексных чисел можно рассматривать как декартово произведение множеств XhY. Если же, например, X={x:0<x<\}, Y={yA<y<2}, то декартовым произведением Хх Yb этом случае можно считать множество точек на плоскости, у которых абсцисса jc изменяется в пределах 0 < х < 1, а ордината^ изменяется в пределах 1 <у < 2. 1.2-14.3 Декартов квадрат Декартово произведение ХхХ называется декартовым квадратом множества X и обозначается символом X2. Дополнение. Если X и Y— одни и те же множества всех вещественных чисел, то множество всех комплексных чисел можно рассматривать и как декартово произведение Хх Y, и как декартов квадрат ХхХ=Х2. Если же множества X и Y различны, то будут различными и множества Хх YnX2. Пусть, например, снова рассматривается второй пример из дополнения к 1.2-13. Теперь X2 есть множество точек на плоскости, у которых абсциссах и ордината;; меняются в одних и тех же пределах 0 < х, у < 1. 1.2-15.3 Диагональ декартова квадрата Множество всех пар (х, х), где х е X, называется диагональю декартова квадрата X2.
Часть I. Математические сведения по линейной алгебре Дополнение. Если X есть множество всех вещественных чисел, а А2— множество всех комплексных чисел, то диагональю квадрата X2 будет множество комплексных чисел z, для которых Re z ~ Jm z. 1.2-1 б.3 Комментарий (порядок элементов) Обратим внимание на то, что декартово произведение состоит из упорядоченных пар элементов. Поэтому, если в множестве X мы выбираем два элемента х,уп хотим из них составить элемент декартова квадрата Х29 то обязательно должны указать, какой из элементов х, у должен быть в паре первым, а какой — вторым. 1.3. Эквивалентность и равенство 1.3.1. Бинарное отношение 1.3-1.3 Комментарий (сравнение элементов) Во многих ситуациях мы сталкиваемся с необходимостью так или иначе сравнивать пары элементов из каких-то множеств. Например, нам приходится сравнивать вещественные числа на равенство или не равенство, треугольники — на подобие или не подобие, уравнения — на эквивалентность или не эквивалентность и т. п. Несмотря на разнообразие ситуаций в них можно увидеть много общего. Во-первых, любое сравнение имеет дело с парами элементов или, другими словами, с элементами декартова квадрата множества. Элементы в паре могут быть упорядочены (как, например, при сравнении вещественных чисел на неравенство "<") или это требование может быть не обязательным (как, например, при сравнении треугольников на подобие). Во-вторых, всегда имеет место правило, используя которое можно выяснить, сравнимы конкретные пары элементов или нет. 1.3-2.3 Бинарное отношение Пусть задано множество X. Непустое подмножество R декартова квадрата X2 называется бинарным отношением. Если пара (х, у) элементов из X принадлежит R, то говорят, что х и у связаны отношением R и этот факт обозначают символом xRy. 1.3-3.3 Комментарий (обсуждение бинарного отношения) Если не сказать ничего больше, то понятие "бинарное отношение" не означает ничего другого, кроме как понятие "подмножество декартова квадрата" множествах Однако словосочетание "бинарное отношение" в действительности предполагает наличие некоторого продолжения. Слово "бинарное" подчеркивает, что имеется какой-то интерес в рассмотрении пар элементов множествах Слово "отношение" говорит о том, что пары элементов некоторым образом связаны между собой, обладают каким-то совместным свойством или, говоря иначе, находятся между собой в каком-то отношении. Чтобы конкретизировать бинарное отношение, надо конкретизировать то со-
1. Множества, элементы, операции 39 вместное свойство, которым должны обладать пары элементов бинарного отношения. Если, например, совместным свойством пар вещественных чисел является их равенство, то бинарное отношение равенства вещественных чисел конкретизируется и оказывается диагональю декартова квадрата X2. Различные свойства пар элементов одного и того же множества X и даже разных множеств нередко приводят к одним и тем же особенностям строения бинарных отношений как подмножеств декартовых квадратов. Рассмотрим некоторые из таких особенностей. 1.3-4.3 Рефлексивность, транзитивность, симметричность Бинарное отношение R, порожденное множеством X, называется: рефлексивным, если xRx для любого х е Х\ симметричным, если из xRy следует yRx для х,у е X; транзитивным, если из xRy, yRz следует xRz для x,y,ze X. 1.3.2. Эквивалентность 1.3-5.3 Отношение эквивалентности Бинарное отношение называется отношением эквивалентности, если оно рефлексивно, симметрично и транзитивно. 1.3-6.3 Эквивалентные элементы Если пара элементов (х, у) связана отношением эквивалентности, то говорят, что х и у эквивалентны и этот факт обозначают символом х ~у. 1.3-7.3 Комментарий (обсуждение эквивалентности) Отношения эквивалентности играют исключительно важную роль в математических исследованиях. Если рассмотреть такие свойства, как равенство вещественных или комплексных чисел, подобие треугольников, эквивалентность уравнений, равенство рациональных чисел, представленных отношениями двух целых чисел, и т. п., то все эти свойства порождают в соответствующих декартовых квадратах подмножества, являющиеся отношениями эквивалентности. В силу отмеченной схожести всех таких свойств их также принято называть отношениями эквивалентности. В дальнейшем, если не возникает недоразумения, мы будем говорить в аналогичных случаях, что на парах элементов множества X или просто на множестве X задано отношение эквивалентности. 1.3-8.3 Класс эквивалентности Пусть на множестве X задано отношение эквивалентности и элемент а принадлежит X. Множество всех элементов х из X, эквивалентных элементу а, называется классом эквивалентности, порожденным элементом а, и обозначается с1(я). Дополнение. Предположим, что множество X есть множество всех вещественных чисел, а отношение эквивалентности есть отношение равенства чисел. Тогда cl(a)
40 Часть I. Математические сведения по линейной алгебре состоит из одного числа а. Пусть теперь множество X есть множество всех треугольников на плоскости, а отношение эквивалентности есть отношение подобия треугольников. В этом случае cl(a) состоит из всех треугольников, подобных треугольнику я. 1.3-9.3 Пересечение классов эквивалентности Два класса эквивалентности либо не пересекаются, либо совпадают. Дополнение. В самом деле, два класса cl(a) и с1F) либо не пересекаются, либо имеют хотя бы один общий элемент с. Но любой класс порождается любым своим элементом, т. е. если Ь е с1(я), то cl(A) = cl(a). Действительно, если е принадлежит cl(ft), то е ~ Ь. Но Ъ ~ я, т. к. Ъ е с1(а), следовательно, е, ~ а, т. е. е е cl(a). Аналогично показывается, что если е е cl(a), то е е clF). Поэтому clF) = cl(a). Это означает, что если классы имеют хотя бы один общий элемент с, то они совпадают полностью. 1.3-10.4 Фактор-множество Пусть на множестве X задано отношение эквивалентности 8. Множество всех классов эквивалентности называется фактор-множеством множества X по отношению эквивалентности 8 и обозначается символом Дополнение. Пусть снова множество X есть множество всех вещественных чисел, а отношение эквивалентности есть отношение равенства. Согласно дополнению к 1.3-8, с1(я) состоит из одного числа а. Поэтому Х\е = X. Рассмотрим теперь множество Z всех целых чисел и будем считать, что т ~ л, если целые числа тип имеют одинаковую четность. Легко проверить, что это бинарное отношение есть отношение эквивалентности. Следовательно, все множество Z разбивается на два класса: Со — множество всех четных чисел и С] — множество всех нечетных чисел. Поэтому Zle = {Со, Ci}. 1.3-11.* Комментарий (эквивалентность, равенство, тождество) Пусть на парах элементов некоторого множества определено некоторое свойство, которое оказалось отношением эквивалентности. Тогда все множество разбивается на непересекающиеся подмножества-классы, в каждом из которых собраны все эквивалентные друг другу элементы и только они. Это означает, что с точки зрения рассматриваемого свойства различия между элементами, принадлежащими одному классу, не имеют для нас никакого значения и в дальнейшем по отношению к этому свойству должны проявлять себя одинаково. Ничто не изменится, если в конкретных ситуациях эквивалентные элементы мы будем называть равными или тождественными и вместо символа "~и использовать символы "=" или "г", Этим обстоятельством мы будем пользоваться очень часто.
1. Множества, элементы, операции 41 Если в проводимых исследованиях отношения равенства будут вводиться аксиоматически, то без дополнительных пояснений будем предполагать, что они являются отношениями эквивалентности. Если же отношения равенства будут вводиться конкретно, то их принадлежность отношениям эквивалентности нужно будет доказывать. 1.4. Алгебраические операции и их свойства 1.4.1. Алгебраические операции 1.4-1.3 Алгебраическая операция Будем говорить, что в множестве X определена бинарная алгебраическая операция или просто алгебраическая операция, если указан закон, по которому любой упорядоченной паре элементов а, Ь, взятых из этого множества, однозначным образом ставится в соответствие некоторый третий элемент с, также принадлежащий этому множеству. Дополнение. Обратим внимание на то, что алгебраическая операция определена над парой элементов. Поэтому, например, операция sinx на множестве вещественных чисел не является алгебраической, а операции сложения и умножения вещественных чисел являются алгебраическими. 1.4-2.3 Комментарий (обозначения и терминология) Алгебраическая операция может быть названа сложением, и тогда с будет называться суммой элементов а и Ъ и обозначаться символом с = а 4- Ъ\ эта операция может быть названа умножением, и тогда с будет называться произведением элементов а и b и обозначаться символом с = ab. Вообще терминология и символика для операции, определенной в множестве X, не будет играть в дальнейшем какой-либо существенной роли. Как правило, мы будем пользоваться символикой суммы и произведения, независимо от того, каким образом определена операция в действительности. Если же нам потребуется подчеркнуть некоторые общие свойства алгебраической операции, то будем обозначать операцию символом "*". 1.4-3.3 Коммутативная операция Алгебраическая операция называется коммутативной, если результат ее применения не зависит от порядка выбора элементов, т, е. для любых двух элементов а и Ъ из заданного множества имеет место равенство a* b = b* а. Дополнение. Примером коммутативной операции может служить сложение двух чисел, не коммутативной — вычитание двух чисел. 1.4-4.3 Ассоциативная операция Алгебраическая операция называется ассоциативной, если для любых трех элементов а, Ь, с исходного множества а * (Ь * с) = (а * Ь) * с.
42_ Часть I. Математические сведения по линейной алгебре Дополнение. Примерами ассоциативных операций могут служить сложение и умножение двух чисел, не ассоциативной операции — деление двух чисел. Например, (C/2) : 3) : C/4) - 2/3, но C/2): C : C/4)) = 3/8. 1.4-5.3 Комментарий (ассоциативность и скобки) Ассоциативность операции позволяет говорить об однозначно, определенном результате применения операции к трем элементам я, Ь, с, понимая под ним любое из выражений а * (Ь * с) или (а * Ь) * с, и писать а* Ь* с без скобок. 1.4-6.3 Ассоциативность и независимость от расстановки скобок Результат вычисления выражения а\ * а2 * ... * ап для ассоциативной операции не зависит от расстановки скобок при всех п. Дополнение. Докажем, что для ассоциативной операции результат вычисления не зависит от расстановки скобок. В самом деле, для п - 3 это утверждение вытекает из определения ассоциативной операции. Поэтому полагаем п > 3 и будем считать, что для всех чисел, меньших л, наше утверждение уже доказано. Пусть даны элементы аь а2,..., ап, и некоторым образом расставлены скобки. Последним шагом всегда будет выполнение операции над двумя элементами ai*a2*...*tf* и ак+, * ak+2 * ••• * я* для некоторого А, 1 ^ к< п. Так как оба^выражения содержат меньше п элементов, то по предположению они определяются однозначно, и остается показать, что для любых целых к, I > 1 (ах *а2* ... *ак)*(ак+{ *ак+2* ••• *ап) = = (а! * а2* ... *я*+/)*(я*+/+1 *я*+/+2* ¦•• * я*)- Обозначив а\ * а2 * ... * я*-б, Я*+1 * Д* + 2* "' * Л* + '" С> Я* + /+1 * Я*+1/ + 2 * ... * Ял = (/, мы получаем на основании ассоциативности операции, что Ъ * (с * d) = (b * с) * d9 и наше утверждение доказано. 1.4-7.3 Неассоциативность и зависимость от расстановки скобок Результат вычисления выражения ct\ * а2 * ... * а„ для неассоциативной операции в общем случае при п>2 зависит от расстановки скобок. Дополнение. Рассмотрим выражение 3/2:3: 3/4. Имеем (C/2): 3): C/4) = 2/3, но C/2) :C: C/4)) = 3/8.
7. Множества, элементы, операции 43 1.4-8.3 Независимость от скобок и порядка элементов Результат вычисления выражения а{ * а2 * ... * ап для ассоциативной и коммутативной операции при всех п не зависит ни от расстановки скобок, ни от порядка элементов. Дополнение. Пусть элементы а\9 а2, ...,ап выбраны в каком-то порядке aix9aJ2,...9aiu. Рассмотрим выражение ah *а^ *...*^ . Согласно 1.4-6 результат его вычисления не зависит от расстановки скобок. Пусть ах - ап. Так как операция коммутативна, то Поэтому, не изменяя результата вычисления выражения af * aJ2 *... * а^ , можно без ограничения общности считать, что ait = an. Следовательно, продолжая упорядочивание элементов, показываем, что результат вычисления любого выражения вида яУ] *ai2 *...*я; не только не зависит от расстановки скобок, но и равен результату вычисления выражения аь а2,..., ап. 1.4-9.3 Дистрибутивность умножения Пусть в множестве X заданы две алгебраические операции. Предположим, что одна из них названа умножением, а другая — сложением. Говорят, что умножение дистрибутивно относительно сложения, если для любых трех элементов а, Ь9 с из множества X выполняются равенства а(Ъ + с) = аЪ + ас, (Ь + с)а = Ьа + са. 1.4.2. Обратные операции 1.4-10.3 Правая и левая обратные операции Пусть в множестве X определена алгебраическая операция "*". Предположим, что уравнения а * х~ Ь, у^а-Ь имеют единственные решения при любых а, Ь. Тогда каждой упорядоченной паре элементов а, Ь е X мы можем поставить в соответствие однозначно определенные элементы х,у е X, т. е. ввести две алгебраические операции. Операция определения х (у) называется правой (левой) обратной операцией по отношению к основной операции "*". Дополнение. Заметим, что для того чтобы правую и левую обратные операции можно было считать алгебраическими, необходимо, чтобы уравнения а * х = Ъ и у*а = Ь имели бы единственные решения, причем при любых парах элементов а,Ь.
44 Часть I. Математические сведения по линейной алгебре 1.4-11.3 Обратная операция Если существует правая и левая обратные операции, то говорят, что основная опера* ция имеет обратную операцию. Дополнение. Наличие обратной операции в действительности означает наличие двух, вообще говоря, различных алгебраических операций — правой и левой обратных. 1.4-12.3 Обратная операция существует не всегда Не каждая алгебраическая операция, даже коммутативная и ассоциативная, имеет правую и левую обратные операции. Дополнение. Рассмотрим операцию умножения, определенную для всех вещественных чисел. Она алгебраическая, коммутативная и ассоциативная. Однако она не имеет ни правой, ни левой обратных. Это следует из того, что уравнения а-х = Ьиу-а = Ьне имеют решений для всех пар вещественных чисел. В частности, при а = О, Ь = 1. 1.4-13.3 Операция коммутативна -> обратные совпадают Если алгебраическая операция коммутативна и обратная операция для нее существует, то правая и левая обратные операции совпадают. Дополнение. Правая обратная операция определяется уравнением а * х = Ь, в котором решение х существует для любой пары элементов а, Ь и всегда единственно. Левая обратная операция определяется уравнением у* а = Ь. Так как его решение всегда существует, единственно и операция "*" коммутативна, то второе уравнение эквивалентно уравнению а*у = Ь. Следовательно, обе обратные операции совпадают. 1.4-14.3 Ассоциативность и коммутативность обратной операции Из ассоциативности или коммутативности алгебраической операции не обязательно следует ассоциативность или коммутативность обратной операции, даже если обратная операция существует. Дополнение. Рассмотрим операцию умножения на множестве положительных чисел. Обратная операция существует, и это есть деление чисел. Но деление чисел не является ни коммутативной, ни ассоциативной операцией. 1.4-15.3 Обратные совпадают -> операция коммутативна Если правая и левая обратные операции совпадают, то исходная алгебраическая операция коммутативна.
1. Множества, элементы, операции 45 Дополнение. Возьмем любую пару элементов а, х, и пусть Ъ = a * х. По условию уравнение у * a = 6 всегда имеет единственное решение иу = х. Поэтому для любой пары элементов a * jc = х * а, т. е. основная операция коммутативна. 1.4-1 б.3 Существование обратных операций от обратных Если алгебраическая операция имеет обратную, то правая и левая обратные операции также имеют обратные. Дополнение. Итак, пусть алгебраическая операция "*" имеет обратную. Это означает, что для любой пары элементов a, b уравнения а* х = Ъ и^*а = 6 имеют единственные решения. Обозначим через мл" правую обратную опердцию, через ' V — левую. Другими словами, jc = алЬ,у = aw Ь. Рассмотрим, например, правую обратную операцию "л" и покажем, что она имеет обратную, т. е. для любрй пары элементов с, dуравнения слм = duvлс = dимеют единственные решения относительно и и v. Но с au~ dозначает не что иное, как с * d- и. Поэтому решение уравнения с л и = d всегда существует и единственно в силу алгебраично- сти операции "*". Уравнение vac = d означает не что иное, как v * d= с. Следовательно, решение уравнения v лс= d всегда существует и единственно, т. к. операция "*" имеет по условию левую обратную. Таким образом, правая обратная операция "л" имеет обратную. Аналогично рассматривается существование обратной операции для левой обратной операции "v". 1.4-17.3 Обратная от обратной не совпадает с исходной Операция, обратная к левой или правой обратной, не обязательно совпадает с исходной алгебраической операцией. Дополнение. Рассмотрим операцию умножения на множестве положительных чисел. Для нее правая и левая обратные совпадают и представляют деление чисел. Но обратная операция для деления не есть умножение. Напишем соответствующие уравнения для деления: а:х = Ь, у : а = Ь. Очевидно, что ' х = а: Ь9 у = а- Ъ. Следовательно, правая обратная операция для деления положительных чисел есть снова деление, а левая обратная операция есть умножение. Поэтому операция, обратная к обратной, не обязательно совпадает с исходной алгебраической операцией.
46 Часть I. Математические сведений по линейной алгебре 1.5. Группы 1.5.1. Общая группа 1.5-1.3 Комментарий (простейшие множества) Множества с одной алгебраической операцией в некотором смысле являются самыми простыми, и поэтому естественно начать наши исследования именно с таких множеств. Мы будем считать свойства операции аксиомами и затем выводить из них следствия. Это позволит в дальнейшем сразу применить результаты исследований ко всем множествам, в которых операции имеют аналогичные свойства, независимо от конкретных особенностей. 1.5-2.3 Группа Группой называется множество G с одной алгебраической операцией, ассоциативной (хотя не обязательно коммутативной), причем для этой операции должна существовать обратная операция. Дополнение. Можно привести очень много множеств с операциями, которые являются группами. Например, • множество: целые числа; операция: сложение чисел; • множество: все комплексные числа, кроме нуля; операция: умножение комплексных чисел; • множество: один элемент а; операция называется сложением и определяется равенством a + a = a; • множество: числа вида a + Ьу12 , где ауЪ — положительные рациональные числа; операция: умножение чисел. 1.5-3.3 Комментарий (обозначения и терминология) Заметим, что обратную операцию нельзя считать второй независимой операцией в группе, т. к. она определяется через основную. Назовем, как это принято в теории групп, операцию умножением и условимся употреблять соответствующую символику. 1.5-4.3 Единица группы Во всякой группе G существует, и притом единственный, элемент е, удовлетворяющий равенствам ае = еа = а для любого а е G. Он называется единицей (единичным или нейтральным элементом) группы G. Дополнение. Возьмем произвольный элемент а группы G. Из существования обратной операции в группе вытекает существование единственного элемента еа
1. Множества, элементы, операции 47 такого, что aea = а. Пусть далее Ъ — любой другой элемент группы. Существует элементу, удовлетворяющий равенству уя = Ь. Теперь получаем b=ya= y(aea) = (ya)ea = bea. Итак, ea играет роль правой единицы по отношению ко всем элементам группы G. Все такие элементы должны удовлетворять уравнению aea - а. Из существования обратной операции вытекает, что элемент еа единственный и, к тому же, не зависит от элемента а. Обозначим его через е'. Аналогично доказывается существование единственной левой единицы е" в группе G, для которой ё'Ъ = Ъ для любого элемента Ь. Из равенств е"ё = е", е"е' = е' вытекает, что правая единица совпадает с левой. Это и есть единица группы G. 1.5-5.3 Обратный элемент Во всякой группе G любой элемент а обладает единственным обратным элементом а \ для которого аа~~1 = а~ ха = е. Дополнение. Из существования обратной операции вытекает существование и единственность для любого элемента а таких элементов а! и а", что аа' = е, а"а = е. Теперь рассмотрим элемент а"аа! и вычислим его двумя разными способами. Имеем а"аа' = а"(аа') = а"е = а", а"ааг = (а"а)а' = еа' = а'. Следовательно, а!1 = а'. Это и есть обратный элемент а~1. 1.5-6.3 Обращение единицы Имеет место соотношение е~х = е. Дополнение. Элемент е~1 единственный, и для него должны выполняться равенства е~ 1е-ее. Мы удовлетворим всем этим равенствам, если поставим е вместо ё~1. Следовательно, е~х = е. 1.5-7.3 Обратный элемент от произведения Для любых элементов яь а2, ...,ап из фуппы G имеет место соотношение Дополнение. Это утверждение проверяется непосредственно: = {а~х ...а~2)е{а2 ...а„) = (а~1 ...а~2) = . .. = *.
48 Часть I. Математические сведения по линейной алгебре 1.5-8.3 Комментарий (обсуждение критерия) Проверка того факта, является ли группой множество с одной ассоциативной операцией, облегчается тем, что в определении группы требование о выполнимости обрат-, ной операции можно заменить требованием о существовании единицы и обратных элементов, причем лишь с одной стороны (например, правой) и без предположения об их единственности. 1.5-9.3 Критерий группы Множество G с одной ассоциативной операцией будет группой, если в G существует хотя бы один элемент е, обладающий свойством ае = а для всех а из G, и по отношению к нему всякий элемент а из G обладает хотя бы одним правым обратным элементом а !, т. е. аа х = е. Дополнение. Пусть а'х — один из правых обратных элементов для а. Имеем аах - е-ее = еаа~К Умножим обе части крайних равенств справа на один из правых обратных для а'К Тогда получим, что ае = еае, откуда вытекает равенство а = еа9 т. к. е есть правая единица для G. Поэтому е есть одновременно и левая единица. Если предположить, что существуют две единицы е' и е", то из равенств е"е' = е* и е"е* = е" следует, что они совпадают. Следовательно, единичный элемент в /множестве G может быть только один. Обозначим его через е. Для любого правого обратного элемента а х имеем следующие соотношения: ах у а~хе = ааа~\ Умножим обе части крайних равенств справа на один из элементов, правых обратных для а"х. Тогда получим, что е = а" ха, т. е. элемент сГх является одновременно и левым обратным для а. Если теперь а ь — произвольный правый обратный элемент для а, а *" — произвольный левый обратный элемент, то из равенств а- х"ааГ h = {а Хпа)а" ь = еа ь = а~ \ а~ l"aa~ u = а 1"(аа~ь) = а' х"е = а'х" вытекает, что а~х* - а". Это означает существование и единственность для всякого элемента а из G обратного элемента а'1. Теперь легко показать, что уравнения ах-Ь иуа- b всегда имеют решения, и притом единственные. Одним из решений являются элементы х = а b и у = Ьа~х. Предположим, что существуют и другие решения, например, элемент z для первого уравнения. В этом случае ах-az. Умножая обе части равенства слева на элемент а \ получим, что х = z. Итак, множество G есть группа. 1.5.2. Подгруппа 1.5-10.3 Подгруппа Подмножество Я группы G называется подгруппой группы G, если оно само является группой относительно алгебраической операции в G.
1. Множества, элементы, операции 49 Дополнение. Пусть, например, группой является множество всех комплексных чисел, кроме нуля, с операцией умножения. Одной из ее подгрупп будет множество положительных вещественных чисел с той же операцией умножения. Для любой группы G ее подгруппой будет множество, состоящее из одного элемента группы G, равного 1. 1.5-11.3 Единица подгруппы Единица группы G является единицей любой подгруппы Я. 1.5.3. Смежные классы 1.5-12.4 Смежный класс группы Пусть Н— подгруппа группы G, a — любой элемент группы G.» Множество aH(Ha), составленное с помощью умножения элементов подгруппы Н слева (справа) на элемент а называется левым (правым) смежным классом группы G по подгруппе Н, порожденным элементом а. Дополнение. Пусть группой G является множество всех комплексных чисел, кроме нуля, с операцией умножения, подгруппой Н— множество положительных вещественных чисел с той же операцией. Будем считать числа точками комплексной плоскости. Выберем в G произвольное число а. В этом случае правый и левый смежные классы группы G по подгруппе Я, порожденные числом а, совпадают и описываются точками комплексной плоскости, кроме нулевой, лежащими на полупрямой, проходящей через точки 0 и а. 1.5-13.4 Вхождение порождающего элемента в смежные классы Элемент а входит в порожденный им как левый, так и правый смежный класс. Дополнение. Это следует из того, что единица е группы входит в любую подгруппу и ае = еа = а. 1.5-14.4 Смежные классы и единица Подгруппа Н является как левым, так и правым смежным классом, порожденным единицей группы G. 1.5-15.4 Смежный класс и его элементы Смежный класс порождается любым своим элементом. Дополнение. Надо показать, что если ge aH, то aH = gH. Пусть g=ahh где h\ е Н. Тогда для любого элемента heH имеем ah = (ahl)(h^lh) = g/t,, где h =Л1ЛеЯ, т.к. h'leH и heH. Значит, aHagH. В то же время
50 Часть I. Математические сведения по линейной алгебре gh = a(h\h) = ай3, где h^-hiheH. Следовательно, gHcaH. Поэтому aH-gH. Доказательство для правого класса аналогично. 1.5-1 б.4 Пересечение смежных классов Любые два левых (правых) смежных класса либо не пересекаются, либо совпадают. Дополнение. Если два класса имеют хотя бы один общий элемент g, то согласно утверждению 1.5-15 оба они порождаются этим элементом g. Следовательно, классы совпадают. 1.5-17.4 Разложение группы по подгруппе Группа G разбивается на непересекающиеся левые (правые) смежные классы по подгруппе Я. Это разбиение называется левосторонним (правосторонним) разложением группы G по подгруппе Я. Дополнение. Каждый элемент группы входит хотя бы в один класс. Остальное Является следствием утверждения 1.5-16. 1.5-18.4 Комментарий (разложение группы и эквивалентность) Интересно сравнить разложение группы по подгруппе и разложение множества на классы эквивалентности. Будем считать элементы a,b e G эквивалентными, например, справа, если существует такой элемент h е Я, что а = hb. Очевидно, что такое понятие эквивалентности является рефлексивным, симметричным и транзитивным. Легко проверить, что оба элемента а, Ъ принадлежат одному и тому же правому смежному классу. Поэтому все эквивалентные друг другу элементы группы G также принадлежат одному классу. Неэквивалентные элементы принадлежат разным классам. Следовательно, при введенном понятии эквивалентности справа правые смежные классы становятся кл&ссами эквивалентности. Аналогичная ситуация имеет место при введении понятия эквивалентности слева. При таких понятиях эквивалентности одноименные смежные классы образуют фактор-множества группы. 1.5.4. Нормальный делитель 1.5-19.3 Сопряженные элементы Элементы а, Ь группы G называются сопряженными^ если существует элемент с этой группы такой, что а = с~ хЪс. 1.5-20.3 Отношение сопряженности Отношение сопряженности элементов группы рефлексивно, симметрично и транзи- тивно, т. е. является отношением эквивалентности.
1. Множества, элементы, операции Дополнение. Элемент а сопряжен сам с собой, т. к. a = e~ хае, где е — единица группы. Следовательно, отношение сопряженности рефлексивно. Если a = с~ хЬс, то Ъ = cac~х = (с~ х)~ хас~х. Элемент с~х принадлежит группе по определению. Поэтому отношение сопряженности симметрично. И, наконец, если а = с" хЪс и Ь = сГ xfd, то а = с~ xd~ fdc = (dc)~ xJ{dc). Элемент dc принадлежит группе по определению. Это означает, что элементы а и/сопряжены, т. е. отношение сопряженности транзитивно. Согласно 1.3-5, отношение сопряженности есть отношение эквивалентности. 1.5-21.4 Нормальный делитель Подгруппа Я группы G называется нормальным делителем, если для любого элемента а е G имеем аН - На, т. е. любой левый (правый) смежный класс одновременно является правым (левым) смежным классом. Дополнение. Нормальный делитель называется также инвариантной или нормальной подгруппой. 1.5-22.4 Критерий нормальности делителя Подгруппа Я группы G является нормальным делителем тогда и только тогда, когда вместе с каждым своим элементом она содержит все сопряженные ему элементы. Дополнение. Пусть Н— нормальный делитель, т. е. На = аН для любого элемента а е G. Это означает, что для любого элемента h e Я существует hx e Я такой, что ha = ah\. Поэтому а~ lha = h\ е Я, т. е. если элемент h e Я, то и все сопряженные ему элементы а~ lha е Я. Возьмем теперь произвольные элементы h e Я и а е G. По условию a~xha e Я и aha'l e Я. Это означает, что существуют элементы /zb /*2 е Я такие, что а~ xha - hh aha~x ~ hi или ha ~ ah\, ah - hia. Значит, На а аН, аН d На, т. е. На = аН для любого элемента а. Следовательно, подгруппа Я является нормальным делителем согласно определению 1.5-21. 1.5-23.4 Произведение элементов смежных классов Пусть Я есть нормальный делитель и аН, ЪН— два смежных класса. Рассмотрим множество, составленное из всевозможных произведений пар элементов, взятых по одному из аН и ЪН. Это множество совпадает со смежным классом аЪН. Дополнение. Пусть g е аН. Существует hxe Я такой, что g= ah\. Пусть/е ЬН. Существует h2 е Я такой, что/= bh2. Имеем gf= ah\bh2. Так как Я— нормальный делитель, то ЬН^НЪ. Поэтому существует /г3 е Я такой, что hxb^bh^. Следовательно, gf= a{hxb)h2 = a(bh3)h2 = (ab)(h3h2). Ho h3h2 e Я и теперь ясно, что gfeabH. Возьмем далее d е аЪН. Существует /*4 е Я такой, что d^abhA^ = (ae)(bhA), где е — единица группы. Имеем ае е аН, bhA e ЬН. Следовательно, d представлен в виде произведения элемента ае е аН и элемента bh4 e ЬН, т. е. произведение всех пар элементов, взятых по одному из аН и ЬН, есть действительно смежный класс аЪН.
Часть /. Математические сведения по линейной алгебре 1.5-24.4 Произведение смежных классов Смежный класс abH называется произведением смежных классов аН и ЬН, если Я является нормальным делителем. 1.5-25/ Группа смежных классов Множество всех смежных классов группы G по ее нормальному делителю Н образует группу относительно операции перемножения классов. Дополнение. На множестве смежных классов операция перемножения классов является алгебраической. Она ассоциативная, т. к. (аН• ЬН) сН= аН- (ЬН• сН) = = аЬсН для любых а, Ь9 с из группы G. Роль единицы играет класс еН9 где е — единица G. Для класса аН обратным будет класс а 1Я. Из утверждения 1.5-9 следует теперь, что множество классов есть группа. 1.5-26.4 Фактор-группа Группа смежных классов группы G по нормальному делителю Я называется факторгруппой группы G по подгруппе Н и обозначается символом G \ Н. 1.5.5. Абелева группа 1.5-27.3 Абелева группа Группа называется коммутативной или абелевоп, если групповая операция коммутативна. 1.5-28.3 Комментарий (обозначение и терминология) В этом случае операцию, как правило, называют сложением и вместо символа аЬ пишут символ а + Ь. Единицу абелевой группы называют нулевым элементом и обозначают символом 0. Обратную операцию называют вычитанием, а обратный элемент — противоположным. Обозначают его символом - а. Мы будем считать, что по определению символ разности а - Ь означает сумму а + (- Ь). Если все же по каким- либо причинам операцию в коммутативной группе мы будем называть умножением^ то обратную операцию будем считать делением. Равные в этом случае произведения а 1Ь и Ъа 1 будем обозначать через Ыа и называть частным от деления Ъ на а. 1.5-29.4 Совпадение классов в абелевой группе В абелевой группе аН= На для любого а е G. Дополнение. В абелевой группе операция умножения коммутативна.
1. Множества, элементы, операции 53 1.5.6. Конечная группа 1.5-30.3 Конечная группа Группа, состоящая из конечного числа элементов, называется конечной группой. Число элементов конечной группы называется ее порядком. Дополнение. Рассмотрим множество целых чисел 0, 1,..., и- 1. Пусть операция заключается в вычислении неотрицательного целого остатка, меньшего и, от деления суммы двух чисел на число п. Будем называть операцию "сложением по модулю и". Множество с такой операцией есть конечная группа порядка и, в которой е = 0, а х = 0, если а = 0, и сГх = и - я, если а * 0. Очевидно также, что множество всех комплексных корней п-й степени из 1 для любого целого п > 1 есть конечная группа по умножению порядка п. 1.5-31.4 Теорема Лагранжа Во всякой конечной группе порядок ее подгруппы является делителем порядка самой группы. Дополнение. Пусть порядок группы G равен п, порядок подгруппы Н равен к. Рассмотрим левостороннее разложение группы G по подгруппе Н. Оно состоит из всех левых смежных классов аН, где а е G. В каждом классе все элементы различны. В самом деле, допустим, что ah\ = ah2 для hu h2 e H. Умножив это равенство слева на а' \ получим, что a xahx = a lah2 или hx = h2. Поэтому каждый класс аН состоит ровно из к элементов. Если всего имеется m классов, то в группе будет тк элементов, т. е. п - тк. 1.5-32.4 Равенство чисел смежных классов Пусть в конечной группе G порядка п задана подгруппа Н порядка к. Число левых смежных классов группы G по подгруппе Н равно числу правых смежных классов группы G по подгруппе Н и равно п/к. Дополнение. При доказательстве утверждения 1.5-31 было показано, что число левых смежных классов группы G по подгруппе Н равно т - п/к. Аналогично показывается, что число правых классов также равно т. 1.5-33.4 Индекс подгруппы Пусть в конечной группе G порядка п задана подгруппа Н порядка к. Отношение п/к называется индексом подгруппы Я. 1.5.7. Циклическая подгруппа 1.5-34. Степень и кратное элемента Пусть в группе G введена операция умножения (сложения). Выберем элемент а и рассмотрим выражение а • а ... а (а + а + ... + а), содержащее п раз повторенный эле-
54 Часть I. Математические сведения по линейной алгебре мент а, где п — произвольное целое положительное число. Это выражение называется п-й степенью (п-кратным) числа а и обозначается d {па). 1.5-35.3 Обратные элементы от степени и кратного Для элемента сГ (па) обратным является элемент а~1 • а'1... сГх (- а - а - ... - а). Он обозначается а' п (- па). Дополнение. Проверяется непосредственно. 1.5-36.3 Свойство степени и кратного Для любых целых чисел /и, п выполняются соотношения d -d"=idl -d^d"*" (па + та = та + па=ч(т + п)а). Дополнение. Проверяется непосредственно. 1.5-37.3 Циклическая подгруппа Пусть G — произвольная группа с операцией умножения. Выберем в ней элемент а и рассмотрим множество Н(а) элементов вида а1, где к представляет любое целое число. Множество Н(а) есть подгруппа группы G. Она называется циклической подгруппой, порожденной элементом а. Дополнение. Проверяется непосредственно. Заметим, что в группе ненулевых комплексных чисел с операцией умножения множество всех корней я-й степени из 1 для любого целого п>\ является не только конечной, но и циклической подгруппой. Она образуется первообразным корнем. Циклической также является подгруппа любой группы G, состоящая из одного элемента, равного 1. 1.5-38.3 Подгруппа циклической подгруппы Любая подгруппа циклической подгруппы является циклической. Дополнение. Пусть Н(а) есть циклическая подгруппа группы G, образованная элементом а. Выберем в Н(а) любую подгруппу R{a). Она состоит из элементов вида d для каких-то целых чисел г. Согласно 1.5-4 в ней заведомо есть элемент а0 = 1. Если других элементов нет, то утверждение доказано, т. к. множество, состоящее из одного элемента, равного 1, есть циклическая подгруппа. Допустим теперь, что в R(a) имеется элемент d при г Ф 0. Наряду с d в подгруппе R(a) всегда существует элемент а\ Пусть сР есть элемент в R(a), соответствующий наименьшему положительному р. Для всех целых п в подгруппе R(a) существуют элементы вида d*p. Представим число г в виде г = тр + q9 где т целое и 0 < q <p. Поэтому d = с^р • а4. Умножив это равенство слева на элемент а~тр, заключаем, что сР е R(a). Но это противоречит предположению, что р минимальная из положительных степеней элементов d подгруппы R(a). Следовательно, для любого г
1. Множества, элементы, операции 55 остаток q от деления г на р равен нулю, т. е. подгруппа R(a) состоит из всех элементов вида amp, т. е. является циклической, образованной элементом ар. 1.5-39.3 Минимальность циклической подгруппы Пусть в группе G выбран элемент а. Среди всех подгрупп «группы G, содержащих элемент а, циклическая подгруппа, образованная элементом а, является минимальной. Дополнение. Любая подгруппа группы G, содержащая элемент а, содержит и все элементы вида </, т. е. включает в себя циклическую подгруппу, образованную элементом а. 1.6. Кольца и поля 1.6.1. КОЛЬЦО 1.6-1-3 Кольцо Множество называется кольцом, если в нем определены две операции — сложение и умножение, обе ассоциативные, а также связанные законом дистрибутивности, причем сложение коммутативно и обладает обратной операцией. Дополнение. Можно привести много примеров множеств с операциями, которые являются кольцами. Например, • множество: целые числа; операции: сложение и умножение целых чисел; • множество: комплексные числа; операции: сложение и умножение комплексных чисел; • множество: один элемент а; операции определяются равенствами а + а = а и а • а = а. • множество: целые числа 0, 1, ...,и- 1; операции: сложение и умножение по модулю п. 1.6-2.3 Коммутативное кольцо Кольцо называется коммутативным, если умножение коммутативно, и некоммутативным — в противном случае. 1.6-3.3 Кольцо есть абелева группа Любое кольцо является абелевой группой по сложению. 1.6-4.3 Кольцо и О В любом кольце существует единственный нулевой элемент 0. При этом для всякого элемента а из кольца имеют место равенства
56 Часть I. Математические сведения по линейной алгебре Дополнение. Так как кольцо является абелевой группой по сложению, то существует единственный элемент 0 такой, что a + 0 = 0 + a = a рля любого элемента а из кольца. Однако и по отношению к умножению элемент 0 играет особую роль. В самом деле, Прибавляя к обеим частям равенства по элементу - (а • 0), получаем, что а • 0 = 0. Аналогично доказывается, что 0 • а = 0. 1.6-5.3 Произведение и противоположные элементы В кольце для любых элементов а, Ъ справедливы равенства (~а)Ь = а(-Ь) = -аЬ. Дополнение. Имеем аF+ (-?)) = а-0 = 0. Это означает, что элементы (- а)Ь и а(- Ь) являются противоположными для элемента ab, т. е. равны - ab и, следовательно, равны между собой. Напомним, что противоположный элемент единственен. 1.6-6.3 Дистрибутивность относительно вычитания В кольце умножение дистрибутивно относительно вычитания, т. е. для любых трех элементов а9 Ь, с выполняются соотношения а{Ь - с) = ab- ас, {а- Ь)с = ас- be. Дополнение. Имеем . а(Ь - с) - а(Ь + (- с)) = ab + а(- с) = ab + (- ас) = ab- ас9 (а - Ь)с = (а + (- Ь))с = ас + (- Ь)с = ас + (- be) = ас- be. 1.6-7.3 Комментарий (обсуждение дистрибутивности) Закон дистрибутивности, т. е. обычное правило раскрытия скобок, является единственным требованием в определении кольца, связывающим сложение и умножение. Лишь благодаря этому закону совместное изучение двух указанных операций дает больше, чем можно было бы получить при их раздельном изучении. 1.6-8.3 Противоположные элементы и -1 В кольце с единицей для любого элемента а Дополнение. Имеем
1. Множества, элементы, операции 57 Это означает, что элементы (- 1)а и а(- 1) равны между собой и равны элементу, противоположному для я, т. е. - а. 1.6-9.3 Единица не равна нулю В кольце с единицей, содержащем не менее двух элементов, 1^0. Дополнение. Допустим, что 1 = 0. Умножив это равенство справа на любой элемент а, получим 1 • а = 0 • а или а = 0. Это противоречит условию, что кольцо содержит не менее двух элементов. 1.6.2. Делители нуля 1.6-10.3 Комментарий (различия в свойствах) Алгебраические операции в кольце обладают многими привычными для нас свойствами операций над вещественными числами. Однако не любое свойство сложения и умножения чисел сохраняется во всяком кольце, пусть даже и коммутативном. Так, умножение чисел обладает свойством, обратным свойству умножения на нулевой элемент. Именно, если произведение двух чисел равно нулю, то хотя бы один из сомножителей равен нулю. В кольце это уже не всегда так. 1.6-11.3 Делители нуля Ненулевые элементы a, b кольца называются делителями нуля, если ab = 0. Элемент а называется левым делителем нуля, элемент b — правым. Дополнение. Рассмотрим множество пар (я, Ь) вещественных чисел с операциями, определяемыми формулами: (a,b) + (c9d) = (a + c,b + d);(a,b)-(c,d) = (ac,bd). Легко проверить, что это множество есть кольцо с нулевым элементом @, 0). Однако произведение ненулевых элементов A, 0) и @, 1) есть нулевой элемент, т. е. A, 0) и @, 1) являются делителями нуля. 1.6-12.3 Комментарий (усложнение исследований) Наличие в кольце делителей нуля существенно усложняет исследование и не позволяет провести глубокой аналогии между вещественными числами и элементами коммутативного кольца. Эту аналогию дает рассмотрение таких колец, в которых делители нуля отсутствуют. 1.6.3. Поле и числа 1.6-13.3 Поле Коммутативное кольцо с единицей, которое содержит не менее двух элементов и в котором каждый ненулевой элемент имеет обратный, называется полем.
58 Часть I. Математические сведений по линейной алгебре Дополнение. Можно привести много примеров множеств с операциями, которые являются полями. Например, • множество: вещественные числа; операции: сложение и умножение вещественных чисел; • множество: комплексные числа; операции: сложение и умножение комплексных чисел; • множество: два элемента а, Ъ\ операции определяются равенствами a + a = b + b = a, a + fe = 6 + a = Z>, д-а = а-6 = 6-а = а, b- b = b; • множество: целые числа 0,1,..., я- 1, где п— простое число; операции: сложение и умножение по модулю п. 1.6-14.3 Поле и делители нуля Поле не имеет делителей нуля. Дополнение. Пусть ab = 0, но а ф 0. Умножая обе части этого равенства слева на элемент сГ \ получим, что a xab = (сГ xa)b = eb = Ъ и, конечно, а 10 = 0. Следовательно, Ъ = 0, т. е. произведение ненулевых элементов в поле не может равняться нулю. 1.6-15.3В поле умножение обратимо На множестве ненулевых элементов поля операция умножения имеет обратную. Дополнение. Согласно утверждениям 1.4-10, 1.4-11 нужно показать, что для любых ненулевых элементов а, Ь поля всегда имеют единственные решения уравнения ax-b^ya^b. Рассмотрим, например, первое уравнение. Умножив обе его части слева на а \ получим, что х = а 1Ь. Допустим, что есть какое-то другое решение z. Тогда находим, что а(х - z) = 0. Так как поле не имеет делителей нуля ид*0, to*-z = 0 или х = z. В силу коммутативности в поле операции умножения, уравнения ах - b и уа-Ъ совпадают. 1.6-1 б.3 Числовые поля Множества рациональных, вещественных и комплексных чисел являются полями. Дополнение. Нужно лишь аккуратно проверить выполнение всех требований утверждения 1.6-13.
1. Множества, элементы, операции 59 1.6-17.3 Комментарий (обозначения) Используя запись частного alb в виде произведения ab~ \ легко показать, что во всяком поле сохраняются все обычные правила обращения с дробями с точки зрения операций сложения, вычитания, умножения и деления. Именно, а с _ad±bc a с ac -a a ~b~~d~~ bd ' *c'~d~~bd' ~~T~~~b' Кроме этого, alb = eld тогда и только тогда, когда ad = be, если, конечно, b ф О и d Ф 0. Поэтому все поля с точки зрения обычных правил обращения с дробями неотличимы от множества чисел. 1.6-18.3 Числа Элементы любого поля будем называть числами. Дополнение. Элементы конкретных полей могут называться иначе. Но если принимать во внимание лишь алгебраические свойства операций, то такие поля неотличимы от числовых. В дальнейшем во всех полях нас будут интересовать только эти свойства. 1.6-19.3 Характеристика поля Существуют поля, в которых сумма 1 + 1 + ... + 1, содержащая п слагаемых, равна нулю. Наименьшее натуральное число и, обладающее этим свойством, называется характеристикой поля. Если такое п не существует, то говорят, что характеристика поля равна 0. Дополнение. Рассмотрим множество из двух элементов а,Ьи пусть операции определяются равенствами Это есть поле характеристики 2. 1.6-20.3 Свойство характеристики Характеристика поля может быть либо 0, либо простое число. Дополнение. Пусть п — характеристика поля и п — составное число, т. е. n = mk для некоторых натуральных чисел т, к, не равных 1. В силу дистрибутивности 1 + 1 + ... + 1 = A + 1 + ... + 1)A + 1 + ... + 1) = 0. Так как поле не имеет делителей нуля, то либо правый сомножитель, либо левый сомножитель равен нулю, т. е. п — не наименьшее натуральное число, обладающее тем свойством, что «-кратная сумма числа, равного 1, есть 0. Следовательно, либо л = 0, либо п — простое число.
60 Часть I. Математические сведения по линейной алгебре 1.6-21.3 Характеристика числовых полей Поля рациональных, вещественных и комплексных чисел имеют характеристики 0. 1.7. Линейные пространства 1.7.1. Линейное пространство 1.7-1.3 Векторы Рассмотрим непустое множество К и поле Р произвольной природы. Предположим, что для всех элементов из К определены операции сложения и умножения на числа из поля Р и результаты выполнения этих операций являются элементами из К. Будем называть элементы из К векторами, независимо от их конкретной природы. 1.7-2.3 Линейное пространство Множество К называется линейным или векторным пространством над полем Р9 если для всех векторов из К определены операции сложения и умножения на числа из Р, причем выполнены следующие аксиомы: 1. Каждой паре векторов х9у отвечает вектор х+у, называемый суммой х и у, причем: • сложение коммутативно: х+у - у + х; • сложение ассоциативно: х + (у + z) = (х + у) + z\ • существует единственный нулевой вектор 0 такой, что х + 0 = х для любого векторах; • для каждого вектора х существует единственный противоположный вектор -х такой, что jc + (- х) = 0. 2. Каждой паре a,jc, где а — число, ах — вектор, отвечает вектор ах, называемый произведением а и х, причем: • умножение на число ассоциативно: а(Cх) = (оф)х; • 1 • х = х для любого вектора х. 3. Операции сложения и умножения связаны между собой следующими соотношениями: • умножение на число дистрибутивно относительно сложения векторов a(x+y):=ax + ay; • умножение на вектор дистрибутивно относительно сложения чисел: (а + р)х = ах + рх. Дополнение. Можно привести много примеров множеств с операциями, которые являются линейными пространствами. Например, поле: вещественные числа; множество: комплексные числа; сложение: сложение комплексных чисел; умно-
1. Множества, элементы, операции 61 жение на число: умножение комплексного числа на вещественное число; поле: вещественные числа; множество: многочлены с действительными коэффициентами от одной переменной t, в том числе константы; сложение: сложение многочленов; умножение на число: умножение многочлена на вещественное число; поле: рациональные числа; множество: числа вида a + byfl +cv3 +JV5, где я, b, c9d— рациональные числа; сложение: сложение чисел указанного вида; умножение на число: умножение числа указанного вида на рациональное число; поле: любое поле; множество: то же самое поле; сложение: сложение элементов (векторов) поля; умножение на число: умножение элемента (вектора) поля на элемент (число) поля. 1.7-3.3 Комментарий (характеристика аксиом) Перечисленные в 1.7-2 аксиомы не претендуют на логическую независимость. Свойства А описывают множество векторов с точки зрения операции сложения и говорят о том, что оно по отношению к этой операции является абелевой группой. Свойства В описывают множество векторов с точки зрения операции умножения вектора на число. Свойства С описывают связь двух операций между собой. 1.7-4.3 Нулевое число и нулевой вектор В любом линейном пространстве для каждого вектора х имеет место равенство О • л: = 0, где в правой части 0 означает нулевой вектор, а в левой 0 — число нуль. Дополнение. Рассмотрим элемент 0 • х + х. Имеем O-x + jc = O-jc+1-jc!=(O + 1) • х = 1 • х = х. Прибавляя к обеим частям равенства элемент - х, находим О = х + (-х) = 0 • х + х + (-*) = 0 • х + (х + (-*)) = 0 • х + 0 = 0 • х. 1.7-5.3 Противоположный элемент и -1 В любом линейном пространстве для любого вектора х справедливо соотношение — Дополнение. Действительно, х + (- \)х = 1 • х + (- 1)х = A - 1)jc = 0 • х = 0. Следовательно, -х = (- \)х. 1.7-6.3 Произведение числа на нулевой вектор В любом линейном пространстве имеет место равенство а • 0 = 0 для любого числа а. Дополнение. Имеем аО = а(х + (-*)) = аA • х + (- \)х) - аA - \)х = 0 • х = 0.
J52 Часть I. Математические сведения по линейной алгебре 1.7-7.3 Комментарий (правила преобразований) С точки зрения операций умножения, сложения и вычитания формально имеют место все правила эквивалентных преобразований алгебраических выражений в любом линейном пространстве. В дальнейшем эти правила мы уже не будем оговаривать особо. 1.7-8.3 Рациональное, вещественное и комплексное пространства Независимо от конкретной природы векторов линейное пространство называется рациональным, вещественным или комплексным и обозначается соответственно буквами Q, R, С, если поле Р является полем рациональных, вещественных или комплексных чисел. 1.7.2. Подпространство 1.7-9.3 Подпространство Множество L линейного пространства К называется его линейным подпространством, если при тех же операциях, что и в пространстве К, оно само является линейным пространством. 1.7-10.3 Тривиальные подпространства Множества, состоящие из одного нулевого вектора или из всех векторов линейного' пространства, являются линейными подпространствами. Эти подпространства называются тривиальными. Дополнение. Легко проверить, что для множества, состоящего из одного нулевого вектора, выполняются все аксиомы линейного пространства. Для всех векторов это верно по определению линейного пространства. 1.7-11.3 Критерий подпространства Для того чтобы множество векторов линейного пространства было его подпространством, необходимо и достаточно, чтобы это множество вместе с каждой парой элементов х, у содержало и все их комбинации вида оис + Р>>. Дополнение. Необходимость следует из того, что для линейного подпространства выполняются все аксиомы линейного пространства. Из них вытекает, что если линейному подпространству принадлежат векторы хиу,то ему же принадлежат векторы вида оис и $у для всех чисел а, Р, а так же их сумма ах + $у. Для доказательства достаточности нужно проверить выполнение всех аксиом линейного пространства для множества, которое наряду с какими-то элементами х,у из линейного пространства содержит комбинации аде + $у для всех чисел а, р. Сумма х +у принадлежит множеству, т. к. х +у = ах + $у при а = р = 1. Ассоциативности
1. Множества, элементы, операции 63 и коммутативность сложения векторов следует из выполнения этих свойств во всем пространстве. Нулевой вектор также содержится в множестве в силу того, что 0 = ох + $у при а = C = 0. Выполнение свойств операции умножения на число и дистрибутивности операций снова следует из выполнения этих свойств во всем пространстве. 1.7.3. Изоморфные пространства 1.7-12.3 Комментарий (обсуждение линейных пространств) Рассмотрим множество всех линейных пространств, заданных над одним и тем же полем Р. Естественно спросить, чем же похожи и чем различаются между собой все эти пространства. Каждое линейное пространство в своем описании содержит две существенно различные части. Во-первых, линейное пространство есть совокупность конкретных объектов, называемых векторами. Во-вторых, над этими конкретными объектами определены операции сложения и умножения на число. Поэтому можно интересоваться либо природой векторов и их свойствами, либо свойствами указанных операций независимо от природы элементов. Во всех практически интересных случаях построение и исследование линейных пространств осуществляется в два этапа: сначала, учитывая природу векторов, определяют операции сложения и умножения на число, а затем на основе свойств этих операций изучают сами пространства. Поэтому два пространства, устроенные одинаково по отношению к операциям сложения и умножения на число, можно считать обладающими одинаковыми свойствами. 1.7-13.3 Изоморфные пространства Два линейных пространства, заданных над одним и тем же полем, называются изоморфными, если между их векторами можно установить такое взаимно однозначное соответствие, при котором сумме любых двух векторов первого пространства будет отвечать сумма соответствующих векторов второго пространства, а произведению какого-либо числа на вектор первого пространства будет отвечать произведение того же числа на соответствующий вектор второго пространства. Дополнение. Рассмотрим три линейных пространства, заданных над одним и тем же полем рациональных чисел: • множество: линейные функции вида а + Ьх от переменной х с вещественными коэффициентами а, Ъ\ сложение: сложение линейных функций; умножение на число: умножение линейной функции на рациональное число; • множество: комплексные числа; сложение: сложение комплексных чисел; умножение на число: умножение комплексного числа на рациональное число; • множество: числа вида я + 6>/2, где а,Ь — рациональные числа; сложение: сложение этих чисел; умножение на число: умножение числа вида а + Ъ V2 на рациональное число.
64 Часть I. Математические сведения по линейной алгебре Понятие изоморфизма очень важно. Поэтому, прежде чем анализировать на изоморфизм конкретные пространства, рассмотрим простейшие свойства. Бели вектор х линейного пространства не равен нулю, то ах * 0 для любого числа а ф 0. Следовательно, если jc * 0, то сие * рх, если а * р. Отсюда вытекает, что при изоморфизме линейных пространств нулевому вектору должен соответствовать нулевой вектор, т. к. в противном случае невозможно однозначное соответствие. Из этого, в свою очередь, вытекает, что при изоморфизме противоположному элементу должен соответствовать противоположный элемент. Установим между множествами векторов первых двух линейных пространств такое соответствие: функции а + Ъх соответствует комплексное число а + ib и наоборот с одними и теми же вещественными числами а, Ъ. Легко проверить, что сумме функций соответствует сумма комплексных чисел, умноженной на рациональное число функции соответствует комплексное число, умноженное на то же рациональное число. Это и означает, что первые два линейные пространства изоморфны. Теперь предположим, что первое и третье линейные пространства изоморфны. Это означает, во-первых, что между множествами векторов этих пространств можно установить взаимно однозначное соответствие. Другими словами, каждой функции а + Ъх с вещественными коэффициентами а, Ъ можно поставить в соответствие одно число вида с + dyJ2, где с, d— рациональные числа. И наоборот, каждому числу вида е +fyJ2, где e9f— рациональные числа, ставится в соответствие одна функция k + lx, где k, I— какие-то числа, в общем случае, вещест- ^ венные. Заметим, что если с = е, d=f9 то совсем не обязательно выполнение равенств к-а, 1 = Ъ. Кроме этого, при таком соответствий сумме фуйкций соответствует сумма чисел вида с + d\J2, умноженной на рациональное число функции соответствует число вида с + dV2, умноженное на то же рациональное число. Известно, что числа 1, v2, v3 несоизмеримы, т. е. не существует таких рациональных чисел а, р, у, не равных нулю одновременно, при которых а + р>/2 +у>/з =0. Пусть функциям 1 + Ох, л/2 +0х, л/з ±0х соответствуют числа с + dyf29 с1 + dfy/2y с" + d"y[l. Тогда при любых рациональных числах а» Р> Y функция а + Р>/2 + у>/з + Ох соответствует числу ас + Рс' + ус" + (ad + prf' + yd") • Л. Так как все числа с, с\ с" и d, d\ d" рациональные, то всегда можно найти рациональные числа а, р, у, не равные нулю одновременно, такие, что ас + Рсг + ус" = 0, a d + prf' + yd" = 0. Но тогда ненулевая функция а + Р>/2 + у>/з + Ох будет соответствовать нулевому числу 0 + 0 • si, что невозможно в силу предполагаемого изоморфизма линейных пространств. Поэтому первое и третье пространства не могут быть изоморфны.
1. Множества, элементы, операции 65 1.7-14.3 Изоморфные пространства неотличимы С точки зрения всех следствий, вытекающих из аксиом линейного пространства, изоморфные пространства неотличимы друг от друга. Дополнение. Это почти очевидно. В самом деле, назовем элементы изоморфных линейных пространств одним и тем же словом "векторы". В аксиомах линейных пространств упоминаются операции с их свойствами, нулевой и противоположный векторы. Независимо от конкретного содержания, операции в изоморфных пространствах называются одинаково и имеют одинаковые свойства. Кроме этого, как показано в дополнении к 1.7-13, в изоморфных пространствах нулевому вектору соответствует нулевой, противоположному— противоположный. Поэтому, если в одном пространстве мы будем проводить какие-то выкладки, вводить определения и делать умозаключения, исходя только из аксиом и никак не используя конкретику пространства, то в другом пространстве можно делать в точности то же самое. При этом мы можем говорить одни и те же слова, проводить одни и те же выкладки, вводить те же самые определения и делать те же умозаключения. Различию просто неоткуда взяться. Конечно, можно и не забывать специфику другого пространства, но принципиально важно ее не использовать. 1.7-15.3 Изоморфизм и эквивалентность Отношение изоморфизма есть отношение эквивалентности. Дополнение. В соответствии с утверждениями 1.3-2—1.3-5 обозначим через X множество всех линейных пространств над одним и тем же полем Р. Конкретные линейные пространства будем обозначать сейчас малыми буквами х, у, z. Пусть R означает отношение изоморфизма. Ясно, что R есть бинарное отношение. Чтобы в соответствии с 1.3-5 установить, что R есть отношение эквивалентности, нужно согласно 1.3-4 показать, что R рефлексивно, симметрично и транзитивно. Изоморфизм линейных пространств содержит две компоненты: взаимно однозначное соответствие между элементами пространств (см. дополнение к 1.7-13) и соответствие между операциями. Рассмотрим сначала возможность рефлексивного, симметричного и транзитивного установления взаимно однозначного соответствия между элементами изоморфных пространств. Если дано линейное пространство х, то каждому элементу поставим в соответствие его же. Пусть даны пространства х,у и xRy. Взаимно однозначное соответствие между элементами этих пространств уже установлено и оно симметрично по определению. Пусть далее даны три пространства x,y,z и xRy, yRz. Будем считать, что элементу а из х соответствует элемент b из у, а элементу Ъ из у соответствует элемент с из z. Теперь положим, что элементу а из х соответствует элемент с из z. Так как в силу изоморфизма R соответствия между элементами пространств x,yuy,z взаимно однозначны, то взаимно однозначным будет и установленное соответствие между элементами пространств х, z. После рассмотрения соответствий между элементами устанавливается аналогичное соответствие между операциями. Отсюда следует, что если xRy, yRz, то xRx, yRx, xRz, т. е. отношение изоморфизма есть отношение эквивалентности. 3 Зак.740
Часть I. Математические сведения по Линейной, алгебре 1.7.4. Арифметическое пространство 1.7-1 б.3 Комментарий (разбиение на классы) Согласно утверждению 1.3-9 множество всех линейных пространств, заданных над одним и тем же полем, может быть разбито на классы. При этом в каждый класс будут входить изоморфные пространства, и только они. Так как изоморфные пространства неотличимы друг от друга, то вместо изучения всех линейных пространств, заданных над одним полем, можно изучать лишь представителей из каждого класса. К описанию этих представителей мы и переходим. 1.7-17.3 n-мерный вектор Вектором размерности п (или п-мерным вектором) называется упорядоченная совокупность из п чисел поля Р. Еслих — вектор, определяемый числами <хь ос2,..., а„, то при записи будем называть его вектор-строкой, а при записи V а2 вектор-столбцом. Если форма записи не будет иметь значение, то будем использовать название вектор; подразумевая под ним любую из форм. 1.7-18.3 Комментарий (классы изоморфных пространств) Все операции над /7-мерными векторами мы будем вводить совершенно одинаково как для вектор-строк, так и для вектор-столбцов. Из соображений удобства записи мы будем использовать, как правило, форму вектор-строк. 1.7-19.3 Координаты вектора Числа аь ..., <х„ называются координатами вектора*. 1.7-20.3 Сумма векторов Если векторы х,у размерности п заданы своими координатами: х = (<хь ..., а„),у - (рь ..., р„), то суммой этих векторов йазывается вектор 1.7-21.3 Произведение вектора на число Произведением векторах- (ось сс2,..., а„) на число X из поля Р называется вектор
1. Множества, элементы, операции 67 1.7-22.3 Нулевой вектор Нулевым вектором называется вектор, все координаты которого равны нулю, т. е. 0 = @ 0). 1.7-23.3 Противоположный вектор Вектором, противоположным вектору х = (аь а2, ..., а„), называется вектор 1.7-24.3 Арифметическое пространство Множество векторов х = (аь а2, ..., а„) с операциями 1.7-20,1.7-21 есть линейное пространство. Это пространство называется арифметическим пространством размерности п и обозначается Р„. Размерность пространства Р„ обозначается dim Р„. 1.7.5. Естественный базис 1.7-25.3 Единичный вектор Вектор е арифметического пространства называется единичным, если одна его координата равна единице, а остальные равны нулю. 1.7-26.3 Естественный базис В /7-мерном арифметическом пространстве совокупность единичных векторов рх = A, 0, 0, ..., 0),р2 = @, 1, 0, ..., 0), ...,/?„ = @, 0, 0, ..., 1) называется естественным базисом пространства. 1.7-27.3 Представление векторов в естественном базисе Для любого вектора jc = (ab ot2, ...,ос„) арифметического пространства справедливо следующее представление: X = Oti/?! + OC2P2 + • •. Дополнение. Очевидно. Нужно лишь воспользоваться определениями операций суммы векторов, умножения вектора на число и понятием естественного базиса (см. 1.7-20, 1.7-21 и 1.7-26). 1.7.6. Конечномерные и бесконечномерные пространства 1.7-28.3 Конечномерное пространство Линейное пространство, изоморфное пространству Рт называется конечномерным.
68 Часть I. Математические сведения по линейной алгебре 1.7-29.3 Бесконечномерное пространство Линейное пространство, не изоморфное никакому пространству Р„, называется бесконечномерным. 1.7-30.3 Комментарий (типы классов пространств) Таким образом, все линейные пространства, заданные над одним и тем же полем Р, разбиваются на два класса — конечномерные и бесконечномерные. Типичным примером бесконечномерного пространства является множество всех вещественных функций, заданных на одном и том же отрезке, с естественными операциями сложения функций и умножения функции на вещественное число. Различные пространства получаются при наложении на допустимые функции различных условий гладкости. Вообще говоря, бесконечномерные пространства в большинстве случаев оказываются связанными с пространствами типа Pw которые определяются аналогично 1.7-17— 1.7-21, но с бесконечным числом координат каждого вектора.
2. Система векторов 2.1. Линейная оболочка и линейная зависимость 2.1.1. Линейная комбинация и оболочка 2.1-1.3 Комментарий (значение общих исследований) Мы снова возвращаемся к рассмотрению общих линейных пространств. Многое из того, что будет описано в этой главе, одинаково важно как для конечномерных, так и для бесконечномерных линейных пространств. 2.1-2.3 Разложение по векторам Пусть заданы система векторов еь е2, ...,еп и вектор х. Если при некоторых числах ось «2, •••> <*л выполняется равенство то говорят, что векторх линейно выражается через векторы еъ ...,еп или представлен в виде разложения по этим векторам. 2.1-З.3 Линейная комбинация Правая часть равенства 2.1-2 называется линейной комбинацией векторов еи •.., ет числа ось • • -, ос„ — коэффициентами линейной комбинации. 2.1-4.3 Линейная оболочка Пусть задана система векторов е\, ..., еп. Множество всех линейных комбинаций векторов е\, ..., е„ называется линейной оболочкой этой системы векторов и обозначается
70 Часть I. Математические сведения по линейной алгебре 2.1 -5.3 Линейная оболочка есть подпространство Линейная оболочка любой системы векторов из любого линейного пространства является линейным подпространством. Дополнение. Проверим выполнение аксиом линейного пространства. Линейная оболочка векторов еь ...,е„ есть множество векторов ^инейного пространства. Если векторы х и у принадлежат этому множеству, то они являются линейными комбинациями векторов еь ..., еп. Но тогда сумма х +у и произведение осе также являются линейными комбинациями тех же векторов еь ...,е„. Нулевой вектор принадлежит множеству, т. к. он представляется в виде линейной комбинации с нулевыми коэффициентами. Пустьх = a^i +... + anen. Противоположный элемент равен -х = -о.\е\-... -а„е„ и тоже принадлежит множеству. Выполнение всех свойств операций над векторами в множестве следует из их выполнения в пространстве. Поэтому все аксиомы линейного пространства для линейной оболочки выполняются. Так как линейная оболочка не обязательно совпадает со всем пространством, то в общем случае это есть подпространство. 2.1-б.3 Линейная оболочка есть наименьшее подпространство Линейная оболочка векторов еь ..., е„ есть "наименьшее" линейное подпространство, содержащее эти векторы, т. е. любое линейное подпространство, содержащее какую- либо систему векторов, содержит и ее линейную оболочку. 2.1.2. Линейная зависимость и независимость 2.1-7.3 Комментарий (обсуждение линейных оболочек) Интерес к линейным оболочкам определяется несколькими обстоятельствами. Во- первых, любая линейная оболочка устроена очень просто — это совокупность всех линейных комбинаций векторов заданной системы. Во-вторых, любая линейная оболочка является линейным пространством. И наконец, согласно представлению 1.7-27 любое арифметическое пространство есть линейная оболочка векторов своего естественного базиса. В общем случае каждое линейное пространство содержит в себе бесчисленное множество других линейных пространств — линейных оболочек всевозможных своих систем векторов. В основе исследования связи линейных пространств, линейных оболочек и порождающих их систем векторов лежит одно из самых фундаментальных понятий — понятие линейной Зависимости системы векторов. 2.1-8.3 Линейная зависимость Система векторов е\, е2,..., е„ называется линейно зависимой, если один из векторов е, линейно выражается через остальные векторы системы или эта система состоит из одного нулевого вектора.
2. Система векторов 71 2.1-9.3 Линейная независимость Система векторов, не являющаяся линейно зависимой, называется линепно независимой. 2.1-10.3 Критерий линейной независимости Система векторов еъ е2, ...,е„ линейно независима тогда и только тогда, когда из равенства следует равенство нулю всех коэффициентов линейной комбинации. Дополнение. Пусть система векторов el5 ..., е„ линейно независима, но существуют числа аь ..., а„, не все равные нулю, такие, что Допустим, что а*^0. Тогда из этого равенства ек определяется как линейная комбинация остальных векторов из eh ..., еп. Это означает, что система векторов еи ..., еп, согласно определению 2.1-8, линейно зависима, что противоречит предположению. Пусть теперь указанное выше равенство выполняется только тогда, когда все числа ось ..., ап равны нулю. Предположим, однако, что система векторов в\, ..., е„ линейно зависима. Это означает, что один из векторов ек линейно выражается через остальные, т. е. Но тогда ' р^, + ... + P^-i^,! + (- 1)екх + P*+iet+1 + ... + P^w, и не все коэффициенты этой линейной комбинации равны нулю, что противоречит условию. Поэтому система векторов еъ ...,еп линейно независима. 2.1-11.3 Система с нулевым вектором Система, содержащая нулевой вектор, линейно зависима. Дополнение. Пусть среди векторов еи ..., е„ вектор ек = 0. Тогда Не все коэффициенты линейной комбинации равны нулю. Поэтому согласно утверждению 2.1-10 система векторов еи ...9еп линейно зависима. 2.1-12.3 Система из одного вектора Система, состоящая из одного ненулевого вектора, линейно независима. 2.1-13.3 Зависимая подсистема Если в системе векторов некоторая подсистема линейно зависима, то и вся система линейно зависима.
72_ Часть /. Математические сведения по линейной алгебре Дополнение. Пусть среди векторов еь ..., е„ подсистема е-,...,е> , 1 <р<п, h 1р линейно зависима. Существуют числа а^,..., а/ , не все равные нулю, такие, что а;е. +... + CL- в: = 0. Но тогда P^i+ ... + [}„?„ = О, если р, =а, для1<р<ии h h V lp lp 1p Py = 0 в остальных случаях. Не все коэффициенты рь ..., ря равны нулю. Поэтому согласно утверждению 2.1-10 система векторов еи ..., е„линейно зависима. 2.1-14.3 Независимость всех подсистем Система векторов линейно независима тогда и только тогда, когда линейно независима любая ее подсистема. Дополнение. Очевидно, если учесть утверждение 2.1-13. 2.1.3. Представление одних векторов через другие 2.1-15.3 Зависимость -» вектор выражается через другие Пусть система векторов еи ..., еп линейно независима, а система еь ..., етх линейно зависима. Тогда вектор х линейно выражается через векторы еь ..., е„. Дополнение. Так как система еь ..., en, x линейно зависима, то существуют такие числа аь ..., а„, а, не все равные нулю, что Должно быть a * 0. Если a = 0, то a^i + ... + а„е„ = 0 и среди чисел аь ..., а„ есть не нулевые. Согласно утверждению 2.1-10 это означает, что система векторов е\9..., е„ линейно зависима, что противоречит условию. Так как а Ф 0, то из первого равенства заключаем, что х= - 2.1-1 б.3 Зависимость -> вектор выражается через предшествующие Система векторов еь е2, ...,е„ линейно зависима тогда и только тогда, когда либо в\ = 0, либо некоторый вектор ek9 2<k<n, линейно выражается через предшествующие векторы. Дополнение. Предположим, что векторы еи ..., е„ линейно зависимы. Тогда существуют числа аь ..., ат не все равные нулю, что
2. Система векторов 73 Пусть последний ненулевой коэффициент есть а*. Если к = 1, то это означает, что е\ = О, т. к. в противном случае a\e} ^ 0. Пусть теперь к> 1. Тогда из равенства + ... + акек = 0 находим, что Необходимость доказана. Достаточность очевидна, поскольку и случай, когда в\ = 0, и случай, когда вектор ек линейно выражается через предшествующие, означает линейную зависимость подсистемы еи ..., ек. Но отсюда согласно утверждению 2.1-13 линейно зависима и вся система еь ..., е„. 2.1-17.3 Зависимость -> вектор выражается через последующие Система векторов eh ...,е„ линейно зависима тогда и только тогда, когда либо еп = 0, либо некоторый вектор ек,\<к<п-\, линейно выражается через последующие векторы. Дополнение. Доказательство проводится аналогично дополнению к 2.1-16. Только теперь счесть первый ненулевой коэффициент и далее рассматриваются два случая: сначала к = пи затем к < п. 2.1-18.3 Единственность представления -> независимость Если какой-либо вектор линейного пространства единственным образом представляется в виде линейной комбинации векторов еь ..., еп, то эта система векторов линейно независима. Дополнение. Пусть система векторов eh ...,en линейно зависима. Согласно утверждению 2.1-10 существуют числа <хь ..., а,„ не все равные нулю, такие, что По условию существует вектор х, который единственным образом представляется в виде линейной комбинации векторов eh ..., em т. е. Сложив почленно оба равенства, получим другое представление для вектора х: Следовательно, система векторов еь ..., е„ не может быть линейно зависимой, т. е. является линейно независимой. 2.1-19.3 Независимость -> единственность представления Если система векторов линейно независима, то любой вектор ее линейной оболочки единственным образом представляется в виде линейной комбинации векторов системы.
Часть I. Математические сведения по линейной алгебре Дополнение. Пусть система векторов еи ..., еЛ линейно независима, но хотя бы для одного векторах имеется два представления: Вычитая почленно эти равенства, получаем, что Среди чисел Pi -уь ..., ря-уп по предположению должно быть хотя бы одно, не равное нулю. Согласно утверждению 2.1-10, отсюда вытекает, что векторы еи ...,е„ должны быть линейно зависимы. Но это противоречит условию. Поэтому для любого вектора линейной оболочки линейно независимой системы векторов е\,..., е„ может существовать только одно представление. 2.1 -20.3 Зависимость -> неединственность представления Если система векторов линейно зависима, то для любого вектора ее линейной оболочки существует бесконечно много разложений по векторам системы. Дополнение. Если система векторов еХу ..., е„ линейно зависима, то существуют числа аь ..., а„, не все равные нулю, такие, что 0 = oti^i + 0С2в2 + ... + сх„е„. Пусть для вектора х имеет место представление Умножим первое уравнение на произвольное число 5 и прибавим его ко второму. Тогда Так как среди чисел аь ..., а„ есть не равное нулю, то мы имеем теперь бесконечно много различных представлений для векторов х. Точнее, различных представлений не меньше, чем различных чисел в поле, над которым задано линейное пространство. Мы будем рассматривать здесь только бесконечные поля. 2.1-21.3 Представление независимой системы через другую Если каждый из векторов линейно независимой системы еь ...,еп линейно выражается через векторы у и ..., ут> то п < т. Дополнение. По условию вектор е„ линейно выражается черезу\,...,;ут. Следовательно, система етУ\9—>Ут линейно зависима. Вектор е„ Ф 0* Согласно утверждению 2.1-16 некоторый вектор >>, является линейной комбинацией предшествующих векторов. Исключив этот вектор, мы получим такую систему
2. Система векторов 75 Легко показать, что через эти векторы линейно выражается любой из векторов еь ..., еп. Присоединим к ним слева вектор е„_ ь Снова заключаем, что система линейно зависима. Согласно утверждению 2,1-16 некоторый ее вектор линейно выражается через предшествующие. Им не может быть вектор еп, т. к. в этом случае линейно зависимой была бы система из двух векторов е„_ ь е« и, следовательно, вся система eh ..., еп. Таким образом, некоторый вектору из последней системы линейно выражается через предшествующие. Если мы исключим его, то опять получим систему, через которую линейно выражается каждый из векторов еь ..., еп. Продолжая этот процесс, заметим, что векторы у{, ...,ут не могут быть исчерпаны раньше, чем будут присоединены все векторы eh ..., е„. В противном случае окажется, что каждый из векторов е\9...,е„ линейно выражается через часть векторов этой же системы, т. е. вся система еь •••, е„ должна быть линейно зависима. Но это противоречит условию. Поэтому п < т. 2.1-22.3 Зависимость больших систем Любые п + 1 векторов из линейной оболочки системы, содержащей п векторов, линейно зависимы. Дополнение. Пусть векторы еь ..., еп+ { принадлежат линейной оболочке векторов уи ...,у„. Это означает, что каждый из векторов eh ..., еп h i линейно выражается через векторыуи --чУп- Если предположить, что система еь ..., е„ + \ линейно независима, то согласно утверждению 2.1-21 должно выполняться неравенство п + 1 < п. Но т. к. это невозможно, то отсюда следует, что система векторов ?ь . • •> ?п + 1 линейно зависима. 2.1-23.3 Независимость расширенной системы векторов Пусть L есть линейная оболочка линейно независимой системы векторов eh ..., eic, k> 1, и вектор ek+\ не принадлежит!. Тогда система векторов еъ ¦.., екь ек+\ линейно независима. Дополнение. Допустим, что система векторов eu ...,ek,ek+i линейно зависима, т. е. для некоторых чисел а,, ...,а*+ь среди которых не все равны нулю. Заведомо ct*+i ^0, т. к. иначе была бы линейно зависимой система векторов еь ..., ек. Но это невозможно по условию. Следовательно, в... =|-^-|в, + ...+|- что означает ек+\ е L. Это тоже невозможно по условию. Поэтому система векторов eh ..., еь ек+ \ линейно независима.
7jB Часть I Математические сведения по линейной алгебре 2.1.4. Снова конечномерные и бесконечномерные пространства 2.1-24.3 Комментарий (типы классов пространств) Ранее мы уже отмечали деление линейных пространств на конечномерные и бесконечномерные, связав это деление с изоморфизмом или неизоморфизмом линейных пространств пространству Р„. Теперь мы можем дать такому делению другую трактовку. 2.1-25.3 Комментарий (конечно- и бесконечномерные пространства) Рассмотрим произвольное линейное пространство К над полем Р. Будем строить в пространстве К систему из максимального числа линейно независимых векторов. Если пространство состоит не только из нулевого вектора, то в нем заведомо существует линейно независимая система, состоящая, по крайней мере, из одного вектора. Предположим, что найдена система из k, k > 1, векторов. Возможна одна из двух ситуаций. Либо любой вектор линейного пространства К линейно выражается через векторы найденной системы и тогда пространство есть линейная оболочка конечной системы векторов. Либо найдется вектор х линейного пространства К, не принадлежащий линейной оболочке системы из к векторов. Но тогда вектор х ц уже найденная линейно независимая система из к векторов образуют линейно независимую систему из к + 1 векторов. Продолжая этот процесс, мы заключаем, что имеет место альтернатива. Или линейное пространство К есть линейная оболочка конечного числа векторов, или в пространстве существуют линейно независимые системы, содержащие сколь угодно большое число векторов. В первом случае линейное пространство будет конечномерным, во втором — бесконечномерным. 2.2. Эквивалентные системы, ранг, базис 2.2.1. Эквивалентные системы 2.2-1.3 Комментарий (снова о линейных оболочках) Линейная оболочка может порождаться различными системами векторов — как зависимыми, так и независимыми. Естественно предположить, что все эти системы должны обладать некоторыми общими свойствами. 2.2-2.3 Эквивалентные системы Две системы векторов еь ..., е„ и/ь ...,fm называются эквивалентными, если каждый из векторов одной системы линейно выражается через векторы другой системы.
2. Система векторов 77 2.2-3.3 Эквивалентность есть отношение эквивалентности Эквивалентность систем векторов есть отношение эквивалентности. Дополнение. Согласно определению 1.3-2 отношение эквивалентности систем векторов есть бинарное отношение R над множеством X всех систем. Возьмем любую систему векторов х. Очевидно, что ее векторы выражаются линейно сами через себя. Поэтому xRx. Пусть теперь xRy. По определению эквивалентность систем векторов симметрична относительно обеих систем х,у. Поэтому yRx. Рассмотрим теперь три системы х, у, z, и пусть xRy и yRz. Это означает, что каждый вектор из системы х линейно выражается через векторы из системы у и каждый вектор из системы у линейно выражается через векторы из системы z. Следовательно, каждый вектор из системы х линейно выражается через векторы из системы z. Верно и обратное. Так как xRy u yRz, то каждый вектор из системы г линейно выражается через векторы из системы у и каждый вектор из системы у линейно выражается через векторы из системы х. Следовательно, каждый вектор из системы z линейно выражается через векторы из системы jc. Поэтому xRz. Согласно определениям 1.3-4, 1.3-5 все сказанное и означает, что понятие эквивалентности систем векторов есть отношение эквивалентности. 2.2-4.3 Критерий эквивалентности Две системы векторов эквивалентны тогда и только тогда, когда их линейные обЬ- лочки совпадают. Дополнение. Очевидно, что если линейные оболочки двух систем совпадают, то каждый из векторов одной системы линейно выражается через векторы другой системы, т. е. системы эквивалентны. Пусть теперь заданы любые две эквивалентные системы. Возьмем любой вектор из линейной оболочки одной системы. По определению линейной оболочки, он линейно выражается через векторы этой системы. Так как системы векторов эквивалентны, то каждый вектор первой системы линейно выражается через векторы второй системы. Поэтому любой вектор из линейной оболочки первой системы обязательно принадлежит линейной оболочке второй системы. Аналогично доказывается и обратное: любой вектор из линейной оболочки второй системы обязательно принадлежит линейной оболочке векторов первой системы. Итак, линейные оболочки обеих систем совпадают. 2.2-5.3 Эквивалентность и независимость -> одинаковое число векторов Эквивалентные линейно независимые системы векторов содержат одинаковое число векторов. Дополнение. Пусть системы векторов еь ..., е„ и уХу .,.,ут линейно независимы и эквивалентны. В силу эквивалентности, каждый из векторов еь •••> е» линейно выражается через векторыуи ...,ут. Согласно утверждению 2.1-21 отсюда следу-
_78 Часть I. Математические сведения по линейной алгебре ет, что n^m.C другой стороны, в силу той же эквивалентности, каждый из векторов yu ...9ym линейно выражается через векторы еи ...,е„. Поэтому т<п, т.е. т = и. 2.2.2. База и ранг системы 2.2-6.3 База системы векторов Если не все векторы системы нулевые, то в этой системе можно выбрать эквивалентную ей линейно независимую подсистему. Всякая такая подсистема называется базой данной системы. Дополнение. Пусть дана система векторов еь ...,е„, в которой не все векторы нулевые. Пусть, например, ех ф 0. Возможны две ситуации. Либо для всех /, 2 < / < и, найдутся числа а, такие, что е, - а,^. Тогда система векторов еь ..., е„ и система из одного вектора ех будут эквивалентны. Либо для какого-то / не найдется такого числа аь что е^а&х. Пусть это будет / = 2. В этом случае система из двух векторов еи е2 линейно независима. Предположим, что линейно независимы векторы еи ...,ek, k>2. Возможны две ситуации. Либо для всех 1,k+\<i<n, векторы et линейно выражаются через векторы еь...,е*. Тогда система векторов еи ...,еп и система векторов еи ...» ек эквивалентны. Либо для какого-то / вектор е, не выражается линейно через векторы еи ..., ек. Пусть это будет i = *+ 1. В этом случае система векторов еь ..., e*+i линейно независима. Продолжая процесс, мы придем к одной из двух ситуаций: либо система векторов еь...,е„ окажется линейно независимой, любо найдется такая линейно независимая подсистема, что все векторы еь ...,е„ будут через нее линейно выражаться. В любом случае будет найдена база. 2.2-7.3 Ранг системы векторов Все базы одной и той же системы векторов состоят из одинакового числа векторов. Это число называется рангом системы. Если все векторы системы нулевые, то ее ранг считается равным нулю. Дополнение. Поскольку все базы эквивалентны исходной системе, то они эквивалентны между собой согласно утверждению 2.2-3. Так как базы, к трму же, представляют линейно независимые системы, то согласно утверждению 2.2-5 они состоят из одинакового числа векторов. 2.2-8.3 Ранг и зависимые подсистемы Пусть ранг системы векторов равен г. Если некоторая ее подсистема содержит более г векторов, то она линейно зависима. Дополнение. Если подсистема содержит более г векторов, но является линейно независимой, то и ранг исходной системы должен быть больше г. Но это противоречит условию, что ранг системы равен г.
2. Система векторов 79 2.2-9.3 Ранг, база и независимые подсистемы Любая линейно независимая подсистема, содержащая г векторов, является базой системы. Дополнение. Пусть подсистема содержит г векторов, но не является базой. Тогда найдется такой вектор в исходной системе, который не выражается линейно через векторы подсистемы. Следовательно, этот вектор совместно с подсистемой образуют новую линейно независимую подсистему, содержащую г + 1 векторов. Поэтому и ранг исходной системы должен быть не менее г + 1. Но это противоречит условию, что он равен г. 2.2-10.3 Достройка независимой подсистемы до базы Любую линейно независимую подсистему данной системы векторов можно достроить до базы этой системы. Дополнение. Пусть ранг системы равен г. Если подсистема содержит г векторов, то она уже является базой согласно утверждению 2.2-9. Предположим, что подсистема линейно независима, содержит менее г векторов, но тем не менее ее нельзя достроить до базы. Это означает, что существует другая линейно независимая подсистема, которая содержит первую подсистему, и имеет максимально возможное число векторов, равное, например, к, но к < г. Отсюда следует, что все векторы исходной системы должны линейно выражаться через векторы второй подсистемы. Но тогда и ранг исходной системы должен равняться к, а не г. Поэтому любую линейно независимую подсистему можно достроить до базы. 2.2-11.3 Ранги двух систем Если векторы одной системы линейно выражаются через векторы другой системы, то ранг первой системы не больше ранга второй. Дополнение. Пусть векторы одной системы линейно выражаются через векторы другой системы. Выберем в каждой из систем какие-нибудь их базы. Тогда каждый вектор базы первой системы должен линейно выражаться через векторы базы второй системы. Согласно определению, базы представляют линейно независимые подсистемы и число векторов в них равно рангу. Поэтому, принимая во внимание утверждение 2.1-21, заключаем, что ранг первой системы не больше ранга второй. 2.2-12.3 Равенство рангов и эквивалентность Если две системы векторов имеют одинаковый ранг и векторы одной системы линейно выражаются через векторы другой, то эти системы эквивалентны. Дополнение. Пусть eh ..., ег— база первой системы, yh ...,уг— база второй системы. Как вытекает из условия утверждения, каждый из векторов eh ...,er линейно выражается через векторы yh ...,уп Обозначим через L линейную оболочку
JS0 Часть I. Математические сведения по линейной алгебре векторов уи ...,j>r. Ей принадлежат векторы обеих баз. Предположим, что в L существует вектор х, который не выражается линейно через векторы еь ..., ег. Так как векторы базы линейно независимы, то это означает, что линейно независимой будет и система векторов еъ ..., е„ х. Но каждый из этих векторов линейно выражается через векторы yl9 ...,уг. Согласно утверждению 2.1-21, должно быть г + 1 < г, что невозможно. Поэтому такой вектор х не существует. Следовательно, каждый из векторов уХу ...9уг как вектор из L обязан линейно выражаться через векторы еи ..., ег. Отсюда вытекает, что каждый из векторов второй системы линейно выражается через векторы первой системы, т. е. обе системы эквивалентны. 2.2.3. Структура арифметического пространства 2.2-13.3 Независимость векторов естественного базиса Система из векторов естественного базиса арифметического пространства линейно независима. Дополнение. Пусть р1 = AД...,0,0),р2 = @,1,...,0,0), ...,/>„ = @,0, ...,0,1) представляют векторы естественного базиса. Тогда при любых числах cti, oc2, ...,а„ имеем aipi + <Х2Р2 + ... + а*?* = (аь а2,..., а„). Равенство нулю этой комбинации возможно только тогда, когда все числа а/ равны нулю. Согласно утверждению 2.1-10 это означает линейную независимость векторов /?Ь...,Р». 2.2-14.3 Размерность и число независимых векторов В арифметическом пространстве размерности п не может существовать линейно независимая система, содержащая более п векторов. Дополнение. Предположим, что в арифметическом пространстве размерности п существует более п линейно независимых векторов. Но каждый из них линейно выражается через векторы р\9 ...,/v Как вытекает из утверждения 2.1-21, такая ситуация невозможна. 2.2-15.3 Системы, эквивалентные естественному базису В арифметическом пространстве размерности п любая линейно независимая система, содержащая п векторов, эквивалентна естественному базису. Дополнение. Рассмотрим в арифметическом пространстве размерности п любую линейно независимую систему из п векторов и систему из и векторов естественного базиса. Ранг обеих систем равен л, и векторы первой системы линейно выражаются через векторы второй системы. Согласно утверждению 2.2-12 обе системы эквивалентны.
2. Система векторов 81 2.2-1 б.3 Арифметическое пространство как линейная оболочка Любое арифметическое пространство размерности п является линейной оболочкой любой своей линейно независимой системы из п векторов. Дополнение. Очевидно, что арифметическое пространство является линейной оболочкой векторов естественного базиса. Согласно утверждению 2.2-15 любая система из п линейно независимых векторов эквивалентна системе векторов естественного базиса, а согласно утверждению 2.2-4 линейные оболочки эквивалентных систем совпадают. 2.2-17.3 Малые линейные оболочки Никакое арифметическое пространство размерности п не может являться линейной оболочкой системы, содержащей менее п векторов. Дополнение. Предположим, что арифметическое пространство размерности п есть линейная оболочка системы, содержащей менее п векторов. Тогда векторы естественного базиса, которые линейно независимы и число которых равно и, должны линейно выражаться через векторы, число которых меньше п. Это невозможно в силу утверждения 2.1-21. 2.2-18.3 Базис арифметического пространства Линейно независимая система из п векторов арифметического пространства размерности п называется базисом пространства. 2.2.4. Структура общего конечномерного пространства 2.2-19.3 Комментарий (значение эквивалентных систем) Эквивалентные системы векторов позволяют дать полное описание строения линейных пространств как линейных оболочек некоторых систем векторов и указать свойства этих систем. 2.2-20.3 Порождение пространства Говорят, что система векторов еь ..., еп линейного пространства К порождает пространство К, если любой вектор х е К является линейной комбинацией векторов eh ..., е„. 2.2-21.3 Базис линейного пространства Упорядоченная система векторов еи.--,еп линейного пространства К называется базисом К, если она линейно независима и порождает К,
82_ Часть I. Математические сведения по линейной алгебре 2.2-22.3 Число векторов в базисах Любые два базиса линейного пространства состоят из одинакового числа векторов. Дополнение. Линейное пространство есть линейная оболочка векторов базиса. Поэтому согласно утверждению 2.2-4 все базисы представляют эквивалентные системы. Но т. к. векторы любого базиса линейно независимы по определению, то в силу утверждения 2.2-5 все базисы состоят из одного и того же числа векторов. 2.2-23.3 Размерность линейного пространства Число векторов базиса называется размерностью линейного пространства К и обозначается dim К. 2.2-24.3 Размерность, равная О По определению размерность линейного пространства, состоящего только из нулевого вектора, равна 0. 2.2-25.3 Достройка независимой системы до базиса В «-мерном пространстве любую линейно независимую систему из к, к < л, векторов можно дополнить до базиса. Дополнение. Пусть в w-мерном пространстве даца система еи ...,ек,к<п, из линейно независимых векторов. Будем дополнять ее другими векторами, сохраняя линейную независимость. Предположим, что построена линейно независимая система еи ..., ек, ек+ ь ..., еп к < г < я, и далее ее дополнить нельзя. Это означает, что все векторы пространства линейно выражаются через векторы системы бЬ ..., ег. Так как система еи ..., ег линейно независима по построению, то она представляет базис. Но базис должен состоять из п векторов. Поэтому в действительности г = п и утверждение верно. 2.2.5. Базис и координаты 2.2-26.3 Комментарий (значение базиса) Базис имеет огромное значение при изучении линейных пространств и постоянно используется в самых различных исследованиях. Именно* существование базисов в произвольных конечномерных пространствах позволяет создавать конструктивные методы изучения как самих пространств, так и функций в этих пространствах. Базис позволяет легко описать строение любого линейного пространства, причем простота описания в значительной мере определяется конкретным выбором базиса. Конечно, естественный базис является самым простым и удобным, однако им можно воспользоваться очень редко, да и то только в арифметическом пространстве. Например, любая линейная оболочка является линейным пространством. Но среди векторов, образующих ее базисы и рассматриваемых как векторы основного арифметического про-
2. Система векторов 83 странства, может просто не быть ни одного единичного вектора. В произвольном конечномерном линейном пространстве, вообще говоря, все базисы равноправны. Их неравноправие начинается лишь тогда, когда мы рассматриваем базисы по отношению к каким-либо другим объектам линейного пространства, например, по отношению к какому-нибудь фиксированному базису или системе векторов, или по отношению к каким-либо функциям, введенным в линейном пространстве, и т. п. Как уже отмечалось, любой вектор может быть представлен своим разложением по любому базису. 2.2-27.3 Разложение по базису Если имеет место представление х = ot^i + ... + anen, где еь ,.., еп являются векторами базиса, то оно называется разложением вектора х по базису, а числа аь ..., а„ называются координатами вектора х относительно этого базиса. 2.2-28.3 Единственность разложения по базису Разложение любого вектора по любому базису единственно. Дополнение. Линейное пространство есть линейная оболочка векторов базиса. Базис представляет линейно независимую систему. Поэтому единственность разложения является следствием утверждения 2.1-19. 2.2-29.3 Координаты нулевого вектора Все координаты нулевого вектора относительно любого базиса равны нулю. Дополнение. Очевидно, что вектор с нулевыми координатами относительно любого базиса является нулевым. Но в соответствии с утверждением 2.2-28 нулевой вектор не может иметь никакие другие координаты. 2.2-30.3 Сложение векторов и координаты При сложении двух векторов их координаты относительно любого базиса складываются. 2.2-31.3 Произведение вектора на число и координаты При умножении вектора на число его координаты относительно любого базиса умножаются на это число. 2.2-32.3 Комментарий (изоморфизм и похожесть исследований) Аналогичные утверждения можно было бы продолжить, однако в этом нет никакой необходимости. Предположим, что задано некоторое конечномерное линейное пространство К размерности п. В частности, это может быть и арифметическое пространство. Выберем в К какой-либо базис еи ..., еп и каждому вектору х из К поставим в соответствие вектор хе, составленный из координат вектора х в выбранном ба-
84 Часть I. Математические сведения по линейной алгебре зисе. Это соответствие не только отображает пространство К взаимно однозначно на арифметическое пространство, но и отображает изоморфно. Поэтому при таком отображении любая линейно зависимая система переходит в линейно зависимую, ранг системы не изменяется, базис переходит в базис и т. д. Установленная связь между произвольными конечномерными и арифметическими пространствами позволяет ограничиться исследованиями, связанными только с арифметическими пространствами. Но чтобы не потерять общности исследований, мы время от времени будем обращаться к произвольным линейным пространствам.
3. Матрицы и операторы 3.1. Конечные суммы и произведения 3.1.1. Конечные суммы 3.1-1.3 Комментарий (необходимость символики) В полях введены две операции — сложение и умножение. Если выполнять большое число операций над числами, то появляются выражения, содержащие значительное число слагаемых и сомножителей. Для удобства их записи мы введем соответствующую символику. Пусть дано некоторое конечное множество чисел не обязательно различных. Будем считать, что все числа перенумерованы каким-то образом и имеют номера, меняющиеся подряд от некоторого номера к до номера р. Обозначать числа будем одной буквой с указанием номера. 3.1-2.3 Обозначение суммирования чисел Сумма чисел я*, а*+ ь •••> ар обозначается символами i = к к</< р Номер / называется индексом суммирования. 3.1-З.3 Вынесение множителя за знак суммы Если число а не зависит от индекса суммирования, то
86 Часть I. Математические сведения по линейной алгебре Дополнение. Это следует из дистрибутивности умножения относительно сложения в любом поле. 3.1-4.3 комментарий (пара индексов) Предположим теперь, что числа отмечены двумя номерами, каждый из которых меняется независимо. Примем для этих чисел общее обозначение aij9 и пусть, например, 3.1-5.3 Перестановка порядка суммирования Всегда имеет место соотношение Дополнение. Сложение в поле является ассоциативной и коммутативной операцией. Справедливость этого утверждения есть следствие утверждения 1.4-8. 3.1-б.3 Комментарий (порядок суммирования и скобки) Если мы условимся, что будем всегда проводить суммирование последовательно по индексам сумм, расположенных справа налево, то скобки можно опустить. 3.1-7.3 Еще раз о перестановке порядка При сделанных предположениях то есть порядок суммирования можно менять местами. Дополнение. При сделанных предположениях это просто другая запись утверждения 3.1-5. 3.1.2. Конечные произведения 3.1-8.3 Обозначение произведения чисел Произведение чисел ak9 ak+ ь ..., ap обозначается символом Теперь номер / называется индексом произведения.
3. Матрицы и операторы 87 3.1 -9.3 Вынесение множителя за знак произведения Если число а не зависит от индекса произведения, то i: = к i = k Дополнение. Это следует из коммутативности операции умножения в поле. 3.1-10.3 Изменение порядка перемножения Всегда имеет место соотношение i ~ к j - m j ~ m i - к Дополнение. Умножение в поле является ассоциативной и коммутативной операцией. Справедливость этого утверждения есть следствие утверждения 1.4-8. 3.2. Матрицы и операции над ними 3.2.1. Матрицы 3.2-1.3 Матрица Пусть п, т — произвольные целые положительные числа. Матрицей называется совокупность из пт чисел а1} поля Р, записанных в виде прямоугольной таблицы: аи а12 ...а1я а21 а22...а2 состоящей из п строк и т столбцов. 3.2-2.3 Комментарий (обозначения) Для обозначения матрицы используются различные символы, например A, A(n x т\ А(ау), А = (ajj) и т. п., или же она указывается явно в виде таблицы, в зависимости от того, какие характеристики матрицы нужно отметить. В последнем случае таблицу заключают в скобки либо квадратные, либо круглые, либо двойные вертикальные. Множество всех матриц с фиксированными п,т и с числами из поля Р обозначается Р"х т. При необходимости указать элемент, расположенный на пересечении /-й строки и у-го столбца матрицы, или к-й элемент вектора используются символы соответственно {•}/, или {•}*. Вместо точки в фигурных скобках ставится идентификатор, соответствующий обозначению матрицы или вектора. Например, {А}у означает элемент a,j матрицы А. Символ {а}к означает к-ю координату разложения вектора а по заданному базису. В случае /7-мерных векторов базис считается естественным.
Часть I. Математические сведения по линейной алгебре 3.2-3.3 Элементы матрицы, столбцы и строки Числа а,у называются элементами матрицы. Индексы ij означают, что элемент ау расположен на пересечении i-й строки иу-го столбца матрицы. Если т или п равно единице, то соответствующий индекс может отсутствовать. 3.2-4.3 Размер матрицы Если матрица имеет п строк и т столбцов, то она называется матрицей размера пхт. 3.2-5.3 Квадратная и прямоугольная матрицы Матрица называется квадратной матрицей порядка л, если п = т. В общем случае матрица называется прямоугольной. Квадратная матрица порядка 1 отождествляется с единственным ее элементом. 3.2-6.3 Столбцевая матрица Прямоугольная матрица размера wxl, состоящая из одного столбца называется столбцевой и обозначается [ab сс2,..., а„]'. 3.2-7.3 Строчная матрица Прямоугольная матрица размера 1 х /и, состоящая из одной строки [Pi,P*...,PJ, называется строчной. 3.2-8.3 Вектор-столбец и вектор-строка Столбцевая матрица называется также вектор-столбцом, строчная матрица — вектор-строкой. Если не возникает каких-либо недоразумений, то оба вида матриц называются просто векторами. 3.2.2. Операции над матрицами 3.2-9.3 Равные матрицы Матрицы А и В, заданные над одним и тем же полем, называются равными, если они имеют одинаковые размеры и {^},у = {В}у для всех ij. Равенство матриц А и В обозначается А-В.
3. Матрицы и операторы 3.2-10.3 Свойство равенства матриц Отношение равенства матриц есть отношение эквивалентности. Дополнение. Отношение равенства матриц по существу сводится к отношению равенства соответствующих элементов или, другими словами, к отношению равенства элементов поля. А оно всегда предполагается рефлексивным, симметричным и транзитивным, т. е. отношением эквивалентности. 3.2-11.3 Сумма матриц Суммой матриц А и В размеров тхп называется матрица С размера тхп, если {C}ij = {А}0 + {В}у для всех ij. Эта операция обозначается С = А + В. 3.2-12.3 Разность матриц Разностью матриц А и В размеров тхп называется матрица С размера т хп, если {C}ij = {А}у - {B}jj для всех ij. Эта операция обозначается С = А - В. 3.2-13.3 Произведение матрицы на число Произведением матрицы А размера тхп т число а называется матрица С размера тхп, если {С}0 = а {А} у для всех ij. Эта операция обозначается С = аА. 3.2-14.3 Свойства сложения матриц Операция сложения матриц коммутативна и ассоциативна, т. е. А + Я = В + А, (А + В) + С = А + (В + С). Дополнение. В самом деле, в силу коммутативности операции сложения в поле имеем для всех i,j а в силу ассоциативности операции сложения получаем, что {(А + В) + C},j = {А + B}tJ + {С} у = {A}v + {B}v + {C}v = = {А} 9 +{В + C}v ={A + (B + Q)q. 3.2-15.3 Свойство разности матриц Всегда выполняется соотношение А - В = А + (- 1)В. Дополнение. Принимая во внимание свойства противоположного элемента и определение вычитания в поле имеем для всех i,j {А - В}„ = {А}9- {В}„ = {А}у + (-{В}tJ) = {A}v + (- 1){B}V =
_?0 Часть I. Математические сведения по линейной алгебре 3.2-1 б.3 Произведение матриц Произведением матрицы А размера m х n и матрицы В размера n х p называется матрица С размера /их/?, если для врех /,у. Эта операция обозначается С = АВ. Дополнение. Если А есть матрица размера тхп9ах есть вектор-столбец (вектор- строка) размера п х 1 A х /и), то выражение Ах(хА) определено и представляет вектор-столбец (вектор-строку) того же размера и х 1 A х т). 3.2-17.3 Произведение матриц и умножение на число Если произведение АВ матриц А, В имеет смысл, то при любом числе а выполняется равенство Дополнение. Проверяем: 3.2-18.3 Некоммутативность произведения матриц Операция произведения матриц не является в общем случае коммутативной. Дополнение. Это подтверждается следующим простым примером: [о i|o oj"[o [о oj[o ij= о L. —Ik. ^ Г НО " " - ГГ 1 [о о и матрицы в правых частях равенств различные. 3.2-19.3 Ассоциативность произведения матриц Если операция произведения иатриц вьщолнима, то она ассоциативна, т. е. Дополнение. Пусть матрицы А9 В, С имеют соответственно размеры тхп> пхр, рхк. Тогда для всех ij имеем, принимая во внимание утверждения 3.1-3—3.1-7, что
3. Матрицы и операторы 91 С другой стороны, {А(ВС)}? = Это означает, что в матрицах (АВ)С и А(ВС) равны элементы, стоящие в позиции (/,/) для всех возможных ij. Следовательно, (АВ)С = А(ВС). Заметим, что в некоторых случаях расстановка скобок может значительно повлиять на число операций, необходимых для получения результата. Пусть, например, требуется найти произведение ABC, где матрицы А> С имеют размеры 1хи,а матрица В размеры п х 1. Если вычисления производить по схеме А(ВС) согласно 3.2-16, то потребуется выполнить 2п2 умножений и п1 -п сложений. В случае использования схемы (АВ)С число операций уменьшается в п раз. 3.2-20.3 Произведение нескольких матриц Для выполнимости операции произведения нескольких матриц, заданных в определенном порядке, необходимо и достаточно, чтобы число столбцов каждой матрицы равнялось числу строк соседней матрицы справа. В этом случае произведение матриц определяется однозначно и может быть вычислено при произвольном порядке расстановки скобок. Дополнение. Очевидно, принимая во внимание утверждения 1.4-6 и 3.2-19. 3.2-21.3 Дистрибутивность произведения матриц Если операция произведения матриц выполнима, то она дистрибутивна по отношению к операции сложения, т. е. Дополнение. Рассмотрим, например, первое соотношение. Второе доказывается аналогично. Пусть матрицы А, В, С имеют соответственно размеры /их я, m х и, я х р. Тогда для всех i,j имеем: {(А + fi)C},y - ±{А + B)i4{C}qj = ±({A}lq + {B 3.2-22.3 Комментарий (особенности умножения на число) Обратим внимание на следующее обстоятельство. Согласно 3.2-13 произведение оА имеет смысл для любого числа а и любой матрицы А. Допустим, однако, что соглас-
j?? Часть I. Математические сведения по линейной алгебре но 3.2-5 число а отождествляется с матрицей порядка 1, полученной в результате перемножения строчной и столбцевой матриц* и у. Заменив в выражении оА число а произведением ху, мы получим, вообще говоря, некорректное матричное выражение хуА. Это связано с тем, что число строк матрицы А может не равняться 1. Обратное верно. Пусть матричное выражение хуА корректно и произведение ху есть матрица порядка 1. Обозначив это произведение числом &, мы получим корректное выражение оА. Если произведение матриц АВ выполнимо, то для любого числа а справедливы равенства <х(АВ) = (оА)В = А(аВ). Если а отождествляется с матрицей ху первого порядка, то в общем случае эти равенства не верны. С другой стороны, если произведение АхуВ выполнимо, то имеет место равенство АаВ = а(АВ), где матрица ху отождествляется с числом а. Однако как матричное, равенство АхуВ = (ху)(АВ) уже почти всегда не выполняется. Поэтому при проведении матричных операций, в которых приходится отождествлять матрицу первого порядка с числом, необходимо соблюдать определенную осторожность. 3.2.3. Диагональные матрицы 3.2-23.3 Диагональ матрицы Элементы а,у, где i -j, называются диагональными, а элементы a,j, где i ф}, — внедиа- гональными. Совокупность диагональных элементов ап, агъ •••> #**> где k = min(/w, n\ называется главной диагональю, а совокупность элементов а\„, а2,п-и •••> я*,л-*+1 -*- побочной диагональю, 3.2-24.3 Диагональная матрица Матрица А называется диагональной, если все ее внедиагональные элементы равны нулю. Диагональная матрица с элементами аи,...уатт обозначается diag(an, а2ъ ..., атт). Элементы диагональной матрицы могут помечаться одним индексом. 3.2-25.3 Скалярная матрица Диагональная квадратная матрица с равными диагональными элементами называется скалярной. 3.2-26.3 Единичная матрица Квадратная матрица, у которой все диагональные элементы равны 1, а внедиагональные равны нулю, называется единичной (тождественной) и обозначается Е или /. Для каждого порядка п существует своя единичная матрица. 3.2-27.3 Нулевая матрица Матрица, у которой все элементы равны нулю, называется нулевой и обозначается 0. Для каждого размера тхп существует своя нулевая матрица.
3. Матрицы и операторы 93 3.2-28.3 Умножение на единичную матрицу Для любой матрицы А размеров mx n и единичных матриц Ет и Е„ порядков т и п соответственно имеют место соотношения 3.2-29.3 Операции с нулевой матрицей Для любой матрицы А и нулевых матриц соответствующих размеров справедливы равенства 3.2-30.3 Умножение на диагональную матрицу При умножении прямоугольной матрицы А справа (слева) на диагональную матрицу diag(flfi, d2,...) все столбцы (строки) матрицы А умножаются как векторы на числа 44,.... Дополнение. Проверяется тривиально. 3.2.4. Перестановочные матрицы 3.2-31.3 Перестановочные матрицы Если для каких-либо квадратных матриц А и В одного порядка выполняется равенство АВ~ ВА, то матрицы называются коммутирующими или перестановочными. 3.2-32.3 Перестановочность с диагональной матрицей Если квадратная матрица А перестановочна с квадратной диагональной матрицей Д имеющей попарно различные диагональные элементы, то матрица А — диагональная. Дополнение. Пусть А — квадратная матрица порядка п с элементами aij9 D — квадратная диагональная матрица того же порядка с диагональными элементами d\9..., dn, причем dt ф dj при / *j. По условию AD = DA или для всех ij Если / ^у, то по условию di ф d} и, следовательно, щ- = 0. Поэтому А есть диагональная матрица. 3.2-33.3 Перестановочность со всеми матрицами Если квадратная матрица А перестановочна со всеми квадратными матрицами того же порядка, то матрица А — скалярная. Дополнение. Пусть матрица А перестановочна со всеми матрицами D того же порядка. В частности, матрица D может быть диагональной с различными диаго-
94 Часть /. Математические сведения по линейной алгебре нальными элементами. Согласно утверждению 3.2-32 отсюда следует, что матрица А диагональная. Предположим теперь, что все элементы матрицы D отличны от нуля. Так как по условию AD = DA9 то для всех ij имеем: aAj = {AD}ij = {DA} у = dfy. По предположению, dtj ф 0 для всех ij. Поэтому для всех / Ф) выполняется равенство au = Оу, т. е. матрица А — скалярная. 3.2-34.3 Степенные свойства перестановочных матриц Если матрицы А, В перестановочные, то имеют место соотношения {А + В)" = А" + С\Ап'хВ +... + с;-1 ЛЕГ'1 + В\ где С* означает число сочетаний из п элементов по к элементов. Дополнение. Проверяется непосредственно'. Нужно только учесть, что если две матрицы перестановочны, то перестановочны любые их степени. 3.2.5. Кольца и линейные пространства 3.2-35.3 Кольцо квадратных матриц Множество квадратных матриц одного порядка с операциями сложения и умножения есть кольцо с единицей, вообще говоря, не коммутативное с делителями нуля. Дополнение. Рассмотрим множество всех квадратных матриц одного порядка. На нем определены операции сложения и умножения матриц. Результатами выполнения операций также являются квадратные матрицы того же порядка. Обе операции ассоциативные согласно утверждениям 3.2-14 и 3.2-19 и связаны законом дистрибутивности, согласно утверждению 3.2-21. Сложение коммутативно в силу утверждения 3.2-14 и имеет обратную операцию в силу утверждения 3.2-15. Нулевым элементом является нулевая матрица, единицей — единичная матрица. В общем случае умножение матриц не коммутативно. Соответствующий пример приведен в дополнении к 3.2-18. Наличие делителей нуля демонстрирует такой пример: о~|Го о] Го о! •о|о iJ=Lo о]' Все это и подтверждает справедливость утверждения, если принять во внимание определения 1.6-1,1.6-2,1.6-11.
3. Матрицы и операторы 95 3.2-36.3 Линейное пространство матриц Множество прямоугольных матриц размера m x n с операциями сложения и умножения на число есть линейное пространство размерности mn. Дополнение. Рассмотрим множество прямоугольных матриц одного размера. На нем определены операции сложения и умножения на число. Результатами выполнения операций также являются прямоугольные матрицы того же размера. Сложение коммутативно и ассоциативно согласно утверждению 3.2-14. Нулевым элементом является нулевая матрица, противоположным для матрицы А — матрица (~\)А. Умножение на число ассоциативно и связано со сложением законами дистрибутивности. Согласно утверждению 1.7-2 это множество есть линейное пространство. Базисом этого пространства являются матрицы Еу, которые отличаются от нулевых только тем, что в позиции (i,j) стоит элемент, равный 1. 3.2-37.3 Кольцо перестановочных матриц Множество матриц, перестановочных с любой фиксированной матрицей А, является кольцом с единицей. Дополнение. Снова рассмотрим множество всех матриц, перестановочных с фиксированной матрицей А. На нем определены операции сложения и умножения матриц. Результатами выполнения операций также являются матрицы, перестановочные с матрицей А. Например, для умножения матриц имеем (BQA = В(СА) = В(АС) = (ВА)С = (АВ)С = A(BQ. Здесь мы воспользовались ассоциативностью операции умножения, что возможно в силу утверждения 3.2-19. Сложение матриц коммутативно и ассоциативно, что определяется утверждением 3.2-14. Согласно утверждению 3.2-21 обе операции связаны законом дистрибутивности. Нулевым элементом является нулевая матрица, так как она перестановочна с матрицей А. Единицей будет единичная матрица. Если какая-то матрица перестановочна с матрицей А, то перестановочной с А будет и противоположная к ней. Согласно утверждению 1.6-1 это множество есть кольцо с единицей. 3.2-38.3 Подпространство перестановочных матриц Множество матриц, перестановочных с любой фиксированной матрицей А, является подпространством. Дополнение. Рассмотрим множество всех матриц, перестановочных с фиксированной матрицей А. На нем определены операции сложения и умножения на число. Результатами выполнения операций являются также матрицы, перестановочные с матрицей А. Нулевым элементом является нулевая матрица, так она перестановочна с матрицей А. Если какая-то матрица перестановочна с матрицей А, то перестановочной с А будет и противоположная к ней. Сложение коммутативно и ассоциативно согласно утверждению 3.2-14. Умножение на число ассоциативно и
96 Часть I. Математические сведения по линейной алгебре связано со сложением законами дистрибутивности. Согласно утверждениям 1.7-2, 1.7-9 это множество есть подпространство. 3.2-39.3 Комментарий (обоснование компактной формы) Пусть дана матрица А размера пхтс элементами я,у из поля Р. Ее строки (столбцы) можно рассматривать как вектор-строки (вектор-столбцы) арифметического пространства размерности т (п) с координатами из того же поля Р. Как мы увидим в дальнейшем, самые различные операции над матрицами будут сводиться к операциям над их строками и столбцами. Более того, эти операции будут осуществляться по тем же самым правилам, что и над векторами арифметических пространств. Поэтому во многих ситуациях удобно представлять матрицы не как совокупности элементов, а как совокупности вектор-строк или вектор-столбцов. 3.2.6. Компактная форма матрицы 3.2-40.3 Компактная форма матрицы Пусть дана матрица А размера пхтс элементами а0 из поля Р. Обозначим /-ю строку иу-й столбец матрицы А символами а* и ар т. е. а', =[ап aMi Тогда матрицу А можно записать в компактной форме а, 3.2-41.3 Линейные операции в компактной форме Если я. ...аи], В = к А'.
3. Матрицы и операторы 97 то выполняется соотношение аА = а а аа2 = [ аа,аа2 для любого числа а. Кроме этого, В= t . t =[а1+Ь>аг+Ь1...ая+Ьм]. Дополнение. Проверяется непосредственно. 3.2-42.3 Произведение матриц в компактной форме Если к то выполняются соотношения Дополнение. Проверяется непосредственно. 3.2-43.3 Трактовка перемножения матриц Каждая строка (столбец) произведения двух матриц есть линейная комбинация строк (столбцов) второго (первого) сомножителя. Коэффициентами линейной комбинации, 4 Зак 740
Часть I. Математические сведения по линейной алгебре образующей i-ю строку (/-й столбец) произведения, являются элементы i-й строки (/-го столбца) первого (второго) сомножителя. Дополнение. Очевидное следствие 3.2-42. 3.3. Транспонирование, сопряжение, след матрицы 3.3.1. Транспонирование и сопряжение матрицы 3.3-1.3 Транспонированная матрица Матрица А' размера nxm называется транспонированной по отношению к матрице А размера тхп, если {А'}у = {А}р для всех /,у. 3.3-2.3 Свойства транспонирования Имеют место соотношения аА\ (А+В)' = А'+В'9 (АВУ - В'А\ (AJ =*А. Дополнение. Проверяется непосредственно. Например, пусть матрицы А, В имеют соответственно размеры тхп,пхр. Тогда {{АВ)% = [АВ)М =?{Л)М{В}? - ^{В%{А\ = {»Л\. З.З-З.3 Комплексно-сопряженная матрица Матрица А размера т х п называется комплексно-сопряженной по отношению к комплексной матрице А размера тхп, если {А}0 = {А}0 для всех i,j. Здесь черта означает комплексное сопряжение. 3.3-4.3 Свойства комплексного сопряжения Имеют место соотношения Дополнение. Проверяется непосредственно. 3.3-5.3 Сопряженная матрица Матрица А* размера тхп называется сопряженной по отношению к комплексной матрице А размера пхт, если (А*}и - {А})} для всех ij.
3. Матрицы и операторы 99 3.3-6.3 Свойства сопряжения Имеют место соотношения (aA)* = aA*, (А +В)* = А* + В*, Дополнение. Проверяется непосредственно. Например, пусть матрицы А, В имеют размеры /их л, и х р и их элементами являются комплексные числа. Тогда % = {B*A*}U. 3.3-7.3 След матрицы Сумма диагональных элементов матрицы А называется следом матрицы А и обозначается tr А. 3.3-8.3 Свойства следа матрицы Имеют место соотношения tr A = tr A', tr A* = tr A, Xr(aA) = a tr A, tr(A + В) = tr /I + tr В, tr(BA) = tr(AB), Дополнение. Проверяется непосредственно. Рассмотрим, например, последнее соотношение. Чтобы одновременно существовали произведения АВ и ВА, их размеры должны быть согласованы. Пусть матрицы А, В имеют соответственно размеры mx n,nxm. Имеем ^=1/=! 3.3-9.3 Следы матриц АА* и А*А Для любой матрицы Л размера т х п с вещественными или комплексными элементами пц имеют место соотношения
100 Часть I. Математические сведения по линейной алгебре Дополнение. В самом деле, пусть матрица Л имеет размер mxn. Тогда /=!>=! im\jm\ y /=Iy=l 1=1j= Второе равенство следует из 3.3-8. 3.3-10.3 След и нулевая матрица Все элементы матрицы А равны нулю тогда и только тогда, когда Дополнение. Очевидно, принимая во внимание утверждение 3.3-9. 3.4. Элементарные матрицы и преобразования 3.4.1 Матрицы перестановок 3.4-1.3 Матрица перестановок Матрицей перестановок называется квадратная матрица, у которой в каждой строке и в каждом столбце только один элемент отличен от нуля и равен единице. 3.4-2.3 Умножение на матрицу перестановок При умножении прямоугольной матрицы А справа (слева) на матрицу перестановок переставляются столбцы (строки) матрицы А. Дополнение. Пусть матрица А имеет размер /w x и и умножается, например, справа на матрицу перестановок Р порядка и. Предположим, что элементы матрицы Р, которые равны 1, находятся в позициях (Аь lx\ (k2, /г),..., (кт /„). При этом среди чисел ?i,..., к„, также как и среди чисел /ь ..., /„ нет равных. Напомним, что по определению все остальные элементы матрицы Р являются нулевыми. Имеем для всех I. Это означает, что для всех у на месте /у-го столбца матрицы АР будет стоять kj-й столбец матрицы А. Так как все числа kj разные, то операция умножения матрицы А справа на матрицу перестановок Р эквивалентна перестановке столбцов матрицы А. Умножение слева исследуется аналогично.
3. Матрицы и операторы 101 3.4-3.3 Транспонирование матрицы перестановок Для любой матрицы перестановок Р всегда выполняются соотношения Р'Р = РР' = Е. Дополнение. В обозначениях дополнения к 3.4-2 находим, что , если / = у, ', если / Ф j. Другими словами, Р'Р = Е. Равенство РР' = Е доказывается аналогично. 3.4-4.3 Произведение матриц перестановок Произведение матриц перестановок одного порядка есть снова матрица перестановок. Дополнение. Пусть Р, Q — матрицы перестановок одного порядка. Допустим, что элементы, равные 1, находятся в позициях (kh /j), ..., (km /„) для матрицы Р и в позициях (s\91{)9 ..., (sn9 tn) для матрицы Q. При этом в каждой из групп чисел (kh ..., к„), (/ь ..., /„), (^ь ..., sn) и (tu ..., tn) нет равных. Все остальные элементы матриц Р, Q равны нулю. Имеем Заметим, что каждая из групп представляет какую-то перестановку из чисел 1, 2, ..., и. Поэтому позиции (kh tj) охватывают позиции всех элементов матрицы PQ. Рассмотрим /,-й столбец матрицы PQ. При изменении к( меняется /,. Но только один элемент {0„ равен 1, когда //==^/. Все остальные элементы в /,-м столбце матрицы PQ равны нулю. Рассмотрим далее кгю строку матрицы PQ. При изменении tj меняется Sj. Но только один элемент {P}ks равен 1, когда Sj = /;. Все остальные элементы кгй строки матрицы PQ равны нулю. Окончательно заключаем, что в каждой строке и каждом столбце матрицы PQ только один элемент отличен от нуля и равен он единице. Это означает, что матрица PQ есть матрица перестановок согласно определению 3.4-1. 3.4-5.3 Группа матриц перестановок Множество всех матриц перестановок одного порядка есть конечная группа по умножению. При этом единичным элементом группы является единичная матрица, а элементом, обратным для матрицы перестановок Р> — матрица Р*. Дополнение. Множество всех матриц перестановок одного порядка конечно. Операция умножения ассоциативна согласно утверждению 3.2-19. Все остальное следует из утверждения 1.5-9 и определения 1.5-30.
102 Часть I. Математические сведения по линейной алгебре 3.4-6.3 Элементарная матрица перестановок Матрица перестановок Pij9 i *у, называется элементарной, если она отличается от единичной тем,что у нее переставлены местами /-я иу-я строки или, что то же самое, /-й иу-й столбцы. 3.4-7.3 Отличие от единичной Элементарная матрица перестановок Ру отличается от единичной только четырьмя элементами, стоящими на пересечении i-x иу-х строк и столбцов. Матрица второго порядка, стоящая на их пересечении, имеет вид 3.4-8.3 Умножение на элементарную матрицу перестановок При умножении матрицы А слева (справа) на элементарную матрицу перестановок Ру в матрице А меняются местами ее /-я иу-я строки (столбцы). Эта операция называется перестановкой двух строк (столбцов) матрицы. Дополнение. См. утверждение 3.4-2 и дополнение к нему. 3.4-9.3 Перестановка элементов матрицы Пусть фиксированы позиции (/,у) и (k,l) элементов в матрице А. При /*Л, j±l(i*kj = l;i = kj*l) в матрице PikAPji(PikA;AP}D в позиции (Л,/) будет находиться элемент щ, в позиции (/,у) — элемент аш. Дополнение. Это есть прямое следствие утверждения 3.4-8. 3.4-10.3 Представление матрицы перестановок Любая матрица перестановок порядка п представима в виде произведения не более, чем п - 1, элементарных матриц перестановок. Дополнение. Пусть Р — произвольная матрица перестановок порядка п. Допустим, что элемент, равный 1, стоит в первом столбце в позиции (к\9 1). Рассмотрим матрицу Рх = Рц^Р. Согласно утверждению 3.4-4 это есть матрица перестановок, у которой в позиции A,1) стоит элемент, равный 11 Поэтому в первом ее столбце и первой ее строке нет никаких других ненулевых элементов. Предположим теперь, что элемент, равный 1, стоит во втором столбце матрицы Р\ в позиции (?2,2). Согласно сказанному выше, к2 ?2. Рассмотрим матрицу Р2 = Р1кгРх. Снова это есть матрица перестановок, у которой уже в позициях A,1) и B,2) стоят элементы, равные 1. 6 ее первых двух столбцах и строках нет никаких других ненулевых элементов. Пусть элемент, равный 1, стоит в третьем столбце матрицы Р2 в позиции (?3, 3). По построению матрицы Р2 должно выполняться неравенство к$ > 3.
3. Матрицы и операторы 103 Рассмотрим матрицу Р3 = Р3шкъР2 и т. д. После выполнения п- 1 шагов мы получим матрицу перестановок Р„-\, У которой в позициях A, 1), B, 2), ..., (л-1, и-1) стоят элементы, равные 1. Элемент, равный 1, в последнем столбце матрицы Р„_ j может находиться только в позиции (п, п). Поэтому Р„_\ есть единичная матрица Е. Итак, Е = Рп -1, *„_, Рп - г, к„_2 • • • 'г, *2 ч а, Р- Умножая это равенство последовательно на матрицы Р^_х к ,..., Рх'к и принимая во внимание утверждение 3.4-3, заключаем, что Р - Р* pf р* Матрицы Р/к1 являются элементарными матрицами перестановок и справедливость утверждения доказана. 3.4-11.3 Квадрат элементарной матрицы перестановок Для любой элементарной матрицы перестановок Р? = Е. Дополнение. Матрица Ру отличается от единичной перестановкой /-й иу'-й строк. Умножение матрицы Ру слева на матрицу Ptj согласно утверждению 3.4-8 снова переставляет /-ю иу-ю строки. Поэтому Р* = ? для всех /,/ 3.4.2. Элементарные матрицы масштабирования 3.4-12.3 Элементарная матрица масштабирования Квадратная матрица Rt{a) называется элементарной матрицей масштабирования, если она отличается от единичной только элементом в позиции (/, /) и этот элемент равен а ф 0. 3.4-13.3 Умножение на элементарную матрицу масштабирования При умножении матрицы Л слева (справа) на элементарную матрицу масштабирования Rj(a) все элементы /-й строки (/-го столбца) матрицы А умножаются на число а. Эта операция называется умноэюением строки (столбца) матрицы на число. Дополнение. Очевидно, принимая во внимание утверждения 3.2-16, 3.4-12. 3.4-14.3 Масштабирование элементов матрицы Пусть элемент а-у матрицы А не равен нулю. Тогда при a-a~jX элемент в позиции (/,/) матрицы Ri(a)A (ARj(a)) будет равен 1. Дополнение. Это есть прямое следствие утверждения 3.4-13.
104 Часть I. Математические сведения по линейной алгебре 3.4-15.3 Представление диагональной матрицы Любая диагональная квадратная матрица порядка п представима в виде произведения не более, чем и, элементарных матриц масштабирования. 3.4-1 б.3 Полезное соотношение Если а Ф О, то Rj(a)Rt(arl) = Д,{а~ x)R{a) = Е. 3.4.3. Элементарные неунитарные матрицы 3.4-17.3 Элементарная неунитарная матрица Квадратная матрица N„@), i *J9 называется элементарной неунитарной матрицей, если она отличается от единичной только элементом в позиции (/,/) и этот элемент равен а. 3.4-18.3 Умножение на элементарную неунитарную матрицу При умножении матрицы А слева (справа) на элементарную неунитарную матрицу Nijia) меняется только /-я строка (/-й столбец). На месте элемента а& (аф для всех к будет находиться элемент а^ + аяу* (а*у + аа*,). Эта операция называется прибавление к одной строке (столбгр) матрицы другой ее строки (столбца), умноженной на число. Дополнение. Проверяется непосредственно. 3.4-19.3 Обращение элементов матрицы в нуль Пусть элемент а^ (я^) матрицы А не равен 0. Тогда при а = - a^ja^ (а = - я*/я*/) элемент в позиции (/, К) ((*,/)) матрицы М0(а)А (ANj/a)) будет равен 0. Дополнение. Это есть прямое следствие утверждения 3.4-18. 3.4-20.3 Еще одно полезное соотношение При любом а справедливы равенства Л^(а)Л^(- а) = Л^<~ а)Л^(а) = Е. Дополнение. Проверяется непосредственно. 3.4.4. Элементарные матрицы и преобразования 3.4-21.3 Элементарные матрицы и преобразования Элементарная матрица перестановок, элементарная матрица масштабирования и элементарная неунитарная матрица называются элементарными матрицами. Умножение матрицы А слева (справа) на любую из элементарных матриц называется левосторонним (правосторонним) элементарным преобразованием матрицы А.
3. Матрицы и операторы 105 3.4-22.3 Свойство элементарных преобразований Возьмем какой-нибудь вектор х из арифметического пространства и выполним над ним любую из следующих элементарных операций: перестановка двух координат; прибавление к одной координате другой координаты, умноженной на число; умножение координаты на ненулевое число. Если вектор jc был не нулевым (нулевым), то после выполнения любой из этих операций он останется не нулевым (нулевым). 3.4-23.3 Сохранение линейной независимости Рассмотрим любую прямоугольную или квадратную матрицу и выберем среди ее вектор-столбцов (вектор-строк) некоторую подсистему. При любой последовательности левосторонних (правосторонних) элементарных преобразований матрицы линейно независимая подсистема останется линейно независимой, линейно зависимая — линейно зависимой. Дополнение. Рассмотрим для определенности вектор-столбцы и левосторонние их преобразования. Другой случай рассматривается аналогично. Очевидно, что достаточно исследовать любое одно элементарное преобразование. Обозначим через А матрицу, столбцы которой состоят из выбранных вектор-столбцов исходной прямоугольной матрицы. Выполнение одного левостороннего преобразования исходной матрицы эквивалентно ее умножению слева на матрицу преобразования В. То же самое относится и к выбранной подсистеме вектор-столбцов. После преобразования она описывается столбцами матрицы ВА. Пусть линейная комбинация вектор-столбцов матрицы А есть вектор-столбец jc. Будем считать его одностолбцевой матрицей. Пусть коэффициенты линейной комбинации образуют элементы одностолбцевой матрицы у. Тогда тот факт, что вектор х есть линейная комбинация вектор-столбцов матрицы А, записывается равенством х = Ау. Предположим, что вектор-столбцы матрицы А линейно независимы и нужно доказать, что линейно независимы вектор-столбцы матрицы ВА. Из предположения вытекает, что при х = О единственной матрицей, при которой выполняется равенство, может быть только у = 0. Рассмотрим далее равенство Допустим, однако, что вектор-столбцы матрицы ВА линейно зависимы или, другими словами, при у = 0 существует Р * 0. Тогда, умножив второе равенство на матрицу С, получим Если у = 0, то Су = 0 при любой матрице С. Но возьмем В равной Pip Я,(а) или Njj(a), а матрицу С соответственно равной Ро, Rj(a~l) или А^(- а). Как и в дополнении к 3.4-24, во всех этих случаях С(ВА)=А. Сравнив теперь первое и третье равенство, мы получим противоречие с тем фактом, что при х = 0 может быть только у = 0. Следовательно, при левосторонних элементарных преобразованиях
106 Часть I. Математические сведения по линейной алгебре линейно независимая подсистема вектор-столбцов перейдет в линейно независимую. Предположим теперь, что столбцы матрицы А линейно зависимы, но столбцы матрицы ВЛ линейно независимы. Это означает, что при jc = 0 в первом равенстве может быть у * 0, но при у = 0 во втором равенстве может быть только ($ = 0. Возьмем в первом равенстве удовлетворяющие ему х - 0, у ф 0 и умножим первое равенство слева на матрицу В. Если х - 0, то Вх = 0, и мы приходим к противоречию с предположением, что во втором равенстве при у = 0 может быть только Р = 0. Заметим, что здесь мы не делали никакого предположения о матрице В. Следовательно, при любых левосторонних, в том числе и элементарных преобразованиях линейно зависимая подсистема вектор-столбцов перейдет в линейно зависимую. 3.4.5. Эквивалентность и ранг 3.4-24.3 Эквивалентность систем строк и столбцов При любой последовательности левосторонних (правосторонних) элементарных преобразований система вектор-строк (вектор-столбцов) полученной матрицы будет эквивалентна системе вектор-строк (вектор-столбцов) исходной матрицы. Дополнение! Рассмотрим, например, левосторонние элементарные преобразования матрицы А. Правосторонние преобразования рассматриваются аналогично. Если мы покажем, что при каждом умножении матрицы А слева на любую элементарную матрицу получается матрица с эквивалентной системой вектор-строк, то этого будет достаточно для доказательства утверждения. Предположим, что матрица А умножается слева на матрицу В. Согласно утверждению 3.2-43, каждая строка матрицы В А линейно выражается через строки матрицы А. Чтобы показать, что строки матриц А и В А представляют эквивалентные системы, надо доказать, что строки матрицы А также линейно выражаются через строки матрицы ВА. Другими словами, надо доказать, что существует такая матрица С, что А = С(ВА). В нашем случае это очень просто. Если В = Ру9 то согласно утверждению 3.4-11 берем С = Ру; если В = /?,(<х), то согласно утверждению 3.4-16 берем С = Л/(а~1); если 2? = Л^(а), то согласно утверждению 3.4-20 берем 3.4-25.3 Сохранение ранга систем строк и столбцов При любой последовательности левосторонних (правосторонних) элементарных преобразований матрицы сохраняются ранги системы вектор-столбцов и системы вектор-строк. Дополнение. Рассмотрим снова только левосторонние преобразования для определенности. Сохранение ранга вектор-строк является следствием утверждения 3.4-24, а сохранение ранга вектор-столбцов — следствием утверждения 3.4-23.
3. Матрицы и операторы 107 3.4-26.3 Комментарий (особенность сохранения рангов) Заметим, что в утверждении 3.4-25 мы говорим о преобразовании строк (столбцов) матрицы, но утверждаем, что сохраняется ранг столбцов (строк). Сохранение ранга строк (столбцов) есть тривиальное следствие утверждения 3.4-24. 3.4.6. Матрицы типа Nr и Мг 3.4-27.3 Матрицы типа Nr и Мг Квадратная матрица порядка р называется матрицей типа Nr (матрицей типа Мг), если она отличается от единичной матрицы лишь элементами, находящимися в г-м столбце ниже главной диагонали (в r-й строке левее главной диагонали). 3.4-28.3 Соотношение для матриц Nr и Мг Для матриц типов Nr и Мг порядков/? при к <р выполняются соотношения МХМ2... Мк = Мх + М2+ ... + Мк-(к-\)Е. Дополнение. Проверяется непосредственно. 3.4-29.3 Связь с элементарными неунитарными матрицами Для матрицы типа Nr порядка/? с элементами nr+Un ..., пРуГ ниже главной диагонали справедливо представление Nr==Nr+hr(nr+lr)-Nr+2yr(nr+2>r)' ... -Мр>г(пРуГ). Дополнение. Проверяется непосредственно. 3.4-30.3 Перестановочность В правой части представления 3.4-29 все матрицы NJt.(nJr) перестановочны, т. е. их произведение может вычисляться в любом порядке. Дополнение. Проверяется непосредственно. 3.4-31.3 Связь с элементарными неунитарными матрицами Для матрицы типа Мг порядка/? с элементами т^ ь ..., mrr_ { левее главной диагонали справедливо представление М, = Nti x(mr> 0 • Ntt 2(тг> 2) • ... • Nr, r- \(гпг, г- О- Дополнение. Проверяется непосредственно.
tO8 Часть I. Математические сведения по линейной алгебре 3.4-32.3 Перестановочность В правой части представления 3.4-31 все матрицы Nrj{mrj) перестановочны, т. е. их произведение может вычисляться в любом порядке. Дополнение. Проверяется непосредственно. 3.5. Матрицы специального вида 3.5.1. Треугольные матрицы 3.5-1.3 Треугольная матрица Матрица А с элементами axj называется правой или верхней (левой или нижней) треугольной, если ац = 0 при / >j (i <j). 3.5-2.3 Строго треугольная матрица Матрица Л с элементами щ называется строго правой или строго верхней (строго левой или строго нижней) треугольной, если ау = 0 при / >j (i uj). 3.5-3.3 Сумма и произведение треугольных матриц Сумма и произведение любых двух треугольных матриц одного наименования есть треугольная матрица того же наименования. Дополнение. Проверяется непосредственно. 3.5-4.3 Линейное пространство треугольных матриц Множество треугольных матриц одного размера и одного наименования есть линейное пространство. Дополнение. На множестве треугольных матриц одного размера и одного наименования определены операции сложения и умножения на число. Результаты выполнения операций, нулевая и противоположная матрицы также являются треугольными матрицами из того же множества. Все необходимые свойства операций, очевидно, выполняются для этих матриц, т. к. они выполняются для них как для матриц общего вида. Поэтому все аксиомы определения 1.7-2 линейного пространства выполнены. 3.5-5.3 Кольцо треугольных матриц Множество квадратных треугольных матриц одного порядка и одного наименования есть некоммутативное кольцо с единицей и делителями куля. Дополнение. На множестве квадратных треугольных матриц одного размера и одного наименования определены операции сложения и умножения. Результаты
3. Матрицы и операторы 109 выполнения операций, нулевая, единичная и противоположная матрицы также являются треугольными матрицами из того же множества. Все необходимые свойства операций, очевидно, выполняются для этих матриц согласно утверждению 3.2-35. Поэтому все требования кольца выполнены. 3.5.2. Трапециевидные матрицы 3.5-6.3 Трапециевидная матрица Правая (левая) треугольная матрица размера m x п называется правой (левой) трапециевидной матрицей, если первые г диагональных элементов этой матрицы ненулевые и последние т~г строк {п - г столбцов) полностью нулевые. 3.5-7.3 Линейно независимые строки и столбцы Первые г строк (столбцов) правой (левой) трапециевидной матрицы образуют линейно независимую систему вектор-строк (вектор-столбцов). Дополнение. Пусть матрица А с элементами atj является, например, правой трапециевидной с первыми г ненулевыми строками. Составим линейную комбинацию этих строк с коэффициентами аь ..., ап и пусть она представляет нулевую строку. Тогда для первых г координат получаем, что а,^, =0, По определению трапециевидной матрицы все элементы ап, ...,ап отличны от нуля. Поэтому из первого уравнения заключаем, что at = 0, из второго — а2 = 0 и, наконец, из последнего — аг = 0. Следовательно, система из первых г строк правой трапециевидной матрицы линейно независима. 3.5-8.3 Произведение трапециевидных матриц Произведение двух трапециевидных матриц одного наименования есть трапециевидная матрица того же наименования. Дополнение. Проверяется непосредственно. 3.5.3. Почти треугольные и ленточные матрицы 3.5-9.3 Почти треугольная матрица Матрица А с элементами atj называется правой (левой) почти треугольной или правой (левой) матрицей Хессенберга, если я,у = 0 при / >j + 1 (/ + 1 <у).
110 Часть I. Математические сведения по линейной алгебре 3.5-10.3 Линейное пространство почти треугольных матриц Множество почти треугольных матриц одного размера и одного наименования есть линейное пространство. Дополнение. Доказательство аналогично дополнению к 3.5-4. 3.5-11.3 Ленточная матрица Матрица А с элементами afJ называется ленточной, если а,, = 0 при l<i-j иу - / > i» для некоторых неотрицательных целых чисел /, аи. В случае т = 0 (/ - 0) матрица называется левой (правой) ленточной; величина / + т + 1 называется шириной ленты. Если / = /и= 1, матрица называется трехдиагональной и левой (правой) двухдиаго- нальной, если т = 1, / = 0 (т - 0, / = 1). 3.5-12.3 Линейное пространство ленточных матриц Множество ленточных матриц одного размера с лентами одной и той же конфигурации есть линейное пространство. Дополнение. Доказательство аналогично дополнению к 3.5-4. 3.5.4. Профильные матрицы 3.5-13.3 Профиль матрицы Пусть дана матрица А размера т х п с элементами а,у. Совокупность позиций 0'ь 1)>(*2>2), ...,(/„, и)> гДе j)?min(/,/и), называется правым или верхним профилем матрицы А9 если ау-0 для всех у при /</}. Совокупность позиций (l,y'i), B,y2M •»9(mJm)> где ji < min(/, и), называется левым или нижним профилем матрицы А, если а,у = 0 для всех i приу <у'/. 3.5-14.3 Комментарий (тривиальные профили) Строго говоря, любая матрица имеет оба профиля, т. к. всегда верхним профилем можно считать совокупность позиций A,1),A,2), ..1,A, и), а нижним— совокупность позиций A,1),B,1),..., (/и, 1). Просто множество нулевых элементов матрицы будет пустым. Такие профили называются тривиальными. 3.5-15.3 Профильная матрица Матрица называется профильной, если она имеет хотя бы один нетривиальный профиль. 3.5-1 б.3 Линейное пространство профильных матриц Множество матриц одного размера и одной конфигурации профилей есть линейное пространство. Дополнение. Доказательство аналогично дополнению к 3.5-4.
3. Матрицы и операторы 111 3.5-17.3 Профильность известных матриц Треугольные, почти треугольные и ленточные матрицы являются профильными. 3.5.5. Блочные матрицы 3.5-18.3 Блочная матрица Пусть дана матрица А, вообще говоря, прямоугольная. Рассечем ее при помощи горизонтальных и вертикальных линий на блоки: А = Ап Ап Каждый из блоков представляет матрицу Аа$ размера ma x щ. Про матрицу А будем говорить, что она разбита на блоки или клетки и будем называть ее блочной. 3.5-19.3 Комментарий (обсуждение блочного разбиения) Важно подчеркнуть, что в блочном представлении матрицы все блоки в каждом столбце (строке) имеют одно и то же число столбцов (строк). Наиболее часто используется такое разбиение, при котором диагональные блоки оказываются квадратными. При некоторых условиях на размеры блоков действия над блочными матрицами производятся поблочно по тем же формальным правилам, что и в случае числовых матриц. Определенную осторожность необходимо лишь соблюдать при выборе порядка сомножителей в произведении блоков из-за некоммутативности операции их перемножения. 3.5-20.3 Сумма блочных матриц Предположим, что матрица А разбита на блоки Аа$, матрица В — на блоки Ву§. Для того чтобы сумму матриц А + В можно было получить поблочно, необходимо и достаточно, чтобы блочные размеры матриц А и В совпадали и для всех а, Р совпадали размеры блоков Аф и ?аР. Дополнение. Пусть матрицы А, В, А + В разбиты на блоки Аа^ Яу5, (А + В)^. Получить матрицу А + В поблочно означает, что каждый ее блок (А + ?)ФЧ/ должен вычисляться по формуле (А + #)ФЧ/ = Аа$ + Вуд для каких-то значений индексов а, р, у, 5. С учетом этого замечания утверждение становится очевидным. 3.5-21.3 Произведение блочных матриц Пусть матрица А разбита на блоки Аф матрица В — на блоки ?у5. Для того чтобы произведение матриц АВ можно было получить поблочно, необходимо и достаточно, чтобы блочные размеры матрицы А по столбцам и матрицы В по строкам совпадали и для всех а, Р, у совпадали размеры блока Аау по столбцам и блока Ву$ по строкам.
112 Часть I Математические сведения по линейной алгебре Дополнение. Пусть матрицы А, В и АВ разбиты на блоки Аа^ 2?у8, (АВ)^. Получить матрицу АВ поблочно означает, что каждый ее блок (АВ)^ должен вычисляться по формуле где индекс ?, пробегает все возможные значения. Чтобы произведение блоков А^ и В^ можно было вычислить, необходимо и достаточно, чтобы для всех значений индекса ? число столбцов блока А^ совпадало с числом строк блока В^. Кроме этого, число строк во всех блоках А^ должно равняться числу строк блока (AB\W, а число столбцов во всех блоках В^ — числу столбцов блока (АВ)т. Далее очевидно. 3.5-22.3 Умножение блочной матрицы на число Пусть матрица А разбита на блоки. Поблочное умножение матрицы А на число а всегда осуществимо. При этом каждый из блоков умножается на число а. 3.5-23.3 Произведение блочных перестановочных матриц Рассмотрим две перестановочные матрицы А, В, и пусть С есть результат их перемножения. Разобьем матрицы А, В, С на блоки. Для того чтобы произведения матриц АВ и ВА можно было получить поблочно и.результат совпадал с блочным разбиением матрицы С, необходимо и достаточно, чтобы блочные разбиения всех матриц Л, В, С были одинаковыми и все диагональные блоки были квадратными. Дополнение. Это есть прямое следствие утверждения 3.5-21. 3.5-24.3 Кольцо блочных матриц Рассмотрим кольцо квадратных матриц. Предположим, что все матрицы кольца разбиты на блоки. Пусть матрица С есть результат выполнения в кольце какой-либо операции над матрицами А, В. Для того чтобы для любой пары матриц А9 В можно было выполнять поблочно любую операцию в кольце и результат совпадал с блочным разбиением матрицы С, необходимо и достаточно, чтобы блочные разбиения всех матриц в кольце были одинаковыми и все диагональные блоки были квадратными. Дополнение. Это есть прямое следствие утверждений 3.5-20, 3.5-21. 3.5-25.3 Блочные матрицы специального вида Блочная матрица называется блочно диагональной, блочно треугольной и т. п., если она приобретает соответствующий вид при замене ее блоков числами. 3.5-26.3 Блочные элементарные матрицы Блочно элементарными матрицами, а также блочными матрицами типа Nr и Мг называются блочные матрицы, в которых 1,0 и числу а соответствуют единичная, нулевая и, в общем случае, какая-то прямоугольная матрица.
3. Матрицы и операторы 113 3.6. Метод Гаусса 3.6.1. Шаги метода Гаусса 3.6-1.3 Общая идея метода Гаусса Согласно утверждениям 3.4-14 и 3.4-19 элементарные преобразования можно выбирать так, чтобы какие-то из элементов преобразованной матрицы становились равными либо 1, либо 0. И, наконец, согласно утверждению 3.4-9 с помощью элементарных преобразований выделенные элементы матрицы можно переставлять на другие места. Теперь можно попытаться реализовать следующую идею. Будем строить последовательность левосторонних (правосторонних) элементарных преобразований заданной матрицы. При каждом умножении на элементарную неунитарную матрицу будем обращать в нуль какой-нибудь элемент матрицы и при этом не изменять все те нулевые элементы, которые были получены при всех предыдущих умножениях на элементарные неунитарные матрицы. При каждом умножении на элементарную матрицу масштабирования будем делать равным единице некоторый элемент матрицы и при этом не изменять все те единичные элементы, которые были получены при всех предыдущих умножениях на элементарные матрицы масштабирования. Элементарные матрицы перестановок будем выбирать так, чтобы после умножения на них ненулевые и единичные элементы матрицы располагались в виде какой-то вполне определенной структуры. Так как общее число элементов матрицы конечно, то конечным будет любой из таких процессов. Все методы преобразования матрицы, построенные на этой идее, собирательно называются методами Гаусса или методами исключения. Они отличаются друг от друга, главным образом, местами расположения нулевых и единичных элементов и порядком их получения. Во всех методах общим является использование преобразований с элементарными неунитарными матрицами. Использование остальных элементарных преобразований не является обязательным. Основной целью применения методов Гаусса является получение матрицы с возможно большим число нулевых элементов. Если выполняются левосторонние (правосторонние) преобразования, то большое число нулевых элементов в матрице, расположенных, к тому же, в виде какой-то регулярной структуры, существенно упрощает изучение системы вектор-строк (вектор-столбцов) матрицы. 3.6-2.3 Нормирование элемента Пусть элемент atj матрицы А не равен нулю. Умножив матрицу А слева (справа) на элементарную матрицу масштабирования R.(aJJx)(RJ(ay1)) или, другими словами, разделив /-ю строку (/-й столбец) матрицы А на ау, получим в позиции (/,/) элемент, равный 1. Дополнение. Очевидно. См. также утверждение 3.4-14.
114 Часть I. Математические сведения по линейной алгебре 3.6-3.3 Исключение элементов Пусть а,у = 1. Умножив матрицу А размера n х m слева (справа) последовательно на элементарные неунитарные матрицы или, другими словами, для всех k*i{k*j) вычтя из k-м строки (столбца) /-ю строку (/-и столбец), умноженную на akj (а,*), получим нулевыми все элементы ву-м столбце (/-й строке), кроме элемента в позиции (/,у), который останется равным 1. Дополнение. Очевидно. См. также утверждение 3.4-19. 3.6-4.3 Независимость от порядка исключения В утверждении 3.6-3 все матрицы Л^ (Л/,*) перестановочны. Другими словами, результат не зависит от того, в каком порядке осуществляется вычитание /-й строки (/-го столбца), умноженной на соответствующие числа, из других строк (столбцов). Дополнение. Проверяется непосредственно. См. также утверждение 3.4-30. 3.6-5.3 Сохранение исключенных элементов Пусть в матрице А размера п х т равны 1 элементы я7] 7),..., at jr, где г > 1, и элемент atj. Предположим, что все эти элементы находятся в разных строках и разных столбцах. Пусть также все элементы в столбцах с номерамиуь ...,уг (строках с номерами /ь ..., /г), кроме элементов а/( ^., ..., а,. } , являются нулевыми. Выполнение процесса 3.6-3 не изменяет столбцы с номерамиуь ...,/, (строки с номерами /ь ..., /г)- Дополнение. Проверяется непосредственно. 3.6-6.3 Шаги метода Гаусса Теперь один из процессов преобразования матрицы становится очевидным. Опишем его, например, для левосторонних преобразований. Пусть дана ненулевая матрица А размера пх т. Выберем любой ненулевой элемент а^ . Сначала с помощью умножения /гй строки на a^J сделаем единицу на месте элемента а^ . После этого выполняем процесс 3.6-3, считая / = /ьу =j{. Допустим далее, что выполнено г, г > 1, шагов процесса и все элементы матрицы в столбцах с номерами уь ...,уг стали нулевыми, кроме элементов в позициях (J\J\\ ..., (/V,yV), которые равны 1. При этом единичные элементы находятся в разных строках и разных столбцах. Возможны три ситуации: 1. г = min(w, n). 2. Все строки матрицы с номерами, отличными от /',, ..., in содержат только нулевые элементы.
3. Матрицы и операторы 115 3. В строках с номерами, отличными от /ь ..., /',., имеется хотя бы один ненулевой элемент. Ситуации 1, 2 означают окончание процесса получения нулевых элементов. Рассмотрим ситуацию 3. В строках матрицы с номерами, отличными от /ь ..., in выберем ненулевой элемент. Пусть он находится в позиции (/г+ьЛ+0- Номер /r+i не совпадает ни с одним из номеров /ь ..., хг в силу выбора элемента. Но номер jr + \ не может совпадать ни с одним из номеровуь ...Jn т. к. в столбцах с такими номерами имеется только по одному не нулевому элементу и находятся эти элементы в строках с номерами /ь ..., ir. Разделив ir+ гю строку на элемент в позиции (ir+ ujr+ О, мы попадаем в условия утверждения 3.6-5, если считать / = ir+uj =yr+i. Поэтому можно получить нулевые элементы вуг+гм столбце, не изменяя столбцов с номерамиуь ...,jr. Продолжая процесс, мы всегда, в конце концов, окажемся либо в ситуации 1, либо в ситуации 2. Пусть процесс получения нулевых элементов закончен, и мы находимся в ситуации 1 или 2. Всегда можно выполнить дополнительно элементарные левосторонние преобразования, переставив строки матрицы местами. Следовательно, не ограничивая общности, можно считать, что ix = 1,..., ir = r. При левосторонних преобразованиях элементы из разных столбцов не влияют друг на друга. Поэтому с точностью до перестановки столбцов (перестановка столбцов— это правосторонние преобразования!) можно также считать, чтоу i = 1, ...Jr- г. Очевидно, что аналогичный процесс можно рассмотреть для правосторонних преобразований матрицы. Аналогичным будет и результат, но только, возможно, с точностью до перестановки строк. 3.6.2. Преобразование матрицы к простейшему виду 3.6-7.3 Одностороннее преобразование матрицы к единичной Пусть строки (столбцы) квадратной матрицы линейно независимы. Тогда с помощью левосторонних (правосторонних) элементарных преобразований ее можно привести к единичной матрице. Дополнение. Проведем с матрицей Л левосторонние преобразования согласно процессу, описанному в утверждении 3.6-6, но без перестановки столбцов. Мы придем к матрице ?, у которой имеется какое-то число столбцов, в каждом из которых находится только один ненулевой элемент и равен этот элемент 1. Все такие элементы находятся в разных строках. Если в матрице В имеются и другие ненулевые элементы, то они находятся только в тех строках, где и упомянутые элементы, равные 1. Итак, в каждой ненулевой строке матрицы В обязательно имеется элемент, равный 1 и такой, что он является единственным ненулевым элементом в своем столбце. Очевидно, что ненулевые строки матрицы В линейно независимы. Если с матрицей А проводятся правосторонние преобразования без перестановки строк, то результат получается аналогичным. Лишь в его формулировке строки и столбцы меняются местами.
116 Часть I. Математические сведения по линейной алгебре Пусть теперь матрица А квадратная, и для определенности линейно независимы ее строки. После выполнения левосторонних преобразований она приводится согласно утверждению 3.4-25 к матрице В с линейно независимыми строками. Так как матрица В квадратная, то отсюда следует, что в каждой ее строке и каждом ее столбце находится только один ненулевой элемент и равен он 1. Ясно, что с помощью дополнительных левосторонних преобразований, заключающихся в перестановке строк, матрицу В можно привести к единичной. 3.6-8.3 Одностороннее преобразование прямоугольной матрицы Пусть строки (столбцы) прямоугольной матрицы А размера n x m линейно независимы и п ф т. Тогда с помощью левосторонних (правосторонних) элементарных преобразований ее можно привести к матрице, имеющей с точностью до перестановки столбцов (строк) блочный вид [ВС] Здесь матрица В является единичной, порядка п (т). Матрица С в общем случае является некоторой прямоугольной матрицей размера пх(т~п) ((/? - т) х т). Дополнение. По существу это утверждение уже было доказано в дополнении к 3.6-7. 3.6-9.3 Еще одно такое преобразование Пусть строки (столбцы) прямоугольной матрицы А размера nx т, n ф т, линейно зависимы и как система векторов имеют ранг т (п). Тогда с помощью левосторонних (правосторонних) элементарных преобразований ее можно привести к матрице, имеющей блочный вид ~В О Здесь матрица В является единичной порядка т (п). Матрица 0 — нулевая, размера (п -т)хт (пх (т - п)). Дополнение. По существу это утверждение уже было доказано в дополнении к 3.6-7. 3.6-10.3 Одностороннее преобразование к простейшему виду Пусть строки (столбцы) прямоугольной матрицы А размера nx m линейно зависимы и как система векторов имеют ранг г < т (г < п). Тогда с помощью левосторонних (правосторонних) элементарных преобразований ее можно привести к матрице, имеющей с точностью до перестановки столбцов (строк) блочный вид
3. Матрицы и операторы 117 \вс] i\B ° [о oj {[с о Здесь матрица В является единичной порядка г, матрицы С — какие-то прямоугольные матрицы соответствующих размеров, матрицы 0 — нулевые. Дополнение. По существу это утверждение уже было доказано в дополнении к 3.6-7. 3.6-11.3 Совпадение рангов систем строк и столбцов Для каждой из приведенных матриц из утверждений 3.6-7—3.6-10 ранг системы вектор-строк совпадает с рангом системы вектор-столбцов. Дополнение. Для каждой из приведенных матриц из утверждений 3.6-7—3.6-10 ранг системы вектор-строк (вектор-столбцов) равен числу строк (столбцов) матрицы В. Но матрица В квадратная, откуда и следует справедливость утверждения. 3.6-12.3 Равенство рангов систем строк и столбцов Для любой матрицы ранг системы вектор-строк совпадает с рангом системы вектор- столбцов. Дополнение. Любая матрица с помощью элементарных преобразований может быть приведена к одному из видов 3.6-7—3.6-10. Для матриц этих видов ранги систем вектор-строк и вектор-столбцов совпадают согласно утверждению 3.6-11. Но согласно утверждению 3.4-25 при любых элементарных преобразованиях сохраняются ранги систем как вектор-строк, так и вектор-столбцов. 3.6-13.3 Двустороннее преобразование к простейшему виду Любая прямоугольная матрица А размера n x m с помощью левосторонних и правосторонних элементарных преобразований может быть приведена к матрице, имеющей блочный вид 0 0 Здесь Е — единичная матрица порядка г < min (п, т), 0 — нулевые матрицы соответствующих размеров. Если г = п < т (г - т < п), то отсутствует вторая блочная строка (столбец). Если г = п - т, то отсутствуют все нулевые блоки. Дополнение. Сначала матрицу А с помощью левосторонних преобразований приводим к левому виду из 3.6-10 и делаем необходимые перестановки столбцов. Затем с помощью правосторонних преобразований полученную матрицу приводим к правому виду из 3.6-10, не изменяя те столбцы, в которых находится матрица В. Так как при правосторонних преобразованиях строки не "перемешиваются", мы получим в итоге требуемый вид матрицы.
118 Часть I. Математические сведения по линейной алгебре 3.6-14.3 Общий ранг систем строк и столбцов Число г в приведенной матрице из утверждения 3.6-13 равно общему рангу систем вектор-строк и вектор-столбцов исходной матрицы А. Дополнение. Это есть прямое следствие утверждений 3.6-12, 3.6-13. 3.6-15.3 Комментарий (подмножество преобразований) С помощью элементарных преобразований можно осуществлять много других полезных действий. При этом совсем не обязательно всегда использовать все виды преобразований. 3.6-1 б.3 Преобразование к треугольному виду Любая прямоугольная матрица А размера n x m с помощью левосторонних элементарных неунитарных преобразований и элементарных преобразований перестановок, а также правосторонних элементарных преобразований перестановок может быть приведена к матрице, имеющей блочный вид И- Здесь В — правая треугольная матрица порядка г < min(w, m) с не нулевыми диагональными элементами, С — прямоугольная матрица соответствующего размера, 0 — нулевые матрицы. Если г = n<m{r = m<л), то отсутствует вторая блочная строка (столбец). Если г = n = m, то отсутствуют и нулевые матрицы, и матрица С. Дополнение. Модифицируем несколько процесс, описанный в комментарии 3.6-6. Во-первых, не будем нормировать строки, стремясь сделать какой-то элемент равным 1. Исключение элементов можно осуществлять и без этого этапа. Во-вторых, проводя исключение с помощью какой-то строки, не будем проводить исключение элементов, находящихся в строках с меньшими номерами. Во всем остальном доказательство осуществляется по той же схеме, что для утверждения 3.6-10. Дополнительно придется выполнить только перестановку столбцов. 3.6-17.3 Еще раз общий ранг Число г в приведенной матрице из утверждения 3.6-16 равно общему рангу систем вектор-строк и вектор-столбцов исходной матрицы А. Дополнение. Строки и столбцы квадратной треугольной матрицы с ненулевыми диагональными элементами линейно независимы. Поэтому утверждение является прямым следствием утверждений 3.4-25, 3.6-12. 3.6-18.3 Комментарий (использование матриц типа Nr и Мг) Заметим, что при описании различных вариантов метода Гаусса мы использовали, главным образом, элементарные неунитарные матрицы. Легко заметить, что при
3. Матрицы и операторы 119 умножении на них слева (справа) постоянно появлялись группы матриц Ntj, у которых изменялся только первый (второй) индекс. Согласно утверждениям 3.4-27—3.4-32 каждую из групп таких элементарных неунитарных матриц можно заменить одной матрицей типа Nr (Л/г). Использование более заполненных матриц типа Nr или Мп естественно, упрощает описание вычислительных процессов. 3.6.3. Преобразование специальных матриц 3.6-19.3 Преобразование треугольной матрицы С помощью левосторонних и правосторонних элементарных преобразований перестановок правую (левую) треугольную матрицу можно перевести в левую (правую) треугольную. Дополнение. Очевидно, если записать строки и столбцы матрицы в обратном порядке и представить полученную матрицу как результат двустороннего умножения исходной матрицы на матрицы перестановок. 3.6-20.3 Преобразование блочно-треугольной матрицы Пусть А, В — две квадратные матрицы одного порядка. Составим блочную матрицу А 01 Е в\> где Е— единичная матрица, 0 — нулевая. С помощью левосторонних элементарных неунитарных преобразований эту блочную матрицу можно перевести в блочную матрицу вида Г 0 АВ] [-Е В Дополнение. Пусть квадратные матрицы А(щ)9 В(Ьу) имеют порядок п. Рассмотрим матрицу ап ап а,, а„ <*Хп а^ ... О 0 ... -1 I*,, Ьп1 ...b
120 Часть L Математические сведения по линейной алгебре Исключим первую строку матрицы А, для чего прибавим к первой строке матрицы С ее (и+1)-ю, (п + 2)-ю, ..., 2п-ю строки, умноженные соответственно на a\\,an, ...,tflw. Теперь в новой матрице выполним аналогичные преобразования второй строки, т.е. ко второй строке прибавим ее (п+ 1)-ю, (я+ 2)-ю, ...,2л-ю строки, умноженные соответственно на а2\, а1Ъ ..., а2п. Проделав такие же преобразования со всеми строками, мы получим блочную матрицу следующего вида: О D\ -Е В] Принимая во внимание процесс преобразования, очевидно, что D = АВ. 3.6.4. Выбор ведущего элемента 3.6-21.3 Комментарий (обсуждение операций деления) При реализации некоторых схем метода Гаусса время от времени приходится выполнять операции деления. Теоретически от элементов, на которые нужно делить, требуется лишь отличие от нуля. Поэтому вроде бы их выбор достаточно широк. Однако на практике эти элементы стараются брать по возможности максимальными по модулю (если используются поля вещественных или комплексных чисел). Это позволяет сдерживать рост результатов промежуточных вычислений и, следовательно, снижать влияние ошибок округления. 3.6-22.3 Ведущий элемент Элементы, на которые приходится делить при реализации методов Гаусса, называются ведущими. 3.6-23.3 Выбор по всей матрице Стратегия, при которой выбор очередного ведущего элемента осуществляется среди всех возможных элементов, называется выбор ведущего элемента по всей матрице. 3.6-24.3 Выбор по столбцу Стратегия, при которой выбор очередного ведущего элемента осуществляется среди элементов какого-нибудь столбца (строки), называется выбор ведущего элемента по столбцу (строке). 3.6-25.3 Отсутствие выбора Стратегия, при которой в качестве ведущих элементов берутся последовательно диагональные элементы в позициях A, 1), B, 2), ..., называется стратегией без выбора ведущего элемента.
3, Матрицы и операторы 121 3.7. Операторы 3.7.1. Линейные операторы 3.7-1.3 Оператор: обозначения и терминология Важнейшим моментом в создании основ математического анализа является введение понятия функции. Это понятие можно распространить на произвольные множества. Правило, по которому каждому элементу х некоторого непустого множества X ставится в соответствие единственный элемент у некоторого множества Y, называется оператором. Результат применения оператора А к элементу х обозначают у = А(х) или у = Ахи говорят, что оператор А действует из X в У, или отображает X в Y. Множество X называется областью определения оператора А. Элемент у называется образом элемента х, а х — прообразом элемента у. Совокупность всех образов называется областью значений оператора А. В том случае, когда каждый элемент у е Y имеет, и притом только один, прообраз, оператор называется взаимно однозначным. Оператор называется также отображением, преобразованием или операцией. В дальнейшем мы будем рассматривать лишь так называемые линейные операторы. Их отличительные особенности заключаются в следующем. Во-первых, областью определения линейного оператора всегда является некоторое линейное пространство или его подпространство. Во-вторых, свойства линейного оператора тесно связаны с операциями над векторами линейного пространства. В общей теории операторов линейные операторы играют столь же важную роль, как и линейные функции в математическом анализе. 3.7-2.3 Линейный оператор Пусть заданы линейные пространства X, Y над одним и тем же полем Р. Рассмотрим оператор А, областью определения которого является пространство X, а областью значений — некоторое множество из Y. Оператор называется линейным, если А(аи + pv) = аАи + $Av для любых векторов и, v е X и любых чисел а, Р е Р. Дополнение. Можно привести очень много примеров линейных операторов. • Поле Р: произвольное поле; пространство X: произвольное линейное пространство над полем Р с базисом; пространство У: поле Р. Оператор А ставит в соответствие каждому вектору х е X его координату с фиксированным номером в разложении вектора х по базису. • Поле Р: поле комплексных чисел; пространствами Y: пространство многочленов от переменной /, т. е. функции вида a$f + axf~x + ... + an-\t + an с коэффициентами из поля Р. Оператор А ставит в соответствие многочлену aQf + axf~I + + ... + an..\t + an многочлен naof~x +(л- \)a\f~2 + ... + а„_ь Этот оператор называется оператором дифференцирования многочленов.
122 Часть /. Математические сведения по линейной алгебре • Поле Р: произвольное поле; пространства X и У: произвольное линейное пространство над полем Р с базисом. Если вектор х е X разложен по векторам базиса, то оператор А ставит вектору х в соответствие вектор у g X\ который отличается от х тем, что часть его координат с фиксированными номерами сделана нулями. Если через S обозначить линейную оболочку векторов базиса, координаты которых остаются без изменения, через Т обозначить линейную оболочку векторов базиса, координаты которых становятся нулевыми, то описанный оператор называется оператором проектирования на подпространство S параллельно подпространству Т. • Поле Р: произвольное поле; пространство X: арифметическое пространство вектор-столбцов размерности т над полем Р; пространство У: арифметическое пространство вектор-столбцов размерности п над полем Р. Если задана матрица А размера п х т с элементами из поля Р, то оператор А ставит в соответствие вектор-столбцу х е X вектор-столбец у = Ах е У, где Ах понимается как произведение матрицы А размера п х т и матрицы х размера т х 1. Этот оператор называется матричным. То, что все эти операторы являются линейными, проверяется тривиально. Полезно воспользоваться утверждениями 2.2-30, 2.2-31 и свойствами матричных операций. 3.7-3.3 Область значений Область значений любого линейного оператора есть подпространство пространства У. Дополнение. Пусть элементы s, t принадлежат области значений оператора А. Это означает, что в области определения оператора А существуют такие элементы и, v, что s = Аи, t — Av. Областью определения линейного оператора всегда является линейное пространство. Поэтому ему принадлежит линейная комбинация осы + Pv при любых числах а, р. Но в силу линейности оператора имеем as + p/ = = А(аи + pv). Следовательно, линейная комбинация as + р/ при любых числах a, p принадлежит области значений оператора. Согласно утверждению 1.7-11 множество значений линейного оператора есть подпространство. 3.7-4.3 Комментарий (обозначения и терминология) Оператор, который каждому вектору х е вставит в соответствие нулевой вектор из У, является, очевидно, линейным. Он называется нулевым оператором и обозначается символом 0. Оператор В, построенный по предписанию Вх = -Ах, где А есть линейный оператор из X в У, также является линейным оператором из X в У. Он называется оператором, противоположным оператору А. Зафиксируем произвольное число а и каждому вектору х е X поставим в соответствие вектор осе е X. Построенный таким способом оператор будет линейным оператором, действующим изХвХ. Он называется скалярным. При a = 0 мы получаем нулевой оператор, при a = 1 — так называемый тождественный оператор. Тождественный оператор обозначается символом Е или L По определению всегда Ех-х Aх = х).
3. Матрицы и операторы 123 3.7-5.3 Равные операторы Два оператора А, В, действующие из X в У, называются равными, если Ах = Вх для всех х е X. Равенство операторов обозначается А = В. 3.7-6.3 Сумма операторов Пусть заданы операторы А, В, действующие из X в Y. Оператор С, действующий из X в Y, называется суммой операторов А, В, если Сх^Ах + Вх для всех х е X. Сумму операторов обозначают С-А + В. 3.7-7.3 Произведение оператора на число Пусть задан оператор А, действующий из X в Y над полем Р. Оператор С, действующий из X в У, называется произведением оператора А на число X из поля Р, если выполняется равенство Сх = X • Ах для всех х е X. Это произведение обозначают С = ХА. 3.7-8.3 Свойства линейности Для линейных операторов А, В операторы А + В и ХА являются линейными. Дополнение. Операторы А, В определены на одном и том же пространстве X. Пусть m,vgI Принимая во внимание определение суммы операторов и линейность операторов А, В, имеем (А + В)(аи +Pv) =А(аи + pv) + В(аи + Pv) = = а(Аи + Ви) + Р(Лу + Bv) = а(^ + В)и + р(Л + ?)v, что означает линейность оператора А+ В. Далее, принимая во внимание определение произведения оператора на число и линейность оператора^, имеем (ХА)(аи + pv) = ХА(аи + Pv) = Х(аА и + $Av) = = а(Х-Аи) + р . (X - Av) =a(XA)u + p(X4)v, что означает линейность оператора ХА. 3.7-9.3 Свойства операции сложения Операция сложения линейных операторов является алгебраической, ассоциативной и коммутативной. Дополнение. Согласно утверждению 1.4-1 операция сложения линейных операторов является алгебраической операцией, т. к. каждой упорядоченной паре операторов А, В однозначно ставится в соответствие оператор А + В, который также есть линейный оператор в силу утверждения 3.7-8. Пусть линейные операторы А, В, С определены на одном и том же линейном пространстве X. Для любого х е X имеем (А + (В + С))х = = (Ах + Вх) + Сх = (А + В)х + Сх = ((А +В) + Qx.
124 Часть I. Математические сведения по линейной алгебре Согласно утверждению 3.7-5 это означает, что А + (В + С) = (А + В) + С, т. е. операция сложения ассоциативная. Далее (А + В)х = Ах + Вх = Вх + Ах = (В + А)х. Согласно тому же утверждению 3.7-5 это означает, что А + В = В + А, т. е. операция сложения коммутативная. 3.7-10.3 Линейное пространство операторов Множество всех линейных операторов, действующих из линейного пространства X в линейное пространство У, есть линейное пространство. Дополнение. На множестве линейных операторов имеется нулевой оператор 0. Каждому вектору jc e X он ставит в соответствие нулевой вектор из У. Очевидно, 0 есть линейный оператор. Для каждого линейного оператора А имеется противоположный оператор -А, который каждому вектору jc e вставит в соответствие противоположный вектор -у, если у = Ах. Линейность противоположного оператора -А есть прямое следствие линейности оператора А. Единственность нулевого и противоположного операторов есть прямое следствие единственности нулевого и противоположного векторов в линейных пространствах. Дистрибутивность операции умножения оператора на число относительно операции сложения операторов проверяется тривиально. Например, для любого jc e X имеем (Х(А + В))х = Х-(А + В)х = Х(Ах + Вх) = ХАх + ХВх = (ХА + ХВ)х. Согласно утверждению 3.7-5 это означает, что Х(А + В) = ХА + ХВ. Все аксиомы линейного пространства, описанные в утверждении 1.7-2, выполнены. 3.7-11.3 Произведение операторов Рассмотрим три линейных пространства X, У, Z над одним и тем же полем Р. Пусть А — оператор, действующий из X в У, В — оператор, действующий из У в Z. Оператор С, действующий из X в Z, называется произведением оператора В на оператор А, если Сх = В(Ах) для всех х е X. Произведение операторов ВиА обозначают С = В А. 3.7-12.3 Линейность произведения Произведение линейных операторов есть снова линейный оператор. Дополнение. Для векторов u,v е X и чисел а, Р имеем, принимая во внимание определение произведения операторов В, А и их линейность, что (BA)(au + Cv) - B(A(au + pv)) = B(aAu + p^v) = aB(Au) + $B(Av) = a(BA)u Согласно определению 3.7-2 это означает линейность оператора В А. 3.7-13.3 Совместные свойства операций Произведение операторов обладает следующими свойствами: (АВ)С = A(BQ, ЦВЛ) = (ХВ)А = В(ХА\
3. Матрицы и операторы 125 Дополнение. Все свойства доказываются аналогично. Рассмотрим для примера свойство дистрибутивности умножения справа. Возьмем любой вектор х из области определения оператора С. Принимая во внимание определения операций сложения и умножения операторов, имеем ((А + В)С)х = (А + В)(Сх) = А(Сх) + В(Сх) = (AQx + (BQx = (AC + BQx. Согласно утверждению 3.7-5 это означает, что (А + В)С = АС + ВС, 3.7-14.3 Кольцо операторов Множество всех линейных операторов, действующих в линейном пространстве X, есть некоммутативное кольцо с единицей. Дополнение. На множестве линейных операторов, действующих из пространства X в то же пространство X, определены две операции — сложение (см. 3.7-6) и умножение (см. 3.7-11), обе ассоциативные, а также связанные законом дистрибутивности (см. 3.7-9 и 3.7-13), причем сложение коммутативно и обладает обратной операцией (см. 3.7-9, 3.7-10 и дополнение к 3.7-10). Роль единицы играет тождественный оператор. Согласно утверждению 1.6-1 это множество линейных операторов есть кольцо с единицей. 3.7.2. Матрица линейного оператора 3.7-15.3 Существование линейного оператора Для любого базиса е\, ...,ет /w-мерного пространства X и любой системы векторов f\....,fm «-мерного пространства Y существует такой линейный оператор А, что fk = Aek для всех к. Если х = ^\е\ + ... + ^тет то Дополнение. Остается только убедиться в том, что указанный в утверждении оператор А является линейным. Но это является прямым следствием утверждений 2.2-30,2.2-31. 3.7-1 б.3 Однозначность оператора Линейный оператор, действующий из пространства X в пространство Y, однозначно определяется совокупностью образов какого-либо базиса пространства X. Дополнение. Пусть в /w-мерном пространстве Xзадан базис еи ...,ети линейный оператор А переводит векторы базиса в векторы/ь ...,fm этого или какого-то другого пространства. Предположим, что линейный оператор В также переводит векторы базиса в\, ..., ет в векторы/ь ...,fm, т. e.fj = Aej uft = Bet для всех /= 1, ..., т. Рассмотрим любой вектор х еХк, разложив его по векторам базиса, будем иметь ... +атет.
126 Часть I. Математические сведения по линейной алгебре Так как оба оператора А, В линейные, то = а/, + ... +%/т = = alBe] + ... + amBem = В(ахех + ... + атет) = Вх. Согласно определению 3.7-5 это означает, что А= В. 3.7-17.3 Задание оператора набором чисел Пусть в w-мерном пространстве X задан базис еи ...,ew, в «-мерном пространстве У— базис дь ..., qn. Линейный оператор А, действующий из X в Y, однозначно определяется набором координат {Ae,}j векторов Aet в базисе qu...yqn для 1 < / < /и, 1 <j < п. Дополнение. В соответствии с утверждением 3.7-16 линейный оператор А однозначно определяется образами/], ...,/» векторов базиса еи ..., ет пространствах Но каждый из векторов/ однозначно определяется координатами разложения/ по векторам базисаqu ...,qn пространства У. 3.7-18.3 Матрица оператора При фиксированных базисах еь ..., ет и qx, ...,qn в пространствах X, У матрица размера п х т с элементами a(j называется матрицей оператора А в выбранных базисах, если аи = {Aej}j для всех ij. 3.7.3. Изоморфизм линейных операторов и матриц 3.7-19.3 Образ базиса При введенных выше обозначениях выполняются соотношения 3.7-20.3 Образ произвольного вектора Пусть у = Ах, где А есть линейный оператор, действующий из пространства X в пространство У. Если векторы х,у заданы своими разложениями по базисам, то при введенных выше обозначениях выполняются соотношения Л2 = «21^1 + «22^2 +-..
3. Матрицы и операторы 127 Дополнение. Согласно условиям утверждения и линейности оператора^ имеем n /H = Ем=у- Согласно утверждению 2.2-28 рг1зложение векторов по любому базису единственно. Поэтому для всех / = 1, ...,w имеем m л, = ?*<&. 7 = 1 3.7-21.3 О матрице оператора Между линейными операторами, действующими из де-мерного пространства X в «-мерное пространство Y над общим полем Р, и прямоугольными матрицами размера п х m с элементами из того же поля Р установлено взаимно однозначное соответствие. Дополнение. По существу, матрица оператора есть вектор того арифметического пространства размерности mn, на которое отображается пространство линейных операторов. Все различие заключается лишь в том, что этот вектор удобно записывать не строкой своих координат, а матрицей. Базис пространства линейных операторов, с помощью которого устанавливается отображение данного пространства на арифметическое, устроен очень просто. Это есть совокупность из mn линейных операторов Eip у которых при выбранных базисах в пространствах X, Y все элементы матриц, за исключением одного, являются нулевыми. Ненулевой элемент находится в позиции (/,/) и равен единице. Координаты образа, прообраза и линейного оператора в своих базисах связаны между собой соотношениями 3.7-20. 3.7-22.3 Изоморфизм линейных операторов и матриц Рассмотрим множество линейных операторов, действующих из фиксированного пространства размерности m в фиксированное пространство размерности п, и множество матриц размера nx m над одним и тем же полем. Эти множества с соответствующими операциями изоморфны. Дополнение. Итак, рассмотрим множество линейных операторов, действующих из m-мерного пространства X в /7-мерное пространство У. На этом множестве определены отношение равенства операторов, а также операции сложения операторов и умножение оператора на число. Если в пространствах X и У выбраны любые базисы еъ ..., ет и qu ..., qm то между линейными операторами и матрицами линейных операторов в этих базисах устанавливается взаимно однозначное соответствие. Мы хотим показать, что это соответствие есть изоморфизм, т. е. равным операторам, сумме операторов и произведению оператора на число соответствуют равные матрицы, сумма матриц и произведение матрицы на то же число.
128 Часть I. Математические сведения по линейной алгебре Пусть операторы А и В равны и в выбранных базисах имеют матрицы A(aSf) и B(bSJ) размера п х т. В соответствии с утверждением 3.7-16 равенство А - В эквивалентно равенствам Ае} = Ве} для у' = 1, ..., т. Принимая во внимание утверждение 3.7-19 для у = 1, ..., /я, имеем Согласно утверждению 2.2-28 разложение векторов по любому базису единственно. Поэтому для всех sj будут равны элементы aSJ и by, т. е. A(asj) = B{bSJ). Предположим теперь, что С = А+Вив выбранных базисах оператор суммы А + В имеет матрицу C(cSJ). Проводя аналогичные рассуждения, заключаем сначала, что Се} = Ае, + Bej дляу = 1, ..., /и, и затем Это означает, что для всех s,y элемент су равен asj + bsf или, другими словами, Рассмотрим далее произведение С оператора /4 на число X, т. е. С = L4. Сначала выписываем равенства Cej = Х-4е7 для у = 1, ..., /и и затем получаем соотношения Отсюда следует, что для всех s,j выполняются равенства csj = Xav. Это соответствует матричному равенству С(су) = XA{aSJ). Заметим, что если определены три линейные пространства X, Y, Z над одним и тем же полем Р и на них определено произведение линейных операторов, то в точности по такой же схеме доказывается, что в любых базисах произведению линейных операторов соответствует произведение их матриц. 3.7-23.3 Связь образа и прообраза Введем обозначения У = л.. Тогда соотношения 3.7-20 принимают вид матрично-векторного соотношения у = Ах. 3.7-24.3 Размерность пространства операторов Линейное пространство операторов, действующих из m-мерного пространства X в «-мерное пространство К, есть конечномерное пространство размерности тп.
3. Матрицы и операторы 129 Дополнение. Очевидно, если принять во внимание утверждение 3.7-21 и утверждение ЪП-22. 3.7-25.3 Комментарий (сравнение матриц и операторов) Важно подчеркнуть, что все операторные и соответствующие матричные равенства будут выглядеть совершенно одинаково, если символ Ах понимать как произведение оператора А на вектор х. Так как символика и свойства операций над матрицами и операторами в этом случае полностью совпадают, то любое преобразование операторного равенства приводит к аналогичному преобразованию матричного равенства. Поэтому с формальной точки зрения безразлично, иметь ли дело с матричными или операторными соотношениями. Использование матричного аппарата позволяет создавать конструктивные методы исследования, и в этом заключается основное его достоинство. Операторный аппарат оказывается более удобным, например, в тех случаях, когда нужно подчеркнуть общие свойства или когда по каким-либо причинам приходится отказываться от рассмотрения конкретных базисов. В дальнейшем мы не будем делать различия между операторными и матричными соотношениями. Более того, все новые понятия и факты, имеющие место в отношении операторов (матриц), мы, как правило, без особой оговорки будем распространять и на матрицы (операторы). В заключение отметим следующее. Знакомясь с пунктом 3.5 и особенно с пунктами 3.4, 3.6, можно все же предположить, что по своим возможностям матричный аппарат богаче операторного. Однако это в действительности не так. Как мы уже видели, исследование линейных пространств осуществляется эффективнее, если в них известны базисы. Но если известны базисы, то согласно утверждению 3.7-18 оператор можно задавать матрицей. Матрица оператора зависит от базисов. Поэтому можно надеяться, что, выбрав подходящие базисы, можно получить матрицу оператора в каком-нибудь достаточно простом виде и, следовательно, получить возможность более простого и более полного изучения самого оператора. Пункт 3.5 готовит почву для такого изучения. Как правило, найти нужные базисы удается не сразу, а лишь выполняя большое число переходов от каких-то известных базисов к близким базисам. Переход к близкому базису порождает элементарное преобразование матрицы оператора. Таким преобразованиям посвящены пункты 3.4 и 3.6. Более подробно об этом мы будем говорить позднее. 5 Зак 740
4. Определители 4.1. Определитель и его свойства 4.1.1. Перестановки 4.1-1.3 Перестановка чисел Пусть множество состоит из п элементов, перенумерованных подряд с помощью индексов, взятых из совокупности натуральных чисел. Установим на элементах какой- нибудь порядок и предположим, что последовательность^,у2, ...Jn описывает индексы элементов, выстроенные соответственно выбранному порядку. Совокупность чисел j 1,7*2» ---,jm среди которых нет равных и каждое из которых есть одно из чисел 1,2,..., п, называется перестановкой этих чисел. Перестановка 1, 2, ..., п называется нормальной, 4.1-2.3 Число перестановок В множестве из п чисел общее количество перестановок равно п\. Дополнение. Для п = 1 это очевидно. Пусть утверждение верно для п - 1 чисел. Все перестановки из п чисел можно разбить на п классов, помещая в один класс лишь те перестановки, которые на первом месте имеют одно и то же число. Число перестановок в каждом классе совпадает с числом перестановок из п- 1 чисел, т. е. равно {п - 1)!. Следовательно, число всех перестановок из п чисел равно п\. 4.1-З.3 Инверсия Говорят, что в данной перестановке числа ij образуют инверсию, если / >у, но / стоит в перестановке раньше у. 4.1-4.3 Четность перестановок Перестановка называется четной, если ее числа составляют четное количество инверсий, и нечетной — в противном случае.
132 Часть I. Математические сведения по линейной алгебре 4.1-5.3 Транспозиция Транспозицией называется преобразование перестановки, при котором меняются местами какие-либо два числа, не обязательно стоящие рядом. 4.1-б.3 Перемена четности Всякая транспозиция меняет четность перестановки. Дополнение. Для чисел, стоящих рядом, это очевидно. Пусть теперь между переставляемыми числами / и у находятся s других чисел Аь А2, ..., Av, s>\. Будем менять местами число / последовательно с рядом стоящими числами к], ..., Av,y. Затем число у, стоящее уже перед /, переместим влево при помощи s транспозиций с числами Av, А5_ь ...,А|. Таким образом, всего мы выполним 25+ 1 транспозиций рядом стоящих чисел. Следовательно, четность перестановки изменится. 4.1-7.3 Упорядоченность перестановок Все п\ перестановок из п чисел можно расположить в таком порядке, что каждая следующая будет получаться из предыдущей при помощи одной транспозиции, причем начинать можно с любой перестановки. Дополнение. Утверждение справедливо при п - 2. Если требуется начинать с перестановки 1,2, то искомое расположение будет 1,2, 2, 1; если же мы начинаем с перестановки 2, 1, то искомое расположение будет 2, 1, 1,2. Предположим, что утверждение доказано для любых перестановок, содержащих не более п - 1 чисел. Пусть перестановки из п чисел мы должны начать с 'ь 1ъ ••> h- Начнем с перестановок, у которых на первом месте стоит число i\. Согласно предположению все эти перестановки можно упорядочить в соответствии с утверждением, т. к. фактически необходимо расположить в нужном порядке все перестановки из п - 1 чисел. В последней полученной таким путем перестановке производим одну транспозицию, переставляя на первое место число /2 и т. д. При такой системе расположения перестановок из п чисел соседние перестановки будут иметь противоположные четности. Учитывая четность числа п - 1! для п > 2, можно заключить, что в этом случае число четных перестановок из п чисел равно числу нечетных и равно п\12. 4.1-8.3 Число четных и нечетных перестановок При п > 2 число четных перестановок равно числу нечетных и равно п\/2. Дополнение. См. дополнение к 4.1-7. 4.1-9.3 Сохранение числа инверсий Еслиуьу2, -"Jn— перестановка из первых п натуральных чисел с числом инверсий s, то после преобразования ее в нормальную перестановку индексные номера 1,2, ..., п образуют новую перестановку с тем же числом инверсий s.
4. Определители 133_ Дополнение. Рассмотрим в перестановке jь ...Jk, ...,У/>, ...,уя любые ее два числа у* и ур. Числа jk и ур образуют либо инверсию (Jk>jP, k<p), либо порядок (jk<jP,k<p)- После преобразования исходной перестановки в нормальную числа jk njp будут располагаться следующим образом: 1, 2, .. .Jp, .. .Jb ..., п в случае инверсии, 1, 2, ...Jk9 ...Jp, ..., п в случае порядка, причем в обоих случаях &</?. Это означает, что числа jk иур в исходной перестановке и их индексы к и р в перестановке индексных номеров одновременно образуют либо инверсию, либо порядок. Следовательно, обе перестановки имеют одинаковое число инверсий. 4.1.2. Определитель и его простейшие свойства 4.1-10.3 Определитель матрицы Определителем п-го порядка, соответствующим квадратной матрице порядка п, называется специальная функция от элементов матрицы. Она задается как алгебраическая сумма п\ членов, составленная следующим образом. Членами определителя служат всевозможные произведения по п элементов матрицы, взятых по одному в каждой строке и каждом столбце. Член берется со знаком плюс, если индексы столбцов его элементов образуют четную перестановку при условии, что сами элементы расположены в порядке возрастания номеров строк, и со знаком минус — в противном случае. Дополнение. Формально определение справедливо для п > 2, т. к. оно связано с четностью или нечетностью перестановок. Однако принято считать, что определитель матрицы первого порядка всегда совпадает с элементом матрицы. Существуют различные способы введения понятия определителя. Все они, конечно, эквивалентны. В зависимости от способа введения этого понятия доказательства отдельных свойств определителя будут иметь различную сложность. 4.1-11.3 Обозначение определителя Если необходимо указать явный вид элементов матрицы А, то для ее определителя употребляется обозначение ап ... а 1п я, Если же явный вид не нужен, то используется обозначение det А или \А I.
134 Часть I. Математические сведения по линейной алгебре Дополнение. Приведем явные формулы для определителей порядка 1, 2, 3: «ч «21 «11 «21 «12 «22 «12 «22 = «. «13 «23 «22- = «1. «21«I2> «22«33 + «12«23«31 <3I 2 М33 -al2a22a3] - aua23an - al2a2la al2a22a3] ua23an 4.1-12.3 Определитель и транспонирование Определитель не меняется при транспонировании матрицы. Это утверждение означает, что все свойства определителя, которые имеют место по отношению к строкам матрицы, будут справедливы также и по отношению к столбцам. Поэтому в дальнейшем мы будем указывать только свойства, касающиеся строк. Дополнение. Действительно, определитель матрицы А с элементами ay состоит из членов вида я^^д •••% > знак которых определяется четностью перестановки juJ2>"-Jn- Все множители любого члена detA остаются в транспонированной матрице А' в разных строках и разных столбцах. Поэтому каждому члену alji9a2h,...,anj^определителя матрицы А можно поставить во взаимно однозначное соответствие член аЛ19аА29...9а^ определителя матрицы А'. Упорядочим элементы в представлении соответствующего члена определителя матрицы А' в порядке возрастания номеров строк. Тогда в соответствии с утверждением 4Л-9 перестановка индексов столбцов будет иметь такую же четность, что и перестановка ji,y2j ...,Уя. Но это означает, что соответствующие члены в определителях матриц А и А' имеют одинаковые знаки. Следовательно, оба определителя состоят из одних и тех же членов с одинаковыми знаками, т. е. они совпадают. 4.1-13.3 Определитель и сопряжение Для любой квадратной матрицы А с комплексными элементами выполняется равенство det^* = det A. Это есть прямое следствие 3.3-5, 4.1-10, 4.1-12. 4.1-14.3 Умножение матрицы на число Если все элементы матрицы порядка п умножить на число а, то определитель умножится на ос". Дополнение. Если каждый элемент матрицы умножается на число а, то каждый член определителя умножается на а". Отсюда и определитель умножается на а".
4. Определители 135 4.1-15.3 Умножение строки на число Если какую-либо строку матрицы умножить на число а, то и определитель умножится на число а. Дополнение. В каждый член определителя из каждой строки матрицы входит один, и только один элемент. Поэтому, если какая-либо строка матрицы умножается на число а, то на число а умножается каждый член определителя и, следовательно, определитель в целом. 4.1-1 б.3 Нулевая строка Если одна из строк матрицы состоит из нулевых элементов, то определитель равен нулю. Дополнение. В каждый член определителя из нулевой строки матрицы входит один элемент. Поэтому каждый член определителя и, следовательно, определитель в целом будет равен нулю. 4.1-17.3 Строка как сумма строк Если все элементы /*-й строки представлены в виде суммы а~ = #/ + aj9 то определитель равен сумме двух определителей, у которых все строки, кроме /-й, такие же, как в исходном определителе, а /-я строка в одном из слагаемых состоит из элементов aj, в другом — из элементов aj. Дополнение. Для каждого члена определителя имеем представление "и -Ч -а< =*ц -Ч -ач, +аи, -Ч --а%г Отсюда и вытекает справедливость утверждения. 4.1-18.3 Перестановка строк Определитель меняет знак, если любые две различные строки матрицы поменять местами. Дополнение. Обозначим через В(Ьу) матрицу, полученную путем перестановки строк с номерами к,р в матрице А(а^) и пусть для определенности к<р. Член aXh ...akjk ...apj ...anj определителя матрицы А совпадает с членом b}ji -.'bpjk ...bkj ...bnj определителя матрицы В. Но они различаются знаками, т. к. перестановки номеров столбцов у них совпадают, а перестановки номеров строк отличаются одной транспозицией. Поэтому соответствующие члены определителей матриц А и В и, следовательно, сами определители различаются только знаками.
136 Часть I. Математические сведения по линейной алгебре 4.1-19.3 Одинаковые строки Определитель матрицы, имеющий две одинаковые строки, равен нулю. Дополнение. С одной стороны, определитель матрицы А при перестановке одинаковых строк не изменяется. С другой стороны, согласно утверждению 4.1-18 он должен поменять знак. Поэтому det А = - det А, т. е. det A = 0. 4.1-20.3 Прибавление линейной комбинации строк Определитель не меняется, если к какой-нибудь строке матрицы прибавить любую линейную комбинацию остальных строк. Дополнение. Обозначим через В(Ь0) матрицу, полученную из матрицы А путем прибавления к ее /?-й строке А>строки, умноженной на число а. Это означает, что bpj = aPJ + aakj для всех у и btj = a0 для \Фр. Пусть для определенности к<р. Для любого члена определителя матрицы В имеем *ц »А, -А, -А. =*ц -% -К, +а%)¦•¦*«. = = К -••% -V •••Чй,) + а(*ц •••**, ••-% •••^„)- Во второй скобке стоит член определителя матрицы, у которой к-я и р-я строки совпадают. Из утверждений 4.1-15, 4.1-17, 4.1-19 следует, что определитель матрицы В не меняется. Если к р-й строке прибавляются и другие строки, умноженные на какие-то числа, то результат, очевидно, будет таким же. 4.1.3. Определители некоторых матриц 4.1-21.3 Определитель треугольной матрицы Определитель квадратной треугольной (диагональной) матрицы равен произведению диагональных элементов. Дополнение. Единственный член определителя треугольной матрицы, в который не входят элементы, заведомо равные нулю, — это член, составленный из произведения диагональных элементов. Этот член всегда имеет знак "плюс". Диагональная матрица является частным случаем треугольной. 4.1-22.3 Определитель единичной матрицы Определитель единичной матрицы равен 1. Дополнение. Проверяется непосредственно. 4.1-23.3 Определитель элементарной матрицы перестановок Определитель элементарной матрицы перестановок равен - 1. Дополнение. Проверяется непосредственно.
4. Определители 137 4.1-24.3 Определитель элементарной неунитарной матрицы Определитель элементарной неунитарной матрицы равен + 1. Дополнение. Проверяется непосредственно или является следствием 4.1-21. 4.1.4. Определитель и линейная зависимость 4.1-25.3 Равенство определителя нулю Определитель равен нулю тогда и только тогда, когда строки матрицы образуют линейно зависимую систему. Дополнение. Обозначим строки матрицы А порядка п через аь а2, ...,а„. Если а\ = О, то dety4 = 0 согласно 4.1-16. Если ах ф О, то в соответствии с 2.1-16 одна из строк aic,2<k<ny линейно выражается через предшествующие. Предположим, что (Хк — (Х\п\ ~Ь СС2#2 ~^~ • • • ~^~ ®-к- \&к- !• Вычтем из к-й строки первую строку, умноженную на ось вторую строку, умноженную на ос2, и, наконец, (к- 1)-ю строку, умноженную на ос*_ \. Согласно 4.1-20 определитель матрицы не должен измениться. Но с другой стороны, после этих операций на месте Л-й строки появится нулевая строка. Поэтому определитель будет равен нулю. Следовательно, det A = 0. Пусть теперь det A = 0. Допустим, что при этом строки матрицы линейно независимы. Выполнив последовательность операций прибавления к одной строке другой строки, умноженной на число, а также операций перестановки строк и умножения строк на ненулевые числа, приведем матрицу А в соответствии с 3.6-7 к единичной. При всех этих операциях определитель матрицы согласно 4.1-15, 4.1-18, 4.1-20 либо не меняется, либо умножается на ненулевые числа. Но в соответствии с 4.1-22 определитель единичной матрицы равен единице. Поэтому определитель матрицы А не может равняться нулю, что противоречит условию. Следовательно, система строк матрицы А не может быть линейно независимой, т. е. должна быть линейно зависимой. 4.1-26.3 Комментарий (определитель и зависимость) Последнее утверждение создает впечатление, что значение определителя может служить "мерой" линейной независимости системы вектор-строк или вектор-столбцов. Такое отношение к определителю весьма широко распространено. Однако следует иметь в виду, что в общем случае значение определителя очень чувствительно к малым возмущениям элементов матрицы. Рассмотрим, например, правую двухдиаго- нальную матрицу порядка п: [12 0 0 0" 0 12 0 ... 0 0 0 0 0 0 ... 12 0 0 0 0 ... 0 1
138 Часть I. Математические сведения по линейной алгебре Очевидно, что det А = 1. Поэтому система вектор-строк матрицы А линейно независима при любом п. Теперь рассмотрим матрицу Ае, которая отличается от матрицы А только тем, что в позиции (л, 1) вместо нулевого элемента стоит элемент, равный е. Легко проверить, что dety4E= I +s(-2)"~1. Следовательно, при s = -(-2I~" система вектор-строк матрицы АЕ будет уже линейно зависимой. Но при п > 100 возмущение е оказывается столь малым, что его не всегда даже можно ввести в память ЭВМ. Так какой же надо считать на практике систему вектор-строк матрицы А?: линейно зависимой или линейно независимой? Ответ на этот вопрос совсем не тривиален, но очень важен. Ведь в реальных задачах нередко приходится иметь дело с матрицами порядка 106 и более. 4.1.5. Вычисление определителя 4.1-27.3 Умножение на неунитарную элементарную матрицу Определитель не меняется от умножения матрицы слева или справа на любую неунитарную элементарную матрицу. Дополнение. Это есть прямое следствие 3.4-18,4.1-10, 4.1-12, 4.1-20. 4.1-28.3 Комментарий (о вычислении определителя) Вычислять определители, исходя из определения, можно только для матриц очень малого порядка (обычно не более 5) или для матриц какой-либо специальной структуры. В общем случае придется выполнить исключительно большой объем вычислений. Значительно экономичнее использовать метод Гаусса. Согласно утверждению 3.6-16 любую квадратную матрицу А с помощью элементарных неунитарных преобразований и элементарных преобразований перестановок можно привести к треугольной матрице В. Выполнение элементарных неунитарных преобразований не меняет определитель. Выполнение любой элементарной перестановки меняет знак определителя. Поэтому согласно утверждению 4.1-21 определитель матрицы А может только знаком отличаться от произведения диагональных элементов матрицы В. Чтобы учесть изменение знака, надо всего лишь подсчитать общее число элементарных преобразований перестановок. 4.2. Миноры и алгебраические дополнения 4.2.1. Разложение определителя 4.2-1.3 Минор Определитель р-го порядка, составленный из элементов матрицы А9 стоящих на пересечении строк с номерами /ь /2, ..., \р и столбцов с номерами jl9j2i -..,jp, называется минором р-го порядка (матрицы или определителя) и обозначается
4. Определители 139 hh При этом совпадение каких-либо индексов в верхней (нижней) строке в обозначении минора означает, что совпадают между собой соответствующие строки (столбцы) самого минора. 4.2-2.3 Ведущий минор Минор, расположенный в первых/? строках и первых/? столбцах, называется ведущим или угловым минором. Минор, расположенный в столбцах и строках с одинаковыми номерами, называется главным. 4.2-3.3 Алгебраическое дополнение Пусть в строках /ь ..., ik и столбцах ju ...Jk определителя расположен минор М порядка к. Минор N порядка n-к, расположенный в строках и столбцах матрицы, оставшихся после вычеркивания строк /ь ...,/* и столбцов jь ...,у*, называется дополнительным минором для минора М Число (-1)'- N называется алгебраическим дополнением минора М. Алгебраическое дополнение элемента я,у, т. е. минора 1-го порядка, есть минор (и- 1)-го порядка со своим знаком. Он обозначается А у. 4.2-4.3 Теорема Лапласа Пусть в определителе d порядка п произвольно выбраны к строк (столбцов), где 1 <к<п- 1. Тогда сумма произведений всех миноров к-то порядка, содержащихся в выбранных строках (столбцах), на их алгебраические дополнения равна определителю d. Дополнение. Пусть выбраны строки с номерами i\ <i2< ... < ik. Нужно доказать, принимая во внимание 4.2-3, что Jl-Jk ... ik] w f /, ... ik I h • • • h 1 Mi • • • '* i где N\ есть дополнительный минор для минора А\ матрицы А. UaJ , UJ) (h - 'Л Рассмртрим детально правую часть равенства. Минор А\ есть определи- тель к-то порядка. Он представляет собой сумму произведений по к элементов матрицы А, взятых из разных строк и столбцов. Каждое из произведений имеет
140 Часть I. Математические сведения по линейной алгебре свой знак как член определителя k-го порядка. Точно так же iV ' * есть оп- ределитель (п - к)-го порядка. Он представляет собой сумму произведений по п - к элементов матрицы, взятых из разных строк и столбцов. Каждое из произведений имеет свой знак как член определителя (п - к)-го порядка. Произведение любого члена минора как определителя к-ro порядка на любой член дополнительного минора как определителя (и - к)~го порядка есть произведение п элементов матрицы А. Согласно определению 4.2-3 дополнительного минора все эти элементы находятся в разных строках и столбцах. Другими словами, это произведение есть член определителя матрицы А. Число членов минора как определителя А-го порядка равно к\, число членов дополнительного минора как определителя (п - ?)-го порядка равно (п-к)\, число различных миноров к-го порядка в любых к строках равно С*. Поэтому общее число произведений членов миноров и членов их дополнительных миноров равно то есть оно равно числу всех членов определителя матрицы А. Но каждому члену определителя матрицы А всегда соответствует одно произведение. В самом деле, рассмотрим член aY a2 ...^ определителя матрицы А. Среди номеров строк 1,2, ..., п имеется только одно подмножество номеров /| < /2 < ... < /*. Выбор этих номеров однозначно определяет подмножество номеров столбцов а,,,а/ ,...,а, . Тем самым определен единственный минор ?-го порядка и в нем единственный член. Оставшиеся элементы члена а]а а2а ... апа определяют единственный член дополнительного минора. По построению произведение найденных членов минора и дополнительного минора представляет рассматриваемый член определителя матрицы А. Таким образом, правая и левая части доказываемого равенства состоят из суммы членов определителя матрицы А, взятых со своими знаками. Остается показать, что одинаковые члены слева и справа имеют одинаковые знаки. Выберем любые элементы ах а2а ...я^ матрицы А, находящиеся в разных строках и столбцах. Они определяют член определителя матрицы А и его знак как в левой, так и в правой части доказываемого равенства. Будем переставлять соседние столбцы матрицы А, перемещая столбец oci на место первого столбца, столбец сс2— на место второго и т. д., столбец ап — на место л-го. При каждой перестановке столбцов выбранные элементы будут частично находиться в других позициях матрицы А. Поэтому определяемый ими член определителя матрицы А будет каким-то образом изменять свои знаки в левой и правой части. Исследуем изменения знаков. Пусть переставляются столбцы с номерами р и q. Как отмечалось в дополнении к 4.1-18, каждый член определителя матрицы А в левой части равенства изменит знак на противоположный. Для изучения изменения знака выбранного члена в правой части нужны более детальные рассмотрения. Возможны три ситуации:
4. Определители 141 либо номера р, q одновременно принадлежат множеству номеров столбцов минора, либо номера р, q одновременно принадлежат множеству номеров столбцов дополнительного минора, либо номера р, q по одному принадлежат как множеству номеров столбцов минора, так и множеству номеров столбцов дополнительного минора. Конечно, имеется в виду тот минор и дополнительный к нему, которые однозначно определяются членом определителя матрицы А. Напомним, что каждому члену det А в левой части доказываемого равенства соответствует одно слагаемое в правой части, а в нем— одно значение ^(ip + jp)9 один член минора Л| | и один член дополнительного минора N\ 1 '" к I При перемене местами двух столбцов тому же члену det^ может, вообще говоря, соответствовать другое слагаемое и другие его компоненты. В первой ситуации остаются без изменения слагаемое, ^(ip + jp), член дополнительного минора; член минора меняет знак, т. к. два его элемента меняются местами в столбцах. Поэтому в первой ситуации выбранный член det А в правой части изменит знак на противоположный. Аналогичный результат во второй ситуации. Только теперь выбранный член det А в правой части меняет знак на противоположный за счет того, что два элемента члена дополнительного минора меняются местами в столбцах. В третьей ситуации не меняются в целом минор и дополнительный минор, а также расположение в них интересующих нас членов, хотя формально как в миноре, так и в дополнительном миноре изменился на 1 номер одного из столбцов. Однако содержание этих столбцов осталось прежним. При перемене местами двух соседних столбцов в ^(//; + jp) одно их чисел jp изменится на 1. Поэтому снова выбранный член det А в правой части меняет знак на противоположный. Итак, при перемене местами двух соседних столбцов матрицы А выбранный член det А меняет знак на противоположный одновременно как в левой части доказываемого равенства, так и в правой. При переводе члена al0L а2а^ ... anoLn из det A в позицию A, 1), B, 2), ..., (/?, п) член слева будет иметь знак "плюс", т. к. перестановка номеров его столбцов стала нормальной и, следовательно, четной. Но знак "плюс" будет иметь тот же член det А справа, т. к. члены минора и дополнительного минора также расположатся на главных диагоналях и ^(ip + jp) будет четной. Окончательно заключаем, что в доказываемом равенстве одинаковые члены det А в правой и левой частях имеют одинаковые знаки. Равенство доказано. 4.2-5.3 Миноры и "чужие" дополнения Пусть в определителе d порядка п произвольно выбраны различные группы по к строк (столбцов), где 1 <к<п- 1. Тогда сумма произведений всех миноров к-то порядка, содержащихся в строках (столбцах) одной группы, на алгебраические дополнения соответствующих миноров другой группы равна нулю.
142 Часть I. Математические сведения по линейной алгебре Дополнение. Пусть две группы из к строк различаются хотя бы одной строкой. Рассмотрим сумму произведений всех миноров к-го порядка, содержащихся в строках первой группы на алгебраические дополнения соответствующих миноров второй группы. В "чужие" алгебраические дополнения будет входить хотя бы одна из строк первой группы. Поэтому, согласно утверждению 4.2-4, рассматриваемая сумма будет равна определителю матрицы, имеющей, по крайней мере, две одинаковые строки. В соответствии с утверждением 4.1-19 этот определитель равен нулю. 4.2-6.3 Разложение по строке Для любой квадратной матрицы А(а0) порядка п всегда выполняются следующие соотношения: fdet A,k = I, О, **/; fdet А, к = /, О, к ф L Дополнение. Это утверждение является прямым следствием утверждений 4.2-4, 4.2-5. Только группа строк (столбцов), по которым раскладывается определитель, состоит в данном случае всего из одной строки (столбца). 4.2.2. Определители некоторых блочных матриц 4.2-7.3 Определитель блочно-треугольной матрицы Определитель блочно-треугольной матрицы с квадратными блоками на главной блочной диагонали равен произведению определителей диагональных блоков. Дополнение. Рассмотрим для определенности левую блочно-треугольную матрицу А = О ^22 Л. с квадратными блоками Ац,А22,..., Д« на главной диагонали. Разложим det^ согласно утверждению 4.2-4 по тем же строкам, в которых находится блок Аи. В этих строках только один минор, возможно, отличен от нуля, и это есть det Au. Дополнительным к нему минором является определитель матрицы Аг - К
4. Определители 143 Величина ?(/р + jp) из утверждения 4.2-4 для блоками является четной. Поэтому согласно 4.2-4 dzt A = det An - det А\. Применяя для detA\ аналогичное разложение и продолжая процесс до конца, заключаем, что S det^ = J^[det Au . 4.2-8.3 Специальный случай Пусть А, В — две квадратные матрицы порядка п. Определитель блочной матрицы ГА °1 г п ' I ~~* ¦" ^ I где Е — единичная матрица, 0 — нулевая, равен det A • det В. Дополнение. Это есть прямое следствие утверждения 4.2-7. 4.2-9.3 Еще один специальный случай Определитель блочной матрицы О ЛВ\ В\ равен det (AB). Дополнение. Пусть матрицы А, В имеют порядок п. Разложим определитель блочной матрицы " О АВ] С = ¦-Е В по первым п столбцам. Согласно 4.2-4 имеем det С - (- 1)а det(- где а = (л+ 1) + (л + 2)+... +2л+1 +2 + ...+/i = /iBw+1). Согласно 4.1-14, 4.1-22 выполняется равенство det(- Е) = (- 1)". Поэтому всегда det С = 4.2.3. Определитель произведения матриц 4.2-10.3 Определитель произведения квадратных матриц Определитель произведения двух квадратных матриц равен произведению определителей сомножителей. Дополнение. Согласно 3.6-20 блочную матрицу из 4.2-8 с помощью левосторонних элементарных неунитарных преобразований можно перевести в блочную матрицу из 4.2-9. Но согласно 4.1-27 определитель от таких преобразований не меня-
144 Часть I. Математические сведения по линейной алгебре ется. Следовательно, из 4.2-8, 4.2-9 вытекает теперь, что для любых квадратных матриц А9 В одного порядка det(AB) = det A • det В. 4.2-11.3 Определители матриц АА* и А*А Для любой квадратной матрицы А с вещественными или комплексными элементами выполняются равенства det(/L4*) = det(A*A) = I det A12 > 0. Дополнение. Это есть прямое следствие утверждений 4.1-13, 4.2-10. 4.2-12.3 Частный случай Пусть квадратная матрица С порядка п равна произведению двух прямоугольных матриц А и В соответственно размеров n x m и m х п, причем m < п. Тогда det С = 0. Дополнение. Обозначим через с,',...,ся' строки квадратной матрицы С = АВ порядка п. Как следует из утверждения 3.2-42, каждая из строк матрицы С есть линейная комбинация строк матрицы В. По условию число строк матрицы В меньше числа строк матрицы С. Поэтому, согласно утверждению 2.1-22, строки матрицы С линейно зависимы. Воспользуемся далее утверждением 2.1-16. Если d = 0, то det C = 0 по утверждению 4.1-16. Пусть теперь ск' линейно выражается через предыдущие строки, т. е. для каких-то чисел аь ..., а*_}. Прибавим к к-й строке матрицы С ее первую строку, умноженную на -ссь вторую строку, умноженную на -а2, и т.д. Наконец, прибавим (к- 1)-ю строку, умноженную на - а*_ х. С одной стороны, в соответствии с утверждением 4.1-20 определитель матрицы С не меняется от таких действий. С другой стороны, после этого на месте Л-й строки матрицы С будет стоять нулевая строка. Поэтому всегда det С = 0. 4.2-13.4 Формула Бине-Коши Пусть квадратная матрица С порядка п равна произведению двух прямоугольных матриц А и В соответственно размеров п х m и m х п, причем m > п. Тогда cf12-nl- у i12 - " \\2...п) ls*,/^m Ui*:- * Дополнение. Обозначим через о,у, Ьф сч элементы матриц А, В, С. Согласно определению произведения матриц имеем
4, Определители 145 Подставляя вместо элементов матрицы С их выражения и используя свойство линейности определителя в отношении вектор-столбцов, находим '" '" ln | = det 'л! • • • Cnn 4, = I S2 = I *,=l »„ 4" 1Л2 4-22 ^.j 14,, 4,,W *„ = 1 4| = 1 4'2 ... a, _ b K „ и Каждый из индексов sb s2, ...9sn не зависит от других и может принимать любые значения от 1 до т. Поэтому полученное выражение представляет собой сумму т" слагаемых. В этой сумме будут равны нулю те слагаемые, у которых значения хотя бы двух индексов равны между собой, т. к. будут равны нулю соответствующие миноры матрицы А. Все остальные слагаемые можно разбить на группы по п\ слагаемых в каждой, объединяя в одну группу все те слагаемые, значения индексов которых образуют одну и ту же совокупность чисел. Обозначим через к\, к2, ...,к„ упорядоченное в порядке возрастания расположение значений индексов sus2, ...,sn. Пусть z(sus2, ...,*„) = (-1)', где t есть число транспозиций, необходимых для преобразования перестановки su s2, ...,sn к перестановке кХу къ ..., кп. Тогда в пределах одной группы значений индексов s\9s2,...9sn сумма соответствующих слагаемых из полученной выше формулы будет равна
146 Часть I. Математические сведения по линейной алгебре = A[k k "к \2...п\(к]к1...к Из полученного соотношения и вытекает справедливость утверждения. 4.2-14.4 Полезное следствие Пусть В - А*. Тогда в обозначениях 4.2-13 имеем ;i 2... пЛ (k.L...k^ '• - x|2 A\ . . . \B\ у " к{кг...кп) \\ 2 ... n) ^,A2...AJ| >0 и, следовательно, 12...* f к{к2...к„\ Дополнение. Это есть прямое следствие утверждений 4.1-13,4.2-13. 4.3. Ранг матрицы 4.3.1. Ранг и независимость 4.3-1.3 Ранг матрицы Наивысший порядок отличных от нуля миноров прямоугольной матрицы А называется ее рангом и обозначается символом rank А, По определению rank 0 = 0. 4.3-2.3 Базисный минор Любой отличный от нуля минор порядка rank Л называется базисным минором матрицы А. 4.3-3.3 Базисные строки и столбцы Строки и столбцы, на которых расположен базисный минор, называются базисными. 4.3-4.3 Базисные строки и базы Любые базисные строки (столбцы) матрицы образуют базу ее вектор-строк (вектор- столбцов).
4. Определители 147_ Дополнение. Базисные строки всегда линейно независимы. Если бы это было не так, то линейно зависимыми были бы и строки базисного минора. И тогда согласно 4.1-25 базисный минор должен равняться нулю. Но это невозможно по определению. Теперь надо показать, что каждая строка матрицы линейно выражается через базисные. Предположим противное. Пусть найдется г линейно независимых строк и г больше, чем ранг матрицы. Будем приводить эти строки с помощью левосторонних преобразований с элементарными неунитарными матрицами к треугольному виду 3.6-16. С одной стороны, согласно утверждению 4.1-27 все миноры в этих строках не изменят свои значения. С другой стороны, в соответствии с процессом приведения обязательно найдется в преобразованных строках минор порядка г, матрица которого с точностью до перестановки столбцов является треугольной с ненулевыми диагональными элементами. Согласно утверждению 4.1-21 данный минор отличен от нуля. Следовательно, в матрице существует ненулевой минор, порядок которого больше, чем число базисных строк. Полученное противоречие говорит о том, что каждая строка матрицы линейно выражается через базисные. 4.3-5.3 Ранги систем строк, столбцов и матрицы Для любой прямоугольной матрицы ранги ее систем вектор-строк и вектор-столбцов совпадают и равны рангу матрицы. Дополнение. Равенство рангов систем вектор-строк и вектор-столбцов есть содержание утверждения 3.6-12. То, что эти ранги совпадают с рангом матрицы, есть следствие утверждений 4.3-1—4.3-4. В самом деле, из 4.3-4 вытекает, что число базисных строк равно рангу систем вектор-строк. Но число базисных строк по определению совпадает с порядком базисного минора, который, в свою очередь, равен рангу матрицы. 4.3.2. Ранг и ведущие миноры 4.3-6.3 Местонахождение базисного минора На пересечении любых базисных строк и базисных столбцов матрицы находится базисный минор. Дополнение. Предположим противное. Пусть минор, стоящий на пересечении базисных строк и базисных столбцов, не является базисным, т. е. равен нулю. Согласно 4.1-25 столбцы этого минора линейно зависимы. Но через столбцы минора линейно выражаются все столбцы выбранных базисных строк, т. к. сам минор располагается на базисных столбцах. В соответствии с 3.6-12 ранг любой системы вектор-строк совпадает с рангом системы ее вектор-столбцов. Из сказанного выше вытекает, что ранг системы вектор-столбцов, выбранных из базисных строк, меньше числа базисных столбцов. Поэтому ранг системы базисных строк должен быть меньше числа базисных столбцов, что невозможно. Следовательно, рассматриваемый минор является базисным.
148 Часть I. Математические сведения по линейной алгебре 4.3-7.3 Независимость строк и ненулевой минор В любых г линейно независимых строках (столбцах) матрицы найдется ненулевой минор порядка г. Дополнение. Будем приводить эти строки с помощью левосторонних преобразований с элементарными неунитарными матрицами к треугольному виду 3.6-16. С одной стороны, согласно утверждению 4.1-27 все миноры в этих строках не изменяют свои значения. С другой стороны, в соответствии с процессом приведения обязательно найдется в преобразованных строках минор порядка г, матрица которого с точностью до перестановки столбцов является треугольной с ненулевыми диагональными элементами. Согласно утверждению 4.1-21 данный минор отличен от нуля. Следовательно, в любых г линейно независимых строках матрицы обязательно найдется ненулевой минор порядка г. 4.3-8.3 Неизменность ранга Любое лево- или правостороннее элементарное преобразование не меняет ранг матрицы. Дополнение. Согласно утверждению 3.4-25 при любых элементарных преобразованиях не меняются ранги систем вектор-строк и вектор-столбцов. А согласно утверждению 4.3-5 эти ранги совпадают с рангом матрицы. 4.3-9.3 Ненулевые ведущие миноры Перестановками строк и столбцов прямоугольной матрицы можно добиться того, что все ведущие миноры, порядок которых не превосходит ранга матрицы, будут отличны от нуля. Дополнение. Пусть ранг матрицы А равен г. Не ограничивая общности можно считать, что первые г столбцов матрицы Л линейно независимы. В первом столбце имеется хотя бы один ненулевой элемент. В противном случае согласно 2.1-11 первые г столбцов будут линейно зависимы. Перестановкой строк ненулевой элемент можно переместить в позицию A.1). Предположим, что перестановкой строк и столбцов мы уже добились того, что первые к, к > 1, ведущие миноры матрицы стали ненулевыми. Рассмотрим систему из первых к + 1 столбцов, если, конечно, к+ 1 <г. Оставим первые к строк матрицы без изменения, а на место (к+ 1)-й строки будем поочередно ставить одну из остальных строк. Обязательно найдется строка такая, что ведущий минор (к + 1)-го порядка будет ненулевым. В самом деле, допустим, что это не так. Тогда согласно 4.1-25 строки всех миноров (к + 1)-го порядка в первых к + 1 столбцах будут линейно зависимы. Но первые к строк линейно независимы по предположению. Это означает, что все строки системы из к + 1 столбцов линейно выражаются через первые к строк. Следовательно, ранг этой системы строк не может превосходить к. С другой стороны, система из к + 1 столбца линейно независима по предположению. Следовательно, ранг системы из к+ 1 столбцов должен равняться А+ 1. Согласно 4.3-5 для любой системы векто-
4. Определители 149 ров ранги ее вектор-столбцов и вектор-строк совпадают. Полученное противоречие говорит о том, что при перестановке строк обязательно найдется ненулевой ведущий минор порядка к + 1. 4.3-10.3 Перестановка строк и столбцов Перестановками строк (столбцов) квадратной матрицы с ненулевым определителем можно добиться того, что все ведущие миноры будут отличны от нуля. Дополнение. Доказательство этого утверждения почти дословно повторяет дополнение к 4.3-9. 4.3-11.4 Ведущие миноры матриц А*А и АА* Для любой матрицы А с вещественными или комплексными элементами все ведущие миноры матриц^*/! иАА* неотрицательны. Дополнение. Пусть матрица А имеет размер n х т. Принимая во внимание 4.1-13 и 4.2-13, находим, что для \<г<т 9 г 1 Z "• Г и для 1 < г < n 1 2 ... г 1c Z ... Г 4.3.3. Матрицы полного и малого ранга 4.3-12.4 Матрица полного ранга Прямоугольная матрица А размера тх п называется матрицей полного ранга, если rank A =min{Aw, n). 4.3-13.4 Случай матрицы полного ранга Пусть вещественная или комплексная матрица А имеет размер их т и является матрицей полного ранга. Тогда при п<т(п>т) все ведущие миноры матрицы АА* {А*А) строго положительны.
150 Часть /. Математические сведения по линейной алгебре Дополнение. Пусть матрица А имеет размер пхт и является матрицей полного ранга. Если п < т, то любые г строк матрицы А линейно независимы. Согласно 4.3-7, в первых ее г строках найдется хотя бы один ненулевой минор. Следовательно, во второй формуле из дополнения к 4.3-11 найдется хотя бы одно строго положительное слагаемое. Если п > т, то любые г столбцов матрицы А линейно независимы. И тогда в первой формуле из дополнения к 4.3-11 найдется хотя бы одно строго положительное слагаемое. 4.3-14.4 Представление матрицы ранга 1 Матрица размера пхт имеет ранг 1 тогда и только тогда, когда она может быть представлена в виде произведения двух ненулевых матриц размеров п х 1 и 1 х т. Дополнение. Пусть матрица С размера пхт представлена в виде произведения матрицы А размера п х 1 и матрицы В размера 1 х т, причем обе матрицы А, В ненулевые. Если в матрице А элемент ап ф О, в матрице В элемент by ф О, то элемент c,j = a,i • by матрицы С так же не равен нулю. Поэтому rank С > 1. Но все столбцы матрицы С пропорциональны матрице А как вектор-столбцу. Следовательно, все миноры матрицы С порядка больше 1 равны нулю, т. е. rank С = 1. Пусть теперь rank С = 1 и элемент Су ф 0. Рассмотрим у-й и р-й столбцы матрицы С, где р ф]. Эти столбцы не могут быть линейно независимыми, т. к. в этом случае в них, согласно 4.3-7, нашелся бы ненулевой минор порядка 2, что невозможно из-за условия rank С = 1. Поэтому эти столбцы должны быть пропорциональны. А т. к. у-й столбец заведомо является ненулевым, то р-й столбец пропорционален у-му. Теперь образуем матрицу А размера п х 1 из у-го столбца матрицы С и матрицу В размера т х 1. Ее элемент Ь\р, 1 <р<т, равен как раз тому коэффициенту, с которым /?-й столбец матрицы С пропорционален ее у-му столбцу. Очевидно, что С = АВ. Обе матрицы А, В ненулевые, т.к. ап = спФ0 по выбору элемента с^ a by = 1 по построению матрицы В. 4.3-15.4 Представление матрицы ранга г Любую матрицу ранга г можно представить в виде суммы г матриц ранга 1 и нельзя представить в виде суммы меньшего числа матриц ранга 1. Дополнение. Пусть матрица С размера пхт имеет ранг г. Предположим, что ее столбцы с номерами уь ...,уг являются базисными. Будем рассматривать эти столбцы как матрицы А\, ...,Аг размера пх\. Согласно 4.3-4 каждый столбец матрицы С линейно выражается через базисные столбцы. Обозначим ?>7-ь ..., bjr коэффициенты линейной комбинации дляу-го столбца и пусть Бь ..., Вг суть матрицы размера lxmc элементами bXh ...,bmi для Bh Очевидно теперь, что Каждая из матриц Ар не нулевая, т. к. эти матрицы образованы из базисных столбцов, а они не могут быть нулевыми из-за своей линейной независимости. Каждая
4. Определители 151_ из матриц Вр также не нулевая, т. к. в матрице Вр, например, элемент в позиции (\JP) равен 1. Следовательно, мы получили разложение матрицы ранга г в сумму из г матриц ранга 1. Предположим далее, что каким-то другим способом мы получили представление матрицы С в аналогичном виде, но верхний индекс суммирования равен к < г. Отсюда вытекает, что каждый столбец матрицы С линейно выражается через матрицы Аь ...,Aki рассматриваемые как вектор-столбцы. Согласно 2.2-11 ранг системы вектор-столбцов матрицы С не может быть больше к. Но согласно 4.3-5 он равен г > к. Полученное противоречие говорит о том, что матрицу ранга г нельзя представить в виде суммы меньшего числа матриц ранга 1. 4.3.4. Свойства ранга 4.3-1 б.4 Свойства ранга Имеют место соотношения: rank(ot/0 = rank А, ос Ф О, rank A = rank КА = rank AM, det К ф 0, det М Ф О, rank A = rank A', rank АВ < min{rank A, rank В}, гапк(Л + В) < rank A + rank В. Дополнение. Первая и третья строки соотношений очевидны. Рассмотрим вторую строку. Пусть матрица А имеет размеры nx m, ранг г и умножается, например, справа на матрицу М порядка т, определитель которой отличен от нуля. Согласно утверждению 4.1-25, столбцы матрицы М линейно независимы. Умножим матрицу AM справа на матрицу R, представляющую любое произведение элементарных матриц. Согласно 4.3-8 ранг матрицы AM не изменится. Но согласно 3.6-7 матрицу R можно выбрать такой, что матрица MR будет единичной и AMR = А. Поэтому rank AM= rank А. Аналогично доказывается, что ранг матрицы не изменяется от умножения слева на любую матрицу с ненулевым определителем. Рассмотрим далее четвертую строку. В соответствии с 3.2-42 каждая строка (столбец) матрицы АВ линейно выражается через строки (столбцы) матрицы В (А). Согласно 2.2-11 ранг системы вектор-строк (вектор-столбцов) матрицы АВ не превышает ранга системы вектор-строк (вектор-столбцов) матрицы В (А). Принимая во внимание 4.3-5, заключаем, что rank АВ < min{ranky4, rank В}. Последняя строка соотношений становится очевидной, если каждую из матриц^, В представить в виде суммы матриц ранга 1 в соответствии с 4.3-15 и принять во внимание, что ранг матрицы не больше числа слагаемых в этой сумме. 4.3-17.4 Случай комплексных матриц Имеют место соотношения: rank Л = rank A*, rank A = rank AA* = rank A*A.
152 Часть I. Математические сведения по линейной алгебре Дополнение. Первое соотношение очевидно. Теперь рассмотрим вторую строку соотношений. Согласно 4.3-16 имеем rank АА* < rank А и rank А*А < rank А. Пусть в матрице А базисными являются строки с номерами /ь ...,/г. Тогда согласно 4.1-13,4.2-13 имеем АА* kr <m I < /г, < <kr<,m 2 ...kr так как в соответствии с 4.3-7 в строках с номерами /ь ..., ir есть хотя бы один ненулевой минор. Следовательно, rank АА* = rank А в силу того, что в матрице АА* нашелся ненулевой минор порядка г = rank Л. Пусть далее в матрице А базисными являются столбцы с номерамиу'ь ...,уг. Совершенно аналогично убеждаемся в том, что А*А J\ > 0, т. е. rank A*A = rank A. 4.3-18.4 Неравенство Фробениуса Если А, В, С— прямоугольные матрицы и произведение ABC существует, то rank АВ + rank ВС < rank В + rank ABC. Дополнение. Докажем сначала одно полезное вспомогательное утверждение. Пусть матрица P = P\...PS есть произведение элементарных матриц P\,...,PS. Существует матрица Q = Qs --- Q\, составленная из произведения элементарных матриц Qs,...,Qu такая, что PQ = QP = E. В самом деле, предположим, что Р/, 1 < / < s, есть элементарная матрица перестановок Ри (элементарная матрица масштабирования Я,(а), элементарная неунитарная матрица N,j(a)). Возьмем Qi = Ри (Qi = Л|(а" l\ Qi = Nij(ra.))- Согласно 3.4-11 C.4-16, 3.4-20) будем иметь Pi Qi= Qi Pi = Е- Принимая во внимание ассоциативность операции умножения матриц, заключаем теперь, что PQ = QP = Е. Согласно 3.6-13 существуют такие матрицы Р\—Р4, составленные из произведений элементарных матриц, что 0 0J 3 4 [О 0 Здесь ЕА (Ес) есть единичная матрица порядка rank A (rank С). Как было показано выше, существуют матрицы Q\—Q4, также составленные из произведений элементарных матриц, причем для всех / Q-,Pi = PtQi = E. Обозначим B~QlBQl, и пусть гА (гс) означает число линейно независимых строк (столбцов) матрицы В
4. Определители 153_ среди первых ее строк (столбцов), число которых равно rank A (rank С). Воспользовавшись 4.3-8, находим, что rank АВ + rank ВС = rank P\AP2Q2BQ3 + rank Q2BQ3P3CP4 = , Ol • *[Er 0 B + rank ВI c \ = r c OJ" [0 01 A rank В + rank ABC = rank 62Ябз + rank P1AP2Q2BQ3P3CP4 = [?. Ol - [~?c Ol = rank В + rank Z? > max {r,, rr\ + min {r,, rr} = r. + rr. [0 Oj L° °J Сравнивая правые и левые части полученных соотношений, устанавливаем справедливость утверждения. 4.3-19.4 Неравенство Сильвестра Если прямоугольные матрицы А и В имеют соответственно п столбцов и строк, то rank A + rank B-n< rank АВ < min {rank A, rank В). Дополнение. Правая часть неравенства установлена в 4.3-16. Для доказательства левого неравенства воспользуемся идеями и обозначениями из дополнения к 4.3-18. Имеем \ЕА 0 rank АВ = rank PXAP2Q2BQZ = A Среди первых строк матрицы В, число которых равно rank A9 мы имеем гА линейно независимых строк. Дополним эти строки до базисных строк матрицы В . Эти дополнительные строки не могут быть среди первых rank ,4 строк. Всего в матрице В имеется n - rank В строк, которые линейно выражаются через базисные. Часть из них, общим числом rank A - гА, находится в первых rank А строках. Очевидно, что rank А - rA < n - rank В или rank A + rank B-n<rA. Согласно доказанному выше rA = rank АВ. Утверждение доказано. 4.4. Невырожденные матрицы 4.4.1. Невырожденная или неособенная матрица 4.4-1.3 Невырожденная матрица Матрица называется невырожденной (неособенной), если ее определитель не равен нулю, и вырожденной (особенной) — в противном случае.
154 Часть I. Математические сведения по линейной алгебре 4.4-2.3 Независимость строк или столбцов Матрица является невырожденной тогда и только тогда, когда ее строки (столбцы) линейно независимы. Дополнение. Это есть прямое следствие утверждения 4.1-25. 4.4-3.3 Произведение невырожденных матриц Произведение невырожденных матриц одного порядка есть невырожденная матрица. Дополнение. Это есть прямое следствие утверждения 4.2-10. 4.4.2. Обратная матрица 4.4-4.3 Умножение на вырожденную матрицу Произведение любой квадратной матрицы и вырожденной матрицы есть вырожденная матрица. Дополнение. Это есть прямое следствие утверждения 4.2-10. 4.4-5.3 Присоединенная матрица Матрица А с элементами аи называется присоединенной для квадратной матрицы А с элементами ау, если afJ = Ajt, где Ар есть алгебраическое дополнение ар. 4.4-6.3 Соотношения с присоединенной матрицей Согласно 4.2-6 матрица и присоединенная к ней связаны между собой соотношениями АА = АА = det A • Е. Здесь Е — единичная матрица. Дополнение. Это есть прямое следствие утверждения 4.2-6. 4.4-7.3 Обратная матрица Для любой невырожденной матрицы А матрица А~l = (det A)~l А такова, что АА~1 = А~]А= Е. Матрица А~1 называется обратной к матрице А. Дополнение. Это есть прямое следствие утверждения 4.4-6. 4.4-8.3 Единственность обратной матрицы Пусть для невырожденной матрицы А существует такая матрица В, что АВ = Е (ВА - Е). Тогда матрица В совпадает с А~' и, следовательно, выполняется равенство ВА = Е (АВ - Е).
4. Определители 155 Дополнение. В самом деле, умножив равенство АВ = Е (ВА = Е) слева (справа) на матрицу А~1 из 4.4-7, заключаем, что В — А~1 и, следовательно, выполняется согласно 4.4-7 равенство ВА= Е (АВ = Е). 4.4-9.3 Представление обратной матрицы Для любой невырожденной матрицы А элементы обратной матрицы таковы: det Л Аг det Л К det A А22 det A '" det det А А А п dot A detA det A_ Дополнение. Это есть прямое следствие утверждений 4.4-7,4.4-8. 4.4-10.3 Соотношения с обратной матрицей Имеют место соотношения: у1 = а' ХА~ \ число а Ф О, Дополнение. Проверяется непосредственно. Рассмотрим, например, последнее соотношение. Имеем (АВ)(В~ ХА~х) - А(ВВ~ l)A~l - АЕА~ 1=АА~1 = Е. Согласно 4.4-8, матрица В~ lA~l есть обратная для матрицы АВ. Для четвертого соотношения воспользуемся равенством А' 1А = Е. Взяв определитель от обеих частей этого равенства и приняв во внимание утверждения 4.1-22, 4.2-10, получаем, что det A~l • det А = 1 или det A~l = (det A)~ \ 4.4-11.3 Случай комплексных матриц Имеет место соотношение {А*)~! = (А~!)*. Дополнение. Из второго и третьего соотношений 4.4-10 вытекает, что (А*)'1 =@ОГ1 =((А'У1) = (Р)' = (А-1)*.
156 Часть I. Математические сведения по линейной алгебре 4.4-12.3 Миноры матрицы и обратной Миноры матрицы и обратной к ней связаны между собой соотношениями к к' ..к' в 1 i. п - р Здесь /i < /2 < ... < /^ вместе с /,' < /2' <... < i'n _ p и kx<k2< ... <kp вместе с к'х < ?2' <...<к'п_р составляют полную систему индексов 1, 2, ..., п. Дополнение. См. [4J, стр. 30—32. 4.4-13.3 Группа невырожденных матриц Множество всех невырожденных матриц одного порядка есть группа по умножению. Дополнение. На множестве невырожденных матриц одного порядка определена операция умножения матриц. Согласно 3.2-19 эта операция ассоциативная, а согласно 4.4-3 произведение невырожденных матриц есть снова невырожденная матрица. На множестве невырожденных матриц есть невырожденная матрица Е, которая обладает тем свойством, что АЕ = А для любой матрицы А. Для любой невырожденной матрицы А согласно 4.4-7 существует обратная матрица А~1 такая, что АА~1 = Е. Согласно 1.5-9 множество невырожденных матриц есть группа. 4.4-14.4 Подгруппа невырожденных матриц Множество всех невырожденных матриц одного порядка, с определителем, равным 1, есть подгруппа. Эта подгруппа является нормальным делителем группы всех невырожденных матриц того же порядка. Дополнение. В множество невырожденных матриц с определителем, равным 1, входит согласно 4.1-22 единичная матрица Е. Если ёеЫ = det?= 1, то согласно 4.2-10 dety4/?=l, а согласно 4.4-11 det/T1 = l. Принимая во внимание 4.4-13, 1.5-9, 1.5-10 заключаем, что данное множество матриц есть подгруппа. Возьмем любую невырожденную матрицу А и любую матрицу В, для которой det 5=1. Имеем det(^~АВА) = 1. Поэтому согласно 1.5-22 данная подгруппа есть нормальный делитель. 4.4-15.4 Смежный класс Смежный класс группы невырожденных матриц по указанной подгруппе есть множество матриц с одним и тем же значением определителя. Дополнение. Очевидно, принимая во внимание определение 1.5-12.
4. Определители 157 4.4-1 б.4 О матрице полного ранга Пусть матрица F размера р х q имеет полный ранг. Если p<q(p>q), то матрица FF* (F*F) является невырожденной и, следовательно, имеет обратную. Дополнение. Согласно 4.3-13 при p<q(p>q) определитель матрицы FF* (F*F) положителен. По определению 4.4-1 матрица FF* (F*F) невырожденная и согласно 4.4-7 имеет обратную. 4.4.3. Вычисление обратной матрицы 4.4-17.3 Обратные матрицы для элементарных Все элементарные матрицы невырожденные и, следовательно, имеют обратные. Обратные матрицы определяются утверждениями 3.4-11, 3.4-16 и 3.4-20. 4.4-18.3 Комментарий (о вычислении обратной матрицы) Находить обратные матрицы, исходя из формул 4.4-9, можно только для матриц очень малого порядка или для матриц какой-либо специальной структуры. В общем случае для вычисления всех необходимых миноров придется выполнить очень большой объем работы даже в том случае, если для вычисления миноров использовать метод Гаусса. Более эффективно применять метод Гаусса непосредственно. Согласно утверждению 3.6-7 с помощью, например, левосторонних элементарных преобразований невырожденную матрицу А можно привести к единичной. Обозначим через В\, Въ ..., Ду матрицы этих преобразований. Применение метода Гаусса означает, что BSBS _ 1 ... В \Л == Е. Но согласно утверждению 4.4-8 отсюда следует, что Другими словами, обратная матрица есть произведение всех элементарных матриц, участвовавших в преобразовании матрицы А. Если это произведение вычислять справа налево (но не в каком-либо другом порядке!), то переход к следующему частичному произведению будет осуществляться в точности по той же схеме, что и преобразование исходной матрицы, но только по отношению к единичной матрице. 4.4-19.3 Обратимость матриц Nr и Мг Пусть матрица типа Nr (типа Мг) порядка р определяется элементами пг+\уП ..., np,r (tf*r, 1, •••> ™r,r-\)- Она невырожденная, имеет тот же тип, и матрица N~\M~l) определяется элементами — пг+ ^п ...,-пРгг (- тг^ ь ..., - wr>r_ О- Дополнение. Проверяется непосредственно.
158 Часть I. Математические сведения по линейной алгебре 4.4-20.3 Полезные соотношения Для матриц типов Nr и Мг порядков р при к <р выполняются соотношения n;]n;1 ... n;1 =(k + \)E-Nl -N2-...-Nk, м;1м~1 ...м;1 =(к + \)Е-м1 -м2-...-мк. Дополнение. Проверяется непосредственно. 4.4-21.3 Блочные элементарные матрицы Блочные матрицы из утверждения 3.5-26 сохраняют все свойства своих скалярных аналогов, если под а"' понимать обратную матрицу, под - а понимать противоположную матрицу, а под строками и столбцами соответственно группы строк и столбцов. Дополнение. Проверяется непосредственно. 4.4.4. Модификация обратной матрицы 4.4-22.4 Полезное тождество Для любых невырожденных матриц Л, В одного порядка имеет место тождество Дополнение. Проверяем В(А~ ]-В~\В- А)А'х) = ВА~Х- ВВ~ \В - А)А"х = = ВА~Х-(В- А)А~ Х=ВА~Х-ВА-Х+ АА'х = ?, то есть утверждение справедливо согласно 4.4-8. 4.4-23.4 Комментарий (об изменении обратной матрицы) Заметим, что тождество 4.4-22 показывает, как изменяется обратная матрица при изменении самой матрицы. 4.4-24.4 Изменение обратной матрицы Пусть даны невырожденная матрица А порядка п и матрицы U, V размеров n x к. Если матрица Е + VA~x U невырожденная, то (А + UVy х=А~х-А-хи(Е+ VA' xUyxVA~x. Это равенство обычно называется формулой Шермана-Моррисона. Дополнение. Проверяем {А + UV)(A~ X-A~XU(E+ VA~XU)-x VA~x) = = АА'х -АА~XU(E + ГА~хиу ХУА~Х + \JVA~х - UVA~XU(E + VA~xUy ХУА~Х =
4. Определители 159 = Е+ UVA-] - U(E+ VAl ll1 то есть утверждение справедливо согласно 4.4-8. 4.4-25.4 Частный случай При к = 1 утверждение 4.4-24 принимает вид (А * l l Дополнение. Очевидное следствие утверждения 4.4-24. Нужно только учесть, что выражение (Е+ VA~xUyx в формуле утверждения является в данном случае матрицей порядка 1. Поэтому умножение на нее справа матрицы A~lU эквивалентно умножению этой же матрицы А~х U слева на число, совпадающее с элементом указанной матрицы порядка 1. 4.4-2б.4 Сохранение ранга От умножения на невырожденную матрицу ранг матрицы не меняется. Дополнение. С одной стороны, это есть перефразировка второго утверждения из 4.3-16. С другой стороны, данное утверждение теперь можно доказать иначе. Пусть дана матрица А размера n x m и ранга г. Умножим, например, матрицу А справа на невырожденную матрицу М и обозначим С = АМ. Согласно 4.3-16 rank С < min{rank A, rank М). Так как rank А < и, a rank Л/= и, то rank С < rank A. Умножив равенство С = AM справа на М~ \ получим А = С М~х. Матрица М~х снова невырожденная, и мы аналогично устанавливаем, что rank A < rank С. Таким образом, ранг матрицы не меняется от умножения на невырожденную матрицу. 4.4-27.4 r-ранговая модификация матрицы Пусть даны матрицы А, С одинаковых размеров и матрица С имеет ранг г. Матрица А + С называется r-ранговой модификацией матрицы А, 4.4-28.4 г-ранговая модификация А~1 r-ранговая модификация матрицы А приводит к r-ранговой модификации матрицы Л~\ Дополнение. В самом деле, возьмем в утверждении 4.4-24 U=C9 V= E. Изменение матрицы А на матрицу С приводит согласно 4.4-24 к изменению матрицы А~х на матрицу А~ ХС{Е + А~ ХС)~ ХА~1. Но согласно 4.4-26 ранг этой матрицы совпадает с рангом матрицы С, так как матрицы А~х и (Е + А~ ХС)~х невырожденные.
160 Часть I. Математические сведения по линейной алгебре 4.4.5. Вполне положительные и ассоциированные матрицы 4.4-29.4 Вполне неотрицательная матрица Квадратная матрица А называется вполне неотрицательной (вполне положительной)\ если все миноры любых порядков этой матрицы неотрицательны (положительны). 4.4-30.4 Произведение вполне неотрицательных матриц Произведение вполне неотрицательных (вполне положительных) матриц есть матрица вполне неотрицательная (вполне положительная). Дополнение. Пусть А и В вполне неотрицательные (положительные) матрицы, имеющие, соответственно, т столбцов и строк. Рассмотрим произвольный минор матрицы АВ. Принимая во внимание 4.2-13, имеем Если обе матрицы вполне неотрицательные (положительные), то такой же по названию знак будет иметь любой минор под знаком суммы и, следовательно, любой минор матрицы АВ. 4.4-31 ^Ассоциированная матрица Пусть А — квадратная матрица порядка п. Для заданного числар, 1 <р<п, упорядочим все N = Срп сочетаний из п чисел 1,2, ..., п по р чисел к\ < к2 < ... < кр в лексикографическом порядке. Это означает, что сочетание к{ < к2 < ... < кр предшествует сочетанию к[ <?2' <...<к'р, если кх = А,',...,?,_, = ?/_,, но к} <к,\\<1<р. Составим квадратную матрицу Ар с элементами если номер сочетания ix < /2 < ... < ip равен /, а номер сочетания^ <j2 < ... <jp равен/ Полученная матрица Ар называется /?-й ассоциированной с А матрицей. 4.4-32.5 Ассоциированная матрица для единичной Ассоциированная матрица для единичной есть единичная. Дополнение. Проверяется непосредственно. 4.4-33.5 Ассоциированная матрица для диагональной Ассоциированная матрица для диагональной есть диагональная. Дополнение. Проверяется непосредственно.
4. Определители 161 4.4-34.5 Ассоциированная матрица для треугольной Ассоциированная матрица для треугольной есть треугольная того же наименования. Дополнение. Проверяется непосредственно. 4.4-35.5+ Соотношения с ассоциированными матрицами Имеют место соотношения АХ=А, An = d*A9 (АВ)р = АрВр9 (А'% = (Ар)~'. Дополнение. См. [4], стр. 30—31. 4.4.6. Симметричные и кососимметричные матрицы 4.4-36.3 Симметричные и кососимметричные матрицы Квадратная комплексная или вещественная матрица А называется симметричной (кососимметричной), если А- А' (А - — А'). 4.4-37.3 Элементы симметричной матрицы Элементы ау симметричной матрицы А удовлетворяют соотношениям ау = я,, для всех Дополнение. Очевидное следствие определения 4.4-36. 4.4-38.3 Обратная матрица Матрица, обратная к симметричной, является симметричной. Дополнение. Действительно, согласно 4.4-10, 4.4-36 имеем А-1=(А'Т1 = (А-1)'. 4.4-39.3 Элементы кососимметричной матрицы Элементы ау кососимметричной матрицы А удовлетворяют соотношениям ау = - о,, для всех ij. В частности, все диагональные элементы любой кососимметричной матрицы равны нулю. Дополнение. Очевидное следствие определения 4.4-36. 4.4-40.3 Обратная матрица Матрица, обратная к кососимметричной, является кососимметричной. Дополнение. Действительно, согласно 4.4-10,4.4-36 имеем А-1 = (-А'Т1=-(АГ1=-{А-1у. 6 Зак 740
162 Часть I. Математические сведения по линейной алгебре 4.4-41.3 Определитель кососимметричной матрицы Определитель кососимметричной матрицы нечетного порядка равен нулю. Дополнение. Если кососимметричная матрица А имеет порядок /?, то согласно 4.1-12, 4.1-14, 4.4-36 находим, что det А = det(- А') = (- 1)" det А' = (- 1)" det A. Поэтому при нечетном п заключаем, что det A = 0.
5. Расстояния, углы, объемы 5.1. Скалярное произведение 5.1.1. Евклидово и унитарное пространство 5.1-1.3 Комментарий (о введении метрики) Абстрактные линейные пространства, изучавшиеся нами до сих пор, в некотором смысле беднее своими понятиями и свойствами, чем обычные геометрические пространства. Беднее, прежде всего, потому, что в них не нашли отражение такие понятия, как расстояние, угол и объем. Этим понятиям посвящен настоящий раздел. В нем рассматриваются только вещественные и комплексные линейные пространства. 5.1-2.3 Евклидово пространство Вещественное линейное пространство Е называется евклидовым, если каждой паре векторов х9 у из Е поставлено в соответствие вещественное число (х, у), называемое скалярным или внутренним произведением, причем выполнены следующие аксиомы: (х, х) > О при х Ф О, @, 0) = О для произвольных векторов х, у, z из Е и произвольного вещественного числа X. 5.1-З.3 Унитарное пространство Комплексное линейное пространство U называется унитарным, если каждой паре векторов х,у из U поставлено в соответствие комплексное число (х,у), называемое скалярным или внутренним произведением, причем выполнены следующие аксиомы:
164 Часть I. Математические сведения по линейной алгебре (х> У) = (>>> х), (kx, у) = Х(х, у), (х, х) > О при х * О, (О, 0) = О для произвольных векторов x,y,z и произвольного комплексного числа X. Черта в первой аксиоме означает комплексное сопряжение. 5.1-4.3 Комментарий (сравнение пространств) Сравнение аксиом евклидова и унитарного пространства показывает, что они различаются "всего лишь" комплексным сопряжением в первой аксиоме. Однако это небольшое отличие исключительно важно, и его нельзя забывать. Если бы в комплексном пространстве аксиомы скалярного произведения полностью совпадали с аксиомами скалярного произведения вещественного пространства, то такое пространство имело бы совсем другие свойства, чем унитарное. При указанных выше аксиомах большинство фактов евклидова и унитарного пространств оказываются либо одинаковыми, либо очень похожими. Если какие-либо определения или факты в обоих типах пространств совпадают полностью или с точностью до замены комплексных чисел вещественными, мы будем приводить соответствующие формулировки только для унитарных пространств без дополнительной оговорки. В этом случае оба пространства будем называть пространствами со скалярным произведением. Естественно, что любое подпространство евклидова (унитарного) пространства само становится евклидовым (унитарным) пространством, если в нем сохранить скалярное произведение. 5.1.2. Свойства скалярного произведения 5.1-5.3 Некоторые следствия Для любых векторов х, у, z пространства со скалярным произведением U и любого комплексного числа а выполняются равенства (х, у + z) = (дс, у) + (х, z), (х, ay) = а (х, у), (О, х) = (х, 0) = 0. Дополнение. Проверяется непосредственно, принимая во внимание свойства скалярного произведения, описанные в 5.1-3. Имеем: (х, у + z) = (у + z, х) = (у, х) + (z, х) = (х, у) + (х, z) = (х, у) + (х, z), (х, ay) = (ay, x) = a(y, x) = а(х, у) = а(х, у), @, х) = (х -х, х) = (х, х) - (х, х) = 0, (х, 0) = (х, х -х) = (х, х) - (х, х) = 0.
5. Расстояния, углы, объемы 165_ 5.1-б.3 Скалярное произведение и нуль Если (х, у) = 0 для любого вектора^, то х = 0. Дополнение. Возьмем у ~ х. По условию (х, х)= 0. Но согласно 5.1-3 это возможно лишь в случае х = 0. 5.1-7.3 Алгебраические преобразования Со скалярным произведением можно выполнять формальные алгебраические преобразования, т. е. для любых векторов х»ур чисел ah p; и любого числа г, s слагаемых. Дополнение. Очевидно, принимая во внимание 5.1-2, 5.1-3, 5.1-5. 5.1-8.3 Координаты и скалярное произведение Пусть еи ...,еп — базис линейного пространства и для произвольных векторов х,у имеют место разложения Скалярное произведение всегда можно ввести следующим образом: (х.зО^Л!+$2 Л2+- + §1, Ля- Дополнение. Необходимо проверить выполнение всех аксиом, например, из 5.1-3. Принимая во внимание утверждения 2.2-29—22-31, находим, что > У) = JX Л, = Е^'Л, = S^^/ = 0% ^Х 1 = 1 °.если @,0) = 0. Пусть z = jiei + у2е2 + ... + упеп. Тогда ч у. =
166 Часть I. Математические сведения по линейной алгебре 5.1-9.3 Неравенство Коши-Буняковского Для любых векторов х, у справедливо неравенство \(х,у)\2<(х,х)(у,у). Это неравенство иногда называют неравенством Шварца. Дополнение. Согласно 5.1-5 утверждение заведомо справедливо, если у = 0. Поэтому будем считать, что у ф 0. Для примера доказательство проведем для унитарного пространства. Рассмотрим вектор х - Ху, где X — произвольное комплексное число. Имеем (х -Ху,х- Ху) - (х, х) - 2Re(X(y, x)) + \Х\2(у, у). В левой части равенства стоит скалярное произведение равных векторов. Поэтому квадратный трехчлен в правой части неотрицателен при любых X, в частности, при X = (х, у)/(у, у). Таким образом, (у, у) (у, у) (у, у) откуда и вытекает справедливость утверждения. 5.1-10.3 Комментарий (обоснование общих исследований) Мы не будем сейчас обращать внимание на исследование арифметических пространств со скалярным произведением. Наличие естественного базиса в этих пространствах делает соответствующие иллюстрации почти очевидными. Так, если векторы заданы своими координатами, то формула 5.1-8 представляет собой наиболее распространенный способ задания скалярного произведения через координаты векторов, неравенство Коши-Буняковского превращается в известное неравенство для двух последовательностей комплексных чисел и т. д. Однако в арифметическом пространстве скалярное произведение далеко не всегда вводится через естественный базис, и к тому же в форме 5.1-8. Чтобы не потерять в дальнейшем общности, мы будем использовать в наших исследованиях только сформулированные выше аксиоматические свойства скалярного произведения. Естественно, что при этом все утверждения остаются в силе и в том случае, когда скалярное произведение задано в виде 5.1-8. 5.1-11.3 Коллинеарные векторы Неравенство Коши-Буняковского обращается в равенство тогда и только тогда, когда векторы х, у коллийеарны, т. е. либо х = осу, либо у = ах для некоторого числа а.
5, Расстояния, углы, объемы 167 Дополнение. Пусть векторы х, у коллинеарны, например, х = ay. Находим (*, *)(у, у) = (ay, ay)(y, у) = \a\2(y, уJ и достаточность доказана. Пусть теперь для некоторых векторов х,у выполняется равенство \(х, у)\2 = (х, х)(у, >>)• Если у = 0, тоу = 0-хи векторы х, у коллинеарны. Если же у ф О, то легко проверить, что при а = (х9 у)/(у, у) последнее равенство эквивалентно равенству (х-- ay,х — ay) - 0. Согласно 5.1-3 это означает, что х- ay и векторы х, у коллинеарны. Необходимость доказана. 5.1.3. Матричное представление 5.1-12.3 Матричное представление скалярного произведения Пусть для вектор-столбцов арифметического пространства скалярное произведение введено согласно 5.1-8 через координаты в естественном базисе. Тогда для любых векторов х, у справедливо равенство (х9у)=у*х ((х,у)=у'х). Выражение, стоящее в правой части равенства, есть число, равное произведению вектор-строки у* (у') на вектор-столбец х. Дополнение. Проверяется непосредственно. 5.1-13.3 Комментарий (о матричном представлении) Формально произведения у*х и у'х представляют матрицы первого порядка. Однако напомним, что по определению (см. 3.2-5) матрица первого порядка отождествляется с единственным ее элементом. 5.2. Ортогональные и биортогональные системы векторов 5.2.1. Нормированные и ортогональные векторы 5.2-1.3 Нормированный вектор Вектор х называется нормированным, если (jc, х) = 1. 5.2-2.3 Нормированная система векторов Система векторов называется нормированной, если нормированы все ее векторы. 5.2-3.3 Возможность нормировки Любой ненулевой вектор у можно нормировать, если умножить его на число ш
168 Часть I. Математические сведения по линейной алгебре 5.2-4.3 Ортогональные векторы Векторы х, у называются ортогональными, если (х, у) = 0. 5.2-5.3 Ортогональная система векторов Система векторов называется ортогональной, если либо она состоит из одного вектора, либо ее векторы попарно ортогональны. 5.2-6.3 Ортонормированная система векторов Нормированная ортогональная система векторов называется ортонормированной. 5.2-7.3 Линейная независимость Ортогональная система ненулевых векторов всегда линейно независима. Дополнение. Пусть ех, ...,еп— ненулевые попарно ортогональные векторы. Предположим, что они линейно зависимы. Тогда согласно 2.1-10 существуют числа аь ..., а„, не все равные нулю и такие, что Умножив это равенство справа скалярно на вектор eh мы получим, что <*/(?/, ?/) = 0. Но (ех, в\) * 0 по условию. Следовательно, а, = 0, т. е. система векторов в\, ..., еп не может быть линейно зависимой. 5.2-8.3 Ортогональность нулевого вектора Единственный вектор, который ортогонален ко всем векторам пространства, есть нулевой вектор. Дополнение. Это есть перефразировка утверждения 5.1-6. 5.2-9.3 Разложения по ортонормированной системе Если еъ ...,е„— ортонормированная система векторов и для векторов х,у имеют место разложения: х = а.1ех+а2е2+ ...+а„ет то справедливы равенства: а ,- = Дополнение. Проверяется непосредственно. Рассмотрим, например, второе равенство. Имеем V = 1 / = 1 ) I¦ = 1 J = 1 / = 1
5, Расстояния, углы, объемы ^ 169_ 5.2-10.3 Ортогональность к системе векторов Пусть заданы ортонормированная система векторов еь ..., ек и вектору. С точностью до умножения на число существует единственный вектор х9 который принадлежит линейной оболочке векторов еь ...,ек,уи ортогонален векторам еъ ..., ек. Он определяется, например, формулой х =у - О, е{)ех - ... - (у, ек)ек. Дополнение. Вектор х должен принадлежать линейной оболочке векторов еъ ..., ек, у. Следовательно, существуют такие числа а, а ь ..., а ь что х = ay + a\e\ + ... + akek. Умножив это равенство справа скалярно на вектор е, и приняв во внимание ортонормированность векторов еь ..., ет получаем (х, et) = ос(у, е,) + а/ для всех /', 1 < / < к. По условию, вектор х должен быть ортогонален векторам еи ..., ек. Поэтому (х, et) = 0 и а, = -а(у, еЦ. Итак, х = а(у-(у, ех)ех - ...-(>, е*)е*) при произвольном числе а. 5.2-11.3 Независимость при малом возмущении Пусть ei, ..., ек— ортонормированная система векторов. Если для векторов 8^ ...,6^ выполняется неравенство (Si,6,)l/2+...+FfeeA)l/2<l, то система векторов ех + еь ..., ек + zk линейно независима. Дополнение. Предположим, что система векторов ех + sb ..., ек + гк линейно зависима. Тогда согласно 2.1-10 существуют числа ось ..., а*, не все равные нулю и такие, что Щ(е{ + е,) + а2(е2 + б2) + ... + ак(ек + ек) = 0. Пусть ар есть максимальный по модулю коэффициент среди ось ..., ос*. Умножив равенство справа скалярно на вектор ер и принимая во внимание ортонормированность системы векторов еь ...» еь находим, что к Далее, используя 5.1-9, имеем к Полученное противоречие говорит о том, что система векторов ei + Бь ..., е * + линейно независима.
170 Часть I. Математические сведения по линейной алгебре 5.2-12.3 Комментарий (устойчивость ортонормированных систем) Из утверждения 5.2-11 вытекает, что при малых изменениях или, как их называют иначе, возмущениях ортонормированных систем сохраняется линейная независимость. В других системах это свойство уже не проявляется в столь четком виде. В общем случае для гарантии линейной независимости возмущенной системы величина возмущений должна быть согласована с мерой линейной независимости исходной системы. Об этом убедительно говорит пример из комментария 4.1-26. Устойчивость линейной независимости ортонормированных систем к малым возмущениям определила их широкое использование в практических вычислениях. 5.2.2. Ортонормированный базис 5.2-13.3 Ортонормированный базис Базис, векторы которого образуют ортонормированную систему, называется орто- нормированным. Если еь •••> &п ортонормированный базис, то 5.2-14.3 Существование ортонормированного базиса В любом конечномерном пространстве со скалярным произведением существует ортонормированный базис. Дополнение. В любом конечномерном пространстве существует базис. Пусть jcb ...,хп— один из них. Построим из него ортонормированный базис еь ...,е„, обладающий тем свойством, что для всех к, 1 <к<п, линейные оболочки векторов Х\, ..., хк и еи ...,ек совпадают. Вектор хх ф О и согласно 5.2-3 его можно нормировать. Положим ех равным этому нормированному вектору. Очевидно, что линейные оболочки векторов хх и в\ совпадают. Пусть уже построена ортонормирован- ная система векторов еи ..., ек, линейная оболочка которых совпадает с линейной оболочкой векторов хи ...,** для некоторого к>\. Обратимся теперь к утверждению 5.2-10. Возьмем у = хк+ \ и построим вектор х. Он не равен нулю, т. к. в противном случае вектор хк+ х принадлежал бы линейной оболочке векторов еи ...,ек или, что то же самое, линейной оболочке векторов д:ь ...,**. Но это невозможно в силу линейной независимости векторов *,,...,**>**+i- Поэтому положим ек+\ равным вектору, полученному после нормировки вектора х. По построению система векторов еь ..., ек, ек+ i ортонормированная и линейная оболочка этих векторов совпадает с линейной оболочкой векторов лгь ...,xk,xk+ h Справедливость утверждения установлена.
5. Расстояния, углы, объемы 171 5.2-15.3 Дополнение до ортонормированного базиса Любую ортонормированную систему векторов можно дополнить до ортонормированного базиса. Дополнение. Согласно 5.2-7 любая ортонормированная система еь ..., ^линейно независима. Ее можно дополнить векторами xk+h ...,х„ до базиса в соответствии с утверждением 2.2-25. Проведя ортогонализацию системы векторов еь ...,еь хк + ь •••> *п так> как это сделано в дополнении к 5.2-14, мы получим ортонормиро- ванный базис. Первые к векторов в нем совпадают с еи ..., ек. 5.2-1 б.3 Критерии ортонормированности базиса Если для какого-либо базиса одно из равенств 5.2-9 выполняется для всех векторов, то этот базис по отношению к данному скалярному произведению является ортонор- мированным. Дополнение. Пусть в унитарном пространстве выбран базис еь ..., еп. Предположим, что для любого вектора х пространства и его разложения x = aiei+a2e2+ ...+а„е„ по векторам базиса справедливы первые равенства, т. е. а, = (х, е,) для всех /. Возьмем в качестве векторах базисный вектор еь\ <к<п. Согласно выбору вектора х мы имеем ос* = 1, ос, = 0, если / * к. Но по условию а, = (ек, е,), что и означает ортонормированность системы еи ..., еп. Пусть для другого вектора у имеет место разложение и для любой пары векторов х, у справедливо второе равенство, т. е. (x,y) = al$l +сс2р2+... + а„C„. Взяв х = еь у = eh мы сразу получаем, что (ек, е,) = 1, если i = k9 и (еь е,) = 0, если \Фк, Снова систему еь ..., еп оказалась ортонормированной. Предположим далее, что для любого вектора х справедливо третье равенство, т. е. (х,х) = |а,|2 + |а2|2 + ... + |ал|2. Взяв х = ек, получаем (ек, ек) = 1 для всех к. Для х = ек + ер и х = ек + iep при к Фр находим, что (ек + ер, ек + ер) = (еь ек) + (еь ер) + (еру ек) + (ер, ер\ (ек + iep, ек + iep) = (еь ек) - i(eb ep) + i(ep, ek) + (ер, ер). По условию левые части равенств равны 2, т. к. векторы ек, ер и ек, iep в разложении по векторам базиса имеют две координаты, равные 1 по модулю, и остальные их координаты равны 0. Кроме этого, (ек, ек) = (ер9 ер) = 1. Поэтому Оь ер) + (вр, ек) = 0, (еь ер) - (ер, ек) = 0.
172 Часть I. Математические сведения по линейной алгебре Отсюда заключаем, что (eic,ep) = 0 при кфр. И в этом случае система векторов еи ..., е„ ортонормированная. 5.2.3. Биортонормированные системы и базисы 5.2-17.4 Биортонормированные системы векторов Две системы векторов хх, ...,хг и уь ...,уг называются биортонормированными или двойственными, если 5.2-18.4 Независимость биортонормированной системы Каждая из биортонормированных систем линейно независима. Дополнение. Исследуем, например, систему х\, ..., jc*. Рассмотрим уравнение + а2Х2 + ... + ocpfjt = О и умножим его справа скалярно на вектору, 1 <р < к. В силу биортонормирован- ности систем х\, ...,хк и уи ...,ук получаем, что ^ = 0. Итак, система векторов х\, ...,хь линейно независима согласно 2.1-10. 5.2-19.4 Единственность биортонормированного базиса Для любого базиса биортонормированный базис единствен. Дополнение. Пусть базисы хь ...,*„ и уи ...9у„ биортонормированные. Предположим, что наряду с базисом хь ...,*„ существует базис zb ...,zw также биортонормированный с базисомуи ...,у„. Возьмем произвольный вектору и представим его в виде разложения у = (Х]у] +... +а^у„. Принимая во внимание условие биортонормированности, имеем для любогор, 1 <р<п, п п (хр - zp, у) = (хр - zp, Xa.^) = Ха'(^ " V Л) = °- 1 = 1 / = I Согласно 5.1-6 это означает, что хр = zp. 5.2.4. Изоморфизм пространств со скалярным произведением 5.2-20.3 Изоморфизм евклидовых и унитарных пространств Евклидовы (унитарные) пространства К и К' называются евклидово (унитарно) изоморфными, если они изоморфны как вещественные (комплексные) линейные пространства и, кроме того, для любой пары векторов jc, у из К и соответствующих векторов х\ у из К9 выполняется равенство (*, у) = (х\ у').
5. Расстояния, углы, объемы 173 5.2-21.3 Изоморфизм и равенство размерностей Для того чтобы два евклидовых (унитарных) пространства были евклидово (унитарно) изоморфны, необходимо и достаточно, чтобы были равны их размерности. Дополнение. Рассмотрим для примера унитарно изоморфные пространства X, Y. Так как при этом они просто изоморфны, то согласно 1.7-14 линейно независимым системам векторов пространства X соответствуют линейно независимые системы векторов пространства Y и наоборот. Следовательно, размерности пространств X, Y совпадают. Пусть теперь даны два унитарных пространства X, Y размерности п. Согласно 5.2-14, в пространствеXсуществует ортонормированный базис х\, ...,*„, в пространстве Y— ортонормированный базис уh ...,уп. Каждый вектор х е X и у е Y однозначно в соответствии с 2.2-28 может быть представлен своим разложением X = CLXX\ + <*2*2 + ... + СС„Х„, у = pi^l + Каждому вектору jc = cci;ci +... + <х^сп поставим в соответствие вектор У = otiyi + ... + а„у„, а каждому вектору у = p^i + ... + Р^„ — вектор х = PiXj + ... + + сс„х„. Это соответствие взаимно однозначное и согласно утверждениям 1.7-13, 2.2-30, 2.2-31 оно есть изоморфизм. Так как соответствующие векторы имеют одинаковые координаты в своих ортонормированных базисах, то согласно вторым равенствам из 5.2-9 это соответствие есть унитарный изоморфизм. 5.2-22.3 Изоморфизм и базисы Пусть даны два евклидовых (унитарных) пространства одной размерности. Выберем в каждом пространстве по какому-нибудь ортонормированному базису и установим соответствие между теми векторами, которые имеют одинаковые координаты соответственно в своих базисах. Это соответствие есть евклидов (унитарный) изоморфизм. Дополнение. Доказательство приведено в дополнении к 5.2-21. 5.2-23.3 Комментарий (обсуждение изоморфизма) Установление изоморфизма между двумя пространствами со скалярным произведением позволяет в теоретическом плане ограничиться исследованием арифметических пространств со скалярным произведением 5.1-8 по отношению к естественному базису. В реальных ситуациях не всегда можно указать ортонормированный базис, позволяющий установить изоморфное соответствие арифметическому пространству. Именно этим, в основном, и объясняется наше стремление сохранить большую общность. Кроме того, не всегда за определенными фактами в арифметических пространствах легко увидеть существенные моменты.
174 Часть I. Математические сведения по линейной алгебре 5.2.5. Ортогональность и сопряженные матрицы 5.2-24.4 Матричное описание свойств Пусть в арифметическом пространстве со скалярным произведением вида 5.1-8 в естественном базисе выбраны любые биортонормированные базисы хь ...,хп и У\, ...,>>„. Составим матрицы Xи Y, столбцами которых являются соответственно векторы хь ..., х„ иyl9 ...9у„. Имеют место соотношения Дополнение. Проверяется непосредственно. 5.2-25.3 Скалярное произведение и сопряженные матрицы Пусть в арифметических пространствах скалярные произведения введены согласно 5.1-8 по отношению к естественным базисам. Для любой прямоугольной матрицы А и любых векторов х, у соответствующих размеров всегда выполняются равенства: (Ах, у) = (х, А*у), (А*Ах, у) = (Ах, Ау\ ,у) = (А*х,А*у). Дополнение. Проверяется непосредственно. 5.2-26.3 Комментарий (указание на связь с операторами) Рассматривая эти равенства с точки зрения формальных определений, трудно увидеть в них что-нибудь большее, чем то, что написано. В действительности они отражают очень глубокие свойства операторов в пространствах со скалярным произведением. Заметим, что мы ввели сопряженную матрицу без какой-либо связи с базисом и скалярным произведением. Затем выяснилось, что для скалярного произведения вида 5.1-8 в естественном базисе выполняются соотношения 5.2-25. Тем не менее это не случайно. Допустим, что в абстрактных конечномерных пространствах со скалярным произведением задан произвольный линейный оператор А. Оказывается, что всегда существует еще один линейный оператор, называемый сопряженным и обозначаемый А*, для которого также выполняются соотношения 5.1-25. Строится он довольно просто. Выберем в пространствах любые ортонормированные базисы. Они однозначно определяют матрицу оператора А. Матрица сопряженного оператора в тех же базисах и будет хорошо известная матрица А*. Если мы хотим перейти от операторных соотношений к аналогичным соотношениям, содержащим матрицы операторов в выбранных базисах, то должны согласно утверждению 5.2-9 задать в арифметических пространствах скалярные произведения вида 5.1-8 в естественных базисах.
5. Расстояния, углы, объемы 175 5.3. Ортогональность на множествах 5.3.1. Ортогональное дополнение 5.3-1.3 Ортогональные множества Два множества векторов называются ортогональными, если каждый вектор одного множества ортогонален каждому вектору другого множества. Ортогональность множеств F и G обозначается F1G. 5.3-2.3 Ортогональность вектора к подпространству Для того чтобы вектор х был ортогонален к подпространству L, необходимо и достаточно, чтобы он был ортогонален ко всем векторам какого-либо базиса подпространства L. Дополнение. Пусть х$, ...9хр— базис подпространства L и вектору ортогонален к каждому из векторов хь ..., хр, т. е. (х„у) = О для всех /. Для любого х е L справедливо представление х = аххх + а2х2 + ... + OLpXp при каких-то числах аь ...,ар. Умножая это равенство справа скалярно на вектор >>, получаем, что (х9у) = (ai*i + ... + (ХрХру) = а.\(хиу) + ... + ар(хр,у) = 0. Если вектор у ортогонален ко всем векторам подпространства, то он ортогонален, в том числе, и ко всем векторам базиса хь ..., хр. 5.3-3.4 Ортогональность подпространств Для того чтобы два подпространства были ортогональны, необходимо и достаточно, чтобы каждый вектор какого-либо базиса одного подпространства был ортогонален ко всем векторам какого-либо базиса другого подпространства. Дополнение. Пусть даны два подпространства L и М Выберем в них какие-либо базисы хь ...,хр иуи ...,ys соответственно. Если L и Мортогональны, то по определению 5.3-1 (xhyj) - 0 для всех ij. Предположим теперь, что (xhyj) = 0 для всех ij. Возьмем любые векторы х е L,z e M и представим их в виде разложений по своим базисам: х = otjx, + а2х2 + ... + (ХрХр, z = p Тогда с учетом предположения получаем, что (х, z) = / = 1 J = I / = 1 j'
176 Часть I. Математические сведения по линейной алгебре 5.3-4.4 Ортогональное дополнение Совокупность всех векторов, ортогональных множеству F, называется ортогональным дополнением множества F и обозначается F1. 5.3-5.4 Ортогональное дополнение и подпространство Ортогональное дополнение любого множества есть подпространство. Дополнение. Возьмем любые два вектора и, v e F1. Это означает, что для любого вектора х е F выполняются равенства (и, х) = (v, x) = 0. Рассмотрим теперь любую линейную комбинацию аи + Pv. Имеем (aw + pv, x) = a(w, x) + p(v, x) = 0. Согласно 1.7-11 множество F1 есть подпространство. 5.3-6.4 Некоторые соотношения Для любого подпространства L пространства К со скалярным произведением справедливы соотношения ' dim L + dim LL = dim К, (L1I = L, К1 = 0, О1 = К. Дополнение. Пусть L есть подпространство пространства К. Выберем в соответствии с 5.2-14 в L ортонормированный базис еи ..., ер. Ясно, что dim/,=/?. Если dim К- п, то согласно 5.2-15 ортонормированную систему еь ...,ер можно дополнить до ортонормированного базиса еи ..., ер, ер+\, ...,е„ пространства К. Очевидно, что ер+ 1, ..., еп е LL, еи ..., ер, <? L1. В подпространстве L1 не может быть ни одного вектора, линейно независимого с векторами ер+,, ..., еп. В противном случае этот вектор совместно с векторами еи ..., еп образовывали бы в пространстве К размерности п линейно независимую систему из п + 1 векторов, что невозможно. Поэтому векторы ер+ ь ..., еп образуют в LL ортонормированный базис. Следовательно, dim /Л = п-р и dim L + dim LL = dim К. Из построения ясно, что векторы ей --.,ер образуют ортонормированный базис подпространства (I1)- Это означает, что (L1I = L. Равенства К1 = 0 и 0х = К очевидны. 5.3-7.4 Ортогональность, ранг, размерность Для того чтобы ранг какой-либо системы йекторов равнялся размерности пространства, необходимо и достаточно, чтобы единственным вектором пространства, ортогональным всем векторам системы, был нулевой вектор. Дополнение. Пусть ранг системы векторов равняется размерности пространства. Тогда из этой системы можно выбрать базис пространства. Если какой-либо вектор jc ортогонален ко всем векторам системы, то он ортогонален и ко всем векторам базиса. Согласно 5.3-2 это означает, что вектор jc ортогонален ко всем векторам пространства. Но из 5.1-6 вытекает, что х = 0. Пусть теперь единственный
5. Расстояния, углы, объемы , 177 вектор пространства, который ортогонален ко всем векторам системы, есть нулевой вектор. Обозначим через L линейную оболочку системы векторов. Все векторы, которые ортогональны системе, принадлежат /Л По условию подпространству L1 принадлежит только нулевой вектор, т. е. dimZx = 0. Из 5.3-6 следует, что dim L = dim К или, другими словами, ранг системы векторов совпадает с размерностью пространства. 5.3.2. Снова биортонормированные системы и базисы 5.3-8.4 Биортонормированные базисы и ортогональное дополнение Пусть еи...,е„ и /ь ...,/,— пара биортонормированных базисов. Для любого к, 1 < к < п, ортогональное дополнение к линейной оболочке векторов е\,..., ек совпадает с линейной оболочкой векторов^+ ь .• .,/*• Дополнение. Обозначим через L линейную оболочку векторов е,, ..., ек. Согласно 5.3-5 множество L1 есть подпространство и dim!1 согласно 5.3-6 равна п-к. По условию биортонормированности каждый из векторов fk+b ...,/„ ортогонален каждому из векторов еъ ..., ек. Согласно 5.3-2 отсюда следует, что каждый из векторов^ ь ...,/, ортогонален каждому вектору из L или, в соответствии с определением 5.3-4, принадлежит L1. Но векторы^+ ь ...,fn линейно независимы согласно 5.3-7 и их число равно п - к. Поэтому они представляют базис L1, а само подпространство L1 есть их линейная оболочка. 5.3-9.4 Существование биортонормированного базиса Для любого базиса в пространстве со скалярным произведением существует биорто- нормированный базис. Дополнение. Пусть в пространстве К размерности п со скалярным произведением выбран базис хь ...,*«• Обозначим через Ьк линейную оболочку векторов Х\9..., хк, 1 < к < п. Ясно, что 0 = Lq с L\ d L2 с:... с ?„_ х с Ln - К и dim Lk = к. Ясно также, что и dim LLn_k =к. Для всех р, 1 </?</?, выберем в подпространстве L1p_x вектор zp ? l? . Согласно 2.1-23 система векторов zb ..., zn линейно независима и, следовательно, представляет базис в А'. В силу выбора каждый из векторов zp, ...,zn уже ортогонален каждому из векторов xh...,xp.\. Теперь из последовательности z\9...9zn построим другую последовательность у\,...,у„, в которой для всех
178 Часть I. Математические сведения по линейной алгебре /?, 1 <р<п, вектору есть какая-то линейная комбинация векторов zp9 ..., zn. Условие ортогональности вектора^ каждому из векторов л;ь ...,хр-\ сохраняется. Однако за счет выбора линейных комбинаций можно удовлетворить оставшиеся условия биортонормированности. Вектор zn не может быть ортогональным вектору хп. В противном случае он будет ортогонален всем векторам базиса хь ...,*„, и, следовательно, согласно 5.1-6, 5.3-2 должен быть нулевым. Возьмем у„ в виде у„ = а„гп и подберем число ап таким, чтобы выполнялось равенство (у„, х„) = 1. Теперь предположим, что для некоторого р < п уже найдены в виде указанных выше линейных комбинаций векторы ур, ...,у„, для которых выполняются все необходимые условия биортонормированности с системой векторов ;сь ..., хт т. е. есл иу = р, р + 1,...,«, / = 1, 2, ..., я. Рассмотрим вектор УР-1=2р-х-(*Р-1>хр)ур-...-Bр_19хя)уя. Напомним, что вектор zp_x по построению ортогонален векторам х\, ...,хр.2> Поэтому легко проверить, что вектор ур_, ортогонален векторам хь ...,хр_2, хр, ..., хп. Он не может быть ортогональным вектору хр.\. В противном случае он должен быть нулевым. Это означало бы, что вектор zp_, линейно выражается через векторы zb ..., zm т. е. система векторов zb ..., zn линейно зависима, что невозможно. Возьмем ур.\ в виде ар_]ур_1 и подберем число ар_\ таким, чтобы выполнялось равенство (ур_ ь хр„ \) = 1. Продолжая данный процесс до р = 1, мы построим базис уь .--,Уп, который будет биортонормированным по отношению к базисухи ...,*„. 5.3.3. Сумма, прямая сумма и пересечение подпространств 5.3-10.4 Сумма множеств векторов Множество К векторов некоторого линейного пространства называется суммой множеств LUL2, ...,Lm этого пространства и обозначается К = Lx + L2 + ... + Lm, если оно состоит из всех векторов вида jc = jcj + x2 + ... + хт, где xt e Lj для всех /. 5.3-11.4 Сумма подпространств Сумма подпространств есть подпространство. Дополнение. Пусть К = Lx + ... +Z,W, где L,, ...,IW— подпространства. Возьмем любые векторы х,у е К. Это означает, что
5, Расстояния, углы, объемы 179 где xhyt e Li для / = 1, ..., /и. Рассмотрим вектор ох + $у для произвольных чисел а, C. Имеем осе + $у = (ах! + р^) + ... + (ouw + Pj/J. Так как ах/ + р^ g I, для / = 1, ..., ту то ах + $у е ?. Согласно 1.7-11 множество /С есть подпространство. 5.3-12.4 Прямая сумма Говорят, что линейное пространство К есть прямая сумма своих подпространств Lh Ьъ ..., Lm, и обозначают если любой вектор хе^ единственным образом представляется в виде суммы х = *i + jc2 + ... + хт где jc/G Z, для всех /'. Если т = 2,то вектор х\ (х2) называется проекцией вектора х на подпространство L{ (L2) вдоль подпространства L2 (Li). 5.3-13.4 Комментарий (пояснение к прямой сумме) Утверждение 5.3-11 позволяет просто говорить о прямой сумме подпространств, не привязывая ее ко всему пространству. При этом роль пространства К играет то его подпространство, которое совпадает с суммой рассматриваемых подпространств. 5.3-14.4 Пространство как прямая сумма подпространств Для того чтобы пространство К было прямой суммой своих подпространств, необходимо и достаточно, чтобы объединение базисов этих подпространств составляло базис всего пространства. Дополнение. Пусть в пространстве К заданы подпространства Lh...,Lm и К= L\ + ... + Lm. Возьмем любой вектор х е К. Он единственным образом представим в виде суммы х = х\ + ... + хт, где jc, e Lt для /= 1, ..., т. В свою очередь, каждый из векторов xt единственным образом раскладывается по базису Lh Следовательно, каждый вектор из К единственным образом раскладывается по векторам объединения базисов из подпространств Lh ...,Lm. Согласно 2.1-18 объединение базисов представляет линейно независимую систему. А так как оно порождает все пространство Ку то согласно определению 2.2-21 это есть базис К. Пусть теперь объединение базисов из подпространств Lu ...,Lm есть базис К. Тогда любой вектор х е К единственным образом раскладывается по векторам базиса и, следовательно, единственным образом раскладывается в сумму х = хх + ... + хт, где xt e L, ддя /= 1, ...,т. Это означает, что пространство К есть прямая сумма подпространств Ьъ ...,Lm. 5.3-15.4 Критерий разложимости пространства Пусть сумма подпространств совпадает с пространством. Для того чтобы пространство было прямой суммой подпространств, необходимо и достаточно, чтобы нулевой
180 Часть I. Математические сведения по линейной алгебре вектор пространства был единственным образом разложим по векторам, составленным из объединения базисов всех подпространств. Дополнение. Пусть даны подпространства Lu ...,Z,OT. Рассмотрим сумму К этих подпространств. Чтобы К было прямой суммой, согласно 5.3-14 необходимо и достаточно, чтобы объединение базисов из Lx, ..., Z,m представляло базис К. Но это объединение порождает К. И чтобы оно было базисом К, необходима согласно 2.2-21 линейная независимость его векторов. Согласно 2.1-18, 2.1-19 для линейной независимости объединения векторов базисов из Lu ...,Lm необходимо и достаточно, чтобы любой, например нулевой, вектор единственным образом был разложим по векторам объединения. 5.3-1 б.4 Пересечение множеств векторов Множество F некоторого линейного пространства называется пересечением множеств Lu L2 этого пространства и обозначается F- Lxn Ьъ если оно состоит из векторов, одновременно принадлежащих как LXi так и L2. 5.3-17.4 Пересечение подпространств Пересечение подпространств есть подпространство. Дополнение. Пусть даны подпространства LX,L2 и их пересечение F = LxnL2. Возьмем любые два вектора х,у € F. По определению 5.3-16 х,у е Lx и х,у е L2. Так как Lx и L2 подпространства, то для любых чисел а, р имеем осе + (Зу е Lx и сие + Ру е L2. По определению 5.3-16 отсюда следует, что cut + Ру е F. Согласно 1.7-11 множество F есть подпространство. 5.3-18.4 Соотношения между размерностями Для любых подпространств Lb L2 имеет место равенство n L2) + dim(Li + L2) = dim Lx + dim L2. Дополнение. Согласно 2.2-23 размерность подпространства есть число векторов его базиса. Пусть хь ..., хг— базис в L\ n L2. Согласно 2.2-25 дополним его векторами уг+и • • •>Уп ДО базиса в Lx и векторами zr + ь ..., zm до базиса в L2. Рассмотрим систему векторов х,, ...,*Луг+ь ...,>>mzr+i, ...,zw. Векторы хх, ...,хп Уг+и '-->Уп линейно независимы и принадлежат L^ по построению. Также по построению векторы zr+ 1, ..., zw линейно независимы и не принадлежат Lx. Поэтому согласно 2.1-23 вся система векторов линейно независима. Очевидно, что эта система порождает Lx + L2. Следовательно, она представляет базис Lx+ L2. Теперь находим, что dim(Li n L2) + d\m(Lx + L2) = г + (п + (m - г)) = п + /я, dim Lx + dim L2 = n + m.
5. Расстояния, углы, объемы 181_ 5.3-19.4 Размерность суммы подпространств Размерность суммы любого числа подпространств не меньше, чем максимальная из размерностей этих подпространств. Дополнение. Это есть очевидное следствие доказательства, приведенного в дополнении к 5.3-18. 5.3-20.4 Критерий прямой суммы подпространств Для того чтобы сумма подпространств была прямой, необходимо и достаточно, чтобы пересечение каждого из подпространств с суммой остальных содержало лишь нулевой вектор. Дополнение. Пусть сумма подпространств является прямой. Согласно 5.3-14 объединение базисов подпространств есть базис суммы подпространств. Поэтому согласно 5.3-18 размерность пересечения любого подпространства с суммой остальных подпространств равна нулю. Это означает, что в таком пересечении содержится только нулевой вектор. Пусть теперь в пересечении любого подпространства с суммой остальных содержится только нулевой вектор. Согласно 5.3-18 отсюда следует, что сумма размерностей подпространств совпадает с размерностью суммы подпространств. Но базисы всех подпространств содержатся в сумме подпространств, число векторов объединения базисов совпадает с размерностью суммы подпространств и сами векторы объединения базисов порождают эту сумму. Следовательно, объединение базисов подпространств является базисом суммы подпространств. Согласно 5.3-14 сумма подпространств будет прямой. 5.3.4. Ортогональная сумма подпространств 5.3-21.4 Ортогональная сумма подпространств Сумма К подпространств Lu L2, ... ,Lm называется ортогональной и обозначается Л ~ Lj\ vt/ L*2 vl/ ... viz Ьт, если подпространства попарно ортогональны. 5.3-22.4 Ортогональная и прямая сумма Ортогональная сумма ненулевых подпространств всегда является прямой суммой. Дополнение. Пусть сумма К подпространств Lh ...,Lm является ортогональной. Предположим, что для некоторого вектора х е К существуют два разложения где xh yi e Lt для всех /, 1 < / < т. Отсюда следует, что О = (*i-,yi)+».+(*«-Л,)
182 Часть I. Математические сведения по линейной алгебре и fa —yi) g Lj для всех /. Так как К является ортогональной суммой, то любой вектор из Li ортогонален любому вектору из Ljy если / *j. Умножив последнее равенство справа скалярно на xt-yh мы получим, что (Xj-yhXj-y,) = Q для всех /, 1 <i<m. Согласно аксиомам скалярного произведения, отсюда следует, что Xi=yi и оба разложения вектора х совпадают, т. е. ортогональная сумма подпространств является прямой. 5.3-23.4 Разложение пространств со скалярным произведением Пространство со скалярным произведением есть ортогональная сумма любого своего линейного подпространства и его ортогонального дополнения. Дополнение. Возьмем в пространстве К размерности п любое подпространство L размерности р. Обозначим через еи ...,ер базис в L. Согласно 5.3-6 размерность ортогонального дополнения L1 равна п-р. Пусть ер+ ь ..., еп есть базис L1. Векторы ер+\,...,е„ не принадлежат L. Поэтому согласно 2.1-23 система векторов еи ...,е„ линейно независима и, следовательно, является базисом К. Как вытекает из 5.3-14, пространство К является прямой суммой своих подпространств L и L1. Так как L и L1 ортогональны по определению, то К = L © L1. 5.3-24.4 Критерий ортогональности суммы Пусть К = L\ + ... 4- Lm и для векторов х,у имеют место разложения х = х\ + ... + хт,у =у\ + ... +ут. Для того чтобы сумма К была ортогональной, необходимо и достаточно, чтобы для всех х,у выполнялось равенство (*, у) = (*i, уХ) + ... + (Х„9 ут). Дополнение. Пусть K = LX + ... + Lm и для векторов х = х\ + ... + хт, у=У\ + ... +ут выполняется равенство (х,у) = (х\,у\) + ... + (хт,у,„). Для любого jceL/ и у & Lj их разложения таковы: x = xhy=yh Если /*у, то по условию (х,у) = 0. Поэтому подпространства Lu...,Lm попарно ортогональны, т.е. К = L\® ... © Lm. Пусть теперь К = L\@ ... © Lm. Рассмотрим разложения х = х\ + ... + хт,у = ух + ... + ут, где xhyf e L, для всех /, 1 <i<m. Условие ортогональности подпространств означает, что (xhyj) = 0 при / Ф]. Но тогда (х,у) = (хх + ...+хт,ух + ...+ym) = (xuyl)+ ...+(хт9ут). 5.3-25.4 Некоторые соотношения Для любых двух подпространств L, М пространства К со скалярным произведением справедливы соотношения (L + M)L - L1 n М1, (L n МI = L1 + М1, если L с М, то М1 с L1. Дополнение. Рассмотрим любые два подпространства L, М. Если z e (L + А/I, то по определениям 5.3-4, 5.3-10 это означает, что z ортогонален всем векторам вида
5. Расстояния, углы, объемы 183 х+у, где х е L,y е М.В том числе z ортогонален всем векторам х е L и всем векторам у е М, т. е. z e L1 n М\ Предположим теперь, что z e L1 п М1. Это означает, что z е LL и z е М1, т. е. z ортогонален всем векторам х е L и всем векторам у е М. Следовательно, z ортогонален всем векторам вида х + у, где х е L,y e M, т. е. z e (Z + Л/)х. Поэтому (Z, + МI = L1 n Л/1. Беря ортогональное дополнение от левой и правой частей равенства, мы получим в соответствии с 5.3-6, что L + М= {LL n А/1I. Это равенство справедливо для любых подпространств Lu M. В том числе оно будет справедливо, если вместо L мы поставим /Л, а вместо М поставим Л/1. Но тогда будем иметь L1 + М1 = ((Z,1I n (M1)-1I = (Zn M). Наконец, пусть выполняется вложение L е М. Из условия, что вектор u e M1, вытекает, что и ортогонален всем векторам из М и, тем более, всем векторам из L. Поэтому он обязан также принадлежать L1. Следовательно, выполняется вложение 5.4. Измерения в линейном пространстве 5.4.1. Длина и расстояние 5.4-1.3 Длина вектора Длиной \х\ вектора х называется величина + (х, х)т. 5.4-2.3 Однородность длины Для любого векторах и числа X выполняется равенство \Хх\ = |А,||х|. Дополнение. Согласно аксиомам 5.1-2, 5.1-3 и определению 5.4-1 имеем \Ц = |(Хх, W/2| = |(п(х, х)I/2| = \(\Ц2 \х\2Г\ = |^| • |х|. 5.4-3.3 Длина и ортогональность Если векторы хи ..., xs попарно ортогональны, то |*i + ... + xs\2 = |xj|2 + ... + |ху|2. Дополнение. Согласно аксиомам 5.1-2, 5.1-3 и определению 5.4-1 имеем 5.4-4.3 Неравенство треугольника Для произвольных векторов х, у имеют место соотношения Цх| - \у\\ < |х ~у\ < \х\ + \у\. Дополнение. Принимая во внимание 5.1-9, находим, что
184 Часть I. Математические сведения по линейной алгебре \х - у\2 = (х - у, х - у) = (х, х) - (х, у) - О, х) + О, у) > откуда и вытекает справедливость утверждения. 5.4-5.3 Тождество параллелограмма Для любых векторов jc, у имеет место тождество параллелограмма Дополнение. Действительно, Iх ~У\2 + I* +У\2 = (х~У, х -у) + (х +у, х +у) = (х, х) - (х,у) - (у, х) + (у, у) + + (х, х) + (х, д/) + О, х) + (у, Я = 2(|х|2 + М2). 5.4-6.3 Расстояние между векторами Расстоянием р(х, у) между векторами х, у называется величина \х ~у\. 5.4-7.3 Свойства расстояния Расстояние между векторами удовлетворяет следующим свойствам: ^ р(х,у) = 0, еслих=.у; р(х, у) < р(х, z) + p(z, у) (неравенство треугольника). Дополнение. Первые два свойства очевидным образом являются следствием определений 5.1-2, 5.1-3, 5.4-1. Третье свойство является следствием 5.4-4 p(x,y) = \x-y\ = \(x-z)-(-z+y)\<\x-z\ + \y-z\ = = \х - z\ + \z -y\ = р(х, z) + р(г,;;). 5.4-8.3 Расстояние между множествами векторов Расстоянием р(А, В) между множествами А, В векторов одного и того же пространства называется величина р(А, В) = inf р(х,у), х € А, у е В. 5.4.2. Угол 5.4-9.3 Угол между векторами Углом {х,у} между ненулевыми векторами х,у евклидова пространства называется угол, определяемый соотношениями cos{x,y} = ^f?, 0<{х,у}<п. им
5. Расстояния, углы, объемы 755 Если среди векторов х, у есть хотя бы один нулевой, то угол между такими векторами считается не определенным. В унитарном пространстве понятия угла между векторами обычно не вводится. 5.4-10.3 Угол между коллинеарными векторами Угол между ненулевыми векторами равен 0 или п тогда и только тогда, когда векторы коллинеарны. Дополнение. Если ненулевые векторы х, у коллинеарны, то х = ay для некоторого числа а. Но тогда cos{x, у}\ = т—гут = ' = 1, \ay\-\y\ \a\-\y\2 т. е. угол равен либо 0, либо п. Если же для ненулевых векторов х9 у угол между ними равен либо 0, либо я, то |cos{x, у}\ = 1 или \(х9 у)\ = |х| • \у\. Согласно 5.1-11 это означает коллинеарность векторов х, у. 5.4-11,3 Тождество для косинусов Пусть е\>...,е„— ортонормированный базис евклидова пространства, jc— произвольный вектор. Всегда выполняется равенство cos2{x, ех) + cos2{jc, е2} + ... + cos2{x, еп} = 1. Дополнение. Согласно 5.2-9 вектор х может быть представлен в виде х = (*,е1)е1 + ...+(х,ел)ея и опять же согласно 5.2-9 и определению 5.4-1 выполняются равенства (*,х) = (х,е1J+...Ч*>е*)Ч*|2. Теперь, вспоминая, что |е,| = 1 для всех /, 1 < / < п, получаем, что И И 5.4-12.3 Угол между вектором и подпространством Углом {х, L} между ненулевыми вектором х и подпространством L евклидова пространства называется наименьший из углов, которые х образует с векторами из L. 5.4-13.4 Еще одно тождество для косинусов Если евклидово пространство разложено в ортогональную сумму подпространств /,!,...,!,, ТО cos2{jc, Li} + cos2{x, L2} + ... + cos2{;c, Lp) = 1.
186 Часть I. Математические сведения по линейной алгебре Дополнение. Пусть евклидово пространство К разложено в ортогональную сумму подпространств Lu ..., Lp и д: е К. Определим сначала, чему равняется cos2{x, L} между вектором х и любым подпространством L из К. Возьмем в К ортонормиро- ванный базис еъ ..., ер, ep+h ..., еп, где векторы еи...9ер принадлежат L, а ?р+ь • ••, еп принадлежат /Л Это возможно согласно 5.3-23. Для любого вектора х е /С согласно 5.2-9 справедливо разложение х = (х, ех)ех + ... + (х, ер)ер + (х, ер+ {)ер+х + ...+(*, е„)е„. Обозначим х' = (х, ех)ех + ... + (х, ер)ер, х" = (г, ер + ,)ej, +1 + ... + (х, еи)ел. Ясно, что х' е I, jc" € Z,1, х' 1 jc", х = х' + jc". Согласно определению 5.4-12 и разложению вектора д:, имеем Если х' = 0, то cos2{x, L) = 0, если х' * 0, то М- И Последнее равенство справедливо, потому что оба вектора x\z e L и, следовательно, угол между ними будет минимальным при z = x'. Оно же верно и в случае л*' = 0. Теперь вернемся к самому утверждению. Возьмем в каждом из подпространств Lh...,Lp какой-нибудь ортонормированный базис. Согласно 5.3-22 ортогональная сумма подпространств 1Ь ..., Lp будет прямой. Поэтому согласно 5.3-14 объединение выбранных базисов из L\, ...,LP является ортонормированным базисом в К. Разложим вектор х по этому базису и обозначим через х] ту часть разложения, которая связана с векторами базиса из Lh I <i<p. Очевидно, что векторы х] попарно ортогональны и при этом по построению х = х[ + ... + хр . Принимая во внимание 5.4-3, находим, что cos{x,L,} + ... + cos{^i;)} = inr + ... + inl- = l. 5.4.3. Перпендикуляр и проекция 5.4-14.3 Проекция и перпендикуляр Каковы бы ни были вектор/и подпространство L, всегда существует, и притом единственное, разложение/= g + h, где g e L, h IL. Вектор g называется ортогональной
5. Расстояния, углы, объемы 187_ проекцией вектора/на подпространство Z, вектор h — перпендикуляром, опущенным из/на L. Проекция обозначается рг^ перпендикуляр — ort^/ Дополнение. Пусть L — любое подпространство размерности р пространства К размерности п. Возьмем в L ортонормированный базис еь ...,ер и дополним его до ортонормированного базиса в К векторами ер+ ь ..., еп. Это возможно согласно 5.2-15. Для любого вектора/е К согласно 5.2-9 справедливо разложение /= (А е,)е, + ...+(?*,)*, + (/; ер+ х)ер + x + ...+(f9 еп)е„, причем единственное. Обозначим g = (f, ех)ех + ...+(? ер)ер, h = (f9 ер+х)ер +i + ...+(/; е„)е„. Тогда выполняется равенство/= g + h , где g e L,hLL. 5.4-15.4 Соотношения для проекций и перпендикуляров Для любых векторов х,уи числа X всегда выполняются соотношения prLx = ort?l x, ortLx = prL± x, ortz,(x + j;) = ort/x + ort/^y, ortjr (Ajc) P1l(pil*) = prLx, ort/Xorti Дополнение. Возьмем в А^ ортонормированный базис ех, ..., ер,ер+и ..., е„, где векторы ^ь ..., вр принадлежат L9aep+u ...,е„ принадлежатLL. Для любых векторов х, у имеем согласно 5.2-^9, что х - (х, ех)ех + ... + (х, ер)ер + (х, ер+ х)ер+, + ...+ (х, е„)еЛ, 7 = 0, ej)e! + ... + (у, еу,)^ + (у, *,+ 0^+1 + ... + (у, е„)е„. Все соотношения доказываются по одной схеме. Поэтому ограничимся рассмотрением лишь нескольких из них. По определению 5.4-14 prLx = (х, в\)ех + ... + (х, ер)ер. Будем опускать перпендикуляр из вектора х на L1. Дополнительным ортогональным подпространством для /Л будет (L1I = L. Поэтому для ortLlx будем иметь то же разложение, что и для рг^х, т. е. оП/Хх = (х, е{)ех + ... + (х, ер)ер. Для любого вектора z e L, очевидно, prLz = z. Так как для любого вектора х е К по определению рг/х е L, то prL(prLx) = pr/x. Далее, prL(x +у) = рг/Х((х, ех) + (у, ех))ех + ...+((*, ер) + (у, ер))ер + ((х, ер+ х) + (у, ер+ ,))г^+1 + + ...+ ((х, е„) + (у, еп))еп) = ((х, в1) + (у, <?i))e, + ... + ((х, вр) + (у, ^))ep = = (х, ех)ех + ... + (х, е,)^ + (у, е,>, + ... + (у, и т. п.
188 Часть I. Математические сведения по линейной алгебре 5.4-1 б.4 Критерий ортогональности суммы подпространств Для того чтобы сумма Lx + L2 подпространств Lu L2 была ортогональной, необходимо и достаточно, чтобы для любого вектора х выполнялось равенство Дополнение. Пусть jci, ...,хг— ортонормированный базис в Lx n L2. В соответствии с 5.2-15 дополним его системой векторов уг+\, ...,уп до ортонормированного базиса в L\. В свою очередь, систему хь ...,у„ дополним векторами zr+ ь ..., zm до ортонормированного базиса в Lx + L2. Векторы zr + ь ..., zm не могут принадлежать L\, поэтому система векторов хь ...,xnzr+u ...,zm представляет ортонормированный базис в L2. Как следует из дополнения 5.4-14, для любого вектора х пространства имеем рг^х = (х, х,)х, +... + (х, хг)хг + (х, yr + l)yr + ] +... + (*, уи)уи, рт^х = (х, xt)xx +... + (х, хг)хг + (х, zr + 1)zr + 1 +... + (х, zm)zm, Если подпространства Ьхи L2 ортогональны, то согласно 5.3-3 множество векторов хь ...,хг должно быть пустым. Иначе каждый из векторовх„ 1 <i<r, должен быть ортогонален сам себе, что невозможно по построению. Но в этом случае из приведенных представлений для проекций вытекает, что рг^ +^х = рг^х + рг^х. Пусть теперь для любого вектора х пространства такое равенство выполняется. В том числе, оно должно выполняться и для любого вектора х„ 1 < / < г, если они существуют. Однако в случае их существования из приведенных представлений для проекций мы получаем, что (х„ Х/)х, = 2(х/? Х/)х„ т. е. х„ = 0, что невозможно по построению. Поэтому множество векторов хь ...,хг должно быть пустым. Но тогда по построению каждый из векторовуг+ ь ...,у„ базиса в L\ будет ортогонален каждому из векторов zr+ ь ..., zm базиса в L2. Согласно 5.3-3 это означает, что подпространства L\ и L2 ортогональны. 5.4-17.4 Полезная оценка Если подпространства L{, Ьъ ...,Lm попарно ортогональны, то для любого векторах справедливо неравенство причем равенство достигается тогда и только тогда, когда х принадлежит ортогональной сумме этих подпространств.
5. Расстояния, углы, объемы 189 Дополнение. Обозначим L = (L{ © ... ФL^,I. Тогда согласно 5.3-23 пространство К может быть представлено в виде ортогональной суммы Л ~~ Lj\ \3/ ... Ш jLw Ч? \Ь 1 \t7 ... чХ/ X>w</ . Согласно 5.4-16 для любого вектора х е К Но pr^jc = л: и все остальные проекции попарно ортогональны. Поэтому в соответствии с 5.4-3 имеем или Очевидно, что в этом неравенстве равенство достигается тогда и только тогда, когда pi/,* = 0 или, другими словами, когда вектор х принадлежит ортогональной сумме подпространствL\, ..., Lm. 5.4-18.3 Расстояние между вектором и подпространством Расстояние между вектором и подпространством равно длине перпендикуляра, опущенного из вектора на подпространство. Дополнение. Рассмотрим произвольное подпространство L из пространства К. Согласно определению 5.4-14 для любого векторах е К справедливо разложение х = pi/* + ortLx. Далее, по определению 5.4-8 р(х, L) = inf p(x, z) = infix - z\ = inf I(pr75c - z) + ort,x|. Вектор (prLx ~z)eL9 вектор ortjxLL, поэтому эти векторы ортогональны. Согласно 5.4-3 р2О, L) = inf(|pr7x- zf + |ortLx|2). Вектор ort^x не зависит от z, а вектор рг/,х - z можно сделать нулевым, если взять z = рг/х . Поэтому р(х, L) = |ortzx|. 5.4-19.3 Ближайший вектор Ближайшим вектором подпространства к заданному вектору является его проекция на это подпространства. Дополнение. Очевидно следует из дополнения к 5.4-18.
190 Часть I. Математические сведения по линейной алгебре 5.4-20.3 Угол между вектором и подпространством Угол между вектором и подпространством совпадает с углом между этим вектором и его проекцией на подпространство. Дополнение. Пусть заданы вектор х и подпространство L. В соответствии с 5.4-14 представим вектор х в виде суммы х = pr^x + ort/X. Согласно определениям 5.4-9, 5.4-12 имеем (х, z) ИМ Если рг^х = 0, то (х, z) = 0 и утверждение доказано, т. к. значение дроби справа будет нулевым при любом z ф 0. Если же pr/jc ф 0, то Ш И Заметим, что pr/jc e L. Поэтому из 5.1-11 следует, что максимум дроби справа теперь будет достигаться тогда, когда вектор z пропорционален вектору рад в частности, когда z = pi*/* . 5.4-21.3 Проекция и перпендикуляр в ортонормированном базисе Пусть еь ..., es — ортонормированный базис подпространства L. Для любого вектора х имеют место соотношения Дополнение. Пусть еь ..., es есть ортонормированный базис подпространства L. Дополним его согласно 5.2-15 векторами es+\, ..., еп до ортонормированного базиса пространства К. Согласно 5.2-9 для любого вектора х е К справедливо представление х = (х, еу)ех + ...+(*, es)es + (х, es + ,)ет +1 + ... + (х, еп)е„. По определению 5.4-14 ort^x = х - рг,х = х - ^](х, ^)ег По построению система векторов еи •••, е„ ортонормированная. Поэтому согласно 5.4-3
5. Расстояния, углы, объемы 191 Kx,et)\ , \ortLx\2=?\(x,ei)\\ и, следовательно, 5.4-22.3 Вычисление перпендикуляра Вектор х из утверждения 5.2-10 есть перпендикуляр, опущенный из вектора;; на подпространство, образованное линейной оболочкой векторов еь •••> е*. Поэтому |х| < [у|, причем равенство достигается тогда и только тогда, когда вектор у ортогонален к каждому из векторов еь ..., ек. Дополнение. В самом деле„ из 5.2-10 заключаем, что у = х + (у, ех)ех + ... + (у, ек)ек. Вектор (у, е\)е{ + ... + (у, е*)е* принадлежит линейной оболочке L векторов е\,...9ек, а вектор х ортогонален ей. Поэтому согласно определению 5.4-14, х = ort/j/. Так как 2 2 2 то |jc| < |у|. Равенство достигается тогда и только тогда, когда рг^у = 0 или, другими словами, когда вектор у ортогонален линейной оболочке L. Согласно 5.3-2 это возможно лишь в том случае, когда вектор у ортогонален к каждому из векторов eh ...9ek. 5.4.4. Объем 5.4-23.5 Объем системы векторов Пусть в пространстве со скалярным произведением задана система векторов лгь ...,х„. Обозначим через Lo нулевое подпространство, через Z, — линейную оболочку векторов х\, ...,*,-. Объемом V(x{, ...,xn) системы векторовхь ...,хп называется величина 5.4-24.5 Неравенство Адамара Для любой системы векторов :сь ..., хп справедливо неравенство Адамара \\
192 Часть I. Математические сведения по линейной алгебре причем равенство имеет место тогда и только тогда, когда система хи ..., х„ ортогональна или содержит нулевой вектор. Дополнение. Как следует, например, из 5.4-21 Поэтому всегда откуда вытекает неравенство Адамара. Если система векторов хи ...,х„ содержит нулевой вектор, то для какого-то / и неравенство Адамара превращается в равенство. Если система векторов хь ...,*„ не содержит нулевой вектор, но является ортогональной, то для всех /, 0 < / < И снова неравенство Адамара превращается в равенство. Пусть теперь неравенство Адамара превращается в равенство. Возможны два случая: либо У(х\, ..., хп) ~ О, либо У(х\, ...,хп) -ф- 0. В первом случае для какого-то / имеем jc/+i = 0, и система векторов Х\, ...,хп содержит нулевой вектор. Второй случай возможен только тогда, когда для всех /, 0 < / < п - 1, выполняются равенства то есть когда согласно 5.3-2 вектор х/+1 ортогонален векторам xl9 , jc,-, т. е. система векторовX], ...,хпортогональна. 5.4-25.5 Объем и ортонормированность Если система хь ..., х„ нормирована и ее объем равен единице, то она ортонормиро- вана. Дополнение. Это есть прямое следствие утверждения 5.4-24, если принять во внимание, что нормированная система не содержит нулевых векторов. 5.4-26.5 Максимальный объем Среди нормированных систем ортонормированная система имеет максимальный объем. Дополнение. Согласно 5.4-24 объем нормированной системы не превосходит 1. Но на ортонормированной системе неравенство Адамара согласно 5.4-24 обращается в равенство, и объем равняется 1.
5. Расстояния, углы, объемы 193 5.4-27.5 Объем двух систем векторов Для любых двух ортогональных множеств векторов х\, ...,хр иуи ...,уг справедливо равенство V(xu...,xp9yu...,yr)= V(xu ...,xp)V(yu ...,yr). Дополнение. Обозначим через L линейную оболочку векторов хь ...,*/?, через Li— линейную оболочку векторов хь ...,хр,у\9 ...,}>/, через А/,— линейную оболочку векторов уи ...,// для всех /, 0 < / < г - 1. По условию L,¦¦ = L 0 М, для всех /. Согласно 5.4-16 Но в силу ортогональности систем векторов xh ...,xpuyu .-.,уг имеем ргду,- + { = О для всех i,0<i<r- I. Теперь справедливость утверждения сразу следует из определения 5.4-23. 5.4-28.5 Объем и определитель Разложим векторы хь ..., х„ по какому-нибудь ортонормированному базису еи ...,е„и из координат этого разложения, расположенных по строкам или столбцам, составим квадратную матрицу. Модуль определителя данной матрицы всегда совпадает с объемом системы векторов лсь ..., хп. Дополнение. Разложим векторы хь ...,х„ по какому-нибудь ортонормированному базису еъ ..., еп и из координат этого разложения, расположенных, например, по строкам, составим квадратную матрицу А. Возможны две ситуации: либо система векторов линейно зависима, либо она линейно независима. В первой ситуации согласно 2.1-16 либо х\ = 0, либо для какого-то /, 0 < / < п - 1, вектор xi+ \ линейно выражается через предшествующие векторы. В этом случае либо ort^x = 0 , либо ^i^i + i^ для того же самого /. Но тогда по определению 5.4-23 имеем V(xu ..., хп) = 0. Кроме этого, в первой ситуации строки матрицы А будут линейно зависимы и согласно 4.2-10 имеем det А - 0. Итак, если система векторов хь ..., хп линейно зависима, то справедливость утверждения установлена. Рассмотрим теперь случай линейно независимой системы векторов лсь ...,*„. Перейдем от системы векторов х\, ...,*„ к системе векторов/ь ...,/,, в которой каждый вектор/, 1 < / < п, получается из вектора х7 путем прибавления к нему какой- либо линейной комбинации предшествующих векторов. В этом случае для всех /, 0 < / < п - 1, подпространства Lh построенные согласно определению 5.4-23 для векторов jcb ".,xn, будут совпадать с аналогичными подпространствами Mh построенными для векторов/ь ...,/,. Кроме этого, каждый из векторов fi+x получается из вектора xi+ \ путем прибавления к нему какого-то вектора из Lh Поэтому для всех / ortMifi + ]=ortLxl + r 7 Зак740
194 Часть I. Математические сведения по линейной алгебре Следовательно, V(xu ...,*„) = V(fu ...,/,). Матрица В, построенная для векторов /J, .-.,fn в том же базисе е{, ..., еп, будет отличаться от матрицы А, построенной для векторов ;сь ...,х„. Однако согласно 4.1-20 имеем det/J = det?. В полной аналогии с процессом, описанным в дополнении к 5.2-14, построим систему векторов /J, ...,/, ортогональной. Единственное отличие состоит в том, что теперь не будем производить никаких нормировок векторов fu ...,/,. Среди этих векторов нет нулевых, поэтому согласно 5.4-24 Представим матрицу В в виде произведения В = FC, где F есть диагональная матрица с элементами |/j|, ..., \fn\ на главной диагонали. По построению строки матрицы С представляют ортонормированную систему векторов арифметического пространства со скалярным произведением вида 5.1-8. Легко проверить, что в этом случае выполняется равенство СС* = Е. Согласно 4.1-22, 4.1-13, 4.2-10 отсюда следует, что |det С| = 1. Поэтому Как было установлено выше, |det В\ = \detA\ и V(fx, ...,/,)= V(xu ...,xn). Таким образом, всегда \detA\=V(xu...,xn). 5.4-29.5 Комментарий (связь определителя и объема) Таким образом, понятию определителя, введенному ранее совершенно формально, дана достаточно ясная геометрическая интерпретация. 5.4-30.5 Переупорядочивание векторов Объем системы векторов не меняется от переупорядочивания векторов. Дополнение. Это есть прямое следствие утверждений 4.1-18, 5.4-28. 5.4-31/Умножение вектора на число Если какой-либо из векторов умножить на число а, то объем системы векторов умножится на |а|. Дополнение. Это есть прямое следствие утверждений 4.1-15, 5.4-28.
6. Системы линейных алгебраических уравнений 6.1. Основные понятия и формы записи 6.1.1. Основные понятия и простейшие факты 6.1-1.3 Система линейных алгебраических уравнений Системой линейных алгебраических уравнений относительно неизвестных х\у х2, ..., хт называется совокупность уравнений вида 022*2 0и 1*1 + 0*2*2 + ... + аптхт = у„. Числа ау называются коэффициентами системы, числам — ее правыми частями. 6.1-2.3 Решение системы Упорядоченная совокупность неизвестных, удовлетворяющая каждому из уравнений, называется решением системы. 6.1-З.3 Совместные и несовместные системы Если система имеет хотя бы одно решение, то она называется совместной; в противном случае система называется несовместной. 6.1-4.3 Частное и общее решения Если система совместна, то каждое ее решение называется частным; совокупность всех частных решений называется общим решением.
196 Часть I. Математические сведения по линейной алгебре 6.1-5. Однородная и неоднородная системы Система называется неоднородной, если среди ее правых частей есть хотя бы одна отличная от нуля; в противном случае система называется однородной. 6.1-б.3 Приведенная система Система, полученная путем замены всех правых частей нулями, называется приведенной однородной системой. 6.1-7.3 Совместность однородной системы Однородная система всегда совместна, т. к. одним из ее частных решений является нулевое решение. 6.1.2. Матрично-векторная запись 6.1 -8.3 Матрично-векторная запись В терминах матричных операций система линейных алгебраических уравнений может быть записана следующим образом: у2 У» 6.1-9. Названия компонентов записи Матрица А с элементами ay называется матрицей системы, вектор х с неизвестными Х\, ...,хт— вектором неизвестных, вектор у, составленный из чисел у\, ...,у„,— вектором правых частей системы или просто правой частью. 6.1-10.3 Матрично-векторная запись системы В обозначениях 6.1-9 система линейных алгебраических уравнений выглядит как матрично-векторное равенство Ах =у9 где матрица А и вектор у известны, вектор л: — не известен. 6.1-11. Расширенная матрица системы Матрица, полученная приписыванием справа к матрице системы столбца правых частей, называется расширенной матрицей системы.
6. Системы линейных алгебраических уравнений 197 6.1.3. Эквивалентные системы 6.1-12.3 Эквивалентные системы Две системы линейных алгебраических уравнений относительно одних и тех же неизвестных называются эквивалентными, если каждое решение одной системы является решением другой системы или обе системы несовместны. Дополнение. Заметим, что другие определения эквивалентных систем могут отличаться от приведенного. Все определения совпадают между собой в той части, которая относится к совместным системам. В некоторых определениях часть, касающаяся несовместных систем, может отсутствовать. Это объясняется тем, что две несовместные системы от одних и тех же неизвестных могут быть несовместны "по-разному". Рассмотрение несовместных систем как эквивалентных соответствует их приближенному сравнению. Однако во многих случаях такое сравнение оказывается достаточным. 6.1-13.3 Матричный критерий эквивалентности систем Если матрица В невырожденная, то системы линейных алгебраических уравнений Ах = у и ВАх = By эквивалентны. Дополнение. Пусть вектор jc является решением системы Ах =у. Умножив это равенство слева на матрицу В, заключаем, что вектор х является также решением системы ВАх = By. Если матрица В невырожденная, то верно и обратное утверждение. Пусть для какого-то вектора х выполняется равенство ВАх = By. Умножив это равенство слева на матрицу В~ \ заключаем, что выполняется равенство Ах =у. Если система Ах=у не имеет решения, то согласно сказанному не может иметь решения и система ВАх = By. И наоборот. Следовательно, в случае невырожденности матрицы В системы Ах =у и ВАх - By эквивалентны. 6.2. Приведение системы к каноническому виду 6.2.1. Метод Гаусса 6.2-1.3 Комментарий (идея метода Гаусса решения систем) Идея метода Гаусса исключительно проста. С помощью последовательности элементарных преобразований система линейных алгебраических уравнений приводится к эквивалентной системе настолько простого вида, что она очень легко решается и исследуется. 6.2-2.3 Перестановка уравнений Если в системе линейных алгебраических уравнений переставить местами любые два уравнения, то полученная система будет эквивалентна исходной.
198 Часть I. Математические сведения по линейной алгебре 6.2-3.3 Умножение уравнения на число Если в системе линейных алгебраических уравнений все коэффициенты и правую часть любого из уравнений умножить на не равное нулю число, то полученная система будет эквивалентна исходной. 6.2-4.3 Прибавление линейной комбинации уравнений Если в системе линейных алгебраических уравнений к какому- нибудь уравнению прибавить другое уравнение, умноженное на любое число, то полученная система будет эквивалентна исходной. 6.2-5.3 Элементарные преобразования системы Перестановка двух уравнений, умножение уравнения на ненулевое число, прибавление к одному уравнению другого уравнения, умноженного на число, а также перенумерация неизвестных называются элементарными преобразованиями системы линейных алгебраических уравнений. 6.2-6.3 Матричная трактовка преобразований Если выполняется перестановка двух уравнений (умножение уравнения на ненулевое число; прибавление к одному уравнению другого уравнения, умноженного на число), то расширенная матрица полученной системы будет равна расширенной матрице исходной системы, умноженной слева на элементарную матрицу перестановок (элементарную матрицу масштабирования; элементарную неунитарную матрицу). Дополнение. Утверждение становится очевидным, если принять во внимание утверждения 3.4-8, 3.4-13, 3.4-18, описывающие эффект умножения матрицы слева, соответственно, на элементарную матрицу перестановок, элементарную матрицу масштабирования, элементарную неунитарную матрицу. 6.2-7.3 Эквивалентность элементарных преобразований Элементарные преобразования приводят к эквивалентным системам. Дополнение. Очевидно, если учесть 6.1-13 и принять во внимание невырожденность матриц элементарных преобразований согласно 4.4-17. 6.2-8.3 Перенумерация неизвестных Если выполняется перенумерация неизвестных, то расширенная матрица полученной системы будет равна расширенной матрице исходной системы, умноженной справа на матрицу перестановок. Последний столбец расширенной матрицы никогда не переставляется. Дополнение. Утверждение становится очевидным, если принять во внимание утверждение 3.4-8, описывающее эффект умножения матрицы справа на элементарную матрицу перестановок.
6. Системы линейных алгебраических уравнений 199 6.2.2. Каноническая система уравнений 6.2-9.3 Приведение к каноническому виду Система линейных алгебраических уравнений общего вида может быть приведена с помощью элементарных преобразований к эквивалентной системе следующего вида: О =иг+„ 0 =!!„. Здесь неизвестные zb ...,zm отличаются от неизвестных xh ...,xm возможно, только перенумерацией. Система такого вида называется канонической. Дополнение. Это преобразование в целом осуществляется так же, как в утверждениях 3.6-7—3.6-10 с помощью левосторонних преобразований. Единственное отличие заключается в том, что элемент, с помощью которого осуществляется исключение, всегда выбирается только среди элементов матрицы системы. Однако само преобразование выполняется для всей расширенной матрицы. 6.2-10.3 Комментарий (значение канонической системы) Вид канонической системы позволяет дать полный ответ на вопрос о том, как устроено общее решение системы линейных алгебраических уравнений. 6.2-11.3 Совместность канонической системы Каноническая система линейных алгебраических уравнений совместна тогда и только тогда, когда все uh г + 1 < / < п, равны нулю. Дополнение. Если каноническая система совместна, то существует набор чисел z\, ..,, zm, при котором удовлетворяются все уравнения, в том числе с номерами от (г + 1)-го до п-го. Но в этих уравнениях левая часть равна нулю при любом наборе чисел z\, ...,zw. Поэтому, чтобы эти уравнения можно было удовлетворить, необходимо выполнение равенств и, = 0 для г + 1 < i <п. Пусть теперь ut - 0 для г + 1 < / < п. Последние п - г уравнений удовлетворяются при любом наборе чисел zb ...,zw. Возьмем в качестве zr+b ...,zm любые числа. Тогда из /-го уравнения, 1 < / < г, определяется неизвестное Z/. Каноническая система оказалась совместной.
200 Часть I. Математические сведения по линейной алгебре 6.2-12.3 Общее решение канонической системы Общее решение совместной канонической системы задается формулами Z\ = U) - b\ Zr~Ur- brrr\Zr+\ - ... - brmZm, где числа zr+i, ...,zm могут принимать произвольные значения. Неизвестные zr+ |, ..., zm называются свободными, 6.2-13.3 Инвариант канонической системы Пусть используются элементарные преобразования. Тогда число г в канонической системе не зависит от способа приведения к ней и равно рангу матрицы исходной системы. Дополнение. Согласно 4.3-8, ранг матрицы не меняется при элементарных преобразованиях. Матрица канонической системы, очевидно, имеет ранг г. Если она была получена из матрицы исходной системы с помощью элементарных преобразований, то г есть также ранг матрицы исходной системы. 6.3. Основные факты 6.3.1. Теорема Кронекера-Капелли 6.3-1.3 Сокращенная запись системы Обозначим а, = J = 1, 2, ...,/w, y = В терминах векторных операций (точнее, операций над вектор-столбцами матрицы) система линейных алгебраических уравнений может быть записана следующим образом: хха\ + ... +xmam=y. 6.3-2.3 Критерий совместности Система линейных алгебраических уравнений совместна тогда и только тогда, когда вектор правой части принадлежит линейной оболочке вектор-столбцов матрицы системы.
6. Системы линейных алгебраических уравнений 201 Дополнение. Воспользуемся обозначениями 6.3-1. Если система совместна, то существует такой набор чисел xh ...,xm что xxa\ + ...+ xmam=y. Это и означает, что вектор правых частей у принадлежит линейной оболочке вектор-столбцов ah ..., am матрицы системы. Пусть теперь имеет место эта принадлежность. Тогда вектор правых частей у линейно выражается через вектор-столбцы аь ..., am. Другими словами, существуют такие числа хь ..., jcw, что xxa\ + ...+ xmam=y. Это означает согласно 6.3-1, что набор чисел х\, ...,xm есть решение системы, т. е. система совместна. 6.3-3.3 Теорема Кронекера-Капелли Для того чтобы система линейных алгебраических уравнений была совместна, необходимо и достаточно, чтобы ранг расширенной матрицы системы равнялся рангу матрицы системы. Дополнение. Выберем в матрице системы любые базисные столбцы. Если система совместна, то согласно 6.3-2 вектор правых частей системы принадлежит линейной оболочке вектор-столбцов матрицы системы и, следовательно, линейно выражается через ее базисные столбцы. Поэтому базисные столбцы матрицы системы являются базисными столбцами расширенной матрицы. Согласно 4.3-5 отсюда следует совпадение рангов обеих матриц. Пусть теперь ранги обеих матриц совпадают. В этом случае базисные столбцы матрицы системы одновременно являются базисными столбцами расширенной матрицы. Поэтому вектор правых частей системы линейно выражается через базисные и, следовательно, через все столбцы матрицы системы. Согласно 6.3-2 это означает, что система совместна. 6.3.2. Общие свойства решений системы 6.3-4.3 Общее решение как подпространство Общее решение приведенной однородной системы образует в w-мерном арифметическом пространстве подпространство размерности /w-r, где г — ранг матрицы системы. Дополнение. В соответствии с 6.2-12 рассмотрим вектор-столбцы kr + l i 0 0 кг*г 0 1 0 -к. 0 0 1
202 Часть I. Математические сведения по линейной алгебре арифметического пространства размерности т. Их число равно т-гн они линейно независимы, т. к. из нижних частей этих векторов можно составить единичную матрицу порядка т - г. Согласно 6.2-12 вектор v с координатами vb ..., vm, описывающий общее решение приведенной однородной системы, может быть представлен в виде v = vr+lbr+l+ ...+ vmbm. Так как числовые коэффициенты vr+b ..., vm могут быть произвольными, то векторы v образуют линейную оболочку т-r линейно независимых векторов, т. е. подпространство размерности т-r. Согласно 6.2-13 число г есть ранг матрицы системы. 6.3-5.3 Фундаментальная система решений Любой базис подпространства решений приведенной однородной системы называется фундаментальной системой решений. Дополнение. Как следует из дополнения к 6.3-4, фундаментальной системой решений является, например, набор векторов br+]i ..., bm. 6.3-6.3 Структура общего решения Общее решение неоднородной системы получается путем прибавления к общему решению приведенной однородной системы любого частного решения неоднородной системы. Дополнение. Обозначим через и вектор-столбец размерности т с координатами мь ..., иг, О, ...,0, через z— вектор-столбец с координатами zb ...,zw, представляющий общее решение неоднородной системы, через z -вектор-столбец с координатами z,,...,zw , представляющий какое-нибудь частное решение неоднородной системы. Как вытекает из 6.2-12 с учетом обозначений в дополнении к 6.3-4, откуда следует, что Числа zi - z. для всех /, г + 1 < / < /и, могут быть произвольными. Поэтому вектор в первых скобках согласно представлению в дополнении к 6.3-4 задает общее решение приведенной однородной системы. Вектор во вторых скобках есть частное решение z неоднородной системы.
6. Системы линейных алгебраических уравнений 203 6.3-7.3 Разность частных решений Разность любых двух частных решений неоднородной системы есть частное решение приведенной однородной системы. Дополнение. Обозначим через z и z вектор-столбцы с координатами Zj,..., zm и ?р..., zm, представляющие любые два частные решения неоднородной системы. Как вытекает из 6.2-12 с учетом обозначений в дополнении к 6.3-4, Поэтому согласно обозначениям в дополнении к 6.3-4 вектор v = (*r + 1 -zr + l)br + l+... + (zm -zm)bm=z-z есть частное решение приведенной однородной системы. 6.3.3. Критерии и формулы 6.3-8.3 Критерий единственности решения Для того чтобы совместная система имела единственное решение, необходимо и достаточно, чтобы ранг матрицы системы был равен числу неизвестных. Дополнение. Пусть совместная система имеет единственное решение. Согласно 6.3-6 это означает, что подпространство решений приведенной однородной системы имеет нулевую размерность. Но согласно 6.3-4 отсюда следует, что m = r, где г есть ранг матрицы системы, m-число неизвестных. Пусть теперь m = г. Согласно 6.3-4 подпространство решений приведенной однородной системы в этом случае имеет нулевую размерность. Согласно же 6.3-6 отсюда вытекает единственность решения совместной системы. 6.3-9.3 Ненулевое решение однородной системы Для того чтобы однородная система имела ненулевое решение, необходимо и достаточно, чтобы ранг матрицы системы был меньше числа неизвестных. Дополнение. Однородная система всегда имеет нулевое решение. Если она имеет, к тому же, ненулевое решение, то согласно 6.3-4 размерность подпространства решений должна удовлетворять неравенству m-r>\ или г < т. Здесь г есть ранг матрицы системы, т — число неизвестных. Очевидно, верно и обратное. 6.3-10.3 Однородная система с вырожденной матрицей Однородная система с квадратной матрицей имеет ненулевое решение тогда и только тогда, когда матрица системы вырожденная.
204 Часть I. Математические сведения по линейной алгебре Дополнение. Для квадратной матрицы согласно определениям 4.3-1, 4.4-1 ранг матрицы меньше ее порядка тогда и только, когда сама матрица вырожденная. Если матрица системы квадратная, то ее порядок равен числу неизвестных. Все остальное определяется утверждением 6.3-9. 6.3-11.3 Система с невырожденной матрицей Система линейных алгебраических уравнений Ах = у с квадратной матрицей А имеет единственное решение тогда и только тогда, когда матрица А невырожденная. В этом случае решение задается формулой х = А~ 1у. Дополнение. Пусть система линейных алгебраических уравнений Ах=у с квадратной матрицей А имеет единственное решение. Согласно 6.3-8 ранг матрицы А равен числу неизвестных или, что в данном случае одно и то же, равен ее порядку. Следовательно, матрица А невырожденная и согласно 4.4-7 имеет обратную матрицу А~ \ Умножив равенство Ах =у слева на матрицу А~ \ получаем, что х = А~ ху. Если матрица А системы линейных алгебраических уравнений невырожденная, то она имеет обратную матрицу А~\ Легко проверить, что вектор х = А~]у является решением системы Ах=у, Следовательно, система совместна. Если х— любое решение системы Ах =у, то, умножив это равенство слева на матрицу А~ \ заключаем, что х = А~1у есть единственное решение системы. 6.3-12.3 Формулы Крамера Рассмотрим систему линейных алгебраических уравнений с невырожденной матрицей. Обозначим через d определитель матрицы системы, через d} — определитель, отличающийся от d лишь тем, что в нему-й столбец заменен столбцом правых частей. Тогда единственное решение системы может быть вычислено по формулам Xj = d/d для всеху. Дополнение. Рассмотрим систему линейных алгебраических уравнений Ах=у с невырожденной матрицей А порядка п. Согласно 6.3-11 она имеет единственное решение х = А~ху. Обозначим черезхь ...,хп иуи ...,у„ координаты, соответственно, векторов х и у. В соответствии с представлением 4.4-9 матрицы А'' имеем х = > где A,j есть алгебраическое дополнение элемента afJ матрицы А. Принимая во внимание 4.2-6 и обозначения для определителей из текста рассматриваемого утверждения, заключаем, что и окончательно лгу = d/d для всеху, 1 <j < п.
6. Системы линейных алгебраических уравнений 205 6.4. Альтернатива и теорема Фредгольма 6.4.1. Образ и ядро матрицы 6.4-1.3 Комментарий (обсуждение полученных результатов) Несмотря на то, что формулы Крамера дают явное представление решения системы с невырожденной матрицей, они редко используются в практических расчетах. Основные причины этого заключаются в большой трудоемкости процесса вычисления всех определителей и в численной его неустойчивости. Однако в теоретическом отношении формулы Крамера нередко оказываются полезными, т. к. позволяют исследовать зависимость решения от элементов матрицы и правой части. Теорема Кронекера- Капелли формулирует необходимое и достаточное условие разрешимости системы в терминах цанга матрицы. Это не очень удобно, т. к. не позволяет заметить той глубокой связи, которая существует между линейными системами и уравнениями других типов. В дальнейших исследованиях существенно используются соотношения 5.2-25, поэтому будем считать, что скалярное произведение введено согласно 5.1-8 через естественный базис. 6.4-2.4 Ядро, дефект и образ матрицы Пусть X, Y— арифметические пространства размерности соответственно т, пи А — матрица размера п х т. Множество векторов х е X, для которых Ах = О, называется ядром матрицы А и обозначается кегЛ. Размерность ядра матрицы А иногда называется ее дефектом. Множество векторов у е Y, для которых у = Ах хотя бы для одного вектора х е X, называется образом матрицы А и обозначается im A. 6.4-3.4 Характеристика образа и ядра Образ и ядро матрицы А суть подпространства. Дополнение. Ядро матрицы А есть множество решений однородной системы линейных алгебраических уравнений Ах = 0. Согласно 6.3-4 это есть подпространство. Возьмем далее любые два вектора .у, u e im А. По определению 6.4-2 существуют векторы z, v е X такие, что у = Az9 и = Av. Но тогда для любых чисел а, р вектор осу + (Зм е im А, т. к. ay + Pw = olAz + P^v = A(az + Pv). Согласно 1.7-11 это означает, что im А есть подпространство. 6.4-4.4 Образ как линейная оболочка Пусть еи ...,ет — любой базис пространстваX. Тогда образ матрицы А есть линейная оболочка векторов Аеи ...,Ает. Дополнение. Пусть еь ..., ет — базис в X. Для любого х е X справедливо разложение
206 Часть I. Математические сведения по линейной алгебре Для образа >> = AxeY имеем Ах = oi\Ae\ + a2Ae2 + ... + antAent9 то есть im А есть линейная оболочка векторов Аеи ••-, Ает. 6.4-5.4 Важный частный случай Образ матрицы А есть линейная оболочка ее вектор-столбцов. Дополнение. Это есть очевидное следствие 6.4-4, если в качестве еи ..., ет взять естественный базис в X. д \ 6.4-6. Размерность образа Размерность образа матрицы А равна рангу А. Дополнение. Согласно 6.4-5 подпространство im А есть линейная оболочка вектор-столбцов матрицы А. Согласно 4.3-4 любые базисные вектор-столбцы матрицы А образуют базу или, другими словами, базис этой линейной оболочки. Согласно 4.3-5 число векторов базы или, другими словами, размерность линейной оболочки равна рангу матрицы А. 6.4-7.4 Размерность ядра Размерность ядра матрицы А размера пх т равна т - rank A. Дополнение. По определению 6.4-2 ядро матрицы А есть множество решений однородной системы линейных алгебраических уравнений Ах = 0. Согласно 6.3-4 размерность ker А равна т - rank A. 6.4-8.4 Размерность ядер An А* Для любой матрицы А размера n x m имеет место равенство dim(ker A) - dim(ker A*) + т-п. Дополнение. Это есть прямое следствие 4.3-17 и 6.4-7. 6.4-Э.4 Различные соотношения Для арифметических пространств X, Y со скалярными произведениями вида 5.1-8 в естественных базисах при любой матрице А выполняются соотношения: ker A* = (im A)\ ker A = (im A*I, ker A*A = (im Л*A)L, ker AA* = (im AA*)\ ker A*A= ker А, кег AA* = ker A*, im A*A = im A*, im AA* = im A, Х= ker А 0 ппЛ* = ker {A*A) 0 im A*A, Y= ker A* 0 im A = kev(AA*) 0 ЩАА*).
6. Системы линейных алгебраических уравнений 207 Дополнение. Пусть даны арифметические пространства X размерности m, Y размерности п и любая матрица А размера пхт над одним и тем же полем вещественных или комплексных чисел. Предположим, что в пространствах^и Yвведены скалярные произведения вида 5.1-8 в естественных базисах. Согласно 5.2-25 для любых векторов хеХ,уеУ выполняется равенство (Ах,у) = (х^4*у). Если х е ker А, то Ах = О и тогда (Ах, у) = 0 для любого вектора у. Поэтому вектор х будет ортогонален всем векторам видаЛ*у, т. е. х е (im А*I. Верно и обратное. Если х е (imA*I, то вектор х должен быть ортогонален векторам вида А*у для всех у е У. Тогда (х, А*у) = 0 или (Ах, у) = 0 для всех у е Y. Поэтому согласно 5.1-6 должно выполняться равенство Ах^О или jceker^. Следовательно, ker,4 = (imA*)A~. Отсюда, заменив матрицу А матрицей А*, получаем равенство ker A* = (im АI. Заменив матрицу А матрицами А*А и АА*, получаем другие равенства ker A*A = (im A*A)\ ker АА* = (im AA*I. Возьмем теперь любой вектор х е ker А*А, т. е. для него А*Ах = 0. Поэтому для любого вектора z e X должно выполняться равенство (А*Ах, z) = 0 или согласно 5.2-25 (Ах, Az) = 0. Но это равенство должно выполняться также при z = x. Согласно аксиомам 5.1-2, 5.1-3 это означает, что Ах = 0, т. е. х е ker А. Если же х е ker A, то Ах - 0. Поэтому для любого вектора z e X должно выполняться равенство (Ах, Az) = 0 или согласно 5.2-25 (А*Ах, z) = 0. Согласно 5.1-6 отсюда вытекает, что А*Ах = 0, т. е. х e ker у4*,4. Следовательно, имеет место равенство ker A*A = ker A. Отсюда, заменив матрицу А матрицей А*, получаем равенство ker АА* = ker А*. Теперь, принимая во внимание ранее выведенные соотношения, находим, что im A*A = (ker A*AI = (ker A)L = im A*, \тАА* = (ker АА*I = (ker A*I = imA. Наконец, в соответствии с 5.3-23, беря в качестве подпространств ядра матриц А, А*, А*А и АА* и используя установленные здесь связи, заключаем, что для пространств X, Y имеют место следующие связанные с матрицей ,4 разложения: X = ker A 0 im A* = ker(A*A) 0 \т(А*А), Y = ker A* 0 im A = ker(AA*) © im(AA*). 6.4.2. Альтернатива и теорема Фредгольма 6.4-10.4 Система с прямоугольной матрицей Или неоднородная система Ах=у имеет решение при любой правой части, или сопряженная однородная система А*и = 0 имеет по крайней мере одно ненулевое решение. Дополнение. Пусть неоднородная система Ах=у имеет решение при любой правой частиц g Y. Согласно 6.3-2, 6.4-5 это означает, что Yd im А. Так как по условию вектор у может быть любым, то im A = Y. Согласно соотношению в последней
208 Часть /. Математические сведения по линейной алгебре строке 6.4-9, отсюда заключаем, что кегЛ* состоит только из нулевого вектора. Поэтому сопряженная однородная система А* и = 0 не может иметь ненулевое решение. Пусть теперь сопряженная однородная система А*и = 0 имеет по крайней мере одно ненулевое решение. Это означает, что kcrA* состоит не только из нулевого вектора. Согласно соотношению в последней строке 6.4-9, заключаем, что im А не совпадает со всем пространством У. Следовательно, существует ненулевой вектор у е К, который согласно 6.4-5 не является линейной комбинацией вектор- столбцов матрицы А. Согласно 6.3-2 для этого вектора у неоднородная система Ах =у не может иметь решение. 6.4-11.4 Альтернатива Фредгольма Или неоднородная система с квадратной матрицей всегда имеет, и притом единственное, решение при любой правой части, или сопряженная однородная система имеет по крайней мере одно ненулевое решение. Дополнение. Допустим, что система Ах-у имеет решение при любом векторе у. Согласно 6.4-10 это означает, что ker А* состоит только из нулевого вектора. А согласно соотношению в последней строке 6.4-9 отсюда следует, что im А совпадает со всем пространством У. Принимая во внимание 6.4-6, заключаем, что rank Л = dim У. Рассмотрим для системы Ах = у ее канонический вид 6.2-9, 6.2-12, 6.2-13. При условиях, что rank Л = dim У и матрица Л квадратная, свободные неизвестные отсутствуют, и решение системы Ах=у оказывается единственным. Все остальное следует из утверждения 6.4-10. 6.4-12.4 Теорема Фредгольма Для того чтобы неоднородная система была разрешима, необходимо и достаточно, чтобы правая часть была ортогональна ко всем решениям сопряженной однородной системы. Дополнение. Пусть система линейных алгебраических уравнений Ах=у разрешима. Обозначим через и любое решение однородной сопряженной системы А*и = 0. Имеем, принимая во внимание 5.2-25, что (и, у) = (w, Ах) = (А*и, х) = @, х) = 0. Предположим теперь, что вектор правых частей у ортогонален всем решениям и однородной сопряженной системы А*и = 0. Это означает, что у e (ker Л*I или, учитывая первую строку соотношений 6.4-9, У a \mA. Согласно 6.4-5 отсюда вытекает, что вектор у принадлежит линейной оболочке вектор-столбцов матрицы А, а отсюда, в свою очередь, согласно 6.3-2 следует разрешимость системы Ах =у. 6.4-13.4 Еще один критерий совместности Для того чтобы система линейных алгебраических уравнений Ах=у была совместна, необходимо и достаточно, чтобы правая часть>> была ортогональна ядру матрицы А*. Дополнение. Это есть просто другая формулировка утверждения 6.4-12.
6. Системы линейных алгебраических уравнений 209 6.4-14.4 Совместность системы А*Ах = А*у Система А*Ах = А*у совместна при любой матрице А и любой правой части у. Дополнение. Согласно 6.4-13 надо показать, что вектор А*у ортогонален ядру матрицы (А*А)*. Вектор А*у е im A*, a ker(A*A)* = ker A*A = кет А согласно 6.4-9. Кроме этого, как указано в 6.4-9, подпространства imA* и ker А ортогональны. Отсюда вытекает справедливость утверждения. 6.4-15.4 Эквивалентность систем Ах = у и А*Ах = А*у Если система Ах=у совместна, то она эквивалентна системе А*Ах = А*у. Дополнение. Предположим, что вектор х есть решение системы Ах =у. Умножив это равенство слева на матрицу А*9 получаем, что вектор х также является решением системы А*Ах = А*у. Пусть теперь вектор z является решением системы A*Az = A*y и известно, что система Ах =у совместна. Из равенства A*(Az-y) = О заключаем, что Az-y e ker А*. Согласно 6.4-13 из условия совместности системы Ах=у следует, что у А. кег А*. Далее, вектор AzeimA и в силу разложения Y=kerA* 0 imA из 6.4-9 это означает, что AzLker А*. Таким образом, одновременно Az-y е кег А* и Az-y I. ker А*. Это может быть только в том случае, когда Az-y = 0 или Az =у, т. е. когда вектор z является решением системы Ах =у. 6.5. Псевдорешение и псевдообратная матрица 6.5.1. Нормальное решение 6.5-1.4 Нормальное решение Пусть пространства^, Yунитарные. Если система Ах=у совместна, то среди ее решений существует одно, имеющее минимальную длину. Это решение называется нормальным. Дополнение. Обозначим через L подпространство решений приведенной однородной системы Ах = 0 или, что то же самое, ядро матрицы А. Согласно 5.4-14 представим решение х системы Ах = у в виде суммы х - u + v, где и g L,v I.L. Покажем, что слагаемое v не зависит от решения х. Обозначим через х какое-нибудь другое решение, и пусть х = п + v соответствующее ему разложение. Принимая во внимание 6.3-7, имеем х — х = (и -п) + (v -v)e L. По построению v-v±L,u-ueL. Поэтому v - v = 0, т. е. v = v. Слагаемое v, очевидно, является решением, так как Ау =у. Среди всех решений системы Ах =у решение v имеет наименьшую длину. Действительно, согласно 5.4-3 выполняется равенство |х|2 = |м|2 + |v|2. Следовательно, |v| < \к\ для любого решения х.
210 Часть I. Математические сведения по линейной алгебре 6.5-2.4 Нормальное решение и ядро матрицы А Среди всех решений системы Ах=у нормальное решение является единственным, которое ортогонально ядру матрицы А. Дополнение. Пусть L есть ядро матрицы А. Согласно 5.4-14 представим решение х системы Ах = у в виде суммы х = u + v, где и е L, v _L L. Для того чтобы решение х было ортогонально Z,, необходимо и достаточно выполнение равенства и = 0. Согласно дополнению к 6.5-1 этому условию удовлетворяет нормальное решение, и только оно. 6.5-3.4 Нормальное решение и образ матрицы А* Среди всех решений системы Ах=у нормальное решение является единственным, которое принадлежит образу матрицы А*. Дополнение. Воспользуемся разложением X=kerA®\mA* из 6.4-9. Согласно 6.5-2 нормальное решение системы Ах=у является единственным решением, которое ортогонально ker Л. Следовательно, оно является единственным решением, которое принадлежит im A*. 6.5.2. Псевдорешение 6.5-4.5 Невязка вектора Пусть дана система линейных алгебраических уравнений Ах=у. Вектор Ах-у называется невязкой вектора jc. 6.5-5.5 Псевдорешение системы уравнений Псевдорешением или обобщенным решением системы Ах=у называется решение системы А*Ах = А*у. 6.5-6.5 Псевдорешение и невязка Среди всех векторов арифметического пространства X псевдорешения, и только они, обеспечивают: • ортогональность вектора невязки Ах -у образу матрицы А; • минимальность длины вектора невязки \Ах -у\. Дополнение. Для любого вектора х е X вектор невязки (Ах-у) е У. Согласно 6.4-9 справедливо разложение Y= ker A* 0 imA. Только для псевдорешений выполняется равенство А*(Ах-у) = 0, или (Ax~y) e ker А*, или (Ах-у) L'xmA. Представим вектор правых частей у в виде суммы у = и + v, где и е ker A*,v e im А. Тогда для невязки имеем разложение Ах -у = (Ах - v) + (- и). Векторы Ах - v и - и ортогональны по построению. Следовательно, согласно 5.4-3
6. Системы линейных алгебраических уравнений 211 Для того чтобы вектор л: был псевдорешением, необходимо и достаточно, чтобы вектор невязки Ах-у е ker А* или, что то же самое, вектор Ax-v равнялся нулю. При этом, очевидно, длина вектора невязки будет минимальной. 6.5-7.5 Множество псевдорешений Пусть задана система Ах=у. Рассмотрим вектор у 9 равный проекции вектора >> на образ матрицы А. Система Ах - у всегда совместна, и множество ее решений совпадает с множеством псевдорешений исходной системы. Дополнение. Действительно, у е im А и согласно 6.4-5 вектор у есть линейная комбинация вектор-столбцов матрицы А. В соответствии с 6.3-2 система Ах-у всегда совместна. Как следует из 6.4-15, системы Ах-у и А* Ах-А* у эквивалентны. Но по построению у = ргу. Поэтому согласно 5.4-14 заключаем, что imA у - у = ort у 9 т. е. у - у е (im АI или, принимая во внимание первое соотноше- imA ние 6.4-9, у - у е ker A *. Следовательно Это означает, что множества решений системы Ах = у совпадает с множеством решений системы А*Ах = А*у или, другими словами, с множеством псевдорешений системы Ах =у. 6.5.3. Нормальное псевдорешение 6.5-8.5 Нормальное псевдорешение Нормальным псевдорешением системы Ах=у называется нормальное решение системы А*Ах = А *у. 6.5-Э.5 Минимизация длины Среди всех псевдорешений нормальное псевдорешение, и только оно, обеспечивает минимальность длины псевдорешения |*|. Дополнение. Это есть другая формулировка утверждения 6.5-1 применительно к системе А*Ах = А*у. 6.5-10.5 Свойства нормального псевдорешения Среди всех псевдорешений нормальное псевдорешение, и только оно, обеспечивает: • ортогональность ядру матрицы А; • принадлежность образу матрицы А*.
212 Часть /. Математические сведения по линейной алгебре Дополнение. Согласно 6.5-3 нормальное псевдорешение является единственным псевдорешением, которое принадлежит \т(А*А)* = \тА*А. Согласно 6.4-9 [тА*А = \тА*. Так как согласно 6.4-9 имеем ker Л = (imA*I, то принадлежность im А* означает ортогональность к ker A, 6.5-11.5 Нулевое нормальное псевдорешение Нормальное псевдорешение х0 равно нулю тогда и только тогда, когда вектор правых частей у принадлежит ядру матрицы А*. Дополнение. Нормальное псевдорешение х0 удовлетворяет системе уравнений А*Ах0- А*у и согласно 6.5-1 имеет минимальную длину. Если х0 = О, то должно быть А*у = О, т. е. у е ker А*. Если у е ker Л*, то все псевдорешения удовлетворяют системе А*Ах = О, т. е. х е кегЛ*Л. Но ker/ГЛ есть подпространство и минимальный по длине вектор в нем является нулевым. 6.5-12.5 Комментарий (обоснование перехода к псевдорешениям) Таким образом, если разрешимость системы линейных алгебраических уравнений Ах-у не гарантируется, то мы всегда можем заменить решение этой системы решением системы А*Ах = А*у. При этом обеспечивается минимизация длины невязки Ах- у, а в случае нахождения нормального псевдорешения обеспечивается также минимизация длины самого псевдорешения. Переход от системы Ах~у к системе А*Ах = А*у называется первой трансформацией Гаусса или методом наименьших квадратов. Последнее название связано с тем, что формальное выписывание условий минимизации квадрата длины вектора невязки |^jc-y|2 как раз и приводит к уравнению А*Ах = А*у. 6.5-13.5 Комментарий (эквивалентность свойств) Заметим, что все свойства нормального псевдорешения, перечисленные в утверждениях 6.5-9, 6.5-10, эквивалентны. Поэтому, проверяя одно из них, можно быть уверенным, что выполняются и другие. 6.5.4. Псевдообратная матрица 6.5-14.5 Комментарий (об аналоге обратной матрицы) В случае невырожденной матрицы решение системы находится с помощью обратной матрицы. Обратная матрица играет существенную роль при выполнении многих исследований. Однако она была определена лишь для невырожденных матриц, и пока мы не имеем соответствующего аналога для вырожденных и тем более для прямоугольных матриц. Этот аналог может быть построен на основе нормальных псевдорешений.
6. Системы линейных алгебраических уравнений 213 6.5-15.5 Псевдообратный оператор Пусть задана произвольная прямоугольная матрица Л. Каждому вектору у е У поставим в соответствие вектор jc0 e X, являющийся нормальным псевдорешением системы Ах = у. Это соответствие порождает отображение хо = А+у пространства Y в пространство X с помощью некоторого оператора А+. Оператор А+ называется псевдообратным или обобщенным обратным. 6.5-1 б.5 Линейность псевдообратного оператора Псевдообратный оператор является линейным. Дополнение. Пусть х{, х2 — нормальные псевдорешения системы Ах =у, соответственно, для правых частей уьУг- Согласно определению 6.5-5 это означает, что А*Ахх=А*уиА*Ах2 = А*у2. Кроме этого, согласно 6.5-2 имеем Jcbx2-Lker А*А. Согласно 3.7-2, нужно показать, что для любых чисел а, Р нормальное псевдорешение для правой части otyi + р>>2 есть ouci + Рдг2. Заведомо <хх{ + рх2 есть псевдорешение для правой части ОУ\ + Р.У2, Т. К. А*А(ахх + р*2) = аА*Ах} + $А*Ах2 = аА*ух + $A*y2 = A\a.yx + р>>2). Кроме этого, otJCi + рх2 ± ker А*А в силу того, что кег А*А и (кег А*А)^~ суть подпространства. Согласно 6.5-5,6.5-2 заключаем, что oui + Р*2 есть нормальное псевдорешение системы Ах = у для правой части ау\ + Ру2. 6.5-17.5 Псевдообратная матрица Матрица псевдообратного оператора в естественных базисах называется псевдообратной или обобщенной обратной, для матрицы А и обозначается А+. Если матрица А имеет размер п х т, то матрица Л+имеет размер тхп. 6.5-18.5 Представление нормального псевдорешения Для нормального псевдорешения jc0 системы линейных алгебраических уравнений Ах =у справедливо равенство Хо = А+у. Дополнение. По форме это есть повторение определения 6.5-15 псевдообратного оператора. Однако установление линейности псевдообратного оператора позволяет перейти от символической записи А+у к произведению псевдообратной матрицы А+ и вектор-столбца у9 заданных в естественном базисе. 6.5-19.5 Комментарий (о псевдообратной матрице) Именно это равенство является основным мотивом для детального изучения свойств псевдообратных матриц, т. к. показывает "похожесть" псевдообратной и обратной матриц в отношении описания решений систем линейных алгебраических уравнений.
214 Часть I. Математические сведения по линейной алгебре 6.5-20.5 Матрица 0* Матрица, псевдообратная для нулевой, является нулевой. Дополнение. Если матрица нулевая, то она соответствует нулевому оператору А. Согласно 6.5-1 нормальное решение системы О*Одг = 0*у является нулевым при любом векторе^. Следовательно, по определению 6.5-8 при любом у нулевым является нормальное псевдорешение системы Ох = у. В соответствии с определением 6.5-15 заключаем, что оператор А* нулевой. Так как согласно 6.5-16 псевдообратный оператор линейный, то нулевому оператору А' соответствует нулевая матрица. Поэтому 0+ = 0. 6.6. Свойства псевдообратной матрицы 6.6.1. Столбцы и строки матриц Д А*, А+ 6.6-1.5 Ядро матрицы А и столбцы матрицы А+ Каждый вектор-столбец матрицы А+ ортогонален ядру матрицы А. Дополнение. Согласно определениям 6.5-15 псевдообратного оператора и 6.5-17 псевдообратной матрицы каждый вектор-столбец матрицы А+ есть нормальное псевдорешение системы Ах = у, где у есть один из векторов естественного базиса. Согласно 6.5-10 каждый вектор-столбец матрицы А+, как и любое другое нормальное псевдорешение, ортогонален ядру матрицы А. 6.6-2.5 Связь столбцов матриц А* и А* Каждый вектор-столбец матрицы А+ есть линейная комбинация вектор-столбцов матрицы А*. Дополнение. Каждый вектор-столбец матрицы А* согласно определениям 6.5-15, 6.5-17 есть некоторое нормальное псевдорешение системы уравнений с матрицей А. Согласно 6.5-10 он принадлежит imA*. Но как следует из 6.4-5, \п\А* есть линейная оболочка вектор-столбцов матрицы А*. Поэтому каждый вектор-столбец матрицы А+ есть линейная комбинация вектор-столбцов матрицы А*. 6.6-3.5 Представление матрицы А* Матрица А+ представима в виде А+ = Л*У, где V— некоторая квадратная матрица. Дополнение. Это есть прямое следствие 6.6-2. Для всех / вектор-столбец с номером / матрицы V состоит из коэффициентов разложения вектор-столбца с номером / матрицы А+ по вектор-столбцам матрицы А*. 6.6-4.5 Зависимость столбцов матриц А* и А* Обозначим через а* /-й вектор-столбец матрицы А*, через а* — /-й вектор-столбец матрицы А+. Система вектор-столбцов я,+ ,..., а] линейно зависима (линейно незави-
6. Системы линейных алгебраических уравнений 215 сима) тогда и только тогда, когда линейно зависима (линейно независима) система вектор-столбцов я*,..., я* . Это верно для любой выборки индексов /ь ..., /г. Дополнение. Пусть сделана некоторая выборка индексов /ь ...,/г. Согласно определениям 6.5-15 псевдообратного оператора и 6.5-17 псевдообратной матрицы /-й вектор-столбец а* матрицы Л+ есть нормальное решение системы А*Аа* =А*е., где е. есть /-й вектор-столбец естественного базиса. Ясно, что A*ei -a*. Согласно 6.5-16 псевдообратный оператор линейный, поэтому любой линейной комбинации а^* + ... + агя* будет соответствовать линейная комбинация а, я,* +... + агя* . Допустим, что система я* ,..., я* линейно зависима. Согласно 2.1-10 существуют такие числа аь ..., а„ не все равные нулю, что ос,я* + ... + ага* = 0 . Следовательно, вектор а,а* + ... + агя,+ будет удовлетворять системе А* А(а1а^ + ... + агя*) = 0. Этот вектор представляет нормальное решение. Согласно 6.5-1 он должен иметь минимальную длину, т. е. а,я* + ... + агя* =0. Не все числа схь ...,а, равны нулю, поэтому система я* +... + а* линейно зависима. Пусть теперь система я* + ... + а] линейно зависима. Снова существуют такие числа cti, ...,ar, не все равные нулю, что а, д/ +... + агя* = 0. Теперь в системе А*А(а{а+ +... + агя;) = а1я* +... + агя* слева стоит нулевой вектор. Следовательно, с^я* +... + агя* =0. Не все числа аь -.., а, равны нулю. Поэтому система я* ,;.., я* линейно зависима. Таким образом, линейно зависимой системе вектор-столбцов я* ,..., я* матрицы А* соответствует линейно зависимая система вектор-столбцов а] ,..., а] матрицы А+ и наоборот. Очевидно, аналогичное соответствие имеется в отношении линейной независимости. 6.6-5.5 Ранги матриц /Г и А+ Для любой матрицы А выполняется равенство rank A* = rank A+. Дополнение. Согласно 6.6-4 базы вектор-столбцов матриц А* и А+ имеют одинаковое число векторов. В соответствии с 2.2-7, 4.3-5 это означает, что rank Л* = rank>4+. Б.6-6.5 Матричное уравнение для А* Рассмотрим матричное уравнение A*AZ = A*, где матрица А размера пхт задана, матрица Z размера тх п неизвестна. Матрица А+ удовлетворяет этому уравнению,
216 Часть I. Математические сведения по линейной алгебре Дополнение. Как уже отмечалось в дополнении к 6.6-4, /*-й вектор-столбец а] матрицы А+ есть нормальное решение системы А * Аа] - А * ei, где е, есть /-й вектор-столбец естественного базиса. Если собрать вектор-столбцы а] в матрицу А+, а вектор-столбцы ef в единичную матрицу Е, то получим матричное равенство 6.6-7.5 Связь строк матриц А* и А* Каждая вектор-строка матрицы А* есть линейная комбинация вектор-строк матрицы А\ Дополнение. Согласно 6.6-6 справедливо равенство А* = (А*А)А+. Все остальное следует из утверждений 3.2-42, 3.2-43. 6.6-8.5 Еще раз об этой связи Каждая вектор-строка матрицы А+ есть линейная комбинация вектор-строк матрицы А*. Дополнение. Согласно 4.3-5, 6.6-5 системы вектор-строк матриц А* и А+ имеют одинаковые ранги. Согласно 6.6-7 вектор-строки матрицы А* линейно выражаются через вектор-строки матрицы А*. На основании 2.2-12 заключаем, что эти системы эквивалентны. Принимая во внимание определение 2.2-2, устанавливаем, что вектор-строки матрицы А+ линейно выражаются через вектор-строки матрицы А*. 6.6-Э.5 Другое представление матрицы А* Матрица А+ представима в виде UA*, где U— некоторая квадратная матрица. Дополнение. Это есть прямое следствие 6.6-8. Для всех i вектор-строка с номером / матрицы U состоит из коэффициентов разложения вектор-строки с номером / матрицы А+ по вектор-строкам матрицы А*. 6.6-10.5 Образы и ядра матриц А* и А* Для псевдообратной матрицы А+ и сопряженной матрицы А* совпадают как образы, так и ядра. Дополнение. В полной аналогии с дополнением к 6.6-8 доказывается, что системы вектор-столбцов матриц А* и А+ эквивалентны. Нужно лишь вместо ссылки 6.6-7 взять 6.6-2. Поэтому im^* = im^+ согласно 2.2-4. Согласно 6.6-9 имеем Л+=Ш*. Кроме этого, согласно 6.6-6 имеем А* = (А*А)А+. Поэтому из A*x = Q следует А+х = 0 и наоборот. Следовательно, ker A* = ker A+.
6. Системы линейных алгебраических уравнений 217 6.6.2. Свойства минимальности 6.6-11.5 Минимальность ранга матрицы А* Среди всех решений матричного уравнения A*AZ:=zA* матрица А+ имеет минимальный ранг. Дополнение. По условию А* = A*AZ. Поэтому согласно 4.3-16 имеем rank A*< min{rank A*, rank A, rank Z}. Но согласно 4.3-17 rank A = гапкЛ*. Поэтому rankZ> rank А*. Но при 2 = АУ уравнение A*AZ-A* удовлетворяется в соответствии с 6.6-6. Кроме этого, согласно 6.6-5 имеем mnkA+ = rank Л*, что и подтверждает справедливость утверждения. 6.6-12.5 Минимальность длины столбцов А* Среди всех решений матричного уравнения A*AZ = A* матрица А+ имеет минимальную сумму квадратов модулей элементов по каждому столбцу. Дополнение. Ясно, что /-й вектор-столбец z,- матрицы Z есть решение системы уравнений A*Az; = A*eh где е, есть /-й вектор-столбец естественного базиса. Но /-й вектор-столбец а[ матрицы А+ есть нормальное решение той же системы. Согласно 6.5-1 имеем |z,|2 > | а* |2 для всех /. 6.6-13.5 Минимальность элементов А+ Среди всех решений матричного уравнения A*AZ = A* матрица А+ имеет минимальную сумму квадратов модулей всех элементов. Дополнение. Предположим, что существует матрица Z, у которой сумма квадратов модулей всех элементов меньше, чем у матрицы А+. Тогда для какого-то /-го столбца Zj матрицы Z сумма квадратов модулей его элементов должна быть меньше, чем для /-го столбца а] матрицы А+. Но это невозможно согласно 6.6-12. 6.6-14.5 Свойства матричной невязки Рассмотрим матрицу А размера пх m и единичную матрицу Е размера пх п. Составим матрицу B(Z) ~ AZ-E размера пх п, где Z— любая матрица размера тпхп. Среди всех матриц Z матрица А+ минимизирует сумму квадратов модулей всех элементов матрицы B(Z)9 и среди всех матриц, минимизирующих эту сумму, минимизирует сумму квадратов модулей всех элементов матрицы Z. Дополнение. Обозначим через z,- z-й вектор-столбец матрицы Z, через е, обозначим /-й вектор-столбец естественного базиса. Тогда /-й вектор-столбец матрицы B{Z) есть Azi - е,. Согласно 6.5-4 это есть невязка вектора z,- по отношению к системе уравнений с матрицей А и правой частью eh В соответствии с 6.5-6 минимум длины невязки достигается на псевдорешениях, а на них согласно 6.5-1 нормаль-
218 Часть I. Математические сведения по линейной алгебре ное псевдорешение обеспечивает минимум длины самих псевдорешений. Всеми этими свойствами обладает /-и вектор-столбец матрицы А+. Поэтому утверждение справедливо для каждого отдельного столбца матрицы B(Z) и, следовательно, для всей матрицы. Последнее доказывается аналогично дополнению к 6.6-13. 6.6-15.5 Комментарий (о "похожести" А и А*) Если матрица А невырожденная, то В(А~') = 0 и, следовательно, сумма квадратов модулей элементов матрицы ВG) на матрице А~1 достигает своего абсолютного минимума. Матрица А+ минимизирует эту сумму в случае произвольной матрицы А. Это обстоятельство также подчеркивает "похожесть11 псевдообратной и обратной матриц. 6.6.3. Матричное определение А* 6.6-1 б.5 Комментарий (обоснование матричного определения) До сих пор мы изучали свойства псевдообратной матрицы как свойства матрицы оператора, названного нами псевдообратным, в естественных базисах. Многие свойства псевдообратной матрицы удобнее изучать, используя эквивалентное матричное определение. 6.6-17.3 Критерий для нулевой матрицы Матрица F является нулевой тогда и только тогда, когда является нулевой хотя бы одна из матриц F*F или FF*. Дополнение. Если матрица F нулевая, то очевидно будут нулевыми матрицы F*F и FF*. Если нулевой будет одна из матриц F*F или FF*, то нулевыми будут ее диагональные элементы и, следовательно, ее след. Согласно 3.3-9 отсюда заключаем, что нулевой будет матрица F. 6.6-18.5 Матричные соотношения для А+ Пусть дана матрица А размера n х m. Рассмотрим матричные соотношения А*АХ=А*У X=UA*=A*V, определяющие неизвестную матрицу X размера т х и, где U и V— какие-то квадратные матрицы порядков соответственно тип. Этим соотношениям удовлетворяет матрица X = А+, и только она. Дополнение. Согласно 6.6-3, 6.6-6, 6.6-9 этим соотношениям удовлетворяет матрица А+. Допустим, что существует еще одна матрица А , также удовлетворяющая указанным соотношениям. Из равенств А*АА+=А*АА = А*9 A+=UA* = A*V, A = UA* = A*V, полагая D = A+-A, G = U-U, H = V-V,
6. Системы линейных алгебраических уравнений 219 находим, что A*AD = 0. Далее получаем, что С учетом 6.6-17 матрица AD = 0. И, наконец, имеем D*D = (A*H)*D = H*(AD) = 0, что означает D = 0 и А- А*. 6.6-19.5 Эквивалентность определений Определения 6.5-17 и 6.6-18 псевдообратной матрицы эквивалентны. Дополнение. Это является следствием единственности решения матричных соотношений из 6.6-18 и единственности матрицы линейного оператора в заданных базисах. 6.6-20.5 Псевдообратная матрица и полный ранг Если матрица А размера пхт имеет полный ранг, то A 1А*(ЛА*У\п<т. Дополнение. Проверим выполнение матричных соотношений из 6.6-18, ограничившись случаем п> т. А*А(А*А)~ 1А* = (А*А)(А*А)~ 1А* =А\ (A*A)~XA* = UA\ и=(А*А)~\ (А*А)~ 1А* - (А*А)(А*АУ \А*А)~ 1А* = А*У, V = A((A*A)~ lJA*. 6.6.4. Скелетное разложение и матрица А+ 6.6-21.5 Комментарий (другие определения) Отметим, что кроме указанных существует много других эквивалентных определений псевдообратной матрицы. Доказательство эквивалентности облегчается тем, что для псевдообратной матрицы известно вполне приемлемое для использования матричное представление. 6.6-22.5 Одно разложение матрицы Пусть А — прямоугольная матрица размера пх. ти ранга г > 0. Существуют матрицы В и С размеров, соответственно, пхгигхтк ранга г такие, что А = ВС. Дополнение. Выберем в матрице А любые базисные столбцы и составим из них матрицу В. Согласно 4.3-5 матрица В имеет размер пхги ранг, равный г. Каждый столбец матрицы А линейно выражается через выбранные базисные столбцы. Со-
220 Часть I. Математические сведения по линейной алгебре ставим матрицу С размера rxm,y которой в качестве элементов /-го столбца взяты коэффициенты разложения /-го столбца матрицы А по ее базисным столбцам. По построению А = ВС. В матрице С столбцы, соответствующие г выбранным базисным столбцам матрицы А, являются единичными. Они линейно независимы. Следовательно, rank С>г. Но строгое неравенство здесь невозможно, т. к. число строк в матрице С равно г. Поэтому rank С = г. 6.6-23.5 Скелетное разложение матрицы Разложение А = ВС из утверждения 6.6-22 называется скелетным разложением матрицы/!. 6.6-24.5 Объяснение скелетного разложения В скелетном разложении в качестве столбцов матрицы В можно взять любые базисные столбцы матрицы А. Тогда столбцы матрицы С состоят из коэффициентов линейных комбинаций, с помощью которых выражаются все столбцы матрицы А через базисные. Дополнение. Это доказано в дополнении к 6.6-22. 6.6-25.5 Представление псевдообратной матрицы Если матрица А представлена своим скелетным разложением А = ВС, то А+ = С\СС*)~ \В*В)~ 1В* = С*(В*АС*У 1В*. Дополнение. Проверим выполнение матричных соотношений из 6.6-18 А*АА+ = С*В*ВСС*(СС*У \В*В)" 1В* = С*В* = А\ А+ = Ш*9 ?/= С*(СС*У \В*ВУ \СС*У 1С, A+ = A*V, V= В(В*ВУ \СС*У \В*ВУ ХВ\ Второе равенство для А+ становится очевидным, если вместо матрицы А подставить ее представление А = ВС. 6.6-26.5 Скелетные разложения для разных матриц Если А = ВС есть скелетное разложение матрицы А, то А* = С* В\ А+ = СВ\ с" = с\ссу \в+ = (в*ву 1в* суть скелетные разложения соответственно для матриц Л*, А+, С*, В+. Дополнение. Пусть матрица А имеет размер n x w, ранг г > 0 и скелетное разложение А - ВС. По определению 6.6-22, 6.6-23 матрицы В, С имеют ранг г и размеры, соответственно, пх ги гх т. Согласно 4.3-16, 4.3-17, 6.6-5 ранги сомножителей в правых частях всех равенств утверждения равны г и сами сомножители
6. Системы линейных алгебраических уравнений 221 имеют "нужные" для скелетных разложений размеры. Ранги матриц в левых частях равенств также равны г. Первое из равенств утверждения очевидно. Справедливость остальных равенств устанавливается непосредственной проверкой выполнения матричных соотношений из 6.6-18. 6.6-27.5 Свойства псевдообратной матрицы Матрицы А,А+9А* связаны между собой соотношениями (а*У = (аУ,(аУ=а9 {аау = аа\ (аа+J = аа\ (а+а)* = а+а, (а+аJ = а+а, а+аа+ = а+,аа+а=а. Дополнение. Все соотношения проверяются непосредственно, подставляя вместо матрицы А ее скелетное разложение, а вместо матрицы А* ее представление 6.6-25. Например, аа+ = всс*(сс*у \в*ву хв* = в(в*ву хв\ (АА+J = В(В*ВУ 1В*В(В*ВУ ХВ* = В(В*ВУ 1В* = АА+. 6.6-28.5 Другие матричные соотношения для А+ Пусть дана матрица А размера пх т. Рассмотрим матричные соотношения AXA=A,X=UA*=A*V, определяющие неизвестную матрицу X размера т х п, где U и V— какие-то квадратные матрицы порядков соответственно тип. Этим соотношениям удовлетворяет матрица Х=А+, и только она. Дополнение. Покажем сначала, что матрица А+ удовлетворяет этим соотношениям, для чего воспользуемся скелетным разложением А = ВС матрицы А и представлением 6.6-25 матрицы А+: АА+А = ВСС*(СС*У \В*ВУ 1В*ВС = ВС = А, а+ = ш\ и=с*(сс*у \в*ву \сс*у 'с, A+ = A*V,V= В(В*ВУ \СС*У \В*ВУ V. Допустим, что существует еще одна матрица А , также удовлетворяющая указанным соотношениям. Из равенств = АУ A+=UA*=A*V, A = UA* полагая D = A+-A, G = U-U, H = V-V, находим, что
222 Часть I. Математические сведения по линейной алгебре Далее получаем, что (DA)*DA = A*D*DA = A*H*(ADA) = 0. С учетом 6.6-17 матрица DA = 0. И, наконец, имеем DD* = DAG* = 0, что означает D = 0, т. е. А = А+. 6.6-29.5 Уравнения Пенроуза Пусть дана матрица А размера n x m. Рассмотрим матричные соотношения АХА=А, ХАХ=Х, (ХА)*=ХА,(АХ)*=АХ, определяющие неизвестную матрицу X размера т х п. Этим соотношениям удовлетворяет матрица Х- А+, и только она. Дополнение. Покажем сначала, что матрица А+ удовлетворяет этим соотношениям, для чего воспользуемся скелетным разложением А = ВС матрицы А и представлением 6.6-25 матрицы А+: АА+А = ВСС\СС*Т \В*ВУ 1В*ВС = ВС = А9 А+АА+ = С\СС*У \В*В)~ 1В*ВСС*(СС*У \В*В)~ 1В* = А\ (А+А)* = (С*{СС*У \В*В)' lB*BQ* = A"A, У = (всс\сс*у \в*ву 1ву = аа\ Допустим, что существует еще одна матрица А , также удовлетворяющая указанным соотношениям. Из равенств АА+А=ААА=А, полагая D = А+ - А , находим, что ADA = 0. Далее из равенств (А+А)* = А+А, (АА)*= АА, (АА+)* = АА\ (АА)*=АА получаем такие равенства )* = DA,(AD)*=AD. Умножая первое равенство слева на матрицу А, а второе— справа, заключаем, что AA*D* = D*A*A = 0. Теперь находим (DA)(DA)* = DAA*D* = D(AA*D*) = 0. Согласно 6.6-17 матрица DA = 0, т. е. А*А =АА. Наконец, из равенств А+АА+ = А+, ААА=А
6. Системы линейных алгебраических уравнений 223 получаем, что A+AD = D. В соответствии с 6.6-9 имеем D = A+AD = UA*AD = U(D*A*A)* = 0. Это означает единственность решения матричных уравнений Пенроуза. 6.6.5. Проекторы 6.6-30.5 Проекция и матрица АА* Всегда primAy = AA+y. Дополнение. Согласно 6.4-9 представим вектор у в виде суммы y = u + v, где u e ker A*, v e im/L Очевидно, что у4*м = 0, v = Ax для некоторого вектора х. Принимая во внимание 6.6-9 и используя 6.6-25, имеем АА+у = AA+u + AA+v = AUA*u+AA+Ax = Ах = v. Ясно, 4Tov = primy4<y. 6.6-31.5 Проекция и матрица А+А Всегда primy4*x = ^+^х. Дополнение. Согласно 6.4-9 представим вектор х в виде суммы х = w + z, где w е ker /4, z е im >4*. Очевидно, что Aw = 0, z = A*f для некоторого вектора/ Принимая во внимание 6.6-25 имеем А+Ах = A+Aw+A+Az = A+AA*f=A*f= z. Ясно, что z = prim/,*x. 6.6-32.5 Ортогональный проектор Матрица у4у4+ (А+А) называется ортогональным проектором на подпространство \тА (im^*). При этом ортогональность понимается в смысле скалярного произведения 5.1-8 в естественных базисах. 6.6-33.5 Об одном свойстве матрицы АА+ Псевдорешения системы Ах=у, и только они, являются решениями системы Ах = АА+у. Дополнение. Это есть прямое следствие 6.5-7, 6.6-30. 6.6-34.5 Нахождение проекции на подпространство Пусть в пространстве со скалярным произведением заданы подпространство L и вектор у. Выберем в L любую систему линейно независимых векторов аъ ..., ат, линейная оболочка которых совпадает с L. Обозначим через y9ai9i: = 1,..., т, векторы
224 Часть I. Математические сведения по линейной алгебре арифметического пространства, координаты которых совпадают с координатами разложения соответствующих векторов по векторам любого ортонормированного базиса пространства. Обозначим через А матрицу, столбцами которой являются векторы ai¦,, i = 1,..., m . Тогда ортогональная проекция вектора ^у на подпространство L определяется формулой рг, у = АА+ у. Здесь prL у есть вектор арифметического пространства, координаты которого совпадают с координатами разложения вектора pr^y по векторам того же ортонормированного базиса пространства. Дополнение. Рассмотрим любое комплексное (вещественное) линейное пространство X со скалярным произведением и арифметическое пространство X над тем же полем и той же размерности. Выберем в X любой ортонормированный базис. Каждому вектору х е X поставим во взаимно однозначное соответствие вектор хе X, составленный из координат вектора х в выбранном базисе. Введем в X скалярное произведение в соответствии с 5.1-8. Согласно 5.2-9, 5.2-20 установленное соответствие между X и X есть унитарный (евклидов) изоморфизм. Поэтому проекции ргду вектора у на любое подпространство LczX будет соответствовать prL у . По построению образ матрицы А совпадает с линейной оболочкой векторов ах, / = 1,..., m . Поэтому справедливость утверждения следует из 6.6-30. 6.6.6. Сопряженные системы уравнений 6.6-35.5 Нормальные псевдорешения системы и сопряженной Рассмотрим систему Ах=у и сопряженную систему A*u = v. Нормальные псевдорешения х0, Но этих систем связаны между собой соотношениями (jc0, v) = (у, u0). Дополнение. Принимай во внимание 5.2-25, 6.5-18, 6.6-27, имеем (xo,v) = (А+у, v) = (у, (АУу) = (у, (Л*)+у) = (у, щ). 6.6-36.5 Комментарий (система с многими правыми частями) Мы хотим обратить внимание на следующее обстоятельство. В практических задачах довольно часто приходится решать системы с одной и той же матрицей А, но с различными правыми частями у. При этом нередко интерес представляют не сами решения, а некоторые линейные функционалы от них. Известно, что линейный функционал может быть представлен как скалярное произведение с фиксированным вектором. Поэтому вместо того, чтобы каждый раз решать систему и затем вычислить линейный функционал, согласно 6.6-35 можно один раз решить сопряженную систему, а каждый раз вычислять только линейный функционал. Принимая во внимание, что
6. Системы линейных алгебраических уравнений 225 решение системы является исключительно трудоемкой задачей, нетрудно понять преимущество второго подхода. 6.7. Линейные многообразия и линейные системы 6.7.1. Плоскость 6.7-1.4 Плоскость и линейное многообразие Пусть L — некоторое подпространство линейного пространства К и х0 — некоторый вектор из К. Множество Н векторов z ~ Xq + у9 где у — любой вектор из L, называется линейным многообразием или плоскостью в линейном пространстве. Вектор х0 называется вектором сдвига, подпространство L— направляющим подпространством. Размерностью линейного многообразия называется размерность его направляющего подпространства. Обозначается линейное многообразие или плоскость символом 6J-2.4 Однозначность направляющего подпространства Каждая плоскость однозначно определяет свое направляющее подпространство и неоднозначно — вектор сдвига. Дополнение. Предположим, что существует еще одно направляющее подпространство U и вектор сдвига х'о, образующие ту же плоскость Я. Тогда для любого z е Я имеем z = xo+y, где у е L, и в то же время z = х'о + /, где/ б U. Отсюда следует, что подпространство U есть совокупность векторов из К, определяемых формулой у = (х0 - х'о) +у. Так как нулевой вектор принадлежит Z/, то из последней формулы следует, что (х0 - х'о) е L. Но это означает, что подпространство I! состоит из тех же векторов, что и подпространство L. Вектор сдвига может быть изменен на любой вектор из L. 6.7-3.4 Единственность ортогонального вектора сдвига Для каждой плоскости существует единственный вектор сдвига, ортогональный направляющему подпространству. Дополнение. Согласно 5.4-14 представим вектор сдвига яг0 в виде суммы *о= g + К где g e L,h LL. Как отмечалось в дополнении к 6.7-2, в качестве вектора сдвига *о можно взять вектор х'о = х0 - g, т. к. - g e L. Но х'о = h и поэтому х'о ±L. Единственность сдвига, ортогонального подпространству L, следует из единственности разложения jc0 = g + h, где g e L,h A.L. 8 Зак.740
226 Часть I. Математические сведения по линейной алгебре 6.7-4.4 Пересечение плоскостей Если пересечение плоскостей содержит вектор jc0, то оно представляет собой плоскость, образованную сдвигом пересечения направляющих подпространств на вектор х0. Дополнение. Пусть плоскость Нх образована сдвигом подпространства Lb плоскость Н2 — сдвигом подпространства L2. Обозначим Н=НХГ\НЪ L = LxnL2. По условию существует вектор х0 е И. Предположим, что существует еще некоторый вектор Х\ е Н. Представим его в таком виде: Теперь из последовательности соотношений хьхое Н->хх,х0 е Нх\хх,х0 е Н2->(хх -х0) е Lx; (*i -*о) е L2 -> (хх -х0) е L заключаем, что любой вектор пересечения Н может быть представлен как сумма вектора х0 и некоторого вектора из пересечения L. Возьмем далее произвольный вектор z e L. Имеем z е L -» z е L\\ z е L2 -> (х0 + z) е Нх\ (х0 + z) е Н2 -> (дг0 + z) e H, то есть любой вектор подпространства L, сдвинутый на вектор дс0, принадлежит пересечению Н. 6.7-5.4 Гиперплоскость В линейном пространстве размерности m любая плоскость размерности m - 1 называется гиперплоскостью. 6.7-6.4 Прямая линия Плоскость размерности 1 называется прямой линией. 6.7.2. Гиперплоскость и прямая 6.7-7.4 Уравнение гиперплоскости В пространстве со скалярным произведением любая гиперплоскость может быть задана уравнением (х9 а) =у, где а— ненулевой вектор, называемый нормальным, у — число. Дополнение. Пусть гиперплоскость И образована сдвигом (т- 1)-мерного подпространства L на вектор х0. Согласно 5.3-6 ортогональное дополнение L1 является одномерным подпространством. Обозначим через а любой его ненулевой вектор. Вектор х е Н тогда и только тогда, когда (х - Хо) е L. В свою очередь, это условие выполняется тогда и только тогда, когда (х-х0, а) = 0. Обозначив у = (х0, а\
6. Системы линейных алгебраических уравнений 227 получаем, что все векторы гиперплоскости и только они могут быть заданы уравнением (л:, а) = у. 6.7-8.4 Другое уравнение гиперплоскости Пусть гиперплоскость задана уравнением (х, а) - у и х0 — ее вектор сдвига. Тогда уравнение (х - х0, а) = 0 описывает ту же гиперплоскость. Дополнение. Очевидно, принимая во внимание дополнение к 6.7-7. 6.7-9.4 Ортогональность нормальному вектору Пусть гиперплоскость задана уравнением (х, а) - у. Тогда все векторы ее направляющего подпространства ортогональны нормальному вектору а. Дополнение. Очевидно, принимая во внимание дополнение к 6.7-7. 6.7-10.4 Коллинеарность с нормальным вектором Пусть х0 — вектор сдвига, ортогональный направляющему подпространству гиперплоскости, заданной уравнением (х, а) =у. Тогда векторы Хо и а коллинеарны. Дополнение. Векторы х0 и а ортогональны L, т. е. принадлежат L1. Но подпространство L1 согласно 5.3-6 одномерное. Поэтому векторы xq и а коллинеарны. 6.7-11.4 Расстояние между вектором и гиперплоскостью Расстояние между вектором v и гиперплоскостью Я, заданной уравнением (х, а) = у9 равно p(v,H) = \(v,a)-y\/\a\. Дополнение. Пусть гиперплоскость Н задана уравнением (х,а)-у. Ее направляющее подпространство L есть гиперплоскость, заданная уравнением (х, а) = 0. Очевидно, что ортогональное дополнение L1 представляет множество векторов, коллинеарных вектору а. Обозначим через #о вектор сдвига гиперплоскости Н. Согласно определению 5.4-8 и принимая во внимание 5.4-18, имеем p(v, Н) = inf |v - z\ = inf |(v - *0) ~(z- xo)\ = inf |(v - x0) - x\ = ort^v - *0)| = |a«| zeH zsH z&L для некоторого числа a. Это число а можно определить из условия, что вектор (v -Хо + аа) е L. Так как дг0 е //, то (х0, а) =у. Следовательно, (v -х0 + аа, а) = (v, а) - (х0, а) + a(a, a) = (v, a) -у + а(а, а) = 0. Отсюда находим a = (у - (v, a))/(a9 а). Поэтому p(v,H) = \(y,a)-y\/\a\.
228 Часть /. Математические сведения по линейной алгебре 6.7-12.4 Проекция вектора на гиперплоскость Любой вектор/пространства может быть единственным образом представлен в виде суммы /= g + h, где g принадлежит гиперплоскости Я, а Л ортогонален направляющему подпространству. Вектор g называется проекцией вектора /на гиперплоскость Я и обозначается Дополнение. Согласно 6.7-1, 6.7-3 представим гиперплоскость Я в виде Я = хо+ U где L — направляющее подпространство, вектор х$ J_ L, Согласно 5.4-14 имеем /= рг7/+ оП/= (рг//+ х0) + (ortj-xo). Первое слагаемое принадлежит гиперплоскости Я, второе ортогонально L, Единственность этого разложения следует из единственности разложения вектора на проекцию и перпендикуляр по отношению к подпространству. 6.7-13.4 Формульное представление проекции Если гиперплоскость Я задана уравнением (х, а) = у, то имеет место равенство Дополнение. Если гиперплоскость Я задана уравнением (х, а)=у, то любой вектор, ортогональный направляющему подпространству, имеет вид аа для некоторого числа а. Поэтому для любого вектора /согласно 6.7-12 имеет место единственное разложение /= рг//+ оса. Число а определяется из условия принадлежности вектора f-aa гиперплоскости Я Имеем {f- aa, a)-y = (f9a)-y- а(я, а) = 0. Следовательно, а = ((/*, а) ~у)/(а, а) и поэтому 6.7-14.4 Направляющий вектор прямой Любая прямая линия есть множество векторов вида z - Хо + tq, где / — числа, *о, q — заданные векторы. Вектор q называется направляющим вектором прямой. Дополнение. Все векторы одномерного подпространства коллинеарны, т. е. имеют вид tqy где q — любой ненулевой вектор подпространства, t — любое число. Если jc0 — вектор сдвига одномерной плоскости, то все векторы прямой линии имеют вид z = дг0 + tq.
6. Системы линейных алгебраических уравнений 229 6.7-15.4 Взаимное расположение прямой и гиперплоскости Пусть заданы прямая линия и гиперплоскость. Возможны три ситуации: • прямая имеет одну общую точку с гиперплоскостью; • прямая целиком принадлежит гиперплоскости; • прямая не имеет общих точек с гиперплоскостью. В первом случае говорят, что прямая пересекает гиперплоскость, во втором — принадлежит гиперплоскости, в третьем — параллельна гиперплоскости. * Дополнение. Пусть векторы прямой линии имеют вид jco + tq, векторы гиперплоскости представлены суммой z0 + L для некоторого подпространства L размерности т - 1. Возможно, не существует такого числа / и вектора jc e L, что выполняется равенство zo + х ~ х0 + tq. Тогда прямая не имеет общих точек с гиперплоскостью. Предположим теперь, что прямая и гиперплоскость имеют две различные общие точки, т. е. существуют такие числа t\ Ф t2 и векторы xh x2 e L, что z0 + Х\ = Xo+t}q9 zo+x2 = xo+t2q. Отсюда находим 1 ( \ г\ г1 Теперь для любой точки прямой имеем 2* z0 + х, *\ ~*2 Сумма слагаемых, кроме первого, в правой части есть линейная комбинация векторов х\9х2. Она принадлежит L, так как L есть подпространство. Поэтому при любом t вектор jc0 + tq принадлежит гиперплоскости. Следовательно, если прямая и гиперплоскость имеют две различные общие точки, то прямая целиком принадлежит гиперплоскости. Наконец, остается еще один случай, когда прямая имеет с гиперплоскостью только одну общую точку. 6.7.3. Геометрическая интерпретация систем уравнений 6.7-1 б.4 Система уравнений и гиперплоскости Систему линейных алгебраических уравнений 6.1-1, заданную над полем комплексных или вещественных чисел, можно рассматривать как систему гиперплоскостей (х, а{) =уи (х, а2) =уъ ..., (х, ап) =уп в арифметическом пространстве, а решение системы — как векторы, принадлежащие пересечению этих гиперплоскостей.
230 Часть I. Математические сведения по линейной алгебре Дополнение. Предположим для определенности, что коэффициенты матрицы системы и правые части из 6.1-1 являются комплексными числами. Обозначим через х = (Х], ...,хт) вектор-решение, через я, = (я/р..., а^}) вектор коэффициентов /-го уравнения. Пусть скалярное произведение в арифметическом пространстве размерности т введено аналогично 5.1-8. Тогда система линейных алгебраических уравнений 6.1-1 может быть записана так: (х, в\)=Уи (х, а2) =уъ ..., (*, а„) =у„. Каждое из равенств представляет уравнение гиперплоскости. Следовательно, решения системы можно рассматривать как векторы, принадлежащие пересечению этих гиперплоскостей. 6.7-17.4 Общее решение системы как плоскость Общее решение системы линейных алгебраических уравнений представляет собой либо пустое множество, либо плоскость. Размерность этой плоскости равна разности между размерностью пространства и рангом линейной оболочки векторов яь ..., ап. Дополнение. Если множество решений системы не пусто, то оно представляет пересечение гиперплоскостей согласно 6.7-16. Согласно 6.7-4 это пересечение есть плоскость. Ранг линейной оболочки векторов аь ¦•-, ап равен рангу системы вектор-строк матрицы А . С учетом комплексного сопряжения и 4.3-5 эти ранги равны рангу матрицы А. Теперь размерность пересечения гиперплоскостей определяется утверждением 6.3-4. 6.7-18.5 Минимальность псевдорешений Пусть система уравнений 6.1-1 задана системой гиперплоскостей 6.7-16, причем векторы аь ..., ап нормированные. Тогда множество псевдорешений системы 6.1-1 совпадает с множеством векторов пространства, для которых сумма квадратов расстояний до всех гиперплоскостей 6.7-16 является минимальной. Дополнение. Обозначим через Я, /-ю гиперплоскость. Согласно 6.1-1, 6.5-4, 6.7-16,6.7-11 имеем Согласно 6.5-6 псевдорешения, и только они, обеспечивают минимальность длины вектора-невязки или, что то же самое, минимальность суммы квадратов расстояний до всех гиперплоскостей 6.7-16. 6.7-19.4 Более близкий к решениям вектор Пусть совместная система уравнений 6.1-1 задана системой гиперплоскостей 6.7-16. Рассмотрим любой вектор/, не лежащий на /-и гиперплоскости. Его проекция на /-ю гиперплоскость ближе к любому решению системы в смысле расстояния 5.4-6, чем вектор/
6. Системы линейных алгебраических уравнений 231 Дополнение. Рассмотрим решение х. Как и любое другое решение совместной системы, вектор х принадлежит всем гиперплоскостям 6.7-16, в том числе /-й. Согласно 6.7-12 представим вектор /в виде суммы /= g + h, где g принадлежит /-й гиперплоскости, a h ортогонален ее направляющему подпространству. Имеем f~x = (g-x) + h. Вектор g-x принадлежит направляющему подпространству, поэтому векторы g-x и h ортогональны. Согласно 5.4-3 имеем \f-x\2 = \g-x\2 + h2. Так как вектор / не принадлежит /-й гиперплоскости, то h Ф 0. Следовательно, 6.7-20.5 Комментарий (о геометрической интерпретации) В связи с геометрической интерпретацией системы линейных алгебраических уравнений, ее решений и псевдорешений полезным является использование понятия прямой линии и исследование ее взаимного расположения с гиперплоскостью. 6.8. Матрица и определитель Грама 6.8.1. Проекция на линейную оболочку 6.8-1.4 Комментарий (значение скалярного произведения) Наличие в пространстве скалярного произведения позволяет эффективно сводить решение многих задач к решению систем линейных алгебраических уравнений. Рассмотрим некоторые из них, считая скалярное произведение в пространстве заданным. б.8-2.4 Разложение вектора и система уравнений Если для заданной системы векторов хи ..., хт и вектора х имеет место разложение то коэффициенты этого разложения удовлетворяют системе линейных алгебраических уравнений U\(x\yXm)+a2(x2,xm)+...+am(xmyxm) = Дополнение. Чтобы получить эту систему, нужно последовательно умножить разложение векторах справа скалярно на векторы хь ...,хт.
232 Часть I. Математические сведения по линейной алгебре 6.8-3.4 Проекция и решение системы Обозначим через L линейную оболочку системы векторов jci, ...,xm. Если для произвольного векторах набор чисел oti, ..., am есть какое-то решение системы 6.8-2, то Дополнение. Принимая во внимание 5.4-14, нужно показать, что вектор х-< - ... -OLmXm будет ортогонален L. Согласно 2.2-6 среди векторов Х\, ...,хт можно выбрать базис в L. Учитывая 5.3-2, заключаем, что достаточно показать, что вектор х — <Х\Х\ -... -OLmXm будет ортогонален каждому изсвекторов Х\, ...,хт. Но это, очевидно, имеет место, т. к. вектор с координатами ось ..., ат есть решение системы 6.8-2 по условию утверждения. 6.8-4.4 Совместность системы Система линейных алгебраических уравнений 6.8-2 всегда совместна. Дополнение. Обозначим через L линейную оболочку векторов хи ...,хт. Принимая во внимание 5.4-14, разложим проекцию вектора х на подпространство L по векторам хи ..., хт. Пусть Согласно 5.4-14 вектор jc-pr^jc должен быть ортогонален подпространству L Учитывая 2.2-6, 5.3-2, он должен быть ортогонален каждому из векторов х\, ..., хт. Но.это условие эквивалентно тому, что вектор с координатами аь ..., ат есть решение системы 6.8-2. 6.8.2. Матрица и определитель Грама 6.8-5.4 Матрица и определитель Грама Матрица G, являющаяся транспонированной матрицей системы 6.8-2, имеет вид \х19х})(х]9х2) ...( G = и называется матрицей Грама системы векторов хьлг2, ..., Jcm. Ее определитель G(X|, ...,jcot) называется определителем Грама. 6.8-6.4 Определитель Грама и зависимость Система векторов лгь ...,хт линейно зависима тогда и только тогда, когда ее определитель Грама равен нулю.
6. Системы линейных алгебраических уравнений 233 Дополнение. Пусть система векторов хь ..., хт линейно зависима. Согласно 2.1-10 найдутся такие числа ссь ..., ат, не все равные нулю, что Умножая это равенство справа скалярно последовательно на векторы х\9 ...,хт, заключаем, что ненулевой вектор с координатами аь ...,ат является решением однородной системы вида 6.8-2. Согласно 6.3-1 это означает, что столбцы матрицы Грама линейно зависимы, а согласно 4.1-25 — что определитель Грама равен нулю. Пусть теперь определитель Грама равен нулю. В соответствии с 6.3-9 однородная система вида 6.8-2 должна иметь ненулевое решение ось ..., ат. Согласно 6.8-3 линейная комбинация а^ + ... + а^х: есть проекция нулевого вектора на линейную оболочку векторов х\9 ...,jcw. Очевидно, эта проекция должна быть нулевым вектором. Поэтому, принимая во внимание 2.1-10, заключаем, что система векторов jci, ..., хт линейно зависима. 6.8-7.4 Элементы матрицы Грама Элементы gtJ матрицы Грама в евклидовом (унитарном) пространстве удовлетворяют для всех ij соотношениям gij = gjh gu * 0 (gy = gfi, gu > 0). 6.8-8.4 Представление матрицы Грама Пусть дана система векторов jcb ---,xm. Возьмем в линейной оболочке этой системы любой ортонормированный базис еь ...,ег, где г<т. Разложив каждый из векторов xh ...,хт по векторам базиса, получим Xi = ane\ + ... +aifer для всех /= 1, ..., т. Составим прямоугольную матрицу А размера т х г с элементами а^ = а,у. Тогда для матрицы Грама G системы векторов дсь ..., хт справедливо представление G = АА*. Дополнение. В самом деле, элемент матрицы АА*, стоящий в позиции (/,Д равен Но элемент g^ матрицы G с учетом 5.2-9 равен тому же: 6.8-9.4 Определитель Грама и независимость Если система векторов хи ..., хт линейно независима, то определитель Грама для нее есть положительное число. Дополнение. Если система векторов хь ...,хт линейно независима, то матрица А из 6.8-8 будет квадратной полного ранга. Согласно 4.3-13 имеем detG = = det(X4*)>0.
234 Часть I. Математические сведения по линейной алгебре 6.8-10.4 Неотрицательность определителя Грама Определитель Грама любой системы векторов есть вещественное неотрицательное число. Дополнение. Это есть прямое следствие 4.3-11, 6.8-8. 6.8-11.4 Перемена порядка векторов Определитель Грама не изменяется при перемене местами любых двух векторов в системе jci, ...,xw. Дополнение. Если в системе векторов JC|, ...,xw меняются местами какие-либо два вектора, то вместо матрицы А из 6.8-8 будем иметь матрицу Р0А, где Ру есть элементарная матрица перестановок, соответствующая перестановке векторов. Принимая во внимание 4.1-23, 4.2-10, имеем * Р*) = (detPyJ • det(AA*) = det G. 6.8-12.4 Замена вектора линейной комбинацией Определитель Грама не изменяется от прибавления к любому вектору системы х\, ..., хт любой линейной комбинации остальных векторов. Дополнение. Очевидно, достаточно рассмотреть случай, когда к какой-то строке прибавляется другая строка, умноженная на число а. В этом случае вместо матрицы А из 6.8-8 будем иметь матрицу Ny(a)A, где Л^(а) есть элементарная неунитарная матрица, соответствующая изменению строки. Принимая во внимание 4.1-24, 4.2-10 имеем йеЩ(а)АА* W* (а)) = деЩ(а)J6ег(АА*) = det G. 6.8.3. Ортогональные системы и определитель Грама 6.8-13.4 Комментарий (зависимость от системы векторов) Естественно, матрица Грама зависит от системы векторов х\, ...9хт. Наличие скалярного произведения позволяет выбрать системы ортогональных и даже ортонормиро- ванных векторов, что делает процесс решения системы 6.8-2 тривиальным. 6.8-14.4 Ортогональная система векторов Матрица Грама ортогональной системы векторов является диагональной. 6.8-15.4 Ортонормированная система векторов Матрица Грама ортонормированной системы векторов является единичной.
6. Системы линейных алгебраических уравнений 235 6.8-1 б.4 Оценка определителя Грама Для любой системы векторов хи ..., хт евклидова или унитарного пространства справедливы неравенства причем равенство слева достигается тогда и только тогда, когда система векторов линейно зависима, а равенство справа — тогда и только тогда, когда система векторов либо ортогональна, либо содержит нулевой вектор. Дополнение. См. [5], стр. 68—71. 6.8-17.4 Еще одна оценка Для любой системы векторов х\9 ...,xm евклидова или унитарного пространства справедливо неравенство G(xu ...,*/,*/+1> ...9xm)<G(xu ...,xi)G(xi+h ...,xm), причем равенство достигается тогда и только тогда, когда либо множества векторов Х\, ...,xi и Х/+1,..., хт ортогональны, либо одно из этих множеств представляет собой линейно зависимую систему. Дополнение. См. [5], стр. 68—71. 6.8-18.4 Добавление вектора Для любой линейно независимой системы векторов лсь ...,хт евклидова или унитарного пространства и любого вектора z выполняется неравенство G(xl9...9xm) Дополнение. См. [5], стр. 68—71.
7. Многочлены 7.1. Многочлены и операции над ними 7.1.1. Группа многочленов 7.1 -1.3 Многочлен Многочленом (полиномом) п-й степени, я > О целое, от переменной х над полем Р называется функция вида fx) = аох" + аххп~1 + ... + ап. хх + ат где аь 0<i<n, фиксированные числа из поля Риао^О. Эти числа называются коэффициентами многочлена, число а0 — старшим коэффициентом. 7.1-2.3 Нулевой многочлен Число 0 поля Р по определению считается многочленом с нулевыми коэффициентами и называется нулевым многочленом или просто нулем и обозначается символом 0. Степень нулевого многочлена не определена. 7.1-З.3 Равные многочлены Два многочлена называются равными, если равны их коэффициенты при одинаковых степенях переменной х. 7.1-4.3 Свойство равенства многочленов Признак равенства многочленов есть отношение эквивалентности. Дополнение. Признак равенства многочленов есть бинарное соотношение. Очевидными являются его свойства рефлексивности, симметричности и транзитивности. Согласно 1.3-5 признак равенства есть отношение эквивалентности.
238 Часть I. Математические сведения по линейной алгебре 7.1-5.3 Равенство степеней Равные многочлены имеют одинаковые степени. 7.1-б.3 Сумма многочленов Суммой fix) + g(x) многочленов называется многочлен где ср-к = ап_к + 6д_ь причем в этих суммах недостающие коэффициенты ah bt считаются равными нулю. 7.1-7.3 Степень суммы многочленов Степень суммы многочленов fix) и g(x) не превосходит максимальную из их степеней или не определена, если fix) + g(x) есть нулевой многочлен. 7.1-8.3 Сложение с нулевым многочленом Для любого многочленах*) выполняются равенства 7.1-9.3 Противоположный многочлен Для любого многочлена fix) = aox" + alx"-x + ... + an противоположным будет многочлен Дополнение. По определению 7.1-6 суммы многочленов fix) + g(x) = 0. 7.1-10.3 Группа многочленов Множество всех многочленов над полем Р есть абелева группа по сложению. Дополнение. На множестве многочленов определена согласно 7.1-6 операция сложения. Очевидно, что она коммутативна. Существует нулевой многочлен со свойством 7.1-8. Согласно 7.1-9 для каждого многочлена существует противоположный. Согласно 1.5-9, 1.5-27 множество многочленов есть абелева группа по сложению.
7. Многочлены 239 ТА.2. Кольцо многочленов 7.1-11.3 Произведение многочлен Произведением fix) • g(x) многочленов называется многочлен h(x) = coxp + c]xp~l + ...+с„9 где ск = I aibj. / + j = к 7.1-12.3 Степень произведения многочленов Степень произведения ненулевых многочленов равна сумме их степеней. 7.1-13.3 Произведение ненулевых многочленов Произведение ненулевых многочленов не может быть нулевым многочленом. Дополнение. В любом поле произведение ненулевых чисел есть ненулевое число. Поэтому согласно 7.1-11 у многочлена, равного произведению ненулевых многочленов, заведомо ненулевым будет старший коэффициент. 7.1-14.3 Единица и минус единица Число 1 (- 1) поля Р есть многочлен нулевой степени. Он называется единицей (минус единицей) и так же обозначается символом 1 (- 1). 7.1-15.3 Представление противоположного многочлена Для любого многочлена fix) противоположным будет многочлен (- \)/(х). 7.1-1 б.3 Свойства единицы и нуля Для любого многочлена fix) выполняются равенства Л*)-1 = 1 •/*)=./(*), 7.1-17.3 Кольцо многочленов Множество всех многочленов над полем Р есть коммутативное кольцо с единицей без делителей нуля.
240 Часть I. Математические сведения по линейной алгебре Дополнение. На множестве многочленов определены операции сложения и умножения. Обе они коммутативные и ассоциативные. Легко проверить, что они связаны законом дистрибутивности. Согласно 7.1-9 сложение обладает обратной операцией. По определениям 1.6-1, 1.6-2 множество многочленов есть кольцо. Согласно 1.6-11, 7.1-13 это кольцо не имеет делителей нуля. 7.1.3. Деление многочленов 7.1-18.3 Комментарий (обсуждение кольца многочленов) Кольцо многочленов над полем Р по своим свойствам близко к кольцу целых чисел. Эта аналогия проявляется в том, что для многочленов, как и для целых чисел, имеют место понятия деления нацело, деления с остатком, делителя, наибольшего общего делителя и др. 7.1-19.3 Разложение многочлена Для любых двух многочленов fix) и g(x) над полем Р, где g(x) * 0, существует, и притом единственная, пара многочленов q(x)n r(x) над полем Р такая, что где либо г(х) = 0, либо степень г(х) меньше степени g(x). Дополнение. Будем считать, что fix) ¦*¦ О, т. к. в противном случае можно положить q(x) = 0, г(х) = 0. Пусть fix) = aox" + axx" '] + ... + am g(x) = Ь&? + b xxs~] + ... + bn tfo * 0, b0 * 0. Без ограничения общности можно считать, что n > s, т. к. в противном случае можно взять q(x) = 0, r(x) - fix). Пусть л = 0. Тогда 5 = 0 и q(x) = a~l, г(х) = 0 . Предположим, что утверждение верно для любого многочлена fix) степени меньше, чем л, и докажем его для любого многочлена fix) степени n > s. Составим разность Либо/К*) = 0, либо степень/^д:) меньше п. В первом случае положим Во втором случае по индуктивному предположению для многочлена/^*) найдутся такие многочлены q\(x), r(x), 4to/i(jc) = g(x)q\(x) + г(х), где либо г(х) = 0, либо степень г(х) меньше степени g(x). Тогда f{x) = ^x"-sg(x) + g(x)q](x) + r(x). b
7. Многочлены 241 Положив приходим к паре многочленов q(x), фг), удовлетворяющим условиям утверждения. Допустим теперь, что существуют еще многочлены q'(x), г'(х), для которых также удовлетворяются условия утверждения. Тогда А*) = g(x)q(x) + r(x),fix) = gix)q'(x) + г'(х\ откуда получаем, что Если г(х) - г\х) Ф О, то q'(x}-q(x)*Q. При этом степень г(х)-г'(х) меньше s, a степень g(x)(q'(x) - q(x)) не меньше s, что невозможно. Поэтому г(х) - г\х) = 0. Согласно 7.1-17 в кольце многочленов нет делителей нуля. Следовательно q\x) - q(x) = 0, т. е. q\x) - q(x\ r\x) = r(x). 7.1-20.3 Деление многочленов Многочлен q(x) называется частным (или неполным частным) от деления fix) на g(x), а г(х) — остатком от этого деления. Если г(х) = 0, то говорят, что fix) делится (или нацело делится) на g(x), при этом g(x) называется делителем fix). 7.1-21.3 Делители минимальной и максимальной степени Делителями любого многочлена fix) будут все ненулевые многочлены нулевой степени и все многочлены вида afix), где число а не равно 0. 7.1-22.3 Общий делитель многочленов Многочлен ф(х) называется общим делителем многочленов fix) и g(x), если он является делителем каждого из них. 7.1-23.3 Наибольший общий делитель Многочлен d{x) называется наибольшим общим делителем ненулевых многочленов fix) и g(x), если d(x) является их общим делителем и сам делится на любой их общий делитель. Обозначается наибольший общий делитель многочленов fix) и g(x) символом 7.1-24.3 Однородность наибольшего общего делителя Если ф;) есть НОД(^ g), то ad(x) есть также НОД(? g) для любого числа а, не равного 0.
242 Часть I. Математические сведения по линейной алгебре 7.1-25.3 Существование наибольшего общего делителя Для любой пары ненулевых многочленов Дх) и d(x) существует наибольший общий делитель. Он определен однозначно с точностью до умножения на число, не равное 0. Дополнение. Приведем описание алгоритма построения НОД(? g), называемого алгоритмом Евклида или алгоритмом последовательного деления. Выполним согласно 7.1-19 цепочку делений с остатком: g(x) = rx(x)q2(x) + r2(x\ г\(х) = r2(x)q3(x) + г3(х), г к - г(х) = /"*_, (x)qk(x) + ф\ n-\(x) = rk(x)qk+l(x). Степени остатков понижаются, поэтому процесс оборвется в тот момент, когда деление выполнится нацело. Пусть гк(х) — последний отличный от нуля остаток. Последовательно заключаем, что гк(х) является делителем гк_ \(х), гк_2(х) и т. д. до g(x) и fix), т. е. является общим делителем fix) и g(x). С другой стороны, еслиДх) и g(x) делятся на какой-то общий делитель, то на этот делитель делятся все остатки от г{(х) до гк(х). Поэтому гк(х) = НОД(? g) согласно определению 7.1-22. Допустим, что имеется два наибольших общих делителя d\(x) и ^(х) для многочленов fix) и g(x). Согласно 7.1-22 имеем d\(x) = d2(x)hi(x), d2(x) = dx(x)h2(x) для некоторых многочленов h\(x), h2(x). Отсюда заключаем, что h\(x), И2(х) = 1, т. е. многочлены h\(x) и h2(x) могут быть только многочленами нулевой степени или числами. 7.2. Основная теорема алгебры 7.2.1. Корни многочленов 7.2-1.3 Теорема Безу Остаток от деления многочлена/*) на многочлен первой степени х-с равенДс). Дополнение. Согласно 7.1-22 разделим fix) на* - с. Тогда имеем Степень остатка г(х) должна быть меньше степени многочлена х-с, т. е. г(х) есть константа. Подставляя х = с в левую и правую части равенств, заключаем, что r(x)=fic). 7.2-2.3 Корень многочлена Корнем многочлена fix) над полем Р называется такое число с поля Р9 что fie) = 0.
7. Многочлены 243 7.2-3.3 Деление на линейный множитель Число с поля Р является корнем многочлена fix) над полем Р тогда и только тогда, когдаДх) делится на х - с. Дополнение. Это есть прямое следствие определения 7.2-2 и утверждения 7.2-1. 7.2-4.3 Оценка числа корней Многочлен степени п > 1 над любым полем Р имеет не более п попарно различных корней. Для нулевого многочлена любой элемент поля Р является корнем. Дополнение. Пусть попарно различные числа сь с2, ... являются корнями многочлена fix). Согласно 7.2-3 многочлен fix) делится на х - сь т. е. fix) = (х - ci)/i(x) для некоторого многочлена f\(x). Подставляя в это равенство числа с2, с3, ..., убеждаемся в том, что они являются также корнями многочлена f\(x). Согласно 7.2-3 многочлен f\(x) делится на х - съ т. е. fx(x) = (x- ci)f2{x). Продолжая этот процесс, получим последовательность многочленов fix),f\(x)9 ...,fk(x), .... Каждый многочлен в ней имеет степень на 1 меньше, чем предшествующий многочлен. Поэтому процесс будет конечным и последовательность содержит не более п многочленов. Следовательно, на каком-то шаге будет получено разложение в котором многочлены fix) nfk(x) не имеют в поле Р корней, отличных от с\, ..., с*, и степень многочлена /к(х) равна п - к > 0. Однако многочлен fk(x) может иметь корни, совпадающие с какими-то из корней си ..., с*, и для него может быть получено аналогичное разложение. Поэтому имеет место такое разложение что каждое из чисел с,, равно одному из чисел сь ..., ск, многочленах) не имеет в поле Р никаких корней, кроме с\,..., ск, многочлен fr(x) не имеет в поле Р ни одного корня и степень fr(x) равна п - г > 0. Общее число попарно различных корней многочлена^*) не превосходит г < п. 7.2.2. Различные представления многочленов 7.2-5.3 Разложение многочлена на линейные множители Пусть для многочлена степени п > 1 над полем Р существуют такие числа сь с2, ..., ст что справедливо разложение fix) = ао(х - сх)(х - с2). ..{х- с„). Это разложение единственно с точностью до порядка сомножителей.
244 Часть I. Математические сведения по линейной алгебре Дополнение. В самом деле, предположим, что существуют другие числа с[9с'2,...9с'и такие, что aQ(x - сх)(х - с2)... (х - сп) = ао(х - с'{)(х - с'2)... (х - сп). Предположим, что среди чисел сь ..., с„ первые к чисел сь ..., ск попарно различные, а каждое из оставшихся чисел ск+], ..., сп равно одному из чисел сь ..., ск. Подставляя в обе части равенства последовательно числа сь ..., ск, заключаем, что среди чисел с[....,с'п должны находиться равные каждому из чисел сь ...,с*. Пусть для определенности с, = с,',..., ск = с^. Выполнения данного условия можно всегда добиться перенумерацией чисел с[,...,сп и соответствующей перестановкой сомножителей в правой части равенства. Разделив обе части равенства на произведение (х - с})... (х - ск\ получаем, что Это равенство аналогично приведенному выше, но степень многочленов стала меньше. Снова среди чисел ск+ ь ..., сп выбираем попарно различные и проводим аналогичные рассуждения. Продолжая этот процесс, в конце концов, устанавливаем, что с точностью до порядка множество чисел с\, ...,с„ совпадает с множеством чисел с,'. -..,с'п. 7.2-6.3 Каноническое разложение многочлена Пусть среди чисел сь Сг, ...,сЛ имеются равные. Предположим для простоты, что числа си с2, ..., сг попарно различны, а каждое из остальных равно одному из них. Разложение называется каноническим. Если kt > 2, то корень с, называется кратным, а число kt — кратностью корня с,. Если ?,= 1, то корень с, называется простым. Здесь 7.2-7.3 Совпадение при различных значениях переменных Пусть два многочлена заданы над полем Р и их степени не превосходят п> 1. Если эти многочлены имеют одинаковые значения более чем при п различных значениях переменных, то они равны. Дополнение. Пусть над полем Р заданы многочлены Дх) и g(x), степени которых не превосходят п. Предположим, что существуют такие попарно различные точки хи ...,xw, т> п, что J[xt) = g(Xi) для всех i,\<i<m. Рассмотрим многочлен fix) - g(x). Степень его не превосходит п по условию и по предположению он имеет т > п попарно различных корней. Согласно 7.2-4 такое возможно только в том случае, когда fix) - g(x) = 0 или/х) = g(x).
7. Многочлены 245 7.2-8.3 Однозначное определение многочлена Любой многочлен степени п>\, заданный над произвольным полем Р9 однозначно определяется своими значениями при п + 1 различных значениях переменной. Дополнение. Это есть прямое следствие 7.2-7. 7.2-9.3 Интерполяционный многочлен Лагранжа Пусть при различных значениях аь а2,..., а„+1 переменной многочленах) степени п принимает значенияЛа\)>Ла2), ••••>Аап+1). Тогда га л (х-а)(х-а)(х-а 1)(х'-а ) Правая часть этого равенства называется интерполяционным многочленом Лагранжа. Дополнение. В правой части равенства стоит многочлен, степень которого не превосходит п. Кроме этого, легко проверить непосредственно, что в точках аь а2, ...,а„+1 этот многочлен равен соответственно Ла\)>Аа2)> --,Аап+\)- Согласно 7.2-7 он равенДл:). 7.2-10.3 Разложение многочлена по степеням х- с Любой многочлен fix) = аох" + аххп~х + ... + ап_ хх + ап степени п> 1, заданный над произвольным полем Р, при любом с е Р может быть представлен в виде fix) = Со^-сУ+ф-с)"-1 + ... + c^ix-c) + с„. Это представление называется разложением многочлена по степеням х- с. Оно единственное, причем всегда с0 = а0, сп =Дс). Дополнение. Существование хотя бы одного представления очевидно. Для этого достаточно вместо х подставить эквивалентное ему выражение (х - с) + с, раскрыть степени и привести подобные члены при одинаковых степенях разности х-с. Очевидно также, что с0 = а0, с„ =fic). Допустим теперь, что существует другое представление Тогда многочлен (bo~co)(x-c)n + (bl-c])(x-c)n-l + ...+(bn.l-cn_])(x-c)^(bn~cn) должен быть нулевым. Согласно 7.1-2, 7.1-3, 7.1-4 это означает, что Z?/ = c/ для всех /.
246 Часть I. Математические сведения по линейной алгебре 7.2-11.3 Формулы Виета Пусть сь с2, ...,сп являются корнями многочлена причем среди корней могут быть равные. Тогда а2/а0 = + (схс2 Эти равенства называются формулами Виета. Дополнение. Рассмотрим разложение 7.2-5. Перемножая выражения в скобках, стоящие справа, приводя подобные члены и сравнивая полученные коэффициенты с коэффициентами многочлена Дх) из 7.1-1, убеждаемся в справедливости утверждения. 7.2-12.3 Формулы Ньютона Пусть с\, с2, ...,с„ являются корнями многочлена Обозначим Для всех к = 1, 2, ..., п выполняются соотношения как + ак _ \S\ + ак _ 2s2 + ... + #0$*= 0. Эти соотношения называются формулами Ньютона. Дополнение. См. [9], стр. 34—38. 7.2.3. Алгебраически замкнутое поле 7.2-13.4 Комментарий (неравноправие полей) До сих пор все поля были равноправны. Однако в вопросе существования корней это не всегда так.
7. Многочлены 247 7.2-14.4 Алгебраически замкнутое поле Поле Р называется алгебраически замкнутым, если любой многочлен fix) степени п > 1 над полем Р имеет в Р хотя бы один корень. 7.2-15.4 Точное число корней Любой многочлен степени п > 1, заданный над алгебраически замкнутым полем, имеет ровно п корней, если каждый из них считать столько раз, какова его кратность. Дополнение. Вернемся к дополнению к 7.2-4. В алгебраически замкнутом поле многочлен fr(x) не будет иметь ни одного корня только в том случае, когда его степень равна нулю. Отсюда сразу вытекает возможность разложения 7.2-5 и, соответственно, 7.2-6. 7.2-1 б.4 Еще раз о каноническом разложении Для многочлена степени п > 1, заданного над алгебраически замкнутым полем, всегда существует каноническое разложение. Дополнение. Очевидно, принимая во внимание дополнение 7.2-15. 7.2-17.4 Незамкнутость поля вещественных чисел Поле вещественных чисел не является алгебраически замкнутым. Дополнение. Достаточно привести подтверждающий данное утверждение пример. Пусть fix) = х2 + 1. Это есть многочлен с вещественными коэффициентами. Однако он не может иметь согласно определению 7.2-2 ни одного вещественного корня, т. к. fie) > 1 для любого вещественного числа с. 7.2-18.4 Комментарий (о каноническом разложении) Если поле не является алгебраически замкнутым, то каноническое разложение вида 7.2-6 для многочлена может не существовать. Тем не менее и в этом случае можно говорить о кратности корней. 7.2-19.3 Кратность корней Иногда говорят, что корень с многочлена fix) имеет кратность к, если fix) делится нацело на (х-с)к и не делится нацело на (х-с)к+\ Корень кратности 1 называется простым. Дополнение. Очевидно, что такое определение кратности корня полностью согласуется с определением, приведенным в 7.2-6.
248 Часть I. Математические сведения по линейной алгебре 7.2.4. Многочлен как функция 7.2-20.4 Комментарий (о поле комплексных чисел) Этот пункт посвящен исключительно важному факту — алгебраической замкнутости поля комплексных чисел. Поэтому всюду в нем предполагается без дополнительных пояснений, что многочлены заданы именно над этим полем. Более того, мы будем просто рассматривать здесь многочлены как комплексные функции комплексного аргумента z. 7.2-21.4 Непрерывность в точке Комплексная функция j(z) от комплексной переменной z называется непрерывной в точке z0, если для любого е > 0 существует 5 > 0 такое, что для всех z из неравенства \z - zo| < 5 следует неравенство ]/(z) -Xzo)| < с 7.2-22.4 Непрерывность многочлена в нуле Многочленflz) = ciqz" + axzn "l + ... + an _ xz есть функция, непрерывная в точке z0 = 0. Дополнение. Пусть |z| < 1. Тогда в силу 1.1-33 |Л»| = \z\ |а„_, + an_2z+ ...+ aoz"-l\ < |z|(k-il + \a*-i\ + .» + Ы). Положим Л/= \an. i| + ... + |яо| и возьмем 5 = min(l, е/М). В этом случае для всехz, для которых \z\ < 5, выполняется неравенство |/(z)| < \z\M< — Л/= е. \М ) 7.2-23.4 Непрерывность многочлена всюду Любой многочлен есть функция, непрерывная во всех точках комплексной плоскости. Дополнение. Пусть z0 — произвольное комплексное число. Разложим многочлен Xz) по степеням z - z0, т. е. /z) = co(z-zo)w + ф-zof-l + ... + с„_ Kz-zo) + с„. Ясно, что см =Xzo), так что Xz)-/z0) = Co(z-z0)w + c^z-zo)" + ... + cw_,(z-zo). Правая часть представляет собой многочлен от z-z0 с нулевым свободным членом. Согласно 7.2-22 для любого 8 > 0 найдется 5 > 0 такое, что |Xz) ~Xzo)| < е для всех z, для которых \z - zo\ < 5. 7.2-24.4 Непрерывность модуля многочлена Модуль любого многочлена есть функция, непрерывная во всех точках комплексной плоскости.
7. Многочлены 249 Дополнение. Так как \\fiz)\ - \fizo)\\ < \f(z) -fizo)l то справедливость утверждения следует из 7.2-23. 7.2-25.4 Предел последовательности Комплексное число zo = хо + /уо называется пределом последовательности комплексных чисел zn - х„ + iyn, если для любого 6 > 0 существует натуральное число N такое, что \zn - zo\ < s для всех п > N. Обозначается это символами lim zn = z0 или zn -» z0. П —> QO 7.2-26.4 Критерий сходимости zn -» z0 тогда и только тогда, когда одновременно хп -> х0 и уп -> д>0. Дополнение. Обозначим zw = хп + /yw, z0 = лго + (Уо- Пусть zw -> z0. Это означает, что для s > 0 существует натуральное число N такое, что \zn - zo\ < s для всех п> N. Согласно 1.1-25 условие \zn-z0\ < 8 перепишем в эквивалентном виде Отсюда следует, что |лг„-хо| <е и \у„-уо\<г для всех n>N. Другими словами, хп ~^хо> Уп -*Уо• Предположим теперь, что хп->х0, уп-> у0. Это означает, что для е>0 существует натуральное число N такое, что для всех п>N имеем |*и - хо| < е/ V2 , [уи - уо\ < е/ V2 . Тогда согласно 1.1-25 то есть zn —> z0. 7.2-27.4 Ограниченная последовательность Последовательность zw называется ограниченной, если существует число /? > О такое, что \zn\ < R для всех п. 7.2-28.4 Сходящаяся подпоследовательность Из любой ограниченной последовательности комплексных чисел можно выделить сходящуюся подпоследовательность. Дополнение. Пусть zn = хп + iyn и |zw| < R. Тогда |xw| < R, так что х„ — ограниченная последовательность вещественных чисел. Из нее согласно теореме Больцано— Вейерштрасса [8] можно выделить сходящуюся подпоследовательность хПк -» х0. Рассмотрим соответствующую подпоследовательность мнимых частей у . Она ограничена и из нее также можно выделить сходящуюся подпоследовательность Уп "^ ^о • Тогда соответствующая подпоследовательность z -» х0 + iy0 = z0 согласно 7.2-26.
250 Часть I. Математические сведения по линейной алгебре 7.2-2Э.4 Неограниченность модуля многочлена сверху EcnnJ(z) есть многочлен степени п > 1, то для любого М> 0 существует R > О такое, что для всех z из неравенства \z\ > R следует неравенство J/(z)| > М Дополнение. Пусть j{z) = а&п + axzn х + ... + ап. Запишем этот многочлен в виде /(z) = aoz"(\ н—-z +... +-JLz~n) = aoz"(l + g(z~!)), где g(z~l) есть многочлен от z с нулевым свободным членом. В силу 7.2-22 для s=l/2 найдется 5>0 такое, что при |2г~!| <5 выполняется неравенство \g(z~ l)\ < 1/2. Модуль tfoz" может быть сделан сколь угодно большим. Именно, при \z\>BM/\ao\)v" будет \а<?п\ > 2М. Возьмем Я = max{BM/|ao|I/w, 5}. Тогда, если \z\> R, то |^~!| < 5 и \z\ > BМ/\ао\)]/п. Принимая во внимание приведенное выше представление многочленаДг), имеем • g(z~ х)\ > \а&п\\\ - |g(z" !)|| > 2Л/A - 1/2) = М. 7.2-30.4 Ограниченность модуля многочлена снизу Для любого многочлена^) степени п > 1 существует комплексное число z0 такое, что |/(zo)| < j/[z)| для всех комплексных z. Дополнение. Рассмотрим множество всевозможных значений модуля многочлена y(z). Так как |/(z)| > 0, то это множество ограничено снизу и, следовательно, имеет точную нижнюю грань [8]. Обозначим ее через т. Тогда для любого натурального числа п можно найти комплексное число zn такое, что |Дг„)| <т + п~х. Воспользуемся утверждением 7.2-29. Для M=w+ 1 найдем R такое, что при \z\>R будет \f[z)\ > М+п~\ Отсюда и из неравенства \/{zn)\ <m + n~x следует, что \zn\ < R. Последовательность zn оказалась ограниченной и из нее согласно 7.2-28 можно выделить сходящуюся подпоследовательность z^ -> z0. Согласно 7.2-24, j/(z)| есть непрерывная функция. Поэтому |/(zWi )| -^ |/(zo)|. С другой стороны, из неравенства |/(zw)| < т + n l и определения нижней грани имеем m<\f{znk)\<m + nk\ Поэтому /(z^) -> т . Следовательно, |/(zo)| = т. 7.2-31.4 Лемма Даламбера Если Дг) есть многочлен степени п > 1 uj{z0) ф 0, то существует такое число zb что Дополнение. Разложим многочлен^) по степеням z - z0: /z) = Co(z-zo)w + ф-ZoY'1 + ... + cw_ i(z-zo) + с„.
7. Многочлены 251 Очевидно, что cn=f[z0)^0. Пусть с„_*— первый ненулевой коэффициент после с„. Такой коэффициент имеется, т. к. п > 1 и с0 * 0. Тогда (с с Л = с„ (z - zo)*g(z - z0) + (z - z0)* +1 , где Сп-к Сп-к есть многочлен от z-z0 с нулевым свободным членом. Согласно 7.2-22 для 8 = 1/2 найдется такое 8, что если |z-zo|<6, то |g(z-zo)| < 1/2. Оценим правую часть приведенного выше представления Xz). Пусть в соответствии с 1.1-31 -^— = /?(cos 6 + / sin 0), z-zo = r(cos ф + / sin ф). Выберем г так, чтобы Rrk < 1. с* Для этого нужно взять г<(l/R)x/k. Далее положим Q + kq> = n, т.е. возьмем Ф = (тт - в)/к. При таком выборе -^— (z - zo)A = - /?rA. Теперь положим zi=zo + r(cos ф + / sin ф) при г < minE, (\/R)vk) и ф = (ti - в)/к. Тогда из представления многочленаДг) следует, что и тем самым \f{zx)\ = \cn\\\-Rrk-Rrkg(z-zQ)\< < \сп\{\\ -Rrk\ + Rrk\g(z-z0)\ ) < \cn\(l-Rrk + 7.2-32.4 Основная теорема алгебры Любой многочлен степени п > 1 с комплексными коэффициентами имеет хотя бы один комплексный корень. Дополнение. Пусть Дг)— произвольный многочлен степени п > 1 с комплексными коэффициентами от комплексной переменной z. Согласно 7.2-30 множество всевозможных значений j/(z)| имеет точную нижнюю грань аи, которая достигается в некоторой точке z0, так что \f[zo)\ = т. ТогдаXz0) = 0, так как в противном случае, если j/(zo)|^O, согласно 7.2-31 найдется точка zb для которой \f{z\)\ < \flzo)\ = = inf ]Дг)|, что невозможно. Таким образом, z0 есть по определению 7.2-2 корень многочлена и согласно 7.2-14 поле комплексных чисел алгебраически замкнуто.
252 Часть I. Математические сведения по линейной алгебре 7.2-33.4 Замкнутость комплексных чисел Поле комплексных чисел^ алгебраически замкнуто. Дополнение. Это следует из определения 7.2-14 и утверждения 7.2-32. 7.2.5. Вещественные многочлены 7.2-34.4 Комментарий (о поле вещественных чисел) Многочлен степени п > 1 над полем вещественных чисел может не иметь ни одного вещественного корня. Но так как поле вещественных чисел является подмножеством поля комплексных чисел, то любой многочлен степени п > 1 с вещественными коэффициентами имеет ровно п корней, в общем случае, комплексных. Вещественность коэффициентов многочлена влечет за собой некоторую специфику. 7.2-35.3 Комплексно-сопряженный корень Пусть многочлен с вещественными коэффициентами имеет комплексный корень с и Im с Ф 0. Тогда многочлен имеет также комплексно-сопряженный корень с* и с&с. Дополнение. Пусть с является корнем многочлена fix), т. е. fic) = aocn + axcn~x + ... + я„_,с + а„ = 0. Взяв комплексное сопряжение от обеих частей этого равенства, получим с учетом 1.1-30 и соотношения ak = ak для всех к, 0 < к < п, что f{c) = a^cn + ax~cn~x + ... + an_^c4 an =0 . Если с = a + ib9 то с=a-ib. По условию Im с = bФ 0, поэтому заключаем, что 7.2-36.3 Кратность сопряженного корня Кратности корней сие многочлена с вещественными коэффициентами совпадают. Дополнение. Пусть многочлен fix) имеет комплексный корень c,c^~c, кратности к. Согласно 7.2-19 это означает, что fix) представим в виде fix)=p(x)(x-c)k для некоторого многочлена р(х) и не представим в виде fix) = q(x)(x-c)k+l ни для какого многочлена ^(jc). Взяв сопряжение от первого равенства и приняв во внимание соотношение f(x) = f(x), получим, что
7. Многочлены 253 Это означает, что fix) делится нацело на (х - с)А. Допустим, чтоДх) делится нацело также на (х - "с)к + *. Аналогично показываем, что тогда fix) должен делиться нацело на (jc -~с)к + х или, что то же самое, на (x-c)k+l. Так как это невозможно, то fix) не может делиться нацело на (х ~ ~с)к +'. Поэтому "с является корнем многочлена fix) той же самой кратности к, что и корень с. 7.2-37.4 Существование вещественного корня Любой многочлен нечетной степени с вещественными коэффициентами имеет хотя бы один вещественный корень. Дополнение. Предположим противное. Пусть многочлен нечетной степени с вещественными коэффициентами не имеет вещественных корней. Следовательно, все корни имеют вид с = а + /6, где Ь*0. Согласно 7.2-35 число с -a-ib также является корнем многочлена, причем комплексным, а не вещественным. Поэтому, принимая во внимание 7.2-36, заключаем, что все корни многочлена с учетом их кратности разбиваются на пары, в каждую из которых входит корень и ему сопряженный. Это означает, что общее число корней является четным числом. Согласно 7.2-15 такой факт невозможен для многочленов нечетной степени, т. е. каждый многочлен нечетной степени с вещественными коэффициентами обязательно имеет хотя бы один вещественный корень. 7.2-38.3 Квадратичный многочлен с сопряженными корнями Пусть с есть комплексное число. Тогда произведение (jc - с)(х - с") есть многочлен ф(х) = х2 +рх + q второй степени с вещественными коэффициентами /?, q. Дополнение. Проверяется непосредственно. 7.2-39.3 Деление на квадратичный многочлен Пусть многочлен fix) с вещественными коэффициентами имеет комплексный корень с и Im с Ф 0. Тогда в поле вещественных чисел fix) делится на ф(лс). Дополнение. Если многочлен fix) с вещественными коэффициентами имеет комплексный корень с и Im с ^ 0, то он будет также иметь согласно 7.2-35 корень сфс . Поэтому fix) согласно 7.2-3 будет делиться нах-си х-~с . Следовательно, он будет делиться на ц>(х) из 7.2-38. 7.2-40.4 Каноническое разложение многочлена Пусть fix) есть многочлен степени п > 1 с вещественными коэффициентами. Существуют попарно различные вещественные числа сь ...,cf и попарно различные пары вещественных чисел (ри q\), ..., (/?,, qs) такие, что
254 Часть I. Математические сведения по линейной алгебре Здесь hi и lj являются натуральными числами и Это разложение многочлена Дл:) на множители называется каноническим разложением над полем вещественных чисел. В частных случаях либо степени многочленов первой степени, либо степени многочленов второй степени в каноническом разложении могут отсутствовать. Дополнение. Пусть многочлен fix) имеет вещественные корни сь ...,cv и комплексные корни сг+\, ...,сг + у, среди которых нет вещественных и комплексно- сопряженных. Тогда он будет иметь также комплексно-сопряженные корни <?г +1, • • •, "сг + лг • Произведение (х-сг+ .){х - cr +}) дает многочлен второго порядка х1 + ррс + qj с вещественными коэффициентами согласно 7.2-38 для всех у, 1 ?j'?s. Теперь обсуждаемое разложение является прямым следствием разложения 7.2-6, с учетом 7.2-15, 7-2-33.
8. Спектральные свойства матриц 8.1. Эквивалентные и подобные матрицы 8.1.1. Преобразование координат 8.1-1.3 Комментарий (выбор базисов) Выбор базисов в линейных пространствах однозначно определяет матрицу линейного оператора. Это позволяет свести исследование различных свойств оператора и операторных соотношений к исследованию аналогичных матричных свойств. Очевидно, что это исследование осуществляется тем эффективнее, чем проще вид матрицы оператора. В общем случае матрица оператора зависит от базисов. До тех пор, пока не сделаны специальные оговорки, мы будем считать числовые поля произвольными. 8.1-2.3 Матрица преобразования координат Пусть еи ...,ет и/ь ...,fm — два базиса одного и того же пространства, причем Матрицей преобразования координат при переходе от базиса е\9...,ет к базису /ь ...,fm называется матрица Р\\ Р\2 —Р\т Ргх Рт\ Pml—Pmm
256 Часть I. Математические сведения по линейной алгебре 8.1-З.3 Матричное представление преобразования координат Пусть в обозначениях 8.1-2 хе и ду означают вектор-столбцы, составленные из координат вектора х в соответствующих базисах. Всегда выполняется равенство xt, = Pxf. Дополнение. Возьмем произвольный вектор х и разложим его по векторам обоих базисов. Пусть Согласно 8.1-2 имеем m m m m m ( m \ m f m \ Eu =&¦/; = 1>.Е/>л = ц Ичрл \=ц T^jPe W i = l / = 1 i = l 7 = 1 j = 1 \^ i'• = 1 ) / = l \^ / = 1 J Сравнивая коэффициенты при et в левой и правой частях полученных соотношений и принимая во внимание 2.2-28, заключаем, что для /= 1, 2, ..., m. Обозначим через хе и Xf вектор-столбцы, составленные из координат вектора х в соответствующих базисах. Установленные соотношения между координатами означают, что хе = Рх/. 8.1-4.3 Критерий для матрицы преобразования Для того чтобы матрица Р была матрицей некоторого преобразования координат, необходимо и достаточно, чтобы она была невырожденной. Дополнение. По определению 2.2-21 векторы базиса линейно независимы. Но столбцы матрицы Р преобразования координат 8.1-2 составлены из координат векторов базиса. Они должны быть так же линейно независимы. Согласно 4.1-25 имеем detP^O и по определению 4.4-1 матрица Р может быть только невырожденной. 8.1-5.3 Матрица обратного преобразования Если Р есть матрица преобразования координат при переходе от базиса еъ ...,ет к базису/ь ...,/„, то Р~х есть матрица преобразования координат при переходе от бази- са/ь ...,fm к базису еи .-.,*«. Дополнение. Согласно 8.1-3 при переходе от базиса еь ..., ет к базису /ь ...,/т выполняется равенство хе = Pxf. Согласно 8.1-4 матрица Р невырожденная и в соответствии с 4.4-1 имеет обратную. Умножая равенство хе = Pxj слева на матрицу Р~ \ заключаем, что х/= Р~ 1хе, т. е. матрица F~' есть матрица преобразования координат при переходе от базиса/ь ...,/,, к базису еи ..., ет.
8. Спектральные свойства матриц 257 8.1-б.3 Произведение преобразований Пусть P,R,S— матрицы преобразования координат при переходе от базисов {e\,...,em}9{fu...9fm}9{eu...,em} соответственно к базисам {fu ...,/„}, {гь ..., rm}9 {г\, •••>'"«}• Всегда выполняется равенство S = PR. Дополнение. В обозначениях 8.1-3 имеем хе = Рх/, xj = Rxn хе = Sxr. Отсюда получаем, что хе = P(Rxr) = (PR)xr. Так как равенства хе = Sxr и хе = (PR)xr выполняются для любого векторах, то они должны выполняться и для векторов базиса ru ..., rm. В этом случае вектор-столбцы хг будут совпадать с вектор-столбцами единичной матрицы. Сравнивая Sxr и (PR)xr, заключаем, что S = PR. 8.1-7.3 Одноименные базисы Два базиса одного вещественного пространства называются одноименными, если определитель их матрицы преобразования координат положительный. 8.1-8.3 Левый и правый базисы Все базисы вещественного пространства можно разбить на два класса одноименных базисов. Один из классов называется левым, второй — правым. 8.1-9.3 Разные базисы и матрицы оператора Пусть линейный оператор действует из пространства X в пространство Y. Выберем в пространствеXбазис еи ..., ет в пространстве Y— базис qb ...,<?„ и обозначим через А матрицу оператора в этих базисах. Предположим, что в пространствах X, Y выбраны также другие базисы/ь ...,/ти^...,/л соответственно и В есть матрица оператора в новых базисах. Пусть Р и Q — матрицы преобразования координат при переходе от еи...,е,„ к/ь...,/т и от q\,...,qn к tu...,tn. Всегда выполняется равенство l Дополнение. Принимая во внимание определение 3.7-18, равенство 3.7-23 и обозначения 8.1-3, справедливы равенства^ -Ахе9 хе = Px/,yq = Qyt. Согласно 8.1-4 матрицы Р и Q невырожденные. Поэтому из этих равенств получаем, что yt — Q~ ]APxj. Матрица оператора в заданных базисах определяется однозначно. Следовательно, В - Q- ХАР. 8.1.2. Эквивалентные матрицы 8.1-10.3 Комментарий (выбор базисов) Описанная связь матриц оператора указывает направление поиска тех базисов, в которых матрица оператора имеет простейший вид. Решение этой задачи существенно зависит от того, совпадают или не совпадают пространства, задающие область определения и область значений оператора. Если пространства, в которых действует оператор, различны, то простейший вид матрицы векторов находится очень легко. Так же легко он находится и в тех случаях, когда пространства совпадают, но по тем или 9 Зак 740
258 Часть I. Математические сведения по линейной алгебре иным причинам предоставляется возможность выбирать различные базисы для образов и прообразов векторов. 8.1-11.3 Эквивалентные матрицы Две прямоугольные матрицы А и В одинаковых размеров называются эквивалентными, если существуют такие две невырожденные матрицы PwQ, что В = Q~ 1АР. 8.1-12.3 Свойство эквивалентности матриц Признак эквивалентности матриц есть отношение эквивалентности. Дополнение. Признак эквивалентности матриц есть бинарное отношение. Оно рефлексивно, т. к. А = Е~ ХАЕ для единичной матрицы Е. Оно симметрично, т. к. из B-Q~ ХАР следует, что А = (Q~ l)BP~ \ Оно также транзитивно. Если В = Q~ ]AP и С~ R~ lBS, то очевидно, что С = (QR)~ ]A(PS). Согласно 1.3-4, 1.3-5 все это означает, что признак эквивалентности матриц есть отношение эквивалентности. 8.1-13.3 Критерий эквивалентности Две матрицы эквивалентны тогда и только тогда, когда они соответствуют одному и тому же линейному оператору в подходящим образом выбранных парах базисов. Дополнение. Согласно 8.1-9 матрицы одного и того же оператора, но в разных базисах, эквивалентны. Рассмотрим теперь две эквивалентные матрицы А и B = Q~lAP. Пусть в пространстве X фиксирован базис еи ...,ет, в пространстве Y— базис q\9...,qn. Формулами из 3.7-20 однозначно определяется линейный оператор, для которого матрица А в этих фиксированных базисах является его матрицей. Допустим далее, что Р и Q суть матрицы преобразования координат при переходе соответственно от базиса еи --->ет к базису/ь ...,/„ и от базиса <7ь •••> Яп к базису /ь ..., /„. Согласно 8.1-9 матрица Q' ]АР будет матрицей того же оператора, что и матрица А, но в новых базисах. 8.1-14.3 Эквивалентность и ранг Для того чтобы две прямоугольные матрицы одинаковых размеров были эквивалентны, необходимо и достаточно, чтобы они имели один и тот же ранг. Дополнение. Пусть матрицы А и В эквивалентны. Тогда В = Q~ lAP, где Q и Р — невырожденные матрицы. Как вытекает из 4.4-18, любую невырожденную матрицу можно представить как произведение элементарных матриц. Но, согласно 4.3-8, от умножения на элементарные матрицы ранг не меняется. Следовательно, ранг матрицы не меняется от умножения на любую невырожденную матрицу. Поэтому rank A = rank В. Предположим теперь, что матрицы А и В имеют одинаковые ранги. Согласно 3.6-13, 3.6-14, 4.3-5, существуют такие матрицы Л/, N, К; L, представляющие произведения элементарных матриц, что [Е 0 MAN = KBL = о о
8. Спектральные свойства матриц 259 Здесь Е есть единичная матрица, порядок которой равен общему рангу матриц А и В. Согласно 4.4-17, 4.4-3 матрицы M,N,K,L— невырожденные. Следовательно, В = (М~ ]Kf ]A(NL~!) в соответствии с 4.4-7, т. е. матрицы А и В эквивалентны. 8.1-15. Простейшая эквивалентная матрица Все эквивалентные матрицы ранга г эквивалентны матрице вида 1 0 0 0 0 1 0 0 ... 0 ... 0 ... 1 ... 0 0 0 0 0 ... 0 ... 0 ... 0 ... 0 о о ... о о ... о Дополнение. Доказательство этого факта приведено в дополнении к 8.1-14. 8.1-16. Комментарий (выбор базисов) Столь простой вид матрицы оператора можно получить, в основном, при раздельном выборе базисов для образов и прообразов. Если оператор действует в одном пространстве, то раздельный выбор базисов допускается довольно редко. Совпадение же базисов приводит к совпадению матриц Р и Q в 8.1-9. В этом случае нахождение матрицы оператора простейшего вида становится сложной и трудоемкой задачей. 8.1.3. Подобные матрицы 8.1-17.3 Подобные матрицы Две квадратные матрицы А и В одинаковых размеров называются подобными, если существует такая невырожденная матрица Р, что В = Р~ 1АР. 8.1-18.3 Свойство подобия матриц Подобие матриц есть отношение эквивалентности. Дополнение. Подобие матриц есть бинарное отношение. Оно рефлексивно, т. к. А = Е~ ХАЕ для единичной матрицы Е. Оно симметрично, т. к. из В = Р~ 1АР следует 1 1\ Х l А = (Р~ 1)~ 1ВР~\ Оно также транзитивно. Если В = Р~ ХАР и С = Q~ lBQ, то очевидно, что C = (PQ)~lA(PQ). Согласно 1.3-4, 1.3-5 все это означает, что подобие матриц есть отношение эквивалентности.
260 Часть I. Математические сведения по линейной алгебре 8.1-19.3 Критерий подобия Две матрицы подобны тогда и только тогда, когда они в разных базисах соответствуют одному и тому же линейному оператору, действующему в одном пространстве. Дополнение. Доказательство почти дословно повторяет дополнение к 8.1-13. 8.1-20.3 Подобие матриц АВ и ВА Если хотя бы одна из двух квадратных матриц Л, В одинакового размера невырождена, то матрицы АВ и В А подобны. Дополнение. Пусть, например, невырождена матрица А. Согласно 4.4-7 она имеет обратную. Поэтому ВА = А~ \АВ)А, т. е. матрицы ВА и АВ подобны. 8.1-21.4 Переход к биортонормированному базису Если при переходе к некоторому базису матрица А преобразуется в подобную ей матрицу В, то при переходе к биортонормированному базису матрица Л* преобразуется в подобную ей матрицу В*. Дополнение. Пусть Р (Q) есть матрица преобразования координат при переходе от естественного базиса eh ..., em к базису дгь ..., х,„ (уь . •.,Ут)- Для того чтобы базисы jci, ...,хт ид>ь ...,ут были биортонормированы в смысле скалярного произведения 5.1-8, необходимо и достаточно, согласно 5.2-17, 8.1-3, 8.1-5, выполнение матричного равенства (Pf)~](Q)~] =E или, что то же самое, P* = Q~]. При переходе к базису *ь ...,хт матрица А преобразуется в подобную ей матрицу В = Р~ ХАР в соответствии с 8.1-9. При переходе к базису у\, ...,ут матрица А* преобразуется в подобную ей матрицу C=Q~ XA*Q = Р*А*(Р*У' - (Р~ 1АР)* = В*. 8.2. Спектр матриц 8.2.1. Собственные значения и собственные векторы 8.2-1.3 Комментарий (эквивалентность и подобие) Конечно, подобные матрицы всегда эквивалентны. Но если для установления эквивалентности матриц достаточно проверить равенство их рангов, то при исследовании множества подобных матриц приходится привлекать значительно более тонкий аппарат. Основным инструментом теперь являются собственные векторы и собственные значения квадратной матрицы. По-прежнему числовые поля считаем произвольными.
8. Спектральные свойства матриц 261 8.2-2.3 Собственное значение и собственный вектор Пусть матрица А квадратная. Число X называется собственным значением (собственным числом) матрицы А, если существует такой ненулевой вектор х, что Ах = Хх. Любой вектор х Ф О, удовлетворяющий этому уравнению, называется собственным вектором матрицы А, соответствующим собственному значению X. Совокупность всех собственных значений называется спектром матрицы. 8.2-3.3 Собственное подпространство Множество собственных векторов матрицы А, соответствующих одному и тому же собственному значению X, становится подпространством, если к нему добавить нулевой вектор. Это подпространство называется собственным подпространством матрицы А, соответствующим собственному значению X. Дополнение. Рассмотрим множество векторов х, обладающих тем свойством, что Ах = Хх для одного и того же числа X. Пусть Ах = Хх и Ау = Ху. Для любых чисел а, Р имеем А(ах + $у) = аАх + рДу = аХх + $Ху = Х(ах + $у). По определению 8.2-2 собственными векторами являются только ненулевые векторы. Поэтому множество собственных векторов матрицы А, соответствующих одному и тому же собственному значению Л,, становится согласно 1.7-11 подпространством, если к нему добавить нулевой вектор. 8.2-4.3 Собственный вектор как решение системы Для того чтобы ненулевой вектор х был собственным вектором матрицы А, соответствующим собственному значению X, необходимо и достаточно, чтобы он являлся решением однородной системы линейных алгебраических уравнений (-А + ХЕ)х = О с матрицей -А + ХЕ. Дополнение. Равенство Ах = Хх можно рассматривать как однородную систему линейных алгебраических уравнений (-А + ХЕ)х = 0 с матрицей — А + ХЕ относительно вектора неизвестных х, т. к., очевидно, оно эквивалентно равенству -Ах + Хх = 0 и, конечно, равенству (-А + ХЕ)х = 0. 8.2-5.3 Собственное значение и определитель Для того чтобы число X было собственным значением матрицы А, необходимо и достаточно, чтобы выполнялось равенство det(— Л + ХЕ) = 0. Дополнение. Равенство Ах - Хх эквивалентно равенству {—А + ХЕ)х = 0. Согласно 6.3-10 и определения 4.4-1 однородная система линейных алгебраических уравнений (- А + ХЕ)х = 0 имеет ненулевое решение тогда и только тогда, когда
262 Часть I. Математические сведения по линейной алгебре 8.2-6.3 Собственные значения треугольной матрицы Для любой треугольной (нулевой, единичной, скалярной, диагональной) матрицы ее собственные значения совпадают с диагональными элементами. Дополнение. Пусть матрица А является треугольной порядка m с элементами ац. Согласно 4.1-21 det(A? - А) = (X - а, Х){Х - а22).. .(X - amm\ то есть det(XE-A) = Q, если вместо X подставить любой диагональный элемент матрицы А. Согласно 8.2-5 это означает, что диагональные элементы яц> #22? •••> Ятт треугольной матрицы А являются ее собственными значениями. 8.2-7.3 Собственные векторы скалярной матрицы Для нулевой, единичной и скалярной матриц любой ненулевой вектор является собственным. 8.2-8.3 Собственные векторы диагональной матрицы Для диагональной матрицы любой единичный вектор является собственным. Дополнение. Пусть диагональная матрица D имеет на главной диагонали элементы du, ••¦> 4ш. Тогда для /-го единичного вектора eh очевидно, имеем Det = duet. 8.2-9.3 Собственные значения подобных матриц Все подобные матрицы имеют одни и те же собственные значения. Дополнение. Пусть X есть собственное значение матрицы А. Согласно 8.2-5 выполняется равенство det(^ - ХЕ) = 0. Если матрица В подобна матрице А, то В = Р~ ХАР для некоторой невырожденной матрицы /\ По определению 4.4-1 имеем det Р Ф 0. Следовательно, в соответствии с 4.2-10, 4.4-10 заключаем, что detCB ~XE) = det(/>" \А - ХЕ)Р) = det Г1 • det(A - ХЕ) • det Р = 0, то есть X является собственным значением матрицы В. Аналогично доказывается, что собственное значение матрицы В одновременно является и собственным значением матрицы А. 8.2-10.3 Собственные значения невырожденной матрицы Для того чтобы матрица была невырожденной, необходимо и достаточно, чтобы она не имела нулевого собственного значения. Дополнение. Если матрица А невырожденная, то согласно 6.3-10 уравнение Ах = 0 - х не может иметь ненулевое решение х. Следовательно, она не может иметь нулевое собственное значение. Если же матрица А не имеет нулевое собственное значение, то она не может быть вырожденной, т. к. в противном случае уравнение Ах = 0 • х имело бы ненулевое решение х. Согласно определению 8.2-2 это означало бы, что матрица А имеет нулевое собственное значение.
& Спектральные свойства матриц 263 8.2-11.4 Ядро и нулевое собственное значение Ядро любой матрицы есть собственное подпространство, соответствующее нулевому собственному значению. Дополнение. Согласно 6.4-2 ядро матрицы А есть множество векторов х, удовлетворяющих однородной системе Ах-0. Но эту систему можно записать как Ах = 0 • х. И тогда ненулевой вектор х можно трактовать как собственный вектор матрицы А, соответствующий нулевому собственному значению. Совокупность таких векторов, дополненная нулевым вектором, согласно 8.2-2 есть собственное подпространство, соответствующее нулевому собственному значению. 8.2-12.3 Независимость собственных векторов Пусть А,;1Д,2, ...Д^ — некоторая совокупность попарно различных собственных значений. Для каждого из собственных значений данной совокупности обязательно существует хотя бы один собственный вектор, и вся система этих собственных векторов линейно независима. Дополнение. Существование хотя бы одного собственного вектора xi для каждого из собственных значений Xi9\<r<s, имеет место согласно 6.3-10, 8.2-4, 8.2-5. Заметим, что для любых 1 < г, р < s справедливо равенство (A-\ipE)xir =Axir -\xir = \xir -\xir =(Xir -\)xlr. Выражение справа равно нулю, если г = /?, и не равно нулю, если гфр. Предположим, что векторы X;,..., х, линейно зависимы, т. е. существуют согласно 2.1-10 числа <х,.,..., ос, , не все равные нулю и такие, что a, jc, + а, х, +... + а, х, = 0. Умножив это равенство слева последовательно на А - Xh Е,..., А - X, ^ Е, А-Х( Е,...,А-Х;Е и принимая во внимание сделанное выше замечание, получим <ч (Ч - Ч) • • • (Ч - Ч-, ХЧ - К,) • • • <Ч - Ч X = °- По условию Xj -Xj ^0 для рфг. Вектор xi Ф 0 как собственный вектор. Поэтому ос, = 0 для всех 1<г<5и система векторов х§,..., х, не может быть линейно зависимой. 8.2-13.4 Сумма собственных подпространств Сумма собственных подпространств любой матрицы является прямой суммой.
264 Часть I. Математические сведения по линейной алгебре Дополнение. Рассмотрим собственные подпространства Ц , относящиеся к собственным значениям X. , 1 < г < s. По определению 8.2-3 каждое собственное подпространство содержит все собственные векторы с одним и тем же собственным значением. Поэтому Xi *Xi9 если гфр. Рассмотрим сумму подпространств L - Lh +... + Ца и возьмем вектор х е L. Предположим, что вектор х имеет два различных разложения где y.9Zj еЦ для всех г. Вычитая одно равенство из другого и обозначая xi = у. - zi , получим jc/( +x>2 +... + xf.f =0. В силу того, что 4,...,Д суть подпространства, векторы xif e L^ для всех г и по предположению, по крайней мере, один из них не равен нулю. Пусть xif Ф 0. Умножим последнее равенство слева последовательно на A-Xi}E,..., A-Xl E, A-Xj ?,..., A-Xi E. Так как xi е Ц , то Axi = X, х, для 1 <p<s. Аналогично тому, как это было сделано в дополнении к 8.2-12, находим, что должно выполняться равенство (\ - ^)... (х. - xirи хч - \ j... (Ч - ч Ч = °- Но это невозможно в силу предположения xt ^0 и условия Xt -Xf ^0 длярфг. Следовательно, разложение вектора jc должно быть единственным, т. е. сумма собственных подпространств всегда прямая согласно определению 5.3-12. 8.2-14.3 Собственные значения обратной матрицы Пусть матрица А невырожденная и ее собственные значения Хи ..., Хт. Тогда собственные значения матрицы А"х равны X^\...9X~J, а соответствующие собственные векторы совпадают. Дополнение. В силу невырожденности матрицы А все Xh 1 < / < w, не равны нулю согласно 8.2-10. Кроме этого, согласно 4.4-7 существует обратная матрица А~\ Умножая равенство Axj = X,Xj слева на А~ \ заключаем, что A~xxf = X~xxt, т. е. утверждение справедливо. 8.2-15.3 Собственные значения матриц Аи А Собственные значения матриц Л и А' совпадают.
8. Спектральные свойства матриц 265 Дополнение. Принимая во внимание 4.1-12, 8.2-5, это есть прямое следствие следующих равенств: det(A -ХЕ) = det@4 - ХЕ)') = det(A' - ХЕ). 8.2-1 б.3 Собственные значения матриц Аи А* Собственные значения матриц Л и А* комплексно сопряжены. Дополнение. Принимая во внимание 4.1-12, 4.1-13, 8.2-5, это есть прямое следствие равенств: det(A *-ХЕ) = det(A - ХЕ) = dei(A' - ХЕ) = dot(A - ХЕ) = 0. 8.2-17.3 Ортогональность собственных векторов матриц А и А* Пусть х есть собственный вектор матрицы А, соответствующий собственному значению Х9у— собственный вектор матрицы А*9 соответствующий собственному значению ц. Если X Ф [i , то векторы хиу ортогональны. Дополнение. Согласно условиям имеем Ах- Ъс,А*у- \ху. Умножая первое равенство справа скалярно на вектор у9 используя второе равенство и принимая во внимание 5.2-25, находим, что Х(х9 у) = (Хх9 у) = (Ах9 у) = (*, А *у) = (х, цу) = ц (х,у). Если X Ф ц , то (х9 у) = 0. 8.2.2. Характеристический многочлен 8.2-18.3 Характеристический многочлен Функция det(XE-A) относительно параметра X есть многочлен, степень которого равна порядку матрицы А: det(XE-A) = Xm-aX~x + a2Xm~2 + ...+(- \)mam. Этот многочлен называется характеристическим многочленом матрицы А, Дополнение. То, что det(XE-A) есть многочлен степени т относительно параметра X, становится ясно, если воспользоваться определением 4.1-10. Член определителя, содержащий максимальную степень параметра Х9 один и равен он произведению диагональных элементов матрицы ХЕ-А. Отсюда становится ясно, что коэффициент при члене Хт многочлена dQt(XE-A) равен 1.
266 Часть I. Математические сведения по линейной алгебре 8.2-19.4 Коэффициенты характеристического многочлена Коэффициент ar, I <r<m, характеристического многочлена матрицы А равен сумме всех главных миноров порядка г этой матрицы. Дополнение. Обозначим элементы матрицы А через afj. Рассмотрим det(XE-A) в виде суммы его членов согласно определению 4.1-10. Член (- \)rarXm~r характеристического многочлена образуется из тех членов определителя, которые содержат произведение из m — г диагональных элементов матрицы ХЕ — А иг внедиаго- нальных ее элементов. Все элементы находятся в разных строках и разных столбцах. Член определителя берется со своим знаком. От произведения диагональных элементов матрицы ХЕ - А в член характеристического многочлена входит только Xm~r. Пусть диагональные элементы находятся в позициях (/ь /j), ..., (/,„_,, /m_r) и 1 < /*i < ... < /w_r < m. Обозначим через Jr множество номеров 1 <j\ < ... <jr<my дополняющее /ь ..., /m_r до совокупности 1,2, ..., т. Теперь имеем (-1L^-= Г- X Z (-\)\-ам,А)...{-а^). 1 й /, < . <im_r<m s^ , , Sjr с Jr Здесь (- 1)G есть знак члена определителя, зависящий от четности или нечетности перестановки, составленной из чисел s^,...,^ ,/,,...,/Wl_r, упорядоченных таким образом, чтобы числау'ь ...,yr, /j, ..., im-r образовывали нормальную перестановку. Принимая во внимание упорядоченность чиселуь ...,уг, заключаем, что упорядочивание последовательности у!, ...,jn /i,..., im-r приведет, конечно, к перемешиванию в общем случае чисел sj9...9Sj и /,,...,/г, но не приведет к изменению расположения чисел Sj,..., Sj относительно друг друга. Поэтому (- 1)е = (- 1)Y, где у есть число инверсий в перестановке s^,..., Sj . Следовательно, J j -> "•-> Jr И окончательно имеем *- i 4/ f ] < 7, <. <jr<m \J]> • • •» Уг 8.2-20.3 Старший и младший коэффициенты Коэффициент ai характеристического многочлена матрицы А равен tr^, коэффициент ат равен det A. 8.2-21.3 Спектр матрицы Корни характеристического многочлена, и только они, образуют спектр матрицы А.
8. Спектральные свойства матриц 267 Дополнение. Согласно определению 8.2-2 спектр матрицы есть совокупность всех ее собственных значений. Но согласно 8.2-5 собственные значения, и только они, обращают в нуль det(-y4 + ХЕ), т. е. в соответствии с 7.2-2, 8.2-18 они, и только они, являются корнями характеристического многочлена. 8.2-22.3 Характеристические многочлены матриц А и А' Матрицы А и А' имеют одинаковые характеристические многочлены. Дополнение. dQt(XE-A') = det(A.?-A)' = det(XE-A) согласно 4.1-12. 8.2-23.3 Характеристические многочлены подобных матриц Подобные матрицы имеют одинаковые характеристические многочлены. Дополнение. Пусть В = Р~ {АР. Принимая во внимание 4.2-10, 4.4-11, имеем dct(XE -В) = det(P" \ХЕ - А)Р) = detP"l • det(XE - A) • det P = det(XE - A). 8.2-24.4 Характеристические многочлены матриц АВ и ВА Для любых двух квадратных матриц А, В одного порядка матрицы А В и В А имеют одинаковые характеристические многочлены. Дополнение. Принимая во внимание 8.2-19, нужно показать, что суммы всех главных миноров одного порядка матриц АВ и ВА совпадают. Согласно 4.2-13 имеем у, <.. <jr<m - z z \uk{ <...<kr<m 1 < у, <.. <j i!V z *4Jr"J; 8.2-2S.4 Случай прямоугольных матриц А, В Пусть даны любые две матрицы А, В размеров тх п9пх т соответственно, где т > п. Характеристические многочлены матриц АВ и ВА связаны между собой соотношением - АВ) = Xя ~ "dQt(XE - ВА). Дополнение. По определению 4.2-1 все миноры порядка выше п для матриц Л и В считаются нулевыми. Применяя формулу Бине-Коши 4.2-13 для вычисления миноров порядка г > п для матрицы АВ, заключаем, что все они равны нулю. Поэтому согласно 8.2-19 все коэффициенты характеристического многочлена матрицы АВ при степенных членах от Хт~"~1 до свободного члена будут так же нулевыми.
268 Часть I. Математические сведения по линейной алгебре Совпадение коэффициентов при старших степенных членах характеристических многочленов матриц Л В и ВА доказано в дополнении к 8.2-24. 8.2-26.3 Характеристические многочлены матриц А и А* Коэффициенты характеристических многочленов матриц А и А* комплексно сопряжены. Дополнение. Принимая во внимание 4.1-12, 4.1-13, имеем det(kE - А*) = det (ХЕ - А) = det (ХЕ -A) = det(XE - A). 8.2-27.3 Комментарий (различие числовых полей) Относительно последнего утверждения следует сделать следующее замечание. Очень многие утверждения справедливы для всех числовых полей. Однако некоторые из них имеют место только для поля комплексных или поля вещественных чисел. Например, только для поля комплексных чисел справедливы все утверждения, имеющие в своей формулировке ссылку на сопряженную матрицу А*, т. к. только для этого поля была определена такая матрица. Только для поля вещественных чисел справедливы все утверждения, имеющие в своей формулировке ссылку на евклидово пространство и т. п. Об этом не надо забывать! 8.2-28.3 Вид подобной матрицы Пусть *1, ...,хг— линейно независимые собственные векторы матрицы А, соответствующие собственному значению ц. Рассмотрим любую невырожденную матрицу В, у которой в качестве первых г столбцов взяты векторы хь ..., хг. Тогда матрица В~ ХАВ имеет следующий блочный вид B~lAB = , D Здесь Е— единичная матрица порядка г, О— нулевая матрица, С и D— какие-то матрицы подходящих размеров. Дополнение. Обозначим через bu b2, ... вектор-столбцы матрицы В. По определению 4.4-7 обратной матрицы, В~ lbf = е, для всех /, где е, есть /-и вектор-столбец естественного базиса 1.7-26. Первые г столбцов матрицы В представляют собственные векторы х\, ..., хп соответствующие собственному значению ц. Поэтому ВТ ]Abj = ВТ xAxt = В~ \\jdc,) = \хВ~ lbt = \xet для 1 < / < г, откуда и вытекает справедливость утверждения. 8.2-29.3 Делитель характеристического многочлена Если матрица имеет блочный вид, указанный в утверждении 8.2-28, то ее характеристический многочлен делится на (X - ц)г.
8. Спектральные свойства матриц 269 Дополнение. Раскладывая определитель согласно 4.2-7 по первым г столбцам, получаем det " ^ " = det(A.? - \хЕ) • dQt(XE - ?>) = (А, - \x)r det(XE - D). 8.2-30.3 След, определитель и собственные значения Пусть Хи ...Дт— собственные значения матрицы А порядка т. Имеют место соотношения Дополнение. Пусть матрица А порядка т имеет собственные значения Хъ ..., Хт. Тогда для характеристического многочлена матрицы А справедливо разложение dtt{XE-A) = Xm-a{Xm~l + ...+(- \)mam = (X-ХХ)(Х-Х2)...(X-Хт). Принимая во внимание 7.2-11 и 8.2-20, заключаем, что tr A = ^Xi9del A = f\Xr 8.2.3. Кратность собственных значений 8.2-31.4 Число и кратность собственных значений Пусть квадратная матрица порядка т задана над алгебраически замкнутым полем. Она имеет т собственных значений, если каждое из них считать столько раз, какова его кратность как корня характеристического многочлена. Каждая группа равных собственных значений имеет хотя бы один собственный вектор. Дополнение. Согласно 8.2-18 характеристический многочлен матрицы порядка т имеет степень т, т. к. коэффициент при Хт не равен нулю. Если поле, которому принадлежат элементы матрицы, алгебраически замкнуто, то согласно 7.2-15 характеристический многочлен имеет ровно т корней, если каждый из них считать столько раз, какова его кратность. Согласно 8.2-21, собственные значения матрицы, и только они, являются корнями характеристического многочлена. И наконец, если X есть собственное значение, то согласно 6.3-10, 8.2-4, 8.2-5 система (ХЕ- А)х = 0 обязательно имеет ненулевое решение независимо от кратности X, т. е. обязательно существует хотя бы один собственный вектор, соответствующий собственному значению X. 8.2-32.3 Алгебраическая кратность Кратность собственного значения как корня характеристического многочлена называется алгебраической кратностью собственного значения или просто его кратностью.
270 Часть I. Математические сведения по линейной алгебре 8.2-33.3 Геометрическая кратность Максимальное число линейно независимых собственных векторов, относящихся к данному собственному значению, называется геометрической кратностью собственного значения. 8.2-34.3 Величина геометрической кратности Геометрическая кратность собственного значения X матрицы А порядка т равна т - хгхМХЕ - A). Дополнение. По определению 8.2-33 геометрическая кратность собственного значения X есть максимальное число линейно независимых собственных векторов, относящихся к X. Все такие собственные векторы являются решениями однородной системы (ХЕ-А)х = 0. Согласно 6.3-4 размерность собственного подпространства равна т - rax\k(XE - A). 8.2-35.3 Сравнение геометрической и алгебраической кратности Геометрическая кратность любого собственного значения не превосходит его алгебраической кратности. Дополнение. Это есть прямое следствие из 8.2-29, т. к. максимальная степень р многочлена вида (X - ц/, на который делится характеристический многочлен, равна кратности числа ц как корня характеристического многочлена или, другими словами, алгебраической кратности собственного значения ц. 8.2-36.3 Кратности собственных значений матриц АиЛ* Геометрические (алгебраические) кратности соответствующих собственных значений матриц А и А* совпадают. Дополнение. Если характеристический многочлен матрицы А делится на (Х-Х;)к' , то характеристический многочлен матрицы А* делится на (X-Xi)ki и наоборот, что является следствием 8.2-26. Поэтому алгебраические кратности собственных значений А* и fa матриц А пА* совпадают. Геометрические кратности определяют согласно 8.2-34. Очевидно, что ранги матрицы и сопряженной к ней совпадают. Следовательно, имеем т - rank(A.,? -A) = m- mtk(\E -A)* = m- rank(X/? - A*\ то есть совпадают и геометрические кратности собственных значений матриц А иА*.
8. Спектральные свойства матриц 271 8.3. Матрицы простой структуры 8.3.1. Строение матрицы простой структуры 8.3-1.4 Матрица простой структуры Матрица А порядка m называется матрицей простой структуры, если она имеет т линейно независимых собственных векторов. В противном случае матрица называется дефектной. 8.3-2.4 Представление матрицы простой структуры Пусть матрица А имеет простую структуру. Обозначим через xh ..., хт полную систему ее линейно независимых собственных векторов, соответствующих собственным значениям X]y...,Xm. Пусть X— матрица, столбцами которой являются векторы х\9..., хт Л— диагональная матрица с диагональными элементами Хи ..., Хт. Имеют место равенства АХ=ХА, Х~1АХ=А, А=ХАХГ\ Дополнение. По определению 4.4-7 обратной матрицы, Х~ xxt = et для всех /, \<i<m, где et есть /-й вектор-столбец естественного базиса 1.7-26. Столбцы матрицы X представляют собственные векторы xh ..., *„,, соответствующие собственным значениям Х\, ...,Хт Поэтому Х~ lAxi = для всех /', 1 <i<m. Собирая все эти равенства вместе, получаем одно матричное равенство X" 1АХ= Л. Умножая его слева на матрицу X, находим другое равенство АХ=ХА. Умножая это последнее равенство справа на матрицу Х~ \ устанавливаем справедливость еще одного равенства А=ХАХ~1. 8.3-3.4 Обратное утверждение Пусть для квадратной матрицы А и невырожденной матрицы X справедливо одно из равенств АХ=ХА, ХГХАХ=А, А=ХАХГ\ где Л — диагональная матрица. Тогда матрица А имеет простую структуру, столбцы матрицы X являются собственными векторами матрицы А, соответствующими собственными значениями являются диагональные элементы матрицы Л. Дополнение. Так как матрица X невырожденная, то все эти равенства эквивалентны, что было показано, например, в дополнении к 8.3-2. Рассмотрим равенство АХ=ХА. Обозначим через jci, , jcm столбцы матрицы X, через А,ь ... Дт — диагональные элементы матрицы А. Для всех /, 1 < / < т, /-й столбец матрицы АХ, т. е. Axh должен равняться z'-му столбцу матрицы ХА, т. е. Xpch Следовательно, для всех /, 1 < / < т, выполняются равенства Axt = Xpct. Это означает, что столбцы матрицы X являются собственными векторами матрицы А, а диагональные элементы мат-
272 Часть I. Математические сведения по линейной алгебре рицы Л— соответствующими собственными значениями. Так какл:ь ...,хт представляют столбцы невырожденной матрицы, то эта система векторов согласно 4.1-25, 4.4-1 линейно независима. Поэтому матрица Л имеет простую структуру. 8.3-4.4 Критерий простой структуры Матрица имеет простую структуру тогда и только тогда, когда подобна диагональной матрице. По этой причине матрицу простой структуры часто называют диагонолизуе- мой матрицей. Дополнение. Это есть прямое следствие 8.3-2, 8.3-3. 8.3-5.4 Еще один критерий Матрица над алгебраически замкнутым полем имеет простую структуру тогда и только тогда, когда для каждого ее собственного значения алгебраическая и геометрическая кратности совпадают. Дополнение. Согласно 7.2-6, 7.2-15, 8.2-32 сумма алгебраических кратностей всех собственных значений равна порядку матрицы. Если матрица имеет простую структуру, то сумма геометрических кратностей всех собственных значений также равна порядку матрицы. Согласно 8.2-35 геометрическая кратность любого собственного значения не превосходит его алгебраической кратности. Равенство сумм кратностей возможно только в том случае, когда для каждого собственного значения его геометрическая и алгебраическая кратности совпадают. Пусть теперь эти кратности совпадают для каждого собственного значения. Тогда для каждого собственного значения найдется столько линейно независимых собственных векторов, какова кратность собственного значения как корня характеристического многочлена. Следовательно, у матрицы существует столько собственных векторов, каков ее порядок. Остается показать, что все эти векторы линейно независимы. По построению они представляют объединение базисов всех собственных подпространств. Но согласно 8.2-13 сумма собственных подпространств является прямой. Согласно же 5.3-14 это возможно только тогда, когда объединение базисов собственных подпространств является базисом суммы подпространств. Следовательно, система собственных векторов линейно независима и матрица имеет простую структуру. 8.3.2. Свойства матрицы простой структуры 8.3-6.4 Попарное различие собственных значений Если все собственные значения матрицы, заданной над алгебраически замкнутым полем, попарно различны, то она имеет простую структуру. Дополнение. Согласно 8.2-2 каждому собственному значению соответствует хотя бы один собственный вектор. Следовательно, в соответствии с 8.2-31 матрица имеет столько собственных векторов, каков ее порядок. Согласно 8.2-12 вся эта
8. Спектральные свойства матриц 273 система линейно независима. Поэтому по определению 8.3-1 матрица имеет простую структуру. 8.3-7.4 Простая структура и перестановочность Пусть матрицы А, В заданы над алгебраически замкнутым полем и матрица В имеет попарно различные собственные значения. Если матрица А перестановочна с матрицей В, то она имеет простую структуру. Дополнение. По условию у матрицы В попарно различные собственные значения. Поэтому согласно 8.3-6 она имеет простую структуру. В соответствии с 8.3-2 представим матрицу В в виде разложения В = Y<dY~ \ где столбцами матрицы У являются собственные векторы матрицы В, диагональные элементы диагональной матрицы 0 суть собственные значения матрицы В. Справедлива цепочка следствий АВ = ВА ->АУвГ! = Г0ГХА -> Г lAY® = 0Г lAY-> C0 = ©С, где С = ТlAY. Обозначим через сц элементы матрицы С, через 0, — диагональные элементы матрицы 0. Приравнивая элементы матриц С0 и 0С в позиции (/,у), получаем, что = 9; Су. По условию 0У Ф 0, для / Ф}. Поэтому с,-; = 0 для / Ф], т. е. матрица С является диагональной. Но С = Т ]А Y. Согласно 8.3-3 это означает, что матрица А есть матрица простой структуры. Более того, матрица А имеет ту же систему собственных векторов, что и матрица В. 8.3-8.4 Простая структура матриц А' и Л В условиях и обозначениях утверждения 8.3-2 матрица А' (А~1) имеет простую структуру и ее собственным вектором, соответствующим собственному значению Х/(\/Х,), является /-й столбец матрицы (А7) (матрицы X). Дополнение. Если матрица А имеет простую структуру, то согласно 8.3-2 для нее справедливо разложение А =Х АХ~ \ Отсюда получаем разложения для матриц А' иА~1: А1 = ((X)"]) Л (рсу 1У \ А~l = Jf A" IT \ Обозначим через А,,- собственное значение матрицы А, расположенное на месте /-го диагонального элемента матрицы А. Из полученных разложений согласно 8.3-3 заключаем, что матрица А' (А~1) имеет простую структуру и собственным вектором матрицы А' (А~!), соответствующим собственному значению Л.ДГ1), является /-столбец матрицы (X)"х (матрицы X). 8.3-9.4 Простая структура матрицы А* В условиях и обозначениях утверждения 8.3-2 матрица А* имеет простую структуру и ее собственным вектором, соответствующим собственному значению h, является /-й столбец матрицы (Х*)~1.
274 Часть /. Математические сведения по линейной алгебре Дополнение. Из разложения A=XAJCl получаем, что Согласно 8.3-3 матрица А* имеет простую структуру и ее собственным вектором, соответствующим собственному значению Xiy является /-й столбец матрицы (ГУ1. 8.3-10.4 Образ матрицы простой структуры Для матрицы простой структуры образ есть линейная оболочка собственных векторов, соответствующих ненулевым собственным значениям. Дополнение. Если матрица А имеет простую структуру, то в пространстве можно выбрать базис из ее собственных векторов. Согласно 6.4-4 образ матрицы А есть линейная оболочка образов векторов базиса. Но образы собственных векторов, соответствующих нулевому собственному значению, суть нулевые векторы. Поэтому можно считать, что образ матрицы А есть линейная оболочка образов собственных векторов или, что то же самое, самих собственных векторов, соответствующих ненулевым собственным значениям. 8.3-11.4 Пересечение образа и ядра Пересечение образа и ядра матрицы простой структуры состоит только из нулевого вектора. Дополнение. Пусть х € ker A n \тА. Согласно 8.3-10 образ матрицы А совпадает с линейной оболочкой ее линейно независимых собственных векторов jci, ...,xn соответствующих ненулевым собственным значениям Xh ..., Хг. Поэтому a2x2 + ... + а^ для каких-то чисел aj, ..., ctr. Но так как х е ker А, то Ах ~ 0. Умножая равенство для вектора х слева на матрицу А, заключаем, что должно выполняться такое равенство: 0 = (X1A.1JC1 + a2\2x2 + .. .+а/Л.ггг. Согласно 2.1-10 в силу линейной независимости векторов х\, ...,хг имеем осД/ = 0 для всех /, 1 < / < л Так как \>Ф 0 для всех /, то для всех / должны выполняться равенства а, = 0. Следовательно, х = 0. 8.3-12.4 Разложение пространства Для матрицы простой структуры, и только для нее, все пространство может быть представлено как прямая сумма ее собственных подпространств. Дополнение. Пусть матрица имеет простую структуру. Согласно определению 8.3-1 в пространстве можно выбрать базис из ее собственных векторов. С другой стороны, этот базис есть объединение базисов всех собственных подпространств.
8. Спектральные свойства матриц 275 Согласно 5.3-14 это означает, что пространство может быть представлено как прямая сумма всех собственных подпространств. Пусть теперь такое представление имеет место. Выберем в каждом собственном подпространстве базис и рассмотрим объединение таких базисов. Это объединение состоит из собственных векторов матрицы. Согласно 5.3-14 оно образует базис во всем пространстве. Поэтому вся система собственных векторов линейно независима и общее число векторов в системе равно размерности пространства. Согласно определению 8.3-1 матрица в этом случае есть матрица простой структуры. 8.3-13.5+ Ассоциированные матрицы Если матрица А имеет простую структуру, то простую структуру будут иметь все ассоциированные с ней матрицы. Дополнение. См. [4], стр. 86. 8.3.3. Ортогональность в собственных векторах 8.3-14.4 Комментарий (используемая ортогональность) Формулировки всех утверждений данного пункта связаны с ортогональностью векторов. Она понимается в смысле скалярного произведения вида 5.1-8 относительно естественного базиса. Всюду предполагается, что пространство комплексное или вещественное. 8.3-15.4 Комплексно-сопряженные собственные значения Пусть х есть собственный вектор матрицы А простой структуры, соответствующий собственному значению X. Существует такой собственный вектор у матрицы А*, соответствующий собственному значению X, что (х, у) = 1. Дополнение. Не ограничивая общности, будем считать, что в соответствии с 8.3-2 вектор х расположен в первом столбце матрицы X, число X находится на месте первого диагонального элемента матрицы Л. Согласно 8.3-9 в первом столбце матрицы (Х*)~1 расположен собственный вектор матрицы ^* ион соответствует собственному значению X. Обозначим этот вектор через у. Имеем (х,у) =у*х = 1, т. к. произведение у*х есть элемент в позиции A,1) матрицы 8.3-1 б.4 Комментарий (замечание) Заметим, что в отличие от утверждения 8.2-17 утверждение 8.3-15 справедливо только для матриц простой структуры. В общем случае оно не выполняется. В этом легко убедиться, рассмотрев, например, матрицу второго порядка, у которой все элементы нулевые, кроме элемента в позиции B, 1).
276 Часть I. Математические сведения по линейной алгебре 8.3-17.4 Биортонормированные системы собственных векторов Для любой системы хь ..., xs линейно независимых собственных векторов матрицы А простой структуры существует биортонормированная система^, ...,ух собственных векторов матрицы А*. Дополнение. Пусть для матрицы А простой структуры выбрана система jcb ...,х, линейно независимых собственных векторов. Согласно определению 8.3-1 дополним ее собственными векторами xs?\9 ...,*,„ до базиса пространства. Составим матрицу^, столбцами которой являются векторы хь ...,xw. Согласно 8.3-9 столбцы матрицы (Х*)~1 представляют собственные векторы у\,...,ут матрицы А*. Принимая во внимание 5.1-8, 8.3-14, легко понять, что скалярное произведение (jc/, yj) есть сумма попарных произведений элементов /-го столбца матрицы X и комплексно-сопряженных элементов у-го столбца матрицы (Х*)~ \ которая, в свою очередь, равна элементу в позиции (/,/) произведения матриц X и (Х*)~] . Но Х'(Х*)~1 -Х\Х') ' = ?, что означает согласно 5.2-17 биортонормированность систем *ь ...,xw иуъ ...,утн,в частности, систем лгь ...,хУ ну{, ...,>\. В действительности доказано даже несколько больше. Именно, если линейно независимые собственные векторы хь ...,xs матрицы А соответствуют собственным значениям \\, ..., \у, то, принимая во внимание полный текст 8.3-9, заключаем, что выбранная биортонормированная система^, ...,ys собственных векторов матрицы А* будет соответствовать комплексно-сопряженным собственным значениям Ал,...Д*, причем независимо от их кратности. 8.3-18.4 Простая структура и биортонормированность Пусть А — произвольная матрица простой структуры порядка т. Всегда существуют биортонормированные базисы хь ...,хт 1луь ...уут в пространстве, состоящие из собственных векторов матриц А и А*, относящихся соответственно к собственным значениям Хь ..., Хти \\9...,Х„,. Дополнение. Очевидно, принимая во внимание 8.3-17 и замечание в конце дополнения к 8.3-17. 8.3-19.4 Матрицы Л и Л* в биортонормированных базисах В биортонормированных базисах утверждения 8.3-18 матрицы А и А* имеют вид диагональных матриц Л и Л соответственно. Дополнение. Если Р есть матрица преобразования координат при переходе от естественного базиса в\у ..., ет к базису хь ...,хт из собственных векторов матрицы А, то согласно 8.1-2 и обозначениям в 8.3-2 имеем Р = Х. Если Q есть матрица преобразования координат при переходе от естественного базиса еи ..., ет к бази- СУУ\> ---уУт* биортонормированному по отношению к базису хь ...,хт, то, как было показано в дополнении к 8.1-21, выполняется равенство P* = Q~\ Поэтому,
& Спектральные свойства матриц 277 принимая во внимание согласно 8.3-2 представление матрицы А в виде произведения ХЛХ~ \ получаем, что 8.3-20.4 Соответствующие матрицы В обозначениях 8.3-18 матрица Gt =xiy* ранга 1 (здесь векторы х и у представлены как одностолбцевые матрицы) называется матрицей соответствующей (сопутствующей) собственному значению Xh 8.3-21.4 Свойства соответствующих матриц Соответствующие матрицы обладают следующими свойствами: fo, i*k, k Дополнение. Принимая во внимание биортонормированность систем векторов хи ...,хтиуи ...,>>„„ а также 5.1-12, имеем для всех г, 1 <г<т. Обозначим через X матрицу, столбцами которой являются векторы jci, ...,xm. Согласно 5.2-18 система векторов лгь ...,хт линейно независима. Поэтому матрица X невырожденная согласно 4.1-25, 4.4-1 и в соответствии с 4.4-7 имеет обратную матрицу Х~\ В матричной записи полученные выше равенства таковы: Умножая это равенство справа на матрицу Х~1, заключаем, что Далее находим, что tGk =xiyixkyk =x,(yixk)yk=(xk,yi)xiyk=tG . = 8.3-22.4 Разложение матрицы на соответствующие Для любой матрицы А простой структуры имеет место разложение
278 Часть I. Математические сведения по линейной алгебре Дополнение. Пусть матрица А простой структуры имеет собственные векторы х\,...,хт9 соответствующие собственным значениям аь ...Дт. Аналогично дополнению к 8.3-21 имеем А - ]? А. / = ! для всех г, 1 < г < т. Поэтому 8.3-23.4 Полезное равенство Пусть X — любое число, не являющееся собственным значением матрицы А простой структуры. Справедливо равенство Дополнение. Пусть матрица А простой структуры имеет собственные векторы х\9 ...,хда, соответствующие собственным значениям Хи ..., Хт и биортонормиро- ванную систему^!, ...Jffl из собственных векторов матрицы А*, соответствующих собственным значениям Xi,... Д,„. Принимая во внимание 8.3-21, заключаем, что л. — л,, , _ 1 /v - ftt Х-Х, jtt Х-Х4 Умножая обе части равенства справа на матрицу (ХЕ - А)' \ имеем АУ?. Это можно делать, т. к. матрица ХЕ-А невырожденная в силу условия, что X не является собственным значением матрицы А. 8.3-24.4 Обнуление собственных значений В условиях и обозначениях 8.3-18 построим соответствующие матрицы Gu ...,Gm. Для любого 5, 1 < s < т, матрица
8. Спектральные свойства матриц 279 имеет те же собственные векторы хъ ...,xm, что и матрица А. Собственные векторы xh 1 < / < s, соответствуют одному и тому же собственному значению, равному 0. Собственные векторы xh s+ I <i<m, соответствуют собственным значениям А,,-. Дополнение. Проверяется непосредственно. В самом деле, для всех г, 1 < г < т, имеем ( s I А - E^/G/ \Xr = 0, r<s. 8.3-25.4 Комментарий (метод исчерпывания) Утверждение 8.3-24 показывает, как можно исключать из спектра матрицы Л отдельные собственные значения. Последовательное исключение собственных значений называется методом исчерпывания. 8.3-26.4 Свойство собственных векторов Любой собственный вектор матрицы А, ортогональный векторам у\, ...,ys из 8.3-18, является собственным вектором матрицы 8.3-24, соответствующим одному из собственных значений Xs +1, ..., Хт, и наоборот. Дополнение. Пусть х есть собственный вектор матрицы А, соответствующий собственному значению X и ортогональный векторамуи ...9ys из 8.3-18. Имеем S \ S а - Y^fli \х=Ах - Т,хлу*х = Ах~ Z^(*> yJxi= ^ так как согласно условию (л;, у,) = 0 для всех /, 1 < / < s. Поэтому вектор х является собственным для матрицы 8.3-24 и соответствует собственному значению X. Предположим, что X не равно ни одному из чисел Xs+h ..., Хт. Тогда согласно 8.2-17 вектор х должен быть ортогонален векторам ys+\, ...,ут т. е. всем векторам yh ...,ут. Это означает, что х = 0. Но х есть собственный вектор и, следовательно, хфО. Полученное противоречие говорит о том, что X является одним из чисел \v + i> ••-, Ki- Пусть теперь z есть собственный вектор матрицы из 8.3-24, соответствующий собственному значению ц и ортогональный векторам^, ...,ys из 8.3-18. Имеем \xz = \А - ^\& \z = Az -J^X^yz = Az -J^X,(z, y,)x, = Az. Поэтому вектор z является собственным для матрицы А и соответствует собственному значению \х. Снова, как и выше, предположение, что \х не равно ни одному из чисел Xs+ ь ...9Хт приводит к противоречию.
280 Часть I. Математические сведения по линейной алгебре 8.3-27.4 Комментарий (обсуждение простой структуры) Тот факт, что среди всех матриц выделяются матрицы простой структуры, объясняется очень просто. Эти, и только эти, матрицы в некотором базисе имеют диагональный вид матрицы. Такой базис может быть составлен лишь из собственных векторов матриц. Действие любой матрицы простой структуры всегда сводится к "растяжению" координат вектора в данном базисе. Коэффициентами "растяжения" являются соответствующие собственные значения. Если бы все матрицы имели простую структуру, то вопрос о выборе базиса, в котором матрица приводится к простейшему виду, был бы полностью решен. Однако матрицами простой структуры не исчерпываются все матрицы.
9. Структура матриц общего вида 9.1. Инвариантные подпространства 9.1.1. Общие свойства инвариантных подпространств 9.1-1.4 Инвариантное подпространство Подпространство L арифметического пространства X называется инвариантным относительно квадратной матрицы А, если для каждого вектора д: из L его образ Ах также принадлежит L. 9.1-2.4 Тривиальные инвариантные подпространства Нулевое подпространство и все пространство являются инвариантными. Они называются тривиальными инвариантными подпространствами. 9.1-З.4 Инвариантность собственного подпространства Любое собственное подпространство является инвариантным. Дополнение. Пусть L есть собственное подпространство матрицы А, соответствующее собственному значению X. Если х е L, то Ах = Хх е L. 9.1-4.4 Инвариантность образа и ядра Образ и ядро матрицы являются ее инвариантными подпространствами. Дополнение. Пусть х е im А, тогда х^Ау для некоторого вектора>\ В этом случае Ах = А(Ау) е \тА. Если7 е ktrA, toAz = 0 e кегА, т. к. ксгА, согласно 6.4-3 есть подпространство и, следовательно, ему принадлежит нулевой вектор.
282 Часть I. Математические сведения по линейной алгебре 9.1-5.4 Инвариантные подпространства перестановочных матриц Если матрицы А и В перестановочны, то образ и ядро матрицы В инвариантны относительно матрицы А. Дополнение. Предположим, что матрицы А и В перестановочны, т. е. АВ = ВА. Если х е im В, то х = By для некоторого вектора у. В этом случае Ах - АВу = = В(Ау) е im В. Если z e ker В то Bz = 0 и B(Az) = A(Bz) = О, т. е. Az е ker В. 9.1-б.4 Инвариантные подпространства матриц Л и Л Если матрица А невырожденная, то А и А~] имеют одни и те же инвариантные подпространства. Дополнение. Пусть L есть инвариантное относительно матрицы А подпространство. Если L — нулевое подпространство, то утверждение очевидно. Предположим поэтому, что L— ненулевое подпространство. Выберем в нем базис х\, ...,хг. Каждый вектор х, можно представить в виде А~ xyh где у, — некоторый вектор пространства. Если Xj e Z,, то по условию Ах, е L. Но Axi=yh Следовательно, в подпространстве L существуют векторы у\> ...9уг такие, что Х/ = A'xyh Матрица А~х невырожденная, поэтому согласно 4.4-26 система векторовуи ...,уг линейно независима и представляет базис в L. Для любого вектора у е L справедливо разложение у = ocj^i + ... + aryr. Далее имеем то есть подпространство L инвариантно относительно матрицы А~ \ 9.1-7.4 Инвариантные подпространства любой матрицы Для любой матрицы А любое подпространство, содержащее ее образ, является инвариантным. Дополнение. Пусть im А с L, где L — некоторое подпространство. Тогда из х е L следует, что Ах е im А с L. 9.1-8.4 Инвариантные подпространства матриц Л и А* Если некоторое подпространство инвариантно относительно матрицы А, то его ортогональное дополнение инвариантно относительно матрицы А*. Дополнение. Пусть L есть инвариантное подпространство матрицы А. Возьмем произвольные векторы х е L,y e L1. Так как Ах е L, то (у, Ах) = 0. Но согласно 5.2-25 имеем (А*у, х) = (у, Ах). Следовательно, А*у е L1. 9.1-9.4 Сумма и пересечение инвариантных подпространств Сумма и пересечение любого числа инвариантных подпространств являются инвариантными подпространствами.
9. Структура матриц общего вида 283 Дополнение. Согласно 5.3-11, 5.3-17 сумма подпространств и пересечение подпространств являются подпространствами. Пусть LUL2— инвариантные относительно матрицы А подпространства. Если х е L\ с\ L2, то х е L\ и х е L2. По условию Ах е Lx и Ах е L2. Поэтому Ах е Lx n L2. Если z e Lxu L2, то вектор z принадлежит, по крайней мере, одному из подпространств Lx или L2. Пусть, например, z e L\. По условию Az e L\. Поэтому Az e Lx\j L2. 9.1-10.4 Разложение пространства и простая структура матрицы Если хотя бы для одного нетривиального подпространства L не существует инвариантного относительно матрицы А подпространства М такого, что X = L + М , то матрица А не имеет простой структуры. Дополнение. Пусть L— есть нетривиальное подпространство, для которого не существует инвариантного относительно матрицы А подпространства М такого, что пространство X раскладывается в прямую сумму X = L + М . Предположим, что, тем не менее, матрица А имеет простую структуру. По определению 8.3-1 существует базис пространства^, составленный из собственных векторов xu ...,xm матрицы А, соответствующих собственным значениям Х\9...,Хт. Пусть eh ..., ek — базис в L. Рассмотрим систему из векторов еъ ..., ек, хь ..., хт. Ее ранг, очевидно, равен т. Согласно 2.2-10 дополним линейно независимую подсистему векторов еъ ...,ек до базы. Дополнительными могут быть лишь векторы из х\9 ...,хт. Предположим, что это векторы jcfti jcAje k . Рассмотрим подпространство М9 представляющее линейную оболочку векторов хк9...9хк .По построению, объединение базисов подпространств L и Месть базис вX. Поэтому согласно 5.3-14 имеем X = L 4- М . Но подпространство М инвариантно относительно матрицы А. Действительно, если z е М, то z -а,х^ +... + ыт_кхкт к для каких-то чисел а,,...,осот_А,идалее Полученное противоречие говорит о том, что матрица А не может иметь простую структуру. 9.1.2. Критерии инвариантных подпространств 9.1-11.4 Критерий инвариантности подпространства Пусть в арифметическом пространстве X размерности т задано подпространство L размерности к. Построим матрицу С размера тх к, столбцы которой представляют векторы базиса подпространства L. Для того чтобы подпространство L было инвариантным относительно матрицы А9 необходимо и достаточно, чтобы существовала квадратная матрица D порядка к такая, что АС = CD.
284 Часть I. Математические сведения по линейной алгебре Дополнение. Обозначим через сь ..., ck(dXi ..., dk) столбцы матрицы C(D). Предположим, что пространство L инвариантное. Для всех /, 1 < / < ?, имеем Acj e L. Как вектор из L, вектор Acj может быть представлен в виде разложения по векторам сь ...,с*. Другими словами, существуют числа du,...>dki такие, что Aci>=duc{ + ...+ dkick. Обозначим через d{ вектор-столбец с координатами dxn ..., dki. Тогда в этих обозначениях Acj = Cdh Собирая вместе эти векторные равенства для всех /, получаем одно матричное равенство AC=CD. Пусть теперь справедливо матричное равенство АС = CD. Возьмем любой вектор х е L. Существуют числа аь ..., ak такие, что х = <Х\С\ + ... + akck. Обозначим через а вектор- столбец с координатами аь ...,а*. Тогда в этих обозначениях х = Са и Ах = АСа = С(?>а). Вектор C(Da) есть линейная комбинация столбцов матрицы С или, другими словами, векторов си ..., ск базиса подпространства L. Коэффициентами этой линейной комбинации являются координаты вектор-столбца Da. Следовательно, Ах е L и подпространство L инвариантное. 9.1-12.4 Расширенный критерий Если утверждение 9.1-11 выполняется для какой-нибудь одной матрицы С, то оно выполняется и для любой другой матрицы С размера m x r,r>k, линейная оболочка столбцов которой совпадает с подпространством L. Дополнение. Доказательство дословно повторяет дополнение к 9.1-11, только теперь векторы си ..., сг представляют систему векторов, линейная оболочка которых совпадает с L. Эта система не обязательно должна быть базисом в L. 9.1-13.4 Очевидный факт Если пространство X и матрица А заданы над алгебраически замкнутым полем, то матрица D из утверждения 9.1-11 имеет хотя бы один собственный вектор. Дополнение. Это есть прямое следствие 8.2-31. 9.1-14.4 Инвариантное подпространство и собственный вектор Пусть пространство X и матрица А заданы над алгебраически замкнутым полем. Тогда в любом ненулевом подпространстве, инвариантном относительно матрицы А, содержится хотя бы один собственный вектор матрицы А. Дополнение. Пусть пространство L инвариантное. Согласно 9.1-11 выполняется равенство АС = CD, где столбцы матрицы С представляют базис в L, матрица D квадратная. В силу алгебраической замкнутости поля, матрица D согласно 9.1-13 имеет собственный вектор та, соответствующий какому-то собственному значению т, т. е. Dw = тти. Рассмотрим вектор Ста. Это есть вектор-столбец, образованный как линейная комбинация столбцов матрицы С. Следовательно, Сш е L Столбцы матрицы С линейно независимы, а вектор тп ненулевой по построению. По этим причинам ненулевым будет и вектор Cm.
9. Структура матриц общего вида 285 Далее имеем А(Съ) = (AQw = (CD)m = Сфтп) = С(тто) = т(Стэ). Поэтому вектор Cm из Z является собственным вектором матрицы А, соответствующим собственному значению т. 9.1-15.4 Собственный вектор перестановочных матриц Пусть пространство X и матрицы А9 В заданы над алгебраически замкнутым полем. Если матрицы А, В перестановочны, то они имеют общий собственный вектор. Дополнение. Согласно 8.2-31 матрица В имеет хотя бы один собственный вектор, соответствующий собственному значению X, Обозначим через L собственное подпространство матрицы В, соответствующее X. Возьмем любой вектор х е L. Имеем Вх = 7ос. Умножив это равенство слева на матрицу А, получим АВх = ХАх. По условию АВ = ВА, поэтому В(Ах) = Х{Ах). Следовательно, если Ах ф 0, то вектор Ах является собственным вектором матрицы В, соответствующим собственному значению X, т. е. Ах е L. Если Ах = 0, то также Ах е L. Это означает, что L есть подпространство, инвариантное относительно матрицы А. Согласно 9.1-14 в L содержится хотя бы один собственный вектор z матрицы А, соответствующий некоторому собственному значению \х. Итак Az= jiz и, конечно, Bz = Xz. 9.1.3. Нахождение инвариантных подпространств 9.1-1 б.4 Выбор ортонормированного базиса Если матрица А комплексная, то матрицу С из 9.1-11 всегда можно выбрать с орто- нормированными столбцами. При этом будет выполняться соотношение С*С - Е. Дополнение. Введем в комплексном пространстве скалярное произведение согласно 5.1-8. Возможность выбора ортонормированных столбцов в матрице С следует из 5.2-14. Соотношение же С*С = Е есть не что иное, как другая запись ортонормированности самих столбцов. 9.1-17.4 Явный вид матрицы D В условиях 9.1-16 матрицу D из 9.1 -11 можно взять в виде D = C*AC. Дополнение. Принимая во внимание 9.1-11, 9.1-16, имеем АС - C(C*AQ = CD- C(C*CD) = CD - CD = 0. 9.1-18.4 Невырожденность матрицы С*АС Пусть в условиях 9.1-16 в линейной оболочке столбцов матрицы С нет ни одного ненулевого вектора из ядра матрицы А. Тогда матрица С*АС невырожденная. Дополнение. Предположим противное. В этом случае согласно 6.3-10, 6.4-2 существует вектор х ф 0 такой, что С*АСх = 0. В соответствии с 9.1-17 выполняется
286 Часть I. Математические сведения по линейной алгебре равенство АС = С(С*АС). Умножив его справа на jc, находим, что А(Сх) = 0. Но Сх Ф 0, т. к. столбцы матрицы С линейно независимы. Равенство А(Сх) = 0 означает, что в линейной оболочке столбцов матрицы С существует ненулевой вектор Сх, который одновременно принадлежит ядру матрицы А. Это невозможно по условию. Поэтому матрица С*АС невырожденная. 9.1-19.4 Уравнения для инвариантного подпространства Пусть дана квадратная комплексная матрица А. Для того чтобы столбцы матрицы С составляли ортонормированный базис какого-либо инвариантного подпространства матрицы А, необходимо и достаточно, чтобы матрица С удовлетворяла следующим уравнениям: АС = С(С*АС),С*С = Е. Дополнение. Это есть очевидное следствие 9.1-11, 9.1-16, 9.1-17. 9.2. Подобие треугольной и блочно-диагональной матрице 9.2.1. Вспомогательные утверждения для общего случая 9.2-1.4 Перестановки и подобное преобразование Пусть матрица А имеет собственное значение X и соответствующий ему собственный вектор х. Для любой матрицы перестановок Р матрица В = FAP будет подобна матрице А. Она имеет собственное значение X и соответствующий ему собственный вектор Р'х. Дополнение. Очевидно, т. к. согласно 3.4-3, 4.4-7 имеем F = Р~\ Э.2-2.4 Перестановки и координаты Пусть матрица А имеет собственное значение X и соответствующий ему собственный вектор л:. Всегда можно подобрать такую матрицу перестановок Р в утверждении 9.2-1, что первая (последняя) координата вектора Р'х будет не нулевой. Дополнение. Очевидно, так как любой собственный вектор по определению 8.2-2 является не нулевым. 9.2-3.4 Комментарий (координаты собственных векторов) Заметим, что собственный вектор определяется с точностью до числового множителя. Поэтому, принимая во внимание утверждения 9.2-1, 9.2-2, можно считать при необходимости, что либо первая, либо последняя координата собственного вектора рав-
9. Структура матриц общего вида 287 на 1. При этом предполагается, конечно, что соответствующие перестановки строк и столбцов матрицы выполнены. Э.2-4.4 Комментарий (базисы и блочные матрицы) Инвариантные подпространства широко используются при выборе базисов, в которых матрица приобретает какой-то относительно простой вид. Довольно часто этот вид связан с блочными матрицами. Если не сделано специальных оговорок, то будем предполагать, что диагональные блоки являются квадратными. 9.2-5.4 Характеристический многочлен блочно-треугольной матрицы Если матрица имеет блочно-треугольный (блочно-диагональный) вид, то характеристический многочлен матрицы равен произведению характеристических многочленов всех диагональных блоков. Дополнение. Это есть прямое следствие 4.2-7, 8.2-18. Э.2-6.4 Собственные значения блочно-треугольной матрицы Если матрица имеет блочно-треугольный (блочно-диагональный) вид, то собственные значения матрицы совпадают с множеством собственных значений всех диагональных блоков. Дополнение. Это есть прямое следствие 8.2-21, 9.2-5. 9.2.2. Инвариантные подпространства и блочные матрицы 9.2-7.4 Независимость от базисов Представим пространство X размерности т в виде прямой суммы своих подпространств L и Мразмерности kwm — k. Пусть базис еь ..., ет в Xвыбран таким образом, что векторы еь ..., ек принадлежат L, а векторы ек+ ь ..., ет принадлежат М. При переходе к этому базису матрица А преобразуется в подобную ей матрицу В, которую представим в блочном виде: В = где В и, #22 — квадратные блоки размеров к,т-к. Если подпространство L (М) инвариантно относительно матрицы А, то блок Ви (В2г) не зависит от выбора векторов Дополнение. Предположим, что инвариантным является подпространство L. Инвариантность подпространства М рассматривается аналогично. Пусть Р есть матрица преобразования координат при переходе к базису еь ..., ет. Тогда согласно
288 Часть I. Математические сведения по линейной алгебре 8.1-9 имеем В = Р~ 1АР. Согласно 8.1-2 первые к столбцов матрицы Р образуют базис подпространства L. По условию его выбор не зависит от выбора базиса в подпространстве М. Но в обозначениях 9.1-11 первые к столбцов матрицы Р суть не что иное, как матрица С. Согласно 9.1-11 существует квадратная матрица D порядка к такая, что АС = CD. Выбор матрицы D определяется только матрицами А и С. Так как Г ХР = ?, то где Ек есть единичная матрица порядка L Поэтому 0 J [О то есть В и - D и эта матрица не зависит от выбора базиса в М Э.2-8.4 Инвариантные подпространства и блочно-треугольные матрицы В условиях и обозначениях утверждения 9.2-7 блок В2Х (Вп) является нулевым тогда и только тогда, когда подпространство L (Л/) инвариантно относительно матрицы А. Дополнение. Рассмотрим блок В2Х. Блок ВХ2 рассматривается аналогично. Если подпространство L инвариантное, то, как было установлено в дополнении к 9.2-7, блок В2Х будет нулевым. Предположим теперь, что В2Х = 0. Тогда 0 Вгг\ [0 Вгг В обозначениях 9.1-11 первые к столбцов матрицы Р суть матрица С. Сравнивая первые к столбцов матриц слева и справа в последнем равенстве, заключаем, что АС-СВХХ. Согласно 9.1-11 отсюда вытекает, что подпространство L инвариантное. Э.2-9.4 Собственный вектор в инвариантном подпространстве Предположим, что L есть инвариантное относительно матрицы А подпространство и мы находимся в условиях и обозначениях утверждений 9.2-7, 9.2-8. Если блок ВХ] имеет собственное значение X, то оно является собственным значением матрицы А и в подпространстве L находится соответствующий X собственный вектор матрицы А. Дополнение. Пусть В{ {х = Хх, где jc = (д:,,..., хк)'. Составим вектор х размерности w, дополнив вектор х последними т - к нулевыми координатами. Легко проверить, что Вх = Xjc, т. е. х есть собственный вектор матрицы В. Если В = Р~ 1АРУ то А(Рх) = Х(Рх). Поэтому Рх есть собственный вектор матрицы А, соответствующий собственному значению X. У вектора х отличны от нуля только первые к коорди-
9. Структура матриц общего вида 289 нат. Следовательно, он представляет линейную комбинацию первых k вектор- столбцов матрицы Р. Но именно они представляют согласно 8.1-2, 9.2-7 базис в L. Это означает, что Рх е L. 9.2-10.4 Комментарий (об инвариантных подпространствах) Хотя инвариантные подпространства играют исключительно важную роль, мы пока имеем очень мало сведений об их структуре. Нам известны лишь тривиальные инвариантные подпространства и инвариантные подпространства, являющиеся собственными. Богатую основу для построения инвариантных подпространств дают утверждения 9.2-7, 9.2-8. 9.2-11.4 Размеры блоков и размерности подпространств Для того чтобы в базисе еь ..., ет матрица имела правый блочно-треугольный вид с блоками на диагонали размеров к\, ..., ks, необходимо и достаточно, чтобы линейные оболочки векторов еь ...,ер образовывали инвариантные подпространства Lp для всех р = к{ + ... + кь 1 <t<s. Дополнение. Это есть прямое следствие 9.2-8. 9.2-12.4 Инвариантные подпространства и блочно-диагональные матрицы Для того чтобы в базисе еи ...,ет матрица имела блочно-диагональный вид с блоками на диагонали размеров kh ..., ks, необходимо и достаточно, чтобы линейные оболочки векторов ег, ег+ ь ..., ер образовывали инвариантные подпространства Lp для всех г,р таких, чтор = к\ + ... + khr=p-kt+ l,l<t<s. Дополнение. В самом деле, для того чтобы матрица имела правый блочно- треугольный вид с блоками на диагонали размеров к\, ..., ks, необходимо и достаточно согласно 9.2-11, чтобы линейные оболочки векторов еь .,., ер образовывали инвариантные подпространства для всех р = к) + ... + kh 1 < / < s. Для того чтобы матрица одновременно имела левый блочно-треугольный вид с теми же блоками на диагонали, необходимо и достаточно согласно 9.2-8, 9.2-11, чтобы линейные оболочки векторов ет, ..., ег образовывали также инвариантные подпространства для всех r = m~ ks - ...-к, + 1,1</< s. Принимая во внимание 9.1-9, заключаем, что все эти условия эквивалентны тому, чтобы линейные оболочки векторов ег, ...,ер образовывали инвариантные подпространства Lp для всех/?, г, удовлетворяющих условиямр = к\ + ... +khr=p-kt+ I, I <t<s. 9.2-13.4 Вложенные инвариантные подпространства В условиях 9.2-11 инвариантные подпространства Lp удовлетворяют соотношениям вложения L\ clL2cz ... cLs=X. 10 Зак 740
290 Часть I. Математические сведения по линейной алгебре 9.2-14.4 Разложение пространства в прямую сумму В условиях 9.2-12 инвариантные подпространства Lp обеспечивают разложение пространства в сумму: i,+I2+... + !,= JT. Дополнение. Принимая во внимание условия 9.2-12 и обозначения в дополнении к 9.2-12, легко видеть, что объединение базисов инвариантных подпространств L\9 ..., Ls есть базис пространствах Поэтому согласно 5.3-14 имеем 1г + L2+... + Lt =Х. 9.2.3. Вложенные инвариантные подпространства 9.2-15.4 Уменьшение порядка блока Пусть для к > О подпространство L из утверждения 9.2-7 является инвариантным, возможно, тривиальным. Предположим, что матрица В'и порядка к (см. утверждение 9.2-7) имеет собственное значение X и ему соответствует собственный вектор дс, у которого последняя координата равна 1. Согласно утверждению 3.4-27 составим матрицу типа Мк с элементами в к-й строке, совпадающими с координатами вектора х, и рассмотрим матрицу С-МкВМ~кх, принимая во внимание 4.4-19. Эта матрица подобна матрице А, является правой блочно-треугольной таких же размеров, как матрица В, нижние блоки не изменяются, внедиагональные элементы к-й строки блока в верхнем углу равны 0, кроме элемента в позиции (к, к), который равен X. Дополнение. Обозначим через С, Мк, В, М~1 матрицы ведущих миноров порядка к матриц С, Мк9 В, М~к{. Принимая во внимание вид матриц Мк и Л/, описанный в 3.4-27 и 4.4-19, легко проверить, что в матрице С по сравнению с матрицей В меняются только верхние блоки. Кроме этого, С-МкВМ~кх . Пусть х = (Х{9 ...,х*_ь 1)'. По построению, последняя строка матрицы Мк имеет элементы jcb ...,jc*_], 1. Принимая во внимание 4.4-19, видим, что последняя строка матрицы Мк1 имеет элементы -лсь ..., ~^_ь 1. Кроме этого, по условию В' х = Хх. Обозначим через ск последнюю строку матрицы С. Имеем [= л/;1 \в' 1 1 "о" 0 К
9. Структура матриц общего вида 291 9.2-1 б.4 Еще раз об уменьшении порядка Пусть для k<m подпространство L из утверждения 9.2-7 является инвариантным, возможно, тривиальным. Предположим, что матрица В12 порядка m - k из утверждения 9.2-7 имеет собственное значение ц и ему соответствует вектор z, у которого первая координата равна 1. Согласно утверждению 3.4-27 составим матрицу типа Nk+\ с элементами в (?+ 1)-м столбце, совпадающими с координатами векторах, и рассмотрим матрицу С = Nkl+]BNk + i. Эта матрица подобна матрице А, является правой блоч- но-треугольной таких же размеров, как матрица В, левые блоки не изменяются, вне- диагональные элементы (к + 1)-го столбца блока в нижнем правом углу равны 0, кроме элемента в позиции (к + 1, к + 1), который равен ц. Дополнение. Обозначим через С, А^,, В, Nk]+l матрицы угловых миноров порядка m - к, расположенных в нижнем правом углу матриц C9Nk + l9B, Nkx+l. Принимая во внимание вид матриц Л^ +1 и Nk]+], описанный в 3.4-27 и 4.4-19, легко проверить, что в матрице С по сравнению с матрицей В меняются только правые блоки. Кроме этого, С = Nk + l ВNkl+l. Пусть z = (l,Z2, ...,zm_*)'. По построению, первый столбец матрицы Nk + l имеет элементы l,z2, ...,zm_k. Принимая во внимание 4.4-19, видим, что первый столбец матрицы Nkl+l имеет элементы 1, -Z2, ...,-zw_*. Кроме этого, по условию Bz = \x . Обозначим через cw_* первый столбец матрицы С . Имеем 1 zl Zm-k i zm-k ,= V 0 0 9.2-17.4 Вложенное инвариантное подпространство Пусть матрица А порядка т имеет т собственных значений и L есть подпространство размерности /?>0, инвариантное относительно матрицы А. Тогда в L содержится подпространство размерности р - 1, также инвариантное относительно матрицы А. Дополнение. Приведем согласно 9.2-8 матрицу А к подобной правой блочно-тре- угольной матрице В с блоком Ви порядка р > 0. Матрица В имеет те же т собственных значений, что и матрица Л согласно 8.2-23. Согласно 4.2-7 характеристический многочлен матрицы В, т. е. det(A,?- В), раскладывается в произведение характеристических многочленов матриц Вц и В22, т. е. det(A,? — В\\) и det(A,?-#22)- Поэтому матрица Вп имеет/? собственных значений и согласно 8.2-4, 8.2-5 хотя бы один собственный вектор. Все остальное является прямым следствием 9.2-8, 9.2-15.
292 Часть А Математические сведения по линейной алгебре 9.2-18.4 Объемлющее инвариантное подпространство Пусть матрица А порядка m имеет m собственных значений и L есть не совпадающее с X подпространство размерности р9 инвариантное относительно матрицы А. Тогда существует подпространство размерности р + 1, также инвариантное относительно матрицы А и которое, к тому же, содержит в себе подпространство L. Дополнение. Доказательство почти дословно повторяет дополнение к 9.2-17. Только теперь можно утверждать, что матрица В2г имеет пг-р собственных значений и хотя бы один собственный вектор. Все остальное является прямым следствием 9.2-8, 9.2-16. 9.2-19.4 Цепочка вложенных подпространств Пусть матрица А порядка m имеет m собственных значений. Матрица А имеет в пространстве X вложенные инвариантные подпространства Lp всех размерностей р для О <р< ш, т. е. Z/o с: L \ a Li с ... с Lm = X, Дополнение. Нулевое подпространство Lo является инвариантным. Согласно 9.2-18 существует инвариантное подпространство Lh содержащее Lo. Далее, существует инвариантное подпространство L2, содержащее L\. И т. д., пока не дойдем до инвариантного подпространства Lm, совпадающего со всем пространством X. 9.2.4. Подобие треугольной матрице 9.2-20.4 Треугольный базис Пусть матрица А порядка m имеет m собственных значений. В соответствии с утверждением 9.2-19 выберем базис е\, ...,ет в X так, чтобы ер е Lp для всех р. Тогда в этом базисе матрица А будет правой треугольной. Дополнение. Обозначим через Мр подпространство, представляющее линейную оболочку векторов ер+и ...,ет. Согласно 5.3-14 имеем X — Lp + Мр для всех /?, 1 <р<т. Согласно 9.2-8 матрица А в базисе еь ..., ет будет для всех р правой блочно-треугольной с блоком порядка р в левом верхнем углу. При р - 1 будут нулевыми поддиагональные элементы 1-го столбца, при/? = 2 — поддиагональные элементы 2-го столбца и т. д. Следовательно, матрица является правой треугольной. 9.2-21.4 Подобие треугольной матрице Если квадратная матрица А порядка т имеет т собственных значений, то она подобна правой треугольной матрице. Дополнение. Очевидное следствие 9.2-20.
9. Структура матриц общего вида 293 Э.2-22.4 Заданный порядок собственных значений Пусть квадратная матрица А порядка m имеет m собственных значений и с учетом кратностей они упорядочены каким-то образом. Тогда матрица А подобна правой треугольной матрице, на главной диагонали которой собственные значения находятся точно в таком же порядке. Дополнение. Для любого р, О < р < ть множество собственных значений матрицы А с учетом их алгебраических кратностей совпадает с множеством собственных значений блоков Ви и В22 матрицы В из 9.2-8 также с учетом их алгебраических кратностей. В самом деле, матрица В подобна матрице А. Согласно 8.2-23 обе матрицы имеют одинаковые характеристические многочлены и, следовательно, одинаковые множества собственных значений. По условию матрица В блочно- треугольная. Согласно 4.2-7 det(kE -B) = dQt(kE - Д,,) ¦ det(A,? - В22). Поэтому собственные значения матрицы А и блоков BUiB22 совпадают. Пусть собственные значения матрицы А взяты, например, в таком порядке Хь ..., Хт. Будем последовательно строить матрицы Во, В\, ..., Вт9 подобные матрицей, правые блочно-треугольные с блоком порядка р в левом верхнем углу для матрицы Вр,0<р<т. Возьмем Bq - А. Блок в правом нижнем углу матрицы В0 совпадает с матрицей А. Он заведомо имеет собственное значение Х\ и соответствующий ему собственный вектор. Поэтому согласно 9.2-16 можно построить матрицу Ви у которой в позиции A, 1) будет стоять Х{, и поддиагональные элементы в первом столбце равны нулю. Матрица В{ подобна матрице А. Следовательно, согласно сказанному выше, собственными значениями блока порядка т - 1 в правом нижнем углу будут числа Х2, ..., Хт. Для собственного значения Х2 этот блок имеет согласно 8.2-4, 8.2-5 хотя бы один собственный вектор. Поэтому согласно 9.2-16 можно построить матрицу В2, у которой в позиции B, 2) будет стоять Хъ поддиагональные элементы во втором столбце равны нулю и первый столбец остался таким же, как у матрицы В\. Матрица В2 подобна матрице В\ и поэтому подобна матрице А. Теперь собственными значениями блока порядка т — 2 в правом нижнем углу будут числа Х3, ..., Хт. Продолжая этот процесс, мы получим, в конце концов, правую треугольную матрицу Вт, подобную матрице А, на главной диагонали которой собственные значения находятся в заданном порядке Хь •••> Хт. 9.2-23.4 Теорема Шура Для любой комплексной матрицы существует ортонормированный базис, в общем случае комплексный, при переходе к которому матрица будет иметь правую треугольную форму. Дополнение. Поле комплексных чисел алгебраически замкнуто. Следовательно, комплексная матрица порядка т имеет т собственных значений, в общем случае комплексных. Поэтому ничто не мешает взять базис еь ...,ет из 9.2-20 ортонор- мированным. В качестве ех берем любой нормированный вектор из L. Предположим, что уже выбраны ортонормированные векторы еи ..., ек. Возьмем в Lk+1 лю-
294 Часть I. Математические сведения по линейной алгебре бой вектор у, не принадлежащий Lkj и построим согласно 5.2-10 вектор х. Пронормировав его, получим ек+\. Все остальное доказательство дословно повторяет дополнение к 9.2-20. 9.2-24.4 Перестановочные матрицы и треугольная форма Для любых комплексных перестановочных матриц А, В существует ортонормирован- ный базис, в общем случае комплексный, при переходе к которому обе матрицы будут иметь одноименные треугольные формы. Дополнение. Если две правые блочно-треугольные матрицы имеют одинаковые блочные размеры и перестановочны, то легко проверить, что перестановочными будут и соответствующие диагональные блоки обеих матриц. Кроме этого, поле комплексных чисел является алгебраически замкнутым. Поэтому, принимая во внимание 9.1-15 и почти дословно повторяя доказательства утверждений 9.2-16, 9.2-18, 9.2-19, 9.2-20, 9.2-23, но уже для пары перестановочных матриц, убеждаемся в справедливости высказанного утверждения. Э.2-25.4 Комментарий (о выборе базиса) Таким образом, если матрица порядка m имеет m собственных значений, то за счет выбора базиса ее можно привести к подобной треугольной матрице, на диагонали которой собственные значения будут стоять в заданном порядке. Однако этот вид не является самым простым среди всех подобных матриц. Заметим, что если матрица задана над алгебраически замкнутым полем и, в частности, над полем комплексных чисел, то она обязательно имеет согласно 8.2-31 ровно ш собственных значений. 9.2.5. Подобие блочно-диагональной матрице Э.2-26.4 Исключение внедиагонального элемента Предположим, что А — квадратная правая треугольная матрица и ati ф а„ для какой- нибудь пары значений ij. Пусть для определенности / <j. Тогда существует такое число а, что в матрице NJ] (a) ANfj(а) в позиции (ij) будет находиться нулевой элемент. Здесь N,j(a) — элементарная неунитарная матрица из утверждения 3.4-17. Дополнение. Принимая во внимание вид 3.4-17 матрицы Л^(а) и тот факт, что согласно 3.4-20 имеем N^l(a) = NIJ(-a)9 вычисляем элемент ац матрицы A = N-\a)ANlj{a)\ Отсюда заключаем, что при а = ао/(а^ - ah) элемент atJ равен нулю.
9. Структура матриц общего вида 295_ Э.2-27.4 Блочно-диагональный базис Предположим, что А — квадратная правая треугольная матрица, у которой равные диагональные элементы находятся рядом. Существует правая треугольная матрица TV такая, что матрица В~ N~ ]AN будет блочно-диагональной. При этом каждый диагональный блок представляет правую треугольную матрицу с одинаковыми диагональными элементами; диагональные элементы разных диагональных блоков в общем случае различны. Дополнение. Это есть прямое следствие 9.2-26. Матрица N образуется как произведение подходящих матриц Л^(ос). Чтобы элементы, обращенные в нуль на предыдущих шагах, не изменялись на последующих, необходимо их исключать в определенном порядке. Например, слева направо и снизу вверх. 9.2-28.4 Подобие блочно-диагональной матрице Пусть квадратная матрица А порядка m имеет m собственных значений. Ее всегда можно привести к подобной блочно-диагональной матрице, причем каждый диагональный блок представляет правую треугольную матрицу с одинаковыми диагональными элементами. Дополнение. Это есть прямое следствие 9.2-22, 9.2-27. 9.2-29.4 Прямая сумма матриц Если матрица А блочно-диагональная, с блоками А1Ь ..., Агг на диагонали, то говорят, что матрица А есть прямая сумма матриц Ахи ...,Ап, и пишут Л =Ап 0 ... ф Ап. 9.2-30.4 Разложение матрицы в прямую сумму Процесс подобного преобразования матрицы к блочно-диагональному виду называется разложением матрицы в прямую сумму матриц меньшего размера. 9.3. Вещественное подобие блочным матрицам 9.3.1. Вспомогательные утверждения для вещественного случая 9.3-1.4 Комментарий (о поле вещественных чисел) Одним из важнейших алгебраически замкнутых полей является поле комплексных чисел. Его подмножество — поле вещественных чисел — не является алгебраически замкнутым. Тем не менее многие факты в нем оказываются похожими. Далее в этой главе будем считать, когда это нужно, что вещественная матрица порядка т имеет т собственных значений, в общем случае комплексных.
296 Часть I. Математические сведения по линейной алгебре 9.3-2.4 Комплексно-сопряженные собственные векторы Если вещественная матрица А имеет комплексное собственное значение X, то она имеет два комплексно-сопряженных собственных вектора х, х , соответствующих собственным значениям X, X . Дополнение. Пусть вещественная матрица А имеет комплексное собственное значение X и соответствующий ему собственный вектор х. Тогда выполняется равенство Ах = Хх. Беря комплексное сопряжение от обеих частей равенства, получаем Ах = ХЗс . Но А = А , поэтому Ах = XJ . 9.3-3.4 Двумерное инвариантное подпространство В условиях и обозначениях 9.3-2 множество векторов вида сие + оис, где а— произвольное комплексное число, есть вещественное инвариантное подпространство размерности 2 для матрицы А. Дополнение. Пусть x=y + iz есть собственный вектор вещественной матрицы А, соответствующий комплексному собственному значению X = ц + /v. Здесь y,z— вещественные векторы, числа ji, v также вещественные. Для любого комплексного числа а = р + /у имеем ах + ах = 2фу - yz). Поэтому множество векторов вида ах + оис есть вещественная линейная оболочка вещественных векторов у, z. Остается показать, что эти векторы линейно независимы. Если X комплексное, а не вещественное число, то v ф 0. В этом случае обязательно z Ф 0, т. к. иначе в равенстве Ах = Хх слева будет стоять вещественный вектор, а справа — комплексный. Допустим, что y = 6z для некоторого вещественного числа 5. Тогда из равенства Ах = Xjc, сравнивая вещественные и мнимые части слева и справа, находим, что bAz = (|л5 - v)z, Az = (v8 + \x)z. Отсюда получаем, что ц5 - v = 5(v8 + ц) или 82 = - 1, если 8 ф 0. Но это невозможно, т. к. 8 есть вещественное число. Если же 8 = 0, то должно выполняться равенство vz = 0. По условию v ф 0, поэтому z = 0, что также невозможно. Полученное противоречие говорит о том, что вещественные векторы у, z линейно независимы над полем вещественных чисел. Инвариантность рассматриваемого подпространства очевидна в силу равенства Л(сис + оис) = аАх + aAJ = (аХ)х + (аХ)х . 9.3-4.4 Перестановки и выбор базиса Пусть вещественная матрица/* имеет комплексное собственное значение X и соответствующее ему вещественное двумерное инвариантное относительно матрицы А под-, пространство. Обозначим через L матрицу из двух столбцов, являющихся векторами
9. Структура матриц общего вида 297 базиса этого подпространства. Всегда можно подобрать такую матрицу L и такую матрицу перестановок Р, что первые (последние) две строки матрицы P'L будут представлять единичную матрицу второго порядка. Дополнение. Пусть вещественная матрица А имеет комплексное собственное значение X и соответствующий ему собственный вектор х = у + iz. Как было показано в дополнении к 9.3-3, вещественные векторы х и у линейно независимы над полем вещественных чисел и принадлежат рассматриваемому подпространству. Рассмотрим составленную из х, у двухстолбцевую матрицу М. Ранг этой матрицы равен 2. Согласно 4.3-5 в ней найдутся две линейно независимые строки. Поэтому существует такая матрица Q второго порядка, что в матрице MQ именно эти две строки будут строками единичной матрицы. Возьмем в качестве L матрицу MQ. Очевидно, что всегда можно найти такую матрицу перестановок Р, что в матрице P'L первые или последние две строки будут строками единичной матрицы. 9.3-5.4 Комментарий (об аналогии в исследованиях) Очевидна аналогия между утверждением 9.3-4 и комментарием 9.2-3. Теперь роль собственного вектора х в утверждениях 9.2-1, 9.2-2, который можно рассматривать как одностолбцевую матрицу, играет двухстолбцевая матрица L из утверждения 9.3-4. Эту аналогию можно проводить и дальше, строя блочные матрицы типа Мг и Nr с блоками первого или второго порядка и т. п. 9.3.2. Вещественное подобие блочно-треугольной матрице 9.3-6.4 Вложенное вещественное инвариантное подпространство Пусть пространство X и матрица Л заданы над полем вещественных чисел и L есть вещественное подпространство размерности р > О, инвариантное относительно матрицы А. Тогда в L содержится вещественное подпространство размерности/?- 1 или р-2, также инвариантное относительно матрицы А. Дополнение. Доказательство этого и многих ближайших утверждений проводится почти дословным повторением доказательств общих утверждений, начиная с 9.2-15. На примере этого утверждения продемонстрируем аналогию. Пусть еъ ...уер есть базис подпространства L. Дополним его векторами ер+х, ...,ет до базиса в X. Обозначим через Млинейную оболочку векторов ер+1, ..., ет. Очевидно, что X = L + М . При переходе к базису еь ••-, ет матрица А преобразуется в подобную ей матрицу В из 9.2-5, в которой блок Вп имеет порядок/?, а блок В2\ согласно 9.2-8 будет нулевым. Согласно 7.2-14, 7.2-33, 8.2-31 вещественная матрица Вп обязательно имеет либо вещественное, либо комплексное собственное значение X. Если X вещественное, то все дальнейшее доказательство в точности повторяет дополнения к 9.2-15 и 9.2-11 с заменой, естественно, k на/?. Если же X комплексное, то возникают некоторые отличия.
298 Часть I. Математические сведения по линейной алгебре По аналогии с 3.4-27 составим "блочную" матрицу типа Мр. Она будет отличаться от единичной матрицы только тем, что у нее могут быть не равны нулю поддиагональные элементы в строках с номерами р и р - 1, но элемент в позиции (/?, р - 1) обязательно равен нулю. Легко проверить, что матрица М~] имеет аналогичный вид, но ее поддиагональные элементы равны соответствующим элементам матрицы Мр, взятым с противоположным знаком. Рассмотрим матрицу С = МрВМ~]. Эта матрица подобна матрице А, является правой блочно-треугольной таких же размеров, как матрица В, нижние блоки не изменяются. Обозначим через С, Мр,В,М~1 матрицы ведущих миноров порядка р матриц С, Мр,В, Мр1. Имеем С-Мр В М~р =МрВп М~р . По предположению вещественная матрица В\\ и, следовательно, согласно 8.2-22 матрица В[х имеет комплексное собственное значение X. Пусть S представляет двухстолбцевую матрицу, вектор-столбцы которой образуют базис двумерного вещественного инвариантного относительно матрицы В'п подпространства, соответствующего X. Согласно 9.3-4 будем считать, что последние две строки матрицы S являются строками единичной матрицы. В согласии с 9.1-11 существует вещественная матрица D второго порядка такая, что В[х S = SD. Теперь будем считать, что последние две строки матрицы Мр совпадают со строками матрицы S'. Обозначим через ср матрицу, составленную из двух последних строк матрицы С . Имеем "О о D Это и означает, что подпространство L содержит в себе вещественное инвариантное подпространство размерности/? - 2. 9.3-7.4 Объемлющее вещественное инвариантное подпространство Пусть пространство X и матрица А заданы над полем вещественных чисел и L есть не совпадающее с X вещественное подпространство размерности р, инвариантное относительно матрицы А. Тогда существует вещественное подпространство размерности р + 1 или р + 2, также инвариантное относительно матрицы А и которое, к тому же, содержит в себе подпространство L. Дополнение. Доказательство почти дословно повторяет дополнения к 9.2-16 и 9.2-18. Только теперь аналогично дополнению к 9.3-6 вместо матрицы Np+\ рассматриваем ее "блочный" вариант. Она будет отличаться от единичной тем, что у нее могут быть не равны нулю поддиагональные элементы в столбцах с номерами р + 1 и р + 2, но элемент в позиции (р + 2, р + 1) обязательно равен нулю.
9. Структура матриц общего вида 299 9.3-8.4 Цепочка вложенных вещественных подпространств Пусть пространство X и квадратная матрица А заданы над полем вещественных чисел. Матрица А имеет в X вложенные вещественные инвариантные подпространства Lp размерности/?,: А)<=^, cIA c...ciA =Jf; при этом разность размерностей соседних подпространств равна 1 или 2. Дополнение. Нулевое подпространство Lo является инвариантным. Согласно 9.3-7 существует инвариантное подпространство Llh размерности 1 или 2, содержащее Z,o. Далее, существует инвариантное подпространство Z,ft, содержащее Lp. При этом разность размерностей подпространств Z,ft и Lfh равна 1 или 2. И т. д., пока не дойдем до инвариантного подпространства Lp, совпадающего со всем пространством X. 9.3-9.4 Подобие блочно-треугольной матрице Пусть собственные значения вещественной матрицы А упорядочены каким-то образом с учетом их кратностей, и пары комплексно-сопряженных собственных значений стоят рядом. Тогда матрица А вещественно подобна правой блочно-треугольной матрице с диагональными блоками первого и второго порядка и собственные значения всех диагональных блоков упорядочены точно так же. Дополнение. Доказательство почти дословно повторяет дополнение к 9.2-22 с учетом 9.2-8, 8.2-23, 4.2-7, 9.3-8, 9.3-7. 9.3-10.4 Приведение к блочно-треугольному виду Для любой вещественной матрицы существует вещественный ортонормированный базис, при переходе к которому матрица будет иметь блочную правую треугольную форму с диагональными блоками первого и второго порядка. Блоки первого порядка соответствуют вещественным собственным значениям, блоки второго порядка — комплексно-сопряженным собственным значениям. Дополнение. Доказательство почти дословно повторяет дополнение 9.2-23 с заменой, естественно, ссылки на 9.2-20 ссылкой на 9.3-9. 9.3.3. Вещественное подобие блочно-диагональной матрице 9.3-11.4 Вещественные матрицы второго порядка Предположим, что вещественная матрица А второго порядка имеет пару комплексно- сопряженных собственных значений X и X. Такая матрица вещественно подобна матрице вида
300 Часть I. Математические сведения по линейной алгебре I» где a = Re X, b = Im X, и всегда является матрицей простой структуры. Дополнение. Пусть вещественная матрица А имеет собственное значение X и X Ф X . Согласно 9.3-2 она имеет собственный вектор х -у + /z, соответствующий X, и собственный вектор х = у -iz, соответствующий X. Как было показано в дополнении к 9.3-3, векторы у и z линейно независимы над полем вещественных чисел и z Ф 0. Так как X Ф X , то согласно 8.2-12 собственные векторы jc и х вещественной матрицы А линейно независимы над полем комплексных чисел. Если матрица А имеет второй порядок, то, имея два линейно независимых собственных вектора я: и х , она согласно определению 8.3-1 является матрицей простой структуры. Пусть X = a + ib. Согласно 8.3-2 существует такая матрицах, что Л = Х~ ХАХ, где Л есть диагональная матрица с элементами a + ib и a-ib на главной диагонали. Обозначим Легко проверить непосредственно выполнение равенств _"/ -ПГа-6] Г1 ПГ"* 0 1Г±Г/ -1 I-/ Л 2/|/ 1 \'\Ь а\ I-/ /|| 0 a-ib\\2i\i I |/ Подставляя в последнее равенство вместо матрицы Л ее представление Л = Х~ 1АХ, получаем, что В = САГ * = СХГ ХАХГх = (ХГ Х)~ХА{ХГ'), то есть матрицы А и В подобны. Остается показать, что матрица ХГХ вещественная. Если -И- то ХГХ=\ ' Л х Р 9.3-12.4 Вещественное матричное уравнение Рассмотрим вещественное матричное уравнение CX-XD = F9 где матрицы С, D,F заданы, матрица X подлежит определению, каждая из квадратных матриц С, D имеет
9. Структура матриц общего вида 301 порядок 1 или 2, матрицы X и F имеют соответствующие размеры. Кроме этого, будем считать, что когда матрица С или D имеет порядок 2, то ее собственные значения не являются вещественными. Если среди собственных значений матрицы С нет ни одного, совпадающего с каким-либо собственным значением матрицы Д то матричное уравнение имеет единственное решение при любой матрице F. Дополнение. При сформулированных условиях, принимая во внимание 9.3-11, обе матрицы CnD являются матрицами простой структуры. Поэтому существуют невырожденные матрицы Y, Z и диагональные матрицы А, 0 такие, что согласно 8.3-2 будем иметь Если матрица С (D) имеет порядок 2, то матрицы К, A (Z, 0) будут комплексными. Перейдем теперь от вещественного уравнения CX-XD = Fb общем случае к эквивалентному, комплексному, подставив вместо матриц С и D их мультипликативные представления. Обозначив получим более простое уравнение с диагональными матрицами А, 0 из собственных значений матриц С, D. Условия существования и единственности решения этого уравнения теперь очевидны. 9.3-13.4 Вещественный блочно-диагональный базис Пусть А — вещественная правая блочно-треугольная матрица с диагональными блоками первого и второго порядка, причем блоки с одинаковыми собственными значениями стоят рядом. Существует вещественная правая треугольная матрица N такая, что матрица B = N~lAN будет блочно-диагональной. Каждый диагональный блок представляет правую блочно-треугольную матрицу, у которой, в свою очередь, все диагональные блоки имеют один и тот же порядок 1 или 2 и одни и те же собственные значения. Дополнение. Представим матрицы А, В в одинаковом блочном виде так, чтобы диагональные блоки у них совпадали с заданными диагональными блоками матрицы А. Рассмотрим блочные матрицы типа элементарных неунитарных матриц Njj(a) с аналогичным блочным разбиением. Эти матрицы отличаются от единичной наличием единственного ненулевого внедиагонального блока а в блочной позиции (ij). Легко проверить непосредственно, что N7jl(a) = Л^.(-а). Пусть блоки Аи и Ajj матрицы А не имеют общих собственных значений. Предположим для определенности, что i <у, и рассмотрим матрицу А = N~](a)AN0(a). Ее блок в позиции (/,/) равен
302 Часть I. Математические сведения по линейной алгебре Все блоки вещественные. Кроме этого, блоки Аи и Ад не имеют общих собственных значений. Их порядки равны 1 или 2. Согласно 9.3-12 существует и единствен блок а такой, что Ац = О . Теперь матрица N образуется как произведение подходящих блочных матриц типа Л^(а). Чтобы блоки, обращенные в нулевые на предыдущих шагах, не изменялись на последующих, необходимо их исключать в определенном порядке. Например, слева направо и снизу вверх. 9.3-14.4 Вещественное подобие блочно-диагональной матрице Любую квадратную вещественную матрицу можно привести вещественным подобным преобразованием к вещественной блочно-диагональной матрице. Каждый диагональный блок представляет правую блочно-треугольную матрицу, у которой, в свою очередь, все диагональные блоки имеют один и тот же порядок 1 или 2 и одни и те же собственные значения. Дополнение. Это есть прямое следствие 9.3-9, 9.3-13. 9.4. Матричные многочлены 9.4.1. Кольцо матричных многочленов 9.4-1.4 Степень матрицы Пусть р — натуральное число. Тогда р-н степенью Ар квадратной матрицы А называется р — кратное ее произведение. Если матрица А невырожденная, то по определению А~р = (А~ 1у. Также по определению А0 = Е. Э.4-2.4 Многочлен от матрицы Пусть А — произвольная квадратная матрица и ц>(Х) — произвольный многочлен ц>(к) = а$кр + ... + а р- \Х + а р. Матрица вида ф(/1) = а$А + ... + а р. \А + а рЕ. называется матричным многочленом или многочленом от матрицы А. 9.4-3.4 Операции над матричными многочленами Над матричными многочленами от одной и той же матрицы можно выполнять алгебраические операции, аналогичные операциям над скалярными многочленами. Э.4-4.4 Перестановочность матричных многочленов Любые два многочлена от одной матрицы перестановочны. Дополнение. Очевидно, принимая во внимание перестановочность степеней матрицы.
9. Структура матриц общего вида 303 Э.4-5.4 Кольцо матричных многочленов Множество всех многочленов от одной матрицы есть коммутативное кольцо. Дополнение. На множестве многочленов от одной матрицы определены операции сложения и умножения. Обе они коммутативные, ассоциативные и связаны законом дистрибутивности. Для многочлена <р(Л) противоположным является многочлен — фО4). Поэтому сложение многочленов обладает обратной операцией. По определениям 1.6-1, 1.6-2 множество многочленов от одной матрицы есть коммутативное кольцо. 9.4.2. Инвариантные, спектральные и другие свойства Э.4-6.4 Образ и ядро матричного многочлена Образ и ядро любого матричного многочлена ф(Л) являются инвариантными подпространствами матрицы А. Дополнение. Пусть х е im <p(A). Это означает, что существует такой вектор у, что х = (р(А)у. Но Ах = А<р(А)у = ц>(А)(Ау) е im q>(A). Пусть теперь z e ker q>(A\ т. е. q>(A)z = 0. Но y(A)(Az) = A(q>(A)z) = 0. Следовательно, Az e ker <p(A). Э.4-7.4 Собственные значения матричного многочлена Любой собственный вектор матрицы А, соответствующий собственному значению \/, является собственным вектором матрицы (рО4), соответствующим собственному значению ф(А,,-). Дополнение. Пусть Ах = Хх. Имеем Е • х = х. Кроме этого, для любого натурального/? находим, что Арх = Ар~ \Ах) = ХАР~ 1х=...= Хрх. Поэтому для любого многочлена <р(А) справедливо равенство у(А)х = у(Х)х. Другими словами, собственный вектор матрицы А, соответствующий собственному значению X, является собственным вектором матрицы <р(А), но соответствующим собственному значению ф(^). Э.4-8.4 Собственные векторы матричного многочлена Если собственное значение матрицы А является (не является) корнем многочлена ф(Х,), то все собственные векторы матрицы А, соответствующие этому собственному значению, принадлежат ядру (образу) матрицы Дополнение. Если собственное значение X матрицы А является корнем многочлена ф(А,), то все соответствующие X собственные векторы х согласно 9.4-7 удовле-
304 Часть I. Математические сведения по линейной алгебре творяют уравнению ц>(А)х = у(Х)х = 0, т. е. х е кег ф(Л). Если же у(Х) ф О, то из этого уравнения заключаем, что 9.4-Э.4 Многочлен от треугольной матрицы Пусть А — квадратная треугольная матрица порядка m с диагональными элементами Х\, X2i ..., Х,„. Для любого многочлена ц>(Х) матрица ф(Л) остается треугольной того же наименования, что и матрица А, и имеет на диагонали элементы Дополнение. Очевидно, т. к. при возведении треугольной матрицы в любую степень ее диагональные элементы возводятся в ту же степень, при умножении треугольной матрицы на число ее диагональные элементы умножаются на то же число, при сложении треугольных матриц их диагональные элементы складываются. 9.4-10.4 Многочлены от подобных матриц Если В = Р~]АР9 то для любого многочлена ф(^) выполняется равенство ф(#) = = Р~]ц>(А)Р. Дополнение. Пусть <р(Х) = а0Хр + ... + ар_ \Х + ар. Для любого г имеем (Г 1АР)Г = Г ХАР Р-]АР ... Г ]АР = Г ХАГР. Поэтому, принимая во внимание, что Е = Р~ 1Р, находим Ф(Я) = ф(Р" ]АР) = ао(Р~ lAPf+... +ар.1(р-хАР) + арЕ - = Г \аоАр + ... + ар _ ХА + арЕ)Р = Г \{А)Р. 9.4-11.4 Кратность собственных значений Предположим, что матрица А порядка m имеет собственные значения Х\, Х2, ..., Хту выписанные подряд с учетом кратности. Тогда с учетом кратности собственными значениями матрицы ф(Л) при любом многочлене ф(Х) являются числа Дополнение. Согласно 9.2-22 существует невырожденная матрица Р такая, что матрица В = Р~1АР будет правой треугольной с диагональными элементами Ху, Х2, ..., Хт. Согласно 9.4-9 матрица ф(В) для любого многочлена у(Х) будет треугольной того же наименования с диагональными элементами, т. е. собственными значениями, равными соответственно <р(Х\\ ц>(Х2), ..., ф(Хт). Матрица Ру(В)Р~1 подобна матрице ф(Я), поэтому имеет такие же собственные значения. Но согласно 9.4-10 имеем = Рц>(Р~ ]АР)Г1 = РГ 1<р(А)РГ1 =
9. Структура матриц общего вида 305 9.4-12.4 Многочлен от блочно-диагональной матрицы Пусть А — квадратная блочно-диагональная матрица, т. е. ' Ап О О Ап где диагональные блоки Аи, ...,АГГ представляют квадратные матрицы, возможно, разных порядков. Для любого многочлена ф(Х) имеем: "<PDi) О Дополнение. Очевидно, т. к. при возведении блочно-диагональной матрицы с квадратными блоками в любую степень каждый из ее диагональных блоков возводится в ту же степень, при умножении матрицы на число умножается на то же число каждый блок, при сложении таких матриц складываются их соответствующие блоки. 9.4-13.4 След степени матрицы Пусть Х\, ...Дт являются собственными значениями матрицы А порядка /я, заданной над алгебраически замкнутым полем. Для всех & = 0, 1,2,... выполняются соотношения Дополнение. Очевидно, принимая во внимание 8.2-30, 9.4-7. 9.4-14.4 Соотношение Ньютона Пусть матрица А задана над алгебраически замкнутым полем и j\K) — к — п\К + U2K +...+(— 1) ат есть ее характеристический многочлен. Обозначим sk = tr Л*. Справедливо следующее матрично-векторное соотношение 1 2 Sn_2 3 о" ... п «2 "? (-1)" а. = - *2 Л. Называется оно соотношение Ньютона.
306 Часть I. Математические сведения по линейной алгебре Дополнение. Это есть уместная здесь переформулировка утверждения 7.2-12. Заметим однако, что в действительности соотношение Ньютона справедливо для любого поля, а не только алгебраически замкнутого. 9.4-15.4 Многочлен и соответствующие матрицы Для любого многочлена ц>(к) в обозначениях и условиях 8.3-22 имеет место разложение Дополнение. Принимая во внимание 8.3-21, легко установить, что для всех натуральных/? выполняется равенство / = ] Поэтому, учитывая 8.3-22, получаем для любого многочлена у(к\ что 9.4.3. Нильпотентная матрица 9.4-1 б.4 Комментарий (о дальнейшем упрощении матрицы) Дальнейшее упрощение вида матрицы при подобном преобразовании связано с рассмотрением некоторых специальных матриц. 9.4-17.4 Нильпотентная матрица Квадратная матрица А называется нильпотентной, если для какого-то натурального числа р > 1 выполняется равенство Ар = 0. Наименьшее число /?, обладающее этим свойством, называется индексом нильпотентности. 9.4-18.4 Треугольная матрица с нулевой диагональю Пусть А — квадратная правая треугольная матрица порядка т с нулевыми диагональными элементами. Обозначим через aql} элементы матрицы А4. Имеют место соотношения afj = 0 при всех /,у, для которых \-m<j-i<q-\ <m-\. Дополнение. Для q = 1 имеем a]tj =0 , для 1 - т <j - i < 0 < т - 1 по условию. Пусть для какого-то q,\ <q<m, выполняются условия aj = 0 для \ —m<j — i<q-\ <m-\.
9. Структура матриц общего вида 307 Имеем По условию axkj = 0 для к >j. По предположению d*k = 0 для к < i + q - 1. Поэтому каждый член в сумме, представляющей a? + l, будет равен нулю, если у - 1 < / + q - 1, т. е. если Утверждение доказано. 9.4-19.4 Критерий нильпотентности Пусть квадратная матрица А порядка т имеет т собственных значений. Она является нильпотентной тогда и только тогда, когда все ее собственные значения нулевые. Дополнение. Пусть согласно 9.2-22 матрица А приведена к подобной правой треугольной матрице В = Р~1АР с собственными значениями Х\, ...,Хт на главной диагонали. Согласно дополнению к 9.4-10 имеем ВР = Р~1АЧР для всех натуральных q. Так как матрица Р невырожденная, то ВР = 0 тогда и только тогда, когда А4 = 0, т. е. матрицы В и А нильпотентны или не нильпотентны одновременно. На главной диагонали матрицы ВР согласно 9.4-9 стоят элементы ?^,...Д*. Если матрица В нильпотентная, то ВР - 0 для некоторого q. Это может быть только тогда, когда Х{ = ... = Хт = 0. Если же Х\ = ... = Хт = 0, то ВР = 0 для некоторого q согласно 9.4-18. 9.4-20.4 Оценка индекса нильпотентности Если нильпотентная матрица порядка т имеет т собственных значений, то индекс ее нильпотентности не превосходит порядка. Дополнение. Пусть согласно 9.2-22 матрица А приведена к подобной правой треугольной матрице В = Р~ 1АР. Как отмечалось в дополнении к 9.4-19 матрицы А и В нильпотентны одновременно. Но если ВР = 0 для некоторого q, то согласно 9.4-18 имеем q<m. 9.4.4. Теорема Гамильтона-Кэли 9.4-21.4 Матрица с одинаковыми собственными значениями Предположим, что все т собственных значений матрицы А порядка т равны X. Тогда матрица (ХЕ — А)т является нулевой. Дополнение. Матрица ХЕ-А порядка т имеет т нулевых собственных значений. Согласно 9.4-19, 9.4-20 имеем (ХЕ-А)т - 0.
308 Часть I. Математические сведения по линейной алгебре 9.4-22.4 Теорема Гамильтона-Кэли Пусть квадратная матрица А порядка m имеет m собственных значений и fiX) — ее характеристический многочлен. Тогда матрицаДЛ) является нулевой. Дополнение. Пусть матрица А имеет г различных собственных значений Х\, ..., Хг с алгебраическими кратностями Аь ...,&г. В соответствии с 7.2-6 представим характеристический многочленДА.) в виде произведения Согласно 9.2-28 матрица А подобна матрице В = Р 1АР, которая является блочно- диагональной с блоками Bih 1 </</-, порядка kh При этом собственным значением блока Вц будет X, с алгебраической кратностью kh Итак, О О Согласно 8.2-23 матрицы А и В имеют одинаковые характеристические многочлены. Согласно же 9.4-12 О О По построению блок Вц для всех /, 1 </</-, имеет одно собственное значение X/ алгебраической кратности А, и порядок блока равен к,. В соответствии с 9.4-21 имеем {XtE - Ви)к> = 0. Поэтому для всех / получаем ABit) = (Ba ->.,?/• ...(Btt -Х;Е)к' ...{Вы-\Е)к> =0. Следовательно,^) = 0. Согласно 9.4-10 заключаем, чтоДЛ) = 0. 9.4-23.4 Комментарий (о теореме Гамильтона-Кэли) Отметим, что теорема Гамильтона-Кэли была доказана в предположении, что матрица порядка m имеет m собственных значений. Однако в действительности она верна и без этого предположения, причем в произвольном числовом поле. Для ее доказательства в этом случае привлекается не используемый здесь аппарат деления произвольных матричных многочленов. Э.4-24.4 Обратная матрица и матричный многочлен Предположим, что невырожденная матрица А порядка m имеет m собственных значений. В этом случае существует многочлен <р(Х) такой, что А~1 =
9. Структура матриц общего вида 309 Дополнение. Пусть матрица А невырожденная и есть ее характеристический многочлен. Согласно 9.4-22, Ат-ахАт-х + ...+(- 1)м"хат_ХА + (- Х)татЕ = 0. Умножив это равенство справа на матрицу А~ \ получим, что А~ гочлена (-D4-, = <р(А) для мно(-D' ,.., г-'+- -V Так как матрица Л невырожденная, то согласно 8.2-20 коэффициент ат ф 0. 9.5. Каноническая форма Жордана 9.5.1. Многочлены и разложение пространства 9.5-1.5 Связь образов и ядер матричных многочленов Пусть квадратная матрица А порядка т имеет т собственных значений и ее характеристический многочлен fiX) разложен в произведение многочленов ср(А,) и ij/(A,M не имеющих общих корней. Имеют место равенства ker ф(Л() = im \\t(A), ker \\j(A) = im ц>(А). Дополнение. Пусть матрица А имеет г различных собственных значений А,ь ...,ХГ с алгебраическими кратностями к\,..., Лг. Если ДА,) = ф(^) • у (к), то предположим для определенности, что <р(к) имеет корни Xh ..., Xs с кратностями к\, ..., kS9 а \у(Х) имеет корни Xs + ь ••• ,К с кратностями Av+1, ..., ^г. Согласно 9.2-28 матрица А подобна матрице В = Р~1АР, которая является блочно-диагональной с блоками Bih I <i<r, порядка kh При этом собственным значением блока Ви будет Xf с алгебраической кратностью kt. Аналогично дополнению 9.4-22 заключаем, что о 0
310 Часть I. Математические сведения по линейной алгебре О о Здесь все матрицы \\f(Bu), ...,\\f(Bss),<p(Bs+[,s+\),q)(Brr) согласно 8.2-10, 9.4-11 и условия распределения корней между многочленами у(Х) и \у(\) являются невырожденными. То, что для матрицы В выполняются равенства ker ф(Я) = im i|/(?), ker ц(В) = im очевидно. Согласно 9.4-10 имеем ф(Л) = Ру(В)Р~\ ц(А) = P\\j(B)P~ l. Если х е im \\f(A\ то х = у(А)у для некоторого вектора у. Принимая во внимание 9.4-22, заключаем, что у(А)х = <p(A)\\i(A)y =J{A)y = 0, т. е. х е ker ф(Л). Допустим теперь, что jc € ker <р(А). Тогда у(А)х = 0 или Ру(В)Р~ хх = 0, т. е. Р" lx e ker q>(B). Но ker фE) = im 1|/(Б), и тогда Р" lx = vj/(^)z для некоторого вектора z. Следовательно, х = P\\f(B)z = \|/(^)(Pz) e im \\i(A). Поэтому ker q>(A) = im \\f(A). Аналогично устанавливаем, что ker \\i(A) = im <p(A). Э.5-2.5 Разложение пространства В обозначениях 9.5-1 для пространства Xсправедливо разложение X = ker ф(Л) + Дополнение. Принимая во внимание вид матриц ф(?) и \\j(B) из дополнения к 9.5-1, а также 5.3-14, очевидно выполнение равенства X = ker ф(Я) + ker \у(В). Пусть еь ..., е, есть базис в кегф(В), е{+], ..., ет— базис в ker \\t(B). В силу невырожденности матрицы Р, векторы Реи ...,Рет образуют базис в X. Но для всех /, 1 < / < t имеем, учитывая 9.4-10, ф(Л)Ре, = Р(Р~ l(p(A)P)ei = Рч>(В)е, = 0, то есть Pet e ker у(А) для этих значений /. Далее, для всех /, t + 1 < / < т, имеем \|/(Л)Л?/= Р(Г lV(A)P)ei = Л|/(Я)в/ = 0, то есть Ре, е ker 1|/(Л) для таких значений /. Подпространства ker y(A) и ker \\i(A) могут иметь в пересечении только нулевой вектор. В самом деле, если х е ker ф(Л) и л: <е ker \\f(A), то Р~ lx e ker ф(?) и P~lx e ker v|/(^). Согласно указанному выше разложению пространства X, Р~ ]х = 0, т. е. х = 0. Следовательно, X = ker ф(Л) + ker \\j(A).
9. Структура матриц общего вида 311 9.5-3.5 Еще раз о разложении пространства Представим характеристический многочлен ДА,) матрицы А порядка m в виде канонического разложения где Xh ...,Xr— попарно различные собственные значения и ki + ... + kr = m. Обозначим фД) = (X - Xj)k', тогда X = ker ф, (Л) + ker ф2 (А) 4-... + ker фг (v4). Дополнение. Очевидно, принимая во внимание 9.5-1, 9.5-2. 9.5.2. Корневые векторы Э.5-4.5 Корневые векторы Инвариантное подпространство кегф,(,4) называется корневым подпространством матрицы А, соответствующим собственному значению Xh Векторы корневых подпространств называются корневыми векторами. Э.5-5.5 Размерность корневого подпространства Размерность корневого подпространства, соответствующего некоторому собственному значению Xh равна алгебраической кратности этого собственного значения. Дополнение. Для матрицы В = Р~ ХАР из 9.4-22 базисом ker ф/(#), очевидно, является совокупность тех единичных вектор-столбцов, номера которых совпадают с номерами столбцов, занимаемых блоком Вц. По построению, число векторов базиса равно kh т. е. алгебраической кратности собственного значения Xh Как было показано в дополнении к 9.5-2, подпространство ker ф/(#) переходит в ker ф,(/4) при преобразовании пространства с матрицей преобразования Р~х. Так как матрица Р~1 невырожденная, размерность подпространства сохраняется. 9.5-6.5 Независимость корневых векторов Корневые векторы, соответствующие попарно различным собственным значениям, линейно независимы. Дополнение. Для матрицы В из 9.4-22 это очевидно. При переходе к матрице А делается преобразование с невырожденной матрицей Р~\ Поэтому линейно независимые векторы перейдут в линейно независимые. Э.5-7.5 Корневой базис Базис пространства X, составленный как последовательное объединение базисов всех корневых подпространств ker ф/04), называется корневым базисом.
312 Часть I. Математические сведения по линейной алгебре Э.5-8.5 Переход к корневому базису Обозначим через Р матрицу преобразования координат при переходе к какому- нибудь корневому базису. Матрица В = Р~ ХАР будет блочно-диагональной: Вп О О В При этом выполняются следующие свойства: • совокупность порядков диагональных блоков совпадает с совокупностью чисел Ккъ ...,*« • совокупность характеристических многочленов диагональных блоков совпадает с совокупностью многочленов ц>,(Х); • если характеристический многочлен диагонального блока Bh равен фД)> то мат" рица (p,(?//) — нулевая. Дополнение. Напомним, что согласно 9.4-6 все подпространства кегфХЛ), 1 ^i<r, являются инвариантными относительно матрицы А. Принимая во внимание разложение 9.5-3 пространства X, а также 9.2-7, 9.2-8, заключаем, что матрица В = Р~ 1АР является блочно-диагональной. По существу это есть матрица В из дополнения к 9.4-22. Обе матрицы могут отличаться друг от друга только перенумерацией подпространств ker ф,(>0 или, что то же самое, перестановкой блоков Bih а также подобным преобразованием самих блоков /?,-,• или, что то же самое, выбором различных корневых базисов. Свойства матрицы В подробно исследовались ранее, например, в дополнениях к 9.4-21 и 9.4-22. 9.5.3. Высота корневого вектора Э.5-9.5 Высота корневого вектора Высотой корневого вектора jc, соответствующего собственному значению X матрицы Л, называется наименьшее целое неотрицательное число т, для которого (А - ХЕ)тх = 0. 9.5-10.5 Оценка высоты корневого вектора Все корневые векторы, соответствующие одному собственному значению, имеют высоты, не превосходящие алгебраической кратности собственного значения. Дополнение. Если х е ker у,(А), то по определению у?А)х = 0, т. е. (А - Х/?) *' х = 0. Принимая во внимание обозначения из 9.5-3 и определение 9.5-9, заключаем, что высота любого корневого вектора не превосходит алгебраической кратности соответствующего ему собственного значения.
9. Структура матриц общего вида 313 9.5-11.5 Корневые и собственные векторы Корневой вектор высоты 1 является собственным вектором. Дополнение. Очевидно, принимая во внимание определение 8.2-2. 9.5-12.5 Корневые векторы матрицы простой структуры Высоты всех корневых векторов матрицы простой структуры равны 1. Дополнение. Очевидно, принимая во внимание определение 8.3-1. 9.5-13.5 Уменьшение высоты корневого вектора Если корневой вектор х, соответствующий собственному значению X матрицы А, имеет высоту &, то вектор (А - XEfx, s < к, будет корневым вектором высоты k-s, соответствующим тому же собственному значению X. Дополнение. Пусть вектор (А - XEfx имеет высоту г. Это означает, что (А - XE)r+sx = 0. Так как / = к есть наименьшее число, для которого (А - ХЕIх = 0, то г + s = к или r = k-s. 9.5-14.5 Независимость разновысотных корневых векторов Если корневой вектор х, соответствующий собственному значению X матрицы А, имеет высоту к, то система векторов х,(А-ХЕ)х, ...,(А-ХЕ)к'хх является линейно независимой. Дополнение. Пусть вектор х имеет высоту к. Это означает, что (А - ХЕ)к~хх ф 0, но (А - ХЕIх - 0 для всех натуральных / > к. Рассмотрим равенство ссо* + ах(А - ХЕ)х + ... + ос*_ Х(А - ХЕ)к~ хх = 0 для каких-то чисел а0,..., oc*_i. Умножая это равенство слева на (А--ХЕ)к~\ заключаем, что должно выполняться равенство ao(A-7JE)k~lx-Q. Так как ^'O, то ао = 0. Умножая далее рассматриваемое равенство слева на (А - ХЕ)к~2, заключаем, что должно выполняться равенство ocj = 0. Аналогично устанавливаем, что все остальные коэффициенты а2,..., ct*_i равны нулю. Согласно 2.1-10 векторы х, (А - ХЕ)х,..., (Л - ХЕ)к~ хх линейно независимы. 9.5-15.5 Комментарий (о простейшем виде матрицы) Получение простейшего вида матрицы при подобном преобразовании может осуществляться теперь лишь за счет специального построения базисов каждого из корневых подпространств. Конечно, корневые базисы можно выбрать таким образом, что каждый из диагональных блоков в матрице 9.5-8 будет треугольным. Однако этот вид матрицы не является самым простым.
314 Часть I. Математические сведения по линейной алгебре 9.5.4. Корневой базис Жордана 9.5-1 б.5 Циклическое подпространство Линейная оболочка корневых векторов 9.5-14 называется циклическим подпространством, порожденным вектором х. 9.5-17.5 Инвариантность циклического подпространства Любое циклическое подпространство является инвариантным. Дополнение. Пусть z = оде + оиО* - ХЕ)х + ... + ос*_ Х{Л - ХЕ)к~ 1х для некоторых чисел а0, ..., а*_ \. Согласно 9.4-4 матрицы А и (А - XEf перестановочны для всех р. Принимая во внимание представление Ах = (А- ХЕ)х + Ъ: и равенство (А - ХЕ)кх = О, получаем, что Az = (ХоАх + ахА(А - ХЕ)х + ... + сх*_ ХА{А - \Е)к~ 1х = = olqAx + ах(А - ХЕ)Ах + ... + а*_ {(А - ХЕ)к~ хАх = = ао((А - ХЕ)х + Хх) + ах(А - ХЕ)((А - ХЕ)х +Хх) + ... + ак_2(А - ХЕ)к~\{А - ХЕ)х + Хх) + ак.{ЦА - ХЕ)к~1х = = а0Хх + (а0 + а^Х^- ХЕ)х + ... + (а^_2 + а^_ ХХ){А - ХЕ)к~ *х, то есть вектор Az принадлежит линейной оболочке векторов х, (А - ХЕ)х,..., (А-ХЕ)к~1х. 9.5-18.5 Разложение корневого подпространства Корневое подпространство разложимо в прямую сумму циклических подпространств. Дополнение. Пусть Я, есть корневое подпространство, соответствующее собственному значению А., алгебраической кратности к,. Обозначим через t максимальную высоту корневых векторов из /?,-. Согласно 9.5-Ю имеем / < к(. Согласно 9.5-13 в подпространстве Rt есть корневые векторы всех высот от 0 до t. Для любого к < t обозначим через Нк совокупность всех векторов, высоты которых не превосходят к. Если х,у е Нк, то (А - XjE)kx = (A- XiE)ky = 0. Но тогда при любых числах а, C имеем {А - Х;Е)\ах + (Зу) = 0. Согласно 1.7-11, ах + Ру е Нь Очевидно, далее, что 0 = Яо с Я, с ... с Я,_! с Я, = Я/. Размерность подпространства Нк обозначим через тк. Ясно, что 0 = т0 < mi < ... < /w,_ I < m, = kt. Пусть yj,...,/^ — произвольные линейно независимые векторы из Я,, линейная оболочка которых в прямой сумме сЯ,.| дает #,. Ясно, что это будут корневые
9. Структура матриц общего вида 315 векторы высоты t, p\ = mt - mt_ \ и никакая ненулевая линейная комбинация векторов /!,...,/Л не принадлежит Я, _i. Рассмотрим совокупность векторов Л > • • • > /Л j (А-Х1Е)/1,...,(А-Х,Е)/Л, (A-X,Effl,...,(A-XlEJfPi, Покажем, что система векторов в этой таблице линейно независима. В самом деле, составим их линейную комбинацию и приравняем ее нулю. Умножив обе части полученного равенства слева на (A-XiE)l~l9 находим, что линейная комбинация векторов (А - XtЕI'l fx,..., {А - Х,Е)'~1 / есть нулевой вектор и, следовательно, принадлежит Ht_\. Согласно выбору f},..., /Л это возможно лишь в том случае, когда все коэффициенты, стоящие при этих векторах, являются нулевыми. Умножив теперь обе части равенства слева на (А - XJEI ~2, находим, что должны быть нулевыми коэффициенты линейной комбинации при векторах, расположенных во второй строке таблицы и т. д. Заметим, что в силу выбора векторов fx,..., /Л никакая ненулевая линейная комбинация векторов, стоящих в /-й строке таблицы, не принадлежит Н, _,. Дополним векторы (А - XfE)f\, ..., (А - XjE)f'l fPi такими векторами /д +,,..., / из #/_!, чтобы вся эта совокупность была линейно независимой и ее линейная оболочка в прямой сумме с Я/_2 давала #,_ ь Ясно, что это будут корневые векторы высоты /- 1,/?2 = /И/_1-/И/_2 и никакая ненулевая линейная комбинация данных векторов не принадлежит Ht_2- Снова построим совокупность векторов Л,+1 > • • • > jP2 > (А-Х,Е) /й + 1,...,(у<-Я., Относительно совокупности векторов (A-XiE)f},...,{A-XtE)fPi, /д +,,..., /ft можно доказать все те же факты, что и относительно совокупности векторов У|,..., fJh, с заменой, конечно, t на /- 1. Переходя таким же образом к подпространствам Я/_2, Я/_3, ...,ЯЬ мы получим линейно независимую систему из kt векторов, принадлежащих корневому подпространству Rh Построенные две таблицы векторов заканчиваются, в конце концов, таблицей из одной строки 3pt 3pt-\
316 Часть I. Математические сведения по линейной алгебре Эти векторы принадлежат Яь т. е. являются собственными векторами матрицы Л, pt = Ш\ -т0. Расположим все полученные таблицы векторов последовательно слева направо, выровняв их по последней строке и введя для всех векторов более компактные обозначения. Тогда получим следующую таблицу е ех ех е] е] ех е1 Векторы, стоящие в первой строке этой таблицы, имеют высоту t, векторы следующей строки — высоту /- 1 и т. д. Векторы последней строки имеют высоту 1. Каждый столбец таблицы определяет базис циклического подпространства, порожденного верхним вектором столбца. Вся совокупность векторов таблицы представляет базис корневого подпространства Rh Как видно, он есть объединение базисов циклических подпространств. Согласно 5.3-14 это и означает, что корневое подпространство разложимо в прямую сумму циклических подпространств. 9.5-19.5 Корневой базис Жордана Корневой базис, составленный как последовательное объединение базисов 9.5-14 циклических подпространств, называется корневым базисом Жордана. Дополнение. Говоря о корневом базисе Жордана, обычно понимают под ним корневой базис, представленный в последней таблице из дополнения к 9.5-18 и упорядоченный по столбцам сверху вниз и слева направо. 9.5.5. Каноническая форма Жордана 9.5-20.5 Канонический ящик Жордана Каноническим ящиком Жордана или жордановой клеткой называется квадратная матрица вида \ 1 X 1 о о X 1 X Диагональные элементы этой матрицы равны Х\ элементы, расположенные рядом с диагональными справа, равны 1; все остальные элементы равны 0.
9. Структура матриц общего вида 317 9.5-21.5 Каноническая форма Жордана При переходе к корневому базису Жордана матрица приобретает так называемую каноническую форму Жордана. Это есть блочно-диагональная матрица, составленная из ящиков Жордана. Дополнение. Согласно 9.5-8 матрица в любом корневом базисе является блочно- диагональной. В силу 9.5-18 любое корневое подпространство есть прямая сумма циклических подпространств, каждое из которых, в свою очередь, согласно 9.5-17 является инвариантным. Поэтому в соответствии с 9.2-7, 9.2-8 заключаем, что в корневом базисе Жордана матрица будет блочно-диагональной и каждому диагональному блоку будет соответствовать одно циклическое подпространство. Остается посмотреть, какой вид будет иметь матрица в циклическом базисе. Пусть ех = ~ хх есть базис циклического подпространства. Отсюда вытекает, что Ае{ = Xfix + еъ Ае2 = Xfa + е3, •••> М-\ k-\ Вектор ек согласно 9.5-13 является корневым вектором высоты 1, т. е. собственным вектором. Поэтому Аек- А,,е*. В соответствии с 3.7-18 в б&зисе еь ..., е* мат" рица будет иметь вид канонического ящика Жордана X 0 l l X 0 , 1 X 9.5-22.5 Критерий подобия матриц Квадратные матрицы одинаковых размеров подобны тогда и только тогда, когда они приводятся к каноническим формам Жордана, одинаковым с точностью до перестановки ящиков Жордана. Дополнение. Ясно, что две квадратные матрицы одинаковых размеров, представляющие канонические формы Жордана, но отличающиеся лишь порядком расположения ящиков Жордана, подобны. Матрицей подобия является подходящая матрица перестановок. Поэтому, если две квадратные матрицы имеют одинаковые канонические формы Жордана, отличающиеся, возможно, лишь порядком расположения ящиков Жордана, то они подобны согласно 8.1-18 в силу транзитивности признака подобия. Пусть теперь две матрицы подобны. Приведем одну из них к канонической форме J. Другая матрица должна быть подобна У, т. к. если В = Г1АР и А = Q~ ]JQ, тоВ = (QPy lJ(QP).
318 Часть I. Математические сведения по линейной алгебре 9.5-23.5 Единственность формы Жордана Для каждой квадратной матрицы каноническая форма Жордана единственна с точностью до расположения ящиков Жордана. Дополнение. Пусть матрица подобна двум каноническим жордановым формам Jx и J2. Эти формы подобны, т. е. J{ = RT lJ2R для некоторой матрицы R. Заметим, что при подобном преобразовании инвариантное подпространство остается инвариантным. В самом деле, предположим, что ех, ..., es есть базис инвариантного подпространства матрицы J\. Это означает, что еслих = а\в\ + ...+ ases для некоторых чисел ось ..., as, то Jxx = Р^ + ... + $ses для каких-то чисел (Зь ..., р,. Рассмотрим векторы Re\, ...,Res. Они линейно независимы. Если Rx = <X]Re\ + ... +a.sReS9 то для J2{Rx) имеем: J2(Rx) = RJXR~ \Rx) - RJxx = p!^! + ... + $sRe,. Согласно 9.2-7, 9.2-8 при соответствующем упорядочивании базисов инвариантных подпространств матрицы J\ и J2 должны иметь одну и ту же блочную структуру. 9.5-24.5 Комментарий (о классе подобных матриц) Полученные результаты полностью характеризуют класс подобных матриц. Именно, любые две подобные матрицы могут быть приведены подобными преобразованиями к одной и той же канонической форме Жордана и не могут быть приведены к разным формам Жордана, отличающимся друг от друга больше, чем расположение ящиков Жордана на диагонали. 9.5-25.5 Произвол расположения ящиков Жордана Существует подобное преобразование, приводящее матрицу к канонической форме Жордана с любым заданным порядком расположения ящиков Жордана на диагонали. Дополнение. Очевидно, принимая во внимание способ приведения матрицы к канонической форме Жордана. 9.5.6. Некоторые следствия Э.5-26.5 Подобие матриц А и А' Матрицы А и А' подобны. Дополнение. Если Уесть каноническая матрица Жордана, то достаточно доказать подобие матриц J и J. Более того, достаточно доказать подобие матриц J и J даже для того случая, когда J есть канонический ящик Жордана. Но это легко проверить непосредственно, т. к. / = Р~ lJP, где Р есть матрица перестановок с единицами на побочной диагонали. Здесь Р~1 = Р.
9. Структура матриц общего вида 319 9.5-27.5 Корневые подпространства матриц А и А* Корневое подпространство комплексной матрицы А, соответствующее собственному значению X, ортогонально корневому подпространству матрицы А*, соответствующему собственному значению ц, не равному X. Дополнение. Пусть матрица А имеет каноническую форму Жордана J, т. е. А = P~XJP для некоторой матрицы Р. Отсюда получаем, что А* = P*J*(P*)~\ Согласно 9.4-10 равенства (А - ХЕ)кх = 0и(/- \^Е)гу = 0 эквивалентны равенствам P~\j-XE)kPx = 0 и P*(J* - \iE)r(P*)~ ly = 0. Поэтому если/(g) есть корневой вектор матрицы J(J*), соответствующий собственному значению Х(у), то х = Р~ У(у = P*g) есть корневой вектор матрицы А (А*), соответствующий тому же собственному значению X (ц). Принимая во внимание структуру матриц J и J*, очевидно, что векторы/и g ортогональны, если X ф\х. Учитывая 5.2-25, теперь имеем (х, у) = (р- lf, p*g) = (f9 (/>- lyp*g) = (/; (р*т lp*g) = (/; g) = о. 9.5-28.5 Симметричное представление ящика Жордана Любой ящик Жордана может быть представлен как произведение двух симметричных, в общем случае, комплексных матриц. Дополнение. Пусть 'X 1 X 1 0 0" .. 1 х_ 1 1 г 1 0  X X 1 1 X х~ 1 0 Матрицы Р и Л симметричные. Легко проверить, что Л = Р Л. 9.5-29.5 Симметричное представление матрицы Любая квадратная комплексная матрица может быть представлена как произведение двух симметричных, в общем случае, комплексных матриц. Дополнение. Пусть квадратная комплексная матрица А представлена в виде А = QJQ~\ где J— каноническая матрица Жордана. Согласно 9.5-28 представим матрицу J в виде произведения J=RS, где R, S— симметричные комплексные матрицы. Теперь имеем Л = QJQ~l = QRSQ-] = (QRQ')(Q'~ lSQ~'). Обе матрицы в круглых скобках, очевидно, симметричные.
10. Нормальные матрицы 10.1. Нормальные матрицы общего вида 10.1.1. Простейшие нормальные матрицы 10.1-1.4 Нормальная матрица Матрица А называется нормальной, если она перестановочна со своей сопряженной матрицей А*, т. е. АА* = А*А. 10.1-2.4 Нормальность сопряженной матрицы Если матрица Л нормальная, то матрица Л* также нормальная. Дополнение. Очевидно, принимая во внимание определение 10.1-1 и то, что (А*)* = А согласно 3.3-6. 10.1 -З.4 Блочно-треугольная нормальная матрица Блочно-треугольная нормальная матрица является блочно-диагональной. Дополнение. Докажем сначала утверждение для матриц блочного порядка 2. Пусть '4, 0 ^ (jfu 0 Vi4H Ai: Приравнивая соответствующие блоки произведения матриц слева и справа, получаем систему уравнений ^22^22 ~ AlAl 11 Зак. 740
322 Часть /. Математические сведения по линейной алгебре Из первого уравнения, принимая во внимание 3.3-8, находим, что tr 4i4*i+tr AiAn= M*i4i- Отсюда с учетом 3.3-9 получаем, что tr А12А*2 = 0 или Ап = 0. Если матрица имеет более высокий блочный порядок, то представляя ее в виде различных блочных матриц порядка 2, последовательно показываем, что все внедиагональные блоки должны быть нулевыми. 10.1-4.4 Нормальность диагональной матрицы Диагональная матрица является нормальной. 10.1-5.4 Нормальность матрицы оЛ + (ЗА* Пусть А — произвольная матрица, а, Р — равные по модулю комплексные числа. Тогда матрица оА + $А* будет нормальной. Дополнение. Осуществляя непосредственные выкладки, находим, что (оА + РЛ*)( ос А* + р А) = \а\2АА* + а р А2 + р а (А*J + \$\2А*А, (а А* + р А){аА + РЛ*) = |а|2Л*Л + а р^2 + р а (А*J + |Р|2^*. Если |а| = |Р|, то правые части обоих равенств одинаковы. Следовательно, одинаковы и левые части. 10.1.2. Собственные векторы нормальной матрицы 10.1-б.4 Комментарий (о виде ортогональности) Мы уже неоднократно отмечали ортогональность различных векторов, связанных с матрицами А и А*. Эта ортогональность особенно характерна для нормальных матриц. Опять будем понимать ее в смысле скалярного произведения вида 5.1-8 относительно естественного базиса, если не сделано какой-либо специальной оговорки. Начиная изучение нормальных матриц, полезно вспомнить утверждения 9.2-23 и 5.2-25. 10.1-7.4 Спектральный критерий нормальности Для того чтобы матрица была нормальной, необходимо и достаточно, чтобы она имела базисную систему ортонормированных собственных векторов. Дополнение. Пусть матрица А имеет базисную систему ортонормированных собственных векторов. По определению 8.3-1 матрица А имеет простую структуру. Согласно 8.3-2 образуем матрицу X, столбцами которой являются собственные векторы. При переходе к базису из собственных векторов матрица А приобретает вид Л = ЛГ ]АХ. Ортонормированный базис является биортонормированным по от-
10. Нормальные матрицы 323 ношению к самому себе. Поэтому согласно 8.1-21 матрица А* при переходе к этому же базису приобретает вид Л* = Х~ ]А*Х. Следовательно, О = Л*Л-ЛЛ* = ХГХА*ХХГХАХ-ХГ ]АХХГlA*X=JTx(A*A -AA*)X9 то есть А*А=АА* и матрица А нормальная. Предположим теперь, что матрица А нормальная, т. е. А*А =АА*. Согласно 9.2-23 существует ортонормированный базис, при переходе к которому матрица приобретает правый треугольный вид А. Если через Р обозначить матрицу перехода к этому базису, то А = Р~ {АР. Кроме этого, как уже отмечалось, при переходе к этому же базису матрица А* согласно 8.1-21 приобретает вид А* = Р~ ХА*Р. Имеем А*А - АА* = Г 1А*РР~ ХАР - Р~ ХАРР~ ХА*Р = Г\А*А- АА*)Р = 0. Следовательно, треугольная матрица А является нормальной. Согласно 10.1-3 матрица А диагональная. Согласно 8.3-3 матрица А имеет простую структуру и столбцы матрицы Р являются собственными векторами. По построению они представляют векторы ортонормированного базиса. Итак, для того чтобы матрица А была нормальной, необходимо и достаточно существование такой невырожденной матрицы X и диагональной матрицы Л, что одновременно выполняются равенства К=ХГХАХ,А*=ХГХА*Х. При этом столбцы матрицы X представляют ортонормированную систему векторов и, как было показано в дополнении к 8.1-21, выполняется равенство X* =Х~\ 10.1-8.4 Собственные векторы матриц А и А* Если матрица А нормальная, то матрицы А и А* имеют одинаковые системы собственных векторов. Дополнение. Это есть прямое следствие итогового заключения в дополнении к 10.1-7 и 8.3-3. 10.1-9.4 Еще раз о собственных векторах Если матрица А нормальная, то собственные значения матриц А и А*, соответствующие общему собственному вектору, комплексно сопряжены. Дополнение. Это есть прямое следствие итогового заключения в дополнении к 10.1-7 и 8.3-3. 10.1-10.4 Диагональный вид Если матрица А нормальная, то в ортонормированном базисе из ее собственных векторов матрицы А и А* одновременно принимают диагональный вид Л и Л соответственно. Дополнение. Это есть прямое следствие итогового заключения в дополнении к 10.1-7 и 8.3-3.
324 Часть I. Математические сведения по линейной алгебре 10.1-11.4 Нормальность и простая структура Нормальная матрица всегда имеет простую структуру. Дополнение. Это есть прямое следствие итогового заключения в дополнении к 10.1-7 и 8.3-3. 10.1-12.4 Соответствующие матрицы для нормальной Пусть матрица А нормальная и дгь ..., дсот— ее ортонормированные собственные векторы, соответствующие собственным значениям A,i, ...Д,„. Построим соответствующие матрицы G, = Х;Х* (см. 8.3-20) для всех /. Имеют место разложения Дополнение. Очевидно, принимая во внимание 10.1-8, 10.1-9, 8.3-22. 10.1-13.4 Еще раз о соответствующих матрицах Если матрица Л нормальная, то в обозначениях 10.1-12 при 1 <s<m будет нормальной матрица (см. 8.3-24) Дополнение. Принимая во внимание 10.1-12, 8.3-21, удостоверяемся, что 10.1.3. Инвариантность ортогонального дополнения 10.1-14.4 Инвариантность ортогонального дополнения Матрица А является нормальной тогда и только тогда, когда для любого инвариантного подпространства L ортогональное дополнение L1 также инвариантное. Дополнение. Пусть для матрицы А ортогональное дополнение L1 любого инвариантного подпространства L также является инвариантным подпространством. Любая вещественная или комплексная матрица имеет согласно 8.2-31 хотя бы один собственный вектор. Возьмем его нормированным и пусть это будет ех. Обозна-
10. Нормальные матрицы 325 чим через L{ его линейную оболочку. По условию Lf есть инвариантное подпространство. Согласно 9.1-14 в нем содержится хотя бы один собственный вектор. Возьмем его нормированным и пусть это будет е2. По построению еие2 образуют ортонормированную систему собственных векторов матрицы А. Обозначим через L2 их линейную оболочку. Очевидно, что L2 есть инвариантное подпространство. По условию L\ также является инвариантным подпространством. Следовательно, согласно 9.1-14 в нем содержится собственный вектор. Возьмем его нормированным и пусть это будет еъ. Теперь еи еъ е3 образуют ортонормированную систему собственных векторов. Продолжая процесс, построим базисную систему ортонор- мированных собственных векторов матрицы А. Согласно 10.1-7 матрица А будет нормальной. Предположим теперь, что матрица А нормальная и пусть L есть какое-нибудь ее инвариантное подпространство размерности г. Так как сейчас рассматривается лишь комплексная или вещественная матрица, то она имеет столько собственных значений, каков ее порядок. Принимая во внимание 9.2-17,9.2-18, построим цепочку вложенных инвариантных подпространств типа 9.2-19, среди которых Lr есть заданное инвариантное подпространство L. Как было показано в дополнении к9.2-23, существует ортонормированный базис eu ...,em такой, что ер е Lp для всех/>, 1 <р < т. По построению векторы еь ..., ег образуют ортонормированный базис в L. В силу 5.3-23 векторы ег+ ь ..., ет образуют ортонормированный базис в /Л Согласно 9.2-23 матрица в этом базисе оказывается треугольной. Любой ортонормированный базис является биортонормированным по отношению к самому себе. В соответствии с 8.1-21 при переходе к базису еь .., ет матрица А перейдет в подобную ей матрицу В = Р~ 1АР, а матрица А* — в подобную ей матрицу В* = Р~]А*Р. Из равенства А*А=АА* следует равенство В*В = ВВ*, т.е. матрица В является нормальной. Но согласно 10.1-3 матрица В должна быть диагональной. Все ее наддиагональные элементы равны нулю. Поэтому согласно 9.2-8 заключаем, что линейная оболочка векторов ег+ ь ..., ет или, другими словами, ортогональное дополнение L1 есть инвариантное относительно матрицы А подпространство. 10.1-15.4 Общие для Аи А* инвариантные подпространства Любое подпространство, инвариантное относительно нормальной матрицы А, инвариантно относительно А*. Дополнение. Пусть матрица А нормальная и L есть инвариантное относительно матрицы А подпространство. Согласно 9.1-8 подпространство L1 инвариантно относительно матрицы А*. Но в силу 10.1-14 подпространство L1 также инвариантно относительно матрицы (А*)* =А. 10.1-1 б.4 Разложение унитарного пространства Для любой нормальной матрицы А в унитарном пространстве X имеют место разложения Х= ker A © im A = ker A 0 (ker A*I.
326 Часть I. Математические сведения по линейной алгебре Дополнение. Согласно 10.1-11 нормальная матрица Л имеет простую структуру. Поэтому в силу 8.3-11 образ матрицы А есть линейная оболочка ее собственных векторов, соответствующих ненулевым собственным значениям. Но согласно 10.1-8 матрицы А и А* имеют одинаковые системы собственных векторов. Поэтому для нормальной матрицы А имеем \rr\A = \тА*. Принимая во внимание 6.4-9 заключаем, что Х= ker A 0 im A = ker A © (ker A*I. 10.1.4. Нормальные матрицы и многочлены 10.1-17.4 Нормальность многочлена от матрицы Пусть А — нормальная матрица. Для любого многочлена ф(А,) матрица ц>(А) будет нормальной. Дополнение. Если АА*=А*А, то для любых натуральных /?, q имеем АР(А*L = (A*)qAp. Учитывая это замечание и раскрывая произведения ф(Л)ф (А*) и ф (А*)(р(А), убеждаемся непосредственно, что они совпадают. 10.1-18.4 Перестановочные нормальные матрицы Перестановочные нормальные матрицы имеют общую базисную систему ортонорми- рованных собственных векторов. Дополнение. Согласно 9.2-24 существует ортонормированный базис, в котором перестановочные матрицы одновременно имеют треугольный вид. Если матрицы, к тому же, нормальные, то, как было показано в дополнении к 10.1-7, каждый вектор этого базиса является собственным, естественно, для каждой из матриц. 10.1-19.4 Многочленное представление матриц А и А* Если А — нормальная матрица порядка т с собственными значениями X ь ...Дда, то существуют такие многочлены р(Х\ q(X), что A*=p(A),A=q(A*); при этом р(Х,) = Xi, q{ Xt ) = Xj для всех /. Дополнение. Пусть матрица А нормальная. В соответствии с итоговым заключением в дополнении к 10.1-7 существуют невырожденная матрицами диагональная матрица Л, составленная из собственных значений Хи...,Хт, такие, что Л = Х~ ]АХ, Л* =ЛГ ХА*Х. Предположим для определенности, что собственные значения Х{, ... Дг, 1 < г < т, попарно различны, а остальные равны каким-то из них. В соответствии с 7.2-9 построим интерполяционные многочлены Лагранжа р(к) и q(X), удовлетворяющие условиям р(Х,) = Xt и q( Xt) = А,, для всех /, 1 < У < г. По построению выполняются равенства р(А) = A9q(A) = Л. Умножив оба равенства слева на матрицу X и справа на матрицу JT| и воспользовавшись 9.4-10, заключаем, что А* =р(А\ А = q(A*).
10. Нормальные матрицы 327 10.1-20.4 Критерий нормальности Если существует хотя бы один из многочленов р(Х), q(k), для которого выполняется соответствующее равенство 10.1-19, то матрица ,4 — нормальная. Дополнение. Пусть, например, А*=р(А) для некоторого многочлена р(Х). Согласно 9.4-4 два многочлена от одной матрицы перестановочны. Поэтому АА* - А*А = Ар(А) ~р(А)А = 0, то есть по определению 10.1-1 матрица А нормальная. 10.2. Унитарные матрицы и преобразования 10.2.1. Унитарные матрицы 10.2-1.3 Унитарная матрица Комплексная матрица U называется унитарной, если сопряженная матрица U* совпадает с обратной ITl. 10.2-2.3 Эквивалентные определения Комплексная матрица UНазывается унитарной, если UU* = Е, (Ц*и= Е). Дополнение. В самом деле, согласно 4.4-8 в обоих случаях V* = 1ГХ. 10.2-3.3 Унитарность сопряженной матрицы Если матрица U унитарная, то матрица U* также унитарная. Дополнение. Очевидно, принимая во внимание определение 10.2-1 и то, что (?/*)* = AГ У = {If)~х согласно 4.4-11. 10.2-4.4 Унитарность и нормальность Унитарная матрица является нормальной. Дополнение. Очевидно, принимая во внимание определение 10.1-1. 10.2-5.3 Матрицы перестановок Любая матрица перестановок унитарная. Дополнение. Очевидно, принимая во внимание 3.4-3. 10.2-6.3 Группа унитарных матриц Унитарные матрицы одного порядка образуют группу по умножению.
328 Часть /. Математические сведения по линейной алгебре Дополнение. На множестве унитарных матриц одного порядка определена операция умножения. Произведение унитарных матриц А, В есть снова унитарная матрица. В самом деле, если А*А = АА* = Е и В* В = ВВ* = Е, то (АВ)*(АВ) = В*А*АВ = В*(А*А)В = Е, (АВ)(АВ)* = ABB* А* = А(ВВ*)А* = ?. Единичная матрица Е является унитарной. Для каждой унитарной матрицы U существует обратная. Это есть If. По определению 1.5-2 множество унитарных матриц одного порядка есть группа по умножению. 10.2-7.3 Определитель унитарной матрицы Определитель унитарной матрицы по модулю равен 1. Дополнение. Пусть U— унитарная матрица, т. е. U*U= E. Принимая во внимание 4.1-22, 4.1-13, 4.2-10, находим, что |detL/|2= det U- det U= det if • det U= det(?/*LO = det?= 1. 10.2.2. Критерии унитарности 10.2-8.4 Спектральный критерий унитарности Среди нормальных матриц унитарная матрица выделяется тем и только тем, что все ее собственные значения по модулю равны 1. Дополнение. Рассмотрим унитарную матрицу U. Она является нормальной. Как было установлено в итоговом заключении дополнения к 10.1-7, должны выполняться соотношения A=rlUY, А* = Г]Ц*У. Здесь У— невырожденная матрица, Л— диагональная матрица из собственных значений Х\9 ..., Х,п. Подставляя в равенство UU* = Е представления для матриц U и U*, получаем, что ЛЛ* = Е или |Х,-|2 = 1 для всех /, 1 < / < т. Предположим теперь, что для нормальной матрицы U все ее собственные значения по модулю равны 1. Это означает, что наряду с указанными выше представлениями для матриц U и U* должно также выполняться равенство ЛЛ* = Е. Отсюда сразу получаем, что UU* = Е, т. е. матрица ?/унитарная. 10.2-9.3 Метрические критерии унитарности Матрица U является унитарной в том и только в том случае, когда выполняется хотя бы одно (следовательно, все) из следующих условий: • столбцы матрицы U, рассматриваемые как векторы унитарного арифметического пространства, образуют ортонормированную систему;
10. Нормальные матрицы 329 • строки матрицы U, рассматриваемые как векторы унитарного арифметического пространства, образуют ортонормированную систему; • для любых двух векторов их скалярное произведение равно скалярному произведению их образов; • для любых двух ортогональных векторов их образы ортогональны, и хотя бы для одного ненулевого вектора его длина равна длине его образа; • для любого вектора его длина равна длине его образа; • для любых двух векторов какого-нибудь базиса их скалярное произведение равно скалярному произведению их образов; • образы векторов любого ортонормированного базиса образуют также ортонорми- рованный базис; • образы векторов хотя бы одного ортонормированного базиса образуют ортонор- мированный базис; • матрица U является матрицей преобразования координат при переходе от ортонормированного базиса к ортонормированному; • матрица U* является матрицей преобразования координат при переходе от ортонормированного базиса к ортонормированному. Дополнение. Рассмотрим кратко каждое из условий. • Согласно 5.1-8 каждый элемент Гц матрицы R = U*U можно рассматривать как скалярное произведение у-го вектор-столбца матрицы (У и ее /-го вектор- столбца. Но т. к. U*U = Е, то система вектор-столбцов матрицы U является ор- тонормированной в смысле скалярного произведения 5.1-8. • Согласно 5.1-8 каждый элемент qy матрицы Q = UU* можно рассматривать как скалярное произведение /-й вектор-строки матрицы (У и ее у-й вектор-строки. Но т. к. UU* = ?, то система вектор-строк матрицы U является ортонормиро- ванной в смысле скалярного произведения 5.1-8. • В самом деле, (х,у) = (х, U*Uy) = (Ux,Uy), если lfU=E. Если же (х>у) = (Ux, Uy) для любых векторов х,у, то (х, (Е- U*U)y) = 0. Согласно 5.1-6 отсюда следует, что (Е- U*U)y = 0 для любого вектора>>, т. е. U*U= E. • Пусть U*U=E. Если (х, у) = 0, то (х, у) = (х, ifUy) = (Ux, Uy) = 0. Кроме этого, для любого х ф 0 имеем (х, лс) = (Ux, Ux), т. е. \х\2 = \Ux\2. Предположим теперь, что из равенства (х,у) = 0 следует (Ux,Uy) = 0 и существует вектор е^О такой, что (eue}) = (Uei, Ue{). He ограничивая общности, можно считать, что (ех, е\)= 1. Возьмем ортонормированный базис в\9 ..., еп» включив в него вектор е\. По условию (Ueh Uej) = 0 для / ф], 1 < i,j < m и (Ueu Ue{) = 1. Рассмотрим ортогональные векторы в\ + ef и ег е}. По условию (U(ex + ej), U(ex - ej)) = 0, откуда заключаем, что (Uej9 Ue^) = 1 для всех ]Ф\ и, следовательно, для всех у, 1 <j<m. Поэтому система векторов Ue\, ..., Uem является
330 Часть I. Математические сведения по линейной алгебре ортонормированной. Представим вектор L/*Lfe,- в виде разложения по системе векторов eu ...,em. Принимая во внимание 5.2-9, имеем 7 = 1 j=\ Итак, на векторах базиса еь ..., ет имеем U*Uet = et для всех /, 1 <i<m. Следовательно, U*U= ?, т. е. матрица [/унитарная. • Если U*U=E9 то для любого вектора jc имеем (х, х) = (jc, U*Ux) = (Ux, Ux). Пусть теперь (jc, jc) = {Ux, Ux) для любого вектора х. Легко проверить справедливость тождества 4(м, v) = \u + v|2 - |w - v|2 + /|w + /v|2 - /|w - /v|2 для любых векторов w, v. Отсюда следует, что равенство длин образов и прообразов влечет за собой равенство скалярных произведений между образами и прообразами. Согласно третьему пункту настоящего утверждения, матрица U унитарная. • Предположим, что для векторов базиса еи...,ет выполняются условия (ehej) = (Ueh Ue}) для всех /,у, 1 <ij<m. Рассмотрим любые векторы х,у и пусть 1 = 1 у = I Имеем (х, у) = ?>Л /=1 7=1 '=17=1 1=17=1 /=1 7=1 Все остальное следует из третьего пункта настоящего утверждения. • Рассмотрим любой ортонормированный базис еи ..., ет. Если матрица U унитарная, то U*U= E. Следовательно, 0, если / Ф у, 1, если / = у, то есть система векторов Ue\, ..., Uem является ортонормированной. Если теперь система векторов Ueu ..., Uem является ортонормированной, то рассмотрим разложение векторов U*Uet по векторам еи ..., ет. Принимая во внимание 5.2-9, имеем U*Uei = уГ (U*Uei, е )е = Z ^е\ > ^е )е ~ ег 7=1 7=1 Так как U*Uej = е, на векторах базиса, то U*U= ?, т. е. матрица U унитарная.
10. Нормальные матрицы 331 • Доказательство полностью повторяет доказательство предыдущего пункта, только теперь базис е{, ...,ет фиксированный. • По существу данное условие есть перефразировка предыдущего, если принять во внимание 8.1-3. • Это есть очевидное следствие предыдущего условия, если принять во внимание 10.2-3. 10.2.3. Унитарные преобразования 10.2-Ю.5 Унитарное преобразование и псевдообращение Пусть А — произвольная прямоугольная комплексная матрица, Q, R — унитарные матрицы. Имеет место равенство (QAR)+ = R*A+Q*. Дополнение. Воспользуемся соотношениями 6.6-18. Матрица А+ и только она удовлетворяет равенствам А*АА+ = А*; A+=UA*=A*V для некоторых квадратных матриц U, V. Пусть В = QAR, где Q, R — унитарные матрицы, и предположительно В+ = R*A+Q*. Проверим выполнение аналогичных равенств для матриц В, В+. Имеем R*A*Q*QARR*A+Q* = R*A*AA+Q* = R*A*Q* или В*ВВ+ = В*. Далее находим R*A+Q* = R*UA*Q* = (R*UR)R*A*Q\ R*A+Q* = R*A* VQ* = R*A*Q*(QVQ*) или B+ = SB* = B*T для квадратных матриц S = R*UR, T= QVQ*. Поэтому действительно (QARf = R*A+Q*. 10.2-11.3 Унитарно подобные матрицы Матрицы А и В называются унитарно подобными, если существует такая унитарная матрица U, что В = If A U. 10.2-12.3 Свойство унитарного подобия Унитарное подобие на множестве квадратных матриц одного порядка есть отношение эквивалентности. Дополнение. По определению 1.3-2 унитарное подобие есть бинарное отношение. Оно рефлексивно, т. к. А = Е*АЕ, а единичная матрица является унитарной. Оно симметрично, т. к. из равенства В= U*AU следует А = UBU*. Очевидно, что для унитарной матрицы U матрица U* также является унитарной. Если В = U*AU и
332 Часть I. Математические сведения по линейной алгебре С= V*BV для унитарных матриц (У и К, то С = (UV)*A(UV). Согласно 10.2-6 матрица UV унитарная. Принимая во внимание определение 1.3-4, заключаем, что унитарное подобие есть отношение эквивалентности. 10.2-13.4 Подобие треугольной матрице Любая комплексная матрица унитарно подобна треугольной матрице. Дополнение. Согласно 9.2-23 существует ортонормированный базис еь ...,е„„ при переходе к которому матрица А приобретает треугольный вид. Обозначим через Р матрицу преобразования координат из естественного базиса в базис еь ..., ет. Сказанное означает, что матрица В - Р~ХАР треугольная. Но Р есть матрица перехода от одного ортонормированного базиса к другому ортонормирован- ному. Согласно девятому пункту 10.2-9 матрица Р унитарная. Следовательно, Р~х = Р* и В = Р*АР, т. е. матрица А унитарно подобна треугольной матрице. 10.2-14.3 Унитарное подобие треугольных матриц Правая (левая) треугольная матрица унитарно подобна левой (правой) треугольной матрице. Дополнение. Рассмотрим матрицу перестановок Р с единицами на побочной диагонали. Легко проверить, что Р = Р* = Р~\ Следовательно, матрица Р унитарная. Непосредственно проверяется, что если матрица А правая (левая) треугольная, то унитарно подобная ей матрица В = РАР является левой (правой) треугольной. 10.2-15.4 Сохранение нормальности При унитарно подобном преобразовании нормальная матрица переходит в нормальную. Дополнение. Пусть А— нормальная матрица, U— унитарная. Рассмотрим матрицу В = U*A U. Имеем В*В-ВВ* = U*A*(UU*)AU- Ц*А{ии*)А*и= U*(A*A -AA*)U=0. 10.2-1 б.3 Сохранение унитарности При унитарно подобном преобразовании унитарная матрица переходит в унитарную. Дополнение. Пусть А — унитарная матрица. Унитарно подобная ей матрица В- U*AU есть произведение трех унитарных матриц. Согласно 10.2-6 матрица В унитарная. 10.2-17.4 Унитарное подобие диагональным матрицам Комплексные нормальные матрицы, и только они, унитарно подобны диагональным матрицам.
10. Нормальные матрицы 333 Дополнение. Предположим, что А — комплексная нормальная матрица. Согласно итоговому заключению в дополнении к 10.1-7, для таких и только таких матриц существует невырожденная матрица X и диагональная матрица Л, что Л = Х~ ХАХ и X* = Х~ \ Условие X* = Х~! означает унитарность матрицы X. Так как Л = Х*АХ, то матрица А унитарно подобна матрице Л согласно определению 10.2-11. Если выполняется условие Л = Х*АХ для унитарной матрицы X, то А*А -АА* =ХА*(Х*Х)АХ* -ХА(Х*Х)А*Х* = ДЛ*Л-ЛЛ*>Г = 0. 10.2.4. Метрические свойства 10.2-18.3 Элементы унитарной матрицы Любой элемент унитарной матрицы равен по модулю своему дополнительному минору. Дополнение. Пусть U— унитарная матрица, т. е. U*U = E. В соответствии с определением 4.4-5 рассмотрим присоединенную матрицу U . Согласно 4.4-6 выполняется равенство UU = det U • Е. Поэтому U = detU - U*. Если Ц, есть алгебраическое дополнение элемента щ матрицы U, то принимая во внимание определение 4.4-5 и свойство 10.2-7, заключаем, что \щ\ = \Щ для всех /,у. Напомним, что согласно 4.2-3 дополнительный минор только знаком отличается от алгебраического дополнения. 10.2-19.4 Сумма квадратов модулей миноров Сумма квадратов модулей всех миноров порядка к, выбранных из произвольных к строк (столбцов) унитарной матрицы, равна 1. Дополнение. Предположим, что U есть унитарная матрица порядка m и выбраны строки с номерами /ь /2,..., 4. Используя 4.1-22, 4.1-13, 4.2-13, находим, что 10.2-20.5 Модуль ведущего минора Пусть ведущий минор порядка к унитарной матрицы порядка m по модулю равен 1. Тогда матрица является блочно-диагональной с блоками порядков к vim-к. Дополнение. Пусть t/есть унитарная матрица порядка т. Рассмотрим матрицу Uk ведущего минора порядка к > 1 матрицы U. Если щ — элементы матрицы U, то
334 Часть I. Математические сведения по линейной алгебре Обозначим через мь ..., щ первые k столбцов матрицы U, через «*,..., и\ — вектор-столбцы матрицы Uk. Так как матрица U унитарная, то в соответствии с первым пунктом 10.2-9 выполняются равенства \и\ = 1 для всех /, 1 < / < к. Но очевидно, что |м*| <|н,|, причем равенство достигается лишь в том случае, когда последние m - к элементов в /-м столбце матрицы U будут нулевыми. В силу условия и согласно 5.4-24, 5.4-28 имеем где V(u\,..., икк) есть объем системы векторов (и*,..., икк). Согласно сказанному выше, эта цепочка соотношений возможна лишь в том случае, когда матрица U является правой блочно-треугольной с блоком порядка к в левом верхнем углу. Но в соответствии с 10.1-3 такая матрица должна быть блочно-диагональной. 10.2-21.3 Сохранение суммы квадратов модулей элементов Сумма квадратов модулей всех элементов матрицы не изменяется при умножении матрицы слева или справа на любые унитарные матрицы. Дополнение. Пусть даны прямоугольная матрица А размера /их п и унитарная матрица Q соответствующего порядка. Рассмотрим матрицу B = QA. Обозначим через ay, btJ элементы матриц А, В. Рассматривая столбцы матриц А, В как векторы и принимая во внимание пятый пункт утверждения 10.2-9, заключаем, что SN'-Shf / = 1 »= 1 для всех j, I <j < п. Суммируя эти равенства по всему, убеждаемся в справедливости утверждения. Если рассматривается матрица C = AR для унитарной матрицы R, то аналогичный результат следует из равенства С* = R*A*. Матрица R* унитарная, а суммы квадратов модулей всех элементов матрицы и сопряженной к ней совпадают. 10.2-22.4 Оценка для собственных значений Пусть дана комплексная квадратная матрица А порядка т с элементами а1} и собственными значениями Хи ..., Хт. Всегда выполняется неравенство т т - т_ SShf*SM2. / = 1 у = 1 / = 1
10. Нормальные матрицы 335 причем равенство достигается тогда и только тогда, когда матрица А нормальная. Дополнение. Согласно 10.2-13 матрица А унитарно подобна, например, правой треугольной матрице В = U*AU9 где U— унитарная матрица. В силу подобия матрицы А и В имеют одни и те же собственные значения согласно 8.2-23. В силу унитарности подобия матрицы А и В имеют одинаковые суммы квадратов модулей элементов согласно 10.2-21. Согласно 8.2-6 собственные значения треугольной матрицы совпадают с ее диагональными элементами. Поэтому / = 1J = 1 Очевидно, что равенство достигается тогда и только тогда, когда матрица В диагональная. В свою очередь, согласно 10.2-17 это возможно тогда и только тогда, когда матрица А нормальная. 10.2.5. Ортогональные матрицы и преобразования 10.2-23.3 Ортогональная матрица Вещественная унитарная матрица называется ортогональной. 10.2-24.3 Комментарий (ортогональность и унитарность) Так как ортогональная матрица является унитарной, то почти все свойства унитарной матрицы переносятся на ортогональную матрицу. При этом меняется лишь терминология: "унитарное пространство" заменяется на "евклидово пространство", а слова "комплексный", "унитарный" и символ А* — соответственно на слова "вещественный", "ортогональный" и символ А'. Некоторое отличие в формулировках утверждений может появиться только в тех случаях, когда по тем или иным причинам необходимо использовать лишь вещественные величины и преобразования. 10.2-25.3 Комплексная унитарная матрица Р+ iQ Пусть U=P + iQ— комплексная унитарная матрица порядка т с вещественными Пр -el c матрицами Р, Q. Вещественная блочная матрица D = \ порядка 2т является ортогональной. Дополнение. Пусть U = Р + iQ — комплексная унитарная матрица. Следовательно, выполняются равенства UU* = [/*?/ = E или (Р + /0(Р - iQ) = PF + QQ + i(QF - PQ) = = {F - iQr)(P + 10 = FP + QQ + i(FQ - QP) = E. Отсюда заключаем, что PF + QQ = FP + QQ = ?, QF - PQ = FQ - QP = 0.
336 Часть I. Математические сведения по линейной алгебре Далее находим DD' = Q P\l-Qf Pi Q' P'Wq P p -Q\\ P' Q'] [pp' + QQ' pq'-QP'"\[e6 QP'-PQ' PP' + QQf\~{oE\' 1 Q'P-P'Q _ ~|_0? 10.2-26.4 Комплексная нормальная матрица В + /С Пусть A=B + iC— комплексная нормальная матрица порядка m с вещественными матрицами Ву С. Вещественная блочная матрица F = В -С С В порядка 2/w является нормальной. Дополнение. ПустьА= В + iC— комплексная нормальная матрица. Следовательно, выполняется равенство А А* = А* А или (В + iC){B' - iC) = BB' + СС + i(CB' - ВС) = = {В' - iCyjB + iC) = B'B + С С + i(B'C - С В). Отсюда заключаем, что ВВ' + СС = В'В + С С, СВ' - ВС = В'С - СВ. Далее находим FF' = В -С1Г В' С С B\\_-C Bf ' B' C'YB -C -c b\c в ГВВ' + СС ВС-СВ'Л [св'-вс вв' + ссу В'В + СС СВ-В'СЛ В'С-СВ В'В + С'С] = FF'. 10.2-27.4 Подобие блочно-треугольной матрице Любая вещественная матрица ортогонально подобна блочно-треугольной матрице с диагональными блоками первого и второго порядков. Дополнение. Почти дословное повторение дополнения к 10.2-13 с заменой ссылки 9.2-23 на 9.3-10. 10.2-28.4 Подобие блочно-диагональной матрице Вещественные нормальные матрицы ортогонально подобны блочно-диагональным матрицам с диагональными блоками первого и второго порядков.
10. Нормальные матрицы 337 Дополнение. Согласно 9.3-10 существует вещественный ортонормированный базис в\, ..., ет, при переходе к которому матрица А приобретает блочно-треуголь- ный вид. Обозначим через Р матрицу преобразования координат из естественного базиса в базис еь...,е,„. Сказанное означает, что матрица В = Р~1АР блочно- треугольная. Но Р есть матрица перехода от одного ортонормированого базиса к другому ортонормированному. Согласно девятому пункту из 10.2-9, матрица Р унитарная. Следовательно, Р~] = Р' и В = Р'АР, т. е. матрица А ортогонально подобна блочно-треугольной матрице. По условию матрица А нормальная. Согласно 10.2-15 матрица В также будет нормальной. Принимая во внимание 10.1-3, заключаем, что матрица В блочно-диагональная. 10.3. Эрмитовы и косоэрмитовы матрицы 10.3.1. Эрмитовы матрицы 10.3-1.3 Эрмитова матрица Комплексная матрица Я называется эрмитовой или самосопряженной, если она совпадает со своей сопряженной матрицей Я*. 10.3-2.4 Эрмитовость и нормальность Эрмитова матрица является нормальной. Дополнение. Так как Я - Я*, то НН* = Н*Н = Я2, т. е. матрица Я согласно определению 10.1-1 является нормальной. 10.3-3.3 Простейший критерий эрмитовости Матрица Я является эрмитовой тогда и только тогда, когда ее элементы hy удовлетворяют равенствам hi} = hyi для всех ij. Дополнение. Если Н= Я*, то hif = hjf для всех ij. Если же для всех ij выполняются равенства hi} = hfl, то это означает, что Н= Н*. Заметим, что диагональные элементы эрмитовой матрицы всегда вещественные. 10.3-4.3 Определитель эрмитовой матрицы Определитель эрмитовой матрицы есть вещественное число. Дополнение. Если Н-Н*, то принимая во внимание 4.1-13, имеем detH = = det Я* =detH.
338 Часть I. Математические сведения по линейной алгебре 10.3-5.3 Произведение эрмитовых матриц Произведение эрмитовых матриц есть эрмитова матрица тогда и только тогда, когда эти матрицы перестановочны. Дополнение. Пусть А = А*, В = В*. Если АВ = ВА, то АВ = ВА = В*А* = (АВ)*. Если же АВ = (АВ)*, то АВ - (АВ)* = В*А* = ВА. 10.3-6.3 Обратная к эрмитовой матрице Матрица, обратная к невырожденной эрмитовой матрице, есть эрмитова матрица. Дополнение. Предположим, что Н=Н* и матрица Я— невырожденная. Беря спряжение от обеих частей равенства- /Г 1#=?, получаем Н*(Н~Х)* = Е или Н(Н~])* = Е. Умножив последнее равенство слева на матрицу /Г1, находим, что (И~Х)* = Н~Х. 10.3-7.3 Сохранение эрмитовости При унитарно подобном преобразовании эрмитова матрица переходит в эрмитову. Дополнение. Пусть А=А*иВ = U*AU для унитарной матрицы U. Имеем B* = U*A*U=U*AU=B. 10.3-8.4 Формулы Кэли Между произвольными эрмитовыми матрицами Н и унитарными матрицами U, не имеющими собственных значений, равных - 1, существует взаимно однозначное соответствие, определяемое формулами U=(E+iH)(E-iHy\ H=i(E-U)(E+UTx. Дополнение. Для матрицы простой структуры перестановочны не только матричные многочлены, но и матричные многочлены с обратными к ним матрицами. В самом деле, пусть матрица А имеет простую структуру. Согласно 8.3-2 имеем представление А = ХАХ~1 для диагональной матрицы Л. Допустим, что матричный многочлен ф(Л) невырожден. Принимая во внимание 9.4-10, получаем, что (<р(А))~1 =Дф(Л))~1Л. Диагональные матричные многочлены всегда перестановочны, поэтому для любого матричного многочлена \у(А) (ц>(А)Т \(А) =Х(у(А)У Х)С хХу(\)Г1 = Дф(Л)Г ll = Хч/(Л)(ф(Л)Г ХГх = Ху(КуС !Дф(Л)Г ХХ-1 Согласно 10.1-11 матрица Н имеет простую структуру. Принимая во внимание 4.4-10,4.4-11, удостоверяемся, что (Е + iH)(E - /Я)" \(Е + /#)(? - iHf])* = = (Е + iH)(E - iH)~ \E + iHy X(E - iH) =
10. Нормальные матрицы 339 то есть матрица (Е + /Я)(? - /Я) — унитарная. Принимая теперь во внимание, что If = U~l и матрица U имеет простую структуру, находим, что (/(?- (/)(?+ WХТ = -/(? + U*)"*(?- If) = U))~lU*(U-E) = /(? + G) то есть матрица i(E - ?/)(? + У)"! — эрмитова. 10.3.2. Критерии эрмитовости 10.3-9.4 Спектральный критерий эрмитовости Среди нормальных матриц эрмитова матрица выделяется тем и только тем, что все ее собственные значения вещественные. Дополнение. Пусть матрица Я эрмитова. Согласно 10.2-17 существуют такие унитарная матрица U и диагональная матрица Л, что Л = U*HU. Беря сопряжение от обеих частей равенства и принимая во внимание, что Н* = Н, заключаем, что А* = U*HU= А. Следовательно, все собственные значения матрицы Я вещественные. Предположим теперь, что у нормальной матрицы Я все собственные значения вещественные. Принимая во внимание 10.2-17, снова справедливо представление Л = If HU, но теперь матрица Л вещественная. Так как Л = Л*, то U*HU=U*H*U,T.e.H=H*. 10.3-10.4 Другие критерии эрмитовости Матрица Я является эрмитовой в том и только том случае, когда выполняется хотя бы одно (следовательно, все) из следующих условий: • для любых комплексных векторов д:, у справедливо равенство (Их, у) = (д:, Ну); • для любого комплексного вектора д: скалярное произведение (Яд:, х) есть вещественное число; • матрица Я унитарно подобна вещественной диагональной матрице. Дополнение. Рассмотрим кратко каждое из условий. • Пусть Н = Н*. Принимая во внимание 5.2-25, для любой пары комплексных векторов х,у имеем (Нх9у)==(х,Н*у) = (х,Ну). Предположим теперь, что равенство (Ях, у) = (х, Ну) выполняется для любой пары векторов. Снова используя 5.2-25, находим, что (х, (Н-Н*)у) = 0. Согласно 5.1-6 отсюда следует, что (Н-Н*)у = 0 для любого вектора>>, т. е. Н-Н* = 0 или Я = Я*. Если Я = Я*, то (Яд:, х) = (х, Я* д:) = (Яд:, х). Следовательно, скалярное произведение (Яд:, х) есть вещественное число для любого вектора х. Предположим теперь, что скалярное произведение (Яд:, х) для любого вектора д: есть вещественное число. Докажем сначала одно вспомогательное утверждение. Именно,
340 Часть I. Математические сведения по линейной алгебре если для любого вектора х имеет место равенство (Вх, х) = О, то В = 0. В самом деле, для любых двух векторов u, v выполняются соотношения (B(u + v), u + v) = (Bu, u) + (Bu, v) + (Bv, u) + (Bv, v) = 0, (B(u + /V), w + /v) = (?w, m) - i(Bu, v) + z(?v, w) + (Bv, v) = 0. По условию (Bu, u) = (Z?v, v) = 0. Поэтому отсюда заключаем, что (Bu, v) = О для любых двух векторов u, v. Согласно 5.1-6 это означает, что Ви = 0 для любого вектора и, т. е. В = 0. Если теперь (Ях, х) есть вещественное число, то (Нх, х) = (х, Н* х) = (//* jc, х) = (Н* х, х). Следовательно, ((# - Н*)х, х) = 0 для любого вектора х. Из сказанного выше вытекает, что Н - Н* = 0 или Н = Я*. Пусть Н= Н*. Как любая нормальная матрица, матрица Я унитарно подобна диагональной матрице согласно 10.2-17, т. е. существуют такие унитарная матрица U и диагональная матрица Л, что Л = U*HU. Но A* = U*H*U=U*HU=A. Поэтому эрмитова матрица всегда унитарно подобна вещественной диагональной матрице. Предположим теперь, что некоторая матрица Я унитарно подобна вещественной диагональной матрице, т. е. для матриц U, А справедливо равенство Л = U*HU. Отсюда заключаем, что Л* = Л = ifH^V^ U*HU, т. е. 10.3.3. Вещественные симметричные матрицы 10.3-11.3 Симметричная матрица Вещественная эрмитова матрица является симметричной. Дополнение. Очевидно, принимая во внимание определения 4.4-36, 10.3-1. 10.3-12.3 Комментарий (симметричность и эрмитовость) Снова есть очень много общего между этими вещественными матрицами и соответствующими эрмитовыми комплексными матрицами. Конечно, здесь также могут появиться некоторые отличия в формулировках утверждений, если необходимо использовать лишь вещественные величины и преобразования. 10.3-13.3 Элементы симметричной матрицы Элементы симметричной матрицы Л с элементами al} удовлетворяют соотношениям ay = ар для всех / ф}. Дополнение. Симметричная матрица А удовлетворяет условию А = А'. Поэтому ее элементы а,у связаны соотношениями atj = dp для всех ij.
10. Нормальные матрицы 341 10.3-14.4 Подобие диагональной матрице Вещественная симметричная матрица ортогонально подобна вещественной диагональной матрице. Дополнение. Вещественная симметричная матрица А является эрмитовой. Согласно 10.3-9 она имеет только вещественные собственные значения. Как нормальная вещественная матрица, матрица А ортогонально подобна блочно-диаго- нальной матрице согласно 10.2-28. Но блоков второго порядка быть не может, т. к. нет комплексно-сопряженных собственных значений. 10.3.4. Косоэрмитовы матрицы 10.3-15.3 Косоэрмитова матрица Комплексная матрица S называется косоэрмитовой или кососстосопряженной, если она совпадает с матрицей - S*. 10.3-1 б.4 Косоэрмитовость и нормальность Косоэрмитова матрица является нормальной. Дополнение. Если S = - S*, то SS* = S^S = - S2. 10.3-17.4 Спектральный критерий косоэрмитовости Среди нормальных матриц косоэрмитова матрица выделяется тем и только тем, что все ее собственные значения чисто мнимые. Дополнение. Если S = -S*, то H^iS есть эрмитова матрица, т.к. H*=-iS* = = iS = H. Согласно 10.3-9 собственные значения матрицы Н вещественные. Следовательно, собственные значения матрицы S чисто мнимые. 10.3-18.3 Эрмитовость и косоэрмитовость Матрица А является косоэрмитовой тогда и только тогда, когда матрица iA эрмитова. Дополнение. Если матрица А косоэрмитова, то А = - А*. Но тогда то есть матрица iA эрмитова. Если же матрица iA эрмитова, то выполняется равенство (iA)* = iA. В этом случае А = - i(iA) = - i(iA)* = - /(- iA*) = -A* и матрица А является косоэрмитовой.
342 Часть I. Математические сведения по линейной алгебре 10.3.5. Вещественные кососимметричные матрицы 10.3-19.3 Кососимметричная матрица Вещественная косоэрмитова матрица является кососимметричной. Дополнение. Очевидно, принимая во внимание определения 4.4-36, 10.3-15. 10.3-20.3 Элементы кососимметричной матрицы Элементы кососимметричной матрицы А с элементами atj удовлетворяют соотношениям dij^-ciji для всех ij. В частности, все диагональные элементы кососимметричной матрицы равны нулю. Дополнение. Кососимметричная матрица А удовлетворяет условию А=-А'. Поэтому ее элементы щ связаны соотношениями а^ = - о,, для всех i,j. В частности, Я//= - 0ц = 0 для всех /. 10.3-21.4 Подобие блочно-диагональной матрице Вещественная кососимметричная матрица ортогонально подобна вещественной блочно-диагональной матрице с блоками первого и второго порядков. Все блоки первого порядка — нулевые, все блоки второго порядка — кососимметричные. Дополнение. Вещественная кососимметричная матрица А является нормальной. Согласно 10.2-28 она ортогонально подобна вещественной блочно-диагональной матрице В = WAU, где U— ортогональная матрица, с блоками второго и первого порядков. Матрица В — кососимметричная, т. к. В' = WA'U= U(r A)U = - В. Все диагональные блоки второго порядка матрицы В являются кососимметрич- ными, все диагональные элементы матрицы В, в том числе ее диагональные блоки первого порядка, согласно 10.3-20 будут нулевыми. 10.3-22.4 Определитель кососимметричной матрицы Определитель невырожденной вещественной кососимметричной матрицы есть положительное число. Дополнение. Согласно 10.3-17 кососимметричная матрица S имеет только чисто мнимые собственные значения. Но т. к. матрица S вещественная, то наряду с ненулевым собственным значением вида ib9 где b — вещественное число, она имеет ненулевое собственное значение - ib. Поэтому у кососимметричной матрицы обязательно общее число ненулевых собственных значений является четным. Согласно 10.1-11 кососимметричная матрица имеет столько собственных значений, каков ее порядок. В силу 8.2-30 определитель кососимметричной матрицы равен произведению всех ее собственных значений. Произведение ненулевых комплекс-
10. Нормальные матрицы 343 но-сопряженных собственных значений есть положительное число. Но в соответствии с 4.4-41 невырожденная кососимметричная матрица может иметь только четный порядок. К тому же, согласно 8.2-10 невырожденная матрица не может иметь нулевые собственные значения. Подводя итог сказанному, заключаем, что detS>0. 10.3-23.3 Скалярное произведение вида (Нх, х) Вещественные кососимметричные матрицы Я, и только они, обладают тем свойством, что для любого вещественного вектора х скалярное произведение (Нх, х) равно нулю. Дополнение. Если Н = -Н, то согласно 5.2-25 (Нх,х) = (х,-Нх) = -(Нх,х). Поэтому (Нх, х) - 0. Пусть теперь для некоторой вещественной матрицы Я и любого вещественного вектора х выполняется равенство (Нх, х) = 0. Обозначим через htj элементы матрицы Я. Возьмем в качестве вектора х единичный вектор eh Тогда (Heh е,) = А„ = 0. Возьмем теперь х = е, + е7. Имеем (Я(е, + ej), е, + ej) = (Heh е,) + (Heh ej) + (Не}, е,) + (Нер ej) = Следовательно, Ау = - А,7 для всех i,j, т. е. Я = - Н\ 10.3.6. Эрмитово разложение матрицы 10.3-24.3 Эрмитово разложение матрицы Произвольную квадратную матрицу Л всегда можно представить в виде суммы, называемой эрмитовым разложением: A = H^iH2, где матрицы Яь Я2 эрмитовы. Эти матрицы называются эрмитовыми компонентами матрицы А. Они определяются однозначно, причем я^^ + АЯг^-А 2 2/ Дополнение. Обозначим ai} (h)j, ti*) элементы матрицы А (Яь Я2). Если разложение А = Hi + /Я2 существует, то должны выполняться равенства для всех р, q. Эта система уравнений относительно hxpq и пг1Щ всегда разрешима и имеет единственное решение
344 Часть I. Математические сведения по линейной алгебре или, что то же самое, 2 2/ 10.3-25.4 Эрмитово разложение и собственные значения Если матрица А нормальная, то собственные значения матрицы Я] (Я2) из разложения 10.3-24 являются вещественными (мнимыми) частями собственных значений матрицы Л. Дополнение. Пусть матрица А нормальная. Согласно итоговому заключению в дополнении к 10.1-7 существуют такие невырожденная матрицами диагональная матрица Л, что А=Х~1АХ, А*=ХГХА*Х. Поэтому из эрмитова разложения 10.3-24 матрицы А получаем, что Х~{Н,Х = -(Х~1АХ + Х~]А*Х) = -(А + Л*), Х~1Н2Х = — (Х~1АХ - Х~ХА*Х) = —(Л - Л*). 2/ 2/ Матрица —(Л + Л*) подобна матрице Н\. Она диагональная и ее диагональные элементы представляют вещественные части собственных значений матрицы А. Матрица — (Л - Л*) подобна матрице Я2. Она также диагональная, но ее диагональные элементы представляют мнимые части собственных значений матрицы А. 10.3-26.4 Перестановочность компонент разложения Матрица А является нормальной тогда и только тогда, когда ее эрмитовы компоненты перестановочны. Дополнение. Пусть матрица А нормальная, т.е. АА*=А*А. Отсюда следует, принимая во внимание разложение 10.3-24, что Н1Н2 - Н2НХ =—(А + А*)(А - А*) - —(А - А*)(А + А*) = 4/ 4/ = —{А2 - АА* + А* А - (А*J -А2 - АА* + X А + (Л*J) = 4/ = —ХА'А-АА') = 0, то есть матрицы Н\ и Я2 перестановочны. Пусть теперь матрицы Н\ и Я2 перестановочны, т. е. Я1Я2 - Н2Н\ = 0. Из выписанных выше соотношений сразу вытекает, что в этом случае А*А-АА* = 0,т. е. матрица А нормальная.
10. Нормальные матрицы 345 10.3-27.3 Вещественный случай разложения Вещественную квадратную матрицу А всегда можно представить в виде суммы А = В + С, где матрица В — вещественная симметричная, С — вещественная кососимметричная. Это разложение единственно, причем В=-(А+А')9 С=-(А-А'). Компонента В называется симметричной составляющей матрицы А, компонента С — кососимметричной составляющей. Дополнение. Очевидно, принимая во внимание 10.3-24. 10.3-28.3 Скалярное произведение вида (Ах, х) Для любой матрицы А и разложения 10.3-24 справедливо равенство Дополнение. Принимая во внимание 10.3-24, находим (Ах, х) = ((Я, + Ш2)х, х) = (ЯЛ х) + №, х). 10.3-29.3 Вещественный случай (Ах, х) Для любой вещественной матрицы А, любого вещественного вектора х и разложения 10.3-27 справедливо равенство Дополнение. Очевидно, принимая во внимание 10.3-27, 10.3-28, 10.3-23.
11. Мультипликативные представления матрицы 11.1. LLZ-разложение матрицы 11.1.1. Элементарные преобразования и треугольные матрицы 11.1-1.3 Сохранение ведущих миноров Все ведущие миноры матрицы не изменяются, если умножить матрицу слева (справа) на любую элементарную неунитарную матрицу Л^(а), где / >j (/ <j). Дополнение. Пусть матрица Л умножается слева (справа) на элементарную неунитарную матрицу Njj(a). Согласно 3.4-18 меняется только /-я строка (/-й столбец), причем к /-й строке (к у'-му столбцу) прибавляется у-я строка (/-и столбец), умноженная (умноженный) на а. Если / >j (i <j\ то первые / -1 (j -1) ведущих миноров не изменяются просто потому, что в них не изменяется ни один элемент. Ведущие миноры порядка /'(/) и выше не изменяются согласно 4.1-20 D.1-12, 4.1-20). 11.1-2.3 Произведение элементарных неунитарных матриц Произведение любой последовательности элементарных неунитарных матриц Л^(сс), для которых / >j (/ <j) есть левая (правая) треугольная матрица с единичными диагональными элементами. Дополнение. Очевидно, если принять во внимание определения 3.4-17,3.5-1 и 3.2-16. 11.1-3.3 Комментарий (о методе Гаусса) Снова обратимся к методу Гаусса преобразования матриц, рассмотренному в пункте 3.6. Будем осуществлять стратегию без выбора ведущего элемента и выполнять
348 Часть I. Математические сведения по линейной алгебре левосторонние умножения на матрицы Л^(ос), где i>j. Если r-Pi ведущий элемент, г>\, отличен от нуля, то подбирая соответствующим образом матрицы Л^(а), мы можем сделать нулевыми все элементы r-го столбца, лежащие ниже диагонали. Первые г столбцов преобразованной матрицы представляют столбцы правой треугольной матрицы. Поэтому ее ведущий минор r-го порядка равен произведению первых г диагональных элементов или, что то же самое, первых г ведущих элементов метода Гаусса. Но согласно утверждению 11.1-1, при этих преобразованиях ведущие миноры матрицы не изменяются. Следовательно, мы можем реализовать г шагов метода Гаусса без выбора ведущего элемента тогда и только тогда, когда отличны от нуля первые г ведущих миноров матрицы. Этого всегда можно добиться перестановкой строк и/или столбцов (см. 4.3-9, 4.3-10). 11.1-4.3 Возможность треугольного разложения Любую квадратную матрицу А порядка т, у которой отличны от нуля ведущие миноры всех порядков от 1 до т- 1, можно представить в виде произведения левой треугольной матрицы L на правую треугольную матрицу U. Дополнение. Пусть у квадратной матрицы А порядка т отличны от нуля ведущие миноры всех порядков от 1 до т - 1. По этому условию отличен от нуля элемент в позиции A, 1). Умножая матрицу слева на выбранные согласно 3.4-19 матрицы Л^ь ...,^mi, сделаем нулевыми элементы а позициях B, 1), C, 1), ...,(w, 1). Согласно 11.1-1 все ведущие миноры при этом не изменятся. Предположим, что выполнено г, г > 1, шагов и сделаны нулевыми поддиагональные элементы в первых г столбцах. Пусть при этом все ведущие миноры не изменились. Матрица ведущего минора порядка г + 1 по предположению является правой треугольной. В силу 4.1-21 произведение первых г+ 1 диагональных элементов не равно нулю. Поэтому не равен нулю элемент в позиции (г + 1, г + 1). Умножая матрицу слева на выбранные согласно 3.4-19 матрицы Nr+2yr+ ь •> Nm,r+ ь сделаем нулевыми элементы в позициях (г + 2, г+1), ..., (/и, г+1). Согласно 11.1-1 все ведущие миноры при этом не изменятся. Таким образом можно выполнить т - 1 шагов, после чего исходная матрица А превращается в правую треугольную матрицу U. У этой матрицы отличны от нуля все диагональные элементы, кроме, может быть, элемента в позиции (/и, т). Элемент в позиции (т9 т) равен нулю тогда и только тогда, когда матрица А вырожденная. Итак, Умножая это равенство слева на матрицы jVw>/M_i(-aww_i), ...,N2j(-a2i) и используя свойство 3.4-20, находим, что А = N2\{- a2i)... Nmf т_2(- aw, m_2) Nnu m _ j(- am, m _ X)U. Согласно 11.1-2 произведение всех матриц M/oiy) здесь есть некоторая левая треугольная матрица L с единичными диагональными элементами. Следовательно, A=LU.
11. Мультипликативные представления матрицы 349 11.1.2. /.(/-разложение общей матрицы 11.1-5.3 /.(Лразложение Разложение 11.1-4 с диагональными элементами матрицы L, равными 1, называется LU-разложением матрицы А. 11.1-б.3 Единственность {.(/-разложения Разложение 11.1-4 единственно, если зафиксировать диагональные элементы матрицы L или матрицы U. Дополнение. Пусть ? (/-разложение 11.1-4 существует и имеет вид ¦/., hx л. кг ha 0 " mm _ "и,, щг . «22 • 0 ' U2m Umn Приравнивая соответствующие элементы матрицы А и произведения LU, получаем, что min(r, j Z au = для всех ij, 1 < ij < m. Отсюда находим luuu = au - 7-1 p=\ = У Легко проверить, что для любого к,\<к<т, матрица ведущего минора порядка к матрицы А равна произведению матриц ведущих миноров того же порядка матриц LwU.Q учетом 4.1-21 заключаем, что '1 2 ... Г 1 2 ... к При сделанных предположениях относительно ведущих миноров матрицы А все диагональные элементы иррAрр) матрицы U{L) определяются однозначно из по-
350 Часть I. Математические сведения по линейной алгебре следнего соотношения, если элементы ирр AРР) положить равными любым фиксированным ненулевым числам. Допустим, что зафиксированы элементы матрицы L После этого из выписанных соотношений однозначно определяется элемент мп, затем 1-й столбец матрицы Z,, 1-я строка матрицы U, элемент ы22, 2-й столбец матрицы L, 2-я строка матрицы (У и т. д., пока не будут определены все элементы матриц L и U. 11.1-7.4 Элементы {.(/-разложения Если A = LU = то (см. 4.2-1) = А\ _ ,/„!/„ =- L'-. L2 - LJ - «2» 12..., 12...i 12 ... k-\ s 12 ... *-l Л \2 ... k 12.../W-1V 12...W-1 12 ... к-\ к 12 ... *-l j 12 ... ^ ' .2 ... J 12 ... kJ 1, ...,w, A= 1,2, ...,/я-1. Дополнение. Пусть разложение^ = L LI существует. Применяя 4.2-13, получим 1 2 ... к-\ s\_ 1 2 ... *-] 1 2 ... к-\ kJ 1 2 ... *-1 ^ Так как матрица ?/ правая треугольная, то в ее первых к столбцах есть только один минор, который, возможно, отличен от нуля, и это — ведущий минор порядка к. Поэтому при s > к имеем I 2 к-\
11. Мультипликативные представления матрицы 351 Положив в этой формуле s = k, находим \ 2Л (\ 2 ... m ^ 2 ... m W 1 1 2 ... .-1 l^lj ll 2 ... w~l При s > к имеем 2 ... к-\ s А\ ll 2 ... *- \ 2 ... A 2 ... ifc-1 ^ Аналогичным образом, рассматривая минор А\ , получаем при [\ 2 ... к-\ s) s>k, что A 2 ... Л-1 it I l 2 ... A: 1 2 ... t Из полученных формул видно, что если зафиксировать диагональные элементы матрицы L или U, то все остальные элементы матриц L и U определяются однозначно. 11.1-8.3 Ведущие миноры и {.(/-разложение Если имеет место разложение 11.1-4, то для всех к справедливо равенство :. Дополнение. Доказательство приведено в дополнении к 11.1-6. 11.1-9.3 Положительные ведущие миноры Если комплексная матрица А имеет положительные ведущие миноры, то ее LU- разложение существует и матрица U имеет положительные диагональные элементы. Дополнение. Если /,,= 1 для всех /, то из 11.1-8 вытекает с учетом утверждения, что щ > 0 для всех /.
352 Часть I. Математические сведения по линейной алгебре 11.1.3. [.(/-разложение профильной матрицы 11.1-10.4 Сохранение нулевых элементов Если для некоторогоу (/) элементы матрицы А удовлетворяют условиям a0 = 0,i= 1,2, ...,p<j(j= 1,2, ...,/•</), то будут равны нулю и элементы матрицы U (L) с соответствующими номерами. Дополнение. В этих условиях будут равны нулю миноры А\ при U 2 ... /-1 j) i= 1,2, ...,/? <j (j= 1,2, ..., г < /), т. к. они будут содержать, соответственно, нулевой столбец (нулевую строку). Поэтому согласно 11.1-7 будут равны нулю элементы матрицы U(L) с соответствующими номерами. 11.1-11.4 LlZ-разложение профильной матрицы Пусть матрица А профильная и для нее существует /.^/-разложение. Тогда матрица U{L) имеет правый (левый) профиль, совпадающий с правым (левым) профилем матрицы А. Дополнение. Очевидное следствие из определений 3.5-13, 3.5-15 и 11.1-10. 11.1.4. Блочное /.(/-разложение 11.1-12.4 Ранг матрицы и порядок блоков Если прямоугольная матрица А представлена в клеточном виде 'В Q] A~\RT где В — квадратная невырожденная матрица порядка г, то ранг матрицы А равен г в том и только в том случае, когда Т= RB~ XQ. Матрица Т- RBT ]Q называется дополнением Шура матрицы В. Дополнение. Вычтем из второй блочной строки матрицы А ее первую блочную строку, умноженную слева на матрицу RB~ \ Полученную матрицу S можно представить как произведение двух блочных матриц. Именно, s-\ E °]\BQ]-\B Q [-RB~] e\[R Т\ [О T-RB'Q Левый сомножитель есть левая треугольная матрица с единичными диагональными элементами. Следовательно, эта матрица невырожденная. Согласно 4.3-16 ранги матриц А и S одинаковы. Допустим, что в матрице Т- RB~ XQ есть хотя бы один ненулевой элемент. Не ограничивая общности, можно считать, что он находится в
11. Мультипликативные представления матрицы 353 позиции (г+ 1,г + 1). В этом случае ведущий минор порядка г+ 1 матрицы S будет отличен от нуля, в чем можно убедиться, вычисляя его согласно 4.2-7. Поэтому, если матрица А имеет ранг г, то должно быть Т - RB~lQ = 0. Если же Т- RB~ 'g = 0, то ранг матрицы S и, следовательно, ранг матрицы А равен г. 11.1-13.4 Блочная матрица второго порядка Если для матрицы В из 11.1-12 имеет место разложение В = LU, то справедливо разложение В Q R т L 01 Гц L'lQ ru~1 e\[o о Дополнение. Проверяется непосредственно, учитывая, что Т= RB~ {Q. 11.1-14.5 Псевдообращение для блочной матрицы Если комплексная матрица Л имеет вид 11.1-12, то - + QQ'T В[В'В + R'Rjl[B\ R']. Дополнение. Напишем согласно 6.6-22, 6.6-23 скелетное разложение матрицы А. Именно, Теперь согласно 6.6-25 находим ¦оп-i i А+ = ВТ в* [BBm+QQm]~ *-н [ВВ* Л"]. 11.1-15. Блочное Lty-разложение Пусть у матрицы А порядка m отличны от нуля ведущие миноры порядков к\ < к2 < ... < ks. = m. Тогда существует разложение А= LU, где L (U) — левая (правая) блочно-треугольная матрица с невырожденными диагональными блоками размеров к\9к2-к\9 ...,ks-ks_i. Это разложение называется блочным Ш-разложением. 12 Зак 740
354 Часть I. Математические сведения по линейной алгебре Дополнение. Пусть существует блочное разложение А= LU, где диагональные блоки матриц A, L, U в соответствии с условием имеют порядки k\9k2-k\,..., ks -ks_\. Обозначим блоки матриц A, Z,, U через А,р Lljy Uy. Имеем 4, Л, Л Ai Аг Аг ¦¦¦ As ¦¦¦ 4. •:• 4, . = А, о ... i21 z22 ... А, А* - 0 0 ¦ 0 0 Un Угг 0 ... с/„ ... и2. ... и, Приравнивая соответствующие блоки матрицы /i и произведения LU, получаем, что для всех /,у, 1 < /,у < 5. Отсюда находим LUU\\ =Alu Lj\U\\ =An, / = 2, L\\U\j = AXp у = 2, Кроме этого, аналогично дополнению к 11.1-6 и 4.2-7, получаем, что для ведущих миноров порядка kh 1 < / < 5, матрицы А справедливо представление Таким образом, если при сделанных предположениях относительно ведущих миноров матрицы А ее блочное L/7-разложение существует, то все диагональные блоки матриц L и U должны быть невырожденными. Но блочное 117-разложение действительно существует. Зафиксируем диагональные блоки матрицы L (или матрицы U) как какие-то невырожденные матрицы соответствующих размеров. После этого из выписанных соотношений однозначно определяется блок UUi затем 1-й блочный столбец матрицы L, 1-я блочная строка матрицы U, блок U229 2-й блочный столбец матрицы L и т. д., пока не будут определены все блоки матриц LvlU.
11. Мультипликативные представления матрицы 355 11.1-1 б.3 Единственность блочного разложения Блочное L^-разложение единственно, если зафиксировать диагональные блоки матрицы L или матрицы U. Дополнение. Это доказано в дополнении к 11.1-15. 11.1-17.4 Комментарий (о треугольных разложениях) Существуют различные методы как получения, так и доказательства существования треугольных разложений матрицы. Описанный в 11.1-4 является явно реализуемым и традиционным. Приведенные в 11.1-6 и 11.1-15 также явные. Тот, что дан в 11.1-6, часто называют компактной схемой метода Гаусса. Все эти методы часто применяются в практических вычислениях. Метод, описанный в 11.1-7, из-за своей трудоемкости редко используется для получения разложений, но он очень полезен в теоретических исследованиях. 11.1.5. [.(/-разложение эрмитовой матрицы 11.1-18.3 Случай эрмитовой матрицы Если матрица А эрмитова и имеет положительные ведущие миноры, то существует разложение А = LL*, где L — левая треугольная матрица. Дополнение. Согласно 11.1-9 для матрицы А заведомо существует LfZ-разло- жение. Будем искать его при условии U= L*. Для этого воспользуемся формулами из дополнения к 11,1-6. Из них следует, что при всех /, 1 < / < т, однозначно определяются произведения диагональных элементов 1цЩ. Но как вытекает из 11.1-8, всегда можно взять ии = I.. > 0, после чего элементы матриц L и U находятся однозначно. Если принять во внимание, что а.} = ajf для всех ij, то из формул дополнения к 11.1-6 заключаем, что utj = ljt для всех j > i. С учетом условия на диагональные элементы это означает, что U= L*. 11.1-19.3 Снова единственность разложения Разложение 11.1-18 единственно, если зафиксировать аргументы диагональных элементов матрицы L. Дополнение. Очевидно, если принять во внимание, что согласно дополнению к 11.1-18 произведения 1ищ определяются однозначно, а условия иИ = 1И позволяют находить /;/ только с точностью до аргументов. 11.1-20.3 Блочный случай эрмитовой матрицы Пусть у эрмитовой матрицы А порядка т отличны от нуля ведущие миноры порядков к\ < к2 < ... < ks = т. Тогда существует разложение А = LDL*, где L (D) — левая блоч-
356 Часть I. Математические сведения по линейной алгебре но-треугольная (блочно-диагональная) матрица с невырожденными диагональными блоками размеров к\, к2-кь ..., Ау-Ад._|. Дополнение. Пусть для эрмитовой матрицы А существует блочное разложение А = LDL*. где диагональные блоки матриц A, L, D в соответствии с условием имеют порядки Аь к2- к\, ..., ks - Л?_ ь Обозначим блоки матриц A, I, D через А,р Lip Dit. Имеем А, А, А, о ... Ln ... А: ••• 0" 0 А,. 4, Л "А, 0 0 t 4, 0 А: 0 : t - л,. ... о " ... 0 ... ц,_ _ Га*, 0 [о 4, - 4, 4 ... 4 о ... с. Приравнивая соответствующие блоки матрицы Л и произведения LDL*, получаем, что ПТ!П(/, /) л - z w; для всех /,у, 1 < i 9j <s. Отсюда находим Г Г) /* _ J А,А,4, =4у. У = 2,...,*, 1 />=) = 2,...,5, -У Кроме этого, в полной аналогии с 11.1-15, получаем, что для ведущих миноров порядкаkh \ <i<s, матрицы А должно выполняться представление 2 ...к, Таким образом, если при сделанных предположениях относительно ведущих миноров матрицы А ее блочное 1?>1*-разложение существует, то все диагональные
11. Мультипликативные представления матрицы 357 блоки матриц L и D должны быть невырожденными. Но блочное LDL*- разложение действительно существует. Зафиксируем диагональные блоки матрицы L как какие-то невырожденные матрицы соответствующих размеров. После этого из выписанных соотношений однозначно определяется блок Du =Z|"I1i4ll(Zi[1). Так как А— эрмитова матрица, то Ап = А*П. Следовательно, также Dn -D*n, Затем определяем 1-й блочный столбец матрицы L из второй строчки соотношений. В силу эрмитовости матрицы А и блока Du третья строчка соотношений удовлетворяется автоматически. Из четвертой строчки соотношений при / = 2 находим блок D22- Он также будет эрмитов. Из пятой строчки соотношений приу = 2 определяем второй блочный столбец матрицы L. В силу эрмитовости матрицы А и блоков D]U D22 шестая строчка соотношений при / = 2 удовлетворяется автоматически. Продолжаем этот процесс, пока не будут определены все блоки матриц L и Z). 11.1-21.3 Сохранение эрмитовости Все диагональные блоки матрицы D разложения 11.1-20 являются эрмитовыми матрицами. Дополнение. Доказано в дополнении к 11.1-20. 11.1-22.3 Сохранение знаков ведущих миноров Все ведущие миноры порядков ku k2,..., ks матриц А и D разложения 11.1-20 имеют одинаковые знаки. Дополнение. Это является прямым следствием соотношения полученного в дополнении к 11.1-20. 11.1-23.3 Единственность разложения Разложение 11.1-20 единственно, если зафиксировать диагональные блоки матрицы!. Дополнение. Доказано в дополнении к 11.1-20. 11.1.6. Перестановки 11.1-24.3 Комментарий (еще раз о треугольных разложениях) Обратим внимание на два обстоятельства, общие для описанных в 11.1-15, 11.1-20 методов получения разложений. Во-первых, для выполнения первых / шагов блочного процесса необходимо знать только первые / блочные столбцы и строки исходной
358 Часть I. Математические сведения по линейной алгебре матрицы. Размеры блоков оставшейся части матрицы не играют существенную роль. Их можно формировать непосредственно перед выполнением очередного шага. При этом уже найденные столбцы и строки треугольных матриц, так же как и диагональные блоки матрицы D в 11.1-20, пересчитывать не нужно. Однако, возможно, придется найденные столбцы и строки представить в ином блочном виде, если будет изменен размер очередного диагонального блока. Во-вторых, осуществление процесса может зайти в тупик только в том случае, когда в правой части первой или четвертой строки соотношений появляется вырожденная матрица. Для выхода из тупикового состояния можно попытаться преобразовать "неиспользованную" часть матрицы с целью получить невырожденную матрицу в указанных соотношениях. Найденные столбцы и строки пересчитывать заново не надо, но нужно с ними сделать такие же преобразования, как с "неиспользованной" частью матрицы. 11.1-25.3 Перестановки и ведущие миноры Если А — невырожденная эрмитова матрица, то существует такая матрица перестановок Н, что у эрмитовой матрицы НАН каждый нулевой ведущий минор имеет ненулевые соседние ведущие миноры. Дополнение. Принимая во внимание комментарий 11.1-24, будем приводить эрмитову невырожденную матрицу А к наиболее простому блочному разложению. Допустимыми преобразованиями матриц будут перестановки строк и столбцов с одинаковыми номерами. Возможны три ситуации: элемент au Ф 0; элемент au = 0, но пц Ф 0 для какого-то /; все элементы на главной диагонали равны нулю. В первой ситуации берем порядок первого диагонального блока матриц L и D равным 1 и находим согласно 11.1-20 первый блочный столбец матрицы L и блок Dn. Во второй ситуации путем перестановки строк и столбцов с номерами 1 и / переставляем элемент an в позицию A, 1). После этого снова берем порядок диагонального блока матриц L и D равным 1 и находим согласно 11.1-20 первым блочный столбец матрицы L и блок Dn. В третьей ситуации любые одноименные перестановки строк и столбцов оставляют главную диагональ нулевой. Однако в силу невырожденности матрицы в ней имеется ненулевой внедиагональный элемент ay. Если он не находится в позиции B, 1) или A,2), то путем перестановки строк и столбцов с номерами 1 и у, а также строк и столбцов с номерами 2 и / переставляем его в позицию B, 1). Теперь блок второго порядка в верхнем левом углу преобразованной матрицы будет невырожденным. Берем порядок первого диагонального блока матриц L и D равным 2 и находим согласно 11.1-20 первый блочный столбец матрицы L и блок ?>п- С "неиспользованной" частью матрицы поступаем точно так же. Отличие заключается лишь в том, что если в этой части матрицы делаются какие-то одноименные перестановки строк и столбцов, то такие же перестановки должны делаться в строках полученных столбцов матрицы L. Окончательно получаем разложение Здесь Я— матрица перестановок, эквивалентная выполненным перестановкам строк. Диагональные блоки матриц L и D невырожденные и имеют порядок 1
11. Мультипликативные представления матрицы 359 или 2. Причем сначала идут блоки первого порядка, а затем второго. Согласно формуле, представленной в дополнении к 11.1-22, никакие два соседних ведущих минора матрицы НАН не могут быть одновременно равны нулю или, другими словами, каждый нулевой ведущий минор имеет ненулевые соседние ведущие миноры. 11.1-26.3 Перестановки и блочное L(/-разложение Если для матрицы НАН из 11.1-25 выполнить разложение 11.1-20, то диагональные блоки матрицы D будут первого и второго порядков. Дополнение. Доказано в дополнении к 11.1-25. 11.1-27.3 Перестановки в невырожденной матрице Если А — невырожденная матрица, то существует такая матрица перестановок Р (#), что у матрицы РА (АН) будут отличны от нуля все ведущие миноры. Дополнение. Рассмотрим, например, случай, когда делается перестановка строк. Второй случай рассматривается аналогично. Пусть матрица А имеет порядок т. Ведущий минор порядка т отличен от нуля в силу невырожденности матрицы. Согласно 4.1-25 столбцы матрицы А линейно независимы, в том числе, линейно независимы ее первые т - 1 столбцов. В силу 4.3-7 в этих столбцах имеется ненулевой минор порядка т - 1. Перестановкой строк его можно переместить в первые т~\ строк. При этом согласно 4.1-18 минор порядка т останется ненулевым. Следовательно, существует матрица перестановок Рт такая, что в матрице Ат = РтА будут отличны от нуля ведущие миноры порядков т и т - 1. Допустим, что для некоторого k,2<k<m, существуют матрицы перестановок Рку ..., Рт такие, что в матрице отличны от нуля ведущие миноры всех порядков от к - 1 до т. Если к = 2, то утверждение доказано, т. к. согласно 3.4-4 произведение Р матриц Рк, ...9Рт есть матрица перестановок. Если же к > 2, то делая аналогичные перестановки, но уже только первых к - 1 строк, можно добиться того, что ведущий минор порядка к - 2 будет ненулевым. При этом все ведущие миноры порядков от к- 1 до т также останутся ненулевыми. Дойдя до к = 2, справедливость утверждения будет установлена. 11.1-28.3 Перестановки в произвольной матрице Если А — прямоугольная матрица ранга г, то существуют такие матрицы перестановок Р, Я, что у матрицы РАН будут отличны от нуля ведущие миноры всех порядков от 1 до г. Дополнение. По определению 4.3-1 в матрице А имеется ненулевой минор порядка г. Перестановкой строк и столбцов его можно переместить в верхний левый
360 Часть I. Математические сведения по линейной алгебре угол матрицы. Далее согласно 11.1-27 перестановкой первых г строк или столбцов можно сделать ненулевыми все первые г ведущих миноров. 11.1.7. Эквивалентные знаковые утверждения 11.1-29.4 Комментарий (об использовании разложений) Полученные разложения можно использовать для доказательства самых различных фактов. Продемонстрируем это на примере критериев положительности спектра эрмитовых матриц. 11.1-30.4 Положительность собственных значений Рассмотрим эрмитову матрицу А порядка m с собственными значениями Хи ...Дт. Предположим, что скалярное произведение введено согласно 5.1-8 в естественном базисе. Следующие свойства матрицы А являются эквивалентными: • все собственные значения матрицы А положительные; • все ведущие миноры матрицы А положительные; • скалярное произведение (Ах, х) положительно для любого ненулевого вектора jc. Дополнение. Согласно третьему пункту 10.3-10 эрмитову матрицу А можно представить в виде А = UAU*, где U— унитарная матрица, Л — диагональная матрица собственных значений. Пусть все собственные значения Х\, ...Дт матрицы А положительны. Принимая во внимание 4.2-13, 4.1-13, имеем Л 2 ... г А . . . .- . I Z ... rj i<*,< <kr<m \K\ K2 * *' Kr) V1 Z "•' 1 2... г ^.fA, *,...*, к,кг...кг) \\ 2 .../¦ так как согласно 10.2-19 хотя бы один минор матрицы U в первых г строках отличен от нуля. Предположим теперь, что все ведущие миноры эрмитовой матрицы А положительны. Согласно 11.1-18 имеет место разложение A = LL*, где L— левая треугольная матрица с ненулевыми диагональными элементами. Теперь имеем (Ах, х) = (LL*x, x) = (L*x, L*x) = (y,y)>0 для любого ненулевого вектора х, т. к. в силу невырожденности матрицы L из х Ф О следует у = L*x Ф 0. Наконец, пусть (Ах, х)>0 для любого х Ф 0. Матрица А эрмитова по условию. Поэтому она нормальная и согласно 10.1-7 имеет полный набор ортонормированных
11. Мультипликативные представления матрицы 361 собственных векторов хь ...,xm, соответствующих собственным значениям Х]9 ..., Хт. Возьмем в качествех собственный векторxh Тогда (Axh xt) = (Xpch x,) = X,{xh x,) = X, > 0. Эквивалентность указанных в утверждении свойств эрмитовой матрицы доказана. 11.1-31.4 Неотрицательность собственных значений Рассмотрим эрмитову матрицу А порядка т с собственными значениями Хъ ..., Хт. Предположим, что скалярное произведение введено согласно 5.1-8 в естественном базисе. Следующие свойства матрицы А являются эквивалентными: • все собственные значения матрицы А неотрицательные; • все главные миноры матрицы А неотрицательные; • скалярное произведение {Ах, х) неотрицательно для любого ненулевого вектора х. Дополнение. Согласно третьему пункту 10.3-10 эрмитову матрицу ,4 можно представить в виде А ~ Uhlfy где U— унитарная матрица, Л — диагональная матрица собственных значений. Пусть все собственные значения Хъ ...,Хт матрицы А неотрицательные. Принимая во внимание 4.2-13, 4.1-13, Имеем 'г •••К ? i<*i<...<*,sm У ХкХк ...XkU\h <. .<kr ?m K z и ksk2 Предположим теперь, что эрмитова матрица А имеет неотрицательные главные миноры. Согласно 8.2-18, 8.2-19 характеристический многочлен матрицы А будет иметь вещественные коэффициенты с чередующимися знаками. Согласно 10.3-9 все его корни вещественные. Но из-за чередования знаков коэффициентов корни не могут быть отрицательными. Поэтому свойства 1 и 2 утверждения эквивалентны. Докажем теперь эквивалентность свойств 1 и 3. Обозначим через хь ...,хт орто- нормированную систему собственных векторов матрицы А, соответствующих собственным значениям. Рассмотрим разложение вектора д: по системе векторов дсь ..., хт. Имеем (Ах, х) = (Л(а,*1 + ... + ал), сад + ... + anixm) = > 0.
362 Часть I. Математические сведения по линейной алгебре Предположим далее, что для эрмитовой матрицы А и любого ненулевого вектора* выполняется неравенство (Ах, х) > 0. Беря в качестве х собственный вектор xh получим (Axh х,) = (kixh x,) = Xfaj, x,) = li > 0. Эквивалентность свойств 1,3 и, следовательно, всех свойств из утверждения доказана. 11.1-32.4 Комментарий (о главных минорах) Заметим, что переход от свойств "положительности" в 11.1-30 к близким, вроде бы, свойствам "неотрицательности" в 11.1-31 потребовал не близкого перехода от рассмотрения только ведущих миноров к рассмотрению всех главных миноров. На самом деле, эрмитовы матрицы с положительными и неотрицательными ведущими минорами обладают разными свойствами. Если эрмитова матрица А имеет положительные ведущие миноры, то для нее согласно 11.1-18 справедливо представление А = LL*, где L — невырожденная левая треугольная матрица. Применяя формулу Би- не-Коши 4.2-13 к этому представлению, легко показать, что все главные миноры матрицы А будут положительными. Если же эрмитова матрица А имеет неотрицательные ведущие миноры, то некоторые из главных миноров могут оказаться отрицательными. Например, в матрице А = с ненулевыми вещественными числами а, C все ведущие миноры равны 0. Однако главный минор, стоящий на пересечении строк и столбцов с номерами 2, 3, равен -р2<0. 11.2. QR-разложение матрицы 11.2.1. Матрицы вращения 11.2-1.3 Матрица вращения Вещественные или комплексные матрицы, отличающиеся от единичной матрицы четырьмя элементами, расположенными на пересечении строк и столбцов с номерами i,j, i Ф]у и имеющими вид П : : 0" с ... -J 0 0 а 0 0 C а Р 0 S ... С 0 где \с\ + |s| = 1, называются матрицами вращения (простого поворота, Гивенса).
11. Мультипликативные представления матрицы 363 11.2-2.3 Унитарность матрицы вращения Комплексная матрица вращения является унитарной. Дополнение. Очевидно, принимая во внимание определения 10.2-1, 11.2-1. 11.2-3.3 Вещественный случай Вещественная матрица вращения является ортогональной. Дополнение. Очевидно, принимая во внимание определения 10.2-1, 10.2-23, 11.2-1. 11.2-4.3 Умножение на матрицу вращения При умножении вектора на матрицу вращения Тц меняются только /-я и/-я координаты вектора. 11.2-5.3 Комментарий (о матрицах второго порядка) Прежде чем приступать к общим исследованиям, изучим подробнее преобразование второго порядка. 11.2-6.3 Преобразование вращения второго порядка Каков бы ни был вектор Ь с координатами х, у, существует унитарная матрица Т вида 11.2-1 второго порядка, для которой вторая координата вектора ТЬ равна нулю. Например, [1, а = 0, Г 0, а = 0, \xla, a*0, \-yla, а*0, Дополнение. Проверяется непосредственно, вычисляя вектор ТЬ. 11.2-7.3 Основная координата В условиях 11.2-6 первая координата вектора ТЬ равна Дополнение. Проверяется непосредственно, вычисляя вектор ТЬ. 11.2-8.3 Комментарий (поворот плоскости) Из условия \с\2 + \s\2 = 1 следует, что в вещественном случае величины с и s можно рассматривать как cos а и sin а для некоторого угла а. В этом случае матрицу Т можно трактовать как матрицу преобразования, заключающегося в повороте плоскости вокруг начала координат на угол а. Название матрицы объясняется именно этим фак-
364 Часть I. Математические сведения по линейной алгебре том. Как вытекает из 11.2-6, всегда можно подобрать такой поворот, при котором любой заданный вектор перейдет в вектор, коллинеарный координатному. 11.2.2. Матрицы отражения 11.2-9.3 Комментарий (об л-мерном пространстве) Теперь рассмотрим «-мерное арифметическое комплексное или вещественное линейное пространство. Пусть для определенности оно состоит из вектор-столбцов. Введем в нем согласно 5.1-8 скалярное произведение через координаты в естественном базисе. В соответствии с 5.1-12 для любых векторов х,у справедливо равенство (х,у)=у*х. 11.2-10.3 Матрица отражения Пусть w— произвольный комплексный или вещественный вектор единичной длины, т. е. (w, w)~ 1. Матрица JJ-E-2ww* называется матрицей отражения (матрицей Хаусхолдера). 11.2-11.3 Комментарий (геометрическая интерпретация) Название этой матрицы объясняется следующим обстоятельством. Если в трехмерном вещественном пространстве рассмотреть зеркальную плоскость с нормальным вектором w, проходящую через начало координат, то преобразование зеркального отражения от такой плоскости задается именно матрицей отражения. Аналогичное свойство сохраняется и в л-мерном пространстве. 11.2-12.3 Эрмитовость и унитарность матрицы отражения Комплексная матрица отражения является эрмитовой и унитарной. Дополнение. В самом деле, принимая во внимание 5.1-12, имеем U* = (E- 2ww*Y = Е*- 2(w*)*w* = E- 2 W = t/, UlT = (E- 2ww*)(E - 2ww*) = E - 2ww* - 2ww* + 4w(w*w)w* = -Е-4ww* + 4(w, w)ww* = E. 11.2-13.3 Вещественный случай Вещественная матрица отражения является симметричной и ортогональной. Дополнение. Очевидно, принимая во внимание 11.2-12, 10.2-23, 10.3-11. 11.2-14.3 Собственные значения матрицы отражения Одно собственное значение матрицы отражения равно - 1, остальные равны + 1.
11. Мультипликативные представления матрицы 365 Дополнение. Для матрицы отражения U = E-2ww* порядка п и любого вектора^, ортогонального вектору w, имеем Uy = (Е - 2ww*)y =y- 2w(w*y) = у - 2(у, w) = у, Uw = (Е - 2ww*)w -w- 2w(w*w) = w - 2(w, w)w = - w. Поэтому матрица отражения ?/ имеет собственный вектор w, соответствующий собственному значению - 1. Кроме этого, матрица U имеет (п - 1)-кратное собственное значение + 1. Ему соответствуют собственные векторы, представляющие любые п~\ линейно независимых векторов, ортогональных вектору w. 11.2-15.3 Формула преобразования отражения Для любых матриц отражения U и вектор-столбцов z выполняются соотношения Uz = (E-2ww*)z = z-2(z, w)w. Дополнение. Действительно, Uz = (E-2ww*)z = z-2w(w*z) = z-2(z, w)w. 11.2-16.3 Специальный случай преобразования Вектор z, коллинеарный вектору w, переводится матрицей отражения в вектор — z. Дополнение. Проверяем, принимая во внимание, что z = aw для некоторого числа а: Uz = U(aw) = aUw - a(w - 2(w, w)w) = - aw = - z. 11.2-17.3 Еще один случай преобразования Вектор z, ортогональный вектору w, оставляется матрицей отражения без изменения. Дополнение. Проверяем, принимая во внимание, что (z, w) = 0: Uz = z- 2(z, w)w = z. 11.2-18.3 Единственность матрицы отражения Пусть заданы любые ненулевые векторы q, s. Может существовать только единственный, с точностью до множителя е, по модулю равного 1, вектор w единичной длины такой, что определяемая им матрица отражения переводит вектор q в вектор as1 для некоторого числа а. Дополнение. Предположим, что существуют два вектора wb w2 единичной длины и такие, что (Е-2wj w*)q = q- 2(q, w^w, - as, (E-2w2 w*2)q = q-2(q, w2)w2 = ay. Вычитая одно равенство из другого, получаем другое равенство
366 Часть I. Математические сведения по линейной алгебре Это означает, что векторы wx и w2 коллинеарны. Так как они имеют единичную длину, то отличаться могут друг от друга только множителем, по модулю равным 1. 11.2-19.3 Явные формулы В качестве вектора w из 11.2-18 можно взять вектор, определяемый соотношениями |а| = \q\/\sl arg a(s, q) = я, р2 = 2(<gr, q - as), w=-(q-as). Р Дополнение. Заметим, что условие arg a(s, q) = n означает, что ct(s, q) есть вещественное неположительное число. Принимая во внимание условие |а| = \q\f\s\, находим (q -as,q- as) = (q, q) - a(q, s) - a(s, q) + |a|2 (s9 s) = = 2(q, q) - 2a(<7, s) = 2(q, q - as) = p2. Поэтому вектор w имеет единичную длину. Кроме этого, 2 (Е - 2ww*)q -q - 2(q, w)w = q —-(<?, q - as)(q- as) = as. P 11.2-20.3 Комментарий (другие явные формулы) Существуют также другие векторы и>, решающие задачу из 11.2-18. Вектор w, описанный в 11.2-19, обладает среди них наибольшим значением величины р и, следовательно, обеспечивает наибольшую точность вычислений. 11.2-21.3 Сохранение первых координат Пусть в векторе w первые г координат нулевые. Тогда при умножении матрицы слева (справа) на матрицу отражения, порожденную данным вектором w, не изменяются первые г строк (столбцов). Дополнение. Пусть в векторе w первые г координат нулевые. В этом случае согласно 11.2-15 для любого вектора z не изменяются первые г координат при его умножении на матрицу отражения U. Предположим, что матрица А умножается слева на матрицу U. Утверждение очевидно, если под векторами z понимать столбцы матрицы А. Утверждение становится очевидным и при умножении матрицы А справа на матрицу U в силу равенств AU = (U'A'Y = ((? - 2ww)'A')' = ((? - 2ww)A')'. В векторе w первые г координат нулевые. Поэтому в матрице А' не изменяются первые г строк при умножении слева на матрицу Е - 2ww . Соответственно в
11. Мультипликативные представления матрицы 367 матрице А не изменяются первые г столбцов при умножении справа на матрицу E-2ww\ 11.2-22.3 Нулевые первые координаты Предположим, что первые г координат векторов q и s нулевые. Тогда в векторе w, построенном в соответствии с 11.2-19, первые г координат будут также нулевыми. 11.2.3. QR-разложение общей матрицы 11.2-23.3 Комментарий (об исключении элементов) Теперь, умножая исходную матрицу слева и/или справа на матрицы вращения или отражения, мы можем строить самые различные методы исключения, постоянно увеличивая в матрице число нулевых элементов. Для матриц вращения нулевые элементы появляются в соответствии с утверждением 11.2-6. Для матриц отражения — в соответствии с утверждением 11.2-19, если в качестве векторов q,s брать векторы с необходимыми нулевыми координатами. Рассмотрим более подробно процессы с левосторонними умножениями на матрицы вращения. 11.2-24.3 Циклические последовательности вращений Пусть Л — прямоугольная матрица размера пхт и предположим для определенности, что т < п. Составим таблицу из индексов поддиагональных элементов B, C, D, 1) 1) 1) C, D, 2) 2) D,3) (го+1,1) (го+1,2) (т+1,3) ... (го+1,го) . (й-1,1) (л-1,2) (и-1,3) ... (я-1,т) (*,1) (л, 2) (л,3) ... (я, го). Рассмотрим две последовательности матриц вращения. Для первой совокупность пар индексов упорядочивается по строкам таблицы, для второй— по столбцам, причем сами строки и столбцы упорядочиваются сверху вниз и слева направо. Обе последовательности называются циклическими. 11.2-25.3 Обнуление поддиагональных элементов Предположим, что при умножении слева на матрицу вращения Ту исключается элемент в позиции (/,/) и пары индексов перебираются в циклическом порядке. После прохождения любой из циклических последовательностей все поддиагональные элементы станут нулевыми.
368 Часть /. Математические сведения по линейной алгебре Дополнение. Если исключение проводить в любом из циклических порядков, то легко видеть, что при очередном умножении слева на матрицу вращения Ti} не изменяются все ранее полученные нулевые элементы. После окончания процесса будет получено равенство R = Tnm ... 7*2, i^> где R есть правая треугольная матрица. Согласно 11.2-2 матрицы вращения являются унитарными, т. е. T*TtJ = Е для всех ij. Поэтому будет справедливо также равенство Обозначив Q = 7*2*, ... Т*m, имеем представление А = QR. Согласно 10.2-6 матрица Q— унитарная. Естественно, что в случае вещественной матрицы А матрицы вращения, вычисляемые в соответствии с 11.2-6, будут вещественными. Вещественными будут и матрицы Q, R. В соответствии с 10.2-23 вещественная унитарная матрица Q будет ортогональной. 11.2-26.3 Возможность разложения матрицы Любую комплексную (вещественную) квадратную или прямоугольную матрицу А можно представить в виде произведения А = QR, где Q — унитарная (ортогональная) матрица, R — комплексная (вещественная) правая треугольная. Дополнение. Это доказано в дополнении к 11.2-25. 11.2-27.3 Q/7-разложение Разложение 11.2-26 называется QR-разложепием матрицы А. 11.2-28.3 Равенство для компоненты R Для комплексной (вещественной) матрицы R из g/^-разложения матрицы А имеет место равенство А*А = R*R (A'A = R'R). Дополнение. Пусть для комплексной (вещественной) матрицы А известно ^-разложение А = QR. Так как матрица Q унитарная (ортогональная), то согласно определению 10.2-1 выполняется равенство Q*Q = E (Q'Q = Е). Следовательно, A*A = R*R(AfA = R'R). 11.2-29.3 Единственность QR-разложения ?Я-разложение невырожденной матрицы единственно, если зафиксировать аргументы диагональных элементов матрицы R как аргументы комплексных чисел. Дополнение. Пусть матрица А невырожденная. Согласно 11.2-26 существует ее 2#-разложение А = QR. Из равенства A*A =R*R вытекает, что матрица R также невырожденная. В соответствии с 4.1-21, 4.4-1 это означает, что все ее диагональ-
11. Мультипликативные представления матрицы 369 ные элементы ненулевые. Обозначим через Bk (Rk) матрицу ведущего минора порядка к матрицы A* A (R), Ясно, что Вк = R*kRk. Поэтому det Вк = det R*k • det Rk = |det Rk f > 0, то есть все ведущие миноры матрицы А* А положительные. Согласно 11.1-18, 11.1-19 матрица R из равенства А*А = R*R определяется однозначно, если зафиксировать аргументы ее диагональных элементов. Матрица Q также определяется однозначно, так как Q - AR~ \ 11.3. Сингулярное разложение матрицы 11.3.1. Сингулярные числа матрицы 11.3-1.4 Эрмитовость и главные миноры матриц А*А и АА* Какова бы ни была прямоугольная матрица Л, матрицы А*А и АА* эрмитовы и имеют неотрицательные главные миноры. Дополнение. Для любой матрицы А эрмитовость матриц АА* и А*А очевидна. Пусть матрица А имеет размер n x m. Принимая во внимание 4.1-13, 4.2-13, находим, что для 1 < г < т PlPl-PrJ 1<*,-~<*,?« l^Aj... К) \P\Pl-Pr 1 < kx <...<kr<,n и для 1 < г < п > I .* I '"I ^2 "-К кхкг... кг 11.3-2.4 Собственные значения матриц А*А и АА* Ненулевые собственные значения матриц А* А и А А* всегда совпадают и положительны. Дополнение. Согласно 8.2-25 характеристические многочлены матриц А*А иАА* отличаются только множителем ^|/и~и|. Поэтому ненулевые собственные значения матриц А*А иАА* совпадают. Как следует из 8.2-19, 11.3-1, коэффициенты характеристических многочленов 8.2-18 матриц А*А и АА* вещественные и имеют че-
370 Часть I. Математические сведения по линейной алгебре редующиеся знаки. В силу 10.3-9 эти многочлены должны иметь лишь вещественные корни. Чередование знаков коэффициентов говорит о том, что корни характеристических многочленов или, другими словами, собственные значения матриц А*АиАА* могут быть только неотрицательными. 11.3-З.4 Сингулярные числа Арифметические значения квадратных корней из общих собственных значений матриц А*А иАА* называются сингулярными (главными) числами матрицы А. 11.3-4.4 Комментарий (об упорядоченности сингулярных чисел) Всюду в дальнейшем будем обозначать ненулевые сингулярные числа матрицы А через рь ...,Р/ и предполагать, что они занумерованы в порядке убывания, т.е. pi > р2 > ... > Р/> 0. Сингулярные числа р, + ь ... будем считать нулевыми. 11.3.2. Сингулярные базисы матрицы 11.3-5.4 Собственные векторы матриц А*А и АА* Пусть А — прямоугольная матрица размера тхп. Обозначим через хь ... ,х„ орто- нормированные собственные векторы матрицы А*А. Тогда: • система векторов Axh ..., Ахп является ортогональной; • ненулевой вектор Ахк является собственным вектором матрицы АА* и соответствует собственному значению р2; • для всех к выполняется равенство \Ахк\ = рк. Дополнение. Рассмотрим кратко каждое из положений. Пусть А*Ахк = р2кхкУрк >0 для всех к, 1 < к < п. Имеем, принимая во внимание 5.2-25, (Ахь Ах,) = (А*Ахк, х,) = р\ (хь х,) = 0, * +1 Предположим, что Ахк Ф 0. Тогда АА\Ахк) = А(А*Ахк) = А{ р] хк) = р,2 (Ахк). И, наконец, \Ахк\2 = (Ахь Ахк) = (А*Ахк, хк) = (р^ хк, хк) = р\. 11.3-6.4 Специальные ортонормированные системы Пусть А — прямоугольная матрица размера тхп. Всегда существуют ортонормированные системы векторов хи ..., х„ и уи ..., ут такие, что
11. Мультипликативные представления матрицы 371 * [ 0 , k>t\ '* \ О, k>t. Дополнение. Рассмотрим арифметические пространства X, Y размерностей, соответственно, я, m и пусть в них введены скалярные произведения вида 5.1-8 в естественных базисах. Выберем в пространстве X в качестве ортонормированного базиса систему х\, ...,х„ собственных векторов матрицы А*А. Будем считать, что сингулярные числа упорядочены следующим образом: р! > р2 > ... > р/ > 0, р|+ ! = р/ + 2 = ... = 0. Согласно 11.3-5 система векторов Ук =~Ахк Рк является ортонормированной ристемой собственных векторов матрицы АА* для k=\,..,,t. Дополним ее до ортонормированного базиса системой векторов У(+ь -чУт, представляющих собственные векторы матрицы АА*, соответствующие нулевому собственному значению. По построению А*Ахк=1 р2кхк для ?=1,...,/ и А*Ахк = 0 для 4=/+1, ...,я. Кроме этого, согласно 6.4-9 имеем kerАА* = kerА*, поэтомуА*ук-0 для k = t+ I, ...,/w. Теперь, принимая во внимание 11.3-5, заключаем, что А \$кУкЛ^и А* hkxk9k<t9 Ахк = \ А у. = < к [ 0 , к > t\ к \ 0, * > t. 11.3-7.4 Сингулярные базисы Ортонормированные системы jcb ...,xw uyu ...,ym из 11.3-6 называются сингулярными базисами матрицы А. 11.3.3. Сингулярное разложение матрицы 11.3-8.4 Существование специального разложения Какова бы ни была комплексная прямоугольная матрица А размера т х л, всегда существует разложение А = UAV, где U, V— унитарные матрицы, Л— прямоугольная диагональная матрица размера т х п с невозрастающими неотрицательными элементами на диагонали. Дополнение. Обозначим через Л диагональную матрицу размера т х п, на диагонали которой стоят числа рь ..., р/5 0,..., 0, через U— квадратную матрицу, столбцы которой составлены из координат векторов ук в естественном базисе, через V* — квадратную матрицу, столбцы которой составлены из координат векто-
372 Часть I. Математические сведения по линейной алгебре ров хк в естественном базисе. Соотношения 11.3-6, записанные в матричном виде, означают, что AV* = UA9 A*U= V*A\ Согласно первому пункту из 10.2-9 матрицы U и V* являются унитарными. Поэтому V*V= E и матрица V также унитарная. Умножая первое равенство справа на матрицу V, получаем требуемое разложение матрицы А. 11.3-9.4 Сингулярное разложение Разложение 11.3-8 называется сингулярным разложением матрицы А. 11.3-10.4 Свойства сингулярного разложения Если задано сингулярное разложение А = UAV матрицы А, то: • диагональные элементы матрицы Л являются сингулярными числами матрицы А\ • столбцы матрицы {/образуют ортонормированный базис из собственных векторов матрицы АА*\ • столбцы матрицы V* образуют ортонормированный базис из собственных векторов матрицы А*А\ • столбцы матриц К\ U образуют в совокупности сингулярные базисы матрицы А. Дополнение. Если дано сингулярное разложение А = UAV, то в силу унитарности матриц U, V сразу получаем такие равенства AA\U)=U{AA*\ A*A(V*)=V*(A*A). Здесь ЛЛ* и Л*Л — квадратные диагональные матрицы с невозрастающими неотрицательными элементами на диагонали. Все утверждения следуют непосредственно из постолбцевого рассмотрения этих равенств. 11.3-11.4 Вещественное сингулярное разложение Для вещественной матрицы существует вещественное сингулярное разложение. Дополнение. Если матрица А вещественная, то вещественными и симметричными будут матрицы А*А и АА*. Согласно 10.3-14 эти матрицы имеют полные системы вещественных ортонормированных собственных векторов. Все остальное следует из построения, описанного в дополнении к 11.3-6, которое в данном случае можно осуществить в поле вещественных чисел. 11.3.4. Сингулярное разложение в различных свойствах 11.3-12.4 Сохранение сингулярных чисел Сингулярные числа матрицы не меняются от ее умножения слева и справа на любые унитарные матрицы.
11. Мультипликативные представления матрицы 373 Дополнение. Пусть В = QAR, где Q,R — унитарные матрицы. Имеем В*В = R*(A*A)R. Поэтому согласно 10.2-11 матрица В*В унитарно подобна матрице А*А и, следовательно, собственные значения этих матриц совпадают. 11.3-13.4 Невырожденность и сингулярные числа Квадратная матрица является невырожденной тогда и только тогда, когда все ее сингулярные числа отличны от нуля. Дополнение. Принимая во внимание 4.1-13, 8.2-30, имеем откуда сразу следует справедливость утверждения. 11.3-14.4 Модуль определителя матрицы Модуль определителя матрицы равен произведению всех сингулярных чисел. Дополнение. Это есть прямое следствие формулы, приведенной в дополнении к 11.3-13. 11.3-15.4 Критерий нормальности Квадратная матрица является нормальной тогда и только тогда, когда все ее собственные значения равны по модулю сингулярным числам. Дополнение. Пусть А — квадратная матрица порядка m с собственными значениями Xh ..., Х,„ и сингулярными числами рь ..., рт. Приведем ее к унитарно подобной правой треугольной матрице В = U*AU9 где U— унитарная матрица. Это возможно согласно 10.2-13. Согласно 10.2-15 матрица Л нормальная тогда и только тогда, когда нормальной будет матрица В. Согласно 11.3-12 матрица В имеет те же сингулярные числа, что и матрица А. А согласно 8.2-23 матрицы А и В имеют одинаковые собственные значения. В силу сказанного справедливость утверждения достаточно доказать для правой треугольной матрицы. Предположим, что матрица В нормальная. В соответствии с 10.1-3 она должна быть диагональной. Но для диагональной матрицы ее диагональные элементы являются собственными значениями, а модули диагональных элементов — сингулярными числами. Поэтому если матрица В нормальная, то модули собственных значений и сингулярные числа совпадают. Пусть теперь у треугольной матрицы В собственные значения совпадают по модулю с сингулярными числами, т. е. \Ьц\ = р/ для всех /, 1 < / < /и. Матрица С = В*В является нормальной. Согласно определению 11.3-3 и 10.2-22 имеем
374 Часть I. Математические сведения по линейной алгебре С другой стороны, i = 1 у = 1 / = 1 i; = I j = I т ( i . -III причем равенство здесь достигается тогда и только тогда, когда матрица В и, следовательно, матрица С являются диагональными или, другими словами, тогда и только тогда, когда матрица В является нормальной. 11.3-1 б.5 Сингулярное разложение и псевдообращение Пусть для матрицы А известно сингулярное разложение А = UAV. Тогда для псевдообратной матрицы А* имеем представление А+ = V*A+U*. Дополнение. Это есть прямое следствие 10.2-10. 11.3-17.5 Псевдообратная матрица для диагональной Предположим, что у диагональной матрицы Л размера nx m первые диагональные элементы рь р2,..., р/ отличны от нуля, а остальные равны нулю. Матрица Л+ есть диагональная матрица размера wxw,y которой первые диагональные элементы равны р~{, р~',..., р~1, а остальные равны нулю. Дополнение. Для матрицы Л+, описанной в утверждении, выполняются матричные соотношения 6.6-18 при единичных матрицах U, V. Это и говорит о том, что данная матрица является псевдообратной. 11.3-18.4 Равенство с сингулярными числами Для любой матрицы А размеров m x n с элементами ay и сингулярными числами р* выполняется равенство tin • ; = i j' Дополнение. Это есть прямое следствие 10.2-21, 11.3-8 и 11.3-12. 11.3-19.4 Полезное неравенство Для любой квадратной матрицы А порядка m с собственными значениями Х\,..., ХП1 и сингулярными числами рь ..., рт выполняется неравенство
11. Мультипликативные представления матрицы 375 m m /¦ = I / = I причем равенство достигается тогда и только тогда, когда матрица А нормальная. Дополнение. Это есть прямое следствие 11.3-18 и 10.2-22. 11.4. Другие представления матрицы 11.4.1. Полярное разложение матрицы 11.4-1.5 Существование специального разложения Любую квадратную матрицу А можно представить в виде произведения А = HU, где Н— эрмитова матрица с неотрицательными собственными значениями и главными минорами, U—унитарная матрица. Дополнение. Напишем согласно 11.3-8 для матрицы А сингулярное разложение А - QAV, где QV— унитарные матрицы, Л— диагональная матрица с неотрицательными диагональными элементами. Тогда Здесь Я = QAQ* есть эрмитова матрица с неотрицательными собственными значениями, совпадающими с диагональными элементами матрицы Л. Согласно 11.1-31 все главные миноры матрицы Я неотрицательные. Матрица U=QV, как произведение двух унитарных матриц, согласно 10.2-6 есть матрица унитарная. 11.4-2.5 Полярное разложение Разложение 11.4-1 называется полярным разложением матрицы А. 11.4-3.5 Единственность эрмитова множителя В полярном разложении А = HU матрицы А эрмитова матрица Я определяется единственным образом. Дополнение. Рассмотрим полярное разложение А = HU и сопряженное разложение А* = U*H. Умножив первое равенство справа почленно на второе, получим, что АА* = Я2. Матрица Я по условию эрмитова с неотрицательными собственными значениями. Принимая во внимание 9.4-11, 10.3-9, 11.3-3, заключаем, что собственными значениями матрицы Я являются сингулярные числа матрицы А. Пусть /ь -'">fm— ортонормированная система собственных векторов матрицы Я, соответствующих собственным значениям рь ..., рт. Имеем АА% = H2fi = H(Hft = pflfi = p}fh то есть векторы/ь ...,fm являются собственными векторами матрицы АА*, соответствующими собственным значениям pf,..., p2m . Рассмотрим теперь любую ор-
376 Часть I. Математические сведения по линейной алгебре тонормированную систему собственных векторовyh ...,ym матрицы АА*, соответствующих собственным значениям pf,...,p^. В соответствии с 5.2-9 разложим вектору по векторам/ь ...,fm, т. е. Теперь находим, что Матрица^* эрмитова. Согласно 8.2-17 ее собственные векторы^ и^, соответствующие различным собственным значениям pf и pj, ортогональны. Поэтому среди скалярных произведений (y^fy могут быть отличны от нуля только те, для которых ру = р/. Это означает, что то есть Ну, = р<у, для всех /, 1 < / < m. Следовательно, собственные векторы матрицы АА* являются собственными векторами матрицы Я. Таким образом^ какова бы ни была матрица Я в полярном разложении А = HU, ее собственные векторы совпадают с собственными векторами уь ...,ут матрицы АА* и они соответствуют собственным значениям рь ..., pw. Эти условия определяют матрицу Н однозначно. В самом деле, пусть существуют две матрицы Нх и #2- Возьмем произвольный векторх и разложим его по векторамyh ...,^m, т. е. Имеем (Я, - Н2)х = Нхх - Н2х = = aipiyi + ... + amp^ym-aiPM -... -ampntym = 0. Поэтому Hx-H2 = 0 или Hi = Я2. 11.4-4.5 Единственность полярного разложения Невырожденная матрица имеет единственное полярное разложение. Дополнение. Пусть матрица А невырожденная. В этом случае в полярном разложении А = HU невырожденной должна быть согласно 4.4-4 матрица Я. Поэтому U=H~XA. Согласно 11.4-3 матрица Я определяется единственным образом. Следовательно, единственным образом определяется также матрица U. 11.4-5.5 Вещественное полярное разложение Для вещественной матрицы существует вещественное полярное разложение. Дополнение. Очевидно, принимая во внимание 11.3-11.
11. Мультипликативные представления матрицы 377 11.4.2. Полярное разложение в различных свойствах 11.4-6.5 Унитарный множитель и матрицы А*А, АА* Каково бы ни было полярное разложение А = HU матрицы А, унитарная матрица U переводит ортонормированный базис из собственных векторов матрицы А*А ъ ортонормированный базис из собственных векторов матрицы АА*. Дополнение. Предположим, что для матрицы А известно полярное разложение А ~ HU. Беря сопряжение от обеих частей этого равенства, будем иметь А* = U*H. Следовательно, АА* = Н2. Если А*Ах = р\ то UA*Ax = p2Ux. Но UА*А = UU*HHU = H2U = AA*U. Поэтому AA*(Ux) = p2(Ux). Пусть xu ...,xm — ортонормированный базис из собственных векторов матрицы А*А. Полученное равенство с учетом седьмого пункта 10.2-9 говорит о том, что Uxh ..., Uxm— ортонормированный базис из собственных векторов матрицы АА*. 11.4-7.5 Унитарный множитель и матрицы А, А* Для любого полярного разложения А = HU унитарная матрица U переводит im A* в im A, a ker A — в ker A*. Дополнение. Матрицы А*А и АА* являются матрицами простой структуры. Согласно 8.3-10 образ матрицы А*А (АА*) есть линейная оболочка собственных векторов, соответствующих ненулевым собственным значениям. В соответствии с 11.4-6 можно утверждать, что матрица U переводит im А*А в im АА*. Но согласно 6.4-9 имеем im A*A = im A*, im АА* = im А. Аналогично заключаем, что матрица U переводит ker А*А в ker А А* или, что то же самое, ker А в ker A*. 11.4-8.5 Критерий нормальности Матрица А является нормальной тогда и только тогда, когда в ее полярном разложении А ~ HU матрицы Н и U перестановочны. Дополнение. Пусть известно полярное разложение А = HU и матрицы Я, V перестановочны, т. е. HU = UH. Имеем А* А = (HU)*(HU) = (UH)*(UH) = (HU*)(UH) = Я2, то есть АА* =А*А и матрица А — нормальная. Предположим теперь, что матрица А нормальная. Обозначим через Х.ь ...Дт ее собственные значения, через Рь ...,Pw— ее сингулярные числа. Согласно П.3-15 можно считать, что \Х{\ = р/ для всех /", 1 < / < т. Не ограничивая общности, предположим далее, что первые t собственных значений и, соответственно, сингулярных чисел матрицы А отличны
378 Часть I. Математические сведения по линейной алгебре от нуля, остальные — равны нулю. Пусть А,,- = р,е, для всех /, 1 < / < t. Обозначим через Л и Р диагональные матрицы с элементами Хь ..., Хт и pi, ..., pw на главной диагонали. Существует унитарная матрица Е такая, что Л = РЕ. Первые / строк матрицы Е представляют строки диагональной матрицы с элементами еь ...,е,. Так как |б/| = 1 для всех /, 1 </</, то согласно первому пункту 10.2-9 первые t столбцов матрицы Е также представляют столбцы диагональной матрицы. Поэтому матрица Е имеет следующий блочный вид О Е22 Здесь блок Еп представляет диагональную матрицу порядка / с элементами еь ..., Б/ на главной диагонали, блок Е22 есть произвольная унитарная матрица порядка т -1. Очевидно, что РЕ = ЕР = Л. Согласно 10.2-17 существует унитарная матрица Q такая, что А = Q*AQ. Следовательно, А = Q*AQ = Q*?QQ*EQ = (б*Р0(б*Е0 = HU. Матрица Q*YQ— эрмитова с неотрицательными собственными значениями, матрица Q*EQ — унитарная. Поэтому разложение является полярным. Согласно 11.4-3 матрица Н в полярном разложении определяется однозначно. Это означает, что Я = Q*VQ. Теперь из равенства Q*AQ = Q*VQU получаем, что для матрицы U единственно возможный вид — это U = Q*EQ. Как было показано выше, матрица Е определяется не однозначно. Однако во всех случаях она перестановочна с матрицей Р и произведение этих матриц дает Л. Теперь имеем UH = Q*EQQ*?Q = Q*E?Q = Q* AQ = A=HU, то есть компоненты U9 H полярного разложения матрицы А перестановочны. 11.4-9.5 Собственные значения множителей Если матрица А нормальная, то собственные значения матрицы Я (аргументы собственных значений матрицы V) полярного разложения А = HU являются модулями собственных значений (аргументами собственных значений) матрицы А. Дополнение. Пусть матрица А нормальная. Из соотношения АА* = Я2 следует, что собственные значения матрицы Я представляют сингулярные числа матрицы А или согласно 11.3-15 модули собственных значений матрицы А. Собственные значения матрицы U представляют числа еь ..., е, и собственные значения блока Е22- В силу равенств X,- = р,?/ для всех /, 1 < / < /, соответствующих ненулевым собственным значениям матрицы А, аргументы ненулевых собственных значений X,
11. Мультипликативные представления матрицы 379 совпадают с аргументами чисел б/. Блок Е22 не определен. Поэтому не определены аргументы его собственных значений. Но не определены также аргументы нулевых собственных значений матрицы А. 11.4.3. Кронекерово произведение матриц 11.4-10.5 Кронекерово произведение Пусть А и В — прямоугольные матрицы размеров /их пир х q соответственно. Кро- некеровым или тензорным произведением Ах В матриц А и В называется матрица С размера тр х щ следующего блочного строения: С = auB B ... аХпВ а1ХВ а22В ... а1пВ LamlB am2B ... атпВ 11.4-11. Свойства кронекерова произведения Следующие соотношения справедливы при любом числе а и любых матрицах, для которых существующие операции имеют смысл: (аЛ) хВ = Ах (ссД) = сс(Л х В), (АВ) х (CD) = (А х С)(В х D). Дополнение. Все равенства проверяются непосредственно с учетом определений 3.2-11,3.2-13,3.2-16,11.4-10. 11.4-12.5 Комплексный случай Для комплексных матриц имеют место соотношения (АхВ)*=А*хВ\ (АхВ)+ = А+хВ\ Дополнение. Первое соотношение почти очевидно. Для проверки второго соотношения воспользуемся утверждением 6.6-18. Имеем (А х В)\А х В)(А+ х В+) = (А* х В*)(А х В)(А+ х В+) = = (А*А х В*В)(А+ хВ+) = (А*АА+ х В*ВВ+) = (А* х В*) = (Ах В)\ А+хВ+ = (UiA*) х (U2B*) = A7! х U2)(A* х В*) = (f/, x U2)(A х В)\ А+хВ+ = (А*У{) х (B*V2) = (А* х B*)(V{ х V2) = (А х B)\VX x V2\ то есть матрица А+ х В+ является псевдообратной для матрицы Ах В,
380 Часть I. Математические сведения по линейной алгебре 11.4-13.5 Перестановки и кронекерово произведение Матрицу А х В перестановками строк и столбцов можно привести к матрице В х А. Если матрицы А, В квадратные, то строки и столбцы переставляются одинаково. 11.4-14.5 Еще кое-что о свойствах Для квадратных матриц Л, В порядков w, n справедливы соотношения: Дополнение. Первое свойство проверяется тривиально. Для проверки второго свойства воспользуемся равенством А х В = (АЕт) х (Е„В) = (А х ?„)(?„, х В\ где Ет,Еп— единичные матрицы порядков я, т. Матрица ЕтхВ блочно-диа- гональная с т блоками на диагонали. Поэтому согласно 4.2-7,4.2-10 имеем det(A х В) = det(A x Еп) • (det B)m. Согласно 11.4-13 существует матрица перестановок Р такая, что Принимая во внимание 3.4-3, заключаем, что det(^ x Е„) = (det^)w. Следовательно, det(A xB) = detO4)"(det B)'\ Третье свойство проверяем непосредственно, используя пятое свойство 11.4-11: то есть матрица Л х В'] есть обратная для матрицы Ах В. 11.4.4. Спектральные свойства кронекерова произведения 11.4-15.5 Кронекерово произведение и подобие Если матрицы А, В порядков m, n подобны соответственно матрицам С, D, то: • матрица Ах В подобна матрице С х D; • матрица Ах Еп + Етх В подобна матрице С х Е„ + Ет х D. Матрица Ах Е„ + Етх В называется кронекеровоп суммой матриц А и В. Дополнение. Принимая во внимание 11.4-11, 11.4-14, находим, что если С = Р~1АР, D = Q~l BQ,
. Мультипликативные представления матрицы 381 то С х D = (Г' АР) х (Q-' BQ) = = (Р-1 х б)^ х Б0 = (Р х бГ1^ х Я)G> х 0, CxEn + EmxD = (p- 1АР) х (gr «?и0 + (/>- >?w/>) х (g i (P x g)" '(^х?й + ?wx B){P x g). 11.4-16.5 Кронекерово произведение и простая структура Если матрицы А9 В порядков w, n имеют простую структуру, то имеют простую структуру матрицы А х В u A x En + Em x В. Дополнение. Если матрицы С, D из дополнения к 11.4-15 диагональные, то диагональными будут матрицы С х Д С х Е„ + ?w x ?>. Матрицы Лх#иЛх?„ + ?,„х# будут иметь простую структуру, т. к. согласно дополнению к 11.4-15 они подобны этим матрицам. 11.4-17.5 Собственные значения и векторы Пусть X и х— собственное значение и собственный вектор матрицы А порядка т\ — собственное значение и собственный вектор матрицы В порядка п. Тогда: кронекерово произведение хху является собственным вектором матрицы Ах В и соответствует собственному значению ^ц; кронекерово произведение хху является собственным вектором матрицы А х Еп + Ет х В и соответствует собственному значению X + ji. Дополнение. Пусть Ах = Хх,By = цу. Кронекерово произведение хху является вектором размерности тп. Матрицы АхВ\\АхЕп + ЕтхВ являются квадратными порядка тп. Теперь проверяем, используя 11.4-11, что (А х В)(хху) = (Ах) х (By) = Ga) x (щ/) = Хф ху), (АхЕп + Етх В)(хху) = (Ах Еп)(хху) + (Ет х В)(хху) = = (Ах) х (Е#) + (?„») х (Ду) = (Хх) ху + х х \i(xxy) = (k + [i)(xxy) 11.4-18.5 Полнота представления Пусть матрицы А и В имеют простую структуру. Тогда все тп собственных значений и соответствующие им собственные векторы матриц Ах В и А х Еп + Ет х В имеют вид, указанный в 11.4-17. Дополнение. Пусть матрицы А, В подобны диагональным матрицам С, D. Справедливость утверждения сразу следует из формул подобия в дополнении к 11.4-15.
382 Часть I. Математические сведения по линейной алгебре 11.4.5. Специальные кронекеровы произведения 11.4-19.5 Кронекерово произведение специальных матриц Кронекерово произведение квадратных матриц А, В любых порядков является диагональной (треугольной того же наименования, нормальной, эрмитовой, унитарной) матрицей, если матрицы А, В диагональные (треугольные одного наименования, нормальные, эрмитовы, унитарные). Дополнение. Если матрицы А, В диагональные или треугольные одного наименования, то очевидно, что матрица А х В будет диагональной или треугольной того же наименования. Пусть теперь матрицы А, В — нормальные. Это означает, что в дополнении к 11.4-15 матрицы Р, Q можно считать унитарными, а матрицы С, D диагональными согласно 10.2-17. Легко проверить, что матрица Р х Q унитарная. В самом деле, принимая во внимание 11.4-12, имеем (Р х Q)(P х QY = (Р х Q)(P* х Q*) = (/>/>*) х (eg*) = ЕтхЕ„ = Ет„. Следовательно, матрица А х В также является нормальной. Если матрицы А, В эрмитовы, то дополнительно, согласно 10.3-9, диагональные матрицы С, D будут вещественными. В этом случае диагональная матрица С х D тоже вещественная и матрица Ах В является эрмитовой. Если же матрицы А, В унитарные, то уже проверялось, что матрица А х В является унитарной. 11.4-20.5 Кронекерово произведение и разложение матриц Пусть для матриц А, В определены: /^-разложения, ??/?-разложения, полярные разложения, сингулярные разложения, скелетные разложения, т. е. А = L{UX, В = L2U2, А = С/,Л, Vu В = и2А2Уъ А = QXRU В = Q2R2, A = CD,B = FG, А = HXUU В = H2U2. Тогда соответствующие разложения для матрицы Ах В имеют вид = (QlxQ2)(RlxR2), (AxB) = (UlxU2)(AlxA2)(VlxV2), (AxB) = (Cx F){D x G). Дополнение. Все равенства проверяются непосредственно, принимая во внимание 11.4-11, 11.4-19. Проверим, например, полярное разложение. Если A=H]U],B = H2U2, то А х В = (Я, С/,) х (H2U2) = (Я, х Я2)(С/, х U2).
11. Мультипликативные представления матрицы 383 Так как матрицы Л, В представлены полярными разложениями, то согласно 11.4-1 матрицы #ь #2 эрмитовы с неотрицательными собственными значениями, матрицы U\9 U2 унитарные. Согласно 11.4-19 матрица #jx#2 эрмитова, матрица U\ х U2 унитарная. Кроме этого, согласно 11.4-18 все собственные значения матрицы #i х #2 неотрицательны. Отметим также, что в силу 11.1-31 все главные миноры матрицы Н\ х #2 будут неотрицательными. Поэтому приведенное разложение матрицы Л х В по определению 11.4-1 является полярным.
12. Билинейные формы 12.1. Билинейные и эрмитовы билинейные формы 12.1.1. Билинейные формы 12.1-1.4 Комментарий (о скалярном произведении) Наличие скалярного произведения в линейном пространстве позволяет эффективно решать многие задачи. Пожалуй, самым концентрированным выражением возможностей скалярного произведения являются утверждения 6.8-2—6.8-4. Однако не в каждом линейном пространстве удается ввести числовые бинарные функции, обладающие полным набором свойств скалярного произведения, описанных в утверждениях 5.1-2, 5.1-3. Иногда "мешает" симметрия скалярного произведения, иногда — его положительная определенность и т. п. Целью ближайших исследований является изучение более общих числовых бинарных функций в линейном пространстве. Эти функции будут обладать более слабыми свойствами, чем скалярное произведение, но все еще будут давать возможность эффективно решать различные задачи. 12.1-2.3 Билинейная форма Пусть задано комплексное (вещественное) линейное пространство. Числовая функция ф(л:, у) называется билинейной формой в этом пространстве, если для любых векторов x,y,z и любого комплексного (вещественного) числа а она принимает комплексное (вещественное) значение, и при этом выполняются соотношения ф(х + г, у) = ср(*, у) + фB, у), ф(ах, у) = аф(х, у\ ф(х, y + z) = q>(x, у) + ср(х, z), ф(х,ау) = аф(х, у). 12.1-3.3 Комментарий (некоторые сравнения) Мы уже встречались ранее с функцией такого вида. Сравнивая 5.1-2 и 12.1-2, легко заметить, что скалярное произведение в евклидовом пространстве является билиней- 13 Зак 740
386 Часть I. Математические сведения по линейной алгебре ной формой. Однако не каждая билинейная форма даже в вещественном пространстве будет скалярным произведением, т. к. как могут оказаться невыполненными важные свойства симметричности скалярного произведения и его положительной определенности. Вспоминая, какую важную роль играло скалярное произведение при изучении евклидовых пространств и действующих в них линейных операторов, нетрудно понять и важность изучения билинейных форм, которые можно рассматривать как скалярные произведения с ослабленными свойствами. Многие свойства билинейных форм в комплексных и вещественных пространствах совпадают, хотя, в ряде случаев, имеются и очень существенные различия. В тех случаях, когда свойства билинейных форм совпадают, мы не будем указывать тип пространств. 12.1-4.3 Формальные преобразования С билинейной формой можно выполнять формальные алгебраические преобразования, т. е. / = I 7 = 1 i¦¦ = 1 j = I 12.1-5.3 Значение в нуле Дня любой билинейной формы выполняются соотношения ф@,>>) = (p(jc, 0) = 0. 12.1-б.3 Нулевая билинейная форма Билинейная форма называется нулевой, если она принимает нулевое значение для всех пар векторов. 12.1-7.3 Линейное пространство билинейных форм Множество всех билинейных форм, заданных над одним и тем же линейным пространством, есть линейное пространство. Дополнение. Очевидно, выполняются все требования линейного пространства 1.7-2. 12.1.2. Симметричные и кососимметричные билинейные формы 12.1-8.3 Симметричная билинейная форма Билинейная форма ф(х,у) называется симметричной, если для любых векторов х,у выполняется равенство ц>(х,у) = ф(у, х). 12.1-9.3 Кососимметричная билинейная форма Билинейная форма ty(x,y) называется кососимметричной, если для любых векторов х, у выполняется равенство ф(х, у)=- ф(у, х).
12. Билинейные формы 387 12.1-10.3 Подпространства билинейных форм Множества симметричных и кососимметричных билинейных форм образуют подпространства в линейном пространстве всех билинейных форм. Дополнение. Очевидно, выполняются все требования линейного подпространства 1.7-9. 12.1-11.3 Разложение в сумму Любая билинейная форма однозначно разложима в сумму симметричной и кососим- метричной билинейных форм, а именно: ФО, У) = -{фО> У) + Ф(У, *)} + - (ф(*> У) - Ф> *)}• Первые два слагаемых в правой части дают симметричную билинейную форму, последние два — кососимметричную. Дополнение. Предположим, что билинейная форма разложима в сумму У(х9у) = у(х9у) + в(х9у)9 где билинейная форма vj/(x, у) симметричная, а 0(х, у) — кососимметричная. Имеем ф(у, х) = v|/(y, х) + 6(у, х) для всех х, у. Принимая во внимание свойства форм \у(х, у) и 6(x, у), получаем такое соотношение: ф,х) = ц(х,у)-в(х,у). Складывая первое и третье равенство и вычитая из первого равенства третье, находим, что Ч/(*э У) = "Г (фО> У) + ФО> ^)}5 6(х, >^) = -{ф(*, у) - (р(у, х)}. Теперь существование и единственность предполагаемого разложения становятся очевидными. 12.1-12.3 Тождество Для любой билинейной формы имеет место тождество ф(х, у) + ср(у, *) = ф(л +J^, х +у) - ф(х, х) - ф(у, ^). Дополнение. В самом деле, принимая во внимание 12.1-4, имеем <р(* +у,х + у)- ф(дс, *) - ф(у, ^) = ф(х, х) + ф(х, у) + ф(у, х) + ф(у, у) - - ф, х) - ф(у, у) = ф(х, у) + ф(у, х).
388 Часть I. Математические сведения по линейной алгебре 12.1-13.3 Свойство кососимметричной формы Кососимметричные билинейные формы, и только они, принимают нулевые значения при всех совпадающих аргументах. Дополнение. Пусть ц>(х,у)— кососимметрическая билинейная форма, т.е. ф(*> У) = - ф(У> х) Для всех векторов х, у. Тогда ф(х, х) = - ф(х, л:) для всех векторов jc, т. е. ф(х, х) = 0. Предположим теперь, что ф(;с, х) = 0 при всех векторах х для какой-то билинейной формы ф(х,х). Воспользовавшись тождеством 12.1-12, заключаем, что ф(х, у) = - ц>(у, х) при всех векторах х,у, т. е. билинейная форма ц>(х,у) кососимметричная. 12.1-14.3 Свойство симметричной формы Симметричная билинейная форма однозначно определяется своими значениями при совпадающих аргументах. Дополнение. Если билинейная форма ф(х, у) симметричная, то ф(х, у) = ф(у, х) при всех векторах х, у. Из тождества 12.1-12 следует, что ф(*, У) = - {Ф + у, х + у) - фО, х) - фО, у)}. 12.1-15.3 Однозначность симметричной части Для любой билинейной формы ее симметричная часть однозначно определяется значениями формы при совпадающих аргументах. Дополнение. Очевидно, принимая во внимание 12.1-11, 12.1-12. 12.1.3. Эрмитовы билинейные формы 12.1-1 б.3 Эрмитова билинейная форма Пусть задано комплексное линейное пространство. Числовая функция называется эрмитовой билинейной (или полу тор алинейнои) формой в этом пространстве, если для любых векторов x,y,z и комплексных чисел а она принимает комплексные значения и при этом выполняются соотношения ф(х + z,y) = ф(дс, у) + ф, у\ ф(ссх, у) = схф(х, у), (р(дг, у + z) = ф(х, у) + ф(х, z), ф(*, ау) = а ф, у). Здесь черта означает комплексное сопряжение. Эрмитова билинейная форма также называется просто эрмитовой формой. 12.1-17.3 Эрмитова и обыкновенная билинейные формы Если эрмитова билинейная форма в комплексном пространстве является обыкновенной билинейной формой, то эта форма— нулевая.
12. Билинейные формы 389 Дополнение. Пусть х,у— произвольные векторы. Так как ц>(х,у) — эрмитова билинейная форма, то Ф(х, (у) = -/ф(*,>0. Но так как ф(х, у) одновременно является обыкновенной билинейной формой, то ф(х,гу) = /ф(х,;у). Оба равенства могут выполняться в том и только в том случае, когда ф(х, у) = О при всех векторах х, у, т. е. когда ф(х, у) — нулевая форма. 12.1-18.3 Алгебраические преобразования С эрмитовой билинейной формой можно выполнять формальные алгебраические преобразования, т. е. / = 1 j=\ / = I у = 1 12.1-19.3 Линейное пространство эрмитовых билинейных форм Множество всех эрмитовых билинейных форм, заданных над одним и тем же линейным пространством, есть линейное пространство. Дополнение. Очевидно выполняются все требования линейного пространства 1.7-2. 12.1-20.3 Тождество Для любой эрмитовой билинейной формы имеет место тождество фО, у) = -{фО + у, х + у) - ф(х - у, х - у) + *<р(х + />, х + iy) - щ(х -iy,x- /»}. 4 Дополнение. В самом деле, принимая во внимание 12.1-18, имеем -{фО + у, х + у) - ф(х - у, х - у) + /ф(х + />, х + /» - /ф(х -(у,*- /»} = = т{ф(х, х) + ф(х, у) + фСу, х) + ф(д;, j;) - <р(х, х) + ф(х, ^) + ф(у, х) - ф(>>, у) + 4 + /ф(х, х) + ф(х, у) - фО, х) + /ф(^, у) - /ф(х, х) + ф(х, ^) ~ Ф(^, Jf) ~ 'ФО> У)} = 12.1-21.3 Совпадающие аргументы Любая эрмитова билинейная форма однозначно определяется своими значениями при совпадающих аргументах. Дополнение. Очевидно, принимая во внимание 12.1-20.
390 Часть I. Математические сведения по линейной алгебре 12.1-22.3 Нулевая форма и совпадающие аргументы Среди эрмитовых билинейных форм нулевая форма, и только она, принимает нулевые значения при всех совпадающих аргументах. Дополнение. Очевидно, принимая во внимание 12.1-20. 12.1-23.3 Комментарий (о различии билинейных и эрмитовых форм) Очевидно, что понятия билинейной формы и эрмитовой билинейной формы совпадают в случае вещественных линейных пространств. В случае же комплексных линейных пространств эти понятия принципиально различны. Это проявляется, например, в утверждениях 12.1-12 и 12.1-20, а также 12.1-6 и 12.1-22. С многочисленными другими различиями познакомимся позднее. 12.1.4. Симметричные и кососимметричные эрмитовы формы 12.1-24.3 Эрмитовы симметричная и кососимметричная формы Эрмитова билинейная форма называется эрмитовой симметричной (эрмитовой кососимметричной), если для любых векторов х, у. , у) = ф(у, х) (ф(х, у) = - у(у, х)). 12.1-25.3 Связь между этими формами Если ф(х, у)— эрмитова симметричная (кососимметричная) билинейная форма, то i(p(x9y) будет эрмитовой кососимметричной (симметричной) билинейной формой. Дополнение. Выполнение условий 12.1-24 очевидно. 12.1-26.3 Однозначность разложения в сумму Любая эрмитова билинейная форма однозначно разложима в сумму эрмитовой симметричной и эрмитовой кососимметричной билинейных форм. Именно: ф(*> У) = -г{фО> У) + ф(.У> *)} + ~{фО> У) ~ ФО> *)} • Первые два слагаемых в правой части дают эрмитову симметричную билинейную форму, последние два — эрмитову кососимметричную. Дополнение. Предположим, что эрмитова билинейная форма разложима в сумму ср(х, у) = V|/(jc, у) + 0(х, у), где эрмитова билинейная форма \у(х,у) симметричная, a Q(x,y)— кососимметричная.
12. Билинейные формы 391 Имеем ФО, х) = у(у9 х) + Q(y, x) для всех х,у. Принимая во внимание свойства форм \у(х,у) и 0(x,j>)> получаем такое соотношение: Складывая первое и третье равенство и вычитая из первого равенства третье, находим, что / 4 l < i 4  N1 *, 4 l < t Ч v(*, у)=-{ф(^ у) + ф(^, *)}> б(^ ^) = ~{Ф, у) - Теперь существование и единственность предполагаемого разложения становятся очевидными. 12.2. Конгруэнтные преобразования 12.2.1. Матрица билинейной формы 12.2-1.3 Представление через координаты Пусть еи ..., е„ — базис пространства и для векторов х, у заданы разложения Тогда имеет место представление для билинейной формы и представление для эрмитовой билинейной формы. Дополнение. Очевидно, принимая во внимание 12.1-4, 12.1-18. 12.2-2.3 Матрица билинейной формы Матрица Фе с элементами <р,у = ф(е„ ej) называется матрицей билинейной (эрмитовой билинейной) формы ц>(х,у) в выбранном базисе еь ..., еп. 12.2-3.3 Матричная запись билинейной формы Если хе, уе — вектор-столбцы арифметического пространства, составленные из координат векторов х, у в разложениях 12.2-1, то (p(jt, у) = х'е Ф^уе для билинейной формы и 5 у) = К^еУе Для эрмитовой билинейной формы.
392 Часть /. Математические сведения по линейной алгебре Дополнение. Проверяется непосредственно путем перемножения вектор-строки х'е (матрицы размера 1 * и), матрицы Фе размера n* n u вектор-столбца д>е или уе (матрицы размера п х 1). Согласно 3.2-5 матрица размера 1 * 1 отождествляется со своим элементом. 12.2-4.3 Представление через скалярное произведение Пусть в линейном пространстве скалярное произведение введено согласно 5.1-8. Тогда любая билинейная (эрмитова билинейная) форма имеет вид ф9 у) = (Ф>е, уе) (ф, у) = (Фе'хе, уе)). Здесь Фе — матрица формы в выбранном базисе. Дополнение. Проверяется непосредственно. 12.2-5.3 Матрицы симметричной и кососимметричной форм Симметричная и кососимметричная (эрмитова симметричная и эрмитова кососим- метричная) билинейные (эрмитово билинейные) формы как в вещественном, так и в комплексном случае имеют, соответственно, симметричную и кососимметричную (эрмитову и косоэрмитову) матрицы в любом базисе. Дополнение. Все ситуации рассматриваются совершенно одинаково. Поэтому ограничимся рассмотрением только эрмитовых форм. Если форма эрмитова симметричная (кососимметричная), то согласно определению 12.1-9 имеем ф(*> у) - ф(.У> х) (ф(х, у)-- (рСу, х)) . Согласно определению 12.2-2 для элементов матрицы Ф должны выполняться соотношения ц>и = ср7/ (фу = - сру/). Но это означает, что матрица формы эрмитова (косоэрмитова). 12.2-6.3 Комментарий (о новых типах матриц) Заметим, что если комплексные числа в действительности являются вещественными, вещественная симметричная матрица есть частный случай эрмитовой матрицы. Поэтому она обладает многими хорошими свойствами. Однако комплексная симметричная матрица, вообще говоря, аналогичными свойствами не обладает. То же самое можно сказать и о комплексной кососимметричной матрице. 12.2.2. Зависимость от выбора базиса 12.2-7.3 Комментарий (о матрице билинейной формы) При переходе от одного базиса к другому матрица билинейной формы меняется. Характер этого изменения полностью определяется видом 12.2-4 билинейной формы и соотношением 8.1-3, описывающим связь координат векторов в разных базисах.
12. Билинейные формы 393 12.2-8.3 Переход к другому базису Пусть Р— матрица преобразования координат при переходе от базиса е\, ..., е„ к базису /ь ...,/7. Тогда для матриц билинейной (эрмитовой билинейной) формы у(х,у) выполняются соотношения Дополнение. Согласно 8.1-3 имеем хе = Pxf, уе = Pyj. Для обыкновенной билинейной формы находим, принимая во внимание 12.2-4, 5.2-25, что ф(х, х) = (ФХ, уе) = (Ф'еРх/9 Pyf) = (Р'Ф'еРхх, у,). Поэтому Ф/= Р'ФеР. Для эрмитовой билинейной формы Ф, у) = ^ Поэтому Фу 12.2-9.3 Ранг билинейной формы Ранг матрицы билинейной формы не зависит от выбранного базиса. Он называется рангом билинейной формы. Дополнение. Согласно 8.1-4 матрица Р преобразования координат невырождена. Как вытекает из 4.4-18, любую невырожденную матрицу можно представить как произведение элементарных матриц. Но согласно 4.3-8 от умножения на элементарные матрицы ранг не меняется. Следовательно, ранг матрицы не меняется от умножения на любую невырожденную матрицу. Поэтому, принимая во внимание 12.2-8, заключаем, что ранг матрицы билинейной формы не зависит от базиса. 12.2-10.3 Дефект билинейной формы Разность между размерностью пространства и рангом билинейной формы называется дефектом билинейной формы. 12.2-11.3 Невырожденная билинейная форма Билинейная форма называется невырожденной, если ее дефект равен 0. 12.2.3. Конгруэнтные матрицы и преобразования 12.2-12.3 Конгруэнтные матрицы Матрицы, связанные соотношением 12.2-8, называются конгруэнтными (эрмитово конгруэнтными), а сами преобразования 12.2-8 называются конгруэнтными (эрмитово конгруэнтными) преобразованиями матрицы Фе. Если матрица Р в 12.2-8 является унитарной, то преобразование называется унитарно конгруэнтным.
394 Часть I. Математические сведения по линейной алгебре 12.2-13.3 Свойство конгруэнтности Отношение конгруэнтности есть отношение эквивалентности. Дополнение. Отношения конгруэнтности суть бинарные отношения. Они рефлексивны, т. к. Фе = Е'ФеЕ (Фе = Е'ФеЕ). Они симметричны, т. к. в силу невырожденности матрицы преобразования координат, имеем Если Фх = Р'ФеР, Ф8 = R^fR (Фу = Р'ФеР, Фя у то устанавливаем, что Ф, = Л'Ф7/г = R'P'OePR = (РЯ)'Фе(РК) (Ф8 = Л'Ф7Л = КР'ФеТИ = (РЯ)'Фе(РК))9 то есть транзитивность также имеет место. Согласно 1.3-4, 1.3-5 оба отношения конгруэнтности суть отношения эквивалентности. 12.2-14.3 Сохранение симметрии и кососимметрии При конгруэнтном (эрмитово конгруэнтном) преобразовании сохраняется симметричность и кососимметричность (эрмитовость и косоэрмитовость) матрицы как в вещественном, так и в комплексном случае. 12.2-15.3 Изоморфное соответствие Между линейными пространствами билинейных и эрмитовых билинейных форм в комплексном (вещественном) «-мерном пространстве и линейным пространством квадратных матриц порядка п с комплексными (вещественными) элементами существуют изоморфные соответствия. Дополнение. Пусть в пространстве фиксирован базис еь -.-,еп. Согласно 12.2-2 каждая форма у(х,у) однозначно порождает матрицу Фе формы. Согласно 12.2-4 каждая матрица Фе порождает форму ц>(х,у). Если в форму <р(х,у) из 12.2-4 подставить х = ehy= вр то получим элемент матрицы Фе, стоящий в позиции (ij). Поэтому соответствие между формами и матрицами при фиксированном базисе оказывается взаимно однозначным. Очевидно, что при таком соответствии сумме форм соответствует сумма матриц, произведению формы на число — произведение матрицы на то же число. Согласно 1.7-13 такое соответствие есть изоморфизм.
12. Билинейные формы 395 12.2-1 б.3 Симметрия в изоморфизме В изоморфизме 12.2-15 симметричной и кососимметричной (эрмитовой симметричной и эрмитовой кососимметричной) билинейной форме соответствуют симметричная и кососимметричная (эрмитова и косоэрмитова) матрица. Дополнение. Очевидно, принимая во внимание 12.2-5. 12.2-17.3 Комментарий (о новых проблемах) В задачах со скалярными произведениями наиболее важным моментом является умение вычислять сами скалярные произведения для конкретных пар векторов. В предыдущих исследованиях вопрос о том, как это делать наиболее рационально, не был изучен детально. Принципиальным было лишь предположение о том, что процесс вычисления скалярных произведений каким-то образом можно осуществить. Оно оправдывалось двумя обстоятельствами. Во-первых, в 5.1-8 был предложен вполне определенный способ введения скалярных произведений через координаты векторов в естественном базисе. И, во-вторых, в 5.2-14 было показано, что в пространствах со скалярными произведениями, обладающими свойствами 5.1-2, 5.1-3, существует класс ортонормированных базисов, в каждом из которых скалярное произведение выражается через координаты векторов снова согласно 5.1-8. Естественный базис также входит в данный класс, В пространствах с "ослабленными" скалярными произведениями, каковыми в общем случае могут быть билинейные формы, такой подход уже невозможен. Если произвольную билинейную форму снова ввести по формулам 5.1-8, то она заведомо будет обладать симметрией. Но это свойство у билинейной формы присутствовать не обязано. Традиционные скалярные произведения обладают свойством симметрии. Поэтому матрицы соответствующих билинейных форм всегда будут либо вещественными симметричными, либо комплексными эрмитовыми. В обоих случаях они нормальные и имеют множество хороших свойств. Для таких билинейных форм задача выбора наиболее удобного базиса состоит в конгруэнтном преобразовании одной нормальной матрицы к наиболее простому виду. Если же симметрия в билинейной форме отсутствует, то в соответствии с 12.1-11, 12.1-26, 12.2-5 приходится одним и тем же конгруэнтным преобразованием приводить к наиболее простому виду уже не одну, а пару матриц: или симметричную и кососимметричную для обыкновенных билинейных форм, или эрмитову и косоэрмитову для эрмитовых билинейных форм. В комплексном случае ни одна из матриц первой пары, вообще говоря, не является даже нормальной. Не сразу можно понять, какие результаты здесь следует ожидать. Другие отличия свойств билинейных форм от свойств традиционных скалярных произведений также приводят к каким-то изменениям. Все это мы будем изучать в процессе освоения нового материала. 12.2.4. Унитарные конгруэнтные преобразования 12.2-18.4 Унитарная конгруэнтность диагональной матрице Любая нормальная матрица приводится к диагональной эрмитово конгруэнтным преобразованием с унитарной матрицей.
396 Часть I. Математические сведения по линейной алгебре Дополнение. Пусть А — нормальная матрица. Согласно 10.2-17 существует унитарная матрица Q и диагональная матрица Л такие, что Л = Q*AQ. Обозначим Р = Q. Матрица Р унитарная. Равенство же Л = Р'АР говорит о том, что матрица А эрмитово конгруэнтна диагональной матрице. 12.2-19.4 Унитарная конгруэнтность треугольной матрице Любая комплексная матрица приводится к треугольной эрмитово конгруэнтным преобразованием с унитарной матрицей. Дополнение. Это есть всего лишь уместная здесь переформулировка утверждения 10.2-13. 12.2-20.4 Вещественная ортогональная конгруэнтность Любая вещественная матрица приводится вещественным конгруэнтным преобразованием с ортогональной матрицей к блочной правой треугольной матрице с диагональными блоками первого и второго порядка. Дополнение. Это есть прямое следствие определения 12.2-12 и утверждения 10.2-27. 12.2-21.4 Комментарий (об унитарной конгруэнтности) Заметим, что в трех последних утверждениях констатируется только возможность выполнения соответствующих преобразований, но ничего не говорится о том, как их осуществлять. 12.2.5. Общие конгруэнтные преобразования 12.2-22.3 Конгруэнтное преобразование произвольной матрицы Используя идеи метода Гаусса, можно попытаться с помощью последовательности элементарных конгруэнтных преобразований привести матрицу к достаточно простому виду. Или, другими словами, попытаться с помощью последовательности переходов найти такой базис в линейном пространстве, в котором матрица билинейной формы будет достаточно простой. Рассмотрим несколько типичных ситуаций конгруэнтного преобразования матрицы А с элементами atJ. 1. Элемент au Ф0. Подбирая, как в методе Гаусса, последовательность левосторонних преобразований с элементарными неунитарными матрицами Nj\, />2, можно сделать все поддиагональные элементы матрицы в первом столбце нулевыми. Последующее умножение справа на транспонированные (или сопряженные) матрицы N'n (#*,) не изменяет элементы первого столбца. В результате выполнения таких конгруэнтных преобразований все поддиагональные элементы матрицы в первом столбце будут нулевыми. 2. Элемент ап = 0, но для некоторого /, /> 2, элемент au Ф 0. Выполняя конгруэнтное преобразование с элементарной матрицей перестановок PXh элемент я;/ переставляем на место элемента au. После этого оказываемся в ситуации 1.
12. Билинейные формы 397 3. Все диагональные элементы равны нулю, но имеется пара элементов atJ и a}i таких, что ay + uji 4- 0. После выполнения конгруэнтного преобразования с элементарной неунитарной матрицей Nif{\) на диагонали появляется элемент а,у + ajh и мы оказываемся в ситуации 2. Предположим, что исходная матрица А не была кососим- метричной. Тогда независимо от того, выполняется ли обыкновенное или эрмитово конгруэнтное преобразование, мы имеем возможность выполнять несколько раз (точнее, хотя бы один раз) преобразования, описанные в ситуациях 1—3. Следовательно, с их помощью матрицу А заведомо можно привести к блочной правой ( К L Л треугольной матрице второго порядка , где К— правая треугольная мат- ^0 М) рица порядка не меньше 1 с ненулевыми диагональными элементами. Если вторая блочная строка отсутствует, то процесс преобразования закончен. Если же она присутствует, то матрица Л/— кососимметричная. Допустим, что матрица М не нулевая. С помощью конгруэнтных перестановок строк и столбцов можно добиться того, что в левом верхнем ее углу будет находиться невырожденный блок вто- ;к l , рого порядка. Теперь представим матрицу | л 1#| в аналогичном виде с той лишь разницей, что матрица К будет иметь на 1 меньший порядок. Тогда в левом верхнем углу матрицы М будет стоять минор порядка 3, который описывает такую ситуацию. 4. В матрице А в левом верхнем углу стоит минор порядка 3, имеющий вид 0 0а 0 а. '32 где элементы яп, я2з и Я32 отличны от нуля. Выполнив конгруэнтное преобразование с умножением слева на матрицу Л^з(ос), мы получим матрицу аа2 0 0 Для случая эрмитова конгруэнтного преобразования результат будет аналогичным. Лишь в первом столбце а меняется на а. Если а не равно ни одному из чисел 0, — ctnan > ~ а\\ап > то все ТРИ веДуЩих минора этой матрицы будут отличны от нуля. Преобразования, описанные в ситуации 1, не меняют ведущие миноры. Поэтому их можно выполнить три раза подряд. Итак, если матрица А не была ко- сосимметричной, то с помощью обыкновенного или эрмитова конгруэнтного преобразования ее можно привести к правой трапециевидной матрице. 5. Пусть матрица А кососимметричная, в ее левом верхнем углу стоит невырожденный минор второго порядка и выполняется обыкновенное конгруэнтное преобра-
398 Часть I. Математические сведения по линейной алгебре (В -D'} зование. Представим матрицу А в блочном виде , где блок В второго \D F ) порядка. Выполнив конгруэнтное преобразование с блочной матрицей ( Е <0 Р' = j , мы получим блочно-диагональную кососимметричную матри^DB~l E) цу с блоком В в левом верхнем углу. 6. Пусть матрица А кососимметричная, в ее левом верхнем углу стоит невырожденный минор второго порядка и выполняется эрмитово конгруэнтное преобразование. Любая невырожденная кососимметричная матрица второго порядка становится невырожденной диагональной матрицей, если выполнить эрмитово конгруэнтное преобразование с матрицей G = . Поэтому, выполнив с блочной I' U матрицей А эрмитово конгруэнтное преобразование с блочно-диагональной мат- (G 0\ рицей , мы снова получим блочную матрицу, но теперь в левом верхнем V j углу будет стоять диагональная матрица второго порядка с ненулевыми диагональными элементами. Этот случай описан в ситуации 1. 12.2-23.3 Конгруэнтность трапециевидной матрице Комплексная матрица эрмитово конгруэнтна правой трапециевидной матрице. Дополнение. Это есть прямое следствие алгоритма, описанного в 12.2-22. 12.2-24.3 Конгруэнтность блочно-диагональной матрице Вещественная (комплексная) кососимметричная матрица вещественно (комплексно) конгруэнтна блочно-диагональной матрице с блоками 2-го и 1-го порядков. При этом все блоки 2-го порядка являются невырожденными кососимметричными матрицами, блоки 1-го порядка — нулевые. Дополнение. Это есть прямое следствие алгоритма, описанного в 12.2-22, а также утверждения 12.2-14. 12.2-25.3 Конгруэнтность диагональной матрице Вещественная (комплексная) симметричная матрица вещественно (комплексно) конгруэнтна диагональной матрице. Дополнение. Это есть прямое следствие алгоритма, описанного в 12.2-22, а также утверждения 12.2-14.
12. Билинейные формы 399 12.2-26.3 Еще раз об этом Эрмитова матрица эрмитово конгруэнтна вещественной диагональной матрице. Дополнение. Это есть прямое следствие 12.2-23, 12.2-14. 12.2-27.3 Снова конгруэнтность трапециевидной матрице Вещественная (комплексная) матрица, не являющаяся кососимметричной, вещественно (комплексно) конгруэнтна правой трапециевидной матрице. Дополнение. Это есть прямое следствие алгоритма, описанного в 12.2-22. 12.2-28.3 Комментарий (о произвольности матриц преобразования) Обратим внимание на то, что в последних утверждениях подразумеваются матрицы конгруэнтного преобразования достаточно произвольного вида. Во всяком случае, они не имеют какой-либо явной специфики, в том числе в случае преобразования вещественной симметричной матрицы. 12.2-29.3 Комментарий (еще раз о матрицах преобразования) В общем случае не всегда можно сказать заранее, какой вид будет иметь матрица конгруэнтного преобразования при переходе к трапециевидной матрице. Однако при некоторых дополнительных ограничениях, накладываемых на исходную матрицу, на этот вопрос можно дать вполне определенный ответ. При этом широко используются различные мультипликативные разложения матрицы. 12.2-30.3 Критерий конгруэнтности Для того чтобы матрица могла быть приведена к правой трапециевидной с помощью конгруэнтного (эрмитово конгруэнтного) преобразования с правой треугольной матрицей, необходимо и достаточно, чтобы число первых ненулевых ведущих миноров преобразуемой матрицы равнялось ее рангу. Дополнение. Пусть квадратная матрица А порядка т и ранга г имеет ненулевые первые г ведущих миноров. В полной аналогии с дополнением к 11.1-4 можно выполнить г шагов метода Гаусса и получить равенство lr) ... N2i(a2{)A. Все матрицы Ny{aij) представляют левые треугольные матрицы с единичными диагональными элементами. Поэтому их произведение Nr есть также левая треугольная матрица с единичными диагональными элементами. Согласно 4.3-8 ранг матрицы Ur равен г. Но по построению первые г столбцов матрицы Ur являются столбцами правой треугольной матрицы, причем диагональные элементы отличны от нуля. Если бы в последних т-г строках матрицы Ur существовал хотя бы один ненулевой элемент, то в матрице Ur имелся бы ненулевой минор порядка г + 1, что невозможно. Следовательно, матрица Ur является правой трапециевидной. Умно-
400 Часть I. Математические сведения по линейной алгебре жение матрицы Ur справа на любую правую треугольную матрицу с ненулевыми диагональными элементами не изменяет ее трапециевидность. Обозначим Р = N'r. Это есть правая треугольная матрица с ненулевыми диагональными элементами. Согласно сказанному матрица Р'АР = UrP (Р'АР = UrP) конгруэнтна (эрмитово конгруэнтна) матрице А и является правой трапециевидной. Предположим теперь, что существует правая треугольная матрица Р с ненулевыми диагональными элементами pu, ...,pmm такая, что матрица S = Р'АР (К = Р'АР) является правой трапециевидной ранга г. По определению 12.2-12 матрица Л конгруэнтна (эрмитово конгруэнтна) матрице S (К). Обозначим через Ah Ph Sh К, матрицы ведущих миноров порядка / матриц A,P,S,K для всех /, 1 <t<m. Легко проверить, что выполняются равенства p;a,p,=s, (p;a,p,=k,). Принимая во внимание 4.1-12, 4.1-21, 4.2-10, заключаем, что Если S (К) является правой трапециевидной матрицей ранга г, то первые г ее диагональных элементов отличны от нуля, а остальные равны нулю. Поэтому первые г ведущих миноров матрицы А отличны от нуля, а остальные равны нулю. Умножение на треугольную матрицу можно рассматривать как выполнение последовательности элементарных преобразований. Согласно 4.3-8 матрицы А и S (А и К) имеют одинаковые ранги. 12.2.6. Билинейные формы в паре базисов 12.2-31.3 Представление в паре базисов Пусть еь ..., е„ и qx, ..., qn — два базиса пространства и для векторов х,у заданы разложения Тогда имеет место представление u, у= для билинейной формы и представление для эрмитовой билинейной формы. Дополнение. Очевидно, принимая во внимание 12.1-4, 12.1-18.
12. Билинейные формы 401 12.2-32.3 Матрица формы в паре базисов Матрица Фец с элементами ф,, = ф(е„ qj) называется матрицей билинейной (эрмитово билинейной) формы ф(х, у) в выбранной паре базисов. 12.2-33.3 Матричная запись билинейной формы Если хе9 уч — вектор-столбцы арифметического пространства, составленные из координат векторов х,у в разложениях 12.2-31, то (р(х,у) = х\Фе(уц для билинейной формы и ф(х, у) = х'е Фец yq для эрмитовой билинейной формы. Дополнение. Проверяется непосредственно путем перемножения вектор-строки х'е (матрицы размера 1 * п), матрицы Феч размера и х л и вектор-столбца yq или yq (матрицы размера п * \). Согласно 3.2-5 матрица размера 1 * 1 отождествляется со своим элементом. 12.2-34.3 Представление через скалярное произведение Пусть в линейном пространстве скалярное произведение введено согласно 5.1-8. Тогда любая билинейная (эрмитова билинейная) форма имеет вид ф(*, у) = (Ф'ечхе, yq) (ф(х, у) = {Ф[цхе, уц)). Здесь Фщ — матрица формы в выбранной паре базисов. Дополнение. Проверяется непосредственно. 12.2-35.3 Переход к другому базису Пусть Р— матрица преобразования координат при переходе от базиса еи ••-, еп к базису /ь ...,fn, Q— матрица преобразования координат при переходе от базиса q\9...9qn к базису tb...,tn. Тогда для матриц билинейной (эрмитово билинейной) формы ф(х, у) выполняются соотношения Дополнение. Согласно 8.1-3 имеем хе = Pxj, уч = Qyt. Для обыкновенной билинейной формы находим, принимая во внимание 12.2-34, 5.2-25, что Ф, У) = (Ф1Л<, Уч) = (****,, 07,) = {п'Ф'ечРхп у,). Поэтому Фу/ = Р'Феч(). Для эрмитовой билинейной формы Ф, У) = (Ф;*„ у,) = (Ф'щРх,, Qy,) = (Q'V^Px,, у,). Поэтому Фу = Р'Феч Q.
402 Часть I. Математические сведения по линейной алгебре 12.2-36.3 Множество матриц в паре базисов Множество матриц одной и той же формы <p(jc,j>) в различных парах базисов есть множество эквивалентных матриц. Дополнение. Очевидно, если сравнить определение 8.1-11 и преобразование матрицы формы согласно 12.2-35. 12.2-37.3 Простейший вид матрицы формы Для любой билинейной (эрмитовой билинейной) формы всегда существует такая пара базисов, в которых матрица формы является диагональной, с элементами 0 и 1 на диагонали. Дополнение. Это есть прямое следствие утверждений 12.2-36 и 8.1-15. 12.3. Квадратичные формы 12.3.1. Квадратичная и полярная формы 12.3-1.4 Комментарий (о выборе билинейных форм) Если в линейном пространстве в качестве скалярного произведения используется произвольная билинейная или эрмитова билинейная форма, то и в этом случае при решении самых разных задач необходимо иметь дело с системами уравнений вида 6.8-2. Многое зависит от того, насколько простой вид может приобрести матрица системы в зависимости от выбора базиса. С точностью до транспонирования она совпадает с матрицей билинейной формы. Как показали проведенные исследования, вообще говоря, нельзя надеется на ее вид более простой, чем треугольный. Для традиционных скалярных произведений матрица системы 6.8-2 может быть выбрана единичной, если взять ортонормированный базис. В терминах конгруэнтности это означает, что матрицы традиционных скалярных произведений всегда конгруэнтны единичной матрице. Собственно говоря, именно из данного факта вытекают многие замечательные результаты в евклидовых и унитарных пространствах. Поэтому очень важно выделить такие классы билинейных и эрмитовых билинейных форм, для которых их матрицы даже при ослабленных требованиях будут конгруэнтны единичной или хотя бы диагональной матрице. Важно также получить критерии принадлежности таких матриц выделенным классам. Заметим, что один класс ослабленных скалярных произведений уже указан. Это комплексные симметричные билинейные формы. Согласно 12.2-25 любая комплексная симметричная матрица конгруэнтна диагональной. Оказывается, что как выделение классов, так и получение критериев можно осуществить, изучая билинейные и эрмитовы билинейные формы лишь на совпадающих векторах. К тому же, необходимость рассмотрения именно такого случая навевается четвертыми свойствами скалярных произведений из 5.1-2, 5.1-3, а также тождествами 12.1-12, 12.1-20.
12. Билинейные формы 403 12.3-2.3 Квадратичная форма Квадратичной формой в комплексном (вещественном) линейном пространстве К называется числовая функция ф(лг, х) от одного векторного аргумента х е К, которая получается из билинейной формы ц>(х,у) заменой вектора у на вектор х. 12.3-3.3 Восстановление билинейной формы Какова бы ни была квадратичная форма, существует единственная симметричная билинейная форма, из которой может быть получена заданная квадратичная форма. Дополнение. Существование и единственность восстановленной симметричной билинейной формы является прямым следствием тождества 12.1-12. 12.3-4.3 Полярная билинейная форма Симметричная билинейная форма, из которой может быть получена заданная квадратичная форма, называется полярной по отношению к этой квадратичной форме. 12.3-5.3 Симметричная часть разложения формы Пусть билинейная форма ц>(х, у) порождает квадратичную форму ф(х, х). Полярная по отношению к (р(х, х) билинейная форма совпадает с симметричной билинейной формой в разложении ф(;с, у) на симметричную и кососимметричную составляющие согласно 12.1-11. Дополнение. Очевидно, принимая во внимание 12.1-11, 12.1-12. 12.3-6.3 Комментарий (о множестве порождающих форм) Множество всех билинейных форм, порождающих одну и ту же квадратичную форму, может быть получено путем сложения полярной билинейной формы и произвольной кососимметричной формы. Невозможность восстановления билинейной формы по квадратичной объясняется тем, что согласно 12.1-13 квадратичная форма не дает никакой информации о кососимметричной части любой билинейной формы. 12.3.2. Эрмитова квадратичная форма 12.3-7.3 Эрмитова квадратичная форма Эрмитовой квадратичной формой в комплексном пространстве называется числовая функция ф(х5 jc) от одного векторного аргумента х, которая получается из эрмитовой билинейной формы <р(х, у) заменой вектора^ на вектор л;. 12.3-8.3 Восстановление эрмитовой формы Какова бы ни была эрмитова квадратичная форма, существует единственная эрмитова билинейная форма, из которой может быть получена заданная эрмитова квадратичная форма. i
404 Часть I. Математические сведения по линейной алгебре Дополнение. Существование и единственность восстановленной эрмитовой билинейной формы является прямым следствием тождества 12.1-20. 12.3-9.3 Комментарий (о единственности восстановлений) Согласно 12.1-13 значение любой кососимметричной билинейной формы на любой паре совпадающих векторов равно нулю. Поэтому, какую бы кососимметричную билинейную форму не прибавить к любой заданной билинейной форме, эта сумма будет порождать одну и ту же квадратичную форму. Вот почему восстановление порождающей билинейной формы можно осуществить только с точностью до слагаемого, представляющего произвольную кососимметричную билинейную форму. И именно поэтому единственным образом, принимая во внимание 12.1-11, можно восстановить симметричную билинейную форму, порождающую заданную квадратичную. В отличие от 12.1-13, если значения эрмитовой формы на совпадающих векторах всегда равны нулю, то согласно 12.1-22 такая форма может быть только нулевой. Это свойство и гарантирует единственность восстановления по заданной эрмитовой квадратичной форме порождающую ее эрмитову билинейную форму. 12.3.3. Матрица квадратичной формы 12.3-10.3 Матрица квадратичной формы Пусть в базисе еи ...,е„ вектор х имеет координаты хи ...,*„. Тогда квадратичная форма в этом базисе имеет вид: Матрица А с элементами al} называется матрицей квадратичной формы. Дополнение. Это есть прямое следствие 12.1-4. 12.3-11.3 Комментарий (о матрице квадратичной формы) Если исходная билинейная форма не была симметричной, то может не быть симметричной и матрица порожденной ею квадратичной формы. И это несмотря на то, что согласно 12.3-3 билинейную форму, порождающую заданную квадратичную форму, всегда можно считать симметричной. Все определяется тем, как будут распределены коэффициенты аи и а}1 при приведении подобных членов у равных произведений хрс, и XjXj. Следует также помнить, что матрица квадратичной формы зависит от выбора базиса. 12.3-12.3 Симметричная квадратичная форма Квадратичная форма называется симметричной (кососимметричной), если ее матрица симметричная (кососимметричная).
12. Билинейные формы 405 12.3-13.3 Симметризация матрицы квадратичной формы Без ограничения общности матрицу квадратичной формы всегда можно считать симметричной и совпадающей с матрицей полярной билинейной формы, порождающей квадратичную форму. Симметричная матрица квадратичной формы определяется однозначно. Дополнение. Представим матрицу А квадратичной формы в виде суммы Л=В + С, где В— симметричная матрица, С— кососимметричная. Пусть аф bip Су — элементы матриц А, В, С. Имеем аУ = bij + Cip Ьц = bjh Cjj = - Ср для всех i,j. Перепишем квадратичную форму 12.3-10 иначе, т. е. пи пи п п ? X aux'xJ = Z Z V/*/+ 2 ? cux>xi ¦ i=\j=l /=l7=l i=lj=l Согласно 12.1-13, вторая двойная сумма справа принимает нулевые значения на всех векторах х. При разложении билинейной формы в сумму симметричной и ко- сосимметричной ее матрица также раскладывается в сумму симметричной и косо- симметричной. Поэтому матрица В задает полярную билинейную форму, порождающую квадратичную форму с матрицей А. Единственность симметричной матрицы квадратичной формы определяется согласно 12.3-3 единственностью полярной билинейной формы. 12.3.4. Матрица эрмитовой квадратичной формы 12.3-14.3 Матрица эрмитовой квадратичной формы Пусть в базисе еь ...,е„ вектор х имеет координаты х\, ...,*„. Тогда эрмитова квадратичная форма в этом базисе имеет вид: / = i / = 1 Матрица А с элементами ач называется матрицей эрмитовой квадратичной формы. Она совпадает с матрицей эрмитовой билинейной формы, порождающей эрмитову квадратичную форму, и определяется однозначно. Дополнение. Это есть прямое следствие 12.1-18, 12.2-1, 12.2-2, 12.3-8. 12.3-15.3 Эрмитова симметричная квадратичная форма Эрмитова квадратичная форма называется эрмитовой симметричной (эрмитовой кососимметричной), если ее матрица эрмитова (косоэрмитова). 12.3-1 б.3 Разложение эрмитовой квадратичной формы Представим матрицу эрмитовой квадратичной формы в виде суммы эрмитовой и ко- соэрмитовой матриц. Это дает разложение эрмитовой квадратичной формы в сумму
406 Часть I. Математические сведения по линейной алгебре эрмитовых симметричной и кососимметричной квадратичных форм. При этом матрица эрмитовой симметричной (эрмитовой кососимметричной) квадратичной формы совпадает с эрмитовой (косоэрмитовой) составляющей разложения матрицы исходной эрмитовой квадратичной формы. Дополнение. Согласно 10.3-24 представим матрицу А эрмитовой квадратичной формы в виде суммы А = В + С, где В — эрмитова матрица, С — косоэрмитова. Если a,j, by, Су — элементы матриц Л, В, С, то п п п п п я Z Z <w = Z ? V/*>+ Z Z w, • Первая двойная сумма справа дает эрмитову симметричную квадратичную форму, вторая — эрмитову кососимметричную. 12.3.5. Представления через скалярные произведения 12.3-17.3 Представление квадратичной формы Пусть в арифметическом пространстве скалярное произведение введено согласно 5.1-8 по отношению к естественному базису. Если А есть матрица, транспонированная к матрице квадратичной формы ц>(х, х), то сама квадратичная форма может быть представлена в виде ф(х, х) = {Ах, х У Дополнение. Проверяется непосредственно, принимая во внимание 12.2-2, 12.2-4, 12.3-10. 12.3-18.3 Представление эрмитовой квадратичной формы Пусть в арифметическом пространстве скалярное произведение введено согласно 5.1-8 по отношению к естественному базису. Если А есть матрица, транспонированная к матрице эрмитовой квадратичной формы ф(х, х), то сама эрмитова квадратичная форма может быть представлена в виде ф(х, х) = (Ах, х) Дополнение. Проверяется непосредственно, принимая во внимание 12.2-2, 12.2-4, 12.3-14. 12.3-19.3 Представление суммой Пусть эрмитова квадратичная форма задана скалярным произведением (Ах, х). Всегда имеет место представление где матрицы В, С эрмитовы.
12. Билинейные формы 407 Дополнение. Представим матрицу А согласно 10.3-24 в виде суммы А = ? + /С, где матрицы В, С эрмитовы. Остальное следует из свойств скалярного произведения. 12.3-20.3 Комментарий (еще раз о симметричных формах) Принимая во внимание 12.2-5, 12.3-3, 12.3-17, матрицу А в 12.3-17 без ограничения общности можно считать симметричной. Поэтому часто сразу предполагают, что квадратичная форма задается симметричной матрицей. Принимая во внимание 12.2-5, 12.3-8, 12.3-18, 12.3-19 также говорят, что эрмитова квадратичная форма задается парой эрмитовых симметричных квадратичных форм. 12.3-21.3 Критерий эрмитовой симметричности Пусть эрмитова квадратичная форма задана в арифметическом пространстве. Эта форма является эрмитово симметричной (эрмитово кососимметричной) тогда и только тогда, когда на всех векторах пространства она принимает вещественные (чисто мнимые) значения. Дополнение. Пусть квадратичная эрмитова форма 12.3-14 является симметричной. Согласно 12.3-15 матрица формы эрмитова, т. е. в соответствии с 10.3-3 а0 = а^. В частности, диагональные элементы аи вещественные для всех /. Имеем / = 1 j - 1 i = \ j = I j' = 1 j = / + 1 / = I i = 1 j = i + I Правая часть этого равенства является вещественной при любых xh Xj. Предположим теперь, что квадратичная эрмитова форма 12.3-14 принимает вещественные значения при любых xhxj. Рассмотрим естественный базис еь ...,еп. Очевидно, что Ф(е*» ек) = акк, ф(еу, es) = a,,, eS9 ек + е,) = акк + а,, + aks + ash /е,, ек + ies) = акк + ass + iask - iah. По условию правые части этих равенств вещественные. Поэтому aks = ask для всех к, s, т. е. матрица Л согласно 10.3-3 является эрмитовой.
408 Часть I. Математические сведения по линейной алгебре 12.4. Закон инерции квадратичных форм 12.4.1. Главные оси и канонические базисы 12.4-1.3 Комментарий (о функциях второго порядка) Представления 12.3-10 и 12.3-14 задают общий вид алгебраических функций второго порядка. Естественно поставить вопрос о наиболее простом виде этих функций, к которому можно их привести с помощью линейной невырожденной замены переменных. Ответ дается на основе утверждений 12.2-25 и 12.2-23. Он будет не одинаков для билинейных и эрмитово билинейных квадратичных форм. 12.4-2.3 Канонический базис квадратичной формы Пусть квадратичная форма задана в арифметическом пространстве. Существует базис, в котором матрица квадратичной формы является диагональной. Этот базис называется каноническим базисом квадратичной формы. В нем квадратичная форма имеет вид который называется каноническим или суммой квадратов. Числа Xh ...Д„ называются каноническими коэффициентами. Дополнение. В условиях и обозначениях 12.3-10 введем скалярное произведение согласно 5.1-8. Тогда квадратичную форму можно записать в виде скалярного произведения ФО, *) = ? X аух^ = (Ах, F), где А — матрица квадратичной формы. Согласно 12.3-13 матрицу А можно считать симметричной. В силу 12.2-25 существует диагональная матрица Л и невырожденная матрица Р такие, что А = Р'АР. Если z = Рх, то принимая во внимание 5.2-25, находим, что (Ах, х) = (Р'КРх, х) = (АРх, (Р')*х) = (Л2, J). Обозначим через Х\, ...Д„ диагональные элементы матрицы Л, через zu ...,zn — координаты вектора 2. Тогда y(z,z) = X]zf +...+Xnz2n. 12.4-3.4 Главные оси квадратичной формы Для квадратичной формы в евклидовом арифметическом пространстве существует ортонормированный канонический базис. Векторы этого базиса называются главными осями квадратичной формы. Дополнение. Согласно 10.3-14 матрицу Р в дополнении к 12.4-2 можно взять вещественной ортогональной. Согласно восьмому пункту 10.2-9 главные оси квад-
12. Билинейные формы 409 ратичной формы как образы векторов естественного базиса представляют орто- нормированный базис. 12.4-4.4 Комментарий (главные оси и конгруэнтное преобразование) Заметим, что квадратичную форму в евклидовом арифметическом пространстве можно, но совсем не обязательно задавать вещественной симметричной матрицей. Если квадратичная форма задана произвольной вещественной матрицей, то такую форму также можно привести к главным осям. Но отсюда нельзя делать вывод, что произвольная вещественная матрица конгруэнтна диагональной. Иногда и эрмитову квадратичную форму можно привести к диагональному виду. В этом случае будут использоваться те же самые названия, что и для квадратичной формы: канонический вид, главные оси и т. п. 12.4-5.3 Треугольный базис Существует базис, в котором матрица эрмитовой квадратичной формы является треугольной. Дополнение. В условиях и обозначениях 12.3-14 введем скалярное произведение согласно 5.1-8. Тогда эрмитову квадратичную форму можно записать в виде скалярного произведения где А — матрица формы. В силу 12.2-23 существует треугольная матрица В и невырожденная матрица Р такие, что А = Р'ВР . Если z-Px, то, принимая во внимание 5.2-25, находим, что (Ах, х) = (Р'ВРх, х) = (ВРх, (/>')•*) = (Bz, z). В новом базисе матрица эрмитовой квадратичной формы уже треугольная, более того, даже трапециевидная. 12.4-6.3 Вещественные канонические коэффициенты Для вещественной (эрмитово,симметричной) квадратичной формы существует вещественный (комплексный) канонический базис, в котором все канонические коэффициенты равны + 1, - 1 и 0. Дополнение. Пусть в каноническом базисе с координатами zb ..., zn вещественная квадратичная форма или эрмитова симметричная квадратичная форма имеет вещественные канонические коэффициенты А.р... Д„. Сделаем замену переменных z = если А,. =0.
410 Часть I. Математические сведения по линейной алгебре В новых переменных квадратичная форма будет снова иметь канонический вид, но канонические коэффициенты будут равны + 1, - 1 и 0. 12.4-7.4 Еще раз о главных осях Для эрмитовой симметричной (эрмитовой кососимметричной) квадратичной формы в унитарном пространстве существует ортонормированный канонический базис. Все канонические коэффициенты являются вещественными (чисто мнимыми) числами. Векторы этого базиса называются главными осями эрмитовой симметричной (эрмитовой кососимметричной) квадратичной формы. Дополнение. Согласно 12.3-15 матрица А эрмитовой симметричной (эрмитовой кососимметричной) квадратной формы является эрмитовой (косоэрмитовой). Эрмитова и косоэрмитова матрицы входят в класс нормальных матриц. Поэтому в силу 10.2-17 матрицу Р в дополнении к 12.4-5 можно взять унитарной, а матрицу Б— диагональной. Согласно седьмому пункту из 10.2-9 главные оси эрмитовой квадратичной формы как образы векторов естественного базиса представляют ортонормированный базис. Канонические коэффициенты являются диагональными элементами матрицы В. Согласно 10.3-9 A0.3-17) они являются вещественными (чисто мнимыми) для эрмитовой симметричной (эрмитовой кососимметричной) квадратичной формы. 12.4.2. Закон инерции квадратичных форм 12.4-8.4 Закон инерции квадратичных форм Если вещественная (эрмитова симметричная) квадратичная форма приводится с помощью линейной невырожденной замены переменных к каноническому виду, то число положительных, отрицательных и нулевых канонических коэффициентов не зависит от способа приведения. Дополнение. Рассмотрим, например, случай эрмитовой квадратичной формы. Предположим, что с помощью двух замен переменных z = Qx и v = Rx эрмитова квадратичная форма (Ах, х) приводится к двум каноническим видам с диагональными матрицами Ai и Л2. Обозначим через Х{,...,Х'п и X", ...Д" диагональные элементы этих матриц. Не ограничивая общности, будем считать, что сначала расположены положительные диагональные элементы, затем — отрицательные и в конце — нулевые. Матрицы Aj и Л2 конгруэнтны одной и той же матрице А. Согласно 12.2-13 отношение конгруэнтности транзитивно. Следовательно, матрицы Aj и А2 конгруэнтны между собой. В силу 4.4-26 ранги обеих матриц одинаковы. Поэтому число нулевых диагональных элементов в матрицах А! и Л2 одинаково. Пусть Х'р и X" — последние положительные диагональные элементы в своих матрицах и, например, q>р. В силу конгруэнтности матриц А\ и А2 существует невырожденная матрица U такая, что Л, = U'A2U . По предположению, ведущий
12. Билинейные формы 411 минор порядка р + 1 матрицы Ль очевидно, является отрицательным. С другой стороны, используя 4.2-13, находим, что \1 2 ... I "Г2"' Из-за невырожденности матрицы U в ее первых р + 1 столбцах найдется хотя бы один ненулевой минор порядкар+ 1, собственные значения Х", ...Д* + 1 положительны в силу предположения q > р. Полученное противоречие говорит о том, что q=p. Очевидно также, что в матрицах А{ и Л2 одинаково число отрицательных диагональных элементов. 12.4-9.4 Матричная форма закона инерции Если вещественная симметричная (эрмитова) матрица приводится вещественным конгруэнтным (эрмитово конгруэнтным) преобразованием к диагональному виду, то число положительных, отрицательных и нулевых элементов на диагонали не зависит от способа приведения. Дополнение. Это всего лишь другая формулировка утверждения 12.4-8. 12.4-10.4 Индексы инерции, сигнатура, ранг Число положительных (отрицательных) канонических коэффициентов в утверждении 12.4-8 называется положительным (отрицательным) индексом инерции. Разность между положительным и отрицательным индексами называется сигнатурой. Общее число ненулевых канонических коэффициентов называется рангом квадратичной формы. 12.4-11.4 Свойство LD/J'-разложения Пусть для эрмитовой матрицы А существует LD/Лразложение, где L — невырожденная левая треугольная матрица, D — диагональная. Тогда число нулевых, положительных и отрицательных диагональных элементов матрицы D совпадает с числом нулевых, положительных и отрицательных собственных значений матрицы А. Дополнение. Если для матрицы А существует разложение А = LDL*, то матрица А конгруэнтна матрице Д т. к.
412 Часть I. Математические сведения по линейной алгебре С другой стороны, матрица А является нормальной и согласно 10.2-17, 10.3-9 существует вещественная диагональная матрица Л и унитарная матрица Q такие, что Л = Q*AQ. Это означает, что матрица А также конгруэнтна матрице Л, т. к. В силу 12.4-9 матрицы D и Л имеют одинаковые числа положительных, отрицательных и нулевых диагональных элементов. Диагональные же элементы матрицы Л являются собственными значениями матрицы А. 12.4-12.4 Единичная матрица квадратичной формы Пусть для вещественной (эрмитово симметричной) квадратичной формы положительный индекс инерции равен размерности пространства. Тогда существует канонический базис, в котором матрица квадратичной формы является единичной. Дополнение. Очевидно, принимая во внимание 12.4-6. 12.4.3. Общий базис пары квадратичных форм 12.4-13.4 Приведение пары форм Пусть даны две вещественные (эрмитово симметричные) квадратичные формы, из которых, по крайней мере, одна имеет положительный индекс инерции, равный размерности пространства. Для этих квадратичных форм существует общий канонический базис. В данном базисе матрица выделенной квадратичной формы является единичной, для другой квадратичной формы — диагональной. Дополнение. Рассмотрим для определенности вещественные квадратичные формы. Сначала ту квадратичную форму, у которой положительный индекс инерции равен размерности пространства, приведем к главным осям с каноническими коэффициентами + 1. Это возможно согласно 12.4-12. При этом вторая квадратичная форма примет какой-то эквивалентный вид. Согласно 12.4-3 для преобразованной второй квадратичной формы существует ортонормированный канонический базис. При переходе к нему матрица второй квадратичной формы станет диагональной. Второе преобразование координат описывает переход от естественного базиса к ортонормированному. Согласно восьмому пункту 10.2-9 матрица преобразования координат будет ортогональной. При таком преобразовании квадратичная форма с единичной матрицей переходит снова в квадратичную форму с единичной матрицей. Поэтому канонический вид первой квадратичной формы при втором преобразовании не изменится, за исключением, конечно, самих переменных. Случай эрмитовых симметричных квадратичных форм рассматривается аналогично с заменой ссылки 12.4-3 на 12.4-7. 12.4-14.4 Матричная трактовка Рассмотрим две эрмитовы матрицы, из которых, по крайней мере, у одной все ведущие миноры положительные. Тогда существует общее эрмитово конгруэнтное преоб-
12. Билинейные формы 413 разование, приводящее обе матрицы к диагональному виду. Диагональная матрица, порожденная выделенной матрицей, является единичной. Дополнение. Пусть даны две эрмитовы матрицы А, В, из которых матрица А имеет положительные ведущие миноры. Согласно 11.1-18 существует невырожденная левая треугольная матрица L такая, что А = LL*. Сделав общее конгруэнтное преобразование с матрицей Р\ - (Ь~')', получим новые матрицы 4 = р;АРх = L-*LL*(L-1)' = E, В1 Матрица/?! остается эрмитовой. Согласно 10.2-17, 10.3-9 существуют вещественная диагональная матрица Л и унитарная матрица Q такие, что Л = Q* B\Q. Сделав второе общее конгруэнтное преобразование с матрицей Р2 = Q, получим новые матрицы А2 = Р[АХР2 = Q*EQ = ?, В2 = Р'ВХР2 = Q*Q\Q*Q = Л. Последовательное выполнение двух конгруэнтных преобразований есть конгруэнтное преобразование. Следовательно, утверждение справедливо. 12.4-15.4 Конгруэнтность диагональной матрице Пусть В — комплексная матрица. Представим ее в виде суммы В = С+ iD, где С и D — эрмитовы матрицы. Если у одной из матриц С, D все ведущие миноры положительные, то матрица В эрмитово конгруэнтна невырожденной диагональной матрице. Дополнение. Разложение B = C + iD всегда осуществимо согласно 10.3-24. Все остальное является прямым следствием 12.4-14. 12.4-1 б.4 Комментарий (об улучшении общего результата) Заметим, что в этом частном случае значительно улучшается общий результат, сформулированный в утверждении 12.2-23. 12.4-17.4 Комментарий (об эквивалентности условий) Условием общей конгруэнтной приводимости пары эрмитовых матриц к диагональному виду до сих пор была положительность всех ведущих миноров у одной из них. Однако ничто не мешает воспользоваться согласно 11.1-30 любым другим эквивалентным свойством. 12.5. Знакоопределенные матрицы 12.5.1. Общие свойства знакоопределенных матриц 12.5-1.4 Положительно определенная матрица Пусть в арифметическом пространстве скалярное произведение введено через естественный базис согласно 5.1-8. Вещественная (эрмитова) матрица называется поло-
414 Часть I. Математические сведения по линейной алгебре жительно определенной и обозначается символом А > 0, если (Ах, х) > 0 для всех вещественных (комплексных) векторов х фО. Аналогично вводятся отрицательно, неотрицательно и неположительно определенные матрицы. Неотрицательно определенная матрица называется также положительно полу определенной. 12.5-2.4 Комментарий (о сохранении знака) Согласно 12.3-21, если для комплексной матрицы А скалярное произведение (Ах,х) всегда вещественно, то матрица А эрмитова. Именно поэтому мы ограничились рассмотрением только этого случая. 12.5-3.4 Критерий определенности Для того чтобы вещественная матрица была определенной в каком-либо смысле 12.5-1, необходимо и достаточно, чтобы ее симметричная составляющая в разложении 10.3-27 была определенной в том же смысле. Дополнение. Пусть согласно 10.3-27 матрица А представлена в виде суммы А = В + С, где В — симметричная матрица, С— кососимметричная. Имеем (Ах, х) = (Вху х) + (Ос, х). Согласно 12.1-13,12.3-17, скалярное произведение (Ос, х) равно нулю на всех векторах. Поэтому матрицы Aw В определены одинаково. 12.5-4.4 Определенность главных подматриц Если матрица А положительно (неотрицательно и т. п.) определена, то так же будет определена любая ее квадратная подматрица, опирающаяся на главную диагональ. Дополнение. Пусть в матрице А порядка п выбрана подматрица А , элементы которой стоят на пересечении строк и столбцов с номерами /ь ..., /г, 1 <г <п. Предположим, что вектор х = (Х), ...,хп) представлен своими координатами в естественном базисе. Рассмотрим вектор x = (xt;,...,*, ) размерности г, координаты которого составлены из координат вектора х. Если скалярное произведение введено согласно 5.1-8 в естественном базисе, то легко проверить, что Так как для всех х ф 0 будет х Ф 0, то матрица А определена так же, как и матрица А. 12.5-5.4 Положительные ведущие миноры Если вещественная матрица положительно определена, то все ее ведущие миноры положительны. Дополнение. В силу 12.5-4 сформулированный факт достаточно доказать только для ведущего минора максимального порядка, т. е. для определителя матрицы А.
12. Билинейные формы 415 Представим матрицу А согласно 10.3-27 в виде суммы А =В + С, где матрица В вещественная симметричная матрица, матрица С вещественная кососимметрич- ная. Принимая во внимание 10.3-29, заключаем, что матрица В является положительно определенной на вещественных векторах. Рассмотрим комплексные векторы z = u + /v, где векторы w, v вещественные. Имеем (Bz, z) = (В(и + /v), и + /v) = = (Ви, и) - i(Bu, v) + i(Bv, и) + (Bv, v) = = (Ви, и) - i(Bu, v) + i(Bu, v) + ?(v, v) = поскольку (^v, и) = (Вщ v) из-за симметрии и вещественности матрицы В. Если z Ф 0, то (Bz, z) > 0, т. е. матрица В является положительно определенной как комплексная эрмитова матрица. Согласно 11.1-30 все ведущие миноры матрицы В положительные. Как следует из 11.1-18, существует разложение В ~ LL\ где матрица L вещественная невырожденная треугольная. Рассмотрим матрицу D = L~xA(Lfyl. Определители матриц Л и D имеют одинаковые знаки, т. к. согласно 4.2-10, 4.4-10 выполняется соотношение С другой стороны, Второе слагаемое представляет вещественную кососимметричную матрицу. Косо- симметричная матрица является косоэрмитовой. Согласно 10.3-17 все ее собственные значения чисто мнимые. В силу 9.3-2 ее ненулевые собственные значения разбиваются на комплексно-сопряженные пары. Принимая во внимание 9.4-7, заключаем, что все собственные значения матрицы D разбиваются на ненулевые комплексно-сопряженные пары и собственные значения, равные 1. Произведение ненулевых комплексно-сопряженных чисел есть положительное число. Поэтому, учитывая 8.2-30, делаем вывод, что det D > 0 и, следовательно, det A > 0. 12.5-6.4 Критерий Сильвестра Для того чтобы эрмитова матрица была положительно определенной, необходимо и достаточно, чтобы все ведущие миноры этой матрицы были положительными. Дополнение. Это есть прямое следствие 11.1-30. 12.5-7.4 Еще один критерий Для того чтобы эрмитова матрица была отрицательно определенной, необходимо и достаточно, чтобы все ведущие миноры нечетного порядка были отрицательными, четного — положительными.
416 Часть I. Математические сведения по линейной алгебре Дополнение. Для того чтобы матрица А была отрицательно определенной, необходимо и достаточно, чтобы матрица - А была положительно определенной. Для этого, в свою очередь, согласно 12.5-6 необходимо и достаточно, чтобы все ведущие миноры матрицы -А были положительными. В терминах матрицы А это эквивалентно отрицательности ее ведущих миноров нечетного порядка и положительности ведущих миноров четного порядка. 12.5.2. Спектральные свойства знакоопределенных матриц 12.5-8.4 Определенность собственных значений Если вещественная матрица положительно определена, то вещественные части всех собственных значений положительны. Дополнение. Пусть в вещественном пространстве X скалярное произведение введено согласно 5.1-8 в естественном базисе и (Ах, х)>0 для всех ненулевых векторов х еХ. Расширим X до комплексного пространства Z. Будем считать, что если z e Z, то z = u + /V, где u, v еХ. Пусть скалярное произведение в Z также введено согласно 5.1-8 в естественном базисе. Очевидно, что (Az, z) > О, если ненулевой вектор z eZ, но является вещественным. Предположим теперь, что z есть собственный вектор матрицы А, соответствующий собственному значению X. Пусть z = и + /V, А. = ц + /V, где u, v — вещественные векторы, ц, v — вещественные числа. С одной стороны, (Az, z) = (Xz, z) = X(z, z) = \i(z, z) + /v(z, z). С другой стороны, (Az, z) = (A(u + iv), и + /V) = (Аи, и) + (Av, v) + i((Av, u) - (Аи, v)). Сравнивая правые части этих равенств, заключаем, что Так как z — собственный вектор, то z Ф 0. Поэтому согласно 5.1-3 имеем (z, z) > 0. В силу z Ф 0, по крайней мере, не равен нулю один из векторов и, v. Следовательно, (Аи, и) + (Av, v) > 0, т. к. по условию матрица А положительно определенная в вещественном пространстве. Окончательно заключаем, что 12.5-9.4 Критерий определенности Для того чтобы эрмитова матрица А удовлетворяла условию А > 0(>, <, <), необходимо и достаточно, чтобы ее собственные значения \j удовлетворяли условию А.,- > 0(>, <, <) при всех /. Дополнение. Это есть прямое следствие 11.1 -30, 11.1-31.
12. Билинейные формы 417 12.5-10.4 Коэффициенты характеристического многочлена Если вещественная матрица положительно определена, то все коэффициенты характеристического многочлена отличны от нуля и имеют чередующиеся знаки. Дополнение. Пусть вещественная матрица А положительно определена. Согласно 12.5-8 вещественные части всех собственных значений положительные. Если ц — вещественное собственное значение, то jli > 0; многочлен X - \х имеет чередующиеся знаки и все его коэффициенты отличны от нуля. Если ц + /V — комплексное собственное значение, то \х > 0 и существует комплексно-сопряженное собственное значение ц- /V. Многочлен (X - ц - iv)(X - ц + /V) = X2 - 2\lX + ц2 + v2 имеет чередующиеся знаки и все его коэффициенты отличны от нуля. Вещественная матрица имеет столько собственных значений, в общем случае комплексных, каков ее порядок. Ее характеристический многочлен 8.2-18 есть произведение какого-то числа рассмотренных многочленов первого и второго порядков. Легко проверить, что произведение любых многочленов с ненулевыми коэффициентами, имеющими чередующиеся знаки, есть также многочлен с ненулевыми коэффициентами, имеющими чередующиеся знаки. Следовательно, таким же будет и характеристический многочлен матрицы А. 12.5-11.4 Критерий Якоби Для того чтобы эрмитова матрица была положительно определенной, необходимо и достаточно, чтобы все коэффициенты характеристического многочлена были отличны от нуля и имели чередующиеся знаки. Дополнение. Пусть эрмитова матрица А порядка п положительно определена. Согласно 11.1-30 все ее собственные значения Х\, ...,Хп положительные. Характеристический многочлен есть произведение многочленов Х-Х\, ..., Х-Хп первого порядка. Легко проверить, что все его коэффициенты не нулевые и имеют чередующиеся знаки. Пусть теперь все коэффициенты характеристического многочлена эрмитовой матрицы не нулевые и имеют чередующиеся знаки. Согласно 10.3-9 все его корни вещественные. Из-за отсутствия нулевых коэффициентов ни один из корней не может быть нулевым. Из-за чередования знаков коэффициентов ни один из корней не может быть отрицательным. Поэтому все собственные значения матрицы А положительные. Согласно 11.1-30 отсюда вытекает положительная определенность матрицы А. 12.5-12.4 Критерий определенности Для того чтобы эрмитова матрица была отрицательно определенной, необходимо и достаточно, чтобы все коэффициенты ее характеристического многочлена были положительны. Дополнение. При замене матрицы А на-А меняются на противоположные ее определенность, собственные значения, корни характеристического многочлена, ко- 14 Зак 740
418 Часть I. Математические сведения по линейной алгебре эффициенты характеристического многочлена при нечетных степенях. После замены эрмитовой матрицы А на - А справедливость утверждения сразу становится следствием из 12.5-11. 12.5-13.4 Комментарий (о знакоопределенности) Заметим, что критерии знакоопределенности 12.5-6, 12.5-7, 12.5-11, 12.5-12 в целом справедливы только для эрмитовых матриц. Для вещественных несимметричных матриц достаточность уже не обязательно будет иметь место. Поэтому, например, вещественная несимметричная матрица с положительными собственными значениями может не быть положительно определенной. Так, матрица при всех р имеет два собственных значения, равных 1. Однако для вектора х = A, 1) имеем {Ах, х) = 2 + р. Следовательно, для этого вектора |<0 при р<-2, О при р = -2, >0 при р>-2. 12.5.3. Сохранение знакоопределенности 12.5-14.4 Сохранение определенности Если А > 0(>, <, <), то для любой невырожденной матрицы В имеем В*АБ > 0(>, <, <). Дополнение. При замене переменных х = By имеем, принимая во внимание 5.2-25, что Так как матрица В невырожденная, то согласно 6.3-10 условие^Ф 0 эквивалентно условию х Ф 0. Следовательно, матрицы А и В*АВ одинаково знакоопределены. 12.5-15.4 Сохранение полуопределенности Если А > 0(>, <, <), то для любой матрицы В имеем В*АВ > 0(>, <, <). Дополнение. При замене переменных jc = By имеем, принимая во внимание 5.2-25, что (В'АВу, у) = (АВу, By) = (Ах, х). Так как матрица В может быть любой, то согласно 6.3-10 условие уфО может приводить как к неравенству jc ф 0, так и к равенству jc = 0. Следовательно, если матрица А была строго определена (> 0, < 0), то матрица В*АВ в общем случае будет определена не строго (> 0, < 0).
12. Билинейные формы 419 12.5-1 б.4 Определенность матрицы аА + (Зв Если А, В> 0 (>, <, <), то для любых неотрицательных чисел а, C, не равных нулю одновременно, имеем <хА + $В > 0 (>, <, <). Дополнение. Очевидно, если принять во внимание равенство х, х) = а(Л;с, х) + p(&t, х). 12.5-17.5 Определенность кронекерова произведения Если матрицы А, В эрмитовы и А, В > 0, то А х В > 0. Дополнение. Пусть матрицы Л, j5 эрмитовы и положительно определенные. Согласно 11.1-30 все их собственные значения положительные. В силу 11.4-19 матрица Л х В эрмитова и согласно 11.4-18 все ее собственные значения положительные. В соответствии с 11.1-30 и определением 12.5-1 матрица Л х В является положительно определенной. 12.5-18.5 Комментарий (о неверности вещественного аналога) Заметим, что вещественный аналог утверждения 12.5-17 в общем случае уже не верен. Рассмотрим, например, вещественные матрицы Очевидно, что при любом а и любом векторехфО имеем (Ах,х)> 0, (Вх,х)> 0. Легко проверить, что 1 -а -а а2 а 1 -а2 -а а -а2 1 -а а' а а 1 На любом вещественном векторе вида z = (б, 8, s, - б) выполняется соотношение При 8 Ф 0 и |<х| > 1 будем иметь ((А х B)z, z) < 0 и матрица А х В не может быть положительно определенной. Если же матрицы А, В вещественные симметричные и положительно определенные, то утверждение 12.5-17 снова имеет место. 12.5-19.4 Определенность и невырожденность Если А > 0 (< 0), то матрица А — невырожденная и А~] > 0 (< 0). Дополнение. Если А > 0 или А < 0, то матрица А не может быть вырожденной. В противном случае согласно 6.3-10 должен существовать вектор х0 ф 0 такой, что
420 Часть I. Математические сведения по линейной алгебре Ах0 = 0. Но тогда (Ах0, х0) = 0, что невозможно по условию. Сделаем замену переменных х = А~ ху. Имеем (Ах, х) = (АА- 1у, А~ У> = (у, А' ху) = (А~ 1у, у) > 0, если А > 0. Аналогичный результат получается при А < 0. 12.5-20.4 Положительность матрицы S + /К Пусть А = 5 + //С— эрмитова положительно определенная матрица порядка /и с вещественными матрицами S, К. Вещественная блочная матрица S -К порядка 2т является симметричной и положительно определенной. Дополнение. Так как матрица А эрмитова, то из 10.3-3 сразу следует, что матрица S симметричная, матрица К кососимметричная и поэтому будет симметричной матрица R. Возьмем произвольный ненулевой вектор z-x + iy, где векторы х,у вещественные и, соответственно, не равные нулю одновременно. По условию матрица А положительно определенная, т. е. (Az, z) > 0. Раскрывая скалярное произведение, находим, что (Az, z) = (Sx, x) - (Ку9 х) + (Кх, у) + (Sy9 у) + /((/&, х) + (Sy, х) - (Sx, у) + (Ку9 у)) > 0. Отсюда вытекают такие соотношения: (Яг, х) - (Ку, х) + (Кх, у) + (Sy9 у) > 0, (Кх9 х) + (Sy9 х) - (Sx, у) + (Ку, у) - 0. Составим далее вещественный вектор размерности 2т. Легко проверить, что (Ru9 u) = (Sx, х) - (Ку, х) + (Кх, у) + (Sy, у). Согласно сделанному выше выводу, это выражение положительно для любого ненулевого вектора и. Следовательно, матрица R положительно определенная. 12.5.4. Матричные неравенства 12.5-21.4 Матричные неравенства Неравенство А > Б или А - В > 0 (>,<,<) для матриц А и В означает, что (Ах, х) > (Вх, х) (>, <, <) для всех jc * 0.
12. Билинейные формы 421 12.5-22.4 Комментарий (о сравнении матриц) Сравнивая матрицы по признаку знакоопределенности, будем считать, что все матрицы являются либо вещественными, либо эрмитовыми. Конечно, сравнение можно осуществлять в любом общем базисе. Особенно эффективно использование общего канонического базиса квадратичных форм. 12.5-23.4 Двусторонние оценки Для любой матрицы А существуют числа а, Р, зависящие только от А и такие, что ос? < А < р?. Дополнение. Если матрица А вещественная или эрмитова, то согласно 12.4-3 или 12.4-7 для квадратичной формы с матрицей А существует ортонормированный канонический базис. Согласно восьмому пункту 10.2-9 матрица перехода от естественного базиса к каноническому является унитарной. При переходе к каноническому базису квадратичная форма с матрицей А приобретает канонический вид с каноническими коэффициентами Хи ..., Х„. В силу унитарности матрицы перехода квадратичная форма с матрицей Е останется в каноническом виде с каноническими коэффициентами, равными 1. Поэтому утверждение справедливо при oc = min Хп P = max Х-г \<i<n 1 </< п 12.5-24.4 Уточнение нижней оценки Если А > 0 (> 0), то число а в неравенствах 12.5-23 может быть выбрано положительным (неотрицательным). Дополнение. Согласно дополнению к 12.5-14 квадратичная форма сохраняет свою знакоопределенность при любом конгруэнтном (эрмитово конгруэнтном) преобразовании матрицы формы. В каноническом базисе определенность связана только со знаками канонических коэффициентов. В обозначениях дополнения к 12.5-23 определенность А > 0 (> 0) эквивалентна условию а > 0 (>. 0). 12.5-25.4 Эквивалентность неравенств аА > рВ и осВ~1 > (ЗА Пусть А, В— эрмитовы положительно определенные матрицы. Тогда неравенства аА > Р# и сс/Г * > $А~{ эквивалентны. Дополнение. Матрица Л эрмитова и положительно определенная. Согласно 11.1-30 все ее ведущие миноры положительные. В силу 12.4-14 существует замена переменных х = Pz такая, что Е, Р'ВР = А, где Л— диагональная матрица с элементами Х\, ...,^w на главной диагонали. Матрица В по условию положительно определенная. Согласно 12.5-14, такой же
422 Часть I. Математические сведения по линейной алгебре должна быть матрица Л. Но это означает, что А,> 0 для всех /, 1 <i<n. Итак, без ограничения общности можно считать, что А = Е, В = Л. Если z = (zi, ..., zn), то в этом случае условие оА > р? эквивалентно условиям az^z. > PA^zj для всех /. В силу положительности чисел А, они, очевидно, эквивалентны условиям осА~ !z<z~ > $ztYt или, что то же самое, условию ос/Г' > $А~ \ 12.5-26.4 Сравнительные оценки для двух матриц Пусть А, В — положительно определенные матрицы. Существуют положительные числа 5, у, зависящие только от А, В и такие, что ЪВ<А< уВ. Дополнение. Если обе матрицы А, В вещественные или эрмитовы, то согласно 12.4-6 для каждой из них существует свой канонический базис, в котором канонические коэффициенты равны + 1,-1 и 0. В силу условий А > 0, В > 0 в действительности все канонические коэффициенты должны равняться + 1. Следовательно, для обеих матриц А> В положительный индекс инерции равен размерности пространства. Согласно 12.4-13 существует общий канонический базис, в котором квадратичная форма с матрицей В приобретет канонический вид с каноническими коэффициентами, равными 1. При этом квадратичная форма с матрицей А также приобретет канонический вид с какими-то каноническими коэффициентами Х\, ..., Хп. В силу условия А > 0 все А/ > 0. Поэтому утверждение справедливо при 0 <8 = min А.,., 0<у 1 < / < и 12.5.5. Квадратный корень из матрицы 12.5-27.4 Квадратный корень из матрицы Для любой эрмитовой положительно (неотрицательно) определенной матрицы А существует, и притом единственная, эрмитова положительно (неотрицательно) определенная матрица S такая, что S2 = A. Матрица S называется (арифметическим) квадратным корнем из матрицы А и обозначается Ат. Дополнение. Пусть матрица А эрмитова и А > 0. Согласно 10.2-17 существуют унитарная матрица U и диагональная матрица Л с собственными значениями Хь ...Д„ на главной диагонали такие, что А = U*AU. В силу 11.1-30 все собственные значения матрицы А положительные. Обозначим через Л1/2 диагональную матрицу с элементами Х\/2,..., Х^2 на главной диагонали и пусть 5= U*A]/2U. Матрица S, очевидно, эрмитова и согласно 11.1-30 положительно определенная, т. к. все ее собственные значения положительные. Кроме этого, S1 = A. Поэтому матрица S представляет квадратный корень из матрицы А. Покажем, что такая матрица единственная.
12. Билинейные формы 423 Рассмотрим любую эрмитову положительно определенную матрицу S, для которой S2 = A. Пусть/ь ...,/,— ортонормированная система собственных векторов матрицы S, соответствующих собственным значениям ць ..., ци. Имеем то есть векторы/ь ...,fn являются собственными векторами матрицы А> соответствующими собственным значениям ц^,...5ц*. Рассмотрим теперь любую орто- нормированную систему собственных векторов хь ...,х„ матрицы А, соответствующих собственным значениям |if,..., \^п. В соответствии с 5.2-9 разложим вектор Xj по векторам/i, ...,/,, т. е. Xi = Теперь находим, что 7 = 1 Матрица у4 эрмитова. Согласно 8.2-17 ее собственные векторы xhf/, соответствующие различным собственным значениям juf и \i2p ортогональны. Поэтому среди скалярных произведений (xhfj) могут быть отличны от нуля только те, для которых \ij = Ц/. Это означает, что /=1 7=1 то есть Sxj = \1,Х1 для всех /, 1 <i<n. Следовательно, собственные векторы матрицы А являются собственными векторами матрицы S и они соответствуют тем же собственным значениям. Эти условия определяют матрицу S однозначно. Предположим, что существуют две матрицы Si и S2. Возьмем произвольный вектор х и разложим его по векторам :сь ..., хп, т. е. Имеем (Si - S2)x = Si* - S2x = Поэтому S\ — S2 = 0 или Si = S2. Случай А > О рассматривается аналогично. 12.5-28.4 Собственные значения и векторы матриц А, А112 Собственные векторы матриц А нАт совпадают, а собственные значения матрицы А равны квадратам собственных значений матрицы Ат. Дополнение. Это доказано в дополнении к 12.5-27.
424 Часть I. Математические сведения по линейной алгебре 12.5-29.4 Перестановочность А и Аш Матрицы АиАт перестановочны. Дополнение. Как следует из дополнения к 12.5-27, если A = U*AU, то АУ2 = U*A]/2U. Диагональные матрицы Л и Л1/2 перестановочны, поэтому AAm= U*AUU*AV2U = U*AAV2U = = U*AV2UU*AU=Al/2A. 12.5-30.4 Простая структура матриц АВ и ВА Пусть А, В— эрмитовы матрицы и одна из них положительно определенная. Тогда матрицы АВ и ВА имеют простую структуру и все их собственные значения вещественные. Дополнение. Согласно 8.2-24 для любых квадратных матриц одного порядка матрицы АВ и ВА имеют одинаковые характеристические многочлены и, следовательно, одинаковые собственные значения. Пусть матрицы А, В эрмитовы и, например, А > 0. В силу 12.5-27 существует эрмитова матрица S такая, что 52 = ^и S> 0. Согласно 12.5-19 матрицаS невырожденная. Далее находим, что BA = BS* = S- \SBS)S, то есть матрицы АВ и ВА подобны одной и той же матрице SBS. В силу эрмитово- сти матриц S и В матрица SBS эрмитова. Согласно 10.1-11 она имеет простую структуру, а согласно 10.3-9 ее собственные значения вещественные. Такими же свойствами обладают матрицы АВ и ВА. 12.5-31.4 Собственные значения матриц АВ и ВА Пусть матрицы А, В эрмитовы и одна из них положительно определенная. Для того чтобы собственные значения матриц АВ и ВА были положительными (неотрицательными), необходимо и достаточно, чтобы другая матрица была положительно (неотрицательно) определенной. Дополнение. Пусть матрицы А, В эрмитовы и А > 0. Как показано в дополнении к 12.5-30, матрицы АВ и ВА подобны одной и той же матрице SBS, где S— арифметический квадратный корень из А. Если В > 0, то согласно 12.5-14 имеем SBS>0 и в силу 11.1-30 все собственные значения матрицы SBS положительные. Если же В > 0, то согласно 12.5-14 имеем SBS>0 и в силу 11.1-31 все собственные значения матрицы SBS неотрицательные. Предположим теперь, что собственные значения матриц АВ и ВА положительные (неотрицательные). Это означает, что положительными (неотрицательными) будут собственные значения эрмитовой матрицы SBS. Любая эрмитова матрица согласно 10.2-17, 10.3-9 унитарно подобна вещественной диагональной матрице из собственных значений. Но преобразование унитарного подобия есть преобразование эрмитово конгруэнтное. Поэтому, принимая во внимание 12.4-9, заключаем, что у эрмитовой матрицы число поло-
12. Билинейные формы 425 жительных, отрицательных и нулевых собственных значений совпадает, соответственно, с положительным, отрицательным индексом инерции и разностью между порядком матрицы и ее рангом. Матрицы SBS и В эрмитово конгруэнтны. Поэтому у них одинаковое число положительных и отрицательных собственных значений. Если все собственные значения матрицы SBS положительные (неотрицательные), то такими же будут собственные значения матрицы В. Согласно 11.1-30 A1.1-31) матрица В положительно (неотрицательно) определена. Если матрицы А, В эрмитовы и В > 0, то этот случай рассматривается аналогично. Нужно лишь матрицы Аи Въ доказательствах поменять ролями. 12.5-32.5 Комментарий (значение знакоопределенности) Для того чтобы гарантировать вещественность спектра произведения двух эрмитовых матриц, в утверждении 12.5-30 привлекалось использование знакоопределенности одной из них. О том, что это условие существенно, говорит следующий пример. Легко проверить, что fiYi <П Го -Г о До -ij (\ о Слева стоит произведение двух эрмитовых матриц, каждая из которых не является знакоопределенной, т. к. имеет собственные значения ± 1. Их произведение справа есть кососимметричная матрица с собственными значениями ± /. Напомним, что согласно 9.5-29 любая комплексная матрица может быть представлена в виде произведения двух симметричных матриц, в общем случае, комплексных. Ясно, что для того чтобы произведение двух симметричных матриц имело вещественный спектр, необходимо дополнительное привлечение каких-то сильных условий. 12.5.6. Приведение пары эрмитовых матриц 12.5-33.4 Комментарий (еще раз о знакоопределенности) Если среди пары эрмитовых матриц есть хотя бы одна знакоопределенная, то согласно 12.4-14, 12.4-17, 12.5-1, 11.1-30 такая пара приводится общим эрмитовым конгруэнтным преобразованием к диагональному виду. Но даже если ни одна из матриц не является знакоопределенной, пара, тем не менее, может быть приведена общим преобразованием к диагональному виду в некоторых случаях. 12.5-34.4 Определенная пара матриц Пара вещественных симметричных или эрмитовых матриц А, В называется определенной, если в множестве матриц вида оЛ + C# при вещественных а, C есть хотя бы одна знакоопределенная матрица. 12.5-35.4 Приведение определенной пары Если пара матриц является определенной, то она может быть приведена общим эрмитовым конгруэнтным преобразованием к вещественному диагональному виду.
426 Часть I. Математические сведения по линейной алгебре Дополнение. Пусть для определенности матрицы А, В эрмитовы, не являются знакоопределенными, но матрица ссоЛ + Р<А например, положительна определена. Тогда в соответствии с 12.2-12, 12.4-14, 12.5-1, 11.1-30 существует такая невырожденная матрица Ру что матрицы Р'АР и P'(aioA + ро#) Р будут вещественными диагональными. Но в этом случае и матрица Р'ВР также будет вещественной диагональной. В самом деле, по предположению матрицы А, В не знакоопределе- ные. Следовательно, сс0 * 0, (Зо ^ 0. Поэтому матрица В может быть представлена в виде Ро Ро Отсюда вытекает, что матрица Р'ВР вещественная диагональная. Ясно, что если матрицы А, В вещественные симметричные, то и общее конгруэнтное преобразование можно выбрать вещественным. 12.5-36.4 Закон инерции для пары матриц Если пара вещественных симметричных или эрмитовых матриц приводится к вещественному диагональному виду каким-нибудь общим эрмитовым конгруэнтным преобразованием, то для каждой из матриц выполняется закон инерции. 12.5-37.5+ Числовая область эрмитовой пары Рассмотрим комплексное арифметическое пространство вектор-столбцов. Пусть в нем введено скалярное произведение согласно 5.1-8 через естественный базис. Числовой областью пары эрмитовых матриц А, В называется множество комплексных чисел для всевозможных комплексных векторов единичной длины. 12.5-38.5+ Числовая область симметричной пары Рассмотрим вещественное арифметическое пространство вектор-столбцов. Пусть в нем введено скалярное произведение согласно 5.1-8 через естественный базис. Числовой областью пары вещественных симметричных матриц Л, В называется множество комплексных чисел для всевозможных вещественных векторов единичной длины. 12.5-39.5+ Совпадение числовых областей Если порядок матриц не равен 2, то числовые области W(A, В) и Wr{A, В) для вещественных симметричных матриц Л, В совпадают. Дополнение. См. [6], стр. 41.
12. Билинейные формы 427 12.5-40.5+ Критерий определенности Для того чтобы пара вещественных симметричных или эрмитовых матриц А, В была определенной, необходимо и достаточно выполнение условия 0 &W(A, В). Дополнение. См. [6], стр. 37—41. 12.5-41.4 Комментарий (поиск знакоопределенной матрицы) Для того чтобы завершить исследования, касающиеся приведения пары матриц к диагональному виду, осталось указать алгоритм нахождения знакоопределенной матрицы в пучке определенной пары. Один из таких алгоритмов под названием алгоритм Кроуфорда—Муна описан в [8], стр. 42—44. После нахождения знакоопределенной матрицы приводить пару к диагональному виду можно, например, способом, описанным в дополнении к 12.4-14. 12.5.7. Обобщенная проблема собственных значений 12.5-42.3 Постановка задачи Пусть даны две квадратные матрицы А, В одного порядка. Задача нахождения векторов х Ф 0 и чисел А,, связанных соотношением Ах — ХВх9 называется обобщенной проблемой собственных значений. Любой вектор х Ф 0 (число X), удовлетворяющий этому соотношению, называется собственным вектором (собственным значением или собственным числом) данной проблемы. 12.5-43.3 Собственные значения Все собственные значения обобщенной проблемы собственных значений, и только они, являются корнями уравнения dci(~A + ХВ) = 0. Дополнение. Доказательство почти полностью повторяет дополнение к 8.2-5. 12.5-44.3 Эквивалентность стандартной задаче Если матрица В невырожденная, то обобщенная проблема собственных значений эквивалентна стандартной задаче, связанной с решением уравнения (В~ 1А)х = Хх. 12.5-45.3 Комментарий (трудности обобщенной проблемы) Если матрица В в обобщенной проблеме собственных значений вырожденная, то сама проблема уже не сводится к стандартной. В этом случае уравнение det(-y4 + ХВ) = 0 будет представлять многочлен, степень которого меньше порядка матриц. В подобной ситуации говорят, что имеются "бесконечно большие" собственные значения. Все исследования становятся значительно сложне^. С некоторыми их аспектами
428 Часть I. Математические сведения по линейной алгебре можно познакомиться в работе [8]. Но даже если матрица В невырожденная, переход к стандартной задаче не всегда оказывается целесообразным. Например, матрицы А, В могут быть эрмитовыми или ленточными. Матрица В~ ]А уже не будет обладать подобными особенностями. Однако можно выделить класс матриц, когда их специфику удастся использовать эффективно. 12.5-46.4 Эквивалентность диагональной задаче Пусть пара матриц в обобщенной проблеме собственных значений является определенной. Тогда исходная задача эквивалентна аналогичной задаче с диагональными матрицами. Дополнение. Пусть в уравнении Ах = ХВх матрицы А, В образуют определенную пару. Согласно 12.5-35 обе матрицы можно привести к вещественному диагональному виду общим эрмитовым конгруэнтным преобразованием. Другими словами, существует невырожденная матрица Р и вещественные диагональные матрицы R, S такие, что R = Р'АР, S = Р'ВР. Умножая уравнение Ах = ХВх слева на матрицу F и делая замену переменных д: = Руу приходим к эквивалентному уравнению Ry = XSy. 12.6. Билинейно метрические пространства 12.6.1. Изотропные векторы 12.6-1.3 Комментарий (о скалярном произведении) Билинейная (эрмитова билинейная) форма, задающая скалярное произведение, кроме симметрии обладает еще одним важным свойством: порожденная ею квадратичная (эрмитово квадратичная) форма принимает нулевое значение только на нулевом векторе. Отказ от этого свойства делает не всегда возможным построение ортогональных и, тем более, ортонормированных систем векторов. Интересно понять поэтому, когда и в какой форме данное свойство квадратичных форм можно сохранить. 12.6-2.3 Изотропный вектор Вектор z называется изотропным для квадратичной (эрмитово квадратичной) формы ф(х, х), если cp(z, z) = 0. 12.6-3.3 Кососимметричная билинейная форма Для квадратичной формы, порожденной кососимметричной билинейной формой, все векторы пространства являются изотропными. Дополнение. Это есть прямое следствие 12.1-13, 12.6-2.
12. Билинейные формы 429 12.6-4.3 Существование изотропных векторов Любая квадратичная форма в комплексном пространстве, кроме ненулевой квадратичной формы размерности 1, имеет ненулевые изотропные векторы. Дополнение. Рассмотрим канонический вид 12.4-2 квадратичной формы. Если п> 1, то уравнение \z\ + X2z\ -О при любых Х\> А,2 имеет ненулевое решение в поле комплексных чисел. Если же п = 1 и Х\ Ф О, то уравнение \z] - О, очевидно, имеет только нулевое решение. 12.6-5.3 Вырожденная билинейная форма Квадратичная форма, порожденная вырожденной билинейной формой, обязательно имеет ненулевые изотропные векторы. Дополнение. Рассмотрим, например, эрмитову билинейную форму ц>(х,у). Согласно 12.2-4 представим ее в виде скалярного произведения (Ф'ехе, уе). Так как билинейная форма вырожденная, то будет в соответствии с 12.2-9, 12.2-10 и 12.2-11 вырожденной и матрица Ф^. Согласно 6.3-9 уравнение Ф'ехе = 0 имеет ненулевое решение. Но тогда (Ф'ехе9хе) = 0 и числовой вектор хе задает ненулевой изотропный вектор квадратичной формы ц>(х, x). 12.6-6.3 Критерий изотропности Представим эрмитову квадратичную форму ц>(х, х) в виде суммы ф(*, X) = ф,(дг, X) + 1ф2(х, X), где ц>\(х, х) и фгС*, х) — эрмитовы симметричные квадратичные формы. Вектор z является изотропным для ф(д:, х) тогда и только тогда, когда он является изотропным одновременно для ф1(х, х) и фгОг, х). Дополнение. Согласно 12.3-21 эрмитовы симметричные квадратичные формы Ф1(дг, л:) и ф2(х, х) на всех векторах принимают вещественные значения. Поэтому ф(х, дг) = 0 тогда и только тогда, когда одновременно q>i(x, х) = 0 и ф2(х, х) = 0. 12.6-7.3 Комментарий (о выборе вида билинейных форм) Наиболее часто билинейные формы в арифметическом пространстве задаются в виде скалярных произведений типа (Ах, у). Это вполне согласуется с 12.2-4. Важно понять, какие требования надо наложить на матрицу А, чтобы квадратичная форма (Ах, х) не имела ненулевые изотропные векторы, и что означает отсутствие таких векторов. 12.6.2. Числовые области матриц 12.6-8.5* Числовая область вещественной матрицы Рассмотрим вещественное арифметическое пространство вектор-столбцов. Пусть в нем введено скалярное произведение согласно 5.1-8 через естественный базис.
430 Часть I. Математические сведения по линейной алгебре Числовой областью вещественной матрицы А называется множество вещественных чисел Vr(A)={(Ax,x)\\x\=\) для всевозможных вещественных векторов единичной длины. 12.6-9.5* Числовая область комплексной матрицы Рассмотрим комплексное арифметическое пространство вектор-столбцов. Пусть в нем введено скалярное произведение согласно 5.1-8 через естественный базис. Числовой областью комплексной матрицы А называется множество комплексных чисел для всевозможных комплексных векторов единичной длины. 12.6-10.5+ Совпадение числовых областей Пусть квадратная комплексная матрица А представлена своим эрмитовым разложением А= Н\ + iH2, где матрицы #ь Н2 эрмитовы. Имеет место соотношение V(A) = W(H\, Н2). Здесь W(HU Н2) есть числовая область пары матриц Ни Н2. Дополнение. Справедливость утверждения следует из определений 12.5-37, 12.6-9 и очевидного равенства (Ах, х) = (Н{х, х) + i(H2x, x). 12.6-11.5+ Расположение числовой области Если О &У(А), то в комплексной плоскости существует такая прямая линия, проходящая через начало координат, что вся числовая область У(А) находится строго по одну сторону от этой прямой. Дополнение. Принимая во внимание 12.6-10, см. [б], стр. 41. 12.6-12.5+ Отношение Релея Элементы числовых областей матриц называются также отношениями Релея. Однако в этом случае они задаются несколько иначе. Именно, (х, х) (х, х) 12.6-13.5+ Отношения Релея и собственные значения Пусть собственные значения Хь ... Д„ эрмитовой матрицы А порядка п упорядочены по невозрастанию, т.е. ХХ>Х2> ... >\п. Если отношение Релея рассматривать как функцию векторов, то ее максимум равен X], а минимум Х„. Дополнение. Согласно 10.3-10 эрмитова матрица унитарно подобна вещественной диагональной матрице. Но преобразование унитарного подобия, очевидно, является конгруэнтным. Поэтому без ограничения общности матрицу А можно
12. Билинейные формы 431 считать диагональной с элементами Х\, ...Д„. При унитарном преобразовании длина векторов не меняется в соответствии с 10.2-9. Если х = (х\, ...,хп), то теперь отношение Релея будет равно ^i|jci|2 +... + Хп\хп\2 при условии, что |*112 + ... + |х„|2 = 1. Ясно, что максимум этой функции равен Хь а минимум Х„. 12.6-14.5+ Числовые области и собственные значения Любое собственное значение комплексной матрицы А принадлежит ее числовой области V(A). Дополнение. Поле комплексных чисел алгебраически замкнуто. Согласно 8.2-31 матрица А имеет столько собственных значений, каков ее порядок. Любой собственный вектор определяется с точностью до множителя. Если собственный вектор х соответствует собственному значению X, то всегда можно считать, что \х\ = 1. Теперь имеем (Ах, х) = (Хх, х) = Х(х, х) = Х eV(A) по определению 12.6-9. 12.6-15.5+ Поворот числовой области матрицы Пусть квадратичная форма (Ах, х) не имеет ненулевых изотропных векторов. Существует вещественное число ф такое, что вещественные (мнимые) части всех собственных значений матрицы eltpA будут строго положительными. Дополнение. Согласно 5.1-3 для любого комплексного числа а выполняется равенство (оАх, х) = а(Ах, х). Поэтому при умножении матрицы А на число е;ф числовая область V(A) поворачивается на угол (р. Так как матрица А не имеет ненулевых изотропных векторов, то 0 $у(А) и в соответствии с 12.6-11 числовая область V(A) находится в комплексной плоскости строго по одну сторону от некоторой прямой. Следовательно, существует такое вещественное число ср, что числовая область матрицы е1Ц>А будет находиться строго в правой (верхней) полуплоскости. Согласно 12.6-14 все собственные значения матрицы е1<рА будут находиться там же. Уместно напомнить, что при умножении матрицы на число все ее собственные значения умножаются на то же число. 12.6.3. Критерии изотропности 12.6-1 б.4 Критерий для вещественной формы Для того чтобы вещественная квадратичная форма (Ах, х) с вещественной матрицей А не имела ненулевых изотропных векторов, необходимо и достаточно, чтобы матрица А была знакопостоянной, т. е. выполнялось условие или А > 0, или А < 0. Дополнение. Принимая во внимание 12.3-13, 12.4-2, матрицу А квадратичной формы (Ах, х) без ограничения общности можно считать вещественной диагональной. Остальное очевидно.
432 Часть I. Математические сведения по линейной алгебре 12.6-17.5+ Еще один критерий для вещественной матрицы Для того чтобы вещественная квадратичная форма (Ах, х) с вещественной матрицей А не имела ненулевых изотропных векторов, необходимо и достаточно выполнение условия О Ф Vr(A). 12.6-18.5+ Критерий для комплексной матрицы Для того чтобы эрмитова квадратичная форма (Ах, х) с комплексной матрицей А не имела ненулевых изотропных векторов, необходимо и достаточно выполнение условия О ф У(А). 12.6-19.5+ Еще один критерий для комплексной матрицы Пусть квадратная комплексная матрица А представлена своим эрмитовым разложением А = Н\ + /7/2, где матрицы Н\, Н2 эрмитовы. Для того чтобы эрмитова квадратичная форма (Ах, х) не имела ненулевых изотропных векторов, необходимо и достаточно, чтобы пара матриц Н\, Н2 была определенной. Дополнение. Это очевидное следствие утверждений 12.6-Ю, 12.6-18, 12.5-40. 12.6-20.5+ Очень важный критерий Для того чтобы эрмитова квадратичная форма (Ах, х) с комплексной матрицей А не имела ненулевых изотропных векторов, необходимо, чтобы матрица А была эрмитово конгруэнтна диагональной матрице с ненулевыми диагональными элементами. Дополнение. Представим согласно 10.3-24 матрицу А эрмитовым разложением А= #i + /Я2. Так как квадратичная форма (Ах, х) не имеет ненулевых изотропных векторов, то в соответствии с 12.6-19 пара матриц Н\, Н2 должна быть определенной. Согласно 12.5-35 такая пара может быть одновременно приведена к диагональному виду общим эрмитовым конгруэнтным преобразованием. Следовательно, существует невырожденная матрица Р и диагональные матрицы Ль Л2 такие, что выполняются равенства Р'НХР ~ А,, Р'НгР = Л2. Отсюда следует, что Р'АР = Р'(НХ + Ш2)Р = Р'НХР + iP'H2P = Л, + /Л2, то есть матрица А эрмитово конгруэнтна диагональной матрице Л| + /А2. Сделав замену переменных х = Ру , находим, что (Ах, х) = (АРу, Ру) = (FAPy, у) = (Р'АРу, у) = ((Л, + iA2)y, у). Так как квадратичная форма слева не имеет по условию ненулевых изотропных векторов, то в силу невырожденности матрицы Р не будет иметь ненулевых изотропных векторов и квадратичная форма справа. Но это возможно только тогда, когда матрица Ai + /Л2 не имеет нулевых диагональных элементов.
12. Билинейные формы 433 12.6.4. Билинейно метрическое пространство 12.6-21.3 Комментарий (о скалярном произведении) Изучение евклидовых и унитарных пространств сводилось к исследованию дополнительных свойств как самих пространств, так и матриц по отношению к билинейным формам, определяющим скалярные произведения. Как уже отмечалось, далеко не всегда возникает необходимость введения именно скалярного произведения. Для решения многих задач достаточно задать в пространстве билинейную или эрмитову билинейную форму, причем не обязательно симметричную и положительно определенную. 12.6-22.3 Билинейно метрическое пространство Линейное пространство называется билинейно метрическим (эрмитовым билинейно метрическим), если в нем задана билинейная (эрмитова билинейная) форма. 12.6-23.3 Комментарий (общность исследований) Многие определения и факты будут одинаковыми как для билинейных, так и для эрмитовых билинейных пространств. Поэтому всюду, где это не вызывает недоразумений, слово "эрмитово" далее мы будем опускать и будем проводить соответствующие выкладки только для билинейных пространств, подразумевая, что для эрмитовых пространств они проводятся аналогично. Желая подчеркнуть общность между билинейными формами и скалярными произведениями, мы будем оба вида форм называть также скалярным произведением и обозначать соответствующим символом. 12.6-24.3 Коэффициенты разложения и система уравнений Если для заданной системы векторов х\9 ..., х,„ и вектора л: имеет место разложение то коэффициенты этого разложения удовлетворяют системе линейных алгебраических уравнений i) + аг(*2, х,) + ... + ат(хт хх) = (x, x\), b x2) + a2(x2, x2) + ... + am(xtm x2) = (x, x2), , xm) + a2(x2, xm) + ... + am(xm xm) = (x, xm). Дополнение. Чтобы получить эту систему, нужно последовательно умножить разложение вектора х справа скалярно на векторы дсь ..., хт.
434 Часть I. Математические сведения по линейной алгебре 12.6-25.3 Матрица и определитель Грама Матрица G, являющаяся транспонированной матрицей системы 12.6-24, имеет вид G= (*2>*i) (*2>*2) ••• и называется матрицей Греша системы векторов хихъ...,хт. Ее определитель G(xu . •, *m) называется определителем Грама. 12.6-26.3 Матрица билинейной формы Если векторы лгь ..., хт образуют базис пространства, то матрица Грама для них является матрицей основной билинейной формой (х9 у) в этом базисе. Дополнение. Это следует из определения 12.2-2. 12.6-27.3 Конгруэнтность матриц Грама Матрицы Грама для различных базисов конгруэнтны. Дополнение. Это есть прямое следствие 12.6-26 и 12.2-8. 12.6-28.3 Ранг билинейно метрического пространства Ранг матриц Грама на базисных системах векторов является инвариантом билинейно метрического пространства и называется его рангом. Дополнение. При переходе к другому базису матрица Грама согласно 12.6-27 умножается на невырожденные матрицы. Как показано в дополнении к 12.2-9, ранг матрицы при этом не изменяется. Поэтому ранг матрицы Грама при фиксированной билинейной форме в пространстве является инвариантом. 12.6-29.3 Дефект пространства Разность между размерностью и рангом пространства называется дефектом пространства. 12.6.5. Ортогональность и ортогональное дополнение 12.6-30.3 Ортогональность справа и слева Если для двух векторов х,у билинейно метрического пространства выполняется равенство (х, у) = 0, то вектор у называется ортогональным справа к вектору х, а вектор х — ортогональным слева к вектору >\
12. Билинейные формы 435 12.6-31.3 Ортогональность Если (х, у) ~(у,х) = О, то векторы х, у называются ортогональными. 12.6-32.3 Ортогональность вектора к подпространству Для того чтобы вектор пространства был ортогонален в каком-либо смысле ко всем векторам линейного подпространства, необходимо и достаточно, чтобы этот вектор был ортогонален в том же смысле к векторам какого-нибудь базиса подпространства. Дополнение. С точностью до указания смысла ортогональности, доказательство дословно повторяет дополнение к 5.3-2. 12.6-33.4 Ортогональность множеств Множество векторов F билинейно метрического пространства ортогонально справа, слева или просто ортогонально множеству векторов G того же пространства, если аналогичное отношение ортогональности выполняется для каждой пары векторов х, у, где* eF,yeG. 12.6-34.4 Ортогональное дополнение справа и слева Множество векторов пространства, ортогональных справа (слева) каждому из векторов множества F, называется ортогональным дополнением F справа (слева) и обозначается F1 (LF). 12.6-35.4 Ортогональное дополнение и подпространство Ортогональное дополнение есть подпространство. Дополнение. С точностью до указания смысла ортогональности, доказательство дословно повторяет дополнение к 5.3-5. 12.6-36.4 Ортогональное дополнение к дополнению Для любого множества F имеют место включения F с1 (F1), F с (^FI. Дополнение. По определению 12.6-34 множество F1 есть множество векторов у билинейно метрического пространства, для которых (*, у) = О при всех х е F. По определению 12.6-30 это означает, что любой вектор х из F ортогонален слева ко всем векторам у из F1. Так как ^(F1) есть множество всех векторов, ортогональных слева ко всем векторам из F1, то заведомо Fc±(FL). Включение Fc (F1I доказывается аналогично. 12.6-37.4 Совпадение дополнений справа и слева Если скалярное произведение задано симметричной или кососимметричной билинейной формой, то для любого множества F выполняется равенство F1 = LF.
436 Часть I. Математические сведения по линейной алгебре Дополнение. Очевидно, т. к. в этом случае равенства (jc, у) = 0 и (у, х) = 0 выполняются одновременно. 12.6.6. Свойства матрицы и определителя Грама 12.6-38.3 Вырожденная матрица Грама Если матрица Грама системы векторов х\9 ...,хт вырожденная, то существуют такие векторы w, v, являющиеся нетривиальными линейными комбинациями векторов xu -..,xm, что и ортогонален справа, a v — слева ко всем векторам линейной оболочки векторовхь ...9хт. Дополнение. Если матрица Грама вырожденная, то ее строки линейно зависимы согласно 4.1-25. Следовательно, существуют такие числа уьУг, ...,Y« не все Рав~ ные нулю, что линейная комбинация строк будет нулевой, т. е. i) + Yiixi, *i) + ... + уда(хот, *,) = О, , xm) + y2(x2, xm) + ... + ym(xm, xm) = 0. Если обозначить то выписанные соотношения означают, что (v, jc7) = 0 для всех у, 1 <j < т. Вектор и строится аналогично, но исходя из линейной зависимости столбцов матрицы Грама. 12.6-39.3 Ненулевые изотропные векторы Если матрица Грама для линейно независимой системы векторов вырожденная, то квадратичная форма (х, х) имеет ненулевой изотропный вектор, принадлежащий линейной оболочке заданной системы и ортогональный справа (слева) ко всем векторам этой оболочки. Дополнение. Векторы w, v из 12.6-38 ортогональны соответственно справа и слева ко всем векторам jcj, ...,xm и, следовательно, ко всем векторам их линейной оболочки, в том числе и к самим себе. Поэтому они являются изотропными. По построению они ненулевые, т. к. векторы дгь ...,*„, по условию линейно независимы и числа Yi, ..., ут не все равны нулю. 12.6-40.3 Равенство нулю определителя Грама Для любой линейно зависимой системы векторов определитель Грама равен нулю. Дополнение. Пусть система векторов хь ..., хт линейно зависима. Если jci = 0, то справедливость утверждения очевидна. Предположим поэтому, что*1 Ф 0.
12. Билинейные формы 437 Согласно 2.1-16 некоторый вектор хь линейно выражается через предыдущие, т. е. Прибавим к к-й строке определителя Грама его первую строку, умноженную на -рь вторую строку, умноженную на -р2, и т. д. И, наконец, (к- 1)-ю строку, умноженную на ~Pjt_ 1. Согласно 4.1-20 определитель Грама не изменится. Однако после этого к-я строка определителя станет нулевой. Для всех /, 1 < / < т, ее элемент, стоящий в позиции (к, /), будет равен Согласно 4.1-16 определитель равен нулю. 12.6-41.3 Отсутствие ненулевых изотропных векторов Если квадратичная форма (х, х) не имеет ненулевых изотропных векторов, то определитель Грама не равен нулю тогда и только тогда, когда его система векторов линейно независима. Дополнение. Пусть квадратичная форма (х, х) не имеет ненулевых изотропных векторов, но определитель Грама равен нулю для системы векторов хи ...,хт. Согласно 4.1-25 его строки линейно зависимы, т. е. существуют числа ссь ..., ат, не все равные нулю и такие, что линейная комбинация первой строки, умноженной на ОС], второй строки, умноженной на ос2, и т. д, /и-й строки, умноженной на ост, будет нулевой. Это означает, что для всех /, 1 < / < т, будем иметь т Для квадратичной (эрмитовой квадратичной) формы (лс, х) умножим /-е равенство, 1 < / < т, на а.(а,.) и все равенства сложим. Тогда 1 7 = 1 По условию квадратичная форма (х, х) не имеет ненулевых изотропных векторов. Поэтому вектор у = сад + ... + antxm = 0. Так как среди чисел аь ..., а», не все равны нулю, то векторы хь ..., х,„ линейно зависимы. Следовательно, если квадратичная форма (х, х) не имеет ненулевых изотропных векторов и система векторов jci, ...,хт линейно независима, то определитель Грама не равен нулю. Если же он не равен нулю, то система векторов х\, ...,xw не может быть линейно зависимой согласно 12.6-40. 12.6-42.3 Комментарий (об изотропных векторах) Заметим, что если определитель Грама не равен нулю на линейно независимой системе векторов, то это еще не означает, что в линейной оболочке данной системы нет
438 Часть I. Математические сведения по линейной алгебре ненулевых изотропных векторов. Примером может служить кососимметричная билинейная форма. 12.6-43.3 Перемена векторов местами Определитель Грама не изменяется при перемене местами любых двух векторов в системехь ...,*т. Дополнение. Действительно, если в системе векторов jci, ...,xm поменять местами какие-либо два вектора xhxj, то в матрице Грама поменяются местами /-й иу-й столбцы, а также /-я иу-я строки. Согласно 4.1-18 определитель Грама два раза сменит знак, т. е. останется без изменения. 12.6-44.3 Прибавление линейной комбинации Определитель Грама не изменяется от прибавления к любому вектору системы х\, ...,*,„ любой линейной комбинации остальных векторов. Дополнение. Достаточно рассмотреть случай, когда изменяется вектор xh Согласно 12.6-43 остальные случаи сводятся к этому. Пусть к вектору Х\ прибавляется вектор СС2Х2 + • ¦ • + а/Л- Предположим, что билинейная форма (я:, у) — обыкновенная. Легко проверить, что новая матрица Грама получается из старой путем прибавления к первой строке второй строки, умноженной на ось и т. д. до последней строки, умноженной на ctw, и к первому столбцу второго столбца, умноженного на а2, и т. д. до последнего столбца, умноженного на ат. Согласно 4.1-20 определитель Грама от этого не изменяется. Если билинейная форма (х,у) эрмитова, то столбцы умножаются на ос2,..., ат . 12.6.7. Нулевые подпространства 12.6-45.4 Нулевые подпространства Подпространства ХК и К1 билинейно метрического пространства К называются соответственно левым и правым нулевыми подпространствами в К. 12.6-46.4 Двойное ортогональное дополнение Имеют место соотношения \KL) = (^АГI = К. Дополнение. Имеем ^К1) <zK, т. к. 1(А^1) есть множество векторов из К. Пусть у— произвольный вектор из К1. Согласно определению 12.6-30 это означает, что (х,у) для всех х е К. С другой стороны, по определению 12.6-34 это же равенство говорит о том, что х е \К1). Поэтому К =\KL). Аналогично устанавливаем, что К=(±КI. 12.6-47.4 Полезные соотношения Для любого множества векторов F всегда справедливы включения К1 с F1, LK с 1F.
12. Билинейные формы 439 12.6-48.4 Нулевые матрицы Грама Для любых систем векторов из 1К или К1 матрицы Грама являются нулевыми. Дополнение. Если Х{,...9хт— векторы из ^К^К1), то (xh х) = 0 ((х, X/) = 0) для любого вектора х е К и всех /, 1 < / < т. В том числе, для х = х\, ..., х = хт. 12.6-49.4 Размерности нулевых подпространств Размерности левого и правого нулевых подпространств совпадают и равны дефекту билинейно метрического пространства. Дополнение. Выберем в К какой-либо базис х\, ...,*»,. Возьмем произвольный вектор х е1К и представим его в виде разложения 12.6-24. Условие х ехК эквивалентно условиям ортогональности слева вектора х к каждому из векторов базиса. Но эти условия приводят к решению однородной системы линейных алгебраических уравнений вида 12.6-24 для определения коэффициентов разложения. Согласно 6.3-4 множество решений этой системы есть подпространство, размерность которого равна дефекту матрицы Грама или, что то же самое, дефекту билинейно метрического пространства. Подпространство К1 рассматривается аналогично. 12.6.8. Невырожденные пространство и подпространство 12.6-50.4 Вырожденное пространство Билинейно метрическое пространство называется вырожденным (невырожденным), если его дефект отличен от нуля (равен нулю). 12.6-51.4 Единственность решения Для невырожденного пространства система 12.6-24, где хи...,хт— базис, всегда имеет, и притом единственное, решение. Дополнение. Невырожденность пространства означает, что ранг матрицы Грама, построенной для базиса пространства, равен размерности пространства. Поэтому матрица системы 12.6-24 будет невырожденной и согласно 6.3-11 система имеет единственное решение. 12.6-52.4 Невырожденные подпространства Для того чтобы в пространстве были невырожденными все его подпространства, необходимо и достаточно, чтобы квадратичная форма (х, х) не имела ненулевых изотропных векторов. Дополнение. Предположим, что квадратичная форма (х, х) не имеет ненулевых изотропных векторов. Рассмотрим любое подпространство L и пусть векторы х\9 ...,*от образуют его базис. Согласно 12.6-41 определитель Грама для этой системы отличен от нуля. Поэтому его ранг равен размерности подпространства. По
440 Часть I. Математические сведения по линейной алгебре определению 12.6-50 подпространство L невырожденное. Пусть теперь все подпространства невырожденные. Тем не менее, допустим, что квадратичная форма (х, х) имеет ненулевой изотропный вектор х0, т. е. (дг0, х0) = 0 для х0 Ф 0. Но (х0, х0) есть определитель Грама для системы из одного вектора *0. Этот вектор представляет базис одномерного подпространства Lu состоящего из векторов, коллинеар- ных вектору jc0. По условию оно невырожденное. Поэтому должно быть (хо, *о) * 0. Полученное противоречие говорит о том, что квадратичная форма (х, х) не имеет ненулевых изотропных векторов. 12.6-53.4 Строго знакопостоянная квадратичная форма Если квадратичная форма (х, х) строго знакопостоянная, то определитель Грама равен нулю тогда и только тогда, когда система векторов линейно зависима. Дополнение. Это есть прямое следствие 12.6-41. 12.6-54.4 Критерий невырожденности пространства Для того чтобы пространство было невырожденным, необходимо и достаточно, чтобы правое и левое нулевые подпространства состояли только из нулевого вектора. Дополнение. Очевидное следствие 12.6-49. 12.6.9. Свойства невырожденного подпространства 12.6-55.4 Разложение пространства в прямую сумму Пусть L — подпространство в К. Для того чтобы существовали разложения К = L + LL = L + LL, необходимо и достаточно, чтобы подпространство L было невырожденным. Дополнение. Предположим, что имеет место разложение K = L + L1. Будем рассматривать L как билинейно метрическое пространство с тем же скалярным произведением, что и в К. Пересечение Lr\LL является правым нулевым подпространством в L. Так как К = L + L1 есть прямая сумма, то пересечение содержит только нулевой вектор согласно 5.3-20. Согласно 12.6-54 подпространство L невырожденное. Если подпространство L— невырожденное, то пересечение Lr\LL согласно 12.6-54 содержит только нулевой вектор. Остается показать, что любой вектор х еК может быть представлен в виде х = u + v, где и е I, v e /А Возьмем какой-либо базис хь ..., хт в L. Для существования искомого разложения х = и + v необходимо и достаточно, чтобы в L нашелся такой вектор и, что вектор х- и будет ортогонален справа к векторам хь ..., хт. Снова для определения коэффициентов разложения вектора и по векторам дсь ...,х,„ получаем систему линейных алгебраических уравнений с матрицей Грама. В силу невырожденности подпространства L эта матрица невырожденная и система имеет решение, т. е. вектор и существует.
12. Билинейные формы 441 Конечно, все сказанное относительно подпространства L1 полностью переносится на подпространство 1L. 12.6-56.4 Размерность ортогонального дополнения Если невырожденное подпространство L имеет размерность т, то размерность подпространств L1 и 1L равна п-т, где п — размерность всего пространства. Дополнение. Очевидное следствие 12.6-55 и 5.3-14. 12.6-57.4 Невырожденное подпространство максимальной размерности Если невырожденное подпространство L имеет максимально возможную размерность, то L1 = K\ LL = LK. Дополнение. Действительно, пусть ранг билинейной формы (х,у) равен г. Тогда подпространство L будет иметь размерность г, а подпространства L1 и 1L — размерность п-г. Но согласно 12.6-49 размерности подпространств К1 и ±К также равны п-г. Кроме этого, К1 aL1, LKcSl Поэтому К1 = L1, LK = LL. 12.6-58.4 Разложение пространства в ортогональную сумму Пусть L — невырожденное подпространство максимальной размерности. Разложения 12.6-55 будут ортогональными тогда и только тогда, когда левое и правое нулевые подпространства совпадают. Дополнение. В самом деле, если разложения 12.6-55 ортогональные, то L1 ортогонально к L не только справа, но и слева, т. е. L1 c^L. Аналогично имеем 1L с L1. Следовательно, L1 = LL. Так как L имеет максимальную размерность, то согласно 12.6-57 это означает, что К1 ~ 1К. Если же нулевые подпространства совпадают, то отсюда в силу 12.6-57 следует, что L1 = LL, т. е. подпространства L1 и XL ортогональны L как справа, так и слева и разложения 12.6-55 являются ортогональными. 12.6-59.4 Еще раз о максимальной размерности Если L — невырожденное подпространство максимальной размерности, то подпространства LL и L1 состоят только из изотропных векторов. Дополнение. Это есть прямое следствие 12.6-57, 12.6-48. 12.6-60.4 Система с транспонированной матрицей Грама Пусть векторы хи ...,хт образуют базис невырожденного подпространства L и х — произвольный вектор. Тогда вектор ... +amxmi
442 Часть I. Математические сведения по линейной алгебре где коэффициенты аь ..., am удовлетворяют системе линейных алгебраических уравнений b х,) + а2(х2, *0 + ... + CLm(xm9 х,) = (х, xj), ,, x2) + а2(х2, х2) + ... + а,и(хт, х2) = (х, х2), b xm) + а2(х2, xw) + ... + а,и(хт, х,„) = (х, x,w), есть проекция вектора х на подпространство L параллельно подпространству LL. Дополнение. Пусть векторы хь ...,*т образуют базис невырожденного подпространства L. Если будет решена система, описанная в утверждении, и составлен вектор z = сад + ... + сел, то z e L как линейная комбинация векторов хь ...,хт. Кроме этого, из самой системы вытекает, что (х-z,х,) - 0 для всех /, 1 <i<m. Поэтому jc-z gxL. Таким образом, получено разложение вектора х в виде суммы x = z + (x-z), где z e L9x-z <elL. Согласно 12.6-55 и определения 5.3-12 это разложение единственно и вектор z есть проекция вектора х на подпространство L вдоль подпространства LL. 12.6-61.4 Система с матрицей Грама Пусть векторы хь ...,х,„ образуют базис невырожденного подпространства L в билинейно метрическом пространстве их — произвольный вектор. Тогда вектор где коэффициенты аь ..., аш удовлетворяют системе линейных алгебраических уравнений О + а2(х1? х2) + ... + а,„(хь xw) = (хь х), 2, хх) + а2(х2, х2) + ... + а/?,(х2, хт) = (х2, х), о.\(хп» х}) + ot2(xw, х2) + ... + aw(xw, х„) = (х„„ х), есть проекция вектора х на подпространство L параллельно подпространству L1. Дополнение. Доказательство аналогично дополнению к 12.6-60. 12.6-62.4 Случай эрмитова билинейного пространства Пусть векторы хь ...,xw образуют базис невырожденного подпространства L в эрмитовом билинейно метрическом пространстве их — произвольный вектор. Тогда вектор где коэффициенты аь ..., ат удовлетворяют системе линейных алгебраических уравнений из 12.6-61, есть проекция векторах на подпространство L параллельно подпространству L1. Дополнение. Доказательство аналогично дополнению к 12.6-60.
12. Билинейные формы 443 12.7. Ортогональные, псевдоортогональные и другие базисы 12.7.1. Ортогональный базис 12.7-1.3 Комментарий (о неравноправии базисов) В билинейно метрических пространствах базисы неравноправны. Среди них имеются такие, для которых системы 12.6-60—12.6-62 решаются и исследуются особенно просто. Так будет, например, в случае, когда значительная часть матрицы Грама состоит из нулевых элементов. Соответственно тому, какой вид имеют матрицы Грама, мы будем рассматривать различные классы базисов в билинейно метрических пространствах. Класс базисов определяется, конечно, простейшим видом матриц, задающих основную форму (х,у). Напомним, что все эти матрицы конгруэнтны. 12.7-2.3 Ортогональный базис Базис называется ортогональным, если его матрица Грама диагональная. 12.7-3.4 Совпадение нулевых подпространств Если в пространстве существует ортогональный базис, то правое и левое нулевые подпространства совпадают. Дополнение. Пусть в пространстве К ранга г существует ортогональный базис еиеъ...,еп. Будем считать, что векторы еъ ...,ег— не изотропные, а векторы ег+\, ...,еп — изотропные. Возьмем произвольный вектор х еКи представим его в виде разложения x = aiel + a2e2+... +а„е„. Принимая во внимание ортогональность базиса и изотропность векторов ег+ ь ..., еп, легко установить, что (х, ej) = (е7, л:) = 0 для г <j < п. Следовательно, векторы er+h ..., е„ входят одновременно и в правое, и в левое нулевые подпространства. Но векторы ег+ь ...9е„ как векторы базиса линейно независимы и их число равно согласно 12.6-49 размерности нулевых подпространств. Поэтому оба нулевых подпространства совпадают. 12.7-4.4 Базис нулевого подпространства В любом ортогональном базисе изотропные векторы, и только они, образуют базис общего нулевого подпространства. Дополнение. Очевидно, принимая во внимание дополнение к 12.7-3. 12.7-5.3 Существование ортогональных базисов Среди билинейно метрических пространств имеют ортогональные базисы те и только те пространства, в которых билинейная форма (х,у) симметричная.
444 Часть I. Математические сведения по линейной алгебре Дополнение. Если билинейная форма симметричная, то согласно 12.2-25 ее матрица конгруэнтна диагональной матрице. Так как согласно 12.6-26 матрица Грама совпадает на базисных системах векторов с матрицей билинейной формы, то это говорит о существовании ортогонального базиса. Пусть теперь в билинейно метрическом пространстве существует ортогональный базис. Согласно 12.6-27 это означает, что матрицы Грама на базисных системах векторов конгруэнтны диагональной матрице. Из 12.2-8 вытекает, что все они могут быть представлены в виде Р'АР, где Л — диагональная матрица, и, следовательно, являются симметричными. Согласно 12.2-3 билинейная форма с симметричной матрицей сама оказывается симметричной, т. к. ф(х, у) = х'еФеуе = (х'еФеуе)' = у'еФехе = фО, х). 12.7-6.3 Еще раз о существовании ортогональных базисов Среди эрмитовых билинейно метрических пространств имеют ортогональные базисы пространства с эрмитовой симметричной и эрмитовой кососимметричной формой Дополнение. Если эрмитова билинейная форма имеет один из указанных видов, то согласно 12.2-5 аналогичными будут ее матрицы. Согласно 10.3-18, 12.2-26 любая из этих матриц конгруэнтна диагональной. Так как согласно 12.6-26 матрица Грама совпадает на базисных системах векторов с матрицей эрмитовой билинейной формы, то это говорит о существовании ортогонального базиса. 12.7-7.5* Нетипичный случай Среди эрмитовых билинейно метрических пространств имеют ортогональные базисы все пространства с эрмитовой билинейной формой (х, у), для которой соответствующая ей квадратичная форма (х, х), не имеет ненулевых изотропных векторов. Дополнение. Согласно 12.2-4 будем считать, что эрмитова билинейная форма (х9у) задана в базисе еи ..., е* скалярным произведением (Ахе,уе) с какой-то комплексной матрицей А. Пусть квадратичная форма (Ахе9 хе) не имеет ненулевых изотропных векторов. Согласно 12.6-18 это означает, что 0 ?V(A). В соответствии с 10.3-24 представим матрицу Л ее эрмитовым разложением A=HX + Ш2. В силу 12.6-10 выполняется равенство У(А)=ЩНХ,Н2). Так как 0 $W(Hh Я2), то согласно 12.5-40 пара матриц Яь Н2 будет определенной и в соответствии с 12.5-35 ее можно привести к вещественному диагональному виду общим конгруэнтным преобразованием. Этим же преобразованием приводится к диагональному виду и матрица А, а базис еь ..., е„ переводится в базис, ортогональный по отношению к эрмитовой билинейной форме (х,у).
12. Билинейные формы 445 12.7-8.5* Комментарий (о различии между пространствами) Эрмитовы квадратичные формы, имеющие ненулевые изотропные векторы, образуют среди всех эрмитовых квадратичных форм множество меньшей меры. Поэтому утверждение 12.7-7 говорит о том, что ортогональные базисы существуют почти во всех эрмитовых билинейно метрических пространствах. Если эрмитова квадратичная форма не имеет ненулевые изотропные векторы в пространстве, то она не имеет их и в любом его подпространстве. Из утверждения 12.7-7 вытекает, что ортогональные базисы существуют в каждом подпространстве почти любого из эрмитовых билинейно метрических пространств. Мы уже неоднократно убеждались в том, какое большое значение имеют ортогональные базисы для проведения исследований в унитарных пространствах. Поэтому может возникнуть предположение, что такое же значение ортогональные базисы будут иметь и в произвольных эрмитовых билинейно метрических пространствах. К сожалению, такое предположение несостоятельно. Объясняется это тем, что в произвольных эрмитовых билинейно метрических пространствах ортогональные базисы имеют совершенно другую структуру, чем в унитарных пространствах. В сопоставимых условиях их просто может быть гораздо меньше. Легко привести пример эрмитова билинейно метрического пространства, в котором с точностью до нормировки векторов существует всего лишь один ортогональный базис. Пусть в естественном базисе эрмитова билинейная форма задается скалярным произведением (Ах, у\ где матрица А имеет вид А= Е + iB,aB представляет эрмитову матрицу с попарно различными собственными значениями. Эрмитова квадратичная форма (Ах, х), очевидно, не имеет ненулевых изотропных векторов. Следовательно, в рассматриваемом пространстве существует ортогональный базис. Переход к нему от естественного базиса осуществляется преобразованием, которое эрмитово конгруэнтно приводит пару матриц Е, В одновременно к вещественному диагональному виду. Ясно, что с точностью до нормировки и перенумерации векторов такое преобразование одно и его матрица совпадает с матрицей собственных векторов матрицы В. Унитарное пространство, очевидно, является эрмитовым билинейно метрическим. Поэтому все общие свойства эрмитовых билинейно метрических пространств сохраняются и в унитарном пространстве. Однако унитарное пространство обладает большой спецификой. Его билинейная форма эрмитово симметрична, а порождаемая ею квадратичная форма положительно определена. Поэтому в унитарном пространстве должны существовать какие-то характерные свойства, отсутствующие в общем билинейно метрическом пространстве. Одно из ключевых свойств, связанное с ортогональными базисами, иллюстрируется утверждением 5.2-10. Согласно этому утверждению, в унитарном пространстве ортогональный базис любого объемлющего подпространства может быть построен как расширение ортогонального базиса объемлемого подпространства. В общем эрмитовом билинейно метрическом пространстве аналогичного свойства нет. Можно показать, что при его наличии матрица эрмитовой билинейной формы обязана иметь следующую специфику: в естественном базисе она есть произведение эрмитовой и диагональной матриц. Приведенные аргументы объясняют, почему нельзя рассчитывать на то, что в произвольных эрмитовых билинейно метрических пространствах ортогональные базисы
446 Часть I. Математические сведения по линейной алгебре будут играть столь же важную роль, как и в унитарных пространствах. Вот почему нужны другие, более подходящие типы базисов. 12.7.2. Псевдоортогональный базис 12.7-9.3 Псевдоортогональный базис Базис называется псевдоортогональным, если его матрица Грама правая трапециевидная. 12.7-10.3 Существование псевдоортогонального базиса Псевдоортогональный базис существует в любом эрмитовом билинейно метрическом пространстве, а также в любом обыкновенном билинейно метрическом пространстве, кроме пространств с кососимметричной билинейной формой (х,у). Дополнение. Это является прямым следствием утверждений 12.2-23, 12.2-27 и определения 12.7-9. 12.7-11.3 Критерий псевдоортогональности Для того чтобы базис был псевдоортогональным, необходимо и достаточно, чтобы каждый из его неизотропных векторов был бы ортогонален слева ко всем предшествующим векторам базиса, каждый из его изотропных векторов был ортогонален слевй ко всем векторам базиса и все изотропные векторы базиса были последними. Дополнение. Принимая во внимание определение 12.6-30 и вид 12.6-25 матрицы Грама, заключаем, что это есть всего лишь переформулировка того, что матрица Грама является правой трапециевидной. 12.7-12.3 Комментарий (о перестановке векторов базиса) Заметим, что ортогональный базис при любой перестановке его векторов остается ортогональным. Псевдоортогональный базис при перестановке векторов уже может не быть псевдоортогональным. 12.7-13.4 Изотропные векторы в базисе Изотропные векторы псевдоортогонального базиса образуют базис левого нулевого подпространства. Дополнение. Согласно 12.7-11 изотропные векторы псевдоортогонального базиса ортогональны слева ко всем векторам базиса и, следовательно, ко всем векторам пространства. Поэтому они принадлежат левому нулевому подпространству. Как векторы базиса они линейно независимы. Кроме этого, их число равно разности между размерностью пространства и рангом матрицы Грама, которое согласно 12.6-49 равно размерности левого нулевого подпространства. Все это говорит о том, что изотропные векторы псевдообратного базиса являются базисом левого нулевого подпространства.
12. Билинейные формы 447 12.7-14.3 Полезный пример Справедливо равенство -/ДО 1 'Д1 i) { О l-/j Дополнение. Проверяется непосредственно. 12.7-15.3 Ортогональный и псевдоортогональный базисы Существуют пространства, в которых имеются как ортогональный, так и псевдоортогональный базис, не являющийся ортогональным. Дополнение. Это подтверждается примером 12.7-14, который показывает, что правая треугольная матрица может быть эрмитово конгруэнтной диагональной матрице. 12.7-1 б.3 Псевдоортогональная система векторов Система векторов, образующих псевдоортогональный базис в своей линейной оболочке, называется псевдоортогональной. 12.7-17.3 Комментарий (об обобщении базисов) Псевдоортогональный базис является достаточно общим типом базиса, т. к. существует почти во всех пространствах. Как мы уже отмечали, он не существует только в обыкновенных билинейно метрических пространствах с кососимметричной формой (х,у). Вообще говоря, можно ввести тип базиса, покрывающий все рассмотренные типы базисов и существующий во всяком пространстве со скалярным произведением. Однако его введение дает мало новых фактов, и мы не будем на нем останавливаться. 12.7.3. Двойственные, псевдодвойственные и другие базисы 12.7-18.4 Двойственные базисы Пусть в паре базисов матрица билинейной формы является диагональной с элементами 1 или 0 на диагонали. Первый (второй) из этих базисов называется левым (правым) двойственным для второго (первого) базиса. 12.7-19.4 Существование двойственных базисов В любом невырожденном пространстве каждый базис имеет правый и левый двойственные базисы, и притом единственные. Дополнение. Пусть Ф есть матрица билинейной формы в каком-либо базисе. В силу невырожденности пространства матрица Ф невырожденная. Существова-
448 Часть I. Математические сведения по линейной алгебре ние правого (левого) базиса, двойственного к заданному базису, означает существование такой матрицы Q (Р) перехода к нему, что в соответствии с 12.2-35 должно выполняться равенство Ф?) = Е (Р'Ф - Е) для билинейно метрического пространства и Ф<2 - Е (Р'Ф = Е) для эрмитова билинейно метрического пространства. Согласно 8.1-4 матрицы Q, Р невырожденные. Из всех указанных равенств они определяются однозначно. 12.7-20.4 Псевдодвойственные базисы Пусть в паре базисов матрица билинейной формы является правой трапециевидной с ненулевыми элементами на главной диагонали, равными 1. Первый (второй) из этих базисов называется левым (правым) псевдодвойственным для второго (первого) базиса. 12.7-21.4 Существование псевдодвойственных базисов В любом пространстве ненулевого ранга каждый базис, возможно после некоторой одинаковой перенумерации координат всех его векторов, имеет как левый, так и правый псевдодвойственный базис. В невырожденном пространстве перенумерацию можно избежать. Дополнение. Пусть задан базис еь ..., еп. Докажем, например, существование левого псевдодвойственного базиса в билинейно метрическом пространстве. Все остальные случаи рассматриваются аналогично. Обозначим через Ф матрицу билинейной формы в базисе в\, ..., е„. Предположим, что она имеет ранг г, 1 <г<п. Принимая во внимание 3.6-16, 3.6-17, 4.3-5, а также 3.2-16,4.4-10,4.4-17, заключаем, что существуют невырожденная матрица S и, возможно, матрица перестановок И такие, что 5ФЯ= U, где матрица U— правая трапециевидная ранга г с ненулевыми диагональными элементами, равными 1. Согласно 8.1-3, 12.2-35, 12.7-20 это означает, что базис/ь ...,/,, задаваемый преобразованием ej = S% 1 < /<я, является левым псевдодвойственным по отношению к базису /ь ..., /„, задаваемому преобразованием e, = Hth I <i<n. Но векторы tu ...,tn могут отличаться от еи ...,е„ лишь одинаковой для всех векторов перенумерацией координат. Если пространство невырожденное, то невырожденной будет матрица Ф и согласно 3.6-7 можно считать, что S = Ф~ \ #=?/=?, и перенумерация отсутствует. 12.7-22.4 Комментарий (о разных базисах) Введение псевдоортогональных базисов было оправдано тем, что не во всех пространствах существуют ортогональные базисы, а там, где они существуют, их может быть недостаточно для осуществления необходимого выбора. Однако введение псевдодвойственных базисов с этой точки зрения может показаться неоправданным, т. к. они сложнее двойственных базисов, хотя такие базисы существуют в тех же пространствах и в нужном количестве. Как будет показано в дальнейшем, в ряде важных случаев можно строить только псевдоортогональные или псевдодвойственные базисы и нельзя строить ортогональные или двойственные. При этом многие задачи удается
12. Билинейные формы 449 решать столь же эффективно, как и в случае использования ортогональных или двойственных систем. 12.7-23.4 Треугольный вид матрицы преобразования В невырожденном пространстве матрица преобразования координат при переходе от левого (правого) псевдодвойственного базиса к любому другому левому (правому) псевдодвойственному базису является левой (правой) треугольной матрицей с единичными диагональными элементами. Дополнение. Рассмотрим для определенности билинейно метрическое пространство. Случай эрмитова билинейно метрического пространства рассматривается аналогично. Пусть xh ...,хп — заданный базис, базисы yh ...,уп и zh ..., zm например, правые псевдодвойственные к нему. Обозначим через R матрицу преобразования координат при переходе от базисау\, ...,упк базису zb ..., zn. По определению 12.7-20 матрица Ф билинейной формы в базисах х\, ...,х„ иу]9 ...,у„ является правой треугольной с диагональными элементами, равными 1. Согласно 12.2-35 матрица той же билинейной формы в базисах х\, ...,хпи zu ..., zn равна ФЛ и также будет правой треугольной с диагональными элементами, равными 1. Нетрудно проверить, что матрица, обратная к треугольной с единичными диагональными элементами, имеет такой же тип. Поэтому R = Ф~ \ФК) есть правая треугольная матрица с диагональными элементами, равными 1. Если базисы уь ...,>>„ и z\9 ...,zn— левые псевдодвойственные к базису х\, ...,хт то вместо матрицы ФЛ появится матрица Я'Ф. Теперь матрица R = ((Я'Ф)Ф~ *)' будет левой треугольной матрицей с диагональными элементами, равными 1. 12.7-24.4 А-ортогональные системы векторов Пусть А — некоторая квадратная матрица, заданная над полем вещественных или комплексных чисел. Системы векторов в арифметическом евклидовом или унитарном пространстве, ортогональные (псевдоортогональные, двойственные, псевдодвойственные) относительно формы (Ах, у), называются А-ортогоналъными (А-псевдоорто- гональными, А-двойственными, А-псевдодвойственными). 12.7-25.4 Сопряженные системы векторов ^-ортогональные (Л-псевдоортогональные) системы векторов называются также системами, сопряженными (псевдосопряженными) относительно матрицы А. 12.8. Ортогонализация 12.8.1. Общий процесс псевдоортогонализации 12.8-1.3 Комментарий (о процессах ортогонализации) Одним из важнейших понятий, связанных с линейным пространством, является понятие ортогональности. Мы уже неоднократно убеждались в том, какую важную роль 15 Зак 740
450 Часть I. Математические сведения по линейной алгебре играют ортогональные и псевдоортогональные системы векторов и особенно базисные системы такого типа. До сих пор большинство наших рассуждений было связано с доказательством существования подобных систем, но не с процессами их построения. Ввиду важности ортогональных, псевдоортогональных и других аналогичных систем для конструирования самых различных вычислительных алгоритмов рассмотрим сейчас общий процесс построения этих систем, называемый процессом ортого- нализацгш. 12.8-2.3 Линейные оболочки векторов базисов Пусть в линейном пространстве задано скалярное произведение (х, у) с помощью невырожденной эрмитовой билинейной формы. Предположим, что для базиса еь ..., еп существует базис/ь ...,/„ обладающий следующими свойствами: • для любого к > 1 линейные оболочки Lk векторов еь ..., ек и/, ...,fk совпадают; • базис/ь ...,/, псевдоортогональный. Тогда этот базис единственный, с точностью до нормировки векторов. Дополнение. Предположим, что существует другой базис gb --igm обладающий такими же свойствами, как базис/j,...,/,. Векторы g\ и/j коллинеарны вектору е\ и все они не нулевые, как векторы базисов. Поэтому g\ = y/i и yi ф 0. Пусть для некоторого к> 1 имеем gf = y/h где у/Ф 0, для всех /, 1 <i<k. Вектор gk+\ принадлежит линейной оболочке векторов еи ...,ек+] и, следовательно, линейной оболочке векторов/, ...,/ + ь т. е. имеет место разложение для некоторых коэффициентов ссь сх2, ..., ак+1. Умножим это равенство справа скалярно на gx. Принимая во внимание, что g\ = Yi/i и псевдоортогональность базисов gb ...,gw и/ь ...,/,, получаем равенство 0 = al'y](fl,f]). В силу невырожденности эрмитовой билинейной формы скалярное произведение (/i,/i) Ф 0, коэффициент у! * 0 по предположению. Поэтому а.\ = 0. Умножив равенство справа скалярно на g2, аналогично получаем, что ос2 = 0, и т. д. Все коэффициенты аь ..., ос* оказываются равными нулю. Следовательно, gk+1 = a*+ \fk+ \. Коэффициент ак+1 не может равняться нулю. В противном случае, gk+ \ = 0, что невозможно, т. к. это есть вектор базиса. Сказанное говорит о том, что векторы gb ..., gn лишь с точностью до множителей отличаются от векторов/i, ...,/,. 12.8-3.3 Процесс псевдоортогонализации Предположим, что (еь ех) * 0, и положим/] = е\. Пусть уже построена система псевдоортогональных векторов/ь ...,/i, причем линейные оболочки этих векторов и векторов еи ...<>ексовпадают. Будем искать вектор/^ i в виде
12. Билинейные формы 451 где a.\tk+u •••> ак,к+1 — неизвестные коэффициенты. Условия ортогональности вектора./^ i слева к векторам/ь ...,fk дают для определения ос^+ь ¦••> &ju+i следующую систему уравнений: + a2, * Матрица этой системы — треугольная. Если (ft,Л)*0 для 1 < /<и, то после п шагов будет построена система векторов/],...,/,, удовлетворяющая обоим свойствам 12.8-2. Дополнение. По построению линейные оболочки векторов еь...,е* и/ь ...,,/i совпадают для всех &> 1. Условия ортогональности векторов fk+l слева к векторам /ь ...,у* означают, что матрица Грама для/ь ...,/, будет правой треугольной. И, наконец, условия (fhfj) *¦ 0 для 1 < / < п говорят о том, что согласно определению 12.7-9 базис/ь ...,/, будет псевдоортогональный. 12.8-4.3 Осуществимость процесса псевдоортогонализации Процесс ортогонализации 12.8-3 осуществим на всех шагах тогда и только тогда, когда матрица билинейной формы (х,у) в базисе е\, ..., еп или, что то же самое, матрица Грама этой системы имеет ненулевые ведущие миноры. Дополнение. Обозначим через Ф матрицу Грама системы векторов еи ..., е„, через Р — матрицу преобразования координат при переходе от базиса еь ..., еп к базису /ь ...,fn, Как видно из процесса 12.8-3, принимая во внимание 8.1-2, матрица Р является правой треугольной с единичными диагональными элементами. В силу псевдоортогональности базиса/ь ...,/, и неизотропности его векторов матрица Грама системы/ь ...,/, будет правой треугольной с ненулевыми диагональными элементами. Согласно 12.2-8 она имеет вид Р'ФР . Согласно 11.1-5 представление Ф = (Р'У1((Р'ФР)Р-1) есть не что иное, как ItZ-разложение матрицы Ф, т. к. матрица L = (Р')~х — левая треугольная матрица с единичными диагональными элементами, матрица U = ((Р'ФР)Р~1) — правая треугольная с ненулевыми диагональными элементами. В силу 11.1-8 все ведущие миноры матрицы Ф— ненулевые. Предположим теперь, что все ведущие миноры матрицы Ф не равны нулю. Согласно 11.1-4 существует разложение Ф = /,?/, где L— левая треугольная матрица, U— правая треугольная. В соответствии с 11.1-8 можно считать, что все диагональные элементы матрицы L равны 1, матрицы U— не равны нулю. Теперь перейдем от базиса еи ..., еп к базису/ь ...,fn с матрицей преобразования Р = (/Г1)'. В новом базисе согласно 12.2-8 матрица Грама будет иметь вид
452 Часть I. Математические сведения по линейной алгебре то есть является правой треугольной с ненулевыми диагональными элементами. Следовательно, по определению 12.7-9 базис/, ...,fn является псевдоортогональным. Матрица Р— правая треугольная с единичными диагональными элементами. В силу 8.1-2 линейные оболочки векторов/ь ...,/ и еь ..., ек совпадают для всех к. Принимая во внимание 12.8-2, заключаем, что процесс получения рассматриваемого базиса /ь ...,fn должен совпадать с процессом 12.8-3, т.е. процесс 12.8-3 осуществим. 12.8-5.3 Линейно зависимая система Если процесс ортогонализации 12.8-3 применить к линейно зависимой системе еи • •., е„, то/к+ 1 = 0 для некоторого к + 1 < п. Дополнение. Пусть система векторов еь ..., е„ линейно зависима. Согласно 2.1-16 в этом случае либо е\ = О, либо некоторый вектор ек + \ линейно выражается через векторы е\, ..., ек, которые, к тому же, линейно независимы. Если при проведении процесса 12.8-3 оказалось, что/=0 для некоторого г, 1 <r<L то утверждение верно. Предположим поэтому, что в процессе 12.8-3 удалось провести к шагов и построить векторы /, ...,fk. Вектор ек+\ линейно выражается через векторы е\, ...,ек и, следовательно, через векторы/, ...,/ь т. е. Принимая во внимание псевдоортогональность системы векторов/], ...,/к, легко проверить из системы уравнений в 12.8-3, что ос, к+ \ = - Р/ для всех /, 1 < / < к, т. е. 12.8-6.3 Ортогональное разложение Процесс ортогонализации 12.8-3 позволяет получить разложения векторов ек+\ по векторам/ь ...,fk+ j. Если согласно 12.8-3 то вектор в скобках принадлежит линейной оболочке Lk векторов еь ..., ек, вектор/t +1 ортогонален слева ко всем векторам еь ..., ек. Поэтому решение систем 12.8-3 дает разложение каждого вектора ек+ , на проекцию и левый перпендикуляр по отношению к подпространству Lk. Дополнение. По построению каждый из векторов/, 1 < / < и, линейно выражается через векторы еь ..., eh Поэтому вектор в скобках действительно принадлежит Lk. Также по построению вектор/+ i ортогонален слева ко всем векторам/, ...,/, и, следовательно, ко всем векторам еи ..., ек. 12.8-7.3 Комментарий (о сохранении преобразуемых векторов) Во многих задачах нет необходимости сохранять связь нового базиса/, ...,/, с исходным базисом еь ..., еп, т. к. требуется построить лишь какой-нибудь псевдоорто-
12. Билинейные формы 453 тональный базис в пространстве. В этом случае при каждом появлении равенства {fhfd = 0 нужно заменить вектор е, другим и снова вычислить вектор/, повторяя эту процедуру до тех пор, пока не выполнится условие (fhfy Ф 0. При этом векторы /ь ...,fi-i не изменяются. Необходимый для замены вектор е, обязательно найдется, если билинейная форма в пространстве невырожденная. 12.8.2. Ортогонализация Грама-Шмидта 12.8-8.3 Особенность симметричной формы Если скалярное произведение (х,у) задано симметричной формой, то система 12.8-3 становится системой с диагональной матрицей и для всех /. Построенный базис/ь ...,/, будет не только псевдоортогональным, но и ортогональным. Дополнение. Пусть скалярное произведение задано симметричной билинейной формой (эрмитовой симметричной формой). Согласно 12.2-5, 12.6-26 матрица Грама в любом базисе будет симметричной (эрмитовой), в том числе, в любом псевдоортогональном базисе. Поэтому в данном случае любой псевдоортогональный базис в действительности оказывается ортогональным. Следовательно, система уравнений в 12.8-3 будет диагональной и формулы для определения коэффициентов aitk+1 становятся совсем простыми. Именно, для всех /, !</<?, 12.8-9.3 Ортогонализация Грама-Шмидта В евклидовом и унитарном пространствах процесс ортогонализации 5.2-10, 12.8-3 и 12.8-8 называется ортогонализащеп Грама-Шмидта. 12.8-10.3 Невозрастание длин векторов При реализации процесса ортогонализации Грама-Шмидта для всех к > 2 выполняется неравенство (fk,fk) ^ (е*, ек\ причем равенство достигается тогда и только тогда, когда вектор ек ортогонален векторам еи ...,ек-\. Дополнение. По существу это есть уместная здесь переформулировка утверждения 5.4-22. 12.8.3. Псевдодвойственная и двойственная ортогонализация 12.8-11.4 Построение псевдодвойственного базиса Пусть ей '.->еп— заданный базис, и пусть нужно построить какой-нибудь псевдодвойственный для него базис, например, левый. Возьмем еще один базис gh ...,qn.
454 Часть I. Математические сведения по линейной алгебре Предположим, что (q\9 e{) Ф 0, и положим tx = qx. Допустим, что уже построена система векторов /|, ..., tk так, что их линейная оболочка совпадает с линейной оболочкой векторов <7ь • • -, Як и выполняются условия (/,-, е,) * 0 для 1 < / < к и (th ej) = 0 для у < /. Будем искать вектор tk+ x в виде где Pi,*+ 1, ..., Р*,*+1 — неизвестные коэффициенты. Условия ортогональности вектора tk+ 1 слева к векторам еь ..., ек дают для определения Pi,*+ ь ..., $к,к+1 следующую систему уравнений с треугольной матрицей b е2) Р1, к + i(/i, ^) + Рг, * +1(/2, е*) + ... +Ра, * + ,(/ь еА) = - fe + ь ек). Если при всех к будет выполнено неравенство (г*, е*)*0, то базис /ь ...,/„ с точностью до нормировки будет левым псевдодвойственным для базиса еь •••» ^w Дополнение. Доказательство почти дословно повторяет дополнение к 12.8-3 с заменой ссылки 12.7-9 на 12.7-20. 12.8-12.4 Осуществимость процесса Для того чтобы процесс 12.8-11 был осуществим при всех к, необходимо и достаточно, чтобы матрица билинейной формы (х9у) в базисах q\, ...,qn и еь ..., е„ имела ненулевые ведущие миноры. Дополнение. Доказательство почти дословно повторяет дополнение к 12.8-4 с заменой ссылок 12.8-3 на 12.8-11, 12.2-8 на 12.2-35 и 12.7-9 на 12.7-20. 12.8-13.4 Инвариантность процесса В процессе 12.8-11 система векторов /ь ..., tn не изменится, если к каждому вектору es (q,) прибавить линейную комбинацию векторов еи ..., ev_ i (gb ...? <grv-1). 12.8-14.4 Двойной процесс псевдоортогонализации Повторное применение процесса 12.8-11 позволяет построить левый двойственный базис для базиса еи ..., еп. Дополнение. Обозначим через Ф,«, матрицу билинейной формы в базисах fb ..., /„ и еь ...,еп из 12.8-11. По построению это будет правая треугольная матрица с ненулевыми диагональными элементами. Рассмотрим новые базисы q[9...,q'n и е[,...,е'п9 где q\ = '„_, + р е\ = ея_/ + | для всех /, 1 <i<n. Матрицей перехода от ста-
12. Билинейные формы 455 рых базисов к новым будет матрица S с элементами Sy9 удовлетворяющими условиям fl, / + у = л +1, Матрица билинейной формы в паре новых базисов будет равна <&qV = S<&leS. Легко проверить, что это есть левая треугольная матрица с ненулевыми диагональными элементами. Теперь по алгоритму, описанному в 12.8-11, построим из базиса q\,..., q'n новый базис t[,..., t'n, который будет левым псевдодвойственным для базиса el,...,е'п. Как уже отмечалось, например, в дополнении к 12.8-4 матрица Р преобразования координат при переходе от базиса q[,...,q'n к базису t[,...,t'n является правой треугольной с единичными диагональными элементами. Матрица билинейной формы в паре базисов t[,...,t'n и е[,...,е'п будет равна согласно 12.2-35 С одной стороны, как произведение левых треугольных матриц, это есть левая треугольная матрица. С другой стороны, по построению это есть правая треугольная матрица. Поэтому она диагональная. Следовательно, с точностью до нормировки базис t[,..., t'n является левым двойственным для базиса е[,...,е'п. И, наконец, базисръ ...,рт где р{ =^_/ + 1 для всех /, 1 < \<п, с точностью до нормировки будет левым двойственным для базиса еь ..., еп. 12.8-15.4 Комментарий (о параллельном выполнении процессов) Процессы 12.8-11, 12.8-14 можно выполнять не только последовательно, но и параллельно, строя новые последовательности векторов ph tt одновременно. Такое объединение процессов приводит к эффективному методу биортогонализации построения двойственных базисов. 12.8-1 б.4 Построение двойственных базисов Пусть заданы базисы еь ...,епи gb ..., gn. Предположим, что из этих базисов строится пара двойственных базисов ph ...,рп и /ь ..., tn. Будем искать векторы pk+u h+\ в следующем виде: к к / = 1 / = 1 Условия (ph tj) ф 0 для / Ф] позволяют определить неизвестные коэффициенты: У/, jH-i = ~ (ек +,, tf)/(ph tt), \к + xtt = - (ph qk
456 Часть I. Математические сведения по линейной алгебре С точностью до нормировки базис рх, ...,/?„ (t\, ..., Q будет левым (правым) двойственным базисом для базиса t{, ..., tn{px, ...,/?„). Дополнение. Это верно по построению. 12.8-17.4 Треугольность матрицы преобразования Во всех процессах ортогонализации матрица преобразования координат при переходе от старого базиса к новому является треугольной. Дополнение. Во всех процессах ортогонализации общим является переход от одного базиса к другому, причем всегда k-й вектор второго базиса для всех к ищется как линейная комбинация первых к векторов первого базиса. Согласно 8.1-2 матрица преобразования координат в таких переходах является треугольной. 12.8-18.4 Построение А-ортогональных систем Если в арифметическом евклидовом или унитарном пространстве эрмитова билинейная форма задается с помощью скалярного произведения вида (Ах, у), то с помощью описанных процессов можно строить А -ортогональные (Л-псевдоортогональные и т. п.) системы векторов. Дополнение. Очевидно, принимая во внимание определение 12.7-24. 12.8-19.4 Комментарий (о дополнительных возможностях) Согласно формулам, определяющим изменение векторов в процессе ортогонализации, в общем случае нельзя надеяться на более простой вид матрицы преобразования координат, чем треугольный. Однако если исходный базис выбрать согласованным с билинейной формой, порождающей скалярное произведение, то можно получить более простые представления для этой матрицы. 12.8.4. Последовательность Крылова и минимальный многочлен 12.8-20.4 Последовательность Крылова Пусть А — квадратная матрица, х — вектор арифметического пространства, заданные над одним и тем же полем. Последовательность векторов jc, Ax,..., Акх, ... называется степенной последовательностью, порожденной вектором х, или последовательностью Крылова. 12.8-21.4 Минимальный аннулирующий многочлен Приведенный многочлен ср(^) минимальной степени, для которого выполняется равенство ц>(А)х = 0, называется минимальным аннулирующим вектор х многочленом.
12. Билинейные формы 457 12.8-22.4 Единственность минимального многочлена Минимальный аннулирующий вектор х многочлен единствен. Дополнение. В самом деле, предположим, что существуют два многочлена ф(Л,) и \у(Х) одной степени, с равными 1 старшими коэффициентами и такие, что <$(А)х = 0 и \\f(A)x = 0. Рассмотрим разность этих равенств (у(А) - \у(А))х = 0. Если ц>(Х) Ф \у(Х), то многочлен у(Х) - \у(Х) будет ненулевым и будет иметь меньшую степень, чем многочлены ф(А,), \у(Х), в силу совпадения их старших коэффициентов. После соответствующей нормировки многочлена ф(А,) - \у(Х) будет получен аннулирующий вектор х многочлен, имеющий меньшую степень, чем многочлены q>(X), \\i(X). Если многочлены ф(Х), 1|/(^)были минимальные, то это невозможно. Поэтому минимальный аннулирующий вектор х многочлен единствен. 12.8-23.4 Делитель характеристического многочлена Минимальный аннулирующий вектор х многочлен является делителем характеристического многочлена. Дополнение. Пусть ДА,)— характеристический многочлен матрицы А. Согласно 9.4-22 имеем J{A) = 0. Поэтому J(A)x = 0 для любого вектора х. Пусть ц>(Х) — минимальный аннулирующий вектор х многочлен. Его степень заведомо не больше степени многочлена ДА,). Разделив согласно 7.1-19 многочлен J(X) на многочлен получим равенство где либо г(Х) = 0, либо степень г(Х) меньше степени ф(^). В силу 9.4-4 многочлены ф(у4) и q(A) перестановочны. Поэтому из полученного равенства следует, что г(А)х = 0. Так как ф(А,) есть минимальный аннулирующий вектор х многочлен, то г(Х) может быть только нулевым многочленом. В противном случае многочлен г(к) был бы аннулирующим вектор jc многочленом и имел бы меньшую степень, чем многочлен ф(^), что невозможно по определению 12.8-21. Следовательно, многочлен ф(Х) является делителем* многочлена fiX). 12.8-24.4 Степень минимального многочлена Степень минимального аннулирующего вектор х многочлена равна максимальному числу первых векторов степенной последовательности, образующих линейно независимую систему. Дополнение. Если jc Ф 0, то в степенной последовательности какое-то число первых векторов являются линейно независимыми. Предположим, что к— наибольшее из таких чисел. Это означает, что существуют числа ос0, ..., а^_ь а^, причем а* Ф 0, что k Обозначим \\t{X) = акХк + ... + <Х\Х + а0 =
458 Часть I. Математические сведения по линейной алгебре Ясно, что ц>(А)х = 0. По определению 12.8-21 многочлен ц>(Х) не может иметь степень, меньшую, чем степень минимального аннулирующего вектор х многочлена. Но он не может иметь и большую степень. Если минимальный многочлен имеет степень /?, то очевидно, что первые р + 1 векторов степенной последовательности будут линейно зависимы, причем коэффициенты линейной комбинации типа 2.1-10 как раз равны коэффициентам минимального многочлена. Следовательно, согласно 12.8-22 <р(А,) есть минимальный аннулирующий вектор х многочлен, и утверждение справедливо. 12.8-25.5 Еще раз о степени минимального многочлена Степень минимального аннулирующего вектор д: многочлена равна сумме максимальных высот корневых векторов матрицы А, присутствующих в разложении вектора х по корневому базису и соответствующих попарно различным собственным значениям. Дополнение. В соответствии с 9.5-19 представим вектор* в виде суммы X = U] + Ui + ... +MV, где Mj, ..., us принадлежат различным циклическим подпространствам ?/ь ..., Us матрицы А. Согласно 9.5-17 любое циклическое подпространство ?/, является инвариантным. Поэтому если щ е Uh то \\j(A)uj e Ui для любого многочлена \j/(X), в том числе для минимального многочлена. Так как различные циклические подпространства не имеют общих векторов, кроме нулевого, то для выполнения равенства \\t(A)x = 0 необходимо и достаточно выполнение равенств 1[/(Л)м, = 0 для всех /, 1 <i<s. Если м, — корневой вектор высоты w, и соответствует собственному значению Xh то согласно 9.5-9 имеем (А - Х^Е)т' н; = 0 . Применив прием, использованный в дополнении к 12.8-23, легко показать, что многочлен \у(Х) будет делиться на (А - \.Е)Щ . Следовательно, равенство \у(А)щ = 0 будет выполняться не только приу = /, но при всех тех у, для которых векторы и} соответствуют собственным значениям, совпадающим с Xh и имеют высоты, не превосходящие /и,-. Пусть Xtг, ...Д;. — попарно различные собственные значения матрицы А, соответствующие векторам wb ..., wv, из разложения вектора х, т1., ...,w; — максимальные высоты корневых векторов uu ..., м„ соответствующих собственным значениям, совпадающим с Xf,... Д,- . Многочлен является аннулирующим для каждого из векторов мь ..., wv и, следовательно, для вектора jc. Кроме этого, он является делителем любого многочлена \у(Х), аннулирующего вектор х. Поэтому у(Х) — минимальный многочлен.
12. Билинейные формы 459 12.8.5. Трехчленные процессы ортогонализации 12.8-26.4 Трехчленные процессы псевдоортогонализации Пусть в арифметическом унитарном пространстве скалярное произведение введено согласно 5.1-8 через естественный базис и задана невырожденная билинейная форма (Сх, у). Предположим, что матрица А удовлетворяет условию для некоторых чисел а, р. Пусть векторы е,=А'~ 1х линейно независимы для 1 < / < к и векторы /ь ...,fk получены из векторов еь ...,?* с помощью процесса псевдоортогонализации по отношению к форме (Сх,у). Тогда имеют место следующие соотношения: f\=x9 где Ш^ JCAfi,fl_x) Дополнение. Принимая во внимание вид векторов ^ и согласно формулам 12.8-3, заключаем, что 7 = 0 для некоторых чисел Xjh Отсюда вытекает, что вектор fi+\ -Afj принадлежит линейной оболочке векторов х,Ах, ...,А1~хх или, что то же самое, векторов fu/ъ —,Л Поэтому для некоторых чисел ?>и+\. Условия ортогональности вектора fi+\ слева к векторам f\,f2, ...,fk дают для определения коэффициентов ?;_/,/+1 систему линейных алгебраических уравнений i, /+ i(C/b/2)
460 Часть I. Математические сведения по линейной алгебре Учитывая условие, которому удовлетворяет матрица Л, псевдоортогональность системы векторов/ и соотношения 5.2-25, имеем = (/;, а*с*Л) = (/?, (ас* + рем)/?) = для / < /" - 1. Среди правых частей системы только две последние могут быть отличны от нуля. Следовательно, только ?,/-1, л-1 и ?7,,+ i могут быть ненулевыми, что и доказывает справедливость трехчленных соотношений для последовательности векторов/. Значение коэффициента oti находится из условия ортогональности вектора/ слева к вектору/ь значения коэффициентов a,, p,_i — из условия ортогональности вектора/*1 слева к векторам/,/. 1# 12.8-27.4 Явные формулы для коэффициентов Если А=А*пС = Е,то для коэффициентов из 12.8-26 имеем п -v J"J'' a - If П ' ' "if f ) (f f ) (f f ) " \Ji •> Ji) \Ji-\>Ji-\) \Ji-\-> J,-\) \Ji -1 > J,¦¦-1) Дополнение. Если А = А*, С = ?, то (ЕАЕГ ')* = 0 • Е + 1 ¦ А и выполняются условия утверждения 12.8-26. Все остальное является его следствием. 12.8-28.4 Трехдиагональный вид матрицы А В условиях и обозначениях 12.8-26 и считая, что к = п, в базисе/, ...,/ матрица А имеет трехдиагональный вид: О Аг = а, 1 0 Р. а2 Р2 1 а3 Рз 1 а 1 Р„-, Дополнение. Будем рассматривать матрицу А как матрицу оператора в естественном базисе. При переходе к базису/,/, ...,/, построенному в соответствии с 12.8-26, матрица А перейдет согласно 8.1-19 в подобную ей матрицу Aj. Принимая во внимание трехчленные соотношения для векторов/ из 12.8-26 и соотношения 3.7-19, связывающие образы векторов базиса и матрицу оператора, убеждаемся в справедливости высказанного утверждения.
12. Билинейные формы 461 12.8-29.4 Уточнение трехдиагонального вида В условиях 12.8-27 существует такая диагональная матрица Д что для матрицы Aj из 12.8-28 матрица D' lAjD будет вещественной симметричной трехдиагональной. Дополнение. В условиях 12.8-27 билинейная форма (Схуу) задает обычное скалярное произведение и делает пространство унитарным. В этом случае псевдоортогональный базис/ь ...,/,> построенный в 12.8-26, в действительности оказывается ортогональным, но не обязательно нормированным. В нормированном базисе матрица будет иметь вид D~] Af D, где D — диагональная матрица. Согласно восьмому пункту 10.2-9 матрица перехода от естественного базиса к ортонорми- рованному является унитарной. Поэтому в силу 10.3-7 можно утверждать, что матрица D~l AfD является эрмитовой. По построению она трехдиагональная. Согласно 10.3-3 ее диагональные элементы вещественные. Обозначим через рь •*••> Pw-1 наддиагональные элементы матрицы D~] Af D и представим их в тригонометрической форме р7 = r/coscpy + / sinq)/). Рассмотрим диагональную матрицу Ь с элементами dih по модулю равными 1, и исследуем матрицу D D~l AfDD. Она снова будет эрмитовой трехдиагональной с наддиагональными элементами Легко подобрать элементы da так, чтобы все наддиагональные и, соответственно, поддиагональные элементы новой матрицы были вещественными. Для этого можно взять в соответствии с 1.1-33 du =1, arg d22 = -arg pb arg d33 =- arg pi -arg p2, ..., arg dm = - arg P! - arg p2 - ... - arg pw_ x. Теперь матрица D из утверждения равна DD , а матрица D~ lAjD будет трехдиагональной вещественной симметричной. 12.8-30.4 Трехчленные процессы биортогонализации Пусть А — произвольная матрица и заданы два вектора х, у в арифметическом унитарном пространстве. Предположим, что системы векторов ek = Ak~]x,qk = (A*)k~ly линейно независимы и двойственные системы векторов pu ...,pn, fb •••? tn получены из них с помощью процесса биортогонализации 12.8-16. Тогда имеют место соотношения Р\=х, tx=y9 рг = Арх - Cxi/?,, h = A*t{ - й1 th aktk-
462 Часть I. Математические сведения по линейной алгебре где ,>'*)= (pk9tk) Дополнение. Принимая во внимание особенности построения систем векторов е\9 ..., еп и qu ...,<?„ и по аналогии с дополнением к 12.8-26, можно считать без ограничения общности, что в формулах 12.8-16 имеем ek+\ =Apk> qk+{ = A*tk. Теперь для коэффициентов yit k+ j и 8/, *+1 получаем такие формулы: По построению вектор Арк принадлежит линейной оболочке векторов р\,р29 ..., Рк+u вектор A*tk— линейной оболочке векторов tu t2,..., tk. В силу двойственности построенных систем рь ...,рй и гь ..., /я отсюда следуют с учетом 5.2-25 цепочки следствий. Именно: (р„ ts) = 0, г > 5, => (^рь О = (рь A*t,) = 0, * > i + 1, => => Yi.*+1 = --- =y*-2.*+1 = О, (рЛ О = 0, г < 5, => (p/s ЛЧ) = (ЛЛ, /А) = 0, * > / + 1, => Следовательно, "треугольные" в общем случае 12.8-16 соотношения для получения векторов рк+1, 4+1 становятся в условиях настоящего утверждения "трехчленными". Кроме этого, появляется зависимость между коэффициентами y,^+i и 5/д+ь Находим, что У к, к +1 = - (Л#ь 4)/(Рь h) = ~(phA *tk)/(pk9 tk) =Ькук + ], Ук-ik + i = -(Л/?ь /*- i)/(p*-ь h-1) = -(р*,-4*4- i)/(p*-ь 4-1) = = - (Рь 4-5*. 1,Л-1 -&к-2,к*к-2У(Рк-\, tk-\) = -(рь tk)/(Pk-\, h-1), = -(Рк-Ук-1кРк-\-Ук-2,кРк-2, h)!{pk. i, /*- 0 = - (pA, /аУ(Ра- ь h- i). Таким образом, подтверждаются формулы для коэффициентов а*, р*_ \. 12.8-31.4 Трехдиагональный вид матрицы А и А* В условиях и обозначениях 12.8-30 в базисе р{, ...,/?„ (t\, ..., О матрица А (А*) имеет трехдиагональный вид. Дополнение. Доказательство почти дословно повторяет дополнение к 12.8-28.
12. Билинейные формы 463 12.8-32.4 Комментарий (об итогах исследований) Заметим, что в общем случае в процессах ортогонализации для построения каждого последующего вектора необходимо привлекать все ранее построенные векторы. В процессах 12.8-26 и 12.8-30 ситуация существенно проще, т. к. нужно привлекать лишь два последних вектора из строящихся систем. Однако при этом приходится на каждом шаге процесса выполнять одну или две операции умножения матрицы на вектор. Несмотря на это, такие процессы позволяют строить весьма эффективные численные методы для решения самых различных задач линейной алгебры.
13. Векторные и матричные нормы 13.1. Метрическое пространство 13.1.1. Расстояние и предел 13.1-1.4 Комментарий (о расстоянии) Одним из основных понятий математического анализа является понятие предела. Основано оно на том, что для точек числовой оси определено понятие "близости" или, точнее, расстояния между точками. Сравнение на "близость" можно ввести и в множествах совсем иной природы. Мы уже определили в утверждении 5.4-6 расстояние между векторами линейных пространств со скалярным произведением. При этом было обнаружено, что оно обладает теми же свойствами 5.4-7, что и расстояние между точками числовой оси. Мы рассмотрим теперь другой, более общий способ введения расстояния между векторами и распространим его также на матрицы. Однако вначале целесообразно привести некоторые общие определения и факты, касающиеся измерений в различных множествах. 13.1-2.4 Метрическое пространство Множество называется метрическим пространством, если каждой паре его элементов Поставлено в соответствие неотрицательное вещественное число, называемое расстоянием, причем выполнены следующие аксиомы: р(х,у) = р(у,х)9 р(х, у) > О, если хФу, р(х, у) = 0, если х=у, p(x,y)<p(x,z) + p(z,y) для любых элементов х, у, z. Эти аксиомы называются аксиомами метрики, причем первая из них называется аксиомой симметрии, третья— аксиомой треугольника (неравенством треугольника).
466 Часть I. Математические сведения по линейной алгебре Дополнение. Рассмотрим некоторые примеры метрических пространств. Проверка выполнения всех аксиом не представляет особого труда: • множество: любое множество вещественных чисел; расстояние: р(х,у) = \х-у\, где \z\ — модуль вещественного числа z; • множество: любое множество комплексных чисел; расстояние: р(х,у) = \x-yl где \z\ — модуль комплексного числа z; • множество: любое множество векторов евклидова или унитарного пространства; расстояние: р(х, у) = \х -у\, где \z\ — длина вектора z, определенная согласно 5.4-1; • множество: любое множество векторов вещественного или комплексного арифметического пространства размерности п > 1; расстояние р(дс,;;)=тах|х, ->>,|, где вектор z представлен своими координатами z = (zl9z2i ..., zw); • множество: любое множество векторов вещественного или комплексного арифметического пространства размерности п > 1; расстояние р(х, у) = arctg(max |дс. - у К где вектор z представлен своими координатами z = (zb z2,..., zw); • множество: любое множество, в котором введено понятие равенства элементов; расстояние определяется по следующей формуле: l,x*y. 13.1-3.4 Предел последовательности Элемент х0 метрического пространства X называется пределом последовательности {х/} элементов хь ...,Х/, ... из X, если последовательность расстояний р(х0,Xi), ..., р(х0,х,), ... сходится к нулю. Последовательность {х;} называется сходящейся в X или просто сходящейся. Для указания сходимости последовательности используется символика X/ -» х0 или lim х,. = х0. 13.1-4.4 Зависимость от метрики В зависимости от введенной метрики одна и та же последовательность может быть и сходящейся, и не сходящейся. Дополнение. Рассмотрим последовательность вещественных положительных чисел х„ = п 1, где п = 1, 2, ..., и на множестве вещественных чисел введем две метрики
13. Векторные и матричные нормы 467 *,y) = \x-y\,P2(x,y) = ,hx^ Очевидно, что число 0 является пределом последовательности в первой метрике и не является пределом во второй метрике. 13.1-5.4 Сходимость подпоследовательности Если последовательность сходится, то сходится (и имеет тот же предел) любая ее подпоследовательность. 13.1-б.4 Единственность предела Последовательность не может иметь более одного предела. Дополнение. Предположим, что последовательность {х„} имеет два предела х0 и у0. Тогда для сколь угодно малого числа 8 > 0 можно выбрать такое N, что при всех п > N. Отсюда, используя аксиому треугольника, находим р(х0, Уо) ^ Р(*О> *п) + Р(ХП9 Уо) < 8. В силу произвольности 8 это означает, что р(х0, >ъ) = 0, т. е. х0 =уо. 13.1.2. Окрестность и замыкание 13.1 -7.4 Шар Шаром S(a, г) в метрическом пространстве X называется множество элементов х е X, удовлетворяющих условию р(а, х) < г. Элемент а называется центром шара, число г —радиусом шара. 13.1-8.4 Окрестность элемента Любой шар с центром в а называется окрестностью элемента а. 13.1-9.4 Ограниченное множество Множество элементов называется ограниченным, если оно целиком принадлежит некоторому шару. 13.1-10.4 Критерий предела Элемент д:0 является пределом последовательности {хп} тогда и только тогда, когда любая окрестность элемента х0 содержит все элементы рассматриваемой последовательности, начиная с некоторого номера.
468 Часть I. Математические сведения по линейной алгебре 13.1-11.4 Предельная точка Пусть элемент jc и множество М принадлежат одному и тому же метрическому пространству. Элемент х называется предельной точкой множества А/, если любая окрестность элемента д: содержит хотя бы один элемент множества М, не совпадающий сх. 13.1-12.4 Замыкание множества Множество, полученное присоединением к М всех его предельных точек, называется замыканием множества Ми обозначается М. 13.1-13.4 Замкнутое множество Множество М называется замкнутым, если М— М. 13.1-14.4 Замкнутый шар Замкнутым шаром S(a, r) называется множество элементов х, удовлетворяющих условию р(я, х) < г. 13.1.3. Полное пространство 13.1-15.4 Фундаментальная последовательность Последовательность {лг0} элементов метрического пространства называется фундаментальной или сходящейся в себе, если для любого числа s > 0 найдется такое N, что р(хп, хт) < е при п,т> N. 13.1-1 б.4 Фундаментальность сходящейся последовательности Если последовательность сходящаяся, то она фундаментальная. Дополнение. Пусть последовательность {х„} сходится к jc0. Тогда для любого 8 > О найдется такое N, что Р(*я>*о)<- при п> N. Согласно аксиоме треугольника р(хя, хт) < р(х„, *о) + Р(^о, хт) < s при п, т> N, что и означает фундаментальность последовательности {хп}. 13.1-17.4 Ограниченность фундаментальной последовательности Любая фундаментальная последовательность ограничена.
13. Векторные и матричные нормы 469 Дополнение. Пусть последовательность {хп} фундаментальная. Это означает, что, по заданному е можно выбрать N такое, что р(х„, хт) < е при п,т> N. Возьмем произвольное no>N. Все элементы последовательности {*„}, начиная с хщ, заведомо принадлежат шару с центром х„о и радиусом, равным максимальному из чисел 13.1-18.4 Полное пространство Метрическое пространство называется полным, если любая фундаментальная последовательность в нем является сходящейся. 13.1-19.4 Последовательность вложенных шаров Пусть дана некоторая последовательность шаров. Эти шары называются вложенными друг в друга, если каждый последующий шар содержится внутри предыдущего. 13.1-20.4 Общий элемент Пусть в полном метрическом пространстве Xзадана последовательность {S(an,rn)} замкнутых шаров, вложенных друг в друга. Если последовательность радиусов стремится к нулю, то существует единственный элемент из X, принадлежащий всем этим шарам. Дополнение. Рассмотрим последовательность {ап}. Так как S(an + p, rn + p)a S(an,rn) при любом р > О, то ап + ре S(an, rn). Следовательно, р(ап+р, а„) < гт т. е. последовательность {ап} — фундаментальная в силу условия гп -> 0. Пространство X— полное, поэтому последовательность {ап} сходится к некоторому пределу а из X. Возьмем любой шар S(ak,rk). Этому шару принадлежат все члены последовательности {а„}, начиная с ак. В силу замкнутости шаров предел данной последовательности также принадлежит всем шарам. Допустим, что существует другой элемент Ь, принадлежащий всем шарам. Согласно аксиоме треугольника рО, Ъ) < р(а, а„) + рО„, Ь) < 2гп. Так как г„ может быть взято как угодно малым, то это означает, что р(а, Ь) = 0, т. е. а = Ь. 13.1-21.4 Полнота пространства чисел Метрическое пространство вещественных (комплексных) чисел с метрикой р(х,у) = = \х -у\ является полным. Дополнение. Пусть {х„} — фундаментальная последовательность вещественных чисел. Согласно 13.1-17 она ограниченная, т.е. существует неотрицательное
470 Часть I. Математические сведения по линейной алгебре число R такое, что |лс„| < R для всех п. Из нее согласно теореме Больцано-Вейер- штрасса [8] можно выделить сходящуюся подпоследовательность хПк -» х0. Возьмем произвольное е > 0. В силу фундаментальности {хп} существует такое число N, что \х„ - хт\ < е/2 для всех n,m>N. В силу сходимости {хп } существует такое число М, что \хп - х0 < е/2 для всех пч > М. Поэтому х. -ха\<\хт -. - Xf <8 для всех п> max {A/, N}9 т.е. последовательность {*„} является сходящейся и множество вещественных чисел с метрикой р(х9у) = \х-у\ является полным метрическим пространством. Рассмотрим теперь фундаментальную последовательность комплексных чисел {zn = xn + iyn}. Согласно 13.1-17 она ограниченная, т. е. существует неотрицательное число R такое, что \zn\ < R для всех п. Отсюда следует, что |дгя| < R и \у„\ < R. Согласно той же теореме Больцано-Вейерштрасса из последовательностей {х„} и {уп} можно выбрать одноименные подпоследовательности {хПк} и {у„к} у сходящиеся соответственно к jc0 и у0. Обозначим zo = jc0 + />o. Имеем \zn-z0\<\xn-xo\ + \yn-yol Заканчивается доказательство так же, как для вещественных чисел. Следовательно, множество комплексных чисел с метрикой р(х,у) = \х~у\ также является полным метрическим пространством. 13.2. Нормированное пространство 13.2.1. Норма и метрика 13.2-1.4 Комментарий (о метрике и операциях) При исследовании метрического пространства основное внимание сосредотачивается лишь на одном свойстве множества — наличии в нем расстояния. При исследовании линейного пространства изучаются лишь операции в множестве. Теперь мы рассмотрим линейные пространства с метрикой. Очевидно, что если понятие расстояния никак не связано с операциями над элементами, то нельзя построить содержательной теории, факты которой соединяли бы вместе алгебраические и метрические понятия. Поэтому мы будем накладывать на метрику, введенную в линейном пространстве, дополнительные условия. В действительности мы уже встречались с метрическими линейными пространствами. Таковы, например, евклидово и унитарное пространства с метрикой 5.4-6. Однако необходимость в такой метрике возникает далеко не всегда. Введение скалярного произведения означает, по существу, введение не только расстояния между элементами, но и углов между ними. Чаще же всего в линейном пространстве требуется дать приемлемое определение лишь расстояния. Важнейшими линейными пространствами такого рода являются так называемые нормированные
13. Векторные и матричные нормы 471 пространства. Мы снова не акцентируем внимание на арифметических пространствах, т. к. соответствующие иллюстрации почти очевидны. Единственное, что существенно, — это предположение о конечномерности линейного пространства. 13.2-2.4 Нормированное пространство Вещественное или комплексное линейное пространство К называется нормированным пространством, если каждому вектору х е К поставлено в соответствие вещественное число ||х||, называемое нормой вектора х, причем выполнены следующие аксиомы: |М1>0,если**0,||0|| = 0, для любых векторов х9 у и любого числа X. Вторая аксиома называется аксиомой абсолютной однородности нормы, третья аксиома — аксиомой треугольника (неравенством треугольника). 13.2-3.4 Метрика в нормированном пространстве Нормированное пространство становится метрическим, если положить р(х,х) = = ||jc->i|. При этом метрика будет обладать двумя дополнительными к 13.1-2 свойствами: р(* + z9y + z) = р(х, у), р(А*, Ху) = |А,|р(х, у) для любых векторов х, у и любого числа X. Дополнение. Действительно, р(лс, у) = О означает \\х -у\\ = 0, что согласно аксиоме 1 из 13.2-2 означает jc = у. Симметрия введенного расстояния очевидна. Наконец, неравенство треугольника для расстояния является простым следствием неравенства треугольника для нормы. Именно, Далее получаем, принимая во внимание 13.2-2, что , Ху) = ||Х* - Ml - 1Ш* -У)\\ = №-Й = Мр(дс, У). 13.2-4.4 Превращение метрического пространства в нормированное Если в метрическом линейном пространстве К какая-либо метрика обладает дополнительными свойствами 13.2-3, то К можно рассматривать как нормированное пространство, если определить норму равенством ||х|| = р(х:, 0) для всех х е К.
472 Часть I. Математические сведения по линейной алгебре Дополнение. Пусть ||х|| = р(х, 0). Если д: ф 0, то р(х, 0) > 0 и поэтому ||а|| > 0. Кроме этого, ||0|| = р@, 0) = 0. Далее имеем, учитывая дополнительные свойства, что , 0) = р(Х*, Х0) = Щр(х, 0) = | ||х + у\\ = р(х + у, 0) = р(х, -у) < р(х, 0) + р@, -у) = = p(x,0) + p(v,0) = |WI + IMi и все аксиомы нормированного пространства выполнены. 13.2-5.4 Норма и длина Любое линейное пространство со скалярным произведением становится нормированным, если под нормой вектора понимать его длину. Дополнение. Пусть ||*|| = |дф Согласно 5.1-2, 5.1-3, 5.4-1 имеем ||дг|| > 0, если х ф О, и ||0|| = 0. Согласно 5.4-2 выполняется равенство ||Ajc|| = |X.||jc||. И, наконец, согласно 5.4-4 имеет место неравенство ||* +^ll ^ IMI + IMI- 13.2.2. Конкретные нормы 13.2-6.4 Энергетическая норма Пусть в арифметическом пространстве со скалярным произведением задана положительно определенная матрица Л. Тогда функция является нормой. Норма этого типа называется энергетической нормой, порожденной матрицей А. Дополнение. В соответствии с определением 12.5-1 матрица А либо вещественная, либо комплексная эрмитова. Пусть матрица/* эрмитова. Согласно 11.1-30 все ведущие миноры матрицы А положительные. Поэтому в силу 11.1-18 существует разложение А = LL*, где L — невырожденная левая треугольная матрица. Сделав замену переменных у ~ L*x и приняв во внимание 5.2-25, приходим к норме вида 13.2-5. Пусть теперь А — вещественная матрица. Представим ее согласно 10.3-27 в виде суммы А = В + С, где В — симметричная матрица, С -— кососимметричная. В соответствии с 12.5-3 матрица В будет положительно определенной и для нее существует разложение В = SS*, где S — вещественная невырожденная левая треугольная матрица. Сделав замену переменных yz=:S*x и приняв во внимание 12.1-13, 5.2-25, получаем (Ах, х) = (Вх9 х) + (Ос, х) = (SS*x, x) = (у, у). Снова приходим к норме вида 13.2-5. 13.2-7.4 Сопряженные числа Положительные числар, q называются сопряженными, если/?"' + q~' = 1.
13. Векторные и матричные нормы 473 13.2-8.4 Неравенство Гельдера Для любых неотрицательных чисел Х\, ..., хп иу\, ...,уп п (п при всех сопряженных числах р9 q. Дополнение. Для 0 < х < 1 и любого а > 0 выполняется неравенство ос* < ох + A - х). При a > О, b > О имеем <ЛГ^ > 0 для сопряженных согласно 13.2-7 чисел р, q. Если х = р~ \ то 1 - х = #~!. Поэтому, положив а = (fb~q, будем иметь ab< — + — Р Ч для любых неотрицательных a, b и сопряженных/?, q. Пусть векторы х = {хихъ ...,х„), у = (уиуг> .~,уп) имеют неотрицательные координаты. Если среди векторов х,у есть хотя бы один нулевой, то неравенство Гельдера, очевидно, справедливо. Поэтому можно считать, что х ф 0, у Ф 0. Предположим, что неравенство выполняется для каких-либо ненулевых х9 у. Тогда оно выполняется и для векторов Хх, \ху при любых неотрицательных X, ц. Следовательно, его достаточно доказать для того случая, когда Полагая теперь в неравенстве для ab a- x^b~ykW суммируя по к от 1 до п9 получаем неравенство Гельдера как для рассматриваемого, так и для общего случая. 13.2-9.4 Неравенство Минковского Для любых неотрицательных чисел хь ..., хп и уь ..., уп \/р при всех/?> 1. Дополнение. Неравенство Минковского очевидно при р = 1. Кроме этого, оно заведомо выполняется, если хотя бы один из векторов х,у равен нулю. Поэтому можно ограничиться случаем р > 1 и х Ф 0. Напишем тождество (а + bf = (а + bf ~ ха + (а + bf~]b для неотрицательных а, Ь. Полагая в нем а = х^ b =yk и суммируя по к от 1 до я, получим
474 Часть /. Математические сведения по линейной алгебре t +у„У Применим к каждой из двух сумм, стоящих в правой части этого соотношения, неравенство Гельдера 13.2-8. Учитывая, что (р- \)q = р, будем иметь я Разделив обе части неравенства на первый множитель справа и приняв во внимание, что р~' + q~l = 1, получим неравенство Минковского. 13.2-10.4 Норма Гельдера Пусть в линейном пространстве векторы заданы своими координатами относительно некоторого базиса. Если х = (oti, ..., aw), то функция И=(хкг при любом р > 1 является нормой. Норма этого типа называется нормой Гельдера с показателем /?. Дополнение. Если х Ф 0, то среди координат аь ..., ап есть хотя бы одна, не равная нулю. Поэтому IMI^ 0. Очевидно также, что \\0\\р = 0. Согласно 2.2-31 вектор Хх имеет координаты Ха.\9 ..., Хап. Следовательно, Пусть теперь имеется второй вектору с координатами рь ..., р„. Согласно 2.2-30, 13.2-9 Все аксиомы 13.2-2 нормированного пространства выполнены. 13.2-11.4 Конкретные нормы Наиболее распространенными среди гельдеровых норм являются следующие: ( Y/2 И, = Z КI' IWL = Z К Г - IWL = "« КI • Вторая из этих норм часто называется евклидовой нормой и обозначается
13. Векторные и матричные нормы 475 13.2.3. Свойства нормы 13.2-12.4 Нормированный вектор Вектор, норма которого равна единице, называется нормированным. 13.2-13.4 Возможность нормировки Любой ненулевой вектор х можно нормировать, умножив его на число X = ||*||~ \ Дополнение. Имеем ||А*|| = || ||х||" 1*|| = \\x\\~ ]\\х\\ = 1. 13.2-14.4 Неравенства треугольника Для любых векторов х, у, z, и выполняются неравенства ИМ - IMII ^ Ik - у\\, Ilk -у\\ - II* - «III * II* - 4 + \\у- «Ц. Дополнение. Используя аксиому треугольника, получаем откуда заключаем, что IMI-IMI^II*->ll, IMI-IMI^Ik-^ll или |||х|| - \\y\\\ < ||jc — jv||- Принимая во внимание это неравенство, имеем \\\x-y\\-\\z-u\\\<\\(x-y)-(z-u)\\ = = \\(X-Z)-(y-u)\\<\\X-4 + \\y-u\\. 13.2-15.4 Оценка нормы линейной комбинации Для любых чисел X., и векторов х, выполняется неравенство Дополнение. Это есть прямое следствие 13.2-2. 13.2.4. Сходимость последовательностей 13.2-1 б.4 Предельные соотношения Если в метрике 13.2-3 для последовательностей векторов {*/}, {у,} и чисел {Х$ справедливы предельные соотношения
476 Часть I. Математические сведения по линейной алгебре то имеют место предельные соотношения Ml -HMI, Xf+yi ->Х+у, kft -> Хх. Дополнение. Пусть справедливы предельные соотношения В силу определения 13.1-3 и условия 13.2-3 имеем p(xhx) = Ito-xll -* 0, p(yhy) = \\у§-у\\ -> 0. Теперь заключаем, принимая во внимание 13.2-2, 13.2-14, что +yibfr+jOII = \\(XI-X) + (У;-У)\\< \\Xi-x\\ + Ifo-dl-X), - Ajc|| = ||(Х, - ^ + Цх, - *)|| < \Xi - X\\\xt\\ + \X\\\x, - х\\ -» 0, то есть все предельные соотношения имеют место. 13.2-17.4 Сходимость и ограниченность по норме Сходимость последовательности векторов в метрике 13.2-3 называется сходимостью по норме, ограниченность множества векторов — ограниченностью по норме и т. д. 13.2-18.4 Координатная сходимость Пусть последовательность векторов xi — (ос};),..., aj,'*) и вектор х = (аь ..., ос„) заданы своими координатами в некотором базисе. Если для всех у выполняются предельные соотношения ос^ —» а^, то говорят, что последовательность векторов х, сходится покоординатно к вектору х. 13.2-19.4 Координатная сходимость в разных базисах Если Xi -» jc покоординатно в каком-нибудь одном базисе, то сходимость имеет место в любом другом базисе. Дополнение. Пусть еи ---,е„ и/ь ...,/,— два базиса одного пространства. Обозначим через Р матрицу преобразования координат при переходе от первого базиса ко второму и пусть ри— ее элементы. Представим векторы */ и х в виде разложений х = а,*, +.'.. + аяея9 х, = а\\ +... + aK\, Предположим, что а:,- —> jc покоординатно в базисе/ь ...,/, Согласно 13.2-18 это означает, что Р(у;) -> Ру для всех у, т. е. для любого 8 > 0 найдется такое N, что ~> р7| < 6 для всех у и всех / > N.
13. Векторные и матричные нормы 477 Принимая во внимание 8.1-3, находим, что для всех у и всех / > N. Здесь р есть максимальный из модулей элементов матрицы Л п — размерность пространства. Поэтому а^ -> а7 для всех у, т. е. х, -> jc покоординатно в базисе еь • •-,?>». 13.2-20.4 Ограниченность последовательностей координат Если в нормированном пространстве последовательность векторов ограничена по норме, то ограничены и числовые последовательности всех координат в разложении векторов по любому базису. Дополнение. Пусть каждый вектор последовательности {*/} представлен в виде разложения по базису еь ..., е„. Введем обозначение и докажем, что последовательность {а;} ограничена. Предположим, что это не так. Тогда из нее можно выбрать бесконечно большую подпоследовательность {О; } . ПОЛОЖИМ 1 Если то, конечно, У*" — ' при всех к = 1,2, ..., п и всех ip. Поэтому Последовательности {у?р)} при каждом А: ограничены по р. Следовательно, можно выбрать такую подпоследовательность векторов {у^}, что последовательность {y\Pi)} будет сходящейся, т. е.
478 Часть I. Математические сведения по линейной алгебре limy<ft)=y, для некоторого числа у^ Из последовательности {у }, в свою очередь, можно выбрать подпоследовательность {уРг}, для которой lim уBА)=у2 ft"** для некоторого числа у2. При этом по-прежнему lim у<А)=У|. Продолжая этот процесс, выбираем из последовательности {ур} такую подпоследовательность {у }, что будут существовать пределы Нту<*">=у4 Рп ~* х для всех к= 1,2, ..., л, причем Обозначим у = у\е\ + ... +ywew. Доказанное означает, что ур -+ у покоординатно. Отсюда следует сходимость по норме, т. к. II уРп -у\\ = \\ Е(у1л) - у*К II ^ Ziyi" - у* I • Ik* II -+ о. к=\ к=\ С одной стороны, вектор у не должен равняться нулю в силу ограничения на его координаты. С другой стороны, так как последовательность {*, } по условию ограничена по норме, а подпоследовательность а, — бесконечно большая по предположению и построению. Рп Следовательно, должно быть \\y\\ = 0 , т. е. у — нулевой вектор. Полученное противоречие доказывает справедливость утверждения. 13.2-21.4 Сходимость по норме и координатная В нормированном пространстве из сходимости по норме вытекает координатная сходимость и наоборот. Дополнение. То, что из координатной сходимости следует сходимость по норме, было показано в дополнении к 13.2-20. Покажем теперь обратное. Пусть дана последовательность {Xj} векторов, сходящаяся по норме к вектору дг0. Очевидно, что
13. Векторные и матричные нормы 479 достаточно рассмотреть случай, когда х0 = 0 и в последовательности {xf} нет нулевых векторов. Снова представим векторы xt в виде разложений по базису еь ..., еп. Последовательность векторов будет ограниченной по норме. Согласно 13.2-20 должны быть ограничены последовательности чисел для всех к - 1,2,...,и. Так как Цх/||->0, то это возможно только тогда, когда ccj^ -> 0 для всех к. Но это и означает, что имеет место координатная сходимость последовательности {*,} к вектору х0. 13.2-22.4 Комментарий (о разных видах сходимостей) Координатная сходимость эффективно используется в теоретических исследованиях; в практических же приложениях удобнее пользоваться сходимостью по норме. Это объясняется, в основном, тем, что при исследовании линейных пространств большой размерности трудно иметь дело с большим числом координатных последовательностей. К тому же не всегда бывает известен хотя бы один базис. Но даже если базис известен, его использование чаще всего приводит к неоправданно громоздким вычислениям. 13.2.5. Полнота нормированных пространств 13.2-23.4 Ограниченность и сходимость Из всякой ограниченной по норме последовательности векторов нормированного пространства можно выбрать подпоследовательность, сходящуюся по норме в этом пространстве. Дополнение. Пусть {*,} — ограниченная по норме последовательность. Представим векторы Xj в виде разложений по базису ei9 ...,еп. Согласно 13.2-20 будут ограничены последовательности {ctj^} для всех к= 1, 2,..., п. Таким же способом, как в дополнении к 13.2-20, выберем из последовательности {*,} подпоследовательность {*. }, для которой существуют предельные соотношения а?'() -> ак. Как было показано в дополнении к 13.2-20, отсюда следует, что подпоследовательность {х, } сходится по норме к вектору ... +апе„.
480 Часть I. Математические сведения по линейной алгебре 13.2-24.4 Полнота нормированного пространства Любое конечномерное нормированное пространство является полным. Дополнение. Пусть {jc,} — фундаментальная последовательность. Согласно 13.1-17 она ограничена. В силу 13.2-23 выберем из нее сходящуюся подпоследовательность {jc, } и обозначим через jc ее предел. Имеем Возьмем произвольное число s > 0. Так как {*,} — фундаментальная последовательность, то по определению 13.1-15 найдется такое Nu что \xi ~~ х( < 8/2 при /, /„ > N\. В силу того, что последовательность {jc, } сходится к jc, то по определению 13.1-3 найдется такое N2, что Ijx, -xi II < е/2 при / > N2. Если Л^ есть максимум из чисел Nu N2, то при / > N Следовательно, последовательность {jc,} сходится по норме к вектору jc. В соответствии с определением 13.1-18 это означает, что любое конечномерное нормированное пространство является полным. 13.2.6. Свойства нормированных пространств 13.2-25.4 Замкнутость подпространства Любое подпространство конечномерного нормированного пространства является замкнутым множеством. Дополнение. Рассмотрим в нормированном пространстве X его подпространство L. Пусть вектор jc eX является предельной точкой для L. По определению 13.1-11 это означает, что существует последовательность {х,} векторов из L, не совпадающих с jc, такая, что ||jc/-jc|| -> 0. Согласно 13.1-16, 13.1-17 последовательность {xj} ограничена. В силу 13.2-23 из нее можно выбрать сходящуюся подпоследовательность xt . Пусть {*, } -> х0. Теперь имеем то есть х = ^о- Рассмотрим базис еи -..,е„ пространства X, в котором первые г векторов представляют базис в L. Векторы xi e L , поэтому для них справедливы разложения Для вектора дг0, вообще говоря, имеет место полное разложение х - а{0)е + + а{0)е + а@) е + + а@)е
13. Векторные и матричные нормы 481 По построению {я, }—>х0 по норме. Согласно 13.2-21 последовательность {xip} -> л:0 покоординатно. Следовательно, а(г°] ,=... = а^ = 0, т. е. вектор лг0 и, конечно, вектор х принадлежат подпространству L. 13.2-26.4 "Удаленный" от подпространства вектор Пусть К— нормированное пространство и L— его подпространство, не совпадающее с К. Существует нормированный вектор х ? L такой, что Цх-jil > 1 для любого вектора у е L. Дополнение. Подпространство L не совпадает с X, поэтому существует вектор лс' 0 L. Согласно 13.2-25 подпространство L замкнуто, следовательно, inf IIjc' - v|| = d > 0. По определению точной нижней грани [5], в L найдется вектору, для которого II ' II d Последовательность {ук} — ограниченная. Выберем из нее подпоследовательность {ук }, сходящуюся согласно 13.2-23, 13.2-25 по норме к некоторому вектору/ е L. Для этого вектора Положим d Ясно, что ||*|| = 1. Кроме этого, если >> е L, то принимая во внимание определение вектора х\ имеем II* - Л= так как вектору' + dy принадлежит L. 13.2-27.4 Критерий конечномерности пространства Если в произвольном нормированном пространстве из всякой ограниченной по норме последовательности векторов можно выбрать сходящуюся подпоследовательность, то пространство конечномерно. Дополнение. Предположим противное. Пусть пространство бесконечномерное. Выберем произвольный нормированный вектор х\ и обозначим через L\ его линейную оболочку. Согласно 13.2-26 найдется нормированный вектор х2 такой, что ||х2-*i|| ^ 1. Обозначим через L2 линейную оболочку векторов хьх2. Продолжая 16 Зак. 740
482 Часть I. Математические сведения по линейной алгебре рассуждения, найдем последовательность {*,} нормированных векторов, удовлетворяющих неравенствам ||дс,- -дс*|| > 1 для всех к < /. Следовательно, из этой последовательности нельзя выбрать ни одной сходящейся подпоследовательности, хотя последовательность ограниченная, т. к. по построению ||х,|| = 1 для всех /'. Поэтому предположение о бесконечномерности пространства было неверным. 13.2-28.4 Эквивалентность норм В конечномерном нормированном пространстве любые две нормы эквивалентны. Это означает, что для любых норм ||-||/, ||||// существуют такие положительные числа а, Р, не зависящие от векторов пространства, что сс|М1/<1М1//<Р!М1/ для всех векторов х. Дополнение. Предположим, что нормы ||-||/ и ||'||у/ не эквивалентны. Тогда найдется такая последовательность {*,}, что для всех / имеем Ы// = 1, но в то же время Ы//> 'Мл в СИЛУ ограниченности последовательности {*,} по норме ||-||// из нее, согласно 13.2-23, можно выбрать сходящуюся к вектору х по этой норме подпоследовательность {х. }. Согласно 13.2-21 имеем {ху }->х покоординатно. Но согласно опять же 13.2-21 подпоследовательность {xf } должна сходиться к вектору х также по норме ||-||/. Так как х = 1, то согласно 13.2-16 должно выполняться II * 11// равенство ||х||у/ = 1, т. е. х *¦ 0. С другой стороны, р. < /~l p. = i~]. Следова- х,. ^> 0 и поэтому ||х||/ = 0, т. е. х = 0. Полученное противоречие говорит о том, что сделанное предположение о неэквивалентности норм неверно. 13.2-29.4 Достижение граничных значений норм В замкнутом, ограниченном по норме множестве векторов конечномерного пространства существуют векторы, на которых достигаются как нижняя, так и верхняя грани значений нормы. Дополнение. Рассмотрим, например, доказательство для нижней грани. Для верхней грани оно осуществляется аналогично. Пусть множество L векторов нормированного пространства замкнуто и ограничено по норме. Обозначим а = inf |Ы|. По определению точной нижней грани [5], в L найдется вектор **, для которого
13. Векторные и матричные нормы 483 Последовательность {хк} ограниченная по норме. Согласно 13.2-23 в ней существует подпоследовательность {хк }, сходящаяся по норме к вектору х. По построению то есть на векторе х достигается точная нижняя грань норм векторов из L. Последовательность {хк } всегда можно выбрать так, чтобы для всех кр либо хк = х, либо хк Фх. В первом случае х е L по выбору векторов хк из множества L. Во втором случае согласно определению 13.1-11 вектор х есть предельная точка множества L. Но по условию L есть замкнутое множество. Следовательно, согласно определению 13.1-13 имеем х е L. Поэтому всегда точная нижняя грань норм векторов из L достигается на векторе из L. 13.2-30.4 Замкнутые шар и сфера Множество векторов х нормированного пространства, удовлетворяющих условию ||х|| < г (||х|| = г) является замкнутым. Дополнение. Пусть у есть предельная точка для множества векторов, удовлетворяющих условию ||jc|| < г (||х|| = г). По определению 13.1-11 существует последовательность векторов **, не совпадающих с вектором у9 удовлетворяющих условию ||**|| < г A1**11 = г) и таких, что ||**-д>|| -> 0- Согласно 13.2-16 имеем ||**|| -> |[у||. Так как ||**|| < г (||**|| = г), то \\y\\ < г (|[у|| = г). Следовательно, любая предельная точка для множества, удовлетворяющего условию ||*|| < г (||*|| = г), сама принадлежит этому множеству. По определению 13.1-13 данное множество является замкнутым. 13.3. Матричные нормы 13.3.1. Аддитивная и мультипликативная нормы 13.3-1.4 Комментарий (о нормах матриц) Множество матриц одинаковых размеров является линейным пространством. Его можно сделать нормированным, если ввести норму любым из описанных способов. При этом, конечно, нормированное пространство матриц будет полным, и имеют место все вытекающие отсюда следствия. Однако по отношению к матричным операциям эти метрические факты оказываются несколько обедненными, т. к. не отражают мультипликативных свойств матриц. Вводя матричные нормы и проводя метрические исследования, обычно в той или иной форме принимают во внимание операции умножения матриц, умножения матрицы на вектор и т. п.
484 Часть I. Математические сведения по линейной алгебре 13.3-2.4 Норма матрицы Пусть каждой матрице А поставлено в соответствие вещественное число \\A\\. Это число называется нормой матрицы, если выполнены следующие аксиомы: |И11>0,еслиЛ*0,||0|| = 0, ИМ! = МИН, 1И + ВИ1ИН + » \\ас\\<\\а\\\\с\\ для любого числа X и любых матриц А, В, С, для которых соответствующие операции имеют смысл. 13.3-3.4 Мультипликативная норма Норма матрицы называется мультипликативной, если она удовлетворяет всем четырем аксиомам 13.3-2. 13.3-4.4 Аддитивная норма Норма матрицы называется аддитивной или обобщенной матричной нормой, если она удовлетворяет первым трем аксиомам 13.3-2. 13.3-5.4 Связь аддитивной и мультипликативной норм Умножением на достаточно большую положительную константу всякую аддитивную матричную норму можно превратить в мультипликативную. Наименьшей из таких констант является a- max ||ЛС||. Дополнение. Множество матриц с аддитивной нормой по определению 13.2-2 есть нормированное пространство. Поэтому к нему применимы все соответствующие результаты. Допустим, что существует такая константа а, что а||-|| становится мультипликативной нормой. Тогда для любых матриц А, С должно выполняться неравенство а||ЛС|| < а2||Л|| ||С||. Это означает, что а > ||ЛС||/||Л|| ||С|| при любых ненулевых матрицах А, С. В силу второй аксиомы аддитивной матричной нормы можно считать, что данное неравенство выполняется лишь для нормированных матриц, для которых ||Л|| = ||С|| = 1. Рассмотрим величину и покажем, что она ограничена. Предположим противное. В этом случае найдутся такие последовательности нормированных матриц Ak и Ск, что \\АкСк\\ > к. Последовательность {Ак} ограничена по норме. Согласно 13.2-23 из нее можно выделить сходящуюся к матрице А подпоследовательность {Ак }. Последовательность {Ск } ограничена и существует подпоследовательность {Ск }, сходящаяся
13. Векторные и матричные нормы 485 к матрице С. Рассмотрим последовательности {Ак } и {Ск }. Они сходятся по норме, соответственно, к матрицам А и С . Согласно 13.2-21 они сходятся к матрицам А и С также поэлементно. Принимая во внимание определение 3.2-16 произведения двух матриц, легко показать, что последовательность {Ак Ск } сходится поэлементно к матрице А С и согласно 13.2-21 она сходится к этой матрице также по норме. В силу 13.2-16 отсюда следует, что последовательность (II А Ск II) сходится к || АС ||. Но, с другой стороны, этой сходимости не может быть, т. к. по построению последовательность {\\А. Ск ||} бесконечно растущая. Рг Рг Полученное противоречие говорит о том, что предположение о неограниченности величины q неверно. Таким образом, множество матриц АС, где \\A\\ = ||С|| = 1, является ограниченным по норме. Покажем, что оно замкнуто. Рассмотрим последовательности матриц Ак и Ск такие, что \\Ак\\ = ||С*|| = 1 и \\АкСк - М\\ -> 0 для некоторой матрицы М Как и выше, выделим подпоследовательности {Ак },{С. }, схо- Рг Рг дящиеся по норме, соответственно к матрицам А и С . Как и выше, показываем, что {Ак Ск } -> АС , и поэтому М~ А С . Следовательно, множество матриц АС замкнуто. Согласно 13.2-29 на нем достигается точная верхняя грань и указанная выше величина q удовлетворяет условиям утверждения. 13.3-6.4 Комментарий (о нормах матриц) Последнее утверждение означает, что при изучении матричных норм можно ограничиться рассмотрением лишь одного вида норм, например мультипликативных. Поэтому в дальнейшем, если не сделано специальной оговорки, под нормой матрицы будет пониматься, как правило, мультипликативная норма. 13.3.2. Согласованная и подчиненная нормы 13.3-7.4 Согласованная норма Норма матрицы называется согласованной с векторными нормами в арифметических пространствах, если \\Ax\\ < \\A\\\\x\\ для всех векторов х. 13.3-8.4 Согласованность мультипликативных норм Всякая мультипликативная норма матриц согласована с какими-нибудь нормами векторов в арифметических пространствах. Дополнение. В самом деле, пусть мультипликативная норма введена для матриц всех размеров. Тогда она автоматически может использоваться в качестве нормы векторов, если их рассматривать как одностолбцевые матрицы. В этом случае неравенство \\Ax\\ < \\A\\ \\x\\ выполняется по определению.
486 Часть I. Математические сведения по линейной алгебре 13.3-9.4 Подчиненная норма Пусть в арифметических пространствах заданы любые векторные нормы. Числовая функция II II- \\AxW- || || **о И ИИ является, по крайней мере, аддитивной матричной нормой и называется нормой матрицы, подчиненной заданным векторным нормам. Дополнение. Рассмотрим числовую функцию **о ||х|| и = 1 и докажем, что она является аддитивной матричной нормой. Рассуждения, аналогичные проведенным в дополнении к 13.3-5, показывают, что эта функция ограничена и, следовательно, определена для любой матрицы А. Если А = 0, то очевидно, ||Л|| = 0. Если А Ф 0, то существует ненулевой вектор у такой, что Ау ф 0. По определению 13.2-2 векторной нормы имеем ||Ду|| > 0. Так как \\A\\ > \\Ау\\/\\у\1 то ||Л|| > 0, если А Ф 0. Далее имеем \\А + В\\ = sup \\(А + В)х\\ < sup (Н| +1|^||) < < sup Ji4jt| + sup ||Ях|| = ||Л|| +1|#||. Все аксиомы 13.3-2, 13.3-4 аддитивной нормы матрицы выполнены. 13.3-10.4 Минимальность подчиненной нормы Среди всех норм, согласованных с заданными векторными нормами, подчиненная норма является минимальной. Дополнение. Пусть ||-||0—любая матричная норма, согласованная с векторными нормами. Принимая во внимание определения из 13.3-7, 13.3-9, имеем p|||p(||4IHI)HI4 И = | ИМ 13.3-11.4 Мультипликативность подчиненной нормы Для квадратных матриц и одинаковых норм в пространствах векторов образов и прообразов подчиненная норма 13.3-9 всегда будет мультипликативной. Дополнение. Действительно, согласно определению из 13.3-9 имеем \\AB\\ = sup \\(AB)x\\ = sup \\A(Bx)\) < И 1 ИН
13. Векторные и матричные нормы 487 13.3-12.4 Мультипликативная норма единичной матрицы Для любой мультипликативной нормы ||?|| > 1. Дополнение. Имеем \\E\\ = ||? • Е\\ < \\E\\ - \\E\\. Поэтому ||?|| > 1. 13.3-13.4 Подчиненная норма единичной матрицы В условиях 13.3-9 всегда ||?|| = 1. Дополнение. Действительно, согласно определению из 13.3-9 имеем 13.3.3. Конкретные матричные нормы 13.3-14.4 Примеры подчиненных норм Следующие функции являются нормами матриц, подчиненными гельдеровым векторным нормам |Н|Ь |Н|оо, |И|2 из 13.2-11: п И, = max TlaJ, l4.,Zkl \\A\\2 = максимальное сингулярное число матрицы А. Дополнение. Доказательства всех этих фактов приведены в [10], стр. 130—136. Они не содержат никаких примечательных моментов, но несколько громоздки. Остановимся здесь лишь на доказательстве, касающемся ||-||2, т. к. эта норма используется наиболее часто. Будем считать, что в пространствах введены скалярные произведения согласно 5.1-8 в естественном базисе. Легко видеть, что в этом случае для любого вектора х имеем ||х|2 = (х, х). Теперь находим, что согласно 13.3-9, 5.2-25 \ \\А I = sup \\Ax\\ = sup (Ах, Ах) = sup (A*Ax, x |4=1 (х,*) = 1 (х,х) = 1 Согласно 11.3-1 матрица А*А эрмитова. В соответствии с 10.2-17, 11.3-3 ее можно представить в виде А*А - U*AU, где U— унитарная матрица, Л— диагональная матрица, диагональные элементы которой являются квадратами сингулярных чисел матрицы А. Сделав замену у= Ux и воспользовавшись 5.2-25, имеем = sup (f\
488 Часть I. Математические сведения по линейной алгебре Обозначим сингулярные числа через рь р2, ... и пусть они упорядочены в порядке невозрастания, т. е. pi > р2 > .... Еслиу = (у\,уг> ...,ут) н(у9у) = 1, то На векторе у = A, 0, ..., 0) неравенство превращается в равенство, поэтому и доказательство закончено. 13.3-15.4 Примеры мультипликативных норм Следующие функции являются мультипликативными матричными нормами: ч1/2 i2 ' max ал. i < / <« J i I < j < m Дополнение. Доказательства всех этих фактов приведены в [10], стр. 130—136. 13.3-1 б.4 Комментарий (о названиях норм) Нормы из 13.3-14, 13.3-15 называются, соответственно, 1-, оо-, спектральной, евклидовой и Л/-нормой. Однако иногда всем этим нормам даются и другие названия. Например, евклидова норма называется также сферической, спектральная— нижней гранью матрицы, 1-норма — второй, оо-норма — первой и т. п. 13.3-17.4 Соотношения эквивалентности матричных норм Имеют место следующие соотношения эквивалентности: т (птГи2М(А)<\\А1Е<М(А),
13. Векторные и матричные нормы 489 Дополнение. Доказательства всех этих фактов приведены в [10], стр. 130—136. 13.3.4. Евклидова и спектральная нормы 13.3-18.4 Согласованность евклидовой нормы Евклидова норма из 13.3-15 согласована с 2-нормами векторов. Дополнение. Евклидова норма является мультипликативной нормой. Поэтому справедливость утверждения следует из того, что 2-норма векторов совпадает с их евклидовой нормой, если векторы рассматривать как одностолбцевые матрицы. 13.3-19.4 Представления евклидовой нормы Для евклидовой нормы матрицы справедливы представления где рь ..., р/ — ненулевые сингулярные числа матрицы А. Дополнение. Это есть прямое следствие определения 13.3-15 и утверждений из 3.3-9, 11.3-18. 13.3-20.4 Унитарная инвариантность Евклидова и спектральные нормы не меняются при умножении матрицы справа и слева на любые унитарные матрицы. Дополнение. Это есть прямое следствие определений из 13.3-15, 13.3-14 и утверждений 10.2-21, 11.3-12. 13.3-21.4 Более точные оценки Для евклидовой нормы произведения матриц имеют место более точные оценки: Дополнение. Рассмотрим, например, первое неравенство. Второе рассматривается аналогично. Согласно 11.3-9 представим матрицу А в виде сингулярного разложения А = UAV, где U, V— унитарные матрицы, Л — диагональная матрица из сингулярных чисел матрицы А, упорядоченных в порядке неубывания. Принимая во внимание 13.3-20 и определения из 13.3-14, 13.3-15, имеем \\АС\\Е < \\UAVC\\E = WMVQh < 9x\\VC\\E =
490 Часть I. Математические сведения по линейной алгебре 13.3-22.4 Совпадение евклидовой и спектральной норм Евклидова и спектральная нормы матрицы совпадают тогда и только тогда, когда ранг матрицы равен 1. Дополнение. Из определения 13.3-15 и утверждения 11.3-18 вытекает, что евклидова и спектральная нормы совпадают тогда и только тогда, когда матрица имеет только одно ненулевое сингулярное число. Но в этом и только в этом случае матрица имеет ранг, равный 1. Действительно, пусть у матрицы А отлично от нуля только сингулярное число pj. Согласно 11.3-9 представим матрицу А в виде сингулярного разложения А = UAV. Обозначим через U\ первый столбец матрицы U, через vj — первую строку матрицы V. Легко проверить, что А = p\U\V] и очевидно, что матрица А имеет ранг, равный 1. Пусть теперь матрица А имеет ранг, равный 1. Согласно 4.3-14 представим матрицу А в виде произведения А = piWiVb где Р! — положительное число, щ — нормированный вектор-столбец, V! — нормированная вектор-строка. Возьмем любую унитарную матрицу U, у которой первый столбец совпадает с мь любую унитарную матрицу V, у которой первая строка совпадает cvj, и диагональную матрицу Л, которая имеет размеры, совпадающие с размерами матрицы А, и единственный ненулевой диагональный элемент, стоящий в позиции A, 1) и равный р|. Очевидно, что А = UAV. Но это есть сингулярное разложение матрицы А. Поэтому матрица Л имеет только одно ненулевое сингулярное число.
ЛИНЕАЛ — новые возможности изучения линейной алгебры 14. Сведения о компакт-диске с системой ЛИНЕАЛ 15. Небольшие иллюстрации к руководству по системе ЛИНЕАЛ 16. Примеры использования системы ЛИНЕАЛ 17. Предметный указатель 18. Список литературы
14. Сведения о компакт-диске с системой ЛИНЕАЛ 14.1. Системные требования Для работы с энциклопедией необходимо следующее аппаратное и программное обеспечение: компьютер с процессором Pentium II и выше, оперативной памятью от 256 Мбайт, установленной операционной системой Windows 98, 2000 или ХР и интернет-браузером Internet Explorer, Netscape Navigator, Mozilla или Firefox. Чтобы узнать параметры своего компьютера, щелкните правой кнопкой мыши на значке My computer и выберите пункт меню Properties. Правильная работа энциклопедии в других интернет-браузерах не гарантируется. Примечание В интернет-браузере должен быть включен JavaScript и отключена блокировка всплывающих окон. Для просмотра графа логических отношений между статьями необходим установленный для интернет-браузера Java-плагин. 14.2. Архитектура системы Энциклопедия использует в качестве Web-сервера программу Dynamic Web Server. Вся информация из энциклопедии хранится в базе данных. В качестве системы управления базами данных используется MySQL. 14.3. Порядок работы с энциклопедией Примечание Во время работы энциклопедии дисковод заблокирован и компакт-диск с энциклопедией невозможно вынуть.
494 Часть II. Линеал — новые возможности изучения линейной алгебры Начало работы: 1. Перед началом работы закройте все окна интернет-браузера. 2. Вставьте компакт-диск в дисковод. Если дисковод уже вставлен, дважды щелкните на значке My Computer на рабочем столе компьютера, найдите в списке дисков Lineal и дважды щелкните на его значке. Окончание работы: 3. Закройте интернет-браузер. Появится диалоговое окно с сообщением "The browser has been closed, do you want to close this software?". Нажмите кнопку Yes. 4. Другой вариант: щелкните правой кнопкой мыши на иконке программы-сервера Dweb на панели задач возле часов и в открывшемся контекстном меню выберите команду close. Продолжение работы с сохраненными выборками: 5. Закройте все окна браузера, оставшиеся от предыдущего сеанса. 6. Запустите энциклопедию. 7. Двойным щелчком на значке файла с сохраненными выборками откройте его, или перетащите мышью в окно браузера с энциклопедией. 8. Нажмите ссылку Продолжить работу. 14.4. Что делать, если что-то не работает 1. Энциклопедия, не запускается. Если после вставки компакт-диска в дисковод энциклопедия не запускается автоматически, дважды щелкните на значке My Computer, найдите в списке дисков Lineal и дважды щелкните на его значке. Если после этого энциклопедия также не запускается, а открывается окно со списком файлов, находящихся на диске "Lineal", найдите в этом списке программу autorun.exe и запустите ее. 2. Сразу после установки компакт-диска появляется диалоговое окно с надписью "The browser has been closed, do you want to close this software?". Нажмите кнопку No. Это предупреждение появляется в случае, когда в момент запуска энциклопедии интернет-браузер уже открыт. 3. Появилось окно программы, ограничивающей доступ в сеть (брандмауэра (firewall)). Разрешите работу HTTP-сервера Dynamic Web Server (программа dwebpro.exe, порт 8080) и системы управления базами данных MySQL (программа mysqld.exe, порт 3334) нажатием на кнопку allow, unlock или разблокировать и, при наличии такой опции, создайте соответствующие правила для брандмауэра (поле remember this setting в случае "Zonealarm").
14. Сведения о компакт-диске с системой ЛИНЕАЛ 495 4. В правой нижней части первой страницы энциклопедии появляется сообщение об ошибке. Это значит, что не смогла запуститься система управления базами данных. Проверьте настройки брандмауэра, если он установлен на компьютере. Если это не помогает, попробуйте перезапустить систему (см. П1.3). 5. Не работает ссылка Начать работу на первой странице. Включите поддержку JavaScript. Для этого в браузере Internet Explorer 6-й версии в меню Tools выберите пункт Internet Options. На вкладке Security выберите зону, соответствующую той, что обозначена в правом нижнем углу окна браузера с первой страницей энциклопедии (обычно это Internet). Затем нажмите кнопку Custom Level и прокрутите вниз окно Settings, пока не появится раздел Scripting и подраздел Active scripting. Выберите пункт Enable. После этого нажмите последовательно OK, Yes и ОК. Затем перезагрузите первую страницу энциклопедии кнопкой браузера Refresh. 6. Не открывается предметный указатель, поиск по ключевым словам, ввод номеров или содержание статей. Проверьте, не включена ли в интернет-браузере блокировка всплывающих окон. При блокировке в браузере Internet Explorer 6-й версии в окне структурного указателя появляется полоска. Может появиться и диалоговое окно. Если оно появилось, нажмите на кнопку ОК. Потом нажмите на полоску и из появившегося меню выберите пункт Always Allow Pop-ups from This Site.... Если упомянутая выше полоска не появилась, отключите блокировку окон с помощью меню Tools, в котором надо выбрать пункт Pop-up Blocker и затем Always Allow Pop-ups from This Site.... После этого появятся всплывающие окна, в которых надо нажать Yes и Retry. Окно структурного указателя перезагрузится. Все вопросы, пожелания и отзывы, касающиеся электронной энциклопедии ЛИНЕАЛ, присылайте по адресу: lineal@guru.ru.
15. Небольшие иллюстрации к руководству по системе ЛИНЕАЛ 15.1. Как узнать, оказывает ли статья А влияние на появление статьи Б Если статья А имеет номер, лексикографически более старший, чем номер статьи Ву то статья А по самому принципу установления причинно-следственных отношений не может оказывать влияние на статью В. Пусть статья А имеет меньший номер. Помечаем статьи А, В в структурном указателе. В выборке структурного указателя статья А будет указана раньше статьи В. Нажимаем кнопку Пополнение. Предположим, что в полном графе предметной области имеются какие-либо пути, связывающие вершины статей А и В. Пусть на этих путях находятся другие вершины, не совпадающие с А и В. Тогда в выборке структурного указателя появятся номера всех статей, соответствующих этим другим вершинам. Они будут окрашены в красный цвет. Наличие красных номеров однозначно говорит о том, что статья А оказывает влияние на статью В, причем не прямо, а через каких-то посредников. Номера статей-посредников как раз и окрашены красным цветом. Однако отсутствие красных номеров еще не говорит ни о чем, так как может существовать прямое влияние. Нажимаем кнопку Граф. Если обе вершины находятся на одном уровне в графе, то статья А не оказывает влияние на статью В. В противном случае влияние есть. Процедуру определения влияния можно осуществлять не только в режиме структурного указателя, но и в любом другом (предметный указатель, поиск, ввод номеров), где есть возможность задать в выборке номера необходимых статей. 15.2. Что означают уровни сложности статей Почти во всяком большом материале, и этот не является исключением, есть что-то очень простое, среднее, сложное и очень сложное. Чтобы легче ориентироваться в
498 Часть II. Линеал — новые возможности изучения линейной алгебры структуре материала, не только полезно, но даже необходимо осуществить какую-то его градацию по уровню сложности. Но любая такая градация неизбежно оказывается субъективной. Принятые в системе ЛИНЕАЛ обозначения уровней сложности совпадают с наиболее распространенными обозначениями оценок уровня знаний. В определенном смысле это сделано специально и оправданно несколькими соображениями. Во-первых, градация устроена таким образом, что на статью любого уровня сложности, кроме уровня 3, могут оказывать влияние лишь статьи не большего уровня сложности и обязательно оказывает влияние хотя бы одна статья из предыдущего уровня. Другими словами, чем выше уровень, тем выше сложность. Во-вторых, на уровне 3 находятся все самые простые статьи, на уровне 5 — все самые сложные, а на уровне 5+ — все статьи энциклопедии, в том числе и такие, для изучения которых необходимо обратиться к специальной литературе. Все это вполне соответствует принципам оценивания знаний. Кроме этого, здесь отражены, в какой-то мере, авторские представления о том, как действительно должны оцениваться знания в области линейной алгебры. По крайней мере, в тех вузах, где математическое образование является профилирующим, и в тех организациях, где от специалистов требуются хорошие знания. Градация статей по сложности заносится при вводе информации в систему и не может быть изменена пользователем. Если же говорить формально, то четыре уровня сложности не означают ничего другого, кроме как разделение всех статей на четыре группы с описанными только что отношениями между ними. На каждом уровне имеются как статьи более или менее простые, так и довольно сложные. Уровень сложности статей, с которыми предполагается работать, выбирается при входе в систему. По умолчанию он равен 5+. После начала работы уровень сложности изменять нельзя. Чем меньше установленный уровень сложности, тем меньше ресурсов требует система и тем эффективнее она функционирует. Выбор уровня сложности не влияет на возможность системы выполнять или не выполнять какие-либо операции. Поэтому в процессе работы можно просто не обращать никакого внимания на уровень сложности. Тем не менее для удобства оценивания выбранного материала уровень сложности статей все-таки показывается. Почти всегда номера статей расположены на цветовом фоне, характеризующем этот уровень. 15.3. Как строятся графы связей по параграфам и главам Связи между параграфами и главами устанавливаются совершенно одинаково. Рассмотрим любое множество статей. Пусть некоторые из них входят в параграф (главу) А, а какие-то другие в параграф (главу) В и эти параграфы (главы) различны. По самому принципу присвоения номеров главам, параграфам и статьям имеет место альтернатива: либо номер любой статьи из параграфа (главы) А лексикографически больше номера любой статьи из параграфа (главы) В, либо номер любой статьи из параграфа (главы) А лексикографически меньше номера любой статьи из параграфа (главы) В. Допустим, что никакая статья из параграфа (главы) А не связана непосред-
15. Небольшие иллюстрации к руководству по системе ЛИНЕАЛ 499 ственно ни с какой статьей из параграфа (главы) В. Тогда эти параграфы (главы) независимы и не связываются дугой. Предположим, что в параграфе (главе) А есть хотя бы одна статья, которая является предшественником для какой-нибудь статьи из параграфа (главы) В. В силу сказанного ранее, в параграфе (главе) В не может существовать ни одной статьи, которая могла бы быть предшественником хотя бы для одной статьи из параграфа (главы) А. Поэтому будем считать параграф (главу) А предшественником параграфа (главы) В. При построении графа по параграфам (главам) проведем дугу из вершины, соответствующей параграфу (главе) А в вершину, соответствующую параграфу (главе) В. Очевидна ситуация, когда дуга будет проводиться из В в А. 15.4. Как связаны сложности параграфа-предшественника и параграфа-следствия В общем случае связи между параграфом-предшественником и параграфом-следствием нет. Понятие сложности параграфа (главы) плавающее и зависит от исходной выборки статей. Именно, сложность конкретного параграфа (конкретной главы) на заданной выборке статей определяется как наибольшая сложность тех статей из данной выборки, которые входят в этот параграф (эту главу). Поэтому в отличие от статей сложность предшественника в случае параграфов или глав может быть больше сложности следствия. Рассмотрим выборку их трех статей: 12.8-20 (сложность 4), 12.8-25 (сложность 5) и 12.8-30 (сложность 4). Статья 12.8-20 является предшественником статьи 12.8-30, статья 12.8-25 не имеет следствий. Статьи 12.8-20 и 12.8-25 входят в параграф 12.8.4, который на данной выборке имеет сложность 5. Статья 12.8-30 входит в параграф 12.8.5, который на данной выборке имеет сложность 4. Но по определению, приведенному выше, параграф 12.8.4 является предшественником параграфа 12.8.5. Заметим, что подобные ситуации встречаются довольно редко. 15.5. Как ознакомиться с содержанием ссылок При чтении различных текстов довольно часто встречаются ссылки на те или иные статьи. Естественно, возникает желание ознакомиться с их содержанием, возможно, спустя какое-то время. Для этого в системе ЛИНЕАЛ реализована специальная операция. Внизу окна структурного указателя, и только здесь, есть строка для хранения номеров статей отложенного просмотра. Активизация курсора на номере любой ссылки, окрашенной синим цветом, осуществляет пересылку этого номера в указанную строку. Такая пересылка возможна во всех случаях, в том числе даже тогда, когда строка отложенного просмотра не видна на экране. Вызвать тексты отложенных статей можно активизацией первой кнопки справа от строки. При этом возникающее новое окно с текстами отложенных статей не закрывает старое окно с текстами тех
500 Часть II. Линеал — новые возможности изучения линейной алгебры статей, из которых был активизирован отложенный просмотр. Статьи просматриваются группами по пять штук. Просмотр статей и пополнение строки отложенного просмотра могут многократно чередоваться. Строка отложенного просмотра очищается с помощью активизации второй кнопки справа от нее. 15.6. Какие установить метки у статей Всего в системе ЛИНЕАЛ реализованы три способа установления меток у статей. Один из них связан с помечиванием обозначающих статьи вершин графов. О нем подробно рассказывается в пункте 16.7. Два других способа связаны с установлением галочек в квадратиках, которые сопровождают названия статей и всегда расположены справа от названий. Не имеет значение, каким образом появляется название статьи и в каком виде представлена сама статья. Это может быть и только ее название, и полное ее описание. Но каждый раз, когда на экране в одной строке появляются одновременно название статьи и квадратик, статья может быть помечена. Пометка осуществляется записыванием галочки в квадратике с помощью активизации на нем курсора. Повторная активизация курсора стирает галочку и, соответственно, снимает пометку статьи. Один из способов можно назвать структурным, другой локальным. Они отличаются друг от друга лишь тем, что при структурной отметке установление (снятие) галочки в квадратике около названия статьи обязательно дублируется установлением (снятием) аналогичной галочки в структурном указателе. Осуществить структурную отметку можно в следующих ситуациях: в самом структурном указателе, при любом вызове полного текста статьи, при вызове списка статей-предшественников или статей-следствий. Если какие-то статьи в структурном указателе оказались помеченными, то во всех этих ситуациях пометки будут видны и, следовательно, в случае необходимости могут быть сняты. Все остальные пометки являются локальными. Они никак не влияют на состояние структурного указателя и нужны только для выполнения указанных на экране инструкций. Структурные отметки особенно полезны в тех случаях, когда при просмотре текстов статей, их предшественников и следствий, или ссылок на другие статьи необходимо выбрать для дальнейшей работы какую-то совокупность статей и зафиксировать ее. Эта фиксация и осуществляется в выборке структурного указателя. 15.7. Как увидеть содержание статей В системе ЛИНЕАЛ можно увидеть полное содержание как одной статьи, так и группы статей. Любую одиночную статью можно вызвать путем активизации курсора на ее номере, если он находится либо в какой-нибудь выборке, либо в цветном прямоугольнике в одной строке с названием статьи. Вызов группы статей можно осуществить нажатием на любую из перечисленных кнопок: кнопка показать на экране с графом, первая кнопка справа от строки отложенного просмотра, кнопка Тексты. Конечно, номера вызываемых статей так или иначе должны быть перечислены. Это
15. Небольшие иллюстрации к руководству по системе ЛИНЕАЛ 501 делается либо отмечая статьи, либо с помощью набора ссылок в строке отложенного просмотра. Вызов группы осуществляется одинаково, независимо от того, откуда он поступил. Статьи перед показом упорядочиваются по лексикографическому росту их номеров. Сам показ происходит партиями по пять штук. В конце каждой пятерки дается список всех партий. Подводя к любой из них курсор, можно увидеть перечень номеров статей, входящих в конкретную пятерку. Активизация курсора вызывает эти статьи на экран. Полное или частичное содержание помеченных статей можно подготовить к выдаче нажатием на кнопку Печать. Появляется меню, в котором нужно отметить галочками те фрагменты статей, которые представляют интерес. После этого нажимаем кнопку GO и на экране появляется подготовленный к выдаче материал. 15.8. Какие операции можно проводить с выборками С точностью до некоторых деталей с выборками проводятся операции двух типов. Во-первых, над ними, как над множествами номеров статей, можно выполнять основные теоретико-множественные операции: объединение, пересечение, вычитание. Сформированный результат всегда будет помещен в выборку структурного указателя. И, во-вторых, состояние выборок (и только выборок!) можно в любой момент запомнить, если возникает необходимость прервать работу с системой ЛИНЕАЛ и возобновить ее позднее. Какова бы ни была операция, ее выполнение начинается с нажатия на кнопку Сохранить выборки. При этом сама система может находиться в любом режиме. Важно только, чтобы кнопка была видна на экране. Появляется меню, согласно которому требуется выполнить некоторые действия. В меню в списке сверху вниз подряд перечислены не пустые на настоящий момент выборки из цепочки: структурный указатель; предметный указатель; поиск; ввод номеров. Каждая из них отмечена слева квадратиком с галочкой. Справа от квадратика, начиная со второго, стоит селектор, по которому можно выбрать логическую операцию. Выбранная операция показывает, что должно быть сделано с данной выборкой по отношению к предыдущим в списке выборкам. Если в появившемся меню указывается только одна выборка, то это означает, что все остальные выборки пустые и будет автоматически выполняться операция объединения выборок или, другими словами, простой перенос непустой выборки. Далее возможно разветвление процесса: либо работа с системой ЛИНЕАЛ продолжается, либо она заканчивается. В любом случае одновременно можно запомнить промежуточное состояние выборок для возобновления работы позднее. Если работа продолжается, то активизируется фраза1 Сформировать выборку и далее фраза Загрузить выборку в структурный указатель. После этого над ранее сформированными 1 Для активизации фразы или строки необходимо подвести курсор на поле, занимаемое этой фразой, и щелкнуть один раз левой кнопкой мыши.
502 Часть II. Линеал — новые возможности изучения линейной алгебры выборками в соответствии с появляющимися замечаниями выполняются ранее выбранные логические операции и результат записывается в выборку структурного указателя. Содержание всех остальных выборок сохраняется, и работа может быть продолжена. Если необходимо запомнить объединенную выборку, такое действие осуществляется в соответствии с инструкцией, появившейся после активизации фразы Сформировать выборку. В случае, когда требуется запомнить текущее состояние всех выборок, то вместо фразы Сформировать выборку активизируется фраза Сохранить выборки по отдельности и выполняются появившиеся указания по сохранению выборок. Содержание выборок запоминается, но оно же остается без изменения в системе. Закрывается окно изменений, после чего можно возобновить работу с системой, начиная с прерванного состояния. Заметим, что если работа с запомненными выборками возобновляется после закрытия системы ЛИНЕАЛ, эту систему необходимо, прежде всего, снова открыть. 15.9. Как выбрать определения из заданной совокупности статей Допустим, что в выборке структурного указателя находятся номера каких-то статей. Обратимся к операции поиска по ключевым буквосочетаниям. На трех полях для начальной информации зададим последовательно буквы "а", "е", "п", по одной на каждом поле, и установим между ними логические операции OR. Отметим галочками те характеристики статей, по которым будем определять присутствие букв. Это заголовки, тексты и определения. Другими словами, в каждом определении выделим заголовок статьи и ее текст. После этого будем искать все те статьи-определения, которые в выделенных частях содержат хотя бы одну из букв "а", "е" или "п". По лингвистической статистике какая-нибудь из этих букв присутствует почти обязательно в любом значимом тексте. Нажимая кнопку ОК, получаем слева список всех 417 статей- определений, имеющихся в энциклопедии. В выборке справа находится список их номеров. Кстати, почти любые другие тройки букв дают тот же самый список. Теперь нажмем кнопку Сохранить выборки. Появляется меню возможных операций над выборкой из структурного указателя и только что полученной выборкой. Выбираем операцию пересечения AND, нажимаем кнопку Сформировать выборку, затем строку Загрузить выборку в структурный указатель и далее действуем в соответствии с указаниями инструкций, нажимая последовательно кнопку ОК. После выполнения всех действий в выборке структурного указателя из всех номеров имевшихся там статей остаются только те, которые относятся к определениям. Напомним, что под статус "определение'1 попадают те статьи, в которых либо приводится определение какого-либо понятия, либо сама статья представляет именное утверждение. Очевидно, что, действуя аналогичным образом, можно из заданной совокупности статей выбирать не только определения, но также утверждения и комментарии.
15. Небольшие иллюстрации к руководству по системе ЛИНЕАЛ 503 С помощью подобных операций можно получать довольно интересные характеристики различных наборов статей. Рассмотрим для примера весь набор статей энциклопедии. Отметив галочками в структурном указателе все 13 разделов, получаем в выборке список из 1531 статьи. Далее таким же способом, как было описано выше, в режиме поиска по ключевым буквосочетаниям получаем список из всех 417 определений, имеющихся в энциклопедии. Нажимаем кнопку Пополнение. В выборке режима поиска появляется список из 801 статьи. Это минимально возможный набор статей энциклопедии, который содержит все 417 определений и статьи, подготавливающие их введение. Среди 417 определений очень много таких, которые не имеют ни одного следствия, входящего в выборку из 801 статьи. Найти эти определения можно следующим образом. Нажимая кнопку Граф в режиме поиска, строим граф причинно- следственных отношений для определений. Затем открываем в окне графа второй справа селектор и активизируем строку конечные. В графе определений будут выделены те из них, которые не имеют никаких следствий-определений. У них возможны только следствия-утверждения и следствия-комментарии. Интересно проанализировать структуру связей этих следствий. Снова нажимаем кнопку Сохранить выборки, однако теперь выбираем операцию вычитание. Нажимаем кнопку Сформировать выборку, затем строку Загрузить выборку в структурный указатель и далее действуем в соответствии с указаниями инструкций, нажимая последовательно кнопку ОК. После выполнения всех действий в выборке структурного указателя из всех 1531 номеров имевшихся там статей остаются только 730 статей. Все они, кроме статьи 1.2-1, являются следствиями рассматриваемых "конечных" определений. Построим их граф. Он имеет большую специфику: в нем имеется всего несколько ярусов, на первом ярусе расположено 464 статьи, на втором — 144, на третьем — 70 и далее число статей на ярусах быстро убывает. Это означает, что 464 статьи из 730 являются всего лишь непосредственными следствиями "конечных" определений, и только малая часть среди остальных представляет более сложные следствия. 15.10. Как подготовить памятные записи по лекциям Это делается очень просто. Сначала необходимо отметить галочками в структурном указателе те статьи, информацию по которым нужно вывести. Если необходимо отметить все статьи, входящие в какие-нибудь параграфы, главы или разделы, то развертывать такие части до уровня статей не обязательно. Отмечать галочками можно любые части целиком. Далее нажимаем кнопку Печать. Появляется меню, в котором нужно отметить галочками те фрагменты статей, которые представляют интерес. В том случае, когда о лекциях требуется составить лишь самое общее представление, можно ограничиться пометкой порядкового номера статьи в будущем списке, ее индивидуального номера, названия, типа и списка предшественников. Информация о каждой статье будет размещаться всего в двух строчках. В первой строчке слева направо показываются: порядковый номер статьи в списке, индивидуальный трехпози-
504 Часть II. Линеал — новые возможности изучения линейной алгебры ционный номер статьи, название статьи и тип статьи (определение, утверждение или комментарий). Во второй строчке перечисляются индивидуальные номера всех статей, которые были непосредственно использованы при формировании данной статьи. Эта часть информации особенно важна, т. к. позволяет увидеть связь статей между собой. Если требуется вывести описания формулировок статей, то в меню отмечается галочкой фрагмент ТЕКСТ. Пометка галочкой фрагмента ДОПОЛНЕНИЕ означает, что будут подготовлены к выдаче также тексты доказательств утверждений и всех поясняющих примеров. 15.11. Как установить связи конкретной статьи с другими статьями Это делается очень просто. Сначала рекомендуется очистить выборку структурного указателя. Далее любым подходящим способом вызываем текст интересующей статьи. Напомним, что в верхней строке текста каждой статьи справа от названия находятся три символа: левая стрелка, квадратик и правая стрелка. Все эти символы активные. Активизируя курсор на квадратике можно записать в нем галочку. Тем самым статья будет помечена и ее номер окажется в выборке структурного указателя. Повторная активизация курсора на квадратике снимает галочку и, соответственно, пометку статьи. Подводя курсор к левой (правой) стрелке, можно увидеть число непосредственных предшественников (следствий) данной статьи. Активизируя курсор на левой (правой) стрелке можно вызвать названия и индивидуальные номера этих предшественников (следствий). Все статьи-предшественники и статьи-следствия расположены в порядке лексикографического роста их номеров. Они сопровождаются такими же стрелками и квадратиками, с которыми можно проводить все описанные действия. В частности, любые из этих статей можно пометить и у какой-нибудь из них снова вызвать предшественников или следствия. Слева от номера любой статьи из списка предшественников или следствий стоит символ и+". Он активный, но в работе с ним есть некоторая особенность, связанная с тем, каким образом сформировался данный список. Если это есть список предшественников (следствий) некоторой статьи, то активизация курсора на знаке "+" около номера любого из ее предшественников (следствий) снова раскрывает предшественников (следствия), но уже у выбранной статьи-предшественника (статьи-следствия). Менять последовательность предшественники-следствия можно с помощью активизации курсора на стрелках. В процессе просмотра предшественников-следствий нужные статьи можно пометить. Все их номера окажутся в выборке структурного указателя. После этого с помеченными статьями можно делать все описанные выше операции: строить граф, конструировать пополнение, выдавать на печать их содержание и т. п. Если при просмотре текстов каких-либо статей покажутся интересными ссылки на некоторые статьи, то для их анализа и пометки можно воспользоваться операцией Строка отложенного просмотра. Работа с ней рассматривалась несколько ранее.
15. Небольшие иллюстрации к руководству по системе ЛИНЕАЛ 505 15.12. Что означает красная кнопка в выборке структурного указателя Изменять содержание выборки структурного указателя можно либо при помощи совершения действий с галочками, либо выполняя операции Пополнение, Добавить к выборке, Сформировать выборку, Очистить. Предположим, что при работе с выборкой совершена какая-то ошибка и необходимо вернуться к предшествующему ее состоянию. В случае, когда изменение осуществлялось с помощью установки (снятия) галочки, предшествующее состояние выборки структурного указателя восстанавливается путем снятия (установки) той же самой галочки. Если же изменение осуществлялось при выполнении любой из перечисленных выше операций, то восстановление достигается путем активизации именно этой красной кнопки. Заметим, что аналогичная красная кнопка функционирует также во всех остальных режимах работы со статьями: предметный указатель, поиск и ввод номеров. Напомним лишь, что в этих режимах изменение выборки с помощью кнопки Сформировать выборку невозможно. 15.13. Что является главным в системе ЛИНЕАЛ Если говорить совсем коротко, то самое главное в системе — это предоставление возможности увидеть в целом структуру изучаемого материала. Именно увидеть, а не прочитать или услышать, и именно в целом, поскольку видение материала в целом со всеми его фрагментами и связями и отличает знания высококлассного специалиста от знаний специалиста среднего. Возможность видеть структуру материала особенно важна при освоении различных абстрактных дисциплин, какой является, в частности, теоретическая линейная алгебра. В обычной ситуации такое видение наступает только после многих лет работы в конкретной предметной области. Есть основания надеяться, что в области линейной алгебры система ЛИНЕАЛ существенно поможет приблизить момент зрительного восприятия предметной области. Предоставление возможности увидеть структуру материала — это главное в системе ЛИНЕАЛ, но только с целевой точки зрения. Чтобы обеспечить достижение такой цели, необходимо было пройти два важнейших предварительных этапа. Во-первых, провести тщательное структурирование и разбиение на фрагменты (статьи) всего материала из рассматриваемой предметной области и установить причинно-следственные отношения между отдельными фрагментами (статьями). И, во-вторых, понять, какие функциональные операции должна выполнять система, и разработать архитектуру самой системы.
16. Примеры использования системы ЛИНЕАЛ 16.1. Построение расширенного пополнения Построение расширенного пополнения приходится реализовывать при решении самых разных задач, поэтому рассмотрим сначала его формально. Конкретные примеры будут показаны несколько позднее. Операция Пополнение может выполняться во всех основных режимах: Структурный указатель, Предметный указатель, Поиск и Ввод номеров. Расширенное пополнение также строится всюду. Поскольку само построение осуществляется везде совершенно одинаково, ограничимся рассмотрением лишь случая структурного указателя. Предположим, что в выборке структурного указателя находятся какие-то статьи, число которых не менее двух. Пусть А (В) означает лексикографически наименьший (наибольший) их номер. Нажимаем кнопку Пополнение. В выборке структурного указателя появляются номера новых статей, окрашенные красным цветом. Их лексикографические номера всегда больше А и меньше В. Среди всех статей энциклопедии, статьи с красными номерами, и только они, обладают следующим свойством: для любой из них в исходной выборке структурного указателя существует пара статей, из которых одна прямо или косвенно является предшественником этой статьи и другая, которая прямо или косвенно является ее следствием. Если при нажатии кнопки Пополнение красные номера статей в выборке не появляются, то это означает, что каждая пара статей в исходной выборке либо не связана, либо связана непосредственно. Теперь нажимаем кнопку Предшественники. Появляется список статей. Все статьи не входят в пополненную выборку структурного указателя, но от каждой из них какая-то статья в выборке зависит непосредственно. Снимая соответствующие галочки, исключаем из списка все статьи, номера которых лексикографически меньше или равны А. Нажимая кнопку Добавить к выборке, присоединяем оставшиеся в списке номера к выборке. Повторяем эту последовательность действий до тех пор, пока при
508 Часть //. Линеал — новые возможности изучения линейной алгебры нажатии кнопки Предшественники не появится список из статей, у которых все номера лексикографически меньше или равны Л, или список не будет пустым. Полученный в выборке структурного указателя список статей и представляет расширенное пополнение первоначального содержания выборки. Он содержит те и только те статьи энциклопедии, номера которых лексикографически не меньше А (и, как следствие, не больше В) и которые прямо или косвенно являются предшественниками статей в исходной выборке. 16.2. Составление цикла лекций на заданную тему Предположим, что составляется цикл лекций, посвященных приведению системы линейных алгебраических уравнений к каноническому виду. Допустим, что будущий слушатель ничего не знает ни о матрицах, ни о системах уравнений. Будем строить цикл, начиная с понятия матрицы. Входим в предметный указатель системы ЛИНЕАЛ и находим слово "Матрица". Видно, что это понятие определяется в статье 3.2-1. Помечаем статью галочкой, активизируя курсор в соответствующем квадратике. Далее, находим определение канонического вида системы линейных алгебраических уравнений. Оно дается в статье 6.2-9. Помечаем и эту статью галочкой. Обе помеченные статьи показаны в предметном указателе справа в выборке. Они являются ориентирами для процесса построения цикла: со статьи 3.2-1 необходимо начинать цикл, статьей 6.2-9, вообще говоря, его надо закончить. Переходим в структурный указатель. Пометим в нем эти же две статьи, что можно сделать двумя разными способами: автоматизированным или непосредственным. Автоматизированный способ удобно применять тогда, когда предварительно помеченных статей много и, тем более, когда они расположены в разных выборках. Осуществляется он через формирование в структурном указателе объединенной выборки путем нажатия кнопки Сохранить выборки и дальнейшего выполнения появляющихся инструкций. Поскольку в рассматриваемом случае выбранных статей мало, проще и быстрее пометить их в структурном указателе непосредственно. Активизируя курсор на знаке "+" раздела 3, раскрываем содержание раздела по главам. Далее, последовательно активизируя курсор на знаках "+" главы 3.2 и параграфа 3.2.1, раскрываем локальное содержание раздела 3 до уровня статей. Активизируя курсор в квадратике справа от статьи 3.2-1 "Матрица", помечаем эту статью галочкой. Аналогично, раскрывая последовательно раздел 6, главу 6.2 и параграф 6.2.2, доходим до статьи 6.2-9 "Приведение к каноническому виду" и помечаем ее. Обе помеченные статьи показаны в структурном указателе справа в выборке. Рассматривая содержание параграфа 6.2.2, решаем, что полезно включить в цикл сведения об общем решении канонической системы, задаваемые статьей 6.2-12. Помечаем также и эту статью. Тем самым в выборке структурного указателя помещены все три выбранные опорные статьи строящегося цикла. Нажимаем кнопку Пополнение. В выборке структурного указателя появляются номера 49 статей. Номера новых статей окрашены красным цветом. Эти и только эти
16. Примеры использования системы ЛИНЕАЛ 509 статьи обладают следующим свойством: все они прямо или опосредованно зависят от статьи 3.2-1 и от какой-то из них прямо или опосредованно зависит либо статья 6.2-9, либо статья 6.2-12. Все 49 статей заведомо должны входить в цикл. Но, возможно, не только они. Могут существовать другие важные статьи, на которые опираются какие- то из этих 49 статей и которые тоже целесообразно включить в цикл. Заметим, что нажать кнопку Пополнение можно было бы непосредственно в предметном указателе. Но это было бы другое пополнение, т. к. не была бы задействована статья 6.2-12. Эту статью мы решили включить как опорную для строящегося курса, анализируя более детально параграф 6.2.2. Сделать такой анализ в рамках предметного указателя невозможно. Нажмем кнопку Предшественники. На экране появляется список из 15 статей. Эти и только эти статьи таковы, что среди всех статей, от которых непосредственно зависят статьи из выборки, лишь они не входят в выборку. Первые 9 предшественников имеют номера, лексикографически меньше, чем 3.2-1. Поэтому понятие матрицы от них заведомо не зависит. Убираем у данных предшественников галочки, а остальных предшественников присоединяем к выборке, нажимая кнопку Добавить к выборке. Повторяем эту процедуру, добавляя к выборке очередные 3 предшественника. Попытка выполнить такую процедуру еще раз показывает, что предшественников, номера которых лексикографически больше, чем 3.2-1, нет. Тем не менее, для большей уверенности в том, что никакие связи не упущены, нажимаем еще раз кнопку Пополнение. Как и должно быть, выборка структурного указателя остается без изменения. Строго говоря, выполненные операции не означают ничего иного, кроме как построение расширенного пополнения списка из трех номеров 3.2-1, 6.2-9 и 6.2-12. Несколько ранее эта операция была описана формально. Формирование цикла закончено. Номера всех его 58 статей находятся в выборке структурного указателя. Взглянем вначале на созданный цикл целиком. Для этого построим граф причинно-следственных отношений статей из выборки нажатием на кнопку Граф. Этот граф достаточно сложен. В соответствии с числом статей он содержит 58 вершин. Его параллельная форма имеет 15 уровней, интересующие нас статьи 6.2-9, 6.2-12 находятся, соответственно, на уровнях с номерами 14, 15. Для детального анализа содержания цикла не будем использовать граф по статьям. Построим укрупненный граф, группируя вместе статьи, входящие в одну и ту же главу. Для этого в нижнем левом селекторе выбираем строку Главы. Теперь граф становится очень простым и содержит только 6 вершин. Чтобы посмотреть содержание отдельных вершин, включаем второй нижний селектор в режим тексты. Все вершины анализируются одинаково. Для примера рассмотрим вершину 3.2. Активизируя на ней курсор, посылаем в верхний правый список номера всех статей, входящих в эту главу и относящихся к построенному курсу. Нажав кнопку показать, можно увидеть группами по 5 штук содержание самих статей. С помощью кнопки очистить список ликвидируется. Полный анализ всех вершин показывает следующее. Из главы 3.2 в цикл входят 15 статей, содержащих первичные сведения о матрицах и операциях над ними.
510 Часть II. Линеал — новые возможности изучения линейной алгебры Из главы 3.4 в цикл входят 18 статей, содержащих описание элементарных преобразований над матрицами и простейших свойств самих преобразований. Из главы 3.5 в цикл входит только одна статья, определяющая блочную матрицу. Данная статья нужна в цикле лишь для того, чтобы аккуратно описать некоторые результаты. Из главы 3.6 в цикл входят 8 статей, описывающих общую идею метода Гаусса и реализацию его шагов с помощью элементарных преобразований матрицы. Здесь же описаны основанные на методе Гаусса процедуры приведения матрицы к различным простым видам. Из главы 6.1 в цикл входят 8 статей, содержащих первичные сведения о системах линейных алгебраических уравнений. Кроме этого, здесь же дается определение эквивалентных систем. Из главы 6.2 в цикл входят 8 статей, описывающих элементарные преобразования исходной системы линейных алгебраических уравнений и доказывающих эквивалентность всех систем, получаемых в результате применения этих преобразований. Показывается, как привести систему к каноническому виду, и приводятся явные формулы для общего решения канонической системы. По графу сразу видно, в каком порядке можно осваивать сформированный материал. Конечно, все начинается с главы 3.2. После этого главы 3.4, 3.5, 6.1 осваиваются в любом порядке. Затем идет глава 3.6 и, наконец, глава 6.2. Главы 3.2, 3.4, 3.5 и 3.6 относятся к преобразованиям матрицы, главы 6.1, 6.2 — к системам линейных алгебраических уравнений. Поэтому цикл по главам лучше выстраивать в таком порядке: 3.2. 3.4 3.5, 3.6, 6.1, 6.2. Переходя к графу по параграфам, можно сформировать тот же цикл иначе по отдельным темам. Но в первом приближении начинать формирование цикла по темам почти всегда надо с анализа графа по главам. В рассматриваемом цикле граф по главам формирует темы почти идеально. Лишь статья 6.1-12 из главы 6.1 может быть отнесена к той теме, которая рассматривается в статьях из главы 6.2. Да и то такое отнесение является скорее делом вкуса, чем по существу. Теперь можно точно ответить на вопрос о том, какие необходимо иметь начальные знания, чтобы освоить созданный цикл. Для этого, не меняя выборку структурного указателя, снова нажимаем кнопку Предшественники. Появляется список из 9 статей. Это как раз те статьи, сведения в которых и составляют необходимые начальные знания. Чтобы описать их, совсем не обязательно запоминать содержание статей всех предшественников. Достаточно запомнить самые сложные из них. Статьи- предшественники, как и любое другое множество статей, связаны между собой каким-то графом причинно-следственных отношений. Среди всех статей выделяются те, от которых не зависит ни одна статья из заданной совокупности. Они называются конечными. Это самые сложные статьи, т. к. в общем случае зависят от всех остальных. По сути, они и описывают начальные знания, но только не детально, а в сжатом виде. Среди предшественников именно данные статьи остаются помеченными после активизации кнопки Оставить конечные. Окончательно получаем, что для освоения созданного курса достаточно знать сведения, содержащиеся в трех статьях 2.1-10, 2.2-7 и 3.1-2. В них дается критерий линейной независимости, определение ранга системы векторов и обозначение суммы многих чисел.
16. Примеры использования системы ЛИНЕАЛ 511 Естественно, что точно так же можно сформировать еще один цикл, посвященный освоению сведений, содержащихся в этих трех статьях. Если отталкиваться от понятия "Вектор", вводимого в статье 1.7-1, то теперь опорными для нового цикла будут статьи с номерами 1.7-1, 2.1-10, 2.2-7 и 3.1-2. Новый цикл содержит 32 статьи, его граф по главам имеет 4 вершины с номерами 1.7, 2.1, 2.2 и 3.1. Анализ содержания статей по вершинам графа показывает следующее. Из главы 1.7 в новый цикл входят 13 статей, в которых даются определения линейного и арифметического пространств и приводятся простейшие их свойства. Из главы 2.1 в новый цикл входят 12 статей, описывающих различные свойства линейно зависимых и линейно независимых систем векторов. Из главы 2.2 в новый цикл входят 5 статей. В них рассматриваются эквивалентные системы векторов, база и ранг системы векторов. Из главы 3.1 в новый цикл входят только 2 статьи, посвященные суммированию чисел. Для того чтобы освоить новый цикл, достаточно владеть начальными знаниями, описанными в статьях 1.2-3, 1.3-5, 1.4-2 и 1.6-18. В них вводятся перенумерация на множестве элементов, понятие отношения эквивалентности, символика и терминология для алгебраических операций, а также понятие числа. Наконец, можно построить еще один цикл по освоению сведений из статей 1.2-3, 1.3-5, 1.4-2 и 1.6-18. Будем начинать с первичного понятия "Множество и элементы", вводимого статьей 1.2-2. Этот цикл содержит 27 статей, его граф по главам является линейным и имеет 5 вершин с номерами 1.2, 1.3, 1.4, 1.5 и 1.6. Анализ содержания статей показывает следующее. Из главы 1.2 в цикл входят 6 статей, посвященных описанию понятия множества и связанных с ним некоторых других понятий. Из главы 1.3 в цикл входят 7 статей. В них обсуждаются такие важные понятия, как эквивалентность, равенство и тождество элементов. Из главы 1.4 в цикл входят 7 статей, в которых вводятся различные понятия, относящиеся к алгебраическим операциям. Из главы 1.5 в цикл входят 3 статьи. В этих статьях вводится понятие группы и доказывается существование в произвольной группе единицы и обратного элемента. Из главы 1.6 в цикл входят 4 статьи, определяющие кольцо, поле и числа. Интересно отметить, что единственным внешним предшественником для статей последнего цикла является статья-комментарий 1.2-1. В этой статье не содержится никакой сколько-нибудь значимой для дальнейших исследований информации. По существу, она всего лишь представляет очень краткое введение к последующему материалу. Сказанное, в частности, означает, что для освоения с помощью системы ЛИНЕАЛ различных вопросов, связанных с каноническим видом системы линейных алгебраических уравнений, не нужно иметь предварительно никаких математических знаний. Данный вывод легко проверить непосредственно. Снова предположим, что составляется цикл лекций, посвященных приведению системы линейных алгебраических
512 Часть II. Линеал — новые возможности изучения линейной алгебры уравнений к каноническому виду. Но теперь допустим, что будущий слушатель не знает ничего. Будем строить цикл, начиная с понятия "Множество и элементы", задаваемого статьей 1.2-2. По описанной ранее процедуре устанавливаем, что на этот раз цикл состоит из 117-ти статей и единственной внешней для него статьей-предшественником является уже знакомая статья 1.2-1. Легко проверить, что эти 117 статей совпадают с объединением всех статей из трех рассмотренных выше циклов, что, конечно, не случайно. Не трудно доказать, что граф по статьям "большого" цикла может отличаться от объединения графов по статьям трех "малых" циклов не более чем наличием какого-то числа дополнительных дуг. В свою очередь, это означает, что описанная методика не только позволяет строить курсы лекций на заданные темы, но и предоставляет возможность разбивать курсы на самостоятельные замкнутые циклы. Обратим внимание на то, что все статьи любого цикла можно просмотреть или подготовить к печати нажатием кнопки Печать. В появившемся меню необходимо сначала отметить галочками те части информации, которые следует взять из базы данных, а затем нажать кнопку GO. Естественно, что точно так же можно просмотреть или подготовить к печати исходную информацию по циклу. В заключение заметим, что если в процессе чтения созданного цикла лекций слушателям будет предоставлена возможность не только познакомиться с содержанием всех указанных выше 58 (для большого цикла 117) определений и фактов, но и будет показана информационная структура цикла и его иерархическое строение, то усвоение материала окажется более эффективным. 16.3. Определение узких мест цикла лекций Известно, что одним из самых трудных мест в типовых курсах линейной алгебры является приведение матрицы с помощью подобных преобразований к жордановой форме. Обычно соответствующие доказательства проводятся в поле комплексных чисел, чтобы обеспечить факт существования у матрицы полного набора собственных значений. По ходу проведения доказательств данный факт используется много раз и не так просто сразу понять, где должен применяться именно он, а где можно использовать и более слабые утверждения. В предыдущем примере было показано, что вполне содержательные циклы лекций удается строить в произвольных полях. Очевидно, что какие-то части процесса приведения к жордановой форме заведомо можно выполнить в таких полях. Однако интересно понять, насколько далеко здесь можно продвинуться и где появятся узкие места. Все это удается узнать с помощью системы ЛИНЕАЛ. Воспользуемся описанной выше методикой построения и исследования циклов лекций. Предположим, что конечной целью цикла является доказательство возможности приведения матрицы к жордановой форме. Используя предметный указатель, находим, что такая возможность фиксируется в статье 9.5-21 "Каноническая форма Жор- дана". Будем считать также, что начальные сведения задаются одной статьей 1.2-2 "Множество и элементы". Переносим номера этих двух статей в структурный указа-
16. Примеры использования системы ЛИНЕАЛ 513 тель и нажимаем кнопку Пополнение. Появление в выборке справа номеров статей, окрашенных красным цветом, говорит о том, что статьи 1.2-2 и 9.5-21 связаны между собой. Нажимая затем кнопку Предшественники, убеждаемся в том, что единственный внешний предшественник для найденного множества статей описывается статьей 1.2-1. Как уже отмечалось, данная статья является вводной и не содержит никакой сколько-нибудь значимой информации. Следовательно, для освоения всего того, что указано в выборке структурного указателя, не требуются никакие специальные знания, в том числе знания о комплексных числах. Заметим, что в данном случае построение расширенного пополнения по двум статьям 1.2-2 и 9.5-21 осуществилось совсем просто. Оно просто совпало с обычным пополнением. Итак, требуемый цикл можно построить в произвольных полях. Остается лишь понять, где и в какой форме в действительности используются дополнительные предположения о существовании либо полного набора корней у алгебраического многочлена, либо полного набора собственных значений у матрицы. Построенный цикл состоит из 277-ми статей. На него также любопытно взглянуть целиком. Нажимаем кнопку Граф. Граф по статьям оказывается достаточно сложным и не размещается на одном экране. Его можно перемещать по экрану, активизируя жирные, двойные стрелки. Всего он имеет те же 277 вершин, его параллельная форма содержит 58 уровней, максимальное число вершин на одном уровне равно 28 и находится оно на 22-м уровне. Естественно, что интересующая нас статья 9.5-21 находится на 58-м уровне. Граф по параграфам тоже сложный и тоже не размещается на экране. Он имеет 91 вершину, 34 уровня, максимальное число вершин на одном уровне равно 11 и находится оно на 11-м и 12-м уровнях. Граф по главам уже более простой. В нем всего 32 вершины, 19 уровней, максимальное число вершин на одном уровне равно 6 и находится оно на 9-м уровне. Решение поставленной задачи можно искать, детально изучая граф по главам. Однако существует более простой путь. Для каждой статьи в выборке структурного указателя приведен не только ее номер, но и названия раздела, главы и параграфа, в которые данная статья входит. Наличие подобной рубрикации существенно упрощает анализ. Имея самое общее представление о процессе приведения матрицы к жордановой форме, легко понять, что предположения о полном наборе у матрицы собственных значений не могут делаться позже параграфа 9.2.5 "Подобие блочно-диагональной матрице" и раньше параграфов 7.2.1 "Корни многочленов" и 7.2.2 "Различные представления многочленов". Из этих трех параграфов в курсе задействовано всего 8 статей и их содержание можно просмотреть непосредственно. Чтобы увидеть любую статью из выборки на экране, необходимо всего лишь активизировать курсор на номере статьи. В статьях 7.2-1, 7.2-2, 7.2-3 из параграфа 7.2.1 и статьях 9.2-26, 9.2-27 из параграфа 9.2.5 никакие интересующие нас предположения не делаются. В остальных статьях что-то похожее на какие-то предположения есть. Более внимательный их анализ может вызвать некоторые вопросы. Например, в статье 7.2-6 говорится о кратности корней многочлена, а в статье 9.2-22 о кратности собственных значений. Из текстов этих двух статей не ясно, как такие понятия связаны друг с другом. Для получения ответа на данный и другие вопросы построим граф причинно- следственных отношений, связывающий крайние статьи 7.2-5 из параграфа 7.2.2 и 17 Зак 740
514 Часть II. Линеал — новые возможности изучения линейной алгебры 9.2-28 из параграфа 9.2.5. Для этого сначала очистим выборку структурного указателя, нажатием кнопки Очистить. Далее, активизируя курсор на кнопке "+" раздела 7, а затем последовательно на кнопках "+" главы 7.2 и параграфа 7.2.6, раскрываем локальное содержание раздела 7 до уровня статей. Активизируя курсор в квадратике справа от статьи 7.2-5 "Разложение многочлена на линейные множители", помечаем эту статью галочкой. Доступ к статье 9.2-28 "Подобие блочно-диагональной матрице" открываем аналогично. Помечаем также и ее. Теперь в выборке структурного указателя находятся номера обеих статей и можно нажать кнопку Пополнение. В выборке справа появляется список из 6 статей. Они символизируют вершины искомого графа. Сам граф получаем нажатием кнопки Граф. Он оказывается линейным. Нажимая кнопку Печать, показываем содержание всех 6 статей для просмотра. Отсюда видно, что статьи 7.2-6, 7.2-19 и 8.2-32 связывают понятия кратности корня алгебраического многочлена и кратности собственного значения матрицы. Теперь становится ясно, что те предположения, которые позволили создать цикл лекций о приведении матрицы к жордановой форме, были сделаны в статье 7.2-5 "Разложение многочлена на линейные множители". Одно-единственное предположение, — и все доказательства цикла можно проводить в произвольных полях. 16.4. Определение ключевых точек цикла лекций Опытный преподаватель или специалист вроде бы всегда должен хорошо знать эти точки. Однако их выбор в определенной мере субъективен и зависит от того, что считать важным в цикле лекций. В общем случае, ключевые точки не всегда легко установить не только при изучении самого цикла, но даже при его создании. При этом не так важно, создается ли цикл заново для чтения лекций, или он восстанавливается при подготовке к сдаче экзаменов, или просто исследуется предыстория возникновения того или иного факта. В поиске ключевых точек система ЛИНЕАЛ может оказаться полезной. Предположим, что цикл лекций связан с теоремой Фредгольма. Будем его строить. По предметному указателю находим, что эта теорема формулируется в статье 6.4-12. Далее необходимо указать точку, с которой должен начинаться цикл. Допустим, что она связана с определением понятия матрицы. Такое понятие вводится в статье 3.2-1. Теперь помечаем обе статьи в структурном указателе и нажимаем кнопку Пополнение. В выборке появляется совокупность из 26-ти статей. Это все те и только те статьи, через которые обязательно нужно пройти, двигаясь от понятия матрицы к теореме Фредгольма. Нажимая кнопку Печать, можно увидеть их содержание. Сразу видно, что совокупность статей не полна, т. к. в ней отсутствует, например, заведомо ключевая статья, определяющая системы линейных алгебраических уравнений. Поэтому необходимо строить полный цикл. Делается это с помощью расширенного пополнения точно так же, как создавался в уже исследованном выше примере цикл приведе-
16. Примеры использования системы ЛИНЕАЛ 515 ния системы уравнений к каноническому виду. В результате соответствующих действий в выборке структурного указателя формируется совокупность из 55 статей. Построим граф статей созданного полного цикла. В нем довольно много вершин и в его структуре не видно ничего примечательного. На первом уровне находятся 4 статьи, определяющие начальные знания. Статья 3.2-1 "Матрица" задавалась как ключевая изначально. Статья 6.1-1 "Система линейных алгебраических уравнений" обязана быть ключевой. Но относительно статей 5.1-3, 5.3-10 из раздела 5 "Расстояния, углы, объемы" ничего определенного пока сказать нельзя. Во втором селекторе графа цикла откроем строку двигать вершины. Переместим все вершины раздела 3 вверх, а все вершины раздела 5 вниз. Все вершины раздела 6, входящие в первые уровни, оставим в центре, остальные расположим в верхней половине экрана. Подведение курсора к любой вершине высвечивает ее связи с другими вершинами. Поэтому сразу становится ясно, что все пути, охватывающие вершины раздела 5 заканчиваются только в 3 вершинах, соответствующих статьям 5.2-25 "Скалярное произведение и сопряженные матрицы", 5.3-23 "Разложение пространств со скалярным произведением" и 6.4-9 "Различные соотношения". Первая и последняя статьи основательно связаны с понятием "Сопряженная матрица", которая определяется в статье 3.3-5. Из графа также видно, что в определенном смысле связующими являются вершины со статьями 6.1-10 "Матрично-векторная запись системы", 6.3-2 "Критерий совместности" и 6.4-2 "Ядро, дефект и образ матрицы". Естественно, что все обсужденные статьи можно отнести к ключевым. Но возникает вопрос: "А не упущены ли какие-нибудь другие важные статьи?". Для поиска ответа на него нажмем на кнопку Печать и посмотрим на содержание всех статей более внимательно. Наверное, полезно отнести к ключевым статью 6.4-5 "Важный частный случай", утверждающую, что образ матрицы есть линейная оболочка ее вектор-столбцов. Итак, в качестве ключевых выбраны 11 статей. Построим для них граф причинно- следственных отношений. Так как граф имеет мало вершин, можно рассмотреть его более внимательно, сняв галочку с режима по уровням. Нажимаем кнопку заморозить и раздвигаем вершины. Сразу видны некоторые особенности групповой иерархии. Все статьи-вершины распадаются на четыре группы. В первую входит одна целевая статья 6.4-12 уровня сложности 4. Вторую образуют три статьи 6.4-2, 6.4-5, 6.4-9 уровня сложности 4, подготавливающие базовую информацию для статьи 6.4-12. Третья формируется из шести статей 3.2-1, 3.3-5, 5.2-25, 6.1-1, 6.1-10, 6.3-2 уровня сложности 3. Она поставляет первичную информацию для статей первой и второй групп. И, наконец, в четвертую группу входит одна статья 5.3-23 уровня сложности 4, подготавливающая дополнительную информацию для статьи 6.4-9. Как уже отмечалось, выбор ключевых точек в определенной мере субъективен. Можно считать ключевыми найденные 11 статей. Какие-то статьи можно добавить к ним, какие-то можно убрать. Все определяется тем, что считать ключевыми знаниями. Многое зависит от того, какое положение занимает анализируемый цикл по отношению к другим знаниям. Однако каким бы не был цикл статей и какой бы смысл не вкладывать в понятие ключевых точек, применение рассмотренных процедур системы ЛИНЕАЛ окажется полезным в их поиске.
516 Часть II. Линеал — новые возможности изучения линейной алгебры 16.5. Оператор и псевдообратная матрица В предисловии было отмечено, что понятие псевдообратной матрицы является единственным, которое было введено в настоящей книге на основе понятия оператора. Проанализируем с помощью системы ЛИНЕАЛ, как это делается и как вообще понятие оператора используется в книге. Сначала находим в предметном указателе, что оператор упоминается в статье 3.7-1. Активизируя курсор на ее номере, вызываем эту статью и убеждаемся в том, что в ней действительно дается определение оператора. Активизируя курсор на левой стрелке в верхней строке экрана, вызываем предшественников данной статьи. Видим, что для введения оператора не требуются никакие начальные знания, кроме общего представления о том, что такое множество. Статья 3.7-1 имеет соответствующее ее содержанию название "Оператор: обозначения и терминология". Далее находим в предметном указателе статью, в которой определяется псевдообратная матрица. Это статья 6.5-17 "Псевдообратная матрица". Пометим в структурном указателе обе статьи и активизируем кнопку Пополнение. В выборке структурного указателя появляются номера 9-ти статей. Номера новых статей окрашены красным цветом. Эти и только эти статьи обладают следующим свойством: все они прямо или косвенно зависят от статьи 3.7-1 и от какой-то из них прямо или косвенно зависит статья 6.5-17. Все 9 статей заведомо должны входить в цикл умозаключений, позволяющих ввести псевдообратную матрицу на основе понятия оператора. Но, возможно, не только они. Могут существовать другие важные статьи, на которые опираются какие-то из этих 9-ти статей и которые тоже целесообразно включить в цикл. Нажимаем кнопку Предшественники. На экране появляется список из 21-й статьи. Эти и только эти статьи таковы, что среди всех статей, от которых непосредственно зависят статьи из выборки, лишь они не входят в выборку. Убираем галочки у всех предшественников, имеющих номера лексикографически меньше, чем 3.7-1, т. к. понятие оператора от них заведомо не зависит. Остальных предшественников присоединяем к выборке нажатием кнопки Добавить к выборке. Процедуру снятия галочек можно ускорить, если предварительно нажать на кнопку Оставить конечные. При этом следует не забыть проверить наличие галочек у всех статей, имеющих номера лексикографически больше, чем 3.7-1. Повторяем эту процедуру еще 10 раз. После этого все предшественники будут впервые иметь номера лексикографически меньше, чем 3.7-1. Тем самым заканчивается формирование цикла умозаключений от оператора до псевдообратной матрицы. Он содержит 83 статьи. Построение расширенного пополнения оказалось в данном случае достаточно длительным. Теперь будем анализировать созданный цикл. Построим граф его причинно- следственных отношений по статьям, нажимая кнопку Граф. Он достаточно сложен. Построим укрупненный граф, группируя вместе статьи, входящие в одну и ту же главу. Для этого в нижнем левом селекторе выбираем строку Главы. Теперь граф становится более простым и содержит только 13 вершин. Чтобы посмотреть содержание отдельных вершин, включаем второй нижний селектор в режим тексты. Все вершины анализируются одинаково. Для примера рассмотрим вершину 3.7, которая заведо-
16. Примеры использования системы ЛИНЕАЛ 517 мо имеет прямое отношение к операторам. Активизируя на ней курсор, посылаем в верхний правый список номера всех статей, входящих в эту главу и относящихся к построенному циклу. Нажимая кнопку показать, можно увидеть группами по 5 штук содержание самих статей. С помощью кнопки очистить список ликвидируется. Полный анализ всех вершин показывает следующее. Все вершины, кроме вершин 3.7 и 6.5, не имеют никакого отношения ни к оператору, ни к псевдообратной матрице. Это вытекает из того, что определение оператора дается в главе 3.7, определение псевдообратной матрицы дается в главе 6.5, а дуга из вершины 3.7 идет только в вершину 6.5. Во-вторых, в главе 3.7 с понятием оператора связаны статьи 3.7-1. 3.7-2. 3.7-5. 3.7-16. 3.7-17, 3.7-18, а в главе 6.5 с понятием псевдообратной матрицы — лишь статьи 6.5-15, 6.5-16, 6.5-17. Построив граф причинно-следственных отношений для этих 9-ти статей, видим, что они образуют вершины односвязного графа, на первом ярусе параллельной формы находится только одна статья 3.7-1, на последнем ярусе — только одна статья 6.5-17. Следовательно, все остальные 7 статей участвуют по существу в процессе создания определения псевдообратной матрицы на основе определения оператора. А какова же тогда роль остальных 74-х статей, входящих в общий цикл умозаключений? Они помогают выполнять промежуточные шаги при переходе от статьи 3.7-1 к статье 6.5-17. То обстоятельство, что для прямого перехода от 3.7-1 к 6.5-17 требуется выполнить всего 8 шагов, не должно вызывать удивление. Это означает только то, что понятие псевдообратной матрицы на самом деле намного сложнее общего понятия оператора. Из-за такой сложности и приходится делать большое число промежуточных шагов. Указанные 8 шагов лишь фиксируют 8 промежуточных этапов. Безусловно, все 74 промежуточные статьи являются промежуточными лишь для обоснования перехода от оператора к псевдообратной матрице. В реальности они многократно используются для решения и других самых разных задач. В книге можно найти иные определения псевдообратной матрицы. Развертывая в структурном указателе главу 6.6 "Свойства псевдообратной матрицы" до уровня параграфов и далее параграф 6.6.3 "Матричное определение Л+и до уровня статей, находим статью 6.6-18 "Матричные соотношения для А+". В ней приведены чисто матричные соотношения, которым удовлетворяет псевдообратная матрица, и только она. Теперь пометим в структурном указателе статьи 6.5-17, 6.6-18 и построим по уже неоднократно примененной методике цикл умозаключений перехода от одной статьи к другой. В данном случае он состоит из 11-ти статей. Никаких ссылок на использование понятия оператора нет, кроме тех, которые были использованы при определении псевдообратной матрицы. Раскрывая до уровня статей параграф 6.6.4 "Скелетное разложение и матрица А*"9 находим статью 6.6-29 "Уравнения Пенроуза", где также дается матричное определение псевдообратной матрицы. Строим цикл умозаключений перехода от статьи 6.5-17 к статье 6.6-29. На этот раз он содержит 15 статей. И снова нет никаких ссылок на использование понятия оператора, кроме тех, которые были использованы при определении псевдообратной матрицы. Конечно, переход от операторного определения псевдообратной матрицы к матричному не очень длинный. Поэтому в любом курсе можно ограничиться рассмотрением лишь матричного определения, например, через уравнения Пенроуза. Но попробуйте доходчиво объяснить смысл этих уравнений!
518 Часть II. Линеал — новые возможности изучения линейной алгебры Для получения ответа на вопрос, где и как понятие оператора вообще используется в книге, поступим следующим образом. С помощью процедуры поиска статей по ключевым словам, а точнее, ключевым буквосочетаниям, найдем все статьи, в которых где-либо встречается слово "оператор". Для этого набираем "оператор" в любом из трех полей, предназначенных для задания исходных буквосочетаний, ставим недостающую галочку около слова дополнениях и нажимаем кнопку ОК. Появляется список из 41-й статьи. Анализируя их содержание, заключаем, что только 7 из этих статей используются для обоснования определения псевдообратной матрицы и вывода каких-то ее свойств. Во всех остальных статьях либо устанавливаются различные свойства самих операторов, либо исследуются те или иные связи между матрицами и операторами. Другими словами, 34 статьи из 41-й формируют некоторый переходной мостик между линейной алгеброй и общей теорией операторов, о чем уже говорилось в предисловии к книге. В том, что эти 41 статья действительно слабо связаны со всеми остальными статьями, можно убедиться непосредственно. Содержание любой из статей можно увидеть, активизируя курсор на ее номере. Далее, активизируя курсор на правой стрелке в верхней строке описания, можно увидеть список всех статей-следствий. Или, другими словами, список всех статей, для которых данная статья является предшественником. У каждой статьи-следствия, в свою очередь, можно увидеть ее статьи-следствия и т. д. Тем самым всегда удается проследить, куда и насколько глубоко распространяется влияние любой статьи. Проводя подобный анализ для каждой из 41-й статьи, легко установить, что глубокое внешнее влияние имеют только 8 статей. Все остальные статьи либо не имеют никакого внешнего влияния, либо их влияние ограничивается одной или двумя статьями. Конечно, под внешними понимаются все статьи, не входящие в рассматриваемое множество из 41-й статьи. 16.6. Знакомство с первыми двумя разделами Глядя на структурный указатель, может сразу возникнуть вопрос: "Разве есть что- нибудь интересное в первых разделах? Ведь там, скорее всего, излагаются самые элементарные сведения". Действительно, в этих разделах описаны лишь начальные шаги в линейной алгебре. Но, с другой стороны, в них имеется 235 статей, что не так мало. Поэтому посмотрим на эти мелочи более пристально. Тем более что при изучении линейной алгебры им не всегда уделяется должное внимание. Начнем с главы 1.1, которая не имеет прямого отношения к линейной алгебре и посвящена изучению комплексных чисел. В ней имеется 44 статьи. Построим граф причинно-следственных отношений. В его параллельной форме 13 уровней, причем на 9-ти уровнях 3 и более статей. Следовательно, в данном материале потенциально заложен широкий выбор порядка изложения отдельных фактов и определений. На 13-м уровне находится единственная статья 1.1-39. Она описывает представление всех корней и-й степени из ненулевого комплексного числа. Эта статья используется в линейной алгебре при доказательстве алгебраической замкнутости поля комплексных
16. Примеры использования системы ЛИНЕАЛ 519 чисел. Конечно, для вывода соответствующих формул не нужны все остальные 43 статьи. Чтобы определить их реальное число, построим цикл умозаключений перехода от исходной статьи 1.1-1 к статье 1.1-39, проделав для этого уже описанную ранее процедуру. Пометим в структурном указателе указанные статьи и нажмем кнопку Пополнение. В выборке появляется список из 23-х статей. Нажатие кнопки Предшественники показывает, что никаких предшественников у статей из выборки нет. Поэтому цикл умозаключений построен. Таким образом, чтобы, исходя из знания вещественных чисел, получить формулы, описывающие все множество корней n-й степени из ненулевого комплексного числа, необходимо проделать 22 маленьких шага. Но всегда ли при изучении комплексных чисел это делается достаточно тщательно? В главе 1.1 можно выделить несколько наиболее важных статей: статья 1.1-1, описывающая алгебраические свойства вещественных чисел, статья 1.1-5, определяющая геометрическую форму комплексного числа, статьи 1.1-21 и 1.1-23, задающие алгебраическое представление комплексного числа, статья 1.1-31, вводящая его тригонометрическую форму, и самая сложная статья 1.1-39, о которой уже говорилось. Кроме этого, обратим внимание на статьи 1.1-42, 1.1-43 и 1.1-44. Они определяют поля вещественных и комплексных чисел, а также устанавливают между ними связь. Пометим эти статьи в структурном указателе и нажмем кнопку Пополнение. В выборке появляется список из 32-х статей. Тем самым построен цикл умозаключений, связывающий все отмеченные статьи. Заметим, что многие статьи из главы 1.1 имеют внешние по отношению к этой главе связи. Например, очень много таких связей имеет статья 1.1-43, определяющая поле комплексных чисел и находящаяся на 10-м уровне. Если некоторый факт соответствует вершине графа с каким-то номером уровня, то это означает, что добраться до него, начиная с вещественных чисел, можно лишь через такое же число макрошагов. Но в том случае, когда доказательство факта проходит в поле комплексных чисел, из общего числа макрошагов 10 макрошагов приходится только на обоснование определения данного поля. Отметим теперь в структурном указателе разделы 1, 2, кроме статей главы 1.1, статей 1.2-8, 1.6-16, 1.7-8, относящимся к комплексным числам, и вводной статьи 1.2-1. Построим граф. Он содержит 187 вершин и его параллельная форма имеет 37 уровней. На последнем уровне находятся статьи 2.2-16 "Арифметическое пространство как линейная оболочка" и 2.2-25 "Достройка независимой системы до базиса". Следовательно, несмотря на кажущуюся простоту, эти статьи на самом деле оказываются достаточно сложными. Возможно, для анализа причин возникновения сложности больше подходит статья 2.2-23 "Размерность линейного пространства", в которой всего лишь определяется данное понятие, но которая, тем не менее, находится на 35-м уровне. Построим цикл умозаключений перехода от определения понятия множества 1.2-2 до определения понятия размерности линейного пространства 2.2-23. Он содержит 61 статью. Соответствующий ему граф, естественно, имеет 35 уровней. На первый взгляд кажется, что для введения столь простого понятия используется очень много статей.
520 Часть II. Линеал — новые возможности изучения линейной алгебры Строение этого цикла наглядно показывает имеющаяся рубрикация статей в выборке структурного указателя. Из нее видно, что в цикле имеются следующие опорные статьи: 1.2-2 "Множество и элементы", 1.4-1 "Алгебраическая операция", 1.7-1 "Векторы" и 2.1-2 "Разложение по векторам". Поэтому процесс перехода от понятия множества, описанного в статье 1.2-2, к понятию размерности линейного пространства, описанного в статье 2.2-23, естественным образом распадается на 4 последовательных этапа. Первый состоит из 13-ти статей от 1.2-2 до 1.3-11 и посвящен обоснованию понятий эквивалентности, равенства и тождества. Второй этап содержит 14 статей от 1.4-1 до 1.6-18. В нем обсуждается целесообразность введения общих числовых полей. На третьем этапе в 15-ти статьях от 1.7-1 до 1.7-28 вводится понятие общего линейного конечномерного пространства, а также арифметического пространства и базиса в нем. И, наконец, на четвертом этапе в 19-ти статьях от 2.1-2 до 2.2-23 обсуждаются такие важные понятия, как линейная оболочка векторов, линейная зависимость и независимость, базис общего конечномерного линейного пространства, которые, в свою очередь, и приводят к понятию размерности пространства. Теперь можно спросить: "Неужели что-то из перечисленного не нужно знать?". Таким образом, вроде бы простые первые разделы на самом деле устроены не так уж просто. Если, конечно, уделять должное внимание мелочам. Заметим, что именно из- за этих мелочей многие статьи находятся в своих фафах на достаточно далеких ярусах. Как уже отмечалось ранее, переход от статьи 1.2-2 "Множество и элементы" к статье 9.5-21 "Каноническая форма Жордана" требует освоения 277-ми статей, а сама статья 9.5-21 находится на 58-м уровне графа. Но если из этого процесса убрать все статьи из разделов 1, 2, 3, в которых излагаются достаточно простые сведения, то теперь надо будет осваивать только 142 статьи, статья же 9.5-21 будет находиться на 27-м уровне. Убрав дополнительно статьи из разделов 4, 5, число статей уменьшается до 95-ти, а номер уровня статьи 9.5-21 только до 25-ти. И, наконец, исключив статьи из раздела 6, уменьшаем общее число статей до 70-ти. Однако при этом статья 9.5-21 остается на том же 25-м уровне. 16.7. Вся предметная область и работа с графами Вызываем структурный указатель и, не развертывая его, помечаем галочками все 13 разделов. В выборке появляются номера всех статей A531), имеющихся в энциклопедии. Это же число указано в конце выборки. Нажимая кнопку Граф, строим граф причинно-следственных отношений между выбранными статьями предметной области. Всего в данном графе между статьями имеется 8525 отношений. Они установлены при создании системы ЛИНЕАЛ и не могут быть изменены пользователем. По этим отношениям автоматически устанавливаются аналогичные отношения между параграфами и главами. Именно, два параграфа (две главы) находятся между собой в каком-то причинно-следственном отношении тогда и только тогда, когда в таком же отношении находятся хотя бы две статьи из разных параграфов (глав). Разнонаправленные отношения между двумя параграфами или главами не могут существовать в
16. Примеры использования системы ЛИНЕАЛ 521 силу того, что все статьи в энциклопедии упорядочены по лексикографическому росту их номеров и каждая статья может быть следствием только статей с лексикографически меньшими номерами. По умолчанию любой граф располагается на экране в виде так называемой параллельной формы. Это означает следующее. Все вершины графа разбиваются на группы, называемые уровнями или ярусами. Вершины одного уровня не связаны между собой дугами и расположены на экране по вертикали сверху вниз в порядке лексикографического роста их номеров. На первом уровне находятся все те и только те вершины, в которые не входят никакие дуги из вершин рассматриваемого множества. На втором уровне размещены все те и только те вершины, в каждую из которых входит хотя бы одна дуга из какой-либо вершины первого уровня. В общем случае, к к-му уровню относятся все те и только те вершины, в каждую из которых могут входить любые дуги из вершин первых (к- 1) уровней, но обязательно входит хотя бы одна дуга из какой-либо вершины (к- 1)-го уровня. Если граф представлен в виде параллельной формы, то число вершин, лежащих на любом его критическом пути, всегда равно общему числу уровней. О том, что вершины графа располагаются на экране в виде параллельной формы, сигнализирует галочка в квадратике слева от надписи по уровням. Как следует из сказанного выше, при построении графа эта галочка ставится по умолчанию. На экране можно видеть как вершины графа, так и дуги. Каждая вершина показана в форме прямоугольника, внутри которого стоит номер соответствующей статьи. Внутренность прямоугольника окрашена в цвет, демонстрирующий уровень ее сложности. Дуги показаны стрелками: между соседними уровнями — черными, между уровнями через один— яркими серыми, между всеми остальными уровнями— слабыми серыми. Сам по себе полный граф, как и многие другие графы, очень плотный, за исключением нескольких первых и последних уровней. Так что увидеть, где находится вершина с тем или иным номером, не всегда просто. К тому же, довольно часто графы бывают очень большими и не помещаются на одном экране. В системе ЛИНЕАЛ реализованы различные процедуры для изучения местоположения отдельных статей в графе, их связей и содержания. Любой граф может быть представлен в трех масштабах: 1:1, 1:2 и 1:4. При построении графа масштаб выбирается автоматически из тех соображений, чтобы на экране поместилось максимально возможное число уровней, но не превосходящее 32. В частности, при построении полного графа статей автоматически выбран масштаб 1:4. Можно принудительно изменить масштаб представления графа, воспользовавшись списком выбора масштаба, находящимся на экране вверху слева. При изменении масштаба изменяется как размер вершин, так и число видимых уровней графа. С помощью активизации расположенных там же сдвоенных расходящихся или сходящихся стрелок можно, не изменяя размера вершин, увеличить или уменьшить число видимых уровней. По всей верхней части экрана располагается шкала уровней, состоящая из двух, находящихся одна под другой, линеек чисел. В первой перечисляются подряд слева на-
522 Часть //. Линеал — новые возможности изучения линейной алгебры право номера уровней параллельной формы графа, начиная с 1-го. Для визуального отличия одного уровня от другого эти номера размещены на фоне полосок, окрашенных в разные цвета. Во второй линейке чисел под каждым номером уровня указывается, сколько вершин графа находится в данном уровне. Активизируя жирные двойные верхние стрелки, можно перемещать граф по экрану влево и вправо. При этом автоматически перемещается и шкала уровней. В том случае, когда на экране виден первый и/или последний уровень графа, соответствующие жирные двойные стрелки заменяются жирными точками. В левой стороне экрана по вертикали расположен список всех номеров вершин графа. Сами номера размещены сверху вниз в порядке лексикографического роста, в общем случае, начиная с наименьшего среди видимых в настоящий момент на экране. Если с отдельными вершинами графа не производятся никакие операции, то этот номер всегда совпадает с самым верхним номером в первом слева видимом уровне графа. Когда в графе не менее 32-х вершин, то указываются 32 номера. В противном случае указываются все номера. Укрупненные левые стрелки у границ списка предназначены для его просмотра целыми страницами, меньшего размера правые стрелки — для сдвига списка на одну позицию. Любой сдвиг графа с помощью жирных двойных стрелок автоматически приводит к соответствующему сдвигу списка. При наведении курсора на любой номер в списке соответствующая вершина становится видимой в графе, ее граница окрашивается красным цветом и увеличивается. Кроме этого, рядом с вершиной появляются два числа со стрелками. Верхнее число означает количество дуг, входящих в данную вершину из вершин графа, нижнее — количество дуг, выходящих из вершины того же графа. Заметим, что речь идет о дугах в конкретном построенном графе. В разных графах эти числа могут быть разными в зависимости от того, сколько предшественников и следствий рассматриваемой вершины входит во множество вершин построенного графа. Если активизировать курсор на этом же номере, то номер внутри вершины графа, также как и ее граница, становятся красными. Теперь вершина помечена и более заметна, поэтому увидеть ее местоположение и следить за ее перемещением становится значительно легче. Пометка сохраняется при смещении курсора. Повторная активизация курсора на том же номере снимает пометку вершины и ее подкрашивание. Все эти же функции можно реализовать, подводя курсор к номеру вершины в самом графе. Конечно, когда нужный номер можно разглядеть. В момент подвода курсора к вершине дополнительно высвечиваются красные стрелки. Они показывают дуги, связывающие данную вершину с теми своими вершинами-предшественниками и вершинами-следствиями, которые видны на экране. Если число входящих или выходящих красных стрелок не совпадает с соответствующим числом, указанным около вершины, то это означает, что какое-то число вершин графа, связанных с рассматриваемой вершиной, находится вне экрана. После смещения курсора красные стрелки у вершины исчезают. Все помеченные вершины в порядке их выбора фиксируются в специальном списке, расположенном в верхнем правом углу экрана. Любая пометка вершины возможна только тогда, когда этот список закрыт. Нажатие кнопки Сброс в верхней строке экрана отменяет пометки всех вершин и очищает специальный список. Если какие-то
16. Примеры использования системы ЛИНЕАЛ 523 видимые на экране вершины или помечаются через список в левой стороне экрана, или же подобные действия осуществляются через вершины в графе, то каждая операция приводит к сдвигу списка. При этом каждый раз первым в списке оказывается номер той вершины, которая отмечалась последней. Заметим, что все сказанное относительно работы с вершинами графов не зависит от того, что на самом деле за ними скрывается: статьи, параграфы или главы. Для того чтобы пометить вершины во втором нижнем селекторе, нужно открыть строку выбор вершин, в верхнем селекторе — строку все вершины. При построении графа эти строки открываются автоматически. В построенном полном графе по статьям 64-го уровня. На первом уровне находятся только две статьи 1.1-1 "Операции над вещественными числами" и 1.2-1 "Комментарий (характеристические свойства)". Как уже отмечалось, вторая статья является вводной и не содержит сколько-нибудь значимой информации. Поэтому для освоения материала книги нужно иметь, главным образом, только общее представление о вещественных числах. На последнем уровне графа находятся статьи 11.4-4 "Единственность полярного разложения", 11.4-7 "Унитарный множитель и матрицы А, А*" и 11.4-8 "Критерий нормальности". Все они связаны с полярным разложением матрицы. Это самые сложные статьи среди всех статей, описанных в настоящей книге. Развертываем левый нижний селектор и выбираем строку параграфы. Статьи полного графа группируются по параграфам и на экран выдается новый граф — граф по параграфам. Всего в нем 253 вершины-параграфа и имеет он 76 уровней. Обратим внимание на то, что при переходе от графа по статьям к графу по параграфам число уровней увеличилось. Такое явление иногда происходит и с другими, как правило, достаточно большими графами. Это зависит от того, какие статьи объединены в параграфы и какие из них присутствуют в графе по статьям. Рассмотрим простой пример. В полном графе по статьям на уровне 31 находятся статьи 10.2-6 и 10.2-11, а на уровне 32 статьи 10.2-12 и 10.3-7. Эти уровни соседние. Легко проверить, что статья 10.2-6 принадлежит параграфу 10.2.1 и является предшественником статьи 10.2-12, статья 10.2-11 также является предшественником статьи 10.2-12 и обе они принадлежат параграфу 10.2.3. Наконец, статья 10.2-11 является предшественником статьи 10.3-7, которая принадлежит уже другому параграфу 10.3.1. Если для данных четырех статей построить граф, то он, конечно, будет иметь только два уровня. Построенный для них граф по параграфам имеет три уровня. Не трудно понять, почему это произошло: связанные причинно-следственным отношением статьи 10.2-11 и 10.2-12 находятся в разных уровнях, но принадлежат одному параграфу. Кстати, в полном графе по параграфам три вершины, соответствующие упомянутым параграфам 10.2.1, 10.2.3 и 10.3.1, находятся на не подряд расположенных, а на более разнесенных уровнях 36, 53, 54. Отметим также, что от того, как приписываются номера статьям, не связанным непосредственно друг с другом, относительное расположение в графе соответствующих вершин может быть самым различным. Например, статьи 12.7-19 и 12.7-20 входят в один и тот же параграф 12.7.3. Лексикографический номер у статьи 12.7-19 меньше, чем у статьи 12.7-20. Тем не менее в полном графе статья 12.7-20 находится на уровне 34, а статья 12.7-19 — на уровне 42.
524 Часть II. Линеал — новые возможности изучения линейной алгебры На последнем уровне построенного полного графа по параграфам находится только одна вершина-параграф 12.8.5 "Трехчленные процессы ортогонализации". Чтобы посмотреть ее содержание, развернем второй нижний селектор и откроем строку тексты. Активизируя далее вершину 12.8.5, переносим номера статей из параграфа 12.8.5 в появившийся в верхнем правом углу новый специальный список. Нажимая кнопку показать, видим, что находящиеся в данном параграфе статьи 12.8-26— 12.8.32 действительно описывают различные аспекты трехчленных соотношений. Интересно отметить, что в первом графе эти статьи размещаются на 42—44 ярусах, т. е. являются далеко не самыми сложными. Теперь сгруппируем парафафы и построим аналогичным способом граф по главам. Он содержит 60 вершин, размещенных на 38 уровнях. На последнем уровне расположена одна вершина-глава 12.8 "Ортогонализация" со статьями 12.8-1—12.8-32. В полном графе эти статьи находятся на уровнях 31—53. Поэтому они тоже не являются самыми сложными. В полном графе по статьям в качестве его подграфов находятся любые графы по статьям, которые можно создать с помощью системы ЛИНЕАЛ, в том числе графы всех изученных ранее примеров. Рассмотрим, например, граф цикла лекций, посвященных приведению матрицы к жордановой форме. Он начинается с вершины 1.2-2, заканчивается вершиной 9.5-21 и имеет 58 уровней. Сначала в списке номеров вершин полного графа, активизируя левую нижнюю стрелку, находим номер 1.2-2. Подводя к нему курсор, выделяем в полном графе вершину с этим номером. Видим, что она находится на уровне 2. Далее находим в списке номер 9.5-21. Подведение к нему курсора не выделяет в графе ни одну вершину. Следовательно, вершины с таким номером нет в видимой части графа. Тогда активизируем курсор на номере 9.5-21. Граф сдвигается влево до уровня 59, на котором и находится нужная вершина. Разность между номерами последнего и первого уровней в исходном графе и в этом же графе, но рассматриваемом как подграф полного фафа, оказалась одной и той же. Поэтому взаимное расположение соответствующих вершин в обоих графах также будет одним и тем же. Однако их относительное расположение может быть и различным. В частности, для любой пары вершин из исходного графа абсолютная величина разницы между номерами их уровней может оказаться в подграфах значительно больше. Другими словами, подграфы могут стать более растянутыми по горизонтали и это растяжение может оказаться не одинаковым в окрестности разных вершин. Рассмотрим граф цикла лекций, посвященных приведению системы линейных алгебраических уравнений к каноническому виду. Он начинается с вершины 3.2-1; заканчивается вершиной 6.2-12 и имеет 15 уровней. Но в полном фафе вершина 3.2-1 находится на уровне 20, а вершина 6.2-12— на уровне 40. Разница номеров уровней равна 20, а не 14, как могло бы быть. Исследуем более внимательно причины локального расширения. В графе цикла лекций, посвященных приведению системы уравнений к каноническому виду, вершины 3.6-6 и 3.4-25 находятся на уровне 11. Вершина 3.6-7 связана дугами с обеими вер-
16. Примеры использования системы ЛИНЕАЛ 525 шинами и находится на уровне 12. Легко проверить, что вершины 3.2-1 и 3.6-6 не связаны ни с одной вершиной из раздела 2. Для этого можно вызвать на экран содержание двух соответствующих статей и активизировать у каждой из них левую вверху кнопку показа предшественников. А можно пометить обе эти статьи в структурном указателе и нажать кнопку Предшественники. Во всех случаях будет видно, что у рассматриваемых вершин в качестве предшественников нет ни одной вершины из раздела 2. Такие же процедуры с вершиной 3.4-25 показывают, что у нее есть зависимость от вершины 2.2-7. Теперь построим объединенный граф цикла лекций по приведению системы к каноническому виду и всего раздела 2. Поскольку вершины 3.2-1 и 3.6-6 не зависят от вершин раздела 2, то понятно, почему вершина 3.2-1 в объединенном графе находится на уровне 1, а вершина 3.6-6 осталась на том же уровне 11. На уровне 1 также расположена вершина 2.1-2. Но она связана с вершиной 3.4-25 путем, на котором имеется 12 вершин из раздела 2. Поэтому в параллельной форме объединенного графа вершина 3.4-25 отодвигается на уровень 13. Соответственно этому вершина 3.6-7 оказывается на уровне 14. Разность местоположений вершин 3.6-7 и 3.6-6 стала 3-го уровня, а не 1-го, как было в исходном графе. Другие расширения исходного графа могут привести к другим относительным смещениям вершин. Например, в полном графе вершина 3.6-6 находится на уровне 30, а вершина 3.6-7 — на уровне 37. Второй нижний селектор в целом предназначен для включения различных режимов работы с вершинами. В нем имеется еще не описанная строка двигать вершины. Ее открытие предоставляет возможность передвинуть любую вершину графа вдоль уровня. Для того чтобы это сделать, необходимо навести курсор на вершину, нажать левую кнопку мыши и, не отпуская кнопку, передвинуть вершину вдоль уровня на требуемое место. В процессе перемещения курсора и удержания его на нужном месте сама вершина может либо непрерывно следовать за курсором, либо срываться и даже неоднократно на исходную позицию. Но если при этом не отпускать кнопку мыши, то цвет вершины начнет периодически становиться более бледным, независимо от ее положения. В любой момент, когда цвет вершины станет бледнее, кнопку нужно отпустить. Новое положение вершины будет зафиксировано. Перемещая вершины вдоль уровней, можно выявить структуру графа более полно. Рассмотрим следующий пример. Пометим галочкой раздел 1 и построим граф. В нем 178 вершин. На уровне 1 находятся вершины 1.1-1 и 1.2-1. Принимая во внимание структуру материала раздела 1, ясно, что почти все вершины не должны быть связаны путями либо с вершиной 1.1-1, либо с вершиной 1.2-1. Но как осуществить разделение вершин по этому признаку и как найти вершины, связанные с обеими начальными вершинами? Откроем во втором нижнем селекторе строку двигать вершины и передвинем вдоль первого уровня вершину 1.1-1 максимально вверх, а вершину 1.2-1 максимально вниз. Перебирать остальные вершины перед их перемещением целесообразнее всего по уровням слева направо. Красные стрелки, которые появляются около вершины в момент подведения курсора, чаще всего убедительно показывают, куда эта вершина тяготеет, вверх или вниз. Не имеет никакого значения, в каком порядке перемещать вершины. Можно ошибаться и даже неоднократно. Очень скоро
526 Часть II. Линеал — новые возможности изучения линейной алгебры произойдет нужное разделение и будет выяснено, что только три вершины 1.2-8, 1.6-16 и 1.7-8 связаны путями с обеими вершинами 1.1-1 и 1.2-1. Проверить данный вывод очень легко. Отметим в структурном указателе все главы с 1.2 до 1.7 и исключим пометки у вершин 1.2-8, 1.6-16 и 1.7-8. Нажимая кнопку Предшественники, убеждаемся, что все помеченные вершины не связаны ни с какими вершинами из главы 1.1. Верхний селектор предназначен, в первую очередь, для выбора множества показываемых вершин графа. Строка выбранные оставляет в графе только ранее помеченные вершины. Все другие вершины представлены в форме бледных маленьких кружочков с номерами, окрашенными в серый цвет. При открытии строки выбранные сохраняется возможность метить вершины и снимать с них пометки. Появляется и новая возможность. Именно, теперь можно увидеть связи помеченных вершин с их предшественниками и следствиями, причем не только непосредственными. Для указания того, что из них нужно показывать, служат стрелки в квадратиках и расположенный слева от них трехпозиционный указатель. Активизация левой стрелки означает показ выходящих дуг, правой — входящих, а сдвоенных средних стрелок — и того, и другого. Активизация какой-либо ступени указателя задает соответствующий уровень глубины показа связей. Если связи очень длинные, то какие-то концевые вершины этих связей могут быть расположены за пределами видимой части графа. В этом случае такие вершины показываются в форме маленьких окрашенных плавающих кружочков. Их тоже можно пометить. Через некоторое время положение вершин-кружочков стабилизируется. По-прежнему в верхнем правом списке формируется перечень всех помеченных вершин. Строка конечные в верхнем селекторе оставляет в графе только те вершины, из которых не выходит ни одна дуга в какие-либо вершины данного графа. Соответствующие этим вершинам статьи представляют в некотором смысле законченные результаты среди всего того множества статей, которое образует рассматриваемый граф. Тем не менее у некоторых из этих "законченных" статей могут быть следствия, выходящие за описанные графом пределы. Обнаружить подобные статьи очень легко: у них и только у них в верхней строке описания содержания присутствует показывающая направо стрелка. Среди основных операций над графами не рассмотренной осталась только одна — снятие галочки слева от надписи по уровням. Смысл этой операции состоит лишь в том, чтобы при исследовании графа освободиться от ограничений в размещении его вершин, накладываемых параллельной формой. После снятия галочки вершины графа начинают двигаться по экрану и через некоторое время их положение стабилизируется. Насколько оно устойчиво, легко проверить, нажимая кнопку Встряхнуть. Принудительная остановка движения вершин осуществляется постановкой галочки около надписи заморозить. В таком состоянии над графом можно выполнять все те же самые операции, которые были рассмотрены при размещении вершин по параллельной форме. Используя режим свободного расположения вершин, можно надеяться на выявление каких-то особенностей графа. Иногда их действительно удается обнаружить. Например, свободное размещение вершин раздела 1 "Множества, элементы, операции" ера-
16. Примеры использования системы ЛИНЕАЛ 527 зу показывает, что статьи главы 1.1 "Вещественные и комплексные числа" слабо связаны с остальной частью раздела. В разделе 3 "Матрицы и операторы" видна значительная отделенность главы 3.7 "Операторы". Во многих графах отчетливо видны центры скопления связей. Для раздела 12 "Билинейные формы" — это статьи 12.5-1 "Положительно определенная матрица" и 12.2-12 "Конгруэнтные матрицы" и т. д. В целом сфера применения режима свободного расположения вершин не очень велика, т. к. эффективно работать в нем можно лишь с относительно небольшими графами.
17. Предметный указатель Аксиомы метрики 13.1 - 2 — нормы векторов 13.2 - 2 — матриц 13.3 - 2 Алгебраическая кратность собственных значений 8.2 - 32 -операция 1.4 - 1 — ассоциативная 1.4 - 4 — дистрибутивная 1.4 - 9 — коммутативная 1.4 - 3 Алгебраическое поле 7.2 - 14 Алгебраическое дополнение 4.2 - 3 Алгебры основная теорема 7.2 - 32 Альтернатива Фред гол ьма 6.4 - 11 Арифметическое пространство 1.7 - 24 --, базис 2.2 - 18 База системы векторов 2.2 - 6 Базис арифметического пространства 2.2 - 18 - двойственный левый 12.7 - 18 --правый 12.7-18 - естественный 1.7 - 26 - корневой 9.5 - 7 --Жордана 9.5 - 19 -линейного пространства 2.2 - 21 -ортогональный 12.7 - 2 - ортонормированный 5.2 - 13 - псевдодвойственный левый 12.7 - 20 --правый 12.7 - 20 -псевдоортогональный 12.7 - 9 - сингулярный 11.3 - 7 Базисные столбцы 4.3 - 3 - строки 4.3 - 3 Базисов одноименных класс левый 8.1 - 8 правый 8.1 - 8 Базисы одноименные 8.1 - 7 Безу теорема 7.2 - 1 Билинейная форма 12.1 - 2 - кососимметричная 12.1 - 9 - нулевая 12.1 - 6 - полуторалинейная 12.1 - 16 - полярная 12.3 - 4 - симметричная 12.1 - 8
530 Часть II. Линеал — новые возможности изучения линейной алгебры Билинейная форма эрмитова 12.1-16 кососимметричная 12.1-24 симметричная 12.1-24 Билинейно метрическое пространство 12.6-22 вырожденное 12.6-50 , дефект 12.6-29 . невырожденное 12.6-50 , ранг 12.6-28 Билинейной формы матрица 12.2-2 в паре базисов 12.2-32 - ранг 12.2-9 - эрмитова матрица 12.2-2 в паре базисов 12.2-32 Бинарное отношение 1.3-2 —, рефлексивность 1.3-4 —, симметричность 1.3-4 —, транзитивность 1.3-4 Бине - Коши формула 4.2-13 Биортонормированные системы векторов 5.2-17 Блок матрицы 3.5-18 Блочная матрица 3.5-18 Блочно-диагональная матрица 3.5-25 - треугольная матрица 3.5-25 - элементарные матрицы 3.5-26 в Ведущий элемент 3.6-22 —, без выбора 3.6-25 —, выбор по всей матрице 3.6-23 —, — столбцу 3.6-24 —, — строке 3.6-24 Вектор 1.7-1 -, длина 5.4-1 - единичный 1.7-25 -изотропный 12.6-2 -, координата 1.7-19, 2.2-27 — корневой 9.5-4 —, высота 9.5-9 -, норма 13.2-2 -, - Гельдера 13.2-10 -, - евклидова 13.2-11 -, - энергетическая 13.2-6 — нормированный 5.2-1, 13.2-12 — нулевой 1.7-22 -, произведение на число 1.7-21 — противоположный 1.7-23 -, разложение 2.1-2 — размерности п 1.7-17 — столбец 1.7-17 — строка 1.7-17 — я-мерный 1.7-17 Векторов аксиомы нормы 13.2-2 — множества ортогональные 5.3-1 — система А - двойственная 12.7-24 — А - ортогональная 12.7-24 — А - псевдодвойственная 12.7-24 — А - псевдоортогональная 12.7-24 — двойственная 5.2-17 — линейно зависимая 2.1-8 независимая 2.1-9 — ортогональная 5.2-5 — ортонормированная 5.2-6 — псевдоортогональная 12.7-16 — псевдосопряженная 12.7-25 — сопряженная 12.7-25 Векторов системы база 2.2-6 — линейная оболочка 2.1-4 — объем 5.4-23 --ранг 2.2-7 — эквивалентные 2.2-2 Векторы коллинеарные 5.1-11 -ортогональные 5.2-4, 12.6-31 --слева 12.6-30
17. Предметный указатель 531 Векторы коллинеарные справа 12.6-30 -, расстояние 5.4-6 -, сумма 1.7-20 -, - множеств 5.3-10 -, угол 5.4-9 Вещественные числа 1.1-1 —, алгебраическая операция 1.1-1 —, —, дистрибутивность 1.1-2 —, —, коммутативность 1.1-2 —, —, перестановочность 1.1-2 —, —, распределительность 1.1-2 —, —, сочетательность 1.1-2 Вещественных чисел поле 1.1-42 Виета формулы 7.2-11 -, единица 1.5-4 -коммутативная 1.5-27 -конечная 1.5-30 --, порядок 1.5-30 -, нормальный делитель 1.5-21 -, обратный элемент 1.5-5 -, подгруппа 1.5-10 -, произведение смежных классов 1.5-24 -, разложение по подгруппе 1.5-17 -, смежный класс 1.5-12 -, сопряженные элементы 1.5-19 -, элемента кратное 1.5-34 -,-степень 1.5-34 Гамильтона - Кели теорема 9.4-22 Гаусса метод 3.6-1 —, ведущий элемент 3.6-22 --,--, без выбора 3.6-25 --,--, выбор по всей матрице 3.6-23 —, —, — столбцу 3.6-24 —, —, — строке 3.6-24 - первая трансформация 6.5-12 Гельдера неравенство 13.2-8 -норма 13.2-10 Геометрическая кратность собственных значений 8.2-33 Гивенса матрица 11.2-1 Гиперплоскость 6.7-5 -, нормальный вектор 6.7-7 -, проекция вектора 6.7-12 Грама матрица 6.8-5, 12.6-25 - определитель 6.8-5 - Шмидта ортогонализация 12.8-9 Группа 1.5-2 -абелева 1.5-27 Даламбера лемма 7.2-31 Двойственная система векторов 5.2-17 Декартов квадрат множества 1.2-14 —, - диагональ 1.2-15 Декартово произведение множеств 1.2-13 Делитель нормальный 1.5-21 -нуля 1.6-11 Дополнение ортогональное 5.3-4 --слева 12.6-34 --справа 12.6-34 Дополнительный минор 4.2-3 Естественный базис 1.7-26 Ж Жордана каноническая форма 9.5-21 - канонический ящик 9.5-20 Жорданова клетка 9.5-20
532 Часть //. Линеал — новые возможности изучения линейной алгебры Зависимая линейно система векторов 2.1-8 Закон инерции квадратичных форм 12.4-8 , матричная форма 12.4-9 И Изоморфизм пространств евклидов 5.2-20 - унитарный 5.2-20 Изоморфные линейные пространства 1.7-13 Инвариантное подпространство 9.1-1 - тривиальное 9.1-2 Инверсия 4.1-3 Индекс инерции квадратичной формы отрицательный 12.4-10 положительный 12.4-10 - нильпотентности 9.4-17 - произведения 3.1-8 - суммирования 3.1-2 Интерполяционный многочлен Лагранжа 7.2-9 К Каноническая форма Жордана 9.5-21 Канонический ящик Жордана 9.5-20 Каноническое разложение вещественного многочлена 7.2-40 — комплексного многочлена 7.2-6 Квадратичная форма 12.3-2 —, главные оси 12.4-3 —, закон инерции 12.4-8 —, —, матричная форма 12.4-9 —, канонические коэффициенты 12.4-2 —, канонический базис 12.4-2 --, -вид 12.4-2 —, матрица 12.3-10 —, отрицательный индекс инерции 12.4-10 —, положительный индекс инерции 12.4-10 --, ранг 12.4-10 —, сигнатура 12.4-10 - симметричная 12.3-12 —, сумма квадратов 12.4-2 - эрмитова 12.3-7 кососимметричная 12.3-15 , главные оси 12.4-5 , матрица 12.3-14 симметричная 12.3-15 , главные оси 12.4-5 Квадратный корень из матрицы 12.5-27 Кели - Гамильтона теорема 9.4-22 Кели формулы 10.3-8 Класс смежной группы 1.5-12 Классы эквивалентности 1.3-8 Клетка матрицы 3.5-18 - жорданова 9.5-20 Кольцо 1.6-1 -, делитель нуля 1.6-11 - коммутативное 1.6-2 - некоммутативное 1.6-2 Комплексные числа 1.1-5 —, алгебраическая операция 1.1-8 —, —, ассоциативность 1.1-9 —, —, дистрибутивность 1.1-9 —, —, коммутативность 1.1-9 —, аргумент 1.1-31 —, вещественная часть 1.1-6 —, вычитание 1.1-14 —, деление 1.1-16 —, корень п-й степени 1.1-35 —, первообразный 1.1-38
17. Предметный указатель 533 Комплексные числа, мнимая единица 1.1-21 —,-часть 1.1-6 —, модуль 1.1-25 —, обратная величина 1.1-18 —, равенство 1.1-7 —, сопряжение 1.1-27 —, форма алгебраическая 1.1-40 —, - геометрическая 1.1-40 —, — тригонометрическая 1.1 -40 —, формула Муавра 1.1-34 Комплексных чисел поле 1.1-43 Конгруэнтные матрицы 12.2-12 — эрмитово матрицы 12.2-12 Корень многочлена 7.2-2 — комплексно-сопряженный 7.2-35 — кратный 7.2-19 — простой 7.2-19 Корневое подпространство 9.5-4 Корневой вектор 9.5-4 —, высота 9.5-9 — базис 9.5-7 — Жордана 9.5-19 Коши - Буняковского неравенство 5.1-9 Крамера формулы 6.3-12 Кратность корня 7.2-19 Критерий Сильвестра 12.5-6 -Якоби 12.5-11 Кронекера - Капелли теорема 6.3-3 Кронекерова сумма матриц 11.4-15 Кронекерово произведение матриц 11.4-10 Л Лагранжа интерполяционный многочлен 7.2-9 -теорема 1.5-31 Лапласа теорема 4.2-4 Лемма Даламбера 7.2-31 Линейная комбинация 2.1-3 —, коэффициенты 2.1-3 -оболочка 2.1-4 Линейно зависимая система векторов 2.1-8 — независимая система векторов 2.1-9 Линейное многообразие 6.7-1 -подпространство 1.7-9 — тривиальное 1.7-10 — пространство 1.7-2 --, базис 2.2-21 — бесконечномерное 1.7-28 — вещественное 1.7-8 — комплексное 1.7-8 — конечномерное 1.7-28 —, порождение 2.2-20 —, размерность 2.2-23 — рациональное 1.7-8 Линейные пространства изоморфные 1.7-13 Линейный оператор 3.7-2 Линия прямая 6.7-6 М Матриц пара, обобщенная проблема 12.5-42 — определенная 12.5-34 —, числовая область 12.5-37 Матрица 3.2-1 — ассоциативная 4.4-31 — билинейной формы 12.2-2 в паре базисов 12.2-32 эрмитовой 12.2-2 в паре базисов 12.2-32 -блочная 3.5-18 — блочно-диагональная 3.5-25 — треугольная 3.5-25 — элементарная 3.5-26
534 Часть II. Линеал — новые возможности изучения линейной алгебры Матрица, вектор-столбец 3.2-8 -, вектор-строка 3.2-8 -, внедиагональные элементы 3.2-23 - вполне неотрицательная 4.4-29 - положительная 4.4-29 -вращения 11.2-1 - вырожденная 4.4-1 -Гивенса 11.2-1 -, главная диагональ 3.2-23 -Грама 6.8-5, 12.6-25 - двухдиагональная 3.5-11 - диагонализуемая 8.3-4 - диагональная 3.2-24 -, диагональные элементы 3.2-23 -единичная 3.2-26 -, индексы элементов 3.2-3 - квадратичной формы 12.3-10 эрмитовой 12.3-14 -квадратная 3.2-5 -, квадратный корень 12.5-27 - комплексно-сопряженная 3.3-3 - кососамосопряженная 10.3-15 - кососимметричная 4.4-36 - комплексная 4.4-36 - косоэрмитова 10.3-15 -ленточная 3.5-11 - левая 3.5-11 - правая 3.5-11 —, ширина ленты 3.5-11 - масштабирования элементарная 3.4-12 - невырожденная 4.4-1 - неособенная 4.4-1 - неунитарная элементарная 3.4-17 -нормальная 10.1-1 - нильпотентная 9.4-17 -нулевая 3.2-27 - обратная 4.4-7 - обобщенная 6.5-17 -оператора 3.7-18 -определенная неотрицательно 12.5-1 - неположительно 12.5-1 - отрицательно 12.5-1 - положительно 12.5-1 -ортогональная 10.2-23 -особенная 4.4-1 -отражения 11.2-10 - перестановок 3.4-1 - элементарная 3.4-6 - положительно полуопределенная 12.5-1 —, побочная диагональ 3.2-23 - полного ранга 4.3-12 - почти треугольная левая 3.5-9 правая 3.5-9 - преобразования координат 8.1-2 -, прибавление к столбцу столбца, умноженного на число 3.4-18 -, — строке строки, умноженной на число 3.4-18 - присоединенная 4.4-5 - простого поворота 11.2-1 - простой структуры 8.3-1 - профильная 3.5-15 - прямоугольная 3.2-5 - псевдообратная 6.5-17 -, размер 3.2-4 -самосопряженная 10.3-1 - симметричная 4.4-36 - комплексная 4.4-36 - системы линейных алгебраических уравнений 6.1-9 расширенная 6.1-11 -скалярная 3.2-25 - соответствующая 8.3-20 - сопряженная 3.3-5 - сопутствующая 8.3-20 - столбцевая 3.2-6
17. Предметный указатель 535 Матрица строчная 3.2-7 -типа Мг 3.4-27 - Nr 3.4-27 -тождественная 3.2-26 - транспонированная 3.3-1 - трапециевидная левая 3.5-6 - правая 3.5-6 -треугольная левая 3.5-1 строгая 3.5-2 - правая 3.5-1 строгая 3.5-2 - трехдиагональная 3.5-11 -, умножение столбца на число 3.4-13 -, - строки на число 3.4-13 -унитарная 10.2-1 - Хаусхолдера 11.2-10 - Хессенберга 3.5-9 - элементарная 3.4-21 —, элементы 3.2-3 -эрмитова 10.3-1 Матрицы, аксиомы нормы 13.3-2 - базисные столбцы 4.3-3 - строки 4.3-3 -блок 3.5-18 - блочное разбиение 3.5-18 - вещественной числовая область 12.6-8 - главные числа 11.3-3 - дефект 6.4-2 -клетка 3.5-18 - компактная форма 3.2-35 - комплексной числовая область 12.6-9 -конгруэнтные 12.2-12 - эрмитово 12.2-12 - кососимметричная составляющая 10.3-27 -, кронекерово произведение 11.4-10 - модификация г- ранговая 4.4-27 - норма 13.3-2 --аддитивная 13.3-4 --евклидова 13.3-16 - - мультипликативная 13.3-3 --, нижняя грань 13.3-16 --обобщенная 13.3-4 --подчиненная 13.3-9 --согласованная 13.3-7 --спектральная 13.3-16 --сферическая 13.3-16 - образ 6.4-2 - перестановка столбцов 3.4-8 --строк 3.4-8 - перестановочные 3.2-31 -подобные 8.1-17 - - унитарно 10.2-11 -, произведение 3.2-16 - профиль левый 3.5-13 - правый 3.5-13 -, прямая сумма 9.2-29 -, равенство 3.2-9 - разложение в прямую сумму 9.2-30 - - полярное 11.4-2 - - сингулярное 11.3-9 - - скелетное 6.6-23 --эрмитово 10.3-24 --Z, С/11.1-5 блочное 11.1-15 --QRM.2-21 -, разность 3.2-12 -ранг 4.3-1 -симметричная составляющая 10.3-27 - сингулярное число 11.3-3 - сингулярный базис 11.3-7 -след 3.3-7 - собственное значение 8.2-2 - - подпространство 8.2-3 --число 8.2-2 - собственный вектор 8.2-2
536 Часть II. Линеал — новые возможности изучения линейной алгебры Матрицы спектр 8.2-2 -, сравнение 12.5-21 -степень 9.4-1 -столбец 3.2-3 -строка 3.2-3 -, сумма 3.2-11 -, тензорное произведение 11.4-10 -умножение на число 3.2-13 - характеристический многочлен 8.2-18 - эквивалентные 8.1-11 - элементарное преобразование 3.4-21 -эрмитовы компоненты 10.3-24 - ядро 6.4-2 Метод Гаусса 3.6-1 —. ведущий элемент 3.6-22 —, —, без выбора 3.6-25 —, —, выбор по всей матрице 3.6-23 —, —, — столбцу 3.6-24 —, —, — строке 3.6-24 —, компактная схема 11.1-17 -исключения 3.6-1 - исчерпывания 8.3-25 - наименьших квадратов 6.5-12 Метрическое пространство 13.1-2 - полное 13.1-18 —, расстояние 13.1-2 Минковского неравенство 13.2-9 Минор 4.2-1 -, алгебраическое дополнение 4.2-3 - базисный 4.3-2 - ведущий 4.2-2 - главный 4.2-2 - дополнительный 4.2-3 - угловой 4.2-2 Многочлен 7.1-1 - вещественный, каноническое разложение 7.2-40 -, единица 7.1-14 - интерполяционный Лагранжа 7.2-9 - комплексный, каноническое разложение 7.2-6 -, корень 7.2-2 -, коэффициенты 7.1-1 - матричный 9.4-2 - минимальный аннулирующий вектор 12.8-21 -, минус единица 7.1-14 - нулевой 7.1-2 - от матрицы 9.4-2 - противоположный 7.1-9 -, старший коэффициент 7.1-1 -, степень 7.1-1 Многочленов деление 7.1-20 --, остаток 7.1-20 --частное 7.1-20 -делитель 7.1-20 --общий 7.1-22 наибольший 7.1 -23 - произведение 7.1-11 -равенство 7.1-3 -сумма 7.1-6 Множество 1.2-2 -замкнутое 13.1-13 -, замыкание 13.1-12 -, ограниченное 13.1-9 -, предельная точка 13.1-11 -, элемент 1.2-2 Множества ортогональные 12.6-33 —, объединение 1.2-10 -, пересечение 1.2-11 - равные 1.2-9 -, разность 1.2-12 -, расстояние 5.4-8 Муавра формула 1.1-34
17. Предметный указатель Н Невязка вектора 6.5-4 Независимая линейно система векторов 2.1-9 Непрерывная в точке комплексная функция 7.2-21 Неравенство Гельдера 13.2-8 — Коши - Буняковского 5.1-9 — Минковского 13.2-9 — Сильвестра 4.3-19 — треугольника 5.4-7 — Фробениуса 4.3-18 -Шварца 5.1-9 Неунитарная элементарная матрица 3.4-17 Норма вектора 13.2-2 --Гельдера 13.2-10 — евклидова 13.2-11 — энергетическая 13.2-6 -матрицы 13.3-2 — аддитивная 13.3-4 — евклидова 13.3-16 — мультипликативная 13.3-3 —, нижняя грань 13.3-16 — обобщенная 13.3-4 — подчиненная 13.3-9 — согласованная 13.3-7 — спектральная 13.3-16 — сферическая 13.3-16 -, ограниченность 13.2-17 -, сходимость 13.2-17 Нормальный делитель 1.5-21 Нормированная система векторов 5.2-2 Нормированное пространство 13.2-2 Нормированный вектор 13.2-12 Нормы векторов аксиомы 13.2-2 — матриц аксиомы 13.3-2 -эквивалентные 13.2-28 Оболочка линейная 2.1-4 Образ матрицы 6.4-2 Объединение множеств 1.2-10 Объем системы векторов 5.4-23 Окрестность 13.1-8 Оператор 3.7-1 - линейный 3.7-2 -, матрица 3.7-18 -нулевой 3.7-4 -, область значений 3.7-1 -, - определения 3.7-1 - обобщенный обратный 6.5-15 -образ 3.7-1 -, прообраз 3.7-1 - противоположный 3.7-4 - псевдообратный 6.5-15 -скалярный 3.7-4 -тождественный 3.7-4 -, умножение на число 3.7-7 Операторов произведение 3.7-11 -равенство 3.7-5 - сумма 3.7-6 Операция алгебраическая 1.4-1 - ассоциативная 1.4-4 - дистрибутивная 1.4-9 - коммутативная 1.4-3 -обратная 1.4-11 - левая 1.4-10 - правая 1.4-10 Определитель 4.1-10 -Грама 6.8-5, 12.6-25 Ортогонализация 12.8-1 - Грама - Шмидта 12.8-9 Ортогональная проекция вектора на подпространство 5.4-14 - система векторов 5.2-5 - сумма подпространств 5.3-21
538 Часть II. Линеал — новые возможности изучения линейной алгебры Ортогональное дополнение 5.3-4 --слева 12.6-34 — справа 12.6-34 Ортогональные векторы 5.2-4, 12.6-31 --слева 12.6-30 --справа 12.6-30 -множества векторов 5.3-1, 12.6-33 Ортогональный базис 12.7-2 - проектор 6.6-32 Ортонормированная система векторов 5.2-6 Ортонормированный базис 5.2-13 Основная теорема алгебры 7.2-32 Отношение бинарное 1.3-2 —, рефлексивность 1.3-4 —, симметричность 1.3-4 —, транзитивность 1.3-4 -Релея 12.6-12 -эквивалентности 1.3-5 П Пенроуза уравнения 6.6-29 Пересечение множеств 1.2-11 — векторов в линейном пространстве 5.3-16 Перестановка 4.1-1 -, инверсия 4.1-3 -нечетная 4.1-4 -нормальная 4.1-1 -, транспозиция 4.1-5 -четная 4.1-4 Перпендикуляр 5.4-14 Плоскость 6.7-1 -, вектор сдвига 6.7-1 -, направляющее подпространство 6.7-1 -, размерность 6.7-1 Подгруппа 1.5-10 -инвариантная 1.5-21 -конечная 1.5-30 -нормальная 1.5-21 -циклическая 1.5-37 Подгруппы индекс 1.5-32 Подмножество 1.2-6 Подпространство линейное 1.7-9 — инвариантное 9.1-1 тривиальное 9.1 -2 — корневое 9.5-4 — направляющее 6.7-1 — нулевое левое 12.6-45 правое 12.6-45 — тривиальное 1.7-10 --циклическое 9.5-16 Поле 1.6-13 — алгебраически замкнутое 7.2-14 — вещественных чисел 1.1-42 — комплексных чисел 1.1-43 -, характеристика 1.6-19 Последовательность Крылова 12.8-20 — ограниченная 7.2-27 -, предел 13.1-3 -степенная 12.8-20 -сходящаяся 13.1-3 — в себе 13.1-15 — фундаментальная 13.1-15 Предел последовательности комплексных чисел 7.2-25 Предельная точка 13.1-11 Проекция вектора 5.3-12 — ортогональная на подпространство 5.4-14 Проектор ортогональный 6.6-32 Произведение смежных классов 1.5-24 Пространства линейные изоморфные 1.7-13 — со скалярным произведением 5.1-4
17. Предметный указатель 539 Пространство арифметическое 1.7-24 — билинейно метрическое 12.6-22 эрмитово 12.6-22 — векторное 1.7-2 -линейное 1.7-2 --, базис 2.2-21 — бесконечномерное 1.7-29 — вещественное 1.7-8 — евклидово 5.1-2 — комплексное 1.7-8 — конечномерное 1.7-28 —, порождение 2.2-20 —, размерность 2.2-23 — унитарное 5.1-3 — метрическое 13.1-2 — полное 13.1-18 -нормированное 13.2-2 Прямая линия 6.7-6 — сумма подпространств 5.3-12 Разложение вектора по базису 2.2-27 — группы по подгруппе 1.5-17 — матрицы в прямую сумму 9.2-30 — полярное 11.4-2 — сингулярное 11.3-9 — скелетное 6.6-23 — эрмитово 10.3-24 — LUIIA-5 блочное 11.1-15 — б/? 11.2-27 Размерность линейного пространства 2.2-23 Ранг билинейной формы 12.2-9 -матрицы 4.3-1 — системы векторов 2.2-7 Расстояние между векторами 5.4-6 — множествами 5.4-8 Сигнатура квадратичной формы 12.4-10 Сильвестра критерий 12.5-6 - неравенство 4.3-19 Сингулярное разложение матрицы 11.3-9 - число матрицы 11.3-3 Сингулярный базис 11.3-7 Система линейных алгебраических уравнений 6.1-1 , вектор неизвестных 6.1 -9 5 - правых частей 6.1-9 , канонический вид 6.2-9 , коэффициенты 6.1-1 , матрица 6.1 -9 , - расширенная 6.1-11 неоднородная 6.1 -5 несовместная 6.1-3 однородная 6.1-5 , правая часть 6.1-1 приведенная 6.1 -6 , псевдорешение. 6.5-5 , - нормальное 6.5-8 , решение 6.1-2 , ~ нормальное 6.5-1 _ обобщенное 6.5-5 ,-общее 6.1-4 , - частное 6.1-4 , свободные неизвестные 6.2-12 совместная 6.1-3 , , фундаментальная система решений 6.3-5 эквивалентная 6.1-12 , элементарные преобразования 6.2-5 Скалярное произведение вещественное 5.1-2 - комплексное 5.1-3 Скелетное разложение матрицы 6.6-23
540 Часть //. Линеал — новые возможности изучения линейной алгебры Смежные классы группы 1.5-12 , произведение 1.5-24 Собственное значение матрицы 8.2-2 , алгебраическая кратность 8.2-32 , геометрическая кратность 8.2-33 - число матрицы 8.2-2 - подпространство матрицы 8.2-3 Собственный вектор матрицы 8.2-2 Соотношение Ньютона 9.4-14 Сопряженные числа 13.2-7 -элементы группы 1.5-19 Спектр матрицы 8.2-2 Сумма множеств векторов 5.3-10 - ортогональная подпространств 5.3-21 Сходимость координатная 13.2-18 -по норме 13.2-17 Ф Фактор-группа 1.5-26 --множество 1.3-10 Формула Бине - Коши 4.2-13 -Муавра 1.1-34 - Шермана-Моррисона 4.4-24 Формулы Виета 7.2-11 -Кели 10.3-8 - Крамера 6.3-12 -Ньютона 7.2-12 Фредгольма альтернатива 6.4-11 -теорема 6.4-12 Фробениуса неравенство 4.3-18 Фундаментальная система решений 6.3-5 Тензорное произведение матриц 11.4-10 Теорема Безу 7.2-1 - Гамильтона - Кели 9.4-22 - Кронекера - Капелли 6.3-3 -Лагранжа 1.5-31 - Лапласа 4.2-4 - основная алгебры 7.2-32 - Фредгольма 6.4-12 - Шура 9.2-23 Тождество параллелограмма 5.4-5 Транспозиция 4.1-5 Угол между векторами 5.4-9 — вектором и подпространством 5.4-12 Уравнения Пенроуза 6.6-29 Характеристика поля 1.6-19 Характеристический многочлен матрицы 8.2-18 Хаусхолдера матрица 11.2-10 Хессенберга матрица 3.5-9 Циклическая последовательность 11.2-24 Циклическое подпространство 9.5-16 Числа 1.6-18 -вещественные 1.1-1 -комплексные 1.1-5 Ш Шар 13.1-7 -замкнутый 13.1-7
17. Предметный указатель 541 Шар, радиус 13.1-7 - центр 13.1-7 Шары вложенные 13.1-19 Шварца неравенство 5.1-9 Ширина ленты 3.5-11 Шура теорема 9 2-23 -дополнение 11.1-12 Эквивалентные матрицы 8.1-11 - нормы 13.2-28 - системы векторов 2.2-2 —уравнений 6.1-12 - элементы 1.3-6 Элементарные преобразования системы уравнений 6.2-5 Элементы группы сопряженные 1.5-19 Эквивалентности классы 1.3-8 - отношение 1.3-5 Ядро матрицы 6 4.2 Якоби критерий 12.5-11
18. Список литературы 1. Воеводин В. В. Линейная алгебра. — М.: Наука, 1980. — 400 с. 2. Воеводин В. В., Воеводин В л. В. Интернет-макет теоретического курса линейной алгебры. // Труды Всеросс. научн. конф. "Научный сервис в сети Интернет", — М: МГУ, 1999. — С. 22—25. 3. Воеводин В. В,, Кузнецов Ю. А. Матрицы и вычисления. — М.: Наука, 1984. — 320 с. 4. Гантмахер Ф. Р. Теория матриц. — М.: Наука, 1966. — 576 с. 5. Икрамов X. Д. Задачник по линейной алгебре. — М.: Наука, 1975. — 320 с. 6. Икрамов X. Д. Матричные пучки — теория, приложения, численные методы. // Итоги науки и техники. Серия: математический анализ. — М.: ВИНИТИ, 1991. — Том 29. С. 3—106. 7. Ильин В. А., Ким Г. Д. Линейная алгебра и аналитическая геометрия.— М.:МГУ, 1998. —320 с. 8. Ильин В. А., Садовничий В. А., Сендов Бл. X. Математический анализ. — М.:МГУ, 1985.—416 с. 9. Корн Г., Корн Т. Справочник по математике. — М.: Наука, 1973. — 832 с. 10. Фаддеев Д. К., Фаддеева В. Н. Вычислительные методы линейной алгебры.— М.: Физматлит, 1963. — 736 с.
190005, Санкт-Петербург, Измайловский пр., 29 В МАГАЗИНЕ ПРЕДСТАВЛЕНА ЛИТЕРАТУРА ПО компьютерным технологиям радиотехнике и электронике физике и математике строительству и архитектуре транспорту машиностроению и другим естественно-научным и техническим направлениям Низкие цены Прямые поставки от издательств у Ежедневное пополнение ассортимента V Подарки и скидки покупателям Тел.: (812) 251-41-10, e-mail: trade@techkniga.com