Текст
                    Р.Беллман
ВВЕДЕНИЕ В ТЕОРИЮ МАТРИЦ
Книга посвящена изложению теории матриц и ее приложениям к теории
дифференциальных уравнений, математической экономике, теории вероятностей.
Монография написана так, что ее может читать студент, не изучавший ранее
линейную алгебру. В книге имеется более 600 задач; многие из них подводят
читателя к самостоятельной научной деятельности в области теории матриц.
Ценность книги увеличивают приводимые в конце каждой главы обзоры
последних оригинальных работ в соответствующей области.
Книга рассчитана на студентов университетов и втузов, на инженеров,
физиков, механиков, использующих матричный аппарат. Много
привлекательного найдет в ней и математик, интересующийся собственно теорией
матриц.
ОГЛАВЛЕНИЕ
Предисловие редактора перевода 8
Предисловие автора к русскому изданию 10
Предисловие автора к английскому изданию 11
Глава 1. Максимизация и минимизация. Обоснование 21
§ 1. Введение B1). § 2. Максимизация функции одной переменной
B1). § 3. Максимизация функции двух переменных B2). § 4.
Алгебраический подход B3). § 5. Аналитический подход — I B5). §
6. Аналитический подход— II B6). § 7.
Упрощающее|преобразование B8). § 8. Другое необходимое и
достаточное условие B9). § 9. Определенные и неопределенные
формы C0). § 10. Геометрический подход C0). §11. Обсуждение
C2).
Упражнения к гл. 1 32
Библиография и комментарий 33
Глава 2. Векторы и матрицы 34
§ 1. Введение C4). § 2. Векторы C4). § 3. Сложение векторов C5). §
4. Умножение вектора на скаляр C6). § 5. Скалярное произведение
двух векторов C6). § 6. Ортогональность C7). § 7. Матрицы C8). § 8.
Умножение вектора на матрицу C9). § 9. Умножение матрицы на
матрицу D0). § 10. Некоммутативность D2). § 11. Ассоциативность
D3). § 12. Инвариантные векторы D4). § 13. Квадратичная форма как
скалярное произведение D5). § 14. Транспонированная матрица D5).
§ 15. Симметрические матрицы D6). § 16. Эрмитовы матрицы D7). §
17. Ортогональные матрицы. Инвариантность расстояний D8). § 18.
Унитарные матрицы D9).
Упражнения к гл. 2 49
Библиография и комментарий 54
Глава 3. Диагонализация и канонические формы симметрических 56
матриц


§ 1. Резюме E6). § 2. Решение системы линейных однородных уравнений E6). § 3. Собственные векторы и собственные значения E8). § 4. Два фундаментальных свойства симметрических матриц E9). §5. Приведение к диагональной форме. Различные собственные значения F1). § 6. Приведение квадратичной формы к каноническому виду F3). § 7. Положительно определенные квадратичные формы и матрицы F5). Упражнения к гл. 3 65 Библиография и комментарий 67 Глава 4. Приведение симметрических матриц к диагональной форме 68 в общем случае § 1. Введение F8). § 2. Линейная зависимость F8). § 3. Ортогонализа-ция Грама — Шмидта F8). § 4. Положительность определителей Грама Dk G2). § 5. Одно тождество G3). § 6. Диагонализация симметрической матрицы второго порядка G5). § 7. JV-мерный случай G7). § 8. Необходимое и достаточное условие положительной определенности (80). § 9. Собственные векторы, соответствующие кратным собственным значениям (80). § 10. Теорема Гамильтона — Кэли для симметрических матриц (81). § 11. Одновременное приведение к диагональной форме (81). § 12. Одновременное приведение к сумме квадратов (84). § 13. Эрмитовы матрицы (85). § 14. Исходная проблема максимизации (85). § 15. Теория возмущений — I (86). § 16. Теория возмущений — II (87). Упражнения к гл. 4 90 Библиография и комментарий 97 Глава 5. Условные экстремумы 99 § 1. Введение (99). § 2. Детерминантный критерий положительной определенности (критерий Сильвестра) (99). § 3. Представление в виде суммы квадратов A02). § 4. Связанные вариации и теорема Финслера A02). § 5. Случай к = 1 A04). § 6. Задача о минимизации A07). § 7. Общий случай A09). § 8. Прямоугольные матрицы A09). §9. Клеточные матрицы A11). § 10. Решение задачи в общем случае A12). Упражнения к гл. 5 113 Библиография и комментарий 116 Глава 6. Функции от матрицы 117 § 1. Введение A17). § 2. Функции от симметрической матрицы A17). §3. Обратная матрица A18). § 4. Единственность обратной матрицы A18). § 5. Квадратные корни A21). § 6. Параметрическое представление A22). § 7. Результат Шура A22). § 8. Основные 00 скалярные функции A23). § 9. Несобственный интеграл \e~^'Ax^dx
A25). § 10. Аналог для эрмитовых матриц A27). §11. Связь между J(H) и \Н\ A28). Упражнения к гл. 6 128 Библиография и комментарий 134 Глава 7. Вариационное описание характеристических чисел 140 § 1. Введение A40). § 2. Отношение Релея A40). § 3. Вариационные свойства характеристических чисел A41). § 4. Обсуждение A42). § 5. Геометрические предпосылки A43). § 6. Теорема Куранта — Фишера о минимаксном представлении характеристических чисел A43). § 7. Монотонное поведение Х^А) A46). § 8. Теорема отделения Штурма A46). § 9. Необходимое и достаточное условие положительной определенности матрицы А A47). § 10. Теорема отделения Пуанкаре A47). § 11. Теорема о представлении A48). § 12. Приближенные методы A49). Упражнения к гл. 7 151 Библиография и комментарий 152 Глава 8. Неравенства 155 § 1. Введение A55). § 2. Неравенство Коши-Шварца A55). § 3. Интегральный вариант A56). § 4. Неравенство Гёльдера A56). § 5. Вогнутость \А\ A58). § 6. Одно полезное неравенство A58). § 7. Неравенство Адамара A59). § 8. Вогнутость произведения XNXN_i ..Xk A60). § 9. Аддитивные неравенства, вытекающие из мультипликативных A61). § 10. Другой путь A62). § 11. Более простое выражение для XNXN_i ..Xk A63). § 12. Неравенство между средним арифметическим и средним геометрическим A64). § 13. Мультипликативные неравенства, вытекающие из аддитивных A65). Упражнения к гл. 8 166 Библиография и комментарий 169 Глава 9. Динамическое программирование 173 § 1. Введение A73). § 2. Задача наименьшего отклонения A73). § 3. Функциональное уравнение A74). § 4. Рекуррентные соотношения A75). § 5. Более сложный пример A75). § 6. Проблема Штурма — Лиувилля A76). § 7, Функциональные уравнения A78). § 8. Матрицы Якоби A79). § 9. Аналитическое продолжение A80). § 10. Несимметрические матрицы A81). § 11. Случай комплексной матрицы А A82). § 12. Слабо связанные системы A83). §13. Упрощения — I A84). § 14. Упрощения — II A84). §15. Уравнение Ах=у A85). § 16. Квадратичное уклонение A86). § 17. Результат СтилтьесаA88). Упражнения к гл. 9 189 Библиография и комментарий 190 Глава 10. Матрицы и дифференциальные уравнения 193
§ 1. Обоснование A93). § 2. Векторно-матричные обозначения A94). § 3. Нормы векторов и матриц A96). § 4. Бесконечные ряды векторов и матриц A97). § 5. Существование и единственность решений линейной системы уравнений A97). § 6. Матричная экспонента B00). § 7. Функциональные уравнения — I B01). § 8. Функциональные уравнения — II B01). § 9. Функциональные уравнения — III B02). § 10. Невырожденность решения B02). §11. Решение неоднородного уравнения. Постоянные коэффициенты B04). § 12. Неоднородное уравнение. Переменные коэффициенты B04). § 13. Неоднородное уравнение. Сопряженная система B05). § 14. Теория возмущений B06). § 15. Неотрицательность решения B07). § 16. Функциональное уравнение Пойа B08). § 17. Уравнение ту = АХ + ХВ B11). § 18. Уравнение АХ+ХВ=С B12). dt Упражнения к гл. 10 213 Библиография и комментарий 213 Глава 11. Явные решения и канонические формы матриц 219 § 1. Введение B19). § 2. Метод Эйлера B19). § 3. Построение решения B20). § 4. Невырожденность матрицы С B21). § 5. Другой метод B21). § 6. Определитель Вандермонда B22). § 7. Явная форма решения линейного дифференциального уравнения. Диагональные матрицы B23). § 8. Диагонализация матрицы B24). § 9. Связь между двумя подходами B25). § 10. Кратные характеристические числа B26). § 11. Каноническая форма Жордана B27). § 12. Кратные характеристические числа (другой метод) B28). § 13. Треугольная форма матрицы. Теорема Шура B31). § 14. Нормальные матрицы B33). § 15. Теорема об аппроксимации B35). § 16. Другая теорема об аппроксимации B36). § 17. Теорема Гамильтона — Кэли B37). § 18. Другое доказательство теоремы Гамильтона — Кэли B37). § 19. Линейные уравнения с периодическими коэффициентами B38). § 20. Представление невырожденной матрицы в виде экспоненты B39). § 21. Другое доказательство B41). § 22. Некоторые интересные преобразования B42). § 23. Биортогональность B43). § 24. Преобразование Лапласа B45). § 25. Пример B46). § 26. Обсуждение результата B47). § 27. Матричный случай B48). Упражнения к гл. 11 249 Библиография и комментарий 257 Глава 12. Симметрические функции, кронекеровские произведения и 260 циркулянты § 1. Введение B60). § 2. Степени собственных значений B60). § 3. Полиномы и характеристические уравнения B62). § 4. Симметрические функции B62). § 5. Кронекеровские произведения B64). § 6. Алгебра кронекеровских произведений B65). § 7.
Кронекеровские степени — I B65). § 8. Кронекеровские степени— II B65). § 9. Кронекеровские степени — III B66). § 10. Кронекеровский логарифм B67). §11. Кронекеровская сумма — I B67). § 12. Кронекеровская сумма -II B68). § 13. Уравнение АХ+ХВ=С B68). § 14. Другое доказательство B70). § 15. Циркулянты B72). Упражнения к гл. 12 273 Библиография и комментарий 276 Глава 13. Теория устойчивости 278 § 1. Введение B78). § 2. Необходимые и достаточные условия устойчивости B79). § 3. Устойчивые матрицы B80). § 4. Метод Ляпунова B80). § 5. Среднеквадратичное отклонение B82). § 6. Некоторые эффективные критерии устойчивости B82). § 7. Необходимое и достаточное условие устойчивости матриц B34). § 8. Дифференциальные уравнения и собственные значения B84). § 9. Эффективные условия устойчивости матриц B87). Упражнения к гл. 13 287 Библиография и комментарий 289 Глава 14. Марковские матрицы и теория вероятностей 292 § 1. Введение B92). § 2. Простой стохастический процесс B92). § 3. Марковские матрицы и вероятностные векторы B94). § 4. Аналитическое описание дискретных марковских процессов B95). § 5. Асимптотическое поведение B95). § 6. Первое доказательство B96). § 7. Второе доказательство независимости от начального состояния B98). § 8. Некоторые свойства положительных марковских матриц B98). § 9. Второе доказательство сходимости C00). § 10. Марковские матрицы общего вида C01). § 11. Непрерывный стохастический процесс C03). § 12. Доказательство вероятностных свойств C04). § 13. Обобщенные вероятности: унитарные преобразования C05). § 14. Обобщенные вероятности: матричные преобразования C06). Упражнения к гл. 14 307 Библиография и комментарий 310 Глава 15. Случайные матрицы 312 § 1. Введение C12). § 2. Предельное поведение физических систем C12). § 3. Средние значения C13). § 4. Средние значения квадратов C14). Упражнения к гл. 15 314 Библиография и комментарий 315 Глава 16. Положительные матрицы, теорема Перрона и 317 математическая экономика § 1. Введение C17). § 2. Некоторые процессы простого роста C17). § 3. Обозначения и определения C18). § 4. Теорема Перрона C19). § 5. Доказательство теоремы 1 C19). § 6. Второе доказательство
простоты Х(А) C21). § 7. Доказательство свойства минимальности Х(А) C22). § 8. Эквивалентное определение Х(А) C23). § 9. Предельная теорема C23). § 10. Стационарный рост C23). § 11. Непрерывные процессы роста C24). § 12. Аналог теоремы Перрона C25). § 13. Ядерный распад C25). § 14. Математическая экономика C26). § 15. Матрицы Минковского — Леонтьева C29). § 16. Положительность определителя |/—А\ C30). § 17. Усиление теоремы 6 C31). §18. Линейное программирование C31). § 19. Теория игр C32). § 20. Марковские процессы принятия решений C34). § 21. Экономическая модель C34). Упражнения к гл. 16 335 Библиография и комментарий 338 Приложение А. Линейные уравнения и ранг 344 § 1. Введение C44). § 2. Определители C44). § 3. Свойство алгебраических дополнений C45). § 4. Правило Крамера C45). § 5. Однородные системы C45). § 6. Ранг C49). § 7. Ранг квадратичной формы C49). § 8. Закон инерции (Якоби — Сильвестра) C49). § 9. Сигнатура C50). Упражнения к приложению А 350 Библиография и комментарий 351 Приложение Б. Метод Эрмита 352 Приложение В. Моменты и квадратичные формы 354 § 1. Введение C54). § 2. Обозначения C54). § 3. Метод Фишера C55). § 4. Моментное представление C56). § 5. Результат Герглотца C57). Библиография и комментарий 358 Дополнительная литература по теории матриц и ее приложениям 359 Именной указатель 362 Предметный указатель 366 Предметный указатель Адамар (J. Hadamard) 53, 159, 160, Бакстер (G. Baxter) 257 170, 337 Баррет (J. H. Barret) 214, 258 Алберт (A. A. Albert) 54 Бартлетт (М. S. Bartlett) 310 Александров П. С. 340 Басе (R. W. Bass) 280, 290 Амир-Моэз (АН R. Amir-Moez) 153, Бассет (I. M. Basset) 98 360 Баумгертель (Н. Baumgartel) 359 Андерсон (Т, W. Anderson) 138, 315 Бауэр (F. L. Bauer) 257, 361 Анке (К. Anke) 286, 289 Бейкер (Н. F. Baker) 19, 214 Антосевич (Н. Antosiewicz) 289 Бейтмен (Н. Bateman) 153 Арли (N. Arley) 215,310 Беккенбах (Е. F. Beckenbach) 169, Ароншайн (N. Aronszain) 153 170, 216, 358 Аутон (L. Autonne) 94 Бекман (М. J. Beckman) 308 Афрайэт (S. N. Afriat) 116, 134, 274 Беллман (R. Bellman) 9, 53, 138, 139,
154, 168—171, 191, 192, 214— 217, 257, 276, 289, 291, 310, 311, 315, 316, 336, 339, 341, 342, 353, 358 Бендат (J. Bendat) 139 Бендиксон (I. Bendixon) 66, 254 Бергстром (Н. Bergstrom) 160, 170, 171 Берингтон (R. S. Burington) 338 Берлин (Т. Н, Berlin) 277 Бермен (J. P. Burman) 53 Бернсайд (W. S. Burnside) 116, 131, 154, 353 Берчиелл (J. L. Burchnall) 51 Бикли (W. G. Bickley) 153 Бине (J. Ph. M. Binet) 271 Биркгоф (G. A. Birkhoff) 54, 308, 340 Бом (С. Bohm) 190 Боненбласт (Н. Bohnenblust) 336, 339, 341, 342 Bopr(G. Borg) 134 Борель (G. Borel) 19, 317 Борксениус (A. Borchsenius) 215 Бохер (М. Bocher) 107, 270, 277 Бохнер (S. Bochner) 138, 343 Браун (R. D. Brown) 98 Браун (Е, T. Browne) 172 Брауэр (A. Brauer) 66, 115, 172, 337,341,361 Брок (Р. Brock) 20, 288 Броудер (A. Broeder) 351 Букнер (Н. Buckner) 289 Бурген (D. G. Bourgin) 351 Важевски (S. Wazewski) 112 Вайнберг (L. Weinberg) 19, 138, 218, 337, 343 Вайнбергер (A. F. Weinberger) 256 Вайнштейн (A. Weinstein) 152 Вайс (G.H.Weiss) 315 Вайценбук (R. Weitzenbuck) 272 Ван Данциг (D. Van Dantzig) 172 Ван дер Варден (В. L. van der Waerden) 258, 290 Вандермонд (А. Т. Vandermonde) 222 Варга (R. S. Varga) 340 Веддерберн (J. H. M. Wedderburn) 255, 257, 277 Вейль (Н. Wevl) 131, 151, 277 Вествик (R. Westwick) 171, 172, 277 Виванти (G. Vivanti) 341 Вигман (N. A. Wiegman) 113, 249, 250, 259 Вигнер (Е. P. Wigner) 19, 139, 315 Виландт (Н. Wielandt) 153, 250, 254, 256, 341, 360 Вильяме (J. D. Williams) 342 Вильямсон (J. D. W. Williamson) 94, 170, 274 Винер (N. Wiener) 172, 190, 191, 257, 259 Виноград Р. Э. 251 Виссер(С. VisserJ13 Вишик М. И. 359 Вольтерра (V. Volterra) 207 Босс (К. Voss) 129 Вронский (Н. Wronski) 251, 252 Вудбери (М. A. Woodbury) 340, 342 Гадерли (К. G. Guderley) 213 Гамильтон (W. Hamilton) 81, 132, 225, 237, 255, 258 Гантмахер Ф. Р. 9, 54, 94, 134—136, 153, 217, 271, 272, 308, 311, 343, 353 Гаусс (К. F.Gauss) 51 Гельфанд И. М. 134, 257, 361 Герглотц (С. Herglotz) 357 Геронимус Я. Л. 92 repu(CS.HerzI38 ГершгоринС. 136, 137 Герштейн (I. N. Herstein) 104, 116, 338, 341 Гёльдер (О. Holder) 155, 156, 158 Гивенс (Н. Giwens) 290 Гильберт (D. Hilbert) 67, 115, 152 Гильдебрандт (S. Hildebrandt) 361 Гирш (К. A. Hirsch) 254, 257
Гиршик (М. A. Girschick) 138 Гликсберг (I. Glicksberg) 154, 170, 216,353 Голдберг (К. Goldberg) 214 Голдстайн (Н. Goldstine) 136, 215 Гоффман (A. J, Hoffman) 172, 216, 254, 350 Гочи(С. GautschiI67 Грам (I. Gram) 68, 70, 72, 92, 155, 163, 186,271 Гребнер (W. Groebner) 98 Грейбил (F. A. Graybill) 95 Гренандер (V. Grenander) 115, 275 Гринспен (D. Greenspan) 136 Гройб(\?. GreubI68 Гросс (О. Gross) 154, 170, 216, 353 Грэйвс (L. M. Graves) 153 ГудИ. (I. J. Good) 116 Гуд Р (R. A. Good) 342 Гулд (S. Gould) 360 Гунтхард (Н. Gunthard) 217 Гурвиц (A. Hurwitz) 52, 283, 286, 290, 353 Гэддам (J. W. Gaddum) 116 Дайне (L. L. Dines) 116 Дайсон (F. J. Dyson) 315, 361 Далецкий Ю. Л. 359 Данскин (J. M. Danskin) 341 Даффин (R. J. DufTin) 139, 154, 217 Двайр (P. S. Dwyer) 134 Дсбре (G. Debreu) 341 Де-Брёйн (N. G. de Bruin) 172, 251, 277 Денис (Ch. Davis) 359 Джекобсон (N. Jacobson) 98 Диас (J.B.Diaz) 153 Дилиберто (S. Diliberto) 251, 288 Димер (W. L. Deemer) 53 Дин (Р. Dean) 191 Добш(Я. DobschI38 Долф (С L. Dolph) 97, 154, 192 Дрезин (М P. Drazin) 98 Дункан (W J, Duncan) 259 ДынкинЕ. Б. 214, 310 Дюпарк (L. Duparc) 93 Евклид (Euclid) 48 Жордан (С. Jordan) 227, 228, 257, 280, 307 Зигель (С. L. Siegel) 130, 137, 171 Ингам (A. E. Ingham) 130, 137, 171, 315 Истерфилд (Т. Е. Easterfield) 216 Калаба (R. Kalaba) 53. 216, 316, 342 Калман (R E. Kalman) 192 Каратеодори (A. Caratheodory) 358 Карлин (S. Karlin) 191, 216, 277, 309, 311,341,343 Карпилевич Ф. И. 343 Картан (Е. Cartan) 276 Касорати (F. Casorati) 252 Каспари (F. Caspary) 49, 137 Като (Т. Kato) 90, 153, 253. 254, 359 Кац (М. Кае) 275, 277, 310, 358 Келлер Г. (Н. В. Keller) 214 Келлеп Дж. (J. В. Keller) 214 Кемпбелл (J. E. Campbell) 19 Кендалл (М. G. Kendall) 316 Кернер (Е. Н. Kerner) 315 Кепке (R. W. Koepke) 192 Клейн (F. Klein) 270, 277 Клемент (A. Clement) 121 Ко (Chao Ко) 255, 258 Коддингтон (Е. A. Coddington) 289 Коллар (A. R. Collar) 259 Коллатц (L. Collatz) 154, 341 Колмогоров А. Н. 94, 190 Конти (R. Conti) 258 Котелянский Д. М. 51, 359 Кохер (М. Koecher) 343 Коши (A. L. Cauchy) 37, 155, 164, 168, 271 Крамер (Н. Cramer) 57. 69, 81, 345 Краус (F. Kraus) 139 Кребилл (D. M. Krabill) 252
Крейг (H.Craig) 130 КрейнМ.Г. 98, 134, 217, 311, 339, 343, 360, 361 Кремер (Н. Cremer) 290 Купманс (Т. С. Koopmans) 308, 339, 342 Курант (R. Courant) 140, 143, 152 155 Курош А. Г. 97, 258 Кэли (A. Cayley) 54, 81, 109, 120, 132, 135, 136, 225, 237, 255, 258 Кэррол (L. Carrol) 18 Лавут П. А. 360 Лагерр (Е. Lagerr) 71 Лагранж (J. L. Lagrange) 25, 30, 74, 162, 163, 204 Лаке М. (М. Lax) 98 Лаке П. (P. D. Lax) 256 Ланцош (С. Lanczos) 351 Лаплас (P. S. Laplace) 245—248 Лаппо-Данилевский И. А. 217, 274, 288 Ларчер (Н. Larcher) 98 Лауденслагер (D. Lowdenslager) 172, 259А Лебег (Н. Lebesgue) 216 Леверье (P. Leverrier) 129 Леви (Н. Levy) 137 Левин (J. J. Levin) 214 Левинсон (N. Levinson) 190, 289 Левитан Б. М. 134 Ледерман (W. Lederman) 307, 310, 337 Лежандр (А. М, Legendre) 71, 150 Лейн (А. М. Lane) 139 Леккеркернер (A. Lekkerkerner) 93 Леман (S. Lehman) 192, 216 Лент (С. Leng) 94 Леонтьев (W. W. Leontieff) 317, 329 Лефщец (S. Lefschetz) 257, 258 Лёвнер (С. Loevner) 19, 138. 139 Ли Г. (Н С. Lee) 96, 214, 255, 258 Ли С. (S. Li) 214 Лидский В Б. 359, 361 Литлвуд Д. (D. E. LHtlewwod) 277 Литлвуд Дж. (J. E. Little wood) 97. 169. 171 Лиувилль (J. Liouville) 98, 149, 176 Лопес (L. Lopes) 171 Лоран (Р. A. Laurent) 131, 358 Лоренц (Н. Lorenz) 95 Лоуэн (А. N. Lowan) 274 Люмер (G. Lumer) 217 Люстерник Л. А 359 Ляпунов А. М. 213, 279. 280, 289 Маас (Н. Maass) 138 Marnvc (YV. Magnus) 214, 215 Мяк-Грегор (J. L. McGregor) 171, 191, 277,309.3117 343 Мак-Дафф (С. С. McDuffee) 52, 54, 134, 258, 276, 277 Маклафлин (J. E. McLaughlin) 97, 192 Маклейн (S. Maclane) 54 Макфсйп (М. S Macphail) 134 Малликен (Т. Mulliken) 341 Мальцев А. И. 257 Марадудин (A. Maradudin) 315 Марков А. А. 16 Маркс (I. Marx) 97, 192 Маркус А. С 153 Маркус M. (M. D. Marcus) 154, 168, 171, 172, 277 Марсалья (G. Marsaglla) 95 Масани (Р. Masani) 172, 259 Матье (Е, Mathieu) 238 Мердок (W. L. Murdock) 275, 358 Мецлер (О. Metzler) 290, 335 Минковский (A. Minkowski) 164, 329, 337 Мирский (L. Mirsky) 33, 67, 96, 161, 172, 253, 254, 256, 308 Митчелл (J. Mitchell) 251 Мойлс (В. N. Moyls) 171, 172, 277 Монтел (Р. Montel) 252 Монтролл (Е. Montroll) 310 Моргенштерн (О. Morgenstern) 339, 342
Морс (М. Morse) 33 Мотард (Т. Motard) 137 Моцкин (Т. S. Mptzkin) 129, 252 Муавр (A. de Moivre) 114 M^(A.M.MoodK16 Мур (Е. Н. Moore) 135 Мурнаган (F. D. Murnaghan) 94, 276 Найквист (Н. Nyquist) 315 Намбу (Y. Nambu) 217 HaHfla(D.N.NandaK16 Нейман, фон (J. von Neumann) 19, 136,215,317,333,342 Нерлав (М. Nerlove) 290, 339 Нобл (S. В. Noble) 340 Нудельман А. А. 360 Ньюмен (N. Н. A. Newman) 255 Олкин (I. Olkin) 20, 53, 54, 132, 138 Ольденбургер (R. Oldenburger) 137,351 Онзагер (L. Onsager) 277 Оппенгейм (A. Oppenheim) 169 Оруэл (G. Orwell) 16 Осборн (Н. Osborn) 152 Островский (A. Ostrowski) 55, 115, 171,179,215,251,253,337,338 Паркер (W. V. Parker) 66, 115, 133, 172,254 Пароди (М. Parodi) 94, 154 Пенроуз (R. Penrose) 135 Переманс (L. Peremans) 93 Перрон (О. Perron) 16, 251, 257, 291, 317, 319, 323, 325, 331, 335, 339; 340, 341 Петровский И. Г. 96 Плакетт (R. L. Plackett) 53 Плюкер (J. Plucker) 277 Пойа (G. Polya) 97, 153, 169, 171, 208, 216, 252, 343 Поттер (Н. S. A. Potter) 129, 138 Примас (Н. Primas) 217 Принсгейм (A. Pringsheim) 341 Прюфер (A. Prufer) 258 Птак (V. Ptak) 360 Пуанкаре (Н. Poincare) 19, 132, 147, 151, 154, 213, 279, 289, 291, 299, 310 Путнам (С. R. Putnam) 122, 235, 254, 341 Пэли (R. Е. А. С. Paley) 53 Пэнтон (A. W. Panton) 116, 131, 154, 353 Радон (J. Radon) 52 Райзер (Н. J. Ryser) 272, 277 Райнболт (W. Rheinboldt) 168 Райнхарт (R. F. Rinehart) 134 Pani(G.RaschI38,215 Редхеффер (R. Redheffer) 218 Резерфорд (D. E. Rutherford) 253, 272, 276 Рейд (W.T.Reid) 218, 258 Релей (J. W. Strutt Lord Rayleigh) 140, 141, 152 Риккати (J. F. Riccati) 218, 249 Риман (В. Riemann) 200, 337, 354 Рисе (F. Riesz) 151, 359 Рихтер (Н. Richter) 134 Ричардсон (J. M. Richardson) 192 Робертсон (Н. Robertson) 167 Робинсон Д. (D. W. Robinson) 133 Робинсон P. (R. M, Robinson) 50 Розенблюм (М. Rosenbloom) 217, 276, 291 Рой (S.N.Roy) 316 Ройтер (G. E. Reuter) 307, 310 Рот (W.E. Roth) 135 Ротфельд С. Ю. 360 PyflHH(W.RudinI33 Рутман М. А. 239 Саймон (Н. A. Simon) 192 Самуэлс (J. С. Samuels) 291 Сараки (P. Szaraki) 112 Сас (О. Szasz) 358 Cere (G. Szego) 92, 115, 252, 275, 358 Сеймелсон (Н. Samelson) 341 Секефальви-Надь (В. Szekefalvi-
Nagy) 151, 359 Селье(С. J. SeelyeI15 Сефл (О. Sefl) 291 Сильвестр (J. J. Sylvester) 99,115, 129,131,135,249,349,353 Синг (J. L. Synge) 96 Ситгривс (R. Sitgreaves) 138 Слепян (Р. Slepian) 138, 218, 337, 343 Смит(О. Smith) 351 Сноу (R. Snow) 340, 341 Соминский И. С. 149 Старжинский В. М. 258 Стейн(Р. Stein) 251 Стейнберг (R. Steinberg) 360 Стенджер (W. Stenger) 360 Стенцель (Н. Stenzel) 98 Стилтьес (Т. J. Stieltijes) 114, 188, 192,354 Сэдл (A. Saddle) 192 Сю (P.L.Hsu) 316 Табер(О. TaberJ51 Та Ли (Та Li) 291 Таусскн (О. Tausski) 20, 54, 93, 136, 167, 172, 249, 252—255, 257, 274, 290, 337 Тейлор (В. Taylor) 21. 288 Темпл (G. Temple) 153 Теплиц (О. Toeplitz) 115, 129, 254, 257,277 Тодд (J, Todd) 93, 253, 274, 290 Томас (R. G. Thomas) 139 Томпсон (R. Thompson) 154 Тройенфельс (P. Treuenfels) 256 Тэтчер (Н. С. Thatcher, Jr.) 351 Уидом (Н. Widom) 275 Уилкс(8. S.WilksK15 Уинг (G. M. Wing) 342 Уинтнер (A. Wintner) 94, 340, 341 Уитл (P. Whittle) 131, 168 Ульман (J. L. Ullman) 341 Уонг (Y. К. Wong) 340, 342 Уэйплс (G. W. Whaples) 351 Фаддеев Д. К. 59, 136, 149, 360 Фаддеева В. Н. 59,136 Фань Цзы (Ку Fan) 20, 93, 153, 155, 160, 161, 167, 169—172, 216, 256, 336,337,341,350 Фаукс (Н. О. Foukes) 54 Фейер (L. Fejer) 132, 137 358 Фейнман (R. Feynman) 215 Феллер^. Feller) 310 Фер (F. Fer) 207, 241 Фидлер (М. Fiedler) 360 Филлипс Г (Н. В. PhillipsI 255, 258 Филлипс P. (R. Phillips) 214 Фишер (Е. Fischer) 16, 140, 143, 153, 155, 170, 355, 358 Форсайт A. (A. R. Forsythe) 131 Форсайт Дж. (G. E. Forsythe) 18, 90, 136,351 ФрайманГ. А. 291 Франк (Е. Frank) 290 Фрезер (R. A. Fraser) 259 Фрейм (J. Frame) 128 Фреймер (М. Freimer) 192 Фреше (М. Frechet) 310 Фридман (В Friedman) 54 Фробениус (G. Frcbentus) 16, 135, 254,317,340,350 Фурье (J. Fourrier) 51, 275 Фуэтер (R Fueter) 135 Xaap(D. te.rHaarJ17 Хазенбрук (P. Hazenbroeck) 290 Хайнц (Е. Heinz) 276 Халмош (Р. Halmos) 33 Хан (W. Hahn) 269, 276 Харди (G. H. Hardy) 97, 169 171 Харрис (Т. Е. Harris) 339, 342 Хартман (Р. Hartman) 340 Хаусдорф (F. Hausdorf) 19 214 Хаусхолдер (A. S. Householder) 132, 215,257 Хейнсворт (Е. V. Hayrisworth) 172, 311,337,338 Хелли (Е. Helly) 354,357
Хелсон (Н. Helson 172, 259 Шмидт (Е. Schmidt) 68, 72, 129, 186 Хенкок (Н. Hancock) 33 Шнайдер (Н. Schnider) 130 Хестинс (М. R. Hestenes) 135, Шнирельман Л. 168 258 Шода (К. Shoda) 249 Хилле (Е. НШе) 214 Шрайбер (S. Schreiber) 308 Холланд (J. Holland) 53 Штурм (С. Sturm) 98, 116, 146, 149, Хопф (Н. Нор!) 257, 340 154, 176, 287 Хори (Jun-ichi Hori) 315 Шур (I. Schur) 54, 66, 94, 96, 116, 117, Хорн (A. Horn) 360, 361 122, 132, 137, 167, 170, 231, 254. Хотеллинг (Н. Hottelling) 130 257, 277, 306, 358 Хуа Ло-Ген (L. К. Ниа) 168, Шура-Бура М. Р. 360 170 Эддингтон (A. Eddington) 255 Чен Кво-цай (Kvo-Tsai Chen) 215 Эйлер (L. Euler) 27, 219 Шварц (Н. R. Schwarz) 155, 287, 290 Энглман (R. Englman) 316 Шварцман П. А. 360 Энтховен (A. S. Enthoven) 290, 335, Швердфегер (Н. Schwerdtfeger) 33. 339 277 Эрмит (С. Hermite) 16, 47, 71, 283, Шекере (G. Szekeres) 251 352, 353 Шерман (S. Sherman) 139 Эрроу (К. J. Arrow) 290, 335, 339 Шефли (С. Schafli) 50 Эфферц (F. H. Effertz) 139, 290, 335 Шёнберг (F. J. Schoenberg) 133, 191, Якоби (К. Jackobi) 50, 52, 115, 131, 343 177, 179, 181, 184, 191, 202, 250, Шилов Г. Е. 97 317,349 Шлезингер (L. Schlesinger) 215 Якубович В. А. 361 ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ Алгебра кронекеровских —, — независимость 68 произведений 265 —, ортогональность 37 Алгебраическое дополнение 49, 345 — ортонормированные 38 Биортогональность 243 —, ортонормированный набор 70 Вариации связанные 102 —, равенство 35 Вектор 34 —, сложение 35 — вероятностный 294 Задача наименьшего отклонения 173 — инвариантный 44 Закон инерции Якоби — Сильвестра —, компоненты 35 349 — неотрицательный 292, 319 Коммутатор 50 — нулевой 36 Корень из матрицы 121 — положительный 294, 319 Критерий Гурвица 283, 286 —, размерность 35 — Сильвестра 99 — собственный 58 Кронекеровская производная от столбец 35 матрицы 275 строка 35 — сумма 267, 268 —, умножение на скаляр 36 Кронекеровский логарифм Векторы, линейная зависимость 68 267
Линейное программирование 332 Линейные неравенства 331 — однородные уравнения, решение 56 , — нетривиальное 57 , — тривиальное 344 — уравнения с периодическими коэффициентами 238 Математическая экономика 326 Матрица 38 — Адамара337 — ассоциированная 272 — вещественная 39 — вырожденная (особенная) 118 — ганкелева 354 — двояко стохастическая 308 Матрица, диагонализация 224 — диагональная 41, 62 — доминантная 337 — единичная 39 — идемпотентная 94 —, каноническая форма Жордана 227, 228 — квадратная 38 — клеточная 111 — комплексно сопряженная 39 — кососимметрическая 64 — косоэрмитова 66 — Лоренца 95 — марковская 294, 301 — Минковского — Леонтьева 329 — невырожденная (неособенная) 118 — неотрицательная 292 — нормальная 233 — нулевая 39 —, область положительности 342, 343 — обратная 118 — ортогональная 48 — платежей 332 — положительная 292, 318 — положительно определенная 65 — прямоугольная 109 —, размер (порядок) 38 — симметризуемая 94 — симметрическая 46 , диагонализация 79 , каноническая форма 56 , параметрическое представление элементов 122 , ранг 151 —, след 94, 124 — случайная 312 , среднее значение 313 —, собственное значение 58 — тёплицева 275, 355 — транспонированная 45, 110 — треугольная 41 —, треугольная форма 231 — унитарная 49 —, "условия устойчивости 284, 287 — устойчивая 280 —, характеристическое уравнение 58, 87 —, — число 58 —, — кратное 58, 226, 228 —, простое 58 —, элемент 38 — эрмитова 47 — Якоби52, 133, 177, 179 Матрицы коммутативные 42 —, одновременное приведение к диагональной форме 81 —, равенство 38 — слабо связанные 183 Метод Ляпунова 280 — ортогонализации Грама — Шмидта 68 — Фишера 355 — Эйлера 219 Метод Эрмита 352 Многочлен устойчивый 283 Моменты 356 Неравенство Адамара 159
— Бергстрома 160 — Гель дера 156 — Коши — Шварца 155 — треугольника 37 — Шура 167 Норма вектора 196 — матрицы 196 Нормирование решения 26 Оператор сопряженный 55 Определитель Вандермонда 222 — Вронского 251, 252 — Грама 70, 92 — Касорати 252 — Коши 223 —Отклонение среднеквадратичное 282 Отношение Релея 141 Полиномы Лагерра 71 — Лежандра71 — Эрмита71 Правило Крамера 81, 345 Преобразование Гаусса 51 — дробно-линейное 41 — индукционное 46 — квадратичное 305 — Кэли120 — Лапласа 245 в матричном случае 248 — линейное однородное 305 — Лоренца 95, 96 — «растягивающее» 84 — сопряженное 46, 55 —, уменьшающее вариацию 343 — унитарное 305 — Фурье конечное 51 — Шура 306 Принцип суперпозиции 220 Проблема Штурма — Лиувилля 176 Произведение кронекеровское 264 — матриц, ассоциативность 43 , некоммутативность 42 — скалярное векторов 36 обобщенное 94 Процесс марковский дискретный 295 , асимптотическое поведение 295, 296 , принятие решений 334 — стохастический непрерывный 303 простой 292 Ранг квадратичной формы 344 — матрицы 349 Рост, непрерывные процессы 324 — стационарный 323 Ряд матричный 197 Символ Кронекера 40 Система неустойчивая 278 Система сопряженная 205, 206 — устойчивая 278 , необходимые и достаточные условия 279 Скаляр 35 Скобки Якоби 250 Спектр 67 Теорема Гамильтона — Кэли 237, 255 для симметрических матриц 81 — Герглотца 357 — Куранта — Фишера 143 — об аппроксимации вторая 236 первая 235 — о представлении 148 — отделения Пуанкаре 147, 151 Штурма 146 — Перрона 319 , аналог 325 , обобщение 335 о приведении к треугольному виду 251 — Пуанкаре — Ляпунова 289 — Стилтьеса 188 — Финслера 103 — фон Неймана 333 — Хелли 357 — Шура 122, 132,231
Теория возмущений 86, 87, 205 — игр 332 Тождество Лагранжа 74, 162 — Якоби 202 Точка седловая 23 — стационарная 21 Умножение вектора на матрицу 39 скаляр 36 — матрицы на матрицу 40 скаляр 39 Уравнение вариационное 149 , приближенный метод решения 149. 150 — Матье238 — Риккати 249 — функциональное Пойа 208 Форма билинейная 51 — квадратичная 23 неопределенная 30 неотрицательная 30 неположительная 30 , одновременное приведение к сумме квадратов 84 отрицательно определенная 30 , представление в виде суммы квадратов 102 , приведение к каноническому виду 63 положительно определенная 30, 65 , сигнатура 350 — тёплицева 355 Экспонента матричная 200 , функциональные уравнения 201, 202 Якобиан 52
ПРЕДИСЛОВИЕ РЕДАКТОРА ПЕРЕВОДА Предлагаемый читателю перевод книги известного амери- американского математика Р. Беллмана «Введение в теорию матриц» вызовет безусловный интерес не только у физиков, механиков и инженеров, использующих матричный аппарат, но и у специа- специалистов-математиков, интересующихся математическими аспек- аспектами теории. В книге излагается собственно теория матриц и ее приложе- приложения к теории дифференциальных уравнений, теории вероятно- вероятностей, математической экономике, проблеме отыскания экстре- экстремума в случае большого числа переменных и другим вопросам. Помимо основного текста, в котором,как правило,приводятся доказательства сравнительно несложных утверждений, автор в конце каждой главы помещает значительное число задач, углу- углубляющих и развивающих затрагиваемые вопросы. Часть задач уводит читателя далеко за рамки основного текста. Как отмечает автор книги, задачи не расположены в тексте в порядке возрастающей трудности. Мы сохранили тот же по- порядок задач, хотя это, на наш взгляд, и вызовет у читателя известные трудности. Несмотря на то, что на русском языке имеется прекрасная монография Ф. Р. Гантмахера по теории матриц, перевод книги Р. Беллмана следует признать целесообразным. Уступая книге Ф. Р. Гантмахера в систематичности, стройности и последова- последовательности изложения, книга Р. Беллмана отличается широким охватом новых проблем теории матриц и ее приложений. Ценность :;ниги повышают приводимые автором в конце каж* дой главы обзоры, в которых названы и прокомментированы оригинальные статьи и новые результаты в соответствующем направлении.
ПРЕДИСЛОВИЕ РЕДАКТОРА ПЕРЕВОДА 9 При переводе книги были устранены опечатки и прочие по- погрешности, которых в оригинале обнаружилось значительное количество. Некоторые доказательства, оказавшиеся неудач- неудачными, были заменены. При редактировании были сделаны примечания и составлен дополнительный список литературы. Число работ по теории матриц непрерывно растет. Мы ука- указали лишь те из них, которые имеют непосредственное отноше- отношение к вопросам, обсуждаемым в книге. В проверке задач (их в книге более шестисот) мне помог А. Я. Белянков. Пользуясь случаем, приношу ему свою при- признательность. В. Б. Лидс кий
ПРЕДИСЛОВИЕ АВТОРА К РУССКОМУ ИЗДАНИЮ Перевод этой книги на русский язык — для меня честь и большая радость. Различие в языках ставит преграды между народами, и переводы служат благородной цели осуществления свободного обмена, который иначе был бы невозможен. Они позволяют узнать все то прекрасное и доброе, что создано дру- другими культурами. Поскольку теория матриц — одна из самых изящных частей математического анализа, естественно, чтобы русские работы в этой области переводились на английский язык и наоборот. Я хотел бы надеяться, что эту книгу прочтут с тем же удоволь- удовольствием, с которым я ее писал. Еще одно замечание. Сейчас трудное время для всех, кто заинтересован в мире и процветании народов. Будем надеяться, что тот факт, что в США и в СССР так много поборников правды и красоты, послужит делу объединения наших народов и что дружба между нашими народами приведет к счастливой жизни, к которой все стремятся. Ричард Беллман Лос Анджелес, Калифорния Университет Южной Калифорнии
ПРЕДИСЛОВИЕ АВТОРА К АНГЛИЙСКОМУ ИЗДАНИЮ Цель настоящего тома — ввести читателя в круг идей и ме- методов теории матриц, которую можно справедливо считать арифметикой высшей математики. Постараемся оправдать наше решение отвести теории матриц столь важную роль. Рассматривая в целом любую из класси- классических областей математики, нетрудно заметить, что наиболее интересные и важные ее разделы связаны с анализом взаимо- взаимодействия различных факторов. Одним из примеров описания этого взаимодействия служат функции от нескольких перемен- переменных. Анализ таких функций приводит к преобразованиям много- многомерного типа. Довольно быстро становится ясным, что само описание воз- возникающих при этом задач сопряжено со значительными труд- трудностями. Достаточно обратиться к работам, написанным сто лет назад, чтобы убедиться в том, как велика опасность в начале любого исследования потонуть в море арифметических и алге- алгебраических деталей. И это помимо многочисленных понятий и аналитических трудностей. Таким образом, решительные усилия должны быть направ- направлены прежде всего на создание удобных, гибких и восприимчи- восприимчивых обозначений. Хотя какая-либо количественная оценка за- зависимости успеха исследования от хорошо придуманных обо- обозначений вряд ли будет иметь смысл, нетрудно привести огром- огромное число примеров, когда решения становились очевидными благодаря удачной формулировке задачи. Напротив, там, где используются неуклюжие и туманные обозначения, для решения потребуются неизмеримо большие усилия. Представьте себе, на- например, как сложно было бы производить арифметические и алгебраические операции с римскими цифрами. Хорошо построенными обозначениями нужно стремиться вы- выразить математическую суть задачи, и ни в коем случае не за- затемнять ее и не отвлекать от нее. Сделав такое вступление, мы теперь выскажем очень простой силлогизм: матрицы являются наиболее важными преобра- преобразованиями-— линейными преобразованиями; преобразования
12 ПРЕДИСЛОВИЕ АВТОРА К АНГЛИЙСКОМУ ИЗДАНИЮ образуют сердцевину математики. В этом суть нашего первого утверждения. Этот том, первый из планируемой к выпуску серии, посвящен- посвященной результатам и методам современной теории матриц, должен познакомить читателя с основными понятиями теории матриц. Особое внимание в нем будет уделено анализу и приложениям к задачам математической физики, техники и математической экономики. Теория матриц на том уровне, на котором мы собираемся ее здесь излагать, довольно четко распадается на три части: теория симметрических матриц, которая проникает во все об- области; матрицы и дифференциальные уравнения — раздел, пред- представляющий интерес в первую очередь для инженера и физика; положительные матрицы, играющие особо важную роль в тео- теории вероятностей и математической экономике. Хотя мы не пытались связать изложение материала с ка- какими-либо реальными прикладными задачами, мы всегда стара- старались указать на происхождение основных проблем, рассматри- рассматриваемых в книге. Изложение начинается с задачи нахождения максимума или минимума функции нескольких переменных. Используя методы дифференциального исчисления, мы показываем, что определе- определение локального максимума или минимума при обычных пред- предположениях о существовании достаточного числа частных про- производных приводит к соответствующей задаче для функций, значительно более простых, а именно к квадратичным функциям. Таким образом, мы приходим к рассмотрению квадратичных форм, а следовательно, и симметрических матриц. Сначала рассматривается случай функции двух переменных, где обычных обозначений вполне достаточно для описания всех интересующих нас результатов. Обратившись к случаю более высокого числа измерений, мы убедимся в необходимости новых обозначений. Тем не менее глубокое понимание двумерного слу- случая очень важно, поскольку все важные черты многомерного случая содержатся уже здесь. Оставив задачу многомерной максимизации, мы обращаемся к введению матричных обозначений. При этом на каждом этапе мы стараемся вводить только те новые символы и понятия, в которых возникает необходимость. Читателя, возможно, удивит, насколько далеко можно продвинуться в изучении теории сим- симметрических матриц, не вводя понятия обратной матрицы. Следуя этой идее, мы отказались от обычного подхода, при котором новое понятие обратной матрицы заливают потоком результатов, связанных с решением линейных систем уравне- уравнений. Никоим образом не желая умалить важность такого под*
ПРЕДИСЛОВИЕ АВТОРА К АНГЛИЙСКОМУ ИЗДАНИЮ [3 хода, отметим все же, что, отказавшись от этого длинного и несколько утомительного пути, можно все же изложить целый ряд важных и интересных результатов. Понятие линейной не- независимости вводится в связи с процессом ортогонализации, где оно играет первостепенную роль. В приложении приводится доказательство основного результата, касающегося решений линейных систем, а также обсуждаются некоторые теоремы о ранге матрицы. Это понятие, очень важное для многих разделов теории ма- матриц, не имеет большого значения в тех разделах, которые мы здесь изучаем. Очень часто во многих разделах математики от читателя требуют большого количества подготовительного материала, на первый взгляд не имеющего прямого отношения к основным результатам. Мы старались избегать такого положения. Осно- Основанием для введения нового понятия для нас служило возник- возникновение конкретной задачи. Это в какой-то мере отражает дей- действительное положение вещей, с которым сталкивается мате- математик в своих исследованиях. Хотя мы и старались сделать логичным наше изложение, это не было самоцелью. Логика в конце концов является одним из приемов, изобретенных человеческим умом для решения опре- определенных задач. Но математика — это больше, чем логика, это — логика плюс процесс созидания. То, каким образом за- законы и понятия логики, составляющие орудие математики, ис- используются для получения результатов, вряд ли является логи- логическим процессом, во всяком случае, не более логическим, чем создание симфонии или картины. Введя квадратные матрицы, центральный объект нашего ис- исследования, мы займемся каноническим представлением дей- действительных квадратичных форм или, что то же, действитель- действительных симметрических матриц. Здесь будет установлен очень важ- важный результат теории симметрических матриц, состоящий в том, что всякая действительная симметрическая матрица в опреде-- ленном смысле эквивалентна диагональной матрице. Другими словами, многомерные преобразования этого типа можно рассматривать как совокупность одновременно выпол- выполняемых одномерных преобразований. Результаты этих вступительных глав поучительны по ряду причин. Прежде всего они показывают, как существенно упро- упрощаются доказательства, если предположить, что характеристик ческие числа матрицы простые. Во-вторых, на их примере можно убедиться, что трудности, возникающие из-за кратности харак- характеристических чисел, могут быть преодолены при помощи двух
14 ПРЕДИСЛОВИЕ АВТОРА К АНГЛИЙСКОМУ ИЗДАНИЮ мощных методов: индукции и предельного перехода по непре- непрерывности. Второй из этих методов требует очень осторожного обраще- обращения. Без преувеличения можно сказать, что те моменты доказа- доказательств, где мы пользуемся им, являются самыми трудными во всей книге. Именно поэтому мы не везде, где это возможно, пользовались этим приемом и часто лишь ограничивались ука- указанием на его применимость. Читатели могут воспринимать это как вызов или, скорее, призыв провести доказательство этим методом во всех деталях. Получив диагональное представление, мы приступим к вы- выводу минимаксных свойств характеристических чисел, открытых Курантом и Фишером. Обобщение этих свойств на случай опе- операторов с частными производными, проведенное Курантом, яв- является одним из выдающихся достижений математики. После этого вполне уместно заняться некоторыми дальней- дальнейшими свойствами матриц. В частности, мы изучим некоторые частные функции матриц. Вопрос об общем определении функции от матриц довольно сложен, и мы лишь слегка затро- затронем его. Далее, мы вернемся к нашей исходной задаче — исследова- исследованию области значений квадратичной формы. На этот раз, прав- правда, мы усложним задачу введением линейных ограничений. Это усложнение не только интересно само по себе, но и дает нам прекрасный повод для введения прямоугольных матриц. На этой стадии разумно рассмотреть матрицы, элементы которых сами являются матрицами. Такое обобщение матричных обозначе- обозначений часто оказывается чрезвычайно полезным. После этого мы рассмотрим ряд очень интересных матрич- матричных неравенств, характеризующих собственные значения, а так- также различные функции собственных значений. Глава, посвя- посвященная неравенствам, является наиболее специальной из всех глав этой книги; она скорее отражает вкусы автора, нежели отвечает потребностям читателя. В последней из глав, посвященных симметрическим матри- матрицам, рассматривается метод функциональных уравнений дина- динамического программирования. Ряд задач максимизации и ми- минимизации квадратичных форм, а также решение линейных си- систем изучаются с помощью этого метода. Интересной чертой получаемых аналитических результатов является их явная зави- зависимость от параметров, которые при решении обычно считают постоянными. Вместе с тем рекуррентные соотношения, которые лежат в основе метода динамического программирования, при- приводят к алгоритмам, нередко оказывающимся удобными с вы- вычислительной точки зрения.
ПРЕДИСЛОВИЕ АВТОРА К АНГЛИЙСКОМУ ИЗДАНИЮ 15 Вторая треть этого тома посвящена приложению теории ма- матриц к решению линейных систем дифференциальных уравне- уравнений. У читателя не предполагается предварительного знакомства с дифференциальными уравнениями. Требующиеся теоремы су- существования и единственности для линейных систем будут до- доказаны в ходе изложения. Важную роль в исследовании линейных систем с постоян- постоянными коэффициентами играет понятие матричного экспонен- экспоненциала. Через эту функцию от матрицы выражается решение линейной системы. Случай переменных коэффициентов более сложен. Для того чтобы получить аналогичное выражение для решения в этом случае, нужно ввести понятие матрицанта. Однако рассмотрение этого понятия выходит за рамки этой книги. Заметим, что матрицант играет важную роль в современ- современной квантовой механике. Хотя экспоненциал и очень удобен для представления реше- решения линейной системы с постоянными коэффициентами, он не дает выражений для отдельных компонент решения. Для этой цели мы пользуемся методом Эйлера нахождения частных реше- решений экспоненциального вида. При этом мы опять приходим к задаче определения характеристических чисел и собственных векторов матрицы. Поскольку здесь матрица уже не является, вообще говоря, симметрической, эта задача много сложнее той, которой мы занимались в предыдущих главах. Хотя и здесь имеется несколько канонических форм, ни одна из них уже не является такой удобной, как диагональная форма, полученная в случае симметрических и эрмитовых матриц. Представление решения в виде суммы экспонент, а также предельные случаи позволяют нам сформулировать необходимые и достаточные условия того, что все решения однородной си- системы стремятся к нулевому вектору при стремлении к беско- бесконечности временного параметра. Так мы приходим к задаче устойчивости и формулируем несколько критериев устойчиво- устойчивости. В общем виде эта задача чрезвычайно сложна. Получив ряд результатов для общего случая не обязательно симметрических матриц, мы обращаемся к задачам, представ- представляющим более специфический интерес. Дана матрица Л. Как определить матрицу, собственные значения которой являются определенными функциями от собственных значений Л? Если мы разыскиваем эти функции как некоторые симметрические функции от собственных значений Л, то весьма естественным образом мы приходим к одной из важнейших концепций алгеб- алгебры матриц—к понятию кронекеровского произведения двух матриц. Как мы увидим в заключительной части книги, эта
16 ПРЕДИСЛОВИЕ АВТОРА К АНГЛИЙСКОМУ ИЗДАНИЮ функция от двух матриц появляется также при изучении случай- случайных матриц. Заключительная часть этого тома посвящена изучению ма- матриц, все элементы которых неотрицательны. Матрицы этого явно специального вида появляются двумя возможными путями: во-первых, при изучении марковских процессов и, во-вторых, при решении различных экономических задач. Рассмотрение физических истоков этих матриц делает интуи- интуитивно ясным большое число важных и интересных предельных теорем, связанных с именами Маркова, Перрона и Фробениуса. Фундаментальную роль в теории положительных матриц играет, в частности, ряд преобразований, выполненных Виландом. Небольшая глава посвящена теории случайных матриц. В этой области мы имеем дело скорее с мультипликативными и, следовательно, некоммутативными операциями, чем с адди- аддитивными и коммутативными. Эти аспекты теории стохастических процессов почти не исследованы. Результаты, которые мы при- приводим, являются вводными и достаточно элементарными. Наконец, в серии приложений изложены некоторые дополни- дополнительные сведения, которые либо имеют косвенное отношение к основным проблемам книги, либо представляют весьма специ- специальный интерес. Результаты, полученные в теории симметриче- симметрических матриц Селбергом, Эрмитом и Фишером, являются столь элегантными, что остается только сожалеть, что не было абсо- абсолютно никакой возможности включить их в книгу. Несколько слов к читателю, впервые обращающемуся к этой пленительной области. Как указывалось выше, этот том написан как введение в теорию матриц. Хотя все главы являются ввод- вводными в этом смысле, однако, перефразируя слова Оруэла, мож- можно сказать, что некоторые из них являются более вводными, чем другие. Следовательно, не обязательно читать главы одну за другой. Начинающему настоятельно советуем прочесть главы 1—5 в ка- качестве общего введения в теорию матричных операций и как зачатки теории симметрических матриц. После этого целесо- целесообразно перейти к общему изучению квадратных матриц, исполь- используя для этой цели гл. 10 и 11. Наконец, для понимания общих основ марковских и неотрицательных матриц могут быть изу- изучены гл. 14 и 16 .Совместно с решением ряда упражнений этот материал составит содержание семестрового курса лекций. Читатель, изучающий теорию матриц самостоятельно, может следовать своей собственной программе. Поднявшись на этот уровень, можно перейти к следующей важной области — минимаксным свойствам собственных значе- значений матриц. В этой связи предлагается изучить кронекеровское
ПРЕДИСЛОВИЕ АВТОРА К АНГЛИЙСКОМУ ИЗДАНИЮ 17 произведение. Здесь кажется подходящей гл, 6. Оставшиеся главы могут читаться после этого в любой последователь- последовательности. Несколько замечаний относительно упражнений. Поскольку цель математиков состоит в том, чтобы решать задачи, то оче- очевидно, что невозможно оценить свой собственный прогресс, не пробуя свои силы на некоторых задачах. Что мы пытались сде- сделать— это предусмотреть задачи разной степени сложности, начиная от чисто иллюстративных и кончая задачами достаточ- достаточней степени трудности. Эти последние могут быть обычно опу- опущены при беглом ознакомлении с книгой. Задачи, непосред- непосредственно следующие за каждым параграфом, являются, вообще говоря, обычными и включены для целей тренировки. Лишь не- небольшая часть из них — задачи повышенной трудности. Они содержат результаты, которые используются в последующем тексте. Поскольку соответствующие результаты могут быть уста- установлены без больших усилий, мы считаем, что было бы лучше включить их в виде упражнений, нежели чрезмерно увеличивать основной текст, приводя все доказательства. Во всяком случае, при серьезном чтении тренировка необходима. Задачи в конце каждой главы обладают, напротив, обычно повышенной труд- трудностью. Хотя имеется соблазн как-то выделить эти задачи (на- (например, отметив их звездочкой), как обладающие повышенной трудностью, небольшое раздумье показывает, что педагогически это было бы очень плохо. Целью такой книги, как эта, является, кроме всего прочего, подготовить студента к самостоятельному решению задач в том виде, как они появляются в исследованиях в области анализа, математической физики, в технике, эконо- экономике и т. д. Очень редко встречается случай, когда задача, по- появившаяся таким образом, четко поставлена так, что ее можно считать отмеченной звездочкой. Более того, для студента важно сделать вывод, что сложность задачи практически никогда не оценивается ее формулировкой. Очень быстро можно убедиться, что некоторые весьма простые утверждения могут скрывать зна- значительные трудности. Приняв во внимание эти соображения, мы перемешали задачи всех уровней трудности совершенно случай- случайным образом, без указаний на сложность их решения. Отсюда следует, что, штурмуя эти задачи, читатель должен сделать все, что может, проявляя иногда упорство и, быть может, возвра- возвращаясь назад снова и снова по мере роста аналитического уме- умения и зрелости. Несколько замечаний относительно общего плана книги. Мы хотели не только изложить ряд основополагающих результатов, но и указать на разнообразие фундаментальных методов. Чтобы это сделать, мы в различных местах представляли разные 2 Р. Беллман
18 ПРЕДИСЛОВИЕ АВТОРА К АНГЛИЙСКОМУ ИЗДАНИЮ доказательства теорем или указывали на другие возможные под- подходы в упражнениях. Существенно отдавать себе отчет в том, что, как и во всех частях математики, в теории матриц имеется много разных подходов. Важность владения многими методами вытекает из того факта, что для получения различных обобще- обобщений теории требуются различные подходы. На самом деле, не- некоторые результаты могут быть почти очевидными при исполь- использовании одного метода доказательства и в то же время быть трудно достижимыми или вообще недостижимыми, если избрать другой путь рассуждений. Хотя многие результаты теории ма- матриц могут быть успешно и весьма элегантно выведены из об- общей теории операторов, важно также выделить особые методы и приемы, относящиеся к специальной области, имеющей дело с преобразованиями в конечномерных пространствах. Это и яви- явилось причиной того, что мы попытались вытащить из забвения ряд простых и эффективных подходов, которые использовались в «старые добрые времена», пятьдесят — семьдесят пять лет назад. Свойством человеческого мышления объясняется то, что по- повторение и перекрестные точки зрения являются мощным педа- педагогическим приемом. В этой связи уместно привести слова из- «Охоты на Снарка» Льюиса Кэррола: «Я сказал это трижды: то, что я говорю три раза, — правда». Перечислим теперь кратко некоторые из многих фундамен- фундаментальных аспектов теории матриц, которые по необходимости не были включены в книгу. Во-первых, мы исключили обсуждение всех вычислительных аспектов матричной теории. Вычислительные методы получили широкое развитие в последние годы, что стимулировалось не- необычайными возможностями современных цифровых машин и их планируемым развитием в будущем и, кроме того, необы- необычайно возросшими потребностями физики и экономики. Необходимость развития новых методов чисто вычислитель- вычислительной природы вытекает из того факта, что задача решения си- системы линейных уравнений с очень большим числом переменных или задача нахождения собственных значений и собственных векторов матриц большой размерности не может быть решена классическим способом. Любое подходящее решение этой задачи требует использования новых и тонких методов. В этой области проделана чрезвычайно большая работа, и мы подумали, что мудрым решением будет выделить отдельный том этой серии для изложения соответствующих результатов. Этот том будет написан Дж. Форсайтом. Другим направлением является комбинаторная теория ма- матриц, которая в последние годы растет как снежный ком. Мате*
ПРЕДИСЛОВИЕ АВТОРА К АНГЛИЙСКОМУ ИЗДАНИЮ 14 матическая теория игр Бореля и фон Неймана, теория линейного программирования, математическая теория расписаний — все эти области объединяются, что, возможно, приведет к новому разделу теории матриц. На этом пути не только появляются новые и значительные алгебраические и аналитические про- проблемы, но и как результат этих методов и концепций оказы- оказывается определенное давление на способы получения вычисли- вычислительных процедур. Том, касающийся этой области, будет напи- написан А. Хофманом. Топологические аспекты входят классически в теорию матриц при изучении электрических цепей. Здесь мы встречаемся с пре- прекрасным сочетанием аналитической, алгебраической и геометри- геометрической теорий. Том, посвященный этой важной области, должен быть написан Л. Вейнбергом. В предшествующем перечислении мы, естественно, едва лишь затронули область, называемую теорией матриц. На отдален- отдаленном горизонте мы видим монографию, посвященную курсу тео- теории матриц повышенного типа. Среди других результатов она должна содержать различные аспекты теории функций от ма- матриц, теории Левнара, зигелевской теории модулярных функций от матриц и теории /^-матриц Вигнера. В более общей теории функционалов от матриц теория Бекера, Кемпбелла и Хаус- дорфа приводит к изучению мультипликативных интегралов. Эти аспекты теории взяли на себя главную роль во многих обла- областях современной математической физики. Другая обширная часть матричного анализа развита в связи с изучением многомерного анализа в математической статистике. Снова мы чувствуем, что результаты в этой области могут быть наилучшим образом изложены совместно с основными кон- концепциями статистики. На общей базе анализа и алгебры мы встречаем теорию представления групп со многими ее прекрасными приложениями к алгебре, анализу и математической физике. Эта область также требует отдельного тома. В чисто алгебраической области имеется теория идеалов, рассматриваемая с помощью матриц, введенных Пуанкаре. Мы не упоминали об этом, поскольку использование таких матриц требует введения чисто формальных концепций. Однако в упражнениях постоянно встречаются упоминания о связи между комплексными числами, кватернионами и матрицами наряду с намеками на более общие взаимосвязи. Изучение матриц с целочисленными элементами тесно свя- связано с числовой теорией матриц. Несмотря на привлекатель- привлекательность этой области, мы чувствовали, что было бы лучше де- детально обсудить эти вопросы в отдельном томе.
20 ПРЕДИСЛОВИЕ АВТОРА К АНГЛИЙСКОМУ ИЗДАНИЮ Важно отметить, что даже приведенный выше перечень не отражает той большой роли, которую играют матрицы в совре- современной математике и ее приложениях. В конец каждой главы и иногда в упражнения мы включили большое количество ссылок на оригинальные статьи, моногра- монографии и различные книги по теории матриц. Читатель, интересую- интересующийся деталями, может основательно с ними познакомиться, воспользовавшись этими ссылками. Мы ни в коем случае не пре- претендуем на исчерпывающую библиографию. Многие из значи- значительных работ не были упомянуты. В заключение мне хотелось бы выразить сердечную благо- благодарность моим друзьям, скрупулезно просмотревшим несколько набросков рукописи. Благодаря их замечаниям и критике были сделаны существенные улучшения в содержании, стиле изло- изложения и форме многих интересных упражнений. Благодарю Поля Брока, Фан Цзы и Ольгу Таусски. Искренне благодарю также А. Маданского и И. Олькина, прочитавших некоторые главы и сделавших замечания по улуч- улучшению некоторых интересных задач. Я особенно рад выразить благодарность RAND Corporation за ее политику в области исследований, которая привела к су- существенной поддержке моей работы по теории матриц. Это только один из аспектов свободы действий, предоставляемых RAND Corporation с тем, чтобы одновременно развивать науч- научные исследования и служить интересу нации. Наконец, благодарю моего секретаря Жанетт Гиберт, кото- которая безропотно печатала сотни страниц уравнений, без всяких жалоб делала правку за правкой и преданно помогала мне в вычитке текста. Ричард Беллман
Глава t МАКСИМИЗАЦИЯ И МИНИМИЗАЦИЯ. ОБОСНОВАНИЕ § 1. Введение. Цель этой вводной главы состоит в том, чтобы указать на естественную связь, существующую между пробле- проблемой определения области значений однородной квадратичной функции и нахождением максимума или минимума произволь- произвольной функции двух переменных. Мы исследуем проблему экстремальных значений квадра- квадратичной функции двух переменных (квадратичной формы двух переменных) весьма подробно. Для этого имеется ряд важных причин. Прежде всего мы демонстрируем три различных метода исследования: алгебраический, аналитический и геометрический. Каждый из этих методов при соответствующем истолковании может быть обобщен на многомерный случай, который мы бу- будем рассматривать впоследствии. С методической точки зрения еще более важным является то, чго алгебраические и аналити- аналитические осложнения, возникающие при исследовании двумерного случая, становятся трудно преодолимыми в /V-мерном варианте задачи. Это обстоятельство выявляет острую потребность в но- новых обозначениях. Таким образом, подробное изучение двумерного случая до- доставляет превосходный материал, служащий оправданием при введении новых понятий. § 2. Максимизация функции одной переменной. Пусть на за- замкнутом интервале [а, Ь] задана действительная функция веще- вещественной переменной х, допускающая разложение в сходящийся ряд Тейлора f(x) = f(c) + (x-c)r(c) + ^^r(c)+... A) в каждой точке открытого интервала (а, Ь). Пусть с — стационарная точка функции f(x), т. е. точка, в которой f'(x)=0, и пусть требуется определить, является ли с
32 МАКСИМИЗАЦИЯ И МИНИМИЗАЦИЯ ОБОСНОВАНИЕ [ГЛ. 1 точкой относительного максимума, относительного минимума или стационарной точкой более сложной природы. Если с — стационарная точка, то ряд A) принимает более простой вид {-^?f"(c)+... B) В случае, когда f"(c)=O, мы должны рассмотреть последующие члены разложения. Однако если f"(с) ФО, то знак второй про- производной определяет характер стационарной точки: функция f(x) имеет относительный минимум в точке х — с при услоаии, что /"(с)>0, и относительный максимум, если /"(с)<0. Упражнение 1. Указать достаточное условие относительного максимума функции, если Г(с)=о. § 3. Максимизация функции двух переменных. Перейдем к рас- рассмотрению тех же вопросов для функции двух переменных f(x, у), определенной на прямоугольнике а\ ^Сх ^СЬи а2^Су*С -^ t>2 и допускающей разложение в сходящийся ряд Тейлора в каждой точке (с,, с2) внутри этой области. Для достаточно малых \х — с, | и \у — с2\ можно записать 2 дс\ дс1 дс2 2 дс2 где df df ^7 = ~а7 при А' = с" У = С^ 8f _ df B) и т. д. Пусть (сь с2) — стационарная точка функции \{х,у),что озна- означает выполнение следующих равенств: -|L = o, # = о. C) дсх ' дс2 к ' Тогда, как и в предшествующем параграфе, поведение функции f(x, у) в окрестности точки (с\, с2) определяется характером квадратичных членов разложения A), а именно: c2J, D)
§ 4] АЛГЕБРАИЧЕСКИЙ ПОДХОД 2i' где для упрощения обозначений принято CL ^^ т , ZO ^= , С = ^-. (О/ 2 dcf ocj дс2 2 ас^ Положим еще для удобства X —C\ = U, у — C2 = V F) и перейдем к рассмотрению однородной квадратичной функции Q(u, v) =au2 + 2buv + cv2. G) Выражение такого вида будем называть квадратичной фор- формой, в данном случае квадратичной формой двух переменных и и v. Хотя мы интересуемся поведением Q(u,v) лишь в окрест- окрестности нуля, ы = у = 0, тот факт, что квадратичная форма Q(u, v) является однородной, позволяет нам при желании рассмотреть ее значения при любых вещественных и и v. Поскольку для любого k Q(ku, kv) =k'2Q(u, у), значения квадратичной формы Q(u, v) на окружности u2 + v2 = k2 весьма просто связаны со значениями Q(u, и) на окружности единич- единичного радиуса u2 + v2=\. Поэтому удобно ограничиться значе- значениями формы на единичной окружности. Если Q(u, v) >0 для всех отличных от нуля значений и и v, то f(x, у) имеет в точке х=С\, у=сп относительный минимум. Если же Q(u, v)<0, то в этой точке имеется относительный мак- максимум, В случае, когда Q(u, v) может принимать как положи- положительные, так и отрицательные значения, мы встречаемся со ста- стационарной точкой более сложного типа, так называемой седло- вой точкой. Хотя в связи с рассмотрением седловой точки возникает большое число очень интересных алгебраических и геометриче- геометрических вопросов, в настоящей книге мы не будем их касаться. Если Q(u, v) —тождественный нуль, то мы приходим к еще более сложной проблеме, к счастью, не имеющей большого зна- значения для приложений. Упражнение 1. Можно ли свести исследование положительности или отрицательное! if однородной формы четвертой степени Q(u,v)- к рассмотрению соответствующей задачи для квадратичных форм? § 4. Алгебраический подход. Рассмотрим теперь несколько про- простых соотношений, связывающих коэффициенты вещественной;
24 МАКСИМИЗАЦИЯ И МИНИМИЗАЦИЯ ОБОСНОВАНИЕ [ГЛ. I квадратичной формы a, b и с, которые позволяют ответить на во- вопрос, с каким из трех описанных выше случаев мы имеем дело. Для того чтобы определить знак квадратичной формы, до- дополним выражение au2 + 2buu до полного квадрата и, предпо- предполагая, что аФО, запишем Q(u, v) в следующем виде: г\ I \ ( , bv \2 , I б2 \ 9 ,. ч Q(u, v) = a U + — + [с- — о2. A) В случае, если а = 0, сфО, мы можем выполнить аналогичное преобразование, поменяв местами аргументы и и v. Если же а = с = 0, то Q(«, и) становится равной 2buv, При этом очевидно, что квадратичная форма может принимать как отрицательные, так и положительные значения при ЬФО и тождественно равн-л нулю в случае, когда 6 = 0, Будем в дальнейшем предполагать, что аФО, так как в противном случае ход решения задачи ясен из приведенных рассуждений. Из формулы A) следует, что Q(u, v) >0 для всех нетри- нетривиальных значений и и v (т. е. для всех и и и, за исключением нулевой точки @, 0)), если только а>0, с-^->0. B) Аналогично этому Q(u, v) <0 для всех нетривиальных и и v при условии выполнения неравенств а<0, с--?<0. C) Справедливо и обратное утверждение. Если квадратичная форма Q положительна для всех нетривиальных значений и и и, то коэффициенты формы удовлетворяют неравенствам B). Аналогичный результат справедлив также в случае, когда •форма Q отрицательна для всех нетривиальных значений и и v. Таким образом, мы доказали следующую теорему. Теорема 1. Выполнение неравенств а Ь а>0, b с >0 D) является необходимым и достаточным условием того, чтобы форма Q(u, v) была положительна для всех нетривиальных зна- значений и и v. Упражнение 1. Показать, что необходимые и достаточные условия положительности -формы Q(u, v) для всех нетривиальных значений и и v могут быть записаны в виде с > 0, ас — Ь2 > 0,
§ 5] АНАЛИТИЧЕСКИЙ ПОДХОД - I 25 Отметим то обстоятельство, что мы снова говорим о необхо- необходимых и достаточных условиях. Разумеется, возможно суще- существование ряда различных, но, конечно, эквивалентных, необхо- необходимых и достаточных условий. Как правило, мы стремимся получить возможно большее число таких условий, так как в раз- различных ситуациях одни из них более удобны, чем другие. § 5. Аналитический подход—I. Как отмечалось выше, для того чтобы определить область изменения квадратичной формы Q(u, и), достаточно исследовать значения, принимаемые функ- функцией Q(u, v) на окружности единичного радиуса «2 + и2=1. Если Q положительна для всех нетривиальных значений и и и, то мы должны иметь min Q(u, v)>0, A) U2+V2=\ в го время как неравенство max Q(u, v)<0 B> «Чо!=1 есть требуемое условие того, что квадратичная форма Q(u, v) отрицательна для всех значений и и v на единичной окружности. Для того чтобы исследовать эти вариационные проблемы в симметричной форме, мы воспользуемся методом множителей Лагранжа. Рассмотрим задачу определения стационарных то- точек новой квадратичной функции R(u, v)=au2 + 2buv + cv2 — K(u2 + v2). C) xr dR dR n Условия —г- = —г- = О дают два линейных соотношения: аи + bv — Хи = О, DV bu + cv-lv = 0. v ' Для того чтобы эти уравнения имели нетривиальное решение, множитель Лагранжа Я должен удовлетворять характеристиче- характеристическому уравнению а — к b Ь с-К =° <5> или Я.2— (а + с)К + ас — Ь2 = 0. F) Поскольку дискриминант (а + сJ — 4{ас — Ь?) = {а — сJ + АЬ2 G)
5 МАКСИМИЗАЦИЯ И МИНИМИЗАЦИЯ. ОБОСНОВАНИЕ [ГЛ. 1 неотрицателен, корни уравнения F) всегда вещественны. Обо- Обозначим их через ki и %2. Эти корни различны, если только не вы- выполняются равенства а = с, 6 = 0. Рассмотрим случай различных корней более подробно. Если 6 = 0, то для корней квадратного уравнения F) полу- получаем Ki = a, К2 = с. При >»! = а из D) получаем уравнения (а - h) и = 0, (с - A,) v = 0, W которые выполняются при произвольном и и и = 0, если афс. Так как мы рассматриваем случай различных корней, то последнее условие выполнено. В случае, если ЬФО, мы получаем нетри- нетривиальные решения системы D), используя лишь одно из урав- уравнений и отбрасывая второе. При этом переменные и и v связаны соотношением (a — h)u = ~bv. (9) Для того чтобы говорить о частном решении, добавим требо- требование ы2 + о2=1. Введение дополнительного условия такого вида называется нормированием решения. Значения и и v, определенные с учетом нормирующего усло- условия, равны ь Другая пара решений (и2, v%) определяется аналогичным образом при замене Ki на Яг- § 6. Аналитический подход — II. После того как из уравнения E.6)') найдены Ki и %%, значения Ы; и о,- определяются по фор- формулам E.10). Эти величины после подстановки дают разыски- разыскиваемые минимальное и максимальное значения квадратичной формы au2 + 2buv + cv2 на окружности u1 + v2~\. Однако оказывается, что можно действовать значительно более изобретательно. Возвращаясь к линейным уравнениям E.4) и умножая первое на и и второе на о, мы получаем X(w2 + u?)=0. 'A) ') Двойной номер в скобках означает ссылку на формулу другого па- параграфа той же главы.
§6] АНАЛИТИЧЕСКИЙ ПОДХОД-II 27" Этот результат не является чем-то неожиданным; он представ- представляет собой частный случай теоремы Эйлера, касающейся одно- однородных функций; дело в том, что если Q(u, v) — однородная функция второго порядка, то Так как u2t + v2{ = l для г=1, 2, то в силу A) Kl = au ll (ЗУ* \ = aul + 2bu2v2 + cv\. Следовательно, одно решение квадратного уравнения E.6) есть искомое максимальное значение, а другое — минимальное значение квадратичной формы. i В связи с этим отметим то замечательное обстоятельство, что максимальное и минимальное значения Q{u, v) могут быть получены без вычисления координат точек, в которых они дости- достигаются. Однако, как мы увидим далее, эти точки обладают сущест- существенными особенностями. Выведем теперь важное свойство точек («,-, р,;), не пользуясь, однако, выражениями для их значений. Как мы видели в предыдущем параграфе, эти точки опреде- определяются системами уравнений 0, au2 + bv2— Я2ы2 = О, bu\ + cvx — K{v{ = 0, bu2 + cv2 — A2o2 = 0, D) Рассмотрим первую систему. После умножения первого урав- уравнения на и2 и второго — на i>2, складывая, получаем bvx — A,u,)+ v2(bul + cvt — A^) = = ащи2 Л- b {u2v{ + UiV2) + cViV2 — h («i«2 + vxv2) = 0. E) Вторая система аналогично этому дает auiu2 + b(u2vi + ulv2) +cvlV2 — K2(u1u2 + ViV2) =0. F) Вычитая из первого уравнения второе, найдем (Ai — lk2)(ulu2 + v1v2)=0. G) Так как по предположению Х\ФК2, то 0. (8)
28 МАКСИМИЗАЦИЯ И МИНИМИЗАЦИЯ. ОБОСНОВАНИЕ [ГЛ. 1 Геометрический смысл этого соотношения будет обсуждаться ниже. Отметим также, что величина utV2 — u2vi не равна нулю. Действительно, предположим противное. Тогда вместе с (8) мы имели бы два уравнения, линейных относительно ui и Vi\ = О 0. Так как обе переменные и{ и Vi не равны нулю одновременно (вследствие нормирующего условия), должно выполняться ра- равенство и2 v2 v2 — и2 = 0. A0) Последнее условие противоречит нормирующему условию в системе D). Упражнение 1. Показать, что для любой пары значений (и\, и2) и (v\, v2) имеет место соотношение (и\ + vf) (ll\ + t|) = («j«2 + V{V2f + (ll\V2 — U2v{f, и, следовательно, U\V2—i^t'i^O, если щ и vt удовлетворяют приведенным выше условиям. § 7. Упрощающее преобразование. Воспользовавшись свойства- свойствами («,-, vt) (см. равенства F.4) и F.8)), посмотрим, что произой- произойдет с квадратичной формой F.1), если сделать замену пере- переменных U = UjU' + U2Vf, v = v{u' + v2v'. ^ Это преобразование является взаимно однозначным, так как определитель U\t>2 — «2^1 отличен от нуля. Прежде всего мы видим, что 2 = („ „'2 + g ^ + ^ ^у, = ц/2 Из этого следует, что значения, принимаемые квадратич- квадратичной формой Q(u, и) на окружности и2 + и2 = 1, совпадают со значениями, принимаемыми следующей квадратичной формой Q(U{Ur + u2v', v\u' + v2v') на окружности и'2 + v'2 = 1,
¦§ 8] ДРУГОЕ НЕОБХОДИМОЕ И ДОСТАТОЧНОЕ УСЛОВИЕ 2Э Рассмотрим теперь выражение для квадратичной формы Q в новых переменных. Производя преобразования, получаем Q(ы,н' + u2v', vvu' + v2v') = (au\ + 2bulvl + cu~)u'2 + + (au\ + 2bu.2v2 + cv-^ v/2 + 2(au1u2 + b(u1v2 + u^^ + cv^v^u'v'. C) С учетом соотношений F.3), F.6) и F.8) окончательно при- приводим Q к виду Я,м'2 + A2i/2. D) Замена переменных привела к исчезновению перекрестного произведения 2buv. Подобное упрощение очень удобно для ис- исследования алгебраических, аналитических и геометрических свойств квадратичных форм. Мы будем иметь возможность убе- убедиться в этом в последующих главах, где аналогичное преобра- преобразование будет применено для многомерного случая. Принципиальная часть теории квадратичных форм состоит в том, что подобные результаты имеют место для квадратич- квадратичных форм любого числа переменных. Упражнение 1. Основываясь на формуле D), определить вид конического сечения, описываемого уравнением Q(u,v) = \, для следующих случаев*): (а) Я, > О, А2 > 0; (с) А,=А2>0; (б) Я, > 0, Х2< 0; (d) %г = 0, А2 > 0. § 8. Другое необходимое и достаточное условие. Используя полученное представление G.4), мы можем установить следую- следующее предложение. Теорема 2. Необходимое и достаточное условие положи- положительности Q(u,v) для всех нетривиальных значений и и v со- состоит в положительности корней уравнения a-l b Ь с-К = 0. A) Упражнение 1. Показать непосредственно, что условие, установленное выше, эквива- эквивалентно утверждению, содержащемуся в теореме 1. *) Возможность приведения квадратичной формы к виду D) была пока установлена лишь в предположении ^1=7^X2. Однако при ki=--%2 обязательно будет а = с, 6 = 0 (см. E.7)), и представление D) имеет место и в этом слу- случае. (Прим. ред.)
30 МАКСИМИЗАЦИЯ И МИНИМИЗАЦИЯ ОБОСНОВАНИЕ (ГЛ. Р § 9. Определенные и неопределенные формы. Введем теперь некоторые новые термины. Если квадратичная функция Q(u.v)=au2 + 2buv + cv2 для всех нетривиальных значений и и v больше нуля, Q{u, v) >0, то мы будем говорить, что Q(u, и) — положительно определенная форма. Если Q(u, v) <0 для тех же значений к и о, то мы будем называть Q(u, v) отрицательно определенной формой. Если Q(u, и) может принимать как по- положительные, так и отрицательные значения, то мы будем гозо- рить, что это неопределенная форма. Если для всех нетривиаль- нетривиальных и и v выполняется неравенство Q(u, и)>-0, то Q(u, v) на- называется неотрицательной (или неотрицательно определенной)- формой. Аналогично определяется неположительная форма. Упражнения 1. Показать, что если aiu2 + 2biiiv-\-clv2 и a2u2 + 2b2uv + c2v2— положи- положительно определенные формы, то форма a1a2u2+2bib2uv + c1c2v2 также положи- положительно определенная. 2. При каких условиях форма (a^Uj +a2u2)--\- Fi«! + &2«2J будет положи- положительно определенной? 3. Как во введенных терминах сформулировать условие того, что урав- уравнение au2-\-2buv + cv2= 1 соответствует эллипсу, гиперболе или параболе? § 10. Геометрический подход. Приведем теперь иной вариант подхода, рассмотренного выше. Этот последний является чрез- чрезвычайно важным для понимания геометрического смысла корней к\ и }.2 и величин (щ, Vi). Предполо- Предположим, что уравнение au2 + 2buv + cv2 = l (Г) О и соответствует эллипсу, изображен- ir) ному на рис- L -Ul Величина r=(u2 + u2)V2 обозна- обозначает длину радиуса-вектора от на- Рис- '• чала координат до точки (и, v) на эллипсе. Воспользуемся тем фактом, что проблема определения мак- максимума квадратичной формы Q(u, и) на окружности u2 + v2=l эквивалентна задаче определения минимума u2 + v2 на кривой Q(u, v) = \. Формализм, связанный с введением множителя Лагранжа, как и ранее, приводит к уравнениям и — %{аи + bv) = 0, v - Я (Ьи + cv) = 0. ^
геометрический подход 31 Это дает 1-аК - ЬК -ЬК 1-сК или в эквивалентной форме а - 1А Ь Ъ с-1/К = 0. C) D) Если Кг — корень уравнения D) и (ии и,-) —соответствующая точка экстремума, то мы, как и ранее, можем заключить, что 9 i 9 ¦} / г* \ ui + vi = Kr E) Из этого равенства следует вывод, что один из корней урав- уравнения D) равен квадрату минимального расстояния от начала координат до эллипса, а другой — квадрату максимального рас- расстояния. Отметим также, что сформулированная нами вариаци- вариационная задача дает в ходе решения длины большой и малой полу- полуосей эллипса. В условии F.8) мы узнаем теперь хорошо извест- известное свойство перпендикулярности или ортогональности главных осей эллипса. Линейное преобразование G.1), очевидно, есть вращение, так как сохраняет как положение начала координат, так и рас- расстояние до него. Мы видим, что это как раз то вращение, кото- которое приводит к совмещению осей эллипса с осями координат. Упражнения 1. Используя вышеприведенные факты, показать, что площадь эллипса дается формулой я а b b с >о, а b d b с f d f e 2. Используя алгебраический подход (см. § 4), показать, что необходи- необходимые и достаточные условия положительной определенности формы Q = a2 +2buv + cv2+2duw+ew2+2fvw имеют вид а > 0, 3. Аналогично, используя аналитический подход (см. § 5), показать, что необходимым и достаточным условием положительной определенности Q является положительность всех корней уравнения а — Х b d b с-A f =0. d f e-X
32 МАКСИМИЗАЦИЯ И МИНИМИЗАЦИЯ. ОБОСНОВАНИЕ [ГЛ I 4. Показать, что если Q — положительно определенная форма, то урав- уравнению Q(u, v, w) = l соответствует эллипсоид. Определить объем этого эллип- эллипсоида. § 11. Обсуждение. Мы исследовали в деталях двумерный слу- случай. Соответствующие вопросы элементарны, однако истоки некоторых из них не вполне очевидны. Все рассмотрение прове- проведено для того, чтобы читателю было легче понять необходи- необходимость перехода к новым обозначениям и он смог оценить их пре- преимущества. Результаты, которые для двумерного случая легко можно было предвидеть и которые были проверены непосредственно выкладками, будут естественным образом получены в общем случае. Основные идеи и основные приемы, с которыми мы будем иметь дело, содержатся в уже проведенных рассу- рассуждениях. Упражнения к гл. 1 1. При каких значениях Х\ и Хч квадратичная форма принимает минимальное значение и чему оно равно? 2. Показать, что выражение (х\ + yf\ [x\ + г/|) может быть записано в форме где коэффициенты а,- и bi не зависят от Xj и yt, и определить все такие ко- коэффициенты. 3. Показать, что аналогичный результат не имеет места для выражения (x2 + y2+zf)D + yl+zl). 4. Если X\u?+2x2UV + x3v2 и у{и2 + 2у2ии + у^иг — положительно определен- определенные формы, то ХгУг Х2У2 Х3уз х2 хъ Vi Уг Уг Уг 5. Использовать этот результат для трактовки упражнения 1 § 9. 6. Обосновать справедливость формального введения множителя Лаг- ранжа при рассмотрении максимальных и минимальных значений функции 7. Какое линейное преобразование оставляет квадратичную форму Q (х„ х2) - I (х\ + xi) + (l-K) (*, + x2f инвариантной? Здесь О^А.^1.
БИБЛИОГРАФИЯ И КОММЕНТАРИЙ 33 Библиография и комментарий § 1. Общее рассмотрение проблемы максимума и минимума функции нескольких переменных можно найти в любой из книг по математическому анализу. Более полное обсуждение может быть найдено в книге Хенкок (Н. Hancock), The Theory of Maxima and Minima, Ginn & Company, Boston, 1907. В последней главе мы будем изучать более сложную задачу определения максимума и минимума при ограничениях. Проб- Проблема определения связи между числом относительных мак- максимумов, относительных минимумов и стационарных точек дру- других типов принадлежит области топологии и здесь обсуждаться не будет; см. Морс (М. Morse), The Calculus of Variations in the Large, Amer. Math. Soc. 18 A934). § 2. Часто пользуются другой терминологией: Швердфегер и Мирский используют термин положительно полуопределенная\ Халмош — неотрицательно полуопределенная.
Глава 2 ВЕКТОРЫ И МАТРИЦЫ § 1. Введение. В первой главе мы исследовали вопрос опреде- определения локального максимума и минимума функции двух пере- переменных. Если перейти к рассмотрению соответствующей проб- проблемы для функции N переменных и поступать так же, как и ранее, то мы сразу же придем к задаче определения простых необходимых и достаточных условий положительности квадра- квадратичной формы N переменных N Q (XU Х2> ¦ ¦ •> XN) = 2j CtijXiXj. A) Как станет ясно позднее, в гл. 5, алгебраический метод, из- изложенный в предыдущей главе, дает простое и изящное реше- решение этой проблемы. Однако, так как мы заинтересованы в бо- более глубоком понимании квадратичных форм, чем это требуется для данной частной задачи, будем предполагать, что такого решения не существует. В настоящей главе нашей целью будет введение такой си- системы обозначений, которая даст нам возможность развить ана- аналитический подход при минимуме аналитических трудностей. В соответствии с указанной целью будем стремиться ввести обо- обозначения, не зависящие от размерности. Несколько неожиданным оказывается то обстоятельство, что исследование квадратичных форм существенно упрощается при использовании обозначений, введенных первоначально для изу- изучения линейных преобразований вида N г/г= liaijXj, t=l, 2, ..., N. B) /=i § 2. Векторы. Определим вектор как набор N комплексных чи- чисел. Вектор вида х2 A)
§ 3] СЛОЖЕНИЕ ВЕКТОРОВ 35 будем называть вектором-столбцом. Если N чисел расположены горизонтально: х={хи х2 xN), B) то х называется вектором-строкой. Так как все операции, которые нам потребуются, можно про- проводить, пользуясь лишь векторами-столбцами, в дальнейшем бу- будем применять термин «вектор» для величины, заданной фор- формулой A). Строчные буквы, такие как х, у, z и а, 6, с, повсюду будем применять для обозначения векторов. Когда рассматривается некоторое множество векторов, мы будем использовать верхние индексы: х\ х2 и т. д. Величины х{ называются компонентами вектора х, в то время как число N называется размерностью вектора х. Одномерные векторы будем называть скалярами. Это обычные величины, встречающиеся в анализе. Через х обозначается вектор, компоненты которого комплекс- комплексно сопряжены элементам вектора х. Если все компоненты х ве- вещественны, то будем говорить, что х—вещественный вектор. § 3. Сложение векторов. Приступим к изложению алгебры век- векторов, устанавливающей правила обращения с этими величи- величинами. Может быть предложено сколь угодно много различных правил, определяющих операции с векторными величинами. Те из них, которые приняты нами, найдут оправдание в том, что они позволяют просто и изящно изложить некоторые важные во- вопросы. Говорят, что два вектора х и у равны, в том и только з том случае, если равны их компоненты: Xi = yt для /=1, 2, ..., N. Простейшая операция для двух векторов есть сложение. Сумма двух векторов х и у записывается как х + у и определяется век- вектором Xi + yi 2: 2 • w XN + Уы Отметим, что знак плюс, связывающий векторы х и у, по смыслу отличен от знака плюс, соединяющего компоненты хг и Ух. Вместе с тем он обладает теми же аналитическими свой- свойствами и потому нет ничего плохого в использовании одного и того же символа в обоих случаях.
36 ВЕКТОРЫ И МАТРИЦЫ [ГЛ. 2 Упражнения 1. Показать, что операция сложения векторов обладает свойством ком- коммутативности: х+у=у+х— и ассоциативности: х+ (y+z) = (х+у) +г. 2. Показать, что вследствие этого вектор х' + х2 + ... +хм определен однозначно. 3. Определить разность двух векторов непосредственно и в терминах операции сложения, т. е. х—у есть вектор z такой, что у + г=х. § 4. Умножение вектора на скаляр. Умножение вектора X на скаляр С\ определяется соотношением с1х1 с{х2 = Хсх = С\Х дг (О Упражнения 1. Показать, что (ci + c2) (x+y) = 2. Определим нулевой вектор (с обозначением 0) как вектор, все компо- компоненты которого равны нулю. Показать, что это эквивалентно определению вектора 0 как вектора, для которого равенство х + 0 = х справедливо для всех х. 3. Показать, что эквивалентное определение нулевого вектора дается условием Ci0 = 0 для всех скаляров с\, § 5. Скалярное произведение двух векторов. Введем теперь важную скалярную функцию для двух векторов х и у, которую будем называть скалярным произведением. Эта функция будет записываться как (х, у) и определяться соотношением , у)= i = \ A) Следующие свойства скалярного произведения выводятся не- непосредственно из определения: {х,у) = (у,х), Bа) (х+у, z + w) = (х, г) + (х, w) + (у, z) + (у, w), B6) (cix,y)=cx(x,y). Bв) Скалярное произведение — это лишь один из способов «умно- «умножения» двух векторов. Вместе с тем имеются и другие опреде- определения операции умножения, которые мы не будем использо- использовать в настоящей книге. Важность введенного понятия скалярного произведения свя' зана с тем, что величину (х, х) можно рассматривать как квад-^ рат «длины» вещественного вектора х.
§ 6] ОРТОГОНАЛЬНОСТЬ 37 Упражнения 1. Если вектор х вещественный, то показать, что (х, х)>0 для всех х, кроме х=0. 2. Показать, что (ux + vy, ux + vy) =«2(x, x) +2uv(x, у) + v2(y, у) есть не- неотрицательная квадратичная форма скалярных переменных и и V, если х и у — вещественные векторы, и что, следовательно, для любых двух веществен- вещественных векторов хну справедливо неравенство (х, уJ^ (х, х) (у, у) (неравен- (неравенство Коши). 3. Дать геометрическую интерпретацию этого результата. 4. Используя этот результат, показать, что для любых двух веществен- вещественных векторов (х + у, х+у) '/2 < (х, х) Ч,+ (у, у) Чг. 5. Почему последнее неравенство называется «неравенством треуголь- треугольника»? 6. Показать, что для любых двух комплексных векторов х и у справед- справедливо неравенство \(Х, I/)|2^i (X, X) (у, у). § 6. Ортогональность. Два вещественных вектора называются ортогональными, если они удовлетворяют соотношению (ж, »)=0. A) Важность понятия ортогональности в существенной мере становится понятной после рассмотрения следующего легко уста- устанавливаемого результата. Теорема 1. Пусть {#'} — множество вещественных взаим- взаимно ортогональных векторов таких, что (х\ xi) =0 при i=hj, и пусть эти векторы нормированы условием (х\ х1) = 1. Тогда если данный вектор х представлен суммой м то имеют место следующие выражения для коэффициентов с,-: d-= (x, x<). C) Кроме того, справедливо соотношение м (х, х) = 2 4 D) Упражнения 1. В силу каких причин понятие ортогональности для комплексных век- векторов вводится соотношением (*,У)=0 и соответствующее условие нормирования — соотношением (x,x) = l? ; 2. Показать, что (х, у) — (х, у).
38 ВЕКТОРЫ И МАТРИЦЫ (ГЛ ? 3. В iV-мерном евклидовом пространстве заданы векторы О О 1 0 0 2_ 0 1 0 Показать, что векторы у* взаимно ортогональны и нормированы. Векторы» N такого типа называются ортонормированными. Пусть х = 2 С/У1< опреде- » = 1 лить величины с,- и обсудить геометрический смысл результата. § 7. Матрицы. Введем понятие матрицы. Таблицу комплексных чисел, записанную в форме ап а2\ lN\ я,2 /V2 a\ a, A) будем называть квадратной матрицей. Это только один из воз- возможных видов матриц. Мы будем рассматривать таблицы по- подобного типа не обязательно квадратные и применять для них тот же термин «матрица». Впоследствии, когда будут вводиться другие виды матриц, мы будем пользоваться термином «матри- «матрица» с добавлением соответствующего прилагательного. Величины aij называются элементами, а целое число N —• размером (порядком) матрицы А. Величины аи, ai2, ..., aiN составляют i-ю строку матрицы А,. а величины flij, Сг:-, . . . , aNj — ее /-Й столбец. Повсюду будем обозначать матрицы прописными буквами Ху У, Z и А, В, С. Иногда будем пользоваться сокращенным обо- обозначением = \\ац\\. B) Определитель, соответствующий таблице A), будем записы- записывать как \А ( или \пц|. Простейшее соотношение между матрицами — это их равен- равенство. Две матрицы называются равными тогда и только тогда,, когда все их соответствующие элементы равны. Действуя так же, как и при рассмотрении векторов, определим операцию сло- сложения. Сумма двух матриц А и В записывается как А + В и определяется формулой А + В=\\аи + Ьи\\. C)
^ 8] УМНОЖЕНИЕ ВЕКТОРА НА МАТРИЦУ 39 Произведение матрицы А на скаляр сх определяется соотно- соотношением |. D) Наконец, под А понимается матрица, элементы которой комп- комплексно сопряжены с элементами матрицы А. Будем называть матрицу А вещественной, если все ее элементы вещественные. Упражнения 1. Показать, что нулевая матрица 0 (матрица, все элементы которой равны нулю) однозначно определена условием Л+0=Л для всех А. 2. Показать, что сложение матриц ассоциативно и коммутативно. 3. Показать, что матрица А1+А2+ ... +АК определена однозначно. § 8. Умножение вектора на матрицу. Для того чтобы сделать нашу алгебру более содержательной, определим некоторые опе- операции умножения. Для обоснования новых понятий вернемся к линейному пре- преобразованию N У{= S auXj, г = 1, 2, . . ., N, A) где коэффициенты a,j — комплексные величины. Целью векторно- матричных обозначений является построение аппарата для ис- исследования линейных преобразований, поэтому вполне понятно, что при выводе фундаментальных свойств векторов и матриц мы периодически обращаемся к этому основному соотношению. Дело в том, что мы хотим, чтобы операции сложения и умноже- умножения матриц были введены не произвольно, а наоборот — су- существенно определялись аналитическими и геометрическими свойствами обьектов нашего исследования. Если два вектора хну связаны соотношением A), то можно записать У^Ах. B) Это соотношение определяет произведение вектора на матрицу. Обратим внимание на порядок, в котором записаны сомножи- сомножители этого произведения. Упражнения 1. Показать, что (А+В) (х+у) =Ах+Ау+Вх+By. 2. Рассмотреть единичную матрицу I, определяемую таблицей 1 О
40 ВИКТОРЫ И МАТРИЦЫ [ГЛ 2 Для элементов единичной матрицы имеем /=|[6jj||, где 6,-j — символ Кроне- кера: 0, 1Ф]. Показать, что N 3. Показать, что 1х=х для всех х и что это соотношение единственным образом определяет матрицу /. 4. Показать, что N / N (Ах, Ах) = 2 2 а» i-i V/-1 § 9. Умножение матрицы на матрицу. Теперь рассмотрим, ка- каким образом можно определить умножение матрицы на мат- матрицу. Рассмотрим второе линейное преобразование z = By, A) которое устанавливает соответствие между компонентами век- векторов у и г. Для того чтобы выразить компоненты z через ком-* поненты вектора х, где, как указывалось выше, у — Ах, за- запишем JV N I N \ N / N \ Zi = Zj bikyk — 2j bikI 2j akjXj I = 2j [ 2j bikak, x,. B) *¦=! ft-l V/=l / /=1 \ft=l / Если теперь ввести новую матрицу C = ||c,-jj|, определяемую соотношениями N cii= ^b^attj, i, /=1, 2, ..., N, C) то можно записать Так как формально мы приходим к определению произведения матриц А и В: С = ВА, F) где матрица С дается формулами C). Снова обратим внимание на порядок, в котором записаны сомножители матричного произведения.
УМНОЖЕНИЕ МАТРИЦЫ НА МАТРИЦУ 41 Упражнения 1. Показать, что (А + В) (C+D)=AC+AD + BC+BD. 2. Если cos 9 —sin 9 sin 9 cos I то показать, что T(Q1)T(Q2)=T(Q2)T(Ql)=T(Qi 3. Пусть А — диагональная матрица (т. е. такая, что «ij=0, если 1ф\), и пусть В — матрица подобного же типа. Показать, что АВ — также диаго- диагональная матрица и что АВ = ВА. 4. Пусть матрица А треугольная (т. е. такая, что ац = 0 для />0. и пусть В — матрица того же типа. Показать, что АВ — снова треугольная матрица, но что в общем случае АВфВА. 5. Пусть а2 ! „ I! Ьх ЬЛ — а2 в = Показать, что АВ — матрица того же типа и что АВ = ВА. (Как мы уви- увидим впоследствии, эти матрицы эквивалентны комплексным числам вида fii + 'Яг, если а\ и аг вещественны.) 6. Используя соотношение ИВ| = И||В], показать, что (а 7. Пусть А = = («161 — а 1 + ш3 a2b2 (a2bl 2f a2 + ia4 ax — ш3 и В — матрица аналогичного вида. Показать, что АВ — матрица того же типа, но что, вообще говоря, АВ фВА. 8. Пользуясь соотношением |ЛВ| = |Л||В|, представить выражение \ \ ) ( \ \ ) (992 2\ / * 2 aj + fl2 + a3 + a4jF, 9. Пусть , рд ) как сумму четырех квадратов. А = -а2 -аз -at ¦аз аз -а4 а2 — а2 и В — матрица подобного вида. Показать, что АВ — матрица того же типа, но что в общем случае АВФВА. Вычислить И|. (Эти матрицы эквивалент- эквивалентны кватернионам.) 10. Рассмотреть дробно-линейное преобразование L = Г, (z). Показать, что если Т2(г) — такое же преобразование с коэффициентами щ, Ь\, С], d\, замененными на а2, b2, c2, d% то Ti(T2(z)) и ^(^(г))—преобра- ^(^(г))—преобразования того же типа. 11. Показать, что если выражение a\d\—feiCi^O, то Г] (г) — преобразо- преобразование того же вида. Каков вид коэффициентов преобразования Г] (г), если Mi—bici=0?
42 ВЕКТОРЫ И МАТРИЦЫ [ГЛ. 2 12. Рассмотреть соответствие между преобразованием T\(z) и матрицей К ci d\ ii записываемое как A\~T\(z). Показать, что если Ai~Ti(z) и Л2~7(г), то A1A2~Ti(T2(z)). Найти условие, достаточное для выполнения равенств? Ti(T2(z))=T2(T,(z)) для всех г. 13. Как, пользуясь приведенными результатами, получить представление для итераций преобразования Г] (г)? 14. Показать, что i-1 -IP 1 0|| 15. Если X = || хи ||, где хи = (- if'1 [N ~ ') *}, то X3 = /. W - 1 / 16. Из того обстоятельства, что мы можем установить соответствия 1и -I'- -I'll Oil' вывести, что может быть построена арифметика, не использующая понятия отрицательного числа. § 10. Некоммутативность. Одним из интереснейших свойств матриц, делающим их изучение таким увлекательным, является то, что произведение матриц некоммутативно. Иными словами, в общем случае АВФВА. A) Простой пример дается матрицами второго порядка 1 211 112 1 А = 3 4 ' 4 3 B) Более интересные примеры появляются в упражнениях 7 и 9 § 9. Для матриц B) имеем АВ = 10 7 22 15 ВА = 13 20 Г C) Если АВ = ВА, то мы будем говорить, что матрицы А я В коммутативны. Теория матриц дает естественный переход от обычной обла- области скаляров и их доступной алгебры к более интересному ре- а(а- 1) ... (a-k+l) kl , причем C- 1. (Прим. ред.)
3 II] АССОЦИАТИВНОСТЬ 43 ильному миру объектов, в котором имеется множество различ- различных видов алгебр, обладающих своими специфическими свой- свойствами. Упражнения 1. Показать, что А1 = 1А=А для всех матриц А и чго это соотношение единственным образом определяет единичную матрицу /. 2. Показать, что Л0=0Л=0 для всех матриц А и что это соотношение единственным образом определяет нулевую матрицу 0. 3. Пусть строки матрицы А состоят из компонент векторов а\а2 av, а столбцы матрицы В состоят из компонент векторов б1, б2, ..., bN. Тогда для произведения уагриц имеем АВ = \\(а\Ы)\\. 4. Если АХ=ХА для всех X, то матрица А представляет собой произ- произведение скаляра и единичной матрицы /. ¦§ 11. Ассоциативность. Хотя в новой алгебре коммутативность не имеет места, свойство ассоциативности, к счастью, сохра- сохраняется. Иными словами, для любых матриц А, В и С мы имеем (АВ)С=А(ВС). A) Это означает, что произведение ABC вполне определено и без помощи круглых скобок. Для доказательства этого результата воспользуемся правилом «немого индекса», которое заключается в том, что любой повторяющийся индекс должен суммироваться по всем своим возможным значениям. Приняв это условие, i/'-й элемент произведения АВ можно записать как а1кЬь). B) Применяя этот прием и определяя произведение, приведенное выше, мы получаем соотношения ' = 11(а/*Ь«)с,Д > = \\aik(bkiCij)l которые устанавливают равенство выражений (АВ)С и А (ВС). Упражнения 1. Показать, что ABCD=A(BCD) = (АВ) {CD) = (ABC)D и что в общем ¦случае произведение Л1Л2 ... AN определяется однозначно. 2. Показать, что функция Л" определяется однозначно и что Ат + п — =АтАп\ т, «=1,2, ... 3. Показать, что Ат и Вп коммутативны, если коммутативны Л и В. 4. Получить выражение для
44 ВЕКТОРЫ И МАТРИЦЫ [ГЛ. 2 — заданная матрица. Используя соотношение Хп+'=ХХп, вывести рекур- рекуррентную формулу для Xi(n) и таким образом получить xt(n) в аналитиче- аналитической форме. 5. Использовать эти соотношения для случая, когда Xl x2 Х\, х2 вещественны, х\, х2 комплексные. 6. Используя эти соотношения, определить явные выражения для эле- элементов Хп, когда IIЯ 1 0| 10 X|i lo о я|| 7. Найти все матрицы размеров 2X2, удовлетворяющие уравнению 8. Найти все матрицы размеров 2X2, удовлетворяющие уравнению Х"=Х, где п — целое положительное число. § 12. Инвариантные векторы. Если действовать так же, как в § 5 гл. 1, то нетрудно убедиться, что проблема определения максимального и минимального значений квадратичной формы N Q = 2 CLtjXiXj для значений **, удовлетворяющих условию JV 2*;=li может быть сведена к проблеме определения вели- величин Я, для которых система линейных однородных уравнений 2i i= I, 2, ..., N, A) имеет нетривиальные решения. В векторно-матричных обозначениях соотношения A) можно представить в форме одного уравнения Ах=кх. B) Записанное таким образом уравнение имеет очень простой смысл. Мы ищем такие векторы х, которые преобразуются ма- матрицей А в векторы, отличающиеся от исходных лишь скаляр- скалярным множителем Я. Если считать, что компоненты вектора х определяют некото- некоторое направление в jV-мерном пространстве, то нашей целью является определение инвариантного направления.
$ 14] ТРАНСПОНИРОВАННАЯ МАТРИЦА 45 Мы продолжим исследование возникающих при этом вопро- вопросов в последующих главах. Тем временем введем некоторые но- новые обозначения, которые будут полезны нам в дальнейшем. § 13. Квадратичная форма как скалярное произведение. Приве- Приведем еще один аргумент, обосновывающий введенные нами обо- обозначения. Квадратичная форма Q(u,v)=au2 + 2buv + cv2 может быть записана в форме u(au + bv) +v(bu + cv). (I) Следовательно, если вектор х и матрицу А определить форму- формулами х = a b b с то Q(u,v) = (x,Ax). Аналогично для jV-мерной квадратичной формы Q (х) = 2 С7=1 B) C) D) где без потери общности можно положить а,-; = а^,-*), запишем М 1 Г ^  Г ^ 1 Q(х) = х{ 2 aijXj fdS a2jXj \+ . . . + xN 2 aN/xf\ = L/ = i J U = i J L/=i J = (х, Ах). E) Здесь вектор х имеет компоненты x-t и /4=||a,;-|, Упражнения 1. Означает ли выполнение равенства (х, Ах) = (х, Вх) для всех х, что 2. При каких условиях (х,Ах)=0 для всех дг? § 14. Транспонированная матрица. Соотношение А'=\\а„\] (I) является определением весьма важной функции матрицы А — транспонированной матрицы А'. Строки матрицы А' являются столбцами матрицы А и строки А —столбцами А'. К рассмотрению этой новой матрицы приводит следующее обстоятельство. Пусть заданы два множества векторов {х) и {у}. *) См. упражнение 7 к § 15 настоящей главы. (Прим. ред.)
46 ВЕКТОРЫ И МАТРИЦЫ [ГЛ. 9. Образуем всевозможные скалярные произведения (х, у), где вектор х берется из множества {х}, а вектор у— из множе- множества {у}. Предположим, что множество {х} преобразуется посредством матричного умножения на матрицу А и дает новое множество векторов {Ах}. Образуя скалярные произведения с векторами у, мы получаем множество значений (Ах, у). Заметим, что {Ах, у) = У1 12 a1;x;j + у2 у 2 a2JXj\ + ... + yN 2 aN]x\ . B) После перегруппировки получаем г n 1 г n -] rjv л (Ах, у) = хх 2 апУ,- + *2 2 aayt И- . .. + .t,v 2 ашу{ I = Li=l J Li=l J li=l J = (x, А'у). C) Другими словами, когда речь идет о скалярном произведении, действие преобразования А на множество {х} эквивалентно дей- действию преобразования А' на множество {у}. В гаком случае мы можем рассматривать А' как индуцированное или сопряженное преобразование. Эта простая, но плодотворная идея глубоко про- проникла в классический и современный анализ. § 15. Симметрические матрицы. Проведенное рассмотрение по- позволяет предположить, что матрицы, удовлетворяющие условию А=Л', A) обладают особыми свойствами и могут играть важную роль в изучении квадратичных форм. На самом деле это действительно так. Матрицы такого типа называются симметрическими и ха- характеризуются условием ац^ан. B) Первая часть настоящей книги будет посвящена исследова- исследованию основных свойств матриц этого класса для случая, когда элементы а.ц вещественны. В дальнейшем термин «симметрическая» будет использовать- использоваться для обозначения вещественной симметрической матрицы. Если при этом возникает опасность путаницы, то мы будем добавлять слова «вещественная» или «комплексная симметрическая» в за- зависимости от типа рассматриваемой матрицы.
§ I6J ЭРМИТОВЫ МАТРИЦЫ 47 Упражнения 1. Показать, что (А')' = А. 2. Показать, что (А+В)' = А' + В', (АВ)' = В'-А\ 3. Показать, что если матрицы А и В симметрические, то матрица АВ не обязательно симметрическая. 4. Показать, что если В — симметрическая матрица, то матрица А'ВА симметрическая. 5. Показать, что (Ах, By) —(x. A'By). 6. Показать, что |.4| = И'|. 7. Показать, что предположение ац = ал не приводит к потере общности N при рассмотрении квадратичной формы Q (х) = У, aijXiXj. § 16. Эрмитовы матрицы. Как было отмечено выше, важной скалярной функцией комплексных векторов оказывается не обычное скалярное произведение, а выражение вида (х,у). Если заметить, что (Ах, у) =¦- (х, г), A> где г = А'у, то мы видим, что сопряженное преобразование опре- определяется теперь матрицей А', комплексно сопряженной с матри- матрицей А'. Матрицы, для которых А=А', B) называются эрмитовыми по имени великого французского мате- математика Шарля Эрмита. Для упрощения обозначений вместо А' будем писать А". Как мы увидим, все важнейшие свойства симметрических матриц имеют прямые аналогии для эрмитовых матриц. Более того, при желании можно ввести обозначение [*,.?]=(*,»), C) в терминах которого свойства обоих типов матриц могут быть получены одновременно. Каждый из этих путей имеет свои пре- преимущества, и читатель сможет сделать свой выбор, как только он освоит основную технику. Упражнения 1. Вещественная эрмитова матрица — симметрическая. 2. (Л*)* = А, (АВ)* = В*А*, (А{А2 ... Ап)* = Л* ... А*2А*. 3. Если матрица A + iB эрмитова (Л и В вещественны), то А'=Л, В' = ~В.
48 ВЕКТОРЫ И МАТРИЦЫ [ГЛ. 2 § 17. Ортогональные матрицы. Инвариантность расстояний. Отправляясь от измерения длин в геометрии Евклида, примем величину {х,х) за длину вещественного вектора х. Чрезвычайно любопытным и в то же время чрезвычайно важ- важным, как мы увидим далее, является вопрос определения такого линейного преобразования у = Тх, которое оставляет неизменной величину (*,*). Иными словами, мы хотим определить ма- матрицу Т так, чтобы уравнение (х,х) = (Тх,Тх) A) удовлетворялось для всех х. Так как (Тх,Тх) = (х,Т'Тх) B) и Т'Т — симметрическая матрица, то легко прийти к заключению, что условие A) приводит к равенству ТТ = 1. C) Вещественная матрица Т, обладающая таким свойством, на- называется ортогональной. Упражнения 1. Показать, что матрица Т' ортогональна тогда и только тогда, когда ортогональна матрица Т. 2. Показать, что любая ортогональная матрица размеров 2x2 с опре- определителем, равным +1, может быть записана в форме cos i sin ( — sin cos Э Ц' Каков геометрический смысл этого результата? 3. Показать, что столбцы матрицы Т представляют собой ортогональные векторы. 4. Показать, что произведение двух ортогональных матриц есть снова ортогональная матрица. 5. Показать, что определитель ортогональной матрицы равен ±1. 6. Пусть Тк—ортогональная матрица равмеров jVX.'V, а матрица разме- размеров (N+l)X(N+\) имеет вид 1 0... О 0 Показать, что матрица TN+\ ортогональная. 7. Показать, что если матрица Т ортогональная, то преобразование х = Ту означает, что у = Т'х. 8. Пусть АВ = ВА и Т — ортогональная матрица, тогда матрицы ТАТ' и ТВТ' коммутативны.
УПРАЖНЕНИЯ К ГЛ. 2 49 § 18. Унитарные матрицы. Так как соответствующей мерой комплексных векторов является величина (х,х), то легко за- заключить, что аналогом условия инвариантности A7.3) является соотношение Т*Т = 1. A) Матрицы, обладающие этим свойством, называются унитар- унитарными и играют в рассмотрении эрмитовых матриц ту же роль, что и ортогональные в теории симметрических матриц. Упражнения 1. Показать, что матрица Т* унитарна тогда и только тогда, когда уни- унитарна матрица 7\ 2. Показать, что произведение двух унитарных матриц есть унитарная матрица. 3. Показать, что определитель унитарной матрицы по модулю равен единице. 4. Показать, что если матрица Т унитарна, то равенство х=Ту означает, что у=Т*х. 5. Получить результат, соответствующий приведенному в упражнении 2 § 17, для элементов унитарной матрицы размеров 2X2. (Аналогичный, но более сложный результат в эллиптических функциях имеет место для пред- представления элементов ортогональной матрицы размеров 3X3. См. Каспари (F. Caspary), Zur Theorie der Thetafunktionen nut zwei argumenten, Kro- necker J. 44, 74—86; Каспари (F. Caspary), Sur les systemes orthogo- naux, formes par les fonctions theta, Comptes Rendus de Paris 54, 490—493. 6. Будет ли вещественная унитарная матрица ортогональной? 7. Будет ли комплексная ортогональная матрица унитарной? 8. Любая ортогональная матрица размеров 3x3 может быть представ- представлена как произведение cos a sin a —sin a cos a 0 0 Каков геометрический Упражнения к гл. 2 1. Доказать, что 0 0 ill смь cos Ь 0 sin Ъ 0 1 0 ел этого —sin b 0 cos Ъ 1 0 0 результата' 0 cos с ¦—sin с 0 sin с COS ." а12 ... 0 (ait +a") xtx,+ ...), где а*' — алгебраическое дополнение элемента а,-; в определителе |a,-j|. 4 Р. Беллман
50 ВЕКТОРЫ И МАТРИЦЫ [ГЛ. 2 2. Пусть 1ц обозначает матрицу, полученную перестановкой /-й и /-ft строк в единичной матрице /. Доказать, что I2 — I 111-! ii ih ki j i — A/' 3. Показать, что матрица 1цА совпадает с Л, с тем лишь исключением» что i-я и /-я ее строки переставлены, в то время как произведение А1ц озна- означает перестановку 1-го и /-го столбцов матрицы А. 4. Пусть Hi) — матрица, i'j-ii элемент которой есть А, а остальные эле- элементы равны нулю. Показать, что произведение A + Нц)А есть матрица» совпадающая с Л, с тем лишь исключением, что ее i-я строка заменена 1-й строкой, к которой прибавлена /-я, предварительно умноженная на h. В то же время матрица A(/ + Hij) отличается от матрицы А аналогичным пре- преобразованием столбцов. 5. Пусть матрица Нг равна единичной / с тем лишь исключением, что ее гг-Ъ элемент равен k. Чему равны произведения НГА и АНГ? 6. Если матрица Л вещественна и ЛЛ' = 0, то Л=0. 7. Если ЛЛ*=0, то /4 = 0. 8. Показать, что если Т — ортогональная матрица, то ее элементы огра- ограничены общей константой. Аналогично, если V — унитарная матрица, то ее элементы также ограничены. 9. Пусть d\ — определитель системы линейных однородных уравнений JV где неизвестными считаются N(N+\)j2 величин xtXj, i,/=I,2, ..., N. Тогда d\ = \a.ij\N+K (Шэфли.) 10. Показать, что пределы lira Л", Нт В" могут существовать, в то время как предел lim (AB)" не существует. Это достаточно показать для матриц А и В второго порядка. N 11. Предположим, что мы имеем систему линейных уравнений 2а<У*У = У=1 = 6,-, 1=1, 2, ..., N. Если, образуя линейные комбинации данных уравне- уравнений, можно свести систему к виду Х\ = с\- Хг = Сч\ ...; xN = cN, то послед- последние равенства представляют собой решение исходной системы и притом единственное. (Р. Робинсон.) 12. Введем скобки Якобн [Л, УЗ]=ЛВ—ВА, коммутатор матриц А и В. Показать непосредственным вычислением, что [Л, [В, С]) + [В, [С, А]] + [С, [Л, В]]=0. 13. Пусть /•] = е — неприводимый корень из единицы, и пусть г^— "\ k = 1, 2, ..., п — 1. Рассмотрим матрицу 1 1 Т = ... г Г1 1 г гп~1 1 тп-\ • ¦ ¦ гп-\
УПРАЖНЕНИЯ К ГЛ. 2 51 Показать, что п 1/2Т — унитарная матрица. Следовательно, если n /=о u т0 л-1 _-2Jirt//n ;=о п-1 п-1 Это преобразование называется конечным преобразованием Фурье. 14. Предположим, что N 2 JV : 2' 2 при bkk = d/iii=l для всех й. Тогда |а//1= JJ eft '). 15. Рассмотрим преобразование Гаусса В =||6,-/|| матрицы А = \\aij\\: ik ~ aaaik)- k>L ьп = ьпап> ¦' bik = an Пусть Лп = ||а,-/||, i, j = 2, ..., N. Показать, что | U - В | = (la^l -1)[Х|Х/-ЛИ \-\U-A I]. (Д. М. Котелянский.) 16. Показать, что матрицы 1 а 611 О 1 0 , О 0 11| удовлетворяют соотношению АВ = I. 17. Показать, что 1 -а -61 О О х у z г х у У z х = (х + у + г) (х + (йу + Ф2г) (х + a>z) = хъ + г/3 + г3 - Зхуг, где ш — кубический корень из единицы. 18. Пользуясь этим, показать, что если Q (jc) = х\ + х\ + х\ — 3xix2x3, то Q(x) Q(y) = Q(z), где г-билинейная форма xi и yi (z,- = 2 a-ij с коэффициентами aijk, не зависящими от xi и yt. ') Берчнелл (J. L. Burchnall), Proc. Edinburgh Math. Soc. B), 9 A954), 100—104.
52 ВЕКТОРЫ И МАТРИЦЫ [ГЛ. 2 19. Доказать, что Х\ Х% Х3 Хц -хг Хх -Х4 ХЪ =(Х2 + Х2 + Х2 + Х2у Xz Х$ Х\ Хч —Х4 —Х3 Х2 Xi и вследствие этого (*? + х\ + х\ + х% (у* + у\ + у% + у*) = z\ + z\ + г\ + z% где Zi — билинейные формы х% и (/,-. Гурвицем было показано, что произведе- произведение суммы Л^ квадратов, умноженное на произведение суммы N квадратов, есть сумма TV квадратов в указанном выше смысле только тогда, когда N= 1,2,4,8!). Изложение теории воспроизводящихся форм см. у Мак-Даффи2). 20. Доказать, что матрица А, элементы которой определяются фор- формулами 0, i > }, ., , „ (п\ п\ удовлетворяет соотношению Л2 = /. Здесь , =-гг, гтг • \к) к\\п — к) ! 21. Пусть //,- = (/,(xi, Хг, ..., ху) — система N функций независимых пе- переменных xt, i=l, 2, ..., N. Матрица J = J(y,x) = \\dtjildXj\\ называется ма- матрицей Якоби, а ее определитель — якобианом преобразования. Показать, что J(z,y)J(y,x)=J(z,x). 22. Рассмотреть связь между jV2 переменными (/;j и JV2 переменными хц, определяемую соотношением Y = AXB, где А и В — постоянные матрицы. По- Показать, что \](у, *)| = |Л|*|В|*. 23. Если Y = XX', где X — нижняя треугольная матрица, то | / (X, У)\ = г ! 24. Показать, что проблема определения максимума функции (х, Ах) — — 2(х, Ь) приводит к векторному уравнению Ах=Ъ. 25. Аналогично показать, что проблема минимизации функции пары век- векторов х и у: (х,Вх)+2(х,Ау) + (у,Ву)—2(а,х)—2{Ь,у) приводит к системе уравнений Вх+Ау=а, А'х + Ву=Ь (предполагается, что В —В' — Прим. ред.). ') Гурвиц (A. Hurwitz), Ober die Komposition der quadratischen Forraen von beliebig vielen Variablen, Math. Werke, bd II, Basel, 1933, 565— 571. 2) Мак-Даффи (С. С. MacDuffee), On the Composition of Alge- Algebraic Forms of Higher Degree, Bull. Amer. Math. Soc. 51 A945), 198—211; Радон (J. Radon), Lineare Scharen orthogonaler Matrizen, Abh. Math. Sem. Hamb. 1 A921), 1—14.
УПРАЖНЕНИЯ К ГЛ. 2 53 26. Пусть f(x)—функция переменной х, принимающей только два зна- значения' х = 0, х=\. Показать, что f(x) может быть записана в форме а + Ьх, где a = f(O). ft-/(l)-f@). 27. Пусть g(x)—функция того же типа, которая сама принимает зна- значения 0 или 1. Тогда f(g(x))=ai+bix. Показать, что коэффициенты а\ и Ъ\ представляют собой линейные комбинации коэффициентов а и Ь и что, таким образом, результат замены х на g(x) эквивалентен матричному преобразова- преобразованию вектора с компонентами а и Ь. 28. Пусть f(xi,Xi) —функция двух переменных, каждая из которых при- принимает только два значения: 0 или 1. Показать, что можно записать f() 29. Пусть g\(xi,Xi), gi{x\, хг) —функции того же типа, которые сами могут принимать только значения 0 или 1. Тогда, записав а2х 2х\ азх зх2 мы придем к матричному преобразованию: a2 а'з = M a, a2 a3 a4 Вычислить матрицу М для случая, когда g\{X\,x2)=X\X2, gi(x\,Xi)=x\([—х2). 30. Обобщить предыдущий результат на случай, когда мы имеем функ- функцию N переменных f(xi,X2, ..., xN) и xi может принимать любое конечное множество значений. (Приведенные результаты используются при изучении различных типов логических сетей. См., например, Беллман, Холланд и Калаба (R. Bellman, J. Holland and R. Kalaba), Dynamic Pro- Programming and the Synthesis of Logical Nets, J. Assoc. Сотр. Mach., 1959.) 31. Если A — заданная матрица размеров 2X2 и X — неизвестная ма- матрица размеров 2x2, то показать, что уравнение АХ—ХА = 1 не имеет ре- решения, 32. Показать, что тот же результат имеет место для случая, когда А и X'—матрицы размеров N\N. 33. Рассмотреть связь между N(N+l)/2 переменными г/,;- и N(N+\)/2 переменными xij, определенную уравнением Y = AXA\ где X и У — симметри- симметрические матрицы. Показать, что \J(Y, X)\ = \A\N + [. Две статьи полуописатель- полуописательного характера, обсуждающие вопросы такого типа, принадлежат Димеру и Олкину '). 34. Построить симметрическую ортогональную матрицу размеров 4X4, элементы которой равны ±1. Этот вопрос и его возможные развития инте- интересны в связи с неравенством Адамара, см. § 7 гл. 8 и (несколько неожи- неожиданно) в связи с задачей планирования экспериментов2). ') Димер и Олкин (W. L. Deemer and I. О Ik in), Jacobian of Matrix Transformations Useful in Multivariate Analysis, Biometrika 38 A951), 345—367. 2) Пэли (R. E. A. C. Pa ley), On Orthogonal Matrices, J. Math, and Physics 12 A933), 311—320; Плакетт и Бермен (R. L. Plackett and J. P. Burman), The Design of Optimum Multifactorial Experiments, Biome- Biometrika 33 A946), 305—325,
54 ВЕКТОРЫ И МАТРИЦЫ [ГЛ. 2 Библиография и комментарий Читателю, который интересуется истоками теории матриц, не- необходимо обратиться к монографии Мак-Даффи (С. С. MacDuffee), The Theory of Matrices, Chelsea Publishing Co., New York, 1946*). Хотя мы иногда будем ссылаться на различные теоремы, пользуясь именами их авторов, мы не будем серьезно пытаться установить автора каждого результата. Как и во многих других областях математики, имеется определенное количество ошибоч- ошибочных приписок. В тех случаях, когда мы знали об этом, мы пы- пытались исправить положение вещей. § 8. Следует отметить, что при иной физической ситуации могут быть введены другие виды алгебр с совсем различными определениями операций «сложения» и «умножения». Как по- показал Олкин, при рассмотрении задач социометрики весьма полезно определение умножения в форме/1-Z? = l!«t.Ajll- Впо- Впоследствии будет показано, что несколько неожиданным образом указанное здесь произведение Шура возникает в теории диффе- дифференциальных уравнений в частных производных. § 10. Подробное обсуждение свойства коммутативности имеется в статье Та у сек и (О. Taussky), Commutativity in Finite Matrices, Amer. Math. Monthly 64 A957), 229—235. Интересное развитие коммутативности можно найти в работе Фридман (В. Friedman), я-commutative Matrices, Math. Ann. 136 A958), 343—347. Решение уравнений ХА=АХ, ХА=А'Х содержится в статье Фаукс (Н. О. Foukes), J. London Math. Soc. 17 A942), 70—80. § 11. Может быть построена другая алгебра, в которой на- нарушена как коммутативность, так и ассоциативность произве- произведения. Особенно интересный пример дает алгебра Кэли. Для обсуждения этих вопросов см. Алберт (A. A. Albert), Modern Higher Algebra, University of Chicago Press, Chicago, 1937; Биркгоф и Маклейн (G. A. Birkhoff and S Maclane), Survey of Modern Algebra, The MacmiUan Company, New York, 1958. *) См. также Ф. Р. Г а н т м а х е р, Теория матриц, «Наука», 1967. (Прим. ред.)
БИБЛИОГРАФИЯ И КОММЕНТАРИЙ 55- § 14. В случае более общих преобразований или операто- операторов А' часто называют сопряженным преобразованием или со- сопряженным оператором. Важность этого понятия связана с тем. что иногда изучение сопряженного преобразования может оказаться проще рассмотрения исходного. Более того, во мно- многих случаях векторные свойства преобразования А выра- выражаются более просто, когда они формулируются в терминах А'. Пример этого мы получим в гл. 14 при рассмотрении марков- марковских матриц. § 16. Обозначение Н* для матрицы Н' предложено, по-види- по-видимому, Островским; см. статью Островский (A. Ostrowski), Ober die Existenz einer endlichen. Basis bei gewissen Funktionen Systemen, Math. Ann. 78 A917), 94—119.
Глава 3 ДИАГОНАЛИЗАЦИЯ И КАНОНИЧЕСКИЕ ФОРМЫ СИММЕТРИЧЕСКИХ МАТРИЦ § 1. Резюме. Рассмотрение проблемы стационарных значений N квадратичной формы Q (х) = 2 aijxixi на сфере х\Л-х\Л-... I, i — 1 . .. + x2N = 1 привело нас к задаче нахождения нетривиальных решений системы линейных однородных уравнений N ^aijxJ = kxh i=\, 2 N. A) Мы прервали наше изложение на этом месте, чтобы ввести векторно-матричные обозначения. В заключение экскурса ука- указывалось, что новый аппарат позволит в простой и изящной форме трактовать этот и связанные с ним вопросы. Отметим, что условия симметрии ац = ац в уравнениях A) выполнены автоматически в силу происхождения уравнений. Это простое, но существенное свойство позволит нам получить боль- большое количество информации, касающейся природы решений. Ис- Используя свойство симметрии, мы преобразуем Q(x) к более про- простой форме, которая играет важнейшую роль в теории матриц и квадратичных форм. Продолжим теперь наше изложение. § 2. Решение системы линейных однородных уравнений. Нам необходим следующий фундаментальный результат. Лемма- Для того чтобы линейная система N 2 Vfy = 0, i=\, 2, ..., N, A) имела нетривиальное решение, необходимо и достаточно равен- ¦ство нулю ее определителя 1.М=0. B)
§2] СИСТЕМЫ ЛИНЕЙНЫХ ОДНОРОДНЫХ УРАВНЕНИЙ 5Г Как обычно, под «нетривиальным» мы понимаем решение, в котором по крайней мере одно из неизвестных отлично от нуля. Этот результат фактически является частным случаем более общего, относящегося к линейной системе, в которой число урав- уравнений не равно числу неизвестных. Обсуждение этих вопросов имеется в приложении А. Однако здесь мы дадим простое индук- индуктивное доказательство, устанавливающее все необходимые нам факты. Доказательство леммы. Необходимость очевидна. Если \Ьц\Ф0, систему можно решить по правилу Крамера и по- получить тем самым единственное тривиальное решение Х\=х2 = . . . ... = Xjv = 0. Докажем достаточность. Очевидно, что результат справедлив для Л/=1. Тогда посмотрим, можно ли установить истинность результата для N, предполагая его справедливым для N— 1. По крайней мере один из элементов Ь^ не нуль, так как в противном случае результат тривиально верен. Предположим,, что не равен нулю один из элементов первой строки, при этом, не теряя общности, можно принять, что этот элемент есть Ьп. Обращаясь к линейным уравнениям A), исключим Х\ из пер- первого и второго уравнений, из первого и третьего и т. д. Получен- Полученная система имеет вид Ъ2\Ъ\2 х2+ ... +[b2N- b1\b\N C) 'N2- ... +[bNN- bN\blN Установим соответствие между определителем этой системы и исходным определителем порядка N. Вычитая первую строку определителя, умноженную предварительно на &21Д41, из второй; первую строку, умноженную на Ьз\/Ьи, из третьей и т. д., мы придем к соотношению 12 bN2 ... b NN 0 boo - ~ bo,b >2N 1 V bN\b\N . D) Отсюда следует, что определитель (N—1)-мерной системы C) есть нуль, так как по предположению ЬцФО, а \Ьц\=0. Из
58 ДИАГОНАЛИЗАЦИЯ СИММЕТРИЧЕСКИХ МАТРИЦ [ГЛ. 3 нашего индуктивного предположения следует, что существует нетривиальное решение системы C): х2, х3,..., xN. Полагая N /=2 получаем тем самым искомое нетривиальное решение систе- системы A): хих2, ... ,xN. Упражнение 1. Показать, что если А — вещественная матрица и уравнение Ах = 0 имеет нетривиальное решение, то всегда существует нетривиальное веще- вещественное решение. § 3. Собственные векторы и собственные значения. Используя векторно-матричные обозначения, запишем систему A.1) в виде Ах = Хх. A) Из леммы § 2 следует, что нетривиальное решение этого урав- уравнения существует в том и только в том случае, если К является корнем уравнения \а{}-Х6ц\=0, B) которое обычно будем записывать в виде |Л-Я/|=0. C) Это уравнение называется характеристическим уравнением ма- матрицы А. Как полиномиальное уравнение относительно К, оно имеет N корней, которые называются характеристическими чис- числами, или собственными значениями матрицы А. Если все корни различны, то мы будем иногда пользоваться термином простые, противопоставляя его термину кратные. Каждому собственному значению ставится в соответствие собственный вектор, определенный с точностью до скалярного множителя. Этот собственный вектор может быть найден индук- индуктивным путем, намеченным в § 2, или с помощью метода, приве- приведенного в приложении А. Ни один из этих способов не является привлекательным, особенно для больших значений N, так как их применение связано с большим объемом вычислений. В на- настоящее время не имеется простых методов нахождения соб- собственных значений и собственных векторов матриц большого размера. Как было отмечено в предисловии, в настоящей книге мы умышленно не приводим библиографии по вычислительным ме-
^ 4] ДВА ФУНДАМЕНТАЛЬНЫХ СВОЙСТВА 59" годам, применяемым для определения численных значений соб- собственных значений и собственных векторов*). Если К — кратный корень характеристического уравнения, то- для произвольной квадратной матрицы может не быть равного кратности корня числа соответствующих собственных векторов. Эти вопросы обсуждаются во второй части настоящей книги, по- посвященной изучению общих, не обязательно симметрических матриц. В случае симметрических матриц кратные корни при- приводят к определенным неудобствам, однако они легко преодоле- преодолеваются. Мы покажем, что вещественная симметрическая матрица порядка N имеет N различных собственных векторов. Упражнения 1. Матрицы А и А' имеют одинаковые собственные значения. 2. ТАТ—к/—Т'(А—Я/)Т, если матрица Т ортогональная. Показать, что- матрицы А и ТАТ имеют одинаковые собственные значения, если Т — орто- ортогональная матрица. 3. Матрицы А и Т*АТ имеют одинаковые собственные значения, если матрица Г унитарная. 4. Матрицы SAT ц А имеют одинаковые собственные значения, если ST = 1. 5. Показать непосредственным вычислением для матриц Л и В размеров 2X2, что матрицы АВ и ВА имеют тождественные характеристические уравнения. 6. Справедлив ли этот результат в общем случае0 7. Показать, что произведение собственного вектора на любой скаляр- скалярный множитель, кроме нуля, также есть собственный вектор. Используя этот факт, показать, что мы всегда можем выбрать собственный вектор х так,, что (х, х) = \. 8. Показать, рассматривая матрицы размеров 2X2, что собственные зна- значений матрицы А+В не могут быть получены в общем случае как сумма собственных значений матриц А и В. 9. Показать, что аналогичное утверждение справедливо для собственных значений матрицы АВ. 10. Для случая матрицы размеров 2x2 получить соотношение между соб- собственными значениями матриц А и Л2. 11. Существует ли соответствующая связь между собственными значе- значениями матриц А и Ап для п=3, 4,...? § 4. Два фундаментальных свойства симметрических матриц. Приведем простые доказательства двух фундаментальных ре- результатов, которые по существу являются основой анализа ве- вещественных симметрических матриц. Хотя мы интересуемся сим- симметрическими матрицами, элементы которых вещественны, мы будем иногда добавлять слово «вещественный» для того, чтобы *) По поводу вычислительных методов опоеделення собственных значе- значений и собственных векторов см. Д. К. Фаддеев и В. Н. Фаддеева Вычислительные методы в линейной алгебре, Физматгиз, 1963. (Прим. ред.)
•60 ДИАГОНАЛИЗАЦИЯ СИММЕТРИЧЕСКИХ МАТРИЦ [ГЛ. 3 подчеркнуть этот факт и предупредить любую возможную ошибку. Теорема 1. Собственные значения вещественной симметри- симметрической матрицы вещественны. Доказательство. Предположим обратное. Так как А — вещественная матрица, то из характеристического уравнения А—А,/|=0 следует, что число, комплексно сопряженное ка- каждому собственному значению, также есть собственное значение. Мы получаем этот результат и всю дальнейшую информацию из того факта, что если Ах = Кх, A) то справедливо также равенство Ах = Кх. B) Из этих соотношений следует (х,Ах)=Цх,х), (х,Ах)=Цх,х). {и) Так как матрица А симметрическая, то (х, Ах) = (Ах, х) = = (х, Ах) и полученные соотношения дают 0=(К-1){х,~х), D) откуда А = А. Последнее противоречит принятому предположе- предположению. Это означает также, что собственные векторы веществен- вещественной симметрической матрицы А всегда могут быть выбраны ве- вещественными. Мы будем поступать именно таким образом. Второй результат содержится в следующей теореме. Теорема 2. Собственные векторы, соответствующие различ- различным собственным значениям вещественной симметрической ма- матрицы, ортогональны. Доказательство. Из равенств у м, 1ф\х, мы получаем (у,Ах)=К(у,х), (x,Ay)=]i(x,y). Так как (х, Ау) = (Ах, у) — (у, Ах), то вычитание дает 0=(К-ц)(х,у}, ' G); откуда следует (х,у)=0.
§ 5) ПРИВЕДЕНИЕ К ДИАГОНАЛЬНОЙ ФОРМЕ 61 Этот результат является основным по своей важности. Его обобщение на операторы более общего вида представляет собой один из краеугольных камней классического анализа. Упражнения 1. Один собственный вектор не может соответствовать двум различным собственным значениям. 2. Показать для матрицы размеров 2X2, что два различных вектора мо- могут соответствовать одному собственному значению. 3. Показать на примере, что существуют симметрические матрицы А и В размеров 2X2 такие, что определитель \А— кВ\ тождественно равен нулю. При каком условии, налагаемом на элементы матрицы В, мы можем утвер- утверждать, что все корни уравнения \А — ХВ\ = 0 вещественны? 4. Показать, что если матрицы второго порядка А и В вещественные симметрические и, кроме того, В положительно определенная, то все корпи уравнения \А—А5!=0 вещественны. 5. Показать, что собственные значения эрмитовой матрицы вещественны и собственные векторы, соответствующие различным собственным значениям, ортогональны. Для доказательства воспользоваться обобщенным скалярным произведением (х, у). 6. Пусть элементы а{1 матрицы А зависят от параметра t. Показать, что производная от определителя \А\ по t может быть записана как сумма N определителей, где /г-й определитель получен дифференцированием элемен- элементов k-и строки при неизменных остальных строках. лг 7. Показать, что производная от \А—Х1\ по % равна — ~^j \ А^ — ?,1 \, k=i Где Ah — матрица размеров (N-l)X(N-l), полученная из А вычеркива- вычеркиванием k-н строки и /г-го столбца. 8. Из результата предыдущего упражнения следует, что если к— про- простое собственное значение матрицы А, то по крайней мере один из опреде- определителей \Ah—к!\ отличен от нуля. 9. Используя этот результат, показать, что если к—простое собствен- собственное значение матрицы Л, то компоненты соответствующего собственного век- вектора всегда могут быть записаны в виде полиномов от Я и от элементов матрицы Л. § 5. Приведение к диагональной форме. Различные собственные значения. Мы без особых усилий можем получить весьма важ- важный результат, если примем упрощающее предположение, что матрица А имеет различные собственные значения Ки Х2, ¦ ¦ ¦ , ?wv- Пусть х1, х2, . . . , xN — соответствующие собственные векторы, нормированные условием (*',*') = !, ' = 1,2 N. A) Рассмотрим матрицу Г, столбцами которой являются век- векторы хи. Т={х\х*,...,х"). B)
62 ДИАГОНАЛИЗАЦИЯ СИММЕТРИЧЕСКИХ МАТРИЦ [ГЛ. 3 Тогда Т есть матрица, строками которой являются векторы *': Г = х1 C) Вследствие ортогональности х' как собственных векторов, со- соответствующих различным собственным значениям симметриче- симметрической матрицы, мы получаем, что ГГ= || (ж',*") 11 = ИМ, D) т. е. Г — ортогональная матрица. Мы можем теперь утверждать, что произведение AT имеет простую форму =(hx\ X2x2,... E) т. е. столбцами матрицы-произведения будут векторы А,*г. Еще раз учитывая ортогональность векторов х\ получаем ГЛ Г 41 М-**, О А2 О F) На главной диагонали матрицы в правой части последнего равенства находятся собственные значения Аь К2, ..., kN, все остальные элементы матрицы равны нулю. Матрица такого типа, как отмечалось ранее, называется диагональной. Умножая последнее выражение справа на Т' и слева на Т, в силу свойства ортогональности ТТ' — I получаем важный ре- результат А, О А9 О Г. G) Описанный процесс называется приведением матрицы к диаго- диагональной форме. Как мы увидим впоследствии, это представление играет фундаментальную роль в теории симметрических матриц.
$ 6] ПРИВЕДЕНИЕ КВАДРАТИЧНОЙ ФОРМЫ Введем обозначение Л = О Х2 63 (8) Упражнения 1. Показать, что Л* = и что Ak = TKkT' при ?=1,2, ... 2. Показать, что матрица А, имеющая различные собственные значения, удовлетворяет своему характеристическому уравнению. Этот факт является частным случаем более общего результата, который мы установим позднее. 3. Найти собственные векторы, соответствующие собственным значениям матриц Ah, k=2,3,..., если матрица А имеет различные собственные зна- значения. § 6. Приведение квадратичной формы к каноническому виду. Покажем теперь, что рассмотренное матричное преобразование приводит к важному преобразованию квадратичной формы Q(x). Полагая х = Ту, где Т определяется формулой E.2), мы получаем фундаментальное соотношение (х.Ах) = (Ту, АТу) = {у, Г AT у) = (у, Ау) A) или в скалярной форме N tXj = 2 Xt/ i — \ B) Так как матрица Т ортогональная, то мы видим, что х=Ту озна- означает Т'х=Т'Ту = у. C) Следовательно, каждому значению х соответствует одно опреде- определенное значение у, и наоборот. Таким образом, мы получили чрезвычайно полезный результат. Множество значений, прини- принимаемых формой Q(x) на сфере (л:, лг) = 1, совпадает со значе- значениями, принимаемыми квадратичной формой (у, Ау) на сфере (У,У) = 1- Пока мы установили этот факт только для случая, когда все Хг различны. Как мы увидим в гл. 4, этот результат справедлив в общем случае и представляет собой одно из основных положе- положений теории квадратичных форм. Упражнения 1. Пусть матрица А имеет различные положительные собственные зна- значения. Используя полученный результат, вычислить объем iV-мерного эллип- эллипсоида (х, Ах) = \.
64 ДИАГОНАЛИЗАЦИЯ СИММЕТРИЧЕСКИХ МАТРИЦ [ГЛ. 3 2. Следуя намеченному выше пути, доказать, что собственные значения эрмитовой матрицы вещественны и что собственные векторы, соответствую- соответствующие различным собственным значениям, ортогональны. Для доказательства воспользоваться обозначением [х, у], введенным в § 16 гл. 2. 3. Показать, что если собственные значения эрмитовой матрицы А раз- различны, то мы можем найти такую унитарную матрицу Т, что А = ТАТ*. Это частный случай более общего результата, который будет доказан в следую- следующей главе. 4. Пусть А — вещественная кососимметрическая матрица, А' = —А. Пока- Показать, что ее собственные значения или нули, или чисто мнимые. 5. Пусть Т — ортогональная матрица. Показать, что все ее собственные значения имеют абсолютную величину, равную 1*). 6. Пусть Т — унитарная матрица. Показать, что все ее собственные зна- значения имеют абсолютную величину, равную 1. 7. Предположим, что мы пытаемся получить представление E.2), не делая предположения о простоте собственных значений симметрической ма- матрицы А. Начнем с утверждения, что всегда можно найти симметрическую матрицу В с произвольно малыми элементами, обладающую тем свойством, что А + В имеет простые собственные значения. Мы не останавливаемся на этом подробно, так как доказательство этого обстоятельства несколько сложнее, чем можно было бы предположить, см. § 16 гл. 11. Пусть {[Хг} — собственные значения матрицы А+В. Тогда, как мы знаем, существует ортогональная матрица S такая, что О О S'. Так как матрица S ортогональная, то ее элементы равномерно ограни- ограничены. Пусть {Вп\ — такая последовательность матриц, стремящихся к нулю, что соответствующая последовательность ортогональных матриц {Sn} схо- сходится. Тогда предел матриц {Sn} должен быть ортогональной матрицей, обо- обозначим его через Т. Так как lim ц,- =Я., то мы имеем А= lim П -> оо Bn) lim Sn п -> °о lim П ¦> °о о lim lira S'n. п. -> оо Ввиду того что это доказательство основывается на аналитических поня- понятиях, которые будут введены лишь позднее, мы не излагаем его в основном тексте. Оно иллюстрирует очень полезный математический принцип, состоящий в том, что результаты, действительные для общих вещественных симметриче- симметрических матриц, всегда могут быть первоначально установлены для матриц с раз- различными собственными значениями с последующим переходом к пределу. *) Имеется в виду вещественная ортогональная матрица. (Прим. ред.)
УПРАЖНЕНИЯ К ГЛ. 3 65 § 7. Положительно определенные квадратичные формы и мат- матрицы. В § 9 гл. 1 мы ввели понятие положительно определенной квадратичной формы двух переменных и родственные понятия неотрицательной и неположительной форм. Распространим эти определения наЛ'-мерные квадратичные формы. Если А =||а*3-||— вещественная симметрическая матрица и лг Qn(*)= % atJxtXj>0 для всех нетривиальных х,, то мы будем говорить, что Qn{x) — положительно определенная форма и А — положительно опреде- определенная матрица. Аналогично, если Н — эрмитова матрица и форма N Pn (х) ~ 2 hijXiXj > 0 для всех комплексных нетривиальных хи то мы будем говорить, что форма Р^(х) и матрица Н положи- положительно определенные. Упражнения 1. Пусть А—симметрическая матрица с различными собственными зна- значениями; получить необходимые и достаточные условия того, что А — поло- положительно определенная матрица. 2. Для произвольной заданной симметрической матрицы А существует ли скаляр с\ такой, что матрица А + с\1 положительно определенная. 3. Показать, что мы можем записать симметрическую матрицу А в форме N А = 2 где Ei — неотрицательные симметрические матрицы. При этом для k—\,%,.. 4. Если р (Я) — полином относительно Я со скалярными коэффициентами тп tn Р W = 2 €к^к> т0 чеРез Р И) обозначают матрицу р (А) = 2 С/И*- Пока- N зать, что р {А) = 2 Р (я<) Е1- Упражнения к гл. 3 1. Пусть А и В — две симметрические матрицы. Тогда, если матрица В положительно определенная, то все корни уравнения \А—А,В]=0 веществен- вещественны. Что можно сказать о векторах х, удовлетворяющих соотношению Ах= XB> 5 Р. Беллмаа
66 ДИАГОНАЛИЗАЦИЯ СИММЕТРИЧЕСКИХ МАТРИЦ [ГЛ. 3 2. Каждая матрица единственным образом представима в форме A—H+S, где Н — эрмитова матрица, a S—косоэрмитова матрица, т. е. та- такая, что S*^—S. 3. В качестве обобщения теоремы 1 показать, что если А, — собствен- собственное значение вещественной матрицы А, то |ImA,|^d(/V(/V—l)/2)Vi, где d = max la., —a., 1/2. (Бендиксон.) Kt, j<N ' ] 4. Вообще пусть А — комплексная матрица; тогда если d, = max | atJ |, d2 = max \atJ + aJ( |/2, то мы имеем 5. Показать, что для любой комплексной матрицы справедливы нера- неравенства *) N 2 <Г i. N ! = N (а -й )/2р. (Шур.) 6. Мы не исключали возможности того, что одному собственному зна- значению могут соответствовать несколько линейно независимых собственных векторов. Как мы увидим, это возможно, если матрица А имеет кратные собственные значения, и этого не может быть, если собственные значения просты. Наиболее простое доказательство этого факта существенно исполь- использует понятия, вводимые в последующих главах. Рассмотрим иной путь дока- доказательства. а) Пусть хх и у — два линейно независимых собственных вектора, соот- соответствующих собственному значению Xi. Тогда х1 и г = у—*'(*', у)/(ж', ж1) — ортогональные собственные векторы. б) Пусть г1 — нормированный вектор г. Тогда матрица 5= (х\ г\ х* xN) является ортогональной. ') Имеются гораздо более тонкие результаты. См. статьи Брауэра (А. Вгаиег) в Duke Math. J., 1946, 1947, 1948, где имеются также даль- дальнейшие ссылки. См. также Паркер (W. V. Р а г ke r), Characteristic Roots and Fields of Value of a Matrix, Bull. Amer. Math. Soc. 57 A951), 103—108. г *) См. теорему Шура ниже в § 13 r/t. 11. (Прим. ред.)
БИБЛИОГРАФИЯ И КОММЕНТАРИЙ 67 в) A = SDS', где О г) Из этого следует, что преобразование x=Sy переводит (х, Ах) в (y,Dy). д) Предположим, что А — положительно определенная матрица (если это не так, то рассмотрим матрицу A + ciI). Тогда, с одной стороны, объем эллипсоида (х, Ах) — \ равен объему эллипсоида и, с другой стороны, как следует из только что проведенных рассуждений, равен объему эллипсоида Если Х.2, то эти результаты противоречат друг другу. Библиография и комментарий § 2. Это доказательство взято из книги Мирский (L. Mirsky), Introduction to Linear Algebra, Oxford Uni- University Press, New York, 1955. Термин «спектр» для множества собственных значений пред- предложен Гильбертом. § 5. Мы в дальнейшем часто будем пользоваться схемой, в которой общему случаю предшествует рассмотрение при условии простых собственных значений. При исследовании многих во- вопросов мы будем опираться на соображение непрерывности, по- подобно тому как это сделано в упражнении 7 § 6. Использование этого метода требует осторожности, так как иногда имеются существенные различия в свойствах матриц с простыми и крат- кратными собственными значениями. Мы не придали здесь этому ме- методу особого значения, потому что его полное обоснование тре- требует тонкого и сложного анализа. Отметим, однако, что это очень мощный метод и поэтому им следует овладеть. 5*
Глава 4 ПРИВЕДЕНИЕ СИММЕТРИЧЕСКИХ МАТРИЦ К ДИАГОНАЛЬНОЙ ФОРМЕ В ОБЩЕМ СЛУЧАЕ § 1. Введение. В этой главе мы хотим показать, что результаты, полученные в гл. 3 в предположении простоты собственных зна- значений, в действительности имеют место в случае симметрических матриц общего вида. Доказательство, которое мы приведем, дает превосходные возможности для обсуждения понятия линейной независимости и метода ортогонализации Грама — Шмидта. При этом будут рассмотрены некоторые другие интересные методы. § 2. Линейная зависимость. Пусть х1, х2, ..., xh — набор k АЛ-мер- ных векторов. Мы говорим, что эти векторы линейно зависимы, если существуют скаляры си с2, ... , с&, из которых по крайней мере один отличен от нуля, такие, что с,*1 + с2*2+ ... + chxh = Q, A) где 0 означает нулевой вектор. Если не существует таких ска- скаляров, то мы говорим, что векторы линейно независимы. Ссылаясь на результаты, полученные в приложении А, можно утверждать, что понятие линейной независимости пред- представляет интерес только для случаев k *CN, так как любые k век- векторов, где k~>N, связаны соотношением вида (I). Упражнения 1. Показать, что произвольные взаимно ортогональные ненулевые век- векторы линейно независимы. 2. Пусть задан ненулевой вектор в произвольном JV-мерном пространстве. Показать, что всегда можно найти набор из Л'—1 векторов, который вместе с данным вектором образует линейно независимую систему. § 3. Ортогонализация Грама—Шмидта. Пусть х\ х2, ..., xN — вещественные линейно независимые /V-мерные векторы. Мы хо- хотим показать, что можно образовать некоторые линейные комби- комбинации этих базисных векторов, которые будут представлять собой систему взаимно ортогональных векторов.
§ 3] ОРТОГОНАЛИЗАЦИЯ ГРАМА - ШМИДТА 69 Процедура, которой мы следуем, индуктивна. Начнем с опре- определения двух новых векторов у1 = X1, A) где йц — скаляр, определенный из условия, что векторы у1 и у2 ортогональны. Соотношение =0 B) дает величину аи: {х1, х2) Так как векторы х1 по предположению линейно независимы, то вектор х1 не может быть равен нулю, так что скалярное про- произведение (xl,xx) отлично от нуля. Пусть, далее, D) где теперь уже два коэффициента а2\ и а22 определяются из усло- условий ортогональности: (У3,У])=0, @3,02)=О. E) Эти условия упрощаются, если в силу A) заменить уравне- уравнение E) эквивалентными соотношениями @3,*')=О, (»3,*J)~0. F) Последние приводят к системе уравнений, линейной относитель- относительно неизвестных коэффициентов asi и а22: (х\ ж1) + а2] (х\ х') + а22(х\ ж1) = О, (*3, х2) + а21 (х\ х2) + а22 (х2, х2) = 0. G) Эти уравнения можно решить, используя правило Крамера, при условии, что определитель (Х\ X1) (Х\ X2) °2 (х\ х2) (х2, х2) (8) не равен нулю. Чтобы показать, что определитель D2 не равен нулю, посту- поступим следующим образом. Предположим противное, D2 = 0. Тогда
70 ДИАГОНАЛИЗАЦИЯ В ОБЩЕМ СЛУЧАЕ (ГЛ. 4 из леммы, установленной в § 2 гл. 3, следует, что существуют два скаляра Г\ и S\, из которых по крайней мере один отличен от нуля, удовлетворяющие линейным уравнениям Эти уравнения могут быть записаны в форме (х\ (л2, г,*1 + stx2) = 0. (Ш) Умножая первое уравнение на ги а второе на Si и складывая результаты, мы получаем 2, riXl+SiX2)=0. A1) Однако это уравнение в силу вещественности коэффициентов может быть выполнено, только если r\X^+S\X2 = 0, что противо- противоречит принятому допущению о линейной независимости векто- векторов х\ Следовательно, определитель D24=0, и система G) имеет единственное решение. На следующем шаге мы вводим вектор A2) Как и ранее, условия взаимной ортогональности (У\х4 = (у\х2) = (у\х*)=--О A3) приводят к системе уравнений (х*,х*)+а31(х\х*) + а32{х2, *') +а33(*3,**) =0, A4) 1=1, 2, 3. Мы можем решить эти уравнения относительно коэффициен- коэффициентов аз1, «32 и пзз, показав, что определитель Da=\(xi,xi)\, l,j=l,2,3, A5) отличен от нуля. Доказательство того, что О3Ф0, полностью' аналогично проведенному для двумерного случая. Эту проце- процедуру можно продолжить шаг за шагом до тех пор, пока не будет получен полный набор взаимно ортогональных векторов {у1}. Эти векторы могут быть нормированы условием (yi,yi) = l. В этом случае мы говорим об ортонормированием наборе век- векторов. Определители Dh называются определителями Грама. :
.§ 3] ОРТОГОНАЛИЗАЦИЯ ГРАМА — ШМИДТа 71 Упражнения 1. Рассмотрим отрезок [—1, 1] и определим скалярное произведение двух вещественных функций f(t) и g(t) следующим образом: (/, g) = J / (/) g (t) dt. -l Пусть Po (t) = -q". Другие элементы последовательности {Pn(t)} веществен- вещественных полиномов степени п определены условиями (Я„,Ят)=0, тфп; (Я„, Рп) = 1. Доказать, что (Я„,?т)=0 для O^Cm^n—1, и построить не- несколько первых членов последовательности. 2. При том же определении скалярного произведения, что и в предыду- предыдущем упражнении, доказать, что где O^/n^rt—1, и, таким образом, выразить полиномы Рп через—,; A — I2)". Эти полиномы с точностью до постоянных сомножителей совпадают с клас- классическими полиномами Лежандра. 3. Рассмотрим интервал @, оо) и определим скалярное произведение оо двух вещественных полиномов f(t) и g(t) соотношением (f, g) = e~* о Пусть последовательность полиномов {Ln(t)} определена условиями: L0@=l, Ln{t) — полином степени п, и (Ln,Lm)=0, пф m; (Ln,Ln) = \. Доказать, что из зтих условий следует равенство (Ln,tm)=O, О^ш^Гп—1, и сконструировать несколько первых членов последовательности. е' —гш е~Ч", 1т\ = 0, О^т^ п— 1, и, таким образом, выразить полиномы Ln через е1 —р^ е~Чп. Эти полиномы с точностью до постоянных сомножителей совпадают с классическими полиномами Лагерра. 5. Рассмотрим интервал (—оо, оо) и определим скалярное произведе- произведение двух вещественных полиномов f(t) и g(t): e~pf (t) g (t) dt. Пусть последовательность полиномов {Hn(t)\ определена следующим обра- образом: Яо(О = 1. Hn(t)—полиномы степени п и (Ят,Яп)=0, тфп; (Нп,Нп) = \. Доказать, что (//,,,/т) =0, О^т^п—1, и сконструировать несколько первых членов последовательности. 6. Доказать, что \е —гщ- е~г, tm I = 0, 0 ^.т^п— 1, и выразить поли- полиномы Нп через е' ~^- е~г • Эти полиномы с точностью до постоянных сом- ножителей совпадают с классическими полиномами Эрмита..
72 ДИАГОНАЛИЗАЦИЯ В ОБЩЕМ СЛУЧАЕ [ГЛ. 4 7. Показать, что если дан вещественный Л'-мерный вектор, нормирован- нормированный условием (х\х') = 1, то мы можем найти /V—t дополнительных векторов х2, х3 xs таких, что матрица Т=(х\х2,.. . ,xN) ортогональная. 8. Получить аналог процедуры Грама — Шмидта для комплексных век- векторов. § 4. Положительность определителей Грама Dk. Все, что тре- требовалось в предыдущем параграфе в той его части, где рассма- рассматривалась ортогонализация, — это неравенство нулю определи- определителя Dh. Покажем теперь, что незначительное развитие приве- приведенных ранее рассуждений позволит нам сделать вывод, что в действительности определители D^ положительны. Этот резуль- результат не очень важен на данном этапе, но сам метод доказатель- доказательства интересен и иногда полезен. Рассмотрим квадратичную форму Q(uu u2, .... щ) = ...+ukxk, = 23 (¦**, где Ui — вещественные величины, а х\ как и ранее, образуют систему вещественных линейно независимых векторов. В силу линейной независимости векторов х{ квадратичная форма Q>0 для всех нетривиальных значений «». Следовательно, свойство, которое мы хотим установить, является следствием общего ре^ зультата, состоящего в том, что определитель D=\au\ B) любой положительно определенной формы N Q= ^ aijUtUj C) положителен. Мы покажем, что свойство положительности про- просто следует из того факта, что рассматриваемый определитель всегда отличен от нуля. Положительность определителя, как мы увидим, может быть легко установлена на основании результатов, которые мы полу- получим в дальнейшем. Однако полезно проводить анализ различных результатов, выясняя, в какой мере они могут быть выведены из простых фактов.
ОДНО ТОЖДЕСТВО 73 Итак, начнем с замечания, что определитель D никогда не равен нулю. Действительно, если D — 0, то имеется нетривиаль- нетривиальное решение системы однородных линейных уравнений N 2 CLijUj = О, t=l, 2, N. Эти равенства приводят нас к следующему: N I N \ Q = 2«^2aiy«yJ = O, D) E) что противоречит положительной определенности формы C). Это рассуждение в основном повторяет доказательство, кото- которое мы привели в § 3. Новое возникает при доказательстве положительности D. Рассмотрим семейство квадратичных форм, определяемое соот- соотношением N />(A,) = A,Q + (l-*J«.2, F) где л — скалярный параметр, изменяющийся на интервале [0, 1]. Очевидно, что для всех X в этом интервале квадратичная фор- форма Р{к) положительна при всех нетривиальных щ. Следователь- Следовательно, определитель квадратичной формы Р(Х) никогда не равен нулю. Но для Я = 0 определитель записывается в простой форме 1 О О 1 = 1 G) и, очевидно, положителен. Поскольку, далее, определитель Р(к) является непрерывной функцией параметра А, и не обращается в нуль при его изменении (O-^X-^l), то положительность Р(Х) при Х — 0 влечет положительность при к=1. Это доказывает сформулированный результат. § 5. Одно тождество. Другой метод доказательства положи- положительности определителя Dk для линейно независимых векторов х{ основывается на неравенстве, которое потребуется нам снова в одной из следующих глав, посвященных неравенствам.
74 ДИАГОНАЛИЗАЦИЯ В ОБЩЕМ СЛУЧАЕ [ГЛ. Теорема 1. Пусть х\ i=\, 2,.... k, — набор N-мерных век- векторов, N > k\ тогда X*. XR. A) (i, j=l, 2, ..., k), суммирование производится по всем индексам {ik}, удовле- удовлетворяющим неравенствам 1 ^ i\, i2,.. . , 4 -^ ЛЛ Доказательство. Прежде чем дать доказательство, от- отметим, что в случае k = 2 A) превращается в тождество Ла- гранжа I N \ f N \ / N \2 1 \i = \ I \; = i / \j = i Для того чтобы используемый нами метод доказательства был ясен, достаточно рассмотреть случай & = 3. Это позволит упро- упростить обозначения. Мы хотим показать, что N 1=1 N у 1 = 1 - 3! ZJ Kfe, C) Начнем с равенства Х1 Vl zl xm Ут гт 2 = = xkyk + xiyi+xmyn Х1У1^ '+у1 + xlz lzl xkzk + xlzl + xmzm Vkzk + Vlzl + Утгт Zk + zl + zn ,D) которое следует из правила перемножения определителей. По- Последний определитель может быть записан в виде суммы трех определителей, первый из которых является типичным: XkZk E)
МАТРИЦЫ ВТОРОГО ПОРЯДКА 75 Вычитая из второго столбца первый, умноженный на yjxk, и из третьего столбца первый, умноженный на zh/xh, мы получаем XlZl+XmZn XkZk F) Записывая этот определитель как сумму двух определителей, каждый из которых имеет вид ¦? у 11 у у Л- y У к I"I II mm ' U iP- U Z \ U Z 2 i 2 i XkZk VlZl Zl ' Zm и вычитая из третьего столбца второй, умноженный на окончательно получаем G) У\ XmZm Z2 (8) Суммируя по всем k, I и т, мы получаем левую часть равен- равенства C). Отметим, что описанная процедура привела к опреде- определителю вида (8), причем на каждом этапе преобразований мы рассматривали один типичный определитель, общее число кото- которых, как нетрудно видеть, равно 3x2. Из этого следует, что дополнительно требуется множитель 1/3! § 6. Диагонализация симметрической матрицы второго порядка. Для того чтобы показать, что произвольная вещественная сим- симметрическая матрица может быть приведена к диагональной форме применением ортогонального преобразования, восполь- воспользуемся методом индукции, рассматривая первоначально случай 2X2. Пусть А —симметрическая матрица А = Й21 «12 Й22 A) и пусть л,1 и х1 — соответствующие собственное значение и соб- собственный вектор. Это означает, что справедливы соотношения Ах1 = hxl или (a1, jc1) = л,1*ц, (а2, л;1) = %\Хи, B) где Ян и Х\2 — компоненты вектора Xх, которые будем считать нормированными условием {хх,хх) = \.
76 ДИАГОНАЛИЗАЦИЯ В ОБЩЕМ СЛУЧАЕ [ГЛ. 4 Как мы знаем, можно построить ортогональную матрицу Г2 размеров 2x2, одним из столбцов которой является вектор ж1. Пусть другим столбцом будет вектор х2. Мы хотим показать, что где Xi и Яг — не обязательно различные собственные значения матрицы А. При этом мы, конечно, сталкиваемся с трудностями, свойственными общему случаю. Для случая различных собствен- собственных значений мы уже привели простое доказательство. Покажем первоначально, что Т2АТ2 = L1 bl2\, D) где bj2 и &22 — пока неизвестные параметры. Существенным об- обстоятельством является то, что элемент под главной диагональю равен нулю. Из уравнений B) следует , , | Х{хп {а1, х2) II 2АТ2=Т2\ , 2 2 . E) Так как ГгГ2 = ^, то, производя умножение, получаем*) где &12 и &22 — параметры, значения которых будут определены ниже. Начнем с параметра bi2 и покажем, что он равен нулю. Это следует из того, что матрица Т2АТг симметрическая: (Т'2АТ2У = Т2А' (Т'2У = Т'2А'Т2 = f2AT2. G) Покажем, наконец, что величина 622 равна второму собствен- собственному значению матрицы А. Это следует из уже отмечавшегося факта, что собственные значения матрицы А совпадают с соб- собственными значениями матрицы Т2АТ2. Следовательно, ?22 = ^2. Этим заканчивается доказательство двумерного случая. Этот случай существен не только для метода индукции. Он предста- представляет для нас ценность и потому, что его изложение содержит все элементы общего доказательства. *) Здесь хп=(х\х*) = 1 и *i2= (х2, х1) =0. (Прим. ред.)
ЛГ-МЕРНЫИ СЛУЧАЙ 77 § 7. W-мерный случай. Применим метод индукции. Предполо- Предположим, что для каждого k, k=l, 2,. . . , N, мы можем определить ортогональную матрицу Ти, которая приводит вещественную сим- симметрическую матрицу А = \\ctij\\, i, j = 1,2, ..., k, к диагональ- диагональной форме х О A) О Элементы главной диагонали Я; должны быть тогда собствен- собственными значениями матрицы А. Сделав это предположение, кото- которое, как мы знаем, справедливо для N--2, покажем, что такое же приведение может быть выполнено для k = N + 1. Пусть B) а N+\ и пусть %\ и xi — соответствующие собственное значение и соб- собственный вектор матрицы AN+i. Действуя так же, как и в двумерном случае, мы построим ортогональную матрицу Ти первый столбец которой есть х\ Пусть остальными столбцами будут х2, х3,. .., xN+l, так что ма- матрица Т\ имеет вид Ti = (x\x2,...,xN^). C) Тогда, как и ранее, первый шаг состоит в том, чтобы показать, что матрица Т\Ац+\Т\ представима в виде Я, О о о >\2 >\N D) при этом: а) все элементы первого столбца нули, кроме первого элемента, равного Ль б) величины 612, Ъ\3,.... blN будут определены ниже; в) матрица AN имеет размеры NN
78 ДИАГОНАЛИЗАЦИЯ В ОБЩЕМ СЛУЧАЕ [ГЛ. 4 Выполняя умножение, получаем (а1, л:1) (а1, л:2) ... (а1, (а2, х1) (а2, х2) ... (а2, (aN+i, л2) ... (aN+1, xN+]) A,*,, (a\ x2) ... (a1, *"+') M12 (d\ x2) ... (a2, jc-v+1) l,xUN+] (aN+\ л:2) ... Так как Тх — ортогональная матрица, то А) 0\2 ... b\t N + О О E) F) Для определения величин Ьн используем тот факт, что ма- матрица TiAN+\Ti симметрическая. Очевидно, что эти величины — нули и матрица AN также сим- симметрическая. Тем самым доказано существование ортогональной матрицы Тх такой, что ' Ai 0 ... О О AN О G) где AN — симметрическая матрица. Отметим, что собственными значениями матрицы AN должны быть Я2Д3,..., Л-jv+i, остающиеся собственные значения матри- матрицы AN+i. Это следует из уже отмечавшейся тождественности соб- собственных значений матриц AN+1 и T'\An+iT\ и из того обстоя- обстоятельства, что характеристическое уравнение матрицы, стоящей в правой части равенства F), имеет вид (Х\ — V,\AN — >„/|=0. Применим теперь нашу индуктивную гипотезу. Пусть TN — ортогональная матрица, приводящая AN к диагональной форме.
§ n yV-МЕРНЫЙ СЛУЧАЙ 79 Построим матрицу (УУ+1)-го порядка 1 0 ... О О О (8) которая, очевидно, также является ортогональной. Легко про- проверить, что /v+i \ГiAn Sn+\ = О О Так как можно записать Sjv+i {Ti An+\T\) Sn+\ — \T\Sn+u (9) A0) то 7"iSjv+i — искомая ортогональная матрица, приводящая ма- матрицу AN+l к диагональной форме. Таким образом, доказан следующий важный результат. Теорема 2. Вещественная симметрическая матрица А мо- может быть приведена к диагональной форме с помощью некото- некоторого ортогонального преобразования, или, что то же самое, су- существует ортогональная матрица Т такая, что Г AT = I Я, о о я2 A1) где Х{ — собственные значения матрицы А. Это равносильно следующему результату: (х, Ах) = ;=i A2) где у = Т'х. Упражнение 1. Сохранятся ли результаты этого параграфа в случае, если А — ком- комплексная симметрическая матрица?
80 ДИАГОНАЛИЗАЦИЯ В ОБЩЕМ СЛУЧАЕ [ГЛ. 4 § 8. Необходимое и достаточное условие положительной опре- определенности. Формула G.12) сразу же приводит к следующей теореме: Теорема 3. Необходимым и достаточным условием поло- положительной определенности матрицы А является положитель- положительность всех ее собственных значений. Аналогично мы видим, что необходимым и достаточным усло- условием неотрицательной определенности матрицы А является не- неотрицательность всех ее собственных значений. Упражнения 1. Матрица А = ВВ' положительно определенная, если матрица В веще- вещественна и \В\ ф 0. 2. Матрица Н=СС* положительно определенная, если \С\фО. 3. Если А — вещественная симметрическая матрица, то матрица 1 + еА положительно определенная при условии, что е достаточно мало. § 9. Собственные векторы, соответствующие кратным собствен- собственным значениям. Если собственные значения матрицы А различ- различны, то соответствующие собственные векторы линейно незави- независимы, что следует из их ортогональности. Рассмотрим теперь общий случай. Предположим, что Я1 — корень кратности k. Верно ли, что существует k линейно неза- независимых собственных векторов, соответствующих собственному значению Я[?. Если это так, то верно ли, что любой собственный вектор, соответствующий Х\, есть линейная комбинация этих к векторов? Для того чтобы ответить на этот вопрос, воспользуемся пред- представлением G.11) и предположим, что Я[ = Яг = ... = Я/,, но что Яг=?Я1 ДЛЯ i = k+ 1, . . . , N. Умножая формулу G.11) слева на матрицу Т, запишем Я, 0 Я2 АТ 0 A) откуда следует, что /-й столбец матрицы Т есть собственный вектор матрицы Л, соответствующий собственному значению Xj. Так как матрица Т ортогональная, то ее столбцы линейно неза- независимы. Следовательно, если Х\ — собственное значение крат- •ности k, то ему соответствует k линейно независимых собствен- собственных векторов. Остается показать, что любой другой собственный вектор у, соответствующий Яь есть линейная комбинация этих k векторов.
§ 11] ОДНОВРЕМЕННАЯ ДИАГОНАЛИЗАЦИЯ Запишем вектор у как линейную комбинацию трицы Т: N У = 2 ctxl. t=i 81 столбцов ма- B) Коэффициенты С; могут быть определены по правилу Краме- Крамера, так как определитель отличен от нуля вследствие линейной независимости векторов х\ Из ортогональности собственных векторов, соответствующих различным собственным значениям, следует, что С; = 0, если только х1—не собственный вектор, соответствующий Х\. Это до- доказывает, что вектор у есть линейная комбинация собственных векторов, соответствующих }.}. § 10. Теорема Гамильтона—Кэли для симметрических матриц. Воспользовавшись выражением G.11), мы видим, что для лю- любого полинома р(Х) имеет место соотношение р(А) = о 0 Г. A) Если, в частности, мы выберем р(К) в ферме характеристиче- характеристического полинома матрицы А, р(к) = \А—Х/|, то нетрудно видеть, что р(А)=0. Это дает доказательство знаменитого результата Кэли и Гамильтона для рассматриваемого частного случая. Теорема 4. Любая симметрическая матрица удовлетворяет своему характеристическому уравнению . Как мы увидим впоследствии, этот результат может быть распространен на произвольные квадратные матрицы. Упражнение 1. Используя соображения непрерывности, получить теорему Гамиль- Гамильтона—Кэли для произвольной симметрической матрицы из результата, перво- первоначально установленного для симметрической матрицы с простыми собствен- собственными значениями, § П. Одновременное приведение к диагональной форме. Мы ви- видели, что вещественная симметрическая матрица может быть приведена к диагональной форме посредством некоторого орто- ортогонального преобразования. Естественно попытаться выяснить, возможно ли одновременное приведение к диагональной форме
82 ДИАГОНАЛИЗАЦИЯ В ОБЩЕМ СЛУЧАЕ [ГЛ. ¦ двух вещественных симметрических матриц. Ответ на этот во- вопрос дается следующей теоремой: Теорема 5. Необходимым и достаточным условием суще- существования ортогональной матрицы Т такой, что Г AT = о О о И-2 о A) является коммутативность матриц А и В. Доказательство. Предположим, что матрица А имеет различные собственные значения. Тогда из того, что получаем А (Вх) =В(Ах) = В(Хх) =К(Вх). C) Из этого соотношения следует, что Вх есть собственный век- вектор, соответствующий Я. Так как собственные значения по пред- предположению различны, то любые два собственных вектора, соот- соответствующих одному и тому же собственному значению, должны быть пропорциональны. Отсюда следует, что Bxi = !Mxi, i=l,2 N, D) где Ц{ — скаляры, которые должны быть собственными значе- значениями матрицы В. Таким образом, мы видим, что матрицы А и В имеют одни и те же собственные векторы х\ х2, .,., хк. Матрица Т может быть взята в виде Т=--(хКх2, ...,xN). E) Рассмотрим теперь общий случай, когда Яг- — собственное значение кратности k с соответствующими собственными векто- векторами х\ х2,... , xh. Тогда из соотношения C) мы получаем = 1,2 k. F) Посмотрим, возможно ли построить такую линейную комби- комбинацию векторов х\ которая была бы собственным вектором ма- матрицы В. Прежде всего отметим, что матрица C=||c{jll симметриче- симметрическая, что следует из ортонормированности векторов xi и сим- симметричности В: (xj, Вх1) = си = (Вх1, х1) = сн. G)
in ОДНОВРЕМЕННАЯ ДИАГОНАЛИЗАЦИЯ к Рассмотрим линейную комбинацию 2j k \ k i k \ k Следовательно, если at выбраны так, что то мы получаем atx 83 (8) ., k, A0) откуда следует, что rx — собственное, значение матрицы В и к 2 п{Х1 — соответствующий собственный вектор. i = \ Соотношение (9) показывает, что Г\—собственное значение матрицы С и di — компоненты соответствующего собственного вектора. Так что если 7\ есть ^-мерное ортогональное преобразо- преобразование, приводящее матрицу С к диагональной форме, то векто- векторы z\ определяемые соотношением (П) образуют ортонормированныи набор векторов, являющихся соб- собственными векторами одновременно двух матриц А и В. Выполняя аналогичные преобразования для собственных век- векторов, соответствующих каждому кратному собственному зна- значению, мы получаем искомую матрицу Т. Необходимость условия следует из того факта, что две матрицы вида z1 z2 :zk = Tk X1 X2 xk о 0 В = Т М-1 о о Г A2) всегда коммутативны, если матрица Т ортогональная.
84 ДИАГОНАЛИЗАЦИЯ В ОБЩЕМ СЛУЧАЕ [ГЛ. 4 § 12. Одновременное приведение к сумме квадратов. Как отме- отмечалось в предыдущем параграфе, одновременное приведение двух симметрических матриц А и В к диагональной форме по- посредством ортогонального преобразования возможно в том и только в том случае, когда матрицы коммутативны. Однако для многих целей достаточно привести матрицы А и В к диагональ- диагональной форме посредством произвольного невырожденного преобра- преобразования. Мы хотим доказать следующую теорему: Теорема 6. Если даны две вещественные симметрические матрицы А и В, причем матрица А положительно определенная, то существует невырожденная матрица Т такая, что Г AT = /, Т'ВТ = A) О Цдг Доказательство. Пусть 5 —ортогональная матрица О Я2 такая, что S'. О kN Тогда если x = Sy, то мы получаем (х, (х, Вх) = (у, S'BSy). Теперь выполним «растягивающее» преобразование У1 = ~Щ> i=l, 2, .... N, так, что Тогда B) У = S2z. SV? = (*. C) D) E) {у, S'
14] ИСХОДНАЯ ПРОБЛЕМА МАКСИМИЗАЦИИ 85 Обозначим через С матрицу S2S BSS2, и пусть S3 —ортогональ- —ортогональная матрица, которая приводит матрицу С к диагональной фор- форме. Если положить г = S3w, то в силу E) N (г, Cz) = (w, S'3CS3w) = 2 И,»»*, и в то же время (z,z) = (w,w). Сравнив C), E) и F), мы заключаем, что F) F0 G) есть искомая невырожденная матрица. Упражнения 1. Что можно сказать в связи с теоремой 6, если предположить, что матрица А является неотрицательно определенной? 2. Пусть обозначение А>В для двух симметрических матриц означает, что матрица А—В положительно определенная. Используя предыдущий ре- результат, показать, что из неравенства А>В>0 следует B'x>A~i. § 13. Эрмитовы матрицы. Очевидно, что тот же метод, который использовался для доказательства теоремы 2, дает возможность доказать теорему 7. Теорема 7. Если Н — эрмитова матрица, то существует унитарная матрица U такая, что 0 0 и*. A) § 14. Исходная проблема максимизации. Теперь мы в состоянии решить проблему, которая для нас послужила толчком к изуче- изучению положительности и отрицательности квадратичных форм, а именно, ответить на вопрос, когда стационарная точка функции f(Xi,x2,...,xN) является точкой относительного минимума или относительного максимума. Пусть с= {си Сг,. .. , cN)—стационарная точка функции /, имеющей непрерывные смешанные производные второго порядка. Тогда достаточно рассмотреть квадратичную форму A)
86 ДИАГОНАЛИЗАЦИЯ В ОБЩЕМ СЛУЧАЕ [ГЛ. 4 где, как и ранее, величины а2/ = d2f dct дс ¦ дх( дх . B) вычислены в точке Х\ = С\, х2 = с2, .. ., xN = cN. Достаточным условием того, что с — точка относительного минимума, является положительная определенность формы Q, необходимым условием — неотрицательность формы Q. Крите- Критерий, приведенный в § 8, дает метод определения положительной и отрицательной определенности квадратичной формы Q. Одна- Однако если f — функция многих переменных и N велико, то этот метод практически неприменим. Далее, в гл. 6 мы получим наи- наиболее удобный из критериев положительной определенности. Упражнение 1. Показать, что условия ^,<0> f'C' f'C2 >0 являются достаточными для того, чтобы функция f (x\, xi) имела относитель- относительный максимум. § 15. Теория возмущений — I. Рассмотрим теперь проблему, представляющую большой теоретический и практический инте- интерес. Пусть А — симметрическая матрица, имеющая собственные значения kit к2, . . . , kN и соответствующие собственные векторы х[, х2,.. . , xN. Спрашивается, что можно сказать о собственных значениях и собственных векторах матрицы А + еВ, где В — сим- симметрическая матрица, а е — малый параметр? Так как мы инте- интересуемся лишь формальной стороной теории, то мы не будем здесь рассматривать вопрос о том, каким должен быть пара- параметр е, чтобы название «малый» было действительно уместным. Если матрицы А и В коммутативны, то они одновременно могут быть приведены к диагональной форме с помощью неко- некоторого ортогонального преобразования. Следовательно, при со- соответствующей перенумерации собственных значений матрицы В собственными значениями матрицы А + еВ будут Яг- + ец*, i = = 1,2,..., Л/, в то время как собственные векторы останутся прежними. Рассмотрим теперь общий случай, когда матрицы А и В не- некоммутативны, АВФВА. Для простоты остановимся только на •случае различных собственных значений. Вообще говоря, можно ожидать, что для достаточно малых е собственные значения матрицы А + гВ будут различными и близ- близкими к собственным значениям матрицы А. Из этого следует,
§ 16] ТЕОРИЯ ВОЗМУЩЕНИЙ - II 87" что собственные векторы матрицы А + гВ также будут близки к собственным векторам матрицы А. Один из способов доказательства этого состоит в следующем. Вместо характеристического уравнения \А — Я/|=0 мы рассма- рассматриваем уравнение \А + еВ — Я/|=0. Проблема сводится к отысканию приближенного решения этого уравнения, причем необходимо учесть, что параметр е мал и корни исходного уравнения известны. Пусть Т — ортогональная матрица, приводящая матрицу А к диагональной форме. Тогда характеристическое уравнение мо- может быть записано в виде -f ecu — X ес12 ес22 — ecNN — Я = 0, где Г ВТ = С = llc-jll. Можно ожидать, что решение этого уравнения имеет вид Коэффициенты dH, d2i и т. д. могут быть выражены через эле- элементы Cij\ мы оставляем задачу определения этих коэффициен- коэффициентов в качестве упражнения для читателя, имеющего опыт обра- обращения с определителями. Мы не останавливаемся подробно на этих вопросах, так как метод, приведенный в следующем параграфе, является более эффективным и, кроме того, может быть использован для изуче- изучения проблемы возмущений в случае операторов более общего вида. § 16. Теория возмущений — II. Предположим, что собственные значения и собственные векторы матриц А + еВ и А не только близки, но и что эти величины могут быть представлены в виде рядов по степеням малого параметра е. Обозначим через уц и у1 собственные значения и собственные векторы матрицы А + еВ, а через Яг- и xi — соответствующие ве- величины для матрицы А. Положим тогда у1 = х1 ( У'
88 ДИАГОНАЛИЗАЦИЯ В ОБЩЕМ СЛУЧАЕ [ГЛ. 4 Чтобы определить неизвестные коэффициенты Ян, %ц, ... и известны уравнение неизвестные векторы дс'1, xi2, .. ., подставим эти выражения а B) и приравняем коэффициенты при степенях е. Имеем (А + гВ) (х1 + ехп + г*х12 + .. .) = = (а,- + е1ц + е2Я2/ + ...)(*<+ е.кп + е2л;г2-}- ...)• C) Отсюда следует, что Ах1 = К{х\ Ах11 + Вх1 = Ktxn + . . Рассматривая эти уравнения, мы видим, что первое из них удовлетворяется тождественно, второе вводит две неизвестные величины: скаляр %ц и вектор дс1'1. Аналогично, третье уравне- уравнение вводит еще два неизвестных: скаляр Яг-2 и вектор дсг'2. На первый взгляд кажется, что рассматриваемый метод определения коэффициентов разложения A) просто непригоден. Однако, исследуя второе уравнение, мы видим, что оно имеет форму (AXI)" {I B) E) где матрица коэффициентов А — XJ вырожденная. Следова- Следовательно, это уравнение имеет решение, только если его правая часть (Яц/ — б)дсг' обладает специальными свойствами. Только после того, как будет установлено, что (Ял/ — В)дсг' обладает этими свойствами, мы сможем определить неизвестный ска- скаляр Ял. Чтобы упростить обозначения, запишем х" = д, (Кц1-В)х1 = г. F) Тогда задача формулируется следующим образом. Мы хотим определить, при каких ограничениях на вектор z уравнение {A—UI)y = z G) имеет решение (Яг- — собственное значение матрицы А), и хо- хотим найти это решение.
§ 16] ТЕОРИЯ ВОЗМУЩЕНИЙ — II 89 Пусть хх, х2, ..., ^' — нормированные собственные векторы матрицы А. Представим у и z в виде линейных комбинаций этих векторов: N y=%bjxj, (8) N z = 2 cjx}, где b, = (у, х>), Cj = (z, х'), /=1,2 N. (9) Подставляя в G), получаем уравнение N N 2)=2iCjX} A0) или, так как Axj = KjX!, /=1, 2, ..., N, 2у2^ (И) М,) Приравнивая коэффициенты при х\ получаем соотношение Ь,(Х} — Ъ)~с}, / = 1, 2, .... Л/. A2) Эти уравнения совместны в том и только в том случае, когда с, = 0. A3) Тогда величины Ь, произвольны, но остающиеся bj опреде- определяются формулами J=1«2> •••' Условие A3) означает, что уравнение G) имеет решение в том и только в том случае, когда вектор z ортогонален собствен- собственному вектору х\ соответствующему собственному значению Кг. Если это так, то существует однопараметрическое семейство решений уравнения G), имеющее вид T^_7- A5) где Ь{ произвольно. Возвращаясь к F), мы видим, что можно принять 6г = 0, так как различный выбор величин 6г- влияет только на нормиро- нормирование нового собственного вектора yi.
¦90 ДИАГОНАЛИЗАЦИЯ В ОБЩЕМ СЛУЧАЕ [ГЛ. 4 Условие ортогональности дается соотношением (х\ (\п — В)#) = 0. •Отсюда следует, что Хи=(х\ Вх*). A6) A7) ¦Упражнения 1. Найти значение Кц. 2. Рассмотреть случай кратных корней, первоначально для матриц разме- размеров 2x2, а затем для матриц произвольных размеров. 3. Пусть К, — собственные значения матрицы А и ki(z)—собственные значения матрицы А+гВ. Показать, что X, (А + гВ)= тде Sp т = 0 2 bs^bs^ .. . BS>' Матрицы Ej определяются соотношением *) A = 2 / S/= 2 EkKXi-Xj). (Като. 4. Пусть Л и i5 — матрицы размеров 10 X 10 0 0 0 в 0 10 -10 Матрицы А и В отличаются лишь одним элементом A0, 1), который для В равен 10'10. Показать, что \KI—A\ = XW и что \\1—В\ = К10— Ю0. Следователь- Следовательно, собственными значениями матрицы В являются 10, 10~1со, ..., 10*'со9, где (В — неприводимое значение корня десятой степени из единицы. Как можно объяснить это явление? (Форсайт.) Упражнения к гл. 4 1. Показать, что вещественная симметрическая матрица может быть за- записана в форме А = 2 hEt, *) По поводу обозначений см. упражнение 3 § 7 гл. 3, а также пред- предлагаемое ниже упражнение 1 к настоящей главе на стр. 90. Предлагаемая в упражнении формула естественным образом выводится контурным инте- интегрированием резольвенты матрицы А+гВ (по этому поводу см. упражне- упражнение 43 к гл. 6).(Прим. ред.)
УПРАЖНЕНИЯ К ГЛ. 4 91 где Et — неотрицательно определенные матрицы, удовлетворяющие условиям ?¦^?¦¦ = 0, i ?= j; ^\ — ^i' и ^f—собственные значения матрицы А. Такое представление называется спектральным разложением матрицы А. 2. Пусть А — вещественная кососимметрическая матрица. Как мы знаем, ее собственные значения или чисто мнимые или нули. Пусть x + iy— соб- собственный вектор, соответствующий (ц, где ц — вещественная величина, отлич- отличная от нуля, а х и у вещественные. Показать, что векторы х и у ортого- ортогональны. 3. Пусть Ti—некоторая ортогональная матрица, двумя столбцами кото- которой являются х и у (см. предыдущее упражнение) Показать, что 7"i= (x, у. x3, х\ ... ,x;V). 0 -ц 0. 0 V2 где матрица v4jv-2 снова кососимметрическая. 4. Доказать методом индукции, что если А — вещественная кососимметри- кососимметрическая матрица четного порядка, то можно нпйти ортогональную матрицу Т такую, что О ¦Ц, 0 0 0 Ц: -Иг 0 где некоторые Ц,,- могут быть нулями. 5. Показать, что если А — вещественная кососимметрическая матрица не- нечетного порядка, то ее каноническая форма имеет вид о ,л Т'АТ = о где некоторые \it могут быть нулями. 6. Показать, что определитель кососимметрическои матрицы нечетного порядка равен нулю. 7. Определитель кососимметрическои матрицы четного порядка есть квадрат полинома относительно элементов этой матрицы.
92 ДИАГОНАЛИЗАЦИЯ В ОБЩЕМ СЛУЧАЕ [ГЛ. 4 8. Пусть А—ортогональная матрица и Л — собственное значение, по абсолютной величине равное 1, но не равное ±1. Пусть соответствующий собственный вектор имеет вид x+iy, где х и у вещественные. Показать, что векторы х и у ортогональны, 9. Действуя, как и ранее, методом индукции, показать, что всякая орто- ортогональная матрица А может быть приведена к форме О А=Т COS ф. Sin фт — Sin ф[ COS ф| -sin | COS I ± 1 0 ± 1 10. Доказать, что TAT' — положительно определенная матрица, если Т есть ортогональная матрица, а Л — диагональная матрица с положительными элементами. 11. Доказать теорему 5 методом индукции, следуя идее доказательства, приведенного в § 6. 12. Установить результат, аналогичный полученному в упражнении 9, для унитарной матрицы. 13. Записать достаточные условия того, что функция f(xu х2, ..., xN) имеет локальный максимум при *, = ?;, 1=1, 2, ...,N. 14. Найти все решения уравнения XX'=А, если А — положительно опре- определенная матрица. 15. Определитель Грама N вещественных функций }i, /г> •••> />, задан- заданных на интервале (а,Ь), определяется формулой ь G(fvf2,...,fN) Доказать, что если Q(xv J ftV)f,«)t 4 Г N 2 = J \g it) - J] x.fi (t) dt, a L 1 = 1 -I min Q = fN) Некоторые дальнейшие исследования смотри у Геронимуса1). Много ре- результатов имеется в монографии Сегё2). ') Я. Л. Геронимус, On Some Persymmetric Determinants Formed by the Polynomials of M. Appell, J. London Math. Soc. 6 A931), 55—58. 2) G. S z e g 6, Orthogonal Polynomials, Amer. Math. Soc. CollQq. Publ. 23 A939). [Русский перевод: Ортогональные многочлены, Физматгиз, 1962.]
УПРАЖНЕНИЯ К ГЛ. 4 93 16. Для матрицы порядка N—1: 2 -1 -1 2 • -1 '2 -1 -1 1 где все неуказанные элементы нули, показать, что JV-1 [ XI - Н | = ТТ (X - 2 - 2 cos 2Ы 2iV-l и определить собственные векторы. 17. Используя последний результат, показать, что если *i=0 и щественны, то N-1 N ? > 4 sin2 2 * ве- ве- ХМ? 2BiV-l) ( = 2 Определить, когда имеет место равенство. 18. Показать, что если все xt вещественны и (=1 и что если N "' T0 N (Фань Цзы, Таусски, Тодд.) 19. Найти собственные значения и собственные векторы матрицы, соог- 2 {xi~xj}2- 1 ветствующей квадратичной форме 1.11 20. Пусть А и В — вещественные симметрические матрицы такие, что А неотрицательно определенная. Тогда, если |Л-И'В!=0, существует нетри- нетривиальный вещественный вектор х такой, что (A+iB)x=0. (Переманс—Дю- парк — Леккеркеркер.) % 21. Если А и В — симметрические матрицы и А неотрицательно опре- определенная, то собственные значения матрицы АВ вещественны. 22. Если А к В — симметрические матрицы, то собственные значения матрицы АВ—ВА чисто мнимые. 23. Привести квадратическую форму Qn(x) =XiX2+x2Xs+. . .+xN-txN к диагональной форме, определяя собственные векторы и собственные значе- значения. Подобным же образом привести к диагональной форме Pjv(*) + Х2Х3+ ., . +XN-.xXN+XNXu
94 ДИАГОНАЛИЗАЦИЯ В ОБЩЕМ СЛУЧАЕ [ГЛ. 1 24. Если А—комплексная квадратная матрица, то А можно представить в виде HU, где Я — неотрицательно определенная эрмитова матрица и U — унитарная матрица. Дальнейшие исследования и ссылки на более ранние результаты Аутона,. Винтнера, Мурнагана можно найти у Вилльямсона1). 25. Если матрицы А, В и С симметрические и положительно определен- определенные, то корни уравнения имеют отрицательные вещественные части. (Пароди.) 26. Пусть А — квадратная матрица. Положим |Л| = |Л| +—|Л]_, где |Л| +— сумма тех членов разложения определителя, которые снабжаются знаком плюс. Показать, что если А — положительно определенная матрица, то |Л|->0. (Шур—Ленг.) 27. Пусть А—вещественная матрица такая, что существует положитель- положительно определенная матрица М, связанная с матрицей Л соотношением А'М = = МА. Матрица Л, обладающая таким свойством, называется симметризуе- мой. Показать, что матрица А обладает следующими свойствами: а) все ее собственные значения вещественны, б) в терминах обобщенного скалярного произведения [х, у]= (х, My) соб- собственные векторы, соответствующие различным собственным значениям, орто- ортогональны; в) пусть матрица Т называется «ортогональной», если она вещественна и ее столбцы ортогональны в обобщенном смысле. Тогда существует «орто- «ортогональная» матрица Т такая, что матрица ТАТ' диагональная2). 28. Аналогичным образом обобщить понятие эрмитовой матрицы. 29. Назовем матрицу Л идемпотентной, если. А2=А. Показать, что не- необходимое и достаточное условие того, что симметрическая матрица А ран- ранга k идемпотентна, состоит в том, что k собственных значений равны еди- единице, а остальные N — k равны нулю. (Понятие ранга определено в прило- приложении А.) 30. Если А—симметрическая идемпотентная матрица, то ранг матри- матрицы Л равен ее следу*). 31. Невырожденная симметрическая идемпотентная матрица тождествен- тождественна единичной матрице. 32. Если Л — симметрическая идемпотентная матрица порядка N и ран- ранга к, то матрица Л будет положительно определенной, если k — N, и неотри- неотрицательно определенной, если k<N. 33. Если Л — симметрическая идемпотентная матрица с элементом й|(=0 для некоторого значения i, то все элементы г'-й строки и г'-го столбца равны нулю. m 34. Если каждая матрица Л,- симметрическая и ^ Лг- = /, то следующие « = i три условия эквивалентны: а) каждая матрица Л,- идемпотентная; б) Л,-Л; = 0, i ф /; в) ^jn.=N, где Гц — ранг матрицы Ai и N—ее порядок. ') D. Williamson, A Generalization of the Polar Representation of Nonsingular Matrices, Bull. Amer. Math. Soc. 48 A942), 856—863. [См. также Ф. Р. Гантмахер, Теория матриц, «Наука», 1966, стр. 249. {Прим. ред.)] 2) А. Н. Колмогоров, Zur Theorie der Markoffschen Ketten Math. Ann. 112 A936), 155—160. *) По поводу следа матрицы см. § 8 гл. 6, стр. 124. (Прим. ред.)
УПРАЖНЕНИЯ К ГЛ. 4 95 35. Пусть Ai — набор симметрических матриц порядка N, и ранг матри- матрицы Л; равен р;. Пусть матрица А = ^ Л; имеет ранг р. i Рассмотрим четыре условия: С1. каждая матрица Л, идемпотентная, С2. Л,Л=0, i Ф1, СЗ. матрица Л идемпотентная, т С4. р = ^ Р,- ; = 1 Тогда 11 любые два из трех условий Cl, С2, СЗ означают выполнение всех условий С1, С2, СЗ, С4. 2) условия СЗ и С4 означают выполнение С1 и С2. Доказательство вышеприведенных фактов и некоторые их применения можно найти в работе Грейбила и Марсалья1). 36. Используя то обстоятельство, что для двух вещественных чисел a'i А о и х2 и любого е>0 имеет место неравенство 2х}х2 < \-хт,е, показать, что квадратичная форма к N - к N к i = k + \ aiixixi+ ¦будет положительно определенной, если 6;>0 и параметр Л достаточно велик. N 37. Показать, что из положительной определенности формы 2 а..х,х- «'. /=1 яе следует при JV>3, что форма 2аггЛГ?"'" ^J \aii\xixi положительно I i Ф I определена *). 38. Матрица Л = ||а4,-||, i, /=1, 2, 3, 4, называется матрицей Лоренца, если преобразование х = Ау оставляет квадратичную форму Q (х) = х\ — х\ — х\ — х\ неизменной, т. е. Q(x)=Q(y). Показать, что произведение двух таких матриц снова матрица Лоренца. 39. Показать, что Р2I/2, г/2 = (Рл, + л2)/A-р2I/21 Уз=х3, yt = xt, где 0<|i2<l, есть преобразование Лоренца. 40. Показать, что любое преобразование Лоренца есть комбинация орто- ортогонального преобразования переменных Х2, я.з, х4, оставляющего Х\ неизменным. ') F. A. Gray bill and G. M a r s a g 1 i a, Idempotent Matrices and Quadratic Forms in the General Linear Hypothesis, Ann. Math. Stat. 28 A957), 678—686. *) Если ciij^O при 1ф], то из положительной определенности формы ' п га 2 cLiiXiXj следует положительная определенность формы 2 \ (Прим. ред.)
96 ДИАГОНАЛИЗАЦИЯ В ОБЩЕМ СЛУЧАЕ [ГЛ. 4 преобразования типа, приведенного выше, и преобразования, состоя- состоящего в возможном изменении знака одной из переменных (отражения) '). Физическую интерпретацию преобразований Лоренца можно найти в книге Синга 2). 41. Пусть Н — неотрицательно определенная эрмитова матрица. Пока- Показать, что для любого заданного интервала [а, Ь] можно найти последователь- последовательность комплексных функций {fi(t)}, i—\, 2, ..., такую, что hit = / h (t) fj (t) dt, i, /-1, 2,...») 42. Пусть /4=||ajj|| — симметрическая матрица рамеров jV'XA' и /4w-i — симметрическая матрица, составленная из элементов at<, i, /=1, 2,..., N 1, матрицы А. Посредством ортогонального преобразования привести матрицу А к виду Н.2 О JV-1 ZN-\ где \ii — собственные значения матрицы AN-u Используя это представление, определить связи (если они существуют) между кратными собственными зна- значениями матрицы А и собственными значениями матрицы AN-\. 43. Используя эти результаты, показать, что ранг симметрической ма- матрицы может быть определен как порядок N матрицы минус число нулевых собственных значений. 44. Если Н — неотрицательно определенная эрмитова матрица, то И = ТТ*, где Т — треугольная матрица, имеющая неотрицательные диагональ- диагональные элементы. См. Ли4). 45. Необходимые и достаточные условия того, что числа d\, d%... ,йя могут быть диагональными элементами ортогональной матрицы с детерминан- N том, равным единице, имеют вид , /= 1, 2, ..., N, и I ^ N — 2 + k=i + 2Я min \dt\, где Я = 1, если число отрицательных di четное, и Х=0, 1 </<JV 1 </<JV если это число нечетное. (М и р с к и й (L. Mi r sky), Amer. Math. Monthly 66 A959), 19—22.) ') Петровский И. Г., Лекции об уравнениях с частными производ- производными, Гостехиздат, 1953. 2) J L. Synge, Relativity, the Special Theory, Interscience Publishers, Inc., New York, 1956. 3) Шур (I. Schur), Math. Z. 1 A918), 206. 4) H С L e e, Canonical Factorization of Non-negative Hermitian Matri- Matrices, J. London Math. Soc. 23 A948), 100—110,
БИБЛИОГРАФИЯ И КОММЕНТАРИЙ f}j Библиография и комментарий § 2. Мы предполагаем, что читатель знаком с основами тео- теории систем линейных уравнений. На тот случай, если некоторые из читателей будут испытывать недостаток знаний или захотят иметь обзор основных результатов, в приложении А собраны формулировки и доказательства, которые необходимы для пони- понимания этой главы *). При желании читатель может принять некоторые положения на веру и доказать их впоследствии на досуге. § 5. Результат этого параграфа является частным случаем фундаментального принципа анализа, который состоит в том, что всякий раз, когда некоторая величина положительна, для этой величины существует формула, делающая ее положитель- положительность очевидной. Во многих случаях построение формулы такого типа или доказательство того, что она существует, является не- нетривиальной задачей. По этому поводу смотри Хард и, Литлвуд, П о й a (G. H. Hardy, J. E. Littlewood and G. Poly a), Inequalities, Cambridge University Press, New York, 1934, 57—60. [Русский перевод: Неравенства, ИЛ, 1948]. См. также соответствующие комментарии в конце гл. 5. § 8. Понятие о положительно определенной квадратичной форме как естественное обобщение понятия положительного скаляра — одно из наиболее полезных и плодотворных во всей математике. Статья Фань Цзы (К у Fan), On Positive Definite Sequences, Ann. Math. 47 A946), 593—607 указывает некоторые из многих возможных путей использова- использования этого понятия в анализе. Подробное и изящное изложение других применений имеется в монографии Фань Цзы (К у Fan), Les Fonctions definies-positives et les Fonc- tions completement monotones, fascicule CXIV, Mem. sci. math., 1950. В приложениях в конце книги мы также укажем остроум- остроумные приемы использования квадратичных форм в различных разделах анализа. Вопрос о диагонализации комплексных неэрмитовых сим- симметрических матриц рассматривается в работе Д о л ф, М а к л а ф л и н и Маркс (С. L, D о 1 р h, J. Е. М с L a u g h- lin and I Marx) Symmetric Linear Transformations and Complex Quadra- Quadratic Form, Comm. Pure and Appl. Math. 7 A954), 621—632. *) По поводу решения систем линейных уравнений см. А. Г. К у р о ш, Курс высшей алгебры, «Наука», 1968, гл. III, а также Г. Е. Шилов, Введе- Введение в теорию линейных пространств, Гостехиздат, 1956, гл. I и III (Прим. ред.)
98 ДИАГОНАЛИЗАЦИЯ В ОБЩЕМ СЛУЧАЕ [ГЛ. 4 Вопросы этого характера возникают как частные случаи бо- более общей проблемы, касающейся собственных значений и соб- собственных функций уравнения Штурма — Лиувилля с комплекс- комплексными коэффициентами. § 15. Дальнейшее обсуждение этих проблем и ссылки мож- можно найти в статье Браун и Бассет (R. D. Brown, I. M, Basset t), A Method for Calculating the First Order Perturbation of an Eigenvalue of a Finite Matrix, Proc. Phys. Soc. 71 A958), 724—732. Некоторые интересные обобщения понятия положительной определенности имеются в работе М. Г. К р е й н, Об одном применении теоремы о неподвижной точке в теории линейных операторов в пространстве с индефинитной метрикой, УМН 5, № 2 A950), 180—199, где можно найти дальнейшие ссылки. § 16. В статье, посвященной физическим приложениям, Лаке (М. Lax), Localized Perturbations, Phys. Rev. 94 A954), 1391 рассматривается решение уравнения (А + В)х = Хх, где только несколько элементов матрицы В отличны от нуля. Некоторые интересные результаты, касающиеся кососиммет- рических матриц, имеются в работах Дрезин (М. P. Drazin), A Note on Skew-symmetric Matrices, Math. Gaz. 36 A952), 253—255; Джекобсон (N. Jacobson), Bull. Math. Soc. 45 A939), 745—748. В связи с упражнением 24 см. работу Стен цель (Н. Stenzel), Ober die Darstellbarheit einer Matrix als Product..., Math. Z. 15, 1—25. В заключение укажем, что некоторые интересные соотноше- соотношения между ортогональностью и квадратичными формами мож- можно найти в работах Греби ер (W. Groebner), Ober die Konstruktion von Systemen or- thogonaler Polynome in ein- und zweidiniensionaler Bereich, Monatsh. Math. 52 A948), 38—54; Л а р мер (H. Larcher), Proc. Amer. Math. Soc. 10 A959), 417—423.
Г л а в а 5 УСЛОВНЫЕ ЭКСТРЕМУМЫ § 1. Введение. В предыдущих главах мы рассмотрели задачу об определении области значений, принимаемых квадратичной формой (дг, Ах) на множестве векторов х 1аких, что (х,х) = \. В частности, нас интересовало, может ли форма (х, Ах) прини- принимать как положительные, так и отрицательные значения. В этой главе мы исследуем тот же вопрос при условии, что х удовле- удовлетворяет не только соотношению (х, х) = \, но и некоторым до- дополнительным линейным ограничениям вида (х, 6') = с,- /= 1,2, ..., k. A) В переводе на язык геометрии мы рассматривали множество значений, принимаемых квадратичной формой (х, Ах) па еди- единичной сфере. В дополнение к этому условию мы теперь пола- полагаем, что х одновременно принадлежит еще и нескольким пло- плоскостям, или, иначе, является точкой заданной (Л/ — k)-мерной плоскости. Ограничения такого рода самым естественным образом воз- возникают в различных задачах алгебры, анализа и геометрии. Прежде всего мы обобщим применявшийся в гл. 1 алгебраи- алгебраический метод, получив на его основе несколько полезных необ- необходимых и достаточных условий положительной определенности. Эти результаты будут в свою очередь расширены в ходе изло- изложения. § 2. Детерминантный критерий положительной определенности (критерий Сильвестра). В гл. 4 было показано, что для положи- положительной определенности вещественной симметрической матрицы необходимо и достаточно, чтобы все ее собственные значения были положительны. Однако, хотя этот результат и имеет тео- теоретическую ценность, его практическое применение довольно за- затруднительно. Поэтому необходимо получить условия, более пригодные для аналитических и вычислительных целей. Критерий, сформулированный на языке собственных значе- значений, не годится для приложений по той причине, что численное
100 УСЛОВНЫЕ ЭКСТРЕМУМЫ [ГЛ. 5 нахождение собственных значений матрицы высокого порядка оказывается весьма трудным делом. Всякая попытка разложить определитель \А — К1\ неизбежно обречена на неудачу вслед- вследствие чрезвычайно большого количества членов, присутствую- присутствующих в таком разложении. Полное разложение определителя порядка N содержит N\ членов. Так как 10! = 3 628 800, а 20!^ se2433 • 1015, то ясно, что прямые методы применить нельзя, даже имея в своем распоряжении самые совершенные вычисли- вычислительные машины '). Численные методы отыскания собственных значений и соб- собственных векторов представляют собой один из наиболее важ- важных разделов теории матриц. Как уже отмечалось ранее, мы не будем здесь затрагивать каких-либо сторон этой темы. Одна из последующих книг нашей серии будет посвящена исключительно этим вопросам. Для квадратичной формы двух переменных мы получили представление 2 ' а2 + ^х2) +[а22-^)х1 B) в предположении, что Отсюда мы заключили, что выполнение неравенств аи a is an>0, а 12 «22 >0 C) является необходимым и достаточным условием положительной определенности матрицы А. Рассмотрим теперь квадратичную форму трех переменных Q (*,, х2, х3) = апх\ + 2апххх2 + а22х22 + 2а23х2х3 + 2ai3x{x3 + аъъх\. D) Так как условие а41>0 является, очевидно, необходимым для положительной определенности, в чем мы убеждаемся, поло- положив х2=х3=0, то можно написать а2 Q (*., ** *з) = а„ [х, + -±± + -^) + [а22 ~^ ]) При скорости вычислений в одну операцию за микросекунду выполне- выполнение 20! операций потребовало бы 500 000 лет!
КРИТЕРИИ СИЛЬВЕСТРА 101 Если Q(xu x2, х3) —положительно определенная квадратичная форма, то, положив х,+ аи мы получим квадратичную форму переменных х2 и х3, которая также должна быть положительно определенной. Отсюда, ис- используя выведенные нами условия C) для матриц второго по- порядка, мы получаем необходимые и достаточные условия поло- положительной определенности квадратичной формы Q(xu X2, х3): ац>0, а22--^ ап ап 2 ап «23 ~ ' ап а12а13 аи >0. F) Первые два условия нам уже знакомы. Преобразуем теперь третье условие к более удобному виду. Рассмотрим определи- определитель а„ «31 «12 О22 а32 «13 «23 «33 = о о «22- ап а12а13 «11 ап «зз- ап G) Чтобы получить последнее равенство, нужно вычесть из второй строки определителя D3 первую, умноженную на —, а из третьей строки — первую, умноженную на -^ (прием, ранее ап применявшийся в § 2 гл. 3). Теперь условия F) можно записать в следующей, наводя- наводящей на размышления форме: «п>0, «11 «21 «12 «22 «11 «21 «31 «12 «22 «32 «13 «23 «33 (8) Таким образом, у нас есть все необходимое для доказательства очень важного результата, содержащегося в теореме 1. Теорема 1. Необходимым и достаточным условием поло- положительной определенности вещественной симметрической мат- матрицы А является выполнение следующих условий: Dk>0, = l, 2 N, (9)
102- УСЛОВНЫЕ ЭКСТРЕМУМЫ [ГЛ. 5 где Dk = \aij\, i, /=1, 2, ...,*. (Ю> Детальное проведение доказательства мы оставляем чита- читателю в качестве упражнения. § 3. Представление в виде суммы квадратов. Несколько про- продолжив наше рассмотрение, мы можем установить следующий результат. Теорема 2. Если ни один из определителей Dh не равен нулю, то квадратичная форма N переменных Xi, хг, .. . , xN мо- может быть представлена в виде еде ckJXj, k=l, 2, ..., N-l, а Сц — рациональные функции элементов ац матрицы А. Формула A) представляет собой обобщение представления B.5) на Л/-мерный случай. Упражнение I. К чему приведет равенство пулю одного или нескольких определи- определителей Dh? § 4. Связанные вариации и теоремы Финслера. Рассмотрим теперь вопрос о знакоопределенности квадратичной формы в случае, когда переменные Xi могут принимать лишь те значе- значения, которые удовлетворяют соотношениям 2V/ = 0' i=l, 2, .... k,- k<N. A) Как обычно, все встречающиеся нам величины предполагаются вещественными. Не уменьшая общности, мы можем считать, что все k уравнений в A) независимы. Тогда, используя эти урав- уравнения, можно выразить k переменных Х\ через остальные N — k переменных в виде линейных функций, подставить затем полу- полученные соотношения в выражение для Q и решать уже (N — k)- мерную задачу, используя выведенные в предыдущих парагра- параграфах критерии.
¦§ 4] СВЯЗАННЫЕ ВАРИАЦИИ И ТЕОРЕМА ФИНСЛЕРА 103 Однако, хотя такой метод и может быть успешно применен, он связан с большим числом операций над определителями. По- Поэтому мы изберем другой путь. Все же мы рекомендуем чита- читателю попытаться получить результат только что описанным способом, хотя бы для случая, когда число условий k=\, чтобы должным образом оценить другой подход, к изложению кото- которого мы сейчас переходим. Начнем с доказательства следующего результата Финслера. Теорема 3. Если (х, Ах) > 0 для всех х, удовлетворяющих условию (х, Вх) = 0, где В — неотрицательно определенная мат- матрица, то существует такое число к, что квадратичная форма (х. Ах) +/,(дс, Вх) положительно определена. Доказательство. Сделаем линейную замену перемен- переменных х=Ту, где Т — ортогональная матрица такая, что k (х, Вх) = 2 iy/j, ^>°> !<*<#. B) Так как В по предположению — неотрицательно определенная матрица, то форма (х, Вх), как мы знаем, может быть приве- приведена к виду B). Это же преобразование, примененное к форме (х, Ах), дает N (х, Ах) = 2 сиу(ур C) j \ Если квадратичная форма (х, Ах) положительна при всех х k таких, что (х, Вх)-= 2^^ = 0, то неравенство N 2 ciJyiyj>0 D) должно выполняться для всех нетривиальных наборов значе- значений переменных уи+и Ук+2, ¦ ¦ • , Ух- В (N — k)-мерном пространстве векторов (yh+i, Ук+2, ¦¦¦ . . . , yN) произведем ортогональное преобразование, которое приводит квадратичную форму D) к сумме квадратов. Это пре- преобразование не затрагивает переменных уи у2, ¦ . ¦ , yt,- В УУ-мер- ном пространстве векторов у запишем это преобразование в виде y = Sw. Тогда (х, Ах) = Q (w) = S i cijytyj = N N k k 2 2 2 2 dijWiWj, E) I 1
|04 УСЛОВНЫЕ ЭКСТРЕМУМЫ [ГЛ. 5 и теперь наша задача сводится к доказательству того, что квадратичная форма к я2иХ+<ЗН F) является положительно определенной, если цг>0, /=1, 2, ...,N, и X достаточно велико. Для завершения доказательства остается только применить результат, сформулированный в упражнении 36 к гл. 4. Возвращаясь к исходной вариационной задаче, заметим, что k уравнений A) можно объединить в одно уравнение k / N \2 к I N \2 Рассматривая ^ ( 2 ЬцХ, I как неотрицательно определенную квадратичную форму, легко убедиться, что из теоремы 3 выте- вытекает следующий результат. Для того чтобы квадратичная форма Q(xux2, ..., хп) была положительной при всех нетривиальных наборах переменных xt, удовлетворяющих линейным уравнениям A), необходимо и до- достаточно, чтобы квадратичная форма k I N \2 Р (Х[, х2 xN) = Q (Х\, х2, . .., xN) + h 2j\ 2jbijXi (8) была положительно определенной для всех достаточно больших положительных К. Упражнение 1. Установить предыдущий результат, рассматривая максимум по всем переменным Хг функции Q (х,, Хг,, ..., х.,) f'v\=_.—LJ—= JLL. (Герштейн.) § 5. Случай k = 1. Попытаемся вывести из предыдущего резуль- результата какой-либо удобный критерий положительной определен- определенности, причем начнем с часто встречающегося случая k — 1. Тогда квадратичная форма Р имеет вид i,T=i ' '' --->¦¦- В соответствии с теоремой 1 для того, чтобы Р была положи- положительно определенной при любом достаточно большом положи-
.5] СЛУЧАЙ k=t 105 тельном X, должны выполняться детерминантные неравенства \ац + ХЬцЬц\>0, i, j=l, 2, ..., k, B) при k— 1, 2, ..., N. Чтобы получить более простой эквивалент этих неравенств, рассмотрим следующее матричное тождество: ап а12 ... alk Xb{ ^21 ^22 • • • &2k Л/&2 Л2\ *k\ ¦Xb\ ¦Xblb2 о 1 0 Ьх «12- Й22" ak2 1 b2 ... f Xbxb2 ±щ + икь2 0 1 bk * » • 0 0 0 1 a\k a2k 4k i-Xb.b, + Xb2bk + Xbl 0 Xb, Xb2 -1 C) Так как равенство в C) сохраняется при замене матриц их определителями, то положительность определителя \ац + + Xbiibij\, i, /=1, 2, ..., k, при всех больших X эквивалентна отрицательности определителя 0-21 #22 -1 D) при больших положительных X. Следовательно, должны выпол- выполняться неравенства аи а\2 ••• alk ап а12 0-22 a>k\ ak2 • ¦ ¦ akk bk bx b2 ... bk 0 при всех больших положительных X и k = \, 2, ..., N. #21 <0 E;
106 УСЛОВНЫЕ ЭКСТРЕМУМЫ [ГЛ. 5- Таким образом, достаточное условие положительности Q при всех нетривиальных наборах значений переменных xit удовле- удовлетворяющих линейному уравнению заключается в том, что окаймленные определители удовлетво- удовлетворяют неравенствам F) an «21 ah\ bi «12 «22 b2 ... aik ¦¦¦ akk ... bk 0\ h bk 0 /г=1, 2, ..., N. Ясно также, что условия аи аг2 ... aik bx «2i a22 ... a2fe ^г «*2 • • • akk bk b2 ... bk 0 G) k=l, 2, ..., N, являются необходимыми, при этом некоторые из этих определителей могут быть равными нулю, не нарушая тем самым положительной определенности формы Q. В простей- простейшем случае такая ситуация может иметь место, когда некото- некоторые из величин bt равны нулю. Обращаясь к E), мы видим, что если какой-либо из окайм- окаймленных определителей, скажем й-й, равен нулю, то необходи- необходимым условием положительной определенности является выпол- выполнение неравенства «и а2[ а2к (8) Дальнейшее обсуждение некоторых частных случаев содер- содержится в приведенных ниже упражнениях. ;
§ б) ЗАДАЧА О МИНИМИЗАЦИИ Ю7 Упражнения 1. В предположении, что bN^=Q, получить предыдущий результат, выра- выражая xN через остальные переменные: и рассматривая Q(x) как квадратичную форму N—1 переменных х\, х2, ... ..., хк-1. Можно ли здесь применить индуктивный подход? 2. Если 6i = 0, то из условия G) следует, что — ап&2<0. Следовательно, если Ь-2?=0, то Оц^О. Какой вид примут условия F) и G), если b\ = b2 — ... =6г=0, 1<г<Л'? 3. Рассмотрим в однородных координатах квадратичную поверхность 4 4 2] а..л^*. = 0 и плоскость ^ u.x, = 0. Доказать, что условие I /=1 г] аи а12 ai3 Qi4 «i ^21 #22 G23 ^24 ^2 Q31 а32 аЗЗ Q34 «3 «41 «42 «43 «44 «4 U, М2 М3 М4 О является необходимым и достаточным для того, чтобы плоскость была ка- касательной к поверхности '). 4 *). Определить минимальное расстояние от квадратичной поверхности (х,Ах)=0 до плоскости (и, х)=0. 5. Для того чтобы прямая, определяемая плоскостями (и, х) = (v, x) =0, была касательной к поверхности (х, Ах) =0 или являлась ее образующей, необходимо и достаточно, чтобы окаймленный определитель Mi I м2 v А и3 v М4 V , «2 «3 «4 0 С I'l V2 Из Ц4 0 6. Определить минимальное расстояние от квадратичной поверхности (х,Ах)=0 до прямой, определяемой плоскостями (и, х) = (v, x) =0. § 6. Задача о минимизации. С предыдущим тесно связана за- задача об определении минимума квадратичной формы (х, х) на ') См. Б ох ер (М. Bocher), Introduction to Higher Algebra, The Macmillan Company, New York, 1947, Chapter 12. *) В задачах 4, 5 и 6 соответствующие поверхности записаны в однород- однородных координатах.
108 УСЛОВНЫЕ ЭКСТРЕМУМЫ множестве векторов, удовлетворяющих условиям (ж, а*)=Ьи i=l, 2 k. [ГЛ. 5 A) Как обычно, все рассматриваемые векторы и скалярные вели- величины предполагаются вещественными. Не уменьшая общности, можно считать, что векторы а1 линейно независимы. Как мы знаем, неравенство (х, х) (х, а1) (х, а1) (а1, а1) (х, ak) (а1, ак) (х, ak) (ak, а1) ... {а\ ак) B) выполняется для любого вектора х. Это неравенство можно преобразовать к виду 0 *! 62 ... bk (а1, а1) I (а1, а') | C) так как определитель | (а\ a.i) \ положителен вследствие линей- линейной независимости векторов а\ Величина, стоящая в правой части неравенства C), и являет- является минимальным значением формы (х, х) при наложенных ограничениях, так как равенство в формуле B) достигается, если выбрать х равным некоторой линейной комбинации век- векторов а1: к *. _ V - .„) (л\ Чтобы удовлетворить уравнениям A), коэффициенты с, должны образовывать решение линейной системы уравнений k ^^ С f \№ у (л ) === Ott \"/ Так как определитель | (а\ а>) \ФО, то эта система имеет един- единственное решение, которое и дает нам единственный минимизи- минимизирующий вектор х.
¦8] ПРЯМОУГОЛЬНЫЕ МАТРИЦЫ юэ Упражнения I. Используя предыдущий результат, показать, что квадратичная форма О <?(¦*) = является отрицательно определенной, если матрица А положительно опре- определена. 2. Дать независимое доказательство результата, предлагаемого в упраж- упражнении 1, показав, что соответствующая квадратичная форма Р(г) .. . + xNzN+1) + {z,Az) не может быть ни положительно определенной, ни даже неотрицательно определенной, если матрица А положительно определена. 3. Полагая, что квадратичная форма (х, Ах) обладает положительным минимумом на пересечении плоскостей (лг, а') =6,-, i= 1,2, ...,?, найти этот минимум и получить таким образом другой вывод результата § 6. § 7. Общий случай. Вернемся теперь к общей задаче, сформу- сформулированной в § 4. Нетрудно использовать для решения этой об- общей задачи те же приемы, что и в случае &=1. Но так как обо- обозначения теперь становятся слишком громоздкими, то стоит потратить немного времени на то, чтобы ввести понятие прямо- прямоугольной матрицы и показать, насколько это новое обозначение упрощает выкладки. Как только мы вводим прямоугольные матрицы (которые не- неплохо было бы в отличие от квадратных называть «таблицами», как это хотел сделать Кэли), естественно возникают матрицы, элементы которых сами являются матрицами. В некоторых ра- ранее введенных обозначениях уже содержался намек на такие матрицы, и мы снова встретимся с ними при изучении кронеке- ровских произведений. § 8. Прямоугольные матрицы. Совокупность комплексных ве- величин ciij, расположенных в виде таблицы аи а12 .. а2\ lNM A) будем называть прямоугольной матрицей. Здесь уже нет той оговорки, что M = N. Мы будем также называть такую таблицу
по УСЛОВНЫЕ ЭКСТРЕМУМЫ [ГЛ. Г, матрицей размера MXN, или МхЛ/-матрицей. Существен поря- порядок, в котором пишутся М и N. При сложении двух МхЛ/-матриц не возникает каких-либо затруднений, однако не совсем ясно, пожалуй, как их следует перемножать. Мы будем допускать умножение Л4хЛ/-матрицы А на /СХ-М-матрицу В. Это ограничение появляется вследствие того, что произведение прямоугольных матриц, как и произве- произведение квадратных матриц, возникает при описании повторных линейных преобразований. Таким образом, произведение двух прямоугольных матриц ав = с = \\а. B) или схематично М К К А N В М= С N, представляет собой /СхЛ/-матрицу, где м C) Матрица А', транспонированная к МхА^-матрице Л, является Л'Х/И-матрицей и получается из А заменой ее строк столбцами. Во многих случаях прямоугольные матрицы можно исполь- использовать для унификации обозначений в том смысле, что с их по- помощью стирается различие между векторами и матрицами. Тем не менее, поскольку между понятиями вектора и квадратной матрицы все же имеется существенная разница, смешивать эти два понятия не всегда желательно, особенно в анализе. Хотя в одном из ближайших параграфов мы и собираемся привести пример упрощения, которого иногда можно достичь в результате использования подобного рода унификации, мы все же призываем читателя к осторожности. Основную роль всегда играют кроющиеся за символами математические идеи, и по- поэтому не стоит рабски следовать каким-либо обозначениям. Упражнения 1. Пусть х п у — JV-мерные векторы-столбцы. Показать что ху'=\\хгу/\, «,/=1,2, ...,N. 2. Если х — УУ-мерный вектор-столбец, то
¦9] КЛЕТОЧНЫЕ МАТРИЦЫ 111 § 9. Клеточные матрицы. Ранее мы ввели матрицы, элементами которых служат комплексные числа. Рассмотрим теперь матри- матрицы, элементы которых сами являются комплексными матрицами: Такая запись особенно удобна тем, что с ее помощью, на- например, можно представить 4х4-матрицу в виде «II «12 Й13 «14 «21 «22 «23 «24 « 31 « 32 « 33 « 34 Аи А,2 А2\ А22 B) «42 «43 «44 где Afi заданы следующим образом: «11 «12 |1 «21 «22 || «31 «32 В то же время можно считать, что «И «12 «13 || «14 «21 «22 «23 » А\2 == «24 «31 «32 «33 И «34 А2\ = II «41 «42 «43 II > ^22 = II «44 ||- |«13 1 а23 «33 «43 аи «24 «34 «44 C) D) Как мы увидим, в некоторых случаях эта новая запись об- обладает определенными преимуществами. Естественно, нам хоте- хотелось бы сохранить для этих матриц обычные правила сложения и умножения. Легко проверить, что сложение выполняется именно так, как мы того ожидали. Кроме того, читателю в виде упражнения ре- рекомендуется проверить, что произведение матриц \]A{j]\ и |]?^|| можно смело определить следующим образом: где N ¦¦ 2 ¦ й=1 E) F)
112 УСЛОВНЫЕ ЭКСТРЕМУМЫ [ГЛ. При этом все произведения AihBhj уже определены. Отметим, что при таком определении умножения ассоциативность сохра- сохраняется. Упражнения 1. Из соотношения вывести, что || А \\с В D II ° 1-е А С -ВЦ А\1 to to = 1 AD CD AD- -BC -DC -BC\, BA DA -AB -CB если ВА=АВ или CD=DC, и все необходимые произведения существуют, 2. Пусть M=A-\-iB, где А и В — вещественные матрицы, и пусть Af,= A -B В А Показать, что 1—М\ = \М—ЩМ—'к1\. (Сараки и Важевски.) 3 (продолжение). Отсюда вывести, что |Afi| = |/W||/W| и что собственными значениями матрицы Mi являются собственные значения матриц М и М. 4 (продолжение). Показать, что матрица М\ симметрическая, если М — эрмитова матрица. § 10. Решение задачи в общем случае. Рассмотрим теперь общую задачу, сформулированную в § 4. Как утверждает теорема 3, квадратичная форма N / к \ должна быть положительно определенной при больших X. Сле- Следовательно, должны выполняться неравенства r=\ bribrj /, /=1, 2 , n, B) n—l, 2, ..., N и любом достаточно большом положитель- положительном X. Чтобы упростить эти условия, воспользуемся тем же самым лриемом, который мы применили в § 5, а также нашими новыми
УПРАЖНЕНИЯ К ГЛ. 5 обозначениями. Пусть Ьп Ь2\ ... bLV b2 из C) и рассмотрим следующее произведение квадратных матриц (N + k)-ro порядка: Вы —Ik h О I I AN + XBnBn XBn B'n h\\\\ 0 —Ik D) где через h обозначена единичная матрица порядка k, a Ллг=11а*Д /, / = 1, 2, .... N. Заменяя в D) матрицы их определителями, получаем Лдг XBn B'n ~h Следовательно, условия B) заменяются неравенством AN XBn Bn — Ik i-Dk An-tXBnBn]. (~l)k E) F) которое должно выполняться для всех достаточно больших X. Таким образом, как и прежде, достаточные условия положи- положительной определенности получить легко. Необходимые условия требуют более детального рассмотрения вследствие того, что некоторые из элементов Ьц и окаймленных определителей могут оказаться равными нулю. Упражнения к гл. 5 1. Пусть {Л;} — произвольный набор квадратных матриц порядка г. Для того чтобы существовали унитарные (гXг)-матрицы U и V такие, что UAiV=Di, где матрицы Dt диагональные и вещественные, необходимо и до- достаточно, чтобы AtA'j N 2. Пусть 2 для всех i и /. (Н. Вигман.) а. .х,х, — положительно определенная квадратичная фор- , / ма. Показать, что 2 i, 1 ф k jk xixj 8 P. Беллман
114 УСЛОВНЫЕ ЭКСТРЕМУМЫ [ГЛ. 5 также является положительно определенной квадратичной формой N—1 пере- переменных х,, х2, ..., хк„и xk+i, ..., x,v. Каковы собственные знач-ения и соб- собственные векторы матрицы этой квадратичной формы? Обобщить этот ре- результат. 3. Введем следующее соотношение между комплексными числами и ма- матрицами: х У -У х Показать, что (a) ZW = WZ; (б) z~Z'\ (в) из z~Z и w~W следует, что zw~ZW. 4 (продолжение). С помощью введенного соответствия и теоремы Муас- ра найти вид Zn при ;;= 1, 2, ... 5 (продолжение). Очевидно, имеют место соответствия 1 Рассматривая матрицу 1 О i 0 1 II О 1 -1 О *s = \i и учитывая эти соответствия, мы приходим к клеточной матрице Л'1 Х2\/ Хз ХЛ — Х2 Х\) \ — Х4 Хз) -Хз ХЛ1 ДГ, ~Х2\ А" 4 Хз! \ Х% Х\] или, если опустить круглые скобки, X ] X 2 Х$ X 4 -х2 х} ~х4 х3 Л'з X,] Л" 1 #2 Х^ Х$ Л*2 ^1 Рассмотрим соответствие Q~QS. Показать, что из Q~QS и W~WH следует соответствие QW~QSWS. Отсюда найти ]QS\ и собственные значения Qa. 6. Как найти максимальное значение, принимаемое формой (х, Ах), если на х наложены ограничения (х, *) = 1, (х, с')=0, i= 1,2, ...,*? 7. Соотношение А^В, где А и В — симметрические матрицы, означает, что матрица А—В неотрицательно определенная. Показать, что из А ^ В, вообще говоря, не следует, что А2^В2. 8. Пусть g(tO>:0; рассмотрим квадратичную форму 1 / N \2 1 / N \2 QN (х) = [ g (t) ( 2 xktk dt. 0 \k=0 1 Показать, что Qn(x) неотрицательно определена и вывести отсюда .teiep- минантные неравенства для величин mk = g(t)tkdt. (Стилтьес.)
УПРАЖНЕНИЯ К ГЛ. 5 115 9. Пусть ; рассмотрим эрмитову форму я. (t) /V 2л Ш dt. Показать, что Нк(х) положительно определена и вывести отсюда детерми- •наитные неравенства для величин mk— g (¦') е2л dt. (О. Теплиц.) 10. Показать, что ™ " О т + п + 1 т, п=0 « = 0 П. Доказать теорему 1 с помощью индукции';. 12. Определить минимум выражения х'п. (Неравенство Гильберта.) N rfG. 13 (продолжение). К какому пределу стремится этот минимум при JV—>оо? (Этот результат играет важную роль в теории прогнозирования. См. Гренандер и Сегё, Тёплицевы формы и их приложения, ИЛ, 1961.) 14. Определить минимум выражения ^1 >, (=0 dt. где {hi) — последовательность действительных чисел таких, что о<ы<.. 15. Найти минимальное и максимальное значения функции (х, Ах) + + 2F, х) на сфере (х,х) = \. Сколько здесь имеется стационарных точек и все ли они действительны? 16. Сколько нормалей, действительных и комплексных, можно провести из данной точки плоскости к эллипсу х2/а2 + у2/Ь2={? 17. Если А = \\аи\\, С=\\си\\ и 2 асу= 0> -2 аЦ= ° и С'-' = С'+О, то ; < матрицы АВ и Л(8 + С) имеют одно и то же характеристическое уравнение. (А. Брауэр.) 18. Если А, С) и Сг таковы, что CiA=ACs = 0, C = Cj+C2, то матрицы АВ и ,4(В + С) имеют одно и то же характеристическое уравнение. (Паркер.) 19. Если АСА = 0, то матрицы АВ и А(В + С) имеют одно и то же ха- характеристическое уравнение. (Паркер.) 20. Пусть ^1«=йЛг^г •. • ^^-к и ц( ^ Ц2^ ¦ • • ^ M.v—характеристические числа соответственно матриц И и S'HS, причем матрица Н эрмитова, a S — произвольная действительная невырожденная матрица. Тогда число положи- положительных, отрицательных и нулевых характеристических чисел у этих матриц одинаково. Количественное уточнение этого результата (принадлежащее Сильвестру и Якоби), часто называемое законом инерции, можно найти в статье Островский (А. М. Ostrowski), A Quantitative Formulation of Sylvester's Law of Inertia, Proc. Nat. Acad. Sci. U.S.A. 45 A959), 740—743. ') См. Селье (С, J. Seelye), Amer. Math. Monthly 65 A958), 355—356.
1]6 УСЛОВНЫЕ ЭКСТРЕМУМЫ ' [ГЛ. 5 Библиография и комментарий § 2. Эти детерминантные критерии могут быть получены с помощью последовательности Штурма, получаемой из харак- характеристического многочлена \А—К1\. Этот же прием можно ис- использовать для доказательства того, что собственные значения действительны. См. Бернсайд и Пэнтон (W. S. Burnside and A. W. Pan ton), Theory of Equations, Longmans, Green & Co., Inc., New York, 1928, vol. II, p. 65, Exercise 39, etc. Замечательное обобщение этих неравенств содержится в ра- работе Шур (I. Sch ur), Ober endliche Gruppen und hermitische Formen, Math. Z. 1 A918), 184—207. Некоторые интересные результаты, связанные с положитель- положительностью, можно найти в работе Гуд (I. J. Good), A Note on Positive Determinants, J. London Math. Soc. 22 A947), 92—95. § 4. Затронутый вопрос охватывается исследованиями, из- изложенными в работах Дайне (L. L. Dines), On the Mapping of Quadratic Forms, Bull- Amer. Math. Soc. 47 A941), 494—498; Дайне (L. L. Dines), On Linear Combinations of Quadratic Forms, Bull. Amer. Math. Soc. 49 A943). Мы также воспользовались результатом Финслера; см. Финслер (P. Finsler), Ober das Vorkommen definiter und semide- finiter Formen in scharen quadratischen Formen, Commentarii Mathematicii Helvetica 9 A937), 188—192. Этот результат независимо от Финслера был получен Гер- штейном. Данное им доказательство предлагается в качестве упражнения в конце главы. Ряд других доказательств имеется в недавно вышедших работах. См., например, Афрайэт (S. N. Afriat), The Quadratic Form Positive Definite on a Linear Manifold, Proc. Cambridge Phil. Soc. 47 A951), 1—6. § 5. Упражнения 3—6 в конце этого параграфа иллюстри- иллюстрируют важный эвристический принцип, который можно сделать строгим с помощью теории инвариантов. Этот принцип гласит: всякий раз, когда мы получаем условия положительности в форме неравенств, имеет место более точный результат в тер- терминах расстояния, площади, объема и т. д., из которого данное неравенство следует с очевидностью. § 6. Задача определения условий положительности формы (х, Ах) при х ^ 0 рассматривается в статье Гэддам (J. W. Gaddum), Linear Inequalities and Quadratic Forms, Pacific J. Math. 8 A958), 4H—414.
Глава 6 ФУНКЦИИ ОТ МАТРИЦЫ § 1. Введение. В этой главе мы сосредоточим свое внимание на. понятии функции от симметрической матрицы. Сначала мы рас- рассмотрим две важные матричные функции: обратную матрицу и квадратный корень из матрицы. Последняя функция представ- представляет особый интерес в связи с вопросом о положительной опре- определенности матриц. Затем мы займемся наиболее важными ска- скалярными функциями от матриц — коэффициентами характери- характеристического многочлена. Определение матричных функций в случае матриц общего вида — задача несколько более сложная, чем это может пока- показаться на первый взгляд. Поэтому всякое детальное обсуждение различных предложенных для этой цели способов мы отклады- откладываем до гл. 11. В случае симметрических матриц существование диагональной канонической формы устраняет большую часть трудностей. Эту диагональную форму, существование которой было установлено в гл. 4, мы используем также для того, чтобы получить параметрическое представление для элементов сим- симметрической матрицы, которое нередко оказывается полезным при различных доказательствах. В качестве примера мы дока- докажем принадлежащий Шуру интересный результат, касающийся произведения двух положительно определенных матриц. В заключение мы выведем важное соотношение между опре- определителем положительно определенной матрицы и соответствую- соответствующей квадратичной формой, которое послужит основой для одной из последующих глав, посвященной неравенствам. Аналогичный результат мы получим и для эрмитовых матриц. .§ 2. Функции от симметрической матрицы. Как мы видели, вся- всякую вещественную симметрическую матрицу можно представить в виде А, О 
:П8 функции от матрицы где Т — ортогональная матрица. Отсюда следует, что i О 1ГЛ. б .4* = Т О Лдг г B) для любого целого k. Следовательно, для всякой аналитической функции f(z) мы можем определить матричную функцию f(A) следующим образом: О f(A) = : О C) если только скалярная функция f(z) определена в точках § 3. Обратная матрица. Следуя по тому же пути, мы приходим к следующему определению обратной матрицы: О О Г, A) причем все К{ предполагаются отличными от нуля. Ясно, что А~1 обладает обычными свойствами обратной матрицы, именно: А А = А А = / (СУ\ § 4. Единственность обратной матрицы. Возникает естественный вопрос, является ли обратная матрица единственной, если она существует. Прежде всего заметим, что все hi отличны от нуля тогда и только тогда, когда |Л|=?0. Действительно, если Я=0 — корень уравнения \А—A/j=O, то мы видим, что и |Л|=0; обратно, если |Л|=0, то Я.=0 является корнем этого уравнения. Матрица А называется вырожденной (особенной), если |Л|=0. Если |Л|=?Ю, то А называется невырожденной (неосо- (неособенной) .
§4] ЕДИНСТВЕННОСТЬ ОБРАТНОЙ МАТРИЦЫ 1 |9> Тотчас же видно, что вырожденная матрица не может иметь обратной, так как из АВ = 1 следует, что |ЛВ| = 1, или |Л|-|В| = 1. Если же |Л|=0, то последнее равенство невоз- невозможно. С другой стороны, покажем теперь, что всякая невырожден- невырожденная матрица, симметрическая или нет, имеет единственную об- обратную. В случае симметрической матрицы А обратная мат- матрица, определяемая новым способом, должна, очевидно, совпа- совпадать с C.1). Уравнение АВ = 1 эквивалентно jV2 уравнениям 2в/Л/ = «.7, i, }=1,2, ..., N. A> Фиксируя /, мы получаем систему линейных уравнений относи- относительно bkj, k=\, 2, ..., N. Эта система имеет своим определи- определителем \А\фО при всех индексах /. Таким образом, если А — невырожденная матрица, то суще- существует единственное решение системы A). Из A) также легко усмотреть, что это решение дается формулой где a.ji — алгебраическое дополнение элемента а^ матрицы А. Упражнения 1. Показать тремя способами: (а) непосредственно из C.1), (б) используя формулу D.2). (в) используя соотношение АА-1 — А^'А—1, что невырожденная симметрическая матрица имеет симметрическую обратную,, причем обратная матрица единственна. 2. Пусть А — вырожденная матрица. Показать, что можно найти та- такую матрицу S с произвольно малыми элементами, что матрица А + В будет невырожденной. 3. Пусть \к!—A\ = XN+ Ci'k'i~'1 + .. . + сN—характеристический многочлен матрицы. Показать, что Л-' = — (А *~] -)-г,Л-"'-2+ . . . -f cN~i)!cN, если только- с л- ФО. 4. Если А\, А2, Bt и В2 — невырожденные матрицы одного и того же по- порядка, то (Г1 л, д, л2 в2 -' 5. Пусть А—прямоугольная матрица размеров NXM. Рассмотрим си- систему несовместных линейных уравнений х=Ау, где х—/V-мерный вектор., а у—М-мерный вектор. Чтобы получить наилучшее приближение для этой системы, мы определим у из условия минимума квадратичной функции- (х—Ау, х—Ау). Показать, что при условии несовместности система имеет-
J20 ФУНКЦИИ ОТ МАТРИЦЫ [ГЛ. 6 ¦единственное наилучшее приближение, которое задается формулой у=(А'А)~хА'х, Определить после этого минимум функции (х—Ау,х—Ау). 6. Пусть А и В — симметрические матрицы, причем А ^В. Как и ранее, ¦соотношение А~^В означает, что матрица А—В неотрицательно определен- определенная. Показать, что из А ^ В > 0 следует, что B~l ^ А~1 *). 7. Если S — вещественная кососимметрическая матрица, то матрица I + S невырожденная. 8. Если матрица S вещественная и кососимметрическая, то матрица Т= (/—S)(/+S)~~' ортогональная (преобразование Кэли). 9. Если А — ортогональная матрица, причем Л + /—невырожденная ма- матрица, то А можно представить в виде где S — действительная кососимметрическая матрица. 10. Для любой матрицы А существует матрица / такая, что ее диаго- диагональные элементы равны ±1, а все остальные элементы — нули, причем матрица JA+I будет невырожденной. 11. Используя предыдущий результат, показать, что всякую ортогональ- ортогональную матрицу А можно представить в виде A=J(l—S)(l + S)-\ где / — матрица, описанная в упражнении 10. 12. Показать, что (а) если At > Ви А2 > В2, то Ai+A2 > Bl + B2; (б) если Л,>ВЬ B,>Ci, то 4i>d; (в) если А\~^В\, A^^-Bi, то ие обязательно А\Ач~^В^Вч, даже если А\А% и В\Въ — симметрические матрицы. (Таким образом, из А"^В еще не сле- следует, что Л2^В2); (г) если /4i>Bi, то T'AJ^T'BJ. 13. Показать, что если А — положительно определенная матрица, то Л .можно определить с помощью соотношения (х, Л~'л:) = тах [2 (х, у)-(у, Ад)]. 14 (продолжение). Используя это соотношение, показать, что В~1^, если А и В —симметрические матрицы ц А !> В > 0 **). 15. Если А—матрица, все элементы которой — действительные целые числа, и |Л| = ±1, то А~1 представляет собой матрицу этого же типа. 16. Если А—матрица, все элементы которой — комплексные целые чис- числа, т. е. числа вида x+iy, где х и у — действительные целые числа, и если ]Л] = ±1 или ±(, то Л представляет собой матрицу этого же типа. 17. Каковы необходимые и достаточные условия того, чтобы система Ах=у имела целочисленные решения, если все компоненты вектора у и эле- элементы матрицы А — целые числа. 18. Показать, что |Л + Ш|2=|Л|2/+Л-1ВЛ-1В|, если H=A + iB — эрмитова матрица,, а Л невырождена. 19. Показать, что (г, Hz) = (x, Ах) + (у, Ау)+2(Вх, у), если H=A+iB — эрмитова матрица, а г=* + й/. 20. Показать, что (х, Лх) = (*, ARx), где Лн=(Л+Л')/2. (Предполагается, что х — вещественный вектор. — Прим. ред.) 21. Как получить элементы матрицы Л-', зная элементы матрицы В-1, «ели Л и В совпадают, за исключением одного столбца. *) См. упражнение 2 к § 12 гл. 4. (Прим. ред.) **) См. упражнение 6 к настоящей главе. (Прим. ред.),
5] КВАДРАТНЫЕ КОРНИ 22. Если А порядка 2Л/ имеет вид О х, 0 ... у, О хг 0 ... О уг 0 х3 ... . О у. при условии что ж,, yi?=0 при нечетных номерах /, элементы Л" определяются по формуле 121 матрицы О, | (-0* к нечетное; kl,-\ п »=о четное, где *о=1. (Клемент.) 23. Пользуясь предыдущим результатом, найти общий вид матрицы А~1. § 5. Квадратные корни. Поскольку положительно определенная матрица является естественным обобщением положительного числа, возникает вопрос, имеет ли положительно определенная матрица положительно определенный квадратный корень. Подобно тому, как мы поступали в § 2, можно определить A'l* соотношением 0 0 Ajv г A) и получить таким образом матрицу, которая удовлетворяет со- соотношению В2=А и является положительно определенной, если А положительно определена. Выясним теперь вопрос о единственности квадратного корня. Так как матрица В симметрическая, то она обладает представ- представлением ¦I О S', B)
122 ФУНКЦИИ ОТ МАТРИЦЫ [ГЛ. 6 где S — ортогональная матрица. Матрицы В и В2 = А переста- перестановочны, следовательно, они могут быть приведены к диаго- диагональной форме с помощью одной и той же ортогональной мат- матрицы Т. Соотношение В2 = А показывает, что В имеет вид A), где квадратные корни берутся со знаком плюс. Упоажнения 1. Сколько симметрических квадратных корней имеет положительно опре- определенная /VX-V-матрица? 2. Может ли симметрическая матрица иметь несимметрические квадрат- квадратные корни? 3. Если матрица В эрмитова и В ^ 0, то А совпадает с единственным не- неотрицательным эрмитовым квадратным корнем матрицы В, если А2 = В и (,4+Л*)>0. [П у т н а м (Putnam), On Square Roots and Logarithms of Operators, Purdue University, PRF-1421, 1958 j § 6. Параметрическое представление. Формула А,, О О г A) дает нам параметрическое представление элементов симметри- симметрической матрицы через элементы ортогональной матрицы Т, именно, N а--=У, U-bt-ь B) Это представление, как мы скоро увидим, можно использовать для получения некоторых свойств элементов симметрической матрицы Л. Упражнение 1. Получить параметрическое представление элементов симметрической 2х2-матрицы через cos 9 и sin 0. § 7. Результат Шура. Используя представление F.2), легко до- доказать следующую теорему: Теорема 1. Если А = \\ац\\ и В = \\Ь{,\\ — положительно определенные матрицы, то матрица также является положительной определенной.
§ 8] ОСНОВНЫЕ СКАЛЯРНЫЕ ФУНКЦИИ Доказательство. Имеем JV JV / JV \ 2 oijbijXixj= 2j bijXiXj[2j^k^ikiikj = N IN Как квадратичная форма переменных Xitih, выражение N 2 btjXitikXjtjk положительно, если хотя бы одна из величин; Xitih отлична от нуля. Но так как 2 *Щк = S х\ S t2tk = S x2t, B> i, k i k i то, очевидно, все Xitih равны нулю тогда и только тогда, когда равны нулю все xt. Это и устанавливает положительную опре- определенность матрицы C=||ajj6jj||. Упражнение 1. Используя упражнение 2 к гл. 5, дать индуктивное доказательство- этого результата, отправляясь от легко доказываегчого случая ;V = 2. § 8. Основные скалярные функции. Рассмотрим теперь некото- некоторые свойства скалярных функций матрицы А, определяемых посредством характеристического полинома Матрицы, фигурирующие в этом параграфе, являются квадрат- квадратными матрицами общего вида, не обязательно симметриче- симметрическими. Из соотношения между коэффициентами и корнями полино- полиномиального уравнения следует, что = 2 С другой стороны, выписывая коэффициенты при ^N-1 в том виде, в каком они получаются при раскрытии определителя \А — А/|, мы видим, что ••• +aNN. C)
124 ФУНКЦИИ ОТ МАТРИЦЫ [ГЛ. 6 Полагая же Х = 0, убеждаемся, что yN(A) = \A\. D) •Линейная функция yi(A) играет первостепенную роль в теории матриц. Она носит название следа матрицы А и обозна- обозначается Sp A. Из C) следует, что SpH+S) = SpH)+Sp(S), E) а несложным подсчетом нетрудно убедиться в том, что Sp(AB)=Sp(BA) F) для любых двух матриц А и В. Эти соотношения справедливы, несмотря на тот факт, что никаких простых соотношений, свя- связывающих характеристические числа матриц А, В и А + В или АВ, не существует. Соотношения E) и F) являются частным случаем следующей теоремы: Теорема 2. Для любых двух матриц А и В имеют место равенства щ{АВ)*=щ{ВА), k = \, 2, .... N. G) Доказательство будет опираться на факт, уже известный нам, а именно, на то, что при k = N равенство G) имеет место, т. е. \АВ\ = \ВА\ для любых двух матриц Л и В. Если А — невырожденная матрица, то = \M — BA\, (8) откуда и следует утверждение теоремы. Если матрица А вырожденная, то соотношение (8) можно получить предельным переходом, отправляясь от матрицы Л+е/, где е мало, а матрица Л + е/ невырожденная. В нижеследующих упражнениях намечен другой подход к доказательству этой теоремы. Упражнения 1. Показать, что \l+tA\ = I +t Sp(A) +... 2. Показать, что щ(ТАТ-1) =фл(Л); <рк(ТАТ')=(рк(А), если Г —орто- —ортогональная матрица. 3. Показать, что любой полином р(п\\, ai2,.. ., unn) от элементов ма- матрицы А, удовлетворяющий условию р(АВ)—р(ВА), где А и В — произволь- произвольные матрицы, должен быть полиномом от функций ц>к(А). 4. Показать, что Sp((AB)k) =Sp((B/4)'t) при k=l,2,... и, следователь- следовательно, щ(АВ)=ук(ВА) при fe=l,2 N. 5. Показать, что если Sp(-4^)=O при всех матрицах X, то Л=0. 6. Показать, что результаты упражнения 2 и теоремы 2 этого параграфа являются частным случаем следующего результата: для любого набора из m матриц А\,Аъ...,Ат порядка N величина yh(A\A%.., Am) остается неизмен- неизменной после циклической перестановки сомножителей Ль Аг,.,., Ат,
§ 9] НЕСОБСТВЕННЫЙ ИНТЕГРАЛ ]25 оо § 9. Несобственный интеграл е~(х'Ах) dx. Важную роль в — оо анализе играет интеграл оо оо /jv= J ... \e-*-A*>dx, A) — ОО —ОО где dx ~ dx\ dx.2 ... dxN. Теорема З. Если матрица А положительно определенная, то B). Приведем два доказательства этой теоремы. Первое доказательство. Пусть Т — ортогональная матрица, приводящая матрицу А к диагональному виду. Введем замену переменных х=Ту, тогда (х,Ах) = (у,Ау). C) N N Далее, П ^i= П ^d поскольку якобиан замены х = Ту ра- равен \Т\, который можно взять равным +1. Так как матрица Т устанавливает взаимно однозначное соответствие, то ( = 1 ~ ОО Учитывая, что П Xt = \ А |, а — ОО ^ОО получаем формулу B). Второе доказательство. В § 3 гл. 5 было показано, что N (х, Ах) = %-?-& До=1, E)
126 ФУНКЦИИ ОТ МАТРИЦЫ [ГЛ. S если матрица А положительно определенная. В формуле E) N ц = х -\- *!?] b -х • k = \ 2 N F) Сделаем замену переменных, определенную формулами F). Якобиан опять равен 1, а соответствие между старыми и новыми переменными взаимно однозначное. Следовательно, 2 J v — Г d и1 Id \ \ —ОО / ~П -*7Ш- G> \А\ Упражнения \. Показать, что если А — положительно определенная матрица, а В сим- симметрическая, го ! е-кх. Ax,-i (х, Вх) ^х _ Л е- | А + /В — ОО — ОО а/2- Для вычисления интеграла следует (а) положить х=Ту, где Т'АТ = Л, а Л — диагональная матрица; (б) сделать еще одну замену переменных yk = ^jXj (в) в получающемся подынтегральном выражении N - S z^-i (г, Сг) е *=1 матрицу С привести к диагональному виду ортогональным преобразованием (г) вычислить полученный интеграл. 2. Вычислить интеграл С Р г, V Osi V V П V I i 11 I"~ "jo ]"^9 22 2 tn n / =6 Хт Xiy (XX \ пХс) тп J J i •* i * О О для целых неотрицательных значений т и п. Учесть при этом, что Как исследовать общий случай: m или п нечетные.
$ 10] АНАЛОГ ДЛЯ ЭРМИТОВЫХ МАТРИЦ 127 3. Вычислить интеграл оо /л,= [ e-(x-ABx)dX для положительно определенных матриц А и В. 4. Вычислить интеграл оо / =, I' e~lx- Ax>+2i (ЛГ' У) их. N § 10. Аналог для эрмитовых матриц. По аналогии с (9.1) рас- рассмотрим интеграл оо /(#)= $ e-&H*>dxdy, A) где dx = dxidx2 ... dxN, dy = dt/idy2 ... dyN, a H—положитель- H—положительно определенная эрмитова матрица. Представим Н в виде H=A + iB, где матрица А действитель- действительная и положительно определенная, а матрица В действительная, кососимметрическая. Тогда / (Я) = | е~(х- л*)-2<в*. №-(.* л») ой- dy. B) — оо Поскольку этот интеграл сходится абсолютно, то можно инте- интегрировать сначала по х, а затем по у. Используя соотношение (х, Ах) + 2(Вх, у) = {х, Ах)-2(х, Ву) = = (Л (х - A~lBy), х - A'1 By) - (By, A~lBy), C) получаем „N/2 (ВУ,А~'ВУ) g-(je. Ax)~2(Bx, У) ^ _ I Следовательно, оо J (H) = J^i Г е-[(*. Ат(у, ва~'ву)] d,, =
128 ФУНКЦИИ ОТ МАТРИЦЫ [ГЛ. 6 §11. Связь между J(H) и \Н\. Остается теперь выразить /(#) через Н . Имеем + iAB\, \H'\ = \A-iB\ = \A\\l-iA~lB\. Так как |Я| = |Я'1, то | Н |2 = | A f | (/ + 1А~1В) (I - iA'lB) | = | A f | / + Л~'Я А'1 В |. B) Сравнивая эти соотношения, получаем /(Я) = ял'/|Я|. C) Упражнения к гл. 6 1. Показать, что характеристические числа матрицы р(А), где р(К) — полином, равны p(Xi), и, следовательно, | р (А) | = JJ р (Яг-). г 2. При каких условиях аналогичный результат имеет место для рацио- рациональных функций? 3. Найти обратные матрицы к следующим матрицам: С = х -у X\ -x2 -Хз — Хь x2 X\ xt ~X3 x3 -x4 X\ x2 xt Хз -x2 X, 4. Пусть Ло=/, а последовательность скаляров и матриц определяется формулами Ck = Sp(AAk-i)/k, k= I, 2,...; Ak=AAh-i—chl. Тогда A-1=An-ilcn. (Фрэйм.) 5. Показать, что \A+tB\ = \A\(l+tSp(A-1B)+...). 6. Используя представление получить соотношение получить аналогичный результат для каждого q>k(A). 7. Показать, что выполнение условия Sp(^4B)>0 для всех положительно определенных матриц В необходимо и достаточно для того, чтобы Л^О и. А Ф 0. 8. Показать, что вывести отсюда соотношения, связывающие Ф&С4) и Sp(i4ft).
УПРАЖНЕНИЯ К ГЛ. 6 129 9. Показать, что матрицы АВ+В и ВА + В имеют одинаковый определи» тель, для чего установить формулу Sp((AB + В) n)=Sp((BA+В)п) для 12 *) ,, ) 10. Пусть Во=/, B^ABi-i+kil, где ki = —Sp(ABl-1)li, тогда (—1)"|А — Х1\=кп+к1Х"-1 + ... (Леверье.) 11. Пусть А, В,... — перестановочные матрицы, и пусть f(x\, х2,...) — произвольная рациональная функция. Показать, что характеристические чис- числа щ, а% ..., ап матрицы А, Ь\, Ьг,...,Ьп матрицы 5,... можно упорядо- упорядочить таким образом, что характеристические числа матрицы f(A,B,...} имеют вид f(a\, b\, .. .), f (аг, Ьг,...) и т. д. 12. Показать, что каждая невырожденная матрица может быть представ- представлена в виде произведения двух, не обязательно действительных, симметриче- симметрических матриц и притом бесконечным числом способов. (Восс.) 13. Если Я — неотрицательно определенная эрмитова матрица, то суще- существует треугольная матрица Т такая, что Н = ТТ*, (Теплиц.) 14. Для любой невырожденной матрицы А существует треугольная ма- матрица Т такая, что матрица ТА унитарная. (Э. Шмидт.) 15. Пусть Р, Q, R, X — матрицы второго порядка. Показать, что всякое характеристическое число матрицы X, являющейся решением уравнения PX* + QX + R = 0, есть корень уравнения \PX2 + Ql + R\ = 0 **). (Сильвестр.) 16. Если матрицы А, В и С положительно определенные, то корни урав- уравнения |/Ш + ВЯ + С| = 0 имеют отрицательные действительные части***). 17. Рассмотрим матрицы А я В такие, что АВ = г\ВА, где г\ есть корень </-й степени из единицы. Показать, что характеристические числа матриц А и В, Я; и цг, можно упорядочить таким образом, что величины (Я? + |х?) q и rl<i~1>/2Xi\ii будут характеристическими числами матриц А+В и АВ соот- соответственно. Для различных значений i, возможно, потребуется выделить раз- различные ветви корня <7-й степени. (Поттер.) 18. Используя представление и разлагая обе части этого равенства по степеням s, получить выражения для коэффициентов разложения |Л+еВ| по степеням е; получить отсюда вы- выражения для функций срй(Л). 19. Пусть А и В — эрмитовы матрицы, обладающие тем свойством, что при всех значениях скаляров fi и с? матрица с\А + с?В имеет своими характе- характеристическими числами величины ciA;-t-C2|ij, где Яг и (г,- — характеристические числа матриц А п В соответственно. Тогда АВ — ВА. (Моцкин.) 20. Показать, что матрица А невырожденная, если |в«1> 2 1«/*|. '=1.2 N. 21. Показать, что собственные векторы матрицы А являются собствен- собственными векторами р(А) для любого полинома р. Обратное утверждение не всегда имеет место. *) Равенство \АВ+В\ = \ВА+В\ очевидно. (Прим. ред.) **) См. упражнение 9 к гл. 11 (Прим. ред.) ***) См. упражнение 25 к гл? 4 и § 8 гл. 13г 9 Р. Беллман
130 ФУНКЦИИ ОТ МАТРИЦЫ ¦ [ГЛ 6 22. Если матрицы А и В симметрические и такие, что Г |/ — Ы\\1 — |ifi| = f/ —ЯЛ —цВ| при всех Я и [1, то ЛВ=0. (Крейг—Хотеллинг.) 23. Пусть ЛВ=0, и пусть р(А,В)— полином со свободным членом раз- разным нулю. Тогда \XI-p(A,B)\ = \-N\X/-p(A,0)\-W-p(B,0)\. (Г. Шнайдер'} 24. Обобщить этот результат на полиномы вида р{А\, А<2, ..., Ап), где Л,Л, = 0, i</. (Г. Шнайдер.) 25. Пусть А ц В — положительно определенные матрицы. Используя со- соотношение |ЛВ| = |Л'/2| |В| |Л'/2|, показать, что опт? АВ\ 1/2 26. Показать, что 14 II (¦=•1 . х) е-(# Л 27. Пусть Y — положительно определенная, а X — симметрическая матри- матрицы второго порядка. Расемотрим интеграл HY)- Х>0 где область интегрирования определяется неравенствами дгн>0, Х\\Х22~ х\2 -> 0- Другими словами, это область, где матрица X является положительно определенной. Тогда Я1/2ГE)ГE-'/г) J \* ) | у IS при Re(s)>'/!- (Ингам — Зигель.) (См. комментарий к § 9, где имеется ин- информация о дальнейших результатах этого типа.) 28. Пусть Л — матрица с комплексными элементами порядка N: •Л = Ца,,,|| = ||Ьг«+(сг,||. Пусть, далее, В — действительная матрица порядка 2JV, полученная из матрицы А заменой элементов br, + icra их матричными экви- эквивалентами 1t>rs Crs ~crs brs Показать, что А~1 можно получить, обратив В и воспользввавшись указан- указанным соответствием. 29. Пусть А — симметрическая матрица и |Л| = Э; тогда окаймленный опре- определитель а,, ... а... х. ¦*! 1 21 а„
УПРЛЖИРНПЯ К ГЛ 8 131 умноженный на второй манный минор матрицы А, представляет собой киад- рат некоторой линейной функции аргументов лг(. (Бернсайд — Пэнтон.) 30. Следовательно, если матрица А симметрическая и ее первый главный минор равен нулю, то определитель и его второй главный минор имеют про- противоположные знаки. 31. Пусть X и А — квадратные матрицы второго порядка. Найти псе решения уравнения Х2=А, имеющие вид X = cJ + с?А, где с, и а~ скаляры. 32. Подобно этому, рассмотреть случай, когда X и А—квадратные мат- матрицы третьего порядка, а Х = С\1 + с'2А4-сИ2- 33. Пусть f(i)—полином степени, не большей чем N — 1, и пусть Яь Я5, ..., A.jv представляют собой N различных характеристических чисел матрицы А. Тогда ГТ Л 1=1 _^ (Интерполяционная формула Сильвестра). Чему равна правая часть этого соотношения, если j{X) —полином степени, большей или равной /V? 34. Справедлива ли эта формула для f(A)=A-]? 35. Показать, что I dXj dxn ... dxN = n ' ' _ (x. Ax) < l 36. Если элементы a.ij квадратной матрицы А порядка N действительны и удовлетворяют условиям ац > ^ | ац |, г=1, 2, ..., N, то свободный ; Ф i член в разложении Лорана функции N / N \ -' /(г,,г2, .... гДГ) = ! на контуре |zi| = |z2l = .. . = |гк| равен |Л] Другими словами, 1 1 г. г. -Л- Г dzl Bто) N _ г ¦¦¦ Ш 1 ; | =1 /=I L А Этот результат остается справедливым и для комплексных матриц та- таких, что | ац | > 2 I а,-/1. Некоторые дальнейшие результаты имеются в / Ф I работе У и т л а '). Приведенные соотношения принадлежат Якоби; некоторые их приложе- приложения можно найти в книгах Вейля2) и Форсайта3). ') P. Whittle, Some Combinatorial Results for Matrix Powers, Quart. J. Math. 7 A956), 316—320. 2) H. Weyl, The Classical Groups ..., Princeton University Press, N. J., 1946. [Русский перевод: Классические группы, ИЛ, 1947.] 8)А. R. Forsyth, Lectures Introductory to the Theory of Functions oi Two Complex Variables, Cambridge University Press, New York, 1914. 9*
132 ФУНКЦИИ ОТ МАТРИЦЫ [ГЛ. 6 37. Показать, что если матрицы А а В неотрицательно определенные, то ^сц/Ьц^О. Вывести отсюда теорему Шура, приведенную в § 7. (Фейер.) i.i 38. Пусть {А,} есть набор симметрических матриц порядка NXN. Вве- Введем скалярное произведение по формуле (A-,A,)=Sp(A,Aj). Пусть, далее, этот набор состоит из M = N(N+\)j2 линейно независимых симметрических матриц. Используя введенное скалярное произведение, по- построить ортонормированный набор {У,} линейно независимых матриц и по- показать, что любая симметрическая матрица X порядка N может быть пред- предам ставлена в виде ЛГ= 2 с»^<> где ci~ № ^)- 39. В условиях предыдущего упражнения рассмотреть следующий набор матриц второго порядка: О О II || 0 1 | о >|(' Hi o|- и построить соответствующий ортонормированный набор. 40. Рассмотреть аналогичный набор матриц {А;} в общем случае и по- построить матрицы {У,-}. 41. Теорема Гамильтона — Кэли утверждает, что всякая квадратная мат- матрица А удовлетворяет своему характеристическому уравнению. Минимальным многочленом матрицы А называется многочлен q(X) минимальной степени, обладающий тем свойством, что <7(А)=0. Показать, что q(X) является дели- делителем характеристического многочлена. 42. Найти якобиан преобразования Y = X~l '). 43. Вычислить функцию от матрицы ./-A) dX при различных предположениях относительно матрицы А и контура интегри- интегрирования С. Пуанкаре первым использовал контурный интеграл —-г- / (Я) {XI — А)~[ dX для представления функции от матрицы f{A). с (Н. Р о i n с а г ё, Sur les groupes continus, Trans. Cambridge Phil. Soc. 18 A899), 220—226 and Oeuvres, vol. 3, 173—212.) 44. Доказать, что если уравнение Ах=Ь имеет решение при всех 6, то существует обратная матрица А. 45. Для любых двух положительных констант кх и k2 существуют матрицы А и В такие, что каждый элемент матрицы АВ— 1 по абсолютной величине меньше k\, а у матрицы ВА — / есть элементы, большие k% (Xayc- холдер.) 46. Если матрица /4t невырожденная, то А, А2 А3 А4 = |А1||А4-А3А7'А ') Олкин (I. Olkin), Note on the Jacobians of Certain Matrix Trans- Transformations Useful in Multivariate Analysis, Biometrika 40 A953), 43—46.
УПРАЖНЕНИЯ К ГЛ. 6 133 47. Если ВС = СВ и А = / о . . ¦в/о С -В I о с -в D, О2 Найти рекуррентные соотношения для матриц О,-. 48. Если А — прямоугольная матрица размера NxM и ранга г, r<N, С — прямоугольная матрица размера MxN, удовлетворяющая условию ACA — kA, где k — скаляр, а В — прямоугольная матрица размера MXN, то характеристическое уравнение матрицы АВ имеет вид X"~r(f(X)=O, a Ял*~гф(Я, — k) =0 является характеристическим уравнением матрицы А (В + С). (Паркер.) 49. Выразить X через У, если К= (АХ+В) (СХ+В)-1. 50. Ранее мы ввели соответствие а + Ы -b a Показать, что равенство /(г)=/(г), где f(z)—степенной ряд, является не- необходимым и достаточным условием, при котором выполняется соотношение f(a а Ь -Ь а (Обобщение этого результата читатель найдет в работе D. W. Robinson, Math. Mag. 32 A959), 213—215.) 51. Если F (z) спг"< гДе (г) ^9, то F(A) положительно 2 я=9 определенная всякий раз, когда матрица А положительно определенная. 52. Если матрица F(A) положительно определенная для любой матрицы оо вида Цаг_/||, то Р (z)= ^ с„г", где сп^0. (У. Рудин.) (Более ранний я=9 результат принадлежит Шенбергу. См. Schoenberg, Duke Math. J., 1942.) 53. Матрица Л = ||аг)|| называется якобиевэй, если atj=O при |( — /1^2. В какой степени определены элементы а,-,- симметрической якобиевой матри- матрицы А, если известны ее характеристические числа. Эта задача представляет
134 ФУНКЦИИ ОТ МАТРИЦЫ [ГЛ. 6 собой конечномерный вариант задачи нахождения функции <р(х) по спектру уравнения и"+Хср{х)и=0 при различных краевых условиях1). 54. Пусть матрица А имеет вид А = a. I 0 1 a2 1 0 1 an • ¦ 0 1 Как выражаются числа а,- через характеристические числа матрицы Л? Библиография и комментарий § 1. Подробное рассмотрение функций от матриц имеется в книге Мак-Даффи (С. С. MacDuffee), The Theory of Matrices, Ergeb- nisse der Mathematik, Reprint, Chelsea Publishing Co., New York, 1946*). Более поздние статьи по этому вопросу: Райнхарт (R. F. Rinehart), The Derivative of a Matrix Function, Proc. Amer. Math. Soc. 7 A956), 2—5; Рихтер (Н. Ri с liter), Ober Matrixfunktionen, Math. Ann. 122 A950), 16—34; Афрайэт (S. N. Afriat), Analytic Functions of Finite Dimensional Linear Transformations. Proc. Cambridge Phil. Soc. 55 A959), 51—56. Прекрасный обзор многих вопросов, связанных с функциями от матриц, дан Райнхартом: Райнхарт (R. F. Rinehart), The Equivalence of Definitions of a Matrix Function, Amer. Math. Monthly 62 A955), 395—414. См. также Двайр и Макфейл (Р. S Dwyer and M. S. M а с p h a i 1), Symbo- Symbolic Matrix Derivatives, Ann. Math. Stat. 19 A948), 517—534. Рассматриваемые нами вопросы тесно связаны с функциями гиперкомплексных величин. В частности, для кватернионов, ') Борг (G. Borg). Eine Umkehrung der Sturm-Liouvilleschen Eigen- werte Aufgabe. Acta Math. 78 A946), 1—96. [См. также: М. Г. Крени, Ре- Решение обратной задачи Штурма — Лиувилля, ДАН СССР 76, № 1 A951) 21—23, М. Г. Крейн, Определение плотности неоднородной симметричной струны по спектру ее частот, ДАН СССР 76, № 3 A951), 345—348; И. М. Гельфанд и Б. М. Левитан, Об определении дифференциаль- дифференциального урав-нения по его спектральной функции, ИАН СССР, сер. матем. 15, N» 4 A951), 309—360. См., кроме того, непосредственно относящееся к дан- данному вопросу дополнение II в книге Ф. Р. Гантмахера и М. Г. К р е й- н а, «Осцилляционные матрицы и ядра и малые колебания механических си- систем», Гостехиздат, 1950.] (Прим. ред.) *) См. также Ф. Р. Г а н т м а х е р. Теория матриц, «Наука», 1967, гл. V. (Прим. ред.) ¦
БИБЛИОГРАФИЯ И КОММЕНТАРИЙ 13е; которые можно рассматривать как матрицы вида Х'2 X | " Х^ X Xjj X 4 X [ л *4 -^3 Х-2 Х\ Z = развита довольно полная теория, во многом аналогичная обыч- обычной теории функций комплексного переменного. Кстати, послед- последнюю можно рассматривать как теорию действительных матриц специального вида х У II -У х I• См. статью Фуэтер (R. Fueter), Functions of a Hyper Complex Variable, Uni- University of 2urich, 1948—1949, reprinted by Argonne National Laboratory, 1959. См. также Фуэтер (R. Fueter), Commentarii Math. Helveticii 20, 419—420, где имеются указания на связанную с этими вопросами лите- литературу. Упомянем, наконец, работу Рот (W. E. Roth), A Solution of the Matrix Equation P(X)=A, Trans. Amer. Math. Soc. 30 A928), 597—599, где изложены ранние результаты Сильвестра, Кэли и Фробе- ниуса, связанные с решением полиномиальных уравнений этого типа. Дальнейшие ссылки на работу по теории функций от матриц будут приведены в конце гл. 10. § 3. Понятие обобщенного обращения для вырэжденных матриц ввел Мур (Е. Н. Мое re), Genera! Analysis, Part. I, Mem. Amer. Phil. Sec. 1 A935), 197, а позднее, независимо от Мура, Пенроуз (R. Penrose), A Generalized Inverse for Matrices, Proc, Cambridge Phil. Soc. 51 A953), 406—413*). Эти и другие вопросы рассматриваются в рабэте Хестинс (М. R. Hestenes), Inversion of Matrices by Biorthegonali- zation, J. Soc. Indust. Appl. Math. 6 A958), 51—90. *\ См. по этому повплу. Ф. P. Г а и т м a x e p, Теория матриц, «На^ка», 1967, гл. I, стр. 32 (Прим. ред.)
,_- ФУНКЦИИ ОТ МАТРИЦЫ [ГЛ. 6 Изложение вычислительных аспектов обращения матриц и связанных с ними различных аналитических вопросов можно найти в работе фон Нейман и Голдстайн (J. von Neumann and H. Gold- Goldstein), Numerical Inverting of Matrices of High Order, Bull. Amer. Math. Soc. 53 A947), 1021—1099. § 4. Прекрасное изложение различных методов обращения матриц, а также большое число ссылок читатель найдет в ра- работе Гринспен (D. Greenspan), Method of Matrix Inversion, Amer. Math. Monthly 62 A955), 303—319*). В численном анализе чрезвычайно важную роль играет за- задача нахождения реализуемых методов обращения матриц, ко- которые отличаются от теоретических. Эти вопросы будут под- подробно рассмотрены Г. Форсайтом в последующем томе. Очень часто необходимо знать, что исследуемая матрица яв- является невырожденной. Удобно поэтому иметь несколько про- простых, не связанных с громоздкими вычислениями критериев, гарантирующих отличие от нуля определителя матрицы. По-видимому, наиболее полезным из них является следую- следующий (упражнение 20 к этой главе): Если матрица А действительная и | ati | > 2 I ац I. ' = 1» 2, ... ..., N, то \А\?=0. Историю этого результата, а также ряд его обобщений чи- читатель найдет в работе Таусски (О. Та us sky), A Recurring Theorem on Determinants, Amer. Math. Monthly 56 A949), 672—676 **). Тесно связана с предыдущей задача построения оценок ха- характеристических чисел матрицы по ее элементам. С этой зада- задачей мы еще встретимся в гл. 16. Подробное же рассмотрение этой задачи мы отложим до одного из последующих томов на- нашей серии. Имеется библиография по этой теме: Таусски (О. Taussky), Bibliography on Bounds for Characteristic Roots of Finite Matrices, National Bureau of Standards Report, September 1951. Отметим еще, что из предыдущего результата следует по- полезный результат Гершгорина, состоящий в том, что все харак- *) См. также Д. К- Фаддеев и В. Н. Фаддеев а, Вычислительные методы линейной алгебры, Физматгиз, 1963. (Прим. ред.) **) См. также Ф. Р. Г а н т м а х е р, Теория матриц, «Наука», 1967, гл. XIV. (Прим. ред.)
БИБЛИОГРАФИЯ И КОММЕНТАРИЙ 137 теристические числа матрицы А лежат внутри кругов с цент- центрами пц и радиусами, равными 2 №u\> t = 1, 2 N. За оригинальным изложением этого результата мы отсылаем чи- читателя к работе Гершгорин С, Ober die Abgrenzung der Eigenwerte einer Matrix, И АН СССР 7 A931), 749—754. § 6. Как уже упоминалось ранее, с помощью эллиптических функций можно получить другое представление квадратных матриц третьего порядка; по этому поводу см. работы Каспари (F. Caspar у), Zur Theorie der Thetafunktionen mit zwei Argumenten, Kronecker J. 94, 74—86; Каспари (F. Caspar у), Sur les systemes orthogonaux formes par les fonctions theta, Comptes Rendus 104, 490—493, а также ряд других статей этого же автора, написанных в тот же период. § 7. См. статью Шур (I. Sch ur), Bemerkungen zur Theorie der beschrankten Bilinear- formen mit unendlich vielen Veranderlichen, J. Math. 140 A911), 1—28. См. также Фей ер (L. Fejer), Ober die Eindeutigkeit der Losung partiellen Diffe- rentialgleichung zweiter Ordnung, Math. Z. 1 A918), 70—79, где имеется ссылка на более раннюю работу Мотарда. См. еще работу Л ев и (Н. Lew у), Composition of Solutions of Linear Partial Differen- Differential Equations in Two Independent Variables, J. Math, and Mech. 8 A959), 185—192. Скалярное произведение матриц, определяемое формулой (А, В) = 2 CLijbij, использовалось Р. Ольденбургером для дру- других целей в работе Ольденбургер (R. Oldenburger), Expansions of Quadratic Forms, Bull. Amer. Math. Soc. 49 A943), 136—141. § 9. Этот несобственный интеграл играет важную роль в различных разделах анализа. Мы будем существенно опираться на этот интеграл и его обобщение в гл. 8, посвященной неравен- неравенствам. Далеко идущие обобщения формулы C) могут быть получены с помощью интегралов, введенных Ингамом и Зиге- лем; см. работы Ингам (А. Е. Ingham), An Integral which Occurs in Statistics, Proc. Cambridge Phil. Soc. 29 A933), 271—276; Зигель (С. L. Siegel), Ober die analytische Theorie der quadratischen Formen, Ann. Math. 36 A935), 527—606.
138 функции от :мдтрицы [гл. & Другие обобщения и связайные с ними результаты можно найти в работах Беллман (R. Bellman), A Generalization of Some Integral Identi- Identities Due to Ingham and Siegel, Duke Math. J. 24 A956), 571—578; Герц (С. S. Herz), Bessel Functions of Matrix Argument, Ann. Math. 61 A955), 474—523; Олкин (I. Oik in), A Class of Integral Identities with Matrix Argu- Argument, Duke Math. J. 26 A959), 207—213; Бохнер (S. Bochner), Group Invariance of Cauchy's Formula in Several Variables, Ann. Math. 45 A944), 686—707; Беллман (R. Bellman), Generalized Eisenstein Series and Nonana- lytic Automorphic Functions, Proc. Nat. Acad. Sci. U. S. A. 36 A950), 356—359; Маас (Н. Maass), Zur Theorie der Kugelfunktionen einer Matrixva- riablen, Math. Z. 135 A958), 391—416; Пот тер (H. S. A. Potter), the Volume of a Certain Matrix Domain, Duke Math. J. 18 A951), 391—397. Интегралы этого типа, их аналоги и обобщения очень есте- естественно возникают в различных задачах многомерного стати- статистического анализа. См., например, Андерсон и Гиршик (Т. W. Anderson and M. A. Gircshick), Some Extentions of the Wishart Distributions, Ann. Math, Stat. 15 A944), 345—357; Раш (G. Rasch), A Functional Equation for Wishart's Distribution, Ann. Math Stat. 19 A948), 262—266; Ситгривс (R. Sit greaves), On the Distribution of Two Random Matrices Used in Classification Procedures, Ann. Math. Stat. 23 A952), 263—270. В связи с функциями от матриц уместно упомянуть иссле- исследования Лёвнера в различных областях математической физики и прикладной математики. Как мы уже отмечали в нескольких упражнениях, из соотношения А >• В, понимаемого в том смы- смысле, что разность А— В двух симметрических матриц А и В является неотрицательно определенной матрицей, не следует,, что Л2>В2, хотя и верно, что /Н^Л, если А > В>0. Впер- Впервые этот вопрос обсуждался в общем виде в работе Лёвнер (С. Loewner), Math. Z. 38 A934), 177—216. См. также Добш (R. Dobsch), Math. Z. 43 A937), 353—388. В своей работе Лёвнер рассматривал задачу определения класса функций, для которых f(A)^-f(B), если Л «> В. Эти функции обладают тем свойством, что Re[/(z)]!X) всякий раз,, когда Re(z)>0. Они играют важную роль в современной тео- теории цепей; см., например, работы В а й к 6 е р г и С л е п я и (L Wei n berg and P Slepian), Positive Real Matrices, Hughes Research Laboratories. Culver City, Calif., 1955;
БИБЛИОГРАФИЯ И КОММЕНТАРИИ 139 Эфферц (F. Н. Effertz), On the Synthesis of Networks Containing Two Kinds of Elements, Proc. Symposium on Modern Network Synthesis, Po- Polytechnic Institute of Brooklyn, 1955, где дан прекрасный обзор полученных в этой области резуль- результатов, и Даффин (R. J. Duff in), Elementary Operations Which Generate Net- Network Matrices, Proc. Amer. Math. Soc. 6 A955), 335—339. Кроме того, эти функции имеют важное значение в некото- некоторых разделах современной физики. По этому поводу см. работы Лейн и Томас (А. М. Lane and R. G. Thomas), Я-matrix Theory of Nuclear Reactions, Revs. Mod. Physic 39 A958), 257—352 [русский перевод: Теория ядерных реакций при низких энергиях, ИЛ, I960]; Вигнер (Е. Wigner), On a Class of Analytic Functions from the Quantum Theory of Collisions, Ann. Math. 53 A951), 36—67. Дальнейшее рассмотрение этих вопросов содержится в бо- более поздней работе Лёвнер (С. Loewner), Some Classes of Functions Defined by Diffe- Difference or Differential Inequalities, Bull. Amer. Math. Soc. 56 A950), 308—319, и в статье Бендат и Шерман (J. Bendat and S. Sherman), Monotone and Convex Operator Functions, Trans. Amer. Math. Soc. 79 A955), 58—71. Здесь же рассматривается понятие выпуклой функции от матрицы, введенное Краусом в работе К р а у с (F. К г a u s), Math. Z. 41 A936), 18—42. § 10. Этот результат содержится в статье Беллман (R Bellman), Representation Theorems and Inequalities for Hermitian Matrices, Duke Math. J., 1959.
Глава 7 ВАРИАЦИОННОЕ ОПИСАНИЕ ХАРАКТЕРИСТИЧЕСКИХ ЧИСЕЛ § 1. Введение. В предыдущих главах мы имели возможность убедиться в том, что как наибольшее, так и наименьшее харак- характеристические числа имеют весьма простую геометрическую интерпретацию, отправляясь от которой, мы пришли к вариа- вариационной формулировке задачи нахождения этих чисел. Как мы увидим далее, те же самые геометрические сообра- соображения приводят к соответствующим -вариационным задачам для остальных характеристических чисел. Однако упомянутый ва- вариационный подход значительно уступает как в эффективности^ так и в красоте другому подходу, которому мы обязаны Р. Ку- Куранту и Э. Фишеру. Оба упомянутых подхода опираются на каноническую форму, полученную в гл. 4. Используя подход Куранта и Фишера, мы выведем ряд ин- интересных свойств симметрических матриц. § 2. Отношение Релея. Как мы знаем, значения, принимаемые квадратичной формой (х,Ах) на сфере (дс, дс) = 1, совпадают со значениями, принимаемыми квадратичной формой (у, Ау) = = А,г/2 + К2у\ + . .. + bNy% на сфере (y,y) = h где Л = Т'АТ, у = Тх, а матрица Т ортогональная. В дальнейшем мы будем предполагать, что Ai>A2>...>Ajv. A) Учитывая это условие, легко убедиться в справедливости не- неравенств (у, (у, из которых сразу же получаем представления для . Ах) (у, у) х (х, х)
¦§ 3] ВАРИАЦИОННЫЕ СВОЙСТВА ХАРАКТЕРИСТИЧЕСКИХ ЧИСЕЛ Отношение часто называют отношением Релея. Из выражений C) следует, что при всех х справедливы не- неравенства Соотношения такого типа очень важны в приложениях, когда требуется быстро оценить характеристические числа. Замеча- Замечательно, что простой выбор значений координат xi часто дает весьма точные приближения для к\ и Xn- Это обстоятельство способствовало успеху многих важных результатов теоретиче- теоретической физики. Интерес к характеристическим числам (и в меньшей степени к собственным векторам) вызван тем, что во многих приклад- прикладных вопросах физики Я,- представляют собой собственные ча- частоты. Более общо можно сказать, что в приложениях Я,- яв- являются наблюдаемыми величинами, с помощью которых можно провести сравнение теоретических выводов с экспериментом. Вопросы этого характера будут детально рассматриваться в отдельной книге настоящей серии, посвященной вычислитель- вычислительным аспектам теории матриц; мы же лишь слегка коснемся их ниже в § 12. § 3. Вариационные свойства характеристических чисел. Начнем наше рассмотрение вариационных свойств с доказательства сле- следующей теоремы: Теорема 1. Пусть х{— набор из N собственных векторов, соответствующих характеристическим числам Я». Тогда при *=1, 2, .... N ЯА = тах(дг, Ax)j{x, х), A) Ч где Rh — область х-пространства, определяемая соотношениями ортогональности (ж,ж*)=0, t=l, 2, ..., k— 1, хфв. B) Геометрический смысл этого результата ясен. Для того что- чтобы определить, например, вторую по величине полуось эллип- эллипсоида, нужно найти максимальное расстояние от начала коор- координат в плоскости, перпендикулярной наибольшей полуоси, до поверхности эллипсоида.
J42 ВАРИАЦИОННОЕ ОПИСАНИЕ ХАРАКТЕРИСТИЧЕСКИХ ЧИСЕЛ [ГЛ. 7 Докажем формулу (I) аналитически. Представим вектор х в виде N х = 2 «*•**• (з) Тогда лг (х, Ах) = 2 V*> , D) (лг, х) = 2 и|- Соотношение A) для Я,1 совпадает с результатом, установлен- установленным в § 2. Рассмотрим выражение для Х^. Условие (х, де1) = О равносильно условию щ—Q. Ясно поэтому, что максимум вы* N N ражения 2 h.u2. при условии 2 и? = 1 равен /L. Точно таким же образом легко установить справедливость A) для всех остальных k. § 4. Обсуждение. Как хорошо известно из физики, увеличение жесткости стержня или пружины приводит к увеличению всех собственных частот. Аналитический эквивалент этого явления состоит в следующем: характеристические числа суммы А + В равномерно больше характеристических чисел матрицы А, если матрица В положительно определенная. Легко показать справедливость этого утверждения для Ai и Xn- Используя очевидные обозначения, имеем i ^ ' = m"x TZ—~v\ шах —г———г—i—г———— ^ A) + XN{B). A) Поскольку по предположению XN(B)>d, мы видим, что К\(А + В)>К\(А), если матрица В положительно определенная. Доказательство того, что KN(A + B)>XN(A), проводится анало- аналогично. Если, однако, попытаться подобным же образом провести доказательство для характеристических чисел Х2, Х3, ..., XN-u то мы столкнемся с тем в данном случае неприятным обстоя- обстоятельством, что вариационное описание характеристических чи- чисел в теореме 1 индуктивно. В формулу для Яг входит собственный вектор д:1 и т. д. Кроме того, как мы уже отмечлчи выше, в многочисленных технических и физических исследованиях мы в первую очередь
$6) : ТЕОРЕМА КУРАНТА - ФИШЕРА 14S интересуемся характеристическими числами, представляющими резонансные частоты. Собственные векторы имеют лишь второ- второстепенное значение. По этим причинам мы зададимся целью—¦¦ получить представление для Xh, не зависящее от других харак- характеристических чисел и соответствующих им собственных век- векторов. Упражнения 1. Показать, что Л« (А + В) ~^\ц (А) +л« (В), если матрицы А и В по- положительно определенные *). 2. Пусть матрица В неотрицательно определенная. Всегда ли в этом слу- случае \N(A + B) больше, чем k(A)? § 5. Геометрические предпосылки. Для того чтобы увидеть, как это сделать, проведем через начало координат плоскость, пере- пересекающую эллипсоид х2/а2 + у21Ь2 + г2/с2 = 1. В сечении получим эллипс, имеющий большую и малую полуоси. Если вращать секущую плоскость до тех пор, пока большая полуось примет свое наименьшее значение, то тем самым мы найдем вторую по величине полуось эллипсоида. Аналитическая реализация только что приведенного построе- построения даст нам желаемое представление. Обоснование этого замечательного результата весьма про- просто; заслуга же Куранта и Фишера (как и всегда в тех слу- случаях, когда доказательство несложно) состоит в обнаружении самого факта. § 6. Теорема Куранта — Фишера о минимаксном представле- представлении характеристических чисел. Справедлива следующая Теорема 2. Характеристические числа Х{, 1 = 1, 2, ..., Nr можно определить следующим образом: A,j = max (л, АхI(х, х), Х2 = min max (х, Ах) '(х, х), (y,jr) = l (х у) = 0 A) Яд, = min max (х, АхI(х, л), iy'1 y')=i Usf'i-9 (=1.2, .... k - I *) Это соотношение справедливо для любых эрмитивых матриц. {Прим. ред.)
144 ВАРИАЦИОННОЕ ОПИСАНИЕ ХАРАКТЕРИСТИЧЕСКИХ ЧИСЕЛ [ГЛ. 7 Возможно также другое определение, эквивалентное предыду- предыдущему, именно: XN = min (х, Ax)l(x, х), X Яд,_, = max min (x, Ax)j(x, x), (У,У) = 1 (х,У)=0 %N-k= max min (x, Ax)l(x, x), B) / = 1,2, ...к Доказательство. Рассмотрим характеристическое чис- число %2- Определим величину |х2 = min max (x, Ax)j{x, х). C) (У,У) = 1 {х,У)=0 Мы начнем с выполнения ортогонального преобразования x = Tz, которое приводит А к диагональному виду. Тогда ц2= min max = min max \ 2j V*/^ z\\. D) Полагая T'y = y\ имеем ( N N -I ц2 = min max \ 2^ft2y2^|. E) Так как (Г^1, Tyl) = (y\ у1), то мы можем написать |д,2= min max \ 2 ^2^/ 2 z^ [. F) Другими словами, достаточно провести доказательство для случая диагональной матрицы А. Вместо того чтобы максимизировать по всем z, будем искать максимум по подобласти, определенной следующим образом: S:z3 = z4= ... =zN = Q и (z,y)=0. G) Так как S является лишь частью совокупности всех векторов z, удовлетворяющих соотношению (z, у) =0, то min max \Klz2 + lk2z\jz2 + z2]. (8) (У.У)=х s
§6] ТЕОРЕМА КУРАНТА — ФИШЕРА 145 Так как далее (%{г\ + ^ + г|)^Л2 при всех z\ и z2, то, следовательно, мы установили, что |Л2^Я,2. Покажем теперь, что \Х2 *С Я,2. Для этого в области, определенной соотношением (У, iO = l. выделим совокупность, состоящую из одного вектора с i/i = l. Такой выбор вектора у приводит к тому, что первая ком- компонента Zx вектора z должна быть равна нулю. Поскольку мини- минимум по подмножеству всегда больше минимума по множеству, содержащему в себе это подмножество, или равен ему, мы имеем ^2 < max { (Я,,*? + %2z\ +...+ V&)/B? + г*+...+ г%)} < Следовательно, jj,2=^2- Воспользуемся теперь тем же самым приемом для того, что- чтобы установить этот результат для общего случая. Рассмотрим величину \ik= min max (х, Ах)/(х, х) = г=1,2 ft-i = min max 1 = 1, 2, . ..,'ft-l Будем искать максимум по подобласти N 2 ft=i S: zk+i = Легко видеть, что = ...== zN = 0 и {z, yl) = \ mm max *•='), 2 k-l ft' A0) A1) A2) так как 2j ^jz]j 2j z{^^k для всех z- Для того чтобы показать, что jj,h -^ Xh, рассмотрим миними- минимизацию по совокупности, состоящей из (к—1) векторов 0 1 0 0 0 , *2= 0 1 0 0 10 Р. Беллман
146 ВАРИАЦИОННОЕ' ОПИСАНИЕ ХАРАКТЕРИСТИЧЕСКИХ ЧИСЕЛ [ГЛ. ? Условия1 ортогональности (yi,z)=0 эквивалентны в этом слу- случае равенствам 2i=22= ... =2^,=0. A4) Как и ранее, мы видим, что цл ^-А*, а следовательно, \Xk = Xk- § 7. Монотонное поведение ки (А). Представление характери- характеристических чисел Xh, данное в теореме 2, делает очевидным сле- следующий результат. Теорема 3. Пусть А и В — симметрические матрицы, при- причем матрица В неотрицательно определенная. Тогда %h(A + B)>Xh(A), k=l,2,...,N. (I) Если матрица В положительно определенная, то '.. .' : . Xh{A + B)>Xk{A), k=l, 2, .... N: B) Упражнение 1. Найти оценку снизу для разности %ь(А+В)—Я/г(Л). § 8. Теорема отделения Штурма. Теорема 2 позволяет также доказать^ следующую теорему. Теорема 4. Рассмотрим последовательность симметриче- симметрических матриц Аг=\\ац\\, /,:/=1, 2 г, . A) где г= 1, й, ..., N. Пусть ik(Ar), k = \, 2, ...,/¦, обозначает k-e характеристи- характеристическое число матрицы Аг, где в соответствии с ранее принятым обозначением - h(Ar)>X2(Ar)>,..>K(Ar). B) Тогда Xk+1(Ai+iXxh(AiXXh(Ai+i). ¦ C) Доказательство. Мы лишь наметим доказательство, оставив читателю в качестве полезного упражнения дополнить его деталями. Мы докажем неравенства МЛ*+,ХМЛ,)<МЛ,+1). D) Имеем Я, (Л;) = max (x, Atx)l{x, x), (К) bi(AM) = max(x, AMx)l(x, х), X где х, фигурирующий в первом_ выражении, представляет собой j-мерный вектор, а х, фигурирующий во втором выражении,
% 10] ТЕОРЕМА ОТДЕЛЕНИЯ ПУАНКАРЕ 147 представляет собой (i + l)-мерный вектор. Рассматривая вариа- вариацию по множеству (i + 1)-мерных векторов с х с (i + 1)-й компо- компонентой, равной нулю, мы убеждаемся, что Х\ (Л,)-^ Х\ (Ai+\): Для того чтобы получить неравенство X2(Ai+l)-^,X[(Ai), мы вос- воспользуемся соотношениями F.2). Тогда Я, (Л,) = max min (х, AiX)j{x, x), (yk,yk)=\ U,/)=d ft~I,2. ....i-l ft-1,2, .... i-l M^+i) = max min (x, Auix)l(x, x). (yk yk)=i {x,yk)=o *=1,2, ..., i-l ft=i, 2, ..., i-l Все векторы, фигурирующие в выражении для X\(Ai), являются /'-мерными, тогда как в выражение для Xz(Ai+\) входят (i + 1)- мерные векторы. В последнем выражении рассмотрим только те векторы х, у которых (i+l)-я компонента равна нулю. Ясно, что для векторов х этого типа можно максимизацию вести только по таким векторам yk, у которых (г+1)-я компонента равна нулю. Следовательно, Лг(Л<+1)^ Х\ (Л<). § 9. Необходимое и достаточное условие положительной опре- определенности матрицы А. Используя предыдущий результат, мы можем получить другое доказательство того факта, что необхо- необходимым и достаточным условием положительной определенности матрицы Л является положительность всех ее главных миноров: \Лк\>0, k=\, 2, .... N. Как мы знаем, для того чтобы матрица Л была положительно определенной, необходимо и достаточно, чтобы Я,л(Л)>0, k = \ 2, ..., N. Если Л положительно определенная, а следова- следовательно, и Яй(Л)>0, то в силу доказанной теоремы отделения i Xh(Ai)>0, k=\, 2, ..., i. Таким образом, | А, | = Ц Xk (Л,) > 0. k=i С другой стороны, если определители \Ak\ положительны при всех k, то, в частности, при к = 1 мы имеем: X\(Ai)>0. По- Поскольку далее Xl(A2)>Xl(Ai)>X2(A2), A) то из условия |Л2|>0 вытекает, что Яг(Л2)>0. Индукцией уста-; навливаем, что Xh(Ai)>0, k=l, 2, ..., i, при t=l, 2, ..., N. Таким путем мы приходим к доказательству сформулированного утверждения. Детали доказательства мы опять оставляем чита- читателю в качестве, упражнения. § 10. Теорема отделения Пуанкаре. Установим теперь следую^ щий результат, полезный как для вычислительных, так и для аналитических целей. , „ ; 10*
148 ВАРИАЦИОННОЕ ОПИСАНИЕ ХАРАКТЕРИСТИЧЕСКИХ ЧИСЕЛ [ГЛ. ? Теорема 5. Пусть {yk}, k= 1, 2, ..., К, — набор из К орто- К гональных векторов, и пусть х = 2 "*#*> так чт0 (х, Ах)= 2 икщ(у', Ау1). A) k,i=\ Рассмотрим матрицу К = \\(ук, Ау')\\, k, 1=1, 2, .... К. B) у /=1,2,..., К, дг.у (Л), / = 0, 1, 2, ..., К ~ 1 - ( } Этот результат сразу же следует из теоремы 4. § 11. Теорема о представлении. Введем обозначение I А | ft = XxXn-I ¦ • ¦ ^N-h+l- ( 1 ) Докажем теперь следующую теорему. Теорема 6. Если матрица А положительно определенная, то к/2 ^А и B\ здесь интегрирование проводится по k-мерному линейному под- подпространству Rh N-мерного пространства R, объемными элемен- элементами которого служат dVh, а максимум берется по всем Rk. Доказательство. Легко видеть, что для доказательства достаточно взять (х, Ах) в виде \х\ + \х\ + ... +XNx2N. Сле- Следовательно, мы должны показать, что = тах ГИ*ч*1+х2*2+-+хд?*5г)</И*. C) Обозначим через Va(p) объем области, заданной соотноше- соотношениями V? + КХ1 + • • • + Vw < Р> D> (х, a') = 0, i=l,2,...,N-k, где векторы а* линейно независимы. Ясно, что \). E)
5 12] ПРИБЛИЖЕННЫЕ МЕТОДЫ 14<> Тогда j = Г е ir • ¦ • ~xn*n n*n , e')=0 (p) = о о Чтобы завершить доказательство, мы должны показать, что максимум объема Va(l) достигается тогда, когда соотношения (х, а') =0 сводятся к равенствам х4 = 0, х2=0, ..., хк=0. Это, однако, является следствием формулы для объема эллипсоида N 1 = 2 Я,.дг? и неравенств, содержащихся в теореме 5 *). i=N-k+\ § 12. Приближенные методы. Задача определения минимума функционала J и'2 dt на функциях, удовлетворяющих условиям J ч кч J- Ai =- о u(O) = u(t) = O, A6) является одной из тех, которые можно решать с помощью ме- методов вариационного исчисления**). Используя стандартную- процедуру, мы приходим к задаче Штурма — Лиувилля: требуется найти те значения параметра X, при которых урав- уравнение u"+Xq{t)u = 0, u@)=u(l)=0, , B) имеет нетривиальное решение. Поскольку в общем случае решения этого уравнения не мо- могут быть выражены через элементарные функции, мы выну- вынуждены прибегать к различным приближенным методам. Вместо того чтобы рассматривать точное вариационное урав- уравнение B) и использовать приближенный метод для его решения, *) Поскольку объем fc-мерной сферы радиуса единица равен — + II (см., например, Д. К. Фаддеев и И. С. Соминский, Сборник задач по высшей алгебре, «Наука». 1968, стр. 289), то правая часть- F) равна ;—гтг, гдеЯ!^Я2^ ... ^Яд — собственные значения, (AiA2 • • • Aft) матрицы Ak = \](ya, Ау')\\, s, t=l, 2, ..., k, а у" образуют ортонормирован- ный базис в Rh. (Прим. ред.) **) Следует предположить q(x)>0. (Прим. ред.)
150 ВАРИАЦИОННОЕ ОПИСАНИЕ ХАРАКТЕРИСТИЧЕСКИХ ЧИСЕЛ [ГЛ. Г мы всегда можем заменить исходную вариационную задачу приближенной вариационной задачей, а затем применить точ- точный метод для решения этой новой задачи. Опишем один из таких путей. Пусть {Ui(t)} — последовательность линейно независимых на отрезке [0, 1] функций, удовлетворяющих условиям A6), т.е. ы, @) =ы,A) =0. Мы попытаемся найти приближенное решение исходной вариационной задачи в виде N S @- (з) Задача, которая теперь стоит перед нами, конечномерная; в нее входят неизвестные хи х2, . ¦ ¦ , xN. Нам нужно минимизи- минимизировать квадратичную форму N 1 J] x.x.^u'^u'^dt D) при условии N 1 2 xlXj J q(t)ut(t)Uj(t)dt=l. E) i. /=1 0 Ясно, что мы получим существенные упрощения, если выбе- выберем последовательность {«t@} такой, что 1 1 \u't(t)u] (t)dt = 6tl, либо J q{t)u.{t) u.(t)dt = 6ir F) о о Первому условию обычно легче удовлетворить. Так, например, мы можем взять и'к (t) = sin nkt, G) нормированную соответствующим образом, или «?@ = />*('). (8) где Ph(t) —fe-й полином Лежандра, опять же подходящим об- образом нормированный. Последний из указанных вариантов осо- особенно удобен, если q(t) является полиномом по t, так как инге- 1 гралы вида j tkut(t)Uj(t) dt легко вычисляются, если Ui(t) за- о даны формулой (8). Описанная процедура сопряжена с целым рядом интересных л важных проблем. Первостепенное значение имеет вопрос о схо-
УПРАЖНЕНИЯ К ГЛ. 7 ¦ -. . . ^ димости решения конечномерной задачи к решению исходной задачи. Кроме того, представляет интерес скорость сходимости (во- (вопрос большой практической важности), а также характер схо- сходимости: является ли она монотонной, колебательной и т. д. Здесь, однако, мы не будем углубляться в эти вопросы. Упражнение 1. Пусть X\N\ X2N\ ••¦> ^n^ ~ характеристические числа, возникающие в задаче, постановка которой описывается формулами D) и E) при Л' = 2„ 3, ... Какие неравенства связывают Л^ ' и Х^~ '? Упражнения к гл. 7 1. Пусть А и В — эрмитовы матрицы, характеристические числа которых соответственно равны \\~^\г~^-- : ц^Цг^й. .., И пусть Vi^v^^... — ха- характеристические имела А + В. Показать, что X,- + ^j^vt-t-j-; для i+ji^N+l*).. (Вейль.) 2. Приведением А к диагональной форме дать индуктивное доказатель- доказательство теоремы отделения Пуанкаре (см. теорему 5 настоящей главы). 3. В чем состоит необходимое и достаточное условие того, что апх\ + 2апх\Х2 + апх\^ Q при всех х\, х2>0? 4. Указать необходимое и достаточное условие, при котором з 2 aijXiXj ^ 0 для всех х\, х?, дг35г0? './ = 1 /V 5. Можно in получить соответствующие условия для V иц"(Хр 6. Показать, что — положительно определенная матрица для л>0, если a,j^O, и матрица y4 = ||afj|| является положительно определенной. 7. Справедливо ли предыдущее утверждение для ЗХЗ-матриц? 8. Доказать, что если а,,>0 и матрица || |Oij| II положительно определен- определенная, то матрица \\ац\\ не обязательно положительно определенная. 9. Показать, что характеристические числа матрипы АЧ2ВАЧ2 меньше ха- характеристических чисел матрицы А, если В — симметрическая матрица, все собственные значения которой расположены между 0 и 1, а матрица Л по- положительно определенная. 10. Справедливо ли неравенство (Тх, Ах) ^ (х, Ах) для всех действитель- действительных х, если А — положительно определенная матрица, а 7" — ортогональная матрица? 11. Определим ранг симметрической матрицы как разность между ее по- порядком и числом нулевых собственных значений. Используя результаты этой: *) См. Ф. Рисе и Б. Секефальви Н а д ь, Лекции по функциональ- функциональному анализу, ИЛ, 1954, гл. VI, § 1. (Прим. ред.)
152 ВАРИАЦИОННОЕ ОПИСАНИЕ ХАРАКТЕРИСТИЧЕСКИХ ЧИСЕЛ [ГЛ. Г тлавы, показать эквивалентность этого определения и определения, данного в приложении А. 12. Предположим, что мы имеем некоторое семейство (Л(д)} действи- действительных симметрических матриц, зависящих от параметра q, скалярного или векторного. Мы хотим определить максимальное характеристическое число каждой матрицы, которое обозначим через /(<?), а затем найти максимум по q этой функции. Мы поступим следующим образом. Вь:.1ерем некоторое начальное значение параметра q, скажем <?о, и пусть х° — собственный век- вектор, принадлежащий характеристическому числу f(qo). Следующее значение параметра мы выберем, максимизируя выражение (х°< A(q)x°)j(x:>, x°) повеем значениям q. Обозначим одно из значений параметра, дающее максимум, че- через q\. Пусть хх—собственный вектор, принадлежащий характеристическому числу f(qi). Продолжая таким образом, мы получим последовательность f(<?o), f(<?i), • •• Показать, что 13. Показать на примере, что описанная процедура не всегда позволяет ¦получить maxf(q). ч 14. При каких условиях, наложенных на матрицу A(q), мы можем га- гарантировать достижение абсолютного максимума? 15. Определим спектральный радиус г(А) квадратной матрицы А как наибольший из модулей ее характеристических чисел. Пусть Н—положи- Н—положительно определенная эрмитова матрица, и пусть g(A, Н) = тах[(Лж, НАх)[(х, X Показать, что r(A) =min g(A, H). н 16. Показать, что если матрица А действительная, то r(A) = min g(A, S), s тде теперь минимум берется по всем действительным симметрическим матри- матрицам. [Осборн (Н. Osborn), The Existence of Conservations Laws, Ann. of Math., в печати.]. Библиография и комментарий § 1. Р. Курант обобщил минимаксное представление на слу- случай дифференциальных операторов с частными производными. Это обобщение легло в основу современной теории собственных значений операторов. Обсуждение этих вопросов можно найти в монографии Курант, Гильберт (R. Courant, D. Hilbert), Methods of Ma- Mathematical Physics, New York, Interscience Publishers, 1953. [Русский перевод второго немецкого издания: Методы математической физики, т. I, II, Гостех- издат, 1951; см. также перевод американского издания 1961 г.: Курант, Уравнения с частными производными, «Мир», 1964.] § 2. Отношение Релея позволяет весьма просто получать верхние границы для наименьшего характеристического числа. Задача нахождения нижних границ связана со значительно большими трудностями. А. Вайнштейн развил сильный метод для случая более общих операторов; этот метод обобщили
БИБЛИОГРАФИЯ И КОММЕНТАРИЙ 15$ Н. Ароншайн и др. Изложение и дальнейшие ссылки имеются в статье Диас (J. В. Diaz), Upper and Lower Bounds for Eigenvalues, Calculus of Variations and Its Applications, L. M. Graves (ed.), McGraw-Hill Book Company, Inc., New York, 1958. См. также работу Темпл и Бикли (G. Temple and W. G. Bickley), Rayleigh's Prin- Principle and Its Applications to Ingineering, Oxford, 1933. Задача определения интервалов, внутри которых могут или, напротив, не могут лежать характеристические числа, имеет важное значение. См. работы К а то (Т. Kato), On the Upper and Lower Bounds of Eigenvalues, J. Phys. Soc. Japan 4 A949), 334—339; Бейтмен (H. Baleman), Trans. Cambridge Phil. Soc. 20 A908), 371—382; Темпл (G. Temple), An Elementary Proof of Kato's Lemma, Matema- tika 2 A955), 39—41. § 6. См. цитированную выше монографию Куранта и Гиль- Гильберта, а также Фишер (Е. Fisher), Uber quadratishe Formen mit reelen Koeffizien- ten, Monatsh. Math. u. Physik 16 A905), 234—249. Обсуждение и некоторые приложения можно найти в статье Пой a (G. Pol у a), Estimates for Eigenvalues, Studies in Mathematics and Mechanics, presented to R. Von Mises, Academic Press, Inc. New York, 1954. Получены существенные обобщения этого результата. Неко- Некоторые из них, принадлежащие Фань Цзы, приведены в гл. 7, §§ 10, 11 и 13. См. Фань Цзы (К у Fan), On a Theorem of Weyl Concerning Eigenva- Eigenvalues of Linear Transformations, I, Proc. Nat. Acad. Sci. U.S.A. 35 A955), 652—655. Другие обобщения получены Виландтом: Виландт (Н. Wielandt), An Extremum Property of Sums of Eigen- Eigenvalues, Proc. Arner. Math. Soc. 6 A955), 106—110*). См. далее Амир Моэз (АН R. Amir-Moez), Extreme Properties of Eigenvalues of a Hermitian Transformations and Singular Values of the Sum and Product of a Linear Transformation, Duke Math. J. 23 A956), 463—477; *) См. также А. С. Маркус, Собственные и сингулярные числа суммы и произведения линейных операторов, УМН 19, № 4 A18) A965), и Ф. Р. Г а н т м а х е р, Теория матриц, «Наука», 1967, Добавление. (Прим. ред.)
154 ВАРИАЦИОННОЕ ОПИСАНИЕ ХАРАКТЕРИСТИЧЕСКИХ ЧИСЕЛ [ГЛ. 7 Маркус и Томпсон (М. Marcus and R. Thompson), A Note on Symmetric Functions of Eigenvalues, Duke Math. J. 24 A957), 43—46; Маркус (М. Marcus), Convex Functions of Quadratic Forms, Duke Math. J. 24 A957), 321—325. § 8. Результаты этого типа можно получить классическим методом Штурма. См. книгу Бернсайд и Пэнтон (W S Burnside and A. W. Pan ton), Theory of Equations, vol. II, Longmans, Green & Co., New York, 1928. § 10. Пуанкаре (Н. Poinca re), Sur les equations aux derivees partielles de la physique mathematique, Amer. J. Math. 12 A890), 211—294. § П. Беллман, Гликсберг и Гросс (R. Bellman, I. Qlicksberg .and O. Gross), Notes on Matrix Theory—IV, Amer. Math. Monthly 62 A955), 571—572. § 12. Детальное изложение вычислительных методов этого типа содержится в книге Коллатц (L. Coliatz), Eigenwertproblemen ind ihre numerische Be- handlung, New York, 1948 [русский перевод: Задачи на собственные значения, «Мир», 1968]. Упомянем, наконец, монографию Пароди (М. Parodi), Sur quelques proprietes valeurs characteristi- ques des matrices carrees, fascicule CXVIL, Mem. sci. mathem. 1952. [См. также M. Пароди, Локализация характеристических чисел матриц и ее примене- применения, ИЛ, I960.] Задача нахождения соответствующего вариационного опи- описания характеристических чисел комплексных матриц, возни- возникающих при исследовании линейных диссипативных систем, чрезвычайно трудна. Некоторые шаги в этом направлении опи- описаны в статье Даффин (R. J. Duff in), A Minimax Theory for Overdamped Net- Networks, J. Rat. Mech. Analysis 4 A955), 221—233. См. также результаты Дольфа и др., на которые мы ссыла- ссылались выше.
Г л а в а 8 НЕРАВЕНСТВА § 1. Введение. В этой главе мы установи-м ряд интересных неравенств, касающихся характеристических чисел и детерми- детерминантов симметрических матриц. Нашими основными орудиями будут интегральное тождество оо оо -N12 С Г Т7^= J ••• lr».**dx, A) справедливое для положительно определенных матриц, его обобщение, данное в теореме 6 гл. 7, а также некоторые обоб- обобщения минимаксного представления Куранта — Фишера, при- принадлежащие Фань Цзы. Прежде чем вывести некоторые неравенства, непосредственно относящиеся к матрицам, мы установим стандартные неравен- неравенства Коши—Шварца и Гёльдера. Далее мы докажем неравен- неравенство о среднем арифметическом и среднем геометрическом, так как оно понадобится нам для одного из результатов этой главы. § 2. Неравенство Коши — Шварца. Первый результат, который мы установим, уже встречался в упражнениях. Однако он впол- вполне заслуживает того, чтобы сформулировать его еще раз. Теорема 1. Для любых двух действительных векторов х и у имеет место неравенство {х,у)*<(х,х)(у,у). A) Доказательство. Рассмотрим квадратичную форму по переменным и и v Q(u, v) = (ux + vy, ux + vy) = u2(x, x)+2uv(x, y)+v2(y, y). B) Поскольку форма Q(u, v), очевидно, неотрицательна, то нера- неравенство A) выполняется с необходимостью. Заметим, что нера- неравенство A) является хотя и частным, но наиболее важным слу- случаем неотрицательности определителя Грама, установленного в § 4 гл. 4.
156 НЕРАВЕНСТВА [ГЛ. 8 § 3. Интегральный вариант. Точно таким же образом можно установить интегральный аналог предыдущего неравенства. Теорема 2. Пусть f(x) и g(x)—функции аргумента х, определенные на некоторой области R. Тогда A) ,R I \R I \R Доказательство. Так как (f±gJ^- 0, то мы имеем 2'lfg\<f2+gi. B) Следовательно, произведение fg интегрируемо, если интегри- интегрируемы /2 и g2. Рассмотрим теперь интеграл gvfdV, C) который в силу предыдущего неравенства существует. Относи- Относительно и и v интеграл C) представляет собой неотрицательна определенную квадратичную форму. Следовательно, как и выше, имеет место A). Упражнения 1. Можно также поступить так: <х, дс) (у, у) - (х, уJ = (у, у) [(х, х) - 2 (^ у* + ^~уу] = 2. Доказать, что 2 % <П 2 ^ft*l)( 2*1/^*]' если числа Xft по- \ft-i / \ft=i /\ft-i / ложительны. 3. Показать, используя предыдущий результат, что (х. Ах) (у, А'1у) !> ^3= (х, уJ, где матрица А положительно определенная. Установить этот ре- результат, не опираясь на диагональную форму. § 4. Неравенство Гёльдера. Следующая теорема обобщает не- неравенство A) § 2. Теорема 3. Пусть р>\ и q=p/(p—1); тогда yip j для всех Xh, Уь. ^ 9. Доказательство. Рассмотрим кривую ' v = up-\ B) гдер>1.
¦§ 4] НЕРАВЕНСТВО ГЕЛЬДЕРА 157 Ясно, что площадь прямоугольника OvRu меньше или равна сумме площадей ОРи и OQv: и и C) причем равенство выполняется только в том случае, если v =ы*>~1. Следовательно, если и, v~^- О, р > 1, то имеет место не- неравенство uv^ + ^. D) Р Я Теперь, последовательно палагая N \\1р I/ N \Uq и = х. E) Рис. 2. й=1, 2, .... N, и суммируя по k, мы приходим к следующему результату: N N N 1 k=l N \l/p / N \llq 2) Si Так как 1/р + 1/д=\, то получаем неравенство A). Полагая в D) „ / М „ _ g (х) о = мы имеем / (х) s (x) G) (8) (9) справедливое при условии, что f(x), g(x) >0 интергралы в пра- правой части существуют. f(x)PdV\"l\ g(x)"dV\ * j f(x)PdV q ^R I \R I R R Интегрируя по области R, получаем неравенство >dv<( [f(xrdv)l*( [ g{xYdvY<.
153 НЕРАВЕНСТВА [ГЛ. * § 5. Вогнутость | А |. Теперь мы выведем некоторые следствия из интегрального тождества A.1). Первым из них будет Теорема 4. Если матрицы А и В положительно опреде- определенные, то \КА+(\ — К)В\ > \А\ь\В\1~>- (]> при 0 < X < 1. Доказательство. Имеем ,Л//2 A-Я) В I 1/2 J • • • , ВХ) Используем теперь интегральную форму D.9) неравенства Гёль- дера, положив р= 1/л, ^ = 1/A — К) ¦ Тогда N12 < J... оо —оо -ЛЧ1-М/2 C) Этот результат после упрощений совпадает с A); в свою оче- очередь неравенство A) является частным случаем более общего результата, который мы выведем позже. Упражнения 1. Доказать что H + i'BI^HI, если матрица А положительно определен- определенная, а матрица В действительная, симметрическая. 2. Показать, что 1х+ A — р при х, (/>0, § 6. Одно полезное неравенство. Впоследствии мы восполь- воспользуемся результатом, который содержится в предлагаемой теореме: Теорема 5. Если матрица А положительно определен- определенная, то \А\ < ана22... aNN. A) Приведем два доказательства этой теоремы. Первое доказательство. \А\ можно представить в виде а,, Й22 ¦ • • O2.V а.М2 &NN 12 ... аш О а2\ aNl aN2 ... aNN B)
НЕРАВЕНСТВО АДАМАРА 159 Так как Л положительно определенная, то и' матрица' -i|a,-j||, i, 1 = 2, . .., N, тоже положительно определенная, следовательно^, квадратичная форма по переменным пц, а^, . . . , aiN, каковой является второе слагаемое в правой части B), отрицательно определенная *). В силу этого Л|<а„ «22 • •'• aN2 ¦ . ¦ C) откуда, применяя индукцию, получаем доказываемый результат. Второе доказательство. Рассмотрим равенство A.1), положив в нем N = 3. Заменяя Xi на —xt и складывая, получаем J в- J ' — CO .Z ' где Так как z + z "У p lo 1 ¦_> IZ 1 ^2 для всех z ^ 0, то 2 2\ D) E) Ml! тде Л2 = ||а(-у||, i, / = 2, 3. Следовательно, 1 „ l'/2i л |'/2 -— i л il/2 т1/2 11/2' F) G) откуда следующим шагом получаем искомый результат для N— 2). Для произвольного N доказательство проводится анало- аналогичным образом. Упражнение 1. Пусть Di = \aij\, i, /=i, 2, ..., m, D2=|atj|, i, Dr = \aij\,i,j = nr-l+\ N. Тогда HKDift ... Dr. , ...,n2, ... § 7. Неравенство Адамара. Наиболее известное из детерминант- ных неравенств принадлежит Адамару. *) См. § 6|.гл. 5 настоящей книги. (Прим, ред.)
160 НЕРАВЕНСТВА [ГЛ. 8 Теорема 6. Пусть В — произвольная невырожденная дей- действительная квадратная матрица. Тогда (О Для доказательства следует применить теорему 5 к положи- положительно определенной квадратной матрице А = ВВ'. § 8. Вогнутость произведения XNXN-i ... А*. Определим функ- функцию \А\ь элементов матрицы А формулой \A\h = lNlN^...Kh. A) Можно доказать следующую теорему: Теорема 7. Если матрицы А и В положительно определен- определенные, то при 0<К1, k=\, 2, . . ., N, \XA + {\-X)B\k>\A\\\B\^. B) Доказательство следует из теоремы 6 гл. 7 в точности тем же путем, которым была получена теорема 4 из соотноше- соотношения A.1). Упражнения 1. Показать, что Ф« (А) = iAL = min (•*. Ах), \Ai\ х где х удовлетворяет условию *j = l, a At — матрица, получающаяся из мат- матрицы А после вычеркивания г'-й строки и 1-го столбца *). 2. Отправляясь от результата предыдущего упражнения, показать, что при условии /1>0 и В>0 справедливо неравенство Ф« [ХА+ A - Я)Д]>ф| (Л)Ч/ (ВH"", О^Х.^1. (Неравенство Бергстрома.) 3. Пусть А и В — две положительно определенные матрицы порядка W, и пусть С=Ы+A—Я)Д, 0<^<1. Пусть А', /=1, 2, ...,N, обозначает подматрицу матрицы А, получаемую вычеркиванием первых (/—1) строк и столбцов. Если ku кг, ..., kN представляют собой N положительных чисел N тг.ких, что 2 ^ i^ 0, то П I Cl f' > П I Al |U/lfi/ J№/- (Фань Цзы.) 4. Доказать неравенство Адамара для эрмитовых матриц. *) Матрица А предполагается положительно определенной. (Прим. ред.)
§ 9] АДДИТИВНЫЕ НЕРАВЕНСТВА 161 5. Если А — положительно определечная матрица размера NXN и Рь обозначает произведение всех главных миноров 6-го порядка матрицы А, то Р1>РгиС"-1>Р>'С"-1>...>Р11С "¦*>?„. (Сас.) См. работу Мирского1). § 9. Аддитивные неравенства, вытекающие из мультипликатив- мультипликативных. Сейчас мы приведем пример, иллюстрирующий математи- математический принцип, согласно которому каждое мультипликативное неравенство имеет аддитивный аналог. Применим теорему 7 к матрицам А = 1 + еХ, В = / + еУ, е > 0, <;) где X и Y — произвольные симметрические матрицы. Ее; и г до- достаточно мало, то А и В будут положительно определенными. Пусть Х\ > х-2 > . . . ^ x.v, f/i 5> у2 > .. . ^ yN — характеристи- характеристические числа матриц X и У соответственно и ^ > г2 >.. .>г,? — характеристические числа матрицы КХ+(\—X) Y. В этом слу- случае применение теоремы 7 дает A + ezN) A + zzN-i) ... (l+BZh)> >[(\+bxn)A+zxn-i) ... {l + exh)fx К B) Для членов первого порядка относительно е это соотношение дает Zff^+'... +zh) > + о(е2). C> Поскольку е произвольно мало, то 2^ + 2^-!+ . . . +Zh > X{XN+ . . . +Xh) +' + (\—X)(yN + yN-i+'...r+yh). D) Сформулируем этот результат, принадлежащий Фань Цзы, в следующей форме: Теорема 8. Пусть А — симметрическая матрица и Sh(A) =/W + >wv-i+ . .. +Xh. E) Тогда при 0 -^ Я -^ 1, ? = 1, 2, .. . , N имеем Sh[XA+(\- X)B]>KSh(A) + A - ВД (Я). F) Заменив Л на —Л, мы получим следующее утверждение: ') L. M i r s k у, On a Generalisation of Hadamard's Determinantal Ine- Inequality Due to Szasz, Arch. Math. 8 A957), 274—275. И Р. Беллман
162 НЕРАВЕНСТВА Теорема 9. Если где А — симметрическая матрица, то Th[lA+(l — [ГЛ. 8 G) (8) •§ 10. Другой путь. Получим эти результаты иным способом, который позволит нам попутно выявить некоторые свойства, представляющие самостоятельный интерес. Начнем с доказа- доказательства следующей теоремы: Теорема 10. Если матрица А положительно определен- определенная, то 1{К2 ... a,w_fc+, = тах!(г', Az>) |, A) R KN%N_{ ... Я* = min|(г', Аг')\, R где R — область, определенная соотношениями (г\г')=б«, *, /=1, 2, ..., N-k+l. B) Другими словами, минимум берется по всем совокупностям из N — k+l ортонормированных векторов. Доказательство. Рассмотрим определитель D2{x, y) = (х, Ах){х, Ау) (х, Ау){у, Ау) а=1 N N V N 2 C) ЛГ N где Х= 2 «а-**, У— 2" *** " *"* , a xk — собственные векторы ма- трицы А. Тождество Лагранжа дает N D2(x, y) = j t. / D) Члены с i — j сюда не входят, так как тогда utVj — UjVt = 0. Легко видеть, что E)
(Ill БОЛЕЕ ПРОСТОЕ ВЫРАЖЕНИЕ ДЛЯ '-лЛлГ-! ... *•* Следовательно, 163 лг 2л N N V 2 лг ЛГ N li Vi F) ИЛИ Это доказывает результат для й = Лгг—1. В общем случае сле- следует воспользоваться тождеством для определителя Грама, при- приведенным в § 5 гл. 4, а не тождеством Лагранжа *). Упражнение \. Используя теоремы 9 и 4, доказать теорему 7. § 11. Более простое выражение для ^лг^л,_1 Я.А. Так как опре- определитель является относительно сложной функцией, желательно получить представление более простое, чем установленное в тео- теореме 10. С этой целью мы докажем теорему 11. Теорема 11. Если матрица А является положительно определенной, то , Az') (г2, , A) где R определяется так же, как и в A0.2). Доказательство. Мы знаем, что из положительной определенности матрицы А вытекает положительная опреде- определенность матрицы (г», Azi), i, /=1, 2, ..., N — k+\. Тогда из теоремы 5 получаем \(z>, Следовательно, N-k+l П Az1). B) ЛГ-ft+l min|(«', Ar'JKmln П R П «*. Az1). C) *) По существу автор предлагает новое доказательство соотношений A), поскольку они прямо следуют из теоремы 5 гл, 7 (стр. 148). (Прим. ред.) 11'
164 НЕРАВЕНСТВА [ГЛ. 8 Выбирая zl = x\ i = N, N—l, ..., N — k+l, мы видим, что N-k+l min П (*', AZ1) < *,„*„_, ...Kk. D) R i = i Этот результат совместно с теоремой 10 дает теорему 11. Упражнения 1. Используя предыдущий результат, доказать теорему 7. 2. Рассмотреть случай k—N и с помощью специального выбора z1 по- показать, что 3. В общем случае показать, что 4. Показать, что min Sp (AB)JN = \A\llN, где минимум берется по всем В, В удовлетворяющим условиям 5>0, |В| = 1, а матрица А положительно опре- определенная. 5. Отправляясь от результата предыдущего упражнения, показать, что \A+B\llN^\A\xlN + \B\4N, если матрицы А к В положительно определенные. (А. Минковский.) § 12. Неравенство между средним арифметическим и средним геометрическим. В дальнейшем нам понадобится фундаменталь- фундаментальное неравенство, касающееся среднего арифметического и сред- среднего геометрического. Теорема 12. Если х{ ~2" 0, то N 2j xtjN^ (XiX2 ... xN)UN. (II Доказательство. Хотя этот результат можно легко установить методами анализа, мы приведем доказательство, близкое по духу тем методам, на которые мы опирались до сих пор *). Отправляясь от неравенства (а[/2 — а''2J^ 0, или, что то же, "' 2 ^(а1а2)'/2. B) положим Б результате, принимая во внимание B), получаем D) ') Это доказательство принадлежит Коши,
5 13] МУЛЬТИПЛИКАТИВНЫЕ НЕРАВЕНСТВА 165 Продолжая таким образом, убеждаемся, что A) справедливо для N = 2k, k—l, 2, ... Чтобы закончить доказательство, мы воспользуемся обратной индукцией и покажем, что неравенство A) выполняется для N— 1, если оно справедливо для N. Для этого положим xl + х2+ ... + *w_, У\ = xi> Уг = Х2> • • • > Ум-i = xn-i> Уи = ТГ—Л ^ и воспользуемся неравенством A). В результате после не- несложных преобразований получаем то же неравенство для N— 1. Прослеживая этапы доказательства, мы видим, что равен- равенство имеет место только при Xi=x2= ... =xN. § 13. Мультипликативные неравенства, вытекающие из адди- аддитивных. Ранее мы показали, как вывести аддитивные неравен- неравенства из мультипликативных. Теперь мы покажем, как можно провести обратную дедукцию. Теорема 13. Из неравенства*) ( ) A) i=k i = k k= 1, 2, . . . , N, справедливого для любого ортонормированного набора векторов {**}, вытекает неравенство Ги-<П (¦*'. л А B) Доказательство. Рассмотрим сумму ... +АД,) + N)+ ... +(cN-cN_l)KN. C) Пусть N П 1. D) Тогда, используя A), получаем неравенство k {x\ Axk) + ck+l (xk+\ Axk«) + ... +cN (x", Ax»), E) *) Неравенство A) следует из теоремы 5 гл. 7, поскольку правая его часть равна сумме собственных значений матрицы BN-k+i — l\ (x't Ax^)\\, i, j = k, k + l N. (Прим. ред.)
166 НЕРАВЕНСТВА [ГЛ S выполняющееся для любого ортонормированного набора векто- векторов {ж1} и скалярных констант, удовлетворяющих D). Из по- последнего неравенства получаем min ( 2 сМ < min 2 ct (•*'. Ах1) , F) R \i = k I R L« = ft J где R — множество в с-пространстве, определяемое соотноше- соотношениями D). Из теоремы 12 следует, что ctK, >(ckck+i ... c = (Цы...^)да-Ы), G) причем равенство имеет место только тогда, когда все А,сг- рав- равны между собой. С учетом второго условия D) мы приходим к заключению, что а = (xAxk+i... V) 1/<лг-"+-»А<. (8) Поскольку из неравенства Xh ^ Xh+i *> ¦ ¦ ¦ ^A,jv>0 следует, что набор (8) принадлежит множеству /?, то при указанных с,- до- достигается минимум в левой части F). Предположим временно, что ортонормированные векторь -,\ } удовлетворяют условию (хк,АхкХ(ж*+1,Ах*+1)<...<{х",Ах1Г). (9) Тогда, рассуждая аналогично, мы придем к заключению, что правая часть F) равна _ ((x\Axh)(xh+l,Axh+l)...(x",AxN)) "-*+! и, следовательно, k .(х»,Ах"). A0) Ясно, однако, что любой набор векторов {*'} можно упорядочить таким образом, чтобы выполнялись неравенства (9). Следова- Следовательно, A0) справедливо для всех ортонормированных {х1}. Упражнения к гл. 8 1. Пусть п(А) = ( У\\ ац |2\1/2. Показать, что \U I N \1/2 / N \]/2 SJ
УПРАЖНЕНИЯ К ГЛ. 8 167 тде m — максимальная кратность любого характеристического числа ма- матриц А *). (Гочи.) 2. Если Xt, Ц/, V; — занумерованные, как обычно, характеристические числа соответственно матриц А*А, В*В и (А + В)* (А + В), то ;i>i] >2 N' (фаньЦзы-> i=\ < = l i=l При тех же предположениях имеет место неравенство (I/2|/2 }/2 (ФаньЦзы.) 3. Если H—A + iB— эрмитова матрица**), то для того, чтобы Н была положительно определенной, необходимо и достаточно, чтобы характеристи- характеристические числа матрицы iA~lB были действительны и не превосходили единицы по модулю. (Робертсон — О. Таусски.) 4. Если Н = А-{1В — положительно определенная матрица, где матрицы А и В действительные, то И|^[Я|, причем равенство имеет место тогда и только тогда, когда В — О. (О. Таусски.) 5. Если Hi—положительно определенная эрмитова матрица, а #2—¦ эрмитова матрица, то Н\ + Н2 положительно определенная тогда и только тогда, когда все характеристические числа матрицы Щ1Н2 больше —1. (Фань Цзы — О. Таусски.) 6. Пусть Ki — положительно определенная матрица и Кг — такая матри- матрица, что матрица К\К-> эрмитова. Тогда К\Кг положительно определена в том и только в том случае, когда все характеристические числа Кг действитель- действительны и положительны. (Фань Цзы — О. Таусски.) 7. Если А и В — симметрические матрицы, то характеристические числа матрицы АВ—В А чисто мнимые. Показать далее, что Sp((/lZ?J)^Sp(y42B2). 8. Пусть А и В — две произвольные матрицы; показать, что квадрат абсолютной величины произвольного характеристического числа матрицы АВ больше или равен произведению минимального характеристического числа матрицы АА' на минимальное характеристическое число матрицы ВВ'. 9. Пусть Н = A + iB — положительно определенная эрмитова матрица; тогда И|>|В|. (Робергсон.) 10. Если А = В+С, где В — положительно определенная матрица, а С — кососимметрическая матрица, то И|^|Д|. (О. Таусски.) 11. Если А — симметрическая матрица, А и /—А — неотрицательно опре- определенные матрицы, а О — ортогональная матрица, то |/—AO\^\f—А\. (О. Та- Таусски.) 12. Доказать неравенство Шура1): Si^i*<siflvif- '=1 1.1 13. Пусть Л—симметрическая матрица, имеющая k нулевых характери- характеристических чисел. Тогда ЛГ N-k N N-k 2*1-2*,. 2*5-2*?. ( = 1 (-1 i = \ ( = ] *) Предполагается, что |А,,|>0 (/=1, 2, ..., N). (Прим. ред.) **) А и В — вещественные матрицы. (Прим. ред.) ') I. Schur, Math. Ann. 66 A909), 488—510.
168 НЕРАВЕНСТВА [ГЛ. <* где суммирование проводится по всем ненулевым характеристическим числам. Из неравенства Коши IN-k \2 /N-k 1 вывести неравенство 14. Воспользовавшись результатом предыдущего упражнения, показать, что ранг симметрической матрицы А больше или равен отношению (Sp4J/Sp(/12). 15. Получить аналогичные соотношения в терминах Sp(.4ft) для & = 1,2, 3, ... (Использованный нами прием впервые применил Шнирельман в связи с проблемой представления каждого целого числа в виде суммы не более чем фиксированного числа простых чисел.) 16. Пусть Aw — наименьшее, а к\ — наибольшее характеристическое число положительно определенной матрицы А. Тогда (Я, +А,.,J (х, хJ < (Ах, х) (Л-'х, х) < ' (х, хJ. 4X1XN Это частный случай более общего результата, полученного В. Гройбом и В. Райнболтом '). 17. Если матрица X положительно определенная, то X+X~l^2J. 18. Если матрица X положительно определенная, то существует един- единственная матрица У, положительно определенная и имеющая заранее задан- заданные диагональные элементы, которая минимизирует величину SplXY-1). 19. Эта матрица Y удовлетворяет уравнению вида X=Y\Y, где Л — диа- диагональная матрица с положительными элементами Xi. N 20. Минимальное значение величины Sp(XY~l) равно ^j^-jijjl- (П. Уиттл.) 21. Справедливо ли неравенство ВС + СВ^2В ''СВ^1, если В и С — по- положительно определенные матрицы? 22. Справедливо ли неравенство (А + В)[12С(А+В)Ч2^АЧгСАЧ2 + В1РСВЧ2, если А, В и С — положительно определенные матрицы? 23. Пусть А и В — матрицы размера NXN с комплексными элементами такие, что матрицы /—А*А и /—В*В неотрицательно определенные' тогда | / — А*В р > | / — А*А 11/ — 5*5 |. (Н u a, Ada Math. Sinica, 5 A955), 463—470. См. Math. Rev. 17 A956), 703.) Обобщения, опирающиеся на представление, полученное в § 10 гл. 6, можно найти в работе Беллман (R. Bellman), Representation Theorems and Inequalities for Hermitian Matrices, Duke Math. J., 1959, другие обобщения содержатся в работе Маркус (М. Marcus), On a Determinantal Inequality, Amer. Math. Monthly 65 A958), 266—268. ') В. Гройб и В. Райнболт (W. Greub and W. Rheinboldt), On a Generalization of an Inequality of L. V. Kantorovich, Proc. Amer. Math. Soc, 1959.
БИБЛИОГРАФИЯ И КОММЕНТАРИЙ 169 Библиография и комментарий § 1. Классическая книга X а р д и, Лиглвуд, П о й a (G. H. Hardy, J. E. L i 111 е w о о d, G. Pol у a), Inequalities, Cambridge University Press, New York, 1934. [Рус- [Русский перевод: Неравенства, ИЛ, 1948.] послужила началом современной теории неравенств, а также явилась стимулом для непрекращающегося большого интереса к этой области. Некоторые более поздние результаты, а также их различные применения излагаются в книге Беккенбах и Беллман (Е. F. Beckenbach and R. Bellman), Inequalities, Ergeb. Math. 1960. [Русский перевод: Неравенства, «Мир», 1965.] В этой книге содержится гораздо более обширный материал о неравенствах, связанных с матрицами и характеристическими числами. Основные результаты этой главы были получены в статьях Фань Цзы: ФаньЦзы (К у Fan), Some Inequalities Concerning Positive-definite Matrices, Proc. Cambridge Phil. Soc. 51 A955), 414—421; ФаньЦзы (К у Fan), On a Theorem of Weyl Concerning the Eigen- Eigenvalues of Linear Transformations, I, Proc. Nat. Acad. Sci. U. S. A. 35 A949), €52—655; Фань Цзы (К у Fan), On a Theorem of Weyl Concerning the Eigen- Eigenvalues of Linear Transformations, II, Proc. Nat. Acad. Sci, U S. A. 36 A950), 31—35; Фань Цзы (К у Fan), Maximum Properties and Inequalities for the Eigenvalues of Completely Continuous Operators, Proc. Nat. Acad. Sci. U. S. A. 37 A951), 760—766; Ф a ii ь Цзы (К у Fan), Problems 4429 and 4430, Amer. Math. Monthly 58 A951), 194 и 60 A953), 48—50 (здесь можно найти теоремы 7 и 11). Нами использовались в основном совершенно другие методы. Мы стремились показать, насколько полезными являются инте- интегральные представления при выводе неравенств. §§ 2—4. Глубокое рассмотрение этих классических нера- неравенств содержится в книге Харди, Литлвуда и Пойа, цитирован- цитированной выше. § 5. Этот результат, насколько это известно автору, принад- принадлежит Фань Цзы; см. третью и пятую из цитированных выше работ. См. также статьи Оппенгейм (A. Oppenheim), Inequalities Connected with Definite Hermitian Forms, J. London Math. Soc. 5 A930), 114—119; Оппенгейм (A. Oppenheim), Inequalities Connected with Definite Hermitian Forms, II, Amer. Math. Monthly 61 A954), 463—466, где приводятся дальнейшие ссылки.
170 НЕРАВЕНСТВА [ГЛ. S Подобные применения представления, выведенного в § 10 гл. 6, можно найти в работе Беллман (R. Bellman), Hermitian Matrices and Representation Theorems, Duke Math. J., 1959, где дано обобщение некоторых результатов, полученных Хуа; см. Хуа (L. К. Ни a), Inequalities Involving Determinants, Acta Math. Sinica 5 A955), 463—470; Math. Rev. 17 A956), 703. Хуа использует другой тип интегрального представления, выте- вытекающий из общей теории представления групп. § 6. См. работу Беккенбах (Е. F. Beckenbach), An Inequality for Definite Hermi- Hermitian Determinants, Bull. Amer. Math., Soc, 1929, 325-329. § 7. Неравенство Адамара является одним из наиболее обос- обоснованных результатов анализа: в литературе имеется свыше ста его доказательств. Приведенное доказательство следует работе Беллман (R. В е 1 1 m a n), Notes on Matrix Theory, II, Amer. Math. Monthly 40 A953), 174—175. Относительно своего неравенства Адамар сделал очень инте- интересное замечание в своей увлекательной книге Адамар (J, Hadamard), The Psychology of Invention in the Mathe- Mathematical Field, Princeton University Press, Princeton, N. J., 1949. За оригинальным изложением мы отсылаем читателя к статье Адамар (J. Hadamard), Resolution d'une question relative aux determinants, Bull. sci. math. 2 A893), 240-248. Обобщение неравенства Адамара можно найти в работе Фишер (Е. Fischer), Uber den Hadamardschen Determinantsatz, Arch. Math. u. Phys. C), 13 A908), 32—40. Другие далеко идущие обобщения даны Шуром: Шур (I. Sch ur), Ober endlische Gruppen und Hermitische Formen, Math. Z. 1 A918), 184—207. См. также Уильямсон (J. Williamson). Note on Hadamard's Determinant Theorem, Bull. Amer. Math. Soc. 53 A947), 608—613. § 8. Этот результат и связанная с ним теорема 11 содер~ жатся в пятой из указанных выше работ Фань Цзы. Приведенное доказательство следует работе Беллман, Гликсберг и Гросс (R. Bellman, I. Glicksberg, and О. Gross), Notes on Matrix Theory, VI, Amer. Math. Monthly 62 A955), 571—572.
БИБЛИОГРАФИЯ И КОММЕНТАРИЙ 171 Результат, сформулированный в упражнении 2, принадлежит Бергстрому, см. работу Бергстром (Н. Bergstrom), A Triangle Inequality for Matrices, Den ilte Skandinaviske Matematiker-kongress, Trondheim, 1949, Oslo 1952, 264—267, а в доказательстве мы следуем работе Беллман (R. Bellman), Notes on Matrix Theory, IV: An Inequality Due to Bergstrom, Amer. Math. Monthly 62 A955), 172—173. Результат упражнения З приводится в статье Беллман (R. Bellman), Notes on Matrix Theory, IX, Amer. Math, Monthly 64 A957), 189—191, где даны два метода: один опирается на обобщение представле- представления Ингама — Зигеля, на которое мы ссылались выше, другой — на неравенство Вергстрома. § 9. Этот параграф иллюстрирует важный прием. Иногда мультипликативные неравенства легче получить ab initio. Здесь мы следуем работе Беллман (R. Bellman), Notes on Matrix Theory, VII, Amer. Math. Monthly 62 A955), 647—648. § 12. В книге Харди, Литлвуда и Пойа приводится история неравенства, связывающего среднее арифметическое и среднее геометрическое, а также большое число его доказательств. При- Приведенное доказательство импонирует тем, что оно опирается на обратную индукцию. §13. Мы опустили доказательство неравенства A), которое содержится во второй статье Фань Цзы. Приведенный вывод неравенства B) из неравенства A) дан в работе Беллман (R. Bellman), Notes on Matrix Theory, XV: Multiplicative Properties from Additive Properties, Amer. Math. Monthly, to appear. Неравенства, связанные с различными функциями от харак- характеристических чисел, широко исследовались различными авто- авторами; см. следующие статьи, где можно найти обширную библио- библиографию по этим вопросам: Островский (A. Ostrowski), Sur quelques applications des fonctions convexes et concaves au sens de I. Schur, J. math, pures et appl. 31, no. 9 A952), 253—292; Маркус и Лопес (М. D. Marcus and L, Lopes), Inequalities for Symmetric Functions and Hermitian Matrices, Canad. J. Math. 8 A956), 524—531; Маркус и Мак-Грегор (M. D. Marcus and J. L. McGregor), Extremal Properties of Hermitian Matrices, Canad. J. Math. 8 A956); Маркус и Мойлс (М. Marcus and В. N. Mo у Is), Extreme Value Properties of Hermitian Matrices, Department of Mathematics, University of British Columbia, Vancouver, Canada, 1956;
172 НЕРАВЕНСТВА [ГЛ. 8 Маркус, Мойлс и Уэствик (М. Marcus, В. N. Moyls and R. West wick), Extremal Properties of Hermitian Matrices, Canad. J. .Math.,, to appear; Маркус, Мойлс и Уэствик (М. Marcus, В. N. Moyls and R. West wick), Some Extreme Value Results for Indefinite Hermitian Matri- Matrices, II, III, 111, J. Math. 2 A958), 408—414. Мы полностью опустили такой интересный и важный вопросг как неравенства для характеристических чисел, выраженные че- через элементы матрицы А. Детальное рассмотрение этих вопросов, можно найти в статьях Бра у эр (A. Brauer), Limits for the Characteristic Roots of a Matrix, IV, Duke Math. J. 19 A952), 75—91; Браун (Е. Т. В г о w n e), Limits to the Characteristic Roots of Matrices, Amer. Math. Monthly 46 A939), 252—265; Паркер (W. V. Parker), The Characteristic Roots of Matrices, Duke Math. J. 12 A945), 519—526. Упомянем еще работу де Б р е й н и ван Данциг (N. G. DeBruijn and D. Van D a n t z i g), Inequalities Concerning Minors and Eigenvalues, Nieuw. Arch. Wisk. 4, no. 3 A956), 18—35, где систематически излагается большое число детерминантных неравенств. Ряд интересных матричных неравенств приводится в работах Мазани и Винера, Хелсона и Лоуденслагера, цитируемых в кон~ це гл. И, а также в статье Фань Цзы и Гоффман (К у Fan and A. J. Hoffman), Some Metric Inequalities in the Space of Matrices, Proc. Amer. Math. Soc. 6 A955), 111—116. Наконец, см. Таусски (О. Taussky), Bibliography on Bounds for Characteristic Roots of Finite Matrices, National Bureau of Standarts, Rept. 1162, September 1951. Неравенства, совершенно отличные от приведенных нами, можно найти в статье Мирский (L. Mirsky), Inequalities for Normal and Hermitian Mat- Matrices, Duke Math. J. 24 A957), 591—599. См. также Хейнсворт (Е. V. Haynsworth), Note on Bounds for Certain De- Determinants, Duke Math. J. 24 A957), 313—320.
Глава 9 ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ § 1. Введение. В гл. 1 в связи с задачами максимизации и ми- минимизации мы рассматривали квадратичные формы и установи- установили, что определение экстремумов квадратичных функций приво- приводит к системам линейных уравнений. Являясь формально простым, решение линейных уравнений с помощью определителей не выполнимо с вычислительной точки зрения по тем причинам, которые обсуждались ранее. Поэтому мы должны предложить другие типы алгоритмов для получения решения. Это наводит на мысль, что, быть может, было бы хо- хорошо развить алгоритмы, непосредственно связанные с перво- первоначальной задачей максимизации, вообще не вводя в рассмотре- рассмотрение промежуточных линейных уравнений. В этой главе мы изучим несколько задач, в которых это мо- может быть сделано. Основным инструментом нашего исследова- исследования явится функциональное уравнение динамического програм- программирования. § 2. Задача наименьшего отклонения. Для заданной последо- последовательности вещественных чисел {аи}, k= 1, 2,. .., N, мы хотим определить другую последовательность {хь}, k= 1, 2,. . ., N, эле- элементы которой «близки» к ah и «близки» друг к другу. Точнее, мы хотим минимизировать N N QW= 2>ck(xk- х^Ул- % dk(xk- ak)\ A) k=i fc-i где ch и dh— заданные положительные числа, а х0 — заданная константа. Действуя обычным образом, мы должны приравнять нулю соответствующие частные производные, в результате чего можно получить следующую систему линейных уравнений: с, (*[ - х0) - с2 (х2 - хх) + dx (л:, - aj = О, ~ *fe-i) - сш (xk+i - xk) + dk (xk - ak) = 0, B) cN (xN — Хдг-i) + dN \xN — aN) = 0.
174 ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ [ГЛ 9 Если N достаточно велико, то на решение этой системы тре- требуется затратить много усилий. Поэтому вместо того, чтобы применять к решению этой системы уравнений один из много- многочисленных существующих способов, мы последуем совершенно другим путем. § 3. Функциональное уравнение. Рассмотрим последователь- последовательность задач минимизации, минимизируя по всем xh каждое из выражений: N N Qr (х) = 23 ск (хк - *ft_[J + 23 dk (xk - akf, A) k=r k=r где xr_\ — u предполагается заданным. Очевидно, что искомый минимум зависит от величины и и, конечно, от г. Введем после- последовательность функций {fr(u)} посредством равенства fr (и) = min Qr (x), B) X где —оо<м<оо, г=1, 2, ..., N. Заметим, что функция fN (и) = min [си {xN - иJ + dN (xN - aNJ] C) XN может быть легко определена. Для нахождения рекуррентного соотношения, связывающего fr{u) с fr+i{u) при г=1, 2, ... ..., N—1, поступим следующим образом. Заметим, что fr (и) = min min ... min 23 ск (хк - хк_хJ + dk (х„ - akJ = = min {cr (xr — иJ + dr {xr — arJ + xr + min... min 23 ск(хк-хк^J +dk(xk-akJ \\ = = min [cf (xr - uJ + dr (xr - arJ + fr+l (x,)]. D) xr Поскольку In{и) определена равенством C), это рекуррентное соотношение в принципе определяет />_](«), fN^{u), ..., fi(u), т. е. в конце концов функцию, которую мы хотели минимизиро- минимизировать с самого начала. Используя цифровую вычислительную машину, можно вычис- вычислить в соответствии с D) все члены последовательности {/*(«)}. Таким образом, вместо того чтобы решать частную задачу для фиксированного N, нашей целью было погрузить эту ва- вариационную задачу в семейство задач подобного типа. Если
§ 5] БОЛЕЕ СЛОЖНЫЙ FIPHMFP 175- даже частная задача является сложной, она может быть доста- достаточно просто связана с другими задачами семейства. Это свой- свойство характерно для большого класса вариационных проблем, из которых задача, рассмотренная выше, представляет весьма' частный пример. § 4. Рекуррентные соотношения. Принимая во внимание анали- аналитическую структуру каждого члена последовательности fr(u), мы. можем получить значительно большее. Начнем с доказательства по индукции того, что каждый член последовательности яв- является квадратичной функцией и: 2, A) коэффициенты которой ur, vr и wr зависят от г, но не от и. Легко' видеть, что этот результат верен для r = N, поскольку минимум A) достигается в точке N с +d ' B'' Подставляя это значение х^ в правую часть C), мы можем убе- убедиться, что функция />(«) действительно квадратична. Подоб- Подобный же анализ для fjv_i(w) и далее по индукции для fr(u) пока- показывает, что все они имеют вид A). Это означает, что для опреде- определения функций fr(u) достаточно найти последовательность ко- коэффициентов {ur,vr,wr}. Поскольку нам известны uN, vN и wN, достаточно получить рекуррентные соотношения, связывающие ur, vr, wr с ur+\, vr+l и MV+i. Для его вывода обратимся к C.4) и запишем и, + vru + wrii2 — = min [dr {xr - arf + cr (xr - uf + ur+l + vr+lxr + wr+lx*}. C> Величина хг, дающая минимум (З), определяется формулой (cr + dr+ wr+x) xr = cru + drar - j vr+l. D) Подставляя это значение хг в C) и приравнивая коэффициенты при одинаковых степенях и, получим желаемые рекуррентные со- соотношения, которые оказываются нелинейными. Дальнейшие де- детали мы оставляем читателю в качестве упражнения. § 5. Более сложный пример. В § 2 мы поставили задачу при- приближения последовательности величин {ah} последовательностью {xk}, имеющей малую разность xh+\ — xh. Сделаем дальнейший шаг и рассмотрим проблему минимизации квадратичной
176 ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ [ГЛ. 9 функции N N Q(Jt)=S ck (хк - xk.xJ + 2 <4 (хк - flfcJ + N + 2 ek (xk - 2*A_, -f *A_2J, A) k=i где л:0 = и, x.t = и. Как и ранее, введем функцию двух переменных fr(u,v) по- посредством равенства [Л' ЛГ 2 ck (xk - xk_xf + 2 dk {xk - akf + k--~r k = r I ^j C? \-^? ^"^k—l ' **k—2/ I ' V"/ где г= 1, 2, ..., N, —оо<м, o<oo, xr^i = u, xr_2 = w. Нетрудно ви- видеть, как и ранее, что для г— 1, 2,. . ., Л' /г («, о) = min [cr (хг — иJ + dT (xr — агJ + + er (xr — 2u + vJ + /,_, (а:г, и)] C) хг и что fr (и, v) = ur+ vru + wru2 -У v'rv + ш'и2 + zruv. Коэффициенты ur, vr, .. ., zr в последнем равенстве зависят толь- только от номера г. Комбинируя эти результаты, мы без труда полу- получим рекуррентное соотношение, связывающее соседние члены по- последовательности \ur, vr, wr, v'r, w'r, 2r}. Поскольку мы можем легко получить эти значения для r = N, мы имеем простой метод нахождения всей последовательности. § 6. Проблема Штурма — Лиувилля. Проблемой, имеющей боль- большое значение в теоретической физике и прикладной математике, является задача определения величин Я, при которых однородное уравнение н" + Ьф@ы = 0, и@) = иA) = 0, имеет нетривиальное решение. Предполагается, что функция <р(/) является вещественной, непрерывной и положительной на ин- интервале [0, 1]. В § 12 гл.7 мы наметили один из путей получения приближен- приближенного решения этой задачи. Укажем сейчас другое решение, снова оставляя в стороне строгие обоснования. Отметим, однако, что вопрос о скорости сходимости при N'-*¦ оо имеет большое значен
§6] ПРОБЛЕМА ШТУРМА —ЛИУВИЛЛЯ 177 ние, поскольку от ответа на этот вопрос зависит эффективность метода. Не пытаясь разыскивать функцию u(t) при O-C^-^Cl, мы попробуем определить последовательность {uh = u(kA)}, k = = 0, 1,. . . , JV—1, где jVA = 1. При этом вторая производная за- заменяется разностью второго порядка Uk+i -2uk + ui,-i ,оч (г) а дифференциальное уравнение переходит в разностное. Послед- Последнее эквивалентно системе линейных однородных уравнений: и2 — 2М] + ХД2ф]«1 = О, U3~ 2U2+ «J + ХА2ф2«2= 0, /дч где ф^ = ф (kA). Мы видим, что первоначальная задача свелась приближенно к задаче весьма обычного типа — определению собственных зна- значений симметрической матрицы - 2 + А2ф! 1 1 - 2 + А2ф2 1 А = 1 - 2 + Ayv_2 1 1 - 2 + A D) Эта матрица представляет собой частный случай так называе- называемой матрицы Якоби, к рассмотрению которой мы вернемся в дальнейшем. Существенно отметить, что это просто один из возможных способов сведения задачи, связанной с дифференциальным урав- уравнением, к матричной форме. Имеется также много других путей. Упражнения 1. Показать, что дифференциальное уравнение F.1) совместно с гранич- граничными условиями эквивалентно интегральному уравнению 1 о 12 Р. Беллман w (/) = Я J K(t, s) ф (s) и (s) ds,
178 ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИИ [ГЛ. где -t) при 0</<s<!. 2. Применить это представление для получения другой аппроксимирую- аппроксимирующей матричной записи, а именно: ?=1, 2, .... N. § 7. Функциональные уравнения. Поскольку матрица А, опреде- определенная равенством F.4), является вещественной и симметриче- симметрической, мы знаем, что ее собственные значения могут быть опреде- определены при минимизации функции N при ограничениях 1*0 — идг — u, \Z af = 1. B 6} Будем определять вместо этого минимум функции N ?\ \iifc — U?_i) C/ k=r при ограничениях "r-i = v, D а) «,v = 0, D6) Л/-1 ftS Ф^«й = J - D в> где г = 1, 2, ..., W — 1, — оо < о< оо. Минимальное значение C) для всех г является функцией v, fr(v). Нетрудно видеть, что *-,-»J- E) Аналогично предыдущему для г=\, 2, ..., Л^ — 1 получим fr(v) = mm[(ur- vf + A -ФгмЛJ/г+1 (o//l -Фг«2)]. F) Последовательность функций {fr(v)}, очевидно, не обладает про- простой аналитической структурой. Однако рекуррентное соотношу ние F) может быть использовано при числовых расчетах.
•§ Ы МАТРИЦЫ ЯКОБИ 179 Упражнение 1. Рассмотреть подобным же образом задачу определения максимума и минимума функций: (а) (axlJ + (xl + ax2f+ ... +(x, + jc2+ ... + *„_, + ах Nf ограничении х\ +х\+ ... +*^=1; (б) x2l + (xi + ax2f + ... + (xl + ax2 + a2x3 + ... +aN~lxNf огран (в) к\ + (xl + ax2 при ограничении к| + х2 + ... + x2N—\; ... + {ж, + ах2 + (а + Ь)хъ + ... +[а +{N-2) b] xN}2 при ограничении х\ + х\+ ... +x2N=\. Другие методы при рассмотрении этих же вопросов обсуждаются в статье Островский (А. М. Ostrovski), On the Bounds for a One-parameter Family of Matrices, J. fur Math., 200 A958), 190—200. § 8. Матрицы Якоби. Под матрицей Якоби будем понимать матрицу, обладающую тем свойством, что отличными от нуля являются только элементы, расположенные вдоль главной диа- диагонали и двух прилежащих к ней диагоналей. Поэтому а^=0 при \i — j\>2. A) Рассмотрим теперь вопрос о решении системы уравнений Ах = с, B) где А — положительно определенная матрица Якоби. Как нам известно, эта задача эквивалентна минимизации неоднородной квадратичной формы Q(x) = (x,Ax) — 2(c,x). C) Раскрывая это равенство, увидим, что следует минимизировать Q (х) = апх2 + 2а12х1х2 + а22х\ + + aNNx2N-2clXy-2c2x2- ... -2cNxN. D) Рассмотрим задачу отыскания минимума функций Qk{x, z) = anx2l + 2al2xlx2 + a22xl + l ~ • • + 2«fc-i, Л-Л + akkxl ii 2г k E) 12*
180 ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ [ГЛ. 9 для k = L 2, ..., N. При этом Определим fk (z) = min QA (л, 2). G) Легко показать далее, что для k = 2, 3, ... Снова можно усмотреть, что каждая функция fk(z) квадра- квадратична по z, так что fh(z)=uh + vkz + whz2, k = 2, 3,. . ., (9) причем Подставляя в (8) последние выражения, получим рекуррентные соотношения, связывающие uh, vh, wh с Uh-i, Vh-i и Wh-i. Оста- Оставляем их вывод читателю в качестве упражнения. Упражнения 1. Обобщить рассмотренную процедуру на случай, когда матрица А обла- обладает свойством aij = 0 при \ i — /| ^3. 2. Получить соотношения, соответствующие приведенным в § 7, для наи- наибольшего и наименьшего собственных значений симметричной матрицы Л, у которой A) ац = 0 при \i — /|>2 и B) ац = 0 при |i —/|>3. § 9. Аналитическое продолжение. Мы получили возможность применить вариационные методы к решению уравнения Ах = с ценой допущения, что матрица А является симметрической и положительно определенной. Возникает соблазн доказать, что точные решения, которые мы нашли, остаются в силе прежде всего для симметрических матриц, которые не являются знако- определенными при условии, разумеется, что ни один из встре- встречающихся знаменателей не обращается в нуль, а затем, при подходящих предположениях,— и для несимметрических матриц. Аргументацию можно провести следующим путем. Выражения для Xi являются линейными функциями Сг и рациональными функциями ац. Равенство вида Л' ^aijxj = cl, A) ] — 1 справедливое в той области пространства aih где матрица А яв- является знакоопределеннои, несомненно должно выполняться для всех ац, которые удовлетворяют условию симметрии.
§ 10] НЕСИММЕТРИЧЕСКИЕ МАТРИЦЫ 18Г Очевидно, однако, что строгое обоснование доказательства подобного рода должно увести нас в трудную область функций нескольких комплексных переменных. Поэтому мы откажемся от этого пути, утверждая лишь, что он существует, и предложим другой, который требует только знания элементарных фактов,, касающихся аналитического продолжения функций одной ком- комплексной переменной. Рассмотрим вместо симметрической матрицы А матрицу Iz + A, где г—скаляр. При достаточно больших положительных г эта матрица яв- является положительно определенной и, кроме того, она является матрицей Якоби, если А — матрица Якоби. Теперь мы хотим применить принцип аналитического про- продолжения. Величины Хи найденные по формулам, выведенным ранее, являются рациональными функциями z, аналитическими при достаточно большой вещественной части z. Следовательно, тождества, справедливые в этой области, должны выполняться и при z = 0, если только ни одна из встречающихся функций не имеет особенностей при 2 = 0. Этими особенностями могут быть только нули знаменателей. Другими словами, формулы законны до тех пор, пока они не теряют смысла. § 10. Несимметрические матрицы. Чтобы применить технику вариационного исчисления к несимметрическим матрицам, мы должны использовать другой подход. Рассмотрим выражение f(x, у) = (х,Вх) +2(х, Ау) + (у, Ву)~2(а, ж)-2F, у), A) в котором по предположению В — симметрическая и положи- положительно определенная матрица, а матрица А вещественна. Мини- Минимизируя A) по х и у, мы получим уравнения Вх + Ау = а, А'х + Ву = Ъ. у } Чтобы гарантировать положительную определенность функции f(x,y) как по х, так и по у, мы должны подчинить матрицу В некоторым дополнительным условиям. Поскольку мы хотим также использовать принцип аналитического продолжения, наи- наиболее коротким путем к цели, пожалуй, будет выбор В в виде B — Iz, где z — достаточно большое положительное число. Теперь, как и ранее, может быть использован аппарат функ- функциональных уравнений. Мы оставляем читателю разработку де- деталей и проведение аналитического продолжения.
182 ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ [ГЛ 9 § 11. Случай комплексной матрицы А. Посмотрим, что нужно делать в случае, когда матрица А является симметрической, но комплексной: A = B + iC, В и С вещественны. Уравнение Ах=с принимает вид (B iC)( i) ib A) или после приравнивания вещественной и мнимой частей Вх-Су = а, Заметим, что эти соотношения устанавливают естественное со- соответствие между комплексной матрицей B + iC N-то порядка и матрицей В - С 1 с by C) имеющей порядок 2N. Это соотношение встречалось раньше в примерах. Для того чтобы связать эту матрицу и систему B) с вариа- вариационной задачей, мы рассмотрим квадратичную форму / {х, у) = (х, Сх) + 2 (х, By) - (у, Су) - 2 (Ь, х) - 2 (а, у). D) Если принять условие, что С положительно определена, то ока- окажется, что f(x,y) является выпуклой функцией по х и вогнутой по у. Как следствие общих теорем, которые мы рассмотрим в гл. 16, имеем minmax/(jc, y) = maxmmf(x, у). E) х у ух Поскольку функция f{x,y) является в данном случае квадра- квадратичной, нет необходимости привлекать эти общие результаты: обе части равенства E) могут быть точно вычислены и после сравнения окажутся равными. Мы оставляем возможность про- провести это сравнение читателю. Перед применением метода функциональных уравнений нам необходим дополнительный результат, заключающийся в том, что минимум по Xi и максимум по f/j могут определяться в лю- любом порядке. В частности, min max = min max min max . F) (VV-'»)('rV-'j») xi yi (V-**) C2-— *jv) Доказательство этого мы также оставляем читателю. Проблемы подобного рода являются фундаментальными в теории игр, ко- которую мы обсудим коротко в гл. 16.
12] СЛАБО СВЯЗАННЫЕ СИСТЕМЫ 183: Комбинируя предыдущие результаты, мы можем рассмотреть- случай комплексной матрицы А. В случае необходимости можно- рассмотреть матрицу A + izI, где z — достаточно большая поло- положительная величина, введенная, как и ранее, для целей аналити- аналитического продолжения. § 12. Слабо связанные системы. Рассмотрим теперь задачу ре- решения системы линейных уравнений вида CL\\X\ A > «13*3 = СЬ а22х2 + «гз*з = с2, Из 1*1 + «32*2 + «33*3 + &1*4 = С3. Мз + «44*4 + «45*5 + «46*6 = С4, «54*4 + «55*5 + «56*6 = С5, «64*4 + «65*5 + «66*6 + Ь2Х7 = С6, + a3N-2, 3N-lX3N-\ + «3jV-2, + a3N-\, 3N-lX3N-l + a3N-l, «ЗЛ/, 3.V-2*3W-2 + «ЗЛ/, 3,V-1*3V-1 + a3N. 3NX3N = C3W- Если все коэффициенты ft,- равны нулю, то эта задача разделяет- разделяется на N простых трехмерных задач. Разумно предположить, что» имеется путь, позволяющий использовать почти диагональную- структуру системы A). Назовем матрицы типа матриц, сформи- сформированных из коэффициентов системы A), слабо связанными. Они появляются во многих физических, инженерных и экономи- экономических задачах анализа систем с большим количеством перемен- переменных, в которых имеется «слабая связь» между отдельными ча- частями системы. Для упрощения обозначений введем матрицы /=1. 2' 3> и векторы где k=\,2,... Первоначально мы предположим, что матрицы коэффициен- коэффициентов B) положительно определенные. Решение линейной системы; эквивалентно задаче определения минимума неоднородной^ *3fe-2 *3ft-l X3k , ск = Сзк-2 C3k-\ Сзк
184 ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ (ГЛ. 9 квадратичной формы (xi,Aix1) + {x2,A2xa)+ ... + (xtf,AsxrT) — — ... — 2(cN, xN) + - D) Будем разыскивать этот минимум с помощью метода функцио- функционального уравнения. Введем последовательность функций {fk(z)}, определенную соотношением fk (z) = min 2 [(xl, Ax1) - 2 (с1, х1)] + 2 2 М,+3,*3« + 2г*з* E) ДЛЯ —оо<2<оо, k—\, 2, ... Следуя обычным методам, получим рекуррентное соотно- соотношение U (z) = min {(jc\ Akxk) + 2zx3k - 2 (c\ xk) + h-x (&ft-i*3ft-i)l. F) 4 где через Rk обозначена трехмерная область — оо<л;зъ x3k-x, л:ЗА_2<оо. § 13. Упрощения — I. Мы можем записать A2.6) в форме min [(**, Akxk) + 2zx3k-2{ck, xk)]+fk_x{bk^x5k_ 2k'X3k-l A) Введем последовательность функций gk{z,y)= min [(**, Akxk) + 2zx3k-2(c\ x% B) X3k' X3ft-1 где Хз/г-2 = f/. Тогда получаем простое одномерное рекуррентное соотношение fk (z) = min [gk (z, у) + fft_, {b^y)]. C) у § 14. Упрощения — II. Как и в параграфе, посвященном матри- матрицам Якоби, мы можем пойти дальше, если заметим, что fk (г) для каждого k квадратична по z: fh(z)=uk + 2vkz + wkz2, A) где Uh, Vu, Wh не зависят от z. Подставляя это выражение в A3.3), мы без труда получим рекуррентные соотношения для последовательности {uk, vh, wh}.
§ 15J УРАВНЕНИЯ 4Jf=J> 185- Упражнения 1. Получить рекуррентные соотношения, позволяющие находить наиболь- наибольшее и наименьшее собственные числа слабо связанных матриц. 2. Распространить предыдущие результаты на случай, когда не асе Ah имеют одинаковые размеры. § 15. Уравнение Ах = у. Теперь мы обсудим простую тему. Мы знаем, что если матрица А является положительно определенной, то решение уравнения Ах = у, A) которое дается формулой х = А~]у, может быть также получено как решение задачи минимизации квадратичной формы Q(x) = (x,Ax)-2(x,y). B) Минимальное значение B) равно — (у,А']у). Сравнивая два подхода к проблеме решения A), мы можем получить некоторые интересные тождества. Введем функцию N переменных Запишем N Уъ ••¦, yN) = ra\Vi\ 2 aijXtXj - 2 2 хгуь . xl It, j = l 1 = 1 J C) N-\ N~\ = aNNxl + . 2 i aijxixj - 2 2 x. (tft - aiNxN) - 2xNyN. (A) Из этого выражения получим следующее функциональное урав- уравнение: Уъ •••, Уы) -= XN + fN-l {УI - awXN> У2 - a2NXN Ун-\ ~ %-!, nXn)\ . E) Чтобы конструктивным образом использовать это соотношение, напомним, что 1я(УиУ2,-.-,Уы)— — (У, А~]у). Поэтому можно записать N fN (У и Уъ ¦ ¦ ¦, У а) = 2 ctj(N)y{yj. F) i. /=i Возвращаясь к E), получим N Г N-\ .?/,, (Ю УСУ, = min атх% - 2xNyN + 2 сц (N ~ 1) X X (уi - aiNxN) (yj - aJNxN)), G)
486 ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ [ГЛ. 9 или, группируя соответствующие члены, N Г ( N-l . 2 сц (N) ytyf = min \х% \аш + 2 altlalltclf ( i, i —I x^ L <¦ './ i j- W —I \ N- + xN | - 2yN - 2 2 (^я/л) c«; (^ - !) Г + .2 (8) Теперь просто выполнить минимизацию N-l (9) aNN+ i, i вследствие чего сам минимум дается равенством JV-1 \ / ЛГ— 1 \ I N-l У, c..(N-\)y.y,\[a,,.,+ У1 а.,а,„с,(Л7-1) -(»,,+ У1 (/.а .—J j; i lj\ NN _¦*-! IN IN il I \ N .^-J / __ «./=i N Приравнивая коэффициенты при #,#,¦ в сумме 2 clj(N)yiyj и в A0), получим рекуррентные соотношения, связывающие после- последовательности {Cij(N)} и {Cij(N—1)}. § 16. Квадратичное уклонение. Задача минимизации по всем ли. квадратичной формы в принципе решается весьма просто. Пусть {hh(t)\ есть эртэго- нальная последовательность функций, полученная по g>((/) с не- немощью процедуры ортогонализации Грама — Шмидта. Очевид- Очевидно, что без ограничения общности функции gk(t) мэжнэ считать линейно независимыми. Тогда г'Г vi / f min QN (jc) = min \f{t)— \Ук^к(ч\ dt = * * n L ?П J T N I T \2 • .B)
S 161 КВАДРАТИЧНОЕ УКЛОНЕНИЕ 187 Этот результат может быть записан как т т т \f(t)dt-\\f (s) f (t) kN (s, t) ds dt, C> о о е где kN(st 0= 2 Ms) MO- D> k=i Получим теперь рекуррентное соотношение, связывающее члены последовательности {kN(s, t)}. Введем квадратичный функцио- функционал — функцию от функции f(t): Флг (!) = min [ \f - У xkgk dt. E) * 0 V 4=1 / Используя технику функциональных уравнений, получим для N = 2,3,... Фдг (f) = min флг-i (/ - xNgN) F) Чтобы раскрыть F), мы воспользуемся приемом, неоднократно применявшимся ранее и связанным с квадратичным характером флг(П- Итак, Флг(/) = т}п f (f~xNgNfdt- XN U т т , - [ f (f(s)~xNgN(s))(f(t)-xNgN{t))kN(s, t)dsdt\ = 0 0 J {г т т 1 !2dt~ J J kN-i(s, t)f(s)f(t)dsdt- 0 0 0 От т т ., ' fSn dt~ \ \ gN (s) f (t) kN., (s, t) dsdt\ + 0 0 J Г r T T 11 + 4M S%dt- j J V,(«. t)gN(s)gN(t)dsdt . (8) L0 0 0 J '
188 ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ [ГЛ. 9 Находя величину xN, минимизирующую (8), и вычисляя минимум фдг if), получим рекуррентное соотношение -kN{s, t) = kN_i(s, t) + т г T T + f f gN (Si) Я (* l) *ЛМ («I. S) *JV-1 Cb 0 <#1 ^1 • (9) о о где т т т dN = J ^ @ rff + J J Vl (S' 0 gtf (S) ffjv @ 0 0 § 17. Результат Стилтьеса. В предыдущих разделах мы под- подчеркивали связь между решением уравнения Ах = Ь и минимиза- минимизацией квадратичной формы (х, Ах)—2{Ь, х) (где А —положитель- —положительно определенная матрица). Используем ту же идею для того, чтобы установить интересный результат, принадлежащий Стилтьесу. Обобщение этого результата мы получим в гл. 16. Теорема 1. Если А — положительно определенная матрица, обладающая тем свойством, что ct-j<0 при 1ф\, то все элементы обратной матрицы А'1 положительны. Доказательство. Рассмотрим задачу минимизации Q(x) = (x, Ах)—2F, х) в предположении, что все компоненты вектора Ь положительны. Предположим, что в точке минимума jli, X2, . •., xh<0, a Xh+u xk+2,. . . , Xjv> 0. Переписывая Q(x) в виде к к N лпх\ + апх\+ ...+ aNNxl + ^ aijxixj + 2 ^ а,,*,*, + N N N к N + Ъ '2iaijXiXj+ 2 aijxixJ-2'Zibixt~2 2 Mi, A) i=k+i i=\ t,i-k+i <=i t=fe+i жы видим, что вследствие отрицательности ац при 1ф\ можно получить меньшее значение Q(x), если хотя бы один из Xi (i=k+ I,..., N) отличен от нуля. Это уменьшение Q(x) дости- достигается заменой х{ на —xt (i=\,2,...,k) при сохранении неиз- неизменными всех остальных переменных. Во всяком случае, мы ви-> _дим, что все xt (t=l,2 N) являются неотрицательными.
УПРАЖНЕНИЯ К ГЛ. 9 189 Чтобы показать, что в действительности все они положитель- яы при положительных Ьи мы заметим, что по крайней мере «дин из Х{ должен быть больше нуля. В случае если в точке ми- минимума •то xN, определяемый как величина, которая минимизирует ,aNNx2N~2bNxN, равен-—— NN скольку в точке минимума ,aNNx2N~2bNxN, равен-—— и, следовательно, положителен. По- NN attX, = bi-ZatjXj (t=l, 2, .... N-\), B) то и все ATj>0. Мы видим, что при любых положительных й,- все составляющие вектора Л~'& положительны. Это доказывает не- •отрицательность элементов матрицы Л. Чтобы показать, что на самом деле все элементы матрицы Л'1 положительны, достаточно установить, что вектор А~1Ь имеет положительные составляющие всякий раз, когда все коэффи- коэффициенты bi неотрицательны, а по крайней мере один из них поло- положителен. Обращаясь к B), мы видим, что неравенство ац<$ при 1ф\ ¦обеспечивает выполнение этого условия. Упражнения к гл. 9 1. Даны две последовательности {а*} и {bh}, k = 0, I, 2, ..., N. Часто нуж- !но определить конечную последовательность {хн}, k = 0, 1, 2, ..., М, которая выражает Ьк наиболее «точно» в форме м bk = 2 аЬ-1х1< as = 0 при s < 0. Чтобы оценить близость приближения, мы используем сумму N I M ft=0 \ 1 = 0 Рассмотрим квадратичную форму по переменным у0, уи .... у_ч, определен- лую как fit. м (Уо> У\> ¦ ¦ ¦' Ум) = ™п {(^о ~ аохо) + (У\ ~ *ъа\ ~ xiaof + ¦¦• Показать, что "< „2 1/ V „2 1_/ fN, i(yo< и».... vn)- Sy\)[ 2 4 - 2 \ft0 /\ft0 / ft_0
190 ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ [ГЛ. 9 и что в общем случае V-LM-V 2. Записать ',/=1 и использовать предыдущее рекуррентное соотношение для получения связи ctl(N, М) с Сц{Ы — 1, М — 1). 3. Записать \ц,м(Уа, У\, •••, J/w) = (j/, ЛмкУ) и получить рекуррентное соотношение в матричной форме. Дополнительное обсуждение этой задачи, являющейся исходной точкой теории экстраполяции Колмогорова — Винера, см. в книге Винер (N. Wie- Wiener), The Extrapolation, Interpolation and Smoothing of Stationary Time Series, John Willey & Sons, 1942, и в особенности приложение к этой книге, написанное Н. Левинсоном. 4. Пусть А и В — две положительные определенные матрицы порядка N, причем АВфВА, а с — заданный Л^-мерный вектор. Рассмотреть вектор xN=ZNZN-i ... Z2Z]C, где каждая из матриц Zt есть А или В. Матрицы Zj («=1, 2, ..., N) даляйш- б«ть в«6р-аны из условия м-*юим«эвщ+ж скаляр- скалярного произведения (x,v, b), где Ь — фиксированный Л^-мерный вектор. Для N—X, 2, ... и всех с определить функцию fnW(N' ) \zl) Тогда Л (с) = max [(Ас, Ь), (Вс, Ь)), fN (с) - max [/w_, {Ac), /w_, (Be)], N - 2, 3, ... 5. Существует ли скаляр А. такой, что при N -> оо fw (с) ~ 6. Каков ответ на этот вопрос, если ЛВ = ВЛ? 7. Пусть С — заданная положительно определенная матрица, a Z* должны быть выбраны так, чтобы максимизировать максимальное собственное значе- значение матрицы ZNZN-i ... ZzZjC. Обозначим через gN (С) этот максимум максиморум. Тогда ), <р (ВС)], gN (С) = max [ffjv_, (AC), gN_} (ВС)], N-2,3,..., где через <f(X) обозначено максимальное собственное значение матрицы X, 8. Существует ли скаляр Я такой, что при N ~> оо gN(C) ~XNh(C)? См. Б о м (С. Ethra) Sulla mimmuzazione di una funzione del prodotto di enti non commutati, Lincei-Rend. Sci. fis. Mat. e Not. 23 A957), 386—388. Библиография и комментарий § t. Теория динамического программирования в действитель- действительности является аппаратом изучения многошаговых процессов принятия решений. Оказывается, что многие вариационные зада- задачи могут быть сформулированы на языке динамического програм- программирования. Эта интерпретация дает новый подход, являющийся
БИБЛИОГРАФИЯ И КОММЕНТАРИЙ 191 полезным как для аналитического рассмотрения, так и для целей вычисления. В этой главе мы интересовались, следуя нашей об- общей программе, лишь аналитическими аспектами. Для деталь- детального ознакомления с общей теорией читатель отсылается к книге Белям а и (R. Bellman), Dynamic Programming, Princeton University Press., Princeton, N. J., 1957. [Русский перевод: Р. Беллман, Динамиче- Динамическое программирование, ИЛ, I960.] § 2. Задача, рассмотренная в этом параграфе, является про- простым примером так называемой проблемы «сглаживания», ср. Беллман (R. Bellman). Dynamic Programming and its Application to Variationa! Problems in Mathematical Economics, Calculus of Variations, Proc. of Symp. in Appl. Math., McGraw-Hill, New York, 1958, т. VIII, 115—139. Обсуждение проблемы сглаживания другого типа см. в сле- следующих работах: Шенберг (I. J. Schoeneberg), On Smoothing Operations and Their Generating Functions, Bull. Amer. Math. Soc. 59 A953), 199—230; Винер (N. Wiener), Cybernetics, John Willey & Sons, N. Y., 1951. {Русский перевод: Н. Винер, Кибернетика, «Советское радио», 1968.] § 3. Вывод этого рекуррентного соотношения является част- частным примером применения принципа оптимальности (см. книгу, указанную в ссылке к § 1). Результаты, обсуждавшиеся в §§ 3—5, впервые были опубликованы в статье Беллман (R. Bellman), On a Class of Variational Problems, Quart. Appl. Math. 14 A957), 353—359. § 7. Эти результаты опубликованы в работе Белл мак (R. Bellman), Eigenvalues and Functional Equations, Proc. Amer. Math. Soc. 8 A957), 68—72. § 8. Это обсуждение следует статье Беллман (R. Bellman), On a Class of Variational Problems, Quart. Appl. Math. 19 A957), 353—359. Значительное число результатов, связанных с тем фактом, что матрицы Якоби появляются при рассмотрении процессов случайного блуждания, содержится в работах Кар л ии и Мак-Грегор (S. Karlin, J. McGregor), Coincident Properties of Birth and Death Processes, Techn. Rep. 9, Stanford University, 1958; Дин (Р. Dean), The Special Distribution of a Jacobian Matrix, Proc. Cambridge Phil. Soc. 52 A956), 752—755. § 9. Это рассуждение, проведенное для случая конечных ма- матриц, может быть легко распространено на более общий класс операторов.
192 ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ [ГЛ. 9 Применение этих методов описано в статье Беллман и Леман (R. Bellman, S. Lehman), Functional Equa- Equations in the Theory of Dynamic Programming, "X: Resolvents, Characteristic Functions and Values, Proc. Nat. Acad. Sci. U.S.A. 44 A958), 905—907. §§ 10—11. Содержание этих параграфов заимствовано из бо- более общего построения в работе Беллман и Леман (R. Bellman, S. Lehman), Functional Equa- Equations in the Theory of Dynamic Programming, IX: Variational Analisis, Analitic Continuation and Imbeding of Operator, Duke Math. J., 1960. Обширное обсуждение материала этого плана имеется в ра- работах Долф и Сэдл (С. L. D о 1 р h, A. Saddle), Point Characterization of the Schwinger Stationary Points in Exterior Scattering Problems, J. Soc. Ind, Appl. Math. 5 A957), 89—104; Долф, Мак-Лафлин и Маркс (С. L. D о 1 р h, J. Е. М с L a u g h- 1 i n, I. Marx), Symmetric Linear Transformations and Complex Quadratic Forms, Comm. Pure and Appl. Math. 7 A954), 621—632. §§ 12—14. Эти результаты заимствованы из статьи Беллман (R. Bellman), On Some Applications of Dynamic Program- Programming to Matrix Theory, 111. J. Math. 1 A957), 297—301. §§ 15—16. Эти результаты следуют из работы Беллман (R. Bellman), Dynamic Programming and Mean Square Deviation, The RAND Corporation, Paper P-1147, Sept. 13, 1957. § 17. Этот результат получен в статье Стилтьес (Т. J. Stiltjes), Sur la racines de Xn = 0, Acta Math. 9 A886—1887). Их обобщение будет дано в гл. 16. Другие приложения пред- предложенного способа см. Беллман (R. Bellman), On the Non-negativity of Green's Functions, Bull. Unione Matematico 12 A957), 411—413. Дальнейшие приложения аппарата функциональных уравне- уравнений к квадратичным формам см. Калман и Кепке (R. E. Kalman, R. W. Koepcke), Optimal Synthesis of Linear Sampling Control Systems Using Generalized Performance Indexes, Amer. Soc. Mech. Eng., Instrument and Regulators Conferences, Newark, April 2—4 1958; Беллман и Ричардсон (R. Bellman, J. M. Richardson), On the Application of Dynamic Programming to a Class of implicit Variational Problems, Quart. Appl. Math., 1959; Ф рей мер (M. Freimer), Dynamic Programming and Adaptive Control Processes, Lincoln Laboratory Report, 1959; Саймон (Н. A. Simon), Dynamic Programming under Uncertainty with a Quadratic Criterion Functions, Econometrica 24 A956), 74—81S
Глава 10 МАТРИЦЫ И ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ § 1. Обоснование. В этой главе, открывающей вторую часть книги, мы обсудим применение теории матриц к решению линей- линейных систем уравнений вида N = 2 a,,xj, x, @) = c{, 1=1, 2, .. ., N, A) где Q,j — постоянные коэффициенты. Приведем некоторые соображения, обьясняющие, почему уравнения этого на первый взгляд частного вида играют цен- центральную роль. Рассмотрим физическую систему S, предполагая, что ее положение в некоторый момент времени t полностью опи- описывается N функциями Х\ (/), x2(t), . . . , Xff(t). Сделаем дальней- дальнейшее допущение о том, что скорость изменения всех этих функций при любом t зависит только от величины xt в этот же момент времени. Это, несомненно, всегда лишь приближение к действитель- действительному положению дел, но приближение весьма полезное и удобное. Аналитическим выражением этих допущений является систе- система дифференциальных уравнений вида ¦7Г = М*ь ** ...,**), i=\,2,...,N, B) с соответствующими начальными условиями xt@)=cit i=l,2,...,N. C) Вектор с = (Ci, с2, ..., сл) представляет начальное состояние си- системы. Набор постоянных {с;}, для которых fi(cuc2, ...,Cjv)=O, i=l,2,...,N, D) играет особенно важную роль. Они определяют, очевидно, поло- положение равновесия, поскольку система S не может отклониться от этого положения при отсутствии внешних сил. Если такие по- положения равновесия существуют, то чрезвычайно интересно исследовать поведение системы в их окрестности. Другими словами, мы хотим изучить устойчивость системы при малых 13 Р. Беллман
194 МАТРИЦЫ И ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ [ГЛ 10 возмущениях. Если возмущенная система возвратится в конеч- конечном счете в положение равновесия, то мы говорим, что положе- положение равновесия устойчиво. В противном случае положение равно- равновесия будет неустойчивым *). Рассмотрение этих ситуаций имеет большое практическое значение. Для того чтобы провести это исследование, положим Xi = Ci + yu E) где через iji обозначены малые отклонения. Подставляя E) в B), мы получим уравнения C2+IJ2, = ft (с и с,, ..., cN) + j + ..., i = 1, 2, . . ., где dft riv - 1 vcr W-Vcjv F) G) а многоточием обозначены члены высшего порядка малости. По- Поведение системы S в окрестности положения равновесия {с,} при- приближенно описывается линейной системой вида A) с постоян- постоянными коэффициентами. Разумеется, законность аппроксимации должна быть тщательно исследована. Мы имеем, таким образом, веское обоснование для изучения линейных систем вида A). Нашей целью является получение аналитического представления решения, что позволит нам уста- установить его асимптотическое поведение при t~*-oo. К вопросам устойчивости мы снова вернемся в гл. 13. § 2. Векторно-матричные обозначения. Для исследования си- системы A.1) мы введем векторы у и с с компонентами соответ- соответственно уг и С{ и матрицу /4 = ||afj||. Из определения разности двух векторов очевидно, что производная от вектора должна быть определена как dij\ A) dy dt dt dih dt dt *) Речь идет об асимптотической устойчивости. (Прим. перев.)
§ 2] ' ВЕКТОРНО-МАТРИЧНЫЕ ОБОЗНАЧЕНИЯ Подобным образом интеграл от y(t) определяется как t J y\(s)ds 195 J y(s)ds = B) г/2 (s) ds yN(s)ds Аналогично вводятся производные и интегралы от матриц. От- Отсюда следует, что уравнения A.1) могут быть записаны как dx dt AX' X(U> c- (б) Матрица А в общем случае не симметрична. Поэтому можно ожидать, что результаты и методы первой части этой книги не будут играть главной роли при рассмотрении системы A.1). Мы должны развить новые методы для рассмотрения квадратных матриц общего вида. Вектор, составляющие которого являются функциями от t, будет называться векторной функцией, или, коротко, функцией от t. Векторная функция непрерывна, если все ее составляющие в рассматриваемом интервале являются непрерывными функ- функциями аргумента t. Эту же терминологию мы будем использо- использовать при описании матричных функций. Упражнения 1. Показать, что (б) it dA\ , dx х + А- dt Г ' '" dt' (в) -^-(АВ)^\.^-\в + А^г, W 4г( (д) d dt п-1 vtl-\ 2. Получить уравнение для производной от X112. 112
196 МАТРИЦЫ И ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ [ГЛ. 10 § 3. Нормы векторов и матриц. Мы могли бы при желании ис- использовать скалярную функцию (*, *) как меру вектора х. Однако более удобно использовать не эту евклидову норму, а более простое выражение 11*11= 21*,1 A) i=i для вектора и N 11/111 = 2 \atJ\ B) i, /=i для матрицы. Легко проверяется, что ll+lllHI. \\A f 11*11, Ikii4il=kil -1ИИ. Причиной, по которой мы выбрали предыдущие выражения в ка- качестве норм для вектора и матрицы, является то, что проверка всех результатов C) чрезвычайно проста. Как мы увидим в упражнениях, приведенных в' конце параграфа, имеется большой выбор в определении нормы. Все нормы в равной степени при- применимы при рассмотрении конечномерных векторов и матриц. Выбор нормы становится делом более сложным лишь в случае, когда мы обращаемся к бесконечномерным векторам и ма- матрицам. Упражнения 1. Показать, что в качестве норм, удовлетворяющих соотношениям C), можно выбрать выражения / N \1/2 11*11=B |*) N \1/2 2 К/12 = ./=1 / 2. Если мы положим |jx|| = max |xi|, какое определение необходимо при- принять для ||Л||, чтобы все неравенства C) выполнялись? 3. Пусть ||*|| есть норма вектора х, удовлетворяющая условиям 11*Н + 11»11>11* + »11, Цс,*||=|с,|М, И*11>0 и ||JC|| = O тогда и только тогда, когда х=0. Показать, что выражение ||Л||= max \\Ax\\ определяет норму 11*11=1 матрицы, удовлетворяющую остальным неравенствам C). (Это стандартный путь введения нормы операторов.) 4. Если для вектора х мы используем норму, введенную в упражнении 2, то какую норму мы получим для А, используя прием упражнения 3?
«5] СУЩЕСТВОВАНИЕ И ЕДИНСТВЕННОСТЬ РЕШЕНИЙ 197 5. Показать, что сходимость последовательности векторов {хл} к век- вектору х по норме влечет покоординатную сходимость и обратно, сходимость по всем координатам влечет сходимость по норме. 6. Показать, что сходимость последовательности векторов {хп} по одной из норм, удовлетворяющей условиям упражнения 3, влечет сходимость по любой другой норме, удовлетворяющей этим же условиям. 7. Показать, что x(t)dt A (t)dt U(t)\\dt. 8. Показать, что ||ЛП||^||ЛЦП для любой нормы, удовлетворяющей соот- соотношениям C). 9. Существует ли норма, удовлетворяющая неравенствам C), для кото- которой \\АВ\\ = \\А\\ \\B\\? § 4. Бесконечные ряды векторов и матриц. В ходе доказатель- доказательства существования решений линейного векторного уравнения, введенного выше, нам понадобятся бесконечные ряды векторов и матриц. Под вектором 2 х" мы будем понимать вектор, г'-я со- оо ставляющая которого есть сумма ряда 2 *"• Поэтому сходи- сходимость векторного ряда эквивалентна одномерной сходимости N оо рядов 2 хг Отсюда следует, что достаточным условием сходи- оо мости векторного ряда 2 х" является сходимость скалярного оо ряда 2 II-*" II- оо Подобно этому матричный ряд вида ^j An представляет со- собой ./V2 рядов, а для сходимости матричного ряда достаточно, оо чтобы сходился ряд 2 II А„ ||. «=0 § 5. Существование и единственность решений линейной систе- системы уравнений. Благодаря этим предварительным замечаниям мы можем доказать следующий основной результат.
198 МАТРИЦЫ И ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ [ГЛ. 10 Теорема 1. Если матрица A(t) непрерывна при t^-О,. то решение векторного дифференциального уравнения dx dt = A(t)x, A) существует для всех t !> О, является единственным и может быть записано в виде x=X(t)c, B) где X(t) — матрица, определенная единственным образом и удо- удовлетворяющая матричному дифференциальному уравнению ^- = A(t)X, X(O) = I. dt C) Доказательство. Для установления существования ре- решения C) мы используем метод последовательных приближений. Рассмотрим вместо C) эквивалентное интегральное уравнение = I+ J A{s)Xds. D) Определим последовательность матриц {А"п} следующим образом: Xn+l=I+ J A{s)Xnds, я = 0, 1,2, ... E) о Далее имеем t Хп+1 - Хп = J A (s) (Хп ~ Хп-Х) ds, «=1,2,... F) о Положим m= max G) Здесь и далее мы используем определение нормы C.1) и C.2). Используя F), получим при 0 <! / ^/( у V II лп+1 ~~ Лп II — JA(s)(Xn-Xn-l)ds s. (8)
•§ 5] СУЩЕСТВОВАНИЕ И ЕДИНСТВЕННОСТЬ РЕШЕНИЙ 199 Поскольку в этом же интервале t : j\\A(s)\\ds^mt, (9) о то, используя (8), по индукции получим || Хп+\ — Хп\\^ -7—гтгг при сю Следовательно, ряд 2 (Хп+\ — Хп) сходится равномерно в интер- интервале [0, t{\. Поэтому матрица Х„ равномерно сходится к матрице X(t), которая удовлетворяет уравнению D), а следовательно, и C). В предположении, что A(t) непрерывна при t^-О, мы можем зыбрать t\ сколь угодно большим и, таким образом, получим ре- решение, существующее при всех t ^ 0. Легко проверяется что x = X(t)c есть решение уравнения A), удовлетворяющее требуемому начальному условию. Установим далее единственность решения уравнения C). Пусть имеется другое решение, которое мы обозначим через У. Тогда У удо- удовлетворяет D), и, следовательно, мы имеем соотношение t X-Y-$A{s)[X{s)-Y(s)]ds. A1) о Поэтому t || X - У IK J II A (s)\\ \\X(s) - У (s)\\ds. A2) о Так как матрицы У и X дифференцируемы, а следовательно, непрерывны, то существует максимум m,= max \\X-Y\\. A3) Из A2) получим || X - У |К mI J II A (s)Ms, 0 </</,. A4) о Используя неравенство A2), мы получим ( * V t , s m, lj \\A(s)\\dsj IU-l'IKmijM(s)||M||i4(sl)||rfsIJrfs< ^—2 —. A5) t
200 МАТРИЦЫ И ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ [ГЛ. 10 Продолжая итеративную процедуру, мы получим тЛ ^\\A{s)\\ds t ^\\A{s)\\d Устремляя п к бесконечности, мы видим, что \\Х—У!|<^0. По- Поэтому /Т=У. Имея матрицу X, легко построить решение уравнения A). Оно равно X(t)c. Единственность решения уравнения A) легко установить, используя те же рассуждения, что и выше. Упражнение 1. Доказать существование решения уравнения A) при условии интегри- интегрируемости матрицы A(t) в смысле интеграла Римана в любом конечном ин- интервале. Должно ли дифференциальное уравнение в этом случае удовлетво- удовлетворяться всюду? Рассмотреть, в частности, случай A(t)= А при 0^^/0 и А (t)=B при t>t0. § 6. Матричная экспонента. Рассмотрим теперь частный слу- случай, когда A (t) — постоянная матрица. В скалярном случае урав- уравнение ^Г = аи, н@) = с, A) имеет решение u = eatc. Было бы очень удобно найти аналогичное решение для матричного уравнения ^ = АХ, Х@) = С, B) имеющее форму X — eAtC. По аналогии со скалярным случаем и имея в виду метод по- последовательных приближений, использованный в § 5, мы попы- попытаемся определить матричную экспоненциальную функцию по- посредством ряда eAt = I + At+ ...+ -~ ... C) Докажем следующий результат: Теорема 2. Матричный ряд, определенный выше, суще- существует для всех матриц А при любом фиксированном t, и для фиксированной матрицы А он равномерно сходится в любой ко- конечной области комплексной плоскости t. Доказательство. Мы имеем И-4УЦ ^ ||Л||" И" ... п\ ^ nl~ • W
§8] ФУНКЦИОНАЛЬНЫЕ УРАВНЕНИЯ — И 201 Учитывая, что ||Л|[П \t \n/nl является общим членом разложения в ряд экспоненты gMIH", мы видим, что ряд C) мажорируется равномерно сходящимся рядом и, следовательно, сам равномер- равномерно сходится в любой конечной области плоскости /. Упражнение 1. Использовав представление eAt в виде ряда, показать, что— {eAt) = § 7. Функциональные уравнения — I. Скалярная экспоненци- экспоненциальная функция удовлетворяет основному функциональному то- тождеству: (,a(s+t) = easeat IJ \ До тех пор, пока аналогичное равенство не доказано для ма- матричной экспоненты, мы не имеем права использовать обозначе- обозначение F.3). Покажем далее, что eA(s+t)—eAseAt_ B) Используя разложение в ряд для трех экспоненциальных функ- функций и тот факт, что члены абсолютно сходящегося ряда можно группировать произвольным образом, можно записать -2W2 kit\ Полагая в B) s =—t, мы получим важный результат: eA(-t+t) — J _. g-AteAt_ D^ Следовательно, матрица eAt всегда невырождена и ее обратная равна е~м. Это матричный аналог того факта, что скалярная экспонента никогда не обращается в нуль. § 8. Функциональные уравнения — II. Доказательство функцио- функционального равенства в § 7 является скорее проверкой результата, чем выводом. Для понимания результата обратимся к диффе- дифференциальному уравнению АХ A) Заметим, что eAt есть решение этого уравнения при начальном условии Х@) = /, a eA(s+')—решение при Х@) = eAs. Поэтому из теоремы единственности мы можем заключить, что eA(s+') = eA(eAs.
202 МАТРИЦЫ И ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ [ГЛ. 10 § 9. Функциональные уравнения — III. После вывода функцио- функционального равенства, обсуждавшегося выше, возникает естествен- естественный вопрос о связи между е(А+в>( и eAteBt. Поскольку (А+В)t^i + {A + B)t+ {А A) то e<A+B)t-eAteBt = (BA-AB)-Y+... B) Следовательно, равенство e^A+B)t = eAteBt справедливо для всех t только в случае, когда АВ — ВА, т. е. когда матрицы А и В пере- перестановочны. Легко видеть, что это условие является и доста- достаточным. § 10. Невырожденность решения. В § 7 мы установили, что матрица eAt всегда невырождена. Докажем теперь, что этот факт вытекает из общего результата, заключающегося в том, что решение уравнения ^ = A{t)X, X@) = /, A) является невырожденным в любом интервале O^Ct^Cti, в кото- ром существует интеграл ||Л(/)||с?/. о Имеется несколько путей доказательства. Наиболее интерес- интересный из них изложен ниже, в то время как два других метода даны далее в качестве упражнений. Рассматриваемый метод ба- базируется на тождестве Якоби: t Jsp A (s) ds |*@1 = е° • B) Для вывода этого результата рассмотрим производную от ска- скалярной функции \X(t) \. Для упрощения обозначений рассмо- рассмотрим двумерный случай. Мы имеем C)
§ 10] причем и Далее имеем _d_ dt НЕВЫРОЖДЕННОСТЬ РЕШЕНИЯ ^ = аих{ + а12х2; du2 ^, @) = 0, у2@)=-1. 203 D) E) \X(t)\ = dxt dyi dt ~dT X-i y2 + dx dt &12%2 &\\У\ *~ ^12 = «i, У\ 2 У1 + У) dt + «22 X Xr X\ У\ G) = Sp(A(t))\X(t)\. F) У-2 Поскольку, кроме того, \Х@)\ = 1, то t J Sp A (s) ds Упражнения t. Рассмотреть уравнения —j— = A (t) X, X @) = /, и —— = — КЛ (/), Y@) = I. Показать, что Y — X~x и что матрица X(t) является невырожденной в любом интервале, где интегрируема ||Л(^)|]. 2. Рассмотреть дифференциальное уравнение второго порядка u" + p(t)u' + q(t)u. Обозначив u' — v, показать, что данное уравнение экви- эквивалентно следующей системе уравнений первого порядка: du_ dt ¦ = v, 3. Рассмотрим интеграл /= w {и" + р (t) и' + q (t) и) dt. Интегрируя 0 U [...]+J u(w" + Pl(t)w' + ql(t)w)dt. частям, получим
204 МАТРИЦЫ И ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ [ГЛ. 1» Какова связь между векторно-матричной системой для уравнения w" + pi(t)w'+q\(t)w = 0 и векторно-матричной системой для уравнения u" + p(t)u' + q(t)u = 0? 4. Рассмотреть следующее доказательство невырожденности матрицы X(t). Если |Х(/)|=0 в некоторой точке t2, 0^t2^t\, то существует линейная зависимость между столбцами матрицы X(t2), т. е. с1х1 + с2х'2 + , . . + сххл' = 0. Поскольку C\Xl-\-c2x2+.. , + cNxN есть решение уравнения —j- = A(t)x, то из равенства его нулю в одной точке следует тождественное равенство нулю в интервале [0, tt]. Однако это противоречит условию \X(t)\ = l при / = 0. § 11. Решение неоднородного уравнения. Постоянные коэффи- коэффициенты. Рассмотрим теперь задачу решения неоднородной си- системы A^- = Ax + f(t), х@) = с. A) Здесь выявляется преимущество матричного экспоненциального обозначения. Мы имеем ^-Ax) = jj (e~A'x) = e'Atf, B) следовательно, t e~Atx = c+ | e~Asf(s)ds C) о или t X = eAtc + J eA «-s) f(s) ds. D) о Заметим, что использование матричной экспоненциальной функ- функции позволяет нам записать решение системы A) точно в такой же форме, что и в случае скалярного уравнения. § 12. Неоднородное уравнение. Переменные коэффициенты. Рассмотрим случай, когда матрица А зависит от времени. Наша цель состоит в решении системы dx dt ¦ = A(t)x+f(t), x@) = c. A) Воспользуемся методом вариации постоянных интегрирования,, принадлежащим Лагранжу, и попытаемся найти решение в фор- форме х = Ху, где X=X(t)—решение уравнения dX/dt=A(t)Xr Х@)=[. Подстановка в A) даст уравнение X'y + Xy'=A(t)Xy + Xy'=A{t)Xy+f(t). B) Поэтому X' f(ty C).
§ 13] СОПРЯЖЕННАЯ СИСТЕМА 205 и, следовательно, D) Интегрирование D) даст у = с+ J X-'(s)f(s)ds. E) о Мы приходим к соотношению t х = X (t) с + J * (t) X~x (s) f (s) ds, F) о которое является обобщением результата A1.4). § 13. Неоднородное уравнение. Сопряженная система. Проде- Продемонстрируем далее другой подход, являющийся одним из наи- наиболее важных в общей теории линейных функциональных урав- уравнений. Пусть Y(t)—переменная неопределенная пока матрица. Проинтегрируем в пределах от 0 до t уравнение ^ A) Интегрируя по частям, получаем следующий результат: t Y(t)x(t)-Y(O)c-\ *L. = I Y(s)A (s) x(s)ds-t ^ Y (s)f(s) ds. B) о о Без потери общности мы можем принять с = 0, поскольку мы всегда можем получить общее решение уравнения A2.1), приба- прибавив к частному решению слагаемое X(t)c. Поскольку нашей целью является получение решения x(i), мы примем наиболее удобное из возможных допущений относительно матрицы Y(t), а именно, что ~=-Y(s)A(s), 0<S<i, (За) Y(t) = I. C6) Если мы сможем удовлетворить обоим этим уравнениям, то ре- решение сходного уравнения A2.1) записывается в простой форме: t х= JY(s)f(s)ds. D)
206 МАТРИЦЫ И ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ [ГЛ 10 Система C) называется сопряженной по отношению к системе A2.1). Из общей теоремы существования и единственности, до- доказанной выше, вытекает, что решение системы C) существует и является единственным. Матрица Y является при этом функ- функцией от s и /. Упражнение 1. Показать, что Y(s, t) = X(t) X~l (s). § 14. Теория возмущений. Интересные приложения получает формула для решения неоднородного уравнения в теории воз- возмущений. Рассмотрим матричную экспоненциальную функцию ел+гв_ jv\bI хотим представить ее в виде ряда по степеням е: оо еА+гв = ел + 2e"QBC4, В). A) Задача легко решается, если матрицы А и В перестановочны, по- поскольку тогда Рассмотрим поэтому более интересный случай, когда АВфВА. Если мы запишем и попытаемся сгруппировать члены с одинаковой степенью е, то мы вскоре увидим, что сделать это достаточно трудно. Вместо этой прямой процедуры мы последуем другим путем. Матрица ел+гв есть решение дифференциального уравнения ¦^Г = {А + гВ)Х, Х@) = 1, C) вычисленного в точке t=\. Запишем это уравнение в форме -^- = АХ + еВХ, Х@) = 1. D) Из A1.4) следует, что X удовлетворяет линейному интеграль- интегральному уравнению t X = eAt + е | еА ^s)BX (s) ds. E) о
§ 15] НЕОТРИЦАТЕЛЬНОСТЬ РЕШЕНИЯ 207 Решая это интегральное уравнение Вольтерра методом последо- последовательных приближений, мы получим бесконечный ряд вида X = eAt + e J еА^>BeAsds+ ... F) о Поэтому разложение в ряд матрицы еА+ев содержит следующи два первых члена: = еА + е J eA (l-s)BeAs ds+ ... G) Упражнения 1. Положить X (t) — е + 2 г'1Рп @ и использовать E) для вывода п=\ рекуррентного соотношения, связывающего Pn(t) и Pn-\(t). 2. Приняв допущение, что eAteBt может быть записано в форме ес (этот результат будет установлен ниже), где C=^Cit + C2t2 + C3t3 + ..., определить матрицы Си С2, С3. 3. Приняв, что ел+вв может быть записана в форме определить матрицы С\, С2, Сз ')• (Разложение в ряд G) обладает тем серьезным недостатком, что для матрицы ел + ев, являющейся унитарной в случае, если А и В косоэрмитовы, оно дает приближение, не являющееся унитарным. Разложение, приведенное выше, лишено этого недостатка.) § 15. Неотрицательность решения. Следующий вопрос возни- возникает в математической экономике. Рассмотрим уравнение 4? x@) = c, A) где А — матрица коэффициентов. Каковы необходимые и доста- достаточные условия, наложенные на матрицу А, чтобы все компонен- компоненты вектора х были неотрицательны при t^-О при условии, что компоненты с неотрицательны и компоненты f(t) неотрицатель- неотрицательны при t > 0. Обращаясь к A1.4), мы видим, что достаточное условие сво- сводится к неотрицательности элементов eAl при />0. Легко ви- видеть, что это условие является также необходимым. Неожиданным является то, что имеется очень простой кри- критерий выполнения этого условия. ') См. также Фер (F. Fer), Acad. Roy. Belg. Cl. Sci. 44, № 5 A958), 818—829.
208 МАТРИЦЫ И ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ [ГЛ. 10 Теорема 3. Для неотрицательности всех элементов матри- матрицы eAi при t ^ 0 необходимо и достаточно, чтобы ai}>0, 1Фи i,j=\,2,...,N. B) Доказательство. Поскольку e*t = I + At+ ..., C) то ясно, что условие B) необходимо для того, чтобы см было неотрицательным при малых t. Чтобы установить достаточность, покажем, что условие а^>0 при 1Ф\ приводит к положитель- положительности элементов eAt при всех t. Ясно, что это условие гаранти- гарантирует положительность eAt при малых t. Для любого целого п имеем тождество eA(=(eA'/")«. D) Тот факт, что произведение положительных матриц само являет- является положительным, доказывает требуемый результат. Так как элементы eAt являются непрерывными функциями ctij, то мы видим, что положительность элементов eAt при поло- положительных a.ij(i ф /) означает неотрицательность элементов eAt при а,-3-> 0 (i Ф /). Другой, более прямой путь доказательства достаточности условия B) сводится к следующему. Пусть С\ — скаляр такой, что все элементы матрицы A + cJ неотрицательны. Тогда ясно, что все элементы матрицы е<А+С11'г неотрицательны. Элементы диагональной матрицы e~CiIt также неотрицательны в силу не- неотрицательности экспоненциальных функций. Заметив, что ма- матрицы A + cJ и —С\1 перестановочны и что поэтому eAt _ e(A+cJ)t-cJt = e(A+cJ)te-cJt E) получим желаемый результат. Упражнения 1. Доказать предыдущий результат, используя систему дифференциаль- дифференциальных уравнений N 2. Показать, что условие a;j(/)^O Aф j) достаточно для того, чтобы обеспечить неотрицательность решения соответствующей системы дифферен- дифференциальных уравнений с переменными коэффициентами, если начальные усло- условия неотрицательны. § 16. Функциональное уравнение Пойа. Мы видели, что мат- матрица Y(t) =eAt удовлетворяет функциональному уравнению —oo<s, t<oo , A)
§ 16] ФУНКЦИОНАЛЬНОЕ УРАВНЕНИЕ ПОЙА 209 Возникает интересный и важный вопрос о том, существуют или нет другие типы решений этого фундаментального матричного уравнения. Ответ является простым, если считать, что Y(() имеет первую производную при всех конечных t. Дифференцируя A) один раз по t, а другой раз по s, мы получим два уравнения: = Y(s)Y'(t), = Y'(s)Y(t). {> Поэтому Y(s)Y'(t) = Y>(s)Y(l). C) Из A) мы видим, что У@)=У(—t)Y(t), а отсюда видно, что матрица Y(t) не может быть вырожденной ни при одном /*). Поэтому согласно C) Y-1(s)Y'(s) = Y'(t)Y-i(t) D) для всех s и I. Следовательно, Y'(t) Y~l (t) = Л, где А — постоян- постоянная матрица. Уравнение Y'(t)=AY(t) E) приводит нас к формуле Y(t) — eAtY@). Получим теперь более общий результат. Теорема 4. Пусть Y(t) — непрерывная матричная функция от t, удовлетворяющая функциональному уравнению A) при 0-*Cs, t^.s + t-^Cto- Тогда в интервале [0,t0] матрица Y(t) запи- записывается в виде Y(t)=eAt, где А — некоторая постоянная ма- матрица *). Доказательство. Рассмотрим риманов интеграл * jv f Y(s)ds = lim У У (йв) б, F) где N определяется из условия N6 = t. Поскольку из A) при 6>0 следует, что У(*б) = У((*-1)в)У(в) = У*(б), G) мы получаем Г У (s)ds = lim У Yk (б). (8) о в->°*-о Мы также имеем N ^^ I. (9) k=0 *) Предполагается, что F@)—невырожденная матрица. Полагая в A) s = f=O, получаем К@) = У2(О); отсюда Y@)-I. (Прим. ред.) 14 Р. Беллман
210 МАТРИЦЫ И ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ [ГЛ. 10 Это приводит к соотношению Поскольку У@) = /, то в силу непрерывности У (t) t A1) и, следовательно, матрица Y(s)ds является невырожденной о при малых t. Отсюда следует, что для фиксированного ма- малого t и достаточно малого б матрица \У(&6N является невырожденной и k = 0 1 \0 1 / t \ -1 Игл J] У (?6N =My(S)dsj . A2) Поэтому из A0) следует, что [У F) — /]/б имеет предел при 6-+0. Обозначим этот предел через А. Тогда для малых t (^) [{ . A3) Отсюда получаем J = Y(t)-I A4) и дифференцированием найдем Y'{t) = AY{t), У@) = /, A5) во всяком случае для малых t. Из функционального уравне- уравнения уже нетрудно заключить, что Y(t) — eAt для всех t в ин- интервале [0, /0].
$17] УРАВНЕНИЕ ^jj--AX + XB 21! Упражнения 1. Найти ошибку в следующем выводе, основанном на соотношении A0): Согласно A0) имеем N lim 6->o t J J 6->о и и т. д. 2. Пусть Y и Z являются решениями уравнений dY dZ dt ' dt ' Тогда решение уравнения dX dt " дается равенством X = YCZ. 3. Запишем линейное уравнение и" + р (t) и' + q (t) м=0 в форме [ 1П Пусть и\ и и2 — линейно независимые решения уравнения второго порядка. Используя предыдущий результат, показать, что функция M = a1«i+a2Mi«2 + H2 является решением уравнения и'" + Зр @ и" + [2р2 @ + р' @ + 4д @] и' + [Ар (t) q (t) + 2q' (t)]u = 0. § 17. Уравнение -^- = AY+Xfi. Докажем теперь следующую теорему. Теорема 5. Решение уравнения dt дается равенством АХ + ХВ Х@) = С, A) = eAtCem. B) Доказательство проводится непосредственно подстановкой. Этот результат (см. также упражнение 2 § 16), несмотря на свою простоту, играет важную роль в различных областях ма- математической физики. 14*
212 МАТРИЦЫ II ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ [ГЛ. 10 Упражнения 1. Получить решение, данное выше, разыскивая его в форме X = eAtY. 2. Пусть Y(t) является квадратным корнем из X(t). Показать, что dt) ' \ dt) dt ¦ § 18. Уравнение AX + XB = С. Используя результат, установлен- установленный выше, мы можем доказать следующую теорему: Теорема 6. Если матрица оо X - - J eAtCeBt dt A) о существует для всех С, то она является единственным решением иравнения АХ+ХВ = С. B) Доказательство. Рассмотрим уравнение ~ Z@) = C. C) Согласно теореме 5 его решение Z(t) определяется формулой A7.2). Проинтегрируем обе части C) в пределах от 0 до оо в пред- предположении, что limZ(^) =0 **). В результате получаем t -С = АП Zdsj + П ZdsJB. D) Мы видим, что матрица X, равная оо оо - J Zds = - j eAsCeBsds, о о удовлетворяет уравнению B). В гл. 12 мы детально обсудим во- вопрос существования интеграла A) и решения уравнения B). Единственность решения следует из линейности уравне- уравнения B). Действительно, рассматривая матричное уравнение B) как N2 скалярных линейных уравнений для элементов Хц ма- матрицы X, мы видим, что из существования решения для всех матриц С следует отличие от нуля определителя коэффициентов системы. Следовательно, полученное решение единственное. *) См. упражнение 2, стр. 195. (Прим. ред.) **) Этот факт следует из существования интеграла A) и не является дополнительным предположением. (Прим. ред.)
БИБЛИОГРАФИЯ И КОММЕНТАРИИ 21* Упражнения к гл. 10 1. Рассмотрим последовательность матриц {Хп}, определенную рекур- рекуррентным соотношением Каким условиям должны удовлетворять матрицы А и В, чтобы эта после- последовательность сходилась, и чему равен ее предел? 2. Если матрица А является положительно определенной, a B(t) поло- положительно определена для всех <>0, причем |Л|^|В(<)| при />0, то для любой неотрицательной функции g(t) такой, что g(t)dt—l, имеет место о неравенство J В (t) g (t) dt о I 3. Если А — положительно определенная матрица, причем такая, что то последовательность матриц, определенная посредством рекуррент- рекуррентного соотношения сходится к положительно определенному квадратному корню из А1). 4. Задача определения величин X, удовлетворяющих детерминантному уравнению |/ — XFi— №F2—... — XhFk | = 0, где Ft — квадратные матрицы Л/-го порядка, эквивалентна задаче определения собственных значений мат- матрицы Fi F2... Fk I 0 ... 0 0 0 о о о| См. Га дер ли (К. G. Guderley), On Nonlinear Eigenvalue Problems, for Matrices, J. Ind. and Appl. Math. 6 A958), 335—353. Библиография и комментарий § 1. Вопросы определения равновесия и теория устойчивости систем дифференциальных уравнений начали непосредственно и почти одновременно изучаться Ляпуновым и Пуанкаре. По- Подробные ссылки и обсуждение результатов может быть найдена в гл. 13 и в книге Беллман (R. Bellman), Stability Theory of Differential Equations, McGraw-Hill Book Company, Inc., New York, 1954. [Русский перевод: Теория устойчивости дифференциальных уравнений, ИЛ, 1954]. ') Виссер (С. Visser), Notes on Linear Operators, Proc. Acad, Sci. Amsterdam 40 A937), 270—272,
214 МАТРИЦЫ И ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ [ГЛ. 10 Некоторые интересные преобразования дифференциальных матричных уравнений содержатся в следующих статьях: Баррет (J. H. Barrett), Matrix Systems of Second Order Differential Systems, Portugalicae Math. 14 A955), 79—89; Баррет (J. H. Barrett), A Prufer Transformation for Matrix Diffe- Differential Equations, Proc. Amer. Math. Soc. 8 A957), 510—518; Левин (J. J. Levin), On the Matrix Riccati Equation, Proc. Amer. Math. Soc. 10 A959), 519—524. § 2. Понятие матричной экспоненты является центральным во всех работах в области теории линейных функциональных уравнений. Его обобщение на класс произвольных операторов является краеугольным камнем теории полугрупп. См. Хилле (Е. Hi lie), Functional Analysis and Semi-groups, Amer. Math. Soc. Publ., 1942. [Русский перевод: Функциональный анализ и полугруппы, ИЛ, 1951]; Хилле и Филлипс (Е. Н i 11 е, R. Phillips), Functional Analysis and Semi-groups, Amer. Math. Soc. Colloq. Publ. 31 A958). [Русский перевод: Функциональный анализ и полугруппы, ИЛ, 1961]. Проблема представления eAteBt в виде ect, где Л и В не ком- коммутируют, является весьма важной не только в теории групп и алгебр Ли, но и в современной квантовой теории. Этот материал послужит объектом специального исследования в следующем томе этой серии. Читатель, интересующийся деталями, может обратиться к статьям: Магнус (W. Magnus), Algebraic Aspects of the Theory of Systems of Linear Differential Equations, Research Rept., BR-3, New York University, Institute of Mathematical Sciences, June 1953, см. также Comm. Pure Appl. Math. 7, № 4 A954); Бейкер (Н. F. Baker), On the Integration of Linear Differential Equations, Proc. London Math. Soc. 34 A902), 347—360; 35 A903), 333—374; second series 3 A904), 293—296; Бейкер (H. F. Baker), Alternants and Continuous Groups, Proc. Lon- London Math. Soc, second series 3 A904), 24—47; Келлер X. и Келлер Дж. (Н. В. Keller and J. В. Keller), On Systems of Linear Ordinary Differential Equations, Research Rept. EM-33, New York University, Washington Square College, Mathematics Research Group, 1957; Хаусдорф (F. Hausdorff), Die Symbolische exponential Formel in der Gruppentheorie, Saechsischen Akademie der Wissenschaften zu Leipzig, Math, Phys. Klasse 58 A906), 19—48; Голдберг (К. Goldberg) The Formal Power series for log (exev), Duke Math. J. 23 A956), 13—21 *); Чен Кво-цай (К v о - T s a i Chen), Integration of Paths, Geometric Invariants and a Generalized Baker-Hausdorff Formula, Ann. Math. 65 A957), 163—178. *) См. также Е. Б. Д ы н к и н, О представлении ряда log (exey) от лекоммутирующих х и у через коммутаторы, Матем. сб. 25 F7) A949), J 55—162.
БИБЛИОГРАФИЯ И КОММЕНТАРИЙ 215- Другое направление в проблеме отыскания решения уравне- j у ния вида -jj- = A(t) X, Х@) = /, приводит к понятию экспонен- экспоненциала. Изучение этого вопроса связано с теорией мультиплика- мультипликативного интеграла. См. работы Шлезингер (L. Schlesinger), Neue Grundlagen fur einen Infini- tesimalkalkul der Matrizen, Math. Z. 33 A931), 33—61; Шлезингер (L. Schlesinger), Weitere Beitrage zum Infinitesimal- kalkul der Matrizen, Math. Z. 35 A932), 485—501; Раш (G. Rasch), Zur Theorie und Anwendung des Produktintegrals, J. Reine angew. Math. 171 A934), 65—119. Результаты более поздних исследований содержатся в ра- работе Магнус (W. Magnus), On the Experimental Solution of Differential Equations for a Linear Operator, Comm. Pure Appl. Math. 7 A954), 649—673. Для понимания связи с физической стороной этой проблемы см. Фейнман (R. P. Feynman), An Operator Calculus Having Applica- Applications in Quantum Electrodynamics, Phys. Rev. 84 A951), 108—128. Наконец, упомянем, что большие усилия были сделаны в области обобщения этих результатов и методов применительно к бесконечной системе линейных дифференциальных уравнений с постоянными коэффициентами. Системы подобного типа есте- естественным образом появляются в теории вероятностей и, в част- частности, в ее приложениях к физике и биологии при изучении про- процессов «размножения и гибели». Эти вопросы вновь будут обсу- обсуждаться в гл. 16. См. также Арли и Борксениус (N. Arley and A. Borchsenius), On the Theory of Infinite Systems of Differentia! Equations and Their Applications to the Theory of Stochastic Processes and the Perturbation Theory of Quantum Mechanics, Acta Math. 76 A945), 261—322; Беллман (R. Bellman), The Boundedness of Solutions of Infinite Systems of Linear Differential Equations, Duke Math. J. 14 A947), 695—706. § 3. Дальнейшие результаты, касающиеся норм матриц, и дальнейшие ссылки могут быть найдены в работах Хаусхолдер (A. S. Householder), The Approximate Solution of Matrix Problems, J. Assoc. Сотр. Mach. 5 A958), 205—243; Нейман и Голдстайн (J. von Neumann and H. Goldstine), Numerical Inverting of Matrices of High Order, Bull. Amer. Math. Soc. 53 A947), 1021 — 1099; Островский (A. Ostrowski), Uber Normen von Matrizen, Math. Z. 63 A955), 2—18; Фан Цзыи Гофман (К у Fan and A. J. Hoffman), Some Metric Inequalities in the Space of Matrices, Proc. Amer. Math. Soc. 6 A955), 111—116;
¦216 МАТРИЦЫ И ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ [ГЛ. 10 Истерфилд (Т. Е. Easterfield), Matrix Norms and Vector Measu- Measures, Duke Math. J. 24 A957), 663—671. § 5. Читатель, знакомый с теорией интеграла Лебега, может заметить, что результат теоремы 1 может быть получен при гораздо более слабых ограничениях на матрицу A(t). Мы, одна- однако, не стремились к формулировке более общего результата, по- поскольку в этом не было необходимости. § 14. Изменение собственных значений А, вызванное измене- изменением размерности, может быть рассмотрено с привлечением ме- методов, изложенных в работе Беллман и Леман (R. Bellman and S. Leman), Functional Equa- Equations in the Theory of Dynamic Programming, X: Resolvents, Characteristic Values and Functions, Duke Math. J., 1960. § 15. Вопросы неотрицательности решений функциональных уравнений играют большую роль в теории вероятностей и в ма- математической экономике, где физические модели делают резуль- результаты интуитивно ясными. Мы вернемся к этим вопросам в гл. 16. Их рассмотрение существенно также при изучении различных классов нелинейных уравнений. См. работы Беллман (R. Bellman), Functional Equations in the Theory of Dynamic Programming, V : Positivity and Quasi-linearity, Proc. Nat Acad. Sci. U. S. A, 41 A955), 743—746; Калаба (R. Kalaba), On Nonlinear Differential Equations, the Maxi- Maximum Operation, and Monotone Convergence Ph. D. Thesis, New York Univer- University, February, 1958. Обсуждение вопроса о положительности операторов содер- содержится в гл. 5 монографии Бекенбах и Беллман (Е. F. Beckenbach and R. Bellman), Inequalities, Ergeb. Math., 1960. [Русский перевод: Неравенства, «Мир», 1965.] Первое доказательство дано С. Карлиным; второе получено О. Таусски. Впервые этот результат опубликован в статье Беллман, Гликсберг, Гросс (R. Bellman, I. Glicksberg .and О. Gross), On some Variational Problems Occurring in the Theory of Dynamic Programming, Rend. Circ. Palermo, Serie II, 1954, 1—35. § 16. Результат и доказательство см. в работе Пой a (G. Pol у a), Ober die Funktionalgleichung in Matrizkalkul, Sitz- Ъег, Akad. Berlin, 1928, 96—99. § 17. Мы не можем точно указать источник этого результата, который встречается в работах многих авторов. Развернутое об- обсуждение этого и связанных вопросов содержится в работе И. А. Лаппо-Данилевский, Memoires sur la theorie des systemes •des equations differentielles lineaires, Тр. физ.-матем. ин-та АН СССР 5 <1934), 7 A935), 8 A936).
БИБЛИОГРАФИЯ И КОММЕНТАРИЙ 217 Тот факт, что решение уравнения -jt~ = АХ + ХВ имеет ука- указанную форму, становится весьма прозрачным, если рассмотреть его под углом зрения квантовой механики. См. Хаар (D. ter Haar), Elements of Statistical Mechanics, Rinehart & Company, Inc., New York, 1954, 149; Намбу (Y. Nambu), Progr. Theoret. Phys. (Kyoto) 4 A949), 331; Примас и Гунтхард (Н. Primas and H. Gunthard), Eine Methode zur direkten Berechnung ..., Helv. Phys. Acta 31 A958), 413—434. § 18. Рассуждения, связанные с оператором Т, определенным посредством равенства ТХ=АХ — ХВ, см. в работе Розенблюм (М. Rosenbloom), On the Operator Equations BX — XA = Q, Duke Math. J. 23 A956), 263—269. Обобщение на оператор 5, определенный как SX— 2 AjXBJr см. в работе Люмер и Розенблюм (G, Lumer and M. Rosenbloom), Linear Operator Equations, Proc. Amer. Math. Soc. 10 A959), 32—41. Упражнения 2 и З взяты из статьи Беллман (R. Bellman), On the Linear Differential Equation Whose Solutions Are the Products of Solutions of Two Given Linear Differential Equa- Equations, Bol. Unione mat. Italiana, Ser. Ill, anno XII, 1957, 12—15. Глубокая связь теории матриц с теорией поведения решений линейных дифференциальных уравнений и, следовательно, с из- изучением линейных колебательных систем приводит к прекрасной теории, развитой в статье Ф. Р. Гантмахер и М. Г. К р е й н, Sur les matrices completement non negatives et oscillatoires, Сотр. math. 4 A937), 445—476*). Как будет отмечено в конце замечаний в гл. 16, эти резуль- результаты имеют важную область приложения в теории вероятностей. Рассмотрение уравнения где А, В и С — симметрические матрицы, при определенных до- дополнительных допущениях относительно вида этих матриц со- содержится в работе Даффин (R. J. D uf f i n), A Minimax Theory for overdamped Networks,. J. Rat. Mech. and Analysis 4 A955), 221—233. *) См. книгу Ф. Р. Гантмахера и М. Г. Крейна, Осцилляционные- матрицы и ядра и малые колебания механических систем, Гостехиздат, 1950.
218 МАТРИЦЫ И ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ [ГЛ. !0 Исследование линейных электрических цепей приводит дру- другим путем к интересной области матричного анализа, а именно к изучению вопроса о том, когда заданная матрица рациональ- рациональных функций может рассматриваться как матричный импеданс разомкнутого n-полюсника. Здесь в качестве фундаментального понятия возникает концепция положительной вещественной ма- матрицы. Последние результаты в этой области и ссылки см. в книге Вейнберг и Слепян (L. Weinberg and P. Slepian), Positive Real Matrices, Hughes Research Laboratories, Culver. City, Calif., 1958. Некоторые интересные результаты относительно связи линей- линейных систем и уравнений Риккати см. в статье Рейд (W. Т. Reid), Solutions of a Riccati Matrix Differential Equation as Functions of Initial Values, J. Math, and Mech. 8 A959), 221—230, где имеются также ссылки на более ранние результаты Редхеф- фера.
Глава 11 ЯВНЫЕ РЕШЕНИЯ И КАНОНИЧЕСКИЕ ФОРМЫ МАТРИЦ ^§ 1. Введение. Хотя результаты, полученные в гл. 10, весьма элегантны, с сожалением приходится отметить, что они не могут нас удовлетворить в тех случаях, когда необходим явный вид компонент решения. В настоящей главе мы исследуем этот вопрос и покажем, что он приводит к задаче определения собственных значений и собственных векторов матриц, не являющихся, вообще говоря^ симметрическими. Так же как и в случае симметрических ма- матриц, мы придем к изучению различных канонических форм. § 2. Метод Эйлера. В гл. 10 мы установили тот факт, что век- торно-матричное уравнение ^ = Ах, х@) = с, A) обладает единственным решением, которое можно записать в виде х = емс. B) Здесь мы изберем другой путь. Следуя Эйлеру, начнем с рассмо- рассмотрения частного решения вида х=еисх, где X — скаляр, ас1 — вектор. При этом забудем на время о начальном условии *@) = = с. Подставляя это решение в уравнение A), мы видим, что Я и с1 связаны равенством кс1 = Ас1. C) Поскольку по предположению вектор с1 отличен от нуля, чис- число К должно удовлетворять характеристическому уравнению |Л-М| = 0. D) При этом с1 является соответствующим собственным вектором. В результате мы с совершенно другой стороны пришли к основ- основной проблеме, рассматривавшейся в первой части книги, — к определению характеристических чисел и собственных векторов
220 ЯВНЫЕ РЕШЕНИЯ И КАНОНИЧЕСКИЕ ФОРМЫ МАТРИЦ [ГЛ. 11 матриц. В данном случае, однако, анализ будет одновременно •более сложным и не столь завершенным, поскольку рассматри- рассматриваемые матрицы не являются симметрическими. Упражнение 1. Найти характеристические числа и собственные векторы матрицы Я 1 0 Я 1 § 3. Построение решения. Посмотрим, каким образом, следуя намеченной линии, можно построить решение, удовлетворяющее заданным начальным условиям. Обозначим, как и ранее, харак- характеристические числа через Яь Яг,. . ., Я#. Поскольку в общем слу- случае эти корни могут быть комплексными, они не поддаются упо- упорядочению. Для упрощения рассуждений будем первоначально считать, что все характеристические числа различны. Пусть с1, с2,... . . . , cN — набор соответствующих собственных векторов, в об- общем случае также комплексных. Используем принцип суперпозиции, чтобы получить требуе- требуемое решение. Поскольку вектор e%kick является решением си- системы при любом к, &=1,2, ..., то при произвольных скалярах Uh линейная комбинация N ¦- У A) dx также окажется решением уравнения —гг= Ах. Теперь вопрос заключается лишь в том, могут ли коэффи- коэффициенты аи быть выбраны таким образом, чтобы удовлетворить условию х@)=с. Это последнее условие приводит к векторному уравнению k=i Система B) имеет единственное решение, если матрица С = {с\ с2, .... cN) B) C) невырождена. При этом, как и ранее, столбцами матрицы С слу- служат собственные векторы с1.
§ 5] ДРУГОЙ МЕТОД 221 § 4. Невырожденность матрицы С. Имеется несколько путей доказательства того факта, что матрица С является невырожден- невырожденной. Следуя одному из них, поступим следующим образом. Пред- Предположим, что |С|=0. Тогда существует нетривиальный набор скаляров Ь\, bz,. .. ,*bN такой, что о=2й*с*. A) k=i Отсюда следует, что функция z=2MV*' B) k=i dx , является решением уравнения —тг — <А.Х, удовлетворяющим на- начальному условию л:@) = 0. Из теоремы единственности выте- вытекает, что 2 = 0 при всех t. Мы должны далее показать, что при различных hi соотно- соотношение o=2ft*<Vftt (з) k=i не может быть выполнено при любых t, если только скаляры bk и векторы ch все не равны нулю. Без ограничения общности примем, что Ь^фО. Деление C) на е lt и дифференцирование по t дают k=2 D) Поскольку Хк различны, то и все разности Kh — Х\ также различ- различны. Теперь мы можем провести доказательство по индукции или просто повторить предыдущую операцию несколько раз. Ясно, что, следуя последним путем, мы придем к соотноше- соотношению вида bNcN (XN - Я,) (Адг - Я2) . . . (KN - *„_,) е^'х^{ = 0. E) Поскольку вектор cN не равен нулю, мы должны иметь bN = 0, что противоречит допущению. § 5. Другой метод. Начав с соотношения D.1), умножим обе части на Л. В результате получим о=21м*с*. A)
222 ЯВНЫЕ РЕШЕНИЯ И КАНОНИЧЕСКИЕ ФОРМЫ МАТРИЦ [ГЛ. II Повторяя эту операцию (TV— 1) раз, приходим к системе линей- линейных уравнений лг Ek' r = 0, 1, 2, .... N-L B) 4=1 Рассмотрим лишь г-е компоненты векторов ch, т. е. ct. Это дает систему скалярных уравнений 0= k=i = 0, 1 JV-1. C) Поскольку не все bh равны нулю и, кроме того, все cht не могут быть равны нулю, когда индексы i и k пробегают все значения от 1 до N, то система C) обязательно имеет нетривиальные ре- решения. Отсюда следует, что должен быть равен нулю определитель коэффициентов системы = l, 2, .... N; r = 0, D) Этого, однако, не может быть, в чем мы убедимся в следующем параграфе. § 6. Определитель Вандермонда. Определитель вида A) носит название определителя Вандермонда. Мы хотим показать, что | Я^ | ф 0, если ХгФК} для всех Простейшим путем доказательства является вычисление опре- определителя. Рассматривая этот определитель как полином от %\ степени N—1, мы видим, что он имеет следующие корни: Л1 = Л2, Я]=лз, ..., Л1 = Я]у. Действительно, определитель равен нулю, если два его столбца совпадают. Отсюда следует, что я'* = 1 я, я? 1 . я2 . я! . яГ1 . .. 1 • • Я.дг 9 -ЛГ-1 I Я*; I = (Я] — Я2) (Я( — Я3) ... (Я! — Ядг) q (Я2, Я3, ..., где функция q не зависит от К\. B)
§ 7] ЯВНАЯ ФОРМА РРШЕНИЯ 223 Аналогично, если считать определитель полиномом степени N—1 от А.2, то он должен иметь сомножителем выражение Продолжая действовать таким образом, мы убедимся, что Л^ ^ у\^ \Аj — Л^) Op (Aj, /*2> • * • > 'vj\')> \3) 1 <></< ЛГ где функция ф является полиномом от К{. Однако сравнивая наи- наибольшие степени, в которых Я, входит в правую и левую части, легко увидеть, что го должна быть константой. Исследование 2 N—1 коэффициентов при члене к\%2 ... Ля в обеих частях равенства дает значение го =1. Из соотношения C) получаем вывод о том, что \кгк если If+Xj при 1ф\. Упражнение 1. Используя аналогичные рассуждения, вычислить определитель Коши 1 Я,+ | i, /= 1, 2 N. § 7. Явная форма решения линейного дифференциального урав- уравнения. Диагональные матрицы. Рассмотрим подход к решению дифференциального уравнения, отличный от предыдущего. В уравнении 4г = А*, х@) = с A) произведем замену переменных х — Ту, где Т — постоянная не- невырожденная матрица, которую мы определим в дальнейшем. Уравнение для у имеет вид Можно ли выбором матрицы Т настолько упростить систему, чтобы она допускала непосредственное интегрирование? Предположим, что мы нашли такую матрицу Г, что матрица ТЛАТ является диагональной: О Г1 AT = C)
224 ЯВНЫЕ РЕШЕНИЯ И КАНОНИЧЕСКИЕ ФОРМЫ МАТРИЦ [ГЛ. 11 Если это выполнено, то уравнения B) распадаются на TV не- независимых уравнений вида ^ = № yt@) = c't, i=l, 2, ..., D) Эти последние имеют простейшие решения: yi — ev"icl. После этого исходный вектор х легко определяется по известному век- вектору у. § 8. Диагонализация матрицы. Рассмотрим весьма интересную, но трудную проблему диагонализации матрицы А. Как нам из- известно из первой части книги, если матрица А является симме- симметрической, то матрица Т, обладающая требуемыми свойствами, всегда может быть найдена. При этом Т'1 = Т/. Как мы увидим сейчас, существуют другие важные классы матриц, которые мо- могут быть приведены к диагональной форме. Не менее важен тот факт, что, помимо диагонального, имеются также другие полез- полезные канонические представления матриц. Рассмотрим, однако, общий случай. Сразу же отметим, что набор величин {цг} должен быть точно таким же, как и {?.,}, по- поскольку характеристические числа матрицы Т~1АТ те же, что и у матрицы А. Как и в предшествующих главах, отсюда следует, что столб- столбцами Т являются собственные векторы матрицы А. Обратно, если все Xt различны, а Т — матрица, столбцами которой яв- являются соответствующие собственные векторы А, то AT =-Т о О A) Мы получили, таким образом, следующий важный результат. Теорема 1. Если характеристические числа матрицы А различны, то существует матрица Т такая, что Т~ХАТ = О B)
СВЯЗЬ МЕЖДУ ДВУМЯ ПОДХОДАМИ 225 Как мы увидим, предположение об отсутствии кратных ха- характеристических чисел является весьма важным. В § 10 мы покажем, что такое простое представление, как B), не может быть получено в общем случае. Упражнения 1. Показать, что теорема Гамильтона — Кэли справедлива для матриц с различными характеристическими числами. 2. Показать, что предположение о существовании N различных характе- характеристических чисел может быть заменено требованием существования Л' ли- линейно независимых собственных векторов. § 9. Связь между двумя подходами. Как мы установили, один из методов решения линейного уравнения dx dt ¦ = Ах, A) приводит к выражению х = емс, в то время как другой, основан- основанный на введении характеристических чисел и векторов, приво- приводит к скалярным экспоненциальным функциям. Установим связь между этими подходами (пока еще в пред- предположении ХгФк}), которая должна существовать вследствие единственности решения. В уравнении dX B) произведем замену переменных X = TY, где Т выбрана в соот- соответствии с § 8. Тогда для Y получим уравнение dt l /li ' ' Y@) = или dY dt 0 Y, Y @) = Г -1 C) D) Отсюда следует, что ei3t Г1 E) 15 P. Беллман
226 ЯВНЫЕ РЕШЕНИЯ И КАНОНИЧЕСКИЕ ФОРМЫ МАТРИЦ и, следовательно, О п-1 О ГГЛ. II F) Подчеркнем еще раз, что это представление получено в пред- предположении, что характеристические числа матрицы А различны. „At Упражнения 1. Вывести формулу F) непосредственно из представления ел" в виде ряда и диагонального представления матрицы Л. 2. Использовать F) для доказательства того, что I еА | = е3рЛ. 3. Используя метод продолжения, показать, что этот результат справед- справедлив для любой квадратной матрицы А. % 10. Кратные характеристические числа. Обратимся к исследо- исследованию случая кратных характеристических чисел матрицы А. Чтобы оценить некоторые из трудностей, с которыми мы можем встретиться в этом случае, начнем с доказательства того факта, что не всегда возможно получить каноническое представление вида (8.2). Теорема 2. Существуют матрицы, которые не сводятся к диагональной форме (8.2) посредством невырожденного преоб- преобразования. Иначе говоря, существуют матрицы N-го порядка, не имеющие N линейно независимых собственных векторов. Доказательство. Рассмотрим матрицу частного вида А = 1 1 0 1 Если существует такая матрица Т, что Г1 AT = Я, 0 0 (О B) то столбцы Т должны быть собственными векторами А. Опре- Определим характеристические числа и собственные векторы. Характеристическое уравнение 1-Я 1 О 1-Я C)
§ 11] КАНОНИЧЕСКАЯ ФОРМА ЖОРДАНА 227 имеет корень Я= 1 двойной кратности. Собственные векторы определяются из уравнений Х\ + Х2 = Х\, D) х2 = х2. Отсюда следует, что х2 = 0, а х\ произвольно. Следовательно, все собственные векторы с точностью до скалярного множителя равны Н Н о Это означает, что матрица Т является вырожденной. Неожиданным является то, что произвольная матрица не обязательно имеет полный набор собственных векторов. Это позволяет нам оценить, сколь существенным ограничением яв- является требование симметрии матриц. Тот факт, что диагонализация матриц не всегда возможна, в высшей степени затрудняет исследование матриц общего вида, но в равной мере и повышает интерес к этому исследованию. Как мы увидим ниже, имеется много способов, чтобы обойти некоторые из возникающих препятствий. Используемые методы базируются на различных канонических представлениях и на теоремах об аппроксимации. Упражнения 1. Почему нельзя воспользоваться методом продолжения для вывода диа- диагонального представления матриц общего вида, основываясь на результатах, полученных для матриц с различными характеристическими числами? 2. Найдя решение системы дифференциальных уравнений ^Х1 _ <(\\ _ dt ' 2> ' '' * 2 (г,\ — dt ~ХЪ *2(U)-C2, показать, что матрица 1 1 | О I I не может быть приведена к диагональной форме. § 11. Каноническая форма Жордана. Введем теперь канониче- каноническую форму, к которой может быть приведена произвольная квадратная матрица. Применение этой формы облегчает рассмо- рассмотрение ряда проблем. Поскольку соответствующий вывод яв- является достаточно громоздким и излагается в большинстве учебников по линейной алгебре и, кроме того, поскольку в 15*
228 ЯВНЫЕ РЕШЕНИЯ И КАНОНИЧЕСКИЕ ФОРМЫ МАТРИЦ [ГЛ. II наших рассмотрениях можно так или иначе обойтись без исполь- использования этого вывода, то мы просто выпишем конечный ре- результат без доказательства. Теорема 3. Пусть Lh(l) означают матрицы размера k x k вида Я 1 0 ... О U (Я) = О Я 1 ... О Я 1 0 0 ... Я причем L\ (Я) = Я. Существует матрица Т такая, что Lki (Я,) 0 Lk2 (Я2) A) Г1 AT= 0 LK (К) B) еде k1+k2+'... + kr = N. Величины. Я,- являются характеристиче- характеристическими числами матрицы А, не обязательно различными. Представление матрицы А в виде B) называется канониче- канонической формой Жордана. Например, если А — матрица третьего порядка, имеющая корень Я1 кратности три, то она может быть приведена к одной из трех форм: Я, 0 0 Упражнения 0 я, 0 0 0 л, !» А2 — Я, 0 0 0 я, 0 0 1 Я! , ' Л3 = я, 0 0 1 я. 0 о C) 1. Используя жорданову каноническую форму, определить для произ- произвольной А матрицу eAt. 2. Используя этот результат, получить необходимые и достаточные усло- условия стремления eAt к нулю при t-> <х>. 3. Доказать, что все At, представленные соотношениями C), различны в том смысле, что не существует матрицы Т такой, что T'^AiT—Aj при 1ф\. Дать два доказательства — алгебраическое и основанное на решениях соог* ветствующих систем дифференциальных уравнений. 4. Показать, что матрица Lk(K)—XI, возведенная в k-ю степень, дает нулевую матрицу. § 12. Кратные характеристические числа (другой метод). Ис- Используя жорданову каноническую форму, мы обладаем систе- систематическим методом получения точной аналитической струк-
§ 12] КРАТНЫЕ ЧИСЛА (ДРУГОЙ МЕТОД) ' 229 туры решений линейных дифференциальных уравнений с по- постоянными коэффициентами. Так, если уравнение сведено к виду A) мы находим г/2 = ех'с2, после чего ух определяется как решение неоднородного уравнения ^Г = ^ + ех%, у,@)-с,. B) Введение интегрирующего множителя е~и дает 1) = с2 C) и, следовательно, У{ = Схеи + c2teu. D) Это поясняет, каким путем члены teu, или в общем случае tkekt, появляются в решении уравнения в случае кратных кор- корней. Обсудим теперь другой подход. Если А имеет различные характеристические числа Х\, Хг, ¦ ¦ ¦> ?wv, то мы можем записать N частных решений уравне- уравнения ~?- = Ау вида y = c(K)elt, l = lu ta, ..., KN, где с (Я) —по- —полином от Я. Мы можем показать это следующим образом. Как нам известно, для получения решения мы подставляем в уравнение функцию у=еи и находим Я и с из уравнения Ас=Хс, или (Л—Я/)с=0. E) После того как параметр X определен из характеристического уравнения |Л-Я/|=0, мы должны найти решение линейной системы E). Пусть 6„=И —М|„ F) означают алгебраические дополнения элемента а{; — X6ij опре- определителя \А — XI \. Тогда решением системы E), обладающим тем свойством, что сг являются полиномами от X, будет а = Ъи, /-1,2 N. G) Может оказаться, что это решение является тривиальным в том смысле, что все с* равны нулю. В этом случае мы можем
230 ЯВНЫЕ РЕШЕНИЯ И КАНОНИЧЕСКИЕ ФОРМЫ МАТРИЦ [ГЛ- IP попытаться определить другой набор си а именно: Ci = bki, i = l, 2, ..., N, (8> для какого-либо кФ1. Покажем, что какой-либо из этих наборов будет нетриви- нетривиальным, если характеристические числа Л различны. В частно- частности, покажем, что для произвольного характеристического числа Я = Я,- все Ьц не могут быть равны нулю, если Я]— простой ко- корень характеристического уравнения. Рассмотрим характеристическое уравнение / (Я) = | А - Я/ | = а22 — aw O-2N = 0. (9) aN\ aN2 • • ¦ aNN ~ Используя правило дифференцирования определителя, найдеш 1 a2i с aNl а„-Я а2] 0 0 г22-Я ... aN2 .... + а„-Я 0 ат а22 — Я . 0 0 а2^ aNN~ Я а12 .. —1 .. aN2 .. • аш • O-2N 1 + 0 • aNN — Я = -*П- ¦+ l — b22— •¦• —bNN. A0) Если для Я=Я4 все 6,г(Я])=0 (/=1, 2, ..., Л/), то и /'(ai)=0.. В противоречие с допущением это означает, что корень Ai яв- является кратным. Таким образом, решения желаемого вида могут быть най- найдены этим путем. Если имеются два различных корня Я] и Я2, то функция г — - A1) также является решением. Случай, когда Я1 становится крат~ йым, может рассматриваться как предельный при Яг-^Яь
<§ 131 ТРЕУГОЛЬНАЯ ФОРМА МАТРИЦЫ. ТЕОРЕМА ШУРА 231 Вычисляя предел A1) при Яг — Ai, мы находим выражение, которое может претендовать на роль решения A2) Мы оставляем читателю в качестве упражнения строгое обосно- обоснование этого факта. Укажем лишь, что возможны два пути до- доказательства: непосредственная проверка и вывод из общих теорем о непрерывной зависимости решения от матрицы А. Упражнение 1. Как получить решение, используя непосредственный алгебраический ¦подход, если Х{ — двукратный корень? § 13. Треугольная форма матрицы. Теорема Шура. Рассмотрим теперь одну из наиболее полезных теорем в теории матриц. Теорема 4. Если дана матрица А, то существует унитар- унитарная матрица Т такая, что Г AT = 'IN О (О .где, как указывает обозначение, элементы под главной диаго- диагональю равны нулю. Доказательство. Будем действовать по индукции, начав с двумерного случая. Пусть Х\ — характеристическое число ма- грицы А, а с1 — соответствующий собственный вектор, нормиро- нормированный согласно условию (с1, с') = 1. Рассмотрим матрицу Т, первым столбцом которой является с\ а второй выбран так, •чтобы Т была унитарной. Тогда, вычисляя Т~1АТ как произве- произведение Т~{ (AT), получим, что Т AT = Я, О B) Элемент 622 должен быть равен Яг, поскольку матрица Т~]АТ имеет те же характеристические числа, что и А. Покажем теперь, что мы можем использовать приведение матрицы порядка N к треугольной форме для доказательства возможности получения треугольной формы в случае матрицы порядка N+1. Пусть, как и ранее, с1 — нормированный собствен- собственный вектор матрицы порядка N + 1, соответствующий Яь
232 ЯВНЫЕ РЕШЕНИЯ И КАНОНИЧЕСКИЕ ФОРМЫ МАТРИЦ [ГЛ. 11 Выберем векторы а1, а2,... ,aN так, чтобы матрица Гь столбца- столбцами которой являются с1, а1, а2,..., aN, была унитарной. Тогда, так же как и для случая N—2, получим TllATi = Я, о 0 Ь\2 В ~>\, JV+1 C) где BN — матрица jV-го порядка. Поскольку характеристическое уравнение правой части имеет вид (Я,-А)|ВДг-Я/| = О, D) то характеристическими числами BN являются величины Яг, Яз, .. •, Ялг+ь т. е. ./V остальных характеристических чисел ма- матрицы А. По предположению индукции существует унитарная матрица TN такая, что Я с 12 Я3 О я ЛГ+1 E) Пусть Глг+1 — унитарная матрица (W+l)-ro порядка, построен- построенная следующим образом: 1 0 ... О О F) Рассмотрим равенство )'1 A (TiTN+l) = T~ TN+\ = ... Ь , N+l О G) Матрица T\TN+i и является, таким образом, той унитарной ма- матрицей, которая приводит А к треугольной форме.
НОРМАЛЬНЫЕ МАТРИЦЫ 233 ? И] Упражнения 1. Показать, что если матрица А имеет k простых корней, то существует такая матрица Т, что Т~1АТ = 2. Используя введенную выше треугольную форму, получить решение уравнения —г— — Ах, х @) = с. 3. Получить необходимое и достаточное условие отсутствия в решении членов te л. 4. Найти общее решение уравнения х"+Ах=0, где А — положительно определенная матрица. 5. Использовать треугольную форму для получения необходимых и до- достаточных условий того, что eAt ->-0 при t->oo. 6. Рассмотреть разностное уравнение х(п +1) =Ах(п), л=0, 1, ..., где х@)=с. Показать, что его решение имеет вид: х(п)—А"с. 7. Найти частные решения, полагая х(п)=%пс, и определить Лис. 8. Показать, что общее решение разностного уравнения имеет форму * (я) = 2 Pi («) я?- г=1 где pi(n)—векторы с компонентами, являющимися полиномами от п сте- степени не выше N— 1. 9. Каково необходимое и достаточное условие того, что каждое решение уравнения х(п+1) =Ах(п) стремится к нулю при и-> оо? 10. Рассмотреть разностное уравнение х[(п+\)А]=х[пА]+А Ах[пА], я= = 0, 1, 2, ..., *@)=с, где Д — положительная скалярная величина. Показать, что х[пА] -> x(t) при Д->0, где x(t) —решение дифференциального уравнения —j— = Ах, х@) — с, при условии, что пА -> t. Дать два доказательства: одно, использующее явную форму решения, и другое — без нее. § 14, Нормальные матрицы. Вещественная матрица, переста- перестановочная со своей транспонированной или, в более общем слу- случае, комплексная матрица, перестановочная со своей транспони- транспонированной и комплексно сопряженной, называется нормальной. Для нормальной матрицы мы имеем АА*=А*А. A) Польза введения этого понятия выясняется следующей тео- теоремой.
234 ЯВНЫЕ РЕШЕНИЯ И КАНОНИЧЕСКИЕ ФОРМЫ МАТРИЦ [ГЛ. IP Теорема 5. Если матрица А нормальна, то она может быть- приведена к диагональной форме посредством унитарного пре- преобразования. Доказательство. Как нам уже известно, мы можем найти унитарную матрицу Т, приводящую А к треугольному виду ] &12 • • • blN B) О Я, Вследствие унитарности Т имеем Я, О б]2 Я2 'IN г-1 Поэтому Отсюда АА* = oi —•-> >->• E) Приравнивая соответствующие элементы справа и слева, по- получим Это означает, что треугольная форма B) в действительности' является диагональной. Упражнения 1. Если все характеристические числа нормальной матрицы А веще- вещественны, то она является эрмитовой и приводится к диагональной форме- с помощью унитарного преобразования. _ 2. Показать, что (Ах, Ах) — (А*х, А*х) в случае, если А нормальна. 3. Показать, что из нормальности А вытекает нормальность матрицы А —XI. 4. Показать, что если А нормальна, то х является собственным вектором матрицы А тогда и только тогда, когда он является собственным вектором, матрицы А*. Для доказательства можно использовать результат предыдущего- упражнения. 5. Если А нормальна, то собственные векторы х и у, принадлежащие различным собственным значениям, ортогональны в том смысле, что (х, у) =0. 6. Используя этот факт, доказать теорему 5. 7. Рассмотреть теорему 5 и доказать обратное утверждение.
15] ТЕОРЕМА ОБ АППРОКСИМАЦИИ 235 8. Если матрица В нормальна и существует угол 8 такой, что Ле'® + А*е~ ^0, где А2—В, то А нормальна; см. Путнам (Putnam), Ргос. Amer. Math. Soc. 8 A957), 768—769. 9. Если А и В перестановочны и А нормальна, то Л* и В переста- перестановочны. § 15. Теорема об аппроксимации. Установим очень полезный результат, который часто используется при рассмотрении воп- вопросов, связанных с квадратными матрицами общего вида. Теорема 6. Существует матрица Т такая, что 'IN ^JV A) причем 1, i e — произвольная заданная константа. Доказательство. Пусть Т\ — матрица, приводящая А к треугольной форме. Тогда замена переменных y=T\Z приводит dy . уравнение -fr = Ay к виду dt dz2 dt blNzN, B) dt Теперь уже легко увидеть, каким образом выбрать матрицу 7', чтобы получить желаемый результат. Произведем в B) замену C) 2 = Новые переменные z\ удовлетворяют системе dt D) dt Vir С помощью подходящего выбора гх сумма абсолютных значе- значений всех недиагональных коэффициентов может быть сделаан
236 ЯВНЫЕ РЕШЕНИЯ И КАНОНИЧЕСКИЕ ФОРМЫ МАТРИЦ [ГЛ. 1» сколь угодно малой. Последняя замена эквивалентна преобра- преобразованию z—Gzl, где G— невырожденная диагональная ма- матрица*). Поэтому мы можем выбрать матрицу Т равной 7"iC Этот результат противоречит на первый взгляд тому факту,, что произвольная матрица, имеющая кратные собственные зна- значения, не может быть приведена к диагональной, форме. Разъяс- Разъяснение сводится к тому, что Т зависит от s. Попытка устремить 8 к нулю приведет либо к тому, что матрица Т станет вырожден- вырожденной, либо к тому, что соответствующий предел перестанет су- существовать. § 16. Другая теорема об аппроксимации. Следующая теорема, как и предыдущая, может быть использована для сведения до- доказательств в случае матриц общего вида к доказательствам, использующим диагональную форму. Теорема 7. Для заданной матрицы А всегда можно найти матрицу В с различными собственными значениями, причем та- такую, что \\А — В||<1е, где г — любая наперед заданная кон- константа. Доказательство. Рассмотрим матрицу А + G, где эле- элементы gn матрицы G— независимые комплексные переменные. Если A + G имеет кратные характеристические числа, то f(X) = \A + G— XI \ и f (X) имеют общий корень. При этом ре- результант этих двух полиномов R(G), являющийся полиномом от gn, должен быть равен нулю. Мы хотим показать, что можно найти набор величин gtj, для которых сумма 21 gtj I произ- i, i вольно мала, причем Я@)ФО. Альтернативой этому является утверждение, что результант R(G), рассматриваемый как по- полином от gn, тождественно равен нулю в окрестности начала координат пространства gu**). Это означает, что f(X) всегда имеет кратный корень. Рассмотрим, однако, следующий на- набор gif. gij = — aij при 1ф\, A) gii = i — aiU i=l, 2, ..., .V. Очевидно, что матрица A + G не имеет при этом кратных корней. Следовательно, R(G) не равняется нулю тождественно, и мы можем найти матрицу B—A + G, обладающую требуемыми свой- свойствами. *) G = diag(r,, r\ /f~')- Шрим. ред.) **) И, следовательно, при всех ga- (Прим. ред.)
§ 18] ДРУГОЕ ДОКАЗАТЕЛЬСТВО 237 Упражнение 1. Построить доказательство этого утверждения на основе того факта,. что матрица А может быть приведена к треугольной форме (это желательна сделать потому, что предыдущее доказательство, несмотря на свою строгость и краткость, использует концепцию v свойства результанта двух полиномоз,. строго доказать которые не так легко, как это может показаться). § 17. Теорема Гамильтона—Кэли. Используя теорему об ап- аппроксимации, установленную в § 16, мы можем, наконец, дока- доказать во всей полноте знаменитую теорему Гамильтона — Кэли. Теорема 8. Каждая матрица удовлетворяет своему харак- характеристическому уравнению. Доказательство. Пусть A + G — матрица, имеющая раз- различные собственные значения, причем ||G|'-^e. Тогда, как нам известно, A + G удовлетворяет своему характеристическому уравнению. Характеристический полином f(X, G) = \A + G — Xf\ матрицы A + G, рассматриваемый как полином or X, имеет ко- коэффициенты, являющиеся полиномами от элементов ga ма- матрицы G. Эти коэффициенты зависят от gtj непрерывным обра- образом; следовательно, \imf(A Поскольку f(A + G, G)=0, то и /(Л)=0. Упражнения 1. Доказать теорему Гамильтона — Кэли, используя жорданову канони- каноническую форму. 2. Доказать теорему Гамильтона — Кэли в предположении, что А имеет полный набор линейно независимых собственных векторов. 3. Использовать теорему Гамильтона — Кэли для представления невы- невырожденной матрицы Л"' как полинома от А. § 18. Другое доказательство теоремы Гамильтона—Кэли. Зная результат, легко предложить серию коротких и элегантных до- доказательств. Укажем одно из них, имеющее чисто алгебраиче- алгебраическую природу и не опирающееся на свойство непрерывности. Рассмотрим матрицу (Л — X/), обратную по отношению к (А — XI) при значениях X, не совпадающих с характеристиче- характеристическими числами. Мы видим, что (А - XI)-* = В(X)/J(},), A) причем элементы матрицы В(Х) имеют степень не выше /V — 1Г a f(x) = \A — XI\. Следовательно, (A-Xl)B(X)=f(X)l. B)
238 ЯВНЫЕ РЕШЕНИЯ И КАНОНИЧЕСКИЕ ФОРМЫ МАТРИЦ [ГЛ. II Запишем В (Я) = Я В у-1 + Я BN_2 ~Ь .. • + Bq, C) где матрицы В,- не зависят от Я. Приравнивая коэффициенты в B), получим серию соотно- соотношений: D) и т. д. Мы видим, что каждая из матриц Bt является полиномом от А со скалярными коэффициентами и, следовательно, BtA — — ABi для всех i. Это означает, что тождество B) справедливо не только для скаляра Я, но также и для любой матрицы, пе- перестановочной с А. В частности, оно сохраняется при замене Я на А. Отсюда и следует желаемый результат, /(Л)=0. § 19. Линейные уравнения с периодическими коэффициентами. Изучим теперь проблему решения линейного дифференциаль- дифференциального уравнения с периодическими коэффициентами: 4L x@) = c, A) где P(t)—непрерывная функция от /, удовлетворяющая для всех t условию P{t+l)=P(t). B) Эта проблема неожиданно является одной из чрезвычайно слож- сложных. Исследование даже относительно простого скалярного уравнения (уравнения Матье) —- + (а + Ъ cos t) и = 0 C) наталкивается на многие трудности, так что имеется специаль- специальная теория, посвященная этому уравнению. Задача получения канонического представления решения A) приводит нас к обсуждению проблемы, представляющей само- самостоятельный интерес, а именно к представлению невырожденной матрицы в виде матричной экспоненты. Как обычно, удобно рассмотреть первоначально дифференци- дифференциальное матричное уравнение.
23] ПРЕДСТАВЛЕНИЕ В ВИДЕ ЭКСПОНЕНТЫ 239 Мы докажем следующую теорему: Теорема 9. Решение уравнения где P(t)—периодическая функция с периодом, равным нице, может быть записано в виде X(t)=Q(t)eCt, D) еди- E) где Q(t)—периодическая функция с тем же периодом, что и P(t), а С — постоянная матрица. Доказательство. Из периодичности P(t) ясно, что если X(t) —решение уравнения D), то и X(t+\) также является ре- решением. Поскольку матрица Х(\) невырожденная, то мы видим,. что X(t+l)X(\)-1 является решением уравнения D), удовле- удовлетворяющим начальному условию. По теореме единственности имеем G) (8) Предположим, что X(\) можно записать в виде Х{\)=ес. Рассмотрим тогда матрицу Q(() =X(t)e~ct. Мы имеем q (t + 1) = X (t + 1) е~с «+» = X (t + 1) е~се-" = = X(t+\)X(\yle-ct = X(t)e-ct = Q(t). Это доказывает утверждение E). Таким образом, осталось дока- доказать законность представления G). § 20. Представление невырожденной матрицы в виде экспо- экспоненты. Докажем теперь следующую теорему: Теорема 10. Невырожденная матрица может быть пред- представлена в виде матричной экспоненты. Доказательство. Пусть матрица А является невыро- невырожденной и имеет различные собственные значения. В этом слу- случае для нее справедливо соотношение 1 0 н-1 A)
240 ЯВНЫЕ РЕШЕНИЯ И КАНОНИЧЕСКИЕ ФОРМЫ МАТРИЦ Тогда, очевидно, что А = ес, где log Я, 0 [гл. log Я, Г\ B) что и доказывает результат для этого случая. Если А имеет кратные корни, то мы можем с равным эффектом использовать каноническую жорданову форму. Пусть А = Т Lkl (h) о 0 (Я2) Г1 C) Достаточно показать, что каждая из матриц L^ (А,-) имеет лога- логарифм. Действительно, если Bi — log Lfe.(?w), то матрица В{ 0 в = т о D) является логарифмом А. В упражнении 4 к § 11 мы заметили, что Отсюда следует, что формальный логарифм В = log Lk (Я) = log [Я/ + Lk (Я) - Я/] = E) [Lk{X)-Uf = к~\ =/log Я h-[Lk(X)-KI]" существует и в действительности является логарифмом в том смысле, что ев=А.
§ 2Ц ДРУГОЕ ДОКАЗАТЕЛЬСТВО 241 Упражнения 1. Для невырожденной матрицы существует корень k-й степени, где k=2, 3, ... 2. Решение уравнения —г— = Q (t) X, X @) = /, можно искать в виде где p p. р„ e e l ... e "..., t t P= [ Q(s) ds, Pn = С Q« ds 0 0 — Р —е -1 1-1 + 0 Qo=Q- Г чР Бесконечное произведение сходится, если / достаточно мало; см. Ф е р {F. Fer), Bull, classe sci. Acad. roy. Belg. 44, № 5 A958), 818—829. § 21. Другое доказательство. Поскольку нами не доказана воз- возможность представления матрицы в жордановой форме, дадим другое доказательство теоремы 10, воспользовавшись методом индукции. Предположим, что представление А = еБ справедливо для матрицы А'-го порядка и что мы привели матрицу (yV+l)-ro порядка к треугольной форме a 0 A) где /Ijv — матрица А-го порядка, приведенная к треугольной форме, aN — А-мерный вектор. Пусть BN — логарифм матрицы AN, являющейся, очевидно, невырожденной, поскольку матрица AN+l невырождена. За- Запишем ^+,= 0 X I B) где /=log?wv+i, a x — неизвестный А'-мерный вектор-столбец. Остается показать, что х может быть выбран таким, что Легко по индукции показать, что для ?=1,2,... имеем C) 16 Р. Беллман
242 ЯВНЫЕ РЕШЕНИЯ И КАНОНИЧЕСКИЕ ФОРМЫ МАТРИЦ Следовательно, eBN О -,k-\ -r-ryt>M + DJV l -Г . . . lN+l где два первых члена ряда взяты равными 0 и 1. Если / не является собственным значением BN, то [ГЛ. If D) - //Г1 = w - // Г1 E) и, следовательно, е — е F) где гиг2,.. ., rN — собственные значения BN. Поскольку, как вид- видно из E), |С(/) | является для всех / непрерывной функцией /. то F) справедливо для всех /. Если / не равно г,{ или любому другому значению логарифма от Хц, то ясно, что \С{1) \Ф0. Если l = rh, то сомножитель {еГк — el)j{rk — I) становится равным ek. Поэтому, ограничиваясь главным значением логарифма, мы ви- видим, что матрица СA) всегда является невырожденной. Следо- Следовательно, вектор х может быть всегда определен так, чтобы C(l)x = aN. Это завершает доказательство. § 22. Некоторые интересные преобразования. Приведение к ка- канонической форме дифференциальных уравнений с переменной матрицей является задачей весьма трудной. Поскольку эта проблема более тесно связана с теорией дифференциальных уравнений, чем с теорией матриц, мы не будем здесь ею заниматься в деталях. Некоторые интересные преобразования встречаются, однако, в самом начале исследования. Положим х=Ту, где Т — функ- функция t. Тогда у удовлетворяет уравнению -щ- = [т АТ~Т чг у- B)
§ 23] БИОРТОГОНАЛЬНОСТЬ 243 Положим f(A, 7]) = T~lAT — Г —^-. Выполняя дифференцирова- дифференцирование, получим, что f (A, T) удовлетворяет функциональному урав- уравнению НА, TS) = f[r'AT-r'~, S). C) Упражнение 1. Рассмотреть скалярное уравнение dln dtn~] Вводя преобразование u = sv, t — q(s), получить аналогичный класс функ- функциональных уравнений. § 23. Биортогональность В первой части книги при рассмотре- рассмотрении симметрических матриц мы установили, что произвольный Л'-мерный вектор может быть записан как линейная комбинация N ортогональных собственных векторов матрицы А, соответ- соответствующих N собственным значениям этой матрицы. Таким образом, если N лг = У- п-х1 (\\ то коэффициенты аг- определяются весьма просто по формуле а{ = (х, х1). B) Если матрица А не является симметрической, то мы встречаемся с двумя трудностями при получении результата, аналогичного этому. Во-первых, матрица А может не иметь полного набора собственных векторов и, во-вторых, они не обязаны быть взаим- взаимно ортогональными. Чтобы обойти первую трудность, мы просто сделаем предпо- предположение, что рассматриваемая матрица имеет N линейно неза- независимых собственных векторов. Вторая трудность преодолевает- преодолевается введением в рассмотрение сопряженных матриц. При этом понятие ортогональности заменяется понятием биортогональ- биортогональности. Пусть у1, у2,... , yN означают линейно независимые соб- собственные векторы, соответствующие характеристическим числам Хи %2, ¦ • • ,^n матрицы А. Тогда матрица Т = (у\у2 yN) C) 16*
244 ЯВНЫЕ РЕШЕНИЯ И КАНОНИЧЕСКИЕ ФОРМЫ МАТРИЦ [ГЛ. !Г является невырожденной и преобразует А к диагональной форме 1 AT О D) Отсюда следует, что О E) Следовательно, А* также обладает N линейно независимыми- собственными векторами, равными столбцам матрицы (Г*) и соответствующими характеристическим числам ?.ь Я2, ..., %.N. Обозначим эти векторы соответственно через z\z2,..., zN. Для определения коэффициентов разложения ¦* = i поступим следующим образом. Из равенств Ау' = КУ1, A'zj =. XjZ> получаем следующие соотношения: {Ау\ г*) = (Ку\ z~i) и далее (y',J4i) = (у1, К^) = (%гУ\ Следовательно, (б) G) (9} A0) Поэтому при мы имеем Очевидно, что при этом (у*, г')Ф0, поскольку вектор z\ будучи ненулевым, не может быть ортогонален ко всем у\
§ 24] ПРЕОБРАЗОВАНИЕ ЛАПЛАСА 245- Таким образом, в частном случае, когда все Х{ различны, мы можем записать для коэффициентов разложения F) формулу Два набора векторов {у'} и {г'\, удовлетворяющих равенству (уп')=0 при 1Ф], A2) называются биортогональными. Очевидно, что мы можем нор- нормировать векторы так, чтобы получить дополнительное условие (Г,^) = 1. A3) Этот метод представления х как линейной комбинации у1 под- подтверждает сделанное ранее замечание о том, что свойства ма- матрицы проще всего изучить, рассматривая наряду с ней транспо- транспонированную. Упражнения 1. Исследовать случай кратных характеристических чисел. 2. Какие упрощения следуют из допущения нормальности Л? § 24. Преобразование Лапласа. Поскольку нам известно, что решение линейного дифференциального уравнения с постоянны- постоянными коэффициентами имеет вид где Pk(t) — вектор, компоненты которого являются полиномами от t степени не выше N— 1, то мы можем применить к решению уравнения преобразование Лапласа. Интеграл = J B)- в случае его сходимости называется преобразованием Лапласа от функции /(/). Поскольку мы интересуемся только функциями f(t) вида A), очевидно, что g(s) всегда существует, если веще- вещественная часть s достаточно велика. Основная формула имеет вид oo
246 ЯВНЫЕ РЕШЕНИЯ И КАНОНИЧЕСКИЕ ФОРМЫ МАТРИЦ [ГЛ. II лри Res>Rea. Очевидно, если J(t) имеет вид /@=cie4 D) то равенство оо \ t = -J^ E) влечет С\ = сг и %\ = а. Подобно этому, из аддитивности интеграла B) легко заклю- заключить, что если /(/) принадлежит классу функций A), a g{s) имеет вид то ¦§ 25. Пример. Рассмотрим линейное дифференциальное урав- уравнение и" — Зм'+2« = 0 A) л будем искать решение, удовлетворяющее условиям м@)=1, ы'@)=0. Поскольку характеристическое уравнение Я,2 —ЗЛ+2 = 0 B) имеет корни Xi = l и Я.2 = 2, то решение A) должно иметь вид и = с1е2' + с2е*. C) Постоянные с\ и с2 определяются из условий с, + С2=1, 2с, + с2 = О, KV что дает Ci = —I, c2 = 2. E) 'Окончательно решение записывается в форме м = 2е' —е2'. F) Воспользуемся вместо этой процедуры преобразованием Лапла- •са. Из A) для Re(s)>2 получим оо оо оо J u"e-st dt-3 J u'e~st dt + 2 J M<rs< rf/ = 0. G)
§ 26) ОБСУЖДЕНИЕ РЕЗУЛЬТАТА Интегрируя два первых члена по частям, получим оо °° оо оо J u'e-$t dt = ue~st + s J ue~st dt = - 1 + s J ue~st dt, 24Г J u" e~st dt = u'e~s + s j u'e~st dt = = 0 + s I u'e~st dt= - s + s2 | ue~st dt. (8> Таким образом, G) преобразуется к виду сю (s2 - 3s + 2) | ue~st dt = s-3, или A0) Рациональная функция в правой части может быть разложена на простейшие дроби: s-3 ¦ + s-2 где .. (s - 1) (s - 3) _ j¦ - 3 'I1! s2-3s+2 ~ ТГ2" = 2, S"\ a2 = Hm (s-2) (s-3) s-3 Следовательно, s2-3s + ue~st dt = = •— 1. s=2 s-1 s-2' A2). откуда получаем соотношение F) для u(t). § 26. Обсуждение результата. Если вместо уравнения второго- порядка, рассмотренного в § 25, нам необходимо исследовать, уравнение десятого порядка, то обычный метод определения по- постоянных интегрирования потребует решения системы десяти совместных уравнений. Это труднопреодолимая задача. Исполь-
•248 ЯВНЫЕ РЕШЕНИЯ И КАНОНИЧЕСКИЕ ФОРМЫ МАТРИЦ [ГЛ. 11 зование преобразования Лапласа устраняет эти трудности. Это .лишь малая часть тех преимуществ, которые присущи методу Лапласа и которые приводят к тому, что преобразование Лап- Лапласа играет фундаментальную роль в анализе. Упражнения 1. Показать, что оо * tne-steatdt = ^-—, о используя: (а) интегрирование по частям, (б) дифференцирование по s или по а. 2. Используя эту формулу, решить дифференциальное уравнение «" — 2г/' + ы = О, и@) = 1, ы'@)=0, характеристическое уравнение для которого имеет кратный корень. 3. Использовать преобразования Лапласа для решения системы линей- линейных уравнений: N bk= ^e ' */, k=\,2 N, с неизвестными Xt. Для этого составить и решить соответствующее дифферен- дифференциальное уравнение. 4. Как подойти к решению соответстгующей задачи, если неизвестными ЯВЛЯЮТСЯ Xi И JV? § 27. Матричный случай. Рассмотрим уравнение —— = Ах х@) = с, A) где А—постоянная матрица. Производя преобразование Лап- Лапласа, получим оо оо !%е-**-А$х<г*<и. B) о о Интегрируя по частям, найдем сю (A-sI)jxe-«dt=-c. C) о Таким образом, преобразование Лапласа от решения имеет вид J Далее мы можем использовать тот же путь, что и ранее, а имен- именно разложить правую часть на простейшие дроби. В результате
УПРАЖНЕНИЯ К ГЛ. II 249- получим Для простоты, как и в одномерном случае, предположим, что собственные значения А различны. Тогда Ак= lim (s-lk)(Is-A)~]. F> Упражнения 1. Найти точное выражение для Ан, используя результат упражнения 34 к гл. 6. 2. Что произойдет, если матрица А имеет кратные корни? Упражнения к гл. 11 1. При каких условиях справедливо разложение если Л = /+ 2. Рассмотрев решение уравнения х"+Ах — О, где А — положительно опре- определенная матрица, показать, что характеристические числа положительно определенной матрицы положительны. 3. Пусть комплексная матрица А является произведением положительно определенной эрмитовой матрицы Н и унитарной матрицы U, A = HU. Пока- Показать, что А нормальна тогда и только тогда, когда Н и U перестановочны. 4. Доказать, что если А, В и АВ нормальны, то ВА нормальна. (Вигман.) 5. Пусть для любой матрицы А //-матрица означает неотрицательно- определенный квадратный корень из АА*. Показать, что необходимым усло- условием того, чтобы произведение двух нормальных матриц было нормальным,, является перестановочность каждой из матриц с Я-матрицей другой мат- матрицы. (Вигман.) 6. Л" = 1 для некоторого п в том и только в том случае, когда собствен- собственные значения матрицы А являются корнями из единицы и А приводится. к диагональной форме. 7. Если В*=0 для некоторого k и АВ — ВА, то |Л+В| = |Л|. 8. Пусть Р, Q, R и X — матрицы второго порядка. Тогда каждое из. характеристических чисел матрицы X, являющейся решением уравнения PX2+QX+R=0, является одновременно корнем уравнения | PX2+QK+R |=0. (Сильвестр.) 9. Доказать, что этот результат справедлив для матриц N-ro порядка и уравнения 10. Скалярное уравнение и"+p(t)u' + q(t)u—Q подстановкой и— = ехр ( [ vdt) или v = u'/u сводится к уравнению Риккати v'+v2+p(t)v + q(t) = = 0. Показать, что подобная связь существует для матричного уравнения Риккати Х'=А(t) +B(t)X+XC(t)X и линейного уравнения второго порядка. 11. Каждая матрица А, для которой |Л|=1, может быть представлена в виде А = ВСВ-'С~К (Шода.) 12- Если |.Х|=1У|=й=0, то могут быть найдены матрицы С и D такие, что Х=С-'?ИУС/>, (О. Таусски.)
•250 ЯВНЫЕ РЕШЕНИЯ И КАНОНИЧЕСКИЕ ФОРМЫ МАТРИЦ 13. Пусть [ГЛ. К 0 0 Л, 0 — iX 0 iX2 0 Показать, что lim -rr ~ '**-! ° N » lira -^ У log [Я + г, (К)}, тде z/ (Я) представляет собой цепную дробь X — W+2 X,- ... Указание. Начать с вывода рекуррентного соотношения для ЛГ>3, где Ял(Л.)=|Я 14. Если матрицы А и В обе нормальны и если матрица С|Л+Сгб имеет характеристические числа с^ + СгМ-г Для всех ct и с2. то ЛВ = б/1. (Вигман, Виландт.) 15. Положим еАев = еА + в+г(А, в)_ Показать, что /(Л, б)=[Л, б]/2 + +g(^4, fi)+ft(^4, В), где И, В]=Лй — ВЛ, а ?(Л, В) — однородный полином третьей степени по А и В, удовлетворяющий равенству g(<4, B)=g(B, Л), Л(Д В) —сумма однородных полиномов, начинающихся с четвертой степени. 16. Показать, что функция / предыдущего упражнения удовлетворяет ра- .венству f(B, С)+1(А, В + С+ЦВ, C))=f(A, B)+f(A+B+f(A, В), С). 17. Используя этот результат, показать, что [А, [В, С}] + [В, [С, А\]+[С, [А, В]]-0, где [А, В) — скобки Якоби: [А, В]=АВ — ВА, 18. Необходимое и достаточное условие того, что lira В" = 0 для веще- П->оо ственной или комплексной матрицы В, сводится к требованию существования
УПРАЖНЕНИЯ К ГЛ II 25 Г такой положительно определенной матрицы Н, что матрица Я — В*НВ поло- положительно определена. (Стейн.) 19. Матрица А приводится х диагональной форме в том и только в том случае, если существует положительно определенная эрмитова матрица И такая, что НАН-1 нормальна. (Митчелл.) 20. Существует ортогональная матрица B(t) такая, что y—B(t)z преоб- преобразует уравнение dy/dt=A(t)y в dzldt—A\(t)z, где A\(t) — треугольная мат- матрица. (Дилиберто*).) 21. Может быть найдена такая ограниченная и невырожденная матрица B(t), что Ai{t) —диагональная матрица. (Дилиберто.) 22. Матрица А имеет форму es, где S — кососимметрическая матрица,, тогда и только тогда, когда А — вещественная ортогональная матрица с опре- определителем, равным единице. (Табер.) 23. Каждая невырожденная матрица может быть выражена как произ- произведение: (а) симметрической и ортогональной матриц, если она вещественна, (б) эрмитовой и унитарной матриц, если она комплексна. Если первый сомножитель выбран положительно определенным, то оба- сомножителя определяются единственным образом. Эти и многие другие ре- результаты установлены в работе де Брейна и Шекерса1) с использова- использованием логарифмов от матриц. 24. Вывести результат упражнения 22 из канонического представления1 для ортогональных матриц, данного выше. 25. Пусть «1, «2, • • •, «я — набор линейно независимых решений диффе- дифференциального уравнения порядка N: Определитель 1. «2 «1 ,AN-\) „(ЛГ-l) «2 •••% называется определителем Вронского функций U\(t), м2@>-- зать, что t - J p, (s) ds W(t) = W(u uu)=W(t)e *' ). Пока- ПокаОбобщение понятия определителя Вронского содержится в статье Остров- Островского2). *) Это теорема Перрона. См. Math. Z. 32 A930), см. также Р. Э. В и н о- град, УМН 9, № 2 F0) A954), 129—136. {Прим. ред.) ') N. G. De Bruijn and G. S z e k e r e s, Nieuw. Arch. Wisk C), 111 A955), 20—32. 2) A. Os trow ski, Uber ein Analogen der Wronskischen Determinants bei Funktionen mehrerer veranderlicher, Math. Z. 4 A9.19), 223^230.
-252 ЯВНЫЕ РЕШЕНИЯ И КАНОНИЧЕСКИЕ ФОРМЫ МАТРИЦ [ГЛ. II Соответствующий определитель, связанный с решением линейного раз- разностного уравнения вида u(x + N)+pAx)u{x + N-l)+ ... +pN(x)u(x)=0, x = 0, 1, 2, .... «, (*) uAx + N-l) uAx + N- U UN (х) uN {х + 1) ¦называется определителем Касорати '). Многие дальнейшие результаты, связанные с определителем Вронского, могут быть найдены в книге Пойа и Сегё2). 26. Унитарная матрица U может быть выражена в форме U=V-lW'lVW, где V и W унитарны, тогда и только тогда, когда |t/|=l. 27. Унитарные матрицы U и V могут быть выражены в форме U=WiW2W3, V=W3W2WU где W,, W2, W3 унитарны, тогда и только тогда, когда \U\ = [V\. 28. Если все элементы матрицы АА*—А*А неотрицательны, то А нор- нормальна. 29. Если матрицы Нх и Я2 эрмитовы и хотя бы одна из них является положительно определенной, то матрица HJi2 может быть приведена к диа- диагональной форме. (Таусски.) 30. Если XA + \iB может быть приведена к диагональной форме для произвольных скаляров К и ц, то АВ—ВА. (Моцкин и Таусски.) 31. Показать, что матрица А, подобная вещественной диагональной мат- матрице D в том смысле, что A — TDT'1, является произведением двух эрмито- вых матриц. (Таусски.) 32. Характеристические числа матрицы а Ь . . cab. ... с а Ь N+l равны Xk = a—2V be cos kQ, k= 1,2 N, где 0 = ном AN(k)=\A—XI\ удовлетворяет разностному уравнению -1 (I) - . Показать, что поли- ') Мовтел (Р, Monte 1), Lec,ons sur les reccurrences et leurs applica- applications, Gautheir-Villars, Paris, 1957; Кребилл (D. M. К г abil 1), On Exten- Extension of Wronskian Matrices, Bull, Amer. Math. Soc. 49 A943), 593—601, 2) G. P о 1 у a and G. S z e g 6, Aufgaben und Lehrsatze aus der Analysis, Zweiter Band, Dover Publications, New York, 1945. [Русский перевод; Задачи и теоремы из анализа, в двух томах, Гостехиздат, 1956].
УПРАЖНЕНИЯ К ГЛ. 1! 253 33. Характеристические числа матрицы г - Ь 2а b 2а г 2а Ъ Ь 2а г 2а Ь В-. Ь 2а г 2а Ь b 2а г 2а b 2a г-Ь определяются равенствами Xh = г _ 26 — б-1 {а2 — (а — 2Ь cos 2}, k=l, 2, .,., N. Получить этот результат, связав В с А2. (Резерфорд, Тодд.) Детальное обсуждение поведения характеристических чисел матрицы А(а)'А(а) может быть найдено у Островского1). Матрица А (а) дается выражением а 0 ... О (а). а ... О 1 а О 1 1 (Другие вопросы, связанные со свойствами интересных матриц частного вида, могут быть найдены в работе Като2).) 34. Обозначим через s(A) функцию max (Xt — Kj) и через ||Л|| выражение ,1/2 21 Показать, чтэ и что, следовательно, s {А) <||,Л \\V~2. (Мирский.) 1/2 *) А, О s t г о w s k i. On the Spectrum of a One-parametric Family of Mat- Matrices, J. reine angew. Math. 193 A954), 143—160. г) Т. Kato, On the Hilbert Matrix, Proc, Amer. Math, Soc. 8 A957), 73—81.
254 ЯВНЫЕ РЕШЕНИЯ И КАНОНИЧЕСКИЕ ФОРМЫ МАТРИЦ [ГЛ. 1! 35. Пусть, как и ранее, [А, В]=АВ — ВА. Если [А, [А, Л*]]=0, то А нормальна. (Путнам.) См.Като и Таусски1). 36. Если собственные значения матрицы А равны Хи %г, ..., XN, С\ и Сг — два ненулевых комплексных числа, а собственные значения матрицы C\A+dA* равны C\Xi + CtXm), где j(i) —перестановка из индексов 1, 2, ..., N, то А нормальна. 37. Пусть матрицы А а В перестановочны. Тогда характеристические числа матрицы f(A, В) равны f(Xt, (Xj); Xi и ц,-—собственные значения А и В, расположенные в порядке, не зависящем от f. (Фробениус.) (О парах матриц А и В, для которых собственные значения матрицы csA + c2B равны сДО + СгА,'2), говорят, что они обладают свойством L 2).) 38. Доказать, что А нормальна в том и только в том случае, когда N Sp(A*A) = 2l**p i 39. Использовать это свойство для доказательства результата, установ- установленного Вигманом, что ВА нормально, если А, В и АВ нормальны. (Мирский.) 40. В случае, если матрица А эрмитова, показать для s(A), введенной в упражнении 34, что _ _ s(/4) = 2 sup | (a, Av)\, Н, V где верхняя грань берется по всем парам взаимно ортогональных нормиро- еь ;ных векторов и и -о. (Мирский.) 41. Если матрица А эрмитова, то s (A) ^ 2 max | ars\. (Паркер, Мирский.) гфэ 42. Если А нормальна, то s (А) < sup s [ гА + гЛ* ). (Мирский 3).) I г 1 = 1 \ 2 J 43. Если А и В—нормальные матрицы с характеристическими числами Xt и [X,-, то существует упорядочение этих чисел такое, что 2ВЦ2, где ЗК/Р-ИИ"- i i, i (Гофман, Виландт.) 44. Как известно, любая матрица А может быть записана в виде B + iC, где матрицы В и С эрмитовы. Пусть характеристические числа В и С распо- расположены соответственно между Ь\ и &2 и между С\ и сг. Тогда все характери- характеристические числа А расположены внутри квадрата с вершинами b\ + U\, Ь\ + 1сг, b2+ici, b2+ic2. (Бендиксон, Гирш.) 45. Под областью DA матрицы А будем понимать комплексную область, ограниченную значениями, принимаемыми квадратичной формой (х. Ах) при (х, х) = \. Показать, что характеристические числа принадлежат DA*). ') Т. К a to and О. Т a u s s к i, Commutators of A and A*, J. Washing- Washington Acad. Sci. 46 A956), 38—40. 2) Моцкин и Таусски (Т. S. Motzkin and О. Tausski), Pairs of Matrices with Property L, Trans. Amer. Math. Soc. 73 A952), 108—114. 3) L. Mirsky, Inequalities for Normal and Hermitian Matrices, Duke Math. J. 24 A957), 592—600. 4) Теплиц (О. Toeplitz), Das algebraische Analogen zu einen Satze von Fejer, Math. Z. 2 A9Ю), 187—197,
УПРАЖНЕНИЯ К ГЛ. II 255 46. Пусть К — наименьшая выпуклая комплексная область, включающая все характеристические числа матрицы А. Если А нормальна, то К и DA совпадают. 47. Рассмотрев случай матриц размеров 2X2, показать, что этот резуль- результат не всегда справедлив, если А не является нормальной матрицей. 48. Область DA является выпуклой, независимо от того нормальна или нет матрица А. Библиографию, касающуюся последних результатов в этой области, см. у Таусски1). 49. Уравнению х'—Ах, где х — /V-мерный вектор, а А — матрица разме- размеров NXN, соответствует линейное однородное дифференциальное уравнение Л'-го порядка, которому удовлетворяет каждая компонента х. Пусть каждое решение дифференциального уравнения, соответствующего у'=Ву, совпадает с решением уравнения, соответствующего х'=Ах. Что можно сказать о связи А и В? 50. Рассмотрим уравнение -—- = Вх, х{0) = с, где постоянная матри- матрица В выбрана так, что функция (х, х) не зависит от времени. Показать, что матрица В обладает этим свойством в том и только в том случае, когда она кососимметрическая. Заключить из этого, что ев ортогональна. 51. Используя тот факт, что векторное дифференциальное уравнение А —т-j- + В ~т— + Сх = 0 эквивалентно системе —т— = у, A -jj- + By + Cx = 0, получить детерминантное равенство, эквивалентное \А\2+В'к+С\=0, с элементами, линейными по X. 52. Пусть Xi, х2, ..., хт — скаляры и через F(xi, х2, ..., хт) обозначена матрица А1х1 + А2х2 + ... +Атхт, где At попарно перестановочны. Пусть f(xh x2, ..., xm)=\F(xu x2, ..., хт)\\ тогда f(Xu Х2, ..., Хт) =0 при усло- условии, что AiXi+A2X2+.. . + АтХт=0. (Обобщение теоремы Гамильтона — Кэли, данное Филипсом.) 53 Показать, что этот результат сохраняет силу, если линейная форма 2 Ai*t заменяется полиномом от Xt с матричными коэффициентами. См. К о и Ли2), где имеются также ссылки на более ранние работы Островского и Филипса. 54. Если ?,¦ (i=l, 2, .;., п)—матрицы размеров 4X4 и при этом ё\ = — 1, EtEj = — EjE{ AФ1), то п ^ 5. (Эддингтон.) 55. Если матрицы ?,¦ являются либо вещественными, либо чисто мни- мнимыми (см. предыдущее упражнение), то из пяти матриц две вещественны, а три мнимы. Обобщение этого случая см. у Ньюмена3). 56. Если В перестановочна с любой из матриц, с которой перестановочна А, то В — скалярный полином от А. (В е д д е р б е р н 4).) 57. Пусть комплексная матрица А имеет спектр Х\, Х2, ..., Хп- Положим w=2K/I2- Тогда inf || S'lAS IP = 2 IAjI2. ') О. Та us ski, Bibliography on Bounds for Characteristic Roots of Finite Matrices, National Bureau of Standards, September 1951. 2) Chao Ко and H. С Lee, A Further Generalization of the Hamilton — Cayley Theorem, J. London Math. Soc. 15 A940), 153—158. 3) M. H. A. Newman, J. London Math. Soc. 7 A932), 93—99. 4) J. M. Wedderburn, Lectures on Matrices, Amer. Math. Soc. Colloq. Publ. 17 A934), 106.
256 ЯВНЫЕ РЕШЕНИЯ И КАНОНИЧЕСКИЕ ФОРМЫ МАТРИЦ [ГЛ. 11 где нижняя грань определяется по всем невырожденным матрицам S. Ниж- Нижняя грань достигается в том и только в том случае, когда матрица А при- приводима к диагональной форме. (Мирский.) 58. Пусть А, В и X означают матрицы размеров NxN. Показать, что для существования по крайней мере одного решения матричного уравнения X2— 2АХ+В=0 достаточно, чтобы характеристические числа матрицы А I -B A были различны. (Тройенфельс.) 59. Пусть {X} — набор матриц размеров NxN, обладающих тем свой- свойством, что каждая их вещественная линейная комбинация имеет только вещественные собственные значения. Тогда наибольшее собственное значение Ятах(А') является выпуклой функцией X, а наименьшее собственное значе- значение Хтщ{Х) является вогнутой функцией X. 60. Пусть собственные значения любой вещественной линейной комбина- комбинации двух матриц X и Y вещественны, причем матрица X имеет отрицатель- отрицательные собственные значения. Тогда любое характеристическое число комбина- комбинации X+iY имеет отрицательную вещественную часть. 61. Пусть {X} — набор вещественных матриц размеров NxN, обладаю- обладающих тем свойством, что каждая их вещественная линейная комбинация имеет только вещественные собственные значения. Тогда если Х\ и Хг — две матрицы из этого набора, обладающие тем свойством, что матрица X] — Х2 имеет неотрицательные характеристические числа, то Xi(Xl)^ki(X2), где числа Х,;(Х) перенумерованы в порядке их возрастания. (Лаке.) Доказатель- Доказательство этих положений, базирующееся на результатах теории дифференциаль- дифференциальных уравнений в частных производных гиперболического типа, можно найти в статье Л а к с а '). Более элементарный путь доказательства см. у А. В а и н- бергера2). 62. Даны два набора комплексных чисел {а*}, {Pi} A ^ «^ п), каждое из которых по модулю равно единице. Доказать следующее утверждение. Две унитарные матрицы А и В порядка п с характеристическими числами соот- соответственно {а,} и {р,} и такие, что единица является характеристическим числом матрицы АВ, существуют в том и только в том случае, когда вы- выпуклая оболочка {а;} и выпуклая оболочка {(?,} имеют общую точку. (Фан Цзы3).) 63. Мы знаем, что ел' может быть записана в виде полинома от А, а именно eAt = Uo(t)J+Ui(t)A + .. . + uN-\(t)AN~'[. Найти дифференциальные уравнения для «,¦(/), используя тот факт, что ~-rr eAt = Ае . 64. Пусть А — матрица размеров NxN и А( + ) образована из А путем замены нулями . всех элементов, расположенных на главной диагонали и ниже. Пусть А(—)=А—А( + ) и предположим, что А( + ) и А(—) переста- перестановочны. Запишем ел =PQ, где Р — / имеет ненулевые члены только над диагональю, a Q—/ имеет ненулевые элементы под диагональю. Тогда с не- ') P. D. La х, Differential Equations, Difference Equations and Matrix Theory, Comm. Pure Appl. Math. 11 A958), 175—194. 2) A. F. Weinberger, Remarks on the Preceeding Paper of Lax, Comm, Pure Appl. Math. 11 A958), 195—196. 3) Этот результат аналогичен теореме Виланда о собственных значениях суммы Двух нормальных матриц. См. Pacific J. Math. 5 A955), 633—638.
БИБЛИОГРАФИЯ И КОММЕНТАРИЙ 257 обходимостью Я = ел<+>, <2 = ел<-> и, следовательно, факторизация единственна. См. Бакстер (G. Baxter), An Operator Identity, Pacific J. Math. 8 A958), 649—664. Аналогия между этой факторизацией и факторизацией Винера—Хопфа глубже, чем это кажется с первого взгляда. Библиография и комментарий §§ 1 —10. Результаты и методы заимствованы из работ Беллман (R. Bellman), Stability Theory of Differential Equations, McGraw-Hill Book Company, Inc., New York, 1954 [русский перевод: Теория устойчивости дифференциальных уравнений, ИЛ, 1954]; Лефшец (S. Lefschetz), Lectures on Differential Equations, Ann. Math. Studies, no 14, 1946. §§ 2—3. Обсуждение проблемы определения характеристи- характеристического полинома см. Хаусхолдер и Бауэр (A. S. Householder and F. L. Bauer), On Certain Methods For Expanding the Characteristic Polynomial, Numerische Mathematik 1 A959), 29—40. § 6. Некоторые более поздние результаты и дополнительные ссылки см. в Гирш (К. А. Н i г s ch), A Note on Vandermonde's Determinant, J. Lon- London Math. Soc. 24 A949), 144—145. § 11. Доказательство канонического представления Жордана можно найти в книгах: Лефшец (S. Lefschetz), Differential Equations, Geometric Theory, Interscience Publishers, Inc., New York, 1957, Appendix I; Веддербери (J. H. M. Wedderburn), Lectures on Matrices, Amer. Math. Soc. Colloq. Publ. 17 A934). (См. также: И. М. Г е л ь ф а н д, Лекции по линейной алгебре, «Наука», 1966; А. И. Мальцев, Основы линейной ал- алгебры, Гостехиздат, 1956.) § 13. Результат получен Шуром в работе Шур (I. Schur), Uber die characteristischen Wurzeln einer linearen Substitution mit einer Anwendung auf die Theorie der Integral Gleichungen, Math. Ann. 66 A909), 488—510. § 14. Понятие нормальной матрицы, по-видимому, впервые введено в работе Теплиц (О. Toeplitz), Math. Z. 2 A919), 190. § 15. Эта приближенная диагонализация введена Перроном и обычно используется в теоремах об устойчивости. См. Перрон (О. Perron), Math. Z. 29 A929), 129—160.
258 ЯВНЫЕ РЕШЕНИЯ И КАНОНИЧЕСКИЕ ФОРМЫ МАТРИЦ [ГЛ. 11 § 16. Обсуждение теорем, касающихся результантов, см. в книге Ван-дер-Варден (В. L. Van der Waerden), Moderne Algebra, Springer — Verlag, Berlin, 1931. [Русский перевод: Современная алгебра, Гос- техиздат, 1947.] См. также А. Г. К у р о ш, Курс высшей алгебры, «Наука», 1968, § 17. Этот результат установлен Гамильтоном для кватер- кватернионов и Кэли для матриц. На стр. 18 книги Мак-Даффи поме- помещено обобщение теоремы Гамильтона—Кэли, данное Филипсом. Дальнейшие обобщения даны Ко и Ли (см. ссылку к упражне- упражнению 53 в настоящей главе). § 19. Этот вывод следует монографии Лефшеца, ссылка на которую приведена выше. Определение матрицы С является проблемой большой трудности. Хороший обзор результатов в этой области содержится в статье В. М. Старжинский, Обзор работ об условиях устойчивости три- тривиального решения системы линейных дифференциальных уравнений с перио- периодическими коэффициентами, «Прикладная математика и механика», 18, № 4 A954), 469—510. § 20. Посмотрим, что означает этот результат. Любое не- невырожденное точечное преобразование у=Ах может быть вы- выделено из непрерывного семейства преобразований, порождаемых дифференциальным уравнением —r- = CZ, Z@) = /, гдеЛ=<?с. § 22. Некоторые задачи, связанные с этими преобразова- преобразованиями, могут быть найдены в Research Problems в журнале Bull. Amer. Math. Soc, 1958. Существует большое количество интересных представлений решения дифференциального уравнения второго порядка (ри')'+ qu = 0. Одно из них, названное преобразованием Прю- фера, было обобщено Барретом на матричный случай (P(i)X')' + Q{t)X = 0 (Proc. Amer. Math. Soc. 8A957), 510—518). Дальнейшие обобщения и усовершенствования даны в статье Рейд (W. Т. Reid), A Prufer Transformation for Differential Systems, Pacific J. Math. 8 A958), 575—584. Приложение к теории устойчивости см. в статье Конти (R. Conti), Sulla ^-Similitudine tra matrici e l'equivalenza asin- totica dei sistemi differenziali lineari, Rev. Mat. Univ. Parma 8 A957), 43—47. § 23. Детальную сводку результатов об использовании би- ортогонализации в связи с основной проблемой обращения матриц и определением собственных значений и векторов см. в статье Хестенес (М. R. Hestenes). Inversion of Matrices by Biorthogona- lization and Related Results, J. Soc. Ind. Appl. Math. 6 A958), 51—90,
БИБЛИОГРАФИЯ И КОММЕНТАРИЙ 259 Одной из наиболее важных задач теории линейных диффе- дифференциальных уравнений является определение структуры реше- решений линейных систем уравнений вида N 2 Pi] (D) Xj = 0, xt @) = ct (i = 1, 2, . . ., N), где D=-t,— оператор дифференцирования. Соответствующая проблема в теории матриц связана с определением характери- характеристических чисел и собственных значений матриц А (к), элементы которых являются полиномами от X. Поскольку подробное обсуждение этой проблемы, которую мы лишь кратко затронули при рассмотрении матриц Л—XI, увело бы нас далеко от главного направления этой книги, мы отсылаем читателя к книге Фрезер, Дункан и Коллар (R. A. Fraser, W. J. Duncan and A. R. Collar), Elementary Matrices, The Macmillan Company, New York, 1946 [русский перевод: Теория матриц и ее приложения к дифференциальным уравнениям и динамике, ИЛ, 1950], где рассмотрены также многие прикладные задачи, например проблема флаттера. Рассмотрение аналитических свойств этих матриц приводит нас к общей теории матриц, элементы которых являются поли- полиномами от комплексной переменной. Эти вопросы важны не только сами по себе, но имеют также важные ответвления в современную физику и теорию прогнозирования. По этому по- поводу см. Масани (P. Masani), The Laurent Factorization of Operator-valued Functions, Proc. London Math. Soc. 6 A956), 59—69; Масани и Винер (Р. Masani and N. Wiener), The Prediction Theory of Multivariate Stochastic Processes, Acta Math. I 98 A957), 110—150; Хелсон и Лауденслагер (H. Helson and D. Lowdensla- ger), Prediction Theory and Fourier Series in Several Variables, Acta Math. 99 A958). Результаты, относящиеся к структуре матриц, элементами которых являются кватернионы, могут быть найдены в статье Вигман (N. A. W i e gma n), The Structure of Unitary and Orthogonal Quaternion Matrices, 111. J. Math. 2 A958), 402—407, где имеются также дальнейшие ссылки. 17*
Глава 12 СИММЕТРИЧЕСКИЕ ФУНКЦИИ, КРОНЕКЕРОВСКИЕ ПРОИЗВЕДЕНИЯ И ЦИРКУЛЯНТЫ § 1. Введение. В этой главе мы покажем, как некоторые за- задачи, связанные с различными симметрическими функциями собственных значений, приводят к одному важному понятию в теории матриц. Используя предельный переход, мы получим кронекеровскую сумму — матричную функцию, играющую важ- важную роль при рассмотрении матричных уравнений вида АХ + ХВ = С. A) Нам уже приходилось встречаться с таким уравнением в одной из предшествующих глав, и мы еще раз встретимся с ним в гл. 13, посвященной теории устойчивости. Кроме того, кронекеровское произведение понадобится нам в одной из по- последующих глав, посвященной теории стохастических матриц. После этого мы построим еще один важный класс блочных матриц, который возникает при рассмотрении некоторых косо- симметрических функций. Хотя эти вопросы тесно связаны с гео- геометрией /v'-мерного евклидова пространства, мы их здесь по- подробно не рассматриваем. Наконец, мы введем циркулянты, по-прежнему исходя из соображений симметрии. Во всей этой главе мы будем пользоваться одним и тем же подходом к определению собственных значений и собственных векторов матриц, именно матрица будет рассматриваться как эквивалент преобразования одного множества величин в дру- другое. Эта точка зрения иллюстрируется и в ряде упражнений. § 2. Степени собственных значений. Очень простой класс сим- симметрических функций от собственных значений представляют собой степенные суммы />*=2tf, *=1, 2, ... A) 1
4 2] СТЕПЕНИ СОБСТВЕННЫХ ЗНАЧЕНИЙ 261 Поставим себе задачу найти сумму Поскольку N v -2 »¦>/ B) мы можем выразить сумму квадратов собственных значений через два коэффициента характеристического полинома. Более Л' того, так как 2^г> k= I, 2, ..., является симметрической функ- « = 1 цией собственных значений, то мы знаем заранее, что она мо- может быть записана как полином от элементарных симметриче- симметрических функций. Во многих случаях, однако, такое представление не является самым удобным. Докажем следующую теорему: Теорема 1. При k = 1, 2, ... имеет место формула C) Доказательство. Если все собственные значения мат- матрицы А различны, то ее диагональное представление О Г1, А = Т О lN из которого, кстати, следует представление Ак \ О xl 0 Т'\ D) E) делает утверждение теоремы очевидным. Легко также видеть, что из знакомых уже нам соображений непрерывности фор- формула C) следует и для матриц общего вида,
262 СИММЕТРИЧЕСКИЕ ФУНКЦИИ [ГЛ. 12" Можно воспользоваться также приведением матрицы к тре- треугольной форме А=Т О г1, F)' где элементы, расположенные под диагональю, равны нулю,. а кг не обязательно различны. Легко видеть, что при этом Ak = Г\ О А Это представление дает другое доказательство формулы C). § 3. Полиномы и характеристические уравнения. Мы знаем, что каждой матрице соответствует характеристический полином. Не ясно, однако, можно ли каждому полиному отнести матрицу,, для которой этот полином будет характеристическим. Теорема 2. Для матрицы ~а2 О - ап О о о уравнение является характеристическим. Доказательство мы оставляем читателю в качестве упраж- упражнения. Упражнение 1. Используя приведенный выше результат, определить сумму кубов кор- корней уравнения %п+а{Кп~х + .. .+ап = 0- § 4. Симметрические функции. Хотя мы уже умеем находить матрицы, собственными значениями которых являются степени. Л*, а|, ..., an, не известно, как строить матрицы, собствен-
¦§ 4] СИММЕТРИЧЕСКИЕ ФУНКЦИИ 263 ные значения которых равны заданным функциям вида АД;, «,/=1, 2, ... Рассмотрим более сложную задачу: найти матрицу, соб- собственные значения которой равны Xi\ij, где Кг — собственные значения матрицы Л, а ,и,- — собственные значения матрицы В. Очевидно, что, положив Xi = [ii, мы приходим к исходной за- задаче. Рассмотрим наиболее простой случай квадратных матриц второго порядка. Имеем — п\\Х\ + Ьпу2, Ь22у2- A) Отсюда следует, что Xl\ilx2yl = B) Заметим, что величины Х\у\, Х\у2, х2уи Х2У2 фигурируют как в правой, так и в левой частях уравнений B). Введем четырех- четырехмерный вектор C) х2у2 и матрицу размеров 4X4 anbn aubl2 al2bn «12612 О12621 OJ2&22 «21I O21O12 O22611 О22О12 092^21 «22^2° С — Тогда уравнение B) можно записать в виде D) Cz. E) Отсюда следует, что z является собственным вектором мат- матрицы С, принадлежащим собственному значению Кщ\. Точно так же легко убедиться, что A.iji2, Агць A-2(i2 будут собственными значениями матрицы С, а соответствующие им собственные век- векторы вычисляются по формуле C).
264 СИММЕТРИЧЕСКИЕ ФУНКЦИИ [ГЛ. 12 Таким образом, мы решили задачу нахождения матрицы, собственными значениями которой служат произведения Хщ» i,j = h 2. § 5. Кронекеровские произведения. Поскольку даже в двумер- двумерном случае необходимы довольно громоздкие вычисления, по- попробуем ввести более удобные обозначения. Возвращаясь к уравнению D.4), мы видим, что в структуре матрицы С имеется определенная регулярность. При ближайшем рассмотрении ока- оказывается, что С можно записать в виде следующей блочной матрицы: апВ а12В С = или, еще проще, \а2]В а22В C = \\at]B\\. A) B) Легко видеть, что такое представление не зависит от размеров матриц А и В. Определение. Пусть А и В — квадратные матрицы соот- соответственно порядков М и N. Квадратная матрица порядка MN, определенная по формуле B), называется кронекеровским про- произведением матриц А я В я обозначается Из приведенных соображений сразу же следует Теорема 3. Собственными значениями матрицы АхВ являются произведения ?wjij, где Я, — собственные значения мат- матрицы A, a \xj — собственные значения матрицы В. Собственные векторы имеют вид x\yi x'yl D) Здесь x'k, k = l, 2, ..., М, обозначают компоненты соб- собственного вектора хг матрицы А, тогда как у1 является собствен- ным вектором матрицы В. Упражнения 1. Показать, что Sp (A XB) =Sp A Sp В. 2. Найти определитель \АхВ |.
8] КРОНЕКЕРОВСКИЕ СТЕПЕНИ - II 3. Показать, что 265 1ХВ = в о в о в § 6. Алгебра кронекеровских произведений. Для того чтобы оправдать название «кронекеровское произведение» и введен- введенные нами обозначения, мы должны показать, что АхВ обла- обладает рядом свойств, естественных для произведения. Мы оставляем читателю в качестве упражнения доказатель- доказательство следующих результатов: АХВХС = (АХ = Л Х(ВХС), (А X В) (С X D) = (АС) X (BD). Aа) A6) Aв) § 7. Кронекеровские степени — I. Рассмотрим теперь кронеке- кронекеровские степени, которые будем обозначать Если матрицы Л и В не перестановочны, то, вообще говоря, (АВ)кФАкВк, а в случае k=2 по самому определению {АВJфА2В2*). Вместе с тем (АВ)М=А^ВМ B) для любых матриц А и В. Это важное свойство устраняет те трудности, которые вызваны отсутствием перестановочности матриц. Мы воспользуемся этим свойством в главе, посвященной случайным матрицам. Упражнение 1. Доказать, что = Ат X А[1\ § 8. Кронекеровские степени — II. Если мы интересуемся только кронекеровскими степенями одной матрицы, а не произведе- произведениями вообще, то можно ввести матрицы, обладающие ана- аналогичными свойствами, но имеющие меньшую размерность. *) Если Л и В не являются вырожденными. (Прим. ред.)
266 СИММЕТРИЧЕСКИЕ ФУНКЦИИ Отправляясь от уравнений образуем произведения Я2*2 = а2]*2 + 2а /1 у у — f) ft у*- Л~ Л1Л1Л2 "llu21Al ' К\х\ = а\хх\ + 2а Ясно теперь, что матрица Ащ = «п ana2i «21 Па\2Х1Х2 («П«22 + 21а22х{х2 2«„ аиа22 + 2«2, 4- а2 г2 \ 12 2' «12«2l) X' 4- «2 Г2 ' 22 2* «12 а12а21 «22 *2 + а 2 а12а22 «22 аХ2а22х\, I? A) B) C) имеет своими собственными значениями Ц, Я,Я2 и %\. Легко- вычислить и соответствующие собственные векторы. Получим теперь выражение для Ащ. § 9. Кронекеровские степени—III. Пусть k — фиксированное целое число. Рассмотрим уравнение (a,,*, + al2x2f = а*,дс* = «пт' A) a12x2f~l (а21дг, + а22х2)' = а\~1а{хх\ где i = 0, 1, 2, ...,й. Матрица Л[А] определяется следующей таблицей размеров (?1)(*1) B) Это представление получено для квадратных матриц второго порядка. Представление для Л[6] в случае матрицы порядка N можно получить подобным же образом.
§ llj КРОНЕКЕРОВСКАЯ СУММА— Т 267 Упражнения 1. Показать, что 2. Показать, что •§ 10. Кронекеровский логарифм. Введем обобщенную степень матрицы для нецелого k. Для этого рассмотрим бесконечную последовательность, общий член которой имеет вид (апХ1 + а12Х2)к-1(а21Х1 + а22Х2)\ i = 0, 1, тде число k, вообще говоря, не целое. В этом случае вместо конечной таблицы вида (9.2) мы по- получаем бесконечную таблицу, поскольку биномиальный ряд для {а\\Х1+а\2х2)к~г бесконечен. Производя замену переменных I I 1 1 I гв\\ >\> A> II ^'2 || II '^2 || убеждаемся, что для произвольных значений k (АВ)ш = АшВт. B) Разложим теперь каждый элемент матрицы Ащ в окрест- окрестности k = 0. Имеем ) + ... C) Это соотношение определяет бесконечную матрицу L{A), о ко- которой можно говорить как о кронекеровском логарифме. Под- Подставляя разложения C) в B), мы видим, что L(AB)=AmL(B)+L(A)Bm. D) Это соотношение аналогично функциональному уравнению для скалярного логарифма. Заметим, что здесь А[щ не является единичной матрицей. Упражнение 1. Определить ij-Pi элемент матрицы L(A) для (=0, 1 и /—0, 1. § 11. Кронекеровская сумма —I. Обратимся теперь к задаче определения матриц, собственные значения которых равны Я,- + Hj. При этом мы воспользуемся применявшимся мето- методом, позволяющим получать аддитивные свойства на известных
268 СИММЕТРИЧЕСКИЕ ФУНКЦИИ [ГЛ. 12 мультипликативных. Рассмотрим соотношение AМ + еЛ) X (IN + еВ) = 1М X IN + е AМ X В + А X IN) + е2(Л X В), 0> где е — числовой параметр. Поскольку собственные значения матрицы (/дг + еЛ)Х X(/iv + eS) имеют вид A + eXt) A + ецу) = 1 + е (Я,, + цу) + е2/^-, то собственные значения матрицы ImXB+AxIn должны быть равны X Упражнение 1. Определить собственные векторы матрицы 1МХВ+Ах1 л-. § 12. Кронекеровская сумма —II. Матрицу /м X В + А X Av можно получить также с помощью дифференциальных уравне- уравнений. Рассмотрим уравнения ~ = апху + al2x2, -g- = bny{ + й12г/2. dx dy = a2ixt Вычислим производные произведений Xiyh X\y2, х2уи х2у2. Имеем ^f = (апх{ + al2x2) yx + Ar: (&ni/i + bl2y2) = = (an + bn) xxyx + bX2xxij2 + al2x2yx B) и т. д. Легко видеть, что матрица, которую мы получаем, в точно- точности равна AxIn+JmXB. § 13. Уравнение АХ + ХВ= С. В гл. 11 было показано, что уравнение АХ+ХВ = С A) имеет единственное решение оо X = - J eAtCeM dt B) о при условии, что интеграл в правой части существует при любой матрице С. Дополним этот результат.
§ 131 УРАВНЕНИЕ 269 Рассмотрим случай, когда А, В, С и X являются матрицами второго порядка. Уравнения для неизвестных элементов хц имеют вид C) #п*11 + #11*12 + #21*11 + #21*12 + #12*21 #12*22 #22*21 #22*22 Матрица коэффициентов #п + Ьп Ь\ч Й21 0 b2t #11 + 0 #21 + X + х + X + х Ьч2 9] 0 1 1 ~Т~ О\0 |2 ~i #12 0 #22 + *12»21 *12^22 x22b2i x22b22 Ьп = Си, = С12, = С21, = с22. 0 #12 &21 222 + D) есть не что иное, как матрица ЛХ/+/ХВ'. Собственные значения этой матрицы равны Я,- + |х;-, поскольку собственные значения матриц В я В' совпадают. Нетрудно ви- видеть, что этот результат может быть обобщен на случай матриц произвольного порядка. Поэтому имеет место Теорема 4. Для того чтобы уравнение A) имело реше- решение при любой матрице С, необходимо и достаточно, чтобы Кг + 11]Ф0, где Xi — собственные значения матрицы A, a jli;- — собственные значения матрицы В. Упражнения 1. Доказать, что необходимым и достаточным условием того, что урав- уравнение АХ+ХА' = С имеет единственное решение при всех матрицах С, является неравенство },1 + }^фО для всех f и /, ' 2. Доказать предыдущий результат следующим образом: (а) Пусть Т — матрица, приводящая А к треугольной форме 1 612 • • • V h h 2 - ' - U2N О 'NN тогда АХ+ХА' = С переходит в уравнение В'(Т'ХТ) + (Т'ХТ)В = Т'СТ. (б) Пусть У=Т/ХТ. Рассмотреть линейное уравнение для элементов мат- N рицы У. Показать, что определитель этой системы равен JJ {Ьц + Ьц) и вывести отсюда сформулированный результат. (Хан.)
270 СИММЕТРИЧЕСКИЕ ФУНКЦИИ [ГЛ. 12 § 14. Другое доказательство. В предыдущих параграфах мы отметили, что кронекеровские произведения возникают из рас- рассмотрения симметрических функций собственных значений двух различных матриц А и В. Для случая одной матрицы А была определена кронекеровская степень частного вида. Рассмотрим теперь другой тип степеней матриц, возникаю- возникающих при рассмотрении некоторых кососимметрических функций, а именно определителей. Отметим, что формальным на первый взгляд выкладкам можно дать четкую геометрическую интер- интерпретацию. Читателю, интересующемуся геометрической сторо- стороной затрагиваемых вопросов, мы рекомендуем обратиться к книге Бохера и Клейна, ссылка на которую имеется в библио- библиографии к этой главе. Для того чтобы подчеркнуть основную идею, не слишком углубляясь в арифметику и алгебру, рассмотрим матрицу треть- третьего порядка и совокупность определителей второго порядка,об- порядка,образованных из собственных векторов этой матрицы. В принципе ясно, как обобщить предлагаемую процедуру на случай опреде- определителей порядка R, образованных из собственных векторов матриц порядка N. На практике это выливается в чрезвычайно трудоемкие выкладки, включающие вычисления определителей. Таким образом, мы оставляем ни в коем случае не тривиальные детали интересующемуся читателю. Рассмотрим матрицу А = a{ a2 С\ a3 b, A) где мы на время отказались от наших обычных обозначений. Это сделает более прозрачными наши выкладки и результаты. Для любых двух собственных векторов xi и х>, 1Ф\, обра- образуем набор уравнений для определителей у\, у2, Уз второго по- порядка, заданных соотношениями: lri \*\ 4~\ Учитывая равенства Vi B) l.xl2 = blx\ + b2xl2 Ь3х'я, C)
14] ДРУГОЕ ДОКАЗАТЕЛЬСТВО 271 а также аналогичные равенства с заменой / на /, легко заклю- заключить в силу B), что ахх\ + а2х12 + а3х3 ахх{ + а2х!2 + а3х, Ь{х\ + Ь2х12-\-Ь3х13 b{x[-\-b2x>2 + b3x. D) Если а — вектор с компонентами а,-, аи — вектор с компонен- компонентами bi, то D) эквивалентно уравнению (а, х1) (a, xj) E) (b, (b, xJ) В этом месте нам потребуется обобщить разложение определи- определителя Грама, данное в § 5, гл. 4. К счастью, это обобщение су- существует*). Легко проверить, что (а, х1) (а, XI) (Ь, *<) (Й, х>) 9 xi 4 4 В силу симметрии отсюда непосредственно следует, что г/г 1 = г/з1 gn(a, b) g23{a, b) g3l(a, b) gi2(a, с) (a, с) g3l(a, с) где , с) g23(b, с) g31(b, с) xi У) F) G) (8) Прежде всего отметим, что A,-uj является собственным значе- значением, а у — собственным вектором матрицы, фигурирующей в системе G). Поскольку матрица не зависит от индексов i и /, мы видим, что собственными значениями этой матрицы могут быть только ЛДг, ЯДз и ЯгЯ3. Таким образом, мы получили спо- способ определения матрицы, собственными значениями которой ЯВЛЯЮТСЯ kiXj, гф\. Упражнения 1. Возвращаясь к обычным обозначениям для элементов матрицы А, выписать выражения для i, /-го элемента матрицы, фигурирующей в фор- формуле G). *) См. Ф. Р. Гантмахер, Теория матриц, «Наука», 1967, стр. 20, формула Бине — Коши. (Прим. ред.)
272 СИММЕТРИЧЕСКИЕ ФУНКЦИИ [ГЛ. 12 2. Пусть А—квадратная матрица порядка N. Воспользовавшись описан- описанной процедурой, найти формулу для элементов матрицы порядка JV(iV—1)/2, собственными значениями которой являются ЯД), i Ф /. 3. На основании полученных результатов показать, что для симметри- симметрической матрицы А имеет место неравенство AiA а12 а22 а также ряд неравенств аналогичного вида. 4. Пусть А — квадратная матрица порядка N, а г — целое число, лежа- лежащее между 1 и N. Обозначим через ST совокупность всех наборов из г раз- различных целых чисел, выбранных из отрезка натурального ряда 1, 2, .. ., N. Пусть s и t — два элемента, принадлежащие Sr, a Ast—матрица, образован- образованная из матрицы А вычеркиванием всех строк с индексами, не входящими в s, и всех столбцов с индексами, не входящими в t. Пусть все элементы Sr перенумерованы в определенном порядке, ска- скажем si, si, ..., sM. Матрица порядка М, где ЛМ М М= r\(N-r)\' Cr(A)=\l\As.Sj\\\, называется r-й ассоциированной матрицей для матрицы А. Установить сле- следующие результаты: (а) СГ(АВ) = СТ[А)-СТ(В); (б) Сг (А') = Сг (А)'; (в) (г) (Д) Ст(А-х)=Ст{А) -\ \СГ{А)\ = \А\ iN-l)\ (r-l)!(/V-r)! ' собственными значениями матрицы СТ(А) являются [хь \iit -.,., \iu, где |Xi + |X2+.. .+[Хм—а-я элементарная симметрическая функция от По поводу ассоциированных матриц см. Резерфорд (D. E. Ruther- Rutherford), Compound Matrices, Koninkl. Ned. Acad. Wetenschap. Amsterdam, Proc. Sect. Sci., ser. A 54 A951), 16—22*). В книге Вайценбука (R. Weitzenbuck, Jnvariantentheorie, Groningen, 1923) рассматривается связь теории ассоциированных матриц с теорией инвариантов. § 15. Циркулянты. При рассмотрении многих вопросов встре- встречаются матрицы вида С = Со cN-l cN-2 CQ С2 Со A) ') Дальнейшие результаты и ссылки можно найти в работе Райзера J. Ryser), Inequalities of Compound and Induced Matrices with Appli- (H. cations to Combinatorial Analysis, 111. J. Math. 2 A958), 240—253. *) См. также Ф. Р. Г а н т м а х е р, Теория матриц, «Наука», 1967, § 4. (Прим. ред.) гл. 1,
УПРАЖНЕНИЯ К ГЛ. 12 273 Определим собственные значения и собственные векторы таких матриц. Пусть Г\— корень скалярного уравнения rN=l. По- Положим #i=co + <Vi + ••• +Wf~'- B) Тогда легко видеть, что у\ удовлетворяет следующей системе уравнений: У\ = со ciri г rN~\ V-2' 1 rW-1 C) r.V-1, 4 N-l I D\  ' ' 1 ' - ' " '01 Следовательно, у\ является собственным значением мат- матрицы С, а вектор 1 х1 = Г\ -N-1 1 D) — соответствующим собственным вектором. Поскольку уравнение rN = \ имеет JV различных корней, мы получаем, таким образом, N различных собственных значений и соответствующих им собственных векторов. Упражнения 1. Аналогично этому с помощью скалярного уравнения г5 — аг+1 найти собственные значения и собственные векторы матрицы: с0 с2 с3 с2 с3 c2 С4 Со ~Ь C4Q С| С% Сз 2. Обобщить этот результат, используя уравнение rAf = b1rA'H+ ... +bN. Упражнения к гл. 12 1. Пусть f(X)—функция N2 переменных xtj, разложимая в степенной ряд по этим переменным в окрестности нуля. Показать, что f{X) = fj Sp 18 P. Беллман
274 СИММЕТРИЧЕСКИЕ ФУНКЦИИ [ГЛ. 12 2. Верно ли, что SdX у SpfrM), 3. Если Л и В — положительно определенные матрицы, то матрица АхВ положительно определенная. 4. Если А и В—симметрические матрицы, причем А^В, то Л'-"' ^ В1"' для я=1, 2, ... 5. Если г удовлетворяет уравнению г" +airN~i + .. . + a,v=0, а s — урав- уравнению s*r+6isju'-1 + .. .+6м=0, то как найти уравнение, корнями которого ЯВЛЯЮТСЯ /"iSj? 6. Пусть 1, oci, ...,a,v-i—элементы конечной группы, и пусть x — Xo+aiXi + .. . + а,\~]Хк-и где Xt — скаляры. Рассмотреть произведения a,iX = a,i@)xo + a,i{\)Xi + . .. + a.i(N—l)xW-i, где элементы a,(/) представ- представляют собой а;, упорядоченные некоторым образом, или a,tX = Xo(i)+Xi(i)a.i + ... ...+x,v_i(i)a,v-i, где Xt(j) представляют собой хи упорядоченные некоторым образом. Введем матрицу X=||JCf(/)|| и определим соответствие Х~х. Если Х~х, а У~(/, то верно ли, что XY ~ ху? 7. Пусть 1, аь ..., a,v-i—элементы конечной группы G, а 1, рь ... ..., Рдг-1—элементы конечной группы Н. Рассмотреть прямое произведе- произведение G и Н, которое определяется как группа порядка MN с элементами а,-р,. Используя процедуру, описанную в предыдущем упражнении, получить мат- матрицу, соответствующую Какова связь между этой матрицей и матрицами JV-l iM-1 1=0 1=0 В работе О. Таусски1) исследуется связь между понятием групповой мат- матрицы и понятием нормальности. 8. Уравнение АХ — ХА=КХ имеет нетривиальные решения X тогда it только тогда, когда Я = Л,- — Я,-, где Яь Я2, ..., kN — собственные значения матрицы А. (Лаппо-Данилевский.) 9. Пусть F — матрица порядка N2, разбитая на N подматриц, так что каждая из подматриц имеет порядок N, причем каждая подматрица fa является рациональной функцией fi,(A) некоторой матрицы А порядка Л'. Если Яь Я2, ..., Адг—собственные значения матрицы А, то собственными значениями матрицы F являются собственные значения N матриц ||fij(Ai)|L k — l, 2, ..., N, каждая из которых имеет порядок N. См. Вильям сон2) и Афрайэт3). В работах Тодда4) иЛоуэна5) эти вопросы излагаются ') О. Т а и s s k у, A Note of Group Matrices, Proc. Amer. Math. Soc. в A955), 984—986. 2) Williamson, The Latent Roots of a Matrix of Special Type, Bull. Amer. Math. Soc. 37 A931), 585—590. 3) S. N. A f r i a t, Composite Matrices, Quart, J. Math., Oxford 2d, ser. 5, 1954, 81—98. 4) J. Todd, The Condition of Certain Matrices, III J. Research Nat. Bur. Standards 60 A958), 1—7. 5) A. N. L о w a n, The Operator Approach to Problems of Stability and Convergence of Solutions of Difference Equations, Scripta Math., no 8, 1957.
УПРАЖНЕНИЯ К ГЛ. 12 275 применительно к численному решению дифференциальных уравнений в част- частных производных. 10. Пусть f(Q)—действительная функция, определенная на отрезке —я^О^я. Рассмотрим коэффициенты Фурье функции /(9): я с„^~- j /(9)e~'"ed0, re = 0, ±1, ±2, ... —я Конечные матрицы вида rJV = ||cft_,||, k, 1 = 0, 1, 2, ..., N, называются тёплицевыми матрицами порядка N. Показать, что матрица 7\v является эрмитовой. 11. Обозначим через А] , Я^, ..., A/y+t собственные значения матрицы TN. Показать, что N + \ 2я ,. —я f(Q)dQ. 12. Показать, что N+ oo Л' + 1 2я — я (Последние два результата являются частными случаями общего результата, установленного Сегё в 1917 г. Изложение более поздних результатов чита- читатель найдет в работе Каца, Мердока и Сегё1). Обобщение тёплицевых матриц было получено Гренандером2), см. также работу У и д о м а 3). 13. С помощью кронекеровской суммы двух матриц Л©? определить кронекеровскую производную от переменной матрицы X(t) соотношением ЬХ ,. X(t + h)\^(-X{t)) _ = llm :, . 14. Рассмотреть дифференциальное уравнение Имеет ли оно решение? Если да, то найти его. ') М. Кае, W. L. Mu r dock and G. Szego, On the Eigenvalues of Certain Hermitian Forms, J. Rat. Mech. Analysis 2 A953), 767—800. 2) U. G r e n a n d e r, Trans. Amer. Math. Soc, 1958. [См. также У. Г р е- нандер и Г. Сегё, Тёплицевы формы и их приложения, ИЛ, 1961. (Прим. ред.)] 3) Н. W i d о m, On the Eigenvalues of Certain Hermitian Operators, Trans. Amer. Math. Soc. 88 A958), 491—522. 18*
276 СИММЕТРИЧЕСКИЕ ФУНКЦИИ [ГЛ. 12 Библиография и комментарий § 1. Прямое произведение матриц тесно связано с поня- понятием прямого произведения групп. Изложение этих вопросов имеется в монографиях Мак-Даффи (С. С. MacDuffee), The Theory of Matrices, Chelsea Publishing Co., New York, 1946, chapter VII; M урна га н (F. D. Murnaghan), The Theory of Group Representa- Representation, Johns Hopkins Press, Baltimore, 1938. [Русский перевод: Теория пред- представлений групп, ИЛ, 1950]. Здесь мы хотели только показать, как это понятие возникает в связи с двумя различными задачами. Одна из них рассмотрена в этой главе, другая будет изложена в гл. 15. См. также Картан (Е. С art an), Oeuvres Completes, part. 1, vol. 2, 1045—1080, где вводится понятие зонной гармоники положительно опреде- определенной матрицы. § 4. Эта процедура заимствована из работы Беллман (R. Bellman), Limit Theorems for Non-commutative Opera- Operations, I, Duke Math. J. 21 A954), 491—500. § 10. Кронекеровский логарифм введен в только что цити- цитированной работе Беллмана. § 11. Теорема 4 приводится в цитированной выше книге Мак-Даффи. Эта теорема независимо была получена Ханом. См. Хан (W. Hahn), Eine Bemerkung zur zweiten Methode von Lyapunov.. Math. Nachr. 14, No 4/6 A956), 349—354. Этот же результат позднее был независимо получен Белл- маном. См. Беллман (R. Bellman), Kronecker Products and the Second Method of Lyapunov, Math. Nachr., 1959. § 13. Обширные исследования были проведены для соответ- соответствующих операторных уравнений. Помимо самостоятельного интереса, который представляют эти уравнения, это вызвано еще и той ролью, которую они играют в квантовой механике. См. Розенблюм (М. Rosenbloom), On the Operator Equatioa BX — XA = C, Duke Math. J. 23 A956); Хайнц (Е. Heinz), Math. Ann. 123 A951), 415—438; Резерфорд (D. E. Rutherford), Koningl. Ned. Akad. Wetenschap., Proc, ser. A 35 A932), 54—59. § 14. Вопросы, затронутые в этом параграфе, относятся к теории инвариантов в линейных преобразованиях. См. Б о хер (М. Bocher), Introduction to Higher Algebra, The Macmillan. Company, New York, reprinted, 1947;
БИБЛИОГРАФИЯ И КОММЕНТАРИИ 277 Клейн (F. Klein), Elementary Mathematics from an Advanced Stand- Standpoint, Geometry, Dover Publication, New York [русский перевод: Элементар- Элементарная математика с точки зрения высшей, т. I, ГТТИ, 1933; т. II, ГТТИ, 1934]; В ей ль (Н. Weyl), The Classical Groups, Princeton University Press, Princeton, N. J., 1946 [русский перевод: Классические группы, их инварианты и представления, ИЛ, 1947]. Определители второго порядка являются координатами Плю- кера. Основная идея состоит в том, что каждое линейное пре- преобразование имеет большое число связанных с ним индуциро- индуцированных преобразований, которые позволяют очень просто вы- вывести некоторые свойства исходного преобразования. Как мы уже упоминали, желая избежать громоздких вычислений, свя- связанных с определителями, мы не разбирали эти вопросы под- подробно. См. статью Швердфегер (Н. Schwerdtfeger), Skew-symmetric Matrices and Projective Geometry, Amer. Math. Monthly 51 A944), 137—148. В упражнениях 15 и 16 к гл. 14 мы встретимся с вероят- вероятностной интерпретацией координат Плюкера, где также дается ссылка на работу Карлина и Мак-Грегора. § 15. Циркулянты играют важную роль во многих физико- математических теориях. См. статью Берлин и Кац (Т. Н. Berlin, M. Kac), The Spherical Model of a Ferromagnet, Phys. Rev. 86 A952), 821—835, где можно найти дальнейшие ссылки на работы Онзагера и др., связанные с прямыми произведениями матриц и групп. Ассоциированные матрицы рассматриваются в работах Райзер (Н. J. Ryser), Inequalities of Compound and Induced Matrices with Applications to Combinatorial Analysis, 111. J. Math. 2 A958), 240—253; де Брейн (N. G. de Bruijn), Inequalities Concerning Minors and Eigenvalues, Nieuw. Arch. Wisk. C) 4 A956), 18—35; Литлвуд (D. E. Little wood), The Theory of Group Characters and Matrix Representations of Group, Oxford, New York, 1950; HI у р (I. Schur), Dber eine Klasse von Matrizen die sich einer gegebe- nen Matrix zuorden lassen, Dissertation, Berlin, 1901; Веддерберн (J. H. M. Wedderburn), Lectures on Matrices, Amer. Math. Soc. Colloq. Publ 17 A934); Мак-Даффи (С. С. MacDuffee), The Theory of Matrices, Chelsea Publishing Company, New York, 1946; Тёплнц (О. Toeplitz), Das algebraischen Analogen zu einem Satze von Fejer, Math. Z. 2 A918), 187—197; Маркус, Мойлс и Уэствик (М. Marcus, В. N. Moyls and R. West wick), Extremal Properties of Hermitian Matrices II, Canad. J*. Math., 1959.
Глава 13 ТЕОРИЯ УСТОЙЧИВОСТИ § 1. Введение. Чрезвычайно важной задачей является исследо- исследование поведения физической системы в окрестности положения равновесия. Если система, выведенная из положения равнове- равновесия малыми возмущениями, возвращается в это положение, то эта система называется устойчивой. В противном случае си- система называется неустойчивой*). Хотя очень часто наличие этого свойства можно проверить экспериментально, такой эксперимент обычно слишком дорог и требует больших затрат времени. Следовательно, при построе- построении системы всегда желательно иметь математический критерий устойчивости. Как мы уже отмечали в гл. 11, линейные уравнения вида ^7 = Ах, х@) = с, A) во многих случаях могут быть использованы для исследования поведения системы в окрестности положения равновесия, кото- которое в данном случае соответствует точке * = 0. Поэтому мы начнем с вывода необходимых и достаточных условий того, что решение системы A) стремится к нулю при t—>oo. Реальная экономическая, техническая или физическая задача на самом деле много сложнее, поскольку уравнения, описывающие процесс, являются нелинейными. В частности, эти уравнения могут иметь вид ^f = Ay + g(y), у@) = с. i B) Возникает вопрос, может ли критерий, выведенный для линей- линейных систем, служить для исследования устойчивости в общем нелинейном случае. Оказывается, что при довольно естествен- естественных предположениях на этот вопрос можно ответить положи- положительно. Этот вывод является одним из результатов классиче- *) См. примечание к § 1 гл. 10. (Прим. ред.)
УСЛОВИЯ УСТОЙЧИВОСТИ 279' ских работ Пуанкаре и Ляпунова. Однако здесь мы не будем заниматься нелинейным случаем и ограничимся рассмотрением линейных уравнений. § 2. Необходимые и достаточные условия устойчивости. Начнем с доказательства основного результата. Теорема 1. Для того чтобы решение уравнения х @) = с, A) стремилось к нулю при (->оо а любом с, необходимо и доста- достаточно, чтобы собственные значения матрицы А имели отрица- отрицательные вещественные части. Доказательство. Если среди собственных значений матрицы нет одинаковых, то представление J-J eAt =T 0 о т-\ B) делает утверждение теоремы очевидным. К сожалению, мы не можем прибегнуть к соображениям непрерывности, чтобы дока- доказать сформулированный результат для общего случая. Поэтому мы поступим следующим образом. Вместо того чтобы приводить матрицу А к диагональному виду, преобразованием подобия приведем ее к треугольной форме, Т~]АТ = В. Система A) в этом случае принимает вид D/у /у (г\\ /i/ /Q\ -jf-Bz, z(o) = c, F} где В — треугольная матрица, а х = Tz, или, в скалярной форме, ~dt ¦ .. . + bxxzN, b22z2 + .. . + b2NZft, dz dt N_ __ bNNZN> Поскольку элементы Ьц являются собственными значениями матрицы А, то по предположению Яе(Ьц) <0 для 1= 1,2, ..., Л^
280 ТЕОРИЯ УСТОЙЧИВОСТИ [ГЛ. 13 Последнее из уравнений D) дает zN = cNeb"N\ E) откуда следует, что zN—*0 при t—*-oo. Для того чтобы показать, что все z,-—*0 при t—> оо, мы вос- воспользуемся индукцией, основанной на следующем результате. Если v(t) —*0 при t—*oo, то решение «(/) системы ^L = b1u + v(t), «@) = а„ F) стремится к нулю при условии, что Re(&i)<0. Это сразу же следует из того, что t и (t) = ахеъ* + еь'< | e~b's v (s) ds. G) о Поскольку Zjv стремится к нулю при t—>oo, то в силу сказан- сказанного выше мы получаем, что все гг—>0 при /-*оо. 1. Доказать теорему 1, используя каноническую форму Жордана. § 3. Устойчивые матрицы. Чтобы избежать ненужных повторе- повторений, введем новый термин. Определение. Матрица А называется устойчивой, если ее собственные значения имеют отрицательные действительные части. Упражнения 1. Выразить необходимые и достаточные условия устойчивости действи- действительной матрицы в терминах матрицы ||Sp (Л*+'I1- (Басе.) 2. Каковы соответствующие условия в случае, если матрица А комп- комплексная? § 4. Метод Ляпунова. Посмотрим теперь, как квадратичные формы могут быть использованы при изучении асимптотического поведения решений линейных дифференциальных уравнений. Этот метод принадлежит Ляпунову и играет главную роль в ¦современной теории устойчивости нелинейных функциональных уравнений всех видов. Рассмотрим уравнение jjj- = Ax, х@) = с, A)
§ 4] МЕТОД ЛЯПУНОВА 281 где с я А предполагаются действительными, а также квадра- квадратичную форму и = (х, Yx), B) где Y — симметрическая постоянная матрица, элементы которой пока не определены. Имеем -^f = (-*', Yx) + (x, Yx') = (Ax, Yx) + (x, YAx) = = (x, (A'Y + YA)x). C) Предположим, что Y является решением уравнения A'Y+YA = —I, D) к тому же мы потребуем, чтобы матрица Y была положительно определенной. Тогда C) приобретает вид |f-=-(*,*), E) откуда 4г <-*->. F) где Адт — наибольшее собственное значение матрицы К. Из F) _%-\t следует, что и^.и@)е N , т. е. и—>0 при t—к», Положи- Положительная определенность матрицы Y гарантирует стремление к нулю всех компонент вектора х при t-*oo. Вместе с тем мы знаем (см. § 13 гл. 12), что если матрица А устойчива, то уравнение D) имеет единственное симметрическое *) решение Y. Поскольку при этом Y определяется формулой $ A'beAbdtt, G) о то (х, Yx) = J (x, eA'l'eAt'X) dt{ = J (eAt>x, eAt*x) dtx. (8) о о Таким образом, матрица У является положительно определен- определенной, так как матрица eAt всегда невырожденная. Упражнения 1. Рассмотрим уравнение —тг = Ах + g (jc), x @) = с, где (а) матрица А устойчивая; (б) ||#(*)]1/||*1|->0 при ||х||-»0; (в) ||с|| достаточно мала. *) Симметричность У следует из вида уравнения D): достаточно в D) перейти к транспонированным матрицам. См. также G). (Прим. ред.)
82 ТЕОРИЯ УСТОЙЧИВОСТИ [ГЛ. 13 Пусть матрица Y обладает свойствами, указанными в § 4. Доказать, что если х является решением предыдущего нелинейного уравнения, а также вы- выполнены указанные условия, то где Г\— положительная константа. Вывести отсюда, что х -> 0 при /->- оо. 2. Обобщить предыдущие рассуждения на случай комплексной мат- матрицы А. § 5. Среднеквадратичное отклонение. Предположим, что А — устойчивая матрица, и нам требуется вычислить интеграл оо /= \ (х, Bx)dt, A) о" где х является решением уравнения D.1). Здесь интересно от- отметить, что интеграл / можно вычислить как рациональную функцию элементов матрицы А, не зная решения линейного дифференциального уравнения. В частности, нет необходимости вычислять собственные значения матрицы А. Определим постоянную матрицу У с помощью соотношения jf{x,Yx). B) Ясно, что B=A'Y+YA. C) Определив таким образом матрицу У, мы получаем следующее выражение для интеграла /: / = -(с, Ус). . D) Поскольку матрица А устойчива, уравнение C) имеет единст- единственное решение, которое может быть выражено через опреде- определители. § 6. Некоторые эффективные критерии устойчивости. Задача проверки матрицы на устойчивость является довольно трудной, и до сих пор не получено сколько-нибудь простого ее решения. Эту задачу осложняет то обстоятельство, что мы не столько заинтересованы в ее решении для данной конкретной матрицы А, сколько в получении условий, которые позволяли бы нам утверждать, что различные представители класса матриц А(\х) являются устойчивыми. Вопросы такого типа постоянно возни- возникают при конструировании систем управления, в математиче- математической экономике, а также при изучении вычислительных алго- алгоритмов.
HFKnTDPblF ЭФФЕКТИВНЫЕ КРИТЕРИИ УСТОЙЧИВОСТИ 285 Если характеристический многочлен матрицы А получен, то существует множество критериев, с помощью которых мы можем судить, имеют ли собственные значения матрицы А отри- отрицательные вещественные части или нет. По-видимому, наиболее- полезным из них является критерий Гурвица. Рассмотрим уравнение Для многочлена, стоящего в правой части A), составим бес- бесконечную таблицу О О 1 1 а2 аА а, а4 0 0 а. а-г 0 0 1 где коэффициенты k полагаются равными нулю, если k>N. Для того чтобы все корни уравнения A) имели отрицательные ве- вещественные части, необходимо и достаточно, чтобы все опреде- определители из последовательности 1 а2 а. 1 а2 а* аА О C) были положительны. Не существует сколько-нибудь простого доказательства этого результата. В следующем параграфе мы наметим в об- общих чертах один из возможных путей, а в приложении Б кос- коснемся некоторых идей Эрмита, которые послужили основой для доказательства Гурвица. Оба эти способа опираются на квад- квадратичные формы. Ссылки на работы, где приводятся другие доказательства, даны в конце главы. Причина, почему этот результат не всегда является эффек- эффективным, состоит в необходимости вычисления определителя JA/ — А\, что является крайне нежелательным, если порядок матрицы А достаточно велик. Упражнения 1. Будем называть многочлен устойчивым, если все его корни имеют отрицательные вещественные части. Используя приведенный критерий, пока- показать, что необходимым и достаточным условием устойчивости квадратного трехчлена X'2+aiX+a2 является положительность коэффициентов: fli>0, аг>0.
284 ТЕОРИЯ УСТОЙЧИВОСТИ [ГЛ. 13 2. Для многочлена X3+aiX2 + a2'K + a3 показать, что соответствующие усло- условия устойчивости состоят в выполнении неравенств а1а2>а3. 3. Показать, что для многочлена Х4 + а\Х3 + а2'кг + аз\ + а4 эти условия сво- сводятся к неравенствам alt a4 > 0, аха^ > a3, a3(aia2 —а3) > \ § 7. Необходимое и достаточное условие устойчивости матриц. Покажем теперь, что из результата, установленного в § 4, сле- следует Теорема 2. Пусть Y определяется соотношением A'Y+YA = —I, A) тогда необходимым и достаточным условием устойчивости мат- матрицы А является положительная определенность матрицы Y. Доказательство. Так же как и в § 5, нетрудно убе- убедиться в том, что т (х, х) dt = (х @), Yx @)) - (х (Г), Yx (T)) B) о или т (х(Т), Yx (Г)) + J (*, х) dt = (x<@), Yx @)). C) о Здесь х является решением уравнения —у- = Ах. Если мат- т рица У положительно определена, то (х, х) dt равномерно о ограничен, откуда следует, что x(t) —>-0 при t—*oo*), а следо- следовательно, матрица А является устойчивой. Тот факт, что мат- матрица Y является положительно определенной, если матрица А устойчива, мы уже доказали ранее. § 8. Дифференциальные уравнения и собственные значения. Рас- Рассмотрим дифференциальное уравнение Ах" + 2Вх' + Сх = 0, х@)=с\ х'@)=с2, A) где матрицы А, В я С являются неотрицательно определенными. Такие уравнения часто возникают при исследовании электриче- электрических цепей, состоящих из емкостей, индуктивностей и сопротив- *) Это связано с тем, что (x(t), x(t)) представляет собой комбинацию экспонент и полиномов параметра t. (Прим. ред.)
¦§ 8] УРАВНЕНИЯ И СОБСТВЕННЫЕ ЗНАЧЕНИЯ 285 лений. Это обстоятельство наводит на мысль, что должен ока- оказаться справедливым следующий результат: Теорема 3. Если матрицы А, В и С являются неотри- неотрицательно определенными и, кроме того, либо матрица С, либо матрица А являются положительно определенными, то уравнение |=0 B) не имеет корней с положительной действительной частью. Если же матрицы А и С неотрицательно определенные, а мат- матрица В положительно определена, то единственным корнем с ну- нулевой действительной частью является Х = 0. Доказательство. Приведем доказательство, которое опирается на физические соображения. Имеем (*', Ах")+2(х', Вх') + (х', Сх)=0. C) Тогда для любого s>0 J [(л', Ах") + 2 (л', Вх') + (x't Cx)] dt = O D) о или s (х', Ах') f0 + 4 | (х', Вх') dt + (х, Сх) |os = 0. E) о Это эквивалентно уравнению {х1 (s), Ax' (s)) + 4 J (х', Вх') dt + {х (s), Сх (s)) = c3, F) о где с3= (с2, Ас2) + (с1, Се1). Если X — корень уравнения B), то уравнение A) имеет ре- решение вида еис. Если X действительно, то и с — действительный вектор. Если X комплексно, X = ri+ir2, то действительная часть выражения еис, равная erit (a1 cos r2t+a2smr2t), также является решением. Подставляя в F), мы получаем е2^ (Ь\ АЬ1) + 4 J е2г^ (b2 (t), Bb2 (t)) dt + e^s {b\ C&3) = c3, G) о где б1 и б3 — постоянные векторы, a b2(t) — переменный вектор, равный (а}г\ + a2r2) cos r2t + {a2r\ — alr2) sin r2t. Если А или С положительно определены и при этом В^О, то положительность г^ приводит к противоречию при s—>-oo. Если А, С^-0, то из положительной определенности матри- матрицы В вытекает, что ri-^О. Поскольку, однако, функция b2(t)
286 ТЕОРИЯ УСТОЙЧИВОСТИ [ГЛ. 13 S является периодической, интеграл j (b2(t), Bb2(t))dt расходится о при s—>-оо, если только /"г не равно нулю. Мы детально остановились на этом доказательстве, поскольку оно может быть обобщено на случай, когда матрицы А, В и С переменные. Упражнения 1. Следуя Анке'), воспользуемся описанным приемом для вычисления оо интеграла и2 dt при условии, что и является решением уравнения О u'" + a2u" + a[U' + aa—Q, все решения которого стремятся к нулю. Пусть «@)=с0, и'@)=с{, и"{0)=с2. Показать, что при этих условиях имеют место следующие соотношения- оо оо J и'"и dt = и"и |0°° - J и."а dt = - с0с2 + с\\% о о оо оо оо \ и"и dt = и'и |~ - J и'2 dt=- c0d - j uA dt, Г uu dt=- сЦч. о 2. Из уравнений оо [ u(i) {и" + а2и" + ахи + аои) dt = 0, / = 0, 1, 2, о и результата предыдущего упражнения получить линейные уравнения для величин (* и2 dt, (* (u'J dt, I (и"J dt. оо о 3. Используя полученные линейные уравнения, представить интеграл I и2 dt как квадратичную форму от с0) си с%. о 4. Используя указанную квадратичную форму, получить необходимые и достаточные условия устойчивости многочлена r3+a2r2 + air + cio. 5. Показать, что найденные условия эквивалентны условиям Гурвица из упражнения к § 2. J) Z. angew. Math. u. Phis. 6 A955), 327—332.
УПРАЖНЕНИЯ К ГЛ 13 287 § 9. Эффективные условия устойчивости матриц. Как уже отме- отмечалось в предыдущих параграфах, существуют достаточно эффективные критерии устойчивости данного многочлена. Но по- поскольку сама задача нахождения характеристического много- многочлена матрицы очень трудна, нельзя считать, что мы распола- располагаем удовлетворительными критериями устойчивости матриц. В некоторых частных случаях известны весьма элегантные кри- критерии. Так, например, имеет место Теорема 4. Если матрица А имеет вид А = • 01 1 0 a2 h — 1 . . . • • * 0 a3 b3 0 0 a4 ... — 1 6д 0 - ?-i aN 1 bN A) еде все элементы, не стоящие на главной диагонали и двух со- соседних с ней, равны нулю, причем элементы щ действительные, a bi либо равны нулю, либо являются чисто мнимыми, то число положительных членов в последовательности произведений аи а\а2, ..., п\п2 ... aN-iaN равно числу собственных значений матрицы А, имеющих положительные действительные части. Доказательство, которое проводится с помощью теории последовательностей Штурма, читатель найдет в работе Шварца, ссылка на которую имеется в конце этой главы. В этой работе показано также, что любая комплексная матрица А может быть приведена к виду A) преобразовинием подобия: А = Т~1ВТ. Как мы увидим в гл. 16, теория положительных матриц дает другой подход к вопросам устойчивости в случае, когда все недиагональные элементы матрицы А неотрицательны. Упражнения к гл. 13 1. Решить скалярное уравнение u" + « = fi(O. для чего положить u' = v, v'=—u + f[(t) и вычислить элементы матрицы eAt, где О 1 -1 О 2. Пусть собственные значения матрицы А различны, a B(t) ->0 при f->oo . Тогда собственные значения матрицы A + B(t), которые мы обозна- обозначим %i(t), различны при t^t оо 3. Если, кроме того, || 8 (t) || dt < оо, то существует матрица ТA), о обладающая тем свойством, что замена переменных у = Тг приводит
288 ТЕОРИЯ УСТОЙЧИВОСТИ [ГЛ. 13 уравнение y'=(A+B(t))y к виду z'= (L(t)+C(t))z, где At) О (О 4. Если V |а</ (t) + uji (t) | dt < оо, то все решения уравнения i, / = 1 О y' — A(t)y ограничены при ^-> оо. 5. Существует ортогональная матрица B(t) такая, что замена y = B(t)z преобразует уравнение y' = A(t)y к виду z' = C(t)z, где матрица C{t) тре- треугольная. (Дилиберто *).) 6 (продолжение). Существует ограниченная невырожденная матрица B(t) такая, что матрица C(t) является диагональной*). 7. Обычное правило дифференцирования произведения двух функций а и v дает d(uv)/dt = u dv/dt + v du/dt, Рассмотрим линейную матричную функ- функцию d(X), определяемую соотношением d(X)=AX — XA, где Л — фиксированная матрица. Показать, что d(XY)=Xd(Y)+d(X)Y. 8. Получить представление для d(X[Х2..-Xя) и тем самым для d(XN). 9. Пусть dA(X)=AX — XA, dB(X)=BX — XB. Показать, что dA(dB{X))=dB(dA(X)). 10. Когда уравнение dX = XX, где X — скаляр, имеет решение и каков вид этого решения? Рассмотрение этих вопросов читатель найдет в книге И. А. Лаппо-Данилевского '). 11. Когда уравнения d(X2)=a2lX1 + a22X2 имеют решения и каковы эти решения? \ 12. Поскольку d(X) является аналогом производной, то какой вид имеет аналог ряда Тейлора? 13. Пусть дана действительная матрица А. Всегда ли существует диаго- диагональная матрица В с элементами, равными ±1, такая, что решения уравне- уравнения В dx/dt=Ax стремятся к нулю при <->оо ? (Брак.) *) Ср. упражнение 20 к гл. 11. (Прим. ред.) ') И. А. Лаппо-Данилевский, Применение функций от матриц к теории линейных систем обыкновенных дифференциальных уравнений, Гос- техиздат, 1957,
БИБЛИОГРАФИЯ И КОММЕНТАРИЙ 289 Библиография и комментарий § 1. Мы используем здесь термин «устойчивость», понимая под этим следующее: все решения уравнения dx/dt = Ах стремят- стремятся к нулю при t-+oo. Более широкое определение и дальнейшие результаты читатель найдет в книге Беллман (R. Bellman), Stability Theory of Differential Equations, McGraw-Hill Book Company, Inc., New York, 1953. [Русский перевод: Теория устойчивости решений дифференциальных уравнений, ИЛ, 1954.] Задача исследования асимптотического поведения решения дифференциального уравнения dx/dt = A(t)x с помощью соб- собственных чисел матрицы A(t) как функций времени t значитель- значительно сложнее. См. цитированную выше книгу, а также Коддингтон и Левинсон (Е. A. Coddington and N. Levin- son), Theory of Ordinary Differential Equations, McGraw-Hill Book Company, Inc., New York, 1955. [Русский перевод: Теория обыкновенных дифферен- дифференциальных уравнений, ИЛ, 1958.] § 2. Обобщением этого результата является теорема Пуан- Пуанкаре— Ляпунова, которая утверждает, что все решения уравне- уравнения dx/dt = Ax+g(x),для которых 1!*@)|| достаточно мала,стре- мала,стремятся к нулю при /—>-оо при условии, что А — устойчивая ма- матрица, а нелинейная функция g(x) такая, что \\g(x) \\/\\x\\ ^-0 при ||дс||—>-0. См. по этому поводу цитированные выше книги. Одно из доказательств этого результата намечено в упражне- упражнении 1 к § 4. § 4. Этот метод играет фундаментальную роль в современной теории устойчивости функциональных уравнений. Впервые этот метод был опубликован в мемуаре Ляпунова в 1897 г. См. книгу А. М. Ляпунов, Общая задача об устойчивости движения, Гостехиз- дат, 1950. Имеется обзор недавних результатов: Антосевич (Н. Antosiewicz), A Survey of Lyapunov's Second Method, Applied Mathematics Division, National Bureau of Standards, 1956. См. также Антосевич (Н. Antosiewicz), Some Applications of Lyapunov's Conditions for Stability, J. Rat. Mech. Analysis, 3 A954), 447—457. § 5. Здесь мы следуем работам: Беллман (R. Bellman), Notes on Matrix Theory, X: A. Problem irr Controll, Quart. Appl. Math. 14 A957), 417—419; Анке (К. Anke), Eine neue Berechnungsmethode der quadratischen Regelflache, Z. angew. Math. u. Phys. 6 A955), 327—331; Букнер (Н. Buckner), A Formula for an Integral Occuring in the Theory of Linear Servomechanisms and Control Systems, Quart. Appl. Math. 10 A952); 19 P, Беллман
290 ТЕОРИЯ УСТОЙЧИВОСТИ [ГЛ. 13 Хазенбрук и Ван дер Варден (P. Hazenbroeck anci В. L. Van der Waerden), Theoretical Considerations in the Optimum Adjustment of R.gulators, Trans. Amer. Soc. Mech. Engrs. 72 A950). § 6. Гурвиц получил эти результаты, исследуя задачу устой- устойчивости многочлена. См. работу Гурвиц (A. Hurwitz), Cber die Bedingungen unter welchen einu Gleichung nur Wurzeln mit negafiven reellen Teilen besitzt, Math. Ann. 46 A895) (Werke, vol. 2, 533—545). С тех пор этот результат был доказан многими различными способами. Обзор критериев устойчивости, новых результатов, а также обширную библиографию можно найти в работе Кремер и Эфферц (Н. Cremer and F. H. Effertz), Cber die algebraische Kriterien fur die Stabilitat von Regulungssystemen, Math. Ann. 137 A959), 328—350. § 7. Обширные исследования этого вопроса провел Басе. Ре- Результаты его не опубликованы. Рассмотрение вопросов устойчи- устойчивости в том виде, в каком они возникают в математической эко- экономике, имеются в работах Энтховен и Эрроу (А. С. Enthoven and К. J. Arrow), A Theo- Theorem on Expectations and the Stability of Equilibrium, Econometrica 24 A956), 288—293; Эрроу и Нерлов (К. J. Arrow and M. Nerlove), A Note on Expectations and Stability, Econometrica 26 A958), 297—305, где также имеется ссылка на более раннюю работу Мецлера. § 9. См. статью Шварц (Н. R. Schwarz), Ein Verfahren zur Stabilitatsfrage bei Mat- rizen-Eigenwert-Problemen, Z. angew. Math. u. Phys. 7 A956), 473—500. Задача приведения данной матрицы к якобиевой рассмотрена в цитированной выше работе Шварца и в работе Г и вене (W. Giwens), Numerical Computation of the Characteristic values of a Real Symmetric Matrix, Oak Ridge National Laboratory, Report ORNL-1574, 1954. Ряд других тесно связанных с этим результатом читатель най- найдет в статьях Франк (Е. Frank), On the Zeros of Polynomials with Complex Coefficients, Bull. Amer. Math. Soc. 52 A946), 144—157; Франк (Е. Frank), The Location of the Zeros of Polynomials with Complex Coefficients, Bull. Amer. Math. Soc. 52 A946), 890—898. В работах Таусски (О. Taussky), Analytical Methods in Hypercomplex Systems, Сотр. Math., 1937; Таусски и Тодд (О. Taussky and J. Todd), Infinite Powers of Matrix, J. London, Math, Soc, 1943
БИБЛИОГРАФИЯ И КОММЕНТАРИЙ 291 рассматриваются матрицы, собственные значения которых лежат внутри единичного круга. Мы совершенно не затронули здесь интересного и важного вопроса об асимптотическом поведении решения векторно-ма- тричного уравнения х(п+ 1) = (Л + В(п) )х(п) при п—>-оо, где элементы матрицы В(п) стремятся к нулю при п—v оо. Изучение этого вопроса было начато Пуанкаре, см, Пуанкаре (Н. Ро in care), Sur les equations lineaires aux differen- tielles ordinaires et aux differences finies, Amer. J. Math. 7 A885), 203—258, и продолжено Перроном: Перрон (О. Perron), Ober die Poincaresche lineare Differenzgleichung, J. reine angew. Math. 137 A910), 6—64 и его учеником Та Ли: Та Ли (Та Li), Die Stabilitatsfrage bei Differenzgleichungen, Acta Math. 63 A934), 99—141. Последние результаты в этой области излагаются в работе Г. А. Ф р а й м а н, О теоремах Пуанкаре и Перрона, УМН 12, № 3 G5) A957), 241—246. См. также Беллман (R. Bellman), A Survey of the Theory of the Boundedness, Stability and Asymptotic Behavior of Solutions of Linear and Non-linear Differential and Difference Equations, Office of Naval Research, Department of the Navy, January 1949. Эти вопросы, так же как и соответствующие вопросы для дифференциальных уравнений, больше относятся к теории ли- линейных дифференциальных и разностных уравнений, чем к тео- теории матриц как таковой. Рассмотрение вопросов, связанных с устойчивостью линейных дифференциальных уравнений со случайными коэффициентами, имеется в работах Сефл (О. Sefl), On Stability of a Randomized Linear Systems, Sci. Sinica 7 A958), 1027—1034; Самуэлс (J. С Samuels) On the Mean Square Stability of Random Linear Systems, IRE Trans, on Circuit Theory, May 1959, Special Supplement (Transactions of the 1959 International Symposium on Circuit and Information Theory), 248—259, где имеются ссылки на более раннюю статью Розенблюма и дру- другие работы.
Глава 14 МАРКОВСКИЕ МАТРИЦЫ И ТЕОРИЯ ВЕРОЯТНОСТЕЙ § 1. Введение. В этой и следующих главах мы будем изучать класс матриц, возникающих в связи с некоторыми фундамен- фундаментальными вопросами теории вероятностей и математической эко- экономики. Методы, которые мы будем здесь применять, совершен- совершенно отличны от используемых при изучении квадратичных форм и дифференциальных уравнений. Основным понятием теперь будет неотрицательность — неот- неотрицательные матрицы и неотрицательные векторы. Матрицу М = = \\tvHj\\ называют неотрицательной, если т^-^О для всех i и /. Аналогично говорят, что вектор х неотрицателен, если все его компоненты неотрицательны, х,- ^> 0. Неотрицательные матрицы, для которых выполняется более сильное условие т^->0, называются положительными. Эти ма- матрицы обладают особенно интересными и изящными свойствами. Термины «положительный» и «неотрицательный» часто ис- используются для обозначения того, что мы ранее называли «по- «положительно определенный» и «неотрицательно определенный». Поскольку в последующем эти два типа матриц вместе появлять- появляться не будут, путаницы возникнуть не должно. Прилагательное «положительный» представляет собой настолько распространен- распространенный и важный термин, что нет нужды пояснять, почему оно столь часто употребляется в разных аспектах. В этой книге мы ограничимся рассмотрением лишь элемен- элементарных свойств неотрицательных матриц. Детальное изучение вопросов, связанных с теорией вероятностей и математической экономикой, можно найти в литературе, приведенной в конце главы. Эта и следующая за ней главы посвящены стохастическим процессам; в последующей главе рассматриваются различные аспекты теории матриц и математической экономики. § 2. Простой стохастический процесс. Для того чтобы подгото- подготовить почву для рассмотрения марковских матриц, остановимся
§ 2] ПРОСТОИ СТОХАСТИЧЕСКИЙ ПРОЦЕСС 293 на некоторых основных моментах, связанных с понятием детер- детерминированного процесса. Рассмотрим систему S, состояние ко- которой изменяется таким образом, что в любой момент t оно мо- может быть описано конечномерным вектором х. Предположим да- далее, что состояние системы в любой момент s + t, s>0, может быть представлено в виде некоторой функции следующей пары аргументов: состояния в момент / и текущего времени s, именно =g(x(l),s). A) При естественных допущениях относительно гладкости функ- функции g(t) мы можем получить, разлагая обе части A) по сте- степеням s, дифференциальное уравнение для x(t) ~ = h(x(t)). B) Конечномерные детерминированные системы рассматривае- рассматриваемого типа эквивалентны, таким образом, системам, описываемым обыкновенными дефференциальными уравнениями. Если мы вве- введем функции более сложного типа, зависящие от предыстории процесса, то придем к более сложным функциональным урав- уравнениям. Предположение о том, что настоящее состояние системы пол- полностью определяет ее будущие состояния, является чрезвычайно ограничительным. Ясно, что в любом реальном процессе оно в той или иной степени не выполняется. Из-за простоты лежащих в ее основе понятий мы все же принимаем детерминированную мо- модель в тех случаях, когда она позволяет получить результаты, согласующиеся с экспериментом. В настоящее время многие наблюдаемые явления уже не могут быть объяснены с позиции теории детерминированных процессов; это обстоятельство вы- вынуждает нас строить другие типы математических моделей. Рассмотрим теперь следующий стохастический процесс. Для упрощения формулировки и во избежание ряда затруд- затруднений мы предположим, что рассматриваемая физическая систе- система S может находиться з одном из состояний, число которых конечно, и переходить из одного состояния в другое только в ди- дискретные моменты времени. Обозначим состояния целыми числами 1,2, ...,N, а моменты времени — через ? = 0,1,2,... Элемент случайности мы введем, предположив, что существует фиксированная вероятность того, что система, находящаяся в состоянии / в момент t, перейдет в состояние i в момент t+l. Это, конечно, также является очень сильным требованием регулярности. На математическом языке случайный процесс обозначает отнюдь не то, что мы обычно под- подразумеваем под случайным процессом в обыденной речи.
294 МАРКОВСКИЕ МАТРИЦЫ И ТЕОРИЯ ВЕРОЯТНОСТЕЙ [ГЛ. 1* В соответствии со сказанным введем матрицу переходов M=\\m.ij\\, где rtiij — вероятность того, что система, находящаяся в момент t в состоянии /, перейдет в момент (+1 в состояние L Отметим, что мы рассматриваем матрицу переходов М, не зависящую от времени. Это наиболее важный и интересный случай. Введя, таким образом, матрицу М, мы, очевидно, должны на- наложить следующие условия: т,7>0, (За) N 2тG=1, /=1, 2, ..., N. C6) Неотрицательность элементов Шц необходима для того, что- чтобы их можно было рассматривать как вероятности. Второе усло- условие отражает тот факт, что частица, находящаяся в момент t в состоянии /, должна перейти в одно из допустимых состояний в момент /+1. § 3. Марковские матрицы и вероятностные векторы. Введем те- теперь некоторые обозначения. Матрицу М, элементы которой удовлетворяют условиям B.3а) и B.36), будем называть мар- марковской матрицей. Вектор х с компонентами х{, удовлетворяющими условиям xf>0, (la) будем называть вероятностным вектором. Вообще, вектор, все компоненты которого положительны, мы будем называть поло- положительным вектором. Упражнения !. Доказать, что при 0^ ^,^ 1 матрица XP+(l+X)Q является марков- марковской всякий раз, когда матрицы Я и Q марковские. ( 2. Доказать, что при тех же условиях матрица PQ марковская. 3. Доказать, что если дс— вероятностный вектор, а М — марковская мат- матрица, то вектор Мх вероятностный. 4. Доказать, что марковскую матрицу можно определить следующим образом: матрица М является марковской тогда и только тогда, когда при любом вероятностном векторе дс вектор Мх также является вероятностным. 5. Доказать, что если матрица М' является транспонированной к мар- N ковской матрице М и jW/=||alj||, то при i=l, 2, ..., N имеем 2 аЦ — **
¦§ 5] АСИМПТОТИЧЕСКОЕ ПОВЕДЕНИЕ 295 6. Доказать, что положительная марковская матрица преобразует не- нетривиальный вектор с неотрицательными компонентами в вектор с положи- положительными компонентами. § 4. Аналитическое описание дискретных марковских процессов. Стохастический процесс, описанный в § 2, обычно называют ди- дискретным марковским процессом. Посмотрим теперь, как этот процесс можно описать аналитически. Поскольку состояние системы S в любой момент времени t представляет собой случайную величину, принимающую любое из значений i= 1, 2,.. . , N, мы введем N функций времени t сле- следующим образом: X{(t) — вероятность того, что система находится в состоянии i в момент t. A) При ^ = 0 имеем Xt@)=6ik, B) где k — начальное состояние системы S. Тогда должны выполняться следующие соотношения: N xt (t + 1) = S тих, (t), i = 1, 2, .. ., N. C) /1 Один из аспектов задачи предсказания поведения системы S состоит в изучении поведения решений системы уравнений C), которую мы можем записать более компактно в виде x(t+l)=Mx((), i=l,2,...,/V. D) В целом эта задача чрезвычайно сложна и интересна и со- сопровождается многочисленными аналитическими, алгебраиче- алгебраическими, топологическими и физическими «обертонами». На эту тему был написан ряд монографий, и все же здесь, по-видимому, ¦еще непочатый край работы. Особенно простые и элегантные результаты могут быть по- получены в случае, когда все элементы матрицы М положительны. Поэтому мы в основном и ограничимся рассмотрением этого случая, воспользовавшись несколькими методами, и лишь слегка коснемся общего случая (неотрицательная матрица). ¦Упражнение 1. Доказать, что x(t) =М'ж@); x(t+s)=M'x(s). § 5. Асимптотическое поведение. Следующие несколько пара- параграфов мы посвятим одному замечательному результату, при- приведя два его доказательства.
296 МАРКОВСКИЕ МАТРИЦЫ И ТЕОРИЯ ВЕРОЯТНОСТЕЙ [ГЛ. 14 Теорема 1. Если М — положительная марковская матрица и x(t) удовлетворяет условию D.4), то Нтдс(/) =у, где у— вероятностный вектор; Aа) t + °° у не зависит от х@); A6) у является собственным вектором матрицы М, принадлежащим характеристическому числу 1. Aв) Тот факт, чтодс(Г) сходится кфиксированному вероятностному вектору у, очень интересен и, возможно, не является неожидан- неожиданным, если учесть «перемешивающее» свойство системы, которое вытекает из условия т^ > 0. Независимость же этого предела от начального состояния поистине удивительна. § 6. Первое доказательство. В этой главе мы дадим два доказа- доказательства этой теоремы. Третье доказательство можно получить как следствие из результатов, касающихся общих положитель- положительных матриц, которые будут выведены в гл. 16. Первое доказа- доказательство (мы приводим его первым из-за его простоты) иллю- иллюстрирует то обстоятельство, которое мы подчеркивали ранее, а именно полезность рассмотрения линейных преобразований совместно с их сопряженными. Поскольку t принимает только дискретные значения 0, 1, 2, .. ., заменим его на п и будем рассматривать х(п) вместо x(t). Что- Чтобы установить наличие предела при п-*-оо у х(п), рассмотрим скалярное произведение х(п) на произвольный вектор Ь. Так как в силу D.4) х(п) =Мпх@), то, полагая дс(О)— с, имеем (х(п),Ь) = {М»с,Ь) = {с, {М»)'Ь) = (с, (М')»Ь), A) где матрица М' является транспонированной к М. Если мы покажем, что (М')пЬ при n^-сю сходится при лю- любом векторе Ь, то тем самым мы покажем, что при п-+оо схо- сходится х(п), так как можно сначала взять вектор Ь со всеми ну- нулевыми компонентами, кроме первой, затем кроме второй и т. д. Введем вектор 2(п) = (М')»&, B)' удовлетворяющий разностному уравнению z{n + \)=M'z{n), 2@) =6. C) Пусть и(п) есть наибольшая компонента вектора г(п) при ка- каждом п, a v(n) — наименьшая. Покажем, что из свойств матри- матрицы М' вытекает, что и(п) — v(n)-+0 при п->оо. Так как N zi(n+\)='2lmjiZj{n) D)
^ 6] ¦ ПЕРВОЕ ДОКАЗАТЕЛЬСТВО 297 и N SmG=l, mu>0, D0 то и(п+ 1)<ы(п), E) Поскольку {и(п)} — монотонно убывающая последовательность, ограниченная снизу нулем, a {v(n)} — монотонно возрастающая последовательность, ограниченная сверху единицей, эти после- последовательности сходятся. Пусть и(п)-+и, v(n)—>v. F) Чтобы показать, что u = v, поступим следующим образом. Используя формулы D) и D'), получаем неравенства -d)u(n) + dv(n), v(n+l)Xl-d)v(n) + du(n), G) где d — положительная нижняя граница элементов mi}, i,j = = 1,2,. . . , N *). Из G) следует оценка u(n+l) — v(n+l)<[(l—d)u(n)+dv(n) — (l—d)v{n) — — du{n)]<.(l—2d)(u(n) — v(n)), (8) откуда имеем и(п) — о(л)<A— 2d)»(«@) — o@)). (9) Следовательно, так как d-^1/2, если N^-2, то н(л)—w(n)->-0 при «->¦ оо. Таким образом, г (я) не только сходится при п->-оо, но и все координаты предельного вектора равны между собой. Из сходи- сходимости г(п) немедленно вытекает сходимость х(п). Из равенства компонент Нтг(л) вытекает независимость предельного вектора от начального состояния. Пусть \imz(n) =z, a limx(n)=y. Как мы только что убеди- убедила оо Я->°° лись, все компоненты вектора z равны между собой. Пусть, на- например, они равны а\. Тогда ... +сп] = аи A0) *) Следует взять то из равенств D), в левой части которого стоит «(«+1). В правой части его все компоненты вектора «(«), кроме и (я), за- заменить на и(п), после чего с учетом D') первое неравенство G) следует немедленно. Аналогично доказывается второе неравенство. (Прим. ред.)
298 МАРКОВСКИЕ МАТРИЦЫ И ТЕОРИЯ ВЕРОЯТНОСТЕЙ [ГЛ. 14 где величина константы щ зависит только ог Ь, Следовательно, у не зависит от с. Легко показать, что у является собственным вектором ма- матрицы М, соответствующим характеристическому числу 1. В са- самом деле *), n+lc = M ПтМпс = Му. A) Другими словами, у есть «неподвижная точка» преобразования, осуществляемого матрицей М. Упражнение 1. Используя тот факт, что / — неотрицательная марковская матрица,, показать, что условия положительности не могут быть полностью устранены. § 7. Второе доказательство независимости от начального со- состояния. Другой метод доказательства независимости от началь* ного состояния состоит в следующем. Как мы уже знаем,, ljm Mnc существует при любом начальном вероятностном век- П -> оо торе с. Пусть у и z— два предельных вектора, соответствующих различным начальным вероятностным векторам cud. Выберем скаляр t\ так, чтобы вектор у — t\Z имел хотя бы одну нулевую компоненту, а все остальные компоненты положительные**). В этом случае вектор М(у — tiz) является положительным, если вектор у — t)Z нетривиальный. Вместе с тем М(у — tlZ)=My— UMz=y-txz. A) Это равенство содержит противоречие, если только не выпол* няется условие у — t\Z = O. Последнее же означает, что t\ — \y так как у и z — вероятностные векторы. § 8. Некоторые свойства положительных марковских матриц. Опираясь на результаты и используя методы предыдущих пунк- пунктов, мы установим некоторые интересные свойства положитель- положительных марковских матриц. Отметим прежде всего, что в предыдущем параграфе мы по- показали, что у положительной марковской матрицы не может быть двух линейно независимых положительных собственных векторов, принадлежащих характеристическому числу 1. *) Поскольку у—вероятностный вектор I 2 Vi ~ '> Vi =** 0 )> то он от- / личен от нуля. {Прим.. ред.) **) Существование такого значения t\ легко показать, введя вектор у — tz и увеличивая параметр t от нуля. (Прим. ред.)
<§ 8] НЕКОТОРЫЕ СВОЙСТВА МАРКОВСКИХ МАТРИЦ 299 Более того, с помощью тех же самых рассуждений легко по- показать, что положительная марковская матрица не может иметь собственного вектора*), принадлежащего характеристическому числу 1 и не пропорционального вероятностному вектору у, по- полученному выше. В самом деле, путь z будет таким вектором1). Тогда при достаточно большом tx вектор z + t\y станет положи- положительным. Разделив каждую компоненту на скаляр t2= (z+tty, с), где с — вектор, все компоненты которого равны единице, мы по- получим вероятностный вектор. Следовательно, (z + txy)/t2 = y, a это означает линейную зависимость векторов z и у. Нетрудно показать, что никакое характеристическое число матрицы М по абсолютной величине не может превосходить еди- единицы. Действительно, пусть х — собственный вектор матрицы М', X— характеристическое число, а т — модуль наибольшей по ве- величине компоненты вектора х. Тогда из соотношения Хх = М'х следует неравенство | X \т^.т 2 тц — т> 0) откуда || Можно легко показать, что если М — положительная марков- марковская матрица, то X = 1 является единственным характеристиче- характеристическим числом, модуль которого равен единице. В самом деле, пусть ji — другое такое характеристическое число, a w + iz—¦ собственный вектор, принадлежащий этому характеристическому числу, где w и z — действительные векторы. Выберем 1Х настоль- настолько большим, чтобы векторы w + t\y и z + txy стали заведомо по- положительными. Тогда М (то + iz + Ml + О У) = » ((«> + iz) + U A + i) у). B) Таким образом, с одной стороны, мы имеем Мп (то + Й + М1 + i) У) = V" i(w + Й) + М1 + *) У)- C) •С другой стороны, при п-^оо последовательность Мп (то + iz + /, A + /) у) - Мп (w + txy + i (z + txy)) D) в силу положительности векторов w + txy и z+txy сходится к зек- тору у, умноженному на некоторый скалярный множитель. Если же по предположению абсолютная величина ц равна •единице, то вектор \xn{w + iz) сходится при п-^оо только тогда, когда ц = 1. Этим завершается доказательство. •) Не обязательно положительного. (Прим. ред.) ') Легко видеть, что для доказательства достаточно взять вектор г дей- действительным.
300 МАРКОВСКИЕ МАТРИЦЫ И ТЕОРИЯ ВЕРОЯТНОСТЕЙ [ГЛ. U Таким образом, нами доказана Теорема 2. Если М — положительная марковская матрица, то характеристическое число с наибольшей абсолютной величи- величиной есть 1. Любой собственный вектор, принадлежащий этому характеристическому числу, с точностью до скалярного множи- множителя совпадает с вероятностным вектором. Упражнение 1. Если "К — характеристическое число, а принадлежащий ему собствен- собственный вектор положителен, то Х=1. § 9. Второе доказательство сходимости. Сейчас мы дадим дру- другое прямое доказательство того факта, что х(п) имеет предел при п—^оо. Выпишем уравнения, связывающие компоненты век- векторов х(п) и х{п+\): N Xt{n+ 1) = 2 ttlijXjin). A) Отсюда имеем N Xi(n+l)- xt (n) = S mt} [Xj(n) ~Xj(n-l)}. B) N Поскольку 2 Xj (n) = 1 при всех п, то неравенства Xj(n)^- •>Xj(n — 1) не могут выполняться для всех /, если только они не сводятся к равенствам. В этом последнем случае х(п) =х(п— 1), откуда х(т) —х{п—1) при т^- п, и, следовательно, доказы- доказываемая сходимость установлена. В общем случае обозначим через S(n) множество тех /, для которых Xj(n)^-Xj(n — 1), а через Т(п)—множество таких /, для которых Xj(n)<Xj(n—1). Из предыдущего ясно, что в S(n) и Т(п) при каждом п входит по крайней мере один элемент. На основании B) легко заключить, что 2 ТПц [Xj (п) - Xj (П - 1)]< Xt (П + 1) - Xt (п) < i^T(n) < 2 тц[х,(п)-Х/(п-1)]. C) / е s (п) Следовательно, D) откуда в силу того, что mij'^d>0 при всех i и у, следует неравенство
§ 10] МАРКОВСКИЕ МАТРИЦЫ ОБЩЕГО ВИДА 301 Точно так же, суммируя по !еГ(л+1), имеем A-d) 2 [Xj(n)-xj(n-l)}^ 2 [xt(n+l)-xi(n)]. F) Сравнивая E) и F), получаем S I *, (П + 1) - *; (П) | < A - d) 2 I *; («) ~ *, (/I - 1) |, G) СО откуда следует, что ряд 2 II х(п)-~ X (п— 1) || сходится. и = 1 Этим завершается доказательство сходимости х(п). Упражнения 1. Показать, что если М — марковская матрица, а М2 — положительная марковская матрица, то последовательности {М2пс} и {М2п+'с} сходятся. Схо- Сходится ли последовательность {Л1"с}? 2. Чему равен предел Мп, если М — положительная марковская мат- матрица? § 10. Марковские матрицы общего вида. Как уже отмечалось выше, общая теория марковских матриц очень сложна; ее изу- изучение лучше всего проводить в рамках теории вероятностей. Приведем простой пример, который покажет нам, как могут возникать характеристические числа с абсолютной величиной, равной единице. Рассмотрим систему, имеющую только два со- состояния, I и 2, причем состояние 1 всегда переходит в состоя- состояние 2, а состояние 2 — в состояние 1. В этом случае матрица переходов имеет вид 0 1 I) { 0||. A) Матрица М имеет своими характеристическими числами Х\ = 1 и Яг = — 1. Рассматривая циклические случаи более высокого порядка, мы можем получить характеристические числа, представляющие собой корни из единицы произвольной степени. Остановимся все же, хотя и вкратце, на одном важном ре- результате, который утверждает, что некоторый усредненный пре- предел существует и в том случае, когда отсутствует предел в до- доказанном выше смысле.
302 МАРКОВСКИЕ МАТРИЦЫ И ТЕОРИЯ ВЕРОЯТНОСТЕЙ [ГЛ. 14 Предположим, что М имеет только простые характеристиче- характеристические числа; тогда, записав М в виде о г1, B) получим ,k—\ C) Если | Я,-1 < предел С1, то п Пт 0 при га п- » оо. Если же 1*7 1 = 1, ТО D) при этом a,j = 0 при Ау-=^= I и а;- = I при Xj= I. При всех случаях, если предположить, что М имеет только простые характеристические числа, можно утверждать, что су-- ществует квазипредельное распределение X + MJC + ¦ ¦ . + МпХ \ я+1 J E) являющееся собственным вектором матрицы М; точнее, Му = у. Предельный вектор у является вероятностным вектором, если х — вероятностный вектор. Рассмотрение общего случая более сложно, но проводится точно таким же образом (см. упражнения в конце этой главы). Упражнение I. Всякое ли характеристическое число марковской матрицы М такое, п что Ш—I, представимо в виде Я = У~1 ?
§ 111 НЕПРЕРЫВНЫЙ СТОХАСТИЧЕСКИЙ ПРОЦЕСС 303 § 11. Непрерывный стохастический процесс. Обратимся теперь к стохастическому процессу, описанному в § 2, и рассмотрим его в предположении, что система наблюдается непрерывно. Начнем с дискретного процесса, в котором наблюдения производятся в моменты времени t = 0, A, 2A,. . . Чтобы придать смысл непре- непрерывному процессу, мы примем гипотезу непрерывности, состоя- состоящую в следующем: вероятность того, что система не изменит своего состояния в течение интервала времени Д, равна 1 —о (А). Чтобы сделать это утверждение строгим, введем следующие ве- величины: tt,jA — вероятность того, что система S находится в состоянии i в момент / + А, при условии что в момент t она находится в состоянии /', 1ф\, A) 1 —а,-;Д — вероятность того, что система S находится в состоянии i в момент ^ + А, при условии что в момент t она находится в состоянии I. B) Предполагается, что величины ац удовлетворяют условиям atJ>0, Ba) ait = 2 ап. B6) Тогда уравнения, описывающие поведение системы S, таковы: х,(/ + Д) = A-а„Д) *,(/) +А 2 atjxj(t), i Ф i Чисто формально используя соотношение *,(/) +А 2 atjxj(t), i= I, 2, ..., N. C) i Ф i *,(* + Д) = х,@ + Д*',(') + о(Д2), D) устремим в C) А к нулю. В результате мы придем к следующей системе дифференциальных уравнений: dx ¦ чгч -~ = - ацх1 + 2j aUxi> xi (°) = °ь E) / ф i i= 1, 2,. .., N, где С{, i= 1,2,. .., N, — начальные вероятности. Все сложные проблемы, связанные с определением непрерыв- непрерывного стохастического процесса, мы оставим в стороне и будем рассматривать процесс в терминах полученной системы диф- дифференциальных уравнений. Для того чтобы принятое определе- определение было корректным, нужно показать, что функции, порождае- порождаемые системой E), ведут себя как вероятности. Этим мы зай- займемся ниже.
304 МАРКОВСКИЕ МАТРИЦЫ И ТЕОРИЯ ВЕРОЯТНОСТЕЙ [ГЛ. 14 Наше рассмотрение связано с рядом интересных вопросов, которые здесь изучаться не будут. Вот некоторые из них. 1. Как непосредственно определить непрерывный стохасти- стохастический процесс и вывести дифференциальные уравнения E)? 2. В каком смысле непрерывный стохастический процесс, определенный системой E), можно рассматривать как предел дискретного стохастического процесса, определенного систе- системой C)? Поскольку эти вопросы скорее относятся к теории вероят- вероятностей, мы лишь ограничимся их упоминанием и сосредоточим свое внимание на матричных аспектах системы E). Тем не ме- менее мы, как обычно, не будем стесняться использовать вероят- вероятностные соображения. § 12. Доказательство вероятностных свойств. Покажем теперь, что система дифференциальных уравнений xi(Q) = ci, *=1, 2, ..., N, A) / Ф i где Ci>0, Sc( = l, Ba) tJ 0, B6) aH = 2 ajh Bb) 1Ф1 порождает набор функций, удовлетворяющих условиям xt(t)>0, t^O, (За) S*<@=l. C6) i Докажем сначала свойство C6). Уравнения A) с учетом свойства Bв) дают i ф i I Следовательно, при всех t ¦5п@ = 2*«@)=1. E) i I Для того чтобы показать, что хг^0, запишем A) в виде 7 Ф I
§ 13] УНИТАРНЫЕ ПРЕОБРАЗОВАНИЯ 305 Поскольку Xj >• 0 в момент ^=0, из последнего соотношения сле- следует, что величины х^0'^ монотонно возрастают. Мы могли бы дать другое доказательство, основываясь на том легко устанавливаемом факте, что решения системы A) яв- являются пределами при А, стремящемся к нулю, решений систе- системы A1.3). Следовательно, свойства решений системы A1.3), имеющие место при всех Д, должны сохраняться и для решений системы A). Рекомендуем читателю провести строгое доказа- доказательство этим путем. § 13. Обобщенные вероятности: унитарные преобразования. Любой набор неотрицательных величин {х,}, удовлетворяющих условиям х,>0, Aа) 2 *« = 1, A6) можно рассматривать как набор вероятностей, где х, есть вероят- вероятность того, что система S находится в состоянии /. Преобразования x'i = Si(xv Х2< ¦¦¦' xn)' t=l. 2, ..., N, B) сохраняющие соотношения A), можно рассматривать как ана- аналитическое описание физических изменений, происходящих в си- системе S. Линейные однородные преобразования N х\ = 2 atjxj C) являются простейшими преобразованиями. Как мы знаем, не- необходимым и достаточным условием того, чтобы свойства A) сохранялись, является марковость матрицы Л = ||д,-;|!. Рассмотрим еще квадратичные преобразования. Пусть х— комплексный вектор с компонентами xiy и пусть х' = Тх, D) где Т — унитарное преобразование. Тогда (х', х') = (х,х). Следовательно, если мы рассматриваем \xi\2, \x2\2,..., \xN\2 как набор вероятностей, то и \х[\2, \x'2f, ..., \x'N\2 можно счи- считать таковым. 20 Р. Беллман
303 МАРКОВСКИЕ МАТРИЦЫ И ТЕОРИЯ ВЕРОЯТНОСТЕЙ [ГЛ. 14 Мы оставляем читателю доказательство соответствующих предельных теорем для последовательности {х(п)}, рекуррентно определенной соотношением х(п+1)=Тх(п), E) где матрица Т унитарная, а (дс(О), дс(О)) = 1. § 14. Обобщенные вероятности: матричные преобразования. Обобщим теперь понятие вероятности следующим образом. Если {А'г} представляют собой конечную совокупность симметрических матриц, удовлетворяющих условиям Xt>0, t = l, 2, ..., N, (la) N 2sp(Zj) = i, A6) i=i то мы назовем их набором вероятностей. Условие Xt^0 озна- означает здесь неотрицательную определенность матрицы Х{. Рассмотрим преобразование N Yt = 2 A'uXjAii, i = 1, 2, .. ., N. B) /¦=i Легко установить следующий аналог полученного для марков- марковских матриц результата: Теорема 3. Необходимые и достаточные условия того, что- чтобы преобразование B) сохраняло свойства A), даются следую- следующими соотношениями: N 1;А'цАц = 1, /= 1, 2, ..., N. C) Хотя аналоги предельных теорем, полученных нами для обыч- обычных марковских преобразований, могут быть установлены и для преобразований вида B), их доказательство значительно слож- сложнее, и потому мы здесь не будем заниматься дальнейшим рас- рассмотрением этих вопросов. Упражнения 1. Пусть М — марковская матрица. Дадим следующее доказательство су- п ществования предела lim 2 Mk/n. Используя преобразование Шура»
УПРАЖНЕНИЯ К ГЛ. 14 307 можно представить матрицу М в виде 'е' Ь, М=Т 12 ¦ Ь2П • • • Ькп п-1 о xN где 8;, i=l, 2, ..., k, действительные, a |W<1. i-—k+\, ..., N. Достаточно рассмотреть итерации треугольной матрицы. Для этого рас- рассмотрим систему уравнений x2(n+l) ... +blNxN(n), ... + b2NxN (n), я=О, 1, 2, ... Показать, что |.v,(n)|^Cir", 0<r<l, i = k+l, ..., N. Используя •соотношение xk{n + l) = e kxk (я) + yk («), где \yh (n)\<c2rn, показать, что п предел lim 2 xk (m)ln существует. Затем воспользоваться индукцией. 2. Доказать этот результат, опираясь на каноническую форму Жордана *). Упражнения к гл. 14 1. Рассмотрим матрицу 1*1 ~ 0 Обозначив через определитель (Я/ — А<"Ц, показать, что при 1, ф_,(Я) = 1, фо(Я)=Я+Хо. (Ледермаи и Ройтер.) *) Собственные значения el9«(s=l, ..., ft) порождают простые жорда- новы клетки, так как ||МП|| ^ с при п -> оо. (Прим. ред.) 20*
308 МАРКОВСКИЕ МАТРИЦЫ И ТЕОРИЯ ВЕРОЯТНОСТЕЙ [ГЛ. 14 2. Предполагая Я(>0, Ц;>0, показать, что характеристические числа матрицы Л<"> различны, неположительны и разделяют спектр матрицы Л<п-'>. (Ледерман и Ройтер.) 3. Является ли матрица Л(п> симметризуемой (см. упражнение 27 к гл. 4)? 4. Под матрицей перестановок мы понимаем матрицу, у которой в каж- каждой строке и каждом столбце отличен от нуля только один элемент, равный единице. Показать, что существует Л'! матриц перестановок порядка Л'. 5. Доказать, что произведение двух матриц перестановок является мат- матрицей перестановок; что матрица, обратная к матрице перестановок, сама является матрицей перестановок. Каковы возможные значения определителя матрицы перестановок? 6. Двояко стохастической матрицей порядка N называется квадратная матрица А, элементы которой удовлетворяют следующим условиям: а) а,7>0, б) 2агу=1> /= '• 2' •••' N' i в) 2a/y=1> /='. 2, ..., .V. Является ли произведение двух двояко стохастических матриц двояко стоха- стохастической матрицей? 7. Доказать, что любая двояко стохастическая матрица может быть представлена в виде A = ^\wrPr, r= 1, 2, ..., Л'!, av>0, ^Wr^l, где {Рг} — набор всех матриц перестановок порядка N. Этот результат принадлежит Биркгофу1). Другое доказательство*), а также ряд приложений этого результата можно найти в работе Купманса и Б е к м а н а 2). Некоторые дальнейшие результаты, касающиеся двояко стохастических матриц, имеются в работах Ш р а й б е р а 3) и Мирского4). Мирский дал очень простое доказательство сформулированного выше результата Бирк- гофа, а также указал на интересную связь между двояко стохастическими матрицами и теорией матричных неравенств. 8. Пусть А — марковская матрица второго порядка. Показать, что А является квадратом марковской матрицы тогда и только тогда, когда ') Q. Birkhoff, Tres observaciones sobre el algebra lineal, Rev. univ. пае. Tucuman. ser. A 5 A946), 147—151. *) См. по этому поводу Ф. Р. Гантмахер, Теория матриц, «Наука», 1967, стр. 556. (Прим. ред.) 2) Т. С. Koopmans and M. J. Beck man, Assignment Problems and the Location of Economic Activities, Econometrica 25 A957), 53—76. 3) S. Schreiber, On a Result of S. Sherman Concerning Doubly Stochas- Stochastic Matrices, Proc. Amer. Math. Soc. 9 A953), 350—353. 4) L. M i r s k y, Proofs of Two Theorems on Doubly Stochastic Matrices, Proc. Amer. Math. Soc. 9 A958), 371—374.
УПРАЖНЕНИЯ К ГЛ. 14 30» 9. Показать, далее, что, если А является квадратом некоторой марков- марковской матрицы, то ее можно представить как 2"-ю степень марковской мат- матрицы, где я = 1,2, ...*). 10. Используя предыдущие результаты, показать, что если матрица А имеет квадратный корень, являющийся марковской матрицей, то и среди корней любой фиксированной степени из этой матрицы есть корень, также являющийся марковской матрицей *). 11. Вывести отсюда, что можно построить семейство марковских матриц, A(t), удовлетворяющее условиям A (s + t) =A (s)A (t) при s, t^Q, Л@)=/ и АA)"=А *). 12. Используя этот результат, или каким-либо другим способом пока- показать, что А=ев, где В имеет вид В = b -b a, ?>0*). 13. Если В — матрица типа, описанного в упражнении 12, то мы знаем, что матрица ев является марковской. Пусть В[ и й2 — матрицы такого типа, и пусть At = ев\ A2 = eBl Является ли произведение А{Аг марковской мат- матрицей этого типа? 14. Пусть А — марковская матрица порядка N, обладающая тем свой- свойством, что среди корней любой фиксированной степени имеется корень, являю- являющийся марковской матрицей. Пусть Ап — некоторый марковский корень сте- степени 2П из матрицы А, пусть A (t) = А АПг ..., где t = 2" + ТПг + . ..„ причем сумма конечна. Можно ли определить A (t) для 0<^<1 как предел значений A(t), где t есть сумма указанного выше вида? Если это возможно, то показать далее, что A(s + t) =A(s)A (t) при 0<s, t<\. Положим еще Л@)=/. Пусть все перечисленные соотношения выполняются; является ли в таком случае A(t) решением дифференциального уравнения dX/dt = BX, Х@)=1, где В — матрица типа, описанного в § 12? 15. Пусть Pi (n)—вероятность перехода из состояния а в состояние i за я шагов, a qi{n)—вероятность перехода из состояния Ь в состояние I за я шагов. Рассмотрим определитель (n) = Доказать, что pi (я) pj (я) ql (я) q . (я) (см. § 14 гл. 12) **). 16. Пусть Фи (я)—вероятность перехода двух частиц из различных со- состояний а и 6 в состояния i и / за время я без промежуточного попадания обеих частиц в одно и то же состояние. Показать, что Какова связь между й,-,(я) и <рг;(«)? См. Карлин и Мак-Грегор> (S. Karlin and J. MacGregor), Coincidence Probabilities, Stanford Uni- University Department of Statistics, lech. Rept. 8. *) В упражнениях 9—13 речь идет о матрицах второго порядка. (Прим. ред.) **) В упражнениях 15 и 16 через at) обозначена вероятность перехода из состояния / в состояние i. (Прим. ред.)
;310 МАРКОВСКИЕ МАТРИЦЫ И ТЕОРИЯ ВЕРОЯТНОСТЕЙ [ГЛ. 14 Библиография и комментарий §§ 1—12. Результаты, приведенные в этой главе, являются классическими для теории конечных марковских цепей. То же можно сказать и о данных нами доказательствах, Детальное рассмотрение и многочисленные дополнительные библиографи- библиографические ссылки можно найти в следующих монографиях и ра- работах *): Феллер (W. Feller), An Introduction to Probability Theory and App- Applications, John Wiley & Sons, Inc., New York, 1950 [русский перевод: Введе- Введение в теорию вероятностей и ее применения, ИЛ, 1951]; Бартлетт (М. S. Bartlett), An Introduction to Stochastic Processes, Cambridge University Press, New York, 1955; Арли (N. Arley), On the Theory of Stochastic Processes and Their Applications to the Theory of Cosmic Radiation, Copenhagen, 1943; Ледерман (W. L e d e r m a n n), On the Asymptotic Probability Distribu- Distribution for Certain Markoff Processes, Proc. Cambridge Phil. Soc. 46 A950), 581—594; Ледерман и Ройтер (W. Ledermann and G. E. Reuter), Spectral Theory for the Differential Equations of Simple Birth and Death Processes, Phil. Trans. Royal. Soc. London, ser. A 246 A953—1954), 321—369. Интересное обсуждение теории матриц и задач случайного блуждания имеется в работе Кац (М. Кае), Random Walk and the Theory of Brownian Motion, Amer. Math. Monthly 54 A947), 369—391. § 7. Перемешивание карт, по замыслу, должно быть марков- марковским процессом, делающим каждое новое распределение карт по игрокам независимым от предыдущего. На самом деле, боль- большинство игроков не очень тщательно перемешивают карты и по- поэтому, запомнив некоторые моменты, касающиеся предшествую- предшествующей сдачи, можно получить значительную информацию о настоя- настоящей партии. Понятие марковских цепей было введено Пуанкаре. См. Фреше (М. Frechet), Traite du calcul des probabilites, tome 1, fasc. HI, 2-е livre, Gauthier-Villrs & Cie, Paris, 1936, где подробно рассматривается приложение теории матриц к марковским цепям. § 13. Обсуждение этих обобщенных вероятностей и их связи с фейнмановской формулировкой квантовой механики читатель найдет в работе Монтролл (Е. Mont roll), Markoff Chains, Wiener Integrals, and Quantum Theory, Comm. Pure Appl. Math. 5 A952), 415—453, *) См. также Е. Б. Дынкин, Марковские процессы, Физматгиз, 1963. •(Прим. ред.)
БИБЛИОГРАФИЯ И КОММЕНТАРИИ 311 § 14. Это матричное обобщение вероятностей было введено- в работе Беллман (R. Bellman), On a Generalization ef Classical Probability Theory, I: Markoff Chains, Proc. Nat. Acad. Sci. U.S.A. 39 A953), 1075—1077. См. также Беллман (R. Bellman), On a Generalization of the Stieltjes Integ- Integral to Matrix Functions, Rend. circ. mat. Palermo, ser II 5 A956), 1—6; Беллман (R. Bellman), On Positive Definite Matrices and Stieltjes- Integral, Rend. circ. mat. Palermo, ser. II 6 A957), 254—258. Другое обобщение марковских матриц имеется в статье Хейнсворт (Е. V. Н а у n e s w о г t h), Quasi-stochastic matrices, Duke- Math. J. 22 A955), 15—24. Некоторые недавние результаты, касающиеся марковских це- цепей и вполне положительных матриц в смысле Ф. Р. Гантмахера и М. Г. Крейна, имеются в работе Карлини Мак-Грегор (S. Karlin and J. М а с G r e g о г), Coince- dence Probabilities, Stanford University Tech. Rept. 8, 1958.
Глава 15 СЛУЧАЙНЫЕ МАТРИЦЫ § 1. Введение. В этой главе мы очень бегло обсудим некоторые вопросы, связанные со случайными матрицами, и то, каким обра- образом матрицы этого типа возникают при изучении дифференциаль- дифференциальных и разностных уравнений. Мы увидим также, что при иссле- исследовании моментов решений линейных функциональных уравне- уравнений указанного типа естественно ввести кронекеровское произ- произведение матриц. § 2. Предельное поведение физических систем. Рассмотрим, как •обычно, физическую систему S, состояние которой в любой мо- момент времени t описывается вектором x(t). В предыдущих главах мы рассматривали случай, когда состояние x(t + А) опре- определяется состоянием x(t) посредством линейного преобразования x(t + A) = (I + ZA)x(t). A) Предельная форма этого преобразования при бесконечно ма- малом А ~ = ZX. B) Предположим теперь, что Z является случайной матрицей*). Под этим мы понимаем, что элементами матрицы Z служат слу- случайные величины, распределения которых зависят от t. По- Поскольку понятия непрерывного стохастического процесса, и в особенности решения стохастического дифференциального урав- уравнения, чрезвычайно сложны, мы ограничимся рассмотрением ди- дискретного процесса. Возвращаясь к уравнению A), введем обозначение x(kA) = =Хц. Тогда A) можно записать в виде C) *) В подлиннике «stochastic matrix». (Прим. ред.)
§ 3] СРЕДНИЕ ЗНАЧЕНИЯ 313 Поскольку Z— случайная матрица, ее значение в каждый мо- момент времени является функцией времени; этот факт мы отра- отразили, снабдив в уравнении C) Z индексом к. Очевидно, что Если А мало, то можно написать ] *„• E> п = | / Л Л S Zk + О (А2)] Таким образом, с точностью до членов порядка Д2 эффект повторных преобразований можно рассматривать как аддитив- аддитивный. Аддитивные стохастические процессы подробно рассматри- рассматриваются в теории вероятностей, и мы не будем заниматься ими. Остановимся лишь на предельном поведении случайной после- последовательности xh в случае, когда ZftA нельзя считать малыми ве- величинами. Поскольку эта задача чрезвычайно сложна, мы ограничимся рассмотрением вопроса об асимптотическом поведении средних значений k-x степеней компонент вектора хп при п -> оо для k = = 1.2,... § 3. Средние значения. Для того чтобы пояснить идею и метод,, достаточно рассмотреть двумерный случай, для чего запишем уравнение C) в координатной форме: vk здесь Uk и Vk — координаты двумерного вектора хк. Предполо- Предположим теперь, что Zj являются независимыми случайными матри- матрицами, обладающими одинаковым распределением. Значительно- труднее случай, когда распределение матрицы Zh зависит от значений, принимаемых матрицей Z^-i. Этот вопрос будет рас- рассмотрен в другой книге. В силу независимости матриц Zh из системы A) следуют соотношения Е (vk+i) = e2lE (uk) + е22Е (vk), где E(uh) и E(vh) — средние значения компонент среднее значение Zxii.
314 случайные матрицы Из системы B) следует, что l) = E(Z)E(xk) = ¦Хп. [ГЛ. 15 C) Это означает, что асимптотическое поведение вектора Е(хп) определяется характеристическими числами матрицы E(Z). Упражнение 1. Пусть матрица Z с одинаковой вероятностью принимает одно из двух возможных значений А или В, где А и В — положительные марковские мат- матрицы. Доказать, что Е(хп)-+у, где у— вероятностный вектор, не завися- зависящий от Хо (х0 по предположению — вероятностный вектор). § 4. Средние значения квадратов. Для определения средних зна- значений квадратов и2п и х?п из C.1) имеем «In = г\К t»L, = zlul + 2zniznMhv. + гЪ>\ ¦'ft+i -i\"k 2\*22ukuk~J-Z22Vk> A) откуда видно, что для определения Е(ы|) и ?(о|) нужно знать величину E(ukvh). Из C.1) следует, что B) = Z11Z21«I (ZllZa Следовательно, ^ (К г) = E(Z»])E(ukvk) где ZI2' — кронекеровский квадрат матрицы Z=||2fj|| (см. опре- определение в § 8 гл. 12). Этот пример показывает, что кронекеровский квадрат есте- естественным образом возникает при изучении случайных матриц. Упражнения к гл. 15 1. Показать, что при определении Е (и^) возникает матрица ?(Z^). 2. Показать, что кронекеровскии квадрат фигурирует в следующей за- задаче. Пусть требуется найти матрицу У, обладающую тем свойством, что Какие значения принимает X? 3. Пусть матрица Z имеет то же распределение, что и в упражнении 1 § 3. Сходятся ли последовательности [?(ып)| и |?(и^)}, и если сходятся, то к каким пределам?
БИБЛИОГРАФИЯ И КОММЕНТАРИЙ 315- Библиография и комментарий Задача исследования различных функций случайных матриц таких, как, например, определители или характеристические числа, чрезвычайно важна для различных разделов математиче- математической физики и статистики. В этой главе мы хотели лишь указать на один из аспектов этой задачи, а также на естественную роль кронекеровских произведений. Обсуждение многих вопросов, связанных со случайными ма- матрицами, имеется в работах Уилкс (S. S. Wilks), Mathematical Statistics, Princeton University Press, Princeton, N. J., 1943; Андерсон (Т. W. Anderson), The Asymptotic Distribution of Cer- Certain Characteristic Roots and Vectors, Proc. Second Berkeley Symposium on Mathematical Statistics and Probability, 1950; Андерсон (Т. W. Anderson), An Introduction to Multivariate Sta- Statistical Analysis, John Wiley & Sons. Inc., New York, 1958 [русский перевод: Введение в многомерный статистический анализ, Физматгиз, 1963], а ссылки — в статье Ингам (А. Е. Ingham), An Integral Which Occurs in Statistics, Proc. Cambridge Phil. Soc. 29 A933), 271—276. См. также Найквист и др. (Н. Nyquist et al.). The Distribution of Random Determinants, Quart. Appl. Math. 12 A954), 97—104; Беллман (R. Bellman), A Note on Mean Value of Random Deter- Determinants, Quart. Appl. Math. 13 A955), 322—324. Некоторые задачи математической физики, в которых фигу- фигурируют случайные матрицы, читатель найдет в статьях Вигнер (Е. P. Wigner), Characteristic Vectors of Bordered Matrices- with Infinite Dimensions, Ann. Math. 62 A955), 548—564; Дайсон (F. J. Dyson), Phys. Rev. B) 92 A953), 1331—1338; Беллман (R. Bellman), Dynamics of Disordered Linear Chain, Phys. Rev. B) 101 A958), 19. На роль кронекеровских произведений при исследовании мо- моментов указывалось также в работах Кернер (Е. Н. Ker n e r), The Band Structure of Mixed Linear Lattices,. Proc. Phys. Soc. 69 A956), 234—244; Джун-ичи Хорн (Jun-ichi Hori), On the Vibration of Disorder- ded Linear Lattice, II, Progr. Theoret. Phys. 18 A957), 367—374. В статье Марадудин и Вайс (A. Maradudin and G. H Weiss), The Disordered Lattice Problem, A. Review, J. Soc. Ind. Appl. Math., 6 A958), 302—319 [русский перевод: Динамическая теория кристаллической решетки в гармоническом приближении, «Мир», 1965].
316 СЛУЧАЙНЫЕ МАТРИЦЫ [ГЛ. 15 показано, как применяются матрицы в задаче «о ближайшем со- соседе». См. также Нанда (D. N. Nan da), Distribution of a Root of a Determinantal Equation, Ann. Math. Stat. 19 A948), 47—57, 340—350; Сю (Р. L. Hsu), On the Distribution of Roots of Certain Determinantal Equations, Ann. Eugenics 3 A939), 250—258; Рой (S. N. Roy), The Individual Sampling ..., Sankhya, 1943; Муд (А. М. Mood), On the Distribution of the Characteristic Roots of Normal Second-moment Matrices, Ann. Math. Stat. 22 A951), 266—273; Кен да л л (М. Q. Kendall), The Advanced Theory of Statistics, vol. II, London, 1946; Энглмак (R. Englman), The Eigenvalues of a Randomly Distribu- Distributed Matrix, Nuovo cimento 10 A958), 615—621. Отметим еще, что итерации случайных линейных преобразо- преобразований играют важную роль в исследовании прохождения волн через случайную среду; по этому поводу см. Беллман и Калаба (R. Bellman and R. Kalaba), Invariant Imbedding, Wave Propagation, and WKB Approximation, Proc. Nat. Acad. Sci. U.S.A. 44 A958), 317—319; Беллман и Калаба (R. Bellman and R. Kalaba), Invariant Imbedding and Wave Propagation in Stochastic Media, J. Math, and Mech., 1959.
Глава 16 ПОЛОЖИТЕЛЬНЫЕ МАТРИЦЫ, ТЕОРЕМА ПЕРРОНА И МАТЕМАТИЧЕСКАЯ ЭКОНОМИКА § 1. Введение. В этой заключительной главе мы рассмотрим несколько задач, возникающих в математической экономике. Общими чертами этих задач являются линейность и положи- положительность. Однако начнем мы с описания некоторых простых ветвящих- ветвящихся процессов, связанных с ростом биологических популяций и такими физическими процессами, как каскады космических лу- лучей и деление ядер. Основной результат теории положительных матриц, как эго ни кажется странным, был получен Перроном в связи с его ис- исследованиями многомерных цепных дробей, введенных Якоби. Фробениус в ряде работ существенно обобщил результат Пер- Перрона. Весьма примечателен тот факт, что результат, полученный в теоретико-числовых исследованиях, занимает теперь центральное место в математической экономике, в частности, на него опи- опирается «вход — выход»-анализ Леонтьева. Этот результат играет также важную роль в теории ветвящихся процессов. Вопросы, излагаемые в этой главе, являются малой и очень специальной частью современной теории положительных опера- операторов, точно так же как результаты, относящиеся к симметри- симметрическим матрицам, являются частным случаем общих теорем тео- теории эрмитовых операторов. В конце главы мы коснемся основной задачи линейного про- программирования и укажем на ее связь с теорией игр Бореля и фон Неймана. В заключение мы упомянем некоторые марковские процессы принятия решений, возникающие в теории динамиче- динамического программирования. § 2. Некоторые процессы простого роста. Рассмотрим следую- следующую простую модель роста группы биологических объектов. Пусть имеется /V различных типов этих объектов, которым мы присвоим номера 1,2,..., jV, и пусть в моменты времени t = =0, 1,2,... каждый из этих типов производит некоторое число потомков каждого из указанных типов.
318 ТЕОРЕМА ПЕРРОНА И МАТЕМАТИЧЕСКАЯ ЭКОНОМИКА [ГЛ. 15 В частности, можно рассматривать случай только двух ти- типов — нормальный вид и мутантный вид. Другой интересный случай представляет собой задача определения числа женских особей в различных ьозрастных группах. По прошествии ка- каждого года женские особи возраста i переходят в группу жен- женских особей возраста t'+l, производя при этом время от времени женскую особь возраста нуль. Важно попытаться предсказать возрастное распределение на основе математической модели, так как действительные данные обычно очень трудно получить. Введем величины ац — число индивидуумов типа i, порожденных одним индивидуумом типа /, i, j = 1, 2, ..., N. A) Как обычно, мы будем интересоваться в первую очередь про- процессами роста, механизм которых не изменяется во времени. Состояние системы в момент времени п определяется N ве- величинами Xi(n) — число индивидуумов типа i в момент п, B) i= 1, 2,... , N. Два последовательных состояния системы связа- связаны соотношениями N *i (л + 1) = 2 atjXj (n), i = 1, 2, . . ., N. C) Начальное состояние системы считаем заданным: Xi@)=cir N Задача, которую мы ставим перед собой, состоит в исследо- исследовании поведения компонент Х{(п) при п->~оо. Это поведение определяется характеристическими числами матрицы Л = ||а^|| и, в частности, наибольшим по модулю характеристическим числом. Как мы уже знаем из рассмотрения марковских матриц, эта задача очень сложна. Можно надеяться, однако, что в предпо- предположении положительности элементов пц все существенно упро- упростится. § 3. Обозначения и определения. Как и в гл. 14, мы будем назы- называть матрицу положительной, если положительны ее элементы. Если А положительна, то мы будем писать Л>0. Запись А>В означает, что А — fi>0. Подобно этому вводятся неотрицатель- неотрицательные матрицы, обозначаемые А > 0. Эти обозначения, разумеется, вступают в противоречие с обо- обозначениями, ранее принятыми при рассмотрении положительно определенных матриц. Мы оказываемся перед выбором: усилить ли бдительность и следить за тем, чтобы оба типа матриц не
§ 5] ДОКАЗАТЕЛЬСТВО ТЕОРЕМЫ I 319 появлялись одновременно, или ввести новые обозначения типа А > > В. Мы все же прибегнем к обозначениям более простым, но требующим от читателя внимания. В конце концов такая си- ситуация более предпочтительна. Вектор х будем называть положительным, если все его ком- компоненты положительны, и неотрицательным, если все его компо- компоненты неотрицательны. Соответственно будем писать х>0 и х 5> 0. Соотношение х ^ у означает, что х — у 5> 0. Упражнения 1. Показать, что из х^у, Л^гО следует, что Ах^Ау. 2. Доказать, что из условия Ах^О при всех х^О следует, что § 4. Теорема Перрона. Сформулируем теперь фундаменталь- фундаментальный результат Перрона. Теорема 1. Если А — положительная матрица, то сущест- существует единственное характеристическое число матрицы А, К{А) с наибольшей абсолютной величиной. Это характеристическое число положительное и простое, а соответствующий ему соб- собственный вектор может быть выбран положительным. Имеется много различных доказательств этой теоремы. Мы приведем доказательство, являющееся во многих отношениях наиболее важным, поскольку попутно будет получено вариа- вариационное описание для Х{А). Из этого описания непосредственно следуют многие свойства К (А), к тому же его можно обобщить на случай более общих операторов. § 5. Доказательство теоремы 1. Доказательство теоремы 1 бу- будет получено в ходе доказательства теоремы 2. Теорема 2. Пусть матрица А положительная, и пусть К{А)— наибольшее по модулю характеристическое число матрицы А. Пусть S(X) — множество всех неотрицательных X, для каждого из которых найдется неотрицательный вектор х такой, что Ддс > Хх*), Т(Х) — множество всех положительных X таких, что Ах <^ %х при некотором положительном векторе х. Тогда X (А) = max X, Ае5(Ц; X(A) = mink, k<=T(h). A) Доказательство теоремы 2. Рассмотрим множество векторов, определенное соотношением 11*11= 2*1 = 1. B) *) х ф 0. (Прим. ред.)
320 ТЕОРЕМА ПЕРРОНА И МАТЕМАТИЧЕСКАЯ ЭКОНОМИКА [ГЛ. 16 Нулевой вектор, очевидно, не входит в это множество. Как и ра- ранее, положим || Л ||= 2 citj. Если Кх^САх, то I /1 МШК1ИН-11*11 и, значит, Отсюда следует, что 5(К) является ограниченным множеством и, кроме того, непустым, если А—положительная матрица*). Пусть >.0 = supX, пусть, далее, {А,,-} — последовательность чисел из S(K), сходящаяся к Ко, и пусть {хЩ — последовательность векторов таких, что )***>< AxW, i=l,2,..., D) и выполнено B). Так как ||дс<г'>|| = 1, то можно выбрать подпоследовательность последовательности х^\ сходящуюся к лс(°> — неотрицательному, нетривиальному вектору. Так как при этом Яо*° -«С Ах°, то Kq^S(K), что означает, что точная верхняя грань S(K) принад- принадлежит S(K). Покажем теперь, что АоД^О)=Лдс<0'. Доказательство будем ве- вести от противного. Предположим, без потери общности, что N 2 aijXj — Кох{ = d{ > О, '"s E) 2jtakixi — KqX^^O, k = 2, ..., N, где Xi, i = 1,2 ..., N, — компоненты вектора дс<°). Рассмотрим теперь вектор у = 0 0 F) Из E) следует, что АуЖоу. Последнее неравенство противоре- противоречит свойству максимальности Ко. Следовательно, di = 0, и равен- равенство должно иметь место во всех соотношениях E). *) Поскольку х =/=0, то ограничение B), очевидно, не изменяет опреде- определения S(X). Речь идет о том, что S(X) не состоит из одного нуля. (Прим. ред.)
§ 6] ВТОРОЕ ДОКАЗАТЕЛЬСТВО ПРОСТОТЫ НА) 321 Таким образом, Ко является характеристическим числом ма- матрицы А, а дс(°) — собственным вектором, который с необходи- необходимостью положителен. Покажем теперь, что Я0 = Я(Л). Предположим, что существует характеристическое число к матрицы А такое, чго \к\^-?^0. Пусть z — соответствующий этому числу собственный вектор, тогда из Аг=кг следует, что |||<Л||, G) где jz| — это вектор, компоненты которого являются абсолютны- абсолютными величинами компонент вектора z. Из неравенства G) и опре- определения ко следует, что |Я|-О*0. Отсюда \к\=к0 и, следователь- следовательно, ко = к(А). Мы доказали свойство максимальности, содержащееся в тео- теореме 2. Свойство минимальности будет получено в § 7. Пусть теперь к— некоторое характеристическое число ма- матрицы А, Кфк0; покажем, что ]Я|<Я0. Мы уже видели (см. G)), что предположение |Я|^Я0 приводит к равенству |A,j=Ao; но соотношение G) с \К = к0 означает, что А \г\ = ko\z\ и, следова- следовательно, \Az\=A\z\. Отсюда следует в силу положительности элементов А, что вектор z лишь скалярным множителем отли- отличается от неотрицательного вектора z = C\W. Следовательно, Аг = = А,о2 и, значит, к = к0. Полученное противоречие показывает, что |М<Л0. Покажем в заключение, что к0 является простым характери- характеристическим числом. Пусть и — вещественный собственный вектор матрицы Л, соответствующий к0 и не пропорциональный х0. Тогда нетрудно подобрать такое е, чтобы вектор дсо+еи был неотрица- неотрицательным, обладал нулевыми компонентами и не равнялся нулю; но тогда А (хо + ей) =Я0(л:0+ ем) >0, и мы приходим к противоре- противоречию. Тем самым доказана простота Яо и теорема 1. Упражнения 1. Показать, что из Л>?^0 следует, что %(А)^'к(В). 2. На примере матриц второго порядка показать, что неравенство В)^Х(А)Х(В) не всегда имеет место. § 6. Второе доказательство простоты к(А). Дадим теперь дру- другое доказательство простоты К(А), основанное на свойстве ми- минимальности. Начнем с доказательства следующей леммы: Лемма. Пусть AN — положительная квадратная матрица порядка N и AN-i — квадратная матрица порядка N—1, полу- полученная из AN вычеркиванием i-й строки и \-го столбца. Тогда X(Ax)>l(AN-i). A) 21 Р. Беллман
322 ТЕОРЕМА ПЕРРОНА И МАТЕМАТИЧЕСКАЯ ЭКОНОМИКА [ГЛ. 16 Доказательство будем вести от противного. Введем обозна- обозначения Пусть /Ijv^/W-i, и пусть Ллг_1 = ||а^-||, i, /=1, 2, .. . , N—1, что не умаляет общности. Имеют место следующие соотношения: JV— 1 2 atJyj = Х^у{, i = 1, 2, ..., N - 1, yi>0, B) N 2 а/;дгу = A,wx,, г = 1, 2, ..., N, xt>0. C) Используя первые iV—1 уравнений из системы C), получаем JV-I — aiNxN = Яд, (xt — cti^x^[IKN) < XNx^ D) что противоречит свойству минимальности Kn-i*)- Воспользуемся теперь этим результатом для того, чтобы по- показать, что Х(А) является простым корнем уравнения f{k) = = \А —Я/| =0. Воспользовавшись правилом дифференцирования определителя, получаем формулу f'(K)= — {Ai — Я/| — \А3 — М\— ...— \AN — M\, E) где через Аи обозначена матрица, полученная из матрицы А вы- вычеркиванием k-то столбца и k-н строки. Поскольку X(A)>X{A/t) для каждого й, а каждый определитель \Аь — Я/| является многочленом от Я с одним и тем же коэффициентом при стар- старшей степени, то каждый многочлен \Ак — XI\ в точке Х = Х(А) имеет один и тот же знак. Следовательно, f'(X(A)) фО. § 7. Доказательство свойства минимальности Х(А). Выше мы дали доказательство свойства максимальности Х{А), в предыду- предыдущем же пункте мы использовали свойство минимальности. Сей- Сейчас мы докажем свойство минимальности, использовав свойство максимальности, хотя мы могли бы и здесь применить ту же схему, что и при доказательстве последнего. Метод, которым мы воспользуемся, — метод сопряженного оператора — является од- одним из наиболее важных и полезных в анализе. С этим методом мы уже встречались при рассмотрении марковских матриц. Пусть А', как обычно, обозначает матрицу, транспонирован- транспонированную к матрице А. Так как характеристические числа матриц А и А' совпадают, то Х(А) =Х(А'). Как мы знаем, (Ах,у) = = (х,А'у). Если Ау^СХу при некотором у > 0, то для любого *) См. ниже в § 7 завершение доказательства теоремы 2. (Прим. ред.}
§ Ю] СТАЦИОНАРНЫЙ РОСТ 323 вектора К(г,у)>(г,Ау) = (А'г,у). A) Пусть г является собственным вектором матрицы А', соответ- соответствующим характеристическому числу %{А). Тогда К(г,у)>(А'г,у)~ЦА)(г,у). B) Так как {г, у)>0, то )J>%{A). Это завершает доказательство свойства минимальности. § 8. Эквивалентное определение 'к(А). Вместо определения Я (Л), данного выше в теореме 1, мы можем дать следующее определение: Те о р е м а 3. К (А) = max min \ 2 aux,lxt ) = min max \ x i l/=l J x i l/=l Здесь x принимает значения на множестве всех неотрицательных векторов, отличных от нуля. Доказательство мы оставляем читателю в качестве упраж- упражнения. § 9. Предельная теорема. Из теоремы 1 вытекает следующий важный результат: Те о р е м а 4. Пусть с — произвольный неотрицательный век- вектор*). Тогда предел v = lim Anc/l (А)п существует и является собственным вектором матрицы А, соот- соответствующим характеристическому числу Я,(Л). Этот предел единствен с точностью до скалярного множителя, зависящего от выбора начального состояния с. Эта теорема представляет собой обобщение соответствую- соответствующего результата, доказанного в гл. 14 для специального случая марковских матриц. Упражнение 1. Получить предыдущий результат, основываясь на его частном слу- случае, установленном для марковских матриц. § 10. Стационарный рост. Посмотрим теперь, какое асимпто- асимптотическое поведение вектора х(п), рассмотренного в § 2, можно усмотреть на основании теоремы Перрона. Мы предположим, что матрица Л = ||а^|| положительная. *) сФО. 21*
324 ТЕОРЕМА ПЕРРОНА И МАТЕМАТИЧЕСКАЯ ЭКОНОМИКА [ГЛ. 16 В этом случае асимптотическое поведение вектора х(п) при п-+оо характеризуется соотношением *(n)~Av, A) где К — перроново характеристическое число, a y — собственный вектор, соответствующий X. Мы знаем, что вектор \ положите- положителен и отличается положительным скалярным множителем от нормированного собственного вектора 6. (Нормированным мы называем здесь вектор, сумма компонент которого равна еди- единице.) Константа пропорциональности, связывающая векторы \ и б, определяется значениями компонент с, вектора с — началь- начального распределения по видам. Замечателен тот факт, что независимо от начального распре- распределения по видам рост популяции асимптотически приобретает стационарность: размер популяции экспоненциально возрастает, но пропорции, в которых в нее входят различные виды, остают- остаются постоянными. Как мы увидим далее, это же явление имеет место в линей- линейных моделях экономических систем. § 11. Непрерывные процессы роста. Возвращаясь к математи- математической модели, описанной в § 2, предположим, что моменты вре- времени, в которые производятся наблюдения над системой, прибли- приближаются друг к другу. В пределе мы получим непрерывный про- процесс роста. Пусть fltjA — число индивидуумов типа /, произведенных индивидуумом типа / за время А, / Ф i; 1 + flj,A — число индивидуумов типа i, произведенных индивидуумом типа i за время А, i=l,2,...,N. A) Тогда имеют место уравнения xt(t + \) = (l + a/f A) xt (t) + AS atJXj (t), i = 1, 2 N. B) Заметим, что теперь а,ц представляют собой интенсивности ро- рождения. Формально переходя к пределу при А-»-О, получаем следующие дифференциальные уравнения: dx. ^\ -~ = auxt+ 2jaijxj> i=l, 2, ..., N. C) / ф i Мы можем теперь определить непрерывный процесс роста по- посредством этих уравнений, оговаривая, что процесс является пре- пределом (в некотором смысле) дискретного процесса.
§ 13] ЯДЕРНЫЙ РАСПАД 325 Асимптотическое поведение Xi(() при /—>оо определяется характеристическими числами матрицы А, имеющими наиболь- наибольшую действительную часть. § 12. Аналог теоремы Перрона. Докажем теперь следующую теорему: Теорема 5. Если A) то характеристическое число матрицы А, имеющее наибольшую действительную часть, является простым и действительным. Этому характеристическому числу соответствует положительный собственный вектор, единственный с точностью до постоянного множителя. Кроме того, Г N -I ( N -I р (А) = max min { 2 а-их,1х, \ = min max I 2 aaXi/x, \ . B) X i { j=l J X I { / = 1 ' ' ) Доказательство. Этот результат легче всего получить как предельный случай теоремы Перрона. Пусть р(/1) обозна- обозначает характеристическое число с наибольшей действительной частью. Очевидно, что характеристическое число матрицы ебА имеет вид X (ем) = е*(Л) C) при 6>0. Как это следует из § 15 гл. 10, матрица е6А положи- положительна при наших предположениях, и, следовательно, характе- характеристическое число р{А) положительное и простое. Используя вариационное представление для Я(ебА), имеем I N \ ебР (Л) = max min 1 + 6 2 auXj/Xi + О (б2). D) I х \ 1=1 I Поскольку 6 в D) сколь угодно мало, то мы получаем искомое представление B). Упражнения 1. Если В^О, а А такая, что <2г;>0 при 1ф], то р(А + В) ^р(Л). 2. Вывести теорему 5 непосредственно из теоремы Перрона 1, рассмот- рассмотрев матрицу sI + A, где s выбрано так, что матрица sI + A является положи- положительной. § 13. Ядерный распад. Этот же тип матриц возникает в связи с некоторыми простыми моделями ядерного распада. В каче- качестве объектов теперь могут выступать N различных видов эле- элементарных частиц или одна частица, скажем, нейтрон, находя- находящаяся в N различных энергетических состояниях.
325 ТЕОРЕМА ПЕРРОНА И МАТЕМАТИЧЕСКАЯ ЭКОНОМИКА [ГЛ. 16 Ссылки на работы в этой области имеются в конце этой главы. § 14. Математическая экономика. Рассмотрим простую модель экономической системы. Имеется Af различных отраслей промыш- промышленности, функционирование каждой из которых зависит от со- состояния остальных. Мы предположим, что состояние системы (совокупности) отраслей может быть описано вектором х(п), /-я компонента которого так или иначе описывает состояние г'-й отрасли. Взаимодействие отраслей моделируется системой рекуррентных соотношений, или разностных уравнений вида xi(n+l) = gl{xl(n), х2(п), ..., xN(n)), xi(Q) = ci, i=l, 2, .... N. A) Такая формулировка, однако, слишком туманна. Для того чтобы увидеть, как соотношения этого типа возникают в дей- действительности, рассмотрим простую модель трех взаимодей- взаимодействующих отраслей, которые мы будем условно называть «авто- «автомобилестроительной», «сталелитейной» и «станкостроительной». Предположим, что каждая из этих отраслей в любой момент времени может быть описана ее сырьевым ресурсом и ее произ- производительной мощностью. Введем следующие переменные состояния: Xi(n) — число автомобилей, произведенных к моменту вре- времени п; Х2(п) — производственная мощность автомобилестроительных заводов в момент времени п; х3{п) — запас стали в момент времени п\ B) Xi(n) — производственная мощность сталелитейных заводов в момент времени п; Хъ(п) — количество (ресурс) станков в момент времени п; Хе(п) — производственная мощность станкостроительных за- заводов в момент времени п. Для того чтобы получить соотношения, связывающие xf(n+ 1) и Xi(n), мы должны сделать некоторые допущения относительно экономической взаимозависимости рассматриваемых трех отрас- отраслей. Эти допущения состоят в следующем: Для того чтобы увеличить производственную мощность каждой из трех отраслей, требуются только станки и сталь. (За) Для производства автомобилей требуются сталь и производственная мощность автомобилестроительных заводов. C6)
$ 145 МАТЕМАТИЧЕСКАЯ ЭКОНОМИКА 327 Для производства стали требуется только производственная мощность сталелитейных заводов. (Зв) Для производства станков требуются сгаль и производственная мощность станкостроительных заводов. (Зг) Динамика процесса производства такова: в начале времен- временного периода, протекающего от момента п до момента я 4-1, не- некоторые количества стали и станков размещаются на заводах трех отраслей для дальнейшего производства стали, станкоз и автомобилей, а также для увеличения существующих производ- производственных мощностей, причем каждая отрасль использует для этого свои запасы. Пусть Zi(n) — количество стали, предназначенное для увеличения х,(я) в момент времени п, i=l,2,..., 6; D) Wj(n) — количество станков, предназначенное для увеличения xt(n) в момент времени п, i — 1, 2, ..., б. Обращаясь к ранее сделанным предположениям C), мы видим что () 0 Eа) Wr,(n) = 0. E6) Для того чтобы получить соотношения, связывающие Хг{п+\) с Xj(n), Zj(n) и Wj(n), мы должны сделать некоторые предполо- предположения, касающиеся зависимости входа и выхода. Простейшим из такого рода предположений является предположение о линей- линейности производства, когда выход продукции прямо пропорциона- пропорционален входу по наименее обеспеченному параметру. Конкретно это значит, что объем выпускаемой продукции пропорционален производственной мощности, если отсутствуют какие-либо огра- ограничения на сырьевые материалы, и пропорционален количеству наименее обеспеченного сырьевого материала, если отсутствуют ограничения на производственную мощность. Процессы этого типа называются «процессами с узкими ме- местами». Для получения уравнений, описывающих рассматриваемый процесс, воспользуемся принципом сохранения. Количество ма- материала в момент я 4- 1 равно количеству материала в момент л минус использованное за время (я, я 4-1) плюс произведенное за время (п,п+ 1). Ограничения на выбор z{ и wt состоят в том, что мы не мо- можем использовать на каждой стадии больше материала, чем
328 ТЕОРЕМА ПЕРРОНА И МАТЕМАТИЧЕСКАЯ ЭКОНОМИКА [ГЛ. IS запасено; кроме того, нет смысла выделять больше сырья, чем можно освоить при данной производственной мощности. С учетом эффекта узких мест уравнения сохранения имеют вид Xi(n + I) = x[(n) + min(y1x2(n), х2(п + \) = х2(ft) + min (а222(ft), $2w2(ft)), X3(n+l) = X3 (ft) - 2, (ft) - Z2 (ft) - 24 (ft) - 25 (tt)-Z6 (ft) + \2Х4 (ft), Xi (/г + 1) = х4 (ft) + min (a4z4 (л), р4да4 (ft)), x5 (п + 1) = x5 (n) - да2 («) - w4 (n) - w6 (n) + min (y5a;6 (n), a525 (ft)), x6 (n + 1) = x6 (n) + min (a626 (n), р6ш6 (и)), где a,, Pi, Yi — константы. Ограничения на выбор zt и да, имеют вид г,, wt>0, Gа) Z6^ X3, G6) х5. Gв) Если ограничения, связанные с производственными мощно- мощностями, являются определяющими, то уравнения F) становятся линейными. Действительно, в этом случае (8a) а424 = р4ш4, (86) а626 = рбш6. (8в) Исключая с помощью этих соотношений ге.1,-, получаем линейные уравнения X3 (ft + 1) = Х3 (ft) - Zi (n) - 22 (ft) - 24 (п) - 25 (tl) - -z6(n) + y2x4(n), x3@) = c3; х4 (ft + 1) = Xi («) + a4z4 (л), х4 @) = c4; X5 (ft + 1) = *5 (ft) - 8222 (ft) - 8424 (ft) - B6Z6 (ft) + a525 (ft), x6 (n + 1) = x6 (ft) + a626 (ft), xe @) = c6.
§15] МАТРИЦЫ МИНКОВСКОГО-ЛЕОНТЬЕВА 329- Ограничения на выбор г* принимают вид zt>0, A0a) 21+22 + 24 + 25 + 26<Х3, A06) *5> ( ! Ов) (Юг) (Юд) Предположим, что эти условия выполняются при 22 = 62*5, 24 = 64*5, 26 = <?6*5, A1) где скаляры е2, е4 и е6 выбраны с учетом условий A0) и 5 = f 6*6. A2) Пусть, кроме того, выполнены условия A0). Тогда уравнения (9) принимают вид Xi(n + 1) = A — ai{)Xi (n) + 2 aijXj{n), i=l, 2, .... 6, где ач>0, i, /=1, ..., 6. A4) Для непрерывного случая эти уравнения таковы: -^Г = - attxi + S а,-Л-, / = 1, 2, .... 6. A5)- Наше детальное рассмотрение экономической модели иллю- иллюстрирует ту важную роль, которую играют матрицы специаль- специального вида, называемые иногда «входными — выходными». К со- сожалению, в наиболее интересных и практически важных случаях мы не можем заменить условие A4) более ограничительным условием положительности. Результатом этого является тот факт, что изучение асимптотического поведения решений урав- уравнений вида A3) очень сложно. Ссылки на довольно обширные- исследования в этой области приводятся в конце главы. § 15. Матрицы Минковского — Леонтьева. Рассмотрим теперь специальный класс неотрицательных матриц, определяемый условиями 0<alJt (la) N
330 ТЕОРЕМА ПЕРРОНА И МАТЕМАТИЧЕСКАЯ ЭКОНОМИКА [ГЛ. 16 Эти матрицы возникают в связи с решением линейных уравнений вида N Xi = 2 CLijXj + yh i = 1, 2, ..., N, B) встречающихся при рассмотрении моделей, очень похожих на предыдущую, для межотраслевых производственных процессов. Докажем следующую теорему: Теорема 6. Если 0^Са;; и N 2а<7<1, /=1, 2, ..., N, C) то система B) имеет единственное решение, которое положи- положительно, если все уг положительны. Если atj>0, то матрица (I — А)~] также положительна*). Доказательство. Чтобы показать, что матрица (/ — Л) является положительной при условии, что а;.,->0, достаточно по- показать, что транспонированная к ней матрица положительна, т. е. (/ — А')~1^0. Рассмотрим сопряженную систему уравнений N zt = 2 anzj +wh i = 1, 2, .. ., N. D) Легко видеть, что в силу условия C) прямой итерационный процесс дает решение уравнения D), которое будет положитель- положительным, если Wi > 0, i — 1,2, ..., N. Из условия a,j>0 также следует, что zt положительны всякий раз, когда w является нетривиальным неотрицательным век- вектором. Таким образом, доказав, что (/ — Л) существует и по- положительна, мы доказали вторую часть теоремы. § 16. Положительность определителя |/ — А\. Поскольку при указанных условиях система A5.2) имеет единственное решение при всех уи то |/ — А\Ф0. Чтобы показать, что |/ — Л|>0, вос- воспользуемся соображениями непрерывности, подобно тому, как мы сделали это в § 4 гл. 4. Если к^-0, то матрица кА удовлетво- удовлетворяет тем же условиям, что и Л. Поэтому определитель |/ — кА\ отличен от нуля при всех к таких, что О^А-^ 1. Поскольку этот определитель положителен при Я = 0 и непрерывен по к, он поло- положителен и при к=\. оо *) В условиях теоремы (/¦—Л)" = 2^'=3= 0. (Прим. ред.)
§ 18] ЛИНЕЙНОЕ ПРОГРАММИРОВАНИЕ 331 N § 17. Усиление теоремы 6. Ясно, что если S а.-, = 1 при всех /, i=\ то 1 является характеристическим числом матрицы А, откуда следует, что |/ — Л|=0. С другой стороны, можно ожидать, что условие Д] aSj < 1 может быть ослаблено. Достаточными оказываются следующие предположения отно- относительно элементов матрицы А: \>аи>0, Aа) 2а,;-<1 хотя бы для одного /, A6) ? 2а,-;-^1 для всех /. Aв) i Это легко доказать, убедившись в том, что элементы матри- матрицы Л2 удовлетворяют условиям A) при всех /. § 18. Линейное программирование. В первой части этой книги мы рассматривали задачу максимизации квадратичной формы при квадратичных ограничениях, а также задачу максимизации квадратичной формы при линейных ограничениях. Однако мы тщательно избегали всех вопросов, связанных с максимизацией линейных форм при линейных ограничениях. Типичная задача этого класса формулируется следующим образом: требуется максимизировать функцию N L(x)='Zctxi A) при ограничениях на аргументы вида N 2а//*/<&«. /=1, 2, .... М, Bа) Ki > 0. B6) Читатель очень быстро обнаружит, что ни один из методов, рассмотренных в первой части книги, посвященной квадратич- квадратичным формам, не пригоден здесь. Вопросы этого типа рассматри- рассматриваются в недавно развитой теории линейных неравенств. Этой теории будет посвящен один из последующих томов этой серии. Теорема Перрона — как сам результат, так и метод доказатель- доказательства — тесно связана с различными частями теории линейных неравенств. Кроме результатов, связанных с вопросами существования и характером решений сформулированной выше задачи, очень
332 ТЕОРЕМА ПЕРРОНА И МАТЕМАТИЧЕСКАЯ ЭКОНОМИКА [ГЛ. 16 большое значение имеет построение алгоритмов численного ре- решения этой задачи. Эта часть общей теории линейных нера- неравенств называется линейным программированием. Приведем теперь очень простой пример того, как такие за- задачи возникают в математической экономике. Предположим, что мы располагаем М видами ресурсов в количествах соответ- соответственно Х\, х2, ..., хм. Этими ресурсами могут быть люди, ма- машины, деньги и т. д. Пусть эти ресурсы используются в N раз- различных производственных процессах, таких, как, например, бу- бурение скважин, производство автомобилей и т, д. Пусть Xij — количество г'-го ресурса, используемое в /-м производственном процессе, C) и при этом N 2* . = *., /=1, 2, ..., М, Dа) . D6) Предположим — и это является обычно довольно грубым при- приближением,— что полезность вложенного ресурса Хц опреде- определяется простой пропорциональностью, т. е. полезность равна а^Хц. Сделав дальнейшее предположение относительно аддитив- аддитивности полезностей, мы приходим к задаче максимизации линей- линейной формы L {х) = 2 a-ijXij E) i, I при ограничениях вида D). В качестве другого примера того, как возникают линейные вариационные задачи, можно рассмотреть модель, приведенную в § 15. Вместо того чтобы заранее задавать значения величин Z{ и ш,, как мы это делали, можно искать значения этих вели- величин, максимизирующие суммарный выпуск стали за N циклов процесса. § 19. Теория игр. Предположим, что два игрока А и В прини- принимают участие в игре следующего простого типа. У первого игро- игрока имеется М ходов, а у второго N. Если А делает г'-й ход, а В делает /-й ход, то А получает сумму ац, а В получает —ац. Матрица А = ||а„|| A). называется матрицей платежей.
§ !9] ТЕОРИЯ ИГР 333 Игроки делают свои ходы одновременно, не зная о решении противника. Затем арбитр в соответствии со сформулирован- сформулированными выше правилами определяет суммы, подлежащие платежу. Предположим, что эта ситуация повторяется снова и снова. Вообще говоря, ни одному из игроков не выгодно делать один и тот же ход в каждой партии. Каждый игрок с помощью неко- некоторого случайного процесса выбирает свои ходы так, чтобы не дать своему противнику извлечь выгоду из его стратегии. Пусть х{ — вероятность того, что А сделает t-й ход, i=l, 2, ..., М, . . B) У] — вероятность того, что В сделает ;-и ход, /=1, 2, ..., N. Тогда средний выигрыш, получаемый за игру игроком А, равен fix, У)=- IlatjXtyj. C) «./ ¦ Задача состоит в том, чтобы определить х{ и у,. Игрок А может рассуждать так: «Предположим, что В знает мой выбор. Тогда он должен выбрать г/,-, чтобы минимизировать f(x,y). В таком случае я выберу хи чтобы максимизировать вы- выигрыш». Придерживаясь такой стратегии, игрок А получит сред- средний выигрыш ол = max mmf{x, у), D) х у где область изменения х и у задается соотношениями xh yi>0, Eа) 21** = 2^=1. E6) i I Точно так же игрок В может гарантировать, что не проиграет больше, чем vB = minmaxf (лг, у). F) у х Основной результат теории игр состоит в том, что vA = vB. Это минимакс-теорема фон Неймана. Отметим еще один довольно замечательный факт. Можно показать, что упомянутая теоретико-игровая задача и задача из теории линейных неравенств, описанная в § 19, математически эквивалентны. Эта эквивалентность, оказывается, является след- следствием дуальности, присущей iV-мерной евклидовой геометрии.
334 ТЕОРЕМА ПЕРРОНА И МАТЕМАТИЧЕСКАЯ ЭКОНОМИКА [ГЛ. 16 § 20. Марковские процессы принятия решений. Рассмотрим те- теперь некоторые задачи, возникающие в теории динамического программирования. Представим себе физическую систему S, которая в каждый момент времени t = 0,l,... находится в одном из состояний Si, S2,... , SN. Пусть Xi(n) — вероятность того, что система S находится в состоянии S{ в момент п, я=1,2,... A) Пусть для каждого q, являющегося векторной переменной, M(q)=-\\mij(q)\\ B) представляет собой марковскую матрицу. Вместо того чтобы считать, что при фиксированном q M(q)nx@) задает вероятностное распределение в момент време- времени п, как для обычного марковского процесса, мы предположим, что q может изменяться от такта к такту. Конкретно, мы.будем считать, что осуществляется управление этим процессом с целью увеличения вероятности того, что система будет находиться в состоянии 1 в любой момент времени. Вместо обычных уравнений мы получаем соотношения N х-, (п + 1) = max 2 rnl} (q) Xj (n), C) *«(«+D =2^0-(?*)*;(«). где q* — значение вектора q, при котором достигается максимум суммы в правой части выражения в первой строке. Мы оставляем читателю исследование очень интересного во- вопроса, связанного с получением простых условий, при которых существует «стационарное», или равновесное, решение. В § 21 мы рассмотрим более общую систему. § 21. Экономическая модель. Пусть мы располагаем W различ- различными видами ресурсов. Пусть Xi{n) — количество /-го ресурса в момент п. A) Предположим, что имеют место следующие линейные соотно- соотношения:
УПРАЖНЕНИЯ К ГЛ. 16 335- где q, как и ранее, — некоторый векторный параметр. Если A (q) — положительная матрица, то асимптотическое поведение системы описывается теоремой Перрона. Предположим, однако, как и в § 20. что процесс управляется с целью увеличения количества каждого ресурса в каждый мо- момент времени. В этом случае уравнения B) принимают вид N xi{n + l) = max^iaij(q)xj{n), i = 1, 2, ..., N. C> я /-1 Имеет место следующее обобщение теоремы Перрона: Теорема 7. Если q принимает значения из конечного мно- множества (qu q2,. . . , qu) такого, что максимум в C) достигается, Dа) 0<m, <aG(^)<m2<oo, D6) max Я- (Л (Д)) существует и достигается при некотором q^ Dв) я го существует, и притом единственное, положительное число к такое, что однородная система N fkyi = va&x^ai}{q)yl E) я i=i имеет положительное решение yt > 0. Это решение единственно с точностью до множителя и , F) я Кроме того, при п-+оо х,(п) ~ аху{Кп, G) где at зависит от начальных условий. Доказательство этой теоремы можно найти в работах, цити- цитируемых в конце этой главы. Упражнения к гл. 16 1. Пусть Л = |]аг,||—неотрицательная матрица. Необходимым и доста- достаточным условием того, чтобы все характеристические числа матрицы А ле- лежали внутри единичного круга, является положительность всех главных миноров матрицы / — А. (Мецлер.) 2. Пусть D — диагональная матрица; пусть диагональные элементы мат- матрицы А отрицательны, а ее внедиагональные элементы неотрицательны. Пусть, кроме того, собственные значения матриц А и DA имеют отрицатель- отрицательные действительные части. Тогда матрица D положительна. (Эрроу и Энт- ховен.)
336 ТЕОРЕМА ПЕРРОНА И МАТЕМАТИЧЕСКАЯ ЭКОНОМИКА [ГЛ. 16 3. Рассмотрим матрицу Z(l)—\\Zij(t)\\, элементы которой обладают сле- следующими свойствами: (a) 2,j>0, (б) 2j; dt > 1 при некотором /, о оо (в) г. .e~at dt < оо при некотором а > 0. Показать, что существует положительный вектор X и положительное число So такие, что I Г ~s«- Sl>t dt\ x = х. Более того, s0 является простым корнем уравнения / - J Ze~st dt = 0, о обладающим наибольшей действительной частью. (Боненбласт ').) 4. Пусть А = || atj || и s. = | а.. | - ^ | a{J |. Если s. > 0, 1 < i < N, то (как мы уже знаем) Л ~\\Ьц \\ существует. Показать, что | 6. . |<l/s.. (Фань Цзы.) 5. Говорят, что действительная матрица А = || аг- ¦ [| увеличивает макси- максимум, если Л? max x.=C max ~У\ а, .х ¦ для любого действительного вектора х. Доказать, что матрица А является увеличивающей максимум тогда и только тогда, когда ее обратная матрица Л =11 Ьц || обладает следующими свойствами: (а) Ьц > 0, N (б) ^Ьц=\, 1</<ЛГ. (Фань Цзы.) /=1 6. Пусть дг; — положительные числа, a /(a'j, x2, ..., хд,) и g(Xj, ^2, ..., х„\ обозначают соответственно наименьшую и наибольшую из N + 1 величин Xj, jc2-f 1/jCj, %3+ l/x9, ..., х^ + l/xA,_j, 1/jc(V. Доказать, что max /(х,, х2, ..., х \= min g(x., x2, ..., xw) = 2 cos (n/(N + 2)). X;>0 N' X,>0 "' ') См. Беллма н (R. Bellman), A Survey of the Mathematical Theory of Time-lag, Retarded Control, and Hereditary Processes, with the assistance of J. M. Danskin, Jr., The Rand Corporation, Rept. R-256, March 1, 1954.
УПРАЖНЕНИЯ К ГЛ. 16 337 7. Пусть а > 0. Для любого разбиения 0 = t0 <<,<...<< = 1 от- N 1 резка [0, 1] сумма Римана Л. U< — ^-i)/(a + *j) для интеграла dt/{a + t} l-i о всегда содержит член > [l — (а/а + lI/Af], a также член, не превосходящий этой величины. (Фань Цзы.) 8. Пусть элементы матрицы А таковы, что а{, ^ 0 при i ф j и а-/+ 2 аИ ~ 0,/ = 1, 2, ...,Л\ Тогда если Л —собственное значение матрицы А, i Ф I то либо Я = 0, либо Re (Я) < 0. (А. Брауэр —О. Таусски.) N 9. Если и. > 0, а(.. > 0, i Ф ), и 2 а• ,• = а ¦ ¦• то 11 «U + "l ~a12 2 i = l — a ш 0. (Минковский.) 10. Если at .> 0 при i ^= j и 6у^ 2 ai;> т0 все алгебраические допол- дополнения элементов определителя — a. -e. ~aN2 ¦ ¦¦ bN хг;| называется неотрицательны. (Ледерман.) 11. Действительная матрица X, у которой х{{ > ^ / ? матрицей Адамара. Пусть Л и В — адамаровы матрицы. Тогда ^;|Л| + |В1. (X е й н с в о р т1).) См. также работы А. Островского2). Матрицы Адамара играют важную роль в численном анализе. Эти мат- матрицы и матрицы более общего типа, доминантные матрицы, находят приме- применение в исследовании многополюсников. См. работы Слепян и Вайнберг (P. Slepian and L. Wei n berg), Synthesis Applications of Paramount and Dominant Matrices, Hughes Research Labora- Laboratories, 1958; ') E. V. Haynsworth, Bounds for Determinants with Dominant Main Diagonal, Duke Math. J. 20 A953), 199—209. 2) A. Ostrowski, Ober die Determinanten mit flberwiegender haupt Diagonale, Comment. Math. Helvetica 10 A937—1938), 69—96; A. Ost- Ostrowski, Note on Bounds for Some Determinants, Duke Math. J. 22 A955), 95—102. 22 P- Беллман
338 ТЕОРЕМА ПЕРРОНА И МАТЕМАТИЧЕСКАЯ ЭКОНОМИКА [ГЛ. 16 Берингтон (R. S. Burington), On the Equivalence of Quadrics in m-affine n-space and Its Relation to the Equivalence of 2m-pole Networks, Trans. Amer. Math. Soc. 38 A935), 163—176; Берингтон (R. S. Burington), i?-matrices and Equivalent Net- Networks, J. Math, and Phys. 16 A937), 85—103. 12. Пусть |Oij| < m\au\, /<(, j=l, 2, .. ., N, и \ац\^М\ац\, j>i, j=l, 2, ... ..., N—1, тогда матрица А вырожденная, если m/(l+m)N<M(l+M)N и m<M. Если т = М, то для невырожденности достаточно, чтобы m<l/(W— 1). (Островский1).) 13. Af-матрицей называется такая действительная матрица А, что Оц ^ 0,/=И=/, и имеет место одно из следующих трех эквивалентных свойств: (а) существует N положительных чисел х, таких, что N ^aijXi>0, i=l, 2, .... N; / = 1 (б) матрица А невырожденная и все элементы матрицы Л неотрица- неотрицательны; (в) все главные миноры матрицы А положительны. Af-матрицы были введены Островским2). См. также Хейнсворт (Е. V. Н а у n s w о г t h), Note on Bounds for Certain Determinants, Duke Math. J. 24 A957), 312—320; Хейнсворт (E. V. H ay ns worth), Bounds for Determinants with Dominant Main Diagonal, Duke Math. J. 20 A953), 199—209, где имеются дальнейшие ссылки. 14. Пусть А и В — положительные квадратные матрицы порядка N та- такие, что АВфВА, а с — данный положительный Л'-мерный вектор. Рассмот- Рассмотрим вектор X]v=ZjvZjv-i . . • Z2ZiC, где каждая матрица Z; равна либо А, либо В. Допустим, что Zi надлежит выбрать таким образом, чтобы макси- максимизировать скалярное произведение (хк, Ь), где Ь — фиксированный вектор. Определим функцию fN (C) = 'ЛДХ (XN' ЬУ \ II Доказать, что /, (С) = max ({Ас, Ь), (Вс, Ь) ), 15. Существует ли такой скаляр Л, что fK(c)ooXNg(c)? 16. Рассмотреть соответствующую задачу для случая, когда максимизи- максимизируется перроново характеристическое число матрицы ZNZK-\-. .Z2Zu Библиография и комментарий § 1. Очень много интересных и важных аналитических за- задач возникает при исследовании различных математических мо- моделей экономического взаимодействия. См. обзорную статью Г ер штейн (I. N. Herstein), Some Mathematical Methods and Tech- Techniques in Economics, Quart. Appl. Math. 11 A953), 249—261. ') А. О s t г о w s k i, On Nearly Triangular Matrices, J. Research Nat. Bur. Standards 52 A954), 319—345. 2) A. Ostrowski, Comment. Math. Helveticii 30 A956), 175—210; ibid. 10 A937), 69—96.
БИБЛИОГРАФИЯ И КОММЕНТАРИЙ 339 Укажем еще две книги, к которым может обратиться чита- читатель, интересующийся этими вопросами: Купманс (Т. Koopmans), Activity Analysis of Production and Allo- Allocation, John Wiley & Sons, Inc., New York, 1951; Моргенштерн (О. Morgenstern) (ed.), Economic Activity Ana- Analysis, John Wiley & Sons, Inc., New York, 1954. Приложения теории положительных матриц к исследованию динамической устойчивости больших систем сбыта описаны б статьях Эрроу и Нерлав (К. J. Arrow and M. Nerlove), A Note on Expectations and Stability, TR No. 41, Dept. of Economics, Stanford Univer- University, 1957; Эрроу и Энтховен (К. J. Arrow and A. Enthoven), A Theorem on Expectations and Stability of Expectations, Econometrica 24 A956), 288—293, где также приведена литература по этим вопросам. По поводу терминологической неразберихи можно добавить, что помимо положительно определенных матриц, с которыми мы имели дело в первой части книги, и положительных матриц. Перрона, важную роль играют также вполне положительные матрицы *). § 2. Изложение математических моделей процессов роста этого типа содержится в монографии Харрис (Т. Е. Harris), The Theory of Branching Processes, Ergeb. Math., 1960 [русский перевод; Теория ветвящихся случайных процессов, «Мир», 1966], где можно найти много дальнейших ссылок. § 3. Понятие положительного оператора является одним из основных в анализе. Развернутое изложение теории и приложе- приложений этих операторов имеется в работе М. Г. Крейн и М. А. Р у т м а н, Линейные операторы, оставляющие инвариантным конус в пространстве Банаха, УМН 3, № 1 B3) A948), 3—95. § 4. См. Перрон (О. Perron), Zur Theorie der Matrizen, Math. Ann. 64 A907), 248—263. Доказательство, данное самим Перроном, отличается от при- приводимого нами и очень интересно само по себе. Приведенное же доказательство важно тем, что оно очень легко обобщается на случай бесконечномерных операторов. Это доказательство было дано Боненбластом в связи с одной задачей из теории многомерных ветвящихсА процессов, поставленной Беллманом *) См. Ф. Р. Гантмахер и М. Г. Крейн, Осцилляционные матрицы, Гостехиздат, 1950. (Прим. ред.)
340 ТЕОРЕМА ПЕРРОНА И МАТЕМАТИЧЕСКАЯ ЭКОНОМИКА [ГЛ. 16 и Харрисом. См. цитированную выше монографию Харриса и докторскую диссертацию Сноу (R. Snow), Mulli-Dimensiona! Branching Processes, UCLA, Dept. of Mathematics, 1960. Результат Перрона был существенно обобщен Фробениусом в статье Фробениус (G. Frobenius), Uber Matrizen aus nicht-negativen Elementen, Sitzsber. der Kgl. preuss. Acad. Wiss., 1912, 456—477, где исследован более общий случай, когда на аи накладывается только ограничение неотрицательности. В течение многих лет основополагающая работа Перрона была забыта и теорему не- неправильно приписывали Фробениусу. Об одном подходе к этой теореме с позиций теории линейных дифференциальных уравнений и некоторых обобщениях можно прочитать в работе Хартман и Уинтнер (P. Hartman and A. Wintner), Linear Differential Equations and Difference Equations with Monotone Solutions, Amer. J. Math. 1 A953), 731—743. Последние результаты можно найти в статье Биркгоф и Варга (G. Birkhoff and R. S. Varga), Reactor Criti- cality and Nonnegative Matrices, J. Ind. and. Appl. Math. 6 A958), 354—377. Как и в случае марковских матриц, задача изучения поведе- поведения собственных значений при более слабом ограничении неот- неотрицательности порождает различные частные случаи. Условия существования единственного собственного значения с наиболь- наибольшей абсолютной величиной наиболее четко выражаются в веро- вероятностных, экономических и топологических терминах. Деталь- Детальное рассмотрение этих вопросов и ссылки на другие источники читатель найдет в работах Уонг (Y. К. Wong), Some Mathematical Concepts for Linear Economic Models, Economic Activity Analysis, O. Morgenstern (ed.), John Wiley and Sons, Inc., New York, 1954; Уонг (Y. K. Wong), An Elementary Treatment of an Input-Output System, Naval Research Logistics Quarterly "l A954), 321—326; Вудбери (М. A. Woodbury), Properties of Leontieff-Type Input- Output Matrices, Economic Activity Analysis, O. Morgenstern (ed.), John Wiley & Sons, Inc., New York, 1954; Вудбери (M. A. Woodbury), Characteristic Roots of Input-Output Matrices, Economic Activity Analysis, O. Morgenstern (ed.), John Wiley and Sons, Inc., New York, 1954; Нобл (S. B. Nobl), Measures of the Structure of Some Static Linear Economic Models, George Washington University, 1958. Первое доказательство теоремы Перрона на основе теорем о неподвижной точке дано в книге Александров и Хопф (P. Alexandroff and H. Hopf), Topo- logie I, Berlin, 1935.
БИБЛИОГРАФИЯ И КОММЕНТАРИЙ 341 Подробное рассмотрение этого метода со многими обобще- обобщениями и приложениями читатель найдет в работе Фань Цзы (К у Fan), Topological Proofs for Certain Theorems on Matrices with Non-negative Elements, Monats. Math. 62 A958), 219—237. § 5. Другие доказательства имеются в работах Брауэр (A. Brauer), A New Proof of Theorems of Perron and Fro- benius on Non-negative Matrices, I: Positive Matrices, Duke Math. J. 24 A957), 367—378; Дебре и Герштейн (G. Debreu and I. N. Herstein), Non-nega- Non-negative Square Matrices, Econornetrica 21 A953), 597—607; Сейм ел сон (Н. Same Is on), On the Perron-Frobenius Theorem, Michigan Math. J. 4 A957), 57—59; Ульман (J. L. Ullman), On a Theorem of Frobenius, Michigan Math. J. 1 A952), 189—193. Дальнейшие ссылки имеются в работе Путнам (С. R. Putnam), Commutators on a Hilbert Space — On Bounded Matrices with Non-negative Elements, Purdue University, PRF-1421, May 1958, где намечен вывод теоремы Перрона как следствия теоремы Виванти — Принсгейма о степенных рядах. Этот результат был независимо открыт Уинтнером, Боненбластом — Карлиным, Мал- ликеном — Сноу и Беллманом. Были предложены различные итеративные схемы для нахо- нахождения наибольшего собственного значения. См. цитированную выше работу Брауэра, а также работы Брауэр (A. Brauer), A Method for the Computation for the Greatest Root of a Positive Matrix, University of North Carolina, December, 1957; Беллман (R. Bellman), An Iterative Procedure for Obtaining the Perron Root of a Positive Matrix, Proc. Amer. Math. Soc. 6 A955), 719—725. § 6. Этот метод был также использован в работе Беллман и Данскин (R. Bellman and J. M. Dans kin), A Survey of the Mathematical Theory of Time-lag, Retarded Control, and Here- Hereditary Processes, The RAND Corporation, Rept. R-256, March 1, 1954 для исследования задачи, сформулированной в виде упражнения (упражнение 3 к гл. 16). § 8. Такое представление для \N(A), по-видимому, впервые появилось в статье Коллатц (L. Collatz), Einschliessungssatz fur die characteristischen Zahlen von Matrizen, Math. Z. 48 A946), 221—226. Строго этот результат был впервые изложен в работе Виландт (Н. Wielandt), Unzerlegbare, nicht negative Matrizen, Math, Z. 52 A950), 642—648,
342 TEOPFMA ПЕРРОНА И МАТЕМАТИЧЕСКАЯ ЭКОНОМИКА [ГЛ. 1& Этот результат был несколько раз переоткрыт, в частности, Боненбластом, а также фон Нейманом. § 13. См. цитированную выше монографию Харриса, а также статьи Беллман, К а л а б а, Уин г (R. Bellman, R. E. Kalaba and G. M. Wing), On the Principle of Invariant Imbedding and One-dimensional Neutron Multiplication, Proc. Nat. Acad. Sci. U.S.A. 43 A957), 517—520; Беллман, Кал аба и Уинг (R. Bellman, R. E. Kalaba and G. M. Wing), On the Principle of Invariant Imbedding and Neutron Trans- Transport Theory, I: One-dimensional Case, J. Math. Mech. 7 A958), 149—162. § 14. Эта модель детально исследована методами динамиче- динамического программирования в книге Беллман (R. Bellman), Dynamic Programming, Princeton Univer- University Press, Princeton, N. J., 1957. [Русский перевод: Динамическое програм- программирование, ИЛ, I960.] § 15. См. цитированные в комментарии к § 4 статьи Уонга и Вудбери. § 18. См. цитированную выше работу Купманса, а также другие работы по линейному программированию, опубликован- опубликованные в Annals of Mathematics. Блестящее изложение теории линейных неравенств читатель найдет в работе Гуд (R. A. Good), Systems of Linear Relations, SIAM Review 1 A959), 1—31, где имеются дальнейшие указания на литературу. § 19. Монография фон Нейман и Моргенштерн (J. von Neumann and О. М о г- genstern), The Theory of Games and Economic Behavior, Princeton Uni- University Press, Princeton, N. J., 1948 представляет собой классическую работу по теории игр. Книга Вильяме (J. D. Williams), The Compleat Strategyst, McGraw-Hill Book Company, Inc., New York, 1955 [русский перевод: Совершенный стра- стратег, «Советское радио», 1960] может служить очень забавным введением в теорию игр. § 20. См. гл. 11 книги Беллмана, приведенной в коммента- комментарии к § 2, а также статью Беллман (R. Bellman), A Markovian Decision Processes, J. Math. Mech. 6 A957), 679—684. § 21. Другая мотивировка дана в работе Беллман (R. Bellman), On a Quasi-Linear Equation, Canad. J. Math. 8 A956), 198—202. Интересное обобщение положительности с удивительными разветвлениями представляет собой понятие областей положи-
БИБЛИОГРАФИЯ И комментарии 343 гельности данной матрицы А. Мы говорим, что R является об- областью положительности матрицы А, если для любой пары x,ye^R имеет место неравенство (х,Ау)>0. См. по этому поводу работы Ко хер (М. Koecher), Die Geodatischen von Positivitatsbereichen, Math. Ann. 135 A958), 192—202; Koxep (M. Koecher), Positivitatsbereiche im Rm, Amer. J. Math. 79 A957), 575—596; Бохнер (S. Bochner), Bessel Functions and Modular Relations of Higher Type and Hyperbolic Differential Equations, Comm. Sem. Math. Univ. Lunde, Suppl., 1952, 12—20; Бохнер (S. Bochner), Gamma Factors in Functional Equations, Proc. Nat. Acad. U.S.A. 42 A956), 86—89. Другим интересным и важным обобщением понятия положи- положительного преобразования являются преобразования, уменьшаю- уменьшающие вариацию. Такие преобразования, естественно, возникают в самых различных разделах анализа. См. работы Шёнберг (I. J Schoenberg), On Smoothing Functions and Their Generating Functions, Bull. Amer. Math. Soc. 59 A953), 199—230; Гантмахер Ф. Р. и Крейн М. Г., Sur les matrices complement nonnegatives et oscillatoires, Сотр. math. 4 A937), 445—476; Пойя и Шёнберг (G. Polya and I. J. Schoenberg), Remarks on de la Vallee Poussin Means and Convex Maps of the Circle, Pacific J. Math. 8 A958), 201—212; Карлин (S. Karl in), Polya-type Distributions, IV, Ann. Math. Stat. 29 A958), 1—21; Карлин и Мак-Грегор (S. Karlin and J. L. MacGregor),- The Differential Equations of Birth-and-Death Processes and the Stieltjes Mo- Moment Problem, Trans. Amer. Math. Soc. 85 A957), 489—546. См. также работу Слепян и Вайнберг (P. Slepian and L. We in berg), Synthesis Applications of Paramount and Dominant Matrices, Hughes Research Labora- Laboratories, Culver City, California. Упомянем, наконец, работу Карпилевич Ф. И., О характеристических корнях матриц с неотри- неотрицательными элементами, ИАН СССР, сер. матем. 15 A951), 361—383, посвященную исследованию областей локализации характери- характеристических чисел неотрицательных матриц.
Приложение А ЛИНЕЙНЫЕ УРАВНЕНИЯ И РАНГ § 1. Введение. Мы хотим напомнить некоторые элементарные результаты, касающиеся определителей и их роли в решении си- систем линейных уравнений вида N ^aijx] = ci, i=l, 2, .... Af. A) Коэффициенты ац и с, предполагаются комплексными. Мы получим также условия существования решений у одно- однородной системы линейных уравнений вида N Sfl(^ = 0, t=l, 2, .... M, B) отличных от Xj=x2= ... =jcjv = O. Это последнее решение назы- называют тривиальным. Для нас наиболее важен случай M — N. Однако мы будем изу- изучать его в рамках обшей системы. В заключение мы введем функцию от коэффициентов систе- системы B), называемую рангом, и изучим некоторые ее свойства. § 2. Определители. Предполагается, что читатель знаком с эле- элементарными свойствами определителей, а также с той ролью, которую они играют в решении линейных систем уравнений. В частности, нам потребуются следующие два результата. Лемма 1. Определитель, имеющий две одинаковые строки или два одинаковых столбца, равен нулю. Этот результат является следствием леммы 2. Лемма 2. Определитель ап ¦ • • aNN A)
§ 5] ОДНОРОДНЫЕ СИСТЕМЫ 345 может быть разложен по элементам первой строки: \аи\ = апАп + а12А12+ ... + ашАш, B) где Aij — определители порядка N—1, получаемые вычеркива- вычеркиванием i-й строки и j-го столбца и умножением на (—1)г'+-\ Числа Ац называются алгебраическими дополнениями ац. § 3. Свойство алгебраических дополнений. Комбинируя утвер- утверждения лемм 1 и 2, мы приходим к заключению, что алгебраиче- алгебраические дополнения Л,;, /= I, 2, . . . , N, удовлетворяют следующей системе линейных уравнений: N A) Действительно, равенства A) означают, что определитель, у ко- которого первая и г'-я строки совпадают, равен нулю. § 4. Правило Крамера. Если \ац\ можно представить в виде 0, то решение системы A.1) 'IN 2 NN 1 "ij I а для Xi справедливы аналогичные выражения, получаемые за-> меной 1-го столбца \atj\столбцом коэффициентов С\, с2,... , clY. § 5. Однородные системы. В дальнейшем мы воспользуемся следующим фактом: Теорема 1. Система линейных уравнений S i=l, 2, .... M, A) имеет нетривиальное решение, если N>M. Если N^.M, то необходимым и достаточным условием суще- существования нетривиального решения является равенство нулю всех определителей \а.ц\ порядка N. Кроме того, можно найти нетривиальное решение, в котором каждый из Xi представляет собой полином относительно aij. Доказательство проведем с помощью элементарной, хотя и громоздкой, индукции. Начнем с первого утверждения. В случае М=\ утверждение очевидно. Далее рассмотрим случай М = 2.
346 ЛИНЕЙНЫЕ УРАВНЕНИЯ И РАНГ [П. А Если N = 2, то мы имеем уравнения л'я' + а'^-о' B> Если \uij\ = 0, то набор v л v « /Q\ л | — t*22» *^2 — с*21 V^/ является решением системы B). Если это решение тривиально, т. е. A'i = x2 = 0, то, воспользовавшись алгебраическими дополне- дополнениями коэффициентов второго из уравнений B), мы получим решение х = а х = а. D) Если и это решение тривиально, то все коэффициенты at. равны нулю, и тогда любой набор значений хи х2 дает решение. Если Л/>2, то мы имеем набор уравнений а^| + a2j2 + + aZx, = 0 E> Разрешим эти уравнения относительно Х\ и х2, выразив их через остальные х{. Это легко сделать, если определитель F) (Х2\ С122 отличен от нуля. Если этот определитель равен нулю, то мы по- попытаемся найти такую пару переменных х,, Xj, у которой опре- определитель a2i a2j отличен от нуля. Затем мы выразим переменные xt и Xj через, остальные переменные. Предположим, однако, что все определители вида G) равны нулю. Мы утверждаем, что в этом случае одно из уравнений E) является избыточным в том смысле, что любой набор значений Хг, удовлетворяющий одному из этих уравнений, с необходи- необходимостью удовлетворяет и другому. Чтобы доказать это, мы пока- покажем, что существуют такие два параметра Xi и Х2, по крайней мере один из которых не равен нулю, что тождественно по х,. Если при этом окажется, что Я|=?0, то, оче- очевидно, достаточно удовлетворить второму из уравнений E), что- чтобы удовлетворялось и первое. Таким образом, мы сведем задачу
§ 5] ОДНОРОДНЫЕ СИСТЕМЫ 347 решения двух уравнений с TV неизвестными к задаче решения одного уравнения с N неизвестными. Равенство (8) эквивалентно следующим уравнениям: Я,ап + Х2а2[ — О, Х1а12 + к2а22 = 0, /д.. = 0. Рассмотрим первые два уравнения: - Я2а22 = 0. Они имеют нетривиальное решение, поскольку мы предполо- предположили, что все определители второго порядка равны нулю. Без потери общности можно считать, что ац или а2\ не равен нулю, поскольку доказываемый результат очевиден, если оба коэффи- коэффициента при %\ равны нулю. Пусть, например, ацфО. Тогда Ki — a2U К2= — ап A1) дают нетривиальное решение. Вместе с тем это решение удовлетворяет и остальным урав- уравнениям из (9), поскольку по предположению все определители второго порядка равны нулю. Отметим одно интересное обстоятельство: доказательство первого утверждения применительно к линейной системе с Nx2- матрицей опиралось на второе утверждение теоремы примени- применительно к линейной системе с 2хЛ?-матрицей. Мы столь детально разобрали этот простой случай, поскольку точно такие же рас- рассуждения проходят и в общем случае. Докажем теперь общий результат с помощью индукции по М. Пусть мы имеем М уравнений N Sa/yjc; = O, t=l, 2, ..., М, A2) причем N~>M. Попытаемся найти нетривиальное решение этой системы уравнений, разрешив ее относительно М переменных Хи Это можно сделать, если хотя бы один из определителей поряд- порядка М матрицы Hflijil отличен от нуля. Предположим, однако, что все определители порядка М рав- равны нулю. Тогда можно найти набор таких чисел у\, г/2,. ¦ • , Ум> из которых хотя бы одно не равно нулю, что равенство У\ у S a ijXjJ + у2 у S ayXjj + ... + ум ^2 aMjx}j = 0 A3) S ijjJ у2 у S
348 ЛИНЕПНЫЕ УРАВНЕНИЯ И РАНГ [П. А выполняется тождественно по xt. Предположим, что мы уже до- доказали существование таких чисел, и пусть (это не умаляет общ- общности) угФО. Тогда если удовлетворяются уравнения N 2агЛ=0, ? = 2, 3, .... М, A4) то удовлетворяется и уравнение 2#i;-#;- = 0. Мы видим, что в этом случае задача для М уравнений сводится к задаче для М — 1 уравнений. Остается, таким образом, только доказать, что при равенстве нулю всех определителей порядка М имеет место тождество A3), которое в свою очередь эквивалентно следующей системе уравнений: ... +умат = О, 2 + у2а22 + ••¦ +Умам2 =0, Система A5) принадлежит к типу систем, фигурирующих во втором утверждении доказываемой теоремы. Для нахождения ее нетривиального решения применим тот же несложный прием, которым мы пользовались выше. Рассмотрим первые М уравнений. Положим у\ равным алге- алгебраическому дополнению элемента ац,у2 — алгебраическому до- дополнению элемента а2\ и т. д. Так выбранные значения г/ь г/2,... . . . , ум должны удовлетворять и остальным уравнениям, по- поскольку по предположению все определители порядка М равны нулю. Таким образом, если хотя бы одно из алгебраических до- дополнений Ац отлично от нуля, то мы получаем искомое нетри- нетривиальное решение. Если же все Аи равны нулю, то мы точно так же рассмотрим другой набор из М уравнений. Эта процедура может не привести к результату только в том случае, когда все определители по- порядка М — 1, получаемые из матрицы ||a,-j|] вычеркиванием од- одного столбца и N — М+1 строк, равны нулю. В последнем случае мы можем положить ум = 0 и получить нетривиальный набор значений г/ь у2,. .. , г/м-ь Действительно, получающаяся система принадлежит к типу, описанному во вто- втором утверждении теоремы, с тем лишь отличием, что М заме- заменяется на М— 1. Следовательно, в силу индуктивного предполо- предположения существует нетривиальное решение этих уравнений. Теорема доказана.
§8] ЗАКОН ИНЕРЦИИ (ЯКОБИ — СИЛЬВЕСТРА) 349 § 6. Ранг. Из доказательства предыдущей теоремы видно, ка- какую важную роль играют отличные от нуля определители наи- наивысшего порядка, скажем г, получаемые из А/'Х-М-матрицы А = \\ац\\ вычеркиванием N — г столбцов и М — г строк. Число г называется рангом матрицы А. Применительно к квадратным матрицам наиболее важный в этом плане результат содержится в теореме 2. Теорема 2. Если матрица Т невырожденная, то ранг ма- матрицы ТА равен рангу матрицы А. Доказательство. Если ранг матрицы А равен г, то мы можем представить N — г ее столбцов в виде линейных комбина- комбинаций г линейно независимых столбцов этой матрицы. Обозначим эти г линейно независимых столбцов а1, а2,..., а7' и запишем матрицу А в виде А = {аха2 ... аг (спа1 + с12а2 + ... + сиаг) ... ... (сц-г.1*1+ ••• +cN-,,rar)). Если обозначить строки матрицы Т через Р, t2, ..., tN произведение можно записать в виде (t\ al)(t\ a2) ... (t\ a')[cn(t\ a1) + + c12(t\ a2)+ ... +clr(t\ а')] •• (t2, al)(t2, a2) ... (t2, a')[cn(t\ a1) + + cl2(t\ a2)+ ... +clr{t\ a')] •• A) то B) Следовательно, ранг матрицы В самое большее равен г. Но поскольку А = Т~1В, то если ранг В меньше, чем г, ранг матри- матрицы А также меньше, чем г, и мы приходим к противоречию. Упражнения 1. Какова связь между рангом матрицы А и числом нулевых характе- характеристических чисел? 2. Доказать инвариантность ранга с помощью дифференциального урав- уравнения dx/dt = Ax. 3. Ранг вещественной симметрической матрицы А — XJ равен N — k, где k — кратность собственного значения Xt. § 7. Ранг квадратичной формы. Ранг квадратичной формы (я, Ах) по определению равен рангу матрицы А. Таким образом, ранг (х, Ах) сохраняется при невырожденных преобразованиях х = Ту. § 8. Закон инерции (Якоби — Сильвестра). Если квадратичная форма (х,Ах), где матрица А действительная, заменой перемен- переменных х — Ту с невырожденной и действительной матрицей Т
350 ЛИНЕЙНЫЕ УРАВНЕНИЯ И РАНГ [П. А приводится к сумме г квадратов: (х, Ах) = S Ъгу1 A) где все bi отличны от нуля, то ранг А, очевидно, равен г. В дополнение к этому имеет место следующая Теорема 3. Если действительная квадратичная форма (х, Ах) ранга г парой невырожденных преобразований х=Ту и x = Sz приводится к сумме г квадратов вида (х, Ах) = Ьху\ + Ь2у\ + ... + Ъгу) = с,г\ + c2z\ + ... + cz\, B) то число положительных коэффициентов ?>; равно числу положи- положительных коэффициентов с,-. § 9. Сигнатура. Пусть р{А) и п(А) представляют собой соот- соответственно число положительных и отрицательных квадратов в представлении формы (х, Ах). Разность s(A) между числом по- положительных и отрицательных квадратов s(A)=p(A) — п(А) на- называется сигнатурой формы (я, Ах). Из предыдущего следует, что s(A)=s(TAT'), A) если матрица Т невырожденная. Упражнение 1. Показать, что r(AB)+r(BC)^r(B)+r(ABC) всякий раз, когда суще- существует произведение прямоугольных матриц ЛВС. (Фробениус.) Упражнения к приложению А 1. Для любой iVXiV-матрицы Л = ||а;][[ ранга г имеют место соотно- соотношения 1М ll2 1=1 /=I причем неопределенности вида 0/0, если таковые встречаются, следует пола- полагать равными нулю. (Фань Цзы, Гоффман.) В статье Фань Цзы и Гоффмана1) рассматривается задача на- нахождения нижних границ для ранга матрицы А непосредственно по ее эле- элементам а,-,-, а также связь между этой задачей и задачей локализации харак- характеристических чисел. ') К у Fan and A. J. Hoffman, Lower Bounds for the Rank and Location of the Eigenvalues of a Matrix, Contributions to the Solution of Systems of Linear Equations and the Determination of Eigenvalues, Nat. Bur, standards Applied Math., ser. 39, 1954,
БИБЛИОГРАФИЯ И КОММЕНТАРИЙ 351 2. Пусть A = B + iC, где В={А+АI2 и C = ~(A—A)i/2 Тогда если А — эрмитова неотрицательно определенная матрица, то ранг матрицы В не меньше ранга матрицы С. (Броудер — Смит.) 3. Если матрица А эрмитова и неотрицательно определенная, то ранг матрицы В не меньше ранга матрицы А. (Броудер — Смит.) Библиография и комментарий Блестящее изложение многих увлекательных вопросов, возни- возникающих в такой на первый взгляд «исчерпанной» задаче, как решение линейных систем, имеется в статье Форсайт (G. Е. Forsythe), Solving Linear Equations Can Be Interesting, Bull. Amer. Math. Soc. 59 A953), 299—329.*) См. также интересную статью Ланцош (С. Lanczos), Linear Systems in Self-adjoint Form Amer Math. Monthly 65 A958), 665—679. Связь между рангом и топологическими инвариантами рас- рассматривается в работе Бур ген (D. G. Во u r gin), Quadratic Forms, Bull. Amer. Math. Soc. 51 A945), 907—908. Ряд других результатов, связанных с понятием ранга, мо- можно найти в работе Ольденбургер (R. Oldenburger), Expansion of Quadratic Forms, Bull. Amer. Math. Soc. 49 A943), 136—141. Обобщение понятия линейной зависимости читатель найдет в работах Тэтчер (Н. С. Thatcher), Generalization of Concepts Related to Linear Dependence, J. Ind. Appl. Math. 6 A958), 288—300; Уэйплс (G. Whaples), A Note on Degree-я Independence, ibid., 300—301. *) Изложение вопросов, затронутых в этом добавлении, см. в книгах: А. Г. К У р о ш. Курс высшей алгебры, «Наука», 1968; Г. Е. Шилов, Введе- Введение в теорию линейных пространств, Гостехиздат, 1956. (Прим. ред.)
Приложение Б МЕТОД ЭРМИТА Рассмотрим многочлен р(х) с действительными коэффициент тами и попарно различными действительными корнями г\,г2, ... . . ., rN. Наша задача состоит в определении числа корней, боль- больших, чем данное действительное число аь Пусть yt = xl + rix2 + r*x3+ ... +r^xN, A) где Хг — действительные числа, и пусть Q(x) обозначает квадра- квадратичную форму Q (X) = S y\\{ri - a,). B) В силу закона инерции приведение квадратичной формы Q(x) к сумме квадратов любым другим способом с помощью действи- действительного преобразования сохранит число положительных ква- квадратов, которое, очевидно, равно числу действительных корней многочлена р(х), больших, чем а\. Эгот результат на первый взгляд кажется неконструктивным, поскольку коэффициенты формы Q(x) зависят от неизвестных корней многочлена р(х). Заметим, однако, что Q(x) предста- представляет собой рациональную симметрическую функцию корней многочлена и, следовательно, рационально выражается через его коэффициенты. Более интересен случай, когда р(х) имеет комплексные корни. Эрмит рассматривал этот случай следующим образом. Пусть г\ и г2 — комплексно сопряженные корни: ri = p(cos а + г sin а), r2 = p(cos a — i sin а), и пусть y2 = u — iv, C) где и и v — вещественные линейные формы от xt. Пусть далее —=—= г (cosqp + isincp), ——— = г (соэф — isin9). D)
МЕТОД ЭРМИТА 353 Нетрудно проверить, что 2 2 ——+—^— = 2г(мсо5ф/2-0 5тф/2J-2г(и5тф/2 + 1>со5ф/2J. E) Г\ — а\ г2 — а.\ Теперь сформулируем результат Эрмита. Теорема. Пусть многочлен р(х) с действительными коэф- коэффициентами имеет только простые корни. Пусть форма Q(*)= 2^/^-a,) F) приведена к сумме квадратов с помощью действительной невы- невырожденной подстановки. Тогда число положительных квадратов формы равно числу пар невещественных корней уравнения р(х) = 0 плюс число действительных корней, больших а\. Некоторые относящиеся сюда результаты Сильвестра рассма- рассматриваются в книге по теории уравнений Бернсайда и Пэнтона, на которую мы уже ссылались. Здесь мы следовали их изложе- изложению *). Обобщение метода Эрмита было дано Гурвицем1) в его классической работе, где даны необходимые и достаточные усло- условия отрицательности действительных частей корней многочлена. Другие методы и ссылки на литературу читатель найдет в работе Беллмана, Гликсберга и Гросса2). В этом приложении мы хотели подчеркнуть эффективность квадратичных форм как «орудия счета». Другую иллюстрацию этой роли квадратичных форм читатель найдет в работе Эрми- Эрмита3) по приведению квадратичных форм. *) См. также Ф. Г. Гантмахер, Теория матриц, «Наука», 1967, 493. (Прим. ред.) ') А. Н и г w i t z, Ober die Bedingungen unter welchen eine Gleichungen nur Wurzeln mit negativen reelen Teilen besitzt, Math. Ann. 46 A895) (Werke, vol. 2, 533—545). 2) R. Bellman, I. Glicksberg and O. Gross, Some Aspects of the Mathematical Theory of Control Processes, The RAND Corporation, Rept. R-313, January 16, 1958. 3) С Hermite, Oeuvres, 284—287; 396—414; J. Crelle, Bd. LII, 1856, 39—51S
Приложение В МОМЕНТЫ И КВАДРАТИЧНЫЕ ФОРМЫ § 1. Введение. Мы будем предполагать, что читатель знаком с понятием интеграла Римана — Стилтьеса. Кроме того, чтобы завершить оба приводимые ниже доказательства, нам придется воспользоваться теоремой, прнпгдлежащей Хелли. § 2. Обозначения. Рассмотрим последовательность величин {ah}, k = 0, 1,..., определенных интегралами it), где g(t)— монотонно возрастающая на отрезке [0,1] функция, причем g{\)=\, a g@)=0. Эти величины называются момента- моментами весовой функции g (или функции распределения). Стилтьес указал на то, что квадратичные формы .V \ / N \2 Q.vW= 2 ашхкх,= J ($]**П dSif) B) к,1=0 о Vfc=j / с необходимостью являются неотрицательно определенными. Бу- Будем называть матрицы AN = \\ak+l\\, k, 1 = 0, 1, ..., N, C) ганкелевыми матрицами. Критерии, выведенные нами в § 2 гл. 5, дают в этом случае ряд интересных неравенств вида jtkdg jtwdg о о \tMdg jtk+2tdg D)
<§ 3] МЕТОД ФИШЕРА 355 причем если g имеет достаточно много точек роста, то справед- справедливо строгое неравенство. Если вместо моментов A) мы рассмотрим тригонометриче- тригонометрические моменты п O2nikt rtrr h П -t- 1 -t- 9 1?Л Ck — е ag, к — u,nii,ni^,..., yo) о то полученная по аналогии квадратичная форма dg, F) называется тёплицевой формой, а соответствующая матрица — тёплицевой матрицей. Очевидно, что необходимым условием того, что последова- последовательность {cfe} задается формулами E) при некоторой монотонно возрастающей функции g{t), удовлетворяющей условиям gO) — = 1, <?@)=0, состоит в том, что матрица С =||оц|| G) является неотрицательно определенной эрмитовой матрицей. Воз- Возникает вопрос: является ли это условие достаточным*). Как мы сейчас увидим, в одном случае это так, в другом — нет. § 3. Метод Фишера. Рассмотрим бесконечную последователь- последовательность действительных чисел {ап}, удовлетворяющую следующему условию: квадратичная форма N Qn(x)= 2 ai+jXiXj A) i, 1=0 положительно определена для каждого N. Теорема 1. Если 2N+\ действительных чисел ао,а\,... ..., a2N таковы, что форма QN(x) положительно определена, то эти числа можно представить в виде ak = bA+bA+ ¦¦¦ +bNrkN> 6 = 0,1 2N, B) где Ьг > 0, а числа г* действительные и различные. Доказательство. Рассмотрим производную квадратич- квадратичную форму Pn(x)=* 2 aM+JXtXj. C) *) По поводу проблемы моментов см. Н. И. А х и е з е р, Классическая про- проблема моментов, Физматгиз, 1961. (Прим. ред.) 23* Р- Беллман
356 МОМЕНТЫ И КВАДРАТИЧНЫЕ ФОРМЫ [П. В Поскольку по предположению QN(x) положительно определена^ мы можем одновременно привести формы PN(x) и QN(x) к виду Qn (•*) = 2 (mjOxo + ... + mjNxNJ, Г D) r (mx + + m,N . . . + m,NxNf, j J l=o где Г] — действительные числа. Из представления QN(x) имеем ai+(j+i) = mOimo, J+i + ... + mNimNt j+l, E) t = 0, 1, .... N, } = 0, 1, ..., N-l. С другой стороны, из представления PN(x) получаем aUi+f = rQmoimOj+ ... +rNmNimNj. F> Сравнивая E) и F), получаем систему линейных однородных уравнений mOi (mOt j+i - romOj) + ... + mNi (mNt j+x - rNmNt j) = 0, G> i = 0, I, ..., N. Поскольку определитель \тц\ отличен от нуля, из G) получаем соотношения ink, j+i = rkmkt j, k = 0, ..., N, (8) или mk,, = r!kmk,o- (9> Следовательно, форму Qv(-?) можно записать в виде QN W = S ml (x0 + r;.x, + ... + г«х„у, A0) откуда следует искомое представление B). Поскольку QN(x) по- положительно определена, то Г{фг$ при 1ф\ и Ш/0>0. § 4. Моментное представление. Используя теорему 1, легко до- доказать теорему 2. Теорема 2. Если действительная последовательность {ап} удовлетворяет условиям: N форма 2 al+:XiXj положительно определена при всех N, Aа) t.l=o N форма 2 {ai+j±ai+,+\)XiX: положительно i,l=0 определена при всех N, A6)
§ 5] РЕЗУЛЬТАТ ГЕРГЛОТЦА 357 то эта последовательность является моментной, т. е. существует такая ограниченная монотонно возрастающая функция g(t)r определенная на отрезке [—1, 1], что > dg (t). B) Доказательство. Из представления, полученного в тео- теореме 1, и условия A6) следует, что 1г,-|-<Л, г = 0,1, ..., N'*)~ Следовательно, мы можем найти монотонно возрастающую функ- функцию gN(t), ограниченную числом а0 и такую, что п = 0, 1, .... N. C) -1 Чтобы завершить доказательство, мы воспользуемся теоремой Хелли, которая гарантирует нам существование монотонно воз- возрастающей функции g(t), ограниченной числом по и обладающей тем свойством, что lim \tadgM(t)= \tndg{t), D) — 1 — I где М пробегает бесконечную последовательность значений. При этом при всех п выполняются равенства B). § 5. Результат Герглотца. С помощью таких же рассуждений можно доказать следующий результат, установленный Гер- глотцем. Теорема 3. Для того чтобы последовательность комплекс- комплексных чисел {ап}, л = 0, ± 1,. . . , а-п — 'с.п, удовлетворяла условию N N Л=1 А=1 при всех комплексных {хп} и всех N, необходимо и достаточно существование действительной неубывающей функции и(у) огра- ограниченной вариации такой, что ап= J einv du (у). <2) о Метод Фишера читатель найдет в его статье'). *) Имеем uh>uk+\ в силу положительной определенности формы A6). (Прим. ред.) ') Е Fischer, Ober die Caratheodorysche Problem, Potenzreinen mit positiven reellen Teil betreffend, Rend. circ. mat. Palermo 32 A911), 240—256.
358 МОМЕНТЫ И КВАДРАТИЧНЫЕ ФОРМЫ [П. В Библиография и комментарий JV Квадратичные формы типа 2 a^jXiXj называют еще /.-фор- /.-формами, подчеркивая тем самым связь между этими формами и рядами Лорана аналитических функций. Эти формы играют чрезвычайно важную роль в а/илизе. См., например, следующие статьи: Сас (О. Szasz), Ober harmonische Funktionen und L-formen, Math. 1. 1 A918), 149—162; Cac (O. Szasz), Ober Potenzreihen und Bilinearformen, Math. Z. 4 A919), 163—176; Фейер (L. Fejer), Cber trigonometrische Polynome, J. Math. 146 A915), 53—82; Шур (I. Schur), Bemerkungen zur Theorie der Beschrankten Bilinear- Bilinearformen mit unendlichen vielen Verandlichen, J. Math. 140 A911), 1—28; Каратеодори (A. Caratheodory), Cber den Zusammenhang der Extremen ..., Rend. circ. mat. Palermo 32 A911), 1—22. Дальнейшие ссылки можно найти в монографии Беккенбах и Беллман (Е. F. Beckenbach and R. Bellman), Inequalities, Ergeb. Math., 1960 [русский перевод: Неравенства, «Мир», 1965], а также в обширной библиографии к статье Кац, Мёр док и Сегё (М. Кае, L. Murdock and Q. Szego), On the Eigenvalues of Certain Hermitian Forms, J. Rat. Mech. Analysis 2 A953), 767-800.
ДОПОЛНИТЕЛЬНАЯ ЛИТЕРАТУРА ПО ТЕОРИИ МАТРИЦ И ЕЕ ПРИЛОЖЕНИЯМ К гл. 2 По поводу спектра матрицы, преобразованной по Гауссу, см_ Д. М. К о т е л я н с к и й, О влиянии преобразования Гаусса на спектры матриц, УМН 10, № 1 A955), 117—121. К гл. 4 Систематическому изложению современной теории возмуще- возмущений операторов посвящена монография К а то (Т. Kato), Perturbation theory for linear operators, Springer-Ver- lag, 1966 (готовится русский перевод). См. также Ф. Рисе и Б. Секефальви-Надь, Лекции по функциональному анализу, ИЛ, 1954, гл. IX, 388—401. Исследование базиса собственных векторов эрмитовой мат- матрицы при возмущении проведено в работе Девис (Ch. Davis), The Rotation of Eigenvectors by a Perturbation, Math. Analysis and Applications 6, № 2 A963); продолжение этой работы там же 11, № 1—3 A965). Теория возмущений неэрмитовых матриц и операторов раз- развита в работе М. И. В и ш и к, Л. А. Л ю с т е р н и к, Решение некоторых задач о возму- возмущении в случае матриц и самосопряженных и несамосопряженных дифферен- дифференциальных уравнений, УМН 15, № 3 (93) A960), 3—80. См. также Ю. Л. Далецкий, Дифференцирование функций неэрмитовых матриц, зависящих от параметра, Изв. вузов, Матем. № 2 A962), 52—64; В. Б. Л и д с к и й, К теории возмущений несамосопряженных операторов, Журнал вычислительной математики и математической физики 6, № 1 A966), 52—60; Баумгертель (Н. Baumgartel), Analytische Stoning isolierter Eingenwerte endlicher algebraischer Vielfachkeit von nichtselbstadjungiertert, Operatoren, Monatsber. Dtsch. Akad. Wiss. Berlin 10, № 4—5 A968), 250—258.
380 ДОПОЛНИТЕЛЬНАЯ ЛИТЕРАТУРА К гл. 6 Локализационные теоремы Гершгорина были обобщены и до- дополнены в работе Фидлер и Птак (М. Fiedler, V. Р t a k), Some inequalities for the Spectrum of a matrix, Matem.-fyz. casopis, SAV 10A960), 148—166. Проблеме локализации спектра нормальных матриц посвя- посвящены работы Виландт (Н. Wielandt), (a) Ein Einschliessungssatz fur charakte- ristischen Wurzeln normaler Matrizen, Arch. Math. 1 A949), 348—352; F) Die Einschliessung von Eigenwerten normaier Matrizen Math. Ann. 121 A949), 234—241. Проблеме обращения матриц посвящено большое число ра- работ. Отметим следующие: Д. К. Фаддеев, Об обусловленности матриц, Тр. Матем. ин-та АН СССР им. В. А. Стеклова, UU, изд. АН СССР, 1959, 387—391; М. Р. Ш у р а - Б у р а, Оценка погрешностей при вычислении обратной матрицы высокого порядка, УМН 6, № 4 A951), 121 —150; Фидлер и Птак (М. Fiedler, V. Ptak), Ober die Konvergenz des verallgemeinerten Seidelschen Verfahrens zur Losung von Systemen linearer Gleichungen, Math. Nachr. 15 A956), 31—38; П. А. Л а в у т, Расположение собственных чисел преобразований Зейделя для систем нормальных уравнений, УМН 7, № 6 A952), 197—202. К гл. 7 М. Г. К р е й н, Об угловой локализации спектра мультипликативного ин- интеграла в гильбертовом пространстве, Функциональный анализ и его прило- приложения 3, № 1 A969), 89—90; С. Ю. Р о т ф е л ь д, Замечания о сингулярных числах суммы вполне не- непрерывных операторов, Функциональный анализ и его приложения 1, № 3 A967), 95—96; Гулд (S. Gould), Variational methods for eigenvalue problems, Oxford University Press, 1966 (готовится русский перевод); Стенджер (W. S t e n g e r), On Poincares bounds for higher eigenvalues, Bull. Amer. Math. Soc. 72, № 4 A966), 715—718; А. А. Нудельман и П. А. Шварцман, О спектре произведения унитарных матриц, УМН 13, № 6 A958), 111 — 117; Амир-Моэз. Хорн (АИ R. A m i г - М о е z, A. Horn), Singular va- values of a matrix, Amer. Math. Monthly 65, № 10 A958), 742—748; Амир-Моэз (АН R. Amir-Moez), Some Equalities in a Unitary Space Leading to Equalities Concerning Singular Values of Sets of Matrices, Math. Ann. 135, № 5 A958), 388—390; Хорн (A. Horn), (a) On the eigenvalues of a matrix with prescriebed -singular values, Proc. Amer. Math. Soc. 5 A954); F) Eigenvalues of sums of Hermitian matrices, Pacific J. Math. 12, № 1 A962), 225—241; Хорн и Стейнберг (A. Horn, R. Steinberg), Eigenvalues of the unitary part of a matrix, Pacific J. Math. 9 A959), 541—550.
ДОПОЛНИТЕЛЬНАЯ ЛИТЕРАТУРА 361 К гл. 10 Исследование свойств /-ортогональных матриц позволило решить проблему устойчивости гамильтоновых систем с перио- периодическими коэффициентами. См. по этому поводу М. Г. К р е й н, Основные положения теории Л-зон устойчивости канони- канонической системы линейных дифференциальных уравнений с периодическими коэффициентами, сб. «Памяти А. А. Андронова», изд. АН СССР, 1955, 414—498; И. М. Гельфанд и В. Б. Лидский, О структуре областей устойчи- устойчивости линейных канонических систем дифференциальных уравнений с перио- периодическими коэффициентами, УМН 10, № 1 F3) A955). См. также статьи: В А. Якубович, Критерий устойчивости для системы двух уравнений канонического вида с периодическими коэффициентами, ДАН СССР 78, № 2 A951), 221—224; М. Г. Крейн, О признаках устойчивой ограниченности решений периоди- периодических канонических систем, Прикладная математика и механика 19, № 6 A955). К гл. 11 Относительно области матриц и операторов см. Гильдебрандт (S. Hildebrandt), Wertebereich eines Operators, Math. Arm. 163, № 3 A966). К гл. 15 Статистические свойства спектра унитарных и эрмитовых матриц обсуждаются в книге Дайсон (F. Dyson), Статистическая теория энергетических уровней сложных систем, ИЛ, 1963. К гл. 16 По поводу спектра матриц с положительными элементами см. Бауэр (F.Bauer), Numerische math. 5 A963), 73—87; Брауэр (A. Brauer), A new proof on the theorems of Perron and Frobenius on non-negativ matrices, Duke Math. J. 24 A957), 367—378; Хорн (A. Horn), Doubly stochastic matrices and the diagonal of rotation matrix, Amer. Js Math. 76, № 3 A954), 620—630.
ИМЕННОЙ УКАЗАТЕЛЬ .Адамар (J. Hadamard) 53, 159, 160, 170, 337 Албсрт (A. A. Albert) 54 Александров П. С. 340 Амир-Моэз (АИ R. Amir-Moez) 153, 360 Андерсон (Т. W. Andeison) 138, 315 Анке (К. Anke) 286, 289 Антосевнч (Н, Antosiewicz) 289 Арли (N. Arley) 215, 310 Ароншайн (N. Aronszain) 153 Аутон (L. Autonne) 94 Афрамэт (S. N. Afriat) 116, 134, 274 Бакстер (G. Baxter) 257 Баррет (J. H. Barret) 214, 258 Бартлетт (М. S. Bartlett) 310 Басе (R. W. Bass) 280, 290 Бассет (I. M. Basset) 98 Баумгертель (Н. Baumgartel) 359 Бауэр (F. L. Bauer) 257, 361 Бейкер (Н. F. Baker) 19, 214 Бейтмен (Н. Bateman) 153 Беккенбах (Е. F, Beckenbach) 169, 170, 216, 358 Бекман (М. J. Beckman) 308 Беллман (R. Bellman) 9, 53, 138, 139, 154, 168—171, 191, 192, 214—217, 257, 276, 289, 291, 310, 311, 315, 316, 336, 339, 341, 342, 353, 358 Бендат (J. Bendat) 139 Бендиксои (I. Bendixon) 66, 254 Бергстром (Н. Bergstrom) 160, 170, 171 Берингтон (R. S. Buringlon) 338 Берлин (Т. Н Berlin) 277 Бермен (J. P. Burman) 53 Бернсайд (W. S. Burnside) 116, 131, 154, 353 Берчнелл (J. L. Burchnall) 51 Бикли (W. G. Bickley) 153 Бнне (J. Ph. M. Blnet) 271 Бнркгоф (G. A. Birkhoff) 54, 308, 340 Бом (С. Bohm) 190 Боненбласт (Н. Bohnenblust) 336, 339, 341, 342 Борг (G. Borg) 134 Борель (G. Borel) 19, 317 Борксеннус (A. Borchsemus) 215 Бохер (М. Bocher) 107, 270, 277 Бохнер (S. Bochner) 138, 343 Браун (R. D. Brown) 98 Браун (Е Т. Browne) 172 Брауэр (A. Brauer) 66, 115, 172, 337,341,361 Брок (Р Brock) 20, 288 Броудер (A. Broeder) 351 Букнер (Н. Buckner) 289 Бурген (D. G. Bourgin) 351 Важевски (S. Wazewski) 112 Вайнберг (L. Weinberg) 19, 138, 218, 337, 343 Вайнбергер (A. F. Weinberger) 256 Вайнштейн (A. Weinstein) 152 Вайс (G. H. Weiss) 315 Вайценбук (R. Weitzenbuck) 272 Ван Данциг (D. Van Dantzig) 172 Ван дер Варден (В. L. van der Waerden) 258, 290 Вандермонд (А. Т. Vandermonde) 222 Варга (R. S. Varga) 340 Веддерберн (J. H. M. Wedderburn) 255, 257, 277 Вейль (Н. Weyl) 131, 151, 277 Вествик (R. Westwick) 171, 172, 277 Виванти (G. VIvanti) 341 Вигман (N. A. Wiegman) 113, 249, 250, 259 Вигнер (Е. P. Wigner) 19, 139 3!5 Внландт (Н. Wielandt) 153 250 254 256, 341, 360 Вильяме (J. D. Williams) 342 Вильямсон (J. D. W. Williamson) 94, 170, 274 Винер (N. Wiener) 172, 190, 191, 257, 259 Виноград Р. Э. 251 Внссер (С. Visser) 213 Вишик М. И. 359 Вольтера (V. Volterra) 207 Восс (К. Voss) 129 Вронский (Н. Wronski) 251, 252 Вудбери (М. A. Woodbury) 340, 342 Гадерли (К. G. Guderley) 213 Гамильтон (W. Hamilton) 81. 132, 225, 237, 255, 258 Гантмахер Ф. Р. 9, 54, 94, 134—136, 153, 217, 271, 272, 308. 311, 343, 353 Гаусс (К. F. Gauss) 51 Гельфанд И. М. 134, 257, 361 Герглотц (С. Herglotz) 357 Геронимус Я. Л. 92 Герц (С S. Herz) 138 Гершгорнн С. 136, 137 Герштейн (I. N. Herstein) 104, 116, 338, 341 Гёльдер (О. Holder) 155, 156, 158 Гивенс (Н. Giwens) 290 Гильберт (D. Hilbert) 67, 115, 152 Гильдебрандт (S. Hildebrandt) 361 Гирш (К. A. Hirsch) 254, 257 Гиршнк (М. 4. Girschick) 138 Гликсберг (I. GHcksberg) 154, 170, 216, 353 Голдберг (К. Goldberg) 214 Голдстайн (Н. Goldstine) 136, 215 Гоффман (A. J. Hoffman) 172, 216, 254, 350 Гочи (С. Gautschi) 167 Грам (I. Gram) 68, 70, 72, 92, 155, 163, 186, 271 Гребнер (W. Groebner) 98 Гренбил (F. A. Graybill) 95 Гренандер (V. Grenander) 115, 275
ИМЕННОЙ УКАЗАТЕЛЬ 363 Гринспен (D. Greenspan) 136 Гройб (W. Greub) 168 Гросс (О. G'-oss) 154, 170, 216, 353 Грэйвс (L. M. Graves) 153 Гуд И. (I. J. Good) 116 Гуд Р (R. A. Good) 342 Гулд (S. Gould) 360 Гунтхард (Н. Gunthard) 217 Гурвиц (Д. Hurwitz) 52, 283, 286, 290, 353 Гэддам (J. w. Gaddum) 116 Дайне (L. L. Dines) 116 Дайсон (F. J. Dyson) 315, 361 Далецкий Ю. Л. 359 Данскнн (J. M. Danskin) 341 Даффин (R. J. DufTin) 139, 154, 217 Двайр (P. S. Dwyer) 134 Дсбре (G. Debreii) 341 Де-Брсйн (N. G. de Bruin) 172, 251, 277 Девнс (Ch. Davis) 359 Джекобсон (N. Jacobson) 98 Диас (J. В. Diaz) 153 Дилнберто (S. Diliberto) 251, 288 Димер (W. L. Deemer) 53 Дин (Р. Dean) 191 Добш (R. Dobsch) 138 Долф (С L, Dolph) 97, 154, 192 Дрезин (М P. Drazin) 98 Дункан (W J. Duncan) 259 Дынкин Е. Б. 214, 310 Дюпарк (L. Duparc) 93 Евклид (Euclid) Жордан (С. Jordan) 227, 228, 257, 280, 307 Зигель (С. L. Siegel) 130, 137, 171 Ингам (А. Е. Ingham) 130. 137, 171, 315 Истерфилд (Т. Е. Easterfield) 216 Калаба (R. Kalaba) 53. 216. 316, 342 Калман (R E. Kalman) 192 Каратеодори (A. Caratheodory) 358 Каолин (S. Karlin) 191, 216, 277, 309, 311, 341. 343 Карпичевич Ф. И. 343 Картан (Е. Cartan) 274 Касорати (F. Casorati) 252 Каспари (F. Caspary) 49, 137 Като (Т. Kato) 90. 153, 253. 254, 359 Кац (М. К.чс) 275, 277. 310, 358 Келлер Г. (Н. В. Keller) 214 Келлеп Дж. (J. В. Keller) 214 Кемпбелл (J. E. Campbell) 19 Кендалл (М. G. Kendall) 316 Кернер (Е. Н. Kerner) 315 Кепке (R. W. Koepke) 192 Клейн (F. Klein) 270, 277 Клемент (A. Clement) 121 Ко (Chao Ко) 255. 258 Коддннгтон (Е. A. Coddington) 289 Коллар (A. R. Collar) 259 Коллатц (L. Collatz) 154, 341 Колмогоров А. Н. 94, 190 Конти (R. Conti) 258 Котеляиский Д. М. 51, 359 Кохер (М. Koecher) 343 Кпя'И <A,J- СаиспУ> 37, 155. 164, 168, 27! IcSavrV v Cramer> 57. 69, 81, 345 Краус (F. Kraus) 139 Кребилл (Г^ М. Krabill) 252 Крейг (Н. Craig) 130 Крзбй1Н М' Г' 98' 134' 217> зи- 339' 343- 36Э- Кремер (Н. Cremer) 290 Купманс (Т. С. Koopmans) 308 339 342 Курант (R. Courant) 140, 143 152 155 Курош А. Г. 97, 258 Кэлн (A. Cayley) 54. 81, 109, 120, 132 135 136, 225, 237, 255. 258 Кэррол (L. Carrol) 18 Лавут П. А. 360 Лагерр (Е. Lagerr) 71 Лагранж (J. L. Lagrange) 25, 30, 74, 162. 163, 204 Лаке М. (М. Lax) 98 Лаке П. (P. D. Lax) 256 Ланцош (С. Lanczos) 351 Лаплас (P. S. Laplace) 245—248 Лаппо-Данилевский И. А. 217, 274. 288 Ларчер (Н. Larcher) 98 Лауденслагер (D. Lowdenslager) 172, 259< Лебег (Н. Lebesgue) 216 Леверье (P. Leverrier) 129 Леви (Н. Levy) 137 Левин (J. .1. Levin) 214 Левннсон (N. Levinson) 190. 289 Левитан Б. М. 134 Ледерман (W. Lederman) 307, 310. 337 Лежандр (А. М. Legendre) 71, 150 ЛеОн (А М. Lane) 139 Леккеркернер (A. Lekkerkerner) 93 Ломан (S. Lehman) 192, 216 Ленг (С. Leng) 94 Леонтьев (W. W. Leontieff) 317. 329 Лефщец (S. Lefschetz) 257. 258 Лёвнер (С. Loevner) 19. П8. 139 Ли Г. (Н С. Lee) 96, 214, 255, 258 Ли С. (S. Li) 214 Лидский В Б. 359. 361 Литлпуд Д (D E Llttlewwod) 277 Литлвуд Дж. (J. E Littlewood) 97. 169. 17t Лнувнлль (J. Liouvillt) 98, 149. 176 Лопес (L. Lopes) 171 Лоран (Р. A. Laurent) 131, 358 Лоренц (Н. I. orenz) 95 Лоуэн (А. N. Lowan) 274 Лгомер (G. burner) 217 Лк.!стерннк Л А 359 Ляпунов А, М. 213. 279. 280. 289 Маас (Н. Maass) 138 Marnvc (W. Magnus) 214. 215 Мак-Грегоо (J. L. McGregor) 171, 191, 277, 309. 311. 343 Мак-Дафф" (С. С. McDuffee) 52, 54, 134. 258, 276. 277 Маклафлин (.1. E. McLaughlin) 97, 192 Маклейн (S. Maclane) 54 Макфсйл (М, S Macphail) 134 Малликен (Т. MulMken) 341 Мальцев А. И. 257 Марадудин (A. Maradudin) 315 Марков А. А. 16 Маркс (I. Marx) 97, 192 Маркус А. С 153 Маркус M. (M. D. Marcus) 154, 168, 171, 172, 277
364 ИМЕННОЙ УКАЗАТЕЛЬ Марсалья (G. Marsaglia) 95 Масаии (P. Masani) 172, 259 Матье (Е. Mathieu) 238 Мердок (W. L. Murdock) 275, 358 Мецлер (О. Metzler) 290, 335 Минковский (A. Minkowski) 164, 329, 337 Мирскяй (L. Mirsky) 33, 67, 96, 161, 172, 253, 254, 256, 308 Мнтчелл (J. Mitchell) 251 Мойлс (В. N. Moyls) 171, 172, 277 Монтел (P. Montel) 252 Монтролл (Е. Montroll) 310 Моргенштерн (О. Morgenstern) 339, 342 Морс (М. Morse) 33 Мотард (Т. Motard) 137 Моцкин (Т. S. Motzkin) 129, 252 Муавр (A. de Moivre) 114 Муд (А. М. Mood) 316 Мур (Е. Н. Мооге) 135 Муриаган (F. D. Murnaghan) 94, 276 Найквнст (Н. Nyquist) 315 Намбу (Y. Nambu) 217 Нанда (D. N. Nanda) 316 Нейман, фон (J. von Neumann) 19, 136, 215, 317, 333, 342 Нерлав (М. Nerlove) 290, 339 Нобл (S. В. Noble) 340 Нуделыман А. А. 360 Ньюмен (N. H. A. Newman) 255 Олкии (I. Olkin) 20, 53, 54, 132, 138 Ольденбургер (R. Oldenburger) 137, 351 Онзагер (L. Onsager) 277 Оппенгейм {A. Oppenheim) 169 Оруэл (G. Orwell) 16 Осбори (Н. Osborn) 152 Островский (A. Ostrowski) 55, 115, 171, 179, 215, 251, 253, 337, 338 Паркер (W. V. Parker) 66, 115, 133, 172, 254 Пародн (М. Parodi) 94, 154 Пенроуз (R. Penrose) 135 Перемаис (L. Peremans) 93 Перрон (О. Perron) 16. 251, 257, 291, 317, 319, 323, 325, 331, 335, 339, 340, 341 Петровский И. Г. 96 Плакетт (R. L. Plackett) 53 Плюкер (J. Plucker) 277 Пойа (G. Polya) 97, 153, 169, 171, 208, 216, 252, 343 Поттер (Н. S. A. Potter) 129, 138 Примас (Н. Primas) 217 Принсгейм (A. Pringsheim) 341 Прюфер (A. Prufer) 258 Птак (V. Ptak) 360 Пуанкаре (Н. Poincare) 19, 132, 147, 151. 154, 213, 279, 289, 291, 299, 310 Путнам (С. R. Putnam) 122, 235, 254, 341 Пэли (R. Е. А. С. Paley) 53 Пэнтон (A. W. Panton) 116, 131, 154, 353 Радон (J. Radon) 52 Райзер (Н. J. Ryser) 272, 277 Райнболт (W. Rheinboldt) 168 Райнхарт (R. F. Rinehart) 134 Раш (G. Rasch) 138, 215 Редхеффер (R. Redheffer) 218 Резерфорд (D. E. Rutherford) 253, 272, 276 Рейд (W. Т. Reid) 218, 258 Релей (J. W. Strutt Lord Rayleigh) 140, 141 152 Риккати (J. F. Riccati) 218, 249 Рнман (В. Riemann) 200 337 354 Рнсс (F. Riesz) 151, 359 Рихтер (Н. Richter) 134 Ричардсон (J. M. Richardson) 192 Робертсои (Н. Robertson) 167 Робинсон Д. (D. W. Robinson) 133 Робинсон P. (R. M. Robinson) 50 Розенблюм (М. Rosenbloom) 217, 276, 291 Рой (S. N. Roy) 316 Ройтер (G. E. Reuter) 307, 310 Рот (W. E. Roth) 135 Ротфельд С. Ю. 360 Рудин (W. Rudin) 133 Рутмаи М. А. 239 Саймон (Н. A. Simon) 192 Самуэлс (J. С. Samuels) 291 Сараки (P. Szaraki) 112 Сас (О. Szasz) 358 Сегё (G. Szego) 92, 115, 252, 275, 358 Сеймелсон (Н. Samelson) 341 Секефальви-Надь (В. Szekefalvi-Nagy) 151, 359 Селье (С. J. Seelye) 115 Сефл (О. Set!) 291 Сильвестр (J. J. Sylvester) 99, 115, 129, 131, 135. 249, 349, 353 Сннг (J. L. Synge) 96 Ситгривс (R. Sitgreaves) 138 Слепяи (P. Slepian) 138, 218, 337, 343 Смит (О. Smith) 351 Сноу (R. Snow) 340, 341 Сомннский И. С. 149 Старжинский В. М. 258 Стейн (P. Stein) 251 Стейнберг (R. Steinberg) 360 Стенджер (W. Stenger) 360 Стенцель (Н. Stenzel) 98 Стнлтьес (Т. J. Stieltijes) 114, 188, 192, 354 Сэдл (A. Saddle) 192 Сю (P. L, Hsu) 316 Табер (О. Taber) 251 Та Ли (Та Li) 291 Таусски (О. Tausski) 20. 54, 93, 136, 167, 172, 249, 252—255, 257. 274, 290, 337 Тейлор (В. Taylor) 21, 288 Темпл (G. Temple) 153 Теплиц (О. Toeplitz) T15, 129, 254, 257, 277 Тодд (J. Todd) 93, 253, 274, 290 Томас (R. G. Thomas) 139 Томпсон (R. Thompson) 154 Тройенфельс (P. Treuenfels) 256 Тэтчер (Н С. Thatcher, Jr.) 351 Уидом (Н. Widom) 275 Уилкс (S. S. Wilks) 315 Уинг (G. M. Wing) 342 Уинтнер (A. Wintner) 94, 340, 34Г Уитл (P. Whittle) 131, 168 Ульман (J. L. Ullman) 341 Уонг (Y. К. Wong) 340, 342 Уэйплс (G. W. Whaples) 351 Фаддеев Д. К. 59, 136, 149, 360 Фаддеева В. Н. 59, 136 Фань Цзы (КУ Fan) 20, 93, 153, 155, 160, 161, 167, 169-172, 216, 256, 336,337,341,350
ИМЕННОЙ УКАЗАТЕЛЬ 365 ¦Фаукс (Н. О. Foukes) 54 Фейер (L. Fejer) 132, 137, 358 Фейнман (R. Feynman) 215 •Феллер (W. Feller) 310 Фер (F. Fer) 207, 241 Фидлер (М. Fiedler) 360 Филлипс Г (Н. В. Phillips) 255, 258 Филлипс P. (R. Phillips) 214 Фишер (Е. Fischer) 16, 140, 143, 153, 155, 170, 355, 358 Форсайт A. (A. R. Firsythe) 131 Форсайт Дж. (G. E. Forsythe) 18, 90, 138, 351 Фрайман Г. А. 291 Франк (Е. Frank) 290 Фрезер (R. A. Fraser) 259 Фрейм (J. Frame) 128 Фреймер (М. Freiraer) 192 Фреше (М. Frechet) 310 Фрндман (В. Friedman) 54 Фробениус (G. Frcber.ius) 16, 135, 254, 317, 340, 350 Фурье (J, Fourrier) 51, 275 Фуэтер (R Fueter) 135 Хаар (D. тег Нааг) 217 Хазенбрук (P. Hazenbroeck) 290 Хайнц (Е. Heinz) 276 Халмош (Р, Halmos) 33 Хан (W. Hahn) 269, 276 Харди (G. Н. Hardy) 97, 169, 171 Харрис (Т. Е. Harris) 339, 342 Хартман (P. Hartman) 340 Хяусдорф (F. Hausdorf) 19, 214 Хаусхолдер (A. S. Householder) 132, 215, 257 Хейнсворт (Е, V. Haynsworth) 172, 311, 337, 338 Хелли (Е. Helly) 354. 357 Хелсон (Н. Helson) 172, 259 Хенкок (Н. Hancock) 33 Хестинс (М. R. Hestenes) 135, 258 Хилле (Е. НШе) 214 Холланд (J. Holland) 53 Хопф (Н. Hopf) 257, 340 Хори (,lun-ichi Hori) 315 Хорн (A. Horn) 360, 361 Хотеллинг (Н. Hottelling) 13Э Хуа Ло-Ген (L. К. Ниа) 168, 170 Чен Кво-цаП (Kvo-Tsai Chen) 215 Шварц (Н. R. Schwarz) 155, 287, 290 Шварцман П. А. 360 Швердфегер (Н. Schwerdtfeger) 33, 277 Шекере (G. Szekeres) 251 Шерман (S. Sherman) 139 Шефли (С. Schafli) 50 Шёнберг (F. J. Schoenberg) 133, 191, 343 Шилов Г. Е. 97 Шлезингер (L. Schlesinger) 215 Шмидт (Е. Schmidt) 68, 72, 129, 186 Шнайдер (Н. Schnider) 130 Шннрельман Л. 168 Шода (К. Shoda) 249 Шрайбер (S. Schreiber) 308 Штурм (С. Sturm) 98, 116, 146. 149, 154, 176 287 Шур (I. Schur) 54, 66, 94, 98 116 117, 122 132, 137, 167, 170. 231, 254, 257, 277, 306 358 Шура-Бура М. Р. 360 Эддннгтон (A. Eddin^ton) 255 Эйлер (L. Euler) 27, 219 Энглман (R. Englman) 316 Энтховен (A. S. Enthoven) 290. 335, 339 Эрмнт (С. Hermite) 16, 47, 71, 283, 352, 353 Эрроу (К- J. Arrow) 290. 335, 339 Эфферц (F. H. Effertz) 139, 290, 335 Якоби (К. Jackobi) 50, 52, 115, 131, 177, 179, 181, 184, 191, 202. 250, 317, 349 Якубович В. А. 361
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ Алгебра кронекеровскнх произведений 265 Алгебраическое дополнение 49. 345 Биортогональность 243 Вариации связанные 102 Вектор 34 — вероятностный 294 — инвариантный 44 —, компоненты 35 — неотрицательный 292, 319 — нулевой 36 — положительный 294, 319 —, размерность 35 — собственный 58 столбец 35 — -строка 35 —, умножение на скаляр 36 Векторы, линейная зависимость G8 —, — независимость 68 —, ортогональность 37 — ортонормированные 38 —, ортонормированный набор 70 —, равенство 35 —, сложение 35 Задача наименьшего отклонения 173 Закон инерции Якоби — Сильвестра 349 Коммутатор 50 Корень из матрицы 121 Критерий Гурвнца 283, 286 — Сильвестра 99 Кронекеровская производная от матрицы 275 — сумма 267, 268 Кронекеровский логарифм 267 Линейное программирование 332 Линейные неравенства 331 — однородные уравнения, решение 56 — — —^ — нетривиальное 57 , — тривиальное 344 — уравнения с периодическими коэффи- коэффициентами 238 Математическая экономика 326 Матрица 38 — Адамара 337 — ассоциированная 272 — вещественная 39 — вырожденная (особенная) 118 — ганкелева 354 — двояко стохастическая 308 Матрица, диагонализация 224 — диагональная 41, 62 — доминантная 337 — единичная 39 — идемпотентная 94 —, каноническая форма Жордана 227, 2281 — квадратная 38 — клеточная 111 — комплексно сопряженная 39 — кососимметрическая 64 — косоэрмитова 66 — Лоренца 95 — марковская 294, 301 — Мннковского — Леонтьева 329 — невырожденная (неособенная) 118 — неотрицательная 292 — нормальная 233 — нулевая 39 —, область положительности 342, 343 — обратная 118 — ортогональная 48 — платежей 332 — положительная 292, 318 — положительно опоеделенная 65 — прямоугольная 109 —, размер (порядок) 38 — симметрнзуемая 94 — симметрическая 46 — —, диагоиализация 79 — —, каноническая форма 56 , параметрическое представление эле- элементов 122 , ранг 151 —, след 94, 124 — случайная 312 , среднее значение 313 —, собственное значение 58 — тёплнцева 275. 355 — транспонированная 45, 110 — треугольная 41 —, треугольная форма 231 — унитарная 49 —, условия устойчивости 284, 287 — устойчивая 280 —, характеристическое уравнение 58, 87 —, — число 58 —,. кратное 58, 226, 228 —, — — простое 58 —, элемент 38 — эрмитова 47 — Якоби 52, 133, 177, 179 Матрицы коммутативные 42 —, одновременное приведение к диаго- диагональной форме 81 —, равенство 38 — слабо связанные 183 Метод Ляпунова 280 — ортогонализации Грама — Шмндта 68 — Фишера 355 — Эйлера 219
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ 367 Метод Эрмита 352 Многочлен устойчивый 283 Моменты 356 Неравенство Адамара 159 — Бергстрома 160 — Гёльдера 156 — Коши — Шварца 155 — треугольника 37 — Шура 167 Норма вектора 196 — матрицы 196 Нормирование решения 26 Оператор сопряженный 55 Определитель Вандермонда 222 — Вронского 251, 252 -¦ Грама 70, 92 — Касорати 252 — Коши 223 Отклонение среднеквадратичное 282 Отношение Релея 141 Полиномы Лагерра 71 — Лежандра 71 — Эрмита 71 Правило Крамера 81, 345 Преобразование Гаусса 51 — дробно-линейное 41 — индукционное 46 — квадратичное 305 — Кэли 120 — Лапласа 245 — — в матричном случае 24У — линейное однородное 305 — Лоренца 95, 96 — «растягивающее» 84 — сопряженное 46, 55 —, уменьшающее вариацию 343 — унитарное 305 — Фурье конечное 51 — Шура 306 Принцип суперпозиции 220 Проблема Штурма — Лиувнлля 17! Произведение кронекеровское 264 —' матриц, ассоциативность 43 — —, некоммутативность 42 — скалярное векторов 36 обобщенное 94 Процесс марковский дискретный 295 — — —, асимптотическое поведение 296 — —, принятие решений 334 — стохастический непрерывный 303 простой 292 Ранг квадратичной формы 344 — матрицы 349 Рост, непрерывные процессы 324 — стационарный 323 Ряд матричный 197 Символ Кронекера 40 Система неустойчивая 278 295, Система сопряженная 205 206 — устойчивая 278 — —, необходимые вия 279 Скаляр 35 Скобки Якоби 250 Спектр 67 Теорема Гамильтона — Кэч — ГерТлотца 3С5И7ММеТ — Куранта — Фишера — об аппрокс достаточные усло- н -'37 ^55 81 143 — Куранта — Фишера 143 — об аппроксимации вторая первая 235 — о представлении 148 — отделения Пуанкаре 236 к треугольному виду 289 87 205 рдтавлении 148 отделения Пуанкаре 147, 151 — — Штурма 146 — Перрона 319 , аналог 325 — —, обобщение 335 о приведении — Пуанкаре — Ляпунова — Стнлтьеса 188 — Финслера 103 — фон Неймана 333 — Хелли 357 — Шура 122, 132, 231 Теория возмущений 86, -- игр 332 Тождество Лагранжа 74 162 - Якоби 202 Точка седловая 23 ¦- стационарная 21 Умножение вектора на матрицу 39 скаляр 36 — матрицы на матрицу 40 -- — — скаляр 39 Уравнение вариационное 149 — —, приближенный метод решения 149 150 — Матье 238 — Рнккати 249 — функциональное Пойа 208 Форма билинейная 51 — квадратичная 23 неопределенная 30 — — неотрицательная 30 — — неположительная 30 ¦, одновременное приведение к сумме квадратов 84 — — отрицательно определенная 30 — —, представление ратов 102 , приведение к 63 — — положительно определенная 30, 65 — —, сигнатура 350 — тёплицева 355 1 виде суммы квад- каноническому виду Экспонента матричная 200 , функциональные уравнения 201, 202 Якобиан 52