/
Текст
Д.К.Фаддеев, В.Н.Фаддеева
ВЫЧИСЛИТЕЛЬНЫЕ МЕТОДЫ ЛИНЕЙНОЙ АЛГЕБРЫ
ОГЛАВЛЕНИЕ
Предисловие 6
Глава I. Основные сведения из линейной алгебры 7
§ 1. Матрицы 7
§ 2. Матрицы специального вида 33
§ 3. Аксиомы линейного пространства 41
§ 4. Базис и координаты 45
§ 5. Подпространства 50
§ 6. Линейные операторы 58
§ 7. Каноническая форма Жор дана 71
§ 8. Строение инвариантных подпространств 85
§ 9. Ортогональность векторов и подпространств 87
§ 10. Линейные операторы в унитарном пространстве и эвклидовом 94
пространстве
§11. Самосопряженный оператор 99
§ 12. Квадратичные формы 111
§ 13. Понятие предела в линейной алгебре 117
§ 14. Градиент функционала 134
Глава П. Точные методы решения систем линейных уравнений 137
§ 15. Обусловленность матриц 138
§ 16. Метод Гаусса 147
§ 17. Вычисление определителей 157
§ 18. Компактные схемы для решения неоднородной линейной системы 160
§ 19. Связь метода Гаусса с разложением матрицы на множители 162
§ 20. Метод квадратных корней 165
§ 21. Обращение матрицы 168
§ 22. Задача исключения 172
§ 23. Исправление элементов обратной матрицы 182
§ 24, Обращение матрицы при помощи разбиения на клетки 184
§ 25. Метод окаймления 187
§ 26. Эскалаторный метод 192
§ 27. Метод Перселла 195
§ 28. Метод пополнения для обращения матрицы 198
Глава Ш. Итерационные методы решения Систем линейных 204
уравнений
§ 29. Принципы построения итерационных процессов 204
§ 30. Метод последовательных приближений 207
§31. Подготовка системы линейных уравнений к виду, удобному для 214
применения метода последовательных приближений. Метод простой
итерации
§ 32. Одношаговый циклический процесс 220
§ 33. Метод П. А. Некрасова 226
§ 34. Методы полной релаксации 230
§ 35. Неполная релаксация 232
§ 36. Исследование итерационных методов для систем с 237
квазитрехдиагональными матрицами
§ 37. Теорема сходимости 244
§ 38. Управление релаксацией 248
§ 39. Релаксация по длине вектора невязки 253
§ 40. Групповая релаксация 254
Глава IV. Полная проблема собственных значений 257
§ 41. Устойчивость проблемы собственных значений 259
§ 42. Метод А. Н. Крылова 263
§ 43. Определение собственных векторов по методу А. Н. Крылова 271
§ 44. Метод Хессенберга 273
§ 45. Метод Самуэльсона 280
§ 46. Метод А. М. Данилевского 285
§ 47. Метод Леверье и видоизменение Д. К. Фаддеева 295
§ 48. Эскалаторный метод 300
§ 49. Метод интерполяции 308
§ 50. Метод ортогонализации последовательных итераций 314
§ 51. Преобразование симметричной матрицы к трехдиагональному виду 317
посредством вращений
§ 52. Уточнение полной проблемы собственных значений 324
Глава V. Частичная проблема собственных значений 328
§ 53. Определение наибольшего по модулю собственного значения 329
матрицы при помощи последовательных итераций
§ 54. Ускорение сходимости степенного метода 346
§ 55. Модификации степенного метода 352
§ 56. Применение степенного метода к отысканию нескольких собственных 355
значений
§ 57. Ступенчатый степенной метод 358
§ 58. Метод А,-разности 367
§ 59. Метод исчерпывания 370
§ 60. Метод понижения 375
§ 61. Координатная релаксация 378
§ 62. Уточнение отдельного собственного значения и принадлежащего ему 386
собственного вектора
Глава VI. Метод минимальных итераций и другие методы, основанные 392
на идее ортогонализации
§ 63. Метод минимальных итераций 392
§ 64. Биортогональный алгорифм 404
§ 65. Метода-минимальных итераций 416
§ 66. А -биортогональный алгорифм 425
§ 67. Двучленные формулы метода минимальных итераций и 427
биортогонального алгорифма
§ 68. Методы сопряженных направлений и их общие свойства 433
§ 69. Некоторые методы сопряженных направлений 437
Глава VII. Градиентные итерационные методы 455
§ 70. Метод наискорейшего спуска для решения линейных систем 456
§ 71. Градиентный метод с минимальными невязками 465
§ 72. Градиентные методы с неполной релаксацией 466
§ 73. ^-шаговые градиентные методы наискорейшего спуска 472
§ 74. Определение алгебраически наибольшего собственного значения 480
симметричной матрицы и принадлежащего ему собственного вектора
градиентными методами
§ 75. Решение частичной проблемы собственных значений с помощью 494
полиномов Ланцоша
§ 76. ^-шаговый метод наискорейшего спуска 498
Глава У1П. Итерационные методы для решения полной проблемы 508
собственных значений
§ 77. Алгорифм деления и вычитания 508
§ 78. Треугольный степенной метод 524
§ 79. LR-алгорифм 530
§ 80. ЛР-алгорифм 533
§ 81. Итерационные процессы, основанные на применении вращений 536
§ 82. Решение полной проблемы собственных значений при помощи 547
спектрального анализа последовательных итераций
Глава IX. Универсальные алгорифмы 553
§ 83. Общая идея подавления компонент 554
§ 84. Прием Л. А. Люстерника для ускорения сходимости метода 557
последовательных приближений при решении системы линейных
уравнений
§ 85. Подавление компонент при помощи полиномов низших степеней 559
§ 86. Различные формы проведения универсальных алгорифмов 563
§ 87. Универсальный алгорифм, наилучший в смысле первого критерия 567
§ 88. Универсальный алгорифм, наилучший в смысле второго критерия 570
§ 89. Прием А. А. Абрамова для ускорения сходимости метода 572
последовательных приближений при решении систем линейных
уравнений
§ 90. ВТ-процессы 574
§ 91. Общие трехчленные итерационные процессы 577
§ 92. Универсальный алгорифм Ланцоша 582
§ 93. Универсальные алгорифмы, наилучшие в среднем 586
§ 94. Метод подавления компонент в комплексной области 589
§ 95. Применение конформного отображения к решению линейных систем 591
§ 96. Примеры ^-универсальных алгорифмов 599
§ 97. Метод конформного отображения в применении к неподготовленной 603
системе
§ 98. Применение идеи подавления компонент к решению частичной 609
проблемы собственных значений
§ 99. Применение конформного отображения к решению частичной 610
проблемы собственных значений
Заключение 612
Дополнение 615
Литература 617
Дополнительная литература 654
ПРЕДИСЛОВИЕ
Настоящая книга посвящена изложению вычислительных методов
для решения основных задач линейной алгебры.
Этими задачами являются решение системы линейных уравнений,
обращение матрицы, решение полной и частичной проблем собствен-
собственных значений.
Огромное количество численных методов решения этих задач,
появившихся главным образом в последние годы, поставило авторов
перед необходимостью попытки их систематизации и изложения с не-
некоторых общих точек зрения. При этом авторы старались строить
изложение не выходя за области понятий линейной алгебры в той
мере, в какой это было возможно. Так, например, авторы сознательно
исключили использование теории непрерывных дробей, заменив ее тео-
теорией ортогональных полиномов, в которой, в свою очередь, ортого-
ортогональность понимается в линейно-алгебраическом смысле.
В книге почти не затрагивается важный вопрос о влиянии ошибок
округления на результат вычислений.
Первая глава книги носит вводный характер. Остальные восемь
глав посвящены изложению вычислительных методов. Материал этих
Глав частично был освещен в книге В. Н. Фаддеевой, вышедшей
в 1950 г. под тем же названием.
В конце книги приложены библиография по вычислительным мето-
методам линейной алгебры и вопросам оценки и распределения собственных
значений матрицы. При ее составлении существенную помощь оказали
авторам И. А. Лифшиц и Р. С. Александрова. Авторы приносят им
свою благодарность.
Рукопись книги была прочитана В. Н. Кублановской, сделавшей
ряд ценных замечаний. Авторы приносят ей глубокую благодар-
благодарность. Авторы благодарят также редактора книги Г. П. Акидова
и всех своих товарищей, проявивших интерес к их работе.
ГЛАВА I
ОСНОВНЫЕ СВЕДЕНИЯ ИЗ ЛИНЕЙНОЙ АЛГЕБРЫ
§ 1. Матрицы
1. Определения. Прямоугольной матрицей называется
совокупность чисел, вообще говоря, комплексных, расположенных
в виде прямоугольной таблицы, содержащей п строк и т столбцов.
Такая матрица записывается в виде:
пъг ¦ • ¦ аг
A)
или, сокращенно, в виде:
А = {аф, 1=1,2 я; ./--=1. 2,
., т.
Две матрицы называются равными, если равны их соответствую-
соответствующие элементы.
Матрица, состоящая из одной строки, называется просто стро-
строкой; матрица, состоящая из одного столбца,—столбцом; матрица
А = (а), состоящая из одного числа, отождествляется с этим числом.
Если число п строк матрицы равно числу ее столбцов, то матрица на-
называется квадратной. В этом случае число п называется поряд-
порядком матрицы.
Среди квадратных матриц важную роль играют так называемые
диагональные матрицы, т. е. матрицы, у которых отличны от
нуля лишь элементы, стоящие вдоль диагонали. Диагональные ма-
матрицы обозначаются
я2 ап\, так что
at 0 ... О
О а2 ... О
_О О ... а„.
B)
8
ОСНОВНЫЕ СВЕДЕНИЯ ИЗ ЛИНЕЙНОЙ АЛГЕБРЫ
[гл. t
Если все числа оц при этом равны между собой, матрица назы-
называется скалярной:
я Q ... О"
О а ... О
.0 0 ... а
и в случае, если а=1,—единичной:
0 ... О
О 1 ... О
C)
D)
.0 0 ... 1
где bjj так называемый символ Кронекера, т. е. §у = 0 при 1Ф],
Наконец, матрица, все элементы которой равны нулю, называется
нулевой. Мы будем обозначать ее символом 0.
Переставив в матрице
ванную матрицу
«11
«21
«12 • • •
а22 • . •
а
получим так наз
~ «п
«12
а
«21
«22
«2т • • •
«lm
«2»
апт —
ываем}
«nl ~
«П2
«ят _
E)
Квадратная матрица А равна транспонированной А' в том и только
в том случае, когда она симметрична, т. е. если а^ = а^.
Очевидно, что матрица, транспонированная со строкой, есть стол-
столбец, составленный из тех же элементов. Это обстоятельство мы часто
будем использовать для удобства записи столбцов. Так, вместо столбца
А
2
3
_5.
мы будем писать D, 2, 3, 5)'.
§1]
МАТРИЦЫ
Посредством замены элементов матрицы на комплексно-сопряжен-
комплексно-сопряженные числа мы приходим к комплексно-сопряженной ма-
матрице А. Если элементы матрицы А вещественны, то Л = Л.
Матрица А* = А, комплексно-сопряженная с транспонированной,
называется матрицей сопряженной с матрицей А. Очевидно, что
(Л*)* = А.
Если матрица А вещественна, то сопряженная с ней матрица совпа-
совпадает с транспонированной.
Определителем квадратной матрицы называется определи-
определитель, элементы которого равны элементам матрицы. Определитель
матрицы А обозначается через |Л|.
Далее, любой определитель, строки и столбцы которого „уклады-
„укладываются" в строки и столбцы матрица называется минором этой ма-
матрицы. Подробнее, минор порядка k матрицы А есть определитель k-vo
порядка, составленный из элементов, находящихся на пересечении неко-
некоторых k строк и k столбцов матрицы А в их естественном расположении.
Рангом матрицы А называется максимальный порядок отличных
от нуля миноров матрицы. Иначе, рангом матрицы называется такое
число г, что среди миноров матрицы существует минор порядка г,
неравный нулю, а все миноры порядка г-\-\ и выше равны нулю
или не могут быть составлены.
2. Умножение матриц на число и сложение матриц. Произ-
Произведением матрицы А = («у) на число а называется матрица,
элементы которой получены из элементов матрицы А умножением на
число а:
аа,
а.а
12
аа
ют
аа„
F)
Суммой двух прямоугольных матриц А = (яу) иВ= (bij), имею-
имеющих одинаковое число как строк, так и столбцов, называется ма-
матрица С, элементы которой равны суммам соответствующих элементов
матриц А и В, т. е.
А+В =
а12
а2г
а2т
\т
2т
пп2 + Ьп
G)
Введенные выше операции, как это нетрудно видеть, обладают
свойствами:
2.
3.
=В-\-А.
=А.
10
ОСНОВНЫЕ СВЕДЕНИЯ ИЗ ЛИНЕЙНОЙ АЛГЕБРЫ
[ГЛ. I
4.
5.
6.
7.
\.А
=А.
Здесь А, В я С матрицы, а а и C числа.
3. Умножение матриц. Умножение матриц А и В определяется
только в предположении, что число столбцов матрицы А равно числу
строк матрицы В. В этом предположении элементы произведения С
определяются следующим образом: элемент i-й строки /-го столбца
матрицы С равен сумме произведений элементов i-й строки матрицы А
на соответствующие элементы /-го столбца матрицы В. Таким образом,
АВ =
an
а22
a2m
д22
ЬгР
Dто
где
с„
я; У=1
т)
(8)
(9)
Заметим, что произведение двух прямоугольных матриц есть снова
прямоугольная матрица, число строк которой равно числу строк пер-
первой матрицы, а число столбцов равно числу столбцов второй матрицы.
Так, например, произведение квадратной матрицы на матрицу, состоя-
состоящую из одного столбца, есть матрица из одного столбца.
Перестановочный закон при умножении матриц, вообще говоря,
не имеет места. Легко видеть, что сама постановка вопроса о равен-
равенстве матриц АВ и ВА имеет смысл только для квадратных матриц А
и В одинакового порядка. Действительно, матрицы АВ и ВА имеют
смысл одновременно только в случае, если число строк первой ма-
матрицы равно числу столбцов второй, а число столбцов первой ма-
матрицы равно числу строк второй. При выполнении этих условий
матрицы АВ и ВА обе будут квадратными, но разных порядков,
если Л и В не квадратные. Но даже и для квадратных матриц оди-
одинакового порядка, вообще говоря, АВ Ф ВА.
Например, _
~ — 5 3"
— 9 7
4 б"
О —2
2~
_3 4_
1
_—з
1 1~
•3 1
О 1
1""
1
~ 1 2~
3' 4_
§1]
МАТРИЦЫ
11
В отдельных случаях умножение может быть коммутативно —
в таком случае матрицы называются перестановочными. Так,
например, скалярные матрицы перестановочны с любыми квадратными
матрицами того же порядка, ибо
«11 al2
«21 «22
_ «nl anl
a 0 ..
•
0
0 a ... 0
_0 0 ... a_
• • • «m "
• • • a2n
•'• ann _
a
0
_0
an a12
¦ «lra
«21 «22 * ' ¦ fl2n
_ an[ an2 ¦ • ¦ ann _
0 ... 0~
a ... 0
0 ... a
aan
Gt#2i
_a«»i
—
y.aV2 . . . aaln ~
xan2 . . . aa
Из последней формулы следует особая роль единичной матрицы
при умножении матриц. Именно, единичная матрица среди всех ква-
квадратных матриц данного порядка играет такую же роль, как число
единица среди чисел. Действительно,
АЕ = ЕА = А.
Можно доказать, что умножение матриц ассоциативно, именно,
если АВ и (АВ)С имеют смысл, то имеют смысл ВС и А (ВС) и
А (ВС) — (АВ) С.
Действительно, элемент /-й строки и у-го столбца (АВ)С равен
а элемент i-й строки и у'-го столбца матрицы А(ВС) равен
к L 3 J a Э
Таким образом, соответствующие элементы матриц (ЛВ)С и Л (ВС)
равны, следовательно, равны и сами матрицы.
Произведение матриц обладает также свойствами:
где А, В, С матрицы, а а число.
Имеет место следующее правило транспонирования произведения:
(АВ)' = В'А'.
A0)
12
ССЧОВНЫЕ СВЕДЕНИЯ ИЗ ЛИНЕЙНОЙ АЛГЕБРЫ
[ГЛ. I
Действительно, элемент 1-й строки и у-го столбца матрицы (АВ)'
равен элементу у'-й строки и i-то столбца матрицы АВ, т. е. равен
ajAi + 0/2*21- + • • • + ajmbmi.
Последнее выражение, очевидно, равно сумме произведений элемен-
элементов i-й строки матрицы В' на соответствующие элементы /-го столбца
матрицы А', т. е. равно элементу i-й строки и у-го столбца ма-
матрицы В'А'.
Ясно также, что
(И)
(АВ)* = В* А1.
Как уже говорилось выше, матрица АВ будет квадратной, если
число п строк матрицы А равно числу столбцов матрицы В, Обо-
Обозначим- через т число столбцов матрицы А (оно равно также числу
строк матрицы В, так как только при этом условии произведение АВ
имеет смысл). Из теории определителей известно, что определитель
матрицы АВ равен нулю, если п^> т, и равен сумме произведений
всех миноров порядка п, составленных из матрицы А, на соответ-
соответствующие миноры, составленные из матрицы В, если п ^ т. Точнее,
если
_ап1
в =
ьп ... ьм
"т.\ • • • &гпп
аих ¦ ¦¦ aut
a»tl ... anln
b^i ¦¦• bhn
'n1 ' ' lnn
A =
и п ^.т, то
\AB\ =
В частности, при т — п
\АВ\ =
т. е. определитель произведения двух квадратных матриц равен
произведению определителей перемножаемых матриц.
4. Разбиение матриц на клетки. Иногда бывает целесообразно
свести вычисления над матрицами высоких порядков к вычислениям
с матрицами меньших порядков. Такое сведение осуществляется при
помощи разбиения данных матриц на так называемые клетки. Именно,
ап .. . а1п
ап\ • • • апп
#11 • • • Ь1п
#»1 • • • Ьпп
§ 1]
МАТРИЦЫ
13
каждую матрицу можно представить и притом многими способами,
как состоящую из нескольких матриц меньшего порядка. Например,
«11
«12
а22
«13 «14
й23 аи
«31
«и
«21
«31
«32
«12
«22
«32
«33
«13
«23
«33
«34_
«14~~
Й24
«34-
-«13
•*22
¦'зг
-*23
Матрицы, на которые разбивается данная матрица, называются клет-
клетками. При клеточном разбиении предполагается, что горизонтальные
и вертикальные разделяющие линии пересекают всю матрицу.
Мы не будем останавливаться на общем случае разбиения матриц
на клетки, а рассмотрим лишь такие разбиения квадратных матриц,
при которых диагональные клетки квадратны.
Основные действия над матрицами с диагональными клетками
одинаковых порядков естественным образом связываются с дей-
действиями над самими клетками.
Именно, если
А —
Ai,
A,
... A
к-
B12 ... Bit
B22 ... B2i
4 R R
nX fe2 * * * Ttli
причем Аи и Bu — квадратные матрицы одинаковых порядков, то
А2г -\- В22 ...
В
2к
к2 ... Акк + Вкк_
Си С12 ¦ ¦ .
21 22 ' * *
Cfc, Cfcj ... С;
кк-
A2)
(ЛЗ)
где
14
ОСНОВНЫЕ СВЕДЕНИЯ ИЗ ЛИНЕЙНОЙ АЛГЕБРЫ
(гл. t
Действительно, все произведения АцВц имеют смысл, так как
число столбцов матрицы Аи всегда равно числу строк матрицы В1}.
Сумма АпВц-\- ... -f-AikBkj имеет смысл, так как все слагаемые
матрицы имеют одинаковое строение. Далее, пусть с^ есть не-
некоторый элемент клетки Су. Тогда
Здесь sv s2 — Sj, ..., sk— sk_l обозначают порядки матриц
Ап, А22, ..., Акк. Ясно, что заключенные в скобки слагаемые, на
которые мы разбили сар, являются элементами матриц АпВ^, .. .
. . ., A!kBkj, занимающими в этих матрицах такое же положение,
какое занимает сл^ в матрице Сц. Следовательно,
Формулы A2) и A3) показывают, что действия с матрицами,
разбитыми на клетки указанного вида, производятся так, как будто
на месте клеток находятся числа.
Важным частным случаем клеточных матриц являются окай-
окаймленные матрицы. Именно, пусть мы имеем квадратную ма-
матрицу An_t порядка п—1:
аи
•42
а.К
П2,П-1
-^п-Ы ая-1,2 ••• Gn-l, n-l_
Образуем квадратную матрицу я-го порядка Л„, присоединяя к ма-
матрице Ап_1 строку ¦У„-1 = (а„1 ••• an,n-i). столбец «„_! =
= (а1и «г» • • • fln-i,n)' и число апп:
Й1„
**п
а,
-1,п
"п-1
A4)
Будем - говорить, что матрица Ап получена окаймлением ма-
матрицы An_v Матрица Ап естественным образом разделена на клетки.
Действия над окаймленными матрицами производятся согласно
общим правилам действий над клеточными матрицами.
Пусть
Я у~
ГМ а"
b
§ 1]
МАТРИЦЫ
15
две окаймленные матрицы порядка п. Смысл обозначений М, v, и,
а и Р, х, у, Ь тот же, что и в определении.
Тогда справедливы следующие равенства:
~а.М
аА =
АВ
аи
_ av aa
~М--\-Р и + у-
_v + x a + b_
~МР + их Му-\- иЪ~
vP -\-ax vy-\- ab_
A5)
Здесь МР и их — матрицы п—1-го порядка; My и ub — столбцы,
состоящие из п—1-го элемента, vP и ах — аналогичные строки и,
наконец, vy-{-ab — число.
5. Квазидиагональные матрицы. 'Рассмотрим еще один частный
случай клеточных матриц, именно так называемые квазидиаго-
квазидиагональные матрицы. Квазидиагональной матрицей называется
квадратная матрица, у которой вдоль главной диагонали расположены
квадратные клетки, а остальные элементы равны нулю. Например,
матрица 7-го порядка
О 0 0 ! О О
О 0 0 10 О
22_
квазидиагональна. Клетками этой матрицы будут, очевидно, матрицы
В =
hi
hv
А —
hi
hi
b-v>
«11 «12 I
_«21 «22 J '
hi
hs
и шесть нулевых матриц.
Если строение двух квазидиагональных матриц одинаково, то
произведение таких матриц будет также квазидиагональной матрицей
того же строения, диагональные клетки которой равны произведе-
произведениям соответствующих клеток перемножаемых матриц.
16 ОСНОВНЫЕ СВЕДЕНИЯ ИЗ ЛИНЕЙНОЙ АЛГЕБРЫ [ГЛ. I
В силу известной теоремы Лапласа определитель квазидиагональ-
квазидиагональной матрицы равен произведению определителей диагональных клеток.
6. Обратная и союзная матрицы. Квадратная матрица А — (а^)
называется неособенной или невырожденной, если ее определитель
не равен нулю; в противном случае матрица называется особенной.
Введем теперь важное понятие обратной матрицы. Матрицу В
назовем обратной к квадратной матрице А, если
АВ = Е. A6)
Докажем, что необходимым и достаточным условием существова-
существования обратной матрицы является неособенность матрицы А.
Необходимость сразу вытекает из теоремы об определителе про-
произведения двух матриц. Действительно, если АВ = Е, то |Л||В| = 1
и, следовательно, | А | ф 0.
Допустим теперь, что |А|Ф 0. Для построения обратной матрицы
рассмотрим предварительно так называемую союзную матрицу,
т. е. матрицу
С =
Ап А21 . . . Ап1
2 2 • • • "П2
П • • • "wn _|
A7)
Здесь Aij — алгебраическое дополнение элемента пц в определителе
матрицы А.
Докажем, что союзная матрица обладает следующим свойством:
АС = \А\Е. A8)
Действительно, вычисляя общий элемент матрицы АС по прави-
правилам умножения матриц, получим, что он равен
anAji + a%tAit + • • • + ainAjn.
т. е. равен нулю при i =h j и определителю матрицы А при l — j,
в силу известной теоремы о разложении определителя.
Таким же образом устанавливается равенство
СА = \А\Е. A8')
Союзная матрица имеет смысл для любой квадратной матрицы А.
Из равенства АС = \А\Е следует, что матрица
вс •
есть обратная для неособенной матрицы А.
Действительно,
§ 1] _ МАТРИЦЫ 17
Построенная матрица обладает также свойством
В А = Е, B0)
что следует из равенства СА=\А\Е.
Докажем, наконец, единственность обратной матрицы. Положим,
что существует такая матрица X, что АХ=Е. Умножая это равен-
равенство на В слева, получим, что Х—В. Если положить, что YA^=E,
то, умножая справа на В, получим Y = B.
Матрица, обратная к матрице А, обозначается А~1. Очевидно,
что l^^l^l^l. Далее (Л) = А. Это следует непосредственно
из равенства А~ХА = Е.
Заметим еще, что матрица, обратная к произведению двух матриц,
равна произведению обратных матриц, взятых в обратном порядке,
т. е.
(Л1Л2) = ЛГ1ЛГ1. B1)
Действительно,
Равенство A9) дает возможность вычисления обратной матрицы.
Однако вычисление союзной матрицы настолько трудоемко, что
упомянутое равенство важно лишь в теоретическом отношении.
Задача численного нахождения обратной матрицы есть одна из
важнейших вычислительных задач линейной алгебры, и мы к ней
будем неоднократно возвращаться в последующих главах.
7. Полиномы от матриц. Определим теперь целую положитель-
положительную степень квадратной матрицы, полагая
п раз
А» = А~7?7а. B2)
В силу ассоциативного закона безразлично, как в этом произведе-
произведении расставить скобки, и потому мы их опускаем. Из определения
ясно, что
= Ап+т
B3)
Отсюда следует, что степени одной и той же матрицы пере-
перестановочны.
Выражение вида
где я0, ах ап комплексные числа, называется полиномом от
матрицы или матричным полиномом. Полином от ма-
матрицы можно рассматривать как результат подстановки матрицы А
вместо переменной t в алгебраический полином
' /@ = <»о*п+ <M»-i+ • • • + я». B4)
2 Зак. 974, Д. К. Фаддеев и В, Н. Фаддеевщ
18
ОСНОВНЫЕ СВЕДЕНИЯ ИЗ ЛИНЕЙНОЙ АЛГЕБРЫ
[ГЛ. I
Важно отметить, что правила действий над полиномами от матриц
ничем не отличаются от правил действий над алгебраическими поли-
полиномами.
Именно, если
то
B5)
Это следует из перестановочности степеней матрицы.
8. Характеристический полином. Соотношение Кели—Гамиль-
Кели—Гамильтона. Минимальный полином. Вековым, или характеристи-
характеристическим, уравнением матрицы Л = (я^-) называется уравнение
-t a.
a22 — t
п\
а
пч.
= 0.
B6)
Левая часть этого уравнения, которую можно записать сокращенно
в виде | Л — tE |, носит название характеристического поли-
полинома матрицы. Вековые уравнения часто встречаются в приложе-
приложениях.
Непосредственное вычисление характеристического полинома пред-
представляет значительные технические трудности. Действительно, если
— !)"[/"— Pit»-1— p2t"-*—...—pn], B7)
то
Pi = ИИ
-2-
чЯ-1
A\,
B8)
sfc-l
а остальные коэффициенты рк суть взятые со знаком (— 1) * суммы
всех миноров определителя матрицы А порядка k, опирающихся на
главную диагональ. Число таких миноров равно числу сочетаний
из п по k.
Корни Х{ характеристического полинома называются собствен-
собственными значениями или характеристическими числами мат-
матрицы. Из известной теоремы Виета, дающей связь корней уравнения
с его коэффициентами, следует, что
B9)
§ 1] МАТРИЦЫ 19
Величина р1 = ап -\~ ... + апп называется следом матрицы А
и обозначается Sp A.
Задача численного нахождения корней характеристического поли-
полинома является одной из важнейших задач линейной алгебры. Прак-
Практически удобные методы определения коэффициентов и корней ха-
характеристического полинома будуг разобраны в дальнейшем.
Старший коэффициент характеристического полинома равен (— 1)п.
Иногда вместо характеристического полинома рассматривается нор-
нормированный характеристический полином, отличающийся от обычного
множителем (— 1)". Старший коэффициент нормированного характе-
характеристического полинома равен единице.
Для любой матрицы имеет место следующее замечательное со-
соотношение, известное под названием соотношения Кели — Гамильтона:
если ср(/) есть характеристический полином матрицы А, то
<р(Л) = 0, т. е. говоря условно, матрица является корнем своего
характеристического полинома.
Для доказательства рассмотрим матрицу В, союзную с матрицей
А — tE. Так как каждое алгебраическое дополнение в определителе
\А — tE\ является полиномом от t степени не выше п—1-й, то
союзную матрицу можно представить в виде
где Вп_г, ..., Во некоторые матрицы, не зависящие от t. В силу
основного свойства союзной матрицы имеем:
Это равенство равносильно системе равенств
Вп_хА =(-\)п+1РпЕ
В0А -Bt =^(—
-Во =(—1)»?.
Умножив эти равенства справа на Е, А, А2 Л", Ап и сложив,
получим в левой части нулевую матрицу, а в правой части
(— 1)П[—РпЕ— Рп-,А— рп.2А*— . .. + Ап\ =<р(Л). C0)
Итак, <р (Л) = 0, что и требовалось доказать.
Соотношение Кели — Гамильтона показывает, что для данной
матрицы существует полином, корнем которого она является.
2*
20 ОСНОВНЫЕ СВЕДЕНИЯ ИЗ ЛИНЕЙНОЙ АЛГЕБРЫ {ГЛ. I
Очевидно, что такой полином не единственный, ибо если ф(^) обладает
этим свойством, то им обладает и всякий полином, делящийся на ty{t).
Полином наименьшей степени, обладающий тем свойством, что мат-
матрица А является его корнем, называется минимальным поли-
полиномом матрицы.
Докажем, что характеристический полином делится на минималь-
минимальный полином.
Пусть q(t) и r(t) целая часть и остаток при делении характери-
характеристического полинома ср (/) на минимальный полином ty(t). Тогда
причем степень r{t) меньше степени ф
Подставив в это равенство А вместо t, получим г(А) =
— ty(A)q(A) = 0. Таким образом, матрица А оказывается „корнем"
полинома r{t). Отсюда следует, что г(<) = 0, так как иначе ф(Г) не
был бы минимальным полиномом. Следовательно, ср(Т) действительно
делится на ф(?).
Точно так же доказывается, что любой полином w(t), аннулирую-
аннулирующий матрицу А, т. е. удовлетворяющий требованию со(А) = 0, де-
делится на минимальный полином.
9. Подобные матрицы. Матрица В называется подобной
матрице А, если существует такая неособенная .матрица С, что
В = С~ХАС. Говорят при этом, что матрица В получена из матрицы А
преобразованием подобия.
Преобразование подобия обладает следующими свойствами:
.. + Ап)С
C^Afi ¦ С~1А2С . . . С~1АпС = С {А^А2 . . . А„) С. C1)
В частности {С~1АС)п = С~1АпС. Далее
для любого полинома f(t).
Из последнего свойства сразу вытекает, что минимальные поли-
полиномы подобных матриц одинаковы.
Покажем, что подобные матрицы имеют также одинаковые
характеристические полиномы.
Действительно,
10. Собственные значения полинома от матриц. Пусть А — мат-
матрица с собственными значениями \и .... Хп, среди которых могут
быть равные, и пусть /(^) = #o + ai^~f~ • • • Л~ат1т данный полином.
§ 1] МАТРИЦЫ 21
Покажем, что собственными значениями матрицы f(A) будут числа
Ж) /(К)-
Предварительно вычислим определитель матрицы /04). С этой
целью разложим полином f(t) на линейные множители
где [х, [iTO корни полинома /(/).
Тогда
и, следовательно,
где ср (/) есть характеристический полином матрицы Л. Но
?(') = & — *)...(*» — О-
Поэтому
П(^^)П(^П(^^))П
J=l . 1=1 \ j=l J 1=1
Равенство
|/И)|=/(М •••/(>-„)
есть тождество относительно коэффициентов полинома f(t). Приме-
Применив это тождество к полиному f(t) — и, получим
|/ (А) — иЕ | = (/ (Х0 — «)...(/ (Хп) — а).
Это и значит, что собственные значения матрицы f(A) суть числа
/(М f(K)-
Отметим, в частности, что собственные значения матрицы А
суть X?, . .., Х?.
11. Элементарные преобразования. Часто над матрицами нужно
совершать следующие операции:
а) умножение элементов какой-либо строки на число;
Ь') добавление к элементам какой-либо строки чисел, пропорцио-
пропорциональных элементам какой-либо предыдущей строки;
Ь") добавление к элементам какой-либо строки чисел, пропорцио-
пропорциональных элементам какой-либо последующей строки.
Иногда такие преобразования приходится делать над столбцами.
Преобразования указанного вида будем называть элементарными
преобразованиями матриц.
Нетрудно проверить, что всякое элементарное преобразование
над строками равносильно умножению матрицы слева на некоторую
22
основные сведения из линейной алгебры
[гл. i
неособенную матрицу специального вида. Именно, операция а) равно-
равносильна умножению матрицы слева на матрицу
1
C2)
операция Ь') равносильна умножению слева на матрицу
1
а . . . 1
1
операция Ь") равносильна умножению слева на матрицу
1
1 ... а
C3)
C4)
§ u
Например,
~ 1
0
_0
0
_0
" 1
0
0
0
a
0
0
1
a
0
1
0
0~
0
1 _
0 ~
0
1 _
0~
a
1 _
a
X
_ u
~ a
X
и
~ a
X
и
b
У
V
b
У
V
b
У
V
с
z
w
c~
z
w
с ~
z
w
МАТРИЦЫ
=
a
ax
_ a
~ a
X
_« +
~ a
_ a
b
ay
V
0.X
с
az
w
b
У
v +
b
УЛ
V
с
z
a_y w-\-a.z _
с
- ZV Z -f- (X1W
w
23
Операции а), b"), br) над столбцами осуществляются посредством
умножения на те же матрицы справа.
В дальнейшем нам придется часто производить над матрицами
преобразования вида а) и Ь').
Результат нескольких преобразований этого вида равносилен
умножению матрицы слева на некоторую „левую треугольную" мат-
матрицу, т. е. матрицу вида
Tu 0 ... 0
721 722 • ¦ • 0
Tnl Tn2 • • • In
C5)
с ненулевыми диагональными элементами ¦(¦•••
Действительно, каждое отдельное преобразование вида а) и Ь')
равносильно умножению слева на некоторую треугольную матрицу
указанного вида, а произведение двух или нескольких треугольных
матриц одинакового строения есть снова треугольная матрица.
Аналогично, результат нескольких преобразований вида а) и Ь")
равносилен умножению слева на „правую треугольную" матрицу,
т. е. матрицу вида *
¦"и ип • • • иы
О
Ьгг . .. Ь2п
О 0 ... Ъп
C6)
Далее, результат нескольких преобразований вида а) и Ь') над
столбцами равносилен умножению справа на правую треугольную
24
ОСНОВНЫЕ СВЕДЕНИЯ ИЗ ЛИНЕЙНОЙ АЛГЕБРЫ
[ГЛ. I
матрицу, а результат нескольких преобразований вида а) и Ь") над
столбцами равносилен умножению справа на левую треугольную мат-
матрицу.
Отметим еще, что результат нескольких преобразований вида Ь')
и Ь"), произведенных над столбцами, таких, что ко всем столбцам
добавляются лишь элементы i-то столбца (который сам остается без
изменения), равносилен умножению данной матрицы справа на мат-
матрицу вида:
1 О
О 1
о
о
1 Щ, и
min
о о
1
C7)
12. Разложение матрицы в произведение двух треугольных
матриц. Треугольные матрицы обладают рядом удобных свойств.
Так, определитель треугольной матрицы равен произведению элемен-
элементов главной диагонали; произведение двух треугольных матриц оди-
одинакового строения есть снова треугольная матрица того же строения;
неособенная треугольная матрица легко обращается, и ее обратная
матрица имеет одинаковое с ней строение и т. д.
Поэтому интересна следующая теорема.
Теорема 1.1. Матрацу
А —
можно представать в виде произведения левой и правой тре-
треугольных матрац, при условии, что
«и
«21
_ «ш
«12
«22
««2
• ¦ • «m
. . . а2п
. . . ат
О,
?=0,
Доказательство проведем методом математической индукции. Для
п=1 утверждение очевидно: (ап) = (Ьп) (сп), причем один из мно-
множителей может быть взят произвольно. Пусть теорема верна для
матриц п—1-го порядка. Покажем, что она верна для матриц я-го
порядка.
§ 1) МАТРИЦЫ
Разобьем матрицу А на клетки следующим образом:
25
А =
а„ •¦• а,
а2п
— 1, п
а„, ап
К-х «
и будем искать разложение А = СВ матрицы А в произведение
матриц В и С требуемого вида, разбив эти матрицы на клетки по-
подобно А:
Сп-х О
х с„
В =
о
По правилу умножения для клеточных матриц:
Сп-х О "I Г Вп_х у
х спп _\ |_ 0 Ьпп
СП-1ВП-1
Поставленная цель будет достигнута, если мы определим матрицы
cn-v Bn-i> х, у и числа спп, Ьпп так, что
хВп_, = г»
Первому требованию можно удовлетворить в силу индукционного
предположения. При этом из предположения, что \An-i\=hQ> сле"
дует, что |СЯ_! | Ф 0 и | 5re_x | ^= 0.
Далее, у и х однозначно определяются по формулам
Таким образом, нам остается определить только диагональные
элементы спп и Ьпп из равенства
сппРпп := апп ХУ
26
ОСНОВНЫЕ СВЕДЕНИЯ ИЗ ЛИНЕЙНОЙ АЛГЕБРЫ
[ГЛ. 1
Это, очевидно, всегда возможно, причем одному из чисел спп
или Ьпп можно приписать произвольное отличное от нуля значение,
и тогда второе число определится однозначно. Тем самым теорема
доказана.
Из хода доказательства следует, что разложение матрицы в про-
произведение двух треугольных будет единственным, если мы заранее
предпишем диагональным элементам одной из треугольных матриц
фиксированные значения.
Удобно считать, например, что Ьп= 1, i= 1, 2, .... п. Если при
этом из строк матрицы С вынести диагональные элементы, то мы
придем к разложению
А = СКВ,
где Л= [kj ап], а; — диагональные элементы матрицы С, и сц=1.
Легко проверить, что
ai~jA^
=1, ..., п.
Действительно, из проведенной конструкции следует, что
Нетрудно дать явные формулы для разложения матрицы в про-
произведение двух треугольных.
Обозначим через фш, I <C k, минор матрицы А, составленный из
первых i строк, первых i— 1 столбцов и &-го столбца. Соот-
Соответственно через fift обозначим минор матрицы А, составленный из
первых i столбцов, первых /— 1 строк и &-й строки. В этих обозначе-
обозначениях §кк == Tftft = | Ак |.
Далее, обозначим через ^к, i^.k, алгебраическое дополнение
/-го элемента последней строки матрицы Ак, через ~{ы алгебраическое
дополнение /-го элемента последнего столбца матрицы Ак. В этих
обозначениях §ш — ~(кк = | Ак_г |.
Построим следующие матрицы:
Pin
О 0 ..
Fu F12 • •
0 L ••
о о ..
Pi»
с2 =
"in
Ти
.bi
Tn
T21-
О ...
T22 • ¦ •
Tn2 • • •
О ...
Т22
и
О
"inn
0
0
"inn —
§ 1] матрицы 27
Из элементарных свойств определителей следует, что
ABz = Ci, C2A = BV ¦ C8)
Далее, введем в рассмотрение диагональные матрицы
= Ipll' Р22 Pnnl = [Til* Т'221 • ' ¦ • Тяге! == I I - |> I ^2 I I Ап [ ]
и
•^2 = [Fll. L Кп\ = iTll. Т22- •••• fn»l = Il. Hll Ия-llb
Введем обозначения
О :;г:= О^О2 ""^ *^1
Со = Si С2.
Очевидно, матрицы В, С, Во и Со имеют единичные диагональные
элементы.
Из равенств C8) следует
откуда
Матрицы С и Cq1 являются левыми треугольными матрицами
с единичными диагональными элементами, матрицы же SB и SB^1
суть правые треугольные матрицы. В силу однозначности разложения
матрицы в произведение треугольных матриц с предписанными диа-
диагональными элементами для одного из сомножителей заключаем,
что С = Со1 и SAT1 = SB, откуда В = Во1.
Таким образом,
А = CSB. C9)
28
Ясно, что
ОСНОВНЫЕ СВЕДЕНИЯ ИЗ ЛИНЕЙНОЙ АЛГЕБРЫ
[ГЛ. Г
С =
В —
1
ж
Til
Т21 J
Ini Ъл
_Tu T22
I Ё12.
Pu "
1 .
0
Pw
P11
D0)
0
1
13. Разложение клеточной матрицы в произведении двух
квазитреугольных. Клеточная матрица с квадратными диагональными
клетками называется правой квазитреугольной, если она
имеет вид
вп в12 ... в1п
о в22 ... в2п
0
0 ... Вп
и левой квазитреугольной, если она имеет вид
0
... 0 ~
. .. 0
Очевидно, что определитель квазитреугольной матрицы равен про-
произведению определителей ее диагональных клеток.
Имеет место следующая теорема.
Теорема 1,2 Если матрицы
Ах — Ап, Аг
неособенные,
то
1 12
А Л
матрица
А =
•"я-11 • • • -"n-ln-l—
"*12
Ап2 . . . Ап
§1]
МАТРИЦЫ
29
может быть представлена в виде произведения левой и правой
квазитреугольных матриц, причем диагональные клетки одной
из них можно взять равными любым наперед заданным неосо-
неособенным матрицам соответствующих порядков.
Доказательство проводится аналогично доказательству теоремы 1.1.
Допустим, что для матрицы Ап_х уже получено искомое разложе-
разложение An_t — Сп_1Вп_1. Так как | Ап_х \ Ф О, то | Сп_х \ Ф О и | Вп_х \ ф 0.
Далее положим
^ **пп
и будем искать квазитреугольные матрицы В и С в виде
~Вп-1У
_о в„,
Матричное равенство СВ = А распадается на равенства
Сп_1Вп_1 = Ап_1
В =
И С =;
-X СПп-
Первое из этих равенств выполняется автоматически, из второго
и третьего находим y=C,7-it/, X=VBn~Li, из последнего находим
Впп = Cll (Апп — XY) (или Спп = (Ап
XY)
взяв в качестве Спп (или Впп) любую неособенную матрицу.
14. Матричная запись системы линейных уравнений. Рас-
Рассмотрим систему п линейных уравнений с п неизвестными:
11*1 + «12*2+ ••• +«!«*« =Л
21*1 + «22*2 + • • ¦ + а2пХп = /2
••• +«»«*«=/«•
D1)
Воспользовавшись матричными обозначениями, в частности пра-
правилом умножения матриц, мы можем записать систему D1) в виде
одного матричного равенства
Ax=f. D Г)
Здесь А обозначает матрицу из коэффициентов системы, /—столбец
свободных членов, х — столбец, элементами которого являются зна-
значения неизвестных.
30
ОСНОВНЫЕ СВЕДЕНИЯ ИЗ ЛИНЕЙНОЙ АЛГЕБРЫ
[ГЛ. I
Если матрица А неособенная, мы сразу получаем решение си-
системы умножением равенства D1') на А'1 слева. Именно,
x = A-1/=jLb/, D2)
где В матрица союзная с А.
Покажем, что последняя формула представляет собой матричную
запись известных формул Крамера
где А{ матрица, которая получается из матрицы А путем замены
элементов г-го столбца через свободные члены.
Действительно, матричное равенство D2) равносильно п равенствам
X: = •
¦¦¦ +Anifn
i=\ п.
Так как Aki суть алгебраические дополнения элемента аы в опреде-
определителе матрицы А, мы получаем, очевидно, что
что доказывает наше утверждение.
15. Матричная запись квадратичной формы. Во многих разде-
разделах математики существенную роль играют квадратичные формы,
т. е. однородные полиномы второй степени от нескольких перемен-
переменных. Ясно, что квадратичная форма состоит из слагаемых двух
видов, именно: квадратов переменных и попарных произведений пе-
переменных, взятых с некоторыми коэффициентами. Разобьем каждое
слагаемое, содержащее попарное произведение переменных на две
равные части, расположив перемножаемые переменные в обоих воз-
возможных порядках. При таком соглашении квадратичная форма будет
записываться в виде следующей квадратной схемы:
Х2 Хп) = «11*1 + «12*1*2 И" • • •
2 |
аХпх1хп
Матрица
~т anixnxi^~ апгхпхг~т~ ¦ • ¦ ~г аппхп-
2 • • ¦ аш
D4)
А =
аи о12
а21 а22
ап
а„
называется матрицей квадратичной формы. Из самого ее определения
следует, что она симметрична, т. е. а^ = а^. Таким образом,-каждая
§ч
МАТРИЦЫ
31
квадратичная форма естественно связывается с некоторой симмет-
симметричной матрицей и обратно, каждой симметричной матрице может
быть соотнесена некоторая квадратичная форма.
Кзадратичная форма может быть коротко записана в матричных
обозначениях. Действительно,
F (л,, х2 хп) = х1
;, + а12х2 + • • • + alnxn) -f
, + a22x2 4- . . . + a2nxn) -f
n (anlxt
(.#!> Х%, • ¦
— (Xj, X2, • ¦
Xn)
x =
+ a12x2 +
+ a22X2 +
a y, —J— a y —н
W t^v 1 I **п2 2 '
«11 «12 • • • «1
«21 «22 • ¦ • «2
an% ¦
I у \
annxn _
X,
x2
nn - -xn—
= x'Ax, D5)
Вещественная квадратичная форма называется положительно-
определенной, если все ее значения при вещественных значениях
переменных положительны, за исключением значения при х1 = х2 ==
= ... =хп = 0.
Примером положительно-определенной формы может служить
форма х\ + х\+ ... +х*п.
Термин „положительно-определенный" распространяется также на
симметричные матрицы. Именно, вещественная симметричная мат-
матрица А = (аф называется положительно-определенной, если квадра-
п
тичная форма F (хи х2, . . ., хп) = 2 а^ххх$ положительно опре-
делена. Так, например, единичная матрица является положительно-
определенной, ибо соответствующая ей квадратичная форма положи-
положительно определена. Очевидно далее, что квазидиагональная матрица,
составленная из положительно-определенных ящиков, положительно
определена.
Понятие положительной определенности может быть распростра-
распространено на комплексные матрицы специального вида:— так называемые
эрмитовы матрицы, которые связываются с формами Эрмита. Этим
формам посвящен п. 6 § 12.
32 ОСНОВНЫЕ СВЕДЕНИЯ ИЗ ЛИНЕЙНОЙ АЛГЕБРЫ [гл I
Выясним, как изменяются коэффициенты квадратичной формы при
линейном преобразовании переменных. Пусть
х2 = Ь21у1 + Ьггу.г 4- • • ¦ + К
или, в матричной записи, х = By. Тогда
х'Ах = (By)' A (By) = у'В'АВу = у'Су,
где С = В'АВ. Легко видеть, что матрица С симметрична.
Действительно, С = (В'АВ)'= В'А'(В1)'= В'АВ = С, ибо А' = А,
(ву = в.
Таким образом, при линейном преобразовании переменных с мат-
матрицей В квадратичная форма превращается в квадратичную же форму,
причем ее матрица коэффициентов заменяется на матрицу В'АВ.
Отметим, что при преобразовании переменных с неособенной
матрицей В положительно-определенная квадратичная форма остается
положительно-определенной. Действительно, если предположить, что
при некоторой системе значений у0 преобразованная квадратичная
форма примет отрицательное или нулевое значение,.то исходная квадра-
квадратичная форма примет то же значение при системе значений перемен-
переменных хо — Вуо, что возможно только при хо = О, а следовательно,
и уо~0.
16. Трансформации Гаусса. Решение системы линейных урав-
уравнений
с невырожденной матрицей А всегда может быть приведено к реше-
решению системы с симметричной и даже положительно-определенной
матрицей. Это сведение основывается на следующей теореме.
Теорема 1.3. Если А невырожденная матраца, то матрицы А'А
и АА' положительно определены.
Доказательство. Если в квадратичной форме с единичной мат-
матрицей Е сделать замену переменных с матрицей А (соответственно
с матрицей А'), то получится квадратичная форма с матрицей
А'ЕА = А'А (соответственно АЕА' = АА'). Так как Е положительно-
определенна, положительно-определенными будут и матрицы А'А
и АА'.
Если систему уравнений
Ax=f
умножить слева на матрицу А', мы получим равносильную систему
А'Ах = A'f
§ 2] МАТРИЦЫ СПЕЦИАЛЬНОГО ВИДА 33
с положительно-определенной матрицей А'А. Такое преобразование
будем называть первой (левой) трансформацией Гаусса.
Вторая (правая) трансформация Гаусса заключается в том, что
вместо системы
Ax = f
рассматривается вспомогательная система
AA'y = f
с положительно-определенной матрицей АА'. Найдя решение у вспомо-
вспомогательной системы, мы найдем решение исходной системы по формуле
х = А'у.
§ 2. Матрицы специального вида
1. Симметричные матрицы. Симметричные матрицы обладают
рядом замечательных свойств, о которых речь будет впереди. Пока
мы лишь отметим, что произведение двух симметричных матриц не
всегда есть матрица симметричная. Точнее, произведение симметрич-
симметричных матриц есть симметричная матрица в том и только в том слу-
случае, когда они перестановочны. Действительно, (АВ)' = В'А' = ВА,
так что АВ = (АВ)', только если В А = АВ.
2. Ортогональные матрицы. Вещественная матрица называется
ортогональной, если сумма квадратов элементов каждого столбца
равна единице и суммы произведений соответствующих элементов из
двух различных столбцов равны нулю. Ортогональность матрицы
может быть охарактеризована одним матричным равенством, именно
А'А = Е. A)
Действительно, диагональные элементы матрицы А'А являются
суммами квадратов элементов столбцов матрицы А, а недиагональ-
недиагональные элементы равны суммам произведений соответствующих элемен-
элементов из двух различных столбцов. Ортогональные матрицы обладают
следующими свойствами.
1. Единичная матрица ортогональна.
2. Если А ортогональна, то А~1 = А/. Это следует из равен-
равенства А'А = Е.
3. Если А ортогональна, то А' тоже ортогональна. Другими
Словами, из выполнения условий ортогональности для столбцов ма-
матрицы А следует выполнение тех же условий для строк матрицы А.
В самом деле,
{А')' А' = АА' = АА = Е.
4. Произведение двух ортогональных матриц есть ортогональная
матрица. Действительно, если А и В ортогональны, то
(АВ)' АВ = В'А'АВ = В'ЕВ = Е.
34
ОСНОВНЫЕ СВЕДЕНИЯ ИЗ ЛИНЕЙНОЙ АЛГЕБРЫ
[ГЛ. I
5. Определитель ортогональной матрицы равен + 1. Действи-
Действительно, из А'А — Е следует, что
\А'А\ = \А'\.\А\ = \А\*=\.
Последнее обстоятельство определяет естественное разбиение
ортогональных матриц на два класса — собственно ортогональные
с определителем -f- 1 и несобственно ортогональные с определи-
определителем — 1.
К классу ортогональных матриц принадлежат элементарные
матрицы вращения вида
1
B)
1
где c2~f-s2=l. Последнее соотношение показывает, что существует
такой угол ср, что с = coscp, 5= sin ср.
Элементарные матрицы вращения отличаются от единичной матрицы
лишь четырьмя элементами, находящимися на пересечении двух строк
и двух столбцов с номерами i и _/, i<CJ- Эти четыре элемента соста-
tC, si [cOScp, sin ср 1
= I . , совпадающую с mi-
s, с] Lsin ?¦ cos T J
трицей преобразования декартовых координат на плоскости при пово-
повороте осей на угол ср.
В дальнейшем элементарные матрицы вращений будут неодно-
неоднократно использоваться как вспомогательные для преобразования дан-
данной матрицы А посредством цепочки умножений слева или справа,
или с обоих сторон на эти матрицы.
Очевидно, что при левом умножении матрицы А = (а^) на ма-
матрицу Тц изменяются лишь 1-я и у-я строки матрицы А, именно, для
матрицы ЛA) = ТцА будем иметь
»>•
C)
§2]
МАТРИЦЫ СПЕЦИАЛЬНОГО ВИДА
35
Соответственно, при умножении матрицы Л = (аа,) справа на ма-
матрицу Tjj изменяются только 1-Я и _/-й столбцы по формулам
аA) = са . -4- sa .
fl(i) I _ sa+ca3 (« = Ь 2. . . ., я). D)
Ясно, что если хотя бы один из двух элементов а^ и а^ отличен
от нуля, то можно подобрать ens так, чтобы для матрицы А = ТцА
элемент а(.У оказался равным нулю. Для этого нужно взять
С ir^ ——
с -—
E)
~tfi
При таком выборе sue получим
Теорема 2.1. Любая вещественная невырожденная матраца
посредством цепочки умножений слева на элементарные ма-
матрицы вращений может быть преобразована в правую треуголь-
треугольную матрицу, все диагональные элементы которой, кроме, может
быть, последнего, положительны.
Доказательство. Пусть
о12 ... ах
о», ... а.
гп
невырожденная вещественная матрица.
Допустим сначала, что ап ф 0. Умножим матрицу А слева по-
поочередно на матрицы Т12, Т13, .... Т1п, выбирая их так, чтобы
последовательно аннулировать все элементы первого столбца, кроме
верхнего. Этот же последний сделаем на первом шагу положительным
и далее будем сохранять его положительность.
Если же ап = 0, начнем преобразования с умножения на Гуо,
где /0 — наименьший номер, при котором а^ Ф 0. В силу предполо-
предположения о невырожденности матрицы А хотя бы один элемент первого
столбца отличен от нуля, так что такой номер j0 найдется.
После описанных преобразований мы придем к матрице
а'1' а*1» . .. а^ '
11 12 In
о <> ¦ • • <
причем aW > 0.
^ ... аЫ
п'2 пп
3*
36
ОСНОВНЫЕ СВЕДЕНИЯ ИЗ ЛИНЕЙНОЙ АЛГЕБРЫ
[ГЛ. I
В силу невырожденности матрицы ЛA) хотя бы один из элемен-
элементов а<2у, ..., а^ отличен от нуля. Теперь подбираем элементарные
матрицы вращений Т23, Ты Т2п так, чтобы после цепочки умно-
умножений на эти матрицы все элементы второго столбца ниже диаго-
диагонали обратились в нуль, а диагональный стал положительным. Затем
переходим к аннулированию поддиагональных элементов третьего
столбца и т. д. В конце процесса придем к матрице
т
п-1п
т ,
«IV
«й!
О 0 ...
в которой все диагональные элементы, кроме, может быть, послед-
последнего а^пп^' положительны. Знак a<-™~V совпадает, очевидно, со зна-
знаком определителя матрицы А. Теорема доказана.
Отметим, что общее число матричных умножений для получения
матрицы А не превосходит числа поддиагональных элементов, рав-
п(п— 1)
ного ——s—— .
Следствие I. Всякая невырожденная вещественная матрица
есть произведение собственно ортогональной на правую тре-
треугольную.
= Gге_
ге_1ге
Г^)
есть соб-
собДействительно, Л
ственно ортогональная матрица;
Следствие 2. Всякая собственно ортогональная матраца
есть произведение элементарных матриц вращения.
Действительно, пусть А собственно ортогональная матрица. Тогда
1 r_i
А — 112 • • • 1 n-lre
Ап-1)
причем все диагональные элементы матрицы А^п~1) положительны.
Легко видеть, что матрица ,А^п~^ единичная. Действительно, сумма
квадратов элементов первого столбца равна единице, откуда- следует,
что а^=1. Из того, что сумма произведений элементов первого
столбца на элементы каждого другого столбца равна нулю, заклю-
заключаем, что aft =...== а^п = 0. Далее, сумма квадратов элементов
второго столбца равна единице. Следовательно, о.^=\ и т. д. Так
последовательно заключаем, что все недиагональные элементы ма-
матрицы Л*") равны нулю, а все диагональные элементы равны
единице.
Симметричные матрицы, так же как и ортогональные матрицы,
входят в более общий класс так называемых нормальных матриц.
Вещественная матрица называется нормальной, если она пере-
перестановочна со своей транспонированной, т, е. если
§2]
МАТРИЦЫ СПЕЦИАЛЬНОГО ВИДА
37
3. Эрмитовы матрицы. Матрица с комплексными элементами
называется эрмитовой, если
F)
или в сокращенной записи
fly = aji>
= А*.
Из определения следует, что диагональные элементы эрмитовой
матрицы вещественны. Вещественные симметричные матрицы являются
частным случаем эрмитовых. Многие свойства вещественных симме-
симметричных матриц сохраняются почти без изменений для матриц эрми-
эрмитовых. В частности, произведение эрмитовых матриц будет эрми-
эрмитовой матрицей тогда и только тогда, когда они перестановочны.
Далее, для любой матрицы с комплексными элементами матрица Af A
будет эрмитовой.
4. Унитарные матрицы. Матрица с комплексными элементами на-
называется унитарной, если суммы квадратов модулей элементов
столбцов равны единице и суммы произведений элементов одного
столбца на числа комплексно-сопряженные к элементам другого столбца
равны нулю. Унитарные матрицы могут быть охарактеризованы ма-
матричным равенством
А*А — Е. G)
Ортогональные матрицы являются, очевидно, частным случаем уни-
унитарных.
Свойства 1—4 ортогональных матриц сохраняются и для матриц
унитарных. Определитель унитарной матрицы есть комплексное число,
по модулю равное единице. Как эрмитовы, так и унитарные матрицы
входят в более общий класс комплексных нормальных матриц, ха-
характеризуемых тем, что они перестановочны со своей сопряженной
матрицей.
К унитарным матрицам относятся элементарные унитарные ма-
матрицы вида
1
(8)
38
ОСНОВНЫЕ СВЕДЕНИЯ ИЗ ЛИНЕЙНОЙ АЛГЕБРЫ
[ГЛ. t
при с > 0, s > О, c2 + s2=l, срх — ср2 — фз — ?4- Определитель та-
такой матрицы равен e*(?i + ?<). Он равен единице в том и только в том
случае, когда ср4 = — cpi и, следовательно, ср3 =—?2 (с точностью
до кратных 2тс).
Если даны два комплексных не равных одновременно нулю числа
а и Ь, то всегда можно подобрать такие с, s, cpt и ср2, что
асе**' — (
ase~l4* -4- be
> О
Для этого достаточно взять
,_ \b
s =.
Y\ а I3 + I Ъ Г2
= — arg а;
(9)
Это замечание позволяет доказать теорему:
Теорема 2.2. Всякая невырожденная комплексная матрица А
преобразуется посредством умножения слева на цепочку эле-
элементарных унитарных матриц с определителями, равными еди-
единице, в правую треугольную матрицу, все диагональные элементы,
которой, кроме, может быть, последнего, положительны.
Ясно, что аргумент этого последнего элемента совпадает с аргу-
аргументом определителя матрицы А.
Из теоремы вытекают следующие следствия.
Следствие I. Всякая невырожденная комплексная матрица
представима в виде произведения унитарной матрицы с опреде-
определителем, равным единице, на правую треугольную, все диаго-
диагональные элементы которой, кроме, может быть, последнего,
положительны.
Следствие 2. Всякая унитарная матрица с определителем,
равным единице, есть произведение элементарных унитарных
матриц с определителями, равными единице.-
5. Трехдиагональные матрицы. Трехдиагональной ма-
матрицей называется матрица вида
~ al bt 0 . .. О О
Ci a2 b2 . . . О О
0 c2 a3 . .. О О
О О О ... а„_! bn
_0 0 0 ... cn_, en
Вещественная трехдиагональная
вой, если Ьгсг > Олри ?— 1, 2
матрица
п—1.
(Ю)
называется якобие-
Любая симметричная
§2]
МАТРИЦЫ СПЕЦИАЛЬНОГО ВИДА
39
трехдиагональная матрица с ненулевыми недиагональными элементами
автоматически будет якобиевой.
Трехдиагональные матрицы замечательны тем, что их характери-
характеристические полиномы вычисляются по несложным рекуррентным фор-
формулам. Пусть срй(?) есть нормированный характеристический полином
укороченной матрицы, т. е. матрицы
с, а., Ьо
сН-
Тогда
?*(') = (—
1 «&_
И* —
= (-1)
с, — t b2
Раскладывая этот определитель по элементам последнего столбца,
получим, при k ^> 3,
а1 — t bv
Т*@ = — (a* —
—(- 1)
ак-2
Cli_l
= (t— aft)cpft_! (tj — ^ft-iCfc.i
A1)
Последняя формула остается верной и для А = 2, если положить
<ро=1. Ясно, что <р1(^) = / — av Полагая ? = 2,3 п, мы по-
последовательно определим полиномы <р2(?), фз(О> ••••?»@. r^e ?n (О
характеристический полином данной трехдиагональной матрицы.
Для матрицы Якоби последовательность полиномов ср0, cpt (t), . ..
...,yn(t) является последовательностью Штурма1). Так как старшие
коэффициенты всех этих полиномов положительны, то, согласно тео-
теореме Штурма, все корни этих полиномов вещественны, Причем
корни двух соседних полиномов разделяются. Итак, все собственные
значения якобиевой матрицы вещественны и различны.
*) А. Г. Курош. Курс высшей алгебры, 1949, стр. 269.
40
ОСНОВНЫЕ СВЕДЕНИЯ ИЗ ЛИНЕЙНОЙ АЛГЕБРЫ
[гл. I
Изложим один прием для решения системы линейных уравнений
с трехдиагональной матрицей. Пусть
—А
= /2
=/3
а2х2
сп-2хп-2~\- ап-1хп-1 ~Ь Ьп-1хп —/я-1
cn-lxn-l~\~anxn —fn
Допустим, что ЬгФО, /=1,2 п—1. Если это условие не
выполнено, то из системы выделяется система с меньшим числом
неизвестных.
Отбросим последнее уравнение и найдем два решения л:'0) и х^
оставшейся системы из и—1 уравнений, положив xi°*=0, jc^—I.
Для этого придется дважды решить систему с треугольной матрицей.
Очевидно, что столбец x^-\-t(x^1 — jc<°)) при любом t будет давать
решение срезанной системы. Найдем t так, чтобы удовлетворялось
и отброшенное ранее последнее уравнение.
Для этого нужно решить уравнение
Откуда
t =^г -
где г^р и г^> невязки последнего уравнения при подстановке реше-
решений лг<°) и jcW.
6. Почти треугольные матрицы. Матрица называется (правой)
почти треугольной, если она имеет вид
A2)
о о
о
Определитель почти треугольной матрицы связан простым рекур-
рекуррентным соотношением со своими главными минорами. Именно, если
положить До = 1 и обозначить
(ft = 1.2 я).
«11
«21
0
«12
«22
0
• • • «lft
¦ • • «2ft
... akk
§ 3] АКСИОМЫ ЛИНЕЙНОГО ПРОСТРАНСТВА 41
ТО
Aft = акк Aft-l — акк-\ ak-lk ^ft-2 + akk-l ак-\ к-г ак-2 к Aft-з
A3)
В этом легко убедиться посредством разложения определителя Дл
по элементам последнего столбца.
Применение этой формулы к вычислению определителя требует
выполнения примерно -^- умножений, что, как мы увидим далее, не-
несколько меньше, чем число операций для вычислений определителя
общего вида.
Формула A3) может быть применена к рекуррентному построению
характеристического полинома почти треугольной матрицы, именно
<?к@ = (t — акк) срй_! (t) — акк_1 ак_1 к cpft_2(t) —
ak_lk_2 ... а21а1к. A4)
Здесь
а
' а\
Н\ 2 • • • '
— а2Х t — аг2 . . . — (
О
О
— акк
:= 1, 2; .... п).
§ 3. Аксиомы линейного пространства
Как известно, методы аналитической геометрии дают возможность
сопоставлять одному из важнейших геометрических объектов—век-
объектов—вектору пространства — тройку вещественных чисел — проекций вектора
на выбранные оси координат. Такое сопоставление делает возможным,
с одной стороны, исследовать свойства геометрических объектов
средствами алгебры и, с другой стороны, интерпретировать геомет-
геометрическими образами некоторые алгебраические задачи. Например,
совместное решение системы трех линейных уравнений с тремя неиз-
неизвестными интерпретируется как задача о пересечении трех плоскостей
в пространстве.
Это обстоятельство делает разумным и целесообразным введение
геометрической терминологии в линейную алгебру.
Ясно, что для возможности геометрической трактовки линейной
алгебры понятие вектора должно быть надлежащим образом обобщено.
Это обобщение осуществляется посредством введения так называемого
линейного пространства. Мы введем это понятие аксиоматически.
Линейным пространством называется совокупность ма-
математических (или физических) объектов, для которых определены два
действия — сложение и умножение на любые вещественные или любые
42 ОСНОВНЫЕ СВЕДЕНИЯ ИЗ ЛИНЕЙНОЙ АЛГЕБРЫ [ГЛ. I
комплексные числа, причем эти действия удовлетворяют следующим
требованиям (аксиомам):
1) X + Y = Y-j-X (переместительный закон);
2) (X + Y) + Z = X-f(Y+Z) (сочетательный закон);
3) существует „О", т. е. такой элемент, что Х + 0 = Х при лю-
любом X;
4) для любого X существует противоположный элемент „—X",
такой, что Х + (— Х) = 0;
5) 1 Х = Х;
6) (a + 6)X = aX-f-ftX;
7) a(X + Y)-=aX + «Y;
8) a(bX) = abX.
Элементы линейного пространства называются векторами.
Из перечисленных аксиом легко выводятся единственность нуле-
нулевого элемента, единственность противоположного элемента, равенства
0Х = аО = 0, (—Х) = (—1)Х. Мы не будем останавливаться на до-
доказательстве этих утверждений.
Пространство называется вещественным, если для его век-
векторов определено умножение только на вещественные числа, и ком-
комплексным, если определено умножение на комплексные числа.
Пространство называется конечно-мерным, если выполнена
следующая аксиома:
9) Существует конечное число векторов Х^ ..., Xjv таких, что
любой вектор пространства представляется в виде
СА + • • • + cNxN.
Размерностью конечно-мерного пространства называется наимень-
наименьшее число векторов, удовлетворяющих требованию аксиомы 9. Если же
аксиома 9 не выполнена, то пространство называется бесконечно-мер-
бесконечно-мерным. Изучение бесконечно-мерных пространств выходит за рамки
линейной алгебры, и, при тех или других дополнительных ограниче-
ограничениях, бесконечно-мерные пространства исследуются в одной из важ-
важнейших математических дисциплин — в функциональном анализе.
Как в вещественном, так и в комплексном линейном пространстве,
может быть введено понятие скалярного произведения сле-
следующим образом. Каждой паре векторов X, Y сопоставляется число
(X, Y).(вещественное в вещественном пространстве, комплексное в ком-
комплексном), причем должны быть удовлетворены следующие аксиомы:
10) (X, X) > Снесли Х^=0; (X, Х) = 0, если Х = 0;
11) (X. Урсуле);
12) (Xt + X2, Y) = (Xlf Y) + (X2, Y);
13) (aX, Y) = a(X, Y).
Для вещественного пространства одиннадцатая аксиома выглядит
проще, именно (X, Y) = (Y, X).
§ 3] АКСИОМЫ ЛИНЕЙНОГО ПРОСТРАНСТВА 43
Вещественное линейное пространство с так определенным ска-
скалярным произведением называется эвклидовым пространством,
комплексное — у нитарным пространством.
Число Y(X, X) называется длиной вектора и обозначается | X .
Скалярное произведение двух векторов удовлетворяет следующему
важному неравенству:
|(Х, Y)|<|X| • |Y|, A)
которое называется неравенством Коши — Буняковского. Докажем
его. При X—-О неравенство очевидно. Пусть X ф 0. Введем вектор
(Y X)
Z = Y — аХ, где а = ; ' , и подсчитаем квадрат его длины, при-
(л, л;
нимая во внимание, что
(Z, X) = (Y, X) — а (X, X) = 0.
Имеем
|Z|2 = (Z, Z) = (Z, Y— aX) = (Z, Y) = (Y— aX, Y) = (Y, Y) — a(X, Y) =
(Y, X) (X, Y) _ I X |» • 1 Y I3 - I (X, Y) \*
~Ul X) (X,X) ~~ |XP
Следовательно, | X |2 • | Y |2 — | (X, Y) [2 = | X |3 • | Z |2 > 0, откуда не-
непосредственно следует неравенство A).
Для пары ненулевых векторов X и Y в эвклидовом пространстве
естественным образом вводится понятие угла по формуле
(X, Y) ,о,
C0S ? = B)
(X Y)
Это определение всегда имеет смысл, ибо число Л. ' по
^Т I » |
лютной величине не превосходит единицы в силу неравенства Коши —
Буняковского.
Важнейшим примером линейного пространства является так назы-
называемое арифметическое пространство. Векторами этого простран-
пространства являются упорядоченные совокупности из п вещественных (комп-
(комплексных) чисел, которые называются компонентами. Два вектора ариф-
арифметического пространства считаются равными в том и только в том
случае, если равны их соответствующие компоненты. Действия сложе-
сложения и умножения на вещественное (комплексное) число определяются
покомпонентно. Тем самым эти действия для векторов арифмети-
арифметического пространства ничем не отличаются от тех же действий для
строк (т. е. однострочных матриц). Следовательно, все формальные
законы этих действий, установленные на стр. 9 для произвольных
матриц, верны и для векторов, так что ^аксиомы 1 — 8 линейного
пространства оказываются выполненными. Роль нулевого вектора
играет вектор, все компоненты которого равны нулю. Противопо-
Противоположным вектором — X для вектора X является (—1)Х.
44
ОСНОВНЫЕ СВЕДЕНИЯ ИЗ ЛИНЕЙНОЙ АЛГЕБРЫ
[ГЛ. t
Выполнение аксиомы 9-й вытекает из того, что любой вектор
арифметического пространства допускает представление в виде
X = *!*!+ •• • ~\-хпеп,
где е^ вектор, 1-я компонента которого равна 1, а все остальные
равны нулю. Ниже будет установлено, что не существует системы
векторов, удовлетворяющих требованию аксиомы 9-й и состоящей
из меньшего чем п числа векторов. Тем самым арифметическое про-
пространство, векторы которого составлены из п чисел, оказывается
«-мерным линейным пространством.
Пространство, составленное из векторов с вещественными компо-
компонентами, является вещественным линейным пространством; простран-
пространство, составленное из векторов с комплексными компонентами, является
комплексным пространством.
Скалярное произведение вводится по формуле
(X, Y) = xJl + ... -±-хпуп,
которая в вещественном пространстве принимает более простой вид
(X, Y) = xly1 + ... -\-хпуп.
Легко проверяется, что скалярное произведение удовлетворяет
аксиомам 10—13.
Длина вектора равна, очевидно, ]/ | хх p-f- ... -f-1 xn |2.
Скалярное произведение векторов -арифметического пространства
может быть выражено и в терминах матриц. Именно,
(X, Y) = xlyl -f • • • + хпуп =
X,
= (*t хп)
-Уп-i-
где (yv ...,yn) строка из чисел, комплексно-сопряженных с компо-
компонентами вектора Y, а (хи ..., х„) строка, элементы которой равны
компонентам вектора X.
Другими примерами линейных конечно-мерных пространств
являются: совокупность всех матриц данного строения, совокупность
полиномов от одной переменной, степень каждого из которых не
превосходит данного числа, совокупность решений линейного одно-
однородного дифференциального уравнения и т. д.
В некоторых из этих пространств естественным образом вводится
скалярное умножение. Так, в пространстве полиномов ограниченной
§ 4) БАЗИС И КООРДИНАТЫ 45
степени с вещественными коэффициентами скалярное произведение
полиномов /j (t) и /2 (t) может быть определено как I /t (t) /2 (t) dt.
а
Легко видеть, что при этом все аксиомы 10—13 выполнены.
В линейных пространствах, возникающих в связи с изучением
конкретных задач, скалярное произведение обычно вводится так,
чтобы оно находилось в естественной связи со специфическими осо-
особенностями элементов изучаемого пространства.
В некоторых задачах, исследуемых методами линейной алгебры,
вообще не возникает необходимости во введении скалярного произ-
произведения.
Линейное пространство, в котором не вводится действие скаляр-
скалярного умножения, называется афинным пространством, и, вообще,
те свойства пространства, которые не связаны с понятием скалярного
умножения, называются афинными свойствами.
С описания афинных свойств мы и начнем систематическое из-
изложение. При этом мы, вообще говоря, не будем оговаривать,
о каком пространстве идет речь — о вещественном или комплексном,
в виду полного параллелизма формулировок и доказательства резуль-
результатов.
§ 4. Базис и координаты
1. Линейная зависимость. Вектор Y = с^ -)- с2Х2 + . . . -\-стХт
называется линейной комбинацией векторов Xv Х2, . . ., Хп.
Легко видеть, что если векторы Y^ Y2, ..., Yk являются линей-
линейными комбинациями векторов Xt, Х2, .. ., Хт, то любая их линей-
линейная комбинация Ti^iH"Тг^гЧ~ ••• А~1к^к является также линейной
комбинацией векторов Х1? Х2 Хт.
Векторы Xt, X2 Хт называются линейно-зависимыми,
если существуют такие числа cv с2 ст, не равные нулю одновре-
одновременно, что имеет место равенство
c1X1 + c2X2+ ... +стХт = 0. A)
Если же это равенство имеет место только тогда, когда все постоян-
постоянные clt с2, . . ., ст равны нулю, то векторы Хь Х2, . . ., Хт назы-
называются линейно-независимыми.
Если векторы Xlt X2, ..., Хт линейно-зависимы, то по крайней
мере один из них является линейной комбинацией остальных. Дейст-
Действительно, если, например, ст Ф 0, то из A) находим:
cl v сг v cm—l v /о\
т33 у Л1 ~г—Л2— ••¦ -г лот-1- К*)
Теорема 4. /. Если векторы Yv Y2, .. ., Yk являются линей-
линейными комбинациями векторов Xlt Х2. .... Хот и А > т, то они
линейно-зависимы.
46
ОСНОВНЫЕ СВЕДЕНИЯ ИЗ ЛИНЕЙНОЙ АЛГЕБРЫ
[ГЛ. t
Доказательство проведем методом математической индукции.
Для т= 1 теорема очевидна. Допустим, что теорема верна в пред-
предположении, что число комбинируемых векторов равно т— 1, и в этом
предположении докажем ее для т комбинируемых векторов. Пусть
•1 == ^Л |~ • • ¦ ~Г" Смп^т
»ft := ckU*i —р
Могут представиться два случая.
1. Все коэффициенты
Тогда Yu Y2,
только т—1
ложения Yt, .
2. Хотя
, с21, . . .,' ск1 равны нулю.
Ym фактически являются линейными комбинациями
Хт. В силу индукционного предпо-
предповекторов Х2
.., Yft будут линейно-зависимы,
бы один коэффициент при
Х1 отличен от
нуля. Без нарушения общности можно считать, что сп ф 0.
Рассмотрим систему векторов
V' v
1 9 lo
2t v
1
к ~ к
Построенные векторы, очевидно, являются линейными комбина-
комбинациями векторов Х2, . ¦ ., Хт, и число их k— 1 больше m— 1. В силу
индукционного предположения, они линейно-зависимы, т. е. найдутся
числа f2> ¦¦•> Т&> не равные нулю одновременно, такие, что
Подставляя вместо Y2,
получим
., Y^. их выражение через Yt
где ifi = — ^f"T2 —
^" Т&-
Числа
следовательно,
' Тг
Y2,
не Равны
линейно-
нулю одновременно и
зависимы.
2. Базис пространства. Система линейно-независимых векторов
называется базисом пространства, если любой вектор пространства
является линейной комбинацией векторов этой системы.
Например, в арифметическим пространстве векторы elt ..., еп
образуют базис. Действительно, они линейно-независимы, так как
компонентами вектора с!е1-\- ... -\- с„еп являются сх сп и
потому кз раьенства с1е1-\- ... +с„еп = 0 следует, что с1 =
§ 4] БАЗИС И КООРДИНАТЫ 47
= с2 = ... = сп = 0. Далее для любого вектора X с компонентами
х1 хп имеем
X = х1е1 -\- . . . -f- xnen.
Базис ev ..., еп будем называть естественным базисом
арифметического пространства.
Установим теперь, что в общем линейном конечно-мерном про-
пространстве всегда существует базис. Пусть п—размерность простран-
пространства. В силу определения размерности в пространстве существует
система п векторов Uv ..., Un таких, что все векторы простран-
пространства являются их линейными комбинациями и не существует системы
из меньшего числ-а векторов, обладающих тем же свойством.
Покажем, что векторы Ux Vn образуют базис пространства,
для чего достаточно установить их линейную независимость. Но она
почти очевидна. Действительно, если допустить, что векторы
Ui, • • -, Un линейно-зависимы, то хотя бы один из них, например U,,,
был бы линейной комбинацией остальных U^ ..., Un_t. Тогда все
векторы пространства оказались бы линейными комбинациями векто-
векторов Uj, . . ., Uw_], что противоречит тому, что п есть размерность
пространства.
Как мы увидим ниже, базис пространства не единственен, и в вы-
выборе базиса имеется широкий произвол.
Теорема 4.2. В п-мерном пространстве не существует более
чем п линейно-независимых векторов.
Доказательство. Действительно, в n-мерном пространстве суще-
существует базис, состоящий из п векторов и^ •-., Un. Любая система
из т >• п векторов будет состоять из линейно-зависимых векторов
в силу теоремы 4.1.
Следствие. Число векторов базиса пространства не зависит
от выбора базиса и совпадает с размерностью пространства.
Действительно, базис «-мерного пространства не может состоять
меньше чем из п векторов по определению размерности и больше
чем из п векторов в силу теоремы 4.2.
Из теоремы 4.2 следует, что размерность арифметического про-
пространства, составленного из л-компонентных векторов, действительно
равна п, ибо в этом пространстве существует естественный базис
ev .. ., еп, состоящий ровно из п векторов.
Произвол в выборе базиса выясняет следующая теорема.
Теорема 4.3. Любая система из п линейно-независимых век-
векторов образует базис п-мерного пространства.
Доказательство. Пусть Ux UB система из п линейно-
независимых векторов и X — любой вектор пространства. По тео-
теореме 4.1 векторы Ui, ..., \Jn, X линейно-зависимы, ибо каждый
из них является линейной комбинацией базисных векторов, число
которых равно п. Следовательно, найдутся не равные одновременно
нулю числа с0, сх сп такие, что c0X + ciUt+ ... -f-c,(Uw = Q-
48 ОСНОВНЫЕ СВЕДЕНИЯ ИЗ ЛИНЕЙНОЙ АЛГЕБРЫ {ГЛ. Г
При этом с0 Ф 0, ибо если со = 0, то ctUj+ ... -f-cwUn = O, что
противоречит линейной независимости векторов U^ .... Un. Следо-
Следовательно,
Итак, мы доказали, что любой вектор пространства есть линейная
комбинация векторов Ur Un, откуда следует, что векторы
Ui 11„ образуют базис.
Доказанная теорема позволяет указать следующую конструкцию
для построения базиса. Возьмем вектор Uj произвольным, только
отличным от нуля. Вектор U2 возьмем произвольно, но неравным
линейной комбинации вектора иг (такой вектор найдется, если п ]> 1).
Далее, за вектор U3 примем произвольный вектор, не являющийся
линейной комбинацией первых двух и т. д. В силу определения раз-
размерности эта конструкция позволит нам построить систему из п
векторов U,, U2, •••, Un, которые будут линейно-независимыми
в силу самой конструкции. Из описанной конструкции также сле-
следует, что любую систему линейно-независимых векторов можно до-
дополнить до базиса пространства.
3. Координаты векторов. Пусть []l UB какой-либо базис
пространства. Тогда каждый вектор X является линейной комбина-
комбинацией векторов Up .... Un, именно
х^^и^ ••• +*«и„. C)
Коэффициенты в этом разложении однозначно определяются векто-
вектором X, ибо если
то
и, следовательно,
х1 х1= ... =хп ¦*„ —О
в силу линейной независимости векторов 1^, ..., UB.
Коэффициенты xlt ..., хп называются координатами век-
вектора X в базисе 1^, .... 11„.
В арифметическом пространстве компоненты вектора хх хп
являются, очевидно, его координатами в естественном базисе.
Введение координат дает возможность каждому вектору X общего
линейного и-мерного пространства сопоставить столбец Х=
:=(х1 хп)' из его координат в выбранном базисе Ux \За.
При этом любой столбец X=(xt х„У окажется сопоставлен
некоторому вектору, именно вектору X^^iUiH- ... -\-xn\Jn. Если
вектору X сопоставлен столбец X, то вектору сХ будет сопоставлен
столбец сХ, если векторам X и Y сопоставлены столбцы X и К, то
вектору X-j-Y будет сопоставлен столбец Х-\- Y. Построенное
соответствие, очевидно, взаимно однозначное,
§ 4] БАЗИС И КООРДИНАТЫ 49
Таким образом, каждый выбор базиса определяет представление
векторов л-мерного пространства в виде столбцов из их координат.
Каждое;такое представление взаимно однозначно. Произведение числа
на вектор представляется произведением того же числа на столбец,
представляющий вектор. Сумма векторов представляется суммой
столбцов, представляющих слагаемые, иначе говоря, эти представле-
представления являются изоморфными — действиям над векторами соот-
соответствуют одноименные действия над представляющими их столбцами.
Для арифметического пространства в частности, естественный
базис порождает представление векторов арифметического простран-
пространства в виде столбцов из их компонент. Такое представление мы
будем называть естественным. Однако другие выборы базиса дают
другие представления векторов арифметического пространства в виде
столбцов.
Из приведенных рассуждений ясно, что общее линейное простран-
пространство размерности п изоморфно арифметическому пространству той же
размерности.
В вычислительных задачах линейной алгебры подлежащие опре-
определению совокупности неизвестных и совокупности чисел, входящих
в исходные данные, следует объединять в столбцы. Оказывается це-
целесообразным рассматривать их как векторы арифметического про-
пространства в их естественном представлении, а при решении задач
переходить к другим представлениям, находящимся в той или другой
связи со спецификой задачи.
4. Преобразование координат. Выясним, как изменятся коорди-
координаты вектора при изменении базиса. Пусть Ux, U2 UB и
Uj, \]'r . . ., \)'n два базиса и пусть
Свяжем с преобразованием координат матрицу, столбцы которой
состоят из координат векторов U^, U'2, . .., М'п в базисе l^, U2. ¦ • •. Un,
т.
е.
матрицу
А =
аи
012
а
¦ ¦¦ Ощ
... а2я
¦•• апп_
Матрица А неособенная, ибо она имеет обратную матрицу, посред-
посредством которой векторы Uv U2 Un выражаются через векторы
ц. и;..... и;.
4 Зак. 974. Д. К. Фаддеев и В. И. Фаддеев^
50
ОСНОВНЫЕ СВЕДЕНИЯ ИЗ ЛИНЕЙНОЙ АЛГЕБРЫ
[ГЛ. I
Обозначим через xlt хг, .... хп координаты вектора X в базисе
U[, U2, ••-, Un, через x'v х'ч, ..., х' координаты в базисе
Uj, Щ, ..., U'n. Найдем зависимость между старыми и новыми коор-
координатами. Имеем
К
х'п
Отсюда, в силу линейной независимости векторов Uv U2,
^i=aii^i + ai2<+ •¦• +аых'п
.. un.
F)
ХП =
Последние равенства можно записать в матричной форме
где
V
X
и Х' =
~х'г
х'
суть столбцы, составленные из координат вектора X л базисах
§ 5. Подпространства
1. Определение подпространства, размерность, базис. Под-
Подпространством пространства R называется множество векторов
X ? R такое, что любая линейная комбинация векторов множества снова
§ 5] ПОДПРОСТРАНСТВА 51
является вектором множества. Очевидно, что множество, состоящее
только из нулевого вектора, так же как и все пространство, являются
подпространствами в смысле этого определения. Мы будем называть
их тривиальными подпространствами.
Ясно, что совокупность векторов, образующих подпространство,
удовлетворяет аксиомам 1-—8 линейного пространства, так что под-
подпространство, рассматриваемое само по себе, является линейным
пространством. Нетрудно убедиться в том, что подпространство
д-мерного пространства будет конечно-мерным и его размерность
не превосходит числа п. Действительно, в подпространстве (как и
во всем пространстве) может существовать не более чем п линейно-
независимых векторов.
В каждом подпространстве, очевидно, существует свой базис,
причем число векторов базиса (размерность подпространства) не
более чем п.
Если размерность подпространства равна п, то оно совпадает
со всем пространством. В самом деле, базис U1? ..., \Jn подпро-
подпространства состоит из линейно-независимых векторов в количестве,
равном размерности всего пространства и, следовательно, является
базисом всего пространства.
Теорема 5.1. Любой базис Ut Vm подпространства может
быть дополнен до базиса всего пространства.
Доказательство. За первые т базисных векторов можно взять
векторы Up . . ., Um, ибо они линейно-независимы, а, как мы видели
выше, любая система линейно-независимых векторов может быть
дополнена до базиса всего пространства.
2. Подпространство, натянутое на данную систему векторов.
Если дана совокупность векторов Х^ ..., Хт линейно-независимых
или даже линейно-зависимых, то, очевидно, множество всевозможных
их линейных комбинаций образует подпространство. Так построен-
построенное подпространство называют подпространством, натянутым на
систему векторов Х{, ¦ ¦ •, Хт.
Теорема 5.2. Размерность подпространства, натянутого на
данную систему векторов X,, ..., Хт, равна рангу матрицы,
составленной из координат этих векторов по отношению к лю-
любому базису.
Доказательство. Пусть
' X и . . . X1 ~™
матрица, столбцами которой являются, соответственно, координаты
данных векторов Х^ . .., Хт относительно некоторого базиса. Пусть
ранг этой матрицы равен г. Тогда, по определению ранга, суще-
существует отличный от нуля минор порядка г матрицы А, а все миноры
4*
52
ОСНОВНЫЕ СВЕДЕНИЯ ИЗ ЛИНЕЙНОЙ АЛГЕБРЫ
[ГЛ. 1
порядков г-\- 1 и выше равны нулю или не могут быть составлены.
Без нарушения общности (в случае необходимости можно изменить
нумерацию данных векторов Х1( .... Хт и базисных векторов, что
равносильно изменению нумерации столбцов и строк матрицы S)
можно принять, что отличным от нуля минором является
х
х1
xrv
xr
Докажем, что векторы Хх Хг образуют базис подпростран-
подпространства Р, натянутого на векторы Х1 Хпг. Установим, прежде
всего, линейную независимость векторов Xt Хг. Пусть
Записывая это равенство в координатах, получим
с1хп + • •• Л~сгхХг =0
c,xr
¦ crxrr = 0
crxr+lr = 0
с,х
1лп\
+ • • ¦ + сгхпг = 0.
Первые г равенств представляют собой систему г линейных одно-
однородных уравнений относительно сх сп определитель из коэф-
коэффициентов которой равен 8 Ф 0. Следовательно, эта система имеет
единственное решение, именно ct= ... =cr — Q. Тем самым линей-
линейная независимость векторов Хг Хг установлена.
Покажем теперь, что все данные векторы Xt, . .., Хг, Хг+1, .... Хт
являются линейными комбинациями X! Хг. Для векторов
Х1 Хг это тривиально, так что нужно рассмотреть только век-
векторы Xs, s = r+l т.
Рассмотрим определитель
x
lr
x
ls
... xrr xrs
... zr г
,'де 2V ..., zr, г некоторые числа, значения которых нам безраз-
безразличны. Через Мь М2, ..., Mr, M обозначим алгебраические допол-
дополнения элементов последней строки в определителе As.
§5]
ПОДПР ОСТРАНСТВА
53
Рассмотрим вектор Y = M1X14- ... -f- MrXr-{- MXS. Его коор-
координатами будут
= М1хи
• • • 4- Mrxlr ~f Mxu
уг = MjXrJ 4- • • • 4- Mrxrr
Л+1 = ^i^r+n+ ••• + M
Уп = ^i^»i +•••+¦ Mrxnr
Первые г координат ух уг равны нулю, так как они предста-
представляют собой суммы произведений алгебраических дополнений эле-
элементов последней строки определителя Д8 на соответствующие эле-
элементы других строк. Остальные координаты yr+i, ¦¦¦, Уп тоже
равны нулю. Действительно,
X,
... X
\г
X
is
Х
У п =
х.
X,
кп
X
nl
и они равны нулю как миноры г4-1'го порядка, составленные из
матрицы Е ранга г. Следовательно, Л11Х14- • • ¦ -\- MrXr-\- MXS = 0.
Так как М = S Ф 0, то
м.
М
Итак, мы доказали, что векторы Х^ . . ., Хг линейно-независимы
и все векторы Xt Xm являются их линейными комбинациями.
Следовательно, векторы Xv ..., Хг образуют базис подпростран-
подпространства Р, ибо любая линейная комбинация векторов Хх, .... Хт
является и линейной комбинацией векторов Xt Хг. Тем самым
Доказано, что размерность подпространства равна г, что и требова-
требовалось доказать.
В терминах теории матриц теорема 5.2 может быть переформу-
переформулирована следующим образом: максимальное число линейно-не за-
зависимых столбцов матрицы, так же как и максимальное число
линейно-независимых строк, совпадает с рангом матрицы.
54 ОСНОВНЫЕ СВЕДЕНИЯ ИЗ ЛИНЕЙНОЙ АЛГЕБРЫ [гЛ. t
3. Относительный базис. Пусть Р есть подпространство раз-
размерности т в л-мерном пространстве R. Векторы Vt, ..., Vft назы-
называются линейно-независимыми относительно Р, если
никакая их линейная комбинация, кроме нулевой, не принадлежит Р,
иными словами, если из c1Vl —j— ... +cftVfc(;P следует, что
сх= ... = cfc = 0.
Система векторов Vj \к называется базисом R относи-
относительно Р, если векторы Vp ..., \к линейно-независимы относи-
относительно Р и если всякий вектор из R представляется в виде суммы
некоторого вектора из Р и линейной комбинации векторов Vt, . . ., Vft.
Теорема 5.3. Пусть lil Um базис подпространства Р.
Векторы Wt \k линейно-независимы относительно подпро-
подпространства Р в том и только в том случае, если векторы
Uj, ••., Um, Vt, ..., Vft линейно-независимы.
Доказательство. Пусть Vt, ..., \k линейно-независимы отно-
относительно Р И ПуСТЬ ClVl+ ••¦ +cftVft+dlUi+ ... -Jf-dmUm = O.
Тогда clV1-\- ... 4-CftVft = — djVi— ... —dm\Jm?P. Следова-
Следовательно, ci= ... = ck = 0 по определению линейной независимости
относительно Р. Поэтому dt\]t + •¦• -j-dm[Jm — O, откуда dt = . ..
. ..= dm = 0. Таким образом, векторы Vt, •••, Vfc, Ut, ..., Um
линейно-независимы, так что необходимость сформулированного усло-
условия доказана.
Допустим теперь, что векторы Vv ..., Vft, их Um линейно-
независимы. Пусть Y = cl\l -f- . • . + СЛ ? Р. Тогда Y = d^i -\- . . .
... +dm\Sm, откуда CiV,+ ... -{-c1yh — dx\il— ... — rfmUm = 0.
В силу линейной независимости векторов V^ .... Vj, Uj, ..., \im
все коэффициенты в последнем равенстве равны нулю. В частности,
cv= ... =cfc = 0, так что Vt Vfc линейно-независимы относи-
относительно Р. Тем самым доказана и достаточность условия.
Теорема 5.4. Для того чтобы векторы Vt, .... Vfc состав-
составляли базис пространства R относительно подпространства Р,
необходимо и достаточно, чтобы векторы Vlt . . ., Vfc, Ut, . .., Um
составляли базис пространства R. Здесь векторы Up .. ., Um
составляют базис Р.
Доказательство. Пусть Vt Vfc базис R относительно Р.
Тогда, в силу теоремы 5.3, векторы V! Vfc, Uj, . . ., Um линейно-
независимы. Далее, для любого вектора X из R имеем
где Y? P, и потому
!+ ¦•• +dm\im.
Необходимость доказана.
Пусть теперь векторы Vt Vft, Ut Um составляют базис R.
Тогда, в силу теоремы 5.3, векторы \v ..., VA линейно-независимы
§ 51 ПОДПРОСТРАНСТВА 55
относительно Р. Далее, для любого вектора X?R имеем
где Y?P. Достаточность доказана.
Следствие 1. Относительный базис всегда существует и
число составляющих его векторов равно разности размерностей
R и Р.
Действительно, как мы видели, любой базис UP ..., Um подпро-
подпространства Р может быть дополнен до базиса пространства R. Сово-
Совокупность дополнительных векторов V(, •••, Vft есть базис R отно-
относительно Р, и их число равно разности размерностей R и Р.
Следствие 2. Пусть PfczDpft_,iD ... idP, убывающая цепочка
подпространств. Тогда объединение базиса Pt, базиса Р2 отно-
относительно Рх, ..., базиса Рй относительно Р^_1 образует ба-
базис Рк.
Теорема 5.6. Любая система \t, . . ., Vs векторов, линейно-
независимых относительно Р, может быть дополнена до базиса R
относительно Р.
Доказательство. Векторы Ux, .... Um, Vj Vs линейно-
независимы в силу теоремы 5.3. Эта система может быть дополнена
до системы U,, ..., Um, VL Vs, Vs+J Vft, образующей
базис R. Тогда векторы Vj, .. ., Vfc и составят базис R относи-
относительно Р в силу теоремы 5.4.
4. Векторная сумма и пересечение подпространств. Пусть Р
и Q два подпространства пространства R. Векторной суммой
подпространств Р и Q называется совокупность всех векторов
Z = X-f-Y, где Х?Р, Y(jQ. Очевидно, что векторная сумма двух
подпространств в свою очередь есть подпространство. Оно может
быть охарактеризовано как наименьшее подпространство, содержа-
содержащее подпространства Р и Q. Будем обозначать векторную сумму
подпространств Р и Q через (Р, Q).
Пересечением подпространств Р и Q называется совокуп-
совокупность всех векторов, принадлежащих как подпространству Р, так и
подпространству Q. Ясно, что пересечение двух подпространств есть
в свою очередь подпространство. Оно может быть охарактеризовано
как наибольшее подпространство, содержащееся в Р и Q. Пересече-
Пересечение подпространств Р и Q обозначается через Р П Q.
Теорема 5.6. Пусть s размерность (Р, Q), t —размерность
Г* П Q. Тогда s-\-t=p-\-q, где р—размерность Р, q—размер-
q—размерность Q.
Доказательство. Ясно, что ^-^jf^s, ?.<^<7<^s. Пусть Mv ...
• • ¦, Ut базис Р П Q- Включим его в базисы U,, . . ., Ut, Vt Vp_j
и Ult ..., [Jt, Wv ..., Wg_f подпространств Р и Q. Докажем, что
Векторы Ut Vt, Vj, .... V^_j, Wj, .... W?_{ образуют базис
56 ОСНОВНЫЕ СВЕДЕНИЯ ИЗ ЛИНЕЙНОЙ АЛГЕБРЫ [ГЛ. I
(Р, Q). Установим сначала их линейную независимость. Пусть
+ <Wt+ ...+^_tWe_t = 0; (l)
Положим
Z = clVi-\- ... 4. , V
Ясно, что Z(jP. С другой стороны, из равенства A) заключаем, что
Z = -dIW!— ... — 4_«We_t.
откуда Z?Q. Следовательно, Z?Pf|Q. и потому
при некоторых vp .... vt. Сравнивая второе и третье представления
вектора Z, получим, что
откуда заключаем, что vx = . .. = vt = 0, rfi = . . . = dq_t = 0 в силу
линейной независимости векторов Uj, ... U{, Wt, ..., Wg_(. Тем
самым равенство A) превращается в равенство
CiUi + • • • + сги, 4- rf,Vl + . . . -+- dp_tVp_t = 0,
откуда Cj = ... =cf = 0, dj = ... =dp_t = 0.
Итак, все коэффициенты в равенстве A) оказались нулями и,
следовательно, векторы Uj, ..., Ut, Vt, ..., Vp_4, Wt, .... WG_t
линейно-независимы. Остается доказать, что любой вектор из (Р, Q)
является их линейной комбинацией. Пусть Z(j(P, Q). Тогда
Z = X + Y, где Х?Р, Y^Q. Представляя X и Y через базисные
векторы подпространств Р и Q, получим
откуда
Тем самым мы доказали, что векторы Ut Ut, Vt Vp_f,
Wt Wg_f образуют базис подпространства (Р, Q). Таким обра-
образом, размерность s подпространства (Р, Q) равна t-\-p — t-{-q—1 =
=p-\-q — t, откуда следует, что
§ 5] ПОДПРОСТРАНСТВА 57
б. Прямая сумма. Если любой вектор X пространства R пред-
представляется в виде суммы векторов Ylt . .., Yk из подпространств
Р, Pfc, то говорят, что R есть векторная сумма подпро-
подпространств Pj РЛ. Если при этом представление
X = Y1+...+Yfc. Y^Pi (i=\ ft)
однозначно, то R есть прямая сумма подпространств Р,, .... Рк.
Теорема 5.7, Для того чтобы пространство R било прямой
суммой своих подпространств Pt Рк, необходимо и доста-
достаточно, чтобы объединение базисов этих подпространств соста-
составляло базис всего пространства.
Доказательство. Пусть R есть прямая сумма -подпространств
?! Pfc и пусть векторы Up..., USl;...; USft_i+i, .. ., USft
составляют базисы этих подпространств. Тогда для любого вектора
из R имеем
где Yj?Pj, и потому
х = Clu, 4 • • • + с,,цч, + ... + cSfc_i+1uSA._i+1 н 4- su-v
Остается доказать линейную независимость векторов 1]1 U.,> .
Пусть
сА+ ... +Cgu,+ ... +4_i+1uSyt_i+1+ ... 4-su-* = °-
Введем обозначения:
c.U.4- ••• +C,Uei=Yl
Тогда Y^Pj и 0 = Y!-(- ... +Yfc. Но все подпространства Р4 со-
содержат нулевой вектор и 0 = 0+ ••• +0. В силу единственности
разложения векторов из R по подпространствам Р1( ..., Р^, мы за-
заключаем, что Yt = ... = Yfc = 0. Следовательно, и все коэффициенты
С], ... cSi, ..., cs +1 сЛ равны нулю. Линейная независи-
независимость векторов Ut, . . ., Us, доказана. Тем самым доказана необхо-
It
Димость условия.
Предположим теперь, что векторы \]1 U3]; .. .; USft_ +i, ...
• • ¦. U8fc, составляющие базисы подпространств Pt, ..., Pfc, образуют
базис R. Тогда для любого вектора X?R имеем
X ==
.. . 4-
58 ОСНОВНЫЕ СВЕДЕНИЯ ИЗ ЛИНЕЙНОЙ АЛГЕБРЫ [ГЛ. I
где
Yi=clU1+ ... 4-с,Ц„ 6Р,
Это представление однозначно, ибо если
x = y; + ...
при Y^ ? P^, то
где
Y'=c' U 4- . . . ~f с' U .
В силу единственности разложения вектора X по базисным векторам,
заключаем, что с,=с' . .., с —с' с = с' , ...
..., cg = с8 и потому Yx = Ylt .... Yk = Yk. Теорема доказана и
в части достаточности.
Теорема 6.8. Если пространство R есть векторная сумма
подпространств Рх, ..., Pfc и размерность R равна сумме раз-
размерностей Pt Pk, то R есть прямая сумма Pv . . ., Pfc.
Доказательство. Векторы пространства R являются линейными
комбинациями базисных векторов всех подпространств Рх, ..., Рл.
Следовательно, размерность R не превосходит суммы размерностей
подпространств Pt Pft и равна этой сумме только если сово-
совокупность всех базисных векторов всех Р,- линейно-независима. Но
в этом случае, в силу теоремы 5.7, пространство R есть прямая
сумма подпространств Pt, . .., Pfc.
Из последней теоремы следует, в частности, что векторная сумма
двух подпространств будет прямой суммой в том и только в том
случае, если пересечение этих подпространств имеет размерность О,
т. е. состоит только из нулевого вектора. Это последнее утвержде-
утверждение легко доказывается и непосредственно.
§ 6. Линейные операторы
1. Функция от векторного аргумента. Функцией от вектор-
векторного аргумента с областью значений 2 называется закон сопоставле-
сопоставления каждому вектору пространства R (или некоторого его подмно-
подмножества) элемента из Q.
Если областью значений Q является совокупность чисел, то функ-
функция от векторного аргумента называется функционалом, если
§ 6] ЛИНЕЙНЫЕ ОПЕРАТОРЫ 59
областью значений S является совокупность векторов того же про-
пространства, то функция от векторного аргумента называется преоб-
преобразованием или оператором.
Примерами функционалов могут служить скалярное произведение
(X, Yo) при фиксированном векторе Yo, длина вектора X, квадра-
квадратичная форма от координат вектора в некотором базисе. Вообще,
если в пространстве зафиксирован базис, то функционалом будет
любая функция от п переменных, именно от п координат переменного
вектора в этом выбранном базисе. Очевидно, что при изменении ба-
базиса функция от координат вектора, задающая функционал, должна
быть подвергнута соответствующему преобразованию переменных.
Функционал Ф называется линейным, если
Ф (с1Х1 + с2Х2) = с,Ф (ХО + с2Ф (Х2). A)
Ясно, что общий вид линейного функционала есть
Ф (X) — Ф (x^t -+¦ . .. -f xnUn) = alXl + . . . + апхп,
где av ..., а„ — числа, именно а1 = ФA11) ап = Ф([]п); здесь
U! Un выбранный базис, хх, х2, ¦ • •, хп координаты вектора X
в этом базисе. В дальнейшем важную роль будут играть квадратич-
квадратичные функционалы и некоторые другие.
2. Линейные операторы. Оператор называется линейным, если
он удовлетворяет следующим условиям линейности.
1. А (аХ) = аАХ при любом комплексном числе а.
2. A^ + X^AXt + AX;;.
Здесь через АХ обозначен результат применения оператора А к
вектору X.
Определим действия над линейными операторами. Произве-
Произведением АВ линейных операторов А и В назовем оператор С,
состоящий в последовательном применении сначала линейного опера-
оператора В, а затем линейного оператора А.
Произведение линейных операторов А и В, как легко видеть,
снова есть линейный оператор.
Действительно,
С (X, -f Х2) = А (В (Хх + Х2)) = А (ВХ, + ВХ2) =
= А (ВХХ) + А (ВХ2) = CXt -f CX2.
Умножение операторов ассоциативно, что непосредственно сле-
Ду.ет из определения.
Оператор Е, сопоставляющий каждому вектору X этот же вектор,
называется единичным оператором. Ясно, что единичный опе-
оператор линеен и ЕА = АЕ = А при любом операторе А.
: Суммой A-f-В линейных операторов А и В назовем опера-
ТоР. С, сопоставляющий вектору X вектор AX-f-BX.
60
ОСНОВНЫЕ СВЕДЕНИЯ ИЗ ЛИНЕЙНОЙ АЛГЕБРЫ
[ГЛ. 1
Оператор 0, отображающий все векторы пространства на нуле-
нулевой вектор, называется нулевым оператором. Ясно, что нуле-
нулевой оператор линеен и А~)-0 = 0-}-А=:А при любом операторе А.
Произведением аА линейного оператора А на число а
назовем оператор, сопоставляющий вектору X вектор а (АХ).
Очевидно, что сумма линейных операторов, а также произведение
оператора на число суть линейные операторы. Данные определения
действий позволяют естественным образом определить степень опера-
оператора как произведение равных сомножителей и полином от опера-
оператора согласно формуле
где
В дальнейшем мы будем иметь дело только с линейными опера-
операторами и потому слово линейный будем опускать.
3. Представление оператора матрицей. Выберем в простран-
пространстве R некоторый базис U^ U2, • ¦ •, Un. Оператор А соотносит
векторам базиса векторы AUj, AU2 AUn.
Пусть векторы KMl, AU2, ••-, AUn заданы своими координатами
в базисе l^, U2 Un, т. е. пусть
AU2 =
a21U2
a22U2
B)
= alnUL -f- a2n
. .. -f annUn
Рассмотрим матрицу А, столбцы которой состоят из координат век-
векторов AUl AU2, • • •, AUB:
Л==
«и
a2I
«22
aZn
C)
Покажем, что матрица А !) вполне определяет оператор А.
Действительно, если для оператора А известна матрица А,
то тем самым известны значения оператора А на базисных векто-
векторах Up U2, .. ., Un и, в силу линейности оператора, легко опре-
определить его значение для любого вектора. Именно, если X = ^lUj-f- ...
... Ч- *nUn. то
!) Отметим, что матрица коэффициентов в соотношениях B) образует
матрицу, транспонированную к той, которую мы связываем с операторов
§ б] ЛИНЕЙНЫЕ ОПЕРАТОРЫ 61
Отсюда легко находятся координаты преобразованного вектора.
Именно,
п п п п
Y = АХ = 2 УиЩ = 2 **AUi — 2 2 akiXiVk,
2
откуда
n
Ук = 2 а*л
i = l
или, в матричной записи,
Y = AX D)
где К и X суть столбцы из координат векторов Y и X.
Обратно, произвольная матрица А может быть связана с неко-
некоторым оператором.
Действительно, преобразование, задаваемое формулой
Y=AX,
где Y и X по-прежнему столбцы из координат векторов Y и X,
линейно при любой матрице А.
Установленное одно-однозначное соответствие между операторами
и матрицами сохраняется при действиях над операторами. Именно,
матрица суммы операторов равна сумме матриц слагаемых, матрица
произведения операторов равна произведению матриц, соответствую-
соответствующих сомножителям.
Короче, совокупность операторов я-мерного пространства изо-
изоморфна совокупности матриц порядка я, и такой изоморфизм осуще-
осуществляется посредством сопоставления каждому оператору соответ-
соответствующей ему матрицы в некотором фиксированном базисе про-
пространства.
В тех рассуждениях, в которых базис пространства заранее
фиксируется, имеет смысл отождествление оператора с соответствую-
соответствующей ему матрицей, подобно указанному выше отождествлению век-
вектора и столбца из его координат. При таком отождествлении резуль-
результат воздействия оператора на вектор совпадает с результатом умно-
умножения матрицы на столбец.
4. Связь между матрицами оператора в различных базисах.
Выясним теперь, как изменится матрица оператора при изменении
базиса пространства.
Положим, что от базиса Uj, U2, ••., Un мы перешли к базису
Uj, и^, ..., U'n. Координаты любого вектора пространства при этом
изменяются по формулам
Х=СХ',
где X столбец из координат вектора X в базисе и^ .... Un,
X' — столбец из координат в базисе U' U^. С — матрица пре-
¦ образования координат.
62 ОСНОВНЫЕ СВЕДЕНИЯ ИЗ ЛИНЕЙНОЙ АЛГЕБРЫ [ГЛ. I
Рассмотрим теперь оператор А, и пусть в базисе Ult . .., U,, ему
соответствует матрица Л, а в базисе V[ \}'п матрица В.
Пусть Y = АХ, У и У столбцы из координат вектора Y в бази-
базисах иг Un и U{ \}'п соответственно.
Тогда
ПО Л —ОЛ , У = L
откуда
и, следовательно,
,У И
потому
к' =
В =
= АСХ',
--С~1АС.
--С^АС.
E)
Таким образом, одному и тому же оператору в различных бази-
базисах соответствуют подобные матрицы. При этом матрица, посред-
посредством которой осуществляется преобразование подобия, совпадает
с матрицей преобразования координат.
5. Ранг оператора. Совокупность АР векторов АХ, где А дан-
данный оператор, а X вектор, пробегающий некоторое подпростран-
подпространство Р «-мерного пространства R, образует подпространство. Дей-
Действительно, если Yj^AP, Y2?AP, то Y1 = AX1, Y2 = AX2, где Xt
и Х2 некоторые векторы из Р, и, следовательно, c1Y1+c2Y2 =
= А(с1Х1 + с2Х2)? АР, ибо qXi + CjjX^P.
В частности, AR является подпространством R. Это подпростран-
подпространство называется образом оператора А. Размерность этого под-
подпространства называется рангом оператора А. Очевидно, что AR
есть подпространство, натянутое на векторы AUj AUM, где
Ut, ..., Мп базис R. Поэтому, согласно теореме 5.2, ранг опера-
оператора равен рангу матрицы, сопоставляемой оператору в базисе
U,, • • •, Un.
Заметим, что, так как размерность подпространства AR не зависит
от выбора базиса, ранги всех матриц, сопоставляемых оператору А
в различных базисах, равны между собой. Следовательно, ранги
подобных матрац равны.
Образ AR совпадает со всем пространством в том и только в том
случае, когда ранг оператора А равен п, т. е. когда определитель его
матрицы не равен нулю. В этом случае оператор называется невы-
невырожденным. Оператор, ранг которого меньше размерности про-
пространства, называется вырожденным.
Совокупность Q векторов Y?R, таких, что AY = 0, есть также
подпространство. Действительно, если Y, ? Q и Y2?Q, то AYj =
= AY2 = 0h A (CjYt-+¦ с2^2) = ci^Yj + c2AY2 = 0 и, следовательно,
^Yi-f-CjYj^Q. Подпространство Q называется ядром оператора А.
§ 6]
ЛИНЕЙНЫЕ ОПЕРАТОРЫ
63
Теорема 6.1. Сумма размерностей ядра оператора а его
образа равна размерности всего пространства.
Доказательство. Пусть Ui Um базис ядра Q оператора А.
Дополним его до базиса пространства R векторами \i Vre_TO.
Покажем, что векторы AVt АУИ_ТО составляют базис образа AR
оператора А. Докажем сначала линейную независимость этих векто-
векторов. Пусть
CiAVt+ ... +c»-mAVn_m=:0.
Тогда A(cIV14----+c»-mVn_m)=0, т. е. cl\l+...+cn_mVn_n,€Q.
Но это возможно только при ci — ... =сп_га = 0, ибо векторы
Vx Vn_m линейно-независимы относительно Q.
Пусть теперь Y?AR. Тогда Y = AX- Разложим X по векторам
выбранного базиса
X=clU1+ ••• +cOTUOT+d1V14- •••• +dn_m\n_m.
Следовательно,
= d1AV1+
ибо Al^ — ... = AUm = 0. Итак, мы доказали, что размерность
образа AR оператора А равна п — т, где т размерность ядра. Тео-
Теорема доказана.
Из доказанной теоремы следует, что ядро состоит из нулевого
вектора в том и только в том случае, когда размерность AR равна «,
т. е. когда оператор невырожденный. Заметим, что если ядро и
образ оператора имеют нулевое пересечение, то все пространство
является их прямой суммой. Однако это обстоятельство выполняется
далеко не всегда.
В терминах теории матриц содержание теоремы может быть
сформулировано следующим образом. Максимальное число линейно-
независилшх решений системы п линейных однородных уравнений
с п неизвестными равно п — г, где г ранг матрицы, составленной
из коэффициентов системы.
Действительно, пусть дана система
«n>'i + ¦ • ¦ + ащУп = О
F)
<Wi+ ••• -\-аппуп = 0.
Эта система равносильна векторному равенству
где А—оператор с матрицей
au ... aw
• • ¦ а„
64 основные сведения из линейной алгебры [гл. t
Y — вектор с координатами yt уп. Поэтому каждое решение
системы F) есть вектор из ядра Q оператора А, и обратно, коорди-
координаты любого вектора Y ? Q образуют решение системы F), так что
максимальное число линейно-независимых решений равно размер-
размерности Q. По теореме 6.1 размерность Q равна п — г, где г есть
размерность образа оператора А, т. е. ранг матрицы А.
6. Обратный оператор. Как мы видели, образ невырожденного опе-
оператора есть все пространство, так что невырожденный оператор осу-
осуществляет отображение пространства на себя. Это отображение взаимно
однозначно. Действительно, если АХ = Z и AY = Z, то А (X — Y) = О,
откуда следует X = Y, так как ядро невырожденного оператора
состоит только из нулевого вектора. Поэтому для каждого невы-
невырожденного оператора А существует обратный оператор А~\ сопо-
сопоставляющий каждому вектору Z?R однозначно определенный век-
вектор X, такой, что AX = Z. Линейность оператора А очевидна.
Из определения обратного оператора следует, что A~!A =
= АА~1 = Е.
В любом базисе взаимно обратным операторам А и А ' соот-
соответствуют взаимно обратные матрицы.
7. Собственные векторы и собственные значения оператора.
Собственным значением (или собственным числом) опера-
оператора А называется такое число X, что для некоторого ненулевого
вектора X имеет место равенство
АХ = XX. G)
Любой ненулевой вектор X, удовлетворяющий равенству G), назы-
называется собственным вектором оператора А, соответствующим
(или принадлежащим) собственному значению X.
Спектром оператора называется совокупность всех его соб-
собственных значений.
Собственные векторы и собственные значения оператора нахо-
находятся следующим образом.
Пусть оператор А в каком-либо базисе представляется матрицей
А = (fljfc); пусть координаты собственного вектора в этом базисе
суть х1 хп.
Тогда координаты вектора АХ будут
п п
2j alkxk xLi апкхк<
fc = l fc-1
и потому для определения координат xl xn и собственного
значения I мы получим систему уравнений:
... -|- a2nxn = \хг (8)
1 I Л2 2 I ' " * t tin ft ' '~~ *Уп
§ 6] ЛИНЕЙНЫЕ ОПЕРАТОРЫ 65
ИЛИ
(«п — *)*1 + «12*2+ ••• 4-airex« = 0
2 — Х) Ч + ¦ • • + «2П*» = 0 (9)
Эта система однородных относительно л^, л2- •••• ¦*» уравнений
будет иметь ненулевое решение в том и только в том случае, если
— \ а12 аи
«21 ап—\ аг,
= 0, A0)
т. е. если X будет корнем характеристического полинома матрицы.
Таким образом, верна следующая
Теорема 6.2. Собственные значения оператора совпадают
с корнями характеристического полинома матрицы, предста-
представляющей оператор.
Вспомним, что матрицы, представляющие один и тот же оператор в
различных базисах, подобны между собой, и, следовательно, их харак-
характеристические полиномы совпадают. Это дает основание назвать
характеристический полином любой матрицы, представляющей опера-
оператор, характеристическим полиномом оператора.
Если tp(/) характеристический полином оператора А и Л какая-
либо представляющая его матрица, то, в силу соотношения Кели —
Гамильтона, ср(Л) = О. Следовательно, и <р(А) = О, так как ср (А)
представляется нулевой матрицей <р (Л).
С оператором естественно связывается также и минимальный
полином, который определяется как полином наименьшей степени
среди полиномов, аннулирующих оператор. Ясно, что минимальный
полином оператора является также и минимальным полиномом для
матрицы, сопоставляемой оператору в произвольном базисе. Харак-
Характеристический полином делится на минимальный.
Поэтому каждый корень минимального полинома является корнем
характеристического полинома. Справедливо и обратное утверждение.
Именно, каждое собственное значение оператора, т. е. каждый
корень характеристического полинома, является также и корнем
минимального полинома оператора.
Действительно, пусть X собственное значение оператора, X
соответствующий ему собственный вектор, ty(t) минимальный поли-
полином оператора. По теореме Безу <J) (t) =p(t) (t — X)-f-^(X). Следо-
Следовательно, ф(А)Х=/;(А)(А — ХЕ)Х + ф(Х)Х. Но (А — ХЕ)Х = О и
КА)Х = 0Х = 0. Поэтому ф(Х)Х = О и ф(Х) = О.
5 Зак, 974, Д. К. Фаддеев и В, Н. Фаддеева
66 ОСНОВНЫЕ СВЕДЕНИЯ ИЗ ЛИНЕЙНОЙ АЛГЕБРЫ (ГЛ. Г
Таким образом, корни характеристического и минимального
полиномов оператора совпадают в совокупности и могут отличаться
лишь кратностями.
На основании так называемой основной теоремы высшей алгебры
нам известно, что каждый полином имеет хотя бы один корень.
Следовательно, оператор имеет по крайней мере одно собственное
значение, которое может быть комплексным, даже если матрица
оператора вещественна.
Для каждого собственного значения соответствующий собственный
вектор (точнее векторы) определяется из системы (9) после подста-
подстановки в нее вместо буквы X найденного численного значения.
Собственных векторов, отвечающих собственному значению X, беско-
бесконечно много, и они образуют подпространство пространства R.
Действительно, все собственные векторы, отвечающие собствен-
собственному значению X, образуют ядро оператора А —АЕ. Размерность /
этого подпространства, т. е. число линейно-независимых собствен-
собственных векторов, соответствующих собственному значению X, равно п — г,
где г ранг оператора А — ХЕ.
Покажем, что / не превосходит кратности k числа X как корня
характеристического полинома оператора. Действительно, пусть
Xj X; линейно-независимые собственные векторы, соответствую-
соответствующие собственному значению X. Построим базис пространства Xi3 . . ., Х„,
взяв за первые / векторов векторы Xt Хг. В этом базисе рас-
рассматриваемый оператор представляется матрицей, первые / столбцов
которой имеют вид:
X 0 ... О
О X ... О
О 0 ... X
О 0 ... О
ибо АХ1 = ХХ1, ..., АХг = ХХг. Характеристический полином этой
матрицы делится на (t — Х)г, и, следовательно, X имеет кратность k,
не меньшую чем I, т. е. l^.k. Естественно было бы предполагать,
что l = k, т. е. что кратным корням характеристического полинома
соответствуют k линейно-независимых собственных векторов. Однако
на самом деле это не так. Именно, число линейно-независимых век-
векторов может быть меньше, чем кратность собственного числа.
Подтвердим сказанное примером. Рассмотрим оператор с матрицей
А =
Тогда \А — tE | = (t — ЗJ, следовательно, X = 3 является двойным
корнем характеристического полинома.
§ 6] ЛИНЕЙНЫЕ ОПЕРАТОРЫ - 67
Система уравнений для определения координат собственного
вектора оператора А будет
ОХ ^ —{ JC% — tjJC|
откуда х2 = О, и потому все собственные векторы рассматриваемого
оператора суть (хг, 0) = ;с1A, 0). Таким образом, двойному собствен-
собственному числу в данном примере соответствует только один линейно-
независимый собственный вектор, так что здесь / строго меньше k.
Важно отметить, что если k=\, т. е. если X есть простой
корень характеристического полинома, то / = ?=1. В самом деле,
I ^С I и />0, ибо хоть один собственный вектор, принадлежащий
собственному значению X, существует.
8. Собственные векторы матрицы. Собственным векто-
вектором матрицы А называется ненулевой столбец, удовлетворяю-
удовлетворяющий условию
АХ=1Х, A1)
где \—некоторое число. Ясно, что собственный вектор матрицы А
есть столбец из координат собственного вектора оператора А, кото-
которому сопоставлена в избранном базисе данная матрица А.
Заметим, что если собственное значение вещественной матрицы
комплексно, координаты собственного вектора также будут комплекс-
комплексными. Вектор, координаты которого комплексно сопряжены с коор-
координатами собственного вектора вещественной матрицы, тоже является
собственным вектором этой матрицы, принадлежащим комплексно-
сопряженному собственному значению.
Для того чтобы в этом убедиться, достаточно в равенстве
АХ = \Х заменить все числа комплексно-сопряженными.
Выше было установлено, что подобные матрицы имеют одинако-
одинаковые характеристические полиномы и, следовательно, одинаковые
спектры собственных чисел.
Мы выяснили геометрическую причину этого обстоятельства,
именно, подобные матрицы можно рассматривать как матрицы одного
и того же оператора, отнесенного к различным базисам. Поэтому
„собственные векторы" подобных матриц являются столбцами из
координат собственных векторов рассматриваемого оператора в раз-
различных базисах и, следовательно, связаны соотношением
A2)
где С есть матрица преобразования координат.
Это обстоятельство проверяется и формально: если
АХ=-1Х, то
68
ОСНОВНЫЕ СВЕДЕНИЯ ИЗ ЛИНЕЙНОЙ АЛГЕБРЫ
{гл. г
9. Собственные векторы треугольной матрицы. Пусть
ьп ь1г ... ьы
5 =
... ь,
in
О
—правая треугольная матрица, диагональные элементы которой попарно
различны. Очевидно, что эти диагональные элементы будут собствен-
собственными значениями матрицы В. Найдем соответствующие им собствен-
собственные векторы. Пусть Xi = {xli, ..., хп{)' есть собственный вектор,
принадлежащий собственному значению Ьи. Для определения компо-
компонент вектора Xi прежде всего сравним в равенстве
aXi = biiXi A3)
компоненты, начиная с i+1-й. Это дает
"» + li +2*1+2» г" • • ¦ Н~ L>i+lnxni == "
откуда находим последовательно, что xni = 0, хп-и = 0, . .., A^+li =
Сравнение г-х компонент в равенстве A3) дает тождество
которое показывает, что компоненту Хц можно взять произвольной.
Возьмем для определенности хц=-\. Тогда первые I—1 компонент
вектора х^ определяются из треугольной системы
фп — Ьи) хи
Таким образом, собственный вектор Х^ принадлежащий собствен-
собственному значению^; имеет все компоненты, начиная с г —]— 1-й. равными
нулю. Поэтому матрица S, столбцы которой состоят из компонент
собственных векторов Х^ Хп, будет правой треугольной матри-
матрицей.
Аналогично устанавливается, что компоненты собственных векто-
векторов левой треугольной матрицы с попарно различными диагональ-
диагональными элементами составляют левую треугольную матрицу.
§ 6] . ЛИНЕЙНЫЕ ОПЕРАТОРЫ 69
10. Приведение матрицы оператора к диагональной форме.
Выясним вопрос об условиях, которым должен удовлетворять оператор
для того, чтобы в пространстве существовал базис, состоящий из
его собственных векторов. Это обстоятельство не всегда имеет место,
как показывает пример, рассмотренный в п. 7.
Базис из собственных векторов замечателен тем, что в нем
матрица оператора имеет диагональную форму [Х1( Х2 Хп].
Действительно, если Xj Хи базис, состоящий из собственных
векторов оператора А, и Хх, Х2, ..., Хп соответствующие собствен-
собственные значения (среди которых могут быть равные), то AXi^X^, . ¦ •
. . ., AXn = XnXn, так что в этом базисе г-я координата вектора АХ;
равна X;, а все остальные координаты равны нулю. Следовательно,
матрица оператора А в базисе Xt Х„ будет
'\ 0 ... 0
0 Х2 . . . 0
0 0 Х?г
Обратно, если оператор А имеет в некотором базисе \]1 Un
диагональную матрицу, то векторы этого базиса являются линейно-
независимыми собственными векторами оператора А. Действительно,
в столбце координат вектора AUj ненулевой будет лишь i-я коорди-
координата и потому AUj = XjUj.
Теорема 6.3. Собственные векторы, соответствующие
попарно различным собственным значениям, линейно-независимы.
Доказательство. Пусть Хх, . . ., Xs попарно различные собствен-
собственные значения оператора А, X,, . . ., Xg какие-либо соответствующие
им собственные векторы. Допустим, что они линейно-зависимы.
Без нарушения общности можно считать, что векторы X! Х^,
где j < 5, линейно-независимы, а векторы Х^+1, . . ¦, Xs являются их
линейными комбинациями. В частности, пусть
з
Xs = 2и
'огда
s Jiii >
С другой стороны,
AXS = XgXs = ^j CjX
S
Отсюда
70 ОСНОВНЫЕ СВЕДЕНИЯ ИЗ ЛИНЕЙНОЙ АЛГЕБРЫ [ГЛ. I
В силу линейной независимости векторов X; все коэффициенты
(ks — Х;)с; = О и, так как по предположению Xs Ф X; при /=1,2, ...
. . ., j, все Cj равны нулю и потому Xs = 0, что противоречит
тому, что Xs собственный вектор. Итак, векторы Xt Xs линейно-
независимы.
Теорема 6.4. Если характеристический полином оператора
имеет только простые корни, то в пространстве существует
базис, состоящий из собственных векторов оператора.
Доказательство. По условию теоремы оператор имеет п различ-
различных собственных значений, где п размерность пространства. Соот-
Соответствующие им собственные векторы \t Х„, в силу теоремы 6. 3,
линейно-независимы, и значит их можно принять за базис.
В терминах теории матриц эта теорема может быть перефрази-
перефразирована следующим образом. Если собственные значения матрицы А
попарно различны, то существует неособенная матрица С такая,
что С~гАС=--А, где A=[Xt XJ.
Действительно, рассмотрим оператор А с матрицей А относи-
относительно какого-либо базиса. Для оператора А существует базис из
собственных векторов. В этом базисе оператору А соотносится диа-
диагональная матрица A = [Xj \п], причем А — С^АС. Здесь С —
матрица преобразования координат при переходе от исходного
базиса к базису, состоящему из собственных векторов. Следовательно,
ее столбцы состоят из координат собственных векторов по отношению
к исходном}^ базису.
Теорема 6.5. Для того чтобы существовал базис из
собственных векторов оператора А, необходимо и достаточно,
чтобы каждому собственному значению соответствовало
столько линейно-независимых векторов, какова его кратность.
Доказательство. Пусть )ч \s все различные собственные
значения оператора А и пусть kx ks их кратности как корней
характеристического полинома, kx-\- . . . -\-ks = п. Обозначим через/;
число линейно-независимых собственных векторов, отвечающих
собственному числу Х4. Пусть Х^ XHi эти собственные
векторы. Покажем, что векторы
XY Y V
11 **lh' • • ¦ ' Л81 Asjg
линейно-независимы.
Положим
Обозначим
Тогда
§ 7] КАНОНИЧЕСКАЯ ФОРМА ЖОРДАНА 71
Каждый из векторов Yi есть или нулевой вектор, или собствен-
собственный вектор, принадлежащий собственному значению Х4. В силу тео-
теоремы 6.3, равенство A4") возможно, только если все векторы
Yj Yg равны нулевому вектору. Но тогда, в силу A4') и
линейной независимости векторов Хг1, .... Х^ при каждом /, заклю-
заключаем, что
са =...== cih = ... —csl= ...= csh = О,
так что равенство A4) возможно только при нулевых коэффициен-
коэффициентах. Тем самым доказана линейная независимость векторов Хп, . . .
..., Xii,, .. ., Xsl, . .., Xsjg. Таким образом, максимальное число
линейно-независимых векторов, соответствующих всем собственным
значениям, равно lt-\- . .. -j-/s- Поэтому для существования базиса
из собственных векторов необходимо и достаточно, чтобы /х —)— _. _
. ..-|_/g —га> что будет выполнено, только если все /4 = &4.
§ 7. Каноническая форма Жордана
В предыдущем параграфе мы видели, что если матрица не имеет
кратных собственных значений, то она всегда может быть приве-
приведена к диагональной форме преобразованием подобия. Однако, если
кратные значения имеются, то преобразования к диагональному виду
может не существовать. Это обстоятельство является исключительным
в том смысле, что многообразие матриц, имеющих кратные собствен-
собственные значения, имеет меньшую размерность, чем пространство всех
матриц. Тем не менее исследование строения таких матриц пред-
представляет очень большой интерес для приложений как теоретического,
так и практического характера. В вычислительной математике,
в обстоятельствах, когда элементы матриц задаются неточно, резкая
грань между случаями простых и кратных собственных значений
стирается, так как при малых деформациях элементов матрицы
всегда можно перейти от матрицы с кратными собственными значе-
значениями к матрице с простыми собственными значениями. Поэтому
в вычислительной алгебре исследование матриц с кратными собствен-
собственными значениями важно преимущественно для правильной ориенти-
ориентировки в структуре матриц, имеющих очень близкие, но различные
собственные значения. С такими же матрицами приходится встре-
встречаться очень часто в приложениях.
Настоящий параграф посвящен изучению структуры матриц,
не приводящихся к диагональной форме, и в частности, установлению
некоторой простейшей канонической формы, обобщающей диагональ-
диагональную, к которой может быть приведена преобразованием подобия уже
совершенно произвольная матрица,
72 ОСНОВНЫЕ СВЕДЕНИЯ ИЗ ЛИНЕЙНОЙ АЛГЕБРЫ [ГЛ. I
1. Инвариантные подпространства. Пусть А оператор, действую-
действующий в га-мерном пространстве R. Подпространство Р пространства R
называется инвариантным по отношению к оператору А,
если векторы из Р преобразуются оператором снова в векторы
из Р, т. е. из Х?Р следует, что и АХ?Р (или в сокращенной
записи АРсР).
Из данного определения следует, что если Р инвариантное под-
подпространство для А, то оно будет инвариантным и для оператора/(А),,
где f(t) любой полином. Действительно, если Х?Р и Р инвариантно,
то АХ?Р, А2Х?Р, .... и, следовательно, /(А)Х?Р.
Отметим, в частности, что подпространство, инвариантное относи-
относительно оператора А, инвариантно и относительно оператора А — р.Е
при любом числе [х. Верно и обратное утверждение: если подпро-
подпространство инвариантно относительно оператора А — [хЕ, то оно
инвариантно относительно А, ибо А = А — р-Е —j— ;j.E.
Очевидно, что все пространство и пространство, состоящее
из нулевого вектора, суть инвариантные подпространства. Нетри-
Нетривиальными примерами инвариантных подпространств могут служить,
например, подпространства, натянутые на один или несколько соб-
собственных векторов оператора А. Действительно, пусть Xt Хк
собственные векторы оператора А и Р натянутое на них подпростран-
подпространство. Тогда любой вектор X, принадлежащий Р, может быть пред-
представлен в виде
и потому АХ — CjAXt -)-...-)- c^AXj. = ciklXl -j- ... -f- с1ск1еХк (среди
чисел Klf . . ., \ могут быть равные). В случае, если все собственные
числа оператора А различны, указанными подпространствами, как
мы увидим далее, исчерпываются все инвариантные подпространства
оператора.
Другим важным типом инвариантных подпространств являются
циклические подпространства. Для определения этого понятия рас-
рассмотрим следующую конструкцию. Пусть дан вектор Хо. Построим
систему векторов Хо, АХ0, А2Х0, ... Ясно, что в этой системе
векторов когда-то в первый раз встретится вектор АдХо, являющийся
линейной комбинацией предыдущих Хо, АХ0 А9~1Х0.
Циклическим подпространством Q, порожденным век-
вектором Хо, называется подпространство, натянутое на векторы
Х0,АХ0 A^Xq. Так как векторы Хо, АХ0 А3~1Х0 линейно-
независимы, то они образуют базис циклического подпространства Q
и потому размерность Q равна показателю степени q.
Докажем теперь, что циклическое подпространство, порожденное
вектором Xot есть наименьшее инвариантное подпространство, содер-
содержащее Xq, т. е. что оно само инвариантно и что оно содержится
во всяком инвариантном подпространстве, содержащем Хо-
§ 7] КАНОНИЧЕСКАЯ ФОРМА ЖОРДАНА 73
Действительно, пусть А9Х0 = ~@Х0-}- ••• -f-T4_iA9~1X0 и пусть
Y?Q. Тогда
= c^to-l- CiAX0+ • • • + Cg-iA^Xo6 Q-
Тем самым инвариантность Q доказана.
Далее, пусть Q' какое-либо инвариантное подпространство, со-
содержащее Хо. Тогда X0?Q'; AX0?Q', . . ., A?~1X0?Q' и, следова-
следовательно, Q с Q', что доказывает минимальность Q среди инвариантных
подпространств, содержащих Хо.
Отметим для дальнейшего, что любое циклическое по отношению
к оператору А подпространство, порожденное вектором Хо, будет
циклическим и по отношению к оператору А — [хЕ при любом
численном значении для [х. Действительно, каждое инвариантное по
отношению к А подпространство будет инвариантным и для А — JJ.E
и обратно, и, следовательно, минимальные инвариантные подпростран-
подпространства, содержащие Хо, должны совпадать.
2. Минимальный аннулирующий вектор Хо полином. Размер-
Размерность <7 циклического подпространства связана также со следующим
важным понятием. Пусть А данный оператор. Мы будем называть
полином у (О аннулирующим вектор Хо, если ¦/_ (A) X,, = 0. Среди
полиномов, аннулирующих вектор Хо, существует полином 6 (t) наи-
наименьшей степени, называемый минимальным аннулирующим
полиномом для вектора Xq.
Степень минимального аннулирующего полинома равна размерности
циклического подпространства, порожденного вектором Хо.
Действительно, пусть q размерность циклического подпространства,
порожденного вектором Хо, и пусть А3Х0= "foXo+ • • • +T3-iA9~1X0-
Положив b{t)~tq—f?-/'1— ••• — Тс получим 6(А)Х0 = 0,
т, е. G (t) есть аннулирующий вектор Хо полином. С другой сто-
стороны, если j(t) полином меньшей степени чем q, то х(А)ХОт4=0
в силу линейной независимости векторов Хо, АХ0 А^Х,,. Сле-
Следовательно, полином <7-й степени G (t) есть минимальный аннулирующий
полином для вектора Хо.
Легко доказать, что всякий полином, аннулирующий Хо> делится
на минимальный аннулирующий Хо полином. Действительно, пусть
Х(А)Хо = 0. Поделив полином х@ на полином 9(?) с остатком,
получим х(О=Р(Ов(О + г(О> гДе остаток r(t) имеет степень,
74 ОСНОВНЫЕ СВЕДЕНИЯ ИЗ ЛИНЕЙНОЙ АЛГЕБРЫ [ГЛ. I
меньшую чем q. Следовательно, 0 = х (А)-Хо = р (А) 9 (А) Хо +
+ г (А) Хо = г (А) Хо, откуда r(t)=O, ибо иначе полином б(^) не
был бы минимальным аннулирующим Хо полиномом. В частности,
минимальный полином оператора (а следовательно, и характеристи-
характеристический) делится на минимальный аннулирующий Хо полином. Поэтому
размерность любого циклического подпространства не превосходит
степени минимального полинома оператора.
Теорема 7.1. Если минимальный аннулирующий полином д(()
для вектора X раскладывается в произведение попарно взаимно
простых множителей
то вектор X может быть представлен в виде суммы векторов
X,, Х2 Xs, аннулируемых соответственно полиномами bl{t),
62(t) 9s@- При этом слагаемые X,, Х2 Xs можно взять
принадлежащими любому инвариантному подпространству, со-
содержащему X.
Доказательство. Очевидно, что теорему достаточно доказать
для s=2, ибо переход к общему случаю осуществляется методом
математической индукции. Так как bl(t) и b2(t) взаимно просты,
то найдутся два полинома pl(t) и p2(t) такие, что 9i@/»i (^)H—
-t~ 92 (/)jo2 (^) = 1 г). Это равенство влечет за собой операторное
равенство
и потому верно векторное равенство
Х=91(А)/;1(А)Х+92(А>р2(А)Х.
Положим
Xl = e2(A)/;2tA)X, Xa = 8l(A)A(A)X.
Тогда
X==i Xj ~}— Х2,
причем
В, (А) X, = в, (А) 92 (А)р2 (А) X = 6 (А)Л (А) X =
=/>2(АN(А)Х=рг(А)О = О.
и аналогично 62(А)Х2 = 0.
Построенные векторы Xj и Х2 принадлежат к любому инвариант-
инвариантному подпространству, содержащему X, ибо если Х(Р и Р инва-
инвариантно, то
Xt = 62 (А)р2 (А) X 6 Р. Х2 = 6t (А) а (А) X е Р.
Замечание. Нетрудно показать, что полиномы 6t(t) Bs(t)
будут минимальными аннулирующими полиномами для векторов
X, Xs соответственно.
••) /..Г. Курош. Курс высщей алгебры, 1940, стр. 175,
§71
КАНОНИЧЕСКАЯ ФОРМА ЖОРДАНА
75
3. Индуцированный оператор. Пусть оператор А действует
в я-мерном пространстве R и пусть Р инвариантное подпространство
для этого оператора. Тогда оператор А сопоставляет каждому век-
вектору из Р вектор из Р, т. е. определяет некоторое преобразование
подпространства Р. Очевидно, что это преобразование является
линейным оператором, определенным на Р. Этот оператор имеет
название оператора, индуцированного оператором А на
подпространстве Р. Индуцированный оператор отличается
от оператора А только областью определения.
Пусть Р инвариантное относительно оператора А подпространство,
Vi Um — базис Р, Up ..., Um, VP ..., Vn_m — базис всего
пространства. Выясним вид, который имеет в этом базисе матрица
оператора А. Так как векторы AUp
AUm принадлежат Р, т. е.
являются линейными комбинациями лишь векторов Up . . ., Um, то их
координаты в выбранном базисе, начиная с m-f-1-й, равны нулю.
Следовательно, матрица оператора А имеет вид:
или сокращенно
«11
«ml
0
0
• ¦ • аш
• • • ®тт
... 0
... 0
«1ШИ
«7И7В-М
«то+1 m+l
апт+1
~Ар В ~
0 Ар
¦ ¦ ¦ «ш
... атп
• ¦ • «m+l n
... апп
•
Здесь Ар есть квадратная матрица порядка т, Av квадратная матрица
порядка п — т, В прямоугольная матрица из т строк и п — т столб-
столбцов, 0 нулевая прямоугольная матрица. Ясно, что Ар есть матрица
Оператора, индуцированного на Р.
Матрица оператора еще более упрощается, если пространство R
есть прямая сумма двух инвариантных подпространств. Действительно,
пусть R^PX-|-P2. Возьмем за базис R объединение базисов Pt и Р2.
В этом базисе матрица оператора А, очевидно, примет вид
0
где APi и Лр2 матрицы операторов, индуцированных оператором А
на Pj и Р2. Если пространство разбивается в прямую сумму k инва-
инвариантных подпространств, то в базисе, составленном из объединения
76
основные Сведения из линейной алгебры
[гл. i
базисов этих подпространств, матрица оператора А принимает
квазидиагональный вид
~ A.
О
A)
где
р2.
Ау>о,
о
Ар , матрицы операторов, индуцированных на
Из последнего разложения вытекает следующая
Теорема 7.2. Если пространство R есть прямая сумма инва-
инвариантных относительно оператора А подпространств Plf
Р2, . . ., Pfc, mo характеристический полином оператора А равен
произведению характеристических полиномов операторов Ах,
А2, . . ., А7г, индуцированных оператором А на подпространствах
Pi, Р2. ¦••• Р*
Для доказательства достаточно отнять ? от элементов главной
диагонали матрицы A) и воспользоваться теоремой о том, что опре-
определитель квазидиагональной матрицы есть произведение определителей,
составленных из ее диагональных клеток.
Если в разложении пространства в прямую сумму инвариантных
подпространств входят одномерные инвариантные подпространства,
т. е. подпространства, натянутые на собственные векторы, то соот-
соответствующие диагональные клетки будут клетками первого порядка,
именно диагональными элементами матрицы. Очевидно, что эти диа-
диагональные элементы будут собственными значениями матрицы.
В дальнейшем мы часто будем заменять выражение „оператор,
индуцированный оператором А на Р" выражением „оператор А на Р".
4. Корневые подпространства. Среди инвариантных подпро-
подпространств особо важную роль играют так называемые корневые под-
подпространства. Корневым вектором для оператора А, соответ-
соответствующим числу jj., называется вектор X такой, что (А — jj.E)mX = O
при некотором целом т > 0. Ясно, что совокупность корневых век-
векторов, отвечающих заданному числу \х, образует подпространство.
Действительно, если (А — (аЕO Xt = 0 и (А — [хЕ)™а Х2 = 0, то
(А — [J-E)m (ctXi ~f- c2X2) = 0, где от = тах(/и1, т2). Это подпро-
подпространство называется корневым подпространством, соответ-
соответствующим числу (л. Покажем, что оно инвариантное. Действительно,
если (A — [iE)mX = 0, то (А — цЕ)т АХ = А (А — уЕ)тХ = 0.
Понятие корневого вектора обобщает понятие собственного век-
вектора, именно, каждый собственный вектор X, принадлежащий собст-
§ 7] КАНОНИЧЕСКАЯ ФОРМА ЖОРДАНА 77
венному значению X, является и корневым для того же числа X,
ибо (А — ХЕ)Х = О.
Высотой ненулевого корневого вектора называется наименьшее
число из таких показателей т, что (А — \iE)mX=0. Иными словами,,
высота корневого вектора есть такое число k, что (А — иЕ)Х = 0,
но (А — \iE) ~1Хф0. Высота нулевого вектора считается равной
нулю по определению. Собственные векторы являются корневыми
векторами высоты единица.
Полином (t — а)' есть минимальный аннулирующий полином для
корневого вектора высоты k. Действительно, (А — [*Е) Х = 0, и,
следовательно, минимальный аннулирующий X полином является дели-
телем (t—;j) . Но делителями (t — \i) являются только полиномы
(t — и.O при j4^k. Полиномы же (t — \if при у <[ & не аннулируют
вектор X, ибо (A — \iE)} ХфО.
Теорема 7.3. Для того чтобы для числа и существовал
ненулевой корневой вектор, необходимо и достаточно, чтобы
число jx было собственным значением оператора А. При этом
высота корневого вектора не превосходит кратности т числа и
как корня минимального полинома. Существуют корневые век-
векторы высоты т.
Доказательство. Если jj. является собственным значением, то для
него существуют ненулевые корневые векторы, например, собствен-
собственные векторы. Обратно, если для числа и. существует ненулевой кор-
корневой вектор X высоты k, то Z = (A—\&)к~хХфЪ и (А—fJ-E)Z =
= (А — ;jE) Х = 0, так что Z есть собственный вектор, соответ-
соответствующий числу [1, и, следовательно, \>- есть собственное значение.
Минимальный аннулирующий вектор X полином (t — а)с является
делителем минимального полинома оператора А. Поэтому высота k
вектора X не превосходит кратности т числа \х как корня мини-
минимального полинома.
Остается доказать последнее утверждение теоремы. Пусть ф@ =
= {t — \>-)т/{1) есть минимальный полином оператора А. Выберем
вектор U так, чтобы он не аннулировался оператором (А — ;хЕ)т~1/(А).
Такой вектор U найдется, ибо иначе <]>(t) не был бы минимальным
полиномом для А.
Положим X = /(А) U. Тогда (\—^Е)т~1Х = (А-ч-Е)'1 f (А) \5ФО,
но (A —jj.E)mX = (A —^Е)т/(А)и = ф(А)и = 0. Таким образом, X
есть корневой вектор высоты т для числа ;х.
5. Свойства оператора, индуцированного на корневом под-
подпространстве. Пусть А оператор в пространстве R, X его собствен-
собственное значение кратности т как корня минимального полинома, Р
корневое подпространство, соответствующее этому собственному
78 ОСНОВНЫЕ СВЕДЕНИЯ ИЗ ЛИНЕЙНОЙ АЛГЕБРЫ [ГЛ. I
значению. Пусть Ар оператор, индуцированный оператором А на под-
подпространстве Р.
Теорема 7.4. Минимальный полином оператора Ар равен
(t — X)m, характеристический полином оператора Ар равен (/ — Х)р,
где р—размерность пространства Р.
Доказательство. Оператор (А— Ш)т аннулирует все векторы
подпространства Р, а оператор (А—\Е)т~1 аннулирует не все век-
векторы Р. Следовательно, (АР — ХЕ)™ = 0, а (Ар — XE)m-1=^O. Отсюда
следует, что (t—X)m есть минимальный полином оператора Ар.
Далее, всякое собственное значение оператора является корнем мини-
минимального полинома. Следовательно, оператор Ар имеет единственное
собственное значение X и потому характеристический полином опе-
оператора Ар равен (t — \)р. Показатель р равен размерности подпро-
подпространства Р, так как степень характеристического полинома любого
оператора ранна размерности пространства, в котором он определен.
Ниже мы установим, что р равно кратности собственного значения
как корня характеристического полинома оператора А.
6. Линейная независимость корневых векторов.
Теорема 7.д. Ненулевые корневые векторы, соответствующие
попарно различным собственным значениям оператора А, линейно-
независимы.
Доказательство. Пусть Хх Xs ненулевые корневые векторы
оператора А, соответствующие собственным значениям \, ..., Xs,
причем X;=?Xj при 1ф], и пусть ku ..., ks высоты векторов Xt, . . ., Xs.
Обозначим через fi(t) полином
а—х/1 ...(t—\гI'1 ...(*—xsL
Докажем, что в зависимости
все коэффициенты могут быть только нулями. Применим к обеим
частям равенства оператор /<(А). Получим
cji (А) X, + ... + cjt (A) Xi + ... + cji (A) Xs = 0. B)
Ясно, что fi'A)Xj = O при 1Ф], ибо полином /4(?) делится на поли-
полиномы (t — Xj) 3, j=f=U гннулирующие векторы Х_,- соответственно.
Д /(A)X0 б /Д?)
Далее, /i(A)Xi=^=0, ибо полином /Д?) не делится на полином
т.
({— Х4) *, являющийся минимальным аннулирующим вектор Х{
полиномом. Таким образом, равенство B) превращается в
причем fi(A)Xi^0. Следовательно, с4 — 0, для всех /=1, 2, .... s.
Тем самым линейная независимость векторов Хх, ..., Xs доказана.
§ 7} КАНОНИЧЕСКАЯ ФОРМА ЖОРДАНА 79
7. Разложение пространства в прямую сумму корневых под-
подпространств.
Теорема 7.6. Пространство R есть прямая сумма всех кор-
корневых подпространств оператора А.
Доказательство. Векторная сумма R' всех корневых подпро-
подпространств есть сумма прямая, в силу доказанной выше линейной неза-
независимости корневых векторов, соответствующих попарно различным
собственным значениям, т. е. принадлежащим к попарно различным
корневым подпространствам. Остается только доказать, что R' сов-
совпадает со всем пространством R, т. е. что любой вектор X из R
может быть разложен в сумму корневых векторов X; при i= 1, ...,&.
Докажем это. Пусть полином Ь (t) есть минимальный аннулирующий
полином для вектора X. Разложим его на линейные множители:
е(/) = (*—\)' ...у—х,)Ч i^\j.
Сомножители (t — \) ', ..., (t — Xg) s попарно взаимно просты. Сле-
Следовательно, на основании теоремы 7.1 мы придем к разложению
х = х,+ ... +х8.
где векторы Xt, . • ., Xs будут аннулироваться соответственно поли-
ft ft
номами (t — Хх) ' (t — Xs) s. Поэтому векторы Xv ..., Xs
являются корневыми векторами. Тем самым теорема доказана.
Отметим, что если вектор X принадлежит какому-либо инвариант-
инвариантному подпространству, то векторы Xt, ..., Xs принадлежат тому же
подпространству. Это следует из вышеупомянутой теоремы.
Составляющие X; вектора X по корневым подпространствам будем
называть проекциями на эти подпространства.
Из доказанной теоремы вытекает такое следствие. Размерность
корневого подпространства, соответствующего собственному
значению Х4, равна кратности Х{ как корня характеристического
полинома оператора А.
Действительно, характеристический полином ср (t) оператора А
в силу сказанного ранее в п. 2 есть произведение характеристических
полиномов операторов, индуцированных оператором А на корневых
подпространствах Р1 Ps, каждый из которых в свою очередь
есть (Хг — t) \ где/»; — размерность соответствующего корневого под-
подпространства. Итак,
откуда следует, что размерности р1 ps являются кратностями
собственных значений в характеристическом полиноме оператора А.
8. Канонический базис корневого подпространства. Изучим по-
подробнее строение отдельного корневого подпространства для опера-
Тора А. С целью упрощения записи мы будем здесь обозначать
80 ОСНОВНЫЕ СВЕДЕНИЯ ИЗ ЛИНЕЙНОЙ АЛГЕБРЫ (ГЛ. I
корневое подпространство буквой Р и соответствующее собственное
значение через X, опустив индексы.
Корневое подпространство Р естественно разбивается на „этажи".
Под этажом высоты j мы будем подразумевать совокупность всех
векто{ о s высоты у. Этажи не являются подпространствами, так как,
в частности, они не содержат нулевого вектора. Однако совокуп-
совокупность векторов, высоты которых не превосходят данного числа /,
уже образует подпространство. Действительно, если высоты векто-
векторов Хг и Х2 не превосходят у, то (А — ХЕ))Х1 = (А — ХЕ)*'Х2 = О
и, следовательно, (А — ХЕ^ (qXj-|-с2Х2) = О, т. е. высота вектора
c1X1-f-c2X2 не превосходит j. Обозначим указанное подпространство
через PW). Очевидно, что Р(^ инвариантно. Далее, РA) с РB) с: ...
...czP(m)=P.
Наряду с „горизонтальными" инвариантными подпространствами Р
мы рассмотрим инвариантные подпространства совершенно другого
рода, так сказать, „вертикальные". Если Хо корневой вектор
высоты у'^-1, то вектор ХХ = (А—^Е)Х0 будет иметь высоту у — 1.
Будем говорить, что вектор Хг лежит под вектором Хо. Совокуп-
Совокупность векторов Хо, Xj, . , ., Х^--! таких, что
Х1 = (А-ХЕ)Х0
Х2 = (А — ХЕ)Х,
X^_j — (А — ХЕ) Х^_2,
назовем „башней". Ясно, что (А — ХЕ)Х_)-_1 = 0. Высота башни,
(т. е. число ее элементов) равна высоте ее „верхнего" порождающего
вектора Хо. Покажем, что векторы, образующие башню, линейно-
независимы. Действительно, пусть
с0Х0 + ClXi + • • • + Cj^Xj-t = 0.
Применяя к этому равенству последовательно операторы (А — ХЕ),
(А —ХЕJ, .... (А —ХЕ/, получим
откуда заключаем, что со = О, ^ = 0 cj_1 = O.
Подпространство, натянутое на башню, будет иметь размерность ./.
Оно инвариантное и циклическое для оператора А — ХЕ, а следова-
следовательно, инвариантное и циклическое И для оператора А.
§ 7] КАНОНИЧЕСКАЯ ФОРМА ЖОРДАНА 81
Мы установим, что в подпространстве Р существует базис, полу-
получающийся объединением нескольких башен, не содержащих общих
элементов. Такой базис будем называть каноническим базисом
корневого подпространства.
Ясно, что каждый выбор канонического базиса определяет раз-
разложение подпространства Р в прямую сумму инвариантных цикли-
циклических подпространств. Именно, такими подпространствами будут
подпространства, натянутые на базисные векторы, входящие в отдель-
отдельные башни.
Доказательству существования канонического базиса предпошлем
следующую лемму.
Лемма. Если векторы Zt, ..., Zs принадлежатР и линейно-
независимы, относительно Р , то векторы. (А — ХЕ) Zi
(А — XE)ZS принадлежат Р(Л и линейно-независимы относи-
относительно V(i~X).
Доказательство. Первое утверждение леммы очевидно. Допустим
теперь, что
Это значит, что
Следовательно,
что возможно только при с1 = ... = cs — 0, в силу линейной неза-
независимости векторов Z1? . . ., Zs относительно Р(Л. Тем самым лемма
доказана.
Перейдем теперь к доказательству существования канонического
базиса.
Пусть PA)cP(a)c.cPw = P, где, как и раньше, Р(Я есть
совокупность всех векторов, высоты которых не превосходят j.
Выберем произвольный базис Хи Х\к1 подпространства Р*от'
относительно р*). Число kx равно разности размерностей Р(т)
и Рт" . Тогда, в силу леммы, векторы (А—^Е)Хц (А — ХЕ) Хи-,
принадлежат р1-™) и будут линейно-независимы относительно р^т~2\
Следовательно, они могут быть включены в базис р'™' относи-
относительно Р(™>. Пусть (А —ХЕ)Хи, .... (A —XE)Xlfcl; X21 Х2ка
базис р'™"' относительно р()й~2). В силу леммы, векторы
(А — ХЕJХИ (A—XEJXiftl, (A — XE) Хщ (А — ЩХ2к,
принадлежат р(т~2) и линейно-независимы относительно р(т~3). До-
Дополним их векторами Хз1 Х3*3до базиса р('"~2) относительно p(w~3),
6 Зак. 974. Д. К,. Фаддеев в В» Н. фаддеева
82
ОСНОВНЫЕ СВЕДЕНИЯ ИЗ ЛИНЕЙНОЙ АЛГЕБРЫ
[ГЛ. I
X
X
1
s
0.
' отн
"о,
о
я
СП
га
Ю
54
а
л4
X
со
*
X
со
1
J:,
Н.Р
н
о
1
§
0.
о
03
•
7
s
X
1
X
:
4"
X
со
S
со
а
со
S
со
X
i
§
со
1
х4
1
ё
со
"а.
отн.
"а.
о
я
СП
я
из
S
л;
X
X .
7
§
g
X
са
S
X
са
X
S
со
"
a
X
<м
S
СО
X
1
со
•
1
S
со
"о.
о
is
из
применим к построенному базису
оператор А—ХЕ, дополним полу-
полученную систему векторов до базиса
Р(т) относительно Р(ет~4) и т. д.
На т-м шагу мы придем к базису
(А-АЕ)™-1 Хп (А-ХЕ)™-1 XlSl.
(А-ХЕ)т-гХи (А-ХЕГ~2 Х2ЙЗ,
ш
подпространства Р'1'. Объединение
всех построенных относительных ба-
базисов есть базис Р и этот базис, оче-
очевидно, будет каноническим.
Построение канонического базиса
в наглядной форме описывается схе-
схемой, приведенной на левой стороне"
страницы. В этой схеме В = А—ХЕ.
Из построения ясно, что выбор
канонического базиса не однозначен.
Однако нетрудно убедиться, что
любой канонический базис может
быть построен посредством описан-
описанной конструкции. Поэтому строение
любого канонического базиса (число
башен данной высоты) будет одина-
одинаковым.
9. Канонический базис про-
пространства и каноническая форма
Жордана для матрицы оператора.
Каноническим базисом простран-
пространства R, в котором действует опера-
оператор А, называется базис, получаю-
получающийся в результате объединения
канонических базисов всех корневых
подпространств, отвечающих опера-
оператору. Канонический базис естественно
разбивается на башни и соответ-
соответственно все пространство разбивается
в прямую сумму инвариантных цикли-
циклических подпространств, натянутых
на векторы, входящие в отдельные
башни. Поэтому матрица оператора
в каноническом базисе будет квази-
квазидиагональной, состоящей из
КАНОНИЧЕСКАЯ ФОРМА ЖОРДАНА
83
ков", отвечающих отдельным башням. Выясним вид этих ящиков.
Пусть Q одно из инвариантных подпространств, натянутое на башню
высоты J, составленную из векторов Хо, Xj = (A — Х;Е)Х0, Х2 =
= (А — XjEJXj Xj_x = (A —Х,Е)Х^_8. Ясно, что
АХ0 = Х,Х0
AXj-2
Таким образом, оператору А на подпространстве Q в выбранном ба-
базисе Хо Xj_x соответствует матрица
~хг о ... о о
1 Х{ ... О О
О 0 ... )ч О
О 0 ... 1 X*
Такая матрица называется каноническим ящиком Жордана.
Во всем пространстве оператору А будет соответствовать квази-
квазидиагональная матрица, составленная из канонических ящиков Жор-
Жордана, т. е. матрица вида:
0 ... О О
\ ... О О
О 0
О 0
Xt О
1 X,
к
1
0
0
0 ...
х, ...
0 ...
0 ...
0
0
xs
1
0
0
0
*8
84 ОСНОВНЫЕ СВЕДЕНИЯ ИЗ ЛИНЕЙНОЙ АЛГЕБРЫ [ГЛ. I
Число ящиков Жордана равно числу „башен" и, следовательно,
числу первых „этажей" этих башен, т. е. числу линейно-независи-
линейно-независимых собственных векторов оператора А. В свою очередь число ящи-
ящиков Жордана, содержащих одно и то же собственное значение Х;,
равно числу башен, на которые разбивается баз'ис соответствую-
соответствующего Х^ корневого подпространства, т. е. оно равно числу линейно-
независимых собственных векторов, принадлежащих собственному
значению Х;. Максимальный порядок ящиков Жордана, содержащих Х>,
равен кратности собственного значения X, как корня минимального
полинома. Сумма порядков всех канонических ящиков, содержащих Х;>
равна кратности )н как корня характеристического полинома.
Пусть оператор А задан посредством матрицы А, соответствую-
соответствующей оператору А в некотором базисе Ut Un. Пусть V, V,,
канонический базис для оператора А. В этом базисе оператору А
соответствует каноническая матрица Жордана J. Если обозначить
буквой С матрицу преобразования координат от базиса 1^, ¦.., \]п
к базису V], . . ., Vra, то /=С~ АС, т. е. J получается из А преоб-
преобразованием подобия. Это преобразование называется приведением ма-
матрицы к канонической форме Жордана. Таким образом, знание кано-
канонического базиса дает нам как каноническую матрицу J, так и пере-
переходную матрицу С. Нетрудно убедиться и в обратном, если канони-
каноническая матрица J равна С1АС, то базис Vj, . . ., Vn, связанный
с исходным базисом посредством преобразования координат с матри-
матрицей С, будет каноническим базисом для оператора А.
Вычисление канонического базиса для оператора, заданного по-
посредством матрицы, довольно сложно. Но часто бывает важно опре-
определить лишь каноническую форму для данной матрицы А без вычи-
вычисления переходной матрицы С, т. е. без вычисления канонического
базиса для соответствующего оператора. Это оказывается возможным
различными способами. Один из них связан с детальным изучением
матрицы А — tE.
Обозначим через Dt (t) общий наибольший делитель всех миноров
i-го порядка определителя \А — tE \. В частности Dn(t) совпадает
с характеристическим полиномом. Можно доказать, что все Dt (t),
подобно Dn(t), являются общими для класса подобных матриц. Далее,
можно доказать, что Dt(t) делится на Di_1(t). Обозначим
Di{t) = ?,(/).
Di-i. @
n
Очевидно, что Dn (t) = |J Ei {t).
Далее оказывается, что En (t) = -~ " есть минимальный поли-
'-'n-i. \ч
ном матрицы.
8] строение инвариантных подпространств 85
Разложим Ei(t) на линейные множители. Тогда
п
Здесь s обозначает число различных собственных чисел, 2my = "j.
г = 1
s п
2 2 ту' = л- Очевидно, что среди показателей т^ лишь немногие
j = 1 г = 1
отличны от нуля.
Биномы (Xj— t) ¦> называются элементарными делителями ма-
матрицы А. Знание элементарных делителей позволяет построить кано-
каноническую форму. Именно, ящики Жордана строятся, исходя из чи-
чисел \j, и порядки этих ящиков равны показателям т.ц. Число ящиков,
содержащих Х^, равно числу неравных нулю показателей Оту.
В случае, если элементарные делители линейные, т. е. если все
отличные от нуля показатели т.ц равны единице, ящики Жордана
вырождаются в диагональные элементы, а каноническая форма ока-
оказывается просто диагональной формой, причем, конечно, одно и то же
собственное число будет входить в качестве диагонального элемента
столько раз, какова его кратность как корня характеристического
полинома.
Верно и обратное, именно: если матрица приводится к диагональ-
диагональному виду, ее элементарные делители линейны. Таким образом, ма-
матрицы с различными собственными числами обладают линейными эле-
элементарными делителями.
Ьсли все элементарные делители (Х^-— t) J взаимно просты (что
имеет место в том и только в том случае, если Dn__x{t)= 1), то
каждое собственное число входит только в один канонический ящик,
причем порядок ящика равен кратности соответствующего собствен-
собственного числа. В этом и только в этом случае минимальный полином
матрицы совпадает с характеристическим.
§ 8. Строение инвариантных подпространств
1. Строение инвариантных подпространств общего вида.
Теорема 8.1. Любое инвариантное подпространство есть
прямая сумма пересечений этого подпространства с корневыми.
Доказательство. Пусть Т какое-либо инвариантное подпростран-
подпространство. Обозначим через Tj пересечение Т с корневым подпростран-
подпространством P.J. Очевидно, что подпространство Tj инвариантно. Покажем,
что подпространство разбивается в прямую сумму подпространств
Ti Ts, где s есть число различных собственных значений опе-
оператора. Включение Тх-{- ...-f-TsczT тривиально, ибо все Tj с= Т.
Сумма lt~{- . . . +TS прямая, так как Т, входят в подпространства Р*.
86 ОСНОВНЫЕ СВЕДЕНИЯ ИЗ ЛИНЕЙНОЙ АЛГЕБРЫ [ГЛ. J
Докажем теперь обратное включение Т cz T, + Т3-)- ... +Tg. Пусть
X ? Т. Разложим X по корневым подпространствам
X = Xl-f-X2-f ••• +XS.
Тогда, как мы видели, *) Хг? Т и, следовательно, Xj^TnPj^TV
Тем самым требуемое включение доказано.
Заметим, что некоторые из Т^ могут быть и нулевыми подпро-
подпространствами.
Из доказанной теоремы следует, что всякое инвариантное под-
подпространство есть прямая сумма инвариантных подпространств, содер-
содержащихся в корневых.
2. Строение циклического подпространства.
Теорема 8.2. Пусть Хо произвольный вектор пространства R
и Q циклическое подпространство для оператора А, порожден-
порожденное вектором Хо. Тогда Q есть прямая сумма циклических под-
подпространств, порожденных проекциями вектора Хо на корневые
подпространства.
Доказательство. По теореме 8.1 Q есть прямая сумма подпро-
подпространств Q; = Q П Р,-
Разложям вектор Хо по корневым подпространствам
Хо = Xj -f- ••• -f- Xs; Xj ? P{.
Тогда циклические подпространства Qt, порожденные векторами Х^,
входят соответственно в Qt, а их прямая сумма Q' входит в Q. Но Q',
очевидно, инвариантное. Следовательно, Q' = Q и все Q; = Q» при
/=1,2 s.
Пусть высота вектора X; равна j\. Тогда векторы
Х{. (А — XjE) Х4 (А — Х^УГ1 Xt
линейно-независимы и порождают инвариантное подпространство, ко-
которое совпадает с Q; вследствие минимальности Q;. Следовательно,
эти векторы образуют базис Q; и потому размерность Q; совпадает
с высотой ji вектора Хг. Отсюда непосредственно вытекают следую-
следующие теоремы.
Теорема 8.3. Размерность циклического подпространства
оператора А, порожденного вектором Хо, равна сумме высот
проекций порождающего вектора Хо на корневые подпространства.
Теорема 8.4. Минимальный аннулирующий Хо полином ра-
равен (t — \)J' ... У—^Уз.
Действительно, этот полином, очевидно, аннулирует все проек-
проекции Хх Xs . вектора Хо. Обратно, если б(А)Хо = О, то
6(А)Х1= ... =9(A)Xs = 0. Но полином наименьшей степени,
аннулирующий Х4, есть (t — Xj)?*. ибо (А — ^Е)^1
Замечание к теореме 7.6.
§ 9] ОРТОГОНАЛЬНОСТЬ ВЕКТОРОВ И ПОДПРОСТРАНСТВ 87
Из теоремы 8.4 следует, что для любого делителя g(t) мини-
минимального полинома оператора А найдется вектор Хо, для которого
этот делитель будет минимальным аннулирующим полиномом (тео-
(теорема Лузина — Хлодовского) *), ибо в подпространстве Р^ существуют
векторы с любой высотой от 0 до ть включительно.
§ 9. Ортогональность векторов и подпространств
Настоящий параграф, а также и параграф 10 посвящены описа-
описанию свойств эвклидова и унитарного пространств. Ввиду полного
параллелизма теории, мы будем излагать факты и их доказательства
в терминах я-мерного унитарного пространства, делая в случае
надобности огояорки, касающиеся специфики пространства Эвклида.
1. Ортогональные системы векторов. Два вектора пространства
называются ортогональными, если их скалярное произведение
равно нулю. Система векторов называется ортогональной, если лю-
любые два вектора системы ортогональны друг другу. В последующем,
говоря об ортогональной системе, мы будем всегда предполагать,
что все векторы этой системы отличны от нуля.
Теорема 9.1. Векторы, образующие ортогональную систему,
линейно-независимы.
Доказательство. Пусть Х^ ..., Хк ортогональная система и
пусть
В силу свойств скалярного произведения имеем
и, так как | Xj |2 > 0, с; = 0 при любом /=], 2 k. Таким
образом, единственно возможными значениями для cv с2, .. ., ск
в равенстве CjXj + • • • -f-скХк = 0 являются cl = с2 = ... = ск = 0,
т. е. векторы Хг, ..., Хк линейно-независимы. Отсюда вытекает,
во-первых, что число векторов, образующих ортогональную систему,
не превышает п и, во-вторых, что любая ортогональная система
из п векторов образует базис пространства. Такой базис называется
ортогональным. Если, кроме того, длины всех векторов орто-
ортогонального базиса равны единице, то базис называется ортонор-
м а л ь н ы м.
В арифметическом пространстве, в котором скалярное произведе-
п _
ние введено по формуле (X, Y) = 2 Х%У%< естественный базис
i
Н. Н. Лузин [1], [2], И. Н. Хлодовскчй [1].
88 ОСНОВНЫЕ СВЕДЕНИЯ ИЗ ЛИНЕЙНОЙ АЛГЕБРЫ [ГЛ. I
От любой системы линейно-независимых векторов Хх' Х&
можно перейти к ортогональной системе векторов Yt \k по-
посредством так называемого процесса ортогонализации. Этот процесс
описывается следующей теоремой.
Теорема 9.2. Пусть Xt Хк линейно-независимы. Тогда
можно построить ортогональную систему векторов Yt \k,
связанную с исходной соотношениями:
a === Xs —р ot2i
Для доказательства проведем следующее индуктивное построение.
Положим Y1 = X1. Допустим далее, что векторы Yt, ..., Ym_i уже
построены и отличны от нуля. Ищем Ym в виде
Ym = Хт— "fnu'Vi— ... —"{mm- \Ym-U B)
Подберем коэффициенты тет1 Tmm-i так> чтобы (Ym, Y7) = 0
приу'=1 т—1. Это легко сделать, ибо
Но (Y/, У^'Ф 0, так как \/ф0 в силу индукционного предположе-
предположения и, следовательно, достаточно взять
Подставив теперь в равенство B) вместо Y1( ..., Ym_i их вы-
выражения через Xlt . .., Xm_t, получим окончательно
'т
Остается проверить, что Ym =^= 0. Но это очевидно, ибо иначе век-
вектор Хт был бы линейной комбинацией векторов Xt Xm-i,
что противоречит условию теоремы.
Замечание. Линейная независимость векторов Xt, ..., Х^
в процессе доказательства используется лишь для установления того,
что каждый построенный вектор отличен от нуля. Поэтому, если
процесс ортогонализации применить к системе линейно-зависимых
векторов, то по ходу процесса обязательно окажется построен нуле-
нулевой вектор. Это произойдет в первый раз точно на r-м шагу, если
векторы xv ..., Xr_i линейно-независимы, а вектор Хг является
их линейной комбинацией. Поэтому процесс ортогонализации может
§ 9]
ОРТОГОНАЛЬНОСТЬ ВЕКТОРОВ И ПОДПРОСТРАНСТВ
89
применяться для проверки линейной независимости или установления
линейной зависимости данной системы векторов.
От любой ортогональной системы векторов легко перейти далее
к ортонормальной системе, деля каждый вектор системы на его длину.
Описанный процесс создает широкий произвол в выборе орто-
нормального базиса. Действительно, от любого базиса можно перейти
к ортонормальному посредством ортогонализации и нормирования.
Скалярное произведение двух векторов очень просто выражается
через координаты этих векторов в любом ортонормальном базисе.
Действительно, если \J1
\]п ортонормальный базис и
ТО
(X, Y) = (?1
2
1
= S S
i
S S
= 2
2
»=1
D)
Таким образом, скалярное произведение выражается через коор-
координаты векторов в любом ортонормальном базисе по формуле, совпа-
совпадающей с формулой, выражающей скалярное произведение векторов
в арифметическом пространстве через компоненты векторов. Тем самым
сопоставление каждому вектору столбца из его координат в орто-
ортонормальном базисе дает отображение общего линейного пространства
на арифметическое (комплексное для унитарного, вещественное для
эвклидова) пространство, изоморфное не только по отношению к дей-
действиям сложения и умножения на число, но и по отношению к дей-
действию скалярного умножения.
2. Преобразование координат при изменении ортонормального
базиса. Пусть Ux Un и \][ U^ два ортонормальных базиса.
Покажем, что матрица преобразования координат при переходе от
первого базиса ко второму будет унитарной матрицей, если R уни-
унитарное пространство, и ортогональной матрицей, если R пространство
Эвклида.
Действительно, столбцами этой матрицы
будут координаты векторов Ц, .... U^ в базисе Ut Ure. В силу
= о4,. где 3 —символ Кронекера, и в силу орто-
U
того, что (U^,
нормальности базиса
Un, имеют место соотношения
1Ь
V ~
ft-i
90 ОСНОВНЫЕ СВЕДЕНИЯ ИЗ ЛИНЕЙНОЙ АЛГЕБРЫ [ГЛ. I
(для унитарного пространства) и
»
& = 1
(для эвклидова пространства).
Это и означает, что матрица А унитарна (для унитарного про-
пространства) или ортогональна (для эвклидова пространства).
3. Ортогонально-дополнительное подпространство. Вектор Z
называется ортогональным к подпространству Р, если он ортогонален
к любому-вектору, принадлежащему Р. Это обстоятельство записы-
записывается в виде Z _[_ Р.
Два пространства называются взаимно ортогональными,
если каждый вектор одного ортогонален к любому вектору другого.
Взаимно ортогональные подпространства не имеют общих векторов
кроме нулевого. Действительно, вектор X, принадлежащий двум взаимно
ортогональным подпространствам, удовлетворяет условию (X, X) = 0,
из которого следует, что X нулевой вектор.
Совокупность всех векторов R, ортогональных ко всем векторам
подпространства Р, образует, очевидно, подпространство Q, которое
называется ортогонально-дополнительным подпростран-
подпространством к Р или его ортогональным дополнением. Построить
это подпространство можно, например, следующим образом. Пусть
подпространство Р имеет размерность р. Возьмем базис Р и дополним
его до базиса всего пространства. К построенному базису применим
процесс ортогонализации. Пусть U,, ••-, Мр, Up+1 Мп полу-
получившийся ортогональный базис. Очевидно, что векторы U[ Up
образуют ортогональный базис подпространства Р. Покажем, что под-
подпространство, натянутое на векторы Up+1 Ura> будет искомым
ортогонально-дополнительным подпространством Q. Действительно,
если Z?Q, то Z ортогонален ко всем Ut Up и, следовательно,
в разложении
коэффициенты сх ср равны нулю. Обратно, если
Z = cp+1\]p+1-\- • .. -f-cnUn,
то Z ортогонален \]1 \]р и, следовательно, Z ортогонален к лю-
любой их линейной комбинации, т. е. к любому вектору, принадлежа-
принадлежащему Р.
Из приведенного построения следует, что размерность q ортого-
ортогонального дополнения равна п—р. Легко доказать, что ортогональное
дополнение к ортогональному дополнению есть исходное подпро-
подпространство. Действительно, пусть Q есть ортогональное дополнение
к Р, Р] ортогональное дополнение к Q. Из определения ясно, что
Р с Рх. Но размерности Р и Pi одинаковы. Следовательно, Рх = Р.
§ 9] ОРТОГОНАЛЬНОСТЬ ВЕКТОРОВ И ПОДПРОСТРАНСТВ 91
Далее, из того же построения следует, что все пространство есть
прямая сумма подпространства и его ортогонального дополнения. Дей-
Действительно, объединение базисов этих подпространств есть базис всего
пространства. Следовательно, любой вектор X пространства R одно-
однозначно представляется в виде
где Y?P, Z _1_ Р. Вектор Y называется ортогональной про-
проекцией вектора X на подпространство Р.
4. Двойственный базис. Пусть U, Vn некоторый базис
в пространстве R. Базис Vi \[п называется двойственным
с Up . . ., Un, если
ГО„ Vi)=l. . E)
(U», V,) = 0 при i Ф J.
Для каждого базиса существует единственный двойственный базис.
Действительно, пусть Q, есть подпространство, натянутое на векторы
U2, •••, Un, и пусть Sx ортогональное дополнение к Q,. Очевидно,
что размерность Q( равна п—1, размерность S, равна 1. Пусть
Z ф 0 любой вектор из Sp Тогда (Z, U2) = • • • — (Z, Un) == 0 и, сле-
следовательно, (Z, U1) = a1^=0. Поэтому вектор Vl = — Z удовлетво-
удовлетворяет условиям E). Аналогичным образом строятся и все остальные
векторы двойственного базиса. Единственность двойственного базиса
следует непосредственно из определения.
Очевидно, что базис будет двойственен самому себе в том и только
в том случае, если он ортонормален.
Если базис VL, . . ., Vn двойственен с базисом Ut Un, то ба-
базис U[ \]п двойственен с базисом Vl Vn, т. е. отноше-
отношение двойственности базисов симметрично. Поэтому имеет смысл
говорить о паре взаимно двойственных базисов (биортогональные
базисы).
Введение двойственного базиса дает возможность представлять
координаты вектора в виде скалярных произведений. Именно, если
координаты вектора X в базисе Up .... Ura суть числа xt хп,
то
Х; = (Х, V4).
Действительно, (X, Vi) = (jc1U1+ . . . + xn\in, Vi) = xi. В свою оче-
очередь
*1 = (х, ио.
где х[ х'п координаты вектора X в базисе Vt Vn. В тен-
тензорной алгебре координаты xt хп называются контрава-
риантными относительно базиса \]1 Ure, а координаты^, ..., х'
ковариантными относительно того же базиса. Одновременное упо-
употребление тех и других координат представляет большие удобства.
92
ОСНОВНЫЕ СВЕДЕНИЯ ИЗ ЛИНЕЙНОЙ АЛГЕБРЫ
[ГЛ. I
Так, например, скалярное произведение двух векторов выражается
через их координаты по отношению к любому (не ортогональному)
базису следующей простой формулой
Укажем один индуктивный способ построения базиса двойствен-
двойственного к данному, напоминающий процесс ортогонализации. Пусть
Ux Ura базис, для которого нужно строить двойственный, и пусть
V(°> \W какой-нибудь другой базис. Допустим, что определители
(V<°>, U.) (v<0), U.)
/f, и,) • • • Ко), и,
..., д„ =
f, U.)
отличны от нуля.
Построим последовательно системы векторов
так, чтобы k-я система удовлетворяла первым k группам условий
биортогональности
(vl4), Mj) = hj при i = 1, 2, л; у = 1 &.
Возьмем
1
(vf> и,) Vl
при/>1.
Ясно, что (VW, Ui)= 1 и (VW, Ui) = 0 при /> 1.
Заметим, что
и,) = (vf, иО - (vP. и,) 11^- = ii ^ о.
Допустим, что мы уже построили векторы vi , V2 Vn 1
удовлетворяющие поставленным условиям, и убедились в том, что
(vl?, \]к)==:~^- ФО. Положим
Ч и»)
Vg
к-i)
§ 9]
Тогда
ОРТОГОНАЛЬНОСТЬ ВЕКТОРОВ И ПОДПРОСТРАНСТВ
(\Р, U*) = 1, (v|u), U*) = 0 при / Ф k
93
= (у?-1}. Uj) = atf при у<л— i.
Остается убедиться в том, что (vif+i, Ua+i) = - д+1 и потому
(Vi+i, Uft+i)=^=0. С этой целью рассмотрим последовательность
матриц
_(v<,*\u,) ... №,и„)_
1 0 ... О (\\к), Uft+i) • • • (\[к\ UB)
о о ... 1 да,
О О ... О №1. u*+i) ¦ • • №ь "я)
Матрица
на число (v
получается из матрицы
, Us) = . "
~Ч делением /fe-й строки
и добавлением й-й строки с надлежа-
надлежащим множителем ко всем остальным. Поэтому все главные миноры
матрицы Л№, начиная с минора порядка k, равны произведениям соот-
соответствующих миноров матрицы А^~^ на ^-1.
Аналогично, все главные миноры матрицы А^\ начиная с ми-
минора порядка k— 1, равны соответствующим минорам матрицы А^к ~2\
умноженным на -~—- и т. д. Применяя это к главному минору по-
порядка k-\-\ матрицы А'М, который, очевидно, равен (Vfe+i, Uj+i) ¦
получим
Вычисление базиса Vt Vm, двойственного к базису иь .. ., Un,
по существу равносильно обращению матрицы А, составленной из
координат векторов \]v .. ., Ure по отношению к некоторому орто-
нормальному базису. Действительно, если матрица В соЪтавлена из
94
ОСНОВНЫЕ СВЕДЕНИЯ ИЗ ЛИНЕЙНОЙ АЛГЕБРЫ
[гл. 1
координат векторов Vx \п в том же базисе, то
В* А = Е.
что непосредственно следует из правила умножения матриц и условий
ортогональности.
§ 10. Линейные операторы в унитарном пространстве
и в эвклидовом пространстве
1. Сопряженный оператор. Пусть А оператор, определенный
в унитарном пространстве. Оператор А* называется сопряжен-
сопряженным с А, если для любых векторов X, Y выполняется равенство
(АХ, Y) = (X, A*Y).
Докажем существование и единственность сопряженного оператора.
Пусть оператору А в некотором ортонормальном базисе соответствует
матрица
векторам X и Y в том же базисе соответствуют столбцы из коорди-
координат (Х[, х2 хп)' и (уи у2, .... уп)'. Тогда вектору АХ будет
соответствовать столбец
•• +аппхп-
Следовательно,
(АХ, Y) = апх,J, -f • • ¦ + OinXtd
¦ ¦ ¦ + аппхпуп =
хп
¦ •• Л-аПпУп) =
= (Х, A*Y),
§ 10] ЛИНЕЙНЫЕ ОПЕРАТОРЫ 95
где А* оператор, имеющий в том же базисе матрицу
А* =
ап а21 ... ап1
а12 а22 ... ап2
.а,
сопряженную с матрицей А.
Таким образом, в качестве сопряженного оператора может быть
взят оператор, имеющий в некотором ортонормальном базисе матрицу,
сопряженную с матрицей исходного оператора в том же базисе.
Докажем теперь единственность сопряженного оператора. Пусть
А* и А* два оператора, сопряженных с оператором А. Тогда
(АХ, Y) = (X, A*Y) = (X, A^Y), откуда (X, (A^ — A^) Y) = 0. Сле-
Следовательно, вектор (A* — A*)Y ортогонален к любому вектору X
пространства R и потому (А* — Aj)Y —0 при любом Y. Отсюда за-
заключаем, что А* — А* есть нулевой оператор, т. е. А* = А*.
Из определения и единственности сопряженного оператора ясно,
что (А*)* = А.
В эвклидовом пространстве сопряженному оператору (по отноше-
отношению к ортонормальному базису) будет соответствовать матрица,
транспонированная с матрицей оператора А (по отношению к тому же
базису), ибо операторы в эвклидовом пространстве представляются
вещественными матрицами.
2. Свойства собственных значений и собственных векторов
операторов в унитарном пространстве. Выясним некоторые взаимо-
взаимоотношения между собственными значениями и собственными векто-
векторами взаимно сопряженных операторов А и А*.
Прежде всего отметим, что характеристические полиномы этих
операторов имеют комплексно-сопряженные коэффициенты и потому
собственные значения оператора А* будут комплексно сопряжены
с собственными значениями оператора А. Это следует из того, что
матрица А* оператора А* в некотором ортонормальном базисе сопря-
сопряжена с матрицей А оператора А в том же базисе. В случае, если
матрица оператора А вещественна в некотором ортонормальном базисе,
то характеристические полиномы и собственные значения операторов А
и А* совпадают.
Взаимосвязи между собственными векторами характеризуются сле-
следующей теоремой.
Теорема 10.1. Если X; собственный вектор оператора А,
соответствующий собственному значению Х;, и \j собственный
вектор оператора А*, соответствующий собственному значе-
значению Xj, то (Хг, Y^) = 0 при
96
ОСНОВНЫЕ СВЕДЕНИЯ ИЗ ЛИНЕЙНОЙ АЛГЕБРЫ
[ГЛ. I
Доказательство. Подсчитаем двумя способами (АХ;, \j). С одной
стороны,
(АХ,. ?,) = №. \j) = h(^t. Y,).
С другой стороны,
(АХ,, Y,) = (X,,
Поэтому
(X, —X,)(Xt. Y,) = 0
и так как Xj—
то
(Х„ Y,) =
что и требовалось доказать.
Отсюда следует, что если все собственные значения Х: Хп
оператора А различны, то для собственных векторов Х^ . . ., Хп
оператора А и собственных векторов \г Yn оператора А* имеют
место п2— п соотношений ортогональности, именно (Xj, Yy) = 0,
1ф). Покажем теперь, что, выбрав каким-либо способом векторы
Y: Yn, мы можем нормировать векторы Xlf .... Хп так, что
(X;, Yj)=l.
Прежде всего покажем, что (Xit У^) = а^0. Действительно,
если бы (Xj, Y{) = 0, то вектор Y» был бы ортогонален ко всем соб-
собственным векторам Xt, ..., X;, .... Х„ оператора А, а следова-
следовательно, и ко всем векторам пространства R, что означало бы, что Y,-
нулевой вектор. Взяв вместо векторов Хь .... Хга векторы — Xv ...
.... — Хп, мы получим требуемое нормирование, ибо
Таким образом, системы векторов Хх,
Хп и
Yre после
проведения нормировки образуют взаимно двойственные базисы про-
пространства.
3. Две группы соотношений ортогональности для собственных
векторов матрицы. Пусть А матрица, собственные значения кото-
которой Xt, ,.., Хге различны, и пусть Хг Хп соответствующие им
собственные векторы (столбцы). Как мы видели, сопряженная матрица А*
имеет собственными значениями числа комплексно-сопряженные
с Xj Х„. Пусть
нормированные
Yn собственные векторы матрицы А",
ше
~хп
•^21
—Хп1
согласно
ха ...
X
хг...
предыдущему i
Х2П
Х1111 —
и Y —
:ункту
~Уи
Угх
-Уы
. Составим матрицы
Уи •
Уа •
Ум-
¦ Уы
• Угп
• Упп-
t
§ 10] ЛИНЕЙНЫЕ ОПЕРАТОРЫ 97
столбцы которых составлены из компонент собственных векторов
матрицы А и матрицы А* соответственно. Выведенные выше соотно-
соотношения ортогональности и нормированности в координатной записи
имеют вид
l (l=zJ)
что равносильно матричному равенству
У'Х=Е,
где Y* матрица, сопряженная с матрицей Y. Заметим, что 1-я строка
матрицы К* состоит из компонент собственного вектора матрицы А',
транспонированной с А, соответствующего собственному значению Х4.
Из равенства Y*X=E следует, что
XV = Е,
что дает вторую группу соотношений ортогональности
¦ хггУ]г + • • • + хтУ]п — |
= ;).
4. Свойства ортогональности корневых векторов.
Теорема 10.2. Любой корневой вектор оператора А, соот-
соответствующий значению I, ортогонален к любому корневому век-
вектору оператора А*, соответствующему собственному значению
Доказательство. Пусть Хо корневой вектор оператора А высоты т,
соответствующий собственному значению X, и Yo корневой вектор со-
сопряженного оператора А* высоты k, соответствующий, собственному
значению ^Ф'к. Построим цепочки корневых векторов:
Х1 = (к — XE)Xq
X2=r(A — XE)Xt
OT_j —¦ (А аЕ) Хт_2
(А—ХЕ)Хт_1 =
(A* —
7 Зак. 974. Д. К. Фаддеев и В. Н. Фаддвеаа
98 ОСНОВНЫЕ СВЕДЕНИЯ ИЗ ЛИНЕЙНОЙ АЛГЕБРЫ [ГЛ. I
Векторы Xm_i и Yt_! будут собственными для операторов А и А*
соответственно, принадлежащими собственным значениям X и [л. Сле-
Следовательно, Xm_j и Y;?_! ортогональны. Доказательство теоремы
проведем по индукции. Пусть уже установлено, что (Xm_i, Yft__/) = 0
при i-\-j </, />3. Докажем тогда, что (Хт_{, Yft_j) = 0 и при
i-\-j = l. Действительно,
X(Xm_j, Y^) —(ХХт_г-, Yu_y) =
ибо (Xn,_i, Y,(_i+1)=0 и (Xm_i+1, Yu_j) = 0' в силу индукцион-
индукционного предположения. Отсюда (X— jx) (Хш_^, Yft_^) = 0 и, следовательно,
(Хт_{, Yk_j) = 0, так как \фр.
5. Базис двойственный к каноническому.
Теорема 10.3. Базис двойственный к каноническому базису
оператора А есть канонический для сопряженного оператора А*
с «перевернутыми башнями»; точнее, если Хо, . . ., Хот_1 «башня»,
взятая из канонического базиса для оператора А, такая, что
то двойственно соответствующие векторы Yo, ..•, YM_iудовле-
YM_iудовлетворяют соотношениям
Доказательство. Заметим предварительно, что если оператору А
в некотором базисе Ии ..., Un соответствует матрица А, то сопря-
сопряженному оператору А* в двойственном базисе Vj, .... \п соответ-
соответствует матрица Л*, сопряженная с матрицей А.
Действительно, пусть A — {ai}) при г, у=1, 2 п. Тогда
п
АЦ|- = 2 aijUj, откуда следует, что ay = (AlTj, Vj). Пусть далее
§ 11]
САМОСОПРЯЖЕННЫЙ ОПЕРАТОР
99
В = {Ь^) (/=1, . .., п; У=1 п) матрица, соответствующая
оператору А* в базисе Vlt .... Vn. Тогда b\j — (A*V^, Uj)- Но
(A*Vj, Ui) = (V,, AUi) = (AUlP \j)=^'a}i. Это и доказывает, что В = А*.
В каноническом базисе оператору А соответствует каноническая
матрица Жордана и башне Хо, ..., Xm_! соответствует канонический
ящик Жордана
X
1 X
1 X
В двойственном базисе оператору А* соответствует сопряженная
матрица. В частности, векторам Yo, . . ., Ym_t будет соответствовать
«ящик»
~~ X 1
л
Это и значит, что
**V W -4- V
rt l m-l— л1т—1 i • m-i
A'Ym_2= XYm_2-f-Ym_3
что и требовалось доказать.
§ 11. Самосопряженный оператор
В настоящем параграфе мы положим в основу не унитарное про-
пространство, а эвклидово пространство, так как результаты излагаемой
здесь теории, в отличие от общей теории собственных значений, не
требуют выхода в комплексное пространство.
Все результаты почти без изменений переносятся и на унитарное
пространство. Мы ограничимся лишь формулировками относящихся
сюда теорем.
7*
100 ОСНОВНЫЕ СВЕДЕНИЯ ИЗ ЛИНЕЙНОЙ АЛГЕБРЫ [ГЛ. I
-1. Определение. Оператор А называется самосопряженным,
если для любых векторов X и Y, принадлежащих R, имеет место
равенство
(АХ, Y).= (X, AY),
т. е. оператор А совпадает со своим сопряженным. Матрица само-
самосопряженного оператора по отношению к любому ортонормальному
базису вещественна (эвклидово пространство) и симметрична, так как
она должна совпадать со своей транспонированной.
Любая линейная комбинация самосопряженных операторов есть
самосопряженный оператор. Далее, если самосопряженный оператор А
невырожденный, то обратный для него оператор А" самосопряжен.
Действительно, полагая A^X^U, A~XY = V, имеем (А^'Х, Y) =
= (U, AV) = (AU, V) = (X, A~'Y). Очевидно и обратное, если опе-
оператору А в некотором ортонормальном базисе соответствует симме-
симметричная матрица, то оператор самосопряженный. Действительно,
в этом случае операторам А и А* отвечает одна и та же матрица,
и, следовательно, они совпадают.
Таким образом, если в пространстве выбрать ортонормальный
базис, то самосопряженные операторы находятся в естественном
одно-однозначном соответствии с симметричными матрицами. Имеется
также тесная связь между самосопряженными операторами и квадра-
квадратичными формами. Именно, скалярное произведение (АХ, X), выра-
выраженное через координаты вектора X, есть не что иное как квадра-
квадратичная форма с матрицей, совпадающей с матрицей А оператора
в выбранном ортонормальном базисе. Действительно,
п n
(АХ, Х) = 2 2 ац XiXj (ai} = aj{).
2. Одно свойство инвариантных подпространств самосопря-
самосопряженного оператора.
Теорема 11.1. Если Р инвариантное подпространство само-
самосопряженного оператора А, то ортогонально-дополнительное
подпространство Q есть также инвариантное подпространство.
Доказательство. Пусть X?Q. Это значит, что (X, Y) = 0 при
любом Y?P. Но тогда при любом Y?P и (АХ, Y) = (X, AY) = 0
(ибо AY?P в силу инвариантности Р). Отсюда AX?Q, что и тре-
требовалось доказать.
3. Построение системы взаимно ортогональных собственных
векторов самосопряженного оператора. Собственные -векторы и
собственные значения самосопряженного оператора обладают рядом
экстремальных свойств, из которых непосредственно вытекают такие
важные свойства, как вещественность всех собственных значений и
существование ортогонального базиса, составленного из собственных
§ 11] САМОСОПРЯЖЕННЫЙ ОПЕРАТОР 101
векторов. В основе этих экстремальных свойств лежит следующая
теорема.
(А \ V \
Теорема 11.2. Существует максимум отношения ,v '
(л., л.)
при X, пробегающем все пространство (кроме нулевого вектора).
Любой вектор, при котором этот максимум достигается, есть
собственный вектор оператора А, а величина максимума есть
соответствующее собственное значение.
Доказательство. Так как
(АХ, X) _ (АХ, X)
(Х,Х) ~~ |ХР
х _х_\
|Х|' \Х\)'
то исследуемый максимум равен максимуму (АХ, X) при X, изменяю-
изменяющемся на «единичной сфере», т. е. так, что длина X равна единице.
Существование максимума (АХ, X) непосредственно следует из тео-
теоремы Вейерштрасса о достижении точной верхней границы для не-
непрерывной функции на ограниченном замкнутом множестве. Пусть
L = max \v '¦. = (AXt, X,), где X, вектор длины единица, реали-
X?R (л, А)
зующий максимум. Тогда для любого вектора
Положим Y = AXX — XxXt и докажем, что Y = 0. Прежде всего по-
покажем, что Y ортогонален к Xt. Действительно, (Y, Х1) = (АХ1 —
— ^iXlt Х1) = (АХ1> Хх) — \(XV XJ^O в силу определения Xt.
Пусть X^Xi+eY, где s положительное вещественное число.
Имеем
(А (Хх + eY), Хх + eY) < \ (X, + sY, Xx + eY),
откуда
(АХр Х1) + е(АХ1, Y)+e(AY, Xx)+s2(AY, Y)<MX,, XJ +
+ 2Х1е(Х1, Y) + >4S2(Y, Y).
Принимая во внимание, что (АХХ> Хх) = \; (AXV Y) = (AY, Xj);
(Хх> Хх)=1 и (Xj, Y) = 0, получим
2е(АХ1, Y) + s2(AY, \)^.e%(\, Y).
Поделив обе части на s и устремив s к нулю, получим
Х, Y)<0.
Далее
(Y, Y) = (AX1 — liXl, Y) = (AXi, Y) — \(XU Y) = (AX1. Y)<0.
Отсюда Y = 0, т. е. AX1 = X1Xi.
Замечание. Отношение - ' часто называют отношением
(А, А)
Ре л е я.
102 ОСНОВНЫЕ СВЕДЕНИЯ ИЗ ЛИНЕЙНОЙ АЛГЕБРЫ [ГЛ. I
Теорема 11.3. Пусть А самосопряженный оператор. Тогда
существует система попарно ортогональных собственных век-
векторов А, образующих базис пространства. Все собственные
значения А вещественны.
Доказательство. Пусть Xt нормированный собственный вектор
оператора А, дающий максимум (АХ, X) на единичной сфере. Обо-
Обозначим через Р1 одномерное подпространство, натянутое на Хх, и че-
через Q[ его ортогональное дополнение. Очевидно, что Plf а следо-
следовательно, и Q, будут инвариантными подпространствами. Размерность QL
равна п—1. Оператор А, рассматриваемый на Qx, будет, очевидно,
самосопряженным и, следовательно, для него найдется нормиро-
нормированный собственный вектор Х2, реализующий max (AX, X). Легко
X€Q |X|
видеть, что соответствующее собственное значение ).2 будет не
больше \. По построению (Х^ Х2) = 0.
Пусть Р2 есть подпространство, натянутое на Х[ и Х2, и Q2 его
ортогональное дополнение (размерности п — 2). Подпространство Р2,
а следовательно, и подпространство Q2 инвариантны. Рассмотрим
оператор А на Q2. Для этого самосопряженного оператора найдется
собственный вектор Х3, реализующий max (AX, X), и соответ-
|Х 1-1, XgQ,
ствующее собственное значение Х3 будет не больше )..,. Очевидно,
что (Xj, Х3) = 0 и (Х2, Х3) = 0. Продолжая указанный процесс при-
придем к системе попарно ортогональных собственных векторов Xt,
..., Хп. Соответствующие им собственные значения будут удовлетворять
неравенствам X, ^> Х2 ^ . . . ^> Хп. Покажем, что в этом ряду каждое
собственное значение повторяется столько раз, какова его кратность
как корня характеристического полинома. Действительно, оператору А
в базисе Хх Х„ соответствует диагональная матрица
и, следовательно, характеристический полином А есть
Оч — Oft» — 0 ••¦ (К — t).
Из описанной конструкции следует, что все собственные значе-
значения Х1? ..., Х„ вещественные, а также что для каждого кратного
собственного значения существует столько попарно ортогональных
(и, следовательно, линейно-независимых) собственных векторов, ка-
какова кратность этого собственного значения как корня характери-
характеристического полинома.
§11] САМОСОПРЯЖЕННЫЙ ОПЕРАТОР 103
В алгебраической форме теорема 11.3 может быть сформулиро-
сформулирована в следующем виде: для любой симметричной матрицы А су-
существует ортогональная матрица Р, такая, что Р' АР есть диа-
диагональная. Действительно, матрицу А можно считать матрицей неко-
некоторого самосопряженного оператора А в ортонормальном базисе.
В базисе, составленном из нормированных собственных векторов,
матрица Л оператора А будет диагональной. Следовательно, Л = Р~гАР,
где Р матрица, составленная из компонент нормированных собст-
собственных векторов. Матрица Р ортогональна, так что Р'1 — Р'
и А = Р'АР.
Диагональные элементы матрицы Л являются собственными зна-
значениями матрицы А.
Непосредственным следствием проведенной экстремальной конст-
конструкции является следующая теорема.
Теорема 11.4. Пусть X, >¦ Х2 .>-... ]!> Хи собственные значения
самосопряженного оператора A, Xj, ..., Кп им принадлежа-
принадлежащие попарно ортогональные собственные векторы. Тогда
(АХ, X)
N= max ±
х /о ^Л' AJ
, (АХ, X)
Х2 = max v '
лА.= max
(X. х>
(АХ, X)
х
Очевидно, что проведенное построение собственных значений
и принадлежащих им собственных векторов можно видоизменить,
( \Х Х^
вычисляя вместо последовательных максимумов отношения W~v\
(Л, Л)
последовательные минимумы этого отношения. При таком построе-
построении собственные значения определяются в порядке их возрастания.
Поэтому верна следующая теорема.
Теорема 11.5. Пусть Xt^.X2 ~^> . .. ~^>У.п собственные числа
самосопряженного оператора А, Хр ..., Х„ соответствующие
им попарно ортогональные собственные векторы. Тогда
(АХ, X)
_1= mm
(АХ, X)
. (АХ, X)
— mm y.-
104 ОСНОВНЫЕ СВЕДЕНИЯ ИЗ ЛИНЕЙНОЙ АЛГЕБРЫ [ГЛ. I
4. Инвариантные подпространства самосопряженного опера-
оператора. Пусть \ > Ц > ... > Xs собственные значения самосопря-
самосопряженного оператора А с кратностями пи пг, ..., ns. Как было по-
показано, в пространстве может быть построен базис из собственных
векторов оператора А, причем число базисных собственных
векторов, соответствующих собственному значению Х;, равно его
кратности «j. Обозначим через Р{ подпространство, натянутое на
базисные собственные векторы, соответствующие значению А;. Под-
Подпространства Pt, .... Ps в силу построения взаимно ортогональны,
и все пространство R есть прямая сумма подпространств Plf .... Ps.
Очевидно, что каждый вектор подпространства Р; есть собственный
вектор оператора А, соответствующий собственному значению Х{.
Обратно, каждый собственный вектор, принадлежащий собственному
значению \{, принадлежит Р,-, т. е .Р, есть совокупность всех собст-
собственных векторов, принадлежащих Х4. Действительно, пусть АХ = Х;Х.
Разложим- вектор X по подпространствам Р,-
Х = Х,+ ... +Х4+ ... +XS, X^P,.
Тогда
АХ = Х;Х = X,Xj + ••• +>Л+ ... + Х;Х8.
С другой стороны,
АХ = АХ! -f • • • 4- АХ4 + • • • + АХв =
= Х1Х,+ ... +Х;Х;4- ••• -4-XsXs.
В силу однозначности разложения любого вектора по подпростран-
подпространствам Pit имеем
Х;Х; = ijXj
при всех у, и, следовательно, Х_,- = 0 при j Ф I, т. е. X = Xi?Pj.
Отсюда вытекает следующее важное свойство собственных векторов
самосопряженного оператора А.
Собственные векторы самосопряженного оператора А, принад-
принадлежащие различным собственным значениям, ортогональны. Дей-
Действительно, они принадлежат к взаимно ортогональным подпро-
подпространствам.
Это свойство собственных векторов легко доказать и непосредст-
непосредственно без использования экстремальной конструкции, ибо если X;
и Xj собственные векторы, принадлежащие' )н и*Х_,- и Х4 Ф Xj, то
(Хг — X,.) (X,. X,.) = (Х,Х„ Х;) - (X,. Х^.) =
Х^ —(Х„ АХ^) = (АХ,. X;) —(AXt. Х^) = 0,
откуд-а (Х{, Xj) = 0.
Замечание. Очевидно, что подпространства Р; являются кор-
корневыми подпространствами для самосопряженного оператора А. Та-
Таким образом, все корневые векторы для самосопряженного оператора
являются просто, собственными векторами. Поэтому минимальный
§ И] САМОСОПРЯЖЕННЫЙ ОПЕРАТОР 105
полином для самосопряженного оператора имеет только простые
корни.
Из разложения пространства R в прямую сумму подпространств
р1 Ps и из экстремальных свойств собственных значений са-
самосопряженного оператора (теорем 11.4 и 11.5) непосредственно
следует справедливость следующих теорем.
Теорема 11.6. Если \ > Х2 > . . . > Х8 попарно различные
собственные числа оператора А а Р, Ps соответствующие
им подпространства собственных векторов, то
, _ (АХ, X)
Л] —— ГПЗХ 7x7 жг \ *
(АХ, X)
шах ту V4
A А
_ (АХ, X)
Kk —. max _. Y -.
xj_p,+ ... +rk_1 <•¦*¦' л>
Теорема 11.7. Если \ > . . . > Xs попарно различные собст-
собственные числа оператора А и Рх Ps соответствующие им
подпространства из собственных векторов, то
, . (АХ, X)
As = mm ¦
X фй vA. A)
, . (АХ, X)
Xs_!= mm ' -
X J_Pg vA' A)
, . (АХ, X)
Хт. = min
(X, X) ¦
Строение инвариантных подпространств для самосопряженного
оператора более просто по сравнению с общим случаем. Действи-
Действительно, пусть Т какое-либо инвариантное подпространство. Опера-
Оператор А, индуцированный оператором А на Т, будет, очевидно, са-
самосопряженным и, следовательно, в подпространстве Т существует
базис, состоящий из собственных векторов оператора А. Но каждый
собственный вектор оператора А есть в то же время собственный
вектор для оператора А. Таким образом, любое инвариант-
инвариантное подпространство самосопряженного оператора
натянуто на некоторую систему собственных век-
векторов. Далее, подобно всему пространству подпространство разла-
разлагается в прямую сумму подпространств Т{) состоящих из собствен-
собственных векторов, принадлежащих собственному значению Х4. Ясно, что
106 ОСНОВНЫЕ СВЕДЕНИЯ ИЗ ЛИНЕЙНОЙ АЛГЕБРЫ [ГЛ. I
Если Х?Т и X = Xj-f- ... -f-X8 есть разложение X по под-
подпространствам Pj, то все X.;?Tj. Действительно, T = TnPi+ •••
. . . —(— Т П F*s и- следовательно, имеет место так же разложение
X = X,'-{- •¦• +Х^, где Х^ТЛР,- В силу однозначности разло-
разложения вектора X по подпространствам Pj все проекции Х^ совпа-
совпадают с Xj. Но X, принадлежат Т.
Строение циклических подпространств описывается теоремой.
Теорема 11.8. Пусть Хо произвольный вектор пространства R.
Тогда циклическое подпространство для самосопряженного опе-
оператора А, порожденное вектором \0, есть подпространство,
натянутое на ненулевые проекции вектора Хо на подпростран-
подпространства Ру . . ., Pg.
Эта теорема является непосредственным следствием более общей
теоремы 8.2. Мы, однако, приведем ее независимое доказательство.
Пусть Q циклическое подпространство, порожденное вектором Хо,
и пусть
X0 = Xfc+ ... -\-Xkj, Xfcl?Pfti,
kj,
разложение Хо по подпространствам Рх, . . ., Ps, причем в этом раз-
разложении удержаны лишь отличные от нуля проекции. В силу ска-
сказанного выше все Xfcl> ..., Xfc. принадлежат Q и, следовательно,
натянутое на них подпространство Q' содержится в Q. Но Q' инва-
инвариантно, ибо оно натянуто на собственные векторы X*,, .... Xfc.,
и Q' содержит Хо. Следовательно, QcQ' и потому Q = Q'.
5. Положительно-определенные операторы. Среди всех само-
самосопряженных операторов особо важную роль играют положительно-
определенные операторы. Самосопряженный оператор А называется
положительно-определенным если для любого зектора X,
отличного от нуля, (АХ, X) > 0.
Из определения следует, что ядро положительно-определенного
оператора состоит только из нулевого вектора, так что положи-
положительно-определенный оператор не вырожден и, следовательно, для
пего существует обратный оператор А.
Матрица положительно-определенного оператора в ортонормаль-
ном базисе положительно определена, и обратно, оператор с поло-
положительно-определенной матрицей в ортонормальном базисе положи-
положительно определен. Действительно, (АХ, X) есть квадратичная форма
от координат вектора в ортонормальном базисе, матрица которой
совпадает с матрицей, сопоставляемой оператору в том же базисе.
Отметим ряд интересных свойств положительно-определенных опе-
операторов.
Теорема 11.9. Если А и В положительно-определенные опе-
операторы, то оператор c^k-^-cJi положительно определен при
с, > 0, сг > 0. Иначе, положительно-определенные операторы
образуют выпуклый конус в пространстве операторов.
§ 11] САМОСОПРЯЖЕННЫЙ ОПЕРАТОР 107
Доказательство. Имеем ((ctA -f- с2В) X, Х) = с1(АХ, Х) +
+ с2(ВХ, Х)>0 при ХфО.
Теорема 11.10. Если оператор А положительно определен,
то оператор А тоже положительно определен.
Действительно,
(А^Х, X) = (A-1X. AA~1X) = (AY, Y)>0.
Здесь Y = A~X.
Теорема 11.11. Все собственные значения положительно-
определенного оператора положительны.
Действительно, если X собственное значение положительно-опре-
положительно-определенного оператора А и X соответствующий этому собственному
значению собственный вектор, то АХ = XX и
> (АХ' X) ^ п
Л== (X, X) >°-
Теорема 11.12. Если А положительно-определенный оператор
и С любой невырожденный оператор, то С*АС положительно
определен.
Действительно, (С*АСХ, X) = (АСХ, СХ) > 0, ибо при X ф О
вектор СХ Ф 0.
В частности, отсюда следует, что для любого невырожденного
оператора С оператор С*С положительно определен.
Теорема 11.13. Для любого положительно-определенного опе-
оператора А существует положительно-определенный „квадратный
корень" А \ т. е. такой положительно-определенный оператор В,
что В2 — А.
Действительно, пусть \ \п собственные значения оператора А
и Xt Хп попарно ортогональные собственные векторы, им при-
принадлежащие. Тогда АХ, = Х;Х{ (/=1,2, ..., п). Определим опе-
оператор В, положив ВХ,- = l/"XjX{ и линейно распространив оператор
на все пространство. Тогда В2Х4 = Х4Х{ = АХ{, т. е. операторы В2
и А совпадают на базисе Xt Х„. Следовательно, в силу линей-
линейности они совпадают и во всем пространстве. Итак, В2 = А. Оче-
Очевидно, что оператор В положительно-определенный.
Теорема 11.14. Если А — самосопряженный оператор а В —
положительно-определенный оператор, то все собственные зна-
значения оператора ВА (а следовательно, и В~ХА) вещественны.
Действительно, ВА = BVa(BVaАВ/а)В. Поэтому собственные
значения оператора ВА равняются собственным значениям опера-
оператора В'^АВ'1'2, который, очевидно, самосопряжен.
. Теорема 11.15. Если А и В положительно-определенные
операторы, то все собственные значения оператора ВА поло-
положительны.
108 ОСНОВНЫЕ СВЕДЕНИЯ ИЗ ЛИНЕЙНОЙ АЛГЕВРЫ |ГЛ. I
Действительно, в этом случае оператор В/!АВ''' —(В ')*АВ 3 по-
положительно определен в силу теоремы 11.12.
Теорема 11.18. Если В положительно-определенный опера-
оператор, А самосопряженный оператор и все собственные значения
оператора ВА положительны, то А положительно определен.
Действительно, если все собственные значения оператора ВА
положительны, то положительны и все собственные значения опера-
оператора В~'/з(ВА) В'"' = В'2АВ'а, т.е. самосопряженный оператор В'2АВ"а
положительно определен. В силу теоремы 11.12 будет положительно-
определенным и оператор А.
Теорема 11.1/. Если А и В перестановочные положительно-
определенные операторы, то АВ положительно-определенный опе-
оператор.
Действительно, в этом случае АВ самосопряженный и его поло-
жительно-определенность следует из положительности его собственных
значений.
Очевидно, что все свойства, описанные в теоремах 11.9- —11.17
остаются верными и для положительно-определенных матриц.
Каждый положительно-определенный оператор определяет неко-
некоторую метрику пространства, удовлетворяющую всем аксиомам
обычной эвклидовой метрики. Именно, А-скалярным произве-
произведением (X, Y)A двух векторов X и Y называется скалярное про-
произведение (АХ, Y). При таком определении все четыре аксиомы
эвклидовой метрики
1) (X, Х)А > 0. X Ф О
2) (X. Y)A = (Y.X)A
3) (аХ. Y)A = e(X, Y)A
выполнены.
Действительно, 3-я и 4-я аксиомы выполнены в силу линейности
оператора А, 2-я в силу самосопряженности и 1-я в силу положи-
положительной определенности.
В этой метрике роль длины вектора X играет А-длина, т. е. ве-
величина ]/(АХ, X). А-о р т о г о н а л ь н ы ми или сопряженными
(относительно А) векторами называются векторы X и Y, для которых
(АХ, Y) = 0. Все теоремы, доказанные в § 9, очевидно, переносятся
на пространство с А-метрикой. В частности, справедливы теоремы.
Теорема V.18. (АХ, YJ<(AX, X) • (AY, Y).
Теорема 11.19. Попарно к-ортогональные векторы линейно-
независимы.
Теорема 11.2Q. Пусть \v . .., Х& заданная система линейно-
независимых векторов. Тогда можно построить К-ортогональную
§ 11 I САМОСОПРЯЖЕННЫЙ ОПЕРАТОР 109
систему векторов, связанную с исходной соотношениями:
s, = xx
S2 = X2 -j- a21X(
Ввиду того, что при построении некоторых численных методов
будет применяться процесс А-ортогонализации и численная реали-
реализация этих методов будет проводиться по формулам процесса, мы
приведем доказательство теоремы, хотя оно почти дословно повто-
повторяет доказательство теоремы 9.2.
Доказательство. Проведем построение по индукции. Пусть
векторы Sp . . ., Sm_! уже построены и отличны от нуля. Вектор Sm
ищем в виде
Коэффициенты ^mj определяем из условия А-ортогональности векто-
векторов Sp ..., Sm_j к вектору Sm. В силу А-ортогональности системы
векторов SP .... Sm_j и в силу того, что Sj Ф 0, /= 1, . .., т — 1,
имеем
tmJ — (Sj, ASj) — (S,, ASj) ' {l)
Подставив в равенство A) вместо Sj, •••, STO_t их выражения через
Xlt .... Хт_,, получим, что
Sm = X,n -j- C-miXj + • • • -f- <*тт-1Лт-\-
Отсюда следует, что вектор Sm не равен нулю, ибо иначе векторы
X] Хт были бы линейно-зависимы, что противоречит условию
теоремы. База для индукции дается тривиальным случаем т=1.
Итак, система А-ортогональных (сопряженных) векторов опреде-
определяется рекуррентными соотношениями
в которых коэффициенты определяются по формулам B).
При практических вычислениях более удобно пользоваться не-
несколько иными формулами для коэффициентов. Именно, из равенства
следует, что
Отсюда
(Sm, AX^) = 0 при j < /я,
110 ОСНОВНЫЕ СВЕДЕНИЯ ИЗ ЛИНЕЙНОЙ АЛГЕБРЫ [ГЛ. I
Таким образом,
_ (Sj, AXm)
^ — (Sj, AXj) •
6. Самосопряженный оператор в унитарном пространстве.
Для унитарного пространства определение самосопряженного опера-
оператора совпадает с определением, данным выше для пространства
Эвклида. Именно, оператор А называется самосопряженным, если он
совпадает со своим сопряженным, т. е. если
(АХ, Y) = (X, AY)
при любых X и Y.
Матрица самосопряженного оператора по отношению к любому
ортогональному базису является эрмитовой, ибо она совпадает со своей
сопряженной. Для любого вектора X скалярное произведение (АХ, X)
принимает вещественное значение. Действительно, (АХ, X) — (X, АХ) =
= (АХ, X). Это обстоятельство делает теорию самосопряженных
операторов в унитарном пространстве формально совпадающей с по-
подобной теорией в эвклидовом пространстве. Именно, с некоторыми
изменениями проводится конструкция для последовательного построе-
построения полной системы попарно ортогональных собственных векторов
при помощи экстремальных соображений. Из этой конструкции сле-
следует, что все собственные значения самосопряженного оператора
вещественны а матрица самосопряженного оператора может
быть приведена к диагональной форме. В алгебраической форму-
формулировке это обозначает, что любая эрмитова матраца может
быть приведена к диагональному виду преобразованием подобия'
посредством унитарной матрицы.
Далее сохраняются все экстремальные свойства собственных зна-
значений, так же как и строение инвариантных подпространств. Ска-
Скалярное произведение (АХ, X), выраженное через координаты X
в ортонормальном базисе, есть форма Эрмита от этих координат
с матрицей, равной матрице оператора А в том же базисе.
Самосопряженный оператор называется положительно-опре-
положительно-определенным, если для любого вектора X, отличного от нуля,
(АХ, X) > 0. Все собственные значения положительно-определенного
оператора положительны.
7. Нормальные операторы в унитарном пространстве. Опе-
Оператор А называется нормальным, если он перестановочен со
своим сопряженным оператором, т. е. если АА* = А*А.
Очевидно, что матрица нормального оператора' в любом орто-
ортонормальном базисе есть нормальная матрица.
Самосопряженные операторы входят в класс нормальных опера-
операторов. В этот же класс входят унитарные операторы, т. е. опе-
операторы, удовлетворяющие требованию А* = А~1.
§ 12]
КВАДРАТИЧНЫЕ ФОРМЫ
111
Теория собственных значений и собственных векторов для нор-
нормальных операторов очень похожа на соответствующую теорию для
самосопряженных операторов. Именно, верна следующая
Теорема 11.21. В пространстве существует ортонормаль-
ный базис, состоящий из собственных векторов данного нормаль-
нормального оператора.
§ 12. Квадратичные формы
1. Преобразование квадратичной формы к каноническому виду.
Теорема 12.1. Всякая квадратичная форма с вещественной
матрицей коэффициентов может быть приведена к следующему
каноническому виду
t^a2yl^- ... -\-а.пу2п,
где ух, уг, ..., уп переменные, связанные с исходными перемен-
переменными xlt х2 хп неособенным линейным преобразованием.
Доказательство. Для и=1 теорема тривиально выполняется.
Допустим, что для форм от п—1 переменной теорема доказана. До-
Докажем, что при этом предположении теорема верна и для форм от п
переменных. Пусть
x2 хп) =
= апх\-\-апх1хг-)г
а21хгх1
аггх%
а2пх2хп -f-
. -\-аппхп —
2alnx1xn-{- ф
•••. xn).
Допустим сначала, что ап ф 0. Тогда
г (atj, х2, • • •, хп) = ап[xt -j-- ¦ х2-f- .
- хп) —
., xn).
В силу индукционного предположения
Fi (х2 хп) = г
где
Уг
-Уп
апу2п,
, Вх — неособенная матрица.
112 ОСНОВНЫЕ СВЕДЕНИЯ ИЗ ЛИНЕЙНОЙ АЛГЕБРЫ
Положим
«11 «11 П
[гл. i
Тогда
Ух
Уг
-Уп-
«И
ап
Ясно, что В — неособенная матрица. В новых переменных квадра-
квадратичная форма примет искомый вид
F(xitx2, .... xn) =
при
Если же ап = 0, то всегда можно сделать предварительно неосо-
неособенное преобразование переменных, при котором коэффициент при
квадрате новой первой переменной окажется отличным от нуля (если
только квадратичная форма не равна нулю тождественно). Действи-
Действительно, если ап — 0, но акк Ф 0 при некотором k, то достаточно
лишь изменить порядок нумерации переменных. Если же все коэф-
коэффициенты ап апп равны нулю, но atj ф 0, то достаточно поло-
положить
хп = Уп-
Это преобразование, очевидно, неособенное. Преобразованная ква-
квадратичная форма будет иметь ненулевой коэффициент 2«у при у].
Замечание. Настоящее доказательство дает также описание
вычислительного процесса ддя приведения квадратичной формы к ка-
каноническому виду. Очень часто бывает, что на всех шагах этого
процесса имеет место первый случай, и тогда отпадает необходимость
вспомогательных преобразований. В этом случае матрица окончатель-
окончательного преобразования В будет треугольной.
2. Положительно-определенная квадратичная форма. Напоми-
Напоминаем, что квадратичная форма F(xlt ..., хп) называется положи-
положительно-определенной, если все ее значения положительны, кроме зна-
значения при
= хг =
= *„ = 0.
§ 12]
КВАДРАТИЧНЫЕ ФОРМЫ
113
Теорема 12.2. Для того чтобы квадратичная форма была
положительно-определенной, необходимо и достаточно, чтобы
все коэффициенты после приведения ее к каноническому виду
была положительны.
Доказательство. Пусть
F(xux2 хп) = а1у\-\-ягу\-{- ... -\-хпу2„.
Если at > 0, а2>0 ап > 0, то F (хх, хг х„), очевидно,
положительно определена. Если же аг <Г. О при некотором /, то, по-
положив уг = 0 Л=1 .Уп —0 и найдя соответствующие
значения Хх х„ переменных хи х2, ¦¦-, хп, получим
F(х1, ..., л:п) = а^^0. Теорема доказана.
Установленный критерий положительной определенности очень
удобен для практической проверки.
Существует другой критерий положительной определенности
квадратичной формы, применение которого не требует приведения
формы к каноническому виду.
Теорема 12.3. (Критерий Сильвестера). Квадратичная форма
? uijXiXj положительно определена в том и только в том слу-
случае, если все определители
а1п
Д1 = Оц. Д2 =
"
положительны.
Доказательство. Пусть F
п) = 2 щ}х^}
положи-
тельно определена.Тогда А=В'АВ, гдеВ матрица, преобразующаяформу
к каноническому виду, Л = [а4 хп] диагональная матрица, со-
составленная из коэффициентов канонического представления. В силу
доказанного выше критерия положительной определенности все аг ]> 0.
Поэтому Д„ = | Л | = | В71 . |Л| • IBl—a^ ... ап|В|2>0. Вместе
с тем, если форма F{хи .... хп) положительно определена, то по-
положительно-определенными будут и все формы
к
0
0)=
Поэтому все определители Дй (k=l, 2 п) положительны.
Допустим теперь, что At >• 0 Дп ]> 0. Тогда матрица А
может быть разложена в произведение
А = САВ,
где Л= At, д? ~- , С и В треугольные матрицы с единич-
единичными диагональными элементами. Так как матрица А симметрична,
8 Зак. 974, Д. К- Фаддеев и В. Н. Фаддеева
114 ОСНОВНЫЕ СВЕДЕНИЯ ИЗ ЛИНЕЙНОЙ АЛГЕБРЫ [ГЛ. I
то С = В'. Если теперь в квадратичной форме сделать преобразо-
преобразование переменных с матрицей В~ , мы придем к квадратичной форме
с матрицей Л, т. е. к канонической форме с положительными коэф-
коэффициентами. Тем самым форма F (х1 хп) положительно опре-
определена.
3. Ортогональное преобразование квадратичной формы к ка-
каноническому виду.
Теорема 12.4. Любая квадратичная форма с вещ ственной
матрицей коэффициентов может быть приведена к канони-
каноническому виду при помощи преобразования переменных с ортого-
ортогональной матрицей.
Доказательство. Пусть А—матрица квадратичной формы. Тогда,
согласно алгебраической формулирозке теоремы 11.3, существует
ортогональная матрица Р такая, что Р'АР = А есть диагональная
матрица. Сделав в квадратичной форме преобразование переменных
с матрицей Р, мы придем к квадратичной форме в новых пере-
переменных с матрицей Л, т. е. к квадратичной форме \у\-\-У^у\-\~ ¦¦¦
... -\-У-пу2п- Теорема доказана.
Отметим, что коэффициенты \, ..., \п, полученные при орто-
ортогональном преобразовании квадратичной формы к каноническому
виду, являются собственными значениями матрицы формы.
4. Закон инерции квадратичных форм. Ясно, что одна и та же
квадратичная форма может быть приведена к каноническому виду
бесконечным множеством способов. Например, можно сделать сначала
какое-либо неособенное преобразование переменных, а затем „спохва-
„спохватиться" и применить хотя бы способ, описанный в п. 1. При этом,
очевидно, что и сами коэффициенты av a2 а„ могут получаться
различными. Однако верна следующая важная
Теорема 12.5. Число положительных, отрицательных и нуле-
нулевых коэффициентов в каноническом представлении квадратичной
формы не зависит от способа приведения.
Доказательство. Пусть
два канонических представления данной квадратичной формы. В этой
записи мы предполагаем, что все сц >• 0 и р4 > 0. Нулевые коэффи-
коэффициенты мы опустили. Тем самым переменные yp+q+i уп и
zr+s+l, ¦ ¦ ¦, гп фактически не входят в преобразованные квадратич-
квадратичные формы. Интерпретируем квадратичную форму как функционал
от вектора X, координатами которого в некотором выбранном базисе
являются числа xY хп. Тогда переход от переменных хх, ..., хп
к переменным у^ уп, так же как и переход к переменным
zl гп, может интерпретироваться как преобразование коорди-
координат. Обозначим через Vt, .... У„ тот базис, в котором координатами
§ 12] КВАДРАТИЧНЫЕ ФОРМЫ 115
вектора X являются yi уп, и через Wlt . .., Wn тот базис,
в котором координатами являются гх гп. Нам надо доказать,
что/? = г, q — s. Допустим, что/? < г. Рассмотрим подпространство Q,
натянутое на векторы Vp+1, • • •, Vp+e, ..., Vn, и подпространство Р,
натянутое на векторы Wx, .... Wr. Сумма размерностей этих под-
подпространств равна п—р~\-г~>п.
По теореме о размерности суммы и пересечения мы заключаем,
что размерность Q П Р больше нуля, ибо размерность векторной
суммы Q и Р не может быть больше чем п. Следовательно, в Q f) P
существует хотя бы один вектор Х0^=0. Пусть у\, . . ., у°п и г° z°
его координаты соответственно в базисах Vj, . . ., Vn и W,, . . ., Wn.
Так как X0?Q, то у\= ••• — У0 = 0, так как Х0^Р, то
z°,, = ... =2°=0. Следовательно,
Из первого равенства заключаем, что F(X0)^. 0, из второго равен-
равенства следует, что F(Xo)>0, ибо хотя бы одна из координат
2° z°r отлична от нуля, так как иначе вектор Хо был бы нуле-
нулевым. Полученное противоречие показывает, что предположение, что
р < г, неверно. Совершенно так же предположение р > г приводит
нас к противоречию. Следовательно, р= г, и теорема в части, касаю-
касающейся числа положительных коэффициентов, доказана.
Для доказательства того, что q = s, достаточно рассмотреть
вместо формы F форму —F.
5. Одновременное преобразование двух квадратичных форм
к каноническому виду.
Теорема 12.6. Пусть F (xv . . ., х„) и Ф (хи . . ., х„) две квадра-
квадратичные формы, причем Ф (хх, ..., хп) положительно определена.
Тогда обе формы можно привести к каноническому виду одним
и тем же преобразованием переменных.
. Доказательство. Приведем каким-либо преобразованием форму
$(*! х„) к каноническому виду
То же преобразование сделаем в форме F (ху, ..., хп). • Полученную
форму обозначим через Ft (yt уп). Далее, в обоих квадратичных
формах положим yt = -—=¦, . . ., уп — —f=t ¦ Коэффициенты этого
У Ч "V ап
преобразования вещественны, ибо ах >> 0 ап > 0. После этого
преобразования получим, что
F(*l Хп) = F2 Bj Zn).
8*
116 ОСНОВНЫЕ СВЕДЕНИЯ ИЗ ЛИНЕЙНОЙ АЛГЕбРЫ [ГЛ. !
Теперь приведем форму F2(z1 гп) к каноническому виду ортого-
ортогональным преобразованием
После преобразования получим
При этом же преобразовании форма г\-\- ... + ^ преобразуется
в t\-\- ... +<и- Действительно, матрицей формы г\-\- ... -f- z'n
является единичная матрица, матрица преобразованной формы тоже
равна единичной, так как Р'ЕР = Е, в силу ортогональности мат-
матрицы Р.
Заметим, что числа Xt \п можно определить, не выполняя
указанных преобразований. Обозначим матрицу формы F (xv .. ., хп)
через А, матрицу формы Ф(хг, ..., хп) через В и диагональную
матрицу [Xj Хп] через Л.
Пусть С матрица линейного преобразования, осуществляющего
одновременное приведение обоих форм к каноническому виду указан-
указанным выше способом. Тогда С'АС = А, С'ВС = Е и, следовательно,
A — tE = C'AC — tC'BC = C'(A — tB)C. Отсюда (Л — tE\ =
= \С'\А — tB\ ¦ \С\ или 0-1 —0 ¦¦¦ (К — t)= \Cf- \A — tB\.
Таким образом, числа \ \п оказываются корнями многочлена
\А — tB\. Уравнение \А — tB\ называется обобщенным вековым урав-
уравнением.
Проведенное доказательство по существу равносильно следующему
рассуждению.
Пусть А матрица формы F(хх, ..., хп) и В матрица формы
O(Xj, ..., хп). Матрица В по условию положительно определена.
Пусть Q ортогональная матрица, преобразующая квадратичную форму
с матрицей B~4"AB"'k к каноническому виду. То^гда Q'B~'UAB~'UQ = A,
где Л диагональна. Обозначим B~'!"Q^=C. Тогда
С АС = Q'B-'''AB-4'Q = A
С'ВС = QrB~l/'BB-'''Q == Q'Q = Е.
Таким образом, преобразование переменных с матрицей С приводит
квадратичную форму F к каноническому виду с коэффициентами
Ха Х„, а квадратичную форму Ф к каноническому виду с коэф-
коэффициентами 1, . . ., 1.
6. Формы Эрмита. Алгебраическое выражение
L _
4- anlznz14- an2znz2 -f- . .. + annznzn
§ 13] ПОНЯТИЕ ПРЕДЕЛА В ЛИНЕЙНОЙ АЛГЕБРЕ 1O
где 2j, ..., гп комплексные переменные, а коэффициенты удовле-
удовлетворяют условию ау = а^, называется формой Эрмита. Матрица
коэффициентов формы Эрмита по самому определению является эрми-
эрмитовой матрицей. Все значения формы Эрмита вещественны, ибо
F (Zi гп) = 2 ayZiZj = 2 a^Zj = F (zt zn).
»'. i «'. i
Для формы Эрмита справедливы теоремы, аналогичные теоремам для
квадратичных форм. Именно,
Теорема 12.7. Любая форма Эрмита может быть приведена
неособенным преобразованием переменных к каноническому виду
^2,2!-4- а22222+ • ¦ ¦ .+ ?-nZnZn.
Форма Эрмита называется положительно-определенной, если все ее
значения положительны, кроме значения при
Zl — Z2 — • • • =z: Zn == 0-
Матрица коэффициентов положительно-определенной формы Эрмита
называется положительно-определенной эрмитовой матрицей.
Теорема 12.8. Для того чтобы форма Эрмита была положи-
положительно-определенной, необходимо и достаточно, чтобы все коэф-
коэффициенты в ее каноническом разложении были положительны.
Теорема 12.9. Форма Эрмита может быть приведена к кано-
каноническому виду при помощи унитарного преобразования пере--
менных.
При таком преобразовании коэффициенты в канонической форме
будут собственными значениями матрицы формы Эрмита.
Теорема 12.10. (Закон инерции). Число положительных,
отрицательных и нулевых коэффициентов в каноническом пред-
представлении формы Эрмита не зависит от способа ее приведения.
Теорема 12.11. Две формы Эрмата, из которых одна положи-
положительно-определенная, могут быть приведены к каноническому
виду одним и тем же преобразованием переменных.
Доказательства всех этих теорем почти дословно совпадают
с доказательствами аналогичных теорем для квадратичных форм.
§ 13. Понятие предела в линейной алгебре
Понятие предела для линейно-алгебраических объектов нам будет
нужно преимущественно для описания итерационных методов. Ввиду
того, что численные задачи формулируются в терминах матриц, мы
определим понятие предела для столбцов, которые мы будем отожде-
отождествлять с векторами арифметического пространства в их естественном
представлении, и для квадратных матриц. Во всем дальнейшем мы
будем употреблять термин вектор преимущественно в этом смысле.
118 ОСНОВНЫЕ СВЕДЕНИЯ ИЗ ЛИНЕЙНОЙ АЛГЕБРЫ [гЛ. I
1. Предел векторов и матриц. Пусть дана последовательность
векторов Хг1' Х^к\ ... с компонентами ху х„ ; . ..;
*№), .. ., xW; ... Если у каждой компоненты существует предел
Hm x(K> = xi, то вектор X с компонентами х^ хп называется
fr-> со
п р еде л о м последовательности А"'1, . .., А*( а сама последова-
последовательность называется сходящейся к вектору X. Это записывается
в виде Хт-+Х или lim Х(к) = Х.
Таким же образом, если имеется последовательность квадратных
матриц А^\ .... Аа\ ... с элементами а$ a\f то преде-
пределом последовательности А А ... называется матрица с элемен-
тами ву = lim а\/, если все эти пределы существуют.
В соответствии с этим определением предела, бесконечный ряд
векторов A"'1'-j-A""^-f- ... -\- A*ft'-j- ... называется сходящимся,
если существует Hm (А"A) -f- А"B) -f- .. . -f-A"'^), и этот предел назы-
вается суммой данного ряда. Очевидно, что для сходимости ряда
векторов необходимо и достаточно, чтобы сходились все ряды из
одноименных компонент; суммы этих рядов являются компонентами
суммы ряда векторов.
Аналогичным образом определяется понятие сходимости ряда
из матриц.
Понятие предела без труда распространяется на векторы и опера-
операторы в любом линейном пространстве посредством перехода к столб-
столбцам из координат (для векторов) и матриц (для операторов) по отно-
отношению к некоторому базису. Легко доказать, что выбор базиса не
влияет на факт сходимости и на результат предельного перехода.
В некоторых вопросах полезным оказывается понятие сходимости
последовательности векторов по направлению.
Последовательность векторов А^1' А" , ... называется схо-
сходящейся по направлению, если последовательность нормиро-
нормированных векторов j—-у- Х^ |—пХ]Х л • • • сходится в обычном
смысле. Ясно, что для сходимости по направлению достаточно, чтобы
последовательность ЬкХ^ ' сходилась в обычном смысле к ненулевому
вектору. Здесь Ьк какие-либо положительные числа. Действительно,
если ЬкХ(к)->Хф 0, то Ьк\ Х{к) \->-\Х\ и, следовательно, ¦
х(к) — 1 Ь Х(к) > 1 X
~ ьк\хЩк \*\ '
Легко видеть, что основные действия (сложение, вычитание, умноже-
умножение) над векторами и матрицами непрерывны. В частности, если
Aw ->¦ А, то AWX-+ АХ при любом векторе X. Обратно, если
§ 13]
ПОНЯТИЕ ПРЕДЕЛА" В ЛИНЕЙНОЙ АЛГЕБРЕ
119
Ak)X-> AX при любом векторе X, то Л(й) -*¦ А. Действительно, поло-
положив X = ei = @ 1, ..., 0)' при i = I, 2 п, получим, что
каждый столбец матрицы А сходится к соответствующему столбцу
матрицы А, и, следовательно, все элементы матрицы А^ сходятся
к соответствующим элементам матрицы А.
Далее, если последовательность квадратных матриц имеет преде-
пределом неособенную матрицу А, то при достаточно большом к для А '
существует обратная и lim
> ее
лСО
Действительно, если А р
цами А(к) матрицы В( J сходятся к матрице В, союзной с А, так как
А, то, очевидно, союзные с матри-
матриак
их элементами являются полиномы соответственно от элементов А
и элементов А.
По той же причине |Л(Л:)|-
с некоторого места, [ Л' '| Ф 0.
Наконец, (А^)'1-* А~\ ибо
1
0, и, следовательно, начиная
\А
Отметим еще следующую теорему.
Теорема 13.1. Если последовательность матрац А ' имеет
пределом неособенную матрицу А и векторы F^ сходятся к F,
то решения систем
имеют предел, являющийся решением системы AX—F.
m
A~'F.
Действительно,
Для матриц, элементы которых являются дифференцируемыми
функциями от некоторого параметра t, естественным образом опре-
определяется дифференцирование по этому параметру. Именно,
Если
то, очевидно,
an(t)... aln(t)
anl (t) . .. апп (t)
120 ОСНОВНЫЕ СВЕДЕНИЯ ИЗ ЛИНЕЙНОЙ АЛГЕБРЫ [ГЛ. I
Легко установить следующие правила дифференцирования
'ж
— (А А ^ — ^ л -4-A dA*-
2. Нормы векторов. В прикладных вопросах бывает важно
судить не только о самом факте сходимости последовательностей
или рядов, но и о быстроте этой сходимости. С этой целью очень
полезно введение так называемой нормы векторов и нормы матриц.
Норму можно вводить различными способами, и в различных случаях
та или другая норма оказывается более удобной.
Вообще, нормой вектора X называется сопоставляемое
этому вектору неотрицательное число \\X\\, удовлетворяющее сле-
следующим требованиям:
1) ||*||>0 приХ^О и ||0|| = 0;
2) ||сХ\\ — | с | ¦ ||*]| при любом числовом множителе с;
3) ||*+К||<||*||-|-||К|| („неравенство треугольника").
Из требований 2) и 3) легко выводится, что
Именно, 11*11 = 11*— K+1KII*— K|| + ||K||. и потому
||*-
Далее,
\\\ \\\\\\ \-\\X\\.
Следовательно
II*-П1> 111*11-1
Каждая норма определяет „единичную сферу" — множество век-
векторов, норма которых не превосходит 1. Единичная сфера есть
центрально симметричное выпуклое тело, т. е. такое множество,
которое вместе с каждым вектором X содержит вектор — * (цен-
(центральная симметрия) и вместе с любыми векторами Xt и Х2 содержит
вектор tXl-\-(l—0*2- 0-4l/-^l, опирающийся на отрезок, соеди-
соединяющий концы векторов *( и Х2 (выпуклость). Обратно, любое
центрально симметричное выпуклое тело V в вещественном про-
пространстве (в комплексном центральная симметрия должна быть заме-
заменена более сильным требованием — вместе с вектором X тело со-
содержит вектор аХ, |а|=1) порождает норму ||*||г, которая опре-
определяется как inf /, где t > 0, -r-^^V.
Проверка аксиом при таком общем определении нормы не пред-
представляет труда.
§ 13]
ПОНЯТИЕ ПРЕДЕЛА В ЛИНЕЙНОЙ АЛГЕБРЕ
121
В дальнейшем мы воспользуемся следующими тремя нормами
вектора
Х=(х1, х2, ..., хп)',
определенными как для вещественного, так и для комплексного
арифметического пространств.
1. Первая норма (кубическая).
Множество векторов вещественного пространства с нормой, не
превосходящей единицы, заполняет единичный куб
2. Вторая норма (октаэдрическая).
Множество вещественных векторов, для которых
полняет я-мерный аналог октаэдра.
3. Третья норма (сферическая).
за-
заЭта норма есть не что иное, как длина вектора. Совокупность
векторов, для которых lA^^l, заполняет шар единичного радиуса.
Для этих трех норм выполняются все требования 1—3.
Для кубической и октаэдрической это очевидно. Для сфериче-
сферической выполнение требований 1, 2 очевидно; требование 3 выпол-
выполняется на основании неравенства Коши — Буняковского. Действи-
Действительно,
Введенные выше нормы связаны следующими неравенствами:
~
(О
B)
C)
Неравенства A) и B) очевидны, так же как правое из нера-
неравенств C).
122 ОСНОВНЫЕ СВЕДЕНИЯ ИЗ ЛИНЕЙНОЙ АЛГЕБРЫ [ГЛ. I
Левое из неравенств C) легко выводится из неравенства Коши —
Буняковского. Именно,
откуда посредством извлечения квадратного корня и деления на уп
получаем левое неравенство C).
Легко установить, что необходимым и достаточным условием
сходимости последовательности векторов XW к вектору X является
||^Y(ft) — ХЦ-+0 для каждой из трех введенных норм.
Для первой нормы это очевидно. Для остальных норм это сле-
следует из неравенств A) и B).
При этом, если Х^-+X, то ЦЛ^Ц-И^Ц. Действительно,
ll*(fc)ll—11*11 \<\\х— *ш1Но.
3. Нормы матриц. Нормой квадратной матрицы Л на-
называется неотрицательное число ||-4||, удовлетворяющее условиям
1) |ИЦ>0, если ЛтЬОи ||0|| = 0;
2) \\сА\\=\с\
3)
4)
Так же как и для нормы векторов, условие \\А^—Л||—>0
является необходимым и достаточным условием того, что А^ —> А,
и так же как для нормы векторов, из А^ —у А следует, что
Часто употребляются следующие две нормы матриц
М (А) = п max I а„ I
To, что эти обе нормы удовлетворяют первым трем условиям, оче-
очевидно, так как они являются (М (А) с точностью до множителя п)
кубической и сферической нормами матрицы, рассматриваемой как
вектор и2-мерного арифметического пространства. Остается проверить
§ 13]
ПОНЯТИЕ ПРЕДЕЛА В ЛИНЕЙНОЙ АЛГЕБРЕ
выполнение 4-го условия. Пусть Л = (ау), В =
/ п \
= 2 o»Aj • Имеем
123
Тогда АВ—
п max
8 = 1
max
. Ж
Далее,
/V2 (AB) =
По неравенству Коши — Буняковского
2 aisbaj
< 2
откуда
2 |
i, j, s,t
Итак,
N (AB) < /V (Л) N (B).
Очевидно, что для любой матрицы А имеет место N(A)^M(A).
Норма матриц может быть введена бесконечным множеством
способов. Так как в большинстве задач, связанных с оценками,
в рассуждении одновременно участвуют как матрицы, так и векторы,
целесообразно вводить норму матриц так, чтобы она была разумным
образом связана с нормой векторов, введенной в данном рассужде-
рассуждении. Мы будем говорить, что норма матриц согласована сдан-
сданной нормой векторов, если для любой матрицы А и любого вектора X
выполняется неравенство
\\AX\\<||А|| • ЦАЦ.
Так, введенная выше норма М(А) согласована с кубической, окта-
эдрической и сферической нормами вектора, N (А) согласована со
сферической нормой вектора.
Действительно, пусть Х=(х1 хп)'. Тогда
max
i ¦
| ai}
<
124
Далее,
ОСНОВНЫЕ СВЕДЕНИЯ ИЗ ЛИНЕЙНОЙ АЛГЕБРЫ
[ГЛ. I
Итак, норма М(А) согласована с кубической и октаэдрической нор-
нормами вектора.
Наконец,
i j ' ' i j
= N2(A)\X\2 < M2(A)\ X\2.
Из этих неравенств следует, что обе нормы М(А) и N (А) согласо-
согласованы со сферической нормой вектора.
Укажем конструкцию, которая дает возможность построить наи-
наименьшую норму матрицы, согласованную с данной нормой векторов.
Именно, примем за норму матрицы А максимум норм векторов АХ
в предположении, что вектор X пробегает множество всех векторов,
норма которых равна единице:
№1 = 1
Вследствие непрерывности нормы, для каждой матрицы А этот
максимум достигается, т. е. найдется такой вектор Хо, что f|A||= 1
и \)АХ0\\ = \\А\\.
Докажем, что построенная таким образом норма удовлетворяет
всем поставленным требованиям 1) — 4) и условию согласованности.
Начнем с проверки первого требования. Пусть А ф 0.
Тогда найдется вектор X, ||Х||=1, такой, что АХф 0, а следова-
следовательно, и II/Ш ^0. Поэтому || Л ||= max ||AV|| > 0. Если же А — 0,
11*11 1
то
= max ||0^||=
В силу определения, ||еЛ|| =
и, следовательно, ||сЛ|| = | с\ • \\A\\.
у Ф 0
К удовлетворяет условию ||Х||=1.
1ИХ||<||К|| • ИИ-
р р Для матрицы А-\-В найдем такой
вектор Хо, что \\А-\-В\\ = \\(А + В)Х0\\ и ||Х0||= 1. Тогда \\А + В\\ =
= \)(А+В)Х0\\ = WAXo+BXoW < \)АХ0\\ Х
№l
Второе требование.
= max j|eAY||= \c | max ||AY|]
№l=i ll*|| = i
Далее проверим условие согласованности. Пусть Y
любой вектор; тогда X =-гу
Следовательно, ||ДУ|| =
Третье требование.
Х
§ 13]
ПОНЯТИЕ ПРЕДЕЛА В ЛИНЕЙНОЙ АЛГЕБРЕ
125
Наконец, четвертое требование. Для матрицы АВ найдем
такой вектор Хо, что ||*o!l=1 и || ЛВ*0|| = || АВ\\. Тогда
= \\АВХ0\\^\\А(ВХ0)\\^\\А\\ ¦ ||ВЛЫКИ|| • ||В|| • ||*0|
Мы проверили выполнение всех четырех требований и условия
согласованности. Построенную таким образом норму матриц мы будем
называть подчиненной данной норме векторов. Докажем, что
подчиненная норма не больше всякой нормы, согласованной с той же
нормой. Действительно, пусть L(A) норма согласования с некоторой
нормой вектора, ||Л||—норма, подчиненная той же норме вектора.
Тогда найдется вектор Хо с нормой, равной единице, такой, что
Но
\\AX0\\<L(A)\\X0\\ =
откуда следует, что
Очевидно, что для всякой нормы матриц, подчиненной какой-либо
норме векторов, ||?||=1. Отсюда следует, что норма М(А) и N (А)
не подчинены ни одной из норм векторов, ибо М{Е) — ./V2 (Е) = п.
Построим теперь нормы матриц, подчиненные всем введенным
выше нормам для векторов.
I. ИЛЦ^ max |^|.
Подчиненная этой норме векторов норма матриц есть
Действительно, пусть [|*||i=l. Тогда
= max
Следовательно,
^Г max
max ||AX\\^ max 2 \aiu\
l|Jt|| i s i
< max
aik \
n
Докажем теперь, что max || AV|| в действительности равен max 2 \aiic\-
№l=i ¦ i s=i
Для этого построим такой вектор *0, что ||*0||i=l и ||л*о|| =
п п
= max2laift|' Именно, пусть 2|а«| достигает наибольшего зна-
% к=1 Л=1
чения при l=j; тогда в качестве компонент хк°) вектора Хо возьмем
хр__ IaJk I
з ¦
если
о, и jcg») = l, если aJk=0. Очевидно, что
128
ОСНОВНЫЕ СВЕДЕНИЯ ИЗ ЛИНЕЙНОЙ АЛГЕБРЫ
п п
[ГЛ. I
||Л-011=1. Далее,
< 2 I агк К 2 I ajk\ ПРИ
= 2 I ai7c I- Следовательно,
max
?i n
= 2 1 «ys I = max 2 I «ft I-
Таким образом,
= max
ай!> что и требовалось доказать.
i
Очевидно, что норма \\A\\i может быть представлена в виде
П.
2
Подчиненная этой норме векторов норма матриц есть
Действительно
я
||ЛХ||=:2
, пусть |
я
И11п =
я
<2
<
= rr
1.
Я
At
iax 2л \ atk
к » = 1
Тогда
/ я
max >j I aift
я
2 I хи I =
1
Теперь возьмем вектор *0 следующим образом: пусть
я
2
«tft
я
2
достигает наибольшего значения для столбца с номером j. Положим
x(fc°)=:0 при k Ф j и л:(.0)—1. Очевидно, что вектор, построенный
таким образом, имеет норму, равную единице. Далее,
V
2<
к = 1
= —J aij I = max —J I ai.
ift
Таким образом,
max 11/1X11= max
я
V
что и требовалось доказать.
Очевидно, что норма ||Л||П может быть представлена в виде
ИII ц = max || Ае{ || „.
§ 13] ПОНЯТИЕ ПРЕДЕЛА В ЛИНЕЙНОЙ АЛГЕБРЕ 127
ш. |*р = 21**18 = (*.*)•
к = 1
Подчиненная этой норме векторов норма матриц есть
где /п есть наибольшее собственное число матрицы А*А. Действи-
Действительно,
|= max \AX\.
Но
= {Х, А"АХ).
Матрица А*А эрмитова. Пусть \г ее наибольшее собственное значе-
значение. Тогда при 1^1=1, max (A', A*AX) = \V Следовательно,
Иногда эту норму называют верхней гранью матрицы. Соответ-
Соответственно наименьшее собственное значение матрицы А*А называют
нижней гранью матрицы А. Очевидно, что нижняя грань
матрицы А есть число обратное к верхней грани обратной матрицы.
Сравнение различных норм матриц приводит к следующим нера-
неравенствам ')
1 A)
У п
< М {А) B)
< М (А) C)
i M (Л)< N (А) < Ж (Л) D)
< Л/ (Л) E)
F)
G)
(8)
(Ю)
Некоторые из этих неравенств имеются в работе Тюринга ¦[!].
128
ОСНОВНЫЕ СВЕДЕНИЯ ИЗ ЛИНЕЙНОЙ АЛГЕБРЫ
[ГЛ. I
Правые неравенства A), B), C), D), E) уже отмечались. Все
они точные, ибо они превращаются в равенство для матрицы А,
У КОТОРОЙ пц = 1 (/, j=\, . . ., tl).
Докажем левые половины неравенств A), B), C), D), E). Имеем
|| Л Id = max^] |ay |>max|ay| = —M(A)
\\A\\a = max У | ai} | > max | ai} \ — - M (A) ¦
\\A\\ = max | AX\ ^ max | Ae{
|X[=!
= max У\^+77Г+\^
max
i.j
atj | = - M (A)
Здесь Xl Xn собственные значения матрицы А*А. Наконец,
|* > max | atj | = 1 Ж (Л).
= i/У |
Эти неравенства также точные. Первые четыре из этих неравенств
обращаются в равенство для А = Е, последнее для
А =
0 ... О
о о ... о
о о ... о
Докажем теперь неравенство (8). Имеем
= max U*X|>max
\X\=1 i
max —
i У П
Далее,
|| А ||== max
1
откуда -т=-
max
"]/"«
A\\v
Заменой А на А* устанавливается неравенство (9). Из неравенств
(8) и (9) непосредственно вытекает неравенство A0).
Из (8) и (9) и правого неравенства E) следуют правые неравен-
неравенства F) и G).
§ 13]
ПОНЯТИЕ ПРЕДЕЛА В ЛИНЕЙНОЙ АЛГЕБРЕ
129
Докажем левое неравенство F). Имеем
= max || А*ег || u > max | A*et | >
г i.
У п
Замена А на Л* превращает неравенство F) в неравенство G).
Неравенства F) — A0) точные. Правое неравенство F), левое G),
правое (8), левое (9) и левое A0) достигается для
А =
1 1 ... Г
о о ... о
.0 0 ... 0.
левое F), правое G), левое (8), правое (9) и правое A0) для
0
О
О'
О
1 0 ... О
4. Сходимость геометрической прогрессии. Докажем теперь
несколько теорем, связанных с понятием предела.
Теорема 13.2. Для того чтобы Ат -> О, необходимо и доста-
достаточно, чтобы все собственные значения матрицы А были по
модулю меньше единицы.
Доказательство. Ясно, что при любой фиксированной неособен-
неособенной матрице С матрицы Ат и {С~1АС) =С~1АтС стремятся или
не стремятся к нулю одновременно. Поэтому достаточно доказать
справедливость теоремы для канонической матрицы Жордана. Далее,
для того чтобы последовательность квазидиагональных матриц одина-
одинакового строения стремилась к нулю, необходимо и достаточно, чтобы
сходилась к нулю последовательность отдельных ящиков. Тем самым
нам нужно установить условия сходимости к нулю лишь для
матриц Jm, где У канонический ящик Жордана. Пусть
J =
9 Зак. 974. Д К Фаддеев и В. Н. Фаддеева
130 ОСНОВНЫЕ СВЕДЕНИЯ ИЗ ЛИНЕЙНОЙ АЛГЕБРЫ
Легко видеть, что при tn^-k—1
[ГЛ. I
и г
m-i
{k-\)K {k-2)
,_ т(т—\) ... (m-j+1)
i\
где k порядок ящика, ( т ) = •
Для сходимости Jm к нулю необходимо, чтобы | X | < 1, ибо диа-
диагональными элементами Jm являются X™.
Но это условие и достаточно, ибо при этом условии
т (т -
_
¦ о
при т. -> со, для любого j = 1, ..., k — 2.
Данные в теореме 13.2 условия неудобны для проверки, ибо они
требуют знания собственных чисел матрицы А. Поэтому установим
некоторые более простые достаточные условия для того, чтобы
Теорема 13.3. Для того чтобы Лт-»0, достаточно, чтобы
хоть одна из норм А была меньше единицы.
Доказательство. В силу 4-го требования для нормы, имеем:
\\Ат\\<\\Ат-Ч ¦ IUIK ¦•• <IUIIra.
Поэтому, если 11л11<1, то ||Лт||->0, и, в силу сказанного выше,
Лт->0.
Сопоставляя теоремы 13.2 и 13.3, мы приходим к следующему
выводу.
Теорема 13.4. Модуль каждого собственного числа матрицы
не превосходит любой из ее норм.
Доказательство. Пусть II Л||= а. Рассмотрим матрицу В = —г— А,
где е любое положительное число. Тогда
Следовательно, Вш~>0 при т —> оо. В силу теоремы 13.2 ее соб-
собственные числа по модулю меньше единицы. Но очевидно, что соб-
собственные числа матрицы В равны —-г—\, где А, собственные числа
матрицы А. Таким образом, ¦ * < 1, т. е. [Хг|<а-|-е. Так как е
можно взять как угодно малым, |Х4|^а.
§ 13J ПОНЯТИЕ ПРЕДЕЛА В ЛИНЕЙНОЙ АЛГЕБРЕ 131
Теорема 13.5. Для того чтобы ряд
2+ ... +Лет+. ... A)
сходился, необходимо и достаточно, чтобы Ат —> 0 при т-±со.
В этом случае сумма ряда A) равна (Е — Ау1.
Доказательство. Необходимость этого условия очевидна. Пока-
Покажем, что оно и достаточно. Пусть Ат —> 0. В силу теоремы 13.2
все собственные числа матрицы А по модулю меньше единицы. Сле-
Следовательно, \Е—А\Ф0, и потому существует (?— А)~г.
Рассмотрим тождество
Умножив его справа на (? — А) \ получим
Р_1_Л—1_ _1_ лк — (р А\~1 Ak + 1IF А~\~х
Отсюда следует, что при fe -> оо
ибо Ль+1->0.
Следовательно,
?4-^4+ • • • +^™+ • • • =(? —Л),
что и требовалось доказать.
В силу теоремы 13.2 необходимым и достаточным условием
сходимости ряда A) является неравенство |Х4|<1 для всех соб-
собственных чисел матрицы А. Достаточным признаком сходимости в силу
теоремы 13.3 является неравенство ||Л||< 1 хотя бы для одной
из норм. При выполнении этого условия легко дать следующую
оценку быстроты сходимости ряда A).
Теорема 13.6. Если ||Л||<1, то
Доказательство. Имеем:
(?— А)'1 — (?+Л+ ...
Отсюда
Теорема доказана.
5. Некоторые оценки собственных значений. В предыдущем
пункте были получены некоторые "оценки собственных значений,
9*
132 ОСНОВНЫЕ СВЕДЕНИЯ ИЗ ЛИНЕЙНОЙ АЛГЕБРЫ [ГЛ. I
Именно, было установлено, что все собственные значения по модулю
меньше любой нормы матрицы. Особенно удобными являются оценки
при помощи 1-й и 2-й норм, так как они просто выражаются
через элементы матрицы.
Сейчас мы выведем оценки, дающие более точную информацию
о расположении собственных значений матрицы. Эти оценки носят
название оценок Гершгорина, так как они впервые появились в его
работе [1].
Теорема 13.7. Пусть А = (аф матрица с любыми комплекс-
комплексными элементами. Все собственные значения этой матрицы
находятся в области D, являющейся объединением кругов
\г — а„\^Я4 (/=1 п),
где
Доказательство. Пусть X любое собственное значение ма-
матрицы А и
соответствующий ему собственный вектор. Тогда
п
2 — hct (i = 1, . .., п)
2
или, что то же самое,
п
1
Пусть индекс i выбран так, что х^ есть наибольшая по модулю
компонента вектора X. Тогда
• ati =
откуда
п
Xi
]>>—««!<
I «у I = #*•
Итак, для каждого собственного значения \ найдется круг с цен-
центром пц и радиусом Rit содержащий это собственное значение.
Следовательно, все собственные значения находятся в объединении
всех таких кругов.
§ 13] ПОНЯТИЕ ПРЕДЕЛА В ЛИНЕЙНОЙ АЛГЕБРЕ 133
Замечание 1. Область D Гершгорина целиком лежит внутри
круга |2|^||Л||1 и касается его границы. Действительно, если
п
\г—au\<CRi, то |г|<|a«| + /?i = 2 \aij\ • причем существует
i=\
такое г, при котором неравенство превращается в равенство. Следова-
п
тельно, \z | -^ max 2j I ац I = II^lli> причем снова найдется число г.
осуществляющее равенство.
Таким образом, хотя область Гершгорина есть, вообще говоря,
часть круга | 2 |<; ЦЛЦ^ но оценка для наибольшего по модулю соб-
собственного значения получается такой же, как при помощи 1-й нормы.
Замечание 2. Взяв вместо матрицы А транспонированную,
получим другую область D'', которая будет содержаться внутри
круга |2|< 1И!|и-
Замечание 3. Область Гершгорина может распадаться на не-
несколько связных частей. При этом каждая связная часть содержит
внутри себя столько собственных значений, сколько кругов ее со-
составляют.
Для доказательства введем в рассмотрение матрицу
ап иахг ... иа1п
«22 • • • "«2»
_ ««»! ««П2
где и вещественный параметр. Ясно, что Ai = A.
Область Гершгорина для матрицы Аи есть, очевидно, объедине-
объединение кругов \г — aH\^.uRi, где Rt радиусы соответствующих кругов
для матрицы А. Таким образом, область Du Гершгорина для Аи
при 0 <; и <; 1 содержится в области Гершгорина D для матрицы А.
Поэтому при непрерывном изменении и от 0 до 1 собственные зна-
значения матриц Аи непрерывно изменяются, не выходя из области D.
Следовательно, внутри каждой связной компоненты области D нахо-
находится одинаковое число собственных значений для любой матрицы Аи,
Но собственными значениями матрицы Ао являются диагональные
элементы ац, являющиеся центрами кругов, образующих D. Следо-
Следовательно, число собственных значений матрицы Ао (а следовательно,
и матрицы А), лежащих внутри некоторой связной компоненты
области D точно равно числу кругов, объединением которых полу-
получается эта связная компонента.
За последние годы опубликовано много работ, посвященных
дальнейшему уточнению области, содержащей все собственные зна-
значения матрицы.
134 ОСНОВНЫЕ СВЕДЕНИЯ ИЗ ЛИНЕЙНОЙ АЛГЕБРЫ [ГЛ. I
§ 14. Градиент функционала
1. Определение. Пусть F(X) функционал, вообще говоря,
не линейный, определенный в вещественном эвклидовом простран-
пространстве R и принимающий вещественные значения. Пусть вектор X
задан координатами в некотором ортонормированном базисе. Тогда
функционал F(X) есть функция F(xv ..., хп) от переменных коор-
координат вектора X. Мы будем предполагать, что функционал F (X)
дифференцируем, для чего достаточно потребовать, чтобы функция
F (xv ..., хп) имела непрерывные частные производные по всем
аргументам.
Пусть Y произвольный вектор единичной длины с координатами
Л Уп-
Производной от функционала F в точке X по направлению Y
называется выражение
Производная —-^ характеризует скорость изменения функцио-
функционала F при изменении „аргумента" в направлении вектора Y.
Имеем далее
и потому
i=0
I Jl?_ у —_ c2 X)
где Z — вектор с координатами -g— -^—. Вектор Z назы-
называется градиентом функционала F(X). Из последнего равенства
вытекает, что
ибо | Y | = 1 • Отсюда следует, что
причем —Л = | Z1 , если направление Y совпадает с направлением
dF(X) , „ .,
градиента, и - v -¦ = — |Z , если направление Y противоположно
§ 14] ГРАДИЕНТ ФУНКЦИОНАЛА 135
направлению градиента. Поэтому направление градиента есть напра-
направление наибольшей скорости роста функционала F в данной точке,
а направление, противоположное градиенту, есть направление наи-
наибольшей скорости убывания.
2. Градиенты некоторых функционалов. Пусть А самосопря-
самосопряженный оператор. Определим градиент функционала
й(Х) = (АХ, X).
Имеем
h (X + *У) — h (X) ___ (А (X + М), X + tYy— (АХ, X) =
t ~~ t ~~
= 2 (АХ, Y) + /'(AY, Y),
откуда
dh(\)
д\
• = 2(АХ,
и, следовательно, градиент (АХ, X) равен 2АХ. В частности, гра-
градиент (X, X) равен 2Х.
Так как в дальнейшем нам важно лишь направление градиента,
мы отбрасываем положительный множитель 2 и будем подразумевать
под градиентом функционала (АХ, X) вектор АХ.
Совершенно аналогично находим, что градиент функционала
/(Х) = (АХ, X) — 2 (F, Х) + с равен (с точностью до множителя 2)
вектору АХ — F.
Вычислим, наконец, градиент функционала ;х(Х) = ,v V\ •
(Л, А)
Имеем
ф (X) _ (Х' Х> ^Г(АХ, Х)-(АХ,Х)-А.(Х,Х) _
dY (X, ХJ
(X, ХJ(АХ, У)-(АХ, Х)-2(Х, Y)
— ¦ Tij —
2
Следовательно, с точностью до положительного множителя -,v vT •
(.А, Л;
градиент функционала ц(Х) равен вектору | = АХ — [J-(X)X. Отме-
Отметим два свойства этого градиента:
1) (X, g) = 0;
2) (I §) = (?, АХ).
Действительно,
(X, |) = (Х, АХ— ;j.(X)X) = (X, AX) —[x(X)(X, Х) = 0
в силу определения ^-(Х).
136 ОСНОВНЫЕ СВЕДЕНИЯ ИЗ ЛИНЕЙНОЙ АЛГЕБРЫ [гл. 1
Далее,
(g. g) = (g. AX — |i(X)X) = (g. AX)-!x(X)(X, g) = (§, AX)
ибо (X, g) = 0.
Первое из этих свойств имеет простой геометрический смысл,
именно, градиент| есть проекция вектора 1] — АХ (градиента (АХ, X))
на подпространство, ортогональное к вектору X, ибо
причем (а(Х)Х пропорционально X и g ортогонально к X.
Это обстоятельство легко можно было бы обосновать посред-
посредством чисто геометрического рассмотрения, без использования про-
проведенных выше вычислений, но мы на этом не будем останавли-
останавливаться.
ГЛАВА II
ТОЧНЫЕ МЕТОДЫ РЕШЕНИЯ СИСТЕМ
ЛИНЕЙНЫХ УРАВНЕНИЙ
Настоящая глава посвящена трем задачам, тесно связанным друг
с другом: задаче решения линейной неоднородной алгебраической
системы уравнений, задаче обращения матрицы и так называемой
задаче исключения.
Все эти задачи теоретически решаются достаточно просто, Однако
при большом порядке матрицы, связанной с задачей, фактическое
решение этих задач требует большого числа вычислительных операций.
В настоящее время имеется большое количество методов числен-
численного решения систем линейных уравнений, и работа над их усовер-
усовершенствованием интенсивно ведется в наши дни.
Численные методы, решающие указанные задачи, делятся на две
группы: точные и итерационные методы. Под точными методами
мы подразумеваем методы, которые дают решение задачи при помощи
конечного числа элементарных арифметических операций. При этом,
если исходные данные, определяющие задачу, заданы точно (например,
если они целые или рациональные числа, представленные в виде
обыкновенных дробей) и вычисления выполняются точно (например,
по правилам действий над обыкновенными дробями), то решение
также получается точное. В точных методах число необходимых
для решения задачи вычислительных операций зависит только от вида
вычислительной схемы и от порядка матрицы, определяющей данную
задачу.
Исторически первым методом этой группы является метод, осно-
основанный на идее исключения неизвестных. В применении к решению
линейной неоднородной системы алгорифм этого метода, связанный
с именем Гаусса, состоит из цепочки последовательных исключений,
посредством которых данная система превращается в систему с тре-
треугольной матрицей, решение которой не составляет труда.
В настоящее время разработано много различных вычислительных
схем метода Гаусса в применении ко всем трем упомянутым задачам.
Среди этих схем следует отметить так называемые компактные
схемы, требующие минимальной записи или запоминания промежу-
промежуточных результатов. В компактных схемах используется операция
накопления, т. е. вычисления сумм вида 2аА- Применение этой
138 ТОЧНЫЕ МЕТОДЫ РЕШЕНИЯ СИСТЕМ ЛИНЕЙНЫХ УРАВНЕНИЙ [ГЛ. II
операции с двойной точностью, т. е. с сохранением всех значащих
цифр отдельных слагаемых с округлением лишь после окончания
суммирования, значительно снижает ошибки округления.
Близким к методу Гаусса является метод, основанный на идее
окаймления. В основе этого метода лежит представление данной
матрицы в виде последовательно вложенных друг в друга матриц,
начиная с матрицы первого порядка.
Различные модификации метода исключения, так же как и метод
окаймления, по существу связаны с разложением матрицы в произве-
произведение двух треугольных матриц, теоретически описанным в § 1, п. 12.
К точным методам обращения матриц относится и метод, основан-
основанный на идее постепенного изменения обращаемой матрицы с внесением
последовательно поправок к обратной (метод пополнения).
В последние годы получили большое распространение точные
методы, основанные на идее построения вспомогательной системы
векторов, ортогональных в той или иной метрике. Как будет показано
ниже, метод Гаусса может быть включен и в эту группу методов.
Итерационные методы доставляют средство для прибли-
приближенного решения системы линейных уравнений. Решение системы при
помощи итерационных методов получается как предел последовательных
приближений, вычисляемых некоторым единообразным процессом.
При применении итерационных методов существенным является
не только сходимость построенных последовательных приближений,
но и быстрота сходимости. В этом отношении каждый итерацион-
итерационный метод не является универсальным; давая быструю сходимость
для одних матриц, он может" сходиться медленно или даже совсем
не сходиться для других матриц. Поэтому при применении
итерационных методов важную роль играет предварительная подго-
подготовка системы, т. е. замена данной системы ей эквивалентной,
устроенной так, чтобы для нее выбранный процесс сходился по воз-
возможности быстро, а также различные приемы ускорения.
Настоящая глава книги посвящена изложению простейших методов,
входящих в группу точных методов. Другие методы (точные и
итерационные) будут излагаться далее на протяжении почти всей книги.
§ 15. Обусловленность матриц
При численном решении систем линейных уравнений даже точ-
точными методами возникает несколько источников неточности решения.
Одним из них является необходимость округления чисел в про-
процессе вычисления. При этом может случиться, что по ходу вычисле-
вычисления придется столкнуться с явлением исчезновения значащих цифр
в результате вычитания двух величин, близких друг другу. Исчезно-
Исчезновение значащих цифр может быть причиной настолько значительного
снижения точности результата, что из-за этого иногда бывает не-
необходимо изменить схему вычисления или переделать работу с боль-
большим числом значащих цифр в промежуточных выкладках.
§ 15]
ОБУСЛОВЛЕННОСТЬ МАТРИЦ
139
матрица, обратная к А. Как известно, А суще-
А I Ф 0. Однако,
Второй источник появляется в условиях, когда система линейных
уравнений возникает в процессе решения практической задачи,
так что элементы матрицы коэффициентов, так же как и свободные
члены, известны лишь приближенно, с некоторой степенью
точности. Неточность самих исходных данных порождает ошибки
в решении, так как изменение коэффициентов системы в пределах
заданной точности влечет за собой изменение решения. Займемся
более детально исследованием этой причины неточности в решении
системы.
Теоретическое решение системы AX—F дается формулой
X=A~1F, где А'1
ствует в том и только в том случае, если
если элементы матрицы А заданы приближенно, возможно, что даже
сам вопрос о том, имеет ли матрица А отличный от нуля опреде-
определитель или нет, лишен смысла. Именно, может случиться, что при
точном вычислении определителя, исходя из приближенных значений
элементов матрицы, принятых за точные, определитель оказывается
отличным от нуля, но изменение элементов в пределах точности
их задания может привести к матрице с нулевым определителем.
Ясно, что система с матрицей, обладающей указанным свойством,
не может быть решена со сколько-нибудь удовлетворительной
точностью. Система практически оказывается несовместной..
Мы будем называть обратную матрицу устойчивой, если
малым изменениям в элементах матрицы будут соответствовать малые
изменения в элементах обратной матрицы.
Очевидно, что для устойчивости обратной матрицы во всяком
случае необходимо, чтобы определитель матрицы был бы не слишком
мал. Степень малости определителя, препятствующую получению
устойчивой обратной матрицы, трудно определить раз навсегда, ибо
само понятие „не слишком мал" вряд ли может быть определено
точно. Прежде чем переходить к уточнению этого понятия, рас-
рассмотрим следующий пример. Пусть
Нетрудно вычислить, что |№| =
5
7
6
_5
\w\
68
—41
— 17
10
7
10
8
7
6
8
10
9
— 1. При
—41
25
10
—6
5~
7
9
ю_
этом
-17
10
5
—3
•
10
-6
—3
2
140 ТОЧНЫЕ МЕТОДЫ РЕШЕНИЯ СИСТЕМ ЛИНЕЙНЫХ УРАВНЕНИЙ [ГЛ. II
Если считать, что элементы матрицы W заданы абсолютно точно,
то все обстоит благополучно. Однако определитель матрицы W
является довольно малым. В самом деле, известная оценка Адамара
для значения определителя
дает
| W |< /2 534 437 350 яз 50 000,
что означает (в силу достижимости оценки Адамара), что при
таких же суммах квадратов модулей элементов строк модуль опре-
определителя может доходить до 50 000.
Это дает основание предположить, что матрица W~l будет мало-
малоустойчивой, что легко подтверждается следующим рассуждением.
Проследим, как изменяется определитель матрицы W при малых
изменениях ее первого элемента. Пусть
5+г
7
6
5
7
10
8
7
6
8
10
9
5
7
9
10
Тогда | W (е) | = 1 -f- 68е, откуда следует, что прие = — gg~ — 0.015
матрица W (е) будет особенной. Таким образом, если считать эле-
элементы матрицы W известными с точностью до 0.02, то практически
матрица W должна рассматриваться как особенная.
Покажем, как будут меняться все элементы обратной матрицы
при незначительном изменении первого элемента матрицы W. Пусть
Тогда
67
40
16
9
.088
.450
.772
.866
5.0002
7
6
5
|U
\\ =
—40
24
> 9
—5
7
10
8
7
6
8
10
9
= 1.0136,
.450
.664
.862
.916
— 16
9
4
2
5"
7
9
ю_
.772
.862
.943
.966
*
9
—5
—2
1
.866
.916
.966
.980
§
и,
15)
следовательно,
Vv — Vvi =
ОБУСЛОВЛЕННОСТЬ МАТРИЦ
~ 0.912
—0.550
—0.228
0.134
—0.550
0.335
0.138
—0.084
—0.228
0.138
0.057
—0.033
0.134
—0.084
—0.033
0.020
141
Еще большее расхождение мы получим, если рассмотрим матрицу
'4.99 7 6
7 10 8
6 8 10
5"
7
9
9 10
для которой Wz | = 0.320, и
204.82 —128.12
— 128.12 77.53
—53.12 31.78
31.25 —18.81
—53
31
14
—8
.12
.78
.03
.31
31
— 18
—8
5
.25
.81
.31
.12
Интересно отметить, что при этом само определение элементов
матриц №~\ Wi1 и W21 не встречает трудностей, связанных, напри-
например, с исчезновением значащих цифр.
Выясним теперь в общем виде, как могут изменяться элементы
обратной матрицы при изменениях элементов самой матрицы. Пусть
Из равенства
имеем
откуда
1-1
= 0,
Но
datJ
142 ТОЧНЫЕ МЕТОДЫ РЕШЕНИЯ СИСТЕМ ЛИНЕЙНЫХ УРАВНЕНИЙ [гЛ. И
где вц матрица, элемент /-Й строки и у-го столбца которой равен
единице, все остальные элементы равны нулю. Следовательно,
1?
dai}
¦=-^"V
Ч
О ... О"
2i 0 ... О
' ; 0 ... О
о о
о о
a"Ziajn
и потому
откуда
дя
м
da
ч
Таким образом, изменение каждого элемента обратной матрицы,
вызванное изменением элемента ay, равно этому изменению, ум-
ноженнсму на произведение некоторых двух элементов обратной
матрицы. Если элементы обратной матрицы достаточно велики (что
при малом определителе бывает всякий раз), то незначительная
ошибка в элементах исходной матрицы влечет за собой значительные
изменения в элементах обратной. Конечно, в некоторых случаях
ошибки от изменения различных элементов матрицы могут компен-
компенсировать друг друга.
Будем называть матрицу плохо обусловленной, если со-
соответствующая ей обратная матрица будет неустойчивой.
Плохо обусловленная матрица может оказаться практически
особенной, если ее элементы заданы приближенно.
Естественно, что система линейных уравнений с плохо обуслов-
обусловленной матрицей мало устойчива, т. е. ее решение сильно изменяется
при малых изменениях как коэффициентов, так и свободных членов.
Проследим, как значительна эта неустойчивость. Пусть
O.HXj
данная система. Тогда Х=А ]F и, следовательно,
дХ дА i
§ 15]
откуда
ОБУСЛОВЛЕННОСТЬ МАТРИЦ,
143
: — akixj-
Аналогично из формулы
дХ 1 dF
Л
дХ _ 1 dF _ ,
df " Л д/ ~"
следует, что -^ = аы.
Таким образом, если элементы обратной матрицы велики, то
малое изменение как коэффициентов системы, так и свободных
членов влечет за собой значительное изменение решения. Так, на-
например, для рассмотренной выше матрицы W „близкие" свободные
члены
Fl = Bld ,32 ,33 ,31 )'
Fz = B3.001, 31.999, 32.999, 31.001)'
F3 = B3.01 , 31.99 , 32.99 , 31.01 )'
Fi = B2,.l , 31.9 , 32.9 , 31.1 )'
будут приводить к далеко не „близким" решениям
*х = A ,1 ,1 ,1 У
A = A.136, 0.918, 0.965, 1.021)'
^ = B.36 , 0.18 , 0.65 , 1.21 )'
^ = A4.6 , —7.2, —2.5, 3.1 )'.
Явление плохой обусловленности матрицы было известно давно,
по-видимому, еще Гауссу. Однако изучение и количественные характе-
характеристики этого явления появились недавно.
Мы видели, что „малость" определителя является причиной плохой
обусловленности матрицы. Однако легко видеть, что одна величина
определителя не может вполне характеризовать обусловленность
матрицы. Так, например, очевидно, что матрицы, отличающиеся
лишь постоянным множителем, надлежит считать одинаково обуслов-
обусловленными. Соответствующие же им определители будут отличаться
на п-ю степень множителя. Отсюда следует, что величину определи-
определителя нужно сравнивать хотя бы с /1-й степенью наибольшего
144
ТОЧНЫЕ МЕТОДЫ РЕШЕНИЯ СИСТЕМ ЛИНЕЙНЫХ УРАВНЕНИЙ [ГЛ. II
элемента матрицы или я-й степенью какой-либо нормы матрицы.
Однако и этого недостаточно. Так, из матриц
20
0
0
0
1
0
0
0
0.
05
и
20
0
0
0
0.
0
2
0
0
0.
25
первая обусловлена хуже, чем вторая, хотя у них одинаковы как
определители, так и наибольшие элементы.
Действительно, соответствующие обратные матрицы будут
0.05 0 0 "
0 1 0
0 0 20
0.05 0 0"
0 5 0
0 0 4
и потому одинаковые изменения в элементах данных матриц приведут
к разным изменениям в элементах обратных матриц, которые в пер-
первой матрице будут более значительными.
Для характеристики матрицы с точки зрения ее обусловленности
несколькими авторами предложены различные количественные харак-
характеристики, называемые числами обусловленности. Это два
числа Тюринга 1)
Л/-число = ^N(A)N (Л) = v (А)
М-число = -i- М (А) М (А'1) = [х (А),
где Л? (Л) = У SpЛ'Л и М (Л) = п • max | а^ | — рассмотренные выше
нормы матриц, число Тодда2)
Р-число ~
где \t—собственные значения матрицы А, и
где ||Л ||—третья норма матрицы. Легко видеть, что
Я-число = 1/ -^- = -л (Л),
где [ij и [1„ наибольшее и наименьшее собственные значения
матрицы А'А, А' — транспонированная с А матрица. Я~но, что
!) Тюринг [11.
2) Тодд [Ц.
§ 15] ОБУСЛОВЛЕННОСТЬ МАТРИЦ 145
Для симметричных матриц Р-число обусловленности совпадает
с Я-числом!
Числа обусловленности не дают, конечно, исчерпывающей характе-
характеристики обусловленности матрицы.
Отметим неравенства, связывающие эти числа:
v (Л) О(А) <пЬ(А)
Легко подсчитать, что для ортогональных матриц v(^) = 7j(<4) =
= р(Л)=1. Покажем, что все числа обусловленности не меньше
единицы. Для р(Л) и ~ц(А) это очевидно. Для v(A) это следует
из тождества
=4/04+ •••
где [ij, ..., [л„— собственные значения матрицы А'А.
Числа обусловленности v(A) и i\{A) имеют следующий вероят-
вероятностный смысл. Рассмотрим систему линейных уравнений AX=F,
где вектор F задан точно, а элементы матрицы А являются незави-
независимыми случайными величинами со средними значениями пц и одинако-
одинаковой дисперсией а2, которая предполагается очень малой по сравнению
с величинами коэффициентов. Тогда N-число обусловленности
показывает во сколько раз отношение среднего квадра-
квадратичного ошибок неизвестных к среднему квадратич-
квадратичному самих неизвестных превосходит отношение
среднего квадратичного ошибок коэффициентов
системы к среднему квадратичному самих коэффи-
коэффициентов. Я-число дает отношение наибольшей полу-
полуоси к наименьшей полуоси для эллипсоида рассеяния
вектора, компонентами которого являются ошибки
неизвестных1).
Легко подсчитать, что для матрицы W, рассмотренной выше,
„ „ 30.28868 о.о.
Р-число = Я-число^ 0Ш015005 ~2984
ЛГ-число = i- /"933 /9708 « 752
Ж-число = -^ 40 X 272 = 2720.
1) Тюринг [1], Д. К. Фаддеев [4].
J0 Зак, 974. Д. К- Фаддеев и В, Н, фаддеевч
146 ТОЧНЫЕ МЕТОДЫ РЕШЕНИЯ СИСТЕМ ЛИНЕЙНЫХ УРАВНЕНИЙ [ГЛ. II
Числа обусловленности матрицы W еще не очень велики. В практи-
практических расчетах иногда приходится встречаться с системами, матрицы
которых имеют числа обусловленности свыше 20 000.
На вопрос о том, какой характер неопределенности влечет за
собой плохая обусловленность системы, в известной степени отвечают
следующие рассуждения.
Пусть А невырожденная матрица, которую для простоты мы
будем считать вещественной, пусть Uv U2, . .., Un ортонормальная
система собственных векторов для матрицы А'А и пусть jj.t, ,u2, ..., \>п
соответствующие им собственные значения. Тогда векторы V{ —
= - Alli образуют ортонормальную систему собственных векторов
У н
для матрицы АА'. Действительно,
далее
(I/,. Uj) =
Пусть теперь дана система
AX=F
с матрицей А.
Разложим вектор F по векторам Vv V2 Vn
Ясно, что ct = (F, Vt).
Далее ищем решение в виде
Подстановка в систему дает
п
г = 1
откуда следует, что
Можно убедиться в том, что при малых изменениях матрицы А
как собственные значения [1г матрицы А'А, так и системы векторов
{(/{} и {1/j} изменяются мало, независимо от обусловленности мат-
матрицы А. Однако при плохой обусловленности матрицы А среди [а$
§ 16] МЕТОД ГАУССА 147
имеются очень малые числа, и даже малые их изменения могут ока-
оказаться относительно большими. Коэффициенты й^ формулы A), отве-
отвечающие малым |лг, окажутся плохо определенными, так что решение
„разбалтывается" в направлениях векторов Uit соответствующих ма-
малым [х^, что мы уже видели раньше на основе вероятностных рас-
рассуждений.
Если коэффициенты системы известны точно (что бывает, напри-
например, при решении методом сеток краевых задач для уравнений эл-
эллиптического типа с постоянными коэффициентами), то источником не-
неопределенности может служить только неточность в коэффициентах Cj,
соответствующих малым |J4, которая, согласно формуле A), увеличи-
увеличивается во много раз при переходе к коэффициентам й{. Однако и
это явление может не иметь места, если по условию задачи вектор
свободных членов ортогонален или почти ортогонален к векторам Vit
соответствующим малым и.,-, и потому решение остается устойчивым
при небольших допустимых (без нарушения упомянутой почти-орто-
гональности) изменениях свободных членов.
§ 16. Метод Гаусса
В этом параграфе мы изложим наиболее простой и естественный
метод для решения системы уравнений, основанный на последователь-
последовательном исключении неизвестных. Как уже говорилось выше, он связан
с именем Гаусса. Метод имеет много различных вычислительных
схем. Мы начнем изложение с рассмотрения так называемой схемы
единственного деления.
Итак, пусть дана система уравнений
а21Х1~Г a22X2i ¦¦• ~~\~a2nXn = f2 П\
an\x\ I an2x2 I • • ¦ I annxn== /«•
Допустим, что коэффициент ап Ф 0. Разделим коэффициенты
первого из уравнений A) (включая и свободный член) на коэффи-
коэффициент ап, который мы будем называть ведущим элементом A-го шага),
и обозначим
? B)
Мы получим новое уравнение
п = gv C)
Исключим теперь неизвестное хх из всех уравнений A), начиная со
второго, посредством вычитания из этих уравнений уравнения C),
10*
148 ТОЧНЫЕ МЕТОДЫ РЕШЕНИЯ СИСТЕМ ЛИНЕЙНЫХ УРАВНЕНИЙ [ГЛ. II
умноженного соответственно на числа аги а31, ..., ani. Преобразо-
Преобразованные уравнения будут
а22- 1Х2 I " • ' I а2п. \Хп == /г- 1
D)
ап2- 1^2 Н~ • • " ~Т~ апп. \хп r==z In- 1>
где
ац., = ai} — aixbxj (i, j > 2)
E)
Разделим далее коэффициенты первого из преобразованных урав-
уравнений на ведущий элемент 2-го шага аг2, lt который будем считать
отличным от нуля. Мы получим уравнение
Х2 ~Т~ *23-*-3 Г" • • • I "гпХП == &2<
где
} а22. 1 а22- 1
Исключая неизвестное хг из уравнений D), начиная со второго, мы
придем к уравнениям
йзз. гхг ~~т~ • ¦ • "т~ азп- 2 хп == /з. 2
an3-2xS~\~ ¦¦¦ Л~ апп- 2хп — /п- 2-
где
aij.2 — aij.l—ai2.Aj ('• }>ЪУ
fi-2—fi.t ai2- lg2-
Продолжаем процесс по той же схеме. На от-м шагу мы получим
уравнения
xm~T~ "mm+lxm+l ~~т~ •••
& т+Ъ тхт+\ ~Т~ ¦ • • г" ^п
1. тхт+1 ~Т~ • • • ~Т~ @пп. тхп :== /п. т>
где
, amj- т-\ . .. . п
%тчп-1
/т. го-1 _
атт- т-\
aij. m == aij- m-i aim ¦ m-l^mj'
Ii. m == fi. m-i aim m~\gm-
Объединив все первые уравнения каждого шага, мы получим си-
систему ¦
§ 16]
МЕТОД ГАУССА
= g2
143
(8)
с треугольной матрицей, эквивалентную исходной системе. Отметим,
что описанный процесс возможен только при условии неравенства
нулю всех ведущих элементов атт.т_х, так как по ходу процесса
на них приходится производить деление.
Из системы (8) значения для неизвестных находим последовательно
от хп к хх по очевидным формулам
Итак, для решения данной системы по схеме единственного де-
деления мы сначала строим вспомогательную треугольную систему,
а затем решаем ее. Процесс нахождения коэффициентов треугольной
системы мы будем называть прямым ходом, а процесс получе-
получения ее решения обратным.
В табл. II. 1 приведена схема единственного деления для системы
четырех уравнений и численный пример.
Таблица П. I
Схема единственного деления
«11
«21
«31
«41
1
1
«12
«22
«за
«43
*12
«22-1
«32-1
«42-1
1
1
«13
«23
«33
«43
613
«23-1
«33-1
«43-1
Ь23
«33-2
«43-2
1
1
«14
«21
«34
«44
614
«21-1
«34-1
«41-1
624
«3i-2
«44-2
*34
«44-3
I
«15
«25
«35
«45
»15
«25-1
«35.1
«45-1
Ь25
«35-2
«15-2
*35
«45.3
*4
Х3
х2
хх
«16
«26
«36
«46
616
«26-1
«ЗС1
«46-1
*26
«36-2
«46-2
*36
«46-3
1
0.47
-0.11
0.55
1
5 |
Xi
1
0.17
1
0.35
0.43
0.17
0.9201
0.3687
0.3365
1
1
— 0.25
0.67
1
о.за
— 0.25
0.7875
0.9725
0.4975
0.85589
0.65693
0.20949
1
1
0.54
— 0.32
— 0.74
1
0.54
- 0.5738
- 0.6806
0.7030
— 0.62363
— 0.45067
0.91285
-0.68602
1.05656
1
0.3
0.5
0.7
0.9
0.3
0.3590
0.7330
0.7350
0.39017
0.58914
0.60371
0.89681
0.41584
0.39358
1.16681
- 0.36304
0.44089
1.76
2.32
1.20
3.24
1.76
1.4928
1.3936
2.2720
1.62243
0.79540
1.72605
1.21079
1.47240
1.39358
2.16682
0.63695
1.44089
150
ТОЧНЫЕ МЕТОДЫ РЕШЕНИЯ СИСТЕМ ЛИНЕЙНЫХ УРАВНЕНИЙ [ГЛ. II
Поясним табл. II. 1. В схеме мы обозначили свободные члены
исходных и преобразованных уравнений теми же буквами, что и
коэффициенты уравнений, но со вторым индексом 5. Это позволяет
объединить формулы, по которым преобразуются коэффициенты и сво-
свободные члены данной системы. Шестой столбец служит для контроля.
Этот контроль основан на следующем обстоятельстве. Если в дан-
данной системе сделать замену Xj = x{-f-1, то для определения х^ мы
получим систему с прежними коэффициентами и свободными членами,
равными суммам элементов строк матрицы коэффициентов (включая
свободные члены). Поэтому, если составить сумму элементов каж-
каждой строки исходной матрицы (включая свободные члены) и провести
над ними все те операции, что и над остальными элементами, то, при
отсутствии вычислительных ошибок, должны получаться числа, рав-
равные суммам элементов вновь построенных строк. В конце процесса,
после окончания обратного хода, должны получиться числа х-ь, рав-
равные Xj-j-1. Иногда более целесообразным является использование
этой идеи для контроля каждой построенной строки. С этой целью
Таблица П. la
Схема единственного деления в симметричном случае
«11
1
1
«12
«22
^12
«22-1
1
1
«13
«23
«33
*13
«23-1
«33-1
6 23
«33-2
1
1
«14
«24
«34
«44
»14
«24-1
«34-1
«44-1
Ь24
«34-2
044-2
ьи
«41-3
1
«15
«25
5
«45
»1Б
«25-1
«35-3
«45-1
*25
«35-2
5-2
*35
«45-3
*4
Х3
Х2
Х1
«16
«26
«36
«46
Ь16
6.1
«36-3
«46.1
»26
«36-2
«46-2
hs
«46-3
ч
х3
*Ъ
Ч
1.00
1
1
0.42
1.00
0.42
0.82360
1
1
0.54
0.32
1.00
0.54
0.09320
0.70840
0.11316
0.69785
1
1
0.66
0.44
0.22
1.00
0.66
0.16280
— 0.13640
0.56440
0.19767
- 0.15482
0.53222
- 0.22185
0.49787
1
0.3
0.5
0.7
0.9
0.3
0.37400
0.53800
0.70200
0.45410
0.49568
0.62807
0.71030
0.73804
1.48240
1.03917
0.04348
-1.25780
2.92
2.68
2.78
3.22
2.92
1.45360
1.20320
1.29280
1.76493
1.03871
1.00547
1.48844
1.23591
2.48240
2.03916
1.04348
— 0.25779
§ 16] МЕТОД ГАУССА 151
в контрольный столбец записываются суммы элементов строящихся
строк и полученные числа лишь сравниваются с результатами контроль-
контрольных действий.
Число умножений и делений, нужных для нахождения решения
системы п уравнений по схеме единственного деления, равно
|(Л2+ЗЯ— 1).
В случае, если матрица коэффициентов системы симметрична,
т. е. aij^=uji, мы имеем, очевидно, aij.k — aji.k- Поэтому можно
опустить запись элементов, расположенных ниже диагонали. Схема
единственного деления, приспособленная для симметричного случая,
показана в табл. 11.1а.
Первый элемент строки, опущенный при записи коэффициентов
(и нужный нам для вычислений элементов вспомогательных матриц),
мы легко находим как верхний элемент столбца, включающего диаго-
диагональный элемент данной строки. Контрольный столбец по-прежнему
содержит суммы всех элементов каждой строки, включая и опущен-
опущенные при записи.
Число вычислительных операций в схеме единственного деления
значительно сокращается, если матрица коэффициентов системы почти
треугольна, в частности, если она трехдиагональна.
В случае, если нужно решить несколько систем с данной мат-
матрицей, естественно искать решения одновременно, выписывая сво-
свободные члены в соседних столбцах. Контрольная сумма образуется
как сумма элементов строк расширенной матрицы. Схема решения
нескольких уравнений дана в табл. II.2.
Схема единственного деления очень проста и удобна. Однако
она не является универсальной, в том смысле, что для ее примени-
применимости нужно, чтобы все ведущие элементы были отличны от нуля.
Это обстоятельство, однако, не может быть предсказано без вычисле-
вычислений, которые в той или иной форме эквивалентны самому примене-
применению схемы. Близость ведущих элементов к нулю может быть причи-
причиной значительной потери точности.
Поэтому схему единственного деления целесообразно несколько
видоизменить, не предписывая a priori порядка исключаемых неиз-
неизвестных.
Наилучшим вариантом является схема единственного деления
по главным элементам. В этой схеме в качестве исключаемой
на m-м шагу неизвестной выбирается та, коэффициент при которой
на предыдущем шагу был наибольшим по модулю. При вычи-
вычислении по схеме главных элементов исчезновение значащих цифр
может происходить, только если система плохо обусловлена, так что
происходящая при этом потеря точности неизбежна по существу
дела.
Отметим, что в разобранном примере главные элементы совпадают
с коэффициентами атт, т_х, так что обе схемы совпадают,
152 ТОЧНЫЕ МЕТОДЫ РЕШЕНИЯ СИСТЕМ ЛИНЕЙНЫХ УРАВНЕНИЙ [ГЛ. II
Таблица II. 2
Схема единственного деления. Несколько систем уравнений
1.00
0.42
0.54
0.66
1
1
0.42
1.00
0.32
0.44
0.42
0.82360
0.09320
0.16280
1
1
0.54
0.32
1.00
0.22
0.54
0.09320
0.70840
-0.13640
0.11316
0.69785
-0.15482
1
1
0.66
0.44
0.22
1.00
0.66
0.16280
-0.13640
0.56440
0.19767
- 0.15482
0.53222
- 0.22185
0.49787
1
0.25
0.45
0.65
0.85
0.25
0.34500
0.51500
0.68500
0.41889
0.47596
0.61680
0.68204
0.72239
1.45096
1.00394
0.01847
-1.25752
0.3
0.5
0.7
0.9
0.3
0.37400
0.53800
0.7020Э
0.45410
0.49568
0.62807
0.71030
0.73804
1.48240
1.03917
0.04348
-1.21780
0.15
0.30
0.45
0.60
0.15
0.23700
0.36900
0.50100
0.28776
0.34218
0.45415
0.49033
0.5J006
1.06466
0.72652
- 0.00490
- 0.942Я4
3.32
3.43
3.88
4.67
3.32
2.03560
2.08720
2.47880
2.47159
1.85685
2.07643
2.С6082
2.48838
4.99805
3.76964
1.05705
— 2.45828
Последовательные исключения неизвестных, преобразующие дан-
данную систему в систему с треугольной матрицей, можно проводить и
по другим вычислительным схемам.
В схеме деления и вычитания на каждом шагу делятся
все уравнения на коэффициент при исключаемой неизвестной и затем
само исключение производится вычитанием одного уравнения из всех
остальных.
В схеме умножения и вычитания на первом шагу не-
неизвестное х1 исключается из /-го уравнения посредством умножения
этого уравнения на ап и вычитанием 1-го уравнения, умноженного
на atl. На последующих шагах применяется тот же прием, так что
коэффициенты вспомогательных уравнений йц.т на от-м шагу вы-
вычисляются по формулам
Jim—@тт ¦ m—lfi ¦ т—1 @гт ¦ т—\Jm • т—1-
Существуют и другие вычислительные схемы. В частности, каж-
каждую из описанных схем можно применять как с заранее предписан-
предписанным порядком исключения неизвестных, так и выбирая порядок
исключения по ходу процесса, например, по главным элементам.
§ 16] МЕТОД ГАУССА 153
Вычислительные схемы метода Гаусса основаны на приведении
системы к системе с правой треугольной матрицей посредством ли-
линейного комбинирования уравнений, что равносильно умножению
Слева матрицы системы (и одновременно столбца свободных членов)
на некоторые, вспомогательные матрицы. Заслуживает внимания моди-
модификация метода исключения, при котором в качестве вспомогательных
матриц, управляющих линейным комбинированием уравнений, берутся
элементарные матрицы вращений. При этом вычисления располагаются
следующим образом. Берем
r _ «U „ _ «31
2
1
(если ап — а21 = 0, берем с21 = 1, sn = 0) и первые два уравнения
системы заменяем уравнениями
C21-^l 52)У2 := C2l/l S2U2
Здесь через yt и у2 обозначены левые части первых двух уравнений
исходной системы. После преобразования во втором уравнении
коэффициент при неизвестном хг будет равен нулю.
Далее аналогичным образом обрабатывается преобразованное пер-
первое уравнение с третьим исходным уравнением, полученное новое
первое с исходным четвертым и т. д. После п—1-го шага процесса
мы придем к системе вида
Теперь тот же процесс применим к системе с отброшенным пер-
первым уравнением. После ~—' шагов мы придем к системе с тре-
треугольной матрицей, которая решается обычным обратным ходом.
Эта схема исключения требует приблизительно в 4 раза больше
вычислительных операций, чем схема единственного деления, но отли-
отличается большой стабильностью и мало чувствительна к „провалам"
промежуточных определителей системы.
В табл. П. 3 дается решение системы, ранее решенной в табл. II. 1
методом единственного деления. В последнем столбце таблицы по-
помещены числа Сц и s^, в ненумерованных строках;—вспомогательные
величины, нужные для их вычисления.
154
ТОЧНЫЕ МЕТОДЫ РЕШЕНИЯ СИСТЕМ ЛИНЕЙНЫХ УРАВНЕНИЙ [ГЛ. II
Результативная система с треугольной матрицей располагается
в строках Г", 2'", 3'", 4'", исходная — в строках 1, 2, 3, 4. Строки
Г, 2', 3', 4' и 1", 2", 3", 4" заняты промежуточными линейными
комбинациями исходных уравнений. Их удобно получать в порядке,
совпадающем с порядком следования строк в таблице. В последней
строке таблицы расположено решение системы. Шестой столбец во
всех нумерованных строках контрольный.
Таблица II. 3
Решение линейной системы методом вращений
1
2
1'
3
1"
4
у и
2'
3'
2"
4'
2/7/
3"
4"
3'"
4"'
1.00
0.47
1.2209
1.10495
— 0.11
1.23301
1.11041
0.55
1.53551
1.23916
0.44089
0.17
1.00
1.10494
0.57922
0.35
1.11041
0.54170
0.43
1.23916
0.67627
0.83272
0.40566
0.85798
0.92627
0.14489
0.87897
0.93754
—0.36302
—0.25
0.67
0.05873
1.00
—0.04062
0.36
0.12339
0.71271
1.00090
0.92627
1.07907
0.34063
0.93753
1.11875
0.58768
0.16978
0.37419
0.61172
1.16679
0.54
—0.32
0.35260
— 0.74
0.42417
1.00
0.82395
—0.51930
—0.70143
— 0.77404
0.70783
—0.65536
—0.40316
0.81895
0.61171
—0.16002
0.89868
0.39356
0.3
0.5
0.48419
0.7
1.76
2.32
2.57969
1.20
1
0.41247
0.9
0.76908
0.32491
0.74452
0.61816
0.62342
0.70708
0.52703
0.52040
0.65077
0.35368
2.44813
3.24
3.63184
1.35104
1.44964
1.84945
1.81676
2.10800
0.71154
1.50913
1.10245
1.25236
0.90503
—0.42536
0.99508
0.09906
0.89610
—0.44385
0.89900
—0.43795
0.98799
-0.15455
0.96072
—0.27755
§ 16] МЕТОД ГАУССА 155
Вместо элементарных матриц вращения для приведения системы
к равносильной системе с треугольной матрицей можно использовать
и другие ортогональные матрицы. Удобными оказываются матрицы
отражений от п—1-мерной плоскости1). Пусть W вектор единичной
длины, ортогональный к заданной п—1-мерной плоскости Q. Тогда
матрица отражения относительно Q есть U = Е — 2WW (здесь
WW' есть произведение столбца на строку, т. е. матрица ранга 1).
Действительно, если вектор Z ортогонален к W, то
UZ = Z — 2WWZ = Z,
ибо W'Z = (W, Z) = 0, a UW = W — 2W-WW = — W, ибо WW =
— (W, W)=\. Матрица U, очевидно, ортогональная и \U\= — 1.
Вектор W можно всегда подобрать так, чтобы матрица U пере-
переводила любой заданный вектор S в вектор заданного направления,
например в вектор, направленный по одному из координатных век-
векторов е. Для этого достаточно взять
W = — (S — ае),
где а= ±-|5|, р = | S — ае\ = /2а2— 2аE. е).
Действительно, при таком выборе W имеем
US = S — 2(W, S)W=S — pW=S — S-j-ae = ae,
так как 2(W, S) = —Ba2 — 2a(S, e)) = p.
Выбор знака для а, вообще говоря, безразличен. Им можно
распорядиться так, чтобы число р было большим из двух возмож-
возможных, для чего следует взять sign а = — sign(S, e).
Для любого вектора Y имеем
UY=Y — 2(W, Y)W. (9)
Для преобразования системы AX=F к треугольной системе
поступаем так. На первом шагу вектор W строится по первому
столбцу 5 = Л! матрицы Л и по вектору е — е:. После умножения
обеих частей системы на матрицу U (что равносильно применению
формулы (9) к столбцам матрицы Лик вектору F) приходим к си-
[а v~\
, где В квадратная матрица п— 1-го
порядка. Далее процесс повторяется для системы с матрицей В
и т. д.
После п—1-го шага мы придем к треугольной системе. Легко
видеть, что матрица этой системы, с точностью до знаков строк,
совпадает с матрицей, полученной методом вращений.
1) Хаусхольдер [13].
156 ТОЧНЫЕ МЕТОДЫ РЕШЕНИЯ СИСТЕМ ЛИНЕЙНЫХ УРАВНЕНИЙ [ГЛ. II
Приведем результат первого шага для системы табл. II. 1. Имеем
а = — 1.23915 р = 2.35569
' W — @.95053, 0.19952, —0.04670, 0.23348)'
"—1.23917 —0.67628 —0.12339 —0.82397
—0.00001 0.82236 0.69658 —0.60630
0.00001 0.39158 0.99378 —0.67299
_—0.00001 0.22213 0.39110 0.66497
UF -=(—0.76908, 0.27560, 0.75252, 0.63740)'-
Метод единственного деления может быть следующим образом
обобщен на системы, матрицы которых разбиты на клетки с квадрат-
квадратными диагональными клетками. Разбив соответственно решение и стол-
столбец свободных членов на векторы, размерность которых равна порядкам
диагональных клеток, запишем систему в виде
Mia2
АггХг
n
2пХп =
nlXt
Ап2Х2
• • • + АппХп = Fn.
Аи
Пусть | An | Ф 0. Найдем матрицу Аи и умножим на нее слева пер-
первое уравнение системы. Получим матричное уравнение
где
Умножим это уравнение слева на Л21, ..., Ап1 и вычтем, соот-
соответственно, из 2-го га-го уравнений исходной системы. Получим
систему
2 ~1~ • ¦ • ~Т~ А^п.^Л.п = Г2-1
2-12
"»2-Г2 Т
I
Гп
где
Поступая аналогично дальше, придем в конце концов к системе
с квазитреугольной матрицей с единичными диагональными клетками
Неизвестные векторы Хх Хп находятся последовательно от
Хп к Хх по формулам
•Xi = Gj — Bii+iXi+1— ... —В^пХ„.
§ 17]
ВЫЧИСЛЕНИЕ ОПРЕДЕЛИТЕЛЕЙ
157
Разбиение матрицы на клетки, вообще говоря, не изменяет числа
элементарных операций, нужных для решения системы. Однако можно
получить значительный выигрыш в объеме работы, если существует
разбиение, при котором возникают упрощения при обращении веду-
ведущих клеток.
§ 17. Вычисление определителей
Метод Гаусса, развитый в предыдущем параграфе для решения
линейной системы, может быть применен и для вычисления определи-
определителей. Мы остановимся отдельно на описании соответствующей схемы
единственного деления, так как вычисление определителей часто встре-
встречается в приложениях. Пусть
за а12 . . . av
Clnt Ом ¦ • • Cloi
. . . а„
и пусть апф0. Вынесем элемент ап из первой строки. Тогда, при-
применяя обозначения § 16, получим:
Д= а,
1 Ь\2
«21 «22
Затем из каждой строки отнимем первую строку, умноженную соот-
соответственно на первый элемент этой строки. Мы получим, очевидно.
• • • &2п-1
О-2П-1
О Йп2.1 • • • «mi.1
Далее, с оставшимся определителем п— 1-го порядка поступаем со-
совершенно таким же образом, если только а^^ФО.
Продолжая процесс, мы получим, что искомый определитель ра-
равен произведению ведущих элементов:
Если на каком-либо шагу окажется, что flii-i-i^O или ац^^г близко
к нулю (что влечет за собой уменьшение точности вычислений), можно
предварительно изменить порядок строк и столбцов определителя так;
чтобы в левом верхнем углу оказался неисчезающий элемент.
158 ТОЧНЫЕ МЕТОДЫ РЕШЕНИЯ СИСТЕМ ЛИНЕЙНЫХ УРАВНЕНИЙ [ГЛ. II
Наилучший в смысле надежности результат получится, если на
каждом шагу процесса переводить в левый верхний угол наибольший
по абсолютной величине элемент матрицы, для которой вычисляется
определитель.
Число умножений и делений, нужных для вычисления определителя
и-го порядка, равно —q—(«2 + «+3).
В табл. II. 4 дана схема вычисления определителя и численный
пример.
Таблица II. 4.
Вычисление определителя по схеме единственного деления
(с исключением по строкам)
«11
«21
«31
«41
1
«12
«22
«32
«42
*12
«22-1
«32-1
«42-1
1
«13
«23
«33
«43
*13
«23-1
«33-1
«43-1
*23
«33-2
«43-2
«14
«24
«34
«44
*14
«24-1
«34-1
«44-1
*24
«34-2
«44-2
ьп
«44-3
«15
«25
«35
«45
*15
«25-1
«35-1
«45-1
*25
«35-2
«45.2
Но
«45-3
Д =
1.00
0.47
-0.11
0.55
1
1.00 х
0.17
1.00
0.35
0.43
0.17
0.9201
0.3687
0.3365
1
0.9201 X
-0.25
0.67
1.00
0.36
-0.25
0.7875
0.9725
0.4975
0.85589
0.65693
0.20949
1
0.65693 X
0.54
-0.32
-0.74
1.00
0.54
— 0.5738
- 0.6805
0.7030
- 0.62363
- 0.45067
0.91285
- 0.68602
1.05656
1.05656 =
1.46
1.82
0.50
2.34
1.46
1.1338
0.6606
1.5370
1.23226
0.20627
1.12234
0.31399
1.056F6
0.63863
Схема единственного деления для вычисления определителей мо-
может применяться не только с исключением по строкам, но и по
столбцам (табл. И.5). Это, очевидно, равносильно вычислению опре-
определителя транспонированной матрицы по строкам.
Из рассмотрения процесса вычисления определителя мы видим,
что он, за исключением последнего умножения, совпадает с прямым
ходом процесса Гаусса, примененным для системы с матрицей, для
которой вычисляется определитель.
Известные формулы Крамера (§ 1) показывают, что решение ли-
линейной системы можно находить в виде х, —-Л; i= 1, .. ., п, где Д
обозначает определитель из коэффициентов системы, Д{ — определи-
определитель из коэффициентов, в котором элементы ?-го столбца заменены
свободными членами. Таким образом, для решения системы прихо-
приходится вычислять п-\-1 определитель «-го порядка.
§ 17]
ВЫЧИСЛЕНИЕ ОПРЕДЕЛИТЕЛЕЙ
159
Таблица //. 5
Вычисление определителя по схеме единственного деления
(с исключением по столбцам)
1.00
0.47
-0.11
0.55
1.91
0.17
1.00
0.35
0.43
1.95
0,9201
0.3687
0.3365
1.6253
-0.25
0.67
1.00
0.36
1.78
0.7875
0.9725
0.4975
2.2575
0.65693
0.20949
0.86643
0.54
— 0.32
— 0.74
1.00
0.48
— 0.5738
— 0.6806
0.7030
— 0.5514
— 0.45067
0.91285
0.46218
1.05653
1.05656
1.00
0.47
— 0.11
0.55.
1.91
1
0.40072
0.36572
1.76С44
1
0.31889
1.31891
1 X 0.9201 X 0.65693 X 1.05656 = 0.63863
Сравнивая процесс Гаусса для решения системы с процессом вы-
вычисления определителя, мы видим, что объем вычислений для реше-
решения системы лишь немногим превышает вычисление одного опреде-
определителя. Поэтому пользоваться формулами Крамера для численного
решения системы нецелесообразно. По сути дела, в способе Гаусса
производятся вычисления всех определителей Д и Дг одновременно,
причем деление на Д = аиа2гл ... ппп.п_1 производится постепенно,
по одному множителю на каждом шаге.
Получение нулей при вычислении определителя можно осущест-
осуществить также посредством линейного комбинирования строк матрицами
вращений. Это требует значительно большего числа операций, чем
160 ТОЧНЫЕ МЕТОДЫ РЕШЕНИЯ СИСТЕМ ЛИНЕЙНЫХ УРАВНЕНИЙ [ГЛ. II
схема единственного деления, но дает значительно более стабильный
процесс вычислений.
Для вычисления определителя можно так же разбить его матрицу
на клетки с квадратными диагональными клетками и затем „получить
нули" подобно тому, как это делается в соответственно видоизме-
видоизмененной схеме единственного деления для решения систем линейных
уравнений.
В конце концов искомый определитель окажется произведением
определителей „ведущих" клеток
§ 18. Компактные схемы для решения неоднородной
линейной системы
В § 16 мы видели,что решение системы линейных уравнений по
схеме единственного деления свелось к определению коэффициентов
aij-k преобразованных уравнений (включая свободные члены) и коэф-
коэффициентов btj уравнений окончательной треугольной системы. При
этом, для получения решения данной системы нам нужны только
коэффициенты Ь^, а числа п^.к играют вспомогательную роль и
нужны лишь затем, чтобы определить числа Ьц.
Покажем 1), что числа Ьц можно получать процессом накопления,
позволяющим избежать вычисления и записи всех коэффициентов а^ук.
Выделим элементы 1-го столбца каждой вспомогательной мат-
матрицы ау.^р i^-j, обозначив их через Сц, i^-j-
Анализируя процесс вычисления коэффициентов вспомогательных
матриц, мы видим, что
aij-h — aij-k-l — агк-к-Фк) = aij-k-l — сгФк) =
— aij-k-2 — cik-l^k-lj — cikPkj = • • • —
к
— atj — CiAj — Сц&2) — • • • — cikbk! = ai} — 2 cnbl}. A)
Таким образом, любой элемент ai}.k выражается посредством накоп-
накопления через выделенные нами элементы Су и числа Ьц.
В частности, для самих элементов Су, i^j, и Ъц, i<LJ, имеют
место рекуррентные формулы
Сц == aij.j-1 = ац — 2 cabij (i > j)
' i-i B).
°ij — 2
i-l
Дуайр [1].
КОМПАКТНЫЕ СХЕМЫ
161
По этим же формулам определяются, очевидно, и свободные члены
преобразуемых уравнений. Схема проведения прямого хода по фор-
формулам B) называется компактной. Обратный ход остается таким же,
как и в развернутой схеме единственного деления.
Вычисления по компактной схеме удобно располагать так, как
это указано в табл. II. 6.
Таблица II. 6
Компактная схема метода единственного деления
"и
а:,
а3,
а„
с,, 1 1
Со,
С31
«и
1
0,2
а.2х
ом
0,3
»Г2
С22 | 1
С32
Си
1
а2,
я зз
0,3
»,.
&23
с!В 1 1
С,з
1
Он
а,,
Оз,
о„
»..
ь21
Ьз,
1
а,5
025
035
а 15
ь..
6«
•^.
*3
Л-2
о1в
02,
031
о,»
6,
К,
ь„
ь„
х~,
х~,
X,
х\
1
0.47
—0.11
0.55
1 И
0.47
-0.11
0.55
1
0.17
1
0.35
0.43
0.17
0.92011 1
0.3687
0.3365
1
—0.25
0.67
1
0.36
-0.25
0.85589
0.65693| 1
0.20949
1
0.54
-0.32
-0.74
0.54
-0.62363
—0.68602
1.056571 1
1
0.3
0.5
0.7
0.9
0.3
0.39017
0.89681
0.39357
0.39357
1.16681
-0.36305
0.44089
1.76
2.32
1.20
3.24
1.76
1.62243
1.21080
1.39357
1.39357
2.16682
0.63694
1.44090
Здесь вычисление элементов с и Ъ мы производим последовательно
по углам, начиная с вычисления элементов С:
с32
1-й шаг
2-й шаг
3-й шаг
При этом любой элемент получается как разность между соот-
соответствующим элементом а и суммой попарных произведений недиа-
недиагональных элементов с, находящихся в данной строке (слева),
и элементов Ь, находящихся в данном столбце (выше). Конечно, при
вычислении элементов b нужно еще произвести деление на соответ-
соответствующий диагональный элемент с.
162 ТОЧНЫЕ МЕТОДЫ РЕШЕНИЯ СИСТЕМ ЛИНЕЙНЫХ УРАВНЕНИЙ [ГЛ. II
Так,
С43 == fl43 С41*13 С42*23 ==
= 0.36 + 0.55 • 0.23 — 0.3365 ¦ 0.85589 = 0.20949
— 0.74 + 0-11 • 0.54 + 0-3687 ¦ 0.62363 п «одпо
= — 0.68602.
Скажем несколько слов о контроле, применяющемся при вычис-
вычислении по компактной схеме. Так же, как и раньше, составляем
столбец из контрольных сумм и над ним проделываем те же опера-
операции, что и над столбцом свободных членов.
При этом каждое число преобразованного столбца должно сов-
совпадать с суммой элементов соответствующих строк матрицы В, рас-
расширенной посредством присоединения преобразованного столбца
свободных членов. Действительно, матрица В есть матрица коэффи-
коэффициентов системы, получаемой из данной после окончания прямого
хода по схеме единственного деления.
Вычисление по компактной схеме требует предварительной фик-
фиксации ведущих элементов, так что схеме главных элементов невоз-
невозможно придать компактную форму.
Компактная схема формально почти без изменений может быть
распространена на решение систем линейных уравнений, матрицы
которых разбиты на клетки с квадратными диагональными клетками.
Обозначив через Ctj матрицу Ац^__х, мы, так же как в числовом
случае, будем иметь
2«Ц
ц—2 ад,) (* < у).
Эти формулы позволяют последовательно вычислять матрицы Сц и В^
в том же порядке, как и в числовом случае.
§ 19. Связь метода Гаусса с разложением
матрицы на множители
В § 1 было показано, что систему п линейных уравнений с п
леизвестными можно записать в матричной форме
AX=F, A)
где А данная неособенная матрица, X и F столбцы, состоящие из
значений неизвестных и свободных членов, которые мы будем рас-
рассматривать как векторы арифметического пространства.
§ 19] СВЯЗЬ МЕТОДА ГАУССА С РАЗЛОЖЕНИЕМ МАТРИЦЫ НА МНОЖИТЕЛИ 163
Метод Гаусса, проведенный с фиксированным порядком
ведущих элементов, состоит в том, что данная система заменяется
равносильной треугольной системой посредством линейного комби-
комбинирования уравнений, что сводится к линейному комбинированию
строк А. При этом нам приходится (пользуясь схемой единствен-
единственного деления) кроме делений на ведущие элементы добавлять к эле-
элементам строк числа, пропорциональные элементам предшествующих
строк, т. е. совершать над матрицей А элементарные преоб-
преобразования типа а) и Ь') пункта 11 § 1.
Результат нескольких преобразований этого вида, как было там
показано, равносилен умножению матрицы А слева на левую тре-
треугольную матрицу
Тп 0 ... О
О
Т21 Т22
Т»2
~[пп —
B)
В результате этих преобразований мы переходим к системе
с правой треугольной матрицей
О 1
о о
• • • hn
... I
C)
Таким образом, ТА = В, т. е. Л = Г В и, следовательно, матрица .4
разлагается в произведение двух треугольных матриц.
Компактная схема осуществляет это разложение. Действительно,
Т~1 = С, где элементы матрицы С определены по формулам B) § 8,
р
ибо из этих формул следует, что
ач = СЧ + V
2
i
_ V.
(ИЗ формул ДЛЯ Су) И
г-1
- ZJ cil°lj "Г <
(=1
j = 2 cub
2
ij
У)
(из формул для btj).
Последние формулы означают, что
А = СВ.
Так как диагональные элементы матрицы В равны единице, такое
разложение единственно.
11*
164 ТОЧНЫЕ МЕТОДЫ РЕШЕНИЯ СИСТЕМ ЛИНЕЙНЫХ УРАВНЕНИЙ [ГЛ. И
Компактная схема, примененная к клеточной матрице, очевидно,
осуществляет ее разложение в произведение двух квазитреугольных
матриц.
Компактная запись для схем метода Гаусса, отличных от схемы
единственного деления, также связана с разложением матрицы в про-
произведение двух треугольных, но с другим выбором диагональных
элементов.
Заметим, что компактные схемы закрепляют порядок исклю-
исключения, и потому они применимы только в том случае, как это еле-
дует из теоремы 1.1, когда все определители ап,
ап ап
о9, а.,.
не равны нулю.
Покажем, что в случае, когда матрица А симметрична,
\А\
D)
Действительно, А = СВ, А' = В'С и, так как А —А',
1 !i2i
О \ ... ^
Си
0
0
0
0
.. . 0
. . . 0
... с
О 0 . . . 1
Отсюда, в силу единственности разложения матрицы А в произведе-
произведение двух треугольных матриц, следует, что
j ^П. Чп\
О 1 ... ^
С о-2
О 0 ... 1
Таким образом, элементы матрицы В находятся посредством де-
деления элементов матрицы С на диагональные элементы. Тем не менее
компактная схема требует п2 записей и в случае, если матрица А симмет-
симметрична (табл. II. 7), так как в рекуррентные соотношения B) § 18 входят
как числа Ь^, так и числа cki. Можно дать рекуррентные соот-
соотношения, в которых элементы bik выражаются друг через друга
и через диагональные элементы cit. Однако так построенные фор-
формулы оказываются более сложными.
§201
МЕТОД КВАДРАТНЫХ КОРНЕЙ
165
Таблица II. 7
Компактная схема метода единственного деления
в симметричном случае
a,,
й«
-*si
au
«и
1
с»
1
G
Озз
an
612
си | l
C32
1
a u
агз
Озз
Й13
6,3
*2.Ч
Сз3 | 1
с,ь
1
Яц
а<»
Оз,
а1л
6н
*24
ь„
1
1
а,!
«25
"за
а,ь
ьи
^25
*35
ь..
Х3
а,.
а,.
Озв
Й4«
6„
ь.»
63
6.-
7,
1.00
0.42
0.54
0.66
1.00 | 1
0.42
0.54
3.66
1
0.42
1.00
0.32
0.44
0.42
0.82360 | 1
0.09320
0.16280
1
0.54
0.32
1.00
0.22
0.54
0.11316
0.69785 | 1
—0.15482
1
0.66
0.44
0.22
1.00
0.66
0.19767
-0.22185
0.49787 11
1
0.3
0.5
0.7
0.9
0.3
0.45410
0.71030
1.48240
1.48240
1.03917
0.04348
—1.25780
2.92
2.68
2.78
3.22
2.92
1.76493
1.48844
2.48239
2.48239
2.03916
1.04348
—0.25779
§ 20. Метод квадратных корней
В этом параграфе мы покажем, что в случае, когда матрица
системы симметрична, нахождение решения можно еще упростить, 1)
так как в этом случае матрицу можно разложить в произведение
двух транспонированных друг другу треугольных матриц.
Итак, пусть
A = S'S. . A)
где
sn s12 •¦• sln
и
о о
B)
Определим элементы матрицы S. Имеем, в силу правила умножения
матриц:
¦•• +4
1) Т. Банахевич [4], [5].
166 ТОЧНЫЕ МЕТОДЫ РЕШЕНИЯ СИСТЕМ ЛИНЕЙНЫХ УРАВНЕНИЙ [ГЛ. Ц
Отсюда получаем формулы для определения sy-.
pi ац — 2 sl'sV
««—2 4 о !); sv = j^ и > о C)
Далее, решение системы сводится к решению двух треугольных
систем. Действительно, равенство
AX=F
равносильно двум равенствам
S'K = F и SX=K.
Элементы вектора К определяются по рекуррентным формулам, ана-
аналогичным формулам для Sij. Именно,
г-1
fi —
Окончательное решение находится по формулам
E)
В схеме применяется обычный контроль, причем при составлении
контрольных элементов мы учитываем все элементы матрицы. Ана-
Аналогично компактной схеме контрольным равенством является
В методе квадратных корней приходится записывать только
о" элементов матрицы S и 2л компонент векторов К и X.
В табл. II. 8 приведено решение системы по методу квадратных
корней.
§ 20]
МЕТОД КВАДРАТНЫХ КОРНЕЙ
Метод квадратных корней
167
Таблица //. 8
ж,
ж,
о,а
аа2
•?м
ж2
жа
«13
а,,3
«33
sn
S;u
Ж3
аы
а2,
й3)
а,,
Sh
s3l
s(J
,-r,
ж,
л
л
к,
*3
ft,
Л
Л
ft,
*"з
к,
1.00
1.00
-1.25778
—0.25779
0.42
1.00
0.42
0.90752
0.04348
1.04349
0.54
0.32
1.00
0.51
0.10270
0.83537
1.03S17
2.03917
0.С6
0.44
0.22
1.00
0.30
0.1783")
—0.1 f 533
0.70560
1.48238
2.48238
0.3
0.5
0.7
0.0
0.3
0.41211
О.5С336
1.045' 7
2.82
2.6S
2.78
3.22
9 ?2
1.80173
1.24310
1.75157
Вычисление элементов s;j- (так же как и элементов k{ и fej)
производится последовательно по строкам. Любой диагональный эле-
элемент вычисляется как корень квадратный из разности между соответ-
соответствующим элементом а и суммой квадратов всех вычисленных эле-
элементов s, находящихся в том же столбце. Недиагональный элемент sy
получается вычитанием из элемента ау суммы произведений соот-
соответствующих элементов s, взятых из столбцов с номерами I и j.
Полученная разность делится на диагональный элемент строки.
Так,
S34 ;
__ %4 — snsu — sss24 _ 0.22—0.54 • 0.66—0.10270 ¦ 0.17339
So, ~~ 0.83537
--=-0.13533.
Обратный ход происходит по формулам E).
По существу прямой ход метода квадратных корней равносилен
приведению квадратичной формы с матрицей А к сумме квадратов
посредством преобразования переменных с треугольной матрицей.
Если А положительно-определенная матрица, то метод квадрат-
квадратных корней протекает без всяких осложнений. Если же А не по-
положительно-определенная, то возможно вырождение процесса за счет
того, что некоторый коэффициент Sa может оказаться равным нулю
или близким к нулю. Может оказаться также, что подкоренные
выражения для некоторых su окажутся отрицательными. Однако это
не внесет существенных затруднений.
Действительно, в этом случае в строку, для которой s?. < 0,
будут входить чисто мнимые числа, действия с которыми ничуть не
сложнее, чем с вещественными числами.
168 ТОЧНЫЕ МЕТОДЫ РЕШЕНИЯ СИСТЕМ ЛИНЕЙНЫХ УРАВНЕНИЙ [ГЛ. И
Поясним сказанное на примере.
2
1.41421
1.11111
2.11111
—1
—2
-0.70711
1.58114 г
0.77776
1.77776
1
3
1
0.70711
—2.21359/
2.32379
2.55555
3.55555
4
5
6
2.82843
—4.42720 i
5.93857
6
5
И
4.24265
—5.05965 /
8.26235
В настоящее время метод квадратных корней широко используется
для решения симметричных систем и может быть рекомендован чи-
читателю, как один из наиболее эффективных методов.
§ 21. Обращение матрицы
Как уже говорилось во введении, задача решения линейной не-
неоднородной системы и задача обращения матрицы тесно связаны
друг с другом.
Действительно, если для матрицы А известна ее обратная ма-
матрица А~ , то, умножая равенство
AX=F A)
на А~ слева, мы получим
X=A~1F. B)
Обратно, определение элементов обратной матрицы можно свести
к решению п систем вида
уа.а. = 8.. J==l п
где 8^ — символ Кронекера.
Последнее вытекает из определения обратной матрицы
C)
и правила умножения матриц.
§21]
ОБРАЩЕНИЕ МАТРИЦЫ
169
Применяющийся в строительной механике прием определения
решения системы при помощи так называемых чисел влияния:)
есть не что иное, как решение системы посредством построения
обратной матрицы. Сами числа влияния суть элементы обратной
матрицы.
Численное решение п систем уравнений, дающих элементы об-
обратной матрицы, можно осуществлять, например, по методу един-
единственного деления для нескольких систем с общей матрицей коэф-
коэффициентов (см. табл. И. 9).
Таблица II. 9
Обращение матрицы. Схема единственного деления
1.00
0.42
0,54
0.66
1
1
0.42
1.00
0.32
0.44
0.42
0.82360
0.09320
0.16280
1
1
0.54
0.32
1-.00
0.22
0.54
0.09320
0.70840
—0.13640
0.11316
0.69785
-0.15482
1
1
0.66
0.44
0.22
1.00
0.66
0.16280
—0.13640
0.56440
0.19767
—0.15482
0.53222
—0.22185
0.49787
1
1
0
0
0
1
—0.42
-0.54
—0.66
—0.50996
—0.49247
—0.57698
-0.70570
-0.68624
—1.37835
-1.01149
—0.12304
2.50759
0
1
0
0
0
1
0
0
1.21418
—0.11316
—0.19767
—0.16216
—0.22278
—0.44746
—0.26143
1.33221
—0.12303
0
0
1
0
0
0
1
0
0
1
0
1.43297
0.22185
0.44560
1.53183
—0.26142
-1.01149
0
0
0
1
0
0
0
1
0
0
1
0
1
2.00856
0.44560
—0.44746
—1.37834
3.62
3.18
3.08
3.32
3.62
1.65960
1.12520
0.93080
2.01506
0.93740
0.60275
1.34327
0.81071
1.62836
1.70452
1.50030
0.99472
В результате мы получим матрицу, состоящую из строк обратной
матрицы, расположенных в противоположном порядке. Для контроля
вычисления и оценки точности результата целесообразно произвести
умножение А на Л.
А. А. У м а некий [1].
170 ТОЧНЫЕ МЕТОДЫ РЕШЕНИЯ СИСТЕМ ЛИНЕЙНЫХ УРАВНЕНИЙ [ГЛ. II
Теорема о разложении матрицы в произведение двух треугольных
матриц дает возможность построить компактную схему для
вычисления элементов обратной матрицы.') Эта схема требует всего
2и2 записей, причем иа них и2 записей будут давать элементы об-
обратной матрицы.
Пусть
А = СВ, D)
причем элементы треугольных матриц С и В определяются по фор-
формулам B) § 18, которые мы здесь перепишем:
5-1
Cij = ai} — 2 cnbl} (i > j),
i-i
aij ~ 2 cHbl)
Обозначим элементы обратной матрицы A 1 = D через d^.
Имеем, очевидно, что
D = B-lC~\ E)
Покажем, что элементы dq можно определить, не обращая матриц В и С.
Умножая равенство (о) на С справа, получим
DC=B~\ F)
Матрица В , очевидно, также треугольная, с единицами по глав-
главной диагонали. Поэтому мы знаем ее G~ элементов (из них
п (п — 1) ,. \
—-—s— будут нулями и остальные п единицами).
Аналогично, умножая равенство E) на В слева, получим
BU = C . G)
Так как матрица С~ треугольная, то 0—- ее элементов
будут нулями.
Легко видеть, что система, полученная объединением упомянутых
выше —• J~ ' равенств системы DC = В" и „—- равенств си-
стемы BD = C~X, является рекуррентной системой, дающей возмож-
возможность определить п2 элементов обратной матрицы.
1)Уо иДуайр [1].
§21] ОБРАЩЕНИЕ МАТРИЦЫ
Мы выпишем ее для п = 4.
171
i— 1
1
2
0
1
2
0
3
0
0
1
3
0
0
4
0
0
0
1
4
0
0
0
Из уравнений первоЯ группы, при г — 4, определяются последо-
последовательно d44, d43, rf42> ^4i- Затем, из уравнений второй группы, при
j = 4, определяются tf34> d2i, dl4. Далее процесс идет аналогично,
и мы пользуемся по очереди формулами первой и второй группы.
Именно, из уравнений первой группы, при / = 3, определяются d3l,
d32 и d33 и из уравнений второй группы, при / — 3, d23 и dxi; из
уравнений первой группы, при / = 2, d2l и d22, и из уравнений вто-
второй группы, при У = 2, dj2. Наконец, из уравнений первой группы,
при /== 1, определяем dn. Обращение матрицы по компактной схеме
показано в табл. II. 10.
Таблица II. 10
1.03
0.42
0.54
0.66
1.00
0.42
0.54
0.66
1
0.42
1.00
0.32
0.44
0.42
0.82360 | 1
0.09320
0.16280
Компактная схема
0.54
0.32
1.00
0.22
0.54
0.11316
0.69785 | 1
—0.15482
обращения матрицы
0.66
0.44
0.22
1.00
0.66
0.19767
-0.22185
0.49787
1
2.50759
-0.12303
—1.01149
-1.37834
—0.12303
1.33221
—0.26143
—0.44745
-1.01149
—0.26143
1.53184
0.44560
-1.37834
—0.44745
0.44560
2.00855
Компактная схема обращения матрицы может быть распростра-
распространена на клеточные матрицы с квадратными диагональными клетками.
Разложив матрицу А в произведение СВ двух квазитреугольных
матриц, мы ищем обратную матрицу D = А'1 тоже в клеточном
виде. Тогда, аналогично числовому случаю, клетки D^ обратной
172 ТОЧНЫЕ МЕТОДЫ РЕШЕНИЯ СИСТЕМ ЛИНЕЙНЫХ УРАВНЕНИЙ [ГЛ. II
матрицы находятся последовательно из соотношений (мы их при-
приводим для п = 4):
4
Di2C2l
?>13CS1 +
Di3C32 -f-
B13D3i
Порядок определения матриц
ловой матрицы.
/ = 1
= Е
:
2
О
Е
3
О
О
Е
3
О
О
О
О
О
Е
4
О
О
О
такой же, как и в случае чис-
чис§ 22. Задача исключения
Эта задача в простейшем случае состоит в вычислении значения
линейной формы
+ с2х2 -)-••• + спхп, A)
где
с2,
сп данные числа, a xt, х2
апху 4- «12^2 4- • • • 4- аигХп = А
апху 4- «22-^2 4- • • • 4- а2пхп =/2
хп решение системы
B)
4"
4 4" • • • 4" &пп,Хп — /»'
определитель которой отличен от нуля.
Естественный ход решения этой задачи заключается в определении
чисел Xj, Х2, ¦ ¦ ¦, хп в явном виде и в подстановке их в выражение A).
Однако этого можно избежать следующим образом.
Запишем матрицу коэффициентов системы B) и припишем справа
от нее столбец свободных членов, а под ней строку, состоящую из
коэффициентов вычисляемой линейной формы, взятых с обратными
знаками. В правом нижнем углу поставим число 0. Мы придем к схеме:
ап а12 ... а
#21 #22 ' ' " й
О-п\ &п2 • • • О.
k t Ь'Я ' * • t-
Л
л
C)
§ 22] ЗАДАЧА ИСКЛЮЧЕНИЯ 173
или, в сокращенной записи,
A \\F
C')
-С|| О
Пусть Yi. 72 In обозначают решение системы уравнений:
Й12Т1 + °22Т2 + ¦ • ¦ + аП2~{п = Сг
Тогда
/1T1+/2Y2+ ••• +/«Т« =
= (Дцл:, + • • • + fli»
-Jr(a2lx1 4- ... -f- a2n
+ (аИ1*1 + • • • + «nn-fп) Тп =^
= («пTl + • • • + flnlTn) ATi +
Ч- («12T1 + • • • + «пгТп) Хг +
+ +
Ч- («lnTl ¦+- • • • -h dnn'U) Xn =
Таким образом, вычисление формы c1Xi~\-c2X2~{- ¦¦¦ ~\-спхп
можно заменить вычислением формы /11-I+/2Y2+ • • • +/nTn- С дру-
другой стороны, очевидно, что если мы умножим первую строку схемы C)
на -;1, вторую на у2, .... п-ю на у„ и добавим к последней строке,
то мы получим строку, элементы которой, расположенные за двой-
двойной чертой, равны нулю; элемент в правом нижнем углу, очевидно,
равен искомому числу. Обратно, если каким-либо способом мы под-
подберем линейную комбинацию п строк так, что добавление ее к послед-
последней строке дает нулевую строку (до черты), то коэффициенты этой
комбинации будут решениями системы D), и, следовательно, элемент
в правом нижнем углу будет равен искомому числу. Это следует из
единственности решения системы D). Таким образом, нет необходи-
необходимости находить числа yi. y2 уи. Нужно только аннулировать
последнюю строку за счет добавления подходящей линейной комби-
комбинации первых п строк. Это можно сделать обычным прямым ходом
процесса Гаусса, примененным к схеме C).
174 ТОЧНЫЕ МЕТОДЫ РЕШЕНИЯ СИСТЕМ ЛИНЕЙНЫХ УРАВНЕНИЙ [ГЛ. I!
Очевидно, что такой же прием может .быть применен для вычисле-
вычисления линейной неоднородной формы cxXi-{- ... -\-cnxn-\-d. Разница
будет только в том, что в правом нижнем углу нужно записать
вместо 0 свободный член й, так что исходная схема имеет вид:
In
ani
А
У
J п
d.
C")
Этим,способом можно найти и решение системы B) без примене-
применения обратного хода. Действительно, выражения хъ Х2, ¦ ¦ ¦, хп яв-
являются частными случаями линейной формы A) с коэффициентами
A, 0 0), @, 1, 0) @, 0 1). Одновременное
их определение может быть осуществлено по схеме исключения
с одновременной записью в нижнем левом углу строк (—1, 0 0),
@, —1 0), ..., @, 0 —-1), которые вместе составляют
матрицу —Е. В правом нижнем углу вместо числа 0 мы помещаем
нулевой столбец.
Таким образом, исходная схема для решения системы имеет вид:
E)
Получив нулевую матрицу в левом нижнем углу схемы за счет до-
добавления подходящих линейных комбинаций первых п строк, мы
получим в правом нижнем углу столбец, составленный из значений
•неизвестных.
Обращение матрицы равносильно, как мы видели, решению п
систем частного вида, свободные члены которых образуют единич-
единичную матрицу. Решение их в совокупности можно осуществить при
помощи схемы
А\\Е
, F)
где Е по-прежнему обозначает единичную матрицу, а в правом
нижнем углу расположена нулевая матрица л-ro порядка. После
аннулирования всех строк в левом нижнем углу за счет добавле-
добавления подходящих линейных комбинаций первых п строк, мы получим
в правом нижнем углу матрицу А~1.
Схема F) может быть видоизменена следующим образом. Оче-
Очевидно, что аннулирование матрицы —Е, находящейся в левом ниж-
нижнем углу схемы F), требует такого же линейного комбинирования
первых п срок схемы, как при получении единичной матрицы Е
§ 22] ЗАДАЧА ИСКЛЮЧЕНИЯ 175
в левом верхнем углу вместо матрицы А. Поэтому вычисления
можно проводить так. Составим матрицу [А, Е\. Посредством деле-
деления первой строки на ап сделаем первый элемент первой строки
равным единице. Затем получим нуль в первом столбце за счет
добавления ко осем строкам первой, умноженной на подходящие
множители. Далее получим единицу на месте второго элемента вто-
второй строки, посредством деления, и нуль на месте всех остальных
элементов второго столбца, за счет добавления второй строки
к остальным (в частности к первой). Через и шагов мы получим на
месте матрицы А единичную матрицу, а тогда на месте Е окажется
матрица А'1.
По ходу процесса можно как угодно переставлять строки,
что позволяет избегать деления на числа, близкие к нулю, если
матрица не очень плохо обусловлена.
Описанному процессу можно дать другое толкование. Вспомним,
что линейное комбинирование строк равносильно умножению слева
на некоторую матрицу. Обозначим через Вг, В2, . . ., Вп последова-
последовательные матрицы, умножение на которые соответствует окончанию
1-го, 2-го, ..., и-го шагов процесса, Ясно, что матрицы, полу-
получающиеся по ходу процесса, будут [А, Е\, [В{А, BL], [В.^А, В.,], . . .
••-. [ВпА, Вп].
У матрицы В^А первый столбец совпадает с первым столбцом
единичной матрицы, у матрицы В2А уже первые два столбца совпа-
совпадают со столбцами единичной матрицы и т. д.
Обозначим через V[ * вектор, компоненты которого равны эле-
элементам /-й строки матрицы Вк, через Aj у'-й столбец матрицы А.
Из сказанного выше ясно, что
= 8y при /<ft.
Сам процесс построения векторов V\ в точности совпадает с опи-
описанным в § 9 процессом построения двойственного базиса. Двой-
Двойственный базис здесь строится к базису, состоящему из столбцов
матрицы А, исходя из системы координатных векторов.
Выпишем формулы, соответствующие описанному процессу.
vf = A, о о/, vf > = (о, 1 о/ i40) = (о, о 1)'
К. Ч*
Вместо единичных векторов можно брать любую другую систему
линейно-независимых векторов.
Однако при неудачном выборе начальной системы векторов может
случиться, что одно из скалярных произведений (Ак, V^~^) ока-
окажется равным нулю или станет близким к нулю, В частности, для
176 ТОЧНЫЕ МЕТОДЫ РЕШЕНИЯ СИСТЕМ ЛИНЕЙНЫХ УРАВНЕНИЙ [ГЛ. II
координатной системы векторов это будет иметь место, если один
из главных миноров матрицы А равен нулю или близок к нулю.
Следует отметить, что если взять в качестве системы векторов
И0), V(?\ .... V(n столбцы Ак матрицы А, то, как легко видеть
(Ан, Vif') Ф 0. Это следует из того (§ 12), что матрица
(A,. A,) (Av A2) ... (Av An)
(А2, А,) (Аг, А,) . . . (А2, Ап)
_ (Ап,
(Ап, А2) . . . (Ап, Ап) _
= А'А
положительно определена, и, следовательно, все ее главные миноры
положительны.
Отметим также, что процесс проходит хорошо, если за векторы
Vi У„ взять строки матрицы, близкой к обратной.
В работе Хестинса [4] рекомендуется для обращения плохо обу-
обусловленных матриц пользоваться описанным процессом, проводя его
сначала исходя из столбцов матрицы А, а затем, с целью уточнения
(возможно несколько раз), исходя из полученного приближения
к обратной матрице.
Результату исключения можно придать матричную форму. Это
дает возможность получить некоторые обобщения.
Именно, решение системы х1 хп в матричном виде можно
записать как столбец
хг
а значение линейной формы с1х1-\- . . . -\-спхп — как число С А 1/7.
Такое представление указывает путь для вычисления более слож-
сложного выражения С А'1 В, где С и В некоторые прямоугольные мат-
матрицы, из которых С состоит из п столбцов, а В из п строк, при-
причем число столбцов В и число строк С безразлично. Действительно,
элемент /-й строки и /г-ro столбца матрицы СА~ В есть число
CiA~x bk, где ci есть i-я строка матрицы С, а Ьк й-й столбец мат-
матрицы В.
Поэтому вычисление элементов матрицы СА~Х В можно произво-
производить методом исключения, примененным к схеме
А В
G)
§22]
ЗАДАЧА ИСКЛЮЧЕНИЯ
177
После аннулирования элементов, находящихся в левом нижнем углу,
за счет добавления линейной комбинации первых п строк мы полу-
получим в правом нижнем углу матрицу С А'1 В.
Очевидно, что при одновременном изменении знаков всех эле-
элементов матриц В и С результат не меняется, так что схема G) рав-
равносильна схеме
— В
О
G0
Вычисление обратной матрицы для матрицы А можно осуществлять
при помощи схемы
ВА
L-J
В
о
(8)
в которой в качестве матрицы В может быть взята произвольная
невырожденная матрица. Применение схемы (8) по существу равно-
равносильно применению описанного выше процесса биортогонализации
исходя из системы векторов, компоненты которых образуют строки
матрицы В. В частности, процесс при В = А' равносилен процессу
биортогонализации столбцов матрицы А.
Для вычисления произведения СА~Х В можно кроме схемы G)
пользоваться транспонированной (с точностью до знаков В и С)
схемой
(9)
— В' 0
При вычислении по этой схеме мы получим в правом нижнем
углу матрицу (СА В)', так. как {СА~Х в)'= В' {А')'1 С.
В частности, для вычисления значения линейной формы с1х1-{-
-\-с2х2-\- ••• -\- спхп можно также пользоваться схемой
(9')
—F'
0
где А' — матрица, транспонированная с матрицей коэффициентов
системы, С — столбец, составленный из коэффициентов вычисляемой
линейной формы, F' — строка из свободных членов. Справедливость
этого построения легко обосновывается непосредственно, без ссылки
на приведенные результаты. Действительно, если мы умножим пер-
первые п строк схемы (9') на xlt хг, . • •, хп и добавим к последней,
12 Зак. 974. Д. К. Фаддеев и В. Н. Фаддеева
178 ТОЧНЫЕ МЕТОДЫ РЕШЕНИЯ СИСТЕМ ЛИНЕЙНЫХ УРАВНЕНИЙ [ГЛ. II
мы получим нуль в левом нижнем углу и clx1 -f-c2x2-f- ... + спхп
в правом нижнем углу.
Аналогично, для решения системы АХ— F мы можем пользо-
пользоваться схемой
A0)
F'
0
Схемы G) и (9) могут быть применены для вычисления А }В.
Для этого достаточно положить С = Е в этих схемах.
Для обращения матрицы наряду со схемой F) можно пользо-
пользоваться схемой
А'\
(И)
— Е
0
При этом после окончания процесса мы получим в правом нижнем
углу матрицу, транспонированную с Л.
Таким образом, для каждой из разобранных задач мы имеем две
схемы, определяемые или матрицей А или ее транспонированной.
Отметим, что целесообразно пользоваться той схемой, которая в ниж-
нижнем левом углу содержит наименьшее число строк. Так, в задаче
решения линейной системы без обратного хода целесообразно поль-
пользоваться схемой с транспонированной матрицей, в задаче вычисления
произведения А~ХВ — схемой с транспонированной матрицей, в слу-
случае, если число столбцов в В меньше п, и схемой с данной матрицей,
если число столбцов в В больше п.
В табл. П. 11 дается обращение матрицы методом биортогонализации
столбцов. В графах I, II, III, IV записываются компоненты столбцов
матрицы А и компоненты последовательно вычисляемых векторов V\k\
В графе V, для контроля, выписываются (Ак, Vf), в графе VI числа
c;fe = (Ak, V/*'), в графе VII числа сг = . В последних четырех
строках граф I—IV получается А~1.
Контрольное умножение обратной матрицы на матрицу А показало,
что максимальный элемент/;' — А~1А по модулю не больше 0.00003.
В табл. II. 12 мы приводим решение системы, проведенное по
схеме A0).
Как обычно, последний столбец является контрольным. Его эле-
элементами являются строчные суммы.
Отметим, что при решении системы по схеме A0) число операций
немного превосходит число операций по способу Гаусса. Однако
однообразие процесса, именно — отсутствие обратного хода, нередко
делает этот способ более удобным.
§ 221
ЗАДАЧА ИСКЛЮЧЕНИЯ
179
Таблица //. //
Обращение матрицы методом биортогонализации столбцов
I
1.00
0.17
—0.25
0.54
0.65125
—0.37575
—0.34958
—0.12493
0.88455
-0.42749
0.09879
—0.38759
1.03020
--0.74255
0.26402
- 0.36175
1.43425
-0.91580
0.14682
- 0.44792
II
0.47
1.00
0.67
-0.32
0.30609
0.74350
0.62320
-0.63252
-0.15555
0.84589
-0.26401
—0.11279
—0.54478
1.68785
—0.70557
—0.18186
—0.34165
1.60075
—0.76449
—0.22518
III
-0.11
0.35
1.00
-0.74
—0.07164
0.41003
1.01095
-0.66687
—0.32623
0.46650
0.52166
- 0.38024
0.44286
—1.19713
1.39414
—0.24377
0.71514
—1.31388
1.31516
—0.30184
IV
0.55
0.43
0.36
1.00
0.35819
0.12984
0.30523
0.63429
0.27757
0.14772
0.15029
0.72505
0.49914
—0.33157
0.40165
0.76437
—0.35461
0.03450
0.64930
0.94645
V
0.999997
0.000004
—0.000004
0.000001
—0.000002
1.000011
—0.000010
0.000007
- 0.000002
0.000002
0.999997
0.000006
0.000009
—0.000001
0.000001
0.999992
VI
1.5355
0.8380
0.1529
1.0210
0.54575
0.87896
1.04885
—0.61442
—0.55166
1.19330
0.37418
—0.09798
0.90206
—0.38678
—0.26166
0.80762
VII
0.65125
hi 3771
2.67251
1.23821
В табл. II. 13 мы приводим вычисление произведения А 1В. Здесь
в качестве А взята матрица
1.00
0.42
0.54
0.66
0.42
1.00
0.32
0.44
0.54
0.32
1.00
0.22
0.66
0.44
0.22
1.00
180 ТОЧНЫЕ МЕТОДЫ РЕШЕНИЯ СИСТЕМ ЛИНЕЙНЫХ УРАВНЕНИЙ [ГЛ. II
а в качестве В — матрица
'0.25
0.45
0.65
0.85
0.30
0.50
0.70
0.90
0.15
0.30
0.45
0.60
0.20"
0.40
0.60
0.80
Вычисление А В произведено по схеме (9) при С= ?. В резуль-
результате вычислений
А"гВ =
¦—1.25753
0.01847
1.00394
1.45096
— 1.25780
0.04348
1.03916
1.48240
— 0.94295
— 0.00491
0.72652
1.06466
— 1.25728
— 0.00655
0.06871
1.41957
Таблица 11.12
Решение системы линейных уравнений методом исключения
1.00
0.42
0.54
0.66
-0.3
1
0.42
1.00
0.32
0.44
—0.5
0.42
0.82360
0.09320
0.16280
-0.37400
0.54
0.32
1.00
0.22
-0.7
0.54
0.09320
0.70840
-0.13640
-0.53800
0.11316
0.69785
-0.15482
—0.49568
1
0.66
0.44
0.22
1.00
—0.9
0.66
0.16280
—0.13640
0.56440
—0.70200
0.19767
—0.15482
0.53222
—0.62807
—0.22185
0.49787
—0.73804
1
1
0
0
0
0
1
—0.42
—0.54
-0.66
0.30
—0.50996
-0.49247
'—0.57698
0.10928
—0.70570
—0.68624
-0.24052
-1.37835
-1.25780
0
1
0
0
0
0
1
0
0
0
1.21418
—0.11316
—0.19767
0.45410
—0.16216
—0.22278
0.37372
- -0.44746
0.04348
0
0
1
0
0
0
0
1
0
и
0
1
0
0
1.43297
0.22185
0.71029
0.44560
1.03916
0
0
0
1
0
0
0
0
1
0
0
0
1
0
0
1
0
2.00856
1.48240
3.62
3.18
3.08
3.32
—2.40
3.62
1.65960
1.12520
0.93080
-1.31400
2.01506
0.93740
0.60275
-0.56037
1.34327
0.81071
0.10546
1.62836
1.30725
§22]
ЗАДАЧА ИСКЛЮЧЕНИЯ
Вычисление произведения A iB
181
Таблица //. 13
1.00
0.42
0.54
0.66
-0.25
-0.30
—0.15
-0.20
1
0.42
1.00
0.32
0.44
-0.45
-0.50
-0.30
—0.40
0.42
0.82360
0.09320
0.16280
—0.34500
—0.37400
—0.23700
—0.31600
1
0.54
0.32
1.00
0.22
—0.65
—0.70
—0.45
—0.60
0.54
0.09320
0.70840
—0.13640
—0.51500
—0.53800
—0.36900
—0.49200
0.11316
0.69785
—0.15482
—0.47596
—0.49568
-0.34218
-0.45624
1
0.66
0.44
0.22
1.00
—0.85
—0.90
-0.60
—0.80
0.66
0.16280
-0.13640
0.56440
—0.68500
—0.70200
—0.50100
—0.66800
0.19767
—0.15482
0.53222
-0.61680
—0.62807
-0.45415
—0.60554
—0.22185
0.49787
—0.72239
—0.73804
—0.53006
—0.70676
1
1
0
0
0
0
0
0
0
1
—0.42
—0.54
-0.66
0.25
0.30
0.15
0.20
—0.50996
—0.49247
—0.57698
0.07406
0.10928
0.02914
0.03885
-0.70570
—0.68624
—0.26182
—0.24052
—0.21234
—0.28312
-1.37835
-1.25753
-1.25780
—0.94295
—1.25728
0
1
0
0
0
0
0
0
0
1
0
0
0
0
0
0
1.21418
-0.11316
—0.19767
0.41889
0.45410
0.28776
0.38368
—0.16216
—0.22278
0.34171
0.37372
0.23227
0.30970
—0.44746
0.01847
0.04348
—0.00491
—0.00655
0
0
1
0
0
0
0
0
0
0
1
0
0
0
0
0
0
1
0
0
0
0
0
1.43297
0.22185
0.68204
0.71029
0.49033
0.65378
0.44560
1.00394
1.03916
0.72652
0.96871
0
0
0
1
0
0
0
0
0
0
0
1
0
0
0
0
0
0
1
0
0
0
0
0
1
0
0
0
0
2.00856
1.45096
1.48240
1.06466
1.41957
3.62
3.18
3.08
3.32
—2.20
-2.40
-1.50
—2.00
3.62
1.65960
1.12520
0.93080
-1.29500
-1.31400
—0.95700
-1.27600
2.01506
0.93740
0.60275
-0.59980
—0.56037
—0.47943
—0.63924
1.34327
0.81071
0.03954
0.10546
—0.01979
—0.02639
1.62836
1.21585
1.30725
0.84334
1.12447
182 ТОЧНЫЕ МЕТОДЫ РЕШЕНИЯ СИСТЕМ ЛИН1.ЙНЫХ УРАВНЕНИЙ [ГЛ. II
§ 23. Исправление элементов обратной матрицы
Обращение матрицы по всем приведенным выше схемам не дает
уверенности в точности полученных результатов из-за неизбежных
округлений, влияние которых на конечный результат трудно оценить.
Для контроля точности матрицы Do, полученной из данной матрицы А
каким-либо процессом обращения, следует составить произведение AD0.
Отклонение этого произведения от единичной матрицы указывает
степень неточности полученных результатов.
Пусть это контрольное вычисление покажет нам, что приближе-
приближение Do к А таково, что ||/?0И^^< Ь где
R0 = E — AD0. A)
В качестве нормы матриц удобно брать первую или вторую норму,
введенные в § 13, как наиболее легко вычисляемые.
При этом условии элементы обратной матрицы А" могут быть
вычислены со сколь угодно большой точностью при помощи сле-
следующего итерационного процесса.*)
Образуем последовательность матриц
Dl = D0(E-\-R0). Ri = E —
„,_!), Rm = E-ADm.
Проверим, что матрица Rm = E— ADm равна Ro . Действительно,
= E (c—Rm-l)(E ~\~ Rm-l) == Rm-1 = Rm-i = ¦•• == Ro ¦ C)
Отсюда следует, что
Dm = A^{E-RT). D)
Последняя формула показывает, что Dm стремится к А"\ причем
сходимость процесса очень быстрая. Дадим оценку погрешности,
принимая во внимание, что Л~1 = О0(ЛО0)~1 = D0(E — RoI:
Из этой оценки видно, что как только начальное приближение
выбрано так, что ||? — AD0\\^.k<^l, число верных десятичных
знаков возрастает в геометрической прогрессии.
1) Хотеллинг [1]. Отметим, что Хотеллинг пользовался нормой N (Л).
§23]
ИСПРАВЛЕНИЕ ЭЛЕМЕНТОВ ОБРАТНОЙ МАТРИЦЫ
183
Последовательные приближения следует вычислять, раскрыв скобки
в формулах B), именно:
-,)• F)
Второе слагаемое будет играть при этом роль малой поправки
к первому.
Иногда, исходя из матрицы Ro, целесообразно образовать матрицы
R^—Rl, Rj. = Ro = (/?jJ посредством последовательного возвыше-
возвышения в квадрат и затем воспользоваться формулой F).
Замечание. В случае, если А симметричная матрица и в ка-
качестве начального приближения Do взята симметричная матрица, то
и все последующие приближения будут матрицами симметричными,
хотя матрица Ro может оказаться и не симметричной матрицей. Дей-
Действительно, из формулы F) следует, что Dm = 2Dm_t — Dm_lADm (,
откуда, допустив, что А = A, Dm-\=- Dm. lt получим
== 2L)m-i '^m-iAUm_l = Um.
В качестве примера применим описанный процесс для уточнения
элементов матрицы А'
А =
для
1.00
0.42
0.54
0.66
0.42
1.00
0.32
0.44
0.54
0.32
1.00
0.22
0.66"
0.44
0.22
1.00
G)
За начальное приближение возьмем результат обращения матрицы А
по методу единственного деления (удерживая 4 знака после запятой)
из табл. II. 9.
2.5076
— 0.1230
— 1.0115
— 1.3783
— 0.1230
1.3322
— 0.2614
— 0.4475
— 1.0115
— 0.2614
1.5318
0.4456
— 1.3783
— 0.4475
0.4456
2.0086
Контрольное вычисление дает для RQ следующее значение:
"—52 —18 20 —50'
— 60 - 8 — 10 10
— 18 —34 26 —10
— 66 20 10 —54
184 ТОЧНЫЕ МЕТОДЫ РЕШЕНИЯ СИСТЕМ ЛИНЕЙНЫХ УРАВНЕНИЙ [ГЛ. II
Отсюда мы видим, что ||Я0||,< 0.000150, ||ЯО||П< 0.000196. Для
оценки погрешности берем ||#0||i. В силу формулы E) имеем, при-
принимая во внимание, что ||A>i|i<C5:
A-
¦А~11<5
@.00015J
1 — 0.00015
-l
< 0.0000001.
Таким образом, Dt дает для А ' значение верное с точностью,
по крайней мере, до единицы седьмого знака для каждого ее эле-
элемента.
Вычисляя, получим:
" 2.50758616 —0.12303930 — 1.01148870 — 1.37834207'
— 0.12303930 1.33221281 —0.26142705 —0.44745375
— 1.01148870 —0.26142705 1.53182667 0.44560858
— 1.37834207 —0.44745375 0.44560858 2.00855152
Контрольное вычисление Е — ADX дает:
(8)
2
1
1
1
0
0
0
0
о г
-1 1
о о
0 —1
Уточненное значение матрицы А~ позволяет получить уточненное
решение неоднократно рассматриваемой системы
хх + 0.42*2 + 0.54*3 + 0.66*4 = 0.3
0.42*t+ *2 + 0.32*з+0.44*4 = 0.5
0.54*! +0.32*2+ *3+ 0.22*4 =0.7 ^
0.66*! + 0.44*2 + 0.22*з+ х4=0.9.
Именно,
*!= 1.2577938, *2 = 0.0434873, *3= 1.0391663, *4= 1.4823929.
A0)
§ 24. Обращение матрицы при помощи разбиения на клетки
Иногда бывает целесообразно при обращении матрицы предвари-
предварительно разбить ее на клетки. Мы рассмотрим формула для обраще-
обращения матрицы порядка п, разбитой на четыре клетки по схеме
с
где А и D квадратные матрицы порядков р и q; p-\-q = n.
" А
_С
В
D _
§ 24] ОБРАЩЕНИЕ МАТРИЦЫ ПРИ ПОМОЩИ РАЗБИЕНИЯ НА КЛЕТКИ 185
Будем искать обратную матрицу также в виде клеточной матрицы
К
м
L
N
где К и N снова квадратные матрицы порядков р и q.
Согласно правилу умножения клеточных матриц, должны иметь
место следующие матричные равенства
AL+BN = О
CL+DN = Е.
Умножив третье равенство слева на BD~X и вычитая из первого,
получим
{a
откуда
Из третьего равенства, далее, находим
M = —D~1CK.
Подобным же образом из второго и четвертого уравнений находим
Конечно, эти формулы выведены в предположении, что все указан-
указанные обращения матриц выполнимы.
Таким образом, обращение матрицы порядка п сводится к обра-
обращению четырех матриц, из которых две имеют порядок р и две
порядок д, и к нескольким матричным умножениям.
Выведенные формулы можно изменить так, что для вычисления
матриц К, L, М и N нужно обратить лишь две матрицы поряд-
порядков р и q.
Именно, легко проверить, что
M = (D — CA~xB)~1; M = ~NCA~x
K=A~i—A~lBM
и аналогично
¦=(A — BD~lC) 1; L =
N = D~1 — i
186
ТОЧНЫЕ МЕТОДЫ РЕШЕНИЯ СИСТЕМ ЛИНЕЙНЫХ УРАВНЕНИЙ [ГЛ. [[
Последние формулы показывают, что метод разбиения удобно при-
применять в том случае, когда какая-либо диагональная клетка легко
обращается.
В качестве примера найдем обращение матрицы
1.00 0.42
0.42 1.00
0.54 0.32
0.66 0.44
0.54 0.66
0.32 0.44
1.00 0.22
0.22 1.00
Вычисление проводим следующим образом.
1) Вычисляем матрицу А
' 1.21418 —0.50996"
— 0.50996 1.21418 _
и образуем произведения
^0.49247 0.57693"
0.11316 0.19767
0.49247 0.11316
0.57698 0,19767
0.30215 0.37482
0.37482 0.46778
Вычисляя последнюю матрицу дважды, как С(а~1В) и (СА ')В, мы
получаем контроль предыдущих вычислений.
2) Образуем матрицу
' 0.69785 — 0.15482~
_—0.15482 0.53222_
й находим ее обратную
N^{D-CA-1B)~i =
3) Вычисляем матрицы
М = — NCA~' =
1.53183 0.44560"
0.44560 2.00355
¦A~XBN--
Л ^"= Л —
'—1.0W48 —0.26142
,— 1.37834 —0.44745.
— 1.01148 — 1.37834
— 0.26142 —0.44745
' 2.50758 —0.12303'
— 0.12305 1.33221
§ 25] метод окаймления L87
Таким образом, искомая обратная матрица будет:
2.50758 —0.12305 —1.01148 —1.37834
— 0.12305 1.33221 —0.26142 —0.44745
— 1.01148 —0.26142 1.53183 0.44560
— 1.37834 —0.44745 0.44560 2.00855.
Изложенный метод по существу совпадает с описанной выше
компактной схемой обращения клеточной матрицы для случая раз-
разбиения матрицы на четыре клетки.
§ 25. Метод окаймления
В этом параграфе мы рассмотрим вычислительные схемы для
обращения матрицы и решения линейной системы, основанные на
идее окаймления.
Данную матрицу А мы будем рассматривать как результат окай-
окаймления матрицы п—1-го порядка, для которой мы будем считать
известной обратную матрицу. Итак, пусть
А =А„
Аг-1 «п
«11
«21
«n-
a
«12
«22
1,1 fln-l,2 '
«П2 ¦
¦ • «1, n-1
• • «n-1, n-1
• • «n, n-1
«m
«2П
«П-1, П
ann
Здесь А„_1 обозначает упомянутую матрицу п—1-го порядка,
vn = («„,, ¦•-.«„,„-О, м„ = («1„ a»-i,n)'-
Матрицу А' ищем также в виде окаймленной матрицы
Л — А~1 —
LJn Sin —
n-l ' n
1
где Рп-! матрица, qn строка, гп столбец и ¦— число, которые нам
нужно определить.
188 ТОЧНЫЕ МЕТОДЫ РЕШЕНИЯ СИСТЕМ ЛИНЕЙНЫХ УРАВНЕНИЙ [ГЛ. II
По правилу умножения окаймленных матриц имеем:
' К-\ ип
'Рп-1 Гп
Отсюда
п-\' п-\ ~Т~ипЯп> "-п-\гпЛ Z "
Р -Х- а а — F
№7t
ап
апп
ап —
=
Е
0
= Е
= 0
= 1.
0
1
A)
B)
C)
D)
Из равенства C) имеем
г„= —
Подставляя значение гп в D), получим
Далее, из A) имеем
A
и потому, на основании B) и E):
¦vnAn-i — vnA-lxunqn + annqn =
= *v4»-i — (ann — а„) qn + ann4n:
Отсюда
«-1
E)
F)
¦ а-пЧп = 0.
Наконец,
Таким образом, окончательно:
An-lanvnAn-l
An-lun
vnAn-l
G)
где ап = апп — vnAn~iUn.
§25]
МЕТОД ОКАЙМЛЕНИЯ
189
Очевидно, что построенная формула является частным случаем
формул обращения матрицы методом разбиения на клетки при
р = п— 1 и ^= 1.
Выведенная формула кладется в основу метода обращения матрицы
посредством последовательного окаймления. Именно, последовательно
строятся обратные матрицы для матриц
(flu).
«22
22 -
«22 «23
Я39 #33 _
из которых каждая следующая получается из предыдущей посредством
окаймления. Каждый шаг этого процесса осуществляется на основании
формулы G). Именно, если A^-i уже известна, для нахождения An
нужно произвести следующие действия:
1) Вычислить столбец — An-iUn. Элементы столбца [3ln Pn-i,«
находятся при помощи накоплений.
2) Вычислить строку — vnAu~\ с элементами *fni> •••>Tw,»-i-
3) Вычислить число
»—1 п—1
аи = «п»+ 2 anihn = апп + 2 агпЛш-
г=1 г=1
(Двойное вычисление числа ап является хорошим контролем пред-
предшествующих вычислений).
4) Наконец, найти элементы d^ обратной матрицы по формулам:
dik = dik + -LiilM- it k < n — 1
j Pi» . j "nk ¦ h / „ 1 . w L
Здесь rf« — элементы матрицы Лй-i-
В случае симметричной матрицы А схема сокращается, очевидно,
ровно вдвое.
В табл. II. 14 дано обращение матрицы G) § 23 при помощи
последовательного окаймления.
Каждый шаг процесса оформлен по следующей схеме
Метод окаймления может быть полезен и в применении к реше-
решению системы линейных уравнений. Особенно целесообразно исполь-
использовать этот метод в случае, когда нужно решать систему, для кото-
которой уже ранее решена усеченная система, получающаяся из данной
190 ТОЧНЫЕ МЕТОДЫ РЕШЕНИЯ СИСТЕМ ЛИНЕЙНЫХ УРАВНЕНИЙ [ГЛ. II
Таблица П. 14
Обращение матрицы методом окаймления
1
1
0.42
—0.42
1.21418
- 0.50996
0.54
—0.49247
1.56172
— 0.43010
—0.70570
0.66
—0.68624
2.50759
—0.12304
—1.01149
1.37835
0.42
1
—0.50996
1.21418
0.32
-0.11316
—0.43010
1.23253
—0.16216
0.44
-0.22277
—0.12304
1.33221
-0.26143
—0.44745
—0.42
0.82360
0.54
0.32
1
-0.70570
—0.16216
1.43297
0.22
0.22186
—1.01149
-0.26143
1.53183
0.44562
—0.49247
-0.11316
0.69785
0.66
0.44
0.22
1
—1.37835
—0.44745
0.44562
2.00856
—0.68624
—0.22277
0.22186
0.49787
вычеркиванием одного уравнения и одного неизвестного. Такая ситуа-
ситуация часто встречается в приложениях. Например, при решении задач
математической физики по методу Б. Г. Галеркина или Ритца может
оказаться, что решение, полученное в результате использования
п—1-й координатной функции, недостаточно точно; если для по-
построения более точного решения достаточно добавление еще одной
координатной функции, то новая система для определения коэффи-
коэффициентов получается из предшествующей системы окаймлением.
Метод окаймления может быть применен к решению системы ли-
линейных уравнений следующим образом.
§ 25] МЕТОД ОКАЙМЛЕНИЯ
Пусть система имеет вид
191
Обозначим
Тогда
К-х ип
— Г п-
* п
а;
_ 0
=
-\ о
0 __
~ А'1
0
/»
п
- д-»1вя
_ -^"
_
п
-
— 1 — 1 "~
nU 1 _
_ г _
—
- 1 и A-i F a-i f -
Но An-iFn_l есть решение усеченной системы, т. е. системы
! ~Г" ¦ • • Г" ^n~t, n-l %п-\ /п-1'
которое мы обозначим
Аналогично
-1
есть решение системы с той же матрицей коэффициентов, но с дру-
другими свободными членами.
Зная Хп_1 и Qn_v мы легко вычислим Хп. Действительно,
1
— Qn-\°nXn-l-\-Qn-Jn
о
Таким образом, для нахождения Хп нам надо кроме Хп_х вычислить
еще Qn_v ¦
192 ТОЧНЫЕ МЕТОДЫ РЕШЕНИЯ СИСТЕМ ЛИНЕЙНЫХ УРАВНЕНИЙ [ГЛ. II
Если усеченная система была решена по методу Гаусса, то для
нахождения Qn_i в схему нужно добавить еще один столбец. Вычи-
Вычисление прямого хода выполняется лишь для этого столбца, с ис-
использованием уже известной левой половины схемы. Затем Qn_!
определяется обычным обратным ходом.
§ 26. Эскалаторный метод
При обращении матрицы методом окаймления существенную роль
при переходе от обращения матрицы Ак_1 к обращению окаймленной
матрицы Ак играет вычисление выражений—AkliUk и —vkA^ti.
При этом компоненты вектора — ATct\tik представляют собой
не что иное, как решение системы уравнений:
ак-1, 121 + ак-1, ггг Т~ ¦•• +rtfc-i, k-\zk-\ + ak-i,k — О-
Аналогично, компоненты —vkAkli образуют решение транспо-
транспонированной системы.
Последовательное решение таких систем при k = 2, ..., п, п-\-\
лежит в основе так называемого эскалаторного метода решения си-
систем линейных уравнений '). Тем самым эскалаторный метод тесно
связывается с методом окаймления.
Существенным достоинством метода является наличие надежного
контроля, при помощи которого можно регулировать точность вы-
вычислений, добиваясь выполнения контрольных равенств за счет при-
привлечения большего числа значащих цифр. Следует, однако, заметить,
что эскалаторный метод не является в этом отношении единственным
среди точных методов решения систем. Надежным контролем обла-
обладает также рассмотренный выше прием биортогонализации столбцов
и целый ряд других методов, которые будут рассмотрены ниже.
Мы изложим эскалаторный метод -лишь в применении к системам
с симметричной матрицей, придав вычислительной схеме компактную
форму. При этом обнаружится связь эскалаторного метода с мето-
методом Гаусса.
Итак, пусть дана система уравнений:
апх1 -\-al2x2-f- ... +alnxn + aunhl = 0
A)
ап1х1 ~T~ ап2х2 ~Р • • ¦ H~ annxn T~ an, n + l == 0»
матрица коэффициентов которой симметрична.
Моррис [4].
§ 26]
ЭСКАЛАТОРНЫЙ МЕТОД
193
Обозначим через zlk zk-i,k решение системы:
anzx + .. . -f ah k_1zk_l + alk = 0
B)
Числа zi,n+l = xi очевидно образуют решение системы A). По-
Поэтому, если мы установим способ последовательного вычисления чи-
чисел zik для i<fe^«-j-l> то тем самым дадим способ построения
искомого решения.
Допустим сначала, что уже вычислены все числа z,k для I <C. k ^ п.
Построим с их помощью матрицу
1 zv
О 1
О О
у
z13
1
Z2n
Z
in
0 0 0
1
C)
Легко видеть, что матрица AZ имеет нули выше главной диаго-
диагонали. Действительно,
Cj = AZ =
fl21,
anlzi2 + an
anlzl
D)
и, в силу определения чисел z^, все элементы, лежащие выше глав-
главной диагонали, равны нулю. Ненулевые элементы матрицы Ct вы-
вычисляются по формулам
Cij = (lilzlj-\-ai2z2}-\- ... -\-aii}_lzi_hj-\-aij,i^.J. E)
Отсюда вытекает связь этого метода с методом Гаусса, рассма-
рассматриваемого в свете разложения матрицы на множители.
Действительно, из D) имеем
A = ClZ~i. F)
Но матрица Z~1 — треугольная матрица с единичной диагональю и
нулевыми элементами ниже диагонали, Ct — треугольная матрица
с нулевыми элементами выше диагонали. Сравнивая это разложение
с разложением матрицы, соответствующим схеме единственного деле-
деления метода Гаусса (А = СВ), мы получаем, в силу единствен-
единственности такого разложения, что
Z~X=.B, C^
G)
13 Зак. 974. Д. К. Фаддеев и В. Н. Фаддеева
194 ТОЧНЫЕ МЕТОДЫ РЕШЕНИЯ СИСТЕМ ЛИНЕЙНЫХ УРАВНЕНИЙ [ГЛ. II
Представим матрицу С в виде
1 0 0 ... О
T2i ! О ... О
_ 1т Ти2 Тиз
О
с33
=ГА. (8)
Здесь -[%}— Т~ > 1>J-
Докажем, что матрица Г=СА~ является матрицей, транспони-
транспонированной к матрице Z". При этом мы будем существенно поль-
пользоваться симметричностью матрицы А. Имеем:
A = TAZ = A' = (Z)'- AT.
Ho (Z) —треугольная матрица с нулями выше диагоиали, Г' —
треугольная матрица с нулями ниже диагонали и единицами на диа-
диагонали. В силу единственности разложения, T' = Z~1.
Это обстоятельство позволяет указать рекуррентные формулы
для последовательного определения чисел 2у. Допустим, действи-
действительно, что мы уже вычислили элементы первых к столбцов мат-
матрицы Z. Тогда по формулам E) можно определить k столбцов мат-
матрицы С, следовательно — k столбцов матрицы Г, т. е. k строк
матрицы Z. Для продолжения процесса нам нужно вычислить эле-
элементы (&-j-l)-ro столбца матрицы Z. Так как диагональный элемент
этого столбца равен единице, а элементы ниже диагонали равны
нулю, нам остается дать формулы для вычисления ^ifc+1, где i^.k.
Из равенства ZV = ? мы получаем, в силу правила умножения мат-
матриц, следующие рекуррентные формулы:
г z -f- z ¦
Ifc+l, к 1к ' 1, йг + 1
Tft + 1, kZ2kiZ2, fc + 1'
'ft + lt к
ft, ft + 1
= 0,
(9)
определяющие элементы (/г-|-1)'Г0 столбца матрицы Z.
Упомянутым выше надежным контролем является действительное
обращение в нуль нижедиагональных элементов матрицы Г'.
§ 27]
МЕТОД ПЕРСЕЛЛА
195
Приведем компактную схему эскалаторного метода для системы
4 уравнений. (Напомним, что свободные члены для единообразия
вычисления мы записываем в левых частях уравнений).
«и
«21
«31
«41
Си
1
0
0
0
«12
«22
«32
«42
721
с2а1 1
0
0
«13
«23
«33
«43
Tsi
Т32
с3з1 1
0
«U
«24
«34
«44
Т41
Т43
Т43
«44
1
«15
«25
«35
«4В
Y51
7»2
Y53
Т54
1
0
0
0
1
0
0
^13
*23
1
0
^14
^24
*34
1
*1
Х2
*3
Xi
Схема состоит из трех частей. В первой части записана матрица
коэффициентов системы (симметричная по условию). Во второй части
мы записываем постепенно элементы столбцов матрицы Z. В нижней
части записываются диагональные элементы матрицы С и элементы
матрицы Г'. Отметим, что элементы k-Pi строки матрицы Г' мы по-
получаем, умножая столбцы матрицы А на k-ft столбец матрицы Z и
деля полученные суммы на элемент скк. Столбец матрицы Z запол-
заполняется по формулам (9). В табл. II. 15 дан иллюстративный пример.
Таблица II. 15
Компактная схема эскалаторного метода
1.00
0.42
0.54
0.66
1
0
0.000003
—0.000009
1
0.42
1.00
0.32
0.44
0.42
О.82360| 1
0.000003
-0.000009
0.54
0.32
1.00
0.22
0.54
0.11316
0.69785 | 1
—0.000009
0.66
0.44
0.22
1.00
0.66
0.19767
—0.22185
0.49787
1
-0.3
—0.5
—0.7
-0.9
-0.3
—0.45410
—0.71030
-1.48240
1
0
0
0
—0.42
1
0
-0.49247
—0.11316
1
0
-0.68624
-0.22278
0.22185
1
-1.25780
0.04348
1.03917
1.48240
§ 27. Метод Перселла
С решением Х=(хг хп) системы уравнений
«ii*i+ ••• +аыхп— /1==0
й»Л—/»=.О
A)
13*
196 ТОЧНЫЕ МЕТОДЫ РЕШЕНИЯ СИСТЕМ ЛИНЕЙНЫХ УРАВНЕНИЙ [ГЛ. II
связывается 1) вектор Z— (xit .... хп, \)' = (Х, 1)'арифметического
(«+ 1)-мерного пространства Rn+l в естественном представлении.
Уравнения системы истолковываются как условия ортогональности
вектора Z с векторами
Лг = (аи ain,— fiY(t=U 2 ri).
Решение разыскивается следующим образом. Шаг за шагом
строятся базисы подпространств убывающих размерностей
где R —подпространство, состоящее из векторов, ортогональных
к векторам Av ..., Ак.
Каждый последующий базис
Vk + l Vn+i
строится из предыдущего
в виде двучленных линейных комбинаций
Vift) = vi*-1) —с^Ик* (/ = ft+l «+1). B)
Коэффициенты c(fc) определяются из условия ортогональности к век-
вектору Ак, что дает
с^ C)
Для осуществимости процесса нужно, чтобы все скалярные про-
произведения (Ак, Vkk~^\ были отличными от нуля.
В качестве базиса R(°) = Rn+1 берется естественный базис
= o.o о/ vS,°li = (o. о 1)'.
Из хода процесса ясно, что на всех шагах вектор V^+i будет иметь
(я-f- 1)-ю компоненту, равную единице. Единственный базисный век-
вектор V^lx подпространства R^ ортогонален ко всем векторам Аи . ..
. .., Ап и имеет последнюю компоненту, равную единице. Таким
образом, вектор V$J+i Дает численное решение системы A).
Метод Перселла по существу очень близок методам, связанным
с треугольной факторизацией и, в частности, если матрица системы
симметрична, с эскалаторным методом.
1) Перселл [1].
Таблица II. 16
Решение системы уравнений методом Перселла. Несимметричная матрица коэффициентов
I
II
III
уф)
1
0
0
0
0
1
vf
0
1
0
0
0
0.17
vf
0
0
1
0
0
—0.25
yf)
0
0
0
1
0
0.54
уФ)
0
0
о-
0
1
—0.3
к«
-0.17
1
0
0
0
0
0.9201
v(l)
vs
0.25
0
1
0
0
0
0.85589
VW
—0.54
0
0
1
0
0
-0.62363
vm
0.3
0
0
0
1
0
-0.39017
vf
0.39550
-0.85589
1
0
0
—0.000001
-0.000005
| 0.65693
vf
-0.64602
0.62363
0
1
0
—0.000003
0.000001
—0.68602
vf
0.23367
0.39017
0
0
1
—0.000001
—0.000005
—0.89681
vf
-0.37470
0.03647
0.68602
1
0
—0.000005
—0.000006
0.000002
1.05656
„C)
0.58836
—0.37740
0.89681
0
1
—0.0000005
—0.000008
0.0000004
—0.39357
VW=(X, 1)'
0.44089
-0.36304
1.16681
0.39357
1
Таблица II. 17
Решение системы уравнений методом Перселла. Симметричная матрица коэффициентов
I
II
iii
уФ)
1
0
0
0
0
1
vf
0
1
0
0
0
0.42
vf
0
0
1
0
0
0.54
vf
0
0
0
1
0
0.66
уФ)
0
0
0
0
1
-0.3
v$
—0.42
1
0
0
0
0
0.82360
у \Ч
3
—0.54
0
1
0
0
0
0.11316
,(D
-0.66
0
0
1
0
0
0.19767
5
0.3
0
0
0
1
0
—0.45410
v<2>
V3
—0.49247
-0.11316
1
0
0
0.000003
0.000003
0.69786
vf
—0.57698
—0.19767
0
1
0
—0.000011
—0.000002
-0.22185
vf
0.10928
0.45410
0
0
1
0.000002
-0.000002
—0.71029
vf
—0.68623
—0.22277
0.22185
1
0
0.000006
0.000005
—0.000011
0.49788
yg)
—0.24052
0.37372
0.71029
0
1
—0.000001
-0.000006
—0.0000004
—1.48240
vfUx,iV
-1.25779
0.04349
1.03916
1.48240
1
и
I
¦о
о
и
ы
со
1
198 ТОЧНЫЕ МЕТОДЫ РЕШЕНИЯ СИСТЕМ ЛИНЕЙНЫХ УРАВНЕНИЙ [ГЛ. ft
Действительно, если составить матрицу
zVi
г23
ггп
1
столбцы которой состоят из первых п компонент векторов V^,
V\ , .... Vn , то эта матрица будет очевидно правой треугольной,
а матрица AZ, в силу условий ортогональности будет левой тре-
треугольной матрицей. Если матрица А симметрична, то матрица Z
совпадает с соответствующей матрицей эскалаторного метода (§ 26, C)).
В табл. 11.16 и 11.17 приводится решение систем с несиммет-
несимметричной и симметричной матрицами, рассматривавшимися ранее
в табл. II.1 и 11.1а.
Схема состоит из трех частей. В первой части записываются по-
последовательно вычисляемые компоненты базисных векторов V\\ во
второй осуществляется контроль вычислений посредством проверки
выполнения условий ортогональности. В первой строке третьей части
записываются (Аи,
), во второй строке коэффициенты c
|ft).
§ 28. Метод пополнения для обращения матрицы
Метод пополнения для обращения матрицы основывается на сле-
следующей идее. Пусть В—неособенная матрица, обратная для которой
известна, и — некоторый столбец, v — некоторая строка, A =
Ясно., что
vv v2, ..., vn) ==
есть матрица ранга один.
Покажем, что матрица, обратная к А, находится по формуле
-^В'1 — - B'^uvB'1,
A)
-v
где -"(.== Л
Конечно, предполагается, что f ф 0.
Дуайр и Уо_]1].| !
§ 28] МЕТОД ПОПОЛНЕНИЯ ДЛЯ ОБРАЩЕНИЯ МАТРИЦЫ 199
Действительно,
(В -f uv) (в'1 — - В-^В-Л-= Е+ uvB'1 —-uvB-1 —
— — и (vB^u) vB'1 = Е -f MB'1 —
— — avB'1 — J-(t — l)uvB~i= E.
Тем самым справедливость формулы A) доказана. Установленная
связь показывает, что элементы матрицы А~г легко находятся, если
элементы матрицы В~ известны.
Полученную формулу можно, в частности, применять в случае,
если матрица А получается из матрицы В изменением одной строки,
т. е. если
где V матрица, все элементы которой равны нулю, кроме элементов
изменяемой строки. Пусть эта строка имеет номер k. Тогда
V = uv = ekv,
где v — ненулевая строка матрицы V и е^ столбец, &-й элемент
которого равен единице, а все остальные равны нулю. Следовательно,
л-1 = в-1 L-— (в-
где рь—k-й столбец матрицы В. Обозначив через aj у-й стол-
столбец матрицы А~х, получим
Метод пополнения для обращения матрицы заключается в следую-?
щем. Данная матрица А = (аф рассматривается как последний член
последовательности А0 = Е, Аи .... Ап — А, причем переход от
матрицы Лй_! к матрице Ак осуществляется посредством замены &-й
строки матрицы Ak_t на k-ю строку матрицы А. Таким образом,
матрица Л получается в результате л-кратного применения описан?
ного выше процесса. Выпишем формулы перехода на /г-м шагу.
Пусть aW — у-й столбец матрицы А^1. Тогда
Здесь vh — {au аы_и ...,аы).
200
ТОЧНЫЕ МЕТОДЫ РЕШЕНИЯ СИСТЕМ ЛИНЕЙНЫХ УРАВНЕНИЙ [ГЛ. II
В табл. 11.18 дано обращение матрицы табл. II. 1а методом по-
пополнения.
Каждый шаг процесса происходит по следующей схеме
pi
...
...
К II
...
...
?n
f
vk
Здесь
"Р/с
* I ГА
В последней части таблицы расположена матрица А.
Метод пополнения можно проводить по другой вычислительной
схеме, несколько более развернутойJ).
Обозначим ci'~^ — (vi- к'^').
В этих обозначениях
а{к) ~— я№-1) Ы. а'*)
з з \ _|_ (Pi~v>
Числа c\j связаны соотношением
D)
Действительно,
Обозначив далее через *Кй) — j-Ш столбец матрицы Ск = D?')'
иметь
Таким образом, матрица Сй получается из матрицы Ск_1 совершенно
так же, как матрица Аи1 из матрицы А~к~1\.
. Для перехода от матрицы Akti к матрице Л*1 (и от Ск_1 к Сй)
нужно кроме матрицы Auti энать лишь элементы &-й строки ма-
матрицы Ck_v На следующем шаге понадобятся соответственно эле-
элементы А+1-й строки матрицы Ск, для построения которой по фор-
формуле E) в свою очередь нужно знать элементы A-f-1-й строки
1) А. П. Ершов [1]. . . '
МЕТОД ПОПОЛНЕНИЯ ДЛЯ ОБРАЩЕНИЯ МАТРИЦЫ 20Г
Таблица II. 18
Обращение матрицы мэтодом пополнения
1
0.82360
0.69785
0.49788
1141
0
0
1о|
0
0
1
0
0
0
0.42
0.50996
1.21418
—0.50996
0
0
0.49247
0.70570
1.56172
—0.43010
—0.70570
0
0.68624
1.37832
2.50756
—0.12305
—1.01148
—1.37832
0
1
0
0
0.42
0.42
—0.42 II
1
0
о I
—0.17640
—0.21418
—0.50996
1.21418
0
0
0.11316
0.16216
—0.43010
1.23253
—0.16216
0
0.22277
0.44744
—0.12305
1.33231
—0.26142
—0.44744
0
0
1
0
0.54
0.54
—0.54
0
1
0
0.09320
0.11316
—0.49247
—0.11316
1
0
—0.30215
—0.43297
—0.70569
—0.16215
1.43297
0
—0.22185
—0.44559
—1.01147
—0.26141
1.53182
0.44559
0
0
0
1
0.66
0.66
—0.66
0
0
1
0.16280
0.19767
—0.57698
—0.19767
0
1
—0.15482
—0.22185
|| —0.68623
—0.22277
0.22185
II !
-0.50212
—1.00852
—1.37831
—0.44744
0.44559
2.00852
0
0.42
0.54
0.66
0.42
0
0.32
0.44
0.54
0.32
0
0.22
0.66
0.44
0.22
0
202
ТОЧНЫЕ МЕТОДЫ РЕШЕНИЯ СИСТЕМ ЛИНЕЙНЫХ УРАВНЕНИЙ [ГЛ. II
Таблица II. 19
Обращение матрицы при помощи „склеенной" схемы
1
0.82360
0.69785
! 0.49788
1
0.42
0.54
0.66
0
0
1
0
0.54
0.66
0.42
0.50996
1.21418
—0.50996
0
0.57698
0.49247
0.70570
1.56172
—0.43010
—0.70570
0
0.68624
1.37832
2.50756
—0.12305
-1.01148
—1.37832
метода
0
0
0.32
0.44
0.42
0.42
-0.42
0.09320
0.16280
—0.17640
—0.21418
—0.50996
1.21418
0
0.19767
0.11316
0.16216
—0.43010
1.23253
—0.16216
0
0.22278
0.44746
—0.12304
1.33221
—0.26143
—0.44746
пополнения
0
0.32
0
0.22
0.54
0.54
—0.54
0
—0.29160
—0.13640
0.09320
0.11316
-0.49247
—0.11316
1
-0.15482
—0.30215
—0.43297
—0.70569
—0.16215
1.43297
0
—0.22185
—0.44559
—1.01147
—0.26141
1.53182
0.44559
0
0.44
0.22
0
0.66
0.66
-0.66
0
—0.13640
• —0.43560
0.16280
0.19767
—0.57698
-0.19767
0
-0.46778
—0.15482
-0.22185
—0.68623
—0.22277
0.22185
1
—0.50213
—1.00854
—1.37832
—0.44746
0.44559
2.00854
1
1.18
1.08
1.32
1.62
-0.62
1
0.2052
0.2508
0.60661
—0.36523
0.39339
1
0.15205
0.21304
—0.26030
0.41751
0.78696
1
0.37165
—0.00527
0.50029
0.70450
0.62835
§ 28] МЕТОД ПОПОЛНЕНИЯ ДЛЯ ОБРАЩЕНИЯ МАТРИЦЫ 203
матрицы Ск_1 и т. д. Элементы же первых 'k—1 строк матри-
матрицы Ск_1 вообще не понадобятся в дальнейших вычислениях, и вычислять
их нет необходимости. С другой стороны, для матрицы A^tt доста-
достаточно вычислять элементы первых k—1 строк, так как последую-
последующие строки совпадают со строками единичной матрицы. Поэтому,
целесообразно ввести в рассмотрение „склеенные" из Ап-х
и Ск_1 матрицы S и 5Й_1, из которых первая 5&_х имеет первые
k—1 строки совпадающими с первыми k—1 строками матрицы
Ак-\ и последние п — Л-f-l строк из С]е_1, вторая — первые k строк
из Ahli, последние п — k строк из Ск_х; матрица Sic-i получается
из Sk_1 заменой /г-й строки на k-ю строку единичной матрицы.
Очевидно, что элементами k-Vi строки матрицы Sk_1 будут
числа с%~г).
В силу формул D) и E) матрица Sk получается из матрицы Su-i
по формулам
j 3 11 (ft —1) к ' * '
1 "Г ckk
Здесь c( ) обозначает у-й столбец матрицы Sk, Oj обозначает у'-й
столбец матрицы S/c-i. За исходную матрицу So нужно взять, оче-
очевидно, 50 = Л — Е. Матрица Sn —Sn равна Л.
В табл. 11.19 дано обращение матрицы по этому варианту мето-
методом пополнения. Поясним заполнение таблицы 11.19. В строках 1—4,
7—10, 13—16, 19—22 последовательно записываются матрицы 50,
§!, 52 и 5з. Строки, совпадающие со строками единичной матрицы,
целесообразно вписать в схему заранее. В строках 5, 11, 17 и 23
записываются /fe-е строки матриц Sk_x, в строках 6,12, 18 и 24 со-
соответствующие множители 3(fc-i) • ® тех же стР0Ках> слева от
1 "Г скк
схемы, записываются знаменатели l+cife"^. Наконец, в строках
25—28 записывается матрица 5П = Л-1.
Для контроля к каждой матрице Sk пристраивается столбец
0»+ь составленный из строчных сумм. Суммируются также элементы
строк, составленных из множителей к\к-и • Контрольные столбцы
(за исключением одного элемента, всегда равного единице) связаны
соотношением
0 п+1 = an+i' —с
ГЛАВА III
ИТЕРАЦИОННЫЕ МЕТОДЫ РЕШЕНИЯ СИСТЕМ
ЛИНЕЙНЫХ УРАВНЕНИЙ
Перейдем теперь к описанию итерационных методов решения си-
систем линейных уравнений. Эти методы дают решение системы в виде
предела последовательности некоторых векторов, построение кото-
которых осуществляется посредством единообразного процесса, называе-
называемого процессом итераций.
В современной литературе описано большое количество итераци-
итерационных методов, основанных на различных принципах. Как правило,
вычислительные схемы этих методов просты и удобны при исполь-
использовании вычислительной техники. Однако каждый итерационный
процесс имеет свою ограниченную область применимости, так как,
во-первых, процесс итераций может оказаться расходящимся для
данной системы и, во-вторых, сходимость процесса может быть на-
настолько медленной, что практически оказывается невозможным до-
достигнуть удовлетворительной близости к решению.
Отметим, что хотя задача обращения матрицы эквивалентна ре-
решению п частных систем с одной и той же матрицей, итерационные
методы редко употребляются для этой цели.
Настоящая глава посвящена описанию общих принципов построе-
построения итерационных процессов, детальному рассмотрению простейшего
итерационного процесса — метода последовательных приближений
в его различных модификациях и координатным релаксационным ме-
методам.
§ 29. Принципы построения итерационных процессов
Основные итерационные процессы для решения линейных систем
могут быть описаны посредством следующей общей схемы.
Пусть дана система линейных уравнений
АХ=Р A)
с неособенной матрицей А. Строится последовательность векторов
.АГA), ХB) ЛГ(Й), ... по рекуррентным формулам
), B)
§ 29] ПРИНЦИПЫ ПОСТРОЕНИЯ ИТЕРАЦИОННЫХ ПРОЦЕССОВ 205
где /г\ Н^\ ...—некоторая последовательность матриц, Х^ —
начальное приближение, вообще говоря, произвольное. Различный
выбор последовательности матриц W ' приводит к различным итера-
итерационным процессам.
Итерационные процессы, протекающие по формуле B), обладают
тем свойством, что для каждого из них точное решение X* является
неподвижной точкой. Это значит, что если за начальное приближе-
приближение -Y(o) взято А'*, то все последующие приближения будут также
равны X*.
Обратно, всякий итерационный процесс, для которого X* является
неподвижной точкой, протекающий по формулам
где С(/?) последовательность матриц, Z(v) последовательность векто-
векторов, может быть представлен в виде B). Действительно, для X*
имеем
X* = СтХ* + Zm,
откуда
> _ х*) = Xl*-D + (С(Ю _ Е) (^ (ft-D
при
Нетрудно дать необходимые и достаточные условия для того,
чтобы итерационный процесс B) сходился к решению при любом
начальном векторе.
Действительно,
X* — Х{к) = X* — Х^ — Н(к) (АХ* — АХ(П-1)) =
Отсюда
х*-х{к) = (е-н^а){е-hV-va) ...(е-н^а){х*-л-@)).
Для того, чтобы X* — Л^-уО при любом начальном векторе
необходимо и достаточно (см. § 13, п. 1), чтобы матрица
Г(й) = (E-HWA) {E-H^a) .. . [Е-Н^А)
стремилась к нулю, для чего, в свою очередь, достаточно, чтобы
любая норма матрицы Г(Л) стремилась к нулю. Конечно, выведенное
условие дает лишь общую точку зрения для построения условий
сходимости конкретных итерационных процессов.
206 ИТЕРАЦИОННЫЕ МЕТОДЫ РЕШЕНИЯ ЛИНЕЙНЫХ СИСТЕМ (гл- П1
Простейшими среди итерационных процессов являются стацио-
стационарные итерационные процессы, в которых матрицы Я( не зави-
зависят от номера шага k. В частности, при HW = E получается клас-
классический процесс последовательных приближений.
Любой стационарный процесс с Н Ф Е можно рассматривать как
процесс последовательных приближений, примененный к равносиль-
равносильной системе
HAX=HF,
так сказать „подготовленной" к применению метода последовательных
приближений. Конечно, осуществлять такую подготовку на самом
деле обычно нет необходимости, и такого рода рассмотрение ста-
стационарных процессов лишь дает удобное средство для их теорети-
теоретического исследования.
Близкими к стационарным итерационным процессам являются ц и к-
лические, в которых матрицы Нт периодически повторяются через
некоторое число р шагов. Ясно, что из каждого циклического про-
процесса можно получить равносильный ему стационарный, принимая
за один шаг стационарного процесса результат применения полного
цикла из р шагов исходного циклического процесса.
Нестационарные итерационные процессы, в свою очередь, можно
подразделить на два типа. Это, во-первых, нестационарные итера-
итерационные процессы в буквальном смысле, когда изменение матрицы #(ft)
осуществляется на каждом шагу. Во-вторых, сюда можно включить
стационарные процессы с ускорением сходимости посредством за-
замены, время от времени, стационарной матрицы Н, определяющей
лроцесс, на некоторые, специальным образом подобранные, мат-
матрицы Н(к).
Выбор матрицы Н для стационарного процесса и матриц Я(Я) для
нестационарного может осуществляться многими различными способами
на основании различных принципов.
Возможно построение матриц Н^ так, чтобы итерационный про-
процесс сходился к решению для возможно более широкого класса си-
систем уравнений. Возможна противоположная точка зрения, в силу
которой при построении матриц Я(й) максимально используются част-
частные особенности данной системы для получения итерационного про-
процесса, обладающего быстрейшей сходимостью. Естественно, что Для
применения итерационного процесса, построенного исходя из послед-
последнего принципа, нужно располагать возможно большей информацией
о матрице коэффициентов системы, в частности о расположении ее
собственных значений.
Важным принципом построения итерационных процессов является
принцип релаксации. Под этим понимается принцип выбора мат-
матриц /г из некоторого заранее очерченного класса матриц так, чтобы
§ 30] МЕТОЛ ПОСЛЕДОВАТЕЛЬНЫХ ПРИБЛИЖЕНИЙ 207
на каждом шагу процесса уменьшалась какая-либо величина, харак-
характеризующая точность решения системы.
Среди релаксационных методов наиболее разработаны коорди-
координатные, в которых матрицы Н(к) подобраны так, что на каждом
шагу меняются одна или несколько компонент последовательных при-
приближений, и градиентные, в которых матрицы // являются
скалярными.
О точности приближенного решения X системы АХ~ F есте-
естественно судить по величине (в том или другом смысле) вектора
ошибки Y — X* — X. Однако вектор ошибки не может быть вы-
вычислен без знания точного решения системы и может лишь оцени-
оцениваться. Вектором, характеризующим точность приближенного реше-
решения X системы AX — F, может служить также вектор невязки
(невязка) r = F— АХ. Ясно, что r = AY. Таким образом, релакса-
релаксация может быть построена на уменьшении любой нормы каждого
из этих векторов.
При положительно-определенных матрицах А удобной мерой точ-
точности является так называемая функция ошибки
f(X) = (AY, Y) = (Y, r) = (A-1r. r).
В силу положительной определенности А всегда f(X)^-Q, причем
f(X) = 0 только при Х=Х*. Ясно, что
f(X) = (X*—X, F — AX) = (Х\ F) — (X, F) — (X*. АХ) + (X, АХ) =
= (АХ. Х) — 2(Х, F)-\-(X*. F).
Функция ошибки не может быть вычислена, если не известно точное
решение. Однако ее значения лишь постоянным слагаемым отличаются
от значений функционала
fo(X) = (AX, Х) — 2{Х, F),
которые могут быть вычислены без знания X*. Поэтому мы можем
судить об убывании функции ошибки сравнивая соответствующие
значения функционала /0(Х).
Другим важным принципом построения итерационных процессов
является принцип последовательного „подавления компонент"
вектора ошибки в разложении его по собственным векторам матрицы
коэффициентов системы.
Релаксационным градиентным методам будет посвящена глава VII.
В главе IX будут рассмотрены методы, основанные на идее подав-
подавления компонент.
§ 30. Метод последовательных приближений
Наиболее простым итерационным процессом является процесс
последовательных приближений. •
Под процессом последовательных приближений
понимается следующий итерационный процесс, Система уравнений
208 ИТЕРАЦИОННЫЕ МЕТОДЫ РЕШЕНИЯ ЛИНЕЙНЫХ СИСТЕМ [ГЛ. III
АХ = F записывается в виде
Х=ВХ+О. A)
где В = Е—A, G = F и последовательные приближения вычисляются
по формуле
w ik1> B)
начиная с некоторого исходного приближения Х^°\ которое может
выбираться, вообще говоря, произвольно. Очевидно, что процесс
последовательных приближений является частным случаем общего
итерационного процесса B) § 29; именно это будет стационарный
процесс, в котором Н — Е. Действительно,
О = Х{к7х) + (F —
Легко дать формулу для выражения Х^ непосредственно через
начальное приближение -Y . Именно
Х(к) = В1сХ@)+(Е+В+ ... +Bft-1)O. C)
Действительно, при й=1 это верно, а при остальных k формула
легко проверяется методом математической индукции.
Отметим, что если процесс последовательных приближений сходится,
то он сходится к решению системы. Действительно, если Х(к) -> X*,
то предельный переход в равенстве
дает X* = ВХ*-\- О, т. е. X* удовлетворяет данной системе.
Теорема 30.1. Для сходимости процесса последовательных
приближений при любом начальном векторе Х{0) необходимо и
достаточно, чтобы все собственные значения матрицы В были бы
по модулю меньше единицы.
Доказательство. Пусть Х^и)-+Х*. Тогда, как мы видели, X*
есть решение системы и, следовательно, X* — Х^=В(Х* — Х(к~1))=
= ... =Вк (Х* — Х{0)), откуда Вь (Х*—Х(о)) -* 0. Так как это должно
иметь место при любом векторе X , необходимо, чтобы В —> 0,
для чего, в свою очередь, необходимо, чтобы все собственные зна-
значения матрицы В были меньше единицы по модулю [теорема 13.2].
Достаточность условия непосредственно вытекает из формулы C),
ибо Вк-+0 и Е + В+ ... +-Вк-У-+(Е — В)-1 = А~\ если все
собственные значения матрицы В меньше единицы по модулю.
Так как условие теоремы 30.1 трудно проверяется, судить о
сходимости процесса последовательных приближений лучше при
помощи достаточных признаков, связанных непосредственно с эле-
элементами матрицы В, Некоторые достаточные признаки вытекают
из теоремы 30.2.
§30]
МЕТОД ПОСЛЕДОВАТЕЛЬНЫХ ПРИБЛИЖЕНИЙ
209
Теорема 30.2. Для того чтобы процесс последовательных
приближений сходился, достаточно, чтобы какая-либо норма
матрицы В была меньше единицы.
Доказательство. Действительно, если ||В|]<С1. то все собствен-
собственные значения матрицы В меньше единицы и потому на основании
теоремы ЗОЛ процесс последовательных приближений сходится.
Дадим теперь оценки быстроты сходимости процесса последова-
последовательных приближений в терминах нормы. При этом выбор нормы
векторов совершенно безразличен, но норма матриц должна быть
согласована с выбранной нормой векторов.
Теорема 30.3. Если \\B\\ < 1, то
м /1'\ 11 - 7» 11 I f\\ I II If I! [I ii II
V* V\ ) \\ ^ \\ t>\\ к \\ Vv^ix I ЦНИИ / Л\
\\Л Л I -^5- II #11 II Л I I 1 ЦВМ • Kq)
1 II ° II
Доказательство. Имеем
\\X* — Xik)\\ =\\(E — B)~1G~ (f + fi-f ... +Bft)G — Blc
Часто бывает важно сравнить точность двух последовательных
приближений, т. е. сравнить величины \Х* — Х(Н)\ и \Х* — Xй1|.
Такое сравнение можно проводить на основании следующей теоремы.
Теорема 30.4. \Х31 — Х(Ь)\^\\В\\\Х"~Х{к-1)\.
Доказательство. Действительно, из равенств
X* = ВХ* -f- О, Х[к) = ВХA! ~1
О
следует, что
Отсюда
Введенные нами в § 13 векторные нормы (кубическая, октоэдри-
ческая и сферическая) и согласованные с ними нормы матриц дают
следующие легко проверяемые достаточные признаки сходимости про-
процесса последовательных приближений и оценки быстроты его схо-
сходимости.
I. Если 2 \b%j | <^ V- < 1 при /= 1, 2,
довательных приближений сходится, причем
max |
п, то процесс после-
F)
где
= (Xi xj и #*> =
\A Яяк. 974_ Л К Фяппррп u R Н (Ьяппррйя
210
ИТЕРАЦИОННЫЕ МЕТОДЫ РЕШЕНИЯ ЛИНЕЙНЫХ СИСТЕМ
[ГЛ. III
II. Если Д] |?
Д
1 при 7=1, 2 л, то процесс после-
последовательных приближений сходится, причем
G)
III. Если ^j
г, & = 1
жений сходится и
р < 1, то процесс последовательных прибли-
(8)
Укажем еще на один путь построения достаточных признаков
сходимости процесса последовательных приближений.
В уравнении
X=BX-\-G A)
с матрицей
^22
и2П
введем новые неизвестные x^=
ные числа.
Тогда система A) превратится в систему
где /^ некоторые положитель-
положительjL
или
п
= 7, Ь:л • — Zj-\ Р--.
О)
Очевидно, что компоненты последовательных приближений Х*® для
системы A) и Z' для системы (9) тоже связаны соотношениями
j4&) = piz(i\ если только эти соотношения имеют место для исход-
исходных приближений ^@) и Z . Поэтому процессы последовательных
приближений для систем A) и (9) сходятся или расходятся одно-
одновременно, и, следовательно, всякое достаточное условие сходимости
процесса последовательных приближений ^"для системы (9) является
вместе с тем достаточным условием сходимости для системы A).
§ 30] МЕТОД ПОСЛЕДОВАТЕЛЬНЫХ ПРИБЛИЖЕНИЙ 211
Таким образом, если можно указать такие положительные числа
рх рп, что выполняется одно из условий
и
1) ^\bij\-~<1 ПРИ t=l я
2) 5>у|'^<1 "Ри j=X п A0)
Pi
3)S
<.J-i P?
l.
то процесс последовательных приближений для системы (I) сходится.
Замечание. При практическом вычислении итераций мы можем
поступать двумя способами.
1) Положим X@) = G. Тогда
Для вычисления A^ft) мы вычисляем последовательно векторы G,
BG BkG и находим их сумму. Это удобно вследствие еди-
единообразия процесса вычисления, а также потому, что каждое после-
последующее слагаемое является лишь поправкой к сумме предыдущих.
Недостатком этого способа является возможное накопление ощибок
от округления с возрастанием числа слагаемых.
2) Вычисление ведется непосредственно по формулам
Здесь каждое приближение является как бы исходным и поэтому
нет необходимости на первых шагах процесса проводить вычисления
с большой точностью; возникающие ошибки впоследствии сглаживаются.
В качестве примера найдем решение системы
0.78*! — 0.02х2 — 0.12х3 — 0.14х4 = 0.76
— 0.02*! + 0.86х2 — 0.04х3 + 0.06х4 =. 0.08
— 0.12^ — 0.04*2 + 0.72*3 —0.08*4= 1.12 (Ц)
— 0.14*!+0.06*2 —0.08*3 + 0.74*4 = 0.68.
Решая эту систему по схеме единственного деления, находим
*!= 1.534965
*2 = 0.122010
*3= 1.975156
*4= 1.412955.
14»
212 ИТЕРАЦИОННЫЕ МЕТОДЫ РЕШЕНИЯ ЛИНЕЙНЫХ СИСТЕМ [ГЛ. III
Для применения процесса последовательных приближений приве-
приведем систему к виду Х= BX-\-G, положив В = Е — А. Получим
х = 0.22xt + 0.02х2 + 0.12х3 + 0.14х
.76
х2 = 0.02хх 4- 0.14х24- 0.04х3— 0.06х44 0.08
A2)
х4 = 0.14*! — 0.06х2 4; 0.08х3 + 0.26х4 4" 0.68.
Нетрудно видеть, что достаточные условия сходимости процесса
последовательных приближений выполнены.
Таблица III. 1
к
Схема вычислений по формуле Х^ = 2 s*°
G
BG
0.76
0.3984
0.195264
0.09421056
0.04527913
0.02174095
0.01043649
0.00500961
0.00240463
0.00115422
0.00055403
0.00026593
0.00012765
0.00006127
0.00002941
1) BlG, 1 =
0.08
0.0304
0.008640
0.00223488
0.00055572
0.00013570
0.00003285
0.00000792
0.00000190
0.00000046
0.00000011
0.00000003
0.00000001
= 0, ..., 14.
1.12
0.4624
0.207936
0.09692928
0.04589292
0.02188361
0.01047017
0.00501763
0.00240654
0.00115468
0.00055414
0.00026596
0.00012765
0.00006127
0.00002941
0.68
0.3680
0.186624
0.09197568
0.04472340
0.02160525
0.01040364
0.00500170
0.00240272
0.00115376
0.00055392
0.00026591
0.00012764
0.00006127
0.00002941
2.64
1.2592
0.598464
0.28535040
0.13645117
0.06536551
0.03134316
0.01503686
0.00721580
0.00346312
0.00166219
0.00079783
0.00038295
0.00018381
0.00008823
2) XSU) =
Для к = 12> 13, 14.
1.53484720
1.53490847
1.53493788
0.12200958
0.12200958
0.12200958
1.97503858
1.97509985
1.97512926
1.41283762
1.41289889
1.41292830
§30]
МЕТОД ПОСЛЕДОВАТЕЛЬНЫХ ПРИБЛИЖЕНИЙ
213
Для сравнения хода итерационного процесса в разных вариантах
проведем его тремя способами. Именно:
1) Вычисление последовательных приближений производим по
ь
формуле X^> = 2jBG (см. табл. III. 1).
г=о
2) Вычисление последовательных приближений производим по
формуле X{k) = BX{k~n-i-G при Х{0) = О (см. табл. III. 2).
3) Снова вычисляем Хт = ВХ(к~1] + G при -Y@) = (l, 0, 0, 0)'
(см. табл. Ш. 3).
Поясним табл. III. 1. Первая часть таблицы содержит компоненты
последовательно вычисляемых векторов В G. Последний столбец
п
является контрольным. В нем записываются числа 2cjx(/'! гДе сj —
п
я= 2 Ьц (числа Cj должны быть вычислены заранее и приписаны
Таблица III. 2
Вычисление приближений по формуле
А'@)
X®
Х(Щ
X®
х&
х*>
л®
X®
Xiio>
Х(п)
хм
0.76
1.1584
1.3537
1.4479
1.4932
1.5149
1.5253
1.5303
1.53273
1.53389
1.53445
1.53472
1.53485
1.534910
1.5349385
0.08
0.1104
0.1190
0.1213
0.1218
0.1220
0.1220
0.1220
0.12201
0.12201
0.12201
0.12201
0.12201
0.122010
0.1220096
1.12
1.5824
1.7903
1,8873
1.9332
1.9551
1.9655
1.9705
1.97292
1.97408
1.97464
1.97491
1.97504
1.975101
1.9751299
0.68
1.0480
1.2346
1.3266
1.3713
1.3929
1.4033
1.4083
1.41072
1.41188
1.41244
1.41271
1.41284
1.412900
1.4129289
2.64
3.8992
4.4977
4.7830
4.9195
4.9849
5.0162
5.0312
5.03838
5.04187
5.04354
5.04434
5.04473
5.044920
5.0450069
214
ИТЕРАЦИОННЫЕ МЕТОДЫ РЕШЕНИЯ ЛИНЕЙНЫХ СИСТЕМ [ГЛ. III
в качестве дополнительной строки матрицы В). Но очевидно, что
п п
^i cjjcW = 2-^^+1'. так чт0 элементы контрольного столбца равны
j = i } j=i 3
суммам остальных элементов, лежащих в той же строке. Вторая
часть таблицы дает приближенное" решение системы, которое мы
получаем, суммируя соответствующие компоненты вычисленных век-
векторов.
Из сравнения табл. III. 1, III. 2 и III. 3 с результатом, получен-
полученным по схеме единственного деления, мы видим, что сходимость
процесса во всех трех вариантах приблизительно одинаковая;
14-е приближение дает в данном примере результат, верный с точ-
точностью до единицы четвертого знака.
Таблица III. 3
Вычисление приближений по формуле
= (l, 0, 0, 0)'
хт
Л<14>
1
0.98
1.2412
1.534769
1.534871
1.534920
0
0.10
0.1140
0.122010
0.122010
0.122010
0
1.24
1.6544
1.974961
1.975063
1.975111
0
0.82
1.1236
1.412761
1.412862
1.412910
1
3.14
4.1332
5.04451
5.044805
5.044951
Сходимость процесса последовательных приближений можно
сильно улучшить, применяя различные приемы ускорения. Процесс
последовательных приближений с применением приемов ускорения
сходимости в большинстве случаев укладывается в общую схему
итерационных процессов с нарушением стационарности. Целесообраз-
Целесообразный выбор приемов ускорения требует предварительной информации
о расположении собственных значений матрицы. Мы вернемся к этому
вопросу в гл. IX.
§ 31. Подготовка системы линейных уравнений к вицу,
удобному для применения метода последовательных
приближений. Метод простой итерации
Условия сходимости метода последовательных приближений тре-
требуют, чтобы матрица коэффициентов системы ЛА"— F была, в том
или ином смысле, близка к единичной матрице. Если это условие
не выполнено или „плохо выполнено", систему целесообразно пред-.
§31]
ПОДГОТОВКА СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ
215
варительно подгбтовить к применению метода последовательных при-
приближений. Подготовка состоит в переходе от данной системы AX=F
к равносильной системе
HAX=HF,
где Н некоторая неособенная матрица, которая выбирается так,
чтобы матрица НА была бы близка к единичной, т. е. матрица Н
была бы близка к А~ .
Применение метода последовательных приближений к подгото-
подготовленной системе, как было указано, равносильно применению стацио-
стационарного итерационного процесса
к исходной системе.
Выбор матрицы Н может быть осуществлен с использованием
частных особенностей данной системы. Рассмотрим некоторые наибо-
наиболее употребительные способы подготовки, использующие лишь до-
довольно поверхностные сведения о матрице коэффициентов.
Пусть матрица А положительно определена. Тогда система AX=F
всегда может быть подготовлена к виду, в котором метод последова-
последовательных приближений будет сходящимся. Действительно, вычислив,
например, первую норму [х матрицы А, мы получим, что все соб-
собственные значения матрицы А заключены в открытом интервале (О, [J-).
Положим
о
A)
Н=— Е.
Система AX—F преобразуется к виду
B)
2
Собственные значения матрицы В = Е А будут заключены
в открытом интервале (—1, 1) и, следовательно, метод последова-
последовательных приближений будет сходящимся.
В качестве примера возьмем систему (9) § 23. Здесь fj. = 2.62.
Выполнив вычисления, получим
D
" 0.23664122 —0.32061069
—0.32061069 0.23664122
—0.41221374 —0.24427481
—0.50381679
—0.41221374
—0.24427481
0.50381679"
—0.33587786
0.23664122 —0.16793893
0.33587786 —0.16793893
0.22900763'
0.38167939
0.53435115'
0.68702290_
0.23664122
C)
216
ИТЕРАЦИОННЫЕ МЕТОДЫ РЕШЕНИЯ ЛИНЕЙНЫХ СИСТЕМ
[ГЛ. III
В § 23 было найдено, что решение системы Х—(—1.2577938,
0.0434873, 1.0391663, 1.4823929)'.
В табл. III. 4 приведем несколько последовательных приближений,
положив X — G.
Таблица III. 4
Вычисление приближений по формуле Х- ' —
JfB5)
Х(Щ
Х(Щ
#щ
0.22900763
—0.4055708
-1.2354227
-1.2505812
—1.2574335
—1.2577475
—1.2577935
0.38167939
0.0372939
0.0473327
0.0442080
0.0435403
0.0434939
0.0434874
0.53435115
0.3577880
1.0287985
1.0348124
1.0389819
1.0391421
1.0391661
0.68702290
0.5162869
1.4668834
1.4760729
1.4821204
¦ 1.4823572
1.4823926
1.83206107
0.5057980
1.3075919
1.3045121
1.3072091
1.3072456
1.3072526
Из приведенных результатов видно, что метод последовательных
приближений в данном случае сходится довольно медленно.
В прикладных вопросах часто встречаются системы, в которых
диагональные элементы матрицы А значительно преобладают над
остальными элементами матрицы. В этом случае подготовка системы
осуществляется так.
Перепишем систему AX—F в развернутом виде
fl12X2
аггхг
а\пХп /l
агпхп = /г
D)
amxi
Поделим каждое уравнение системы D) на диагональный элемент.
Мы получим систему
al2
Л
|—
Й2И х _
а22
«22
§ 31] ПОДГОТОВКА СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ
или в матричной записи
Х=ВХ-{-0,
217
E)
где
О —^
ап
ап
«21
Я
^L О
«гаЧ
апп
ап
А.
«22
fn
F)
Для применения процесса итерации нет необходимости на самом
деле делать преобразование системы D) в систему E). Последова-
Последовательные приближения можно вычислять по формулам:
= f а
G)
=/ —а
J n ra
п, п-1 п-1 •
Описанная модификация процесса последовательных приближений
имеет название метода простой итерации или метода Якоби.
Упомянутое преобразование системы D) в систему E), очевидно,
равносильно умножению системы D) слева на матрицу
1
«11
0
1
Й22
0
1
«mn _
Таким образом, Н =D \ где D—диагональная матрица [аи о.пп\.
Отсюда следует, что необходимое и достаточное условие схо-
сходимости процесса простой итерации состоит в том, что все
собственные значения матрицы В = Е — D~ А по модулю меньше
единицы.
Это условие можно представить в другой форме. Именно, ¦
В — tE\ = \E — D~lA — /?| =
= \D-1\\D
111 Д —
218
ИТЕРАЦИОННЫЕ МЕТОДЫ РЕШЕНИЯ ЛИНЕЙНЫХ СИСТЕМ [ГЛ. lit
Таким образом, для сходимости процесса простой итерации необхо-
необходимо и достаточно, чтобы все корни уравнения
\А — D-\-tD\ =
aut
a2l
Hn
а2п
= 0
(8)
по модулю были бы меньше единицы.
В случае, если матрица А коэффициентов системы симметричная
(или эрмитова) с положительными диагональными элементами, необ-
необходимому и достаточному условию сходимости метода простой итера-
итерации можно придать следующую легко проверяемую форму (Ю. М. Гав-
рилов [2]).
Для того чтобы метод простой итерации для системы
АЖ—F с симметричной матрицей А, имеющей положительные
диагональные элементы* сходился, необходимо и достаточно,
чтобы матрицы А и А = 2D — А (отличающиеся друг от друга
знаками недиагональных элементов) были бы положительно'
определенными.
Действительно, в этом случае, в силу положительной опреде-
определенности матрицы D, все собственные значения матрицы D~lA веще-
вещественны (теорема 11.14). Поэтому для сходимости процесса необхо-
необходимо и достаточно, чтобы собственные значения матрицы D~lA =
= ? — \Е — D~1A) заключались в интервале @,2), т. е. чтобы соб-
собственные значения матриц D~XA и 2Е—D~XA были положительны.
Но в силу теоремы 11.16 это равносильно положительной опреде-
определенности матриц А и ID — А.
Введенные в § 30 достаточные условия сходимости процесса по-
последовательных приближений, будучи применены к системе E), дают
следующие достаточные условия сходимости метода простой итерации:
Ik
II.
аи
ац
(/=1, 2 л)
(У=1. 2 я)
(9)
III
¦ ,!®!<i-
Здесь знак штрих у суммы показывает, что при суммировании опу-
опускаются значения i = J.
§зц
ПОДГОТОВКА СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ
219
Если воспользоваться обобщенными признаками A0) § 30, поло-
положив рц = -——г , то мы получим еще следующие достаточные при-
признаки сходимости простой итерации:
¦•2'
II.
i = l
аЦ
<1
(/=!. 2 п)
G=1, 2 п)
(Ю)
Допустим теперь, что задана система
в которой преобладание главной диагонали не имеет места.
Подбор вспомогательной матрицы Н может быть осуществлен,
например, грубым обращением матрицы А по методу Гаусса.
Часто оказывается целесообразным в качестве матрицы Н взять
матрицу, обратную к матрице
гп а12 0
«43 «44
о ¦ .
Обращение такой матрицы не представляет труда, ибо сводится
к обращению матриц второго порядка. Именно,
о
an
о
где Дх определитель
«21 Й22
В случае, если матрица А симметричная и А = R-\- S, где R поло?
жительнр-определенная матрица, обратная для которой известна,
220 ИТЕРАЦИОННЫЕ МЕТОДЫ РЕШЕНИЯ ЛИНЕЙНЫХ СИСТЕМ [ГЛ. Ill
процесс последовательных приближений, примененный к системе,
подготовленной к виду
Х= — R^l
имеет следующий простой критерий сходимости. Для сходимости
процесса необходимо и достаточно, чтобы матрицы R-\-S
и R — 5 были положительно-определенными.
Действительно, собственные значения матрицы R~ S вещественны,
так как R положительно определена (теорема 11.14). Для сходи-
сходимости процесса необходимо и достаточно, чтобы собственные зна-
значения матрицы R~XS были по модулю меньше единицы, т. е. заклю-
заключены в интервале (—1, 1). Для этого же, в свою очередь, необходимо
и достаточно, чтобы все собственные значения матриц Е -\- R~ S
и Е— /?-1S были' бы положительны. Это имеет место в том и только
в том случае (теорема 11.16), если матрицы R(E-^-R-1S) = R-\-S
и R(E—R~1S) — R — S положительно-определенны.
§ 32. Одношаговый циклический процесс
Пусть система линейных уравнений AX=F представлена в виде
X=BX-\-G, A)
где В = Е — A, G = F. Обозначим компоненты искомого вектора
решения через х1 хп. Одношаговый циклический
процесс (часто называемый также методом Зейделя) напоминает
процесс последовательных приближений с той разницей, что при
вычислении й-го приближения для i-Ш компоненты учитываются вычи-
вычисленные уже ранее й-е приближения для компонент х^\ .. ., х(к}1.
Именно, вычисление последовательных приближений ведется по
формулам
- 2>у4й)+2. М/-1}+ёг B)
(вместо x(ft) = 2*ifx(-&~1)-f"o'i B методе последовательных прибли-
* 3 = 1 °
жений).
Одношаговый циклический процесс может быть истолкован двумя
способами как разновидность общего итерационного процесса. •
Именно, за один шаг процесса можно принять переход от вектора
(*№) xf}v xf-V *№)' к вектору (xf) xf>,
xW~{\ ..., х^-Щ' (или от вектора (л;(&\ ..., х^Л', к вектору
(x№+i)t x(Jc)t . #i( xWYY или же за один шаг можно считать резуль-
результат применения полного цикла, т. е. переход от вектора
§32]
ОДНОШАГОВЫЙ ЦИКЛИЧЕСКИЙ ПРОЦЕСС
221
..., х^'^у к вектору (х№\ .. ., хЩ'. В первом истолковании ме-
метод не будет стационарным, но будет циклическим. Именно, как легко
видеть, в этом случае в качестве матриц, определяющих процесс,
берутся, поочереди, матрицы еп, е22 епп, где
(О
О ... О ... О
О ... 1 ... О
о ... о ... о
(О-
C)
Точнее, Hn(k-i)+i = еи.
Во втором истолковании процесс будет стационарным. Иссле-
Исследуем его подробнее.
Уравнение
X
представим
где
1Л =
~~ 0
bn
_ ьп1
В этих
в виде
0 .
0 .
Ьпг ¦
Х=(М
_1_ ЛЛ У Л-
.. 0 0 ~
.. 0 0
, N =
обозначениях формулы
i-l
п
\г ¦¦¦ Ъы
О 0 ... К
D)
.E)
можно представить в матричной форме в виде
Отсюда следует, что
F)
Таким образом, один полный цикл одношагового циклического
процесса для системы D) оказывается равносильным одному шагу
процесса последовательных приближений, примененного к системе
Х= (Е — М)'1 NX+ (Е — My1 G,
которая равносильна исходной системе
X=(M-{-N.)X-\-G
и может быть получена из нее умножением слева на неособенную
матрицу (Е — My1.
222
ИТЕРАЦИОННЫЕ МЕТОДЫ РЕШЕНИЯ ЛИНЕЙНЫХ СИСТЕМ
[ГЛ. III
Из такого представления процесса следует, что для его сходи-
сходимости необходимо и достаточно, чтобы все собственные значения
матрицы S = (E— M)~lN были по модулю меньше единицы. Эти
собственные значения являются корнями полинома \S — tE\. Умно-
жив обе части этого уравнения на \Е — М\ и воспользовавшись
теоремой о произведении определителей двух матриц, мы преобра-
преобразуем уравнение к виду
\N — (Е — Af)*| = O
или, в развернутой форме, к виду
! —' *12
^22
J\n
bnt
* . .
,'t
Ьпп —
= 0.
G)
Таким образом, для сходимости одношагового циклического про-
процесса необходимо и достаточно, чтобы все корни уравнения G)
были бы по модулю меньше единицы.
Обратимся теперь к рассмотрению одного достаточного условия
сходимости одношагового циклического процесса.
Именно, пусть
2
Как мы видели, в этом случае для метода последовательных
приближений имеет место оценка
|| X* —
|| X*
(8)
где в качестве нормы векторов взята кубическая норма, т. е. тах|х4|.
Покажем, что при этом условии одношаговый циклический про-
процесс сходится, и для него имеет место несколько лучшая оценка.
Действительно, если X* = (xlt . . .„ хп)', то
3 — *
= 1 я).
(9)
Вычитая из (9) равенства B), получим
i-l
Uj\\*j — -
A0)
§ 32] ОДНОШАГОВЫЙ ЦИКЛИЧЕСКИЙ ПРОЦЕСС 223
Обозначим
Тогда из неравенства A0) следует, что
Взяв для I то значение ?0, при котором I xt— xf> I достигает мак-
максимума, получим
И** — *<*)||<._\-||х* — Х?-% A1)
ибо
\\Х* — ХЫ\\ =тах|х4 — xf)\ = \xt — xf\.
Обозначим
Тогда
||Х* — *<*)|| О' \\Х* — Х1*-Ъ\\. A2)
Установим, что
Действительно,
Отсюда
[а > max (fo + Tl) > max y-^ = ц'.
Здесь знак равенства возможен, только если max2l^tj| дости-
* ^=i
гается при /= 1 (или если ^ = 0), и понижение оценки по сравне-
сравнению с оценкой (8) будет наилучшим, если расположить уравнения
п
в порядке возрастания 21 hj l> принимая за первое то уравнение,
в котором эта сумма наименьшая.
Однако одношаговый циклический процесс не всегда оказы-
оказывается более выгодным, чем метод последовательных приближений.
Иногда одношаговый циклический процесс сходится медленнее про-
процесса последовательных приближений. Возможно даже, что одно-
шаговый циклический процесс расходится, хотя метод последова-
последовательных приближений сходится. Области сходимости этих двух
процессов различны и лишь частично перекрываются.
224
итерационные методы решения линейных систем [гл. ш
Приведем примеры, показывающие различие областей сходимости
одношагового циклического процесса и процесса последовательных
приближений.
Пример 1. Пусть
" 5 —5
5 1
о.1 J-
Тогда собственные значения матрицы В определяются из уравнения
@.1—1)E — f)+5 = 0 и потому тах|).г|>1. Процесс последова-
последовательных приближений расходится.
Образуем матрицу
Собственные значения этой матрицы определяются из уравнения
t2 — 0.Н + 0.5 = 0. Очевидно, тах|Хг|<1. Одношаговый цикличе-
циклический процесс сходится.
Пример 2. Пусть
2.3 —5
D
1 —2.3
Собственные значения матрицы В определяются из уравнения
— B.3—0B.3+0+5 = ^—0.29=0; max |X;|< 1. Процесс после-
последовательных приближений сходится. Нетрудно проверить, что в этом
случае одношаговый циклический процесс расходится. Действительно,
^2.3 —5 ~
и собственные значения этой
2.3 — 7.3_
матрицы по модулю больше единицы.
Одношаговый циклический процесс теоретически тождественен
с процессом последовательных приближений, примененным к надле-
надлежащим образом подготовленной данной системе и это обстоятельство
было нами использована для получения условий сходимости процесса.
Однако фактически при проведении процесса вычислительная схема
не совпадает с вычислительной схемой эквивалентного процесса
последовательных приближений и, в частности, вычисление „подго-
„подготавливающей матрицы" Я = (Е—My1 не должно быть осущест-
осуществлено. Это обстоятельство и заставляет выделить одношаговый
циклический процесс как самостоятельный итерационный метод.
В качестве примера найдем решение системы A4) § 30, при-
приведенной к виду
—0.0бх4 + 0.08
.08х4+1.12
= 0.14х1 —
§32]
ОДНОШАГОВЫЙ ЦИКЛИЧЕСКИЙ ПРОЦЕСС
225
Достаточные условия сходимости одношагового циклического
процесса, очевидно, выполнены.
В качестве начального приближения берем вектор свободных
членов. Последовательные приближения помещены в табл. III. 5.
Таблица III. 5
Вычисление решения системы одношаговым циклическим процессом
*<°> = О
*<2)
*<»)
Л (В)
л<«)
Л<"»
^A2)
XW)
^A4)
0.76
1.1584
1.3730
1.4683
1.5080
1.5242
1.5307
1.5333
1.5343
1.53469
1.53485
1.53492
1.534947
1.5349579
1.5349622
0.08
0.1184
0.1208
0.1213
0.1216
0.1218
0.1219
0.1219
0.1220
0.12201
0.12201
0.12201
0.122009
0.1220094
0.1220010
1.12
1.6317
1.8379
1.9204
1.9533
1.9665
1.9717
1.9738
1.9746
1.97493
1.97507
1.97512
1.975141
1.9751507
1.9751541
0.68
1.1424
1.3090
1.3723
1.3969
1.4066
1.4104
1.4118
1.4125
1.41278
1.41289
1.41293
1.412945
1.4129513
1.4129538
Таблица III. 6
Вычисление решения системы одношаговым циклическим процессом
Х^ = О
^B0)
^B5)
xw>
*D9)
0.22900763
—0.40557078
—1.2560487
—1.2574501
—1.2577909
—1.2577935
0.38167939
0.24074649
0.0439969
0.0435866
0.0434880
0.0434873
0.53435515
0.65379631
1.0383844
1.0390124
1.0391650
1.0391661
0.68702290
0.86327494
1.4810254
1.4821242
1.4823907
1.4823927
Сравнивая найденные последовательные приближения с решением
системы, найденным по методу единственного деления (см. § 30),
мы видим, что четырнадцатое приближение дает решение с точностью
15 Зак. 974. Д. К. Фаддеев и В. Н, Фаддеева
226
ИТЕРАЦИОННЫЕ МЕТОДЫ РЕШЕНИЯ ЛИНЕЙНЫХ СИСТЕМ [ГЛ. И!
до трех единиц шестого знака. Одношаговый циклический процесс
в рассматриваемом примере сходится быстрее, чем процесс после-
последовательных приближений (см. табл. III. 1, III. 2 и III. 3).
То же заключение будет,верно и в применении к системе C)
§ 31, что видно из сравнения табл. III. 4 и табл. III. 6, в которой
дается решение упомянутой системы циклическим одношаговым про-
процессом.
§ 33. Метод Некрасова.
Так же как в методе последовательных приближений, данную
систему AX=F можно подготавливать к виду, удобному для при-
применения одношагового циклического процесса различными способами.
Наиболее употребительной является модификация одношагового
циклического процесса, параллельная методу простой итерации.
Необходимое и достаточное условие сходимости этой модифи-
модификации циклического одношагового процесса впервые было найдено
П. А. Некрасовым1), что дает право называть ее методом Некрасова.
Система АХ= F записывается в виде
г-1
A)
или, что то же самое, в виде
vi ац v^
au
X-t
au
и последовательные приближения определяются по формулам
»-i
B)
j-i+i.
Необходимые и достаточные условия сходимости этой модифи-
модификации процесса легко получаются из приведенных выше необходимых
и достаточных условий сходимости в общем случае.
Действительно, выбранная подготовка системы AX=F к виду
Х=ВХ-{- О основана на предварительном умножении системы на диаго-
диагональную матрицу D'1=:[an апп]~1. Следовательно, B=E — D~1A.
Обозначим
C)
/
«21
_«Щ
0 ...
о ...
«П2
0
0
0_
я =
и
0
_0
«12
0 ...
0 ...
«ш
«2»
0
П. А. Некрасов [1].
§ 33] МЕТОД НЕКРАСОВА 227
Тогда
A = L + D + R
так что в прежних обозначениях
M = — D~1L, N = — D/?.
5 = (Е — Ж) N = — (ЕН- D!) D/? = — (?> + L)~x R.
Характеристический полином
матрицы
после умножения на
принимает вид
Следовательно, для сходимости метода Некрасова необходимо и
достаточно, чтобы все корни уравнения (уравнение Некрасова)
ant c12 ... а1п
a2lt a22t ... а2п
D)
были бы по модулю меньше единицы.
Большое количество достаточных признаков сходимости метода
дано в переписке П. А. Некрасова и Мемке.х)
В частности, достаточными признаками являются признаки I, II,
Г, И' § 30.
В случае, если матрица А из коэффициентов системы AX=t
симметрична или эрмитова, существует еще одно важное условие
сходимости метода Некрасова. Именно, если матрица А положи-
положительно определена, то метод Некрасова для системы AX=F
сходится. Это условие в предположении положительности
диагональных элементов матрицы А оказывается также необ-
необходимым. 2)
Для доказательства положим
Л = /?* + О + /?, E)
где D — диагональная матрица, составленная из диагональных эле-
элементов матрицы, R — треугольная матрица, образованная элементами
матрицы А, лежащими выше главной диагонали, R* — ее сопряженная,
Мемке и П. А. Некрасов [1].
Рейх [1], Шмейдлер [Ц, Островский [8],
15*
228 ИТЕРАЦИОННЫЕ МЕТОДЫ РЕШЕНИЯ ЛИНЕЙНЫХ СИСТЕМ [ГЛ. Ill
Как мы видели выше, необходимым и достаточным условием сходи-
сходимости метода Некрасова является требование, чтобы все собственные
числа матрицы S = — (D-\-R*)~1R были бы по модулю меньше
единицы.
Приведем оценку для модулей собственных значений этой ма-
матрицы, из которой непосредственно следует, что все они меньше
единицы.
Обозначим через Ъо наименьшее собственное значение матрицы А.
Так как матрица А положительно-определенная, Хо > 0. Далее, обо-
обозначим Ао= \\R\\ = \\R*\\¦ Пусть U собственный вектор длины еди-
единица для матрицы (D-{- R*yl R, принадлежащий некоторому соб-
собственному значению X. Тогда
или
RU = (D + R*) W = WU
Далее,
(RU, U) = l(DU, U)+-\(R'U, U) = X(AU, U) — l(RU, U).
Обозначим
{AU, U)=p
(DU, U) = d
(RU, U) = a + ib
(R*U, U) = (U, RU) = a — ib.
Тогда
, a + ib
p — a — lb '
откуда
Ho
p = (AU, U) = (DU,
и потому
(p — df = p2 — 2ap -f a2 = p (p — 2a) + Ф = pd + a2.
Таким образом,
^ Ao d0 + a» + b* '
где d0 есть наименьшее собственное значение матрицы D, ибо d ^ d0,
р~^>\. Очевидно, что do=min«jj. Далее,
§ 33] МЕТОД НЕКРАСОВА 22&
Следовательно,
|Х|.< ^ -. F)
Отметим, что dQ ^ Хо, ибо
i = min (Aeit e?) ~^> min (AX, X) == Х.о.
Поэтому справедлива оценка')
[Х|.< 2А° —, G)
несколько более грубая, чем оценка F).
Из полученных оценок следует, что все собственные значения
матрицы (D~\-R*)~ R по модулю меньше единицы. Тем самым схо-
сходимость процесса Некрасова доказана.
Докажем теперь необходимость высказанных условий.
Пусть А симметричная или эрмитова матрица с положительными
диагональными элементами,
и
два соседние последовательные приближения в k-м цикле. Тогда
X' = Х-\- ецО (F — АХ).
Пусть X* решение системы, Y — X* — X, Y'= X*—X' соответ-
соответствующие векторы ошибки. Тогда
где ri — /-я компонента вектора r = F — АХ—AY, ei — вектор,
у которого /-я компонента равна единице, а остальные нули.
Вычислим значение функционала f(X') = (AY', Y') (совпадающего
с функцией Ошибки, если А положительно определена). Имеем
г г2
аи аи
Но
(AY, ^) = г4, (Aeit ег) = ап,
и потому
f(X') = (AY', Y') = (AY, Y) — T-~- < (AY. Y). ^
Если матрица А не положительно определена и|Л|т^0, то можно
найти начальный вектор X^i так, что (АУ@), К<°>) < 0. Тогда в силу (8)
на протяжении всего процесса будет (AYW, К№) < (ЛК(°), yW) < О,
!) Островский [8].
230
ИТЕРАЦИОННЫЕ МЕТОДЫ РЕШЕНИЯ ЛИНЕЙНЫХ СИСТЕМ
[ГЛ. III
и, следовательно, предельное соотношение К(й)-»-0 невозможно.
Поэтому процесс будет расходящимся.
Установленный критерий показывает, что если матрица системы
симметричная с положительными диагональными элементами, то
область ' сходимости метода Некрасова шире области сходимости
метода простой итерации.
Действительно, для сходимости метода Некрасова необходима и
достаточна, в этом случае, положительная определенность матрицы. А,
для сходимости же метода простой итерации необходимым и доста-
достаточным условием является положительная определенность матриц А
и 2D — А.
В табл. III. 7 приводится решение системы (9) § 23 по методу
Некрасова.
Таблица III. 7
Решение системы по методу Некрасова
хт
ХB2)
0
0.3
-1.2577875
— 1.2577922
—1.2577935
0
0.374
0.0434903
0.0434881
0.0434874
0
0.41832
1.0391641
1.0391657
1.0391662
0
0.4454096
1.4823879
1.4823916
1.4823927
§ 34. Методы полной релаксации
Начиная с этого параграфа и до § 38 включительно, мы будем
рассматривать преимущественно системы с положительно-определен-
положительно-определенными матрицами, оговаривая каждый раз случаи, когда это требова-
требование не выполняется.
Пусть X*— точное решение системы AX=F с положительно-
определенной матрицей А, X—некоторый вектор, f(X) — функция
ошибки. Ставится задача, как изменить i-ю компоненту вектора X,
чтобы для измененного вектора X' значение функции ошибки было бы
наименьшим. Пусть
X' =
Тогда
f(X') = (AY', Y') = {A(Y — aei\ У —«<)¦¦=
= (ЛК, К)—2а(ЛК, ед + &{Аег, ег) =
= f(X)+~(aiiu-rif — ^, A)
где г$ — i-я компонента вектора невязки для приближения X,
§ 34] МЕТОДЫ ПОЛНОЙ РЕЛАКСАЦИИ 231
Ясно, что f(X') будет иметь минимальное значение при
« = -?-.
аи
и это минимальное значение равно
Вычислим теперь i-ю компоненту невязки для приближения X''.
Она равна
(F—AX', ед = (Р—АХ—а.Аег, е{) =
= (F—АХ, ег) — a(Aet, et)=:ri — <хаи = О,
т. е. приближение X' удовлетворяет г-му уравнению системы AX=F.
Другими словами, i-я компонента приближения X' может быть вычи-
вычислена из /-го уравнения системы AX=F, в которое вместо остальных
неизвестных подставлены компоненты вектора X. Именно так про-
проходит один шаг в каком-либо цикле процесса Некрасова. Тем самым
процессу Некрасова может быть дано следующее истолкование:
на каждом шагу минимизируется функция ошибки за счет изменения
одной компоненты предыдущего приближения, номера же этих ком-
компонент циклически чередуются от 1 до п.
Если, используя отдельные шаги процесса Некрасова, отказаться
от цикличности в выборе изменяемых неизвестных, то мы придем
к более общей группе методов, называемых методами полной
релаксации.
При такой постановке имеется широкий произвол в выборе после-
последовательности номеров изменяемых компонент (ведущих индексов).
Так, например, решая систему десяти уравнений с десятью неизвест-
неизвестными, занумерованными числами от 0 до 9, можно в качестве
„управления" процессом взять хотя бы десятичную запись числа
е = 2.718 281828459045 235 36..., т. е. менять на первом шагу
вторую компоненту, на втором—седьмую,*на третьем—первую и т.д.
Ясно, что для фактического проведения релаксационного процесса
должен быть выбран какой-либо разумный принцип управления про-
процессом, т. е. принцип выбора последовательности номеров изменяемых
компонент. О некоторых принципах управления процессом релаксации
будет сказано ниже.
Конечно, не всякий процесс полной релаксации сходится к ре-
решению. Так, например, если выбранная последовательность номероь
изменяемых компонент совсем не содержит хотя бы одного номера,
то все поправки Х^ +г> — X} ' будут содержаться в (п—1)-мерном
подпространстве, и если X* — Х(°) не содержится в этом подпростран-
подпространстве, процесс не может сходиться к X*.
Достаточное условие для сходимости процесса к решению будет
дано в § 37.
232 ИТЕРАЦИОННЫЕ МЕТОДЫ РЕШЕНИЯ ЛИНЕЙНЫХ СИСТЕМ [ГЛ. III
§ 35. Неполная релаксация
Вместо полной минимизации функции ошибки на каждом отдельном
шагу процесса можно заботиться лишь об уменьшении функции
ошибки. Процессы, построенные исходя из этого принципа, назы-
называются процессами неполной релаксации.
Выясним, как изменить одну компоненту приближения с тем,
чтобы функция ошибки уменьшалась.
Пусть Х' = Х~\-ае^ Тогда
Для того, чтобы значение f(X') — f(X) было отрицательным,
необходимо и достаточно, чтобы
(аиа — г{J<г|,
откуда
|а«« — П\ <\г{]
и, следовательно,
4 аи w
при 0 < q < 2.
При <7=1 будет иметь место полная минимизация функции ошибки
или, как говорят, полная релаксация. Неполная релаксация называется
нижней, если 0 ¦< g <[ 1 и верхне й — если 1 •< q < 2.
При неполной релаксации функция ошибки изменяется по формуле
^^!. B)
На каждом отдельно-м шагу процесса метод полной релаксации
является наивыгоднейшим, так как он обеспечивает максимальное
уменьшение функции ошибки за один шаг. Однако при проведении
большего числа шагов может оказаться, что неполная релаксация
дает лучший результат.
Число q при неполной релаксации может изменяться от шага
к шагу. Если процесс неполной релаксации берется циклическим
при постоянном или циклически меняющемся q, то процесс можно
рассматривать как частный случай общего одношагового цикличе-
циклического процесса, примененного к системе, подготовленной к виду
x=(e—qd-1a)x-\-qd-1f,
где D=[au, ..., ann],Q~[qv .... qn\{qv <?¦„—значения мно-
множителей релаксации).
§ 35] НЕПОЛНАЯ РЕЛАКСАЦИЯ 233
Действительно, формулы для вычисления компонент результата
k-то цикла будут
C)
Отметим, что последние формулы определяют итерационный про-
процесс и для систем с не положительно-определенными матрицами.
Однако в этом случае конечно нельзя уже говорить о релакса-
релаксационных свойствах процесса.
Легко найти необходимое и достаточное условие сходимости
процесса. Действительно, в обозначениях § 32 и § 33 будем иметь
— Q —
так что необходимым и достаточным условием сходимости про-
процесса C) будет требование, чтобы все собственные значения матрицы
(D-\-QL)~1(D — DQ — QR) были по модулю меньше единицы. Соб-
Собственные значения этой матрицы, очевидно, являются корнями урав-
уравнения
tqza2l
tqnanl tqnan2 ... (t + qn — \)an
= 0 D)
Быстрота же сходимости метода будет зависеть от величины наиболь-
наибольшего модуля корней этого уравнения.
Полученный критерий сходимости процесса C) представляет
интерес главным образом в случае, если матрицы системы не поло-
положительно определены, так как в случае положительно-определенной
матрицы циклический процесс неполной релаксации всегда сходится,
как это будет показано в § 37. Однако и для этого случая кри-
критерий представляет интерес, так как он дает средство для исследо-
исследования быстроты сходимости процесса.
Рассмотрим подробнее процесс C) при ql = q2= ... =qn = q.
Покажем, что за счет малого отклонения q от единицы почти
всегда можно добиться уменьшения наибольшего модуля корней
уравнения D) и, следовательно, получить процесс с более быстрой,
сходимостью, чем процесс Некрасова.,
234
ИТЕРАЦИОННЫЕ МЕТОДЫ РЕШЕНИЯ ЛИНЕЙНЫХ СИСТЕМ [ГЛ. Ш
Пусть <7=1—?. где s малое вещественное число. Тогда урав-
уравнение D) равносильно уравне! и:о
/— ?
1-е
ta.
21
1-Е
= 0.
E)
Положим t — \-\- ks, где Хо наибольший по модулю корень урав-
уравнения Некрасова \tL-\-tD-\-R\ = Q. Тогда, с точностью до е2, имеем
— >.0-|-(&—1 —[— Хо) е, и уравнение E), с точностью до малых
1 ¦ ?
2-го -порядка, перейдет в уравнение
= 0. F)
Здесь 710==X0Z.-4-L)Z)-f-/?. Легко видеть, что, с точностью до
малых 2-го порядка, справедлива следующая формула
| А + еВ | = | А | + s Sp В А,
где А—матрица, союзная с матрицей А. Следовательно, уравнение F)
примет вид
То | + s Р — 1 И- *о) Sp Of 0 + k Sp Z.f 0] = О (s2).
Принимая в,о внимание, что 17 J = 0, получим, с точностью
до малых 1-го порядка, что
fc_ (l-Xo)SpDfo G)
Итак, число >/ = X0-j-fee, где k определяется по формуле G),
является приближенным значением наибольшего по модулю корня
уравнения E).
Сравним модули \0 и ~к'. Ясно, что
Поэтому, при достаточно малом г, можно добиться того, чтобы
|Х'|2 был меньше | Хо |2, если только Re(feXo)=?0. При этом, если
Re (AXq) < 0, следует взять е > 0, т. е. прибегнуть к нижней релак-
релаксации, если Re(?X0)>0, то нужно взять е < 0, т. е. перейти
к верхней релаксации.
Формула G) равносильна следующей формуле
и__ (l-lo)(DXo, Го)^ ф
§35]
НЕПОЛНАЯ РЕЛАКСАЦИЯ
235
где Хо ненулевой вектор, определенный из уравнения ТоХ0=^0,
а Ко ненулевой вектор, определенный из уравнения ГоКо=0. Век-
Векторы Хо и Ко определяются с точностью до скалярных множителей
однозначно, если предположить, что Хо простой корень уравнения
\tL -\~tD-\-R | = 0. Но, как можно показать, только в этом случае
имеет смысл и формула G).
Вопрос о выборе множителя д, приводящего к процессу с наиболь-
наибольшей быстротой сходимости, в общем случае не решен.
Для матриц 2-го порядка исчерпывающее исследование проведено
А. М. Островским [7]. Пусть
^22 —
A =
Ненулевым корнем уравнения
ant al2
a2St a22t
является, очевидно, Xo — и = "'"' 2t , так что для сходимости метода
Некрасова необходимо и достаточно, чтобы |«|<Ч.
Для положительно-определенной матрицы А имеет место нера-
неравенство
0<«< 1.
Применяя формулу G), получим
Поэтому при О < и < 1 (в частности, для положительно-определен-
положительно-определенных матриц) верхняя релаксация (по крайней мере при малых г)
дает более быструю сходимость, чем полная, а при — 1 <1« <С О
более быстрая сходимость будет при нижней релаксации.
В той же работе А. М. Островского дано оптимальное значение
для множителя д. Именно,
причем соответствующее значение для модуля X/ есть
«I
А' = •
+ У1 — и *
Отметим, что изменение быстроты сходимости при неполной ре-
релаксации может быть довольно значительным. Так, для
А =
1 0>6
0,6 1
236
ИТЕРАЦИОННЫЕ МЕТОДЫ РЕШЕНИЯ ЛИНЕЙНЫХ СИСТЕМ [ГЛ. III
будем иметь при полной релаксации Хо = ^- = 0.36. Оптимальная же
, 10
неполная релаксация будет при д = -^-г причем соответствующее
значение X' равно -у- = 0.111 ...
Для не положительно-определенных матриц Островским показано
в той же работе, что при и > 1 процесс C) расходится при всех зна-
значениях q из интервала @, 2). Если же м<—1, то процесс C) будет
2
сходящимся при 0 < g < -, так что область сходимости
процесса C) при q < 1 будет шире, чем область сходимости про-
процесса Некрасова.
Для положительно-определенных матриц третьего порядка можно
показать посредством'довольно громоздких выкладок1), что
так что верхняя релаксация (по крайней мере при малых е) приво-
приводит к более быстрой сходимости, чем полная.
Таблица III. 8
Решение системы методом Некрасова с нижней релаксацией, q = 0.8
хт
Х(Щ
ХB5)
Х<щ
Х(Щ
0
0.24
— 1.2560832
- 1.2575067
— 1.2577924
— 1.2577935 ""
0
0.31936
0.0440084
0.0435748
0.0434877
0.0434874
0
0.3745638
1.0384154
1.0390402
1.0391657
1.0391661
0
0.4149420
1.4810565
1.4821686
1.4823918
1.4823927
Таблица III. 9
Решение системы методом Некрасова с верхней релаксацией. q = \.\
Х@)
ХО)
Х(Щ
0
0.33
— 1.2577939
—1.2577935
0
0.39754
0.0434866
0.0434873
0
0.4340459
1.0391661
1.0391661
0
0.4529715
• 1.4823932
1.4823928
1) Д. К. Фаддеев [3].
§36]
СИСТЕМЫ С КВАЗИТРЕХДИАГОНАЛЬНЫМИ МАТРИЦАМИ
237
Таблица ///. 10
Решение системы методом Некрасова с верхней релаксацией, q — 1.2
xm
0
0.36
— 1.2577988
- 1.2577939
-1.2577936
0
0.41856
0.0434852
0.0434869
0.0434873
0
0.4459930
1.0391678
1.0391662
1.0391661
0
0.4561382
1.4823963
1.48-23930
1.4823928
В табл. III. 8, III. 9 и III. 10 приводятся результаты вычисления
решения системы (9) § 23 по методу Некрасова с неполной релак-
релаксацией при G = 0.8, д=1Л и <7=1.2.
Сравнение этих таблиц с табл. III. 7 показывает, что в данном
примере верхняя релаксация дает лучший результат, чем полная.
Отметим, что дальнейшее увеличение множителя релаксации приводит
уже к худшему результату. Так, при <7=1.3 имеем
ЛГ<19> = (—1.2577970, 0.0434871, 1.0391679, 1.4823915)',
а результат, аналогичный A"(l8> табл. III. 9, получается лишь при k = 26.
§ 36. Исследование итерационных методов для систем
с квазитрехдиагональными матрицами
В настоящем параграфе будет исследоваться быстрота сходимости
метода простой итерации (процесса Якоби) и циклического релакса-
релаксационного метода с постоянным множителем релаксации для систем
с положительно-определенными квазитрехдиагональнымк матрицами
вида
~А Wi
А —
К
W
т-\
A)
где Du .... Dm — диагональные матрицы (быть может разных поряд-
порядков), Wv Wz Wm-i — некоторые прямоугольные матрицы. Оче-
Очевидно, что все диагональные элементы матрицы А положительны.
238
ИТЕРАЦИОННЫЕ МЕТОДЫ РЕШЕНИЯ ЛИНЕЙНЫХ СИСТЕМ [ГЛ. ill
Результаты, здесь излагаемые, принадлежат Янгу [2].
Всякая матрица А указанного вида обладает „свойством А" (Янг),
состоящим в том, что номера строк и столбцов могут быть разбиты
на два непересекающихся множества Р и Q так, что если пц Ф 0 и
i Ф j', то 1?Р и j'6 Q или J 6 Q и J' ?. Р- Именно, такими множест-
множествами будут совокупности номеров строк, соответствующих нечетным
клеткам Dv D3, ... с одной стороны и четным D2, D4, ... с другой.
Верно и обратное, что любая симметричная матрица, обладающая
„свойством Л", может быть приведена к квазитрехдиагональному виду
за счет одновременного изменения нумерации строк и столбцов;
достаточно, например, первые номера отдать множеству Р, после-
последующие— множеству Q.
После такой перенумерации матрица примет вид
D, W
B)
где Dx и Е)г — диагональные матрицы, W — некоторая прямоугольная
матрица. В частности, общая квазитрехдиагональная матрица может
быть преобразована к виду B) при
А
А
'2ft-1 _
A
'2ft-
W,
(если т = 2k)
D.
A
A
2fc + l _
D,
2ft _
§ 36] СИСТЕМЫ С КВАЗИТРЕХДИАГОНАЛЬНЫМИ МАТРИЦАМИ
239
К
*-*
(если tn = 2k-\-l)
Системы с полон<ительно-определенными матрицами, обладающими
„свойством А", возникают, например, при решении некоторых урав-
уравнений в частных производных эллиптического типа разностными мето-
методами. Установление нумерации, в которой матрица становится квази-
трехдиагональной, связано с тем или другим естественным выбором
нумерации узлов.
Прежде всего заметим, что при исследовании сходимости метода
простой итерации и релаксационных циклических методов с постоян-
постоянным множителем релаксации для матриц с положительными диаго-
диагональными элементами мы можем считать, без нарушения общности,
что все диагональные элементы равны единице.
Действительно, если D диагональная матрица, составленная из диа-
_i 1
тональных элементов матрицы А, и А = D 2 AD 2, то А имеет еди-
единичные диагональные элементы. Быстрота сходимости метода простой
итерации обусловливается наибольшим модулем собственных значений
матрицы В = ? — D~lA. Быстрота сходимости релаксационного цик-
циклического метода с постоянным множителем релаксации q опреде-
определяется наибольшим модулем собственных значений матрицы
где D, L и R диагональная, поддиагональная и наддиагональная части
матрицы А. Для матрицы A = D 2 AD a диагональная, поддиаго-
поддиагональная и наддиагональная части будут, соответственно, Е, D 2 LD 2,
D'JRD~^. Поэтому
В = Е — Е А = Е — D~AD~T =
1 i_ l i_
= D (f — D~M) D"-2" = DYBD~ a",
2)
— qE~qD *RD a; =
i _! A
D2D *(D — aD-
*=D2SgD
240.
ИТЕРАЦИОННЫЕ МЕТОДЫ РЕШЕНИЯ ЛИНЕЙНЫХ СИСТЕМ
[ГЛ. III
Таким образом, матрицы В и Sq, построенные исходя из ма-
матрицы А, подобны матрицам В и S, и, следовательно, их собственные
значения соответственно совпадают.
Это замечание позволяет при исследовании указанных методов для
положительно-определенных квазитрехдиагональных матриц огра-
ограничиться рассмотрением матриц вида
А =
W'm-i
где Elt Е2, .... Ет— единичные матрицы.
Если все наддиагональные клетки квазитрехдиагональной матрицы
умножить на некоторое число а, а все поддиагональные на обратное
число а,~х, то определитель матрицы не изменится.
Действительно, ясно что
А,
ат~1Е„
г,
D2 ¦
W , D
m-i. m _
X
X
txE,
откуда непосредственно следует справедливость сказанного.
Это свойство квазитрехдиагональной матрицы позволяет связать
характеристический полином матрицы S? с характеристическим поли-
§36]
СИСТЕМЫ С КВАЗИТРЕХДИАГОНАЛЬНЫМИ МАТРИЦАМИ
241
номом матрицы В. (Мы считаем диагональные элементы матрицы А еди-
единичными). Действительно,
\tE — Sq\ = \t(E-{-qL) — (E — qE — qR)\ =
-1
tqW[
qWx
-\)E2
qVtWl
'm_1 (t+q-l)En
t-\-q-\
W[
-l F
r~ 2
w/
w m-l
t-\-Q—
C)
где F(t) есть характеристический полином матрицы
О —Wt
= Е — А —
¦W[ О
16 Зак. 974. Д. %,. Фаддеев mb. H. Фаддеев*
242 ИТЕРАЦИОННЫЕ МЕТОДЫ РЕШЕНИЯ ЛИНЕЙНЫХ СИСТЕМ [ГЛ. III
Полином F(t) обладает свойством F(— t) = (— \)nF(t). Действительно,
F(-t) =
К
~tE
= (-!)«
— W'l tE2
|=(-l)n F{t).
Следовательно,
F(t),
tE
(t* — c,) (^ — c2) . . .
D)
Здесь & — число пар ненулевых корней полинома F (t). Так как мат-
матрица В симметрична, то все корни полинома F (t) вещественны. По-
Поэтому с1 > 0; с2 > 0; . . .; ск > 0. Положим ci = ji?, / = 1, 2 й;
[.'j >¦ 0. Таким образом, собственными значениями матрицы В являются 0
(кратности п — 2k) и ± \iv ± ц2 ± ук. Нулевой корень может
отсутствовать при четном п.
Так как матрица А = Е — В положительно определена, все числа
1 + |J^ > 0, откуда \i{ < 1. Следовательно, в наших условиях метод
простой итерации сходится. Быстрота сходимости определяется наи-
наибольшим из чисел \iit которое мы обозначим через \х.
Характеристическим полиномом матрицы Sq в силу C) и D)
является
¦м
В частности, при д=1 (метод Некрасова)
Его корнями являются 0 (кратности п — k) и числа ^\, \у%, ..., jx|.
Отсюда мы заключаем, ^то метод Некрасова сходится вдвое быстрее,
чем метод простой итерации
§ 36] Системы с квазитрехдиагональными матрицами 243
Выясним теперь вопрос о наиболее целесообразном выборе мно-
множителя релаксации д.
Нулевым собственным значениям матрицы В соответствуют соб-
собственные значения матрицы Sq, равные 1—д. Собственным значе-
значениям ±fij соответствуют два собственных значения матрицы SQ,
определяемые из квадратного уравнения
(t + g— IJ — <72i^ = 0.
Корни этого уравнения суть
+ УУ^2 — 4д-'г4
\ 2
2
При 0 < q < ¦— = <7г эти корни будут вещественными и
' 1 + К1?
положительными, причем большим из них является
При <7i < Я < 2 корни становятся комплексными и их модули равны
д-\.
На плоскости д, t кривая третьего порядка (t-\~g— IJ — g2\y^t = Q
имеет двойную точку при д = 0, t — 1 и выпуклую петлю в полосе
О^Сд <;<7г- касающуюся прямой ^=9 при ^=1 и прямой д=дг при
Так как каждая прямая, параллельная оси д, пересекает кривую
не более чем в двух точках, то прямая t=\, проходящая через
двойную точку, более не пересекает кривую. Поэтому петля кривой
целиком расположена ниже прямой t=\, и верхняя часть MN петли
опускается при изменении д от 0 до д{. Таким образом, график
модуля большего из двух корней, соответствующих данному \iit имеет
вид, изображенный сплошной линией на рис. 1.
При возрастании ^ точка N сдвигается вправо, а участок кривой MN
поднимается. Таким образом, наибольшее по модулю собственное
значение матрицы Sq соответствует jx.
Наивыгоднейшим значением множителя релаксации, очевидно,
Является
2
я=-
Интересно отметить, что при таком выборе множителя релакса-
релаксации все собственные значения, матрицы. S~ становятся по модулю
244
ИТЕРАЦИОННЫЕ МЕТОДЫ РЕШЕНИЯ ЛИНЕЙНЫХ СИСТЕМ [ГЛ. III
равными q— 1 =-
=г. Действительно, нулевым корням ма-
трицы В соответствуют корни q—1, корням ±^, при ;x,j <] ja, соот-
соответствуют пары сопряженных комплексных корней, равных по мо-
модулю q—1, и, наконец, для ±(л4, при ^ = [а, оба корня совпадают
и равны q— 1.
При q <^.q <[ 2 по тем же соображениям все собственные значе-
значения матрицы Sq по модулю равны q—1.
Рис. 1.
График зависимости от q наибольшего модуля собственных зна-
значений матрицы Sq имеет в точке q = q резкий минимум с верти-
вертикальной касательной слева и касательной справа, образующей угол -j-
с осью абсцисс. Поэтому при отклонении q от q должно получаться
резкое уменьшение быстроты сходимости, особенно при отклонении
в сторону уменьшения.
В заключение заметим, что установленная связь между собствен-
собственными значениями матриц В и Sq сохраняется для любой квазитрех-
диагональной матрицы с единичными диагональными блоками, без
предположения о симметрии и положительной определенности.
§ 37. Теорема сходимости
Теорема 37.1. Если в процессе неполной {или полной) релак-
релаксации для системы с положительно-определенной матрицей
выполнены условия:
а) последовательность ведущих индексов tv ...,ik, ... имеет
интервал повторяемости, т. е. в каждом отрезке длины I
he+i< ¦ ¦ • < tje+i этой последовательности присутствуют хотя бы
по одному разу все числа 1, 2, .... я;
§ 37] теорема сходимости 245
b) множители релаксации удовлетворяют условию г < qk <
< 1 — е при О < s < 1,
то процесс сходится к решению системы. Более того, суще-
существует число 0, 0<9<1 такое, что | X*— X(k) \ < б\
Доказательство. Пусть процесс решения системы AX=F про-
происходит по формуле
^ ^ ^ „ . (i)
где
<2>
Здесь через ?fc обозначен номер компоненты, изменяемой на fe-м
шагу процесса. Пусть f\Xr ) есть значение функции ошибки на k-u
шагу, Y вектор ошибки на k-u шагу.
Тогда
^){^)^^^l, C)
D)
2 — Яъ
Положительные числа aikijc ограничены сверху и снизу, так
что существуют такие константы -fi и Тг> чт0
оо
Так как ряд из положительных членов 2 f(X) — f(X^ ¦*), оче-
оо
видно, сходится, то сходящимся будет и ряд 2 Tiwfe' a вместе с ним
сю
и ряд 2 т\ и> следовательно, тк-+0. Так как компонентаrL~ век-
тора невязки отличается от тк ограниченным сверху и снизу мно-
множителем ——-, мы устанавливаем, что И*'—>0. Таким образом„
компонента вектора невязки с номером, равным номеру компоненты
приближения, меняющейся на следующем шагу, стремится к нулю.
Для сходимости процесса достаточно показать, что и все остальные
компоненты вектора невязки стремятся к нулю при k ->¦ оо. Пусть /
любое натуральное число, 1 <С i ^ п и пусть k > I. Обозначим
через ki номер последнего шага, предшествующего k-uy, при
246
ИТЕРАЦИОННЫЕ МЕТОДЫ РЕШЕНИЯ ЛИНЕЙНЫХ СИСТЕМ
[ГЛ. III
котором менялась i-я компонента приближения. В силу усло-
условия о существовании промежутка повторяемости длины / имеет место
неравенство 0*Ck — kl<^l. В силу доказанного г\ * —> 0. Имеем
далее
L(*)i
Оценим последнее слагаемое. Для этого предварительно оценим
г{1с) — г(т)\, где m<k. Имеем
Следовательно,
и потому
Отсюда
ибо ki^k — L
Следовательно,
2
2
S
2 Kl-
Таким образом, rW—>0 при А—> оо и тем самым сходимость процесса
доказана.
Оценим быстроту сходимости. Из последнего неравенства сле-
следует, что
Следовательно,
f(X(k)) = (Л" V*), г<*>)
где
2
) 2
ч=к-1
ft
= 2
ft
§ 37] ТЕОРЕМА СХОДИМОСТИ
С другой стороны.
247
Так"м образом,
оо
при всех k и при некотором с3>1. Обозначим
со
2 м, = sk.
Тогда неравенство E) представится в виде
откуда
S ^ S^Zll sk = е^й (где 0 <
и, следовательно, 5^ <С c40i. Далее,
S
Итак,
E)
Вместе с этой оценкой справедливы и оценки
| г<*> | = О (9i/2); | Y{k) | = О (9i/2) == О (дк),
где 9 = 9/2.
Сходимость процесса может быть доказана и при более слабых
предположениях относительно множителей релаксации (А. М. Ост-
Островский [8]).
Из доказанной теоремы следует, в частности, сходимость цикли-
циклического релаксационного процесса с постоянным множителем релак-
релаксации д, удовлетворяющим неравенству О <С д < 2.
Сделаем еще одно замечание, касающееся этого случая. Полином
-1)«п qa.vi
tga21
tqan%
tgan
248 ИТЕРАЦИОННЫЕ МЕТОДЫ РЕШЕНИЯ ЛИНЕЙНЫХ СИСТЕМ (ГЛ. III
максимум модулей корней которого определяет быстроту сходимости
процесса, имеет старший коэффициент апа22 ... апп и свободный
член (<7—1)"ацй22 • • -апп- Поэтому произведение его корней равно
(—1)"(<7—!)"• Отсюда следует, что максимум его корней не
меньше \q—1| и может равняться этому числу, только если все его
корни равны по модулю \q—1 .
Если О <С q <C 2, то корни полинома Fq(f) строго меньше еди-
единицы по модулю, так как релаксационный процесс сходится. В силу
непрерывной зависимости корней от коэффициентов полинома, на
границах интервала для q, т. е. при # = 0 и д=2, корни Fq{t) не
превосходят единицы. Но, при # = 0 и # = 2. 1=|^—1 | и, сле-
следовательно, в силу сделанного выше замечания, все корни Fq(t)
равны по модулю единице.
Это обстоятельство для ^ = 0 легко проверяется непосредственно,
ибо F0(t) = au ¦•• ann(t—!)"• Для <7 = 2 доказанное обстоятель-
обстоятельство не тривиально. Для квазитрехдиагоиальных матриц quo было
установлено в § 36 прямым подсчетом.
§ 38. Управление релаксацией
Вместо того, чтобы при проведении процесса координатной ре-
релаксации задаваться последовательностью ведущих индексов a priori
(как это делается, например, в циклическом процессе или в процессе,
где управление задается, десятичной записью числа е), можно выбирать
индекс 1к на каждом шагу, исходя из результатов предыдущего шага.
Так, например, самое быстрое убывание функции ошибки при пере-
переходе от Х^'1^ к Х^ получается, если выбирать индекс ik так, чтобы
число — было бы наибольшим среди всех чисел ^ —, где
aikik au
г=1 п. Иными словами, индекс ik выбирается так, чтобы
число
было бы наибольшим. Процесс релаксации с таким
управлением носит название процесса Зейделя.
С именем Гаусса связывается процесс, при котором ведущий
rf'i] I
индекс выбирается из условия max— -. Наконец, правило упра-
аи
вления Сауссела определяется вычислением max|r< ^l-
Теорема 38./. Если ведущий индекс ik релаксационного коор-
координатного процесса для системы с положительно-определенной
матрицей А выбирается так, что
¦ \rV}\>i\r{ik-1}\ @<Т<1. '=1 «). О)
§ 38] УПРАВЛЕНИЕ РЕЛАКСАЦИЕЙ 249
и если е < qk < 2 — е, то процесс неполной релаксации сходится
к решению системы X* и существует число 6, 0 < 6 < 1 такое,
что \Х* — X{}!)\<(lk.
Из этой теоремы следует сходимость процессов неполной релак-
релаксации Гаусса, Зейделя и Сауссела, так как эти процессы удовлетво-
min аИ „
ряют условию теоремы при -f = — для процесса Гаусса, при
-. / mill п:! г-, „ ,
7 = 1/ — Для процесса оейделя и при 7 = 1 Для процесса
Сауссела. Действительно, для метода Сауссела это очевидно. В ме-
методе Гаусса имеем
>~1Г- прИ i=l П'
и потому
Аналогичные неравенства имеют место и для метода Зейделя.
Доказательство теоремы. Введем те же обозначения, что и при
доказательстве теоремы предыдущего параграфа. Повторяя доказа-
доказательство упомянутой теоремы, получим, что ряд 2 т^ сходится,
тк—>0 и г\* —>¦ 0. Далее, из неравенства
1С
ri ^С — ггъ B)
заключаем, что \г\ —> 0 при всех t=\ п. Тем самым схо-
сходимость процесса доказана.
Для оценки быстроты сходимости используем вытекающее из B)
неравенство
V
* -Л, r'fe-J)) < || Л
Далее,
С другой стороны,
и, следовательно,
Положив
со
Sb = Zj ГПч,
250 ИТЕРАЦИОННЫЕ МЕТОДЫ РЕШЕНИЯ ЛИНЕЙНЫХ СИСТЕМ [ГЛ. III
получим
откуда
и
sk
Таким образом,
s
и, следовательно,
/ (х{к)) < ъ
ч = к
Справедливы и оценки
|r(S) | = О@*), |K!ft)| = O(e*), 9= О'/1.
При пользовании релаксационными методами с управлением Сау-
селла, Гаусса, Зейделя на каждом шагу нужно вычислять все ком-
компоненты вектора невязки, но затем при определении ведущего ин-
индекса для следующего шага учитывается только одна. Поэтому
представляют интерес такие вычислительные схемы, в которых ис-
использовались бы все эти компоненты. Для построения таких схем
следует воспользоваться соотношением между двумя соседними век-
векторами невязки.
Именно, из соотношения
следует
гAс-1) г(к-\)
= /**-!) — qk -^ Aeiir = И*) — qk ^
где через Aik обозначен столбец с номером 1к матрицы А.
Переходя к компонентам, получим
пс) _ (>-1) _ (k-i) fl«ft
1 ~Г% Г'* aii4*
Положим
и аи' i уан'
Тогда
„(ft) __ ~(fc-l) v(ft-l) g<<* д
°i °i ai, . ^Г— -. Г . ~ ^* '
§ 38] УПРАВЛЕНИЕ РЕЛАКСАЦИЕЙ 251
Положив
получим
(к) (к-1) (*-l)t
или в векторной форме
Здесь 5-, Cj и Я^ у-е столбцы соответствующих матриц {bi}), (cy)
и (/Zj,), которые, очевидно, равны соответственно D~ A, AD~X,
D~'!*AD~'k. Для проведения выбранного процесса соответствующая
вспомогательная матрица должна быть составлена заранее. Заранее
должны быть выбраны и коэффициенты релаксации qv q2, ...
Далее вычисления располагаются так.
При помощи начального приближения составляются п чисел И0'
(или ^(°) или а(.°Л. Из них выбирается наибольшее по модулю, под-
подчеркивается и его номер принимается за i1. По формулам F) со-
составляются числа rf1 (или fW или cW, из них выбирается наиболь-
наибольшее по модулю, подчеркивается и его номер принимается за 12 и т. д.
После того, как выполнено достаточное число N шагов, компо-
компоненты приближения находятся по формулам:
или
или
Сумма "У' распространяется на те значения k, для которых r|fc~^
(или yI*' или а|/'~1)) были подчеркнуты.
Для уменьшения влияния ошибок округления, процесс следует
время от времени прерывать с тем, чтобы, вычислив приближение,
найти невязку1 непосредственно и начать процесс сначада,
252
ИТЕРАЦИОННЫЕ МЕТОДЫ РЕШЕНИЯ ЛИНЕЙНЫХ СИСТЕМ [ГЛ. III
Вычислительная схема становится особенно простой, если все
а~ц = 1. В этом случае все три способа управления совпадают и нет
надобности в вычислении вспомогательных матриц, ибо каждая из
них совпадает с исходной.
Если систему АХ= F преобразовать посредством подстановки
_-i __1
X—D 2К и умножением на D 2 слева к виду
D
= D 2/\
матрица которой симметрична и имеет р'авные единице диагональные
элементы, то применение релаксационного процесса с управлением
равносильно применению метода Зейделя к исходной системе.
Таблица III. И
Вычисление последовательных приближений релаксационным процес-
процессом с управлением при q=\
k X
1 F—AX
2
3
4
5
6
7
8
X
9 F—AX
100
X
0
0.3
—0.294
—0.56508
0
—0.16477733
—0.29372899
0
—0.12794835
-0.98675734
—0.98675734
^0.00000007
-r-1.2577936
0
0.5
- 0.104
—0.05664
0.1806936
0.08304778
—0.00291999
0.12044619
0.03514729
0
0
—0.00000004
0.0434874
0
0.7
0.502
0
0.3051432
0
—0.04298389
0.11562976
0.07298031
0.80714320
0.80714320
0.00000003
1.0391661
0
0.9
0
—0.11044
0.2625128
0.19538130
0
0.19386113
0
1.28924243
1.28924243
0
1.4823928
h
4
3
1
3
4
1
4
1
В табл. III. 11 приведены результаты применения полного ре-
релаксационного процесса (^=1) с управлением к системе (9) § 23.
§ 39] РЕЛАКСАЦИЯ ПО ДЛИНЕ ВЕКТОРА НЕВЯЗКИ 253
Последовательные векторы невязки вычисляются по формуле
где через Aj обозначен _/-й столбец матрицы А.
Таким образом, решение системы, с точностью до 2 • 10~7 в каждой
компоненте, получено через 100 элементарных шагов, что эквива-
эквивалентно приблизительно 25 простым итерациям.
Применение процесса с управлением при дк=1.2 приводит
к такому же результату через 52 элементарных шага, при дк — 0.8
через 148 элементарных шагов.
§ 39. Релаксация по длине вектора невязки
Рассмотрим теперь процессы, основанные на минимизации или
уменьшении длины вектора невязки за счет изменения, на каждом
шагу, одной компоненты предыдущего приближения.
Пусть X некоторое приближение и i номер изменяемой компо»
центы. Положим
Х' = Х+Ьег.
Тогда
и потому
(г', г') = {г — ЪАг, г — ЪА{) = (г, г) — 23 (г, Аг) + З2 (^, Л,) =
Здесь Ai — /-й столбец матрицы А. Величина (г', г') будет мини-
минимальной при
а__ (г, Л)
° — (.A* At)'
так что в случае полной релаксации можно взять
Если заданная система предварительно приведена к такому виду,
что все (Аг, Aj)—l (что всегда можно сделать посредством замены
неизвестных xt = .. Xl I, мы будем иметь
Ai)ei B)
= (/-. г) — (г. А?. ... . C).
254 ИТЕРАЦИОННЫЕ МЕТОДЫ РЕШЕНИЯ ЛИНЕЙНЫХ СИСТЕМ [ГЛ. III
Неполная релаксация в этом случае может проводиться по форму-
формулам
X'=X-\-q(r,Ai)ei (О < q < 2), D)
причем
(г', г') = (г, г) — qB_<7){г, А{?. E)
Нетрз'дно видеть, что метод релаксации по длине вектора не-
невязки равносилен релаксационному методу по функции ошибки для
системы А'АХ= A'F, полученной из данной системы AX=F первой
трансформацией Гаусса. Действительно,
(г, r) = (AY, AY) = (A'AY, Y),
где Y вектор ошибки, так что квадрат длины вектора невязки для
системы AX~F есть функция ошибки для системы А'АХ = A'F.
Если последовательность номеров изменяемых компонент задана
a priori (например, если применять циклический процесс), то про-
проведение процесса по формулам B) или D) не требует фактического
выполнения трансформации Гаусса, т. е. вычисления матрицы А'А.
Если же осуществлять управление процессом, требуя на каждом
шагу максимального убывания длины вектора невязки за счет выбора
номера изменяемой компоненты, то, пак справедливо отмечает По»
корна [1], целесообразно предварительно вычислить матрицу А'А
и вести процесс (при (Л,, At) = 1) по формулам
rW = r(*-i)_(-r(ft-i)S
где- 1к номер наибольшей по модулю компоненты вектора г^*, Вг
есть г-й столбец матрицы А'А. Это равносильно проведению рела-
релаксационного процесса с управлением для системы А'АХ = A'F.
§ 40. Групповая релаксация
Пусть AX=F данная система.
Отдельный шаг метода групповой релаксации заключается в сле-
следующем. Выделяется группа G индексов и при переходе от пред-
предшествующего приближения к следующему изменяются только ком-
компоненты с индексами из выбранной группы О. Изменение осуще-
осуществляется так, что уравнения, индексы которых входят в группу G,
удовлетворяются точно. Иначе говоря, изменяемые компоненты суть
решения системы уравнений
2 = /»— S ашхт, A)
где индекс i пробегает всю группу G.
Легко видеть, что если матрица Л положительно-определенная,
то. один шаг групповой, редаксации. минимизирует функцию ошибок
§ 40] ГРУППОВАЯ РЕЛАКСАЦИЯ 255
в подпространстве, натянутом на единичные векторы с индексами,
образующими группу G.
Метод групповой релаксации допускает много модификаций,
в зависимости от принципа выбора групп О на каждом шагу. Про-
Простейшей модификацией является циклический групповой процесс,
в котором все индексы раз навсегда разбиваются на несколько не
перекрывающихся групп и по ходу процесса эти группы циклически
чередуются. Этот процесс может рассматриваться как процесс по-
последовательных приближений при надлежащей подготовке системы.
Для того чтобы показать это, положим, для простоты, что группы
состоят из последовательных индексов и чередование осуществляется
в порядке их возрастания. Обозначим через D квазидиагональную
матрицу, „вырезанную" из матрицы А в соответствии с разбиением
индексов на группы, через L матрицу, состоящую из элементов
матрицы А, лежащих налево от элементов матрицы D, через R мат-
матрицу, состоящую из элементов А, лежащих направо от элементов
матрицы D. Тогда
A = L + D + R. B)
Пусть X приближение, полученное после завершения k циклов
процесса. Тогда Х(к+1) и Х{к\ очевидно, связаны соотношением
и потому
x(k+i) = (i _|_ д)-1 F _ (L._|_ D)-i RX^\ C)
Таким образом, изучаемый процесс равносилен процессу последова-
последовательных приближений, примененному к системе, подготовленной
к виду
Х= — (L + D) RX-{- (L + D) F.
Отсюда вытекает необходимое и достаточное условие сходимости
процесса, которое заключается в том, чтобы собственные значения
матрицы (L-j- D)~1R были по модулю меньше единицы. Если матрица А
положительно-определенная эрмитова матрица, то процесс сходится
всегда. Действительно, в этом случае собственные значения матрицы
(L + Dy^^iR^Dy^ по модулю не превосходят г А°
Здесь через Ло обозначено \\R\\ — || R*\\, через ^.0 — наименьшее соб-
собственное значение матрицы А, через d0 — наименьшее собственное
значение матрицы D. Доказательство этого неравенства проводится
совершенно аналогично доказательству, проведенному для процесса
Некрасова. При этом используется то обстоятельство, что вырезан-
вырезанная матрица D всегда положительно определена. Справедливо нера-
неравенство d0 ^ ^.0.
При свободной групповой релаксации допускается не только' не
циклическое чередование заранее- выбранных групп, но и изменение
256 ИТЕРАЦИОННЫЕ МЕТОДЫ РЕШЕНИЯ ЛИНЕЙНЫХ СИСТЕМ [ГЛ. щ
состава групп на каждом шагу. Как мы видели, отдельный шаг
с выбранной группой <3W осуществляется по формулам
>=*f при ./?<}<*>.
Эти формулы равносильны формулам
1> - *?>] = /* - S «^2?=г?> (/ € cw) D)
Обозначив
получим
x) ¦ ' = x)' {J t U ),
где o'j' есть решения системы
При неполной релаксации вычисление проводится по формулам
.шч F)
где 0 < qk < 2.
Для положительно-определенной матрицы имеет место следую-
следующая теорема сходимости. Если существует число I такое, что
любая последовательность групп длины I содержит каждый
индекс хотя бы раз, и если в < qk < 2 — е, то процесс групповой
свободной неполной релаксации сходится к решению системы.
(Островский [8]).
Доказательство этой теоремы аналогично доказательству соответ-
соответствующей теоремы для одношагового процесса.
Как правило, сходимость группового процесса оказывается более
быстрой по сравнению со сходимостью соответствующего одношаго-
одношагового процесса.
Дополнительная же работа, заключающаяся в решении вспомога-
вспомогательных систем, легко осуществляется при наличии подпрограммы
для решения системы фиксированного порядка;
Конечно, применять метод групповой релаксации имеет смысл
лишь для систем с большим числом уравнений.
ГЛАВА IV
ПОЛНАЯ ПРОБЛЕМА СОБСТВЕННЫХ ЗНАЧЕНИЙ
Под полной проблемой собственных значений понимается про-
проблема нахождения всех собственных значений матрицы А, так же
как и принадлежащих этим собственным значениям собственных век-
векторов (или векторов, образующих канонический базис). Напомним,
что собственными значениями матрицы А называются корни ее
характеристического полинома, т. е. корни уравнения
\A-tE =
Ill—'
, — t
= (_1)»[^_^»-'_ ... -Рп]=0.
Определение компонент собственного вектора требует решения
системы п однородных уравнений с п неизвестными; для вычисления
всех собственных векторов матрицы, вообще говоря, требуется
решить п систем вида
где Xt = (xxi xni) — собственный вектор матрицы А, принадле-
принадлежащий собственному значению ~кг.
Как уже отмечалось в § 1, п. 8 коэффициенты pt характеристи-
характеристического полинома являются, с точностью до знака, суммами всех
миноров определителя матрицы А порядка /, опирающихся на глав-
главную диагональ. Непосредственное вычисление коэффициентов pt
является чрезвычайно громоздким и требует огромного числа опе-
операций.
Совершенно естественно, поэтому, появление специальных вычисли-
вычислительных приемов, упрощающих численное решение поставленных
задач. Большинство методов, дающих решение полной проблемы
собственных значений, включает предварительное вычисление коэф-
коэффициентов характеристического полинома, которое осуществляется
теми или иными средствами, минуя вычисление многочисленных мино-
миноров. Собственные значения вычисляются затем по какому-либо методу
для приближенного вычисления корней полинома. Одним из лучших
17 Зак. 974. Д. К. Фаддеев и В. Н. Фаддеева
258 ПОЛНАЯ ПРОБЛЕМА СОБСТВЕННЫХ ЗНАЧЕНИЙ [ГЛ. 'V
способов приближенного вычисления корней полинома ср (t) = aotn -f-
-f- u1tn~ -f- ... -f- an_xt -f- an является способ Ньютона. Именно, если t0
есть некоторое исходное приближение к корню, то последователь-
последовательные приближения tlt t2, ... вычисляются по формуле
'«-'l-i — ^(ti} 0-1.2. ...).
Если ^0 взято достаточно близко к искомому корню X, то последо-
последовательные приближения ti сходятся к X с квадратичной сходимостью,
т. е. погрешность последующего приближения будет иметь порядок
квадрата предыдущей:
|Х — fi|<c|X —^р,
где с некоторая константа.
Вычисление значений полинома ср (t) и его производной в данной
точке t0 следует проводить по схеме Хорнера:
а0 ау а2 ... an_x an\\t0
а0 Ьх Ъг ... bn_1 bn
а0 с1 с2 ¦ ¦ ¦ cn_i,
которая заполняется по рекуррентным формулам
*« = *<-А+а< (t=l, 2 п)
^ = <Wo + ?i (/=1,2 я—1).
Тогда
Числа же oQ, bx bn_x будут коэффициентами частного р
от деления полинома <p(t) на t —10. Соответственно числа а0,
сг, ..., ?„_! будут коэффициентами частного ср2(/) от деления tfi(O
на t —10.
По большей части собственные векторы матрицы удается опреде-
определить, используя промежуточные результаты вычислений, проведенных
для определения коэффициентов характеристического полинома.
Конечно, для определения собственного вектора, принадлежащего
тому или другому собственному значению, это собственное значе-
значение должно быть уже вычислено. Методы этой группы являются
точными, т. е. если их осуществлять для матриц, элементы которых
заданы точно (рациональными числами) и вычисления проводить точно
(по правилам действий над обыкновенными дробями), то в результате
будет получено точное значение коэффициентов характеристического
полинома, и компоненты собственных векторов окажутся выражен-
выраженными точными формулами через собственные значения.
Наряду с точными методами для решения проблемы собственных
значений имеются методы итерационные, в которых собствен-
собственные значения получаются как пределы некоторых числовых после-
§ 41] УСТОЙЧИВОСТЬ ПРОБЛЕМЫ СОБСТВЕННЫХ ЗНАЧЕНИЙ 259
довательностей, так же как и компоненты принадлежащих им соб-
собственных векторов. В итерационных методах, как правило, соб-
собственные значения вычисляются непосредственно, без предварительного
вычисления коэффициентов характеристического полинома. Это суще-
существенно упрощает задачу, так как вычисление корней полинома, коэф-
коэффициенты которого известны, достаточно трудоемко.
Однако итерационные методы более приспособлены к решению
частичной проблемы собственных значений. Под частичной про-
проблемой мы подразумеваем задачу нахождения одного или нескольких
собственных значений и соответствующих им собственных векторов.
Полная и частичная проблемы собственных значений совершенно
различны как по методам их решения, так и по области приложе-
приложений. Решение полной проблемы для матриц даже не очень высокого
порядка неизбежно оказывается весьма громоздким, и возможность
решения частичной проблемы, минуя тяжести решения полной,
является очень ценной для практики.
Настоящая глава посвящена изложению точных методов для
решения полной проблемы собственных значений. Итерационные
методы решения полной проблемы будут рассмотрены в гл. VIU,
частичная же проблема будет изучаться, начиная со следующей главы.
Отметим, что все предлагаемые ниже методы (как в этой главе,
так и в последующих), кроме метода Леверье A840 г.) и метода
Якоби A846 г.), появились в тридцатых годах нашего столетии или
позднее.
При изложении численных методов мы будем, как правило, пред-
предполагать элементы матриц вещественными.
§ 41. Устойчивость проблемы собственных значений
При постановке проблемы собственных значений для матриц,
элементы которых заданы приближенно, естественно возникает вопрос
об устойчивости полученного решения, иными словами, вопрос о том,
как изменяются собственные значения и собственные векторы при
изменении элементов данной матрицы в пределах допустимой по-
погрешности.
То, что в отдельных случаях проблема собственных значений не
может быть устойчивой, ясно из следующих соображений. Допустим,
что данная матрица, если ее численное задание рассматривать как
точное, имеет лишь простые собственные значения, однако, при
некотором определенном изменении ее элементов в пределах точ-
точности задания можно придти к матрице, имеющей кратное собствен-
собственное значение, с нелинейным элементарным делителем. В этом случае,
каноническая форма матрицы при изменении ее элементов в преде-
пределах точности задания претерпевает качественное изменение,
переходя от чисто диагональной формы к общей канонической
форме. В частности, даже число собственных векторов изменяется
260 ПОЛНАЯ ПРОБЛЕМА СОБСТВЕННЫХ ЗНАЧЕНИЙ [ГЛ. IV
скачкообразно. В этих условиях, конечно, полная проблема собствен-
собственных значений, вместе с определением собственных векторов, просто
теряет смысл. В условиях же, близких к описанной ситуации, про-
проблема определения собственных векторов наверное не имеет устой-
устойчивого решения.
Пусть А данная матрица и A-\-dA близкая к ней матрица.
Выясним как изменяются собственные значения и собственные век-
векторы матрицы А, когда она получает приращение dA. Проведем
подсчет в предположении, что все собственные значения матрицы А
различны, отбрасывая величины второго порядка малости, т. е. будем
рассматривать dA (и соответственно dX и dX) как дифференциалы,
а не как конечные приращения.
Пусть
АХг = ХгХг (i=1, 2, ..., п), A)
Тогда
(dA) Хг-\-А dXi = кг dXi + й\гХг. B)
Пусть V1 Vn — собственные векторы сопряженной матрицы Л*,
соответствующие собственным значениям \ \п. Тогда
((dA) Xt, Vj) + (Л (dXt), Vj) = )H (dXit Vj) + d)H (Xit Vj). C)
Положив в равенстве C) C = j, получим
((dA) Xt, VJ -+- (A (dX^), V-) = (dXit \tVi) H- d)H (Xit Vt).
откуда
ЩА)Хь Vt)
D)
ЙА'~ (Xb Vt)
ибо A'Vi^liVi.
Положим теперь 1ф}. Тогда, в силу равенств (Xit Vj) = 0 и
(A(dXi), Vj) = lj(dXi, Vj), получим
откуда
Пусть
dXi = 2l atiXj. E)
Тогда
(dXit Vj) = aij(Xj, Vj),
и, следовательно,
i, Vj)
((dA)Xt,
(dxit vj) — ^^
§ 41] УСТОЙЧИВОСТЬ ПРОБЛЕМЫ СОБСТВЕННЫХ ЗНАЧЕНИЙ 261
Коэффициент ан остается, естественно, неопределенным, в силу
неоднозначности собственного вектора, и без нарушения общности
можно считать, что аг4 = 0.
Перейдем теперь к оценкам. Из формулы D) получим
, , \\dA\\-\Xt\.\Vt\ _
где
, что Cj ~^> 1. Если собственные векторы вещественны, то
1
' ; cos <fi I '
где ср; угол между векторами Xi и Vi.
Число ct назовем коэффициентом перекоса матрицы Л,
соответствующим собственному значению Хг. Таким образом, измене-
изменение Хг при данной \\dA\\ может быть тем больше, чем больше соот-
соответствующий этому собственному значению коэффициент перекоса Сц.
Для нормальных матриц, в частности, для эрмитовых и унитарных
матриц
\d)H\^\\dA\\,
ибо для нормальных матриц Xi = Vi. Поэтому для нормальных
матриц задача определения собственных значений всегда
устойчива. Для произвольных же матриц задача определения
собственных значений будет не устойчивой только при большом
коэффициенте перекоса.
Что же касается определения собственных векторов, то, как
показывают формулы E) и F),
п
|**|-2'_Гх7|-. (8)
так что задача может быть неустойчивой, только если велик хоть
один коэффициент перекоса или если имеются близкие собственные
значения.
Приведем теперь результаты, касающиеся изменения собственных
значений вещественной матрицы при случайных изменениях элементов
матрицы. Пусть элементы матрицы А являются независимыми случай-
случайными величинами со средними значениями ац и с одной и той же
дисперсией а2. Тогда любое вещественное собственное значение будет
случайной величиной, имеющей в первом приближении дисперсию
с (к) а2, где с (к) коэффициент перекоса, соответствующий этому соб-
собственному значению1). В случае, если ау—д^, т. е. матрица из
1) Д. К. Фаддеев [4].
262
ПОЛНАЯ ПРОБЛЕМА СОБСТВЕННЫХ ЗНАЧЕНИЙ
[ГЛ. IV
средних значений симметрична, но допускаются не симметричные
вариации, дисперсия каждого собственного значения равна о2. Для
симметричных же матриц при допустимых симметричных изменениях
ее элементов такой же результат получается, если предположить,
что дисперсия диагональных элементов равна а2, а недиагональ-
недиагональных 7f °2- Собственные значения в этом случае являются (в первом
приближении) независимыми случайными величинами. Что же касается
коэффициентов характеристического полинома, то их дисперсии могут
быть довольно большими для каждого отдельного коэффициента,
однако при этом коэффициенты будут уже не независимыми и вероят-
вероятные их изменения связаны так, что они не' приводят к большим
изменениям собственных значений. Тем не менее неосторожное окру-
округление коэффициентов в процессе их вычисления может нарушить их
взаимную связанность и привести затем к неправильным значениям
собственных чисел.
Рассмотрим пример, иллюстрирующий сказанное выше. Возьмем
А =
765
7 10 8 7
6 8 10 9
5 7 9 10
, A-\-dA =
5.1
7
6
_5
7
10
8
7
6
8
10
9
5
7
9
10
Как мы видели, матрица А плохо обусловлена. Характеристические
полиномы для матриц А и A-\-dA соответственно будут
*4— 35*3+146*2— 100*+1
35.1/3+
110.6*+7.8,
и потому собственными значениями первой матрицы будут (с точ-
точностью до трех десятичных знаков) числа 0.010, 0.843, 3.858,
30.289, для второй числа 0.079, 0.844, 3.874, 30.303. Мы видим,
что результаты полностью согласуются со сказанным выше. Измене-
Изменение одного элемента матрицы на 0.1 вызвало изменение собствен-
собственных значений самое большее на 0.069, в то время как коэффициенты
характеристического полинома изменились значительно, не только
относительно, но и абсолютно, а именно, максимально на 10.6.
Однако значительно меньшее изменение коэффициентов характери-
характеристического полинома может привести к большему изменению всех
или части корней. Так, если „округлить" коэффициент 35.1, заменив
его на 35.0, то, как легко вычислить, наибольший корень полинома
*4—35*3+149*2—110.6*+7.8 будет 30.185. Тем самым измене-
изменение наибольшего корня превосходит 0.1.
Погрешности, возникающие от возможной неустойчивости, конечно,
не зависят от выбора метода численного решения задачи, в отличие
§ 42]
МЕТОД А. Н. КРЫЛОВА
263
от погрешностей, возникающих от неизбежного округления промежу-
промежуточных результатов. Вопроса об оценке этих погрешностей мы не
будем касаться.
Отметим, что плохая обусловленность матрицы в смысле реше-
решения системы никак не связана с устойчивостью проблемы собствен-
собственных значений. Действительно, плохая обусловленность означает
только, что среди собственных Значений имеются малые по модулю
по сравнению с другими собственными значениями.
§ 42. Метод А. Н. Крылова
Работа А. Н. Крылова [1] явилась первой в большом цикле
работ, посвященных приведению векового уравнения к полиномиаль-
полиномиальному виду.
Идея А. Н. Крылова заключалась в предварительном преобразо-
преобразовании уравнения
= 0
A)
"rel "n2 ¦ ¦ • "nn —
в эквивалентное ему, вообще говоря, уравнение вида
1
-tn h
= 0,
B)
развертывание которого по степеням t осуществляется, очевидно,
значительно проще, при помощи разложения определителя по мино-
минорам 1-го столбца.
Для осуществления указанного преобразования А. Н. Крылов
вводит в рассмотрение дифференциальное уравнение, связанное с дан-
данной матрицей; одновременно он ставит вопрос о нахождении чисто
алгебраического преобразования, переводящего уравнение A) в урав-
уравнение B).
Выяснению алгебраической сущности преобразования А. Н. Кры-
Крылова посвящены работы Н. Н. Лузина [1], [2], И. Н. Хлодовского [1],
Ф. Р. Гантмахера [1], Д. К. Фаддеева [1]. Мы изложим метод
А. Н. Крылова в его алгебраической интерпретации.
Равенство нулю определителя
а22 — t
C)
264
ПОЛНАЯ ПРОБЛЕМА СОБСТВЕННЫХ ЗНАЧЕНИЙ
[ГЛ. IV
есть необходимое и достаточное условие для того, чтобы система
однородных уравнений
txx = а^Ху + апх2
tx2 = а21хг + «22^2
¦ • ¦ + «1А
D)
имела решение jq, х2, ..., хп, отличное от нулевого.
Преобразуем систему D) следующим образом. Умножим первое
уравнение на t и заменим txv .... txn их выражениями D) через
Х1' ¦ • ¦ . Хп.
Это дает
Рху = b2lxt 4- *22^2 + • • ¦ + hn*n. (.5)
где
Умножим далее уравнение E) на ^ и заменим снова txv tx2, . . .
. . ., txn их выражениями через xt xn. Мы получим
Повторяя этот процесс (я—1) раз, мы перейдем от системы D)
к системе
tXy = bnxt 4- bl2x2 4- • • • 4" hnxn
t2xt = b2lXy 4- b.22x2 4- ... 4- b2nxn
G)
t Xy — Ьп1Х1 4" Ьп2Х2 4" ¦ • ¦ ~T~ "nnxn>
коэффициенты которой
формулам
будут определяться по рекуррентным
= 2, .... п; k=l, .... п).
(8)
Очевидно, что определитель системы G) будет иметь вид B).
Система G) имеет ненулевое решение для всех значений t, удовле-
удовлетворяющих уравнению ср(?) = О. Таким образом, D(t) обращается
в нуль при всех t, являющихся корнями уравнения ср(^) —0.
Покажем, что
I 0 ... 0
bn bn ... bln _
(9)
§ 42] МЕТОД А. Н. КРЫЛОВА 265
т. е. при N Ф 0 D(t) отличается от искомого характеристического
полинома только численным множителем.
Пусть все корни ср(^) различны. Так как все корни cp(f) яв-
являются корнями D(f), то D(t) делится на ср(/). Так как, кроме того,
степени D(t) и ср(^) одинаковы, частное должно быть постоянным
(не зависеть от t). Сравнивая коэффициенты при tn, получим
9@
В случае, если ср(Л имеет кратные корни, равенство
(Ю)
сохраняется, что следует хотя бы из соображений непрерывности.
Можно проверить это равенство и непосредственно умножением
входящих в него определителей, если при этом использовать соот-
соотношения (8).
Из равенства A0) видно, что если /V = 0, то D(t) тождественно
равно нулю. В этом случае указанное преобразование ничего не
дает. Однако и при /V = 0 A. H. Крылов предлагает особый прием,
алгебраическая сущность которого будет выяснена ниже.
Обратимся теперь к коэффициентам bik, определяющим D (t).
Введем в рассмотрение векторы Вг с компонентами biv bi2, ..., bin.
Равенства
показывают, что
В{ = А'В^, A1)
где А' — матрица, транспонированная к данной.
Из равенства A1) следует, что
Bi = А'1~ХВХ, A = 2 я).
В свою очередь, В1 = А'В0, где Во = A, 0 0)'. Таким обра-
образом, окончательно,
Bt = A'*B0 (/=1. 2 я). A2)
Очевидно, что преобразовывать систему D) можно, исходя, напри-
например, из второго уравнения этой системы. В этом случае t войдет
во второй столбец определителя D (t), а коэффициенты Ь^ будут
определяться по формулам A2), где Д, = @, 1 0)'.
Метод А. Н. Крылова естественным образом обобщается, если
ввести в рассмотрение вместо вектора Во специального вида про-
произвольный вектор 50 = F01, Ьт 1>Опу.
266
Пусть
ПОЛНАЯ ПРОБЛЕМА СОБСТВЕННЫХ ЗНАЧЕНИЙ
и = b0lxx -4- Ь02х2 + • • • + Ьопхп,
[гл. iv
A3)
где xv x2, ¦¦•, хп решение системы D).
Тогда, повторяя прежние рассуждения, получим:
U = f>olXt + fyJ*2
tu = bnxx -f bl2x2
Pa = b2lxx + Ьг2х2
blnxn
A4)
и = ftnl^ -4- bn2x2
Г ттр fi. (h. h, h. V Л' /¦?
i a*- i-'| v^tl» 12» * * • » uin' 0'"
Рассматривая (и-)-1) равенство A4) как систему линейных одно-
однородных уравнений с п-\-\ неизвестным и, хх хп, получим, что
ненулевое решение возможно в том и только в том случае, когда
определитель
t
= 0.
A5)
tn bnl ... bnn
Повторяя прежние рассуждения, найдем, что
где на этот раз
*02
*12
"п-1,1"п-\.,
"п-1,
A6)
Так же как и для рассмотренного выше частного случая, преоб-
преобразование ничего не дает, если /V = 0.
Предположим поэтому сначала, что N ф 0. На основании
равенства D{t) = Ny(t) коэффициенты р% характеристического
полинома определяются как отношения ——~ , где Л/г суть
N
алгебраические дополнения элементов tn l в определителе D(f).
Определение коэффициентов характеристического полинома через
указанные отношения и составляет сущность работы А. Н. Крылова.
Однако проведенное исследование дает возможность определить
искомые коэффициенты, минуя вычисления миноров, существенно
сократив при этом число нужных операций.
Действительно, ввиду того, что элементы строк определителя A6)
являются компонентами векторов Во, Вх Bn-i< условие N ф 0
§ 42] метод а. н. Крылова 267
равносильно линейной независимости этих векторов. Поэтому
при N Ф О векторы Во, Вх, .. ., Вп_г образуют базис пространства.
Следовательно, вектор Вп является их линейной комбинацией:
Покажем, что коэффициенты этого соотношения и являются
коэффициентами р^ характеристического полинома, записанного
в виде:
T(O = (-l)n [f-pf-1- ... -Рп].
Действительно, отняв от последней строки определителя D(f)
линейную комбинацию предыдущих строк с соответствующими коэф-
коэффициентами ql, цг дп, получим, на основании равенства A7), что
D(t) =
t
q/'1- ...
1 *oi • • • hn
.n-l
Отсюда
D(t)
N
...-а
что и требовалось доказать.
Равенство A7) позволяет находить коэффициенты q1=zpl>
q-i^^Pi, ..., qn=pn как решения системы линейных уравнений,
эквивалентной этому векторному равенству.
Равенство A7) связывает метод А. Н. Крылова с соотношением
Кели — Гамильтона (примененным к матрице А').
Действительно, из соотношения
следует, что
А'пВъ—рхА'п~ Во-\~ ... -\~рпВ0,
т. е.
Bn=PiBn-i+ ¦¦¦ +РпВ0- A7)
Очевидно, что вместо системы A7) для определения коэффици-
коэффициентов рг можно употреблять систему
где векторы Сп определяются равенствами.Сй = АкС0.
Для определения коэффициентов рг при помощи решения системы
A7) или A7') нужно произвести ^я!(п+1) умножений и делений.
268 ПОЛНАЯ ПРОБЛЕМА СОБСТВЕННЫХ ЗНАЧЕНИЙ (г.1. IV
В первоначальной форме метод А. Н. Крылова требовал -д-(«4 +
-|_4га3-)-2л2 — п—3) умножений и делений.
В случае, если Л/ = 0, система, эквивалентная равенству A7), не
дает возможности определить коэффициенты характеристического
полинома, так как определитель этой системы как раз равен N.
Алгебраическая сущность упомянутого приема А. Н. Крылова
заключается в том, что возможно определить коэффициенты полинома
наименьшей степени О (X) такого, что 8 (А)С0 = 0, т. е.
коэффициенты минимального аннулирующего полинома. Вообще говоря,
это будет минимальный полином матрицы, и его корни будут совпа-
совпадать со всеми корнями характеристического полинома, но будут
иметь меньшую кратность. Однако при неудачном выборе вектора Со
вместо минимального полинома может получиться какой-либо его
делитель и тогда часть корней уравнения \А — tE | = 0 может быть
потеряна. Как показали Н. Н. Лузин и И. Н. Хлодовский,*) в качестве
полинома б (t) при специальном выборе вектора Со можно получить
любой делитель минимального полинома. Этот ^результат уже был
отмечен (§ 8, п. 2).
Если минимальный полином матрицы не совпадает с характери-
характеристическим полиномом, то N = 0 при любом выборе вектора Со.
Действительно, в этом случае ф(Л)С0 = 0, и, так как степень поли-
полинома ф(?) меньше и, векторы Со, АС0, ..., Ап~1С0 линейно-за-
линейно-зависимы. Что же касается дополнительного вырождения, то его можно
избежать за счет изменения начального вектора Со.
Итак, метод А. Н. Крылова дает возможность определить коэф-
коэффициенты характеристического полинома, если N ф 0, или некото-
некоторого его делителя, вообще говоря, минимального полинома, если
Д/=0.
Практически обстоятельство /V = 0 обнаружится само собой
в процессе прямого хода при решении системы A7) по методу
Гаусса. Именно, в части ypaei e :ий исключатся все коэффициенты
одновременно, так что эти уравнения обратятся в тождества
0 = 0. Эти уравнения (пусть число их равно п — т) нужно от-
отбросить; в оставшейся системе надо отбросить п—т последних
столбцов, начиная со столбца свободных членов (т. е. со столбца
из компонент вектора Сп). Последний из оставшихся столбцов, со-
составленный из компонент вектора Ст, надо принять за свободный
член новой системы. Решение системы дает коэффициенты линейной
зависимости Ст от Со, Cl Cm_v т. е. коэффициенты минималь-
минимального аннулирующего вектор Со полинома.
Разберем теперь два примера, оба взятые из статьи
А. Н. Крылова [1].
1) Н. Н. Лузин [1], [2]; И. Н. X до до в,с кий [1].
§ 421
МЕТОД А. н. кРЫЛбВА
269
В качестве первого примера определим коэффициенты характе-
характеристического полинома для матрицы
—5.509882
0.287865
0.049099
0.006235
1.870086
-11.811654
4.308033
0.269851
0.422908
5.711900
-12.970687
1.397369
0.008814-
0.058717
0.229326
-17.596207
взятой А. Н. Крыловым из работы Леверье [1]. По вычислениям
Леверье
? (t) = f+ 47.8884301*+ 797.2789t2 + 5349.4571 -f 12296.555;
>n = — 17.86303; X2=.—17.15266; X3 = —7.57404; ).4==—5.29870.
В табл. IV. 1 мы приводим схему вычислений коэффициентов рь
рассматривая их как решения системы A7').
Таблица IV. I
Вычисление коэффициентов характеристического уравнения
по методу А. Н. Крылова
I
II
III
Q
1
0
0
0
1
Ci
—5.509882
0.287865
0.049099
0.006235
—5.166683
1
1
с»
30.917951
-4.705449
• 0.334184
0.002224
26.548910
-16.34603
1.136758
0.104141
1
1
Q
— 179.01251
66.38829
—23.08728
—0.649152
—136.3606
1 230.62300
—34.41064
—2.087086
—30.27086
1.065352
1
Q
1100.7201
-967.5973
576.5226
—4.04004
705.6054
—3361.2884
741.5585
16.91759
652.3451
—51.01828
—47.8887
—797.287
-5349.53
—12296.8
948.11566
-905.62659
553.81860
—4.68073
-3146.0115
708.28462
14.93465
623.0742
—49.95292
—46.8887
-796.287
—5348.53
—12295.8
Здесь в части I расположены последовательно вычисляемые ком-
компоненты векторов АкС0 (k — 0, 1, 2, 3, 4) и обычные контрольные
270
ПОЛНАЯ ПРОБЛЕМА СОБСТВЕННЫХ ЗНАЧЕНИЙ
[ГЛ. IV
суммы. В строке II осуществляется контроль, аналогичный приме-
применявшемуся в § 30 при вычислении последовательных итераций.
В III части содержится решение полученной системы, которое мы
находим по схеме единственного деления.
Окончательным контролем вычисления коэффициентов рг является
сравнение значения pt со следом матрицы. Так как Sp А = — 47.888 430,
мы видим, что значение рх, найденное из решения системы, доста-
достаточно точно.
Сравнение с данными Леверье показывает, однако, что коэффи-
коэффициенты вычислены с меньшей степенью точности. Известная потеря
точности является органическим недостатком метода А. М. Крылова
и объясняется тем обстоятельством, что коэффициенты системы,
определяющей pit являются величинами различных порядков, что
приводит, как правило, к не очень хорошей обусловленности системы.
Несколько лучший результат можно получить, применяя для реше-
решения системы схему главных элементов.
В качестве второго примера возьмем еще одну матрицу из статьи
А. Н. Крылова [1]:
5 30 —48'
3
3
14 —24
15 —25
A8)
В приведенной ниже таблице три первых строчки содержат коэф-
коэффициенты системы для определения qf
1
0
0
5
3
3
0
-29
-15
-15
0
125
63
63
0
Уже первый шаг процесса Гаусса показывает, что здесь имеет место
случай вырождения. Урезанная система
<7i + 5?2 = — 29
3^2=: — 15
дает в качестве решения д2 = — 5, qy — — 4. Таким образом, в этом
случае мы определили коэффициенты полинома второй степени
^2 —[— 5/ —j— 4, являющегося лишь делителем характеристического
полинома.
На практике при пользовании методом Крылова ситуация точного
вырождения может появиться лишь при особых обстоятельствах
(например, когда по существу физической задачи, приводящейся
к исследованию собственных значений матрицы, эта матрица по физи-
§43] ОПРЕДЕЛЕНИЕ СОБСТВЕННЫХ ВЕКТОРОВ ПО МЕТОДУ А. Н. КРЫЛОВА 271
ческому смыслу должна иметь минимальный полином, отличный от
характеристического). Чаще встречается случай приближенного вы-
вырождения. В этом случае система уравнений A7) (или A7')) оказы-
оказывается плохо обусловленной, но это не портит дела. Действительно,
проводя процесс прямого хода решения системы по методу исклю-
исключения, нужно лишь остановиться, когда коэффициенты всех уравне-
уравнений, начиная с некоторого, почти исчезнут в пределах точности
вычисления, и далее действовать так, как будто они обратились в нуль
точно.
В заключение заметим, что для матрицы вида
«1
«21 «22 '
О а3, .
«2»
О О
при условии, что элементы а21, а32 ап-\, п отличны от нуля,
система уравнений A7), построенная исходя из начального вектора
'1 "I
О
О
будет треугольной, ибо у вектора АС0 все компоненты, кроме пер-
первых двух, равны нулю, у вектора А2С0 все компоненты, кроме пер-
первых трех, равны нулю и т. д. В частности, отмеченное обстоятельство
будет иметь место для трехдиагональной матрицы.
§ 43. Определение собственных векторов
по методу А. Н. Крылова
Предположим, что методом А. Н. Крылова найдены коэффициенты
характеристического полинома и что все собственные числа вычислены
и оказались различными. Покажем, как, используя проведенные
вычисления, определить собственные векторы матрицы. Пусть Со
исходный вектор в процессе А. Н. Крылова и пусть Хи Хг Хп
собственные векторы матрицы А, принадлежащие \, \< • • • • ^п-
Согласно теореме 6.3 векторы Xlt ..., Хп линейно-независимы.
Разложим вектор Со по собственным векторам:
A)
272 ПОЛНАЯ ПРОБЛЕМА СОБСТВЕННЫХ ЗНАЧЕНИЙ [ГЛ. IV
Тогда
С, = АС0 = а^Х, + а2Х2Х2 + .. . -f- лп\пХ„
B)
Векторы Сх, С2 С„_! вычислены в процессе нахождения соб-
собственных чисел. Покажем, что собственные векторы могут быть
получены в виде линейных комбинаций
P«A.-i + fcA_2+ ••• H-Pin-A а=\, 2 п)
при подходящем выборе коэффициентов ру. Рассмотрим линейную
комбинацию:
-4-
(X2) X2 + . . . + an<Pl (Х„) А„. (З)
где
<P1(O=Pio<nH-Pi/l+ ¦•¦ +Pi,»-i- D)
Подберем коэффициенты {310 p, n_x так, чтобы
<Pi (>-i) Ф 0, cf! (X2) = ... = .p, (Xn) = 0. E)
Для этого достаточно взять в качестве срх (^) полином
-PSn-1~----Pn. F)
Здесь y(t) — характеристический полином, коэффициенты и корни
которого уже вычислены.
Коэффициенты частного F) легко вычисляются по схеме Хорнера,
т. е. по рекуррентным формулам
Таким образом,
т. е. составленная нами линейная комбинация есть собственный век-
вектор Хх с точностью до численного множителя. Конечно, коэффи-
§44]
МЕТОД ХЕССЕНБЕРГА
273
циент ах должен быть отличным от нуля; это обеспечивается успешным
завершением процесса А. Н. Крылова. Так как собственный вектор
определен с точностью до постоянного множителя, мы можем при-
принять за собственный вектор построенную линейную комбинацию.
Аналогично
j=o
где
Ji0 —
j—\ п — 1.
(8)
О)
В качестве примера вычислим собственный вектор матрицы Леверье,
принадлежащий собственному числу Х4 = — 5.29870.
Выпишем характеристическое уравнение с коэффициентами, взя-
взятыми из табл. IV. 1:
3 t-\- 12296.8 = 0.
Вычисляя числа {34^ при j = 0, 1, 2, 3, получим
1; 42.5900; 571.615; 2320.71.
Составим линейные комбинации по формуле (8), располагая вычисле-
вычисления в таблице:
Таблица IV. 2
Вычисление собственного вектора по методу А. Н. Крылова
P43Q
2320.71
0
0
0
—3149.53
164.548
28.066
3.5640
'\>i\C<>
1316.80
-200.405
14.233
0.0947
hoCs
—179.01
66.388
—23.087
—0.6492
^4
308.97
30.531
19.212
3.0095
1
0.098815
0.062181
0.009741
Последний столбец содержит компоненты собственного вектора Х4,
нормированного так, что его первая компонента равна единице. Ниже
мы увидим, что значения компонент собственного вектора, вычислен-
вычисленного по методу А. Н. Крылова, хорошо согласуются со значениями,
вычисленными другими методами.
§ 44. Метод Хессенберга
В методе Хессенберга 1), так же как и в методе Крылова, разы-
разыскивается нулевая линейная комбинация векторовС0, АС0, .. ., Ап~1С0.
В то время как в методе Крылова коэффициенты такой линейной
!) Цурмюль [3].
18 Зак. 974. Д. К. Фаддеев и В, Н. Фаддеева.
274
ПОЛНАЯ ПРОБЛЕМА СОБСТВЕННЫХ ЗНАЧЕНИЙ
[ГЛ. IV
комбинации находятся посредством решения системы линейных урав-
уравнений A7), в методе Хессенберга искомая линейная комбинация полу-
получается как последний вектор в рекуррентно строящейся последова-
последовательности векторов Z,, ..., Zn, Zn+1 при Zl = CQ таких, что у век-
вектора Zj+l первые j компонент равны нулю. Каждый последующий
вектор получается итерацией предшествующего с последующим „ис-
„исправлением" посредством добавления подходящей линейной комбина-
комбинации всех предшествующих векторов. Иначе говоря,
zj и =
"О
(О
В качестве вектора Zt удобно взять вектор A, 0, ..., 0)'. Указан-
Указанный процесс не всегда возможно осуществить. Естественное течение
процесса нарушается, если на каком-либо шагу получится гц — 0.
Рассмотрим основной случай, предполагая zu Ф 0, .... znn Ф 0,
В этом случае векторы Z:, . . ., Zn оказываются линейно-независимыми,
так что матрица
Z = [Zu Z2, . . ., Zn\
будет неособенной. Ясно, что
j b B)
где <pj (t) = t*-\~ .. . —некоторый полином степени J. В силу линей-
линейной независимости векторов Zx, ..., Zn равенство /(A)Z1 = 0 не-
невозможно, если только степень полинома / меньше п. Полином же ср„
аннулирует Zx и его степень равна я. Следовательно, полином срп
совпадает с характеристическим полиномом матрицы А.
Полиномы
очевидно, связаны рекуррентными соотношениями
C)
где t?0(t)=l (j = 1
п).
Таким образом, коэффициенты характеристического полинома опре-
определяются, как только известны все коэффициенты Лу.
Нетрудно видеть, что система векторных равенств
Z2 = AZl-\-hnZ1
§44]
МЕТОД ХЕССЕНБЕРГА
275
равносильна матричному равенству
AZ-\-ZH=Q,
где
Н-.
Аи
— 1
0
0
hz
h22
— 1
0
j
Кп
hn
""nn _
D)
E)
Последнее равенство позволяет последовательно определять все эле-
элементы матриц Н и Z.
Для уяснения вычислительной схемы целесообразно равенство
AZ-\-ZH—Q представить в форме
Здесь (A Z) и \~п\ прямоугольные матрицы, составленные из
матриц A, Z и Н в указанном порядке. Составим теперь следующую
схему
«11 «12 ¦ • • «Ш 2а 0 . . . О
^22
О
Zn\ Zn2
— 1 /г22
0 0 ... —\ hnn
Первые п строк этой схемы образованы матрицей (А | Z), послед-
последние п столбцов матрицей (ттЬ В начале процесса нам известна мат-
трица А и первый столбец матрицы Z. Умножение 1-й строки ма-
матрицы (А | Z) на 1-й столбец матрицы (jj) позволяет определить
элемент hn, умножение остальных строк на 1-й столбец матрицы
\-о) — элементы z22, , . ., zn2 соответственно. Как только определены
эти элементы, умножение матрицы (А \ Z) на 2-й столбец матрицы 1-тЛ
дает последовательно элементы Л12, А22, z33, .. ., zn3. Далее произ-
производится умножение матрицы (А | Z) на 3-й, . . ., и-й столбцы ма-
матрицы (-и). Вычисления допускают обычный контроль при помощи
составления строчных сумм.
18*
Таблица IV. 3
Определение коэффициентов характеристического полинома по методу Хессенберга
—5.509882
1.870086
0.422908
0.008814
1
0
0
0
¦ (-
0.287865
—11.811654
5.711900
0.058717
0
0.287865
0
0
0.049099
4.308033
—12.970687
0.229326
0
0.049099
1.1367579
0
0.006235
0.269851
1.397369
—17.596207
0
0.006235
0.10414110
1.0653609
2
—5.166683
—5.363684
—5.438510
—17.299350
1
0.343199
1.2408990
1.0653609
D)
l
0
0
0
—5.509882
—1
0
0
0
0.287865
0.049099
0.006235
—0.55915162
10.836146
j
0
0
0
1.1367579
0.10414110
-0.48166191
-22.577119
13.924832
1
0
0
0
1.0653609
-0.00939009
—0.21730602
—0.20553668
17.617570
4
0
0
0
0
1
3
0
0
0
1
47.888430
2
0
0
1
30.270860
797.27877
1
0
1
16.346028
264.18531
5349.4555
0
j
5.509882
59.146734
698.72941
12296.551
%(D
1
E.509882
76.492762
994.18558
18492.173
О
1
2
3
4
§ 44] МЁТбд хёссёнвёрга 277
При осуществлении вычислений на настольных машинах целесооб-
целесообразно вычисления расположить в форме
"Л' Z
Г Н
и заменить умножение строк на столбцы умножением столбцов. Двой-
Двойная запись матрицы Z оправдывается простотой действий.
Коэффициенты характеристического полинома определяются парал-
параллельно с определением чисел кц по рекуррентным соотношениям,
вытекающим из соотношений C). Для контроля рекуррентно вычис-
вычисляются значения полиномов при ?=1, равные суммам их коэффи-
коэффициентов.
В табл. IV. 3 определяются коэффициенты характеристического
полинома матрицы Леверье.
Для контроля была вычислена левая часть равенства D). Наи-
Наибольший по модулю элемент полученной матрицы оказался рав-
равным 0.0000004.
Как только собственное значение найдено, легко определяется
принадлежащий ему собственный вектор. Действительно, матричное
равенство D) показывает, что А== — ZHZ, т. е. что матрица А
подобна матрице —Н. Следовательно, собственный вектор Xi ма-
матрицы А, принадлежащий собственному значению Xi связан соотно-
соотношением
с собственным вектором Уг матрицы Н, принадлежащим собствен-
собственному значению —X,-. Собственные же векторы для матрицы Н опре-
определяются без труда, так как произвольно задавшись последней
компонентой собственного вектора, мы определим остальные его ком-
компоненты из системы линейных уравнений:
F)
— .Уп-1 +(*п»+ *).?» = 0
с треугольной матрицей. Отброшенное первое уравнение можно
использовать для контроля.
В качестве примера определим по табл. IV. 4 собственный вектор
матрицы Леверье, принадлежащий наименьшему по модулю собствен-
собственному значению. Приближение к этому собственному значению, вычис-
вычисленное как корень полинома
47.888430*3 -4- 191.218ПР + 5349.4555^ + 12296.551,
равно —5.298700.
Результат подстановки компонент вектора К4 в первое уравнение
системы F) равен —0.0007.
278
ПОЛНАЯ ПРОБЛЕМА СОБСТВЕННЫХ ЗНАЧЕНИЙ
[ГЛ. IV
Таблица IV. 4
Определение собственного вектора по методу Хессенберга
0.2Ш82
—1
Н+\Е
—0.559152
5.537446
|
— 0.481662
—22.577119
8.626132
—1
—0.009390
—0.217306
—0.205537
12.318870
у*
308.95220
106.05866
12.318870
1.000000
308.9522
30.5306
19.2109
3.0095
*4
1.000000
0.098820
0.062181
0.009741
К изложенному методу можно подойти с несколько иной точки
зрения. Именно, метод может быть истолкован как метод приведения
данной матрицы А преобразованием подобия к специальному виду
h
hl2 ...
h,
— 1 h,
22
0 0
причем преобразующая матрица Z выбирается треугольной. Поли-
Полиномы cpj (t), f2(t) 9п@> как легко видеть, будут характеристи-
характеристическими полиномами для матриц
— 1
h
22 _
"А
A,.
0 —1
h3
и т. д.
Действительно, развертывая характеристический определитель такой
матрицы по элементам последней строки, мы придем к прежним ре-
рекуррентным соотношениям C).
Рассмотрим теперь исключительные случаи, которые могут встре-
встретиться по ходу процесса.
Может случиться; что на 1-й шагу процесса гн — 0, но хотя бы
одна компонента вектора Z{ отлична от нуля. В этом случае, мы,
заполняя столбец для Zi+V поставим в него нули только на тех
местах, на которых фактически можно добиться нулевого значения
за счет добавления линейной комбинации предыдущих столбцов. Про-
Процесс продолжается дальше таким же образом. Если при этом ока-
окажется, что мы построим п ненулевых векторов Zx Zn, то они
автоматически будут линейно-независимыми, и матрица Z (в данном
случае уже не треугольная, но получающаяся из треугольной пере-
перестановкой столбцов) будет осуществлять подобное преобразование
матрицы А в матрицу Н. Но может случиться, что на каком-либо
шаге мы придем к нулевому вектору. Это, очевидно, произойдет
§ 44]
МЕТОД ХЕССЕНБЕРГА
279
в том и только в том случае, когда векторы Zt, AZX Ап Zx
линейно-зависимы, т. е. когда минимальный аннулирующий полином
для Zx есть только делитель характеристического полинома.
В этом случае, дойдя до нулевого вектора мы прекращаем про-
процесс. Последний полином ср, (t) будет минимальным аннулирующим
полино.мом для вектора Zx и его корни будут образовывать лишь
часть спектра собственных значений.
Рассмотрим два примера, иллюстрирующих оба возможных исклю-
исключительных случая (табл. IV. 5 и табл. IV. 6).
Из табл. IV. 5 мы видим, что в первом примере уже 222 = 0.
Однако процесс все же удается довести до конца.
Таблица IV. 5
Метод Хессенберга в вырожденном случае
2
1
—1
j
1
0
0
0
0
2
2
6
0
0
0
14
3
1
1
2
0
3
0
0
]
1
3
7
0
—1 ,
7,3
0
1
0
0
0
—2
—1
0
0
0
0
3
}
2
—1/3
1
0
0
0
0
7,3
7/3
—149
—23/3
—1
0
14
0
0
—14
—14/3
—8
—2
Опишем кратко ход процесса. Последовательно определяем: из A X 1)
йц = — 2, из B X 1) 222 = 0, изCX1) 232 = 3. Это позволяет счи-
считать гъъ = ги = 0. Далее из D X 1) определяем zi2 = — 1, из A X 2)
1
/?12 = 2, из BX2) 223 = 0, из C X 2) /z22 = —
3 '
из DX2)
7 7
243 = тг. Полагаем 244 = 0. Из (I X 3) определяем А13 = -=-, из B X 3)
о ' о
14
23
224= 14, из C X 3) h23 = —-g, из DX3) /г33 = —-j. Наконец, из
AX4) определяем А14 = — 14, из B X 4) Й44 = —2, из CX4)
/г24 = —^4. из DX4) hu = — 8.
После определения матрицы Н определяем характеристический
полином, как указано выше.
В качестве второго примера рассмотрим матрицу A8) из § 42.
В этом случае (табл. IV. 6) Z3 = @, 0, 0/, и мы вычисляем лишь
делитель характеристического полинома.
280
ПОЛНАЯ ПРОБЛЕМА СОБСТВЕННЫХ ЗНАЧЕНИЙ [ГЛ. IV
Таблица IV. 6
5
3
3
1
0
0
Метод Хессенберга в
30
14
15
0
- 30
0
—48
—24
—25
0
—48
0
вырожденном случае
1
0
0
1
—5
—1
0
0
30
—48
54
10
—1
0
0
0
Именно, имеем
=1, <pl = t— 5, ср2 = (t -j- 10) (t — 5) -(-54 =
В заключение этого параграфа заметим, что при вычислении
коэффициентов характеристического полинома можно избежать исполь-
использования рекуррентных соотношений для полиномов ср»- Вместо этого
можно находить характеристический полином срп (или его делитель
в случае вырождения) непосредственно применяя способ А. Н. Кры-
Крылова1) к матрице— W, что приводит, как мы видели выше, к решению
треугольной системы. Так, в последнем примере надо применить
метод А. Н. Крылова к матрице
Имеем
'5 —54"
1 —10
Следовательно, коэффициенты полинома ср2 определяются из системы
Рг — 5Л = — 29
Pi = — 5,
откуда pt = — 5, р2 = — 4 т. е. <р2 = t2 -j- 51 -\- 4.
§ 45. Метод Самуэльсона
Близким к методу А. Н. Крылова является также и метод, пред-
предложенный Самуэльсоном [1].
1) С ей б л, иБержер [1].
§45]
МЕТОД САМУЭЛЬСОНА
281
Вычислительная схема этого метода такова. Вычисляется прямо-
прямоугольная матрица
¦ (О
R
RM
RNP
ДО"
0
0
0
1
0
0
0
-«11 -
0
0
0
-RS -
0
0
0
-RMS . . .
0
0
1
0
1
—ап
1
—ап
—RS
—«и
—RS
—RMS
—RMn
5_
где R, S и М клетки в следующем разбиении данной матрицы
А —
«И 1 «12 • ¦ • «in
«21 ! °22 ¦ • • п2п
_ ап\ ¦ «п2 • • ¦ «яге
«и Я
S М
B)
Далее, посредством элементарных преобразований (как это де-
делается в задаче исключения § 22) нужно добиться того, чтобы на
месте строки RMn~x оказалась нулевая строка. Тогда остальные
элементы последней строки дадут, вообще говоря, коэффициенты харак-
характеристического полинома. Процесс исключения, как мы видели, очень
однообразен и прост. Это является основным достоинством схемы.
Автор выводит указанную схему из преобразования системы ли-
линейных дифференциальных уравнений, связанной с матрицей, к одному
дифференциальному уравнению порядка п посредством специального
приема исключения. Краткое алгебраическое обоснование схемы за-
заключается в следующем.
Пусть
C)
произвольный i
зектор.
Пусть далее
АХ0 =
хп
Х21
— хп\ _
V
-Ух _
; ¦-.;
~ X
X
А"'
\п
пп
Г
_
•"¦Ire
Уп
X
X
X
1, и -
', 71 —
1,« —
•
1
!
1 _
Ч, п 1
у
'п
D)
282 ПОЛНАЯ ПРОБЛЕМА СОБСТВЕННЫХ ЗНАЧЕНИЙ [ГЛ. IV
Из построения следует, что
xlk = allxhk.l-j-RYk_1 . E)
^ = &U-! + ^^-l (*=1 Л)- F)
Таким образом, мы имеем я2 соотношений (п и п(п— 1)) между
пг-\-п величинами. Они дают возможность исключить из системы
равенств E) и F) векторы YY Кп, т. е. п(п—1) величин.
В результате этого исключения останется п равенств, связывающих
2« чисел, именно, компоненты вектора Ко и числа х10 х1п.
Проведем это исключение. Имеем при &=1, 2, ..., п:
х1к = <2плг1]й_, ~
;- ly
ИЛИ
Коэффициенты этих п равенств образуют, очевидно, матрицу A).
Исключая из этих п равенств компоненты вектора Ко, мы полу-
получим одно линейное соотношение между числами х10 х1п с по-
постоянными коэффициентами, не зависящими от выбора исходного
вектора.
С другой стороны, исходя из соотношения Кели — Гамильтона,
мы имеем
Х\п Р\х1,п-1 ••• РпхЮ== "•
Это равенство тоже является линейной зависимостью между числами
х10, . .., х1п с постоянными коэффициентами, не зависящими от вы-
выбора вектора.
Эта зависимость будет совпадать с зависимостью, полученной
методом исключения, в том случае, если матрица А такова, что мы
вправе считать числа х10 хи n_t независимыми переменными,
т. е. если мы можем им придавать независимо друг от друга произ-
произвольные значения за счет подходящего выбора остальных компонент
исходного вектора Хо или,, иными словами, за счет вектора Ко.
Более строго обосновать метод Самуэльсона можно посредством
следующего соотношения между коэффициентами характеристических
полиномов окаймленной и окаймляемой матриц.
§ 45] МЕТОД САМУЭЛЬСОНА 283
Пусть
-'+..- +Рп)
-'+ • • • +Чп-д }
характеристические полиномы матриц А и М. (Мы, вопреки обычной
записи полиномов, изменили знак у коэффициентов рк и qk).
Тогда справедливы следующие соотношения:
p2 = — RS — qlan + q2
Эти соотношения получаются из правила раскрытия окаймленного
определителя.
Далее, если применить к матрице М метод А. Н. Крылова,
приняв за исходный вектор R' (с компонентами а12, .. ., а1п), то
коэффициенты qlt q2, .. ., qn_x будут определяться из системы
уравнений
M'n-xR> + qiM'n-2R'+ ... 4-«7п_1Я' = 0. A0)
Коэффициенты ри р2 рп являются в силу соотношений (9)
линейными неоднородными формами от qy, ..., </n-i и, следова-
следовательно, могут быть одновременно вычислены методом исключения
(см. § 22). Из двух возможных модификаций метода исключения
следует взять ту, в которой компоненты векторов R', M'R', . . .
.... УИ'™/?' располагаются в строки схемы. Тогда эти строки,
рассматриваемые как матрицы, суть R, RM RM11'1. При этом
коэффициенты соотношений (9) окажутся расположенными точно
в согласии со схемой Самуэльсона. Из приведенного выше обосно-
обоснования метода легко выяснить область его применения. Действительно,
она совпадает с областью применимости метода А. Н. Крылова для
матрицы М, исходя из вектора R'.
В качестве примера возьмем снова матрицу Леверье. Вычисления
коэффициентов характеристического полинома произведем согласно
описанной схеме (см. табл. IV. 7). Сначала мы вычисляем матрицу A),
располагая ее элементы в первых четырех строках. Далее проводим
исключение, как было показано в § 22. Последняя строка дает
искомые значения коэффициентов, которые почти в точности сов-
совпадают со значениями, вычисленными по методу А. Н. Крылова,
Последний столбец, как обычно, есть контрольный столбец.
Таблица IV. 7
Определение коэффициентов характеристического полинома по схеме Самуэльсона
1.870086
—20.264529
261.81060
—3882.0495
1
0.422908
5.208653
—183.23653
3870.8749
0.226144
9.791355
—242.44343
4748.777
1
0.008814
0.051697
—0.905064
—10.72254
0.004713
0.147204
—2.138977
7.57356
0.015034
1.505942
—63.82003
1
0
0
0
1
0
0
0
1
0
0
1
0
1
0
0
1
5.509882
0
0
1
5.509882
0
1
5.509882
0.664036
47.88868
0
1
5.509882
-0.559152
0
1
5.509882
—0.559152
0.102131
30.270872
—485.5565
20.10095
797.287
1
5.509882
—0.559152
5.577387
0.534735
16.346035
-140.55844
2081.445
1.669435
264.18511
-5846.330
175.42847
5349.52
5.509882
- 0.559152
5.577387
—66.36373
2.946325
59.146736
—765.80173
11371.416
6.040710
698.72872
—17314.569
463.98116
12296.72
8.811690
—9.053449
89.197123
—76.73275
4.711917
86.431330
—1144.4327
18215.162
8.827310
995.6906
—23703.765
661.17460
18492.42
§ 46]
МЕТОД А. М. ДАНИЛЕВСКОГО
285
Число операций, нужных для определения коэффициентов харак-
характеристического полинома, по методу Самуэльсона немного меньше,
чем в методе А. Н. Крылова. Действительно, составление матрицы A)
требует п(п— IJ умножений, а процесс исключения в схеме Самуэль-
Самуэльсона требует столько же операций сколько решение системы в методе
А. Н. Крылова.
§ 46. Метод А. М. Данилевского
Элегантный и весьма эффективный метод вычисления коэффи-
коэффициентов характеристического полинома предложен А. М. Данилев-
Данилевским [1]. Геометрический смысл этого метода состоит в следующем.
Данная матрица А рассматривается как матрица оператора в базисе
е, = A. О,..., 0)', е2 = @, 1 0)' е„ = @, 0, .... 1)'.
Предполагается, что векторы ех, Аех Ап
Тогда
В базисе ех, Aev . . ., An~1e
ех линейно-независимы.
Ясно, что коэффициенты pv p2, ¦ ¦ ¦, рп суть искомые коэффи-
коэффициенты характеристического полинома.
1ei рассматриваемый оператор, очевидно,
будет иметь так называемую матрицу Фробениуса
О ... рп
О
Р~
1
_о о ...
содержащую в явном виде искомые коэффициенты характеристи-
характеристического полинома.
к базису е,
п~1е
Ае1г ..., А}
1 шагов. Каждый шаг состоит
А
к~1е
к базису
еп. Для осуществимости всего
ек+1,
Переход от базиса еи е2
осуществляется постепенно в п
в переходе от базиса ех, Аеу
ех, Аеи ..., A ~lev A'ev ekn, .
процесса необходимо считать, что все промежуточные системы векто-
векторов действительно являются базисами, т. е. состоят из линейно-не-
линейно-независимых векторов. Ниже будет рассмотрено, как следует поступать
в случаях вырождения. Пока же мы будем рассматривать лишь не-
невырожденный процесс.
Обозначим через А матрицу, полученную при k—1-м шаге
процесса, так что A = A
ру
= A{i\ Р = А{п)
А{п). Столбцами матрицы Л(/с)являются .
h
координаты векторов Aev Агех Ahev Аек+Х, .... Аеп в базисе
286
ПОЛНАЯ ПРОБЛЕМА СОБСТВЕННЫХ ЗНАЧЕНИЙ
[ГЛ. IV
Aex, ..., Л*
ek+v
еп. Поэтому первые k — 1 столбцов
матрицы Ау ' будут совпадать с одноименными столбцами матрицы
Фробениуса Р. Имеем
где Sk
что
соответствующая матрица преобразования координат. Ясно,
1 ...
0 . . .
0 . . .
sh
S-2,
sn,
ft + 1 • •
k + l ¦ ¦
fe + l ¦ •
. 0
. 0
. 1_
где sljft41, 52ift+1 sn, й+1суть координаты вектора Акех в базисе
еи Аеъ . . ., Ак~1е1, ек+1> . . ., еп. Эти координаты, как мы видели
выше, суть не что иное, как элементы аЦ? й-го столбца матрицы А^к\
Имеем далее
5*' =
0 . . . —
1
sk+\, fen
. . 0
о ... —-
l.ft+1
Вычисление матрицы А + целесообразно проводить в два приема.
Сперва вычисляется вспомогательная матрица В(к) = Sk~1A<-k\ Это дей-
действие, в силу строения матрицы Sj^ состоит в том, что (й-(-1)-я
строка матрицы
умножается на —щ—, а от каждой из осталь-
остальных строк отнимается полученная (?-)-1)~я строка матрицы В ',
умноженная на соответствующий элемент &-го столбца матрицы А(к\
Очевидно, что в результате этих действий первые (ft—1) столбцов
не изменятся, в k-м же столбце на (&+ 1)-м месте окажется еди-
единица, а все остальные элементы станут нулями. Вычисления осталь-
остальных элементов матрицы В^ ' будут двухчленными, напоминающими
вычисления метода Гаусса. Полученная матрица ВD) умножается затем
§ 46] МЕТОД А. М. ДАНИЛЕВСКОГО 287
справа на S^. При этом изменяется только один, именно (А-|-1)-й
столбец. Его элементами будут, как нетрудно видеть,
jk • • ¦ • > 2U "nj ajk
Иначе говоря, (A-f- 1)-й столбец матрицы Д(й+1) есть результат ите-
итерации А-ro столбца матрицы А(к) матрицей В(Л).
Таким образом, переход от матрицы А к матрице А- +1^ про-
происходит по формулам
. \к) _ 1 (ft)
Vk+l,j — —(ft) ' uk + l,j
ak lk
В качестве примера мы снова возьмем матрицу Леверье.
Поясним табл. -IV. 8. В графах 2, 3, 4, 5 последовательно
записываются матрицы Л*1', J3 , В1-2' и В . Графы 6 и.7 контроль-
контрольные, графа 6 содержит суммы строк матриц В' ', графа 7 суммы
строк матриц Лк\ В графу 1 записываются &-е столбцы матрицы Л(А:),
вычисление которых сопровождается обычным контролем. Коэффи-
Коэффициенты характеристического полинома располагаются, таким образом,
в четырех последних строках графы 1. Так как они вычисляются
одновременно, контрольное совпадение рх со следом матрицы является
вместе с тем и показателем точности вычисления остальных коэф-
коэффициентов; полученные результаты ближе к данным Леверье, чем ре-
результаты, найденные по методу А. Н. Крылова и методу Самуэльсона.
Число операций, нужных для вычисления по методу А. М. Дани-
Данилевского, значительно меньше, чем по двум указанным методам,
и, как мы увидим ниже, меньше, чем по другим методам.
Именно, число умножений и делений на &-м шагу будет
я — А Н- (я — А) (я — 1) + (я — А) я = 2я (я — А),
и потому общее число умножений и делений будет я3 — я2.
Метод A.M. Данилевского позволяет вычислять собственные векторы
как самой матрицы А, так и ее транспонированной. Действительно,
так как
S~1AS = P. A)
где
о = Oj o2 ... on_it B)
Таблица IV. 8
Вычисление коэффициентов характеристического полинома по методу А. М. Данилевского
оо
1
—5.509882
0.287865
0.049099
0.006235
—59.146733
—16.346028
1.1367579
0.10414109
—74.251862
—698.72936
—264.18530
—30.270859
1.0653607
-992.12016
-12296.550
—5349.4555
—797.27875
-47.888430
2
—5.509882
0.287865
0.049099
0.006235
0
1
0
0
1
0
1
0
0
1
0
1
0
0
3
1.870086
—11.811654
4.308033
0.269851
—224.21096
—41.031921
6.3226593
0.52568503
—258.39454
0
0
1
0
1
0
0
1
0
4
0.422908
5.711900
—12.970687
1.397369
109.75157
19.842287
— 13.944923
1.2736523
116.92259
—615.81773
—180.67895
—12.267276
2.5511798
—806.21278
0
0
0
1
5
0.008814
0.058717
0.229320
—17.596207
1.1326872
0.20397409
0.21931108
—17.597479
—16.041507
12.543678
3.3575611
0.19292681
—17.617571
—1.523405
— 11542.147
-4365.4005
—500.38776
- 16.536719
6
—3.208074
—5.753172
—8.384229
—15.922752
—113.32670
—19.985660
—7.402953
—15.798142
—603.27405
— 176.32139
— 11.074349
— 15.066391
— 11542.147
—4364.4005
—499.38776
—15.536719
7
51.737524
4.7002331
—12.588854
—16.219686
—686.18568
—259.82774
—29.077932
—16.552210
-12296.550
—5348.4555
—796.27875
—46.888430
о
х
я
о
и
и
S
о
о
и
о
н
ж
Е
¦х
>
та
¦х.
§ 46] МЕТОД А. М. ДАНИЛЕВСКОГО 289
то собственный вектор U матрицы А, принадлежащий собственному
значению X, выражается через собственный вектор Y матрицы Р по
формуле
U = SY = S{S2 ... S^K.
Компоненты у{ уп вектора К находятся без труда как решения
системы
РпУп =
Полагая _у„=1, получим последовательно
Первое уравнение системы будет удовлетворяться тождественно, так
как 1п— рД"— ... — рп = 0.
Для вычисления компонент уг следует применять рекуррентные
формулы. Эти формулы совпадают с формулами схемы Хорнера для
деления характеристического полинома на t — \.
Обозначим далее
Компоненты вектора К(/?) вычисляются по компонентам век-
вектора К(&+1) по двучленным формулам
yf) -
Формулы для вычисления компонент собственного вектора транс-
транспонированной матрицы имеют несколько более простой рисунок.
Переходя в равенстве A) к транспонированным матрицам, получим
так что собственный вектор матрицы А', принадлежащий собствен-
собственному значению X, связан с соответствующим собственным вектором Z
матрицы Р' соотношением
19 Зак. 974. Д. К. Фаддеев и В. Н. Фаддеева
290 ПОЛНАЯ ПРОБЛЕМА СОБСТВЕННЫХ ЗНАЧЕНИЙ (ГЛ. IV
Компоненты zv .... гп вектора Z находятся из системы
гг = \гг
z3 = Xz2
= l2,
Полагая г1=1, получим последовательно 22 =
., zn = X". Последнее уравнение выполняется тождественно.
Далее
где
Z = Z(n),
На этот раз каждое преобразование E^1) будет менять лишь
одну (fe-f-l)-ro компоненту предыдущего вектора, так что компо-
компонентами вектора Z(ft) будут zv 22, .... zk, vk+l, .... vn. При этом
fc+1
i-fc + 2
где
Формулы (З) и D) для вычисления собственных векторов ма-
матрицы Л и ее транспонированной различны по своей структуре, но
требуют приблизительно одинакового числа вычислительных опера-
операций. Для нахождения собственных векторов матрицы А, конечно,
можно использовать любую из этих формул, транспонируя при жела-
желании матрицу А в начале процесса.
В качестве примера рассмотрим вычисление собственного вектора
матрицы Леверье, принадлежащего собственному значению Х4, исполь-
используя данные табл. IV. 8. Для Х4 получено приближенное значение,
равное —5.298695.
§ 461 МЕТОД А. М. ДАНИЛЕВСКОГО 291
Пользуясь схемой Хорнера
1 47.888430 797.27875 5349.4555 12296.550 || —5.298695
1 42.589735 571.60873 2320.6752 —0.0000789,
вычислим компоненты собственного вектора К матрицы Р. Получим
У =Y(i) = B320.6752; 571.60873; 42.589735; 1)'. По форму-
формулам C) находим последовательно
КC) = A621.9458; 307.42343; 12.318876; 1.0653607/
КB) = ( 893.32453; 106.05874; 14.003580; 2.3482620)'
Y{1)=U = ( 308.95339; 30.530599; 19.210958; 3.009538)'.
После нормировки к единичной первой компоненте получим
G= A.000000; 0.098819; 0.062181; 0.009741)'.
Для нахождения собственного вектора транспонированной ма-
матрицы, принадлежащего Х4, предварительно вычисляем числа та, при
k = 1, 2, 3, именно
тп т1г тп
19.140507 52.031073 655.86178
3.4738506 14.379516 247.97733
— 0.170562 0.87969479 28.413718
— 0.021659 —0.09161237 0.93864923.
Далее вычисляем
Z = (l, —5.298695, 28.076169, —148.76706)'
и
V = ({, 0.641980, 0.535599, 0.0138036)'.
Отметим, что при вычислении, особенно последней компоненты,
происходит значительное уничтожение значащих цифр, что делает
результат недостаточно надежным.
Если X есть кратное собственное значение, то для него легко
вычисляется вся „башня" корневых векторов. Она будет только
одна, так как (в силу предположения линейной независимости век-
векторов gj, Aex An~1ei) матрица А имеет взаимно простые эле-
элементарные делители.
Корневые векторы матрицы А (или ее транспонированной А')
вычисляются по формулам C) (или D)), в которых компоненты соб-
собственных векторов Y (или Z) должны быть заменены компонентами
корневых векторов матрицы Р (или Р'). Последние находятся без
труда.
19*
292
ПОЛНАЯ ПРОБЛЕМА СОБСТВЕННЫХ ЗНАЧЕНИЙ
[ГЛ. IV
Как было показано выше, компоненты ylt уг, .... уп собствен-
собственного вектора Y матрицы Р суть коэффициенты частного от деления
характеристического полинома на ^^Х. Соответственно, компоненты
корневых векторов суть коэффициенты от деления характеристи-
характеристического полинома на (t — XJ, (t — XK, ..., (t — X)m, где т есть
кратность собственного значения, причем первой компонентой всегда
является свободный член. Эти компоненты находятся последовательно
по схеме Хорнера.
Для матрицы же Р' корневые векторы суть
Z = (l. X, X2. .... X")
Z1 = @, 1. 2Х („_1)Х"-2)
z,=
0
_t = (o, о, о
1
В качестве примера рассмотрим матрицу
13 16 16"
А= —5 —7 —6
—6 —8 —7.
собственные значения которой суть Х1 = Х2=1, Х3 — —3.
Коэффициенты характеристического полинома матрицы вычисляются
в табл. IV. 9. Эти вычисления дают, что характеристический поли-
полином матрицы равен t3-\-t2— 5^ —|— 3.
Найдем собственный и корневой вектор, принадлежащие соб-
собственному значению Х= 1.
Применяя схему Хорнера, получим
1, 1, —5, 3|| 1
1, 2, —3
1, 3
так что собственный вектор Y матрицы Р равен (—3, 2, 1)', а кор-
корневой К=@, 3, 1)'.
Поэтому собственным вектором матрицы А будет
IT С С V / 1 ? Л QV
U = *^1V2 ^^ V У» ^* "^*/ »
а корневым
t/ = 51S2F = C2, —9, —14)'.
Алгебраическое изложение метода А. М. Данилевского, данное
в книге В. Н. Фаддеевой [1], эквивалентно переходу от базиса
еп к базису А'п~геп, А
'п~2
чего
иной
каноническая
форме.
матрица Фробениуса
... А'еп, еп, в результате
получается в несколько
§46]
МЕТОД А. М. ДАНИЛЕВСКОГО
293
Таблица IV. 9
Определение коэффициентов характеристического полинома
по методу А. М. Данилевского
1
13
—5
-6
8.6
-1.2
—3.2
4.2
—3
5
-1
2
13
—5
—6
0
1
0
1
0
1
0
3
16
-8
-2.2
1.4
0.4
-0.4
0
0
1
4
16
-6
7
0.4
1.2
0.2
1.8
0.9375
1.1250
-0.0625
5
45
-18
—21
—1.8
3.6
0.6
0.9375
2.1250
0.9375
6
9.0
1.0
-3.0
Отметим одну деталь, связывающую метод Данилевского и метод
Хессенберга. Элементы /%-го столбца матрицы Л'*> являются, по
самому построению, коэффициентами в равенстве
откуда следует, что полином
обладает тем свойством, что вектор <?к(А) ei^= Zk+i имеет первые k
компонент в исходном базисе равными нулю. Поэтому вектор Zk+i
и полином срд. (t) совпадают с соответствующим вектором и соответ-
соответствующим полиномом в методе Хессенберга. Тем самым все числа,
образующие &-й столбец матрицы Л(й), встречаются в вычислениях,
проводимых по методу Хессенберга — верхние k в качестве коэффи-
коэффициентов (с обратными знаками) полиномов ^{t), нижние п — k в ка-
качестве компонент вектора Zft+1.
Обратимся теперь к рассмотрению возможных вырождений про-
процесса.
Может оказаться, что на некотором шагу о^^ & —0- Это пока-
показывает, что система векторов ev Aev .... Аке1% ekvv ,. ., е„ ли-
294
ПОЛНАЯ ПРОБЛЕМА СОБСТВЕННЫХ ЗНАЧЕНИЙ
[ГЛ. IV
нейно-зависима. Если при этом окажется, что хоть одно из чисел
а<|) ф 0 при У>&+1, то в матрице Л(/с) нужно переставить
&+1-Ю и у-ю строки и одновременно k-\-l-u и 7-й столбцы.
Такая перестановка равносильна переходу от базиса ev Aev . .., Ак~1е1,
ек+1, .. ., ej е„. к базису ev Аех Ак~1е1, ej efe+1, .... еп.
Легко видеть, что если ev Ae1 Апе1 линейно-независимы, то
такое j обязательно найдется. После совершенной трансформации
процесс продолжается. При вычислении собственных векторов сде-
сделанная трансформация, конечно, должна быть учтена. (В надлежа-
надлежащий момент нужно переставить k-\-\-K> и j-ю компоненты соответ-
соответствующих векторов.)
Указанная трансформация может быть полезна, даже если
но среди чисел я(*>, j > k -\- 1, есть число значительно большее по
модулю, чем акк\к, так как она увеличивает точность вычисления.
Если такая трансформация проделывается на каждом шаге, мы при-
приходим к схеме, подобной схеме главных элементов метода Гаусса.
Если же все дС*)=О при y^-fe-f-1, что обозначает, что уже
векторы ev Aev
Аке1 линейно-зависимы, то матрица
имеет вид
0
1
0
0
0
0
0
0
0
1
«ffi
с
(к)
К
и, следовательно, характеристический полином матрицы А равен
произведению характеристических полиномов матриц а[' и А2 .
Матрица А[к) уже есть каноническая матрица Фробениуса. Она
соответствует индуцированному оператору на инвариантном подпро-
подпространстве, натянутом на векторы ег Ак~1е1.
К матрице А^ нужно снова применить общий процесс при-
приведения.
Таким образом, в рассматриваемом случае процесс нахождения
характеристического полинома только упрощается. Однако вычисле-
вычисление канонического базиса (в частности и собственных векторов)
несколько усложняется. Мы не будем останавливаться на решении
этого вопроса.
Метод А. М. Данилевского допускает следующее обобщение. Приве-
Приведение к канонической форме можно осуществить посредством перехода
от базиса ev е2 еп к базису /, Af An~if, где / неко-
некоторый вектор, выбираемый, вообще говоря, произвольно, требуется
только, чтобы векторы /, Af, .... An~xf были линейно-независимыми,
§ 47] МЕТОД ЛЕВЕРЬЕ И ВИДОИЗМЕНЕНИЕ Д. К. ФАДДЁЕВА 295
Если элементарные делители матрицы взаимно просты, такой вектор
всегда найдется.
Этот вариант требует уже я шагов, так как добавляется еще
один „нулевой" шаг, состоящий в переходе от базиса (еи е2, . ¦ ¦, еп)
к базису (flt ег еп), что осуществляется посредством преобра-
преобразования подобия
где So—матрица, первый столбец которой составлен из компонент
вектора /, остальные совпадают со столбцами единичной матрицы.
Дальнейший ход процесса ничем не отличается от описанного выше.
Бауэр [6] рекомендует выбирать начальный вектор так, чтобы его
координаты по собственным векторам, соответствующим большим по
модулю собственным значениям, были бы малыми. Методы построения
таких векторов будут описаны в гл. IX.
§ 47. Метод Леверье и видоизменение Д. К. Фаддеева
В этом параграфе мы изложим метод, известный под названием
метода Леверье [1], требующий большего числа операций, чем все
рассмотренные выше методы, но совершенно не чувствительный
к частным особенностям матрицы, в частности, к „провалам" проме-
промежуточных определителей.
Пусть
U 1
характеристический полином матрицы и Xlt Xj Хп его корни,
среди которых могут быть равные. Обозначим
J? = Sft. B)
Тогда справедливы соотношения, известные под названием формул
Ньютона:
kPk = Sk—PiSk-i— ••• — Рй-А (A=l, .... я). C)
Если числа sk известны, то, решая рекуррентную систему C), мы
сможем найти нужные нам коэффициенты рк.
Покажем, как определяются числа sfe. Имеем
Далее, в силу § 1 п. 10, характеристические числа матрицы А*
будут Хх, Х?, .... Xjj. Следовательно,
? ? ... +x?=*SpA*. D)
Таким образом, процесс вычисления сводится к последователь-
последовательному вычислению степеней матрицы А, затем к вычислению их сле-
следов и, наконец, к решению рекуррентной системы C). Вычисление п
296 ПОЛНАЯ ПРОБЛЕМА СОБСТВЕННЫХ ЗНАЧЕНИЙ [ГЛ. IV
степеней матрицы А (у последней матрицы Ап нужно вычислить
только диагональные элементы) требует большого числа, правда
однообразных, операций, и потому метод Леверье гораздо более
трудоемкий, чем вышеизложенные методы. Его ценность состоит,
как это уже упоминалось, в его универсальности. Число необходи-
необходимых по методу Леверье умножений равно
~-(и — 1)B«з — 2я*4-и + 2).
Заметим, что при вычислении степеней матрицы полезно осуще-
осуществлять контроль при помощи столбца, состоящего из сумм элемен-
элементов каждой строки матрицы А. Результат умножения матрицы А
на этот столбец должен совпадать с аналогичным столбцом ма-
матрицы А2.
Действительно, пусть St столбец сумм матрицы А, ?2 столбец
сумм матрицы А2. Пусть U = (l, 1 1)'. Тогда
1: = AU, S2 = AW,
Z2 = ALV E)
Очевидно, сказанное верно и для других степеней.
Изложим теперь видоизменение метода, предложенное Д. К. Фад-
деевым 1), которое кроме упрощений при вычислении коэффициентов
характеристического полинома позволит нам определить обратную
матрицу и собственные векторы матрицы.
Будем вместо последовательности А, А2 Ап вычислять по-
последовательность Alt Аг, . .., Ап, построенную следующим образом:
F)
Докажем, что a) qx=pv q2—p2 qn — Pn;
b) Bn — нулевая матрица;
c) если А неособенная матрица, то
Рп •
(Если матрица А особенная, то (—l)"^,, будет матрицей, союз-
союзной с матрицей А).
*). Д. К. Ф а д д е е в и И. С. С о м и н с к и й. Сборник задач по высшей
алгебре, 1949, задача № 979. См. также Сурьо[1]и Фрейм [1].
§47]
МЕТОД ЛЕВЕРЬЕ И ВИДОИЗМЕНЕНИЕ Д. К. ФАДДЕЕВА
297
Докажем сначала а) методом математической индукции. Очевидно,
что pt = SpA = qv Предположим, что ^i=/?i. Яг —/>2> ¦ • -'Чк-i.=
—Рк-и и докажем, что Яи~Рк- Согласно нашей конструкции:
Следовательно,
Sp Ак = Л?* = Sp А* — л Sp _Д*-» — ... _л_, Sp Л =
... Pk-lSV
и, следовательно,
G)
(8)
Отсюда, в силу формул Ньютона kqk =
=Рк-
Далее, в силу соотношения Кели — Гамильтона
Наконец, из равенства G) следует, что
АВп_х = Ап = Вп-\-РпЕ = РпЕ,
так что
Pn
Равенство Ап=рпЕ может .быть использовано для контроля вы-
вычисления; очевидно, что отклонение Ап от скалярной матрицы является
мерой точности вычислений. Кроме этого окончательного контроля,
целесообразно пользоваться частным контролем, составляя для матриц Bt
столбцы сумм. При этом справедливо соотношение
1
1
(9)
где S{ столбец сумм матрицы Bit So—аналогичный столбец матрицы А.
Формула (8) дает алгорифм для обращения матриц. Для матриц
не очень высокого порядка в случае, если нужно решить как задачу
нахождения собственных чисел, так и задачу обращения матрицы,
указанный метод очень удобен.
Число операций, нужных для получения коэффициентов pi (вклю-
(включая и вычисление матрицы Вп), равно (п—1) п3 умножений.
В табл. IV. 10 на прежнем примере показана схема вычисления
по .методу Д- К. Фаддеева коэффициентов характеристического поли-
полинома и элементов обратной матрицы.
Перейдем теперь к определению собственных векторов матрицы А.
Пусть собственные числа уже вычислены и при этом оказались
различными. Построим матрицу
Таблица IV. 10
Определение коэффициентов характеристического полинома и элементов обратной матрицы
по методу Д. К. Фаддеева
ю
СО
ОО
—5.509882
1.870086
0.422908
0.008814
-232.94165
—3091.3122
-12296.551
—0.001
0.001
0.001
А'
0.287865
—11.811654
5.711900
0.058717
0.049099
4.308033
— 12.970687
0.229326
рх = — 47.888430
—400.96516
3
—427.95884
рг = - 797.27876
А*
—4094.0411
-4213.8419
/>з = - 5349.4555
А,
0.000
-12296.551
0.001
—0.001
Л = -
0.000
0.000
—12296.550
0.001
12296.551
0.00623i
0.269851
1.397369
—17.596207
—532.69187
—4649.1712
0.000
0.000
0.001
—12296.551
42.378548
0.287865
0.049099
0.006235
564.33711
9.07995
2.68546
0.30081
2258.1433
70.5604
32.0618
4.4283
—0.183640
—0.005738
—0.002607
—0.000360
1
1.870086
36.076776
4.308033
0.269851
58.98700
396.31360
99.69550
11.01857
в»
458.3882
1255.4144
419.6360
52.7398
А~
—0.037278
—0.102095
—0.034126
—0.004289
0.422908
5.711900
34.917743
1.397369
23.13088
132.18346
369.31992
25.74858
276.1613
556.3836
1135.6136
98.8129
1
—0.022458
—0.045247
—0.092352
—0.008036
0.008814
0.058717
0.229326
30.292223
0.42522
2.39755
4.22567
264.58689
6.2599
11.4757
16.2164
700.2843
—0.000509
—0.000933
—0.001319
—0.056950
2
44.68036
42.13526
39.50420
31.96568
646.8802
539.9746
475.9266
301.6549
2998.953
1893.834
1603.527
856.265
1
я
о
И
S
О
О
и
Q
га
и
X
¦х
и
X
в*
§47]
МЕТОД ЛЕВЕРЬЕ И ВИДОИЗМЕНЕНИЕ Д. К. ФАДДЕЕВА
299
где Bi матрицы, вычисленные в процессе нахождения коэффициентов
характеристического полинома, а \к есть &-е собственное число ма-
матрицы А.
Можно доказать, в предположении, что все ~klt . . ., Хп различны,
что матрица Qk ненулевая.
Покажем, что каждый столбец матрицы Qk состоит из компо-
компонент собственного вектора, принадлежащего собственному числу ).к.
Действительно,
(\кЕ — A)Qk = (\kE — 1
Отсюда следует, что (ккЕ — А) и = 0, где и любой столбец построен-
построенной матрицы Qk, т. е. что
1ка = Аи. (И)
Это равенство показывает, что и есть собственный вектор.
Замечание 1. Вычисляя собственные векторы описанным обра-
образом, нет необходимости, конечно, находить все столбцы матрицы Qk.
Следует ограничиться вычислением одного столбца; его элементы
получаются в виде линейной комбинации с прежними коэффициентами
одноименных столбцов матриц Bt.
Замечание 2. Для вычисления столбца и матрицы Qk, удобно
пользоваться рекуррентной формулой:
где bj — взятый нами столбец матрицы В;, а е — одноименный столбец
единичной матрицы.
Тогда
В качестве примера вычислим собственный вектор Х4 матрицы Ле-
верье, принадлежащий собственному числу Х4 = —5.29870.
Таблица VI. И
Определение собственного вектора по методу Д. К. Фаддеева
I
2258.1433
70.5604
32.0618
4.4283
II
—2990.2530
-48.1119
—14.2294
1.5939
III
1189.8294
8.0822
1.3785
0.1751
IV
—148.7675
0
0
0
V
308.9522
30.5307
19.2109
3.0095
VI
1
0.098820
0.062181
0.009741
300 ПОЛНАЯ ПРОБЛЕМА СОБСТВЕННЫХ ЗНАЧЕНИЙ [ГЛ. IV
В графах I, II, III расположены компоненты 1-го столбца ма-
матриц, Bit умноженные на соответствующие степени Х4, в графе IV ком-
компоненты вектора ^(l, 0, 0, 0)'. Графа V содержит компоненты век-
вектора Xit графа VI — его компоненты после нормирования.
§ 48. Эскалаторный метод1)
Оригинальный метод определения собственных чисел и собствен-
собственных векторов матрицы известен под названием эскалаторного метода.
Этот метод дает индуктивную конструкцию, посредством которой,
зная собственные числа и собственные векторы матрицы Ак_1 и ее
транспонированной, можно составить уравнение для определения соб-
собственных чисел матрицы Ак, полученной из Ак_1 окаймлением, и затем
вычислить по несложным формулам компоненты собственных векто-
векторов для матрицы Ак и ее транспонированной. Применение эскалатор-
эскалаторного метода начинается с отыскания собственных векторов матрицы
2-го порядка. Эта задача решается совсем просто.
Большим достоинством метода является наличие мощного контроля,
дающего возможность вычислителю на каждом шагу быть уверен-
уверенным как в своих вычислениях, так и в отсутствии потери значащих
цифр. Кроме того, сама форма уравнения для определения собствен-
собственных значений оказывается очень удобной при применении метода
Ньютона.
Метод основан на использовании свойств ортогональности соб-
собственных вектопов матрицы и ее транспонированной.
Мы не будгм проводить общей индукции от fe-ro шага к A-f- 1-му,
а ограничимся рассмотрением перехода от матрицы 3-го порядка
к матрице 4-го порядка. Для удобства компоненты векторов бу-
будем обозначать, вопреки обычаю, различными буквами. Предпо-
Предположим, что все собственные числа матрицы А3 вещественны и раз-
различны.
Итак, пусть \ (/-=1, 2, 3) собственные числа матриц Аа и А'г,
где
A)
Пусть далее Хг = (хг, уг, гг)' и Х'г = {х'г, у'г, г'г)' (г = 1, 2, 3)
совокупность собственных векторов этих матриц.
«21
_«31
«12
«22
«32
«13
«23
«33 _
J) Моррис и Хед [1], [2]; Моррис [5].
§ 48] ЭСКАЛАТОРНЫЙ МЕТОД 301
Эти собственные векторы могут быть нормированы так, что
xl
X
<
x2
x3
X2 XS
x x
Ух z{ -
Уг z2
Уз z3
XX
x2
_x,
~x'i
X
z[
Ух
Уг
Уз
К
У'г
К
zl
z,
<
У',
B)
Это следует из установленных в § 10 п. 3 свойств ортогональности
собственных векторов матрицы и ее транспонированной.
Пусть Ai матрица 4-го порядка, полученная из А3 окаймлением,
Х=(х, у, z, и)' ее собственный вектор, принадлежащий собственному
числу X.
Имеем
Хх = апх -f- апу -(- a13z -f- auu
ггУ + а23г~\-а21и
. 1 i V."/
Хи =
Умножим первые три уравнения системы C), соответственно,
на х'г, у'г, г'г и сложим. Получим:
а32<-) У
откуда в силу того, что (х'г, у'г, г'У есть собственный вектор для
матрицы А'г
>• (*< + УУ'г + гг'г) = Хг (хх;
и, следовательно,
где
Пусть
zz
F)
302 ПОЛНАЯ ПРОБЛЕМА СОБСТВЕННЫХ ЗНАЧЕНИЙ [ГЛ. ,у
Тогда, в силу ортогональных свойств B), справедливо следующее
соотношение:
з
где
Р — а41х -\- ai2y -\- ai3z = — (а44— 1)и. (8)
Действительно,
з
2
(a4lxr + ai2yr + ai3zr) (x'fx + y'ry + z'rz) =
= au (XA
P'a
Заменив в уравнении G) выражение х'х-\-y'ry-{-z'rz на —ч _^_?-
согласно D), получим следующее уравнение для определения собствен-
собственных чисел матрицы АА:
Уравнение (9) мы будем называть эскалаторной формой харак-
характеристического уравнения или эскалаторным уравнением.
Далее, умножая D) последовательно на xr, yr, zr (г=1, 2, 3) и
складывая, получим, снова принимая во внимание свойства ортого-
ортогональности B):
<¦«>
Аналогично
X
и
х'
и'
3 /
г = 1
Z
и
У rrxr
г = 1
г'
У
' и
2j хг —)
у'
' и'
3
3
V
\
3
г = 1
г
Р'гУг
г~
Р X
г
Таким образом, найдя собственное число X из уравнения (9), мы
находим по формулам A0) и A1) собственные векторы матриц А^ и А'^,
принадлежащие этому числу, с точностью до численного множителя.
Для возможности продолжения процесса мы должны еще нормиро-
нормировать их в смысле формулы B).
§ 48] ЭСКАЛАТОРНЫЙ МЕТОД 303
Нетрудно проверить (снова используя свойства B)), что
xx' + yy' + zz' _
Следовательно, г~1
з
хх'+ уу'+ zz'+ ии' __ j , у
ии' ^ (Хг — XJ"
Таким образом, мы удовлетворим условию нормированности при
3 /
1 -v^ Р Р
UU' ' ZU (kr — АJ'
Заметим, что если левую часть эскалаторного уравнения обозна-
обозначить через /(X)
ji\\ ~ | \ | ^ r r С12")
то „
Таким образом,
Не теряя общности, мы можем считать, что и= + и', выбирая знак
так, чтобы —j — ± /' (X) было положительным. Это дает
a = a' = -f===, если /' (X) > 0;
а = —H/=y=-jr^-, если /' (X) < 0. A3)
В заключение отметим контрольные равенства:
о о о
A4)
Последние равенства показывают, что все „новые" элементы ма-
матрицы Л4 употребляются нами для контроля. Хорошее совпадение
контрольных формул гарантирует правильность вычислений на каждом
шагу. При окончании процесса полезно проверить для найденных
векторов выполнение, условия ортогональности.
Мы описали процесс только для матриц четвертого порядка: пе-
переход к общему случаю очевиден. При соблюдении контрольных
304
ПОЛНАЯ ПРОБЛЕМА СОБСТВЕННЫХ ЗНАЧЕНИЙ
[ГЛ. IV
равенств метод гарантирует очень большую точность как для всех
собственных чисел, так и для компонент принадлежащих им собствен-
собственных векторов.
В случае симметричной матрицы эскалаторный процесс естественно
облегчается, так как при этом все величины, отмеченные штрихом
(т. е. относящиеся к транспонированной матрице) будут совпадать
с соответствующими величинами без штрихов. Из вида эскалаторного
уравнения можно в этом случае заключить, что собственные корни
последовательно окаймляемых матриц разделяются. Это обстоятель-
обстоятельство сильно облегчает определение корней, которые обычно находятся
по методу Ньютона.
Заметим, что эскалаторная форма характеристического уравнения
оказывается удобнее для применения способа Ньютона, чем развер-
развернутая, так как вычисление /(X) и /'(X) осуществляется очень легко.
Не вдаваясь в подробности, отметим, что в случае, когда после-
последовательные эскалаторные уравнения имеют одинаковые или комплекс-
комплексные корни, описанный процесс должен быть некоторым образом')
изменен.
Найдем при помощи эскалаторного метода собственные числа и
собственные векторы для матрицы Леверье.
Решение будет состоять из трех этапов.
I этап. Для матрицы Аг
"—5.509882 1.870086'
0.287865 —11.811654.
уравнение для определения собственных чисел будет
Х2+17.321536Х+64.542487 = 0;
его корни:
Х1==— 11.895952, \ = — 5.425584.
Для контроля образуем ^ + ^2 = — 17.321536 и вычислим след ма-
матрицы А2:
SPA, = — 17.321536.
Далее, вычисляем собственные векторы матриц Ла и А'г, решая
соответствующие системы, и нормируем полученные векторы:
—0.061767
0.210926
0.905643
4.679234
0.210926
1.138422
К
—0.210926
4.679234 .
26.638114
Л2
0.210926
0.061767
0.442009
I
Pi и Р[
Моррис и Хэд [2].
§48]
ЭСКАЛАТОРНЫЙ МЕТОД
305
Первый этап окончен.
II этап. Образуем матрицу
"—5.509882 1.870086 0.422908"
0.287865 —11.811654 5.711900
0.049099 4.308033 —12.970687
Выписываем на отдельный листок вновь введенные коэффи-
коэффициенты ап, а23 и а31, а32 в виде столбцов и, прикладывая их к столб-
столбцам собственных векторов матрицы Аг, находим величины P't и Р.
(накоплением). Для удобства дальнейших вычислений выписываем их
рядом с собственными векторами в схеме (I), располагая в строку.
Теперь мы можем написать эскалаторное уравнение для ма-
матрицы Аг:
94 194^91 П ^П^Ю^
f(k)— 12.970687 + ЛН 8QSQ52 X~H Ч 495^84—Т = 0<
Определяем его корни по методу Ньютона, располагая вычисление
по схеме:
X
—11.895952 —X
—5.425584 —X
12.970687 + X
рЛ
—11.895958 —X
рЛ
—5.425584 — X
рЛ
(—11.895952— ХJ
рЛ
(—5.425584—ХJ
га)
ДХ
—15
3.104
9.574
—2.029
7.772
0.053
5.796
2.504
0.006
3.510
-1.651
—16.651
4.755
11.225
-3.680
5.074
0.045
1.439
1.067
0.004
2.071
—0.6948
—17.3458
5.4498
11.9202
—4.3751
4.4267
0.0422
0.0938
0.8123
0.0035
1.8158
—0.0517
—17.3975
5.501548
11.971916
—4.426813
4.385061
0.042031
0.000279
0.797059
0.003511
1.800570
—0.000155
—17.397655
5.501703
11.972071
—4.426968
4.384936
0.042031
—0.000001
0.797014
0.003511
1.800525
0.000000
II
Таким образом, Ха = — 17.397655.
Аналогично находим >-> = — 7.594378 и Х.3 = — 5.300190. Кон-
Контроль:
X, -4- Х2 + Х3 = — 30.292223, Sp Л3 = — 30.292223,
20 Зак, 974. Д. К, Фаддеев и В. Н, Фаддеева
306
ПОЛНАЯ ПРОБЛЕМА СОБСТВЕННЫХ ЗНАЧЕНИЙ
[ГЛ. IV
Перейдем теперь к определению компонент собственных векторов
матриц А3 и A's, которые находятся, с точностью до множителя, по
формулам, аналогичным формулам A0) и (И). При этом удобно со-
составить вспомогательные схемы (III) и (IV).
p'i*i
—1.645356
2.068264
0.422908
Р'гУг
5.618671
0.093231
5.711902
Р-х.
—0.191024
0.240123
0.049099
pty't
4.237716
0.070318
4.308034
III
1
Af + 17.397655
0.181762
0.083528
1
X,- + 7.594378
—0.232473
0.461086
1
A,- -f 5.300190
—0.151613
—7.974863
IV
Схема (III) содержит произведения чисел Pt и Pt на компоненты
соответствующих векторов и получается из схемы (I); последняя строка
/2 \
осуществляет контроль (например, 2 P\xi — ai2 )¦ Схема (IV) содер-
жит множители
где вместо X последовательно взяты три вычи-
сленных корня.
Далее, нормирующие множители определяются из схемы (II) и двух
аналогичных схем, служащих для вычисления двух других корней.
Так как /' (^) > 0,
D- =
1
Yf Он)
и г.. = z' = D,
(/=!, 2, 3).
Вычисляя, получим Dt = 0.745248, D2 = 0.644055, D3 = 0.172627.
Используя предыдущие схемы, без труда находим компоненты
собственных векторов матриц Л3 и А'3 (в окончательную схему мы
их вписываем после умножения на соответствующий множитель нор-
нормирования).
§48]
ЭСКАЛАТОРНЫЙ МЕТОД
307
0.094129
—0.766896
0.745248
0.835026
хг
—0.860553
0.813572
0.644055
1.114160
*з
2.804268
0.275404
0.172627
0.333026
0.010928
—0.578409
0.745248
0.137039
А
—0.099909
0.613612
0.644055
0.182847
0.325572
0.207717
0.172627
0.054654
Рг и Р'г
Второй этап окончен.
III этап. Вычислив величины Р{ и Р\, пишем эскалаторное урав-
уравнение для матрицы Л4:
17.596207 + X-
0.114431
0.203721
0.018201
—17.397655 —л
и вычисляем его корни:
Xt = — 17.863262,
Х3 = — 7.574044,
—7.594378 —X ' —5.300190 — /."
Х2 = —17.152427
Х4 = — 5.298698
4
2
X; = — 47.888431; Sp Л4-— — 47.888430.
Далее вычисляем собственные векторы матрицы Av нормируя их обыч-
обычным образом:
—0.019872 .
0.169807
—0.187215
0.808482
Хч
0.032932
-0.261310
0.236640
0.586694
хя
—0.351235
0.328467
0.260927
0.045005
ХА
1.135218
0.112183
0.070591
0.011058
и собственные векторы матрицы А'-.
К
—0.014058
0.780383
—1.140762
0.808482
А
0.023297
—1.200908
1.441927
0.586694
—0.248476
1.509559
1.589924
0.045005
К
0.803091
0.515564
0.430123
0.011058
20*
308
ПОЛНАЯ ПРОБЛЕМА СОБСТВЕННЫХ ЗНАЧЕНИЙ
[гл. iv
Окончательным контролем вычисления является вычисление произведе-
произведения двух соответствующих матриц, состоящих из компонент собствен-
собственных векторов. Вместо единичной матрицы была получена матрица
' 1.000005
—0.000003
—0.000002
—0.000001
—0.000004
1.000004
0.000000
0.000000
. 0.000000
—0.000002
0.999994
0.000004
0.000002"
—0.000003
0.000000
1.000006
Наконец, для сравнения представим эскалаторное уравнение в виде
обычного полинома:
г4 + 47.888430^+ 797.27877^ + 5349.4556^+ 12296.550 = 0,
а собственный вектор, принадлежащий Х4, нормируем так, чтобы его
первая компонента была равна единице. Это даетХ, —A; 0.098820;
0.062183; 0.009741)'.
Мы видим, что коэффициенты написанного уравнения совпадают
с данными Леверье с большей точностью, чем при вычислении дру-
другими методами. Соотношения ортогональности также выполнены со
значительной точностью.
§ 49. Метод интерполяции
Методы, приведенные нами в предыдущих параграфах, решали
задачу приведения к полиномиальному виду векового уравнения. Раз-
Развитый в этом параграфе метод интерполяции применим к более общей
задаче, а именно к развертыванию определителя вида
/и @ ¦ • • /,» (О
F(t):
••• /„„(О
A)
(fik(t) Данный полином от t), в частности, к развертыванию характе-
характеристического определителя ?)(/) = | А—tE\ и определителя \А — Bt\,
где А и В данные матрицы.
Сущность метода заключается в следующем. Пусть известно,
что F(t) есть полином, степень которого не превосходит числа к.
Как известно, такой полином вполне определяется своими значениями
в й+1-й точке и может быть восстановлен по таким значениям при
помощи той или другой интерполяционной формулы.
Поэтому для явного представления F(t) нужно вычислить значе-
значение k-{-\ численных определителей
/и (*,) ¦•¦fin &
1 k),
B)
§ 49] метод интерполяции 309
где Хо, Xj, . . ., Хк некоторые числа, выбираемые, вообще говоря,
произвольно.
Вычисление нужных определителей можно осуществить, например,
по схеме, изложенной в § 17.
Для построения полинома F(t) по его значениям наиболее удобно
пользоваться интерполяционной формулой Ньютона, применимой для
равноотстоящих абсцисс Xt.
Мы приводим формулу Ньютона для ^ = г, г = 0, . . ., k:
(f—1) ... (f—/+1), C)
8 = 0
где &F (Г) обозначает i-ю разность вычисленных значений полинома F (/),
определяемую по рекуррентной формуле
Д*/7@ = Д'/?(/ + 1) —Д'"^@-
Положим
i
¦ \ г tm
Тогда формула (З) преобразуется к виду:
. D)
Эта формула носит название интерполяционной формулы А. А. Мар-
Маркова.
В работе Ш. Е. Микеладзе [1], в которой был описан интерпо-
интерполяционный метод раскрытия полиномиальных определителей, в каче-
качестве интерполяционной формулы выбрана формула D).
Таблица коэффициентов интерполяционной формулы А. А. Мар-
Маркова для /«<;/<; 20 приведена в книге В. Н. Фаддеевой [1].
При пользовании интерполяционной формулой целесообразно для
контроля опорных значений определителя A) вычислить еще хоть
одно значение F(t), именно, в нашем случае, F(k-\-l), ибо Д^+^СО)
должно быть равным нулю, a Aftf@) и Дл/7A) равными между собой.
Метод интерполяции требует большого числа действий. Так, для
вычисления коэффициентов характеристического полинома при помощи
интерполяционной формулы D) требуется прежде всего вычислить
(«-f-1) определителей л-го порядка. Это потребует
—7г—(п—1)(/г2 + я + 3) умножений и делений.
310
ПОЛНАЯ ПРОБЛЕМА СОБСТВЕННЫХ ЗНАЧЕНИЙ
[ГЛ. IV
Если коэффициенты интерполяционной формулы взять из таблицы,
то для получения коэффициентов характеристического полинома
п(п4- 1)
нужно еще произвести —- умножение.
Таким образом, общее число нужных операций умножений и де-
делений
на много превышает число операций, нужных для вычисления тех же
коэффициентов по методу А. М. Данилевского и по методу А. Н. Кры-
Крылова.
Кроме того, указанный метод не позволяет как-нибудь упростить
задачу нахождения собственных векторов матрицы, в то время как
при вычислении по методам А. М. Данилевского или А. Н. Кры-
Крылова задача об определении собственных векторов матрицы сильно
упрощается. Тем не менее, метод интерполяции интересен как метод,
дающий возможность решать более общие задачи.
В качестве примера снова проведем вычисления для матрицы
Леверье.
Опуская утомительное вычисление определителей, найдем, что
<р@)= 12296.55, <рA)= 18492.17, <рB) = 26583.68
<рC) = 36894.41, <р D) = 49771.69.
Далее, составим таблицу разностей:
t
0
1
2
3
4
12296.55
18492.17
26583.68
36894.41
49771.69
Д
6195.62
8091.51
10310.73
12877.28
Д2
1895.89
2219.82
2566.55
Дз
323.33
347.33
Д4
24
(Отметим, что в случае вычисления коэффициентов характеристи-
характеристического полинома вычисление лишних значений f(t) для контроля
можно не производить, так как надежным контролем в этом случае
является равенство Д*<р(О) = (—1)"л!).
Наконец, вычисляем коэффициенты характеристического полинома,
располагая вычисления по схеме:
§49]
МЕТОД ИНТЕРПОЛЯЦИИ
311
1
1
2
3
4
А\ @)
6195.62
1895.89
323.33
24.00
0.0416 6667
0.1666 6667
—0.2500 0000
47.8883
с2{
0.5000 0000
—0.5000 0000
0.4583 3333
797.280
«и
1.0000 0000
—0.5000 0000
0.3333 3333
—0.25000000
5349.45
Коэффициент /?4 = ср@)= 12296.55.
Метод интерполяции применим всегда; в частности, случай, когда
характеристический полином имеет кратные корни, ничем не выде-
выделяется среди других случаев.
Если вместо чисел 0, .. ., к взять в качестве узлов интерполя-
интерполяции числа tj, = a-\-hi, то формула D) видоизменится следующим
образом:
F (t) = F (а) + 2 ( 2 CmlStfF (a)) (t - а)
E)
Иногда может быть целесообразно в качестве интерполяционных
абсцисс брать неравноотстоящие числа. В этом случае можно поль-
пользоваться общей интерполяционной формулой Ньютона. Однако в слу-
случае неравноотстоящих абсцисс удобнее строить нужный полином
методом неопределенных коэффициентов. Именно,
k, мы получим систему
Тогда для определения чисел cij, j = 0,
алгебраических уравнений
которую можно решить каким-либо из изложенных методов.
Метод интерполяции удобно применять, в частности, к раскры-
раскрытию определителя \А — Bt\ в случае, если матрица В имеет малый
определитель. Если же определитель В не является малым числом,
то определение коэффициентов искомого полинома лучше произво-
производить посредством преобразования
Матрица АВ~Х может быть найдена по методу исключения (§ 22).
Интерполяционный метод оказывается полезным для вычисления
собственных значений минуя вычисление характеристического поли-
полинома.
312 ПОЛНАЯ ПРОБЛЕМА СОБСТВЕННЫХ ЗНАЧЕНИЙ [ГЛ. IV
Существует следующий метод для определения корней поли-
полинома1) /(/) (или какой-либо другой аналитической функции2), являю-
являющийся несложным обобщением известного способа ложного положе-
положения. Берутся три произвольных значения t0, /,, t2 независимой пере-
переменной и вычисляются соответствующие значения функции yo~f(to),
yi = f(ti), >/2=/(^)- По найденным значениям строится интерполя-
интерполяционный полином второй степени и находятся его корни. Тот из
корней, который оказался ближе к /2, чем другой, принимается за
следующее приближение t3. Далее тем же способом строится tit исходя
из тройки чисел tu t2, t3 и т. д.
Доказательство сходимости этого процесса, при произвольных
начальных приближениях, неизвестно. Оно известно лишь в пред-
предположении о достаточной близости исходных приближений к вычи-
вычисляемому корню.1) Однако практически процесс оказывается всегда
сходящимся.
Выбор интерполяционного полинома именно второй степени (а не
первой и не более высокой) удобен тем, что при нем без существен-
существенных осложнений имеется возможность, в случае необходимости, вы-
выхода на комплексную плоскость с вещественной оси, даже если f{t)
имеет вещественные коэффициенты и исходное приближение берется
вещественным.
Расчетные формулы таковы. Положим tt—/0 = Д1, /2—-^ = 1^,
t3—B = Д3. Тогда Д3 есть корень квадратного уравнения
+ С = 0, F)
при
а = Ai (У2 — Ух) + ^г (Уо — У О
b = Дх (Дх + 2Д2) (у2 — Л) -f Д^ Од, - уд G)
Формулы становятся еще удобнее, если ввести отношения поправок,
положив
Для 83 получим квадратное уравнение
+ T = <J (9)
!) Мюллер [Muller D.], Math. Tables and Other Aids Comput., 1956, 10,
208—215.
2) Франк [Frank W. L.J. J. Assoc. Comput. Machinery, 1958, 5, Ms 2,
154-160.
§ 49] МЕТОД ИНТЕРПОЛЯЦИИ 313
с коэффициентами
Для решения квадратного уравнения здесь удобна формула
5 = ^ A1)
причем знак при квадратном корне должен выбираться так, чтобы
из двух возможных значений знаменателя получалось большее по
модулю.
Новая поправка получится по формуле Д3 = Д2^3. новое прибли-
приближение
A2)
При применении этого приема к вычислению собственных значе-
значений 1) нет нужды в вычислении коэффициентов характеристического
полинома. Вычисление значений характеристического полинома при
фиксированных значениях t сводится к вычислению численных опре-
определителей \А— tE\, что возможно производить без особого труда,
например, по методу исключения.
Описанный прием особенно хорошо приложим, если матрица А
имеет вид, удобный для вычисления определителей \А — tE\, напри-
например, если матрица почти треугольна или трехдиагональна. Эти сообра-
соображения дают основания рекомендовать применение квадратичной интер-
интерполяции после преобразования исходной матрицы к почти треуголь-
треугольной форме (например, методом Хессенберга или методом вращений
Гивенса, см. § 51) или к трехдиагональной (например, биортогональ-
ным алгорифмом, см. § 63, или методом вращений в симметричном
случае).
В качестве примера вычислим два собственных значения матрицы
D) § 51. В табл. IV. 13 эта матрица подобным преобразованием
приведена к трехдиагональной форме.
Возьмем ^о = 0- ^ = 0.5, tz=\.
Тогда ^О = 0.28615247, ^ = —0.01927552, _У2 = — 0.07370353.
Проведя вычисления по формулам A0), A1), A2), получим ?3 =
= 1.26691227. Вычисляя определитель \А — t3E |, получим _у3 =
= — 0.31978253. Снова применяем формулы A0), A1), A2), увели-
увеличив в них все индексы на единицу. Получим tt = 0.84456137.
После шести шагов процесс стабилизируется на t8 — 0.79670667.
Это значение совпадает в пределах точности с Xg.
Франк [1].
314 ПОЛНАЯ ПРОБЛЕМА СОБСТВЕННЫХ ЗНАЧЕНИЙ [ГЛ. IV
Вычисляем теперь другой корень, исходя из тех же начальных
приближений ^о=О. tl = 0.5, t2=\. Значения уг находим по фор-
формуле
После трех шагов процесса получим
Х3 = 0.63828382
с удовлетворительной точностью.
§ 50. Метод ортогонализации последовательных итераций
Излагаемый метод, подобно методу А. Н. Крылова и методу Хес-
Хессенберга, имеет целью отыскание равной нулю линейной комбина-
комбинации последовательности итераций произвольного вектора матрицей А.
В то время как в методе Крылова это делается при помощи реше-
решения линейной системы, а в методе Хессенберга постепенным наращи-
наращиванием нулевых компонент в „исправленных" итерациях, в этом
параграфе мы для той же цели применим процесс ортогонализации.
Именно, исходя из вектора Хх, строим его итерацию АХХ и орто-
гонализуем ее с вектором Хх, т. е. строим вектор Х2 = АХ1 -\-gnXi
так, что {Хх, Л) = 0. Это будет выполнено, если
Далее, строим вектор АХг и ортогонализуем его с векторами Хх
и Хг. В результате придем к вектору
Х3 — АХг ~\- g2xXx + g22X2>
где
_ (АХЪ Хх) _ (АХо, Х2)
g21 — (Xlt Хх) ' g*2 — (Хь Х2) '
Процесс естественно продолжается по формулам
Хк) ., . 0
<А=1. 2, .,.. 0
' 8*- <Хк, Хк) <А=1. 2,
до тех пор, пока мы не придем к нулевому вектору. Это во всяком
случае произойдет на п-м шагу процесса, но может случиться и
ранее, если минимальный аннулирующий Хх полином не является
характеристическим полиномом. Ясно, что
где полиномы ерг-(/) связаны друг с другом рекуррентными соотно-
соотношениями
§ 50]
МЕТОД ОРТОГОНАЛИЗАЦИИ ПОСЛЕДОВАТЕЛЬНЫХ ИТЕРАЦИЙ
315
Таким образом, вычислив все коэффициенты g-y, мы можем после-
последовательно вычислить все полиномы сро= 1, срх(^) ср„(t) = cp(t).
В случае, если процесс оканчивается раньше времени, мы получим
минимальный аннулирующий вектор Xt полином.
Заметим, что в нормальном случае АХ-\- XG = 0, где X есть
неособенная матрица со столбцами Х1
Sn
х„
g\n
gin
_ О . .. — 1 gnn_
Таким образом, матрица А подобна матрице —G. Это обстоятель-
обстоятельство позволяет определить собственные векторы матрицы А в точ-
точности тем же процессом, что и в методе Хессенберга.
В прилагаемой табл. IV. 12 дается численная иллюстрация метода
на примере матрицы Леверье.
Таблица состоит из пяти частей. В первой части помещены
взаимно ортогональные векторы Хх Xi и их итерации.
Части II, III и IV содержат (Xt, Xk), (AXt, Xk) и gik соответственно.
В части V вычисляются коэффициенты характеристического полинома
по рекуррентным формулам. При вычислении итераций производится
обычный контроль по суммам. Из табл. IV. 12 видно, что коэффи-
коэффициенты характеристического полинома вычислены с достаточной сте-
степенью точности. В качестве контроля можно также вычислить теоре-
теоретически нулевую матрицу AX-\-GX.
Метод ортогонализации итераций в общем случае довольно тру-
трудоемок. Объем вычислительной работы при его применении больше,
чем, например, при применении метода Хессенберга.
Однако в случае, если матрица А симметрична, картина чрезвы-
чрезвычайно упрощается, именно, в этом случае матрица G будет трех-
диагональной.
Действительно, матрица X, столбцы которой попарно ортого-
ортогональны, может быть представлена в виде
X=UD,
где U — ортогональная матрица, D = [d,, .
Из равенства АХ-\- XG = 0 следует, что DGD*1 — — U~1AU. Если А
симметрична, то матрица —U~XAU тоже симметрична. Следовательно,
digijdj1 = djgjid^1- Так как §"^- = 0 при i-—у >¦ 1, то gji = 0 при
i — у> 1, т. е. G действительно есть трехдиагональная матрица.
Метод ортогонализации итераций в применении к симметричной
матрице носит название метода минимальных итераций. Он
был впервые описан Ланцошем в его широко известных работах
B] — [5]. Среди вычислительных методов линейной алгебры метод
dn], di = Y{Xi,
Таблица IV. 12
Определение коэффициентов характеристического полинома методом ортогонализации итераций
со
I
II
III
IV
V
*1
0
1
0
0
1
—11.811654
25.161231
—30.066321
¦^-19.223056
11.811654
—25.161231
30.066321
19.223057
1
AXt
1.870086
—11.811654
4.308033
0.269851
—5.363684
Х2
1.870086
0
4.308033
0.269851
0
22.129190
-255.57418
177.78270
234.06012
11.549188
—8.0338548
—10.576985
1
11.811654
АХ2
—8.4796731
25.161231
-55.724444
1.2832177
-37.759668
13.118302
0
—5.9701610
4.3997776
0
—0.000013 •
227.09071
—1829.9620
2643.4751
8.0582864
—11.640613
1
23.360842
111.25378
АХ3
—74.766345
—30.066321
79.090169
—85.680123
—111.422620
Xi
15.920690
0
—3.6292098
—52.393399
0
—0.000107
0.000083
3011.7078
—49600.723
16.469301
1
31.419128
291.46828
831.68803
AXt
—89.717741
—19.223057
35.839866
916.95301
843.85208
—0.000054
0
—0.000349
Q.000028
1
47.888429
797.27874
5349.4554
12296.550
э
о
•о
о
01
га
>
п
о
С
га
га
х
S.
X
а»
л
га
X
§51]
МЕТОД ВРАЩЕНИЯ
317
минимальных итераций занимает исключительно важное положение
в виду многочисленных связей его с другими современными мето-
методами, точными и итерационными.
Методу минимальных итераций и его обобщениям будет посвя-
посвящена гл. VIh частично гл. VII.
§ 51. Преобразование симметричной матрицы к трехдиаго-
нальному виду посредством вращений
Вращением мы будем называть преобразование координат с эле-
элементарной матрицей вращения
1
"A)
1
при с2 + s2 = 1.
Геометрически вращение может быть интерпретировано как пово-
поворот базисных векторов ег и ej на некоторый угол, осуществляемый
в плоскости, натянутой на векторы ег и е$. Матрица Г<у ортого-
ортогональна.
Мы покажем,1) что любую симметричную матрицу можно при-
привести к трехдиагональной форме посредством цепочки вращений,
т. е. цепочки преобразований подобия с матрицами вида Тц.
Произведем необходимые подсчеты. Пусть А — симметричная
В С ' В '
матрица,
= Л7\
В
С = T't В = Т'¦lATi..
Легко видеть, что все
столбцы матрицы В совпадают со столбцами матрицы А, за исклю-
исключением 1-го и /-го столбцов, которые получаются из соответствую-
соответствующих столбцов матрицы А по формулам:
Вх = cAi -f- sAj
Bj = — sAj, -j- c
B)
Гивенс [1], [2].
318 ПОЛНАЯ ПРОБЛЕМА СОБСТВЕННЫХ ЗНАЧЕНИЙ [ГЛ. IV
В свою очередь строки матрицы С совпадают со строками мат-
матрицы В, за исключением /-й и j-Pi, которые получаются из соответ-
соответствующих строк матрицы В по таким же формулам:
С = сВ1 4- sBj
C)
При этом для построения строк С3 и Сг нужно вычислить только
четыре элемента си, Су, Cjt, Cj1 (причем Cj% только для контроля,
так как с^ — Су, но они получаются неодинаковыми вычислениями).
Остальные элементы строк Сг и С3 не только теоретически равны
соответствующим элементам столбцов В{ и Bj, но при их вычисле-
вычислении выполняются одинаковые действия.
Пусть 1 <i<y. Покажем, что с и s можно выбрать так, чтобы
Cj_lfJ- == 0. Действительно, Ci_1j = bi_1j== — sai_li-)-caj-v> так чт0
S ai — lj
достаточно взять — = и, следовательно,
С Я;_1г-
Qi-lj ai-U
S= — г С = 7=-
Выбор знака знаменателя безразличен.
Весь процесс приведения симметричной матрицы к трехдиагональ-
ному виду выглядит так. За счет преобразований посредством
73, .'. ., Т2п аннулируются по очереди элементы первой строки,
начиная с третьего. Затем за счет Ти Т3п аннулируются эле-
элементы второй строки, начиная с четвертого. Ясно, что при этом
элементы первой строки больше меняться не будут. Действительно,
первые два элемента первой строки не будут меняться при преобра-
преобразованиях посредством Т34, ..., Т3п. Оставшиеся, равные нулю эле-
элементы, будут подвергаться линейным однородным преобразованиям
и потому останутся равными нулю. Далее, за счет преобразований
посредством Г45 Т4п аннулируются элементы третьей строки,
начиная с пятого и т. д.
Из сказанного выше ясно, что каждое последующее преобразо-
преобразование не будет изменять ранее аннулированные элементы. ' Таким
образом, самое большее через -^ преобразований, мы пе-
перейдем от данной симметричной матрицы А к трехдиагональной
матрице S.
Вычислительную схему метода проиллюстрируем на примере
матрицы
~ 1.00 0.42 0.54 0.66
0.42 1.00 0.32 0.44
0.54 0.32 1.00 , 0.22
0.66 0.44 0.22 1.00
D)
§ 51] МЕТОД ВРАЩЕНИЯ , 319
уже встречавшейся ранее в примерах решения системы линейных
уравнений.
Характеристический полином этой матрицы равен
^ — 4/3 -f- 4.752f2 — 2.111856^ -j- 0.28615248.
Здесь все коэффициенты вычислены точно.
Собственные значения матрицы D), вычисленные с точностью до
5. 10~9, суть
Х1 = 2.32274880, Х2 = 0.79670669, Х3 = 0.63828380,
Х4 = 0.24226071.
Процесс трехдиагонализации проведен в табл. IV. 13.
Таблица состоит из четырех частей. В части II наряду с данной
матрицей А расположены результаты последовательных преобразова-
преобразований подобия посредством Т23, Т24, Ти. Последняя матрица является
искомой матрицей S. Части I и IV вспомогательные, часть III — кон-
контрольная.
Дадим описание одного шага заполнения таблицы (заключающе-
(заключающегося в осуществлении преобразования посредством матрицы Тф.
В части II переписываются все элементы предыдущей матрицы, кроме
элементов, лежащих в двух строках и двух столбцах с номерами I
и j. Затем j-й и у-й столбцы преобразуются по формулам A) и
элементы преобразованных столбцов, кроме элементов с индексами и,
ij> jl> JJ записываются на надлежащие места в части II. Выделенные
четыре элемента вносятся в часть I. Образованная матрица запол-
заполняется далее по симметрии. Оставшиеся четыре элемента строятся
затем по формулам B) над числами, помещенными в части 1. В чет-
четвертую часть записываются коэффициенты ens, определяющие
матрицы вращений (в последней строке) и необходимые для их
вычисления числа. Контроль (часть III) осуществляется при помощи
вычисления соответствующих столбцовых сумм (для контроля опера-
операций над столбцами) и при помощи вычисления следов построенных
матриц, которые должны быть равны между собой.
После того, как построена трехдиагональная матрица, подобная
исходной матрице А, отыскание собственных значений может быть
осуществлено различными способами.
Наиболее прямым путем является построение характеристического
полинома <f(t) для матрицы S (а следовательно, и подобной ей
матрицы Л) по рекуррентным формулам
?о=1. ?<W = (' — *«)?,_!(О-8|_и?«_2('). ?л@ = (-1
и затем нахождение его корней.
Таблица IV. 13
Приведение симметричной матрицы к трехдиагональной при помощи цепочки вращений
(О
о
I
II
III
IV
!
и
ш
IV
1.00
0.42
0.54
0.66
4.00000000
1
0.95057877
0
0.00000000
4.00000000
0.42
1.00
0.32
0.44
2.18
0.4680
0.61394061
1.25101197
1.01369821
0.95057877
1.60414343
—0.20405479
—0.13906436
3.01123416
0.54
0.32
1.00
022
2.08
0.68410526
0.78935221
0
— 0.20405479
0.68984614
—0.09805848
0.38773287
0.060977254
0.82634777
0.66 II 1
0.44 0.68410525
0.22 0
1.00 0.66
3.99999997
—0.59027359
0.41154187
0.00000000
— 0.13906436
— 0.09805848
0.70601043
0.46888759
—0.27679020
0.24693573
0.56316014
1
0.95057877
0
0
3.99999997
0.86653332
0.98581321
0.68410525
1.31015383
—0.07876923
0.44379135
2.3592812
2.98024313
0.90359999
0.71967235
0.95057877
1.60414343
—0.24693573
0
—0.59289121
0.36134790
0
—0.07876923
0.68984614
—0.21224804
—0.44379135
0.51483019
0.31656653
0
—0.24693573
0.60370643
—0.02833780
0.58446099
0.66
0.44379135
—0.21224804
1
1.8915433
0.95057876
0.69431385
—0.46952426
0.63863277
0
0.00000000
—0.02833781
0.79215011
0.16910852
я
о
1
я
¦о
о
от
м
к
f-
п
о
3
до
>
га
X
§51]
.МЕТОД ВРАЩЕНИЯ
321
Коэффициенты полиномов <р;(О удобно вычислять следующим
образом. Коэффициенты располагаются согласно схеме
?п
in)
tn
t°
Схема затем заполняется слева направо по рекуррентной формуле
Участвующие в формуле коэффициенты, очевидно, входят в схему
в следующем расположении
(i-l) (i)
Гивенс ') рекомендует другой прием, позволяющий обойти вычисление
коэффициентов характеристического полинома. Этот прием исполь-
использует то обстоятельство, что полиномы ср0, <рх, . . ., !fn образуют ряд
Штурма.
Наконец, как мы видели в § 49, здесь удобно проводить вычисле-
вычисление корней методом квадратичной интерполяции.
Вычисление собственных векторов для матрицы S может быть
осуществлено так же, как в методе Хессенберга, т. е. посредством
решения соответствующей треугольной системы
(sn — Х4)
sl2v2 = О
E)
Sn -1 Л - 1 + (Snn — Aj) Vn = 0
для компонент vx,...,vn собственного вектораVit принадлежащего l-r
Однако здесь удобно задаться первой компонентой (а не послед-
последней, как в методе Хессенберга) и затем последовательно вычислят >
вторую, третью и т. д.
1) Гивенс [2].
21 Зак. 974. Д. К. Фаддеев и В. Н. Фаддеева
322 ПОЛНАЯ ПРОБЛЕМА СОБСТВЕННЫХ ЗНАЧЕНИЙ [гл. IV
: Оказывается возможным дать и явные формулы для компонент
собственного вектора, принадлежащего собственному значению >.;.
Именно,
vk = cpj. . (XA F)
Действительно, подстановка этих значений для компонент в левую
часть ft-го уравнения системы E) дает
Он) 4-
0 при 2<ft</i-l.
TaKiM образом, уравнения от второго до и—1-го удовлетворяются.
Очевидно, удовлетворяется и первое уравнение. Последнее же является
следствием остальных.
Однако пользоваться явными формулами F) менее целесообразно,
чем численно решать систему E), как по объему вычислений, так и
по надежности результата.
Для перехода от собственных векторов матрицы S к собственным
векторам матрицы А нужно использовать соотношение
с гт1 т V AT T
° — I ' 23 • • • ' П-1,п\ Л/ 23 • ¦ • ' я-|,п-
из которого следует, что каждый собственный вектор U матрицы А
выражается через соответствующий собственный вектор V матрицы 5
по формуле
U = TaT2t...Tn.linV. G)
т. е. U получается из V посредством цепочки умножений на матрицы
поворотов Ту. При каждом отдельном умножении будут меняться
только две компоненты предыдущего вектора — i-я и у'-я — по
формулам
v'. = cv. — sv.
v'. = sv.-\-cv..
J I ' J
Здесь через v{ и Vj обозначены компоненты предыдущего вектора,
через v't и v'. — следующего.
Хотя количество умножений в этом процессе весьма значительно,
ошибки округления накапливаются медленно, так как они умножаются
на коэффициенты с и s, по модулю меньшие единицы.
Наконец, отметим, что если окажется, что один или несколько
элементов sk_lk равны нулю, то матрица S разобьется на два
или несколько якобиевых ящика И задача вычисления собствен-
собственных значений и собственных векторов только облегчится. Это
§51]
МЕТОД ВРАЩЕНИЯ
323
явление наверное будет иметь место, если исходная матрица имеет,
кратные собственные значения.
Мы закончим этот параграф вычислением характеристического
полинома для матрицы, приведённой нами к трехдиагональному виду
в табл. IV. 13, определением собственных значений этой матрицы
и вычислением двух собственных векторов, принадлежащих наиболь-
наибольшему и наименьшему собственным значениям.
Таблица IV.14
Вычисление коэффициентов характеристического полинома
по рекуррентным формулам
* \
4
3
2
1
0
0
1
1
0.90360000
1
1
—1
1.60414343
0.060977255
2
1
—2.60414343
0.70054343
0.60370643
0.0008030309
3
1
—3.20784986
2.21170431
—0.36194532
0.79215011
4
1
—3.99999997
4.75199990
—2.11185592
0.28615247
Здесь в первой части таблицы расположены коэффициенты после-
последовательных полиномов ср{ (по столбцам), во второй записаны коэф-
коэффициенты рекуррентных формул sH и s?_l4 (вычисленные по данным
табл. IV. 13). Таким образом находим, что искомый характеристи-
характеристический полином будет
/4 —3.99999997/3 + 4.75199990/2—2.11185592/ + 0.28615247.
Его наибольший и наименьший корни будут
Х, = 2.32274880 и Х4 = 0.24226070.
Для определения принадлежащих им собственных векторов найдем
сначала соответствующие собственные векторы матрицы S, решая
систему E).
Получим
V\=(l, 1.3915194, —0.19994896, 0.00370089)'
V',^.-(l, —0.79713467, —0.54680289, —0.02817925)'.
21*
324
ПОЛНАЯ ПРОБЛЕМА СОБСТВЕННЫХ ЗНАЧЕНИЙ
[гл." iv
Далее вычисляем последовательно
TuV1 = (l, 1.3915194, —0.16731157,
TVm^i == 0. 1-0774967, —0.16731157,
T23T2iTHV1 = Ul^(\, 0.793587, 0.747805,
—0.10954506/
0.88731461/
0.887315/
734V4 = A, —0.79713467, —0.43597992, 0.33122345/
72473y4=(l, —0.34370275, —0.43597992,-—0.79183400/
T23T2iTuVi=Ui = (l, 0.133129, —0.538968, —0.791834/.
Отметим, что указанный процесс можно применять и к несим-
несимметричной матрице, только при этом в результате вместо трехдиа-
гональной матрицы получится почти треугольная матрица
1 5'l2
!1 S22
г_ы Sn-1,2
П S,l2
0
$п- 1, 'Л
Sn3
0
0
• •¦ sn_]
... Sn n
!, П-1
-1
0
0
«„-..
Таким образом, в случае несимметричной матрицы цепочка вра-
вращений приводит ее почти к такому же виду, как и в методе Хес-
сенберга и в методе ортогонализации итераций. Проблема собствен-
собственных значений решается аналогично указанным методам.
§ 52. Уточнение полной проблемы собственных
значений
Пусть А данная матрица, собственные значения которой попарно
различны. Пусть мы располагаем приближенными значениями Xj, ..., Х„
для собственных чисел матрицы А, приближенными собственными
секторами Ut Un матрицы А, так же как и приближенными
собственными векторами Vx, .... Vn сопряженной матрицы А*. Ста-
Ставится задача об уточнении всей совокупности перечисленных величин.
Будем искать уточненные значения в виде
считая числа ДХ4, так же как и компоненты векторов
малыми.
§ 52] УТОЧНЕНИЕ ПОЛНОЙ ПРОБЛЕМЫ СОБСТВЕННЫХ ЗНАЧЕНИЙ 325
Без нарушения общности можно считать, что
Действительно, собственные векторы определены с точностью до
скалярного множителя и потому мы вправе считать, что 1-я коор-
координата уточненного собственного вектора по отношению к базису
Ux, • ¦ •, Un равна единице. На том же основании мы вправе счи-
считать, что
2
Очевидно, что коэффициенты кц и ktj будут малыми числами.
Выразим поправки ДХ; и коэффициенты Ai;- и йу через невязки
известного нам решения полной проблемы собственных значений,
т. е. через
Уравнение
перепишем в виде
AU-,
Введя в это равенство невязку /¦$ и отбросив последний член пра-
правой части равенства, получим
AbUt— hWi^i — n + MiUi. E)
Составим теперь скалярные произведения с векторами Vj (J = 1, . . ., п).
Тогда
(A At/,, V,) - X; (Д1/4. V,) = - (п, V,) 4- ДХ; (f/t, ^-)- F)
Но, с точностью до малых 2-го порядка,
Поэтому
(X,. - )н) (Af/i, Vj)» - (г,. V,) + ДХ; (f/j. ^-). G)
Положив /=У, получим
326 ' ПОЛНАЯ ПРОБЛЕМА СОБСТВЕННЫХ ЗНАЧЕНИЙ [ГЛ. IV
Будем теперь считать, что 1ф]. Так как с точностью до малых
2-ю порядка
то из равенства G) получим
(fi, VA
n
Аналогично
Из вида этих формул мы заключаем, что для уточнения собствен-
собственных значений и собственных векторов используются по существу
лишь результаты контрольных вычислений, произведенных после
получения исходного приближения к решению полной проблемы
собственных значений.
Отметим, что при этом коэффициенты hjj и &у связаны друг
с другом легко проверяемым соотношением
(Uj, V,)Ay + (t/,, VOktj = -(Uit Vj),
так что для вычисления коэффициентов &у даже нет необходимости
вычислять невязки г*.
Уточненные значения собственных чисел могут быть вычислены
также по формуле
1-, | ц. _>. | (П< Vt) _(AUt, Vt) (П)
из которой видно, что для получения уточненного значения для соб-
собственного числа достаточно лишь знать приближенные значения для
собственных векторов ?/4 и Vf.
Отметим, что указанный процесс есть не что иное, как приме-
применение одного шага метода Ньютона к нелинейной системе
A*Vt = 1уг.
Для симметричной матрицы можно считать ?/4 = Vt и потому
лх _ (r«, Ut)
(П, Uj)
H
., ц.у
Приведем результаты уточнения полной проблемы собственных
значений для матрицы Леверье. В качестве исходных приближений
возьмем данные эскалаторного метода, округленные до трех десятич-
десятичных знаков. Имеем
Х, = —17.863. Х2 = —17.152, Х3 —— 7.574, Х4 = —5.299.
§ 52] УТОЧНЕНИЕ ПОЛНОЙ ПРОБЛЕМЫ СОБСТВЕННЫХ ЗНАЧЕНИЙ 327
Имеем также
—0.020
0.170
0.187
0.808
0.999111
.2
0.033
-0.261
0.237
0.587
1.000543
и*
—0.351
0.328
0.261
0.045
0.999343
1.135
0.112
0.071
0.011
0.999848
Уг
—0.014
0.780
— 1.141
0.808
V2
0.023
— 1.201
1.442
0.587
V,
-0.248
1.510
1.590
0.045
V.
0.803
0.516
0.430
0.011
В последней строчке размещены соответствующие скалярные про-
произведения (Uj, Vj) при j = 1, 2,3, 4. Вычисления проведем для i= \.
Имеем
-0.00110982
0.00228956
0.00181651
0.00001071
('Г VJ)
- 0.00026259
-0.00014959
0.00662120
0.00107144
-0.711386
-10.2822-10
-12.562090
АУ
0
0.00021023
- 0.00064394
- 0.0000852Э
0.00013616
- 0.00027565
- 0.00012429
0.000Э9352
и,
- 0.01986384
0.16972435
- 0.18712429
0.80809352
cU,
- 0.019873
0.169806
-0.187214
0.808482
В последнем столбце помещается собственный вектор, принадлежа-
жий собственному значению \, нормированный так, чтобы его по-
последняя компонента совпадала с последней компонентой собствен-
собственного вектора, вычисленного эскалаторным методом.
По формуле (8) находим
ДХ1 = — 0.000263; \ = — 17.863263.
Приводим также результаты вычислений для i = 2, 3, 4.
0.032933
- 0.261309
0.236640
0.586694
&з
-0.351235
0.328466
0.260925
0.045006
&4
1.135218
0.112182
0.070589
0.011058
Хз = — 17.152428, Х3 = — 7.574013, Х4 = — 5.233696.
Полученные значения для собственных чисел и компонент соб-
собственных векторов верны уже с точностью до 2 • 10~в
ГЛАВА V
ЧАСТИЧНАЯ ПРОБЛЕМА СОБСТВЕННЫХ ЗНАЧЕНИЙ
Настоящая глава посвящена частичной проблеме собственных зна-
значений, которая состоит, как было сказано выше, в определении
одного или нескольких, как правило немногих, собственных значе-
значений матрицы и принадлежащих им собственных векторов. Своеобразие
частичной проблемы заключается в том, что методы для ее решения
должны основываться на косвенных соображениях, использующих те
или другие свойства собственных значений и собственных векторов.
В.се методы для решения частичной проблемы являются итерацион-
итерационными методами.
Для построения этих методов используются две, по существу
различные, основные идеи.
Первую идею мы поясним в предположении, что в пространстве
существует базис из собственных векторов. Исходя из некоторого
вектора, вообще говоря, произвольного, строят бесконечную по-
последовательность векторов так, чтобы в этой последовательности
все более преобладала одна составляющая в разложении по собствен-
собственным векторам. Тогда построенная последовательность будет схо-
сходиться по направлению к выделенному собственному вектору. По-
Попутно определяется и собственное значение. Процессы, основанные
на этой идее могут быть применены и при отсутствии базиса из
собственных векторов. В этом случае при их обосновании можно
использовать разложение по каноническому базису. При этом не-
некоторое видоизменение методов позволяет вычислять несколько век-
векторов из канонического базиса.
Вторая идея основывается на экстремальных свойствах собствен-
собственных -значений и применима только к симметричным матрицам. Эта
идея близка к идее релаксации для решения линейной системы урав-
уравнений. Методы, основанные на этой идее, дают последовательность
векторор, все лучше реализующих максимум (или минимум) отно-
(АХ, X) " "
шения ¦-„ '-.-¦
(Л, Л)
- Выбор поправок для перехода от предыдущего вектора к по-
последующему может осуществляться различно. Важнейшая группа ме-
методов, использующих эту идею, в которых поправки берутся в на-
§ 53] НАИБОЛЬШЕЕ ПО МОДУЛЮ СОБСТВЕННОЕ ЗНАЧЕНИЕ 329
правлении градиента функционала v ' , будет рассмотрена в
(л, л)
главе VII. В этой же главе будут вкратце рассмотрены методы, ана-
аналогичные методам координатной релаксации, простой и групповой.
§ 53. Определение наибольшего по модулю
собственного значения матрицы при помощи
последовательных итераций
В настоящем параграфе мы изложим метод, позволяющий вы-
вычислять наибольшее по модулю собственное значение матрицы и при-
принадлежащий ему собственный вектор при помощи вычисления по-
последовательности итераций произвольного вектора. Излагаемый ме-
метод называется степенным и является простейшим итерационным
процессом для решения частичной проблемы собственных значений.
Он применим для произвольной матрицы, хотя ход итерационного
процесса существенно зависит от того, как входит наибольшее по
модулю собственное значение матрицы в ее каноническую форму
Жордана. В связи с этим приходится различать несколько возмож-
возможных случаев. Мы, однако, не будем исследовать проблему во всей
общности и ограничимся рассмотрением лишь важнейших частных
случаев.
Для упрощения изложения мы будем предполагать, что все
собствен-ные значения матрицы, кроме, может быть, наибольшего
по модулю, имеют линейные элементарные делители, хотя выводы,
которые мы сделаем, имеют место и без этого предположения. Будем
также считать, что элементы исследуемых матриц вещественны.
1. Наибольшее по модулю собственное значение веществен-
вещественное и простое. В этом случае наибольшему по модулю собствен-
собственному значению соответствует один линейный элементарный делитель,
так что в силу только что сформулированного соглашения, все
элементарные делители матрицы линейны. Поэтому существует базис
из собственных векторов U1, U2 ?/,., принадлежащих собствен-
собственным значениям \, Х2 Хп, расположенным в порядке убывания
модулей, причем \W > | Х2 [, но среди остальных могут быть равные.
Возьмем произвольный вектор Уо и образуем последовательность
его итераций матрицей А
AY0, A*Y0, ..., АП0, ...
Напишем разложение вектора Уо по собственным векторам
yo = fl1f/1 + fl8f/2+ ¦¦• +anUn. A)
Среди чисел щ некоторые могут равняться нулю. Предположим,
однако, что at Ф 0. х)
!) Так как щ = (Vi, Yo), где Vj первый собственный вектор транспони-
транспонированной матрицы, то требование <ц_ Ф 0 будет выполнено в случае, если
вектор Уо не будет ортогонален к вектору V±.
330 ЧАСТИЧНАЯ ПРОБЛЕМА СОБСТВЕННЫХ ЗНАЧЕНИЙ [ГЛ. V
Очевидно, что
А Ко = axKlUx + a2k2U2 + • • • + anXnUn
B)
Обозначим AkYQ=Yk = (ylk, y2k, ..., ynk)' и выясним структуру
компонент вектора Yk. Пусть
Ui = (ии> И21- • • ¦ • ип1)', U2 = (и12, й22 un2Y, . . ., U,, =г-
-=(и,н, и.2п, . . ., и„пу.
Тогда из B) получим
yih -=a1uaXil + a2i/i2Xa+ ... -)-««««>-«•
Коэффициент при XJ по крайней мере в одной из компонент не ра-
равен нулю, так как ах Ф 0 по предположению и вектор Ux не ну-
нулевой. Пусть ук (первый индекс опускаем) какая-либо из компонент
вектора Yk, для которой коэффициент при XJ{ отличен от нуля. Тогда
Ук ~ С 1^1 + С2^2 И" ¦•• +СпК- C)
причем коэффициент с; не зависит от индекса k и с, =,- 0.
Рассмотрим отношение компонент двух соседних итераций.
Ук + i.
yk ,
Ук Cj>* 4- c2l« + . . . + с„^
-— Xt 2 JU^? '" ~*~ """ , D)
где
Произведя деление и удерживая члены до порядка о^к и а* вклю-
включительно, получим
^ [ ^^ ^f] D+af), F)
где
*; = Ml — «2). *3 = *3A—«З)- G)
Отсюда мы видим, что если k достаточно велико, то
A^^il. (8)
1 Ук
Так как обычно все компоненты вектора Ut отличны от нуля,
то в качестве ук может быть взята, как правило, любая компонента
§ 53] НАИБОЛЬШЕЕ ПО МОДУЛЮ СОБСТВЕННОЕ ЗНАЧЕНИЕ 331
вектора Yk. Таким образом, первое собственное значение прибли-
приближенно равно отношению любых соответствующих компонент двух
соседних достаточно высоких итераций произвольного вектора ма-
матрицей А.
При практическом выполнении итераций следует вычислять от-
отношения ??L±1 для нескольких компонент. Хорошее совпадение этих
Ук
отношений будет показывать, что в выражении F) различие зна-
значений коэффициентов Ь'ч, Ь'л уже перестало играть заметную роль.
Быстрота сходимости процесса в рассматриваемом случае опре-
определяется величиной отношения —¦ и может быть медленной, если это
'¦1
отношение близко к единице.
Для того чтобы избежать роста компонент, иногда целесооб-
целесообразно при вычислении итераций тем или другим способом нормиро-
нормировать на каждом шагу получаемые векторы. Удобными нормировками
являются деление вектора на его первую компоненту, или на наи-
наибольшую компоненту, или, наконец, нормировка к единичной длине.
При этом вместо последовательности Yk мы получим последователь-
последовательность Yk = \>kYk, где [)к нормирующие множители, и для получения )ч
надо брать отношения компонент векторов AYk и Yk.
Может случиться, хотя это и маловероятно, что начальный век-
вектор Ко выбран неудачно, именно так, что коэффициент а, равен
нулю, или очень близок к нулю. В этом случае не будет ясной
картины сходимости итераций по направлению. Действительно, на
первых шагах итерации преобладающим будет член, зависящий от
Х2 (если а2 Ф 0). Однако в дальнейшем, если даже ах точно равно
нулю, то после нескольких шагов итерации слагаемое, зависящее
от \, появится, благодаря ошибкам округления, сначала 'с очень
малым коэффициентом; по мере дальнейших итераций это слагаемое
будет довольно быстро возрастать по сравнению с остальными.
„Борьба за преобладание" членов, зависящих от \ и ^2, вызывает
неясность в ходе процесса. При неудачном выборе, в указанном
смысле, начального вектора, его необходимо изменить.
Описанный процесс дает возможность определить также и все
компоненты собственного вектора, принадлежащего наибольшему
собственному числу. Именно, отношения компонент вектора Yk стре-
стремятся к отношениям компонент этого собственного вектора.
Действительно, при о, Ф 0
О (?)*]. (9)
Пример i. Попытаемся определить первое собственное значение
матрицы Леверье.
332
ЧАСТИЧНАЯ ПРОБЛЕМА СОБСТВЕННЫХ ЗНАЧЕНИЙ
[ГЛ. V
Возьмем вектор A, 0, 0, 0)' за исходный и образуем 20 итераций,
нормируя их на каждом шагу посредством деления на первую
компоненту.
Приведем только две последние итерации:
Уи» АУ1в
1.00000 — 17.4655
—8.20321 143.3809
8.17013 —143.0881
—7.95957 149.2676
— 6.99265 132.0949
Отношения
компонент
—17.466
—17.479
—17.514
—18.753
Из приведенных данных мы видим, что отношения различных
компонент еще далеки друг от друга; это показывает, что процесс
еще не установился. Действительно, с точностью до трех знаков,
Xj = —17.863. Процесс итерации сходится медленно из-за того, что
второе собственное значение Х2 — —17.152 мало отличается по мо-
модулю от первого.
Пример 2. Определим первое собственное значение и принад-
принадлежащий ему собственный вектор для матрицы
—5.509882 1.870086 0.422908
0.287865 —11.811654 5.711900
0.049099 4.308033 —*12.970687_
Возьмем в качестве начального вектор A, 0, 0)'. Приведем та-
таблицу итераций, начиная с 12-й итерации:
Уи АУ1г У13 - АУ13 ?и АУи
1.0000000 —17.351783 1.00000Э0 —17.378482 1.0000000 —17.389552
— 8.1139091 141.126754 — 8.13327J0 141.483894 —8.1413264 141.6329Э1
7.8783245 -137.093170 7.9008117 —137.468256 7.9102568 -137.625469
0.7644154 —13.318201 0.7675407 —13.362844 0.7689304 —13.382030
Найдем отношения соответствующих компонент для 12-й, 13-й,
14-й и 15-й итерации:
— 17.351783 —17.378482 —17.389552
— 17.393189 —17.395694 —17.396795
— 17.401310 —17.399257 —17.398356.
Три последних отношения позволяют нам считать, что Xi =— 17.39
или Х1 =—17.40. Как мы видели в § 48, с точностью до четырех
знаков, 'Х1 = — 17.3977.
§ 53] НАИБОЛЬШЕЕ ПО МОДУЛЮ СОБСТВЕННОЕ ЗНАЧЕНИЕ 333
Далее, для компонент собственного вектора находим следующие
значения
1.00000 1.00000 1.00000
—8.13327 —8.14133 —8.14472
7.90081 7.91026 7.91426.
Мы видим, что последний результат уже довольно близко под-
подходит к точному значению, так как в § 48 было найдено, что
Uv = @.094129, —0.766896, 0.745248)' или после соответствую-
соответствующего нормирования {Д— A.00000, —8.14729, 7.91730)'.
Пример 3. Найдем первое собственное значение и принадле-
принадлежащий ему вектор для матрицы
0.22
0.02
0.12
0.14
0.02
0.14
0.04
—0.06
0.12
0.04
0.28
0.08
0.14
—0.06
0.08
0.26
В табл. 111.1 были вычислены 14 итераций, исходя из вектора
@,76, 0.08, 1.12, 0.68)'.
Вычисляя отношения компонент 14-й и ГЗ-й итераций, находим
для >ч значение 0.4800.
(Мы игнорируем вторую компоненту итераций из-за ее малости
по сравнению с остальными компонентами).
Отношения компонент 7-й и 6-й итераций дают для \ значения
0.4800, 0.4792, 0.4808.
Для компонент собственного вектора из 14-й итерации нахооим
следующие значения:
1.0000, 0.0000, 1.0000, 1.0000.
Нетрудно проверить, что точное'значение ^ = 0.48 и принадле-
принадлежащий ему собственный вектор имеет-компоненты 1, 0, 1, 1.
2. Наибольшее собственное значение вещественное, кратное,
но соответствующие ему элементарные делители линейны.
В этом случае формула C) остается верной, но несколько первых
членов можно соединить вместе, так что
где г кратность \v
Все дальнейшие рассуждения остаются в силе и потому
v /X \к
i±tl=). _|_О (-г1 . A0)
334
ЧАСТИЧНАЯ ПРОБЛЕМА СОБСТВЕННЫХ ЗНАЧЕНИЙ
[гл. v
Таким образом, и в этом случае, при условии а^ ф 0, отношение
-—— дает приближенное значение наибольшего собственного числа.
Ук
Вопрос о кратности корня не может быть решен без более деталь-
детального исследования. Мы еще вернемся к этому вопросу ниже.
Векторы Yk = AkY0, также как и в предыдущем случае, сходятся по
направлению к одному из собственных векторов, принадлежащих X,,
именно к собственному вектору, лежащему в циклическом под-
подпространстве, порожденном вектором Ко. Исходя из различных на-
начальных векторов, мы придем, вообще говоря, к различным собствен-
собственным векторам.
Пример 4. Определим первое собственное значение матрицы
.022551 0.116069 —0.287028 —0.429969"
0.228401 0.742521 —0.176368 —0.283720
0.326141 0.097221 0.197209 —0.216487
|_0.433864 0.148965 —0.193686 0.006472_
Решая характеристическое уравнение
X4—1.968753).3+ 1.391184X2 — 0.415291л -f- 0.044360 = 0,
получим для собственных чисел значения:
Х1 = Х2 = 0.667483, Х3= 0.346148, Х4 = 0.287639.
Определим Xt при помощи степенного метода, взяв за начальный
вектор A, 1, 1, 1)'.
Приведем таблицу итераций, начиная с 9-й итерации:
1.000000
1.844723
0.676506
0.875250
AYg
0.666160
1.230507
0.449420
0.583298
1.000000
1.847165
0.67464.3
0.875613
0.666822
1.232545
0.449211
0.584025
Yu
1.000000
1.848387
0.673660
0.875834
AYn
0.667151
1.233563
0.449088
0.584399
4.396479 2.929385 4.397421 2.932603 4.397881
Вычислим отношения компонент этих итераций:
0.666160 0.666822 0.667151
0.667042
0.664325
2.934201
0.666466
0.667263
0.665850
0.666990
0.667373
0.666639
0.667249
Последние четыре отношения дают для \ значение 0.667, вер-
верное с точностью до третьего знака.
§ 531
НАИБОЛЬШЕЕ ПО МОДУЛЮ СОБСТВЕННОЕ ЗНАЧЕНИЕ
335
3. Два наибольшие по модулю собственные значения веще-
вещественны и противоположны по знаку. Из равенства C) мы видим,
что в этом случае четные и нечетные итерации имеют различные
коэффициенты при соответствующих степенях \, так как
и потому две соседние итерации не могут быть использованы для
определения \. Однако мы можем определить 1?х по одной из сле-
следующих формул:
Учк
или
А: —
1
У-ik + i
(И)
Для нахождения собственных векторов, принадлежащих /.t
и Х2 =— >чГ целесообразно построить векторы У^-^^У^-х и Ук~"
— Kiyk_v Отношения компонент этих векторов будут стремиться,
соответственно, к отношению компонент векторов (У, и U2, прина-
принадлежащих собственным числам \г и к2.
Действительно, в силу равенства
У и =
«2 (~ К)
A2)
имеем
- A3)
Пример 5. Нетрудно вычислить, что собственные значения
матрицы
~ 4.2 —3.4 0.3"
А= 4.7 —3.9 0.3
__5.6 5.2 0.1.
суть Xj = — Х2 = 0.5, Х3 = 0.4, причем собственному значению 0.5
принадлежит собственный вектор A, 1, —1)', собственному значе-
значению —0.5 принадлежит собственный вектору—-_-, —-^-, 1) яа
яь5(—0,667, —0.833, 1)'.
336 ЧАСТИЧНАЯ ПРОБЛЕМА СОБСТВЕННЫХ ЗНАЧЕНИЙ [гл. V
Проведя вычисления получим .
уо ^23 Уи , К25
0.2 0.25972708 • 10 0.22548439 • 10 0.65159766 • \0~~~
0.4 0.23588520 ¦ 10~6 0.23740533 • 10 0.59199296 • 1*0
0.6 —0.21119890- 10~6 —0.24898850-10-° —0.53103718 • 10
0.28441339-10"" 0.21390121•10"G 0.71255344-10""-
Для отношений соответствующих компонент векторов К2Ь и К23
получим
0.25087782, 0.25096655, 0.25143936,
откуда для Xj находим три приближенных значения
0.500877, 0.500966, 0.501437,
так что, с точностью до трех десятичных знаков, Xj я» 0.501.
Далее находим
К25 +0.501 К23 Ul К23 —0.501 К24 02
0.17 1.000 —0.0479 —0.669
0.17., 1.000 —0.0597 —0.834
—0.1778 —0.998 0.0716 1.000.
Таким образом, компоненты собственных векторов определены
с точностью до 2 • 10" .
4. Наибольшие по модулю собственные значения образуют
простую комплексную пару. Пусть X, и Х2 комплексно-сопряжен-
комплексно-сопряженные, наибольшие по модулю собственные значения и |^зГ<СРч1-
Согласно формуле C)
причем в этом случае с1 и с2 кбмплексно сопряжены. Пусть
)л = re , К2 = re
тогда
yk=2Rrkcos(kd-i-a)-JrC^I+ . . . . A5)
Присутствие множителя cos(&8-f-a) будет причиной того, что зна-
значения ук будут сильно колебаться как по величине, так и по знаку.
Таким образом, наличие комплексных корней, наибольших по мо-
модулю, сразу обнаруживается при составлении итераций. Положим
р = — (X, -Ф Х2) = — 2г cos 6
¦ , 2 A6)
§ 53] НАИБОЛЬШЕЕ ПО МОДУЛЮ СОБСТВЕННОЕ ЗНАЧЕНИЕ 337
Тогда \ и Х2 будут корнями квадратного уравнения
Коэффициенты р и q могут быть определены из следующих сооб-
соображений. Пусть k настолько велико, что ук яу с^к\ -\- с2Х*. Тогда
+ сЛ*-1^ +Р\ + Я] = 0. A7)
Здесь приближенное равенство справедливо с точностью до О (| ).31/с).
Аналогичное приближенное равенство
+ ^ft-i^0 A8)
будет справедливо для любой другой компоненты гк вектора
Yk — A'Y0. В качестве zk можно также взять zk = ykvt или, более
обще, любую компоненту вектора Zk = A Zo, где Zo произвольный
начальный вектор.
Из равенств A7) и A8) получим, вообще говоря,
В частности, если взять zk = yk+l, получим
У к
Дадим более строгое обоснование формул A9) и B0). Это
позволит выяснить условия их применимости и оценить погрешность.
Пусть
^ ^ ( *)
Тогда
С))~
0)=
= {cld2 - cadj (Х§ - XJ) X*-IX*-»+ О (| XfX* |).
22 Зак. 971. Д- К. Фаддеев и В. Н. Фаддеева
О (| Х3 \к)) (rf^i + <*2^ 1 + О (| Хэ
338
ЧАСТИЧНАЯ ПРОБЛЕМА СОБСТВЕННЫХ ЗНАЧЕНИЙ
[ГЛ. V
Аналогично
У*-А -
сЛ~ c2d,)(к, - >.,)Xf-%*-1 -f- О
Мг — ctd{)(h — К)
Поэтому
A9')
'ft-1
если только cld2 —
). Аналогично
V V
¦)¦
B0')
Отметим, что для формул B00 условие cld2 — c2dl^0 всегда
выполняется, ибо dl = \cl, d2^='K2c2, так что cxd2 — cadt =
12B J^
Собственные значения Xt и Xj можно определять минуя вычисле-
вычисление /> и решение квадратного уравнения. Именно, определив q — fl
по однсй из формул A9) или B0), найдем г и вычислим выражение1)
B1)
= ~ [ctr Vм + c2rke~iM\ [e -•« + е*в] = Л cos б.
Отсюда находим
cos 6
Ук
B2)
~г~) ¦
После того как собственные значения Xt и Х2 определены,
соответствующие им собственные векторы легко определяются.
Именно, из приближенных равенств:
1) Эйткен E].
§531
находим
НАИБОЛЬШЕЕ ПО МОДУЛЮ СОБСТВЕННОЕ ЗНАЧЕНИЕ
339
B3)
Yk+l—Х2КА и Yk+1— \Yk,
с точностью
векторами, соответ-
соответоткуда следует, что
до малых слагаемых, являются собственными
ствующими собственным значениям Xt и Х2.
Пример 6. Собственные значения матрицы
26 —54 4
13 —28 3
_ 26 —56 5
суть X, = 1 +5/, Х2 = 1 — 5/ и Х3 = 1. Собственный вектор, принад-
принадлежащий Xt (нормированный соответствующим образом) есть Ul =
= A, 0.53974564 — 0.09141494/, 1.03656599 + 0.01589827/)'.
Вычислим собственные значения X, и Х2 и принадлежащие им
собственные векторы степенным методом. Имеем
0.2 1293880.4 3669538.0 —26301835
0.4 654932.2 2528583.4 —11971081
0.6 1348746.6 3708420.2 —27650581
3297559.2 9906541.6
-65923497
Беря за ук первую компоненту и за zk вторую компоненту, получим
17367716-105
откуда
Далее
Я
86838591 • 10*
22578047 • 10»
= — 1.9999997
86838591 • 10*
= 26.000015,
Xt яа 0.9999999 + 5.0000015/
Х2 яа 0.9999999 — 5.0000015/.
= (—22632297 + 18347696/, —9442498 + 12642921/,
—23942161 +185421070'.
так что после соответствующей нормировки
^ = A, 0.5250 — 0.1330/, 1.0391+0.02310'.
22*
340 ЧАСТИЧНАЯ ПРОБЛЕМА СОБСТВЕННЫХ ЗНАЧЕНИЙ [гл. V
Используя К18, К19 и К20, получим
Xt= 1.00000000 Н- 5.00000000/,
U1 = (l, 0.5397452 — 0.0914155/, 1.0365660 + 0.0158983/)'.
5. Наибольшее по модулю собственное значение вещественно
и находится в жордановом ящике второго порядка. Нами уже
отмечалось, что ход итерационного степенного процесса существенно
зависит от структуры канонической формы Жордана, связанной
с данной матрицей. В этом пункте мы на простейшем примере
покажем характер тех изменений, которые возникают, если наи-
наибольшему по модулю собственному значению соответствует не-
нелинейный элементарный делитель.
Именно, рассмотрим случай, когда Хх вещественно и принадлежит
Г/., 01
в канонической форме Жордана ящику I, а следующее соб-
Ll '-iJ
ственное значение Х2 по модулю меньше, чем Xv Для простоты
выкладок мы будем считать, как и прежде, что всем остальным
собственным значениям соответствуют линейные элементарные
делители.
В рассматриваемом случае вместо базиса из собственных век-
векторов мы берем канонический базис U1, U2 Un. Воздействие
матрицы А на векторы этого базиса происходит по формулам
AUl = \U1
AU2 = Xtt/2
Л?/3 = \3U3
и, следовательно,
A*U,=
B4)
Пусть Ко начальный вектор. Мы будем предполагать, что про-
проекция вектора Ко в корневое подпространство, соответствующее
собственному значению \, отлична от нуля и не является собствен-
собственным вектором. Примем ее за первый вектор Ut канонического базиса.
Тогда
§ 53] НАИБОЛЬШЕЕ ПО МОДУЛЮ СОБСТВЕННОЕ ЗНАЧЕНИЕ 341
и, в силу B4),
к —л Го = HUi-f-kKi U-i-\-k-jazUi-f- ... -f-hnanun.
Любая компонента вектора Yk будет иметь вид (мы по-прежнему
опускаем первый индекс)
Уи = crf 4- CaftXf-14- сзХ* 4- • • • 4- сп>1 B5)
Отношение —^iL по-прежнему стремится к Хх, но медленнее, чем
любая геометрическая прогрессия из-за наличия множителя k во вто-
втором слагаемом. Именно:
У к+1 1
Практически определить )ч из отношения -ЛИ- становится почти не-
невозможным х).
Для определения собственного значения \t следует поступать
так же, как при определении комплексной пары собственных значе-
значений, т. е. искать коэффициенты р = -—2Xj и <7 = Х1 квадратного
уравнения, двойным корнем которого является )п. Итак, пусть
Ук = с^х 4- kc^.i '14- c3h 4- • • • •
Тогда
у к+14" рУк 4" яУк-i== ciAi (Xj 4- pXi 4~ я) ~\~
4- cgX? [(ft 4-1) Xi 4-pftX! 4- q (ft — l)] 4- о (>.?) = о (х?).
Аналогично
где zk определяется так же, как и в предыдущем пункте.
Из полученных приближенных равенств находим
!) Отметим, что если ящик, к которому принадлежит Хх в канонической
форме Жордана, имеет более сложную структуру, то в выражении F) по-
появляются и другие степени \, умноженные на соответствующие биномиаль*
ные коэффициенты:
— 1) ^fc —2..
Отношение k+l стремится к ).t еще медленнее.
342
Частичная проблема собственных значений
fгл. v
Легко проверить, что эти равенства будут справедливы с точ-
ностью до величин порядка (у2-) • •Зто делается в точности так же,
как в предыдущем случае.
Для определения собственного значения X,, очевидно, достаточно
определение одного из коэффициентов р или q. Однако совпадение
чисел — -^ и уд служит контролем правильности гипотезы о вхо-
вхождении собственного значения ).t в канонический ящик.
Сделанная гипотеза может быть подтверждена и другими сред-.
ствами. Именно, найдя ^ssij/g, можно построить так называемые
Х-разности
Легко вычислить, что
= с,/*^
с3(k
• • • - cnl*\ =
О (X*), B7)
Ду
т. е. —г^~ стремится к Xt достаточно быстро. Совпадение пре-
*Ук
Ду
дела д с вычисленным ранее значением для \ и факт быстрой
Ук
сходимости
к Л, служит подтверждением предположения о том,
что X.J входит в ящик 1-го порядка.
Далее ясно, что
т. е. вторая Х-разность мала по сравнению с самой компонентой ук.
Собственный вектор 1/г, соответствующий собственному значе-
значению X.J, легко определяется. Именно из равенства
о
следует
B8)
т. е. вектор Kft+i — ^К^ —?/2 приближенно равен собственному
вектору, соответствующему Xv После нормировки точность прибли-
(X \fc
-j-5-l . Корневой вектор, соот-
соответствующий собственному значению \ определен с точностью до
слагаемого, пропорционального собственному вектору ?/2. За одно
§53]
НАИБОЛЬШЕЕ ПО МОДУЛЮ СОБСТВЕННОЕ ЗНАЧЕНИЕ
343
из возможных приближенных значений корневого вектора может
быть взят сам вектор
Однако при больших значениях k этот корневой вектор, благодаря
множителю k во втором слагаемом, сильно „вытянут" в направлении
собственного вектора U2- Целесообразнее взять в качестве прибли-
приближенного корневого вектора
Полученный вектор лишь скалярным множителем отличается от
проекции (У, начального вектора Ко на корневое подпространство,
соответствующее собственному значению )ч.
Пример 7. Собственные значения матрицы
" о 9 Q
" "С ?* О
А=, —13 —2 —12
16 4 16.
суть X, = \ = 2; Х3 = 1. Собственный вектор, соответствующий X, = 2
есть иг = [—\, —~, lY = (—0.666667, —0.833333, 1)'.
Приведем вычисления степенным методом. За начальный вектор Ко
возьмем вектор A, 0, 1)'. Его проекция на корневое подпростран-
подпространство есть (после нормировки)
т
у, lV?«(—0.714286, —0.857143, 1)'.
Имеем
1 8126470 17301510 36700166
0 10223622 21757958 46137350
— 1 —12320776 —26214408 —55574536
6029316 12845060 27262980.
Сходимость процесса оказывается медленной, что дает основание
предполагать наличие кратных собственных значений.
Для вычисления р и q берем за ук первую компоненту, за гк
вторую. Тогда
-f = 2-000092
4= 1б870532ь!^- 4-0003891. /?= 2.000097.
344
ЧАСТИЧНАЯ ПРОБЛЕМА СОБСТВЕННЫХ ЗНАЧЕНИЙ
[ГЛ. V
Если за ук взять первую компоненту, а за гк третью, то совпаде-
совпадение — ¦— и V q будет еще лучше. Именно,
? = —4.0000648, —1- = 2.000032
д= 4.0001373, У7= 2.000034.
Таким образом, можно считать Хх = 2.00003.
Далее
2=К20 — 2.00003К19 i
2096627
2620781
—3144934
Ui = Y20—20U2
—5232374
—6278270
7324144
-0.
-0.
1.
U2
666668
833334
000000
—0
—0
1
.714401
.857202
.000000
Сравнивая найденные значения для (/2 и G, с точными, мы видим
хорошее совпадение для U2 и несколько худшее для Ul. Последнее
можно объяснить не очень удачным выбором начального вектора,
проекция которого на соответствующее корневое подпространство
оказывается довольно близкой к собственному вектору.
6. Имеются два близких по модулю наибольших по модулю
собственных значения. В пунктах 4 и 5 для определения собствен-
собственных значений мы применяли по сути дела один и тот же прием, и
основанием для применения этого приема служило нарушение схо-
сходимости последовательности 7c'tl . Из результатов пункта 1 следует,
что причиной плохой сходимости этой последовательности может
быть не только равенство наибольших модулей собственных значе-
значений, но и их близость. В этом случае тоже может быть применен
прием, заключающийся в использовании формул A9) или B0),
однако при этом корни составленного квадратного уравнения уже
будут вещественными и неизбежно близкими по модулю. Решив
квадратное уравнение, мы их определим с точностью до величин
порядка
Заметим, что если последовательности отношений компонент схо-
сходятся быстро, указанный прием не позволяет определить одно-
одновременно /.J и Х2 с удовлетворительной точностью, так как фор-
формулы для определения коэффициентов р и q будут содержать в чи-
числителе и знаменателе числа; близкие к нулю.
Процесс будет иметь плохую сходимость также, если |Х2| не
достаточно превосходит |Х3|.
Пример 8. В качестве иллюстрации указанного приема вы-
вычислим наибольшее по модулю собственное значение матрицы
Леверье.
§ 53] НАИБОЛЬШЕЕ ПО МОДУЛЮ СОБСТВЕННОЕ ЗНАЧЕНИЕ 345
Используем для этого нормированные итерации вектора A, 0, 0, 0)',
вычисленного нами для примера 1.
Имеем
Y V V
'18 '19 '20
1.0000000 1.0000000 1.0000000
—8.1970024 —8.2032008 —8.2093658
8.1476812 8.1701265 8.1926032
—7.3754981 —7.9595730 —8.5464157
—6.4248193 —6.9926473 —7.5631783.
Выпишем также нормирующие множители
Pl8 = —17.450861, р19 = —17.458270, р20 = —17.465517.
Очевидно, что
Р = РгоР. Я = Pi9<7'
где р и q составляются из компонент нормированных итераций по
формулам A9')-
Если за ук взять первую компоненту, за гк вторую, то
' p = 34.836912
= °-994611' ? = 303.27451.
Таким образом, для определения Xt и Х2 имеем уравнение
*2 +34.836912*+ 303.27451 =0,
откуда
>.,=—17.418456 —/0.12810^—17.4185 —0.3579 = —17.7764'
>.2 = —17.0606.
Принимая за ук первую компоненту, за гк сначала третью,
а затем четвертую компоненты получим
Xt = —17.831, Х2 = —17.125;
^ = —17.866, Х2 = —17.148.
Сравнивая полученные значения для \lt мы видим, что все три
значения более близки друг к другу, чем значения, полученные
в примере 1. Последнее значение Xt = —17.866 с точностью до ЗЛО
совпадает с точным значением. При этом Х2 определяется примерно
с такой же точностью, как Хх. : :
346 ЧАСТИЧНАЯ ПРОБЛЕМА СОБСТВЕННЫХ ЗНАЧЕНИЙ [|'Л. V
§ 54. Ускорение сходимости степенного метода
В этом параграфе будут изложены два приема ускорения сходи-
сходимости степенного метода, в случае если наибольшее собственное
значение вещественное и простое.
1. Скалярное произведение. Этот прием особенно удобен в при-
применении к симметричной матрице; однако мы изложим его без этого
]7редположения.
Пусть наряду с последовательностью итераций вектора матри-
матрицей А
Ко, Yt^AYb. Y2 = A*Y0 Yk = A"Y0. ... A)
вычислена также последовательность итераций матрицей А'
Zo, Z{ = A'Z0, Z2 = A'*Z0, .... Zk = A'*Z0, ... (I')
Введем базисы Uv . . ., Un и Vv . . ., Vn, составленные из соб-
собственных векторов матриц А и А', причем будем предполагать, что
эти базисы удовлетворяют условиям ортогональности и нормирован-
ности в смысле § 10 п. 3.
Пусть
K0 = fllf71 + fl2f72+ ... +anUn
Z0 = blV1+biV2+ ... +bnVn.
То гда
(Yk, Zk) = (A"Y0. A'kZ0) = (AMY0, 20) =
t/2+ ... +rft/», ЪУь-{-ЬгУг+ ... +bnVn).
Далее, в силу свойств ортогональности и нормированное™ си-
системы векторов Uv . . ., Un и Vx Vn, имеем
(Yk, Zk) = а№?4-ваЫ**4- • • • 4-«nbj*n. C)
Аналогично
Из равенств (З) и D) получаем:
(Yk,Zk) _ atyf 4a,yg* + ... 4аА'-я*
Из этой оценки видно, что образование скалярного произведения
сокращает число шагов итерации, нужных для определения Xt с дан-
данной точнретью, почти вдвое. Однако при этом требуется дополни-
дополнительное вычисление последовательности A0-
§ 54] УСКОРЕНИЕ СХОДИМОСТИ СТЕПЕННОГО МЕТОДА 347
В случае симметричной матрицы, при Z0=Y0 последователь-
последовательности A) и A') совпадают, и поэтому в этом случае применение
метода скалярного произведения особенно целесообразно. Начиная
с некоторого шага процесса, нужно вычислять соответствующие
скалярные произведения и определять Хх через их отношения. Именно,
h F)
Так, в примере 3 § 53 мы легко вычисляем
(А1 Ко, А1 Ко) = 0.00007528987
(Л'К0, Л6 Ко) = 0.00015685433,
что дает для />, значение 0.479999 (вместо значений 0.4800, 0.4792,
0.4808, найденных из отношений компонент A1Y0 и ASYO). В качестве
второго примера рассмотрим матрицу
G)
2 4 1
собственные числа которой суть 1, •=-, -^ и -=-.
, о У о
Для определения /., образуем итерации AkY0, беря в качестве Yo
вектор A, 1, 1, 1)'.
Приведем 17-ю, 18-ю, 19-ю и 20-ю итерации:
1.0000000
1.0000000
0
0
0
0,
—0.
— и <
.7777778
0252525
.8888889
1
0
0
—8
.0000000
.3333333
.5555556
.6444444
0
0.
—0.
0.
3333333
0252525
1111111
Л"К0
4.6731097 4.6760089 4.6779433 4.6792336
8.3733415 8.3912886 8.4032694 8.4112637
0.0028992 0.0019344 0.0012903 0.0008605
—8.3861607 —8.3998278 —8.4089592 —8.4150555
4.6631897 4.6694041 4.6735438 4.6763023.
Отношения компонент этих итераций будут
1.000620 1.000414 1.000276
1.002143 1.001428 1.000951
0.667219 0.667029 0.666899
1.001630 1.001087 1.000725.
Здесь отношения третьих компонент сильно отличаются от осталь-
остальных, в силу исчезновения значащих цифр. Последний столбец дает
348 ЧАСТИЧНАЯ ПРОБЛЕМА СОБСТВЕННЫХ ЗНАЧЕНИЙ' [ГЛ. V
Xi^t; 1.001; найденное значение совпадает с точным с точностью до
одной единицы третьего знака.
Покажем теперь, как можно уточнить это значение применением
способа скалярного произведения.
Для этого образуем итерации вектора A, 1, 1, 1)', транспониро-
транспонированной матрицей А'.
Вычисляя, получим
Л'-°К0 = @.7961118, —0.0002189, 3.9939022, —0.1134904)'.
Далее,
(Л2ОКО, Л/20К0) = 4.681817 и О9К0, АА°У0) = 4.681816. "
Отношение
^01
01
=1-000000
дает в качестве Xt значение 1.000000, верное с точностью до шести
знаков после запятой.
Замечание. Если, находя итерации, мы их нормируем, то для
определения Хх нужно пользоваться одной из формул
(Уи-ь Zk)
или ^
х {У*. А'}*=йш (9)
(Ун, Zk-i)
Здесь через Yk и Zfe обозначены нормированные итерации AkY0
и A'kZ0. Способ нормировки при пользовании этими формулами
безразличен.
2. 52-процесс ]). Этот прием применим только в случае, когда
l^i!>l^2l> 1^з|. так чт0 ^i и ^2 вещественны.
Предположим, что мы определили ряд величин
Ук> Ук+1> Ук+2> ¦ ¦¦'
относительно которых известно, что
у к = с Д? + с24 + • • • + СпС- (И)
В качестве yft можно взять, например, любую компоненту вектора
Yk = AkY0, скалярное произведение соответствующих итераций и т. д.
Тогда, как было показано в § 53 и в п.' 1 § 54, можно при-
приближенно определить первое собственное число Xt как отноше-
ние и =
к
¦ 1) Эйткен [5J
§ 54] УСКОРЕНИЕ СХОДИМОСТИ СТЕПЕННОГО МЕТОДА
Далее, в § 53 было показано, что
349
где *; = ^
Если сходимость последовательности ик, uk+l, wft42, • • ¦ недоста-
недостаточно быстрая, то ее можно сильно улучшить следующим приемом,
который носит название сопроцесса. Образуем
"к
"ft —
Покажем, что
С этой целью положим
A3)
A4)
тогда
Разбивая последний определитель на сумму- четырех, получим
гк гк + \
]¦
Но
ик — 2ик+1 + «л+2 = li \Ч — 2eft+1 + eft+2].
Таким образом,
Вычисляя, получим, что
где
Таким образом,
— 2ei + 1 -j-
— bs (я2 -
A - «sK '
350 ЧАСТИЧНАЯ ПРОБЛЕМА СОБСТВЕННЫХ ЗНАЧЕНИЙ [ГЛ. V
Отсюда следует, что ошибка в определении in при помощи ^-про-
^-процесса может быть намного меньше, чем при нахождении его прямо
из последовательности ик, ukrV ...
Отметим, что при фактическом проведении сопроцесса по фор-
формуле A3) как в числителе, так и в знаменателе происходит уничто-
уничтожение значащих цифр. Этого явления можно избежать следующим
приемом. Пусть ик = с-\- 1к, где с — число, составленное из уста-
установившихся десятичных знаков в последовательности ик. Тогда, как
нетрудно проверить,
причем второе слагаемое играет роль малой поправки по отношению
к первому.
Замечание. При нахождении первого собственного числа
симметричной матрицы о2-процесс надо применять не к компонентам
итераций, а к соответствующим скалярным произведениям.
Покажем применение сопроцесса на примерах § 53.
В примере 2 § 53 для приведенных отношений применение
о2-процесса дает для \ следующие значения:
— 17.3974
— 17.3977
— 17.3977.
С точностью до четырех знаков \ = —17.3977.
Аналогично, в примере 3 § 53 применение сопроцесса к приве-
приведенным отношениям дает для \ следующие значения:
0.66748
0.66748
0.66748
0.66748.
Таким образом, >.t определяется уже с точностью до пяти знаков.
(Точное значение \ = 0.667483).
сопроцесс можно применять также и к определению компонент
первого собственного вектора. При этом мы укажем два различных
варианта этого процесса, в зависимости от того, можно ли считать
известным Xj с достаточной степенью точности или нет.
1) Пусть мы знаем только последовательность итераций AkY0,
причем для удобства вычислений пусть каждая итерация нормирована
делением на компоненту гк с фиксированным номером.
Обозначим любую другую компоненту вектора Yk через ук.
Если
Ук — cAl 4" С2к2 + . • . + Спкп,
§ 54] УСКОРЕНИЕ СХОДИМОСТИ СТЕПЕННОГО МЕТОДА 351
то указанное деление сводит zk к единице, а ук к vk, причем
™ г -* It , , -.
_ с, Со&1-62с( /Xs
T7 + ~^T~
/XjU
Несложное вычисление показывает, что
Таким образом, если 52-процесс применен ко всем компонентам нор-
нормированного вектора AkYa, то мы найдем отношения коэффициентов,
стоящих при степенях /,, в выражениях ук. Коэффициенты же эти
пропорциональны компонентам собственного вектора.
Так, для собственного вектора примера 2 предыдущего параграфа
применение сопроцесса дает для компонент вектора значения
1.00000
—8.14718
7.91721,
которые значительно ближе к точным, чем значения, вычисленные
непосредственно из тех же итераций.
2) Если X, известно достаточно точно, процесс улучшения можно
построить следующим образом. Умножим все компоненты векторов
А'~ Ко, А Ко, А +1Ко, на X,, 1, X, соответственно и затем применим
к ним ^-процесс. Так как
то
-= |f.c.).?-1^ (a, —-/^-f. . . . + dc^f-'xj;-1 (X, -XrtJJ X
Далее,
с2^— (X, —
352 ЧАСТИЧНАЯ ПРОБЛЕМА СОБСТВЕННЫХ ЗНАЧЕНИЙ [ГЛ. V
Отсюда
Ук хГ1
Ч~ЧН
=„,?[,
Отношения полученных чисел, вычисленных для разных компонент,
дают отношения компонент собственного вектора.
§ 55. Модификации степенного метода
1. Степенной метод со сдвигом. Известно, что собственные
значения Х4 матрицы А связаны с собственными значениями и.; ма-
матрицы В = А — сЕ простыми соотношениями.
а собственные векторы обоих матриц совпадают. Это обстоятельство
дает возможность определять собственные значения матрицы Л, при-
применяя степенной метод к матрице А — сЕ. Такое .видоизменение сте-
степенного метода мы будем называть степенным методом со
сдвигом. Сдвиг меняет взаимоотношение между модулями соб-
собственных значений, причем при наличии комплексных корней, даже
при вещественном с, изменение этого взаимоотношения может быть
довольно сложным. Если же все собственные значения вещественны,
то за счет сдвига можно сделать наибольшим по модулю как алге-
алгебраически наибольшее, так и алгебраически наименьшее. Именно,
(см. рис. 2) при с < с0 = -t 2 "" наибольшим по модулю будет \xv
при с > с0 наибольшим по модулю будет уп.
К \-< С1 ^ С,' А;, Л,
Рис. 2.
Оптимальным значением с для вычисления Xt является, как'не-
1п 4- X, ,
трудно видеть, с, =-^—~, так как при таком выборе с сходимость
степенных итераций для определения и, будет наибыстрейшей.
Соответственно, оптимальным значением для вычисления Хп будет
с'^ = ¦ *"~' ч , Конечно, высказанные соображения имеют лишь
теоретическое значение, ибо, как правило, мы не знаем, даже грубо,
ни Xj ни Хп. Однако все-таки они дают возможность сделать некото-
некоторые рекомендации для целесообразного выбора с. Так, если ма-
матрица А положительно-определенная, то имеет смысл сделг.Тз сдвиг
при.некотором положительном с и, попробовав вычислить итерации,
по поведению их судить о целесообразности сделанного сдвига.
§ 55]
МОДИФИКАЦИЯ СТЕПЕННО.ГО МЕТОДА
353
Иногда все же удается воспользоваться грубыми оценками для
Х2 и \п.
Сравним ход степенного процесса без сдвига с ходом степенного
процесса со сдвигом, близким к оптимальному для матрицы D) §51
Здесь
^ 0.7967 + 0.2423 ^
Мы проведем процесс со сдвигом, полагая с ==0.5.
Итерируя матрицей А вектор @.3, 0.5, 0.7, 0.9)', получим
'О '10
0.3 0.31005932- 104
0.5 0.24605904 • 104
0.7 0.23186358- 104
0.72018993 • 104
0.57153328 • 104
0.53856100- 104
0.16728203 • 105
0.13275282 • 106
0.12509420- 106
0.9 0.27512042- 104 0.63903554 • 104 0.14843190 • 105
1.06310236-104 2.46931975- 104 0.57355095 ¦ 105.
Для отношений компонент получим соответственно
2.3227488
2.3227485
2.3227494
2.3227484
2.3227488
2.3227487
2.3227489
2.3227889.
В последнем столбце стабилизируется уже седьмой знак. Ту же точ-
точность в отношениях компонент мы получим из 9-й и 8-й итера-
итераций матрицей А1^А — 0.5Е. Действительно,
Уо
0.3
0.5
0.7
0.9
0.82648864
0.65589056
0.61805179
0.73335608
102
102
102
ю2
0.15064813
0.11955238
0.11265531
0.13367238
103
1С3
103
103
2.83378707- 102 0.51652820 • 103,
так что для 0.5-f-(^j
получим значения
2.3227489
2.3227489
2.3227487
2.3227486.
23 Зак. 974. Д. К. Фаддеев и В.- Н. Фаддеева
354 .ЧАСТИЧНАЯ ПРОБЛЕМА СОБСТВЕННЫХ ЗНАЧЕНИЙ [ГЛ. V
Для определения наименьшего собственного значения оптимальным
будет сдвиг на
Хг+Ь, ^ 2.32 + 0.64 _
2 ~ 2 — J-48.
Приведем результат вычислений при с =1.5. Именно
1 ¦ 5 + (ЛJО/(Л).9 1 ¦ 5 + (УдиКУди
0.2434512 0.2422607
0.2492658 0.2422606
0.2406113 0.2422607
0.2409250 0.2422607.
2. Возведение матрицы в степень. Для построения высоких
итераций вектора иногда целесообразно предварительно возвести
данную матрицу в степень. Наиболее просто вычисляются последо-
последовательные степени матрицы А, А2, А*, Ав, Л16, . .. Однако возве-
возведение матрицы в квадрат, очевидно, по объему работ равносильно
образованию п итераций вектора, так что вычисление матрицы Л2*
равносильно построению kn итераций. Соответственно, вычисле-
вычисление Л2 Ко равносильно вычислению kn-\-\ итерации и потому вы-
выигрыш в объеме работы получается, если &n-|-l<2fc, т. е. если
число итераций, необходимых для получения нужной точности, пре-
превосходит n\g2n.
Можно ограничиться вычислением некоторой фиксированной сте-
степени матрицы А и затем составлять итерации посредством вычис-
вычисленной степени. Например, вычислив Л8, можно найти Л8К0, затем
Л8 (ASYO) = AUYO и, наконец, Л17К0 = Л(Л16К0).
Степени матрицы могут быть использованы и непосредственно
для определения наибольшего по модулю собственного значения,
в случае, если оно простое и вещественное.
Именно,
2* к
Последнее следует из того, что
и, следовательно,
С
Этот прием по существу равносилен применению метода Лобачев-
Лобачевского к отысканию наибольшего по модулю корня характеристиче-
характеристического уравнения матрицы.
§ 56] ОТЫСКАНИЕ НЕСКОЛЬКИХ СОБСТВЕННЫХ ЗНАЧЕНИЙ 355
Несколько более удобной, чем формула A), является формула
, 5рЛ^
так как дополнительное вычисление SpA2k->л эквивалентно (по объему
работы) одной итерации вектора матрицей А'1'. Метод следов может
быть распространен на случай кратных и комплексных корней *).
§ 56. Применение степенного метода к отысканию
нескольких собственных значений
В § 53 мы рассмотрели несколько случаев, когда наибольшее
по модулю собственное значение не изолировано, т. е. когда
имелось другое собственное значение, равное или близкое по модулю.
Примененный там прием заключался в вычислении коэффициентов
квадратного уравнение, корнями которого являются два наибольших
по модулю собственных значения. Этот прием может быть естест-
естественным образом обобщен. Допустим, что элементарные делители
матрицы взаимно просты и что | \ | ^-1 Х21 ^>> . . . ^> \\г \ > | Х,.+11 ^>
;>...;> |ХИ|. Обозначим через Ult .... Un канонический базис
пространства. Допустим, что начальный вектор Ко взят таким, что
все компоненты в его разложении по векторам канонического базиса
отличны от нуля, т. е.
щфО ({= 1, 2 и). A)
Пусть tr-\-b1tr~i-\- ... -{-br = (t— \) ... (t — Xr) полином, кор-
корнями которого являются \v .... \г. Тогда, как нетрудно видеть,
IW + ^+r-i-r- •¦• +*г^«0 B)
с точностью (в каждой компоненте) до величин порядка \\г+1-\-г\к.
Действительно, в написанной линейной комбинации исчезают все
составляющие по векторам Uit .. ., Ur, а коэффициенты при Ur + l, . ..
. . ., Un умножаются не более чем на Х*+ь и, быть может, на величину
порядка некоторой степени k (если у матрицы имеются нелинейные эле-
элементарные делители). Векторное равенство B) равносильно системе п ра-
равенств для соответствующих компонент. Взяв какие-либо г из них,
получим систему г линейных уравнений относительно bv ..., br.
Будем, для простоты, считать, что компоненты перенумерованы так,
что выбранными будут г первых компонент векторов Ykvr Yk.
!) Фрезер, Дункан и Коллар [1].
23*
356 ЧАСТИЧНАЯ ПРОБЛЕМА СОБСТВЕННЫХ ЗНАЧЕНИЙ
Решая полученную систему
по формулам Крамера, получим для коэффициентов
ближенные значения
[ГЛ. V
C)
. . ., br при-
Ъ —
°х
~Ух
"Уг
Ух
Уг
к + г
к+г
k+r-i
к + г-1
У\
Уг
Ух
У,
к + г-2
k + r-i
k+r-i
k + r-i
¦¦¦Ухк
¦¦¦Угк
¦¦¦ У\к
¦¦¦Угк
и
Ухк+г-Х ¦ ¦ ¦
Уг к + г-1 ¦ ¦¦
Ух kt-r-1 ¦ ••
Угк+г-1 •¦¦
— У1 к ы
— Угк + г
Ухк
Угк
•D)
Можно показать, что эти равенства справедливы с точностью до
величин порядка ( ftl i ) • Для k~2 эти оценки были прове-
\ I кг I /
дены выше.
Определив коэффициенты Ьх br, находим собственные зна-
значения как корни полинома tr-\-bltr-\- ... -\-br. Если среди них
окажутся равные, это будет свидетельствовать о наличии нелинейных
элементарных делителей у матрицы А. Заметим, что для определения
коэффициентов blt ..., br можно брать вместо г различных компо-
компонент векторов Ук+Г Yk какую-либо одну компоненту векторов
•к+г< ¦ ¦ •> 'к> 'k+r + V • • ¦' "к-и> • ¦ •'• 'к+2г-х 'к+г-1-
При практическом вычислении нет необходимости на самом деле
вычислять определители. Можно написанную систему решать численно,
одним из описанных выше способов.
Заметим, что сколько-нибудь удовлетворительный результат по-
получается, если определяемые г собственных значений близки по мо-
модулю, а следующее (r-(-l)-e сильно отрывается от них. Если же
это обстоятельство не имеет места, то полученная система C) будет
очень плохо обусловлена и определители в формулах D) будут очень
близки к нулю.
Теоретически говоря, указанным процессом можно построить весь
характеристический полином (вернее минимальный аннулирующий век-
вектор Ко полином), приняв г = п. В этом случае мы придем к методу
Крылова, выполненному исходя из начального вектор АкУ0. Конечно,
здесь целесообразно считать k — 0, чтобы не вычислять лишних ите-
итераций. К тому же с увеличением k падает обусловленность системы
метода Крылова.
В случае, если \\ \ > ]Х2| >...> |ХГ| > |Хг+1| >..->| К |.
можно несколько изменить описанный процесс. Именно, в этом слу-
случае достаточно вычислять лишь свободные члены последовательных
полиномов (t — XJtf — )-2) (t — \,)(t — X2) ... (t — Хг), так как
§56]
ОТЫСКАНИЕ НЕСКОЛЬКИХ СОБСТВЕННЫХ ЗНАЧЕНИЙ
357
эти числа с точностью до знака равны произведению последователь-
последовательных собственных значений. Выпишем соответствующие формулы 1):
У1к+х
... lr:
У Ik
Угк + r-l •¦• Угк
Заметим, что определение произведения даже двух собственных
значений наталкивается на препятствие в виде исчезновения значащих
цифр, так как при достаточно большом числе итераций строки опре-
определителей становятся почти пропорциональными (в случае, если пер-
первое собственное значение сильно отрывается от второго). Поэтому,
как правило, даже второе собственное значение определяется при
помощи степенного метода с гораздо меньшей степенью точности,
чем первое.
В § 53 мы уже рассмотрели примеры на вычисление коэффи-
коэффициентов уравнений, корнями которых являются наибольшие по мо-
модулю собственные значения для г =2. Мы ограничимся этими при-
примерами и проиллюстрируем здесь лишь второй описанный прием.
Именно, определим второе собственное значение для матрицы G) § 54.
Взяв ?=18, получим, исходя из первых двух компонент соответ-
соответствующих векторов,
4.6792336
8.4112637
4.6779433
8.4032694
4.6779433 4.6760089
8.4032694 8.3912886
—0.0265541
—0.0397902
= 0.667353.
Исходя из вторых и четвертых компонент тех же итераций, получим
\1г,т 0.666110.
В § 54 мы вычислили, используя эти же итерации, что Xt =
= 1.001. Это дает для Х2 значения 0.6667 или 0.6654. Точное зна-
значение Х2 = 0.66666. ..
Э й т к е н [5J.
358
ЧАСТИЧНАЯ ПРОБЛЕМА СОБСТВЕННЫХ ЗНАЧЕНИЙ
[ГЛ. V
Наконец, определим Х2 через отношение определителей, состав-
составленных из одноименных компонент соседних итераций. Используя
первые компоненты 17-й, 18-й, 19-й и 20-й итераций, получим
4.6792336 4.6779433
4.6779433 4.6760089
так что
4.6779433
4.6760089
0.6669.
4.6760089
4.6731097
—0.0030156
—0.0045170
= 0.667611,
§ 57. Ступенчатый степенной метод
Определение двух и более собственных значений при помощи
степенного метода наталкивается, как мы только что видели, на две
трудности. Это, во-первых, возможное уничтожение значащих цифр
при составлении нужных линейных комбинаций и, во-вторых, от-
отсутствие критерия, по которому можно было бы судить о достиже-
достижении удовлетворительной точности. От обоих этих недостатков сво-
свободен несколько более трудоемкий ступенчатый степенной
метод, к изложению которого мы сейчас переходим. Мы его раз-
разберем подробно в применении к задаче определения двух наиболь-
наибольших по модулю собственных значений и принадлежащих им собст-
собственных векторов (или собственного и корневого, если наибольшее
по модулю собственное значение входит в канонический ящик вто-
ро.го порядка) и лишь коснемся его обобщения на задачу определе-
определения первых г собственных значений. Мы рассмотрим три модифика-
модификации метода. При этом мы будем считать, что | \ \ %. \ Х2 | > | Х31 ~^> . ¦ ¦
...~^.\\п\. Для простоты изложения будем также предполагать, что
собственные значения, начиная с Х3, имеют линейные элементарные
делители.
1. Вполне стабилизирующийся ступенчатый метод. Пусть
Хо и Ко — два произвольных вектора. Образуем векторы АХ0 и AY0
и построим такие их линейные комбинации Хг и Yt, что первые две
компоненты векторов XL и Yl образуют матрицу
1 0'
_0 1_
Для этого нужно умножить прямоугольную матрицу, состав-лен-
состав-ленную из компонент векторов АХ0, AY0 на матрицу второго порядка,
обратную к матрице, составленной из первых- двух компонент век-
векторов АХ0, AY0.
Это можно сделать, например, так. Построим вектор Х\, поде-
поделив все компоненты вектора АХ0 на первую компоненту. Вектор Y±
строится посредством вычитания из вектора AY0 вектора Хи умно-
умноженного на первую крмпоненту вектора AY^ и деления всех комгю-
§ 57]
СТУПЕНЧАТЫЙ СТЕПЕННОЙ МЕТОД
359
цент полученного вектора на его вторую компоненту. Наконец,
вектор Х\ строится посредством вычитания из вектора Хг вектора Кр
умноженного на вторую компоненту вектора Л\.
Далее процесс повторяется. Именно, векторы Хк и Yk строятся
как линейные комбинации векторов АХк,_х и AYk_l такие, что их
первые две компоненты образуют единичную матрицу второго по-
порядка.
Теорема 57.1, Пусть собственные значения матрацы А удо-
удовлетворяют неравенствам
Тогда, если 1) отличен от нуля определитель из первых двух
компонент собственных векторов Ux и U2, принадлежащих собст-
собственным значениям \ и Х2, или собственного вектора Ux и корне-
корневого U2, принадлежащих собственному значению Xt = Х2; 2) не ра-
равен нулю определитель c1d2 — c2dt из коэффициентов разложения
векторов Хо и Ко по собственным (корневым) векторам; 3) все
определители, составленные из первых двух компонент векто-
векторов АиХ0 и AkY0 отличны от нуля, то последовательности век-
векторов Хк и Yk имеют пределы X и Y и эти предельные векторы
лежат в инвариантном подпространстве, натянутом на векторы
Ul и иг.
Доказательство. Из процесса построения векторов Хк и Yk
ясно, что векторы Хк и Yk являются линейными комбинациями век-
векторов АкХ0 и AkY0. Пусть
Х1к У14
Гъ =
2к
_ хпк Упк __
— двухстолбцовая матрица, составленная из компонент векторов АкХ0
и A*Y0,
1 О
0
1
Ък
fink-
360
ЧАСТИЧНАЯ ПРОБЛЕМА СОБСТВЕННЫХ ЗНАЧЕНИЙ
[ГЛ. V
— матрица, составленная из компонент векторов Хк и Ук. Из по-
построения следует, что матрица Фк получается из матрицы Fk линейным
комбинированием столбцов, что равносильно умножению справа на
некоторую матрицу второго порядка. В качестве этой матрицы, оче-
очевидно, нужно взять матрицу
х\к
— Х2к
У\к
Учк _
так что
х\к У\к
Третье условие теоремы обеспечивает существование матриц
ЗСлъ Vife *
, т. е. обеспечивает бесконечную продолжимость про-
_ хгк Угк _
цесса.
Перейдем теперь к оценкам компонент векторов Хк и Yk или,
что то же самое, к оценкам элементов матрицы Ф^. Для этого вы-
выразим элементы матрицы Фк через х{к и yik. Имеем
У ik
xlk
Угк
Угк ~Ухк
_ хгк
х
ifc_
и, следовательно,
при
A)
при i>3. B)
Допустим сначала, что Ul и U2 — собственные векторы, отвеча-
отвечающие, может быть, равным собственным значениям \ и Х2. Из раз-
разложений
Хо = c1Ul
cnUn
следует
АкХ0 =
Следовательно,
+ cn\nuni
yik
D)
§ 57]
и потому
СТУПЕНЧАТЫЙ СТЕПЕННОЙ МЕТОД
361
Х2кУгк =
X
В силу второго условия теоремы cxd2 — c2rft ф 0. Поэтому
(I ft\
4-
В силу первого условия теоремы мии22 — и12и21 Ф Q. Аналогично
\h\k\
В случае, если Х1 = >ч2 и это собственное значение лежит в кано-
каноническом ящике второго порядка, будем иметь, что
s
С/
')•
E0
F0
Переходя к пределу в равенствах E) и F) (или E0 и F0)
при k-+<x>, получим
Sib- '—г Jbi
1№ ¦'г
Таким образом, предельные векторы (с компонентами х; и _у4)
равны
Ц11«22—
ц
и,
2
2
Теорема доказана. В процессе доказательства даны и оценки быстроты
сходимости
Замечание. Условиям 2 и 3 теоремы можно всегда удовле-
удовлетворить за счет подходящего выбора начальных векторов Хо и Yo.
Выполнения же условия 1 можно добиться за счет изменения, в случае
362 ЧАСТИЧНАЯ ПРОБЛЕМА СОБСТВЕННЫХ ЗНАЧЕНИЙ [ГЛ. V
надобности, нумерации компонент ректоров пространства, что равно-
равносильно одновременному изменению строк и столбцов матрицы А. Не-
Нетрудно доказать далее, что если условия 1 и 2 выполнены, то усло-
условие 3 будет выполняться при достаточно больших k.
На доказанной теореме и основывается рассматриваемая модифи-
модификация ступенчатого степенного метода.
Последовательность векторов Хк и Yk строится до тех пор, пока
не окажутся выполненными, с достаточной степенью точности, равенства
Такая стабилизация наступит, если условия теоремы 57.1 выпол-
выполнены. В силу теоремы, подпространство, натянутое на предельные
векторы X и Y, совпадает с инвариантным подпространством, натянутым
на векторы U1 и U2. Поэтому наша задача сводится теперь к решению
полной проблемы собственных значений в этом двумерном подпрост-
подпространстве. Примем за базис этого подпространства предельные век-
векторы X и Y. Тогда
так что матрица
L. -—
-Р
(8)
есть матрица индуцированного оператора в рассматриваемом под-
подпространстве.
Числа а, р, f, 8 легко определяются. Действительно, а и р — суть
первые две компоненты вектора АХ, | и 5 первые две компоненты
вектора AY. Приближенные значения для них уже были нами полу-
получены как соответствующие компоненты векторов АХк и AYk. Иско-
Искомые собственные значения совпадают с собственными значениями мат-
матрицы L. Координаты же векторов Ul и U2 относительно базиса X
и К равны компонентам собственных (или собственного и корневого)
векторов матрицы L.
Так, если \Ф\, легко вычислим, что
(9)
Мы не будем приводить примера, иллюстрирующего рассматри-
рассматриваемую модификацию ступенчатого степенного метода, так как она
нами рассмотрена лишь с целью теоретического обоснования после-
последующих модификаций, более пригодных для численного осуществления.
§ 57] СТУПЕНЧАТЫЙ СТЕПЕННОЙ МЕТОД 363
2. Ступенчатые итерации Бауэра1). Исходя из двух векторов Zo
и Yo, образуем две последовательности векторов Zk и Yk следующим
образом. Вектор Zk+l получается из вектора AZk делением на первую
его компоненту. Вектор Yk+l получается как линейная комбинация
векторов AYk и AZk, такая, что первая компонента вектора YkLl
равна нулю, вторая равна единице. Иными словами, векторы Yk
совпадают с одноименными векторами предыдущей модификации при
Xo—Zo, а векторы Zk совпадают с нормированными к единичной пер-
первой компоненте векторами обычного степенного метода.
Поэтому в условиях предыдущей теоремы векторы Yk стабили-
стабилизируются. Поведение же векторов Zk зависит от взаимного располо-
расположения первых двух собственных значений, которое a priori может
быть неизвестным. Именно, последовательность Zk будет стабилизи-
стабилизироваться, если |^i|>|^2l> но- быть может, очень медленно, если |Xj|
близок к | Х21 или если Хх = Х2, и не будет стабилизироваться,
если | Xt | = | ^21, но Xj^Xg, т. е. если )ч = —Х2 и если Xj, X2 обра-
образуют комплексную пару.
Тем не менее, используя векторы Zk и Yk при достаточно боль-
большом k, можно определить Xt и Х2, так же как и принадлежащие им
собственные (или собственный и корневой) векторы, не сложнее, чем
используя вполне стабилизирующиеся итерации Хк и Yk предыдущей
модификации.
Ясно, что (при Zo = Хо) векторы Zk и векторы Хк связаны
соотношением
Xk = Zk — eYk,
где sk есть вторая компонента вектора Zk. Поэтому, при достаточно
большом k, можно считать, что
где X и К — предельные векторы стабилизирующегося процесса,
т. е. можно считать, что вектор Zk попадает в подпространство,
натянутое на векторы X и К.
Примем векторы Zk и Y за базис этого подпространства. Выясним,
как действует матрица А на этот базис. Имеем при всех k соотно-
соотношения
Коэффициенты рк, ок и хк легко определяются из сравнения пер-
первых двух компонент в этих соотношениях.
1) Бауэр [7].
364
ЧАСТИЧНАЯ ПРОБЛЕМА СОБСТВЕННЫХ ЗНАЧЕНИЙ
[ГЛ. V
При выбранном нами достаточно большом k мы вправе заменить
векторы Yh и Yji+l на Y, вектор Zfe+1 на Zk-\-(sk+1— вк) Y, так что
рк (ек+х — ек) Y
(Ю)
Следовательно, подлежащие определению собственные значения
матрицы А равны собственным значениям матрицы
(И)
а собственные векторы (или собственный и корневой векторы) имеют
координаты в базисе Zk и Y, равные компонентам собственных
векторов* (или собственного и корневого векторов) матрицы Мк.
Легко вычислить, что характеристический полином матрицы Мк
есть
Отметим, что если в процессе стабилизируется не только второй
столбец, но и первый, то матрица Мк стабилизируется и предельная
матрица М имеет треугольную форму
Р °
О t
3. Нестабилизирующиеся итерации. Здесь Vo и Wo некоторые
начальные векторы, векторные последовательности строятся по фор-
формулам
Vk+l = AVk
A3)
где t]k есть отношение первых компонент векторов AWk и Vk + l, так
что первая компонента вектора Wk+1 равна нулю при k ~^> 0.
Ясно, что векторы Vlc и Wk лишь нормировкой отличаются от
векторов Zk и Yk предыдущей модификации. Именно,
= akZ
kZk
A4)
где ак — первая компонента вектора Vk, ck— вторая компонента
вектора Wk. Поэтому векторы Vk и Wk также можно принять за
базис инвариантного подпространства, натянутого на векторы Ut
и U2, при достаточно большом k.
Легко вывести связи между числами рк, ак и тй предыдущей моди-
модификации с первыми компонентами векторов Vk, Vk+l, Wk и Wk + l.
§ 57] СТУПЕНЧАТЫЙ СТЕПЕННОЙ МЕТОД 365
Именно,
Наконец, е& =—-, где Ьк— вторая компонента вектора Vk.
Соотношения A0) для векторов Zk и Yk, имеющие место при
достаточно больших к, превращаются в соотношения
Поэтому искомые собственные значения матрицы А равны собст-
собственным значениям матрицы
¦V/,-
k
ak I Ck С/с \ ""•"' л ak I _
т. е. корням квадратного уравнения
. A6)
ак )\ акск
=0- A7)
>
Собственные векторы определяются аналогично предыдущей моди-
модификации.
В рассматриваемой модификации, при выполнении условий тео-
теоремы 57.1, векторы Wk сходятся лишь по направлению, а векторы Vk
могут сходиться по направлению быстро или медленно, или совсем
не сходиться.
Критерием, позволяющим окончить процесс, может служить стаби-
стабилизация свободного члена уравнения A7).
В случае, если | Xj | > | Х21, векторы Vk сходятся по направлению,
так что bk + l ^ibk fc+l , и потому за собственные значения можно
принять \. = fh±L ) =iiiLL#
F ' ак ' 2 ск
Указанная модификация несколько проще предыдущей в процессе
составления последовательностей векторов, но менее удобна в заклю-
заключительных операциях. Поэтому целесообразно, начав процесс в этой
модификации, перейти затем соответствующим нормированием к пре-
предыдущей.
366
.ЧАСТИЧНАЯ ПРОБЛЕМА СОБСТВЕННЫХ ЗНАЧЕНИЙ
[ГЛ. V
В качестве примера определим первые два собственных значения
матрицы Леверье и принадлежащие им собственные векторы при
помощи третьей модификации ступенчатого степенного метода.
Возьмем Vo ==A, 1, 1, 1)', Wo = @, I, 1, 1)'. Тогда
—3.208074
—5.753172
—8.384229
-15.922752
—33.268227
-0.71750565
ЛГ,
2.301808
-6.041037
-8.433328
-15.928987
-28.101544
0 16696157-10'°
— 0.11414017-10"
0.53854629-10"
0.2028172Ы0"
—0.10903620-10
W,
-0.00000001
-10.168965
-14.449051
—27.353636
0
0.29882011-10»
-0.10951099-18"
0.28675616-1011
v,,-
-0.10419891-10»
0.72583945-109
-0.378641SM0-1
—0.11545164-10"
-0.91870763-10
-0.26535195-10"
0.17832314-10111
-0.72561121-10"
-0-35613659-10"
-0.13126160-10
Wi7
0
-0.15619598-10s
0.57277646-10»
-0.14996613-10'°
*,.
0
-0.57619870-10"
0.21119162-10"
—0.55281857 -1011
Собственные значения матрицы 7V17 определяются из уравнения
/2+ 35.015145/'+ 306.38882 == 0,
собственные значения матрицы jV1r из уравнения
/2 _|_ 35.015455/+ 306.39423 = 0.
Мы видим, что процесс достаточно стабилизировался.
Для собственных значений получаем
Х1 = —17.8629, >,2 = —17.1522 при* =17
или
Х1 = —17.8631,
: —17.1523 при ?= 18.
Для определения собственных векторов, принадлежащих найденным
собственным значениям, найдем предварительно (при & = 18) собствен-
§ 58]
метод А-разности
367
ные векторы матрицы Л^. Нетрудно подсчитать, что Xt = A, —9.4429)',
Х2={\, —6.0357)'. Теперь имеем
щ U2 = Vlg — 6.0357 W13 Ui
-0.019861 0.166962 • 1010 0.032937
0.169702 —0.132477 • 10u —0.261341
-0.187112 0.119970- 10u 0.236668
0.808482 0.297402 • 10u 0.58669L
0.166962- 1010
-0.142657 • 10u
0.157293- 10u
-0.679638- 10u
Все три модификации двухступенчатого степенного метода могут
быть обобщены в форме r-ступенчатого степенного метода, позво-
позволяющего уже, вообще говоря, определять г собственных значений
и принадлежащих им векторов канонического базиса. Первая моди-
моди|
> |Х
При-
Прификация дает стабилизирующийся процесс, если |ХГ
менение первой модификации позволяет построить инвариантное под-
подпространство, натянутое на векторы Ul Ur канонического ба-
базиса, соответствующие собственным значениям Хх, .. ., X,.. Тем самым
применение первой модификации сводит частичную проблему для мат-
матрицы я-го порядка к решению полной проблемы для матрицы порядка г.
При г = п, очевидно, первая модификация теряет содержательность.
Поэтому она может применяться лишь при г значительно меньших п.
Иначе обстоит дело со второй модификацией и мало отличаю-
отличающейся от нее третьей. Здесь при г = я мы приходим к так называе-
называемому треугольному степенному методу, который решает полную
проблему собственных значений для матрицы и будет нами изложен
в § 78 гл. VIII. При больших г, в частности при г==п, метод дает
хорошие результаты лишь в случае, если все собственные значения,
подлежащие определению, вещественны и различны. Наличие комп-
комплексных корней и собственных значений, принадлежащих ящикам
Жордана высших порядков, сильно затрудняет проведение процесса,
в чем мы убедились даже при рассмотрении случая г = 2.
§ 58. Метод Х-разности
Метод Х-разнисти дает возможность, зная наибольшее по модулю
собственное значение Хх, находить следующее собственное значение Х2
и принадлежащий ему собственный вектор при условии, что
Метод состоит в следующем.
Пусть вычислена последовательность
Уг
Ут
0)
и из нее определено
тора Yk=
—~. Здесь ук — любая компонента век-
368 ЧАСТИЧНАЯ ПРОБЛЕМА СОБСТВЕННЫХ ЗНАЧЕНИИ [гл. V
Образуем разность
ДЛ = Л+1 — \У* = с2 (Х2 — Xt) X* + • • • + с„ (Х„ — \) С B)
Так как Х2 по модулю больше, чем все остальные собственные зна-
значения, и с2Ф0, то первый член этой разности будет преобладать,
и мы сможем определить ).2 аналогично тому, как мы определяли )ч.
Именно,
> , Ук+i — hyic /оч
Однако при таком определении Х2 мы наталкиваемся на исчезновение
значащих цифр, так как в числителе и знаменателе отношения C)
нам приходится вычитать величины, близкие друг другу. Практически
целесообразно, найдя )ч из отношения ук_.г1 и ук, вернуться
назад и определить Х2 из отношения
) ~ Ут + Х — hi'm m ^ h (i\
Ут— '4)'m-t
беря в качестве т наименьшее из чисел, при котором преобла-
преобладание Хз над следующими собственными числами уже начинает
сказываться. Указанный прием дает для Х2 довольно грубые значения,
однако часто достаточные для нужд практики. Теоретически возможно
при помощи аналогичного процесса определять и следующие соб-
собственные числа.
Очевидно, что для определения второго собственного вектора
процесс составления Х-разности надо произвести в последователь-
последовательности AY0, A2YU AkY0, ... Действительно, разность
A*"Y0 — \A*Y0 = а2 (Х2 — X,) X2fc*2 + . .. + ап (Хп - \) \кпХп
показывает, что компоненты вектора Х2 могут быть найдены анало-
аналогично тому, как мы определяли компоненты вектора Х1 в § 53.
Для примера определим второе собственное число матрицы G) § 54.
В качестве X, будем брать как значение, полученное непосред-
непосредственно из отношений компонент 20-й и 19-й итераций (Х[ ?аз 1.001),
так и уточненное при помощи скалярного произведения значение
(Хх^ 1.000000).
Принимая за ук первую компоненту вектора AkY0, получим (при
X! -5й 1.000000), учитывая 17-ю, 18-ю и 19-ю итерации (т=18):
I Ут+х — 1хУт ^ 4.677943 — 4.676009 _ 0.001934
2~ ут— hy-m-i ~ 4.676009 — 4.673110 ~ 0.002899
Аналогично, принимая за ук четвертую компоненту вектора AkY0
получим
— 0.009131 _
Х*- -0.013667 ~
§ 58] метод 1- разности 369
Таким образом, знание достаточно точного значения Xt дало воз-
возможность определить и Х2 относительно точно (три знака после за-
запятой) (точно X, = 0.666 ...)•
Если в качестве )., мы возьмем более грубое значение Xj^ 1.001,
то, вычисляя прежнее отношение, мы столкнемся с описанным явле-
явлением исчезновения значащих цифр. В этом случае в качестве т надо
взять число значительно меньшее чем 20.
Так, рассматривая 9-ю, 10-ю и 11-ю итерации вектора A]<YU
4.4665336
7.1243407
0.0699857
— 7.4707539
4.1901061
4.5365193
7.5407651
0.0476287
— 7.7678185
4.3570946
получим, вычисляя величины ут+х — Х_уто:
Отношения этих величин
от = 9 от = 10
0.06552 0.04309
0.40930 0.27986
-0.02242 —0.01548
-0.28959 —0.20213.
4.5841480
7.8281626
0.0321941
- 7.9777169
4.4667878
дают для Х2 значения
0.658
0.684
0.690
0.698.
Таким образом, знание весьма грубого значения для Х( позволило
нам все же, используя ранние итерации, получить для \% значение,
верное с точностью до трех единиц второго знака.
Приближенные значения для компонент второго собственного
вектора мы можем получить как соответствующие отношения ком-
компонент вектора Am+1Y0 — X1AmY0. Взяв /и —9, мы получим, исполь-
используя ранее вычисленные компоненты вектора Al0Y0 — \A9YQ, следую-
следующие значения для компонент собственного вектора (после нормиро-
нормирования):
1.00; 6.49; —0.36; —4.69.
Для рассматриваемой матрицы второй собственный вектор имеет
компоненты
1.^ = 6.2. — т = — 0.333 .... — ^ = —4.733 ....
о 3 15
24 Зак. 974. Д. К. Фаддеев и В. Н. Фаддеева
370 ЧАСТИЧНАЯ ПРОБЛЕМА СОБСТВЕННЫХ ЗНАЧЕНИЙ [ГЛ. V
так что результаты вычисления достаточно хорошо согласуются
с точными данными.
Метод Х-разности может быть обобщен следующим образом.
Пусть известны Хх и Х2 и требуется определить Х3, причем известно
также, что |X3J>|X4|. В этом случае мы составляем „вторую XtX2-
разность", т. е.
Д2Л = (Л+2 — КУн f 1) — 1г (Ук+i — Х1Ук) =
= Ук r2 — (xi + h) Ук+1 + КЧУк-
Легко видеть, что
А2Л = сг (Х3 - X,) (Х3 — Х2) Х3* + • • • + с„ (Хп - )ч) (Х„ — Х2) X*
и, при достаточно большом k,
Пропадание знаков при составлении второй Х^-разности будет еще
значительнее, чем при использовании первой Xj-разности, так что
в случае вещественных Х1 и Х2 метод почти не применим. Относи-
Относительно хорошие результаты получаются лишь в случае, когда \ и Х2
образуют комплексную пару. В этом случае вторую Х^-разность
целесообразно искать в виде
&Ук = Ук+2 + РУк + 1~{- ЧУ к>
где р и q коэффициенты квадратного трехчлена {t — Хх)(/ — Х2) и
могут быть вычислены по формулам A9) § 53.
Более того, если за простым вещественным корнем Xt или
комплексной парой \ и Х2 следует комплексная пара, то используя
Х-разности вместо итераций в формулах A9) § 53, мы сможем по-
получить коэффициенты квадратного трехчлена (t — Х2)(?—Х3) или
{t — Х3)(/ — Х4) соответственно.
§ 59. Метод исчерпывания
Методы исчерпывания и понижения (§ 60) дают возможность
определять последующее собственное значение и принадлежащий ему
собственный вектор, после того как предшествующие собственные
значения и принадлежащие им собственные векторы известны с до-
достаточной степенью точности. В отличие от методов § 56 и § 58,
направленных к той же цели, применение методов исчерпывания и
понижения не влечет потери точности. Поэтому эти методы дают
возможность, в частности, решить полную проблему собственных
значений при помощи цепочки решений частичных проблем.
Для простоты изложения будем предполагать, что все собствен-
собственные значения матрицы А вещественны.
§ 59]
МЕТОД ИСЧЕРПЫВАНИЯ
371
Для проведения одного шага метода исчерпывания для матрицы А
нужно знать предварительно не только какое-либо ее собственное
значение Х2 (не обязательно наибольшее по модулю) и принадлежащий
ему собственный вектор Ul=^(a1, и2, .... ип)', но также и собст-
собственный вектор V1 = (vl,v2, ¦¦¦, vn)' матрицы А', принадлежащий
собственному значению )п. Будем предполагать, кроме того, что
все собственные значения матрицы А попарно различны, так что
существуют базисы Uv . . ., Un и Vl Vn, состоящие из собст-
собственных векторов матриц А и А', удовлетворяющих условиям норми-
нормированное™ (О-,. V;) = 1 при /—1, 2 п.
Составим матричное произведение UXV'V где V[ строка, состав-
составленная из компонент вектора Vv
Это будет квадратная матрица
u2vl
u2v2
_utlvl unv2 . . . unv,,_
Заметим, что матричное произведение V\UX равно числу 1, та
как оно равно скалярному произведению (U1, V^.
Далее образуем матрицу
Докажем, что матрица Ах обладает теми же собственными числами
и векторами, что и матрица А, за исключением первого собствен-
собственного числа, вместо которого появляется собственное число, равное
нулю. Действительно,
AlU1 = AUX — \ (uyj Ut = AU, — KU, {V[U,) = AU, — \U, = 0
AUi = AUt — X, {уУ,) U, = AUt - l.U, (V[Ut) = )HUb
так как Vj?/., = 1, V'1Ui=(Vl, t/,)=0 в силу ортогональных свойств
векторов ?/,, U2 Un и Vv V2 Vn.
Указанное свойство матрицы А дает возможность, исходя из век-
векjYq, . . ., AfYQ, .
определяли X, и
. . определить ).2 и U2
U1 из последователь-
последовательторной последовательности
аналогично тому, как мы
ности AY0, ..., AkY0, ..., так как собственное число Х2 будет
первым собственным числом для матрицы Av Мы будем называть
этот процесс процессом исчерпывания.
Покажем, что
A?Y0 = AmY0 — irU1v'1Y0, B)
т. е. что для практического применения указанного процесса нет
надобности вычислять матрицу Л, на самом деле и образовывать
372 ЧАСТИЧНАЯ ПРОБЛЕМА СОБСТВЕННЫХ ЗНАЧЕНИЙ [ГЛ. V
ряд векторов Л,К0 Л\У0, ..., а достаточно вычислить лишь
два соседних вектора Af+1Y0 и АтУ0 по формуле B).
Для установления равенства B) введем так называемое билиней-
билинейное разложение матрицы А.
На основании ортогональных свойств системы собственных век-
векторов матрицы Л и ее транспонированной верно матричное равен-
равенство
E = UlV'1 + UiV'0_+ ... +UnV'n.
Умножая это равенство слева на Л и заменяя AUt на >.;?/; (/= 1,2 п),
получим, что
Процесс исчерпывания уничтожает первое слагаемое в этом раз-
разложении, так что
Далее
Ат = хТ
Аналогично
Л, —k2U2V2-f- ... -f-f-nUnVn.
Поэтому
Л] = А Aj CjKi,
откуда вытекает равенство B).
Таким образом, применять метод исчерпывания можно в двух
вариантах. В одном из них надо вычислить вектор UiVlY0, образо-
образовать векторы A™+1Y0 и A™YQ по формуле B) и затем определить л2
и U2 обычным для степенного метода образом.
В этом варианте происходит значительное уничтожение значащих
цифр и потому в качестве т приходится брать число, значительно
меньшее, чем число итераций, применявшихся для определения числа \
и компонент собственных векторов (Д и V,. Точность при исполь-
использовании этого варианта получается невысокой.
Второй вариант заключается в фактическом построении матрицы Д
и вычислении итераций посредством Av Этот вариант требует боль-
большего объема вычислений, но обеспечивает значительно лучшие резуль-
результаты в смысле точности.
В обоих вариантах возможно применение приемов улучшения
сходимости.
Пример. Рассмотрим снова матрицу G) § 54.
Метод исчерпывания требует для определения второго собствен-
собственного числа знания как первого собственного числа, так и принад-
принадлежащих ему собственных векторов как матрицы А, так и мат-
матрицы А'. Поэтому при пользовании этим методом необходимо наряду
§591
МЕТОД ИСЧЕРПЫВАНИЯ
373
с вычислением последовательности итераций A*YQ вычислять и после-
последовательность итераций A'kY0. Таким образом, при определении ^
мы всегда можем уточнить значение Xj при помощи метода скаляр-
скалярного произведения.
В нашем примере, используя двадцать итераций вектора Yo =
— A, 1, 1, 1)' матрицей А и матрицей А', мы получили для )ч
значение Xt= 1.000000 (см. п. 1, § 54).
Для компонент собственных векторов матриц А и А' мы полу-
получаем, нормируя компоненты векторов A20Y0 и A'WYO значения:
1.00000
1.79757
0.00018
1.79838
1.00000
— 0.00027
5.01676
— 0.14256
Точные значения компонент первого собственного вектора матрицы А
суть 1, 1.8, 0, —1.8. Следуя теории, нужно прежде всего нор-
нормировать векторы G, и F] так, чтобы ({/,, t/t) = 1. Вычисляя мно-
множитель нормирования, получим с =0.795678. Таким образом, для
компонент первых собственных векторов матриц А и А' мы получим
значения:
1.00000 0.79568
1,79757
0.00018
1.79838
—0.
3.
—0.
00021
99173
11343
Теперь мы можем образовать матричное произведение C/jVV Именно:
0.79568 —0.00021 3.99173 —0.11343
1.43029 —0.00038 7.17541 —0.20390
0.00014 0 0.00072 —0.00002
— 1.43093 0.00038 —7.17865 0.20399
Далее образуем матрицу Ах.
~ 0.20432
—0.43029
—0.00014
1.43093
0.00021
0.77816
—0.02525
—0.88927
—2.99173
—6.84208
0.55484
— 1.46579
0.11343"
0.53723
—0.02523
—0.09288
а образуем итерации вектора Ко=A, 1,1, 1)' этой матрицей.
374 ЧАСТИЧНАЯ ПРОБЛЕМА СОБСТВЕННЫХ ЗНАЧЕНИЙ [гл. V
Приведем 17-ю и 18-ю итерации матрицей Av
АХ
—0.00869
—0.05388
0.00290
0.04107
—0.01861
А
—0.
—0.
0.
0.
—0.
18у
1 *0
00580
03597
00193
02741
01242.
Отношения компонент 17-й и 18-й итераций дадут для X, значения;
0.667
0.668
0.666
0.667.
Из 18-й итерации получим посредством нормирования к единич-
единичной первой компоненте f72 = A.00, 6.20, —0.333, —4.73)'.
Мы видим, что как само второе собственное число Х2, так и
компоненты второго собственного вектора определяются методом
исчерпывания более точно, чем методом Х-разности. Однако этот
метод требует в случае несимметричной матрицы много дополни-
дополнительной работы. В случае симметричной матрицы метод исчерпы-
исчерпывания может быть рекомендован.
При вычислении второго собственного числа и компонент второго
собственного вектора можно пользоваться описанной модификацией
метода исчерпывания, при которой вектор A^Yq вычисляется, минуя
итерации матрицей At, по формуле B). Вычисляя, получим
иУ!У0 = D.67377, 8.40142, 0.00084, —8.40521)'.
Теперь вычисляем a\yo по формуле B) при k = 9 и 10. Это дает:
a\y0
0.20724
1.27708
0.06915
0.93446
А
—0.
—0.
0.
0.
¦1 r0
13725
86065
04679
63739.
§ 60] МЕТОД ПОНИЖЕНИЯ 375
Отношения компонент равны:
0.662
0.674
0.677
0.682,
так что Х2^0.67 с точностью до 10~2. Далее, нормируя л{°К0,
получим G2 = A.00, 6.27, —0.34, —4.64)'.
Метод исчерпывания почти без изменений может быть перенесен
на матрицы с комплексными элементами и вещественные матрицы
с комплексными собственными значениями. При его обосновании
нужно рассмотреть вместо строк V't строки V*, составленные из чисел
комплексно-сопряженных с компонентами собственных векторов V^
матрицы А*, принадлежащих собственным значениям Х;.
При применении метода исчерпывания в случае вещественной-
матрицы, для которой определена пара комплексно-сопряженных
значений с соответствующими им собственными векторами, следует
проводить процесс исчерпывания по формуле
А1 = А
LJyl — \iryl = А — 2Re (X^vj).
Это позволяет оставаться в классе вещественных матриц.
§ 60. Метод понижения
Пусть для матрицы А вычислено первое собственное значение \
и принадлежащий ему собственный вектор UL = (ut ип)'. Рас-
Рассмотрим матрицу
«! 0 ... 0
1
Нетрудно проверить, что
- 1
«3
«1
о
о
376
ЧАСТИЧНАЯ ПРОБЛЕМА СОБСТВЕННЫХ ЗНАЧЕНИЙ
[ГЛ. V
Матрица Р ХАР подобна матрице А и потому собственные числа
обеих матриц одинаковы.
Но
Р'1АР
"l
«1
«1
О апг —
——- Q,
bl2 . .
В
Таким образом,
>—.tE\ = (k1 — t) \B — tE\.
Следовательно, собственными значениями матрицы А кроме X,
будут собственные значения матрицы п — 1 -го порядка В. Если
нормировать вектор Ul так, что и1=1, то мы будем иметь
«22
- И,й,
_"П2"
¦ и„а,,
Для нахождения Х2 нам, очевидно, нужно построить последователь-
последовательность BY0 В Yo и находить Х2 как отношения любых компо-
компонент построенных векторов.
Далее, пусть Z некоторый собственный вектор матрицы В соот-
соответствующий собственному значению X. Тогда матрица Р~]АР будет
иметь собственный вектор ' . Определим zt.
Имеем
Й12
В
§60]
МЕТОД ПОНИЖЕНИЯ
377
Приравнивая первые компоненты в этом векторном равенстве,
получим
откуда
• • • +
Наконец, собственный вектор U матрицы А определится по фор-
формуле
U
-'И-
¦z»
Пример. Определим второе собственное число и компоненты
принадлежащего ему собственного вектора для матрицы G) § 54.
Как мы видели, для этой матрицы было определено первое собст-
собственное число Хя=! 1.001 (§ 54, п. 1) и компоненты принадлежащего
ему собственного вектора 1, 1.79757, 0.00018, —1.79838 (§ 59).
Для определения Х2 вычислим матрицу
В.
Далее образуем итерации вектора Ко = A, 1, 1)' матрицей В.
Приведем результат 15-й и 16-й итераций:
0.77778
—0.02525
—0.88889
— 1.46424
0.55538
—6.84606
0.33333
—0.02525
0.11111
—0.09565
0.00725
0.06339
—0.06388 .
0.00484
0.04243
Определим
Это дает:
—0.02502 —0.01661 '
из отношения компонент 16-й и 15-й итераций.
0.668
0.668
0.669.
Далее . определим компоненты второго собственного вектора, счи-
считая Z = В1вУ0. Для этого сначала определим
1
л,
0.00484
—0.333
; — 0.0145.
378 ЧАСТИЧНАЯ ПРОБЛЕМА СОБСТВЕННЫХ ЗНАЧЕНИЙ [ГЛ. V
Далее вычисляем компоненты и2, иг, и4 вектора U2: и2 —— 0.0900,
м3 = 0.00484, и4 = 0.0685. Таким образом, компоненты вектора U2
суть —0,0145; —0.0900; 0.00484; 0.0685, так что после нормирования
*/2 = A, 6.21, —0.333, —4.72/.
§ 61. Координатная релаксация
Метод, описанный в этом параграфе, применим только в случае,
если матрица А симметрична. В некотором роде он близок к итера-
итерационным методам для решения линейных систем, основанным на
релаксации того или другого функционала. В данном случае роль
такого функционала играет отношение Релея.
„ .„. (АХ,Х)
Вычислим прежде всего, как изменяется отношение и, (л) = . v v.
(л, л)
при изменении X в определенном направлении. Пусть
A)
где Y—некоторый фиксированный вектор, определяющий направ-
направление изменения вектора X. Тогда
{АХ', X') = {AX+a.AY, X-\-olY) = {AX, Х)-\-а.{АХ,
-f а(ЛК, X)-\-v?{AY, Y) = {AX, Х)-\-2ь{АХ, К) + а2(ДК, К)
и, следовательно,
(У'\ — <АХ'< Х"> — (ЛХ,Х) + 2а(АХ, Г) + аЦАУ, Y)
14 }~~ (Х\ X) ~~ (X,X) + <2a(X,Y) + a4(Y,Y) ' К*>
Подберем теперь множитель а так, чтобы отношение \>-{Х') достигало
наибольшего значения. Вычисляя производную ji {X') по а, получим
dy- {X') _ [2 {АХ, Y) + 2a(AY, Y)]{(X, X) + 2а. (X, Y) + а*(К, У)]
d-j. ~~ [{X,X) + 2<i(X,Y) + <0{Y,Y)]*
[2 {X, У) + 2а (К, У)] [(АХ, X) + 2з {АХ, У) + ^ {AY, У)]
и потому для определения а будем иметь уравнение
[{АХ, Y){Y, Y)—{AY, Y)(X, Y)\ <#-\-[{AX, X)(Y, Y)-{AY. Y){X, X)] a-f-
+ {AX, X) (X, Y) — {AX, Y) (X, X) = aa* + ba + c = 0. C)
Исследование уравнения (З) показывает, что его корни всегда
вещественны и различны. Правда, может случиться, что коэффициент
при а2 обращается в нуль. Тогда следует условно считать, что один
из корней уравнения равен оо. Это будет, если один из экстре-
экстремумов достигается на векторе Y. Вторым исключением является слу-
случай, когда \>-(Х') оказывается не зависящим от а. В этом случае
§611
КООРДИНАТНАЯ РЕЛАКСАЦИЯ
379
уравнение C) превращается в тождество 0 = 0. Геометрический смысл
сказанного очень прост. Для пояснения мы предположим, что мат-
матрица А положительно определена, что не нарушает общности, так
как любую симметричную матрицу можно сделать положительно-
определенной за счет добавления скалярной матрицы, причем при
таком преобразовании собственные векторы не меняются, а все зна-
значения отношения Релея (в частности, все собственные значения) изме-
изменяются на постоянное слагаемое. В этом предположении отношение
, v, (АХ, X) 1
Релея \s.{X)—\ -^есть, очевидно, -г-,
(л, л) р*
где р-—длина вектора, исходящего из
начала координат в направлении век-
вектора X до пересечения с эллипсоидом
(АХ, Х)—\. Векторы X' = X+aY
лежат в плоскости (двумерном под-
подпространстве), натянутой на векторы
X и У. Эта плоскость пересекает
эллипсоид (АХ, Х)= \ по эллипсу,
причем отношение Релея достигает
максимума на векторе, направленном
по малой оси этого эллипса и мини-
минимума на векторе, направленном по
большой оси эллипса (см. рис. 3).
Может случиться что вектор К на- I
правлен по одной из осей этого эллипса. *
Вот именно в этом случае один из
корней уравнения C) обращается в бес-
бесконечность. Наконец, может случиться,
что эллипс вырождается в окружность.
Тогда уравнение C) обращается в тож-
тождество, и а может быть взято произвольным. Заметим сразу, что если
при некоторых X и Y получается не круговое сечение и мы сделаем
достаточно малую деформацию векторов X и К, то направление осей
эллипса изменится сколь угодно мало.
Несложное вычисление дает, что экстремальное значение и/ равно
Рис. 3.
an.
D)
it
где d = (X, X)(Y, Y)~(X, Yf, Ь = (АХ, X)(Y, Y) — (AX, Y)(X, Y)
и a = (AX, Y)(Y, Y) — (AY, Y)(X, Y) есть коэффициент при а2 в урав-
уравнении C). Так как d > 0, то из D) следует, что для получения
максимума jx' нужно брать больший корень уравнения C) при а > О
и меньший корень уравнения при а < 0.
Координатный релаксационный метод заключается
в том, что за вектор Y на каждом шагу процесса берется один из
координатных векторов e-v
380 ЧАСТИЧНАЯ ПРОБЛЕМА СОБСТВЕННЫХ ЗНАЧЕНИЙ [ГЛ. V
Пусть Х= (х1 хп)'. Введем обозначение
р = (АХ, X) E)
q = (X,X).
Тогда
(X, AY) = (X. Ае{) = (АХ, et)=ft
(AY, Y) = (Aeit et) = au
(Y, К) = (*4> ei)=\ F)
(X, Y) = (X. e,) = *i-
Квадратное уравнение для определения а перейдет в уравнение
a2 [fi — auXi\ + « [P — aHq\ H-jOXj —/tf = 0. G)
Выбрав соответствующий корень, определим следующее приближение
Х' = Х-\-яе{. (8)
Для этого приближения будем иметь
F' = AXf = AX-\- aAet = F + лАг, (9)
где At есть i-fl столбец матрицы Л. Далее
/>' = (AV, X') = (f. X0 = р + 2а/,
q> = (X', X') = q
Таким образом, величины р', q' и компоненты вектора F', нужные
для проведения следующего шага, легко вычисляются.
Если на следующем шаге менять у-ю компоненту j Ф i, то
в квадратном уравнении нужно заменить аи на «.,, xt на х'., fi на
/', q на q' и р на р'.
Выбор номеров изменяемых компонент может осуществляться раз-
различно. Простейшей возможностью является циклическое чередо-
чередование индексов. Ввиду возможного накопления ошибок округления
время от времени нужно вычислять величины q, р и /j (/ =1, 2, . . ., п)
непосредственно по определяющим их формулам.
Отметим также соотношение
, __Р fjj +аа__ Р' /цч
Я —A q' '
которое можно использовать для контроля вычислений.
Максимизация отношения Релея за счет изменения вектора в дан-
данном направлении может осуществляться несколько иначе, чем было
описано выше.
§ 61] КООРДИНАТНАЯ РЕЛАКСАЦИЯ 381
По существу нам нужно найти максимум отношения Релея
Kv 'у\ в плоскости X'=¦ с.Х-\-с«У, натянутой на данные век-
(Л , Л )
торы X и У.
Считая X' нормированным вектором ((X', Х')—1), мы придем
к задаче об отыскании максимума квадратичной формы
(АХ, Х)с\-\-2{АХ, Y)clC-, + {AY, Y)c\ A2)
при условии
{X, X)ci-\-2 (X, Y) dc2 + (К, Y) c'i = 1. A3)
Решая эту задачу методом множителей Лагранжа, мы придем к системе
уравнений для определения коэффициентов с1 и с2
\{АХ, Х) — Хх (X, Х)\ с, + [(АХ, Y) — (X, Y) и] с2 = О,
, К)—(X, У)а]С1+[(ЛК, К) —(К, К) J*] са = 0, ( }
откуда следует, что множитель Лагранжа р. является корнем квад-
квадратного уравнения
{АХ, Х) — (Х, Х)у. (АХ, У) — (Х, К);х
(АХ, Y)~(X, Y)\x (AY, Y) — (Y, У)и. =Ош A5)
Больший корень этого квадратного уравнения будет давать значение
искомого максимума \х', коэффициенты же сх и с2 определяются из
системы A4) после подстановки в нее вместо [л найденного значения а'.
Для отношения сх и с2 получаем
_ сз _ (АХ, X) — (X, X) jx' _ (X, Y)y.' — (АХ, Y)
а ~ с7 "" (X, У) (*' — (АХ, У) ~~ J.AY, У) —(У, У) jjl' "
Так как, в конце концов, нормировать вектор X' нет необходи-
необходимости, можно полагать
X' = Х-\- aY.
В случае координатной релаксации, когда У = е{, получим в преж-
прежних обозначениях, что \>/ есть больший корень квадратного уравнения
(q — х'Ь у* — (anq+p — 2xJi) а + анр — /? = 0 A7)
и
Л = Л —j— <XS{, V'°)
где
fi — Xtf-' К' — в«
Переход к следующему шагу осуществляется так же, как в прежней
схеме. Хорошим контролем является выполнение равенства ji/ = -^-7-.
382 ЧАСТИЧНАЯ ПРОБЛЕМА СОБСТВЕННЫХ ЗНАЧЕНИЙ [ГЛ. V
Циклический координатный процесс оказывается сходящимся
почти всегда, однако доказательство сходимости мы дадим при не-
некоторых ограничениях.
Теорема 61.1. Пусть матрица А симметрична и ее наиболь-
наибольшее собственное значение \ простое. Пусть начальный вектор Х„
выбран так, что 1) V~\7~^"~Hr ^> ^>> г^е Кг> — второе, в порядке убы-
(Хо, Ло)
вания, собственное значение матрицы А и что 2) ^^ >
(о, л0)
> (Аеи ei) = au при всех /=1, 2 п. При этих условиях
последовательные приближения Хк в циклическом координатном
процессе сходятся по направлению к собственному вектору,
отвечающему собственному значению \.
Доказательство. Будем предполагать, что на каждом шаге
процесса последовательные приближения нормируются к единичной
длине и из двух взаимно противоположных нормированных векторов
выбирается один в некоторой фиксированной полусфере. Обозначим
через D совокупность векторов длины единица, удовлетворяющих
условиям 1) и 2) теоремы и лежащих в выбранной полусфере. Из
условия теоремы следует, что начальное приближение принадлежит
области D. Все последующие приближения будут также принадлежать
области D, ибо по ходу процесса отношение Релея не убывает.
Рассмотрим подробнее отдельный шаг циклического координат-
координатного процесса. Пусть X—некоторый вектор из области D. Обозна-
Обозначим через <?i(X) нормированный вектор, взятый в выбранной полу-
полусфере, на котором достигается максимум (АХ, X) в подпространстве,
натянутом на векторы X и et. В силу второго условия теоремы
(АХ, X) > (Aeit <?j) и потому вектор <?i(X) определяется однозначно.
Из приведенных выше геометрических соображений очевидно, что
нелинейный оператор ср; непрерывен в области D.
В новых обозначениях процесс может быть описан следующим
образом
Х1 = cpj (Хо), Х2 = у2(Х1) ^n^fni^n-i)
Хп+\ — '-?i(Xn), • • ¦, Xnli uj = fj(Xn'e rj^1), ... (у — 1, 2 n)
Через ix0, fjj, ... обозначим значения (AX0, Xo), (AXV XJ, . . .
функционала (АХ, X). Эти значения удовлетворяют неравенствам
ft) ^Hi <C Нг *С • • • и ограничены сверху числом \. Следовательно,
существует lim рА. = ;х.
Рассмотрим последовательность векторов Xv, Xn+l, Х2п+1, .. ¦
Все векторы этой последовательности находятся в области D. В силу
ограниченности и замкнутости единичной сферы из этой последова-
последовательности можно извлечь сходящуюся последовательность Хпи .+1.
Пусть К есть предел этой последовательности. Вектор К находится
внутри области D, ибо (AY, Y) — (j. > (i0 > max(X2, (Aeu ей)-
§ 61] КООРДИНАТНАЯ РЕЛАКСАЦИЯ 383
В силу непрерывности оператора ср2 в области D имеем
К = ср2(К)= \m<f2(Xnk,+i) = Hm Хпк +2-
J > СО Ч J ' j > СО '
Следовательно, (AY,Y) = Hm (/LYnfc.+2. -^nft +г) = Н-- Но по опреде-
определению оператора ср2 на векторе К достигается максимум (AZ, Z) в пло-
плоскости, натянутой на К и ег и этот максимум равен ^ = (Л К, К)ХЛе2, ег)-
Следовательно, У = У. Точно так же доказывается, что ©3(К) = У, . . .
. . . , ф„ (К) — К, ср[ (У) -= К, так что вектор К оказывается неподвижным
для всех операторов cpi (j— 1, 2, . . ., я).
Это значит, что за счет изменения каждой отдельной координаты
вектора Y отношение Релея не может быть увеличено. Следова-
Следовательно, все частные производные отношения Релея в точке К равны
нулю и, следовательно, У есть собственный вектор. Но, в силу усло-
условий 1) и 2) теоремы, это может быть только собственный вектор,
соответствующий наибольшему собственному значению \.
Итак, единственной предельной точкой последовательности Х1§
Хп+1, Х2п+1, . . . является собственный вектор, отвечающий наиболь-
наибольшему собственному значению.
К тому же вектору сходятся и остальные последовательности
Хь Xn + i, X2n+i, . . ., а потому и вся последовательность^, Х2, .. .
Теорема доказана.
Замечание. Условие 2) теоремы не является существенным,
ибо оно, вообще говоря, будет выполняться автоматически после
проведения первого цикла процесса при любом выборе начального
вектора. Если же снять первое ограничение, то, повторяя доказа-
доказательство, мы получим, что каждая предельная точка последователь-
последовательности Хо, Xv Х2, . . . является собственным вектором матрицы А.
Если допустить, что собственные значения матрицы А различны,
то, в силу равенства отношения Релея на всех предельных точках,
мы можем заключить, что предельная точка единственна, т. е. после-
последовательность Хо, Xv ... сходится к некоторому собственному век-
вектору. Однако этот собственный вектор не обязан принадлежать
наибольшему собственному значению, что можно проиллюстрировать
на следующем примере. Пусть
А =
35 —22 8'
-22 38 14
8 14 53
B 1 2 V
-о-. — -о > -о") .то
окажется, что все последовательные приближения будут равны Хо.
384
ЧАСТИЧНАЯ ПРОБЛЕМА СОБСТВЕННЫХ ЗНАЧЕНИЙ
[ГЛ. V
Легко проверить, что Хо есть собственный вектор, отвечающий соб-
собственному значению Xj = 54. Наибольшим же собственным значением
является Xj = 63.
Более внимательный анализ показывает, что последовательность
Хо, Xv . ¦. может сходиться к собственному вектору, соответствую-
соответствующему не наибольшему собственному значению, только если она,
начиная с некоторого вектора, стабилизируется.
Использование координатной одношаговой релаксации для на-
нахождения наибольшего собственного значения, вообще говоря, невы-
невыгодно, ибо по ходу процесса приходится на каждом малом шаге
решать квадратное уравнение G).
Мы все же приведем пример (матрица D) § 51), показывающий
ход процесса, опуская промежуточные вычисления.
Хо
X,
Х2
X-
xQ
Xtf)
Xn
0.34 0.20 0.90 0.75 1.8300504
0.59995498 0.41211685 0.76621642 0.70021179 2.2138031
0.69781651 0.51354408 0.67966297 0.67841258 2.2977743
0.73541175 0.56051428 0.62985366 0.67161815 2.3165637
0.75062330 0.58274350 0.60231592 0.67072572 2.3211276
0.75694325 0.59351423 0.58729670 0.67163815 2.3223053
0.75958696 0.59882656 0.57913506 0.67281146 2.3226235
0.76068465 0.60148118 0.57469926 0.67377537 2.3227126
0.76113138 0.60282111 0.57228443 0.67445635 2.3227381
0.76130659 0.60350310 0.57096708 0.67490251 2.3227456
0.76137102 0.60386377 0.57024369 0.67517902 2.3227477
0.76139227 0.60403891 0.56985092 0.67535101 2.3227485
1.0000 0.7933 0.7484 0.8870
Здесь в последнем столбце приведены значения \i(Xi).
Групповая координатная релаксация заключается
в следующем. Ищется максимум (или минимум) отношения ' „
за счет одновременного изменения нескольких координат пре-
предыдущего приближения. От шага к шагу выбираемые группы коор-
координат изменяются.
Дадим описание одного шага процесса 1). Пусть X некоторое
приближение к собственному вектору, принадлежащему наибольшему
по модулю собственому значению Х1( найденное в предыдущих k шагах.
Положим для определенности, что в рассматриваемом шаге изменяе-
изменяемые координаты имеют номера 1 г. Натянем на векторы X,
1) Хестинс [1].
§61] КООРДИНАТНАЯ РЕЛАКСАЦИЯ 385
<?, ег подпространство Q и будем искать максимум [а (X') в этом
подпространстве. Пусть
ciei-\- ... +crer. B0)
Тогда
04*',*')= 2 bjci'fi B1)
i, J = 0
где
т ¦= (АХ X)
70i = (AX, et) = (X, Aet) = (*, At) B2)
Ту = (Aeit ej) = fly (I. j = 1, 2, . . ., r).
Здесь через ^ обозначен i-й столбец матрицы А. В свою очередь
г
(Л"', *')== 2 Рус^, B3)
где
Poo = (Л> Л) — xi + • • • + хп
В ¦ = (* g.) =r= jc- B4)
В,-- = (е-, е-) = Ьу (I, у = 1, 2, . . ., г),
Оу — символ Кронекера. Обозначим
B5)
Легко видеть, что максимум [!¦(*') равен наибольшему корню jj-'
уравнения
|Г — ^В| = 0, B6)
а вектор, реализующий этот максимум, есть решение линейной одно-
однородной системы с матрицей Г—\>'В. Полученное решение целесо-
целесообразно нормировать так, чтобы со=1.
Таким образом, один шаг групповой координатной релаксации
равносилен решению частичной обобщенной проблемы собственных
значений для матрицы 'т~\- 1-го порядка. Однако обобщенная про-
проблема в данном случае легко сводится к обычной.
Для этого в подпространстве, натянутом на *, е1, . . ., ег выби-
X ~
раем ортонормальный базис Z = ~^-, ех ег, где *= @,0 0,
1^1
Будем рассматривать вектор, реализующий максимум отношения
Релея в виде
.. +srer. B7)
386 ЧАСТИЧНАЯ ПРОБЛЕМА СОБСТВЕННЫХ
Тогда
где аж
Поэтому числа s0, ...
тора матрицы
(АХ' X')
= (AZ, Z)
= йу при i.
S =
являются
~ °00 °01
ЗНАЧЕНИЙ
/=1 г.
компонент
... о0г ~
... о1г
... агг_
гами собственного
[гл. \
B9)
век-
C0)
соответствующего наибольшему собственному значению. Это послед-
последнее и равно искомому максимуму.
Таким образом, в выбранном базисе каждый отдельный шаг метода
групповой релаксации требует решения частичной проблемы соб-
собственных значений для матрицы порядка /¦ —)— 1.
Метод групповой координатной релаксации имеет смысл приме-
применять лишь для матриц большого порядка.
§ 62. Уточнение отдельного собственного значения
и принадлежащего ему собственного вектора
1. Метод Дерведюэ.') Пусть X и U суть приближенные значения для
некоторого собственного значения матрицы А и принадлежащего
этому собственному значению собственного вектора. Обозначим через
~к* — \-\-йХ и и* = 1)~{-Ш точные значения того и другого. Пусть
W = r. A)
Для определения ЬХ и Д(У имеем нелинейное уравнение
AU* = VU*
или
Л(У + Д[У) = (Х + ДХ)([У + Ди). B)
Отбрасывая члены 2-го порядка малости, получим
или, принимая во внимание A),
— AW— ХД?/ = О. C)
') Дерведюэ [2].
§62]
УТОЧНЕНИЕ ОТДЕЛЬНОГО СОБСТВЕННОГО ЗНАЧЕНИЯ
387
Без нарушения общности можно считать, что первая компонента
вектора Д(У равна 0, ибо собственный вектор U* определен с точ-
точностью до постоянного множителя. Записав равенство C) в компо-
компонентах, мы получим систему п линейных уравнений с п неизвест-
неизвестными ДХ, Ди2 Ди„. Эта система имеет вид
— и1 ДХ -j- й12 Ди, -f- ... 4-oln Д«п = — гх
(й22 — X) Ди2 + • • • + а2п Ди„ = — г2
и2 ДХ
D)
Найдя ДХ, Д«2
Ди„, можно повторить процесс.
В качестве примера уточним собственное значение и принадлежащий
ему собственный вектор для матрицы примера 2 § 53. На странице 333
было найдено, что Х1= 17.39 и f/j = A.00000, —8.14472, 7.91426/.
Вычисляя невязку, получим г==(— 0.00420498,0.0592605,—0.0630314)'.
Ниже приведено решение системы для определения ДХ, Ди2 и Ди3 по
методу единственного деления
—1
8.14472
—7.91426
1
1
1.870086
5.578346
4.308033
-1.870086
20.809673
— 10.492314
1
1
0.42290S
5.711900
4.419313
—0.422908
9.156367
1.072309
0.4400053
5.6889803
1
0.00420498
—0.05926046
0.06303143
—0.00420498
—0.02501208
0.02975214
—0.00120195
0.01714090
0.00301300
-0.0025277
—0.0076578
1.297199
19.375706
0.8761174
-1.297199
29.941029
—9.390253
1.438804
5.706124
1.0030130
0.9974724
0.9923423
Таким образом,
ДХ = — 0.007658, Ди2 = — 0.00253, Д«3 = 0.00301,
и потому мы получаем уточненные значения
Х1 = — 17.397658, ^ = A.00000, —8.14725, 7.91727/.
Полученные значения уже значительно ближе к точным (см. § 53).
25*
388 ЧАСТИЧНАЯ ПРОБЛЕМА СОБСТВЕННЫХ ЗНАЧЕНИЙ [ГЛ. V
2. Метод Вилаидта. Для уточнения отдельного собственного зна-
значения и принадлежащего ему собственного вектора можно применить
следующее видоизменение степенного метода, впервые предложенное
Виландтом ').
Пусть «лесть приближение к собственному значению X матрицы А,
которому соответствует собственный вектор U. Тогда число v = г
будет собственным значением для матрицы В = (А — аЕ)'1, которому
будет соответствовать, как это не трудно проверить, собственный
вектор U. Остальными собственными значениями для матрицы В будут
v4 = =- и если [а достаточно близко к X, то v будет значительно
преобладать над остальными собственными значениями матрицы В.
Поэтому применение степенного метода с матрицей В уже при не-
небольшом количестве итераций даст хорошее приближение для числа v.
Собственное значение X найдется по формуле
* = {*+!. E)
Итерации матрицей В = (А — p-f) требуют либо фактического
обращения матрицы А — uf, либо менее трудоемкого решения системы
линейных уравнений
дающее' сразу итерацию вектора Ui_i матрицей В. За вектор Uo
следует брать известное приближение к собственному вектору.
Определитель матрицы А — \>.Е будет близок к нулю и система F)
окажется плохо обусловленной. Однако характер плохой обусло-
обусловленности здесь будет таким, что с малой точностью определяются
абсолютные значения компонент вектора (У4, но отношения компонент
этого вектора будут, как правило, определяться с хорошей точностью.
Для вычисления же компонент собственного вектора только это и
нужно, так как последние определяются лишь с точностью до ска-
скалярного множителя.
Возможна еще одна модификация процесса, в которой итерации
получаются в результате решения системы
где [J-j есть приближение к собственному значению X, уточненное на
предыдущем шаге. Это дает ускорение сходимости процесса. Правда
оно мало существенно, так как процесс и без него сходится очень
быстро.
Заметим еще, что при [л. очень близких к X решение системы
(A — ]iE)Ui = Ui_l (8)
1) Бодевиг [6], стр. 293-294.
§62]
УТОЧНЕНИЕ ОТДЕЛЬНОГО СОБСТВЕННОГО ЗНАЧЕНИЯ
389
почти не отличается от решения однородной системы
(А— pE)U = 0
(9)
для координат собственного вектора.
Собственное значение v определяется как отношение соответ-
соответствующих компонент векторов Ui и Ui_l. В силу указанной выше
плохой обусловленности системы, эти отношения определяются с не-
невысокой точностью, но это не портит дела, так как число — играет
роль малой поправки в формуле Х = у. -| для определения соб-
собственного значения матрицы.
Метод Виландта проиллюстрируем на примере предыдущего
пункта.
Пусть [1. = —17.39, ?/„ = A.00; —8.14; 7.91)'. Решая по методу
единственного деления соответствующую систему
11,880118
0.287865
0.049099
1
1
1.870086
5.578346
4.308033
0.15741308
5.5330323
4.3003042
1
1
0.422908
5.711900
4.419313
0.03559796
5.7016526
4.4175652
1.0304751
—0.01379120
1
1.00
—8.14
7.91
0.08417425
—8.1642308
7.9058671
— 1.4755437
14.251154
—1033.3512
1063.3671
— 130.5185
15.173112
3.438111
16.686445
1.2771853
3.0704541
16.6237365
0.5549315
14.237362 '
— 1032.3512
1064.3671
— 129.5185
получим, что t71 = A.0000, —8.14725, 7.91728)' и i = —0.007655
(или —0.007655, —0.007662). Это дает ). = — 17.397655. Вектор Ux
также значительно ближе к собственному вектору, чем Uo.
3. Метод возмущений. Метод возмущений разработан для огра-
ограниченных операторов в Гильбертовом пространстве *). В применении
к матрицам он в основном заключается в следующем.
•)F. Rellich. Math. Ann., 1936, 113 D), 600—619. M. К. Гавурин.
Вестн. Ленингр. ун-та, 1952, 9, 77—95.
390 ЧАСТНАЯ ПРОБЛЕМА СОБСТВЕННЫХ ЗНАЧЕНИЙ [ГЛ. V
Пусть симметричная матрица Ао имеет простое собственное зна-
значение Xq и соответствующий ему собственный вектор Хо. Обозначим
через R матрицу, определенную условиями R(A0— \E)Y=Y при
любом К, ортогональном к Хо, и RX0 = 0. Матрица R существует,
ибо оператор с матрицей Ао — XqE будет невырожденным на под-
подпространстве, ортогональном к вектору Хо. Пусть А некоторая
другая симметричная матрица, X ее собственное значение и X соот-
соответствующий собственный вектор, причем (X, Хо) Ф 0, что позволяет
считать, без нарушения общности, что X—Xo-{-Z, при (Z, Х0) = 0.
Положим В = А — Ао, |а = Х — )^. Тогда имеют место соотно-
соотношения
В)Х, Хо) = 0 A0)
X0. (И)
Действительно, (^Е~В)Х=(кЕ
так что ((\хЕ — В)Х, Х0) = (Х, (Ао — ХоЕ)Х0) = 0. Далее,
(Е — R (|i?— В)) Х=Х— R (Ао — )^Е) X = X— Z = Хо.
Если матрица Е — R{]xE — В) невырожденная (что будет иметь
место, например, если | [а | и ||В|| достаточно малы), то формула A1)
эквивалентна формуле
Х=(Е — ЖцЕ —Я))*,,- A2)
При малых |(л| и ||В || правую часть равенства A2) можно раз-
разложить в ряд. Ограничиваясь членами второго порядка и принимая
во внимание, что RXo = 0, получим приближенную формулу
A3)
которая вместе с A0) дает
р, X0)-(RBX0, ВХ0) + (BRBX0, RBXo)
Для применения изложенного к задаче об уточнении отдельного
собственного значения симметричной матрицы воспользуемся приемом
«ложного возмущения", также предложенного М. К. Гавуриным1).
Пусть для симметричной матрицы А известен приближенный норми-
нормированный собственный вектор Хо и приближенное собственное зна-
значение \0 = (АХ0, Хо). Построим матрицу
где г — АХ0 — \)Х0. Ясно, что Ао симметрична, и легко проверяется,
что для нее вектор Хо является собственным вектором, принадле-
принадлежащим собственному значению Aq.
• i)-M. К. Гавурин. Успехи матем. наук, 1957, 12, № 1, 173—175.
§ 62] УТОЧНЕНИЕ ОТДЕЛЬНОГО СОБСТВЕННОГО ЗНАЧЕНИЯ 391
Приближенные формулы A3) и A4) превращаются в
Rr — pR2r A5)
(Rr, r)
Уточнив по формулам A5) и A6) собственный вектор и соб-
собственное значение, можно повторять процесс до получения тре-
требуемой точности.
Векторы Rr и R2r находятся соответственно из систем линейных
уравнений
= r A7)
(A0~\0E)Z = Rr A8)
(Z, Л"о) = 0.
Так как \ Ао — \,Е| = 0, одно из п первых уравнений в системах
A7) и A8) может быть отброшено и использовано лишь для
контроля.
Если в формуле A5) отбросить член \t.R2r второго порядка ма-
малости, то отпадает необходимость в решении второй системы.
Отметим, что метод может применяться, начиная с довольно
грубых приближений для Хо.
На описанный здесь прием реализации метода возмущений обра-
обратил внимание авторов Л. А Руховец.
Для матрицы D) § 51 имеем Х=г0.24226071, ^=@.718846,
0.095699, —0.387435, —0.569207)'.
Исходя из приближения Хо = @.704361, 0.176090, —0.440225,
—0.528271)', полученного нормированием вектора @.8, 0.2, —0.5,
—0.6)', и ХО = (ЛАГО, Хо) = 0.248992, получим, после однократного
применения формул A5) и A6) и нормирования, Хх = @.718839,
0.095717, —0.387445, —0.569206)', \t = 0.24226072.
При проведении итерационного процесса посредством «-кратного
повторного применения формул A5) и A6), быстрота сходимости
имеет порядок q&n, если же пользоваться упрощенной формулой A5)
с отброшенным членом \xR2r, то быстрота сходимости будет иметь
порядок фп. Здесь q= о , где г невязка начального при-
ближения, х расстояние от уточняемого собственного значения до
ближайшего соседнего. Эти оценки нам сообщены М. К. Гавуриным.
ГЛАВА VI
МЕТОД МИНИМАЛЬНЫХ ИТЕРАЦИЙ И ДРУГИЕ МЕТОДЫ,
ОСНОВАННЫЕ НА ИДЕЕ ОРТОГОНАЛИЗАЦИИ
Методы, которые будут описаны в этой и следующей главах,
применимы к решению системы линейных уравнений и к решению
проблемы собственных значений — полной (гл. VI) и частичной (гл. VII).
Хотя исторически некоторые методы, описанные в гл. VII (в част-
частности, метод наискорейшего спуска), появились ранее методов гл. VF,
мы излагаем сначала эти последние, ибо появление их позволило
упростить и развить дальше первые.
Несмотря на то, что методы гл. VI являются точными, а методы
гл. VII итерационными, их вычислительные схемы по существу имеют
один рисунок.
§ 63. Метод минимальных итераций
1. Построение базисных векторов в невырожденном случае.
Пусть матрица А симметрична. Метод минимальных итераций') для
решения полной проблемы собственных значений есть не что иное,
как метод ортогонализации последовательных итераций некоторого
начального вектора (§ 50). Однако мы изложим его независимо
от результатов § 50, ввиду возникновения многих важных особен-
особенностей метода, наличие которых позволяет обобщить метод и рас-
расширить область его применения.
Будем в этом пункте предполагать, что симметричная матрица А
имеет попарно различные собственные значения \, Х2, . . ., \п. Пусть
Uv U2, . . ., Un соответствующие им собственные векторы, которые
мы будем считать нормированными.
Выберем некоторый начальный вемгор X. Он может быть един-
единственным образом представлен в виде
X=*alU1 + aiU2+ ... +anUn. A)
Будем далее пока предполагать, что все коэффициенты аг Ф 0. Тогда
система векторов X, АХ, . . ., Ап~хХ будет линейно-независимой.
Ланцош [2].
§ 63] МЕТОД МИНИМАЛЬНЫХ ИТЕРАЦИЙ 393
Теорема 63.1. Если векторы X, АХ, .... Ап~1Х линейно-не-
линейно-независимы и векторы р0, рг, ..., рп^х получены из них при по-
помощи процесса ортогонализации, то эти векторы определяются
по трехчленным рекуррентным формулам
0=1,2 я —2)
Ро = X. Pi = АРо — ЧР
где
а (pilA (l = 0. 1 я —2)
(Pi'Pi)
a __ (APi- Pi-l) __ (if ^A:-l) _ (Pi' Pi) (l—i 2 П — 2)
(Pi-U Pi-l) (Pi-Ь Pi-l) (Pi-1> Pi-l)
Доказательство. Пусть X, AX, . . ., An~1X линейно-независимы,
и векторы p0, pt Pn-x получены из них процессом ортогона-
ортогонализации. Тогда рг = А%Х-\-Ci'Al~1X-\- . . . -\-с\ X.
Отсюда следует, что вектор pi + 1 — Арх принадлежит подпростран-
подпространству, натянутому на векторы X, АХ, ..., AiX, или, что то же
самое, подпространству, натянутому на векторы р0, р1 рг. Итак,
вектор pi+1 выражается через предшествующие по формуле
где -j^ -fo*' некоторые чи'сла. Из соотношений ортогональности
вектора pi+1 к предшествующим векторам получим
Но при у = 0, 1, ..., 1 — 1 имеют место равенства (Арг, р}) = О,
ибо (Apit pj) = (pi, Apj), а вектор Apj есть линейная комбинация
векторов Pj+i, Pj Ро, каждый из которых ортогонален к век-
вектору pi при j: ^ i — 2. Следовательно, ненулевыми остаются только
два коэффициента
а* 'U (Pi, Рд
„(») (APi> Pj-i) (Pi,
()
i-l (р^.р^) (Pi-bPi-l)
Далее,
(Pi. Api_1) = (pi, Pi + ^-i-iPi-i + h-iPi^^iPi. Pi) D)
и, следовательно,
e — (pj< Pi)
?i ~ (Pi-l, Pi-l)'
394 МЕТОД МИНИМАЛЬНЫХ ИТЕРАЦИЙ [ГЛ. VI
Из последней формулы для ^ следует, что ^ > 0. Для положи-
положительно-определенной матрицы положительными будут и коэффи-
коэффициенты оц.
Очевидно, что векторы />4 представляются в виде
pi=pi(A)X=pi(A)p0 (/=1 л—1). E)
где pi(t) = P-f- ... некоторый полином степени I.
Полиномы fi(t) могут вычисляться параллельно с вычислением
векторов pi по формулам
№i-i(t). F)
в которых коэффициенты <хг и р{ имеют прежние значения.
Заметим, что вектор р„ = Арп_х — ап_хРп_х — Р„_цGя_2, где
(Арп^ьРп^й и a (Pn-i.Pn-i) б ортогонален к п
"-1 (Pn-l.Pn-l) Vn l (Рп-ъРп-z)
векторам р0, pit .... рп-1 и, следовательно, вектор рп равен нулю.
Соответственно, полином рп (t) = (t — ап_г)рп_1 (t) — $n-iPn-2 @
совпадает с характеристическим полиномом. Тем самым получен
удобный и простой алгорифм для вычисления коэффициентов харак-
характеристического полинома.
Трехчленность рекуррентных соотношений, связывающих век-
векторы р^ и полиномы Pi(t), была уже нами установлена двумя спо-
способами, только что и выше в § 50. Осветим это обстоятельство
еще с одной точки зрения. Из равенства E) и разложения
/>0=а1(/1+й2(УаН- ... +anUn
следует, что
Рг = °iPi On) ui + azPi Q-г) U2 + • • • + a«Pi (K) Un-
Отсюда, принимая во внимание условие |(У^| = 1, получим
Последнее равенство эквивалентно равенству
ш
fpj(t)Pdt)dF(f) = O. G)
т
Здесь весовая функция интеграла Стилтьеса определена следующим
образом
F (/) = 0 т. < * < X.t
a + al+ ... +< Ап</<Л
где т и М—границы спектра матрицы А (рис. 4).
§63]
МЕТОД МИНИМАЛЬНЫХ ИТЕРАЦИЙ
395
Условие G) определяет ортогональную по интегральному весу F(t)
систему полиномов Pi(t). Но из теории ортогональных полиномов
известно1), что эти полиномы связаны трехчленными рекуррентными
соотношениями.
Отметим ряд свойств векторов р0 Рп-\ и полиномов po(t),
рЛО Pn-iV). P«<f).
л,
a,'
<
м
Рис. 4.
Теорема 63.2. Корни полиномов pn(t) po(() вещественны
и разделяются.
Действительно, в силу соотношений F) и положительности коэф-
коэффициентов р,; последовательность полиномов pn(t), pn-i(t) Po(t)
есть последовательность Штурма с положительными старшими коэф-
коэффициентами.
Теорема 63.3. Векторы р0, .... pi_x образуют ортогональ-
ортогональный базис подпространства Pit натянутого на векторы X,
АХ А'-'Х.
Доказательство. Векторы р0, . . ., р{_х принадлежат подпро-
подпространству Pit линейно-независимы и ортогональны.
Следующая теорема описывает свойства векторов рг, дающее
право называть их минимальными итерациями. Именно это свойстве
было положено в основу построения системы векторов р0, . .., рп^
Ланцошем [2], автором первой публикации, посвященной методу
минимальных итераций.
Теорема 63.4. Среди всех векторов вида Z = А*Х-{- Y, где
К?Р{, вектор Pi имеет наименьшую длину.
Действительно, pt — АгХ-\-?0, где Ко некоторый определенный
вектор из Рг, и, следовательно, Z=pi-\-Y—Kg.
Но
~Y0, Pi+Y— КО) =
1) И. П. Натансон. Конструктивная теория функций, 1949, ч. II, гл. IV.
396
МЕТОД МИНИМАЛЬНЫХ ИТЕРАЦИЙ
[гл. vi
ибо (fi, Y—Ко) = 0. Таким образом, \Z\2^-\pi\2 и знак равенства
возможен, только если К—Ко = 0, т. е. Z = p^.
Теорема 63.5. Оператор с матрицей А имеет в базисе р0,
plt .... рп-х трехдиагональную матрицу Якоби
«о
1 а
I V2
1 a,
'п-2 Yn-l
' 1
(9)
Действительно,
Ар0 =
АРп-2 = $n-2
т. e. координаты векторов Ap0, Apu. . ., Apn_l в базисе рй, ри..., рп_\
совпадают со столбцами матрицы У. Положительность чисел C; уже
отмечалась. Тем самым теорема доказана.
Следствие.
Действительно, матрицы Л и У подобны, и, следовательно, их следы
одинаковы.
При фактическом осуществлении метода минимальных итераций
равенство A0) дает хороший заключительный контроль.
Теорема 63.8.
t — a0
1 t-
t я^_1
§ 63] МЕТОД МИНИМАЛЬНЫХ ИТЕРАЦИЙ
Доказательство. Полиномы
t-a0 p,
397
Pi(t) =
1
1
связаны такими же рекуррентными соотношениями, что и поли-
полиномы pi(t), в чем легко убедиться разложением определителя по эле-
элементам последнего столбца. То, что pl (f) = р^ (f) и рг(t) = рг(t) ясно
непосредственно. Следовательно, Pi(t)=Pi(t) при всех / — 1, 2 п.
Теорема 63.7. Векторы р0 Pn-i удовлетворяют соот-
соотношениям
Pj) = 0 при |*_у|>1. A1)
Действительно, для /=0, ..-, / — 2 справедливость теоремы
уже была установлена при доказательстве теоремы 63.1. Для 1<С]
утверждение теоремы следует из равенств
(Apt, pj) = (pt
В заключение отметим, что вектор pt совпадает с градиентом 5
функционала \х (X) — ' ' ' в точке р0. Два основных свойства
(Х,Х)
(X, Е) = О
градиента
являются частным случаем свойств
(Pi. Pi) = О
I, Pi) = (Pi< Pi)
A2)
системы векторов р0, pv . . ., pn_v
2. Достройка системы базисных векторов в случае вырожде-
вырождения. В предыдущем пункте мы предполагали, во-первых, что все
собственные значения матрицы А различны и, во-вторых, что все
коэффициенты щ в разложении выбранного нами начального вектора
по собственным векторам отличны от нуля. Эти условия обеспечивали
линейную независимость векторов X, АХ Ап~1Х.
Если хотя бы одно из них не выполнено, то векторы X,
АХ, . .., Ап~ X уже не будут линейно-независимыми. Если проводить
над ними процесс ортогонализации, то на некотором шагу процесс
оборвется, именно, мы получим, что рг = 0 при некотором г < л.
398 МЕТОД МИНИМАЛЬНЫХ ИТЕРАЦИЙ [ГЛ. VI
В этом случае полином pr{t) будет, очевидно, минимальным анну-
аннулирующим вектор р0 полиномом.
Покажем, как в вырожденном случае достроить систему векто-
векторов р0 рг_х до ортогонального базиса всего пространства.
Возьмем снова произвольный вектор Y и образуем вектор
определяя коэффициенты с; из условия ортогональности вектора р^
с построенными ранее векторами р0, .... рг_1. Это дает
с = <ZlM. (/ = 0 г—1). A4)
1 (Pi, Pi) ' к '
Вектор р№ ортогонален по построению ко всем векторам
р0 Рг-1< т- е- принадлежит к подпространству, ортогонально-
дополнительному к Рг. Следовательно, и все его итерации будут
ортогональны к Рг, ибо Рг инвариантно и, по теореме 11.1, его
ортогональное дополнение тоже инвариантно. Поэтому, применяя
метод минимальных итераций к вектору pW, мы построим систему
векторов pW, . . ., рA}1 попарно ортогональных не только друг к другу,
но и ко всем векторам р0 Рг-\- Если г ~\-1<^п, мы продолжаем
процесс достройки до тех пор, пока не дойдем до базиса всего
пространства. При этом все пространство естественным образом
разобьется в прямую сумму нескольких попарно ортогональных
инвариантных подпространств Pr, Pt, .... Характеристический поли-
полином матрицы будет равен произведению минимальных полиномов,
аннулирующих последовательные начальные векторы.
3. Определение собственных векторов. Рассмотрим сначала
невырожденный случай. Пусть мы уже построили ортогональный
базис пространства р0, .. ., рп-\, систему ортогональных полиномов
po(t) Pn-i(t)> Pn(t) и нашли корни характеристического поли-
полинома рп((). Пусть U\ собственный вектор, принадлежащий собствен-
собственному значению \. Тогда
В силу ортогональности векторов р0, ..., рп_1
Сч = ?Щ. A6)
Таким образом, для определения вектора (У^ надо вычислить лишь
постоянные ((/4, pj). Это делается без труда на основании следующих
соображений. Из разложения начального вектора р0 по собственным
векторам матрицы
§ 63] МЕТОД МИНИМАЛЬНЫХ ИТЕРАЦИЙ 399
получим
Pi = aiPj (M <Л + • • • + ajff (Kn) Un,
и, следовательно,
Таким образом, с точностью до постоянного множителя
П РоОч) | I Рп-1 О*) „ /17ч
*— 77Г~пТ^° i * * * ' Тп п \Pn~v A7)
Отметим, что значения Pj(\) можно вычислять непосредственно
по рекуррентным соотношениям для полиномов pj(t).
В вырожденном случае векторы, вычисленные по формуле
| | Рг-1 Оч) /17м
^ +/7 A7)
где X; корни полинома pr (t), будут собственными векторами, лежащими
в инвариантном подпространстве Рг. Полная система собственных
векторов определится, если применить описанный прием ко всем
подпространствам Рг, Рг, .... в прямую сумму которых разбивается
пространство R в процессе достройки ортогонального базиса.
В качестве примера определим все собственные значения и при-
принадлежащие им собственные векторы для матрицы D) § 51
1.00 0.42 0.54 0.66'
0.42 1.00 0.32 0.44
0.54 0.32 1.00 0.22
.0.66 0.44 0.22 1.00.
Вычисление ортогонального базиса и коэффициентов характери-
характеристического полинома дано в табл. VI. 1. В качестве начального век-
вектора взят вектор /?0 = A, 1, 1, 1)'.
В первой части таблицы помещены компоненты последовательно
вычисляемых векторов р0, Ар0, рх, Apt pt. Во второй части
записаны результаты контрольной проверки выполнения условий
ортогональности для векторов рг и обычного контроля сумм дл&
векторов Арг. В третьей части таблицы помещены скалярные произ-
произведения (р0, р0), (р0, Ар0), (ри рг), ..., причем (рг, Pi) = (Api_1, pi)
вычисляются двумя способами, в четвертой находятся коэффициенты оц
и C{. В последней части таблицы записаны коэффициенты полиномов
Pi(t), которые вычисляются рекуррентно, так же как в § 51. В ре-
результате вычислений получим
<р (/) = Pi (/) = t*—4. 00000005/3 +
4-4.75200016^ — 2.11185609/ + 0.28615248.
Вычисление базисных векторов и коэффициентов характеристического полинома
по методу минимальных итераций
Таблица VI. 1
I
II
III
IV
V
Ро
1
1
1
1
4.0
2.3
0.0414
1
АРо
2.62
2.18
2.08
2.32
9.20
9.20
Р\
0.32
—0.12
—0.22
0.02
0
0.1656
0.1656
0.47468599
0.05101041
1
—2.3
Арх
0:1640
—0.0472
-0.0812
0.1300
0.1656
0.078608
Рг
—0.02929952
—0.03163768
—0.01816908
0.07910628
0
-0.16 -КГ8
0.0084473237
0.0084473229
0.50602042
0.01120624
1
—2.77468599
1.05037778
Ар2
—0.00018850
—0.01495082
—0.02671150
0.04185082
—0.16-10"8
0.0042745183
Ра
—0.001685676
0.007179741
—0.006295284
0.000801219
0
0.16-10"8
0.12-Ю"9
0.000094662737
0.000094662885
0.71929364
1
-3.28070641
2.40341514
—0.41418866
Ар,
—0.001540834
0.004809803
—0.004731764
0.001462796
0.2-10"8
0.000068090305
Ра
]
1
—0.52-10""
0.39 • 10~9
0.81 • Ю~9
0.31 • 10~9
4.00000005
1
—4.00000005
4.75200016
—2.11185609
0.28615248
§ 63]
МЕТОД МИНИМАЛЬНЫХ ИТЕРАЦИЙ
401
Полученные значения для коэффициентов хорошо согласуются
с точными (см. § 51). Вычисляя корни последнего полинома получим
для собственных значений
^ = 2.32274880; Х2 = 0.79670672; >.3 = 0.63828385;
Х4 = 0.24226068.
Для нахождения принадлежащих им собственных векторов предва-
предварительно, в табл. VI. 2, находим коэффициенты разложения.
Таблица VI. 2
Вычисление коэффициентов разложения
и
Ро Он)
Р\ Он) = h — ао
h — Ч
Рг Он)
Pa (*«)
h — аз
Pi (к)
р'ЛЧ
Ро (h)KPo Ро)
Pi (h)/(Pv Pi)
РгО-дНРъ Pi)
Ръ Q-ШРъ. Pa)
1
2.32274880
1
0.02274880
1.84806281
0.00064121125
1.81672838
0.0000044810604
1.60345516
—0.3877 • 10~9
5.348
0.25
0.13737198
0.075907030
0.047337111
2
0.79670672
1
—1.5032933
0.32202073
0.52549161
0.29068630
—0.076069604
0.07741308
0.2760-10~8
-0.134
0.25
—9.0778581
—62.208059
—803.58551
3
0.63828385
1
—1.6617162
0.16359786
—0.31325321
0.13226343
0.043332881
—0.08100979
0.3062-10~8
0.106
0.25
—10.034518
—37.083131
457.76070
4
0.24226068
1
-2.0577393
—0.23242531
0.43687069
—0.26375974
—0.010262774
—0.47703296
0.3658-10 ~8
—0.457
0.25
— 12.425962
51.717053
— 108.41408
Наконец, по формулам A7) вычисляем все собственные векторы
матрицы А и нормируем их к единичной первой норме.
Собственные векторы матрицы А
Таблица VI. 3
Ui
1.000000
0.793587
0.747804
0.887315
и*
0.061916
—0.291847
1.000000
—0.651533
—0.447443
1.000000
0.042210
—0.425676
Ui
1.000000
0.133129
—0.538970
—0.791834
26 Зак. 974. Д. К. Фаддеев и В. Н. Фаддеева
402
МЕТОД МИНИМАЛЬНЫХ ИТЕРАЦИЙ
[ГЛ. VI
В качестве второго примера рассмотрим матрицу
10 6 3
А =
6 5 2
3 2 2
За начальный вектор возьмем ро = (\, 1, 1)'.
Приводим вычисления по описанной выше схеме (мы не отступаем
от схемы, хотя в контрольных вычислениях здесь нет необходимости,
так как вычисления проводятся точно).
Таблица VI, 4
Метод минимальных итераций в случае вырождения
I
11
III
IV
V
/>о
1
1
1
. 3
13
24
1
Ар0
19
13
7
39
39
Pi
6
0
—6
0
72
72
3
1
—13
Apt
42
24
6
72
216
Рг
0
0
0
" 1
—16
15
Из приведенной таблицы видно, что в данном случае имеет место
вырождение, ибо уже /?2=0.
Отметим, что сумма ax-\-^ равна следу оператора, индуцирован-
индуцированного на подпространстве, натянутом на векторы р0 и рх, и не совпа-
совпадает со следом матрицы А.
Для достройки базиса пространства возьмем новый начальный
вектор
К = A, 0, 0)'.
Тогда в качестве р^
нужно взять вектор
У.Ро)
(Ро,Ро)
„
§ 63] МЕТОД МИНИМАЛЬНЫХ ИТЕРАЦИЙ 403
и провести вычисления по прежней схеме. Мы сразу получаем, что
Др(У = pW, так что р*?1 есть собственный вектор, принадлежащий
собственному значению Х3 =1.
Нетрудно вычислить, что Xj=15, X2=l. Принадлежащие им
собственные векторы (в подпространстве, натянутом на р0 и pt)
вычисляются по формулам A7')
и — I _i-1 — (L 1 IV /
о оо \ 2 3 6 /
_J_ ]_ __/ 2_ j_ Г
2 3 6, \ 3 ' 3 ' 3,
4. Решение линейной системы. Знание базиса р0, ..., pn^i
позволяет также найти решение линейной системы
AX=F. A8)
Действительно, пусть
п-1
Л = ^й\Рх (.1У/
г =0
разложение искомого решения по базисным векторам. Наша задача
заключается в определении коэффициентов щ. Пусть
Тогда
Из уравнения A8) имеем
Ш
i=0 i=0
Но на основании рекуррентного соотношения B) имеем
Подставляя это выражение в B0) и приравнивая коэффициенты при
векторах pt A = 0, 1, .... п—1), получим для определения коэф-
коэффициентов ui систему с трехдиагональной матрицей
B1)
п 1 (рп_ъ рп_х) '
26*
404 МЕТОД МИНИМАЛЬНЫХ ИТЕРАЦИЙ [ГЛ. VI
Решив ее относительно а0, ..., an_v получим искомое решение по
формуле A9).
Однако, как мы увидим ниже, небольшое изменение метода
позволит избежать решения трехдиагональной системы и получить
явные формулы для коэффициентов разложения решения по некото-
некоторой другой системе базисных векторов.
В вырожденном случае матрица вспомогательной системы ра-
разобьется на несколько трехдиагональных ящиков, и это только облег-
облегчит решение системы.
§ 64. Биортогональный алгорифм
Биортогональный алгорифм можно рассматривать как обобщение
метода минимальных итераций на случай несимметричной матрицы.
При этом разнообразие в возможных причинах вырождения значи-
значительно увеличивается по сравнению с симметричным случаем, что
несколько усложняет теорию метода.
1. Нормальное течение процесса. Пусть — А несимметричная
матрица, р0 и р0 — два произвольных начальных вектора. Строим
две последовательности векторов
Pi =APo — <*oPo Pi =А'Ро — <*оРо A)
где
(A Pi
(Pi,
(Ар{,
(Pi-i
¦Pi) _
Pi)
Pi-i)
. Pi-i)
(Pi, A'pi)
(Pi, Pi)
(Pi, A'pi
(Pi-i. Pi
-,)
-i)
(Pi. -^Pi-i)
(Pi-i. Pi-i)
(Pi-I.
Pi-i)
Pi-l)
(ft.
(Pi-l.
Л)
Pi-i)
Ясно, что Pi=Pi(A)p0, Pi—Pi(A')p0, v№ Pi(l) — полиномы, связан-
связанные рекуррентными соотношениями
A+i @ = (f — <*i) A @ — hPi-i @- C)
Из формул B) видно, что процесс оборвется, как только в первый
раз будет иметь место равенство (рг, рг) = 0, так что до обрыва
процесса (р^ р^) Ф 0. Непосредственным вычислением можно про-
проверить, что для построенных систем векторов выполняются условия
биортогональности, т. е., что (pt, pj) = 0 при i+j. Поэтому как
векторы р0, рх, . .., рг_х, так и векторы р0, ри .... рг_х линейно-
независимы. Действительно, если
§ 64] БИОРТОГОНАЛЬНЫЙ АЛГОРИФМ 405
то, составляя скалярные произведения с pi% получим
Тг (/>»- Pi) = 0
и так как (pt, р^фО, то f* = 0, / = 0, 1 г— 1. Таким же обра-
образом убеждаемся в линейной независимости векторов р0, 'рх /V-i-
Отсюда следует, что г^.п, т. е. процесс построения векторов
р0, pv ... и р0, ру, . . . должен оборваться не позже чем на
л-м шаге.
Будем считать, что биортогональный алгорифм протекает нор-
нормально, если он обрывается на л-м шаге, и является вырожденным,
если он обрывается раньше.
При нормальном течении процесса как вектор рп, так и век-
вектор рп равны нулю. Действительно, вектор рп ортогонален к п ли-
линейно-независимым векторам р0, pv ...,pn_v а вектор рп орто-
ортогонален к п линейно-независимым векторам р0, pv ..., рп-\-
Покажем, как решается полная проблема собственных значений
при нормальном течении биортогонального алгорифма.
Сначала рассмотрим простейший случай, когда собственные зна-
значения матрицы А различны.
Пусть Ul, . . ., Un—собственные векторы матрицы A, Vx Vn
собственные векторы матрицы А' и пусть
po = a1Vi-\- .. . -\-anVn.
Легко видеть, что как коэффициенты alt . . ., ап, так и коэффициенты
а1 ап все отличны от нуля, ибо если бы среди коэффи-
коэффициентов а,, ..., ап (или av ..., ап) нашлись нулевые, то векторы
Ро, • • -. Pn-i (или Ро> • ¦ •• Pn-i) были бы линейно-зависимы, так как
все они укладывались бы в подпространство меньшей чем п раз-
размерности.
В силу предположения о нормальном течении биортогонального
алгорифма мы построим две системы базисных векторов р0, pl Pn-i
и р0, рг рп_х (двойственные, с точностью до нормирования базиса)
и одновременно систему полиномов po(t), Pi(t) pn-y{t), pn(t),
причем полином рпA) будет характеристическим. Пусть его корни
найдены. Будем искать собственные векторы для матриц А л А'
в виде
^» = с*оА>+ ••• -\-cin-iPn-i
- D)
\
Таблица VI. 12
Решение линейной системы методом Л-минимальных итераций
I
II
III
IV
V
Яо
1
1
1
1
9.2
2.318
0.008220348
0.24
0.26086957
2.62
2.18
2.08
2.32
9.20
21.3256
Ч\
0.302
—0.138
-0.238
0.002
0
0.075627200
0.56838288
0.04404472
—0.1432
-1.8934986
Адх
0.11684
—0.08644
—0.11864
0.08824
0
0.042985206
—0.06303198
—0.01622351
0.00841478
0.07888289
. 0.78 • 10~8
0.38- 10~9
0.0033309791
0.0033309789
0.42274246
0.049863598
14.969652
Aq2
—0.01323917
—0.00529574
—0.01345978
0.03199469
МО"9
0.0014081463
0.000105619
0.007640798
—0.006534421
—0.001440546
—0.98 • Ю~10
—0.13 ¦ 1О~9
—0.59 • Ю~10
0.000065400106
0.000065400117
—0.0020185014
-30.863885
Mi
—0.001164594
0.004960303
—0.004349251
0.000553541
-1 • Ю-9
X
—1.2577936
0.0434874
1.0391662
1.4823928
я
s
¦в
>
Pi
§ 64] БИОРТОГОНАЛЬНЫЙ АЛГОРИФМ 407
В силу ортогональных свойств базисных векторов
cik =
(Pic' Pk) (Рк> Рк) E)
Отбрасывая неравные нулю множители, получаем
-Рп-1
F)
ui — ; —.Po-r •¦• +7 ~ -Pn-i
(Ро> Ро) (Рп-ь Pn-v
1/ Ро (h) ~ . |_ Pn-i Оч) ~
vi — ; ^тРо-г •••"+" : = г Pn-v
(Ро, Ро) (Рп-Ь Рп-1)
В качестве иллюстрации решим полную проблему собственных
значений для матрицы Леверье. Вычисление двойственных базисов
и коэффициентов характеристического полинома дано в табл. VI. 5,
структура которой совпадает со структурой табл. VI. 1 метода мини-
минимальных итераций. Конечно, для контроля кроме выполнения условий
биортогональности целесообразно вычислять теоретически равные
значения (Apit рг) и (р^ А'р^), а также (pit pi) по различным фор-
формулам. Заключительный контроль осуществляется вычислением
п-1
1-0
Из табл. VI.5 видно, что характеристический полином равен
? (t) = pA (t) = /4+ 47.888430*3+ 7Э7.27877*2 +
+ 5349.4556*+12296.551.
Таким образом, значения для коэффициентов характеристического
полинома, найденные по биортогональному алгорифму, почти совпа-
совпадают с соответствующими значениями, найденными по эскалаторному
методу (см. § 48). Имеем далее
Х1==— 17.863262; Х2 = — 17.152427; Х3 = —7.574044;
Х4 = — 5.298698.
Для вычисления собственных векторов предварительно вычисляем
множители разложения в табл. VI. 6, которая не требует пояснения.
Далее вычисляем собственные векторы матриц А и А', нормируя
их в соответствии с нормировкой эскалаторного метода (табл. VI.7
и VI. 8).
408
МЕТОД МИНИМАЛЬНЫХ ИТЕРАЦИЙ
[ГЛ. VI
Таблица V/.6
1
h
Ро 0ч)
h—ao = Pi 0i)
).j — aj
р-г Он)
X; — a.2
Рз 0ч)
h — «з
Pi (h)
Po Оч)Хро, Ро)
Pi0h)XPv Pi)
P2^i)(P^ Pi)
PaO-i)!(Pa. Pa)
Вычисление
1
— 17.863262
1
—10.359641
—4.403603
43.857113
—10.285383
-234.24261
1.484009
0.00000250
—91.8
1
—5.8773660
1.1887052
0.8010094
множителей разложения
2
-17.152427
1
—9.648806
—3.692768
33.868169
—9.574548
—122.30678
2.194844
—0.0000468
80.7
1
—5.4740858
0.9179644
0.4182368
3
—7.574044
1
—0.070423
5.885615
—2.177116
0.003835
1.465722
11.773227
0.000125
—224
1
—0.03995329
—0.05900865
—0.00501214
4
—5.298698
1
2.204923
8.160961
16.231657
2.279181
—9.157839
14.048573
0.0000109
338
1
1.2509255
0.4399436
0.0313159
Таблица VI. 7
Собственные векторы матрицы А
—0.019873
0.169806
—0.187214
0.808482
и*
0.032933
—0.261308
0.236639
0.586694
и3
—0.351235
0.328468
0.260923
0.045007
1.135218
0.112182
0.070589
0.011058
Сравнение с данными эскалаторного метода показывает хорошее
совпадение.
Биортогональный алгорифм не усложняется, если собственные
значения матрицы комплексны.
4 3'
Для примера рассмотрим в табл. VI.9 матрицу А =
—3 4
собственные значения которой Xj = 4-f-3/, ^ = 4 — 3/.
§ 64]
Vi
—0.014059
0.780381
—1.140762
0.808484
БИОРТОГОНАЛЬНЫЙ
Собственные векторы
V*
0.023297
-1.200904
1.441927
0.586694
АЛГОРИФМ
матрицы А'
v3
—0.248476
1.509558
1.589924
0.045006
Таблица
v4
0.803091
0.515562
0.430126
0.011058
409
VI. 8
Таблица VI. 9
Вычисление двойственной пары базисов и коэффициентов
характеристического полинома
1
II
III
IV
V
Ро
1
1
—18
1
Ро
1
0
Ар0
7
1
8
7
А'Ро
4
3
7
7
А
0
—6
0
—18
1
1
—7
А
—3
3
0
—18
— 18
Ар,
—18
—24
— 42
-13
A'Pi
01
-18
— 18
Pi
0
0
?2
0
0
1
—8
25
На основании табл. VI. 9 заключаем, что p2(t) = t2 — 8^—j— 25,
откуда Xj^-4+31, Xa = 4-— 3i. Коэффициенты разложения для Ul
— 3 + 3; _. , — 3 — Зг
и U2 будут 1, —_ |8 и 1,
. Отсюда
Будем теперь считать, что среди собственных значений матрицы А
(следовательно, и А') есть равные. Соответствующие элементарные
410 МЕТОД МИНИМАЛЬНЫХ ИТЕРАЦИЙ [ГЛ. VI
делители должны быть взаимно просты, ибо в противном случае
минимальный полином матрицы А (и А') не совпадал бы с характери-
характеристическим и это привело бы к вырождению биортогонального алго-
алгорифма не позже, чем на пг-и шаге (где т — степень минимального
полинома), что противоречит предположению о невырожденном тече-
течении алгорифма. Биортогональный алгорифм позволяет определить
весь канонический базис пространства. Именно, пусть \, ..., Xg —
различные собственные значения матрицы с кратностями пи п2, . . ., ns,
пх~\- ... -\-ns = n. Тогда в канонической форме Жордана будет
s ящиков с порядками nl ns. Каждому ящику соответствует
канонический базис ?/<°) ?/("<" *) при /=1, 2 s, причем
Вектор Ui = UP есть собственный вектор, принадлежащий собствен-
собственному значению \.
Проведем биортогональный алгорифм. Ясно, что последний поли-
полином pn(t), полученный по ходу биортогонального алгорифма, будет
характеристическим полиномом матрицы А (и А'). Собственные век-
векторы матрицы А (и А') также будут определяться по прежним
формулам F), которые, однако, требуют обоснования. Легче всего
доказать их справедливость непосредственной проверкой. Пусть
п Ра 0ч) „ i _i_ Pn-i 0ч) „
i ъPot t.и
(/>о. Ро) (Pn-v Pn-i)
В силу соотношения
имеем
AUi=-aM. {Pl _|_ аоРо)+-ai^L Q,
(Ро, Ро) (Л. Pi)
Pn-i Он)
: =—-
(Pn-l. Pn-i)
о „ ч _ Г "о Ро Он) i hPi (х<I „
Р»-1Р»-г) — — =т—h, ^г \Ро
L (Ро, Ро) (Pi. Pi) J
| ГРо(^) i "iPl(k) | РзРг^)!^ ,
UPo. Ро) (Pi. Pi) (Pa. Pi)i Л
_U Г P»-iW | -a»-iPw-t(^I
• ; ~—;"г"; ~—г
L(P»-2, Pn-г) (Pb-i. P«-i) J
§ 64] БИОРТОГОНАЛЬНЫЙ АЛГОРИФМ 411
Но
°оРо Оч) 1_ Pi Pi Оч) gp -\- Pi Q-i) «о -)- \{ — ад n 1 -\
(Po, Po) (A. Pi) (Po- Po) (Po. Po) *(Po. Po) *(Po. Po)
, aiPi (^i) i РгРг (xi) _ ^lPo (^i) 4- aiPi Оч) + P2 (^) __
(A P)
(Po. Po) (A. Pi) (Pa. Pa) (Pi. Pi) (Pi- Pi)
(Pn-2. Ри-г) (Pn-l. Pn-l) (Pn-l- Pn-i)
у Pn-l Q-i)
1 (Pn-l, Pn-l)
Следовательно, ^t/^ = Xjt/j, т. е. t/; действительно есть собственный
вектор, принадлежащий собственному значению Х;.
Точно так же верны формулы
! A=1, 2 s)
у{^Щр0+ ...+^f».1
(Po. Po) (Pn-l. Pn-l)
для собственных векторов матрицы Л'.
Покажем теперь, что векторы
Ui = ^г. Pi —f— • • • -Г; = .Pn-l
(Pi, Pi) (Pn-l, P«-l)
. + ...
)
2!(р„-1. P»-i)
(8)
l
* A4- \)\(Рщ-1. Рщ-l) l Df-l)>(Pn-l. Pn-l) '
являются корневыми векторами, принадлежащими собственному зна-
значению Xj, образующими канонический базис соответствующего под-
подпространства.
Проверим первую из этих формул. Для упрощения выкладки
введем обозначения
d = d ^
1 (Pi, л) "'X (Pn-i. Pn-i)
Имеем
— Ml) Pl
-2 + rfn-lan-l — Mn-l)Pn-
"Г"
412 МЕТОД МИНИМАЛЬНЫХ ИТЕРАЦИЙ [ГЛ. VI
Но
1 ' (Pv Pi) (Ро. Ро) (Ро, Ро) (Ро. Ро)
i (ai-\)^
— =
( )
, = = ^=
(й. Л)(Л, Л) (л, л)
(Л. ЛI Л*;^^ *Л (Pi. л)
ибо p'2{t) = t — ^4-^@- Далее,
ибо Р'г ц)=(t—я2) р; (о—р2+р2 (t).
Аналогично получаем
Наконец,
!+-
(Рп-Ь Pn-l) (Рп-ь Pn-l)
1 Г|-а — X.W (ХЛ + В о' (>. Л] = Pn-iCh)
(Рп-Ь Pn-l) г г П (Pn-h Pn-l)
ибо
так как Х{ есть игкратный корень полинома pn(t), и;>-2. Таким
образом,
1»Р
что и требовалось доказать.
Остальные формулы проверяются аналогично.
В качестве примера рассмотрим матрицу А =
нормальная форма которой состоит из одного канонического ящика,
принадлежащего трехкратному собственному значению Х1=\.
4
—2
— 1
5
2
1
2
1
1
§ 64]
БИОРТОГОНАЛЬНЫЙ АЛГОРИФМ
413
Таблица VI. 10
Вычисление двойственной пары базисов и коэффициентов
характеристического полинома
I
II
III
IV
V
Ро
1
0
0
1
4
—8
1
Ро
1
0
0
АРо
4
—1
1
4
А~Ро
4
о
—2
7
4
Р\
0
2
— 1
0
-8
-13/8
—1/64
1
—4
Pi
0
5
_2
-8
Api
-8
3
1
—4
13
А'~р,
-8
—8
3
-13
13
Pi
0
-1/4
—5/8
0
0
1/8
5/8
1
— 19/8
3/2
Pi
0
1/8
-1/4
0
0
1/8
Арг
0
-1/8
—3/8
-4/8
5/64
А'р2
0
0
-1/8
-1/8
5/64
Рз
0
0
0
1
—3
3
—1
Pa
0
0
0
Согласно табл. VI. 10, p3(t) =
Далее вычисляем
—1, Х1 = Х2 = Х3=1.
= —з
1. 2)'
Л-Л = @. -2, -5/.
414
Аналогично
МЕТОД МИНИМАЛЬНЫХ ИТЕРАЦИЙ
= (\, 2, -1)'
[гл. vi
В качестве второго примера рассмотрим матрицу, каноническая
форма которой состоит из двух ящиков (один из которых первого
порядка), а именно матрицу
~ 13 16 16'
А= —5 —7 —6
_—6 —8 —7_
Ее собственными значениями будут Хл = Х2 = 1, Х3 ——3.
Таблица VI.11
Вычисление двойственной пары базисов и коэффициентов
характеристического полинома
¦
II
III
IV
V
р„
1
0
0
1
13
-176
1
Ро
1
0
0
Ар„
13
—5
g
2
13
Л'Ро
13
16
16
45
13
Pi
0
-5
-6
0
-176
-153/11
32/121
1
-13
Pi
0
16
16
0
-176
-176
Ар,
-176
71
82
23
2448
А'р,
-176
-240
-208
— 624
2448
Рг
0
16/11
-16/11
0
0
— 512/11
-1/11
1
10/11
—53/11
Л
0
— 192/11
160/11
0
0
— 512/П
-512/11
Ар>
0
-16/11
-16/11
— 32/11
512/121
А р3
0
64/11
32/11
96/11
512/121
Ри
0
0
0
1
1
-5
3
Л
0
0
0
Согласно табл. VI.ll, pa(t)~ t3~\-t2 —
Далее вычисляем
32
О, Л« ==^ Кп, ==^- 1 , Лд ~О»
—16
16
§ 64] БИОРТОГОНАЛЬНЫЙ АЛГОРИФМ 415
= @,1,-2)'; ?4P=-(l.—у*—г
2. Вырожденное течение алгорифма. Изучим возможные при-
причины обрыва алгорифма. Допустим, что' алгорифм обрывается на
r-м шагу, так что (pi.Pi) Ф 0, / = 0 г—1 и (pr,pr) = Q. Как
мы видели, системы векторов р0, ..., рг_х и р0, ..., pr-i линейно-
независимы. Ввиду того, что векторы р0, Ар0, .... Аг~1р0 линейно
выражаются через р0, pt, ..., pr-i и обратно, заключаем, что век-
векторы р0, Ар0 Аг~1р0 линейно-независимы. Точно так же ли-
линейно-независимыми будут и векторы р0, А'р0, .... А г~1р0.
Обозначим через Рг подпространство, натянутое на векторы
Ро' Pi> •¦•• Pr-i (или, что то же самое, на векторы р0, Ар0, ...
.... Аг~1р0), через Рг подпространство, натянутое на векторы
р0, рх, . . ., рг_г, через Qr и Qr их ортогональные дополнения.
Тогда ЯгП<Зг = 0 и Рг П Qr — 0. Действительно, из условий
(Pi<Pj) = Q- ПРИ г#/ и (Pt.'pi) Ф 0> следует, что в Рг не суще-
существует ни одного вектора, кроме нулевого, ортогонального ко всем
векторам из Рг, и в Рг не существует ни одного вектора, кроме
нулевого, ортогонального ко всем векторам из Рг.
При обрыве алгорифма на r-м шаге возможны четыре случая.
1. рг—рг — 0 (двусторонний обрыв алгорифма). В этом
случае рг = рг(А)р0 — 0, но в силу линейной независимости векторов
Ро> АРо> •••> ^~ Ро ни при каком полиноме ш(() ниже r-й сте-
степени невозможно ш(А)ро = 0. Следовательно, полином pr(t) есть
минимальный полином, аннулирующий вектор р0. Так же устанавли-
устанавливается, что pr(t) есть минимальный полином, аннулирующий век-
Т0Р Ро (п0 отношению к матрице А').
Подпространство Рг будет инвариантным относительно А под-
подпространством, именно циклическим подпространством, порожден-
порожденным вектором р0. Подпространство Рг будет инвариантным относи-
относительно А'. Соответственно Qr будет инвариантным для A, Qr —
инвариантным для А'. Размерности подпространств Рг и Рг одина-
одинаковы, следовательно сумма размерностей Рг и Qr равна размерности
всего пространства и, так как PrDQr = 0, получаем, что все про-
пространство есть прямая сумма инвариантных (относительно А)
подпространств Рг и Qr. Таким же образом, все пространство
есть прямая сумма инвариантных (относительно А') подпро-
подпространств Рг и Qr.
Итак, в случае двустороннего обрыва алгорифм дает минималь-
минимальный аннулирующий векторы р0 и р0 полином. При этом оказы-
416 МЕТОД МИНИМАЛЬНЫХ ИТЕРАЦИЙ [ГЛ. VI
вается возможным разложение пространства в прямую сумму двух
инвариантных подпространств, из которых одно циклическое.
2. рг = 0, рг Ф О (односторонний обрыв). В этом слу-
случае pr(t) будет минимальным аннулирующим полиномом для р0, но
не будет минимальным аннулирующим полиномом для р0. Подпро-
Подпространство Рг не будет инвариантным для А' и Qr не будет инва-
инвариантным для А. Хотя по-прежнему R = Pr~\-Qr, но это разложение
не является разложением в прямую сумму инвариантных подпро-
подпространств.
Аналогичный результат имеет место в случае
3. рг ФО, Я = 0.
В последнем случае
4. рг Ф 0, рг ф О, но (рг, рг) = 0 (тупиковый обрыв), ал-
алгорифм как бы заходит в тупик, так как в результате проведения
алгорифма мы не получаем ни какого-либо делителя характеристи-
характеристического полинома, ни инвариантного подпространства.
Можно показать, что односторонние и тупиковые обрывы алго-
алгорифма являются исключительными и их можно избежать посредством
надлежащего выбора начальных векторов р0 и р0. Именно, векторыр0
и р0 всегда можно выбрать так, что в результате проведения ал-
алгорифма будет определен минимальный полином матрицы А и кано-
канонический базис циклического подпространства, порожденного на-
начальным вектором.
В случае двустороннего обрыва всегда можно осуществить до-
достройку полученных систем векторов р0, ..., рг_у и р0, .... рг _,
до биортогональных базисов пространства. Достройка делается со-
совершенно аналогично тому, как это делается в методе минимальных
итераций.
§ 65. Метод Л-минимальных итераций
Предположим, что матрица А положительно определена. Тогда,
как мы видели (теорема 11.19), любая система линейно-независимых
векторов может быть подвергнута процессу Л-ортогонализации.
Если процесс Л-ортогонализации провести для системы векторов
q0, Aq0 An~1q0, мы придем к методу Л-минимальных итераций.
Этот метод может быть применен для решения полной проблемы
собственных значений, аналогично описанному выше методу мини-
минимальных итераций. В применении же к решению системы уравнений
с матрицей А метод Л-минимальных итераций оказывается более
удобным.
Действительно, пусть q0 qn_^ полученный в процессе
Л-ортогонализации базис. Если решение системы
AX=F A)
§ 65] МЕТОД Л-МИНИМАЛЬНЫХ ИТЕРАЦИЙ 417
искать в виде
*=2!в#«. B)
1-0
то из уравнения
П-1
2 ajAqt = F
t = 0
получим для коэффициентов. at явные формулы
° C)
Дадим формулы для вычисления обратной матрицы. Условия
^-ортогональности векторов q0 Яп-\ могут быть записаны
в матричной форме
Q'AQ--=A, D)
где Q—матрица со столбцами q0 <7n-i> A=[(#o, Aq0), ...
•••• (Яп-и АЯп-дЪ Из формулы D) непосредственно следует, что
A-1 = QA~iQ'. E)
Легко видеть, что система Л-ортогональных (сопряженных)
векторов строится по трехчленным рекуррентным соотношениям
gi+i = Aqi — -Uqi — biqi_1, q1 = Aq0 — ^q0, ¦ F)
где
Этот процесс построения векторов q± может оборваться только
если некоторый вектор qr окажется нулевым. Как правило, это про-
происходит при г = п. Преждевременный обрыв свидетельствует о ли-
линейной зависимости последовательных итераций q0, Aq0 Arq0,
т. е. о том, что минимальный аннулирующий вектор q0 полином не
совпадает с характеристическим. В силу построения
(8)
где qi(t) полиномы, удовлетворяющие рекуррентным соотношениям
* —To. ft+i@ = C — Tf)?i(O — 8*ft-i@- (9)
Полиномы qi (t) будут, очевидно, удовлетворять соотношениям ор-
ортогональности
ж
f
27 Зак, 974, Д. К, Фаддеев в В. Н. Фаддеева
418
МЕТОД МИНИМАЛЬНЫХ ИТЕРАЦИЙ
[ГЛ. VI
где F (t) весовая функция для полиномов pi {t) в методе минимальных
итераций.
Векторы q0, ..., grn_1 обладают рядом свойств, аналогичных
свойствам векторов р0 , рп_х.
В частности, корни полиномов qo(t), .... <7n-i@. <7п@ веще-
вещественны и разделяются; векторы q0 q%_x составляют А-орто-
гональный базис подпространства Qit натянутого на векторы
q0, Ад0, ..., А%~ q0; среди всех векторов вида Alq0-{-Z, где Z?Qj,
вектор qi имеет наименьшую .Д-длину.
Далее, если процесс протекает без вырождения, то оператор
с матрицей А имеет в базисе q0, .... qn_x трехдиагональную матрицу
Якоби.
"То Зо
1 Ti 8.
Отсюда следует, что
Tn-i K-i
1 In -
t
|Ti=SpA
10)
(П)
Наконец, (Aqt, Aqj) = 0 при \i—j\ > 1.
В случае преждевременного обрыва процесса всегда можно до-
достроить систему Л-ортогональных векторов до базиса всего про-
пространства аналогично тому, как это делалось в методе минимальных
итераций.
Такую достройку нужно производить, если ставится задача об
обращении матрицы или о решении большой серии уравнений с дан-
данной матрицей коэффициентов А, но с различными свободными чле-
членами.
При решении же одной системы достройка оказывается ненужной,
если за начальный вектор q0 взят свободный член системы, так как
при таком выборе начального вектора преждевременный обрыв про-
процесса только сокращает объем вычислений.
Действительно, пусть процесс Л-минимальных итераций обры-
обрывается на r-и шагу. Тогда qr (t) = f-\-dj1"'1-\- .. .-t-cfr_^+fifr есть
минимальный аннулирующий вектор F полином, так что
~1
откуда X=A~1F = -l-[—Ar~1F— .
надлежит подпространству Qr.
. —dr^F\. Поэтому X при-
при§ 65] МЕТОД Л-МИНИМАЛЬНЫХ ИТЕРАЦИЙ 419
Векторы <70, ..., qr_x образуют базис подпространства Qr, так
что решение X представляется в виде
Для коэффициентов а{ сохраняются прежние формулы
С тем же успехом вместо свободного члена F в качестве на-
начального лектора q0 можно взять любую невязку ro = F— АХ0,
где Хо произвольный вектор. Действительно, система АХ= F
равносильна системе А(Х—Х0)~г0, свободным членом которой
является г0. В этом случае решение системы получается в форме
i=0
где
Если матрица А симметрична, но не положительно-определенна,
то построение векторов qi также возможно. Однако в этом случае
может произойти „тупиковое" окончание процесса, в котором на
некотором шагу может обратиться в нуль скалярное произведе-
произведение (Aqi, qi), хотя q-x Ф 0. Так же как в биортогональном алгорифме
тупиковое окончание связано с неудачным выбором начального век-
вектора и может быть устранено его заменой.
Рассмотрим примеры на решение системы и обращение матрицы.
Отметим, что вычислительная схема для построения векторов q0, ...
. . ., qn-\ почти ничем не отличается от вычислительной схемы ме-
метода минимальных итераций. Хорошим заключительным контролем
при невырожденном течении процесса является выполнение нера-
неравенства A1)
Я-1
В табл. VI, 12 приведено решение системы (9) § 23.
Части I—IV табл. VI. 12 аналогичны соответствующим частям
табл. VI. 1. В части V выписываются (F, q^ и коэффициенты а^
Полученное решение (ер. § 23) верно с точностью до 2 ¦ Ю~7
в каждой компоненте.
27
*
Решение линейной системы методом Л-минимальных итераций
ю
о
I
и
III
IV
V
Яо
1
1
1
1
9.2
2.318
0.008220348
0.24
0.26086957
2.62
2.18
2.08
2.32
9.20
21.3256
Ч\
0.302
—0.138
-0.238
0.002
0
0.075627200
0.56838288
0.04404472
—0.1432
-1.8934986
Адх
0.11684
—0.08644
—0.11864
0.08824
0
0.042985206
Яч
—0.06303198
—0.01622351
0.00841478
0.07888289
. 0.78- 10~8
0.38 • 10~9
0.0033309791
0.0033309789
0.42274246
0.049863598
14.969652
Aq2
—0.01323917
—0.00529574
—0.01345978
0.03199469
МО"»
0.0014081463
Яз
0.000105619
0.007640798
—0.006534421
—0.001440546
—0.98 • Ю~10
—0.13-Ю"9
—0.59 • 10~10
0.000065400106
0.000065400117
—0.0020185014
—30.863885
Mi
—0.001164594
0.004960303
—0.004349251
0.000553541
-1 • Ю-9
X
—1.2577936
0.0434874
1.0391662
1.4823928
я
S
О"
X
S
¦в
>
S
3
§ 65] МЕТОД Л-МИНИМАЛЬНЫХ ИТЕРАЦИЙ 421
Вычислим также обратную матрицу для матрицы А. Целесооб-
Целесообразно предварительно вычислить матрицу Q = QA с элементами
qij
где qij — есть J-я компонента вектора qt. Имеем
(A9t. «О
0.10869565 3.9932723 —18.922959 1.6149668"
0.10869565 —1.8247403 —4.8704929 116.83158
0.10869565 —3.1470159 2.5262182 —99.914532
0.10869565 0.0264455 23.681593 —22.026662.
Тогда A~1 = QQ', согласно формуле E). Вычисляя, получим, что
" 2.507586 —0.123039 —1.011489 —1.378342"
—0.123039 1.322213 —0.261427 —0.447454
— 1.011489 —0.261427 1.531827 0.445608
_—1.378342 —0.447454 0.445608 2.008551 _
Расхождение с данными § 23 наблюдается лишь в трех элементах,
причем в каждом элементе не превосходит 1 • 10~6
В случае нормального течения алгорифма все собственные зна-
значения матрицы находятся как корни полинома qn(t). Для собственных
векторов справедлива формула
В случае обрыва алгорифма (не тупикового) последний полином даст
минимальный аннулирующий q0 полином, а собственные векторы,
найденные по формуле
<7п 0*) <7„ < (\Л
образуют базис из собственных векторов подпространства Qr. Про-
Процессом достройки можно определить все собственные значения
и полную систему собственных векторов.
Определим коэффициенты характеристического полинома и один
из собственных векторов рассмотренной выше матрицы. Приводим
вычисления, проведенные на основе таблицы VI.12.
Прежде всего
(Aq3, Aq3) = 0.000045183277
13 = 0.69087467
S3 = 0.01963390,
422 МЕТОД МИНИМАЛЬНЫХ ИТЕРАЦИЙ [ГЛ. VI
Далее, вычисляем рекуррентно коэффициенты характеристического
полинома:
1
1 —4.00000001
1 —3.30912534 4.75200003'
1 —2.88638288 2.48544305 —2.11185600
1 —2.318 1.30929117 —0.45139731 0.28615248
Таким образом,
ср (/) = qx (t) = t* — 4.00000001Я + 4.75200003^ — 2.111856000; +
+ 0.28615248.
Один из корней этого полинома есть Х3 — 0.63828371, Опреде-
Определим собственный вектор, принадлежащий этому собственному зна-
значению. Предварительно вычислим коэффициенты разложения по схеме:
Х3 0.63828371
Яо О-з) 1
:Х3 — fo —1.6797163
Х3—Tl 0.06990083
<72(X,j) —0.12563391
Х3 —Тз 0.21554125
q3(l3) 0.046903344
Х3 —Тз —0.05259096
Ч*0-зУ —0.8263-10"8
9^(Х3) 0.106
i/(9o, Яо) 0.10869565
Ях (>-з)/(?1. Яд —22.210478
q2) —37.716811
<7,) 717.17535.
Теперь собственный вектор находится по формуле A2). Именно,
(У3 = (—4.145756, 9.265433, 0.391085, —3.944060)' =
= 9.265433 (—0.447443, 1.000000, 0.042209, —0.425675/.
Наибольшее расхождение с данными § 63 не превосходит 1 • 10~8.
Если матрица системы AX=F не симметрична, то решение си-
системы уравнений все же возможно найти посредством метода Л-ми-
нимальных итераций, который нужно применять к равносильной си-
системе, полученной первой или второй трансформацией Гаусса.
В обоих случаях расчетные формулы можно преобразовать так,
чтобы избежать действительного вычисления соответствующих матриц
А'А или АА'.
§ 6Г] метод л-минимальных итераций 423
При первой трансформации имеем
(Myt ЛЛ^) (A'vt,
'* (ЛМ^ ft)
(Vt,
n—1
\'Aqit ft) ""
i=o i=.o
Описанный метод будем называть методом Л'Л-минимальных итераций.
Для контроля можно использовать попарную ортогональность
векторов v. Действительно,
(vit Vj) = (Aqi, Aqj) = (A'Aqt, ty) =
Отметим, что
Q', A4)
где матрицы V и Q составлены из столбцов v0, vv .... vn_t и q0,
qi ?n_i соответственно, Л = [(г>0, vQ) (Vn_v г>п_1)].
Аналогично вторая трансформация Гаусса приводит к методу
АА'-и инимальных итераций.
Расчетные формулы метода
Щ = A'qi
Qi + i = Awt
_ (Awu
*l (W{,
*
n—1 n—1
X=A' 2a^= 2
i~0 i=0
д =
1
(щ, т)'
Легко видеть, что (wi, wi) = 0.
В табл. VI. 13 и VI. 14 приведено решение системы (по данным
табл. II. 1) методами А'А и ЛЛ'-минимальных итераций. Во второй
части таблиц проверяется выполнение контрольных соотношений
ортогональности.
Таблица VI. 13
1 «
I
II
III
IV
1
1
1
1
2.9279073
0.057281636
V | 0.34056725
»o
1.46
1.82
0.50
2.34
6.12
11.1696
3.804
Решение системы уравнений методом А
A'v0
3.5474
3.2494
2.1963
2.1760
11.1696
32.703553
Чг
0.6194927
0.3214927
-0.7311073
—0.7519073
0.43451405
0.015893004
—0.40132318
0.45089331
0.36342271
— 0.13031765
— 0.53614308
—2-10~8
A'vl
0.34115826
0.16392188
- 0.19255928
— 0.31252088
—2-10~8
0.6398129б| 0.27800772
— 0.25677177
0.01469831
— 0.03305285
0.06783548
— 0.04308823
2.8355666
4 4.4707328.
Л-минимальных итераций
—0.03114716
0.03309338
0.08653546
-0.02479610
—0.2-10"8
-5-10-8
0.010168550
0-04546087
A'v2
-0.03875003
0.04742345
0.10756822
-0.11624169
0.028833601
- 0.09027375
0.13603752
-0.07316431
0.01788792
— 3.1374083
V,,
-0.03919682
0.03886464
—0.02885813
0.00039434
0.2-10""8
1-10~8
-2-10""8
0.0038797981
—0.012172511
х
0.4408884
—0.3630309
1.1667982
0.3935674
Таблица VI. 14
I
II
III
IV
V
1
0' ¦
0
—1
0.76850226
0.82150909
-0.6
да0
0.45
-0.26
— 0.61
— 0.46
-0.88
0.8538
— 0.70274069
Решение системы уравнений методом АА
Aw a
0.3099
-0.3100
—0.4101
—0.5439
-0.9541
0.65614723
-0.45860226
-0.31000000
— 0.41010000
0.22460226
2.5968518
0.026084155
— 0.37750864
да,
— 0.43566002
— 0.43491841
— 0.42229262
0.37963104
—0.26-10~8
0.70140446
Л да,
— 0.19902223
— 1.04409661
— 0.80751843
-0.19902223
— 2.24965950
1.8214434
— 0.53821819J
Яг
0.17039078
— 0.23907255
0.25745049
0.03922808
0.16506397
0.14710157
-минимальных итераций
¦Юз
0.05128257
— 0.10313037
0.06879630
0.01722895
— 0.73-10""8
0.55-10~8
Aw.2
0.025854965
—0,038447305
0.014310165
0.025854972
0.027572797
0.018295543| 0.0030199349
8.0402954
Чг
0.009691839
0.009101047
-0.017488523
0.013521269
0.0073852512
да3
0.023329767
0.010441822
—0.008946124
0.028784034
0.143-10~8
0.753-10~8
-0.105-10-9
0.0015618634
4.7284873
X
0.4408884
—0.3630310
1.1667983
0.3935672
§ 66] Л-БИОРТОГОНАЛЬНЫЙ АЛГОРИФМ 425
§ 66. Л-биортогональный алгорифм
Наряду с описанными выше приемами симметризации для решения
систем с несимметричной матрицей можно использовать видоизмене-
видоизменение биортогонального алгорифма — Л-биортогональный алгорифм.
Сущность его заключается в построении двух систем векторов
Яо> ¦•- Яп-\ и <7о Чп-х таких, что (Aqit qj) — O при i+j и
(Aqt, qi) ф О (двойственная пара сопряженных базисов).
Системы векторов строятся по рекуррентным соотношениям
Яо — То<7о Чх = А'Чо ЧоЯо
S А' s
где
^{Адь А'д,)
После построения двойственной пары сопряженных базисов реше-
решение линейной системы вычисляется по формуле
'1Р'«2 q, C)
Мы не будем вдаваться в исследование возможных вырождений
процесса, так как это было бы почти дословным повторением п. 2
§ 64. Отметим только, что одностороннего и тупикового окончания
процесса можно избежать за счет перехода к другой системе началь-
начальных векторов.
Л-биортогональный алгорифм дает возможность решить полную
проблему собственных значений. Так, при нормальном течении алго-
алгорифма, полином qn(t) в последовательности полиномов, построенных
по формулам
qi+l(f) = tqi(f)—Uqi{t) — biqi_l{f), 9l@ = f — To. D)
есть характеристический полином. Найдя его корни, соответствую-
соответствующие собственные векторы можно построить по формулам
Ui ~ м«- 7.)qo + ''' + q E)
Канонический базис, в случае, если матрица А не приводится
к диагональной форме, находится по формулам, аналогичным форму-
формулам биортогонального алгорифма.
В табл. VI. 15 приведено решение системы с данными табл. II. \
по Л-биортогональному алгорифму.
Таблица VI. 15
0
I
II
III
IV
V
I
II
III
IV
V
<7o
0
1
0
0
1.35
1.1406667
— 0.39350637
1.2
0.88888889
ft
0.02186708
0.65215750
-0.58979130
— 0.09119504
0.452-10~7
-0.284-10""8
-0.08626526
1.7391620
—0.O4935660
0.57214921
Решение системы линейных уравнений Л-биортогональным алгорифмом
0
1
1
0
1.35
— 0.75231677
0.06236619
— 0.24584873
0.3524S939
0.213- Id —7
— 0.128-10~7
— 0.08626526
Ая„
0.17
1.00
0.35
0.43
A'Z
0.36
1.35
1.67
-1.06
1.95 | 2.32
1.5399
Aq-t
0.23093636
0.29645727
-0.29645722
— 0.01106529
0.21987112
— 0.15002936
А'»7
— 0.50208664
0.00000002
0.11091559
0.10821921
— 0.28295182
0.17
— 0.1406667
0.35
0.43
— 0.45-10-7
— 0.53123360
1.5818799
0.16238668
— 0.3708С004
0.69799809
0.16530023
— 0.81490787
0.67245006
0.07771139
— 0.149-10—7
— 0.284-10~7
0.70Ы0-8
0.09097897
•
0.17046432
1.8736671
7,
0.36
0.2093333
0.5293333
— 1.06
— 0.45-10~7
— 0.53123360
Z
0.77785489
— 0.14245783
0.45252968
— 0.33270445
— 0.242-10~7
— 0.734-10"8
0.706-10~8
0.09097898
Aq,
0.29078666
0.03613330
—0.03613334
0.58901332
0.87979994
— 0.84034775
Aqa
— 0.09938247
— 0.31154287
0.31154285
0.06029815
— 0.03908434
А-г
— 0.18284001
— 0.00000004
0.19798661
—1.3242933
— 1.3091467
X
0.4408885
— 0.3630309
1.1667983
0.3935673
§ 67] двучленные формулы 427
§ 67. Двучленные формулы метода минимальных итераций
to биортогонального алгорифма
Системы векторов р0 Рп~х и <7о Яп-i тесно связаны
друг с другом, и их одновременное вычисление может быть осуще-
осуществлено по формулам более простым, чем трехчленные формулы,
определяющие каждую из этих систем в отдельности. Именно, спра-
справедлива следующая
Теорема 67.1. Если А — положительно-определенная мат-
матрица, векторы X, АХ, ..., Ап~1Х линейно-независимы, векторы
р0, . . ., рп_х получены из них процессом ортогонализации, а век-
векторы <70 <7n-i процессом А-ортогонализации, то между век-
векторами построенных систем имеются следующие двучленные
соотношения
1i+l=Pi + l—ai+l<7i' С1)
где
__ (Pi, Mi) __ (qi, Mi)
Pi (Pi, Pi) (Pi, Pi)
(Pi + h Pi+l) (Pi+\, Pi + l)
~ (Pi,Aqi) — (q
Доказательство. Равенство ?>о —<7о непосредственно следует из
построения. Обозначим через Р% подпространство, натянутое на век-
векторы X, АХ, ..., AiX, через Я{ множество векторов AlX-\-Y, где
Y^Pi_v Векторы р0 р{, так же как и векторы q0 qt
образуют базисы подпространства Рг, причем рг ^ Р^, qi ? Pj. Далее,
если Z ? Рь то AZ ^ Pi+l, в частности, Арг ^ Pi+1 и Aq^ ^ Pi+V Рассмот-
Рассмотрим вектор pi+1 — Aqsl. Вектор Aq{ ортогонален к векторам <70, ..., q%-x
и, следовательно, ко всем векторам подпространства Я{_1Р в частно-
частности, к векторам р0, ...,pi_1. Вектор pi+1 тоже ортогонален
к р0 Pi-v Следовательно, и вектор pi+1 — Aqt ортогонален
к р0, ..., Pi_v С другой стороны, вектор pi+l — Aqb, как разность
двух векторов из множества Pi+1, принадлежит подпространству Pv
Поэтому pi+1—j4<7j = — piPt, где pi некоторое число. Ясно, что
ибо
(Pi+i — Mi, Pi) __ (Aq{, pt)
Vl (Pi. Pi) (Pi, Pi)
428 МЕТОД МИНИМАЛЬНЫХ ИТЕРАЦИЙ [ГЛ. VI
Теперь рассмотрим вектор qi+l—Pi+f Этот вектор-принадлежит
подпространству Р^. Далее, вектор pi+1 ортогонален ко всем векто-
векторам подпространства Р{, в частности, к векторам Aq0, ..., Aqt_lt
так что вектор pi+i Л-ортогонален к векторам qQ qi-i- Век-
Вектор же qi+l Л-ортогонален к векторам q0, ..., ^_t по построению.
Следовательно, вектор qi+1—pi+l тоже Л-ортогонален к векторам
qQ qi-v Поэтому qi+1—/?i+1 = — ai+iq'it где ai+1 некоторое
число. Очевидно, что
— Pi+i, Mi) _ (Ачь
i + l (Aqitqt)
Ho Aqi—pi^Pi, qt—Pi^Pi-v так что (pi+1, Aqi) = (pi+V pi+l),
Aqi, Pi). Следовательно,
_ (Pi+Ь Pi + l) _ (Pi + i' Pi + l) . _ (?»¦ Mi)
{gi,Aq() (pt,Aqi) ' Pi (рь Pi) #
Теорема доказана.
Замечание 1. Если А симметричная, но не положительно-опре-
положительно-определенная матрица, то теорема остается верной при условии, что про-
процесс Л-ортогонализации не имеет тупикового окончания.
Замечание 2. Полиномы рг(г) и q^t) также связаны, очевидно,
двучленными соотношениями
Pi+i(t) = tq% (t) — PiPi (t)
Qi+\ if) =Pi+\ it) — °i+1qi СО-
Легко устанавливаются связи между коэффициентами двучленных
формул pf и а( и коэффициентами трехчленных формул щ и ^ или
Yi и 8j. Именно,
{Ц = р, + О< (/=1. 2 Л— 1) D)
Bj^p^jOj (/= 1, 2 n—l)
Ti = P»4-°i+i (/ = 0, 1 n—l)
E)
li^PiOi A=1, 2 n—l). K '
Действительно, в силу двучленных соотношений A), имеем
. F)
Исключая из этих соотношений Aqt и Aqi_v получим
xA-i) — PiPi =
§ 67] двучленные формулы 429
Отсюда, в силу линейной независимости векторов рг и /7i_1, получим
Аналогично, исключая pi+1 и рг из соотношений
получим
откуда
Выведенные соотношения между коэффициентами показывают,
в частности, что
И-1 И-1
Двучленные формулы существуют и для одновременного построе-
построения биортогональных и Л-биортогональных систем, в случае, если
оба процесса не вырожденные. Именно, если
А» = Яо Ро = <7о>
то
где
_ (pit
(Pi, Pi) (Pi' Pi)
„ __ (Pi+ь Pi+i) (Pi+u 'Pi+i)
(Pi, A'qt) (pb Aqt)
Соотношения D) и E) по-прежнему сохраняются. Доказательство
принципиально ничем не отличается от доказательства, проведенного
выше.
430
МЕТОД МИНИМАЛЬНЫХ ИТЕРАЦИЙ
[ГЛ. VI
Одновременное вычисление биортого
I
11
III
IV
V
I
II
III
IV
V
Ро
0
1
0
0
1
7.503621
1
Pi
8.6346552
16.298936
—16.298936
3.7527932
0
0.07 • 10~в
36.894859
—5.9951147
1
20.963280
99.233549
Ро
0
1
1
0
2.6926058
0
—1.0979091
-1.1323868
0
0.07-10~6
36.894860
36.894860
Чо
0
1
0
0
—0.23490436
1
Яг
11.594561
9.852133
—9.480335
4.179904
2.12 -10~6
—1.24-10
1.3221017
1
22.546044
111.48181
Яо
0
1
1
0
?2
3.2259404
0.3717982
—0.3385964
—0.6764826
0.31 -10~6
0.66 • 10~6
Мо
1.870086
—11.811654
4.308033
0.269851
—5.363684
—7.503621
-7.503621
Aq%
—49.43280
-166.93761
166.93761
-84.06708
—133.49987
—221.18891
—221.18892
А'Яо
0.336964
-7.503621
—7.258787
0.288043
—14.137401
—7.503621
-7.503621
-17.688366
0
6.934482
11.876143
1.122259
§67]
нальных и Л-биортогональных систем
ДВУЧЛЕННЫЕ ФОРМУЛЫ
431
Таблица VI. 16
Р\
1.870086
—4.308033
4.308033
0.269851
0
1.7626333
—13.224755
1
7.503621
Рз
2.332948
—69.223619
69.223619
—61.568654
0
-4.78- 10-в
—0.84-10
—292.43424
—20.669372
1
28.541159
237.15908
594.91651
А
0.336964
0
0.244834
0.288043
0
1.7626333
1.7626333
Рз
—1.5458854
0
0.3523910
5.0873542
0
1.03-Ю"8
2.48 • 10~6
—292.43426
-292.43424
Я\
1.8700860
—4.0731286
4.3080330
0.2698510
—0.29-Ю
— 1.5827643
1
7.738525
Чъ
-12.996241
—82.249141
81.757586
—67.094912
-5.86 • 10~6
61.46 -КГ8
6.43-10~6
1
27.219057
207.35092
447.52622
0.33696400
0.23490436
0.47973836
0.28804300
0.01 • 10~6
Ъ
—5.8109067
—0.4915550
0.8000499
5.9817370
0.32-10
11.03- Ю"8
2.86- 10~8
Agi
—16.096774
73.271617
—73.271617
0.18407987
—15.9126943
—23.310394
—23.310394
-48.220650
1430.8088
—1430.8088
1272.5854
6044.4321
6044.4321
—1.7636605
0.00000001
—4.3357788
—4.9416849
—11.0411242
—23.310394
—23.310394
Pi
—0.00008
0.00006
—0.00006
—0.00001
1
. 47.888429
797.27875
5349.4555
12296.551
Таблица VI. 17 ?
Одновременное вычисление ортогонального и Л-ортогонального базисов ю
1
11
III
IV
V
А>
1
1
1
]
4
2.3
1
1
1
1
1
9.2
0.018
1
2.62
2.18
2.08
2.32
9.20
Pi
0.32
—0.12
-0.22
0.02
0
0.1656
0.15668599
1
-2.3
1i
0.302
—.0.138
—0.238
0.002
0
0.0756272
0.0756272
0. Ill69690
1
— 2.318
Ад,
0.11684
—0.08644
—0.11864
0.08824
0
Рг
— 0.02929952
— 0.03163768
— 0.01816908
0.07910628
0
— 0.16-10"8
0.0084473237
0.3943235*
1
— 2.77468599
1.05037778
— 0.06303198
— 0.01622351
0.00841478
0.07888289
0.78-10~8
0.38.10~9
0.0033309790
0.0033309791
0.02841890
1
-2.88638289
1.30929119
1
Адп
— 0.01323917
— 0.00529574
— 0.01345978
0.03199469
0.1-10~8
—0.001685678
0.007179744
—0.006295283
0.000801218
0.1 .10~81
0.38-10~9
-0.1Ы0"0
0.000094662773
0.69087470
1
— 3.28070648
2.40341533
— 0.41418874
<7з
0.000105622
0.007640798
—0.006534422
—0.001440547
0.25-10~8
0.25-10"9
0.64. Ю-12
0.000065400114
0.000065400112
1
—3.90912538
2.48544316
-0.45139736
Aq3
—0.001164592
0.С04960304
-0.004349251
0.000553542
0.2.10-8
Pi
0.28.10-9
0.52.10-9
0.75.10-9
0.75.10-9
1
— 4.00000008
4.75200027
-2.Ш85621
0.28615252
§ 68] МЕТОДЫ СОПРЯЖЕННЫХ НАПРАВЛЕНИЙ И ИХ ОБЩИЕ СВОЙСТВА 433
В табл. VI. 16 приведено одновременное вычисление биортого-
нального и Л-биортогонального базисов для матрицы Леверье,
в табл. VI. 17 приведено одновременное вычисление ортогонального
и Л-ортогонального базисов для матрицы D) § 51.
§ 68. Методы сопряженных направлений
и их общие свойства
Методами сопряженных направлений для решения систем линей-
линейных уравнений
AX=F A)
называются методы, в которых решение X представляется в виде
линейной комбинации векторов, ортогональных в некоторой метрике,
так или иначе связанной с матрицей системы. Термин „сопряженные
направления" происходит от того, что направления векторов, орто-
ортогональных в некоторой метрике R сопряжены по отношению к по-
поверхности второго порядка
(RX, X) = const. B)
Метод Л-минимальных итераций, также как и методы А'А и
ДЛ'-минимальных итераций являются методами сопряженных напра-
направлений.
Каждый отдельный метод характеризуется выбором метрики и
выбором исходной системы векторов, подвергающейся ортогонали-
зации. При построении системы /^-ортогональных векторов часто
используются формулы теоремы 11.20.
Методы сопряженных направлений укладываются в следующую
общую схему.
Пусть R—CAB— положительно-определенная матрица. Пусть,
далее, построена система /^-ортогональных векторов Sj sn (век-
(векторов /^-сопряженных направлений). Ищем решение системы в виде
п
Х = Х0 + В'% aiSi. C)
г = 1
Здесь Хо — начальное приближение, выбираемое, вообще говоря,
произвольно. Обычно берется А = 0.
Подстановка C) в систему дает
Умножая последнее равенство на С, получим
п
R 2 OiSi = Сг0,
4
434 МЕТОД МИНИМАЛЬНЫХ ИТЕРАЦИЙ [ГЛ. VI
D)
откуда коэффициенты я,- легко определяются. Именно,
(Сг0, «<)
Решение C) можно представить также в виде
4=1
Векторы Bs^ #sn, в свою очередь, ортогональны в метрике,'
определяемой матрицей R.t — B'~ RB'1, которая, очевидно, положи-
положительно определена. Действительно,
(R.Bs,, BSj) = (B'R.Bsi, sj) = (Rsh Sj) = 0 (t Ф j).
В известных частных методах сопряженных направлений или R — А
(А положительно-определенная), или R—A'A, или R=AA'. В первых
двух случаях В = Е и системы векторов sx sn и Bst Bsn
совпадают. В последнем случае Rx = E и построение системы
Bsx Bsn осуществляется проще, чем построение системы s^ .... sn.
При этом оказывается возможным исключить векторы st sn из
формул для решения системы.
Решение в форме C) можно представить как последний член по-
последовательности векторов Хо, Xv . . ., Хп, где
а векторы Хо, Хх Хп рассматривать как последователь-
последовательные приближения к решению. При этом последовательные не-
невязки r0, rlt ... будут связаны друг с другом по формуле
' = ^-1 — ctiABsi. F)
Действительно,
г* = F — АХ{ = F —
При построении /-го приближения Xt нет необходимости знать всю
систему сопряженных направлений, так как оно определяется лишь
первыми / векторами системы. Поэтому свойства последовательных
приближений Хо, ..., Xt не будут зависеть от того, каким образом
система векторов Bsx Bst (или sv ..., Sj) будет продолжена
до полной. Построенная система приближений будет обладать сле-
следующими экстремальными свойствами.
Теорема 68.1. Среди всех векторов вида Z=X0-\-V, где V при-
принадлежит подпространству, натянутому на векторы Bsv ..., Bsi,
вектор Xf наименее по R^dAune отличается от точного реше-
решения. Иначе говоря, обобщенная функция ошибок /в,(^):=
= (R1(X—Z), X—Z) будет принимать наименьшее значение при
X
§ 68] МЕТОДЫ СОПРЯЖЕННЫХ НАПРАВЛЕНИЙ И ИХ ОБЩИЕ СВОЙСТВА 435
i
Доказательство. Пусть Z=A + 2 "ij^sj- Тогда
1=1
/в, (Z) = (Лг (A"— Z), A1— Z) =
/In i \ n'< i
= Ui ( 2 «^ - 2 Т;% .) , 2 ^ - 2 TiB
причем равенство достигается при у;- = о^. Тем самым минимум
fn^Z) достигается при Z = Xs = Хп -4- ^j CLjBsj.
3=1
Теорема 68.2. Обобщенная функция ошибок убывает при воз-
возрастании индекса I.
Справедливость теоремы непосредственно вытекает из теоремы 68.1.
Легко также проверить ее непосредственно вычислением. Именно,
Отметим еще следующие свойства последовательных невязок г0,
г, Г; и векторов sv . . ., s,-.
Теорема 68.3. Справедливы равенства
(Cri,Sj) = 0 (y=l О
• (Crt. sj) = (Cr0, Sj) (i=\ у— 1). { }
Доказательство. Имеем
n
ri = F — AXi = A(X—Xi) = У \СГ()'г8,к\ ABsk.
Следовательно,
r„ _ V (Cr0, sk)
Отсюда (Cri, Sj) = 0, если y<t-f-l- Далее,
(On, Sj
>4
(^j, 4> ^} ^ (Сг°-Sj)'
если y^.f-f-1. Тем самым теорема доказана.
Методы сопряженных направлений обладают следующим неприят-
неприятным свойством. В случае, если система векторов, подвергающихся
процессу обобщенной ортогонализации, далека от ортогональной по
436 МЕТОД МИНИМАЛЬНЫХ ИТЕРАЦИЙ (ГЛ. VI
отношению к выбранной метрике, то при проведении процесса орто-
гонализации может произойти значительная потеря точности. Поло-
Положение может быть исправлено „доортогонализацией" полученной си-
системы, т. е. по сути дела построением новой ортогональной системы,
исходя из уже построенной.
Эта доортогонализация должна быть проведена по общим фор-
формулам обобщенной ортогонализации, что требует вычисления неко-
некоторых малых поправочных коэффициентов из треугольной системы
с сильно преобладающей главной диагональю.
Искомое решение системы затем должно быть найдено по фор-
формулам C) и D) (или E) и F)), примененным к вновь построенной
системе векторов.
В случае, если А положительно-определенная матрица, можно при-
принять R = A, B = C = E. В этом случае процесс решения системы
AX=F имеет простой геометрический смысл.
Рассмотрим л-мерное точечное пространство, в котором выбрана
декартова система координат. Каждой точке пространства сопоставим
вектор, исходящий из начала координат в эту точку. Точку и соот-
соответствующий ей вектор будем отождествлять в том смысле, что
говоря о результате каких-либо действий над точками мы будем
понимать одноименные действия над соответствующими им векторами.
Рассмотрим поверхность, заданную векторным уравнением
f(X) = (А (X— X*), X— X*) = с.
(Здесь X* точное решение системы). Ясно,- что эта поверхность при
с > 0 есть эллипсоид Wn с центром в точке X*. При различных
значениях с уравнение определяет подобные эллипсоиды с общим
центром.
Прямые Sl3 S2, .. ., Sn, проходящие через центр эллипсоида
в направлениях Л-ортогональных векторов sv s2, • ¦ ¦, sn, образуют
систему сопряженных диаметров эллипсоида /(Л) = с.
Пусть Хо начальное приближение. Возьмем c>f(X0). В этом
предположении точка Хо будет находиться внутри эллипсоида/ (X) = с.
Проведем через точку Хо прямую Pv параллельную Sv затем пло-
плоскость Р2, параллельную St и S2, трехмерную плоскость Р3, парал-
параллельную Sv S2, S3 и т. д. Прямая Р1 пересечется с телом f(X)^c
эллипсоида f(X)==c по отрезку Wu плоскость Р2 по плоскому
эллипсу W2, трехмерная плоскость Р3 по трехмерному эллипсоиду W3
и т. д. Обозначим через Xt середину отрезка Wv через Х2 центр
эллипса W2, через Х3 центр эллипсоида W3 и т. д. Последней точ-
точкой Хп этого ряда будет центр всего и-мерного эллипсоида Wn,
т. е. решение X* системы AX=F.
Геометрически ясно, что из всех векторов, исходящих из центра
эллипсоида Wn и опирающихся на ^-мерную плоскость Рк, наимень-
наименьшую Л-длину имеет вектор Хп — X'', направленный в центр Хк эллип-
§69]
НЕКОТОРЫЕ МЕТОДЫ СОПРЯЖЕННЫХ НАПРАВЛЕНИЙ
437
соида Wk. Но как раз этим же экстремальным свойством обладает
k-t приближение в методе сопряженных направлений. Поэтому центры
Xt, Х2, ..., Хп представляют собой не что иное, как последова-
последовательные приближения в методе сопряженных направлений. Сам про-
процесс последовательного построения точек Хо, Xlt .. ., Хп может
быть описан следующим образом. Через Хо проводится хорда Wt
эллипсоида Wn, параллельная диаметру Sv Середина этой хорды
есть Xv Через Хх проводится хорда W2, параллельная S2. Эта хорда
будет в эллипсе W2 диаметром, сопряженным с хордой Wv Ее сере-
середина будет центром эллипса W2, т. е. точкой Х2. Далее, через Х2
Рис. 5.
проводится хорда W3, параллельная S3. Эта хорда есть диаметр
эллипсоида W3, сопряженный с его плоским сечением W2, и ее сере-
середина Х3 есть центр эллипсоида и т. д. (см. рис. 5)
В заключение этого параграфа приведем формулы для нахождения
обратной матрицы. Условия /^-ортогональности векторов st sn
в матричной форме записываются в виде
S'RS = Л,
где S — матрица со столбцами st sn, A=[(s1, Rst) (sn, Rsn)].
Отсюда следует, что
S'CABS = A
и (8)
i-i
Если
Л = BSA^S'C = (BS) A'1 (C'S)'.
¦.A, B = C = E, то
(9)
§ 69. Некоторые методы сопряженных направлений
В современной литературе описаны и изучаются несколько мето-
методов сопряженных направлений. В этих методах в качестве системы
векторов Zx Zn, подвергающихся процессу #-ортогонализации
438 МЕТОД МИНИМАЛЬНЫХ ИТЕРАЦИЙ [ГЛ. VI
берется или система единичных векторов е, еп, или система
последовательных итераций некоторого произвольного вектора матри-
матрицей R.
1. Метод ортогональных векторов. В этом методе а) А поло-
положительно-определенная, R = A, Z1=^e1, ..., Zn = en. Соответствую-
Соответствующие формулы получаются из формул § 68 при С = В = Е, R1==A.
Векторами направлений будут Л-ортогональные векторы
при
I =2 п
0
Если Хо = 0, то
где t=1 B)
_ (F, st) __ (F, Sj)
щ — (s{, Asi) ~~ (st, Аед ¦
Отметим, что векторы Аег суть не что иное, как столбцы А
матрицы А. Таким образом,
(F, Si)
* (s4, At) '
Контроль вычислений осуществляется вычислением величин (At, Sj)
при j > t, которые теоретически должны равняться нулю.
Вычисление решения по методу ортогональных векторов уклады-
укладывается в схему:
I Ах А2 Д3 A F sx S2 5з .S4 X
II контроль (Sj, Asj)
III (Ai, s^
IV ii}
V щ
В табл. VI. 18 приведено решение системы уравнений (9) § 23
по методу ортогональных векторов.
Установим теперь связь между методом ортогональных векторов
и эскалаторным методом (§ 26).
Фокс, Хаски, У и л ь кинс он [1].
§69]
НЕКОТОРЫЕ МЕТОДЫ СОПРЯЖЕННЫХ НАПРАВЛЕНИЙ
439
00
«3
а-
1
со
о
с
о
X
о
о
о.
о
о
I
й
*
X
Щ
X
со
ев
с
>
(
и
S
и
<и
X
Щ
си
а
><
с?
со
—1.2577937
0.0434872
1.0391663
1.4823929
—0.6862368
—0.2227744
0.2218557
-0.4924721
-0.1131617
1
0
51-00
о
— о о о
п ю ь q
dodo
0.66
0.44
0.22
1.00
0.54
0.32
1.00
0.22
0.42
1.00
0.32
0.44
1.00
0.42
0.54
0.66
-
t~ г- r~
1 1 1
ooo
о <м о
п со и
о о ©
с-
с
1
> о
', 22
i о
о
=
0.4978712
0.6978533
0.82360
1.00
III
—0.2218557
0.1131617
0.1976688
0.42
0.54
0.66
>
1.4823929
0.7102890
0.4541039
0.3
>
440 МЕТОД МИНИМАЛЬНЫХ ИТЕРАЦИЙ
Соотношения
Si =«i
So := (?о foiSt
[ГЛ. VI
sn — еп Tnlsl ••• ~~~ ~{nn--lsn--l
могут быть записаны в виде
e1=sl
е1 = Т21*1 + «2
"Tnn-1
1 Т~ *»
или сокращенно в виде
где
E = TS',
D)
1 0 ... 0 0~!
T2i ! ••• ° 0
Tnl Tn2 • • • Тяи —1 —
а 5 матрица, столбцами которой являются векторы направлений.
Поэтому
и, следовательно, S является правой треугольной матрицей с еди-
единичной главной диагональю. Далее, ортогональность векторов 5;
к векторам Asj, при i ф j может быть сокращенно записана в виде
матричного равенства,
S'AS = A,
где Л — диагональная матрица. Действительно, элемент 1-й строки
и у'-го столбца матрицы S'AS равен, очевидно, ($;, Asj) и потому
равен нулю при 1ф]. Таким образом,
и у-го столбца матрицы SAS равен,
равен нулю при 1ф]. Таким образом,
Ровно такое же разложение лежит в основе эскалаторного метода
при S=Z в обозначениях § 26. При проведении вычислений по обоим
методам фактически определяются элементы матриц Г, Л и S.
Вычислительные схемы методов в основном совпадают.
2. Метод Д-минимальных итераций. Метод укладывается
в общую схему методов сопряженных направлений при R = A, A
положительно-определенная, Zt — q0 Zn = A
жении линейной независимости векторов gQ
n~1
q0 (в предполо-
предполоЛ™^)- Как и
§ 69] НЕКОТОРЫЕ МЕТОДЫ СОПРЯЖЁННЫХ НАПРАВЛЕНИЙ 441
в предыдущем методе С = В = Е, R1 = A. Система векторов сопря-
сопряженных направлений q0 Чп-i строится непосредственно по трех-
трехчленным рекуррентным формулам (§ 65), минуя вычисления векторов
Aq0, . . ., Ап~ <70 и Л-ортогонализации системы q0, Aq0, . . ., An~1q0.
3. Метод сопряженных градиентов. В методе сопряженных гра-
градиентов J) R = A, А положительно-определенная, В = С = Е, R1 = A.
Л-ортогональные векторы slt . . ., sn теоретически строятся про-
процессом Л-ортогонализации невязок r0, rv ..., rn_t последователь-
последовательных приближений Хй, Xv ..., Xn_v определяемых по формулам
метода сопряженных направлений, т. е. по формулам
А", = А-0 + 2а^. E)
где J=1
__ (Гр, Sj)
п
Таким образом, здесь система векторов, подвергающихся процессу
ортогонализации, не задается заранее, а строится параллельно с по-
построением векторов сопряженных направлений и соответствующих им
последовательных приближений. Отметим, что название метода свя-
связано с тем обстоятельством, что невязка /^ является градиентом
функции ошибок, вычисленным в точке Х^. Очевидно, что метод
сопряженных градиентов естественно связывается с решением лишь
одной системы AX=F, хотя знание базиса sv ..., sn позволяет
решать так же и системы с отличными от F свободными членами.
Процесс построения последовательных приближений оборвется,
как только некоторая невязка гк окажется равной нулю, т. е. как
только приближение совпадает с точным решением системы. A priori
мыслима другая причина остановки процесса, не приводящая к точ-
точному решению. Именно, процесс может остановиться, если некото-
некоторая невязка гк окажется линейной комбинацией предыдущих. Тогда
получится sk+1 = 0 и rft+1 = rk. Однако это невозможно, в силу
следующей теоремы.
Теорема 69.1* Ненулевые невязки r0, rv ..., rfc_, взаимно
ортогональны.
Доказательство. Рассмотрим (гг, /у) при />у. Так как век-
векторы Sj, . . ., Sj+l получаются Л-ортогонализацией системы векто-
векторов г0, ..., г у заключаем, что вектор г$ есть линейная комбинация
векторов 5Р ..., Sj+1 и потому (г;, rj) есть линейная комбинация
чисел (rit sft) при k = 1 y'-j-l. Но, в силу теоремы 68.3,
(Г|, sk) = 0 при &<;/, в частности, при k=\, ..., у+1.
Из доказанной теоремы следует, что если гк Ф 0, то rft не может
быть линейной комбинацией невязок г0, . . ., rlc_l, так что обращение
невязки в нуль является единственной причиной остановки процесса.
1)Штифель [1], Хестинс и Штифель[1].
442 МЕТОД МИНИМАЛЬНЫХ ИТЕРАЦИЙ (ГЛ. V!
Выведем теперь расчетные формулы процесса. Заметим, прежде
всего, что из формул
^Г .(в)
следует
^ = ^-1 — щАвь ¦ G)
причем -а* Ф О, ибо ri-r Ф г{.
Допустим, что мы уже построили векторы sb ..., st и г0, ..., />
Покажем, что следующий вектор направления si+1 строится по
формуле
где (8)
Oi — {sit Ast) •
Для того чтобы убедиться в этом, достаточно доказать, что так
построенный вектор si+1 будет Л-ортогонален к векторам з1г
S2 Sj. ЯСНО, ЧТО
(si+v AsO = (rit ASi)— <? ^ (Si. Ast) = 0.
Рассмотрим теперь (si+v Asj) при У=1, 2, .... /—1. Прежде
всего отметим, что (si+l, Asj) = (rit Asj). Далее, по формуле G)
имеем Asj = — (^_i — fj), так что
(si+v ASj) = -щ (rt, rj_t) — ¦— (rit rj) = O
в силу того, что j < i, j—l<i и невязки ортогональны. Итак,
формула (8) справедлива.
Отметим, что вычисление коэффициентов щ и Ь% можно произво-
производить и по формулам
_ (s{, r._i) _ (u-i, rt-x)
ai~ (Si, Ast) ~ {st. ASi) ,Q4
h - ^t, n) (У;
Us
-!, rt-i) '
справедливость которых легко устанавливается.
При практическом применении метода коэффициенты следует
вычислять по формуле
„ _ (r<-i, п-\)
а\— {st, Ast) '
пользуясь формулой
_ (Si, п-х)
a
§ 69] НЕКОТОРЫЕ МЕТОДЫ СОПРЯЖЕННЫХ НАПРАВЛЕНИЙ 443
для контроля. Формула же
щ~ (Si,
чувствительна к ошибкам округления и ее применение нецелесо-
нецелесообразно.
Таким образом, расчетные формулы метода сопряженных гра-
градиентов таковы. Выбирается произвольное приближение Хо к реше-
решению системы AX—F и вычисляется невязка ro — F — АХ0. Далее,
по рекуррентным соотношениям
S, — Гп
h
(rt-i,
~~ (Si,
(ri,
(rt-i,
H-x)
Asu
'isi
a)
(Si, rf-t
(Si,
A0)
(«i. As()
строятся векторы направлений su s2, ¦ • ¦ и невязки rv r2, ... Про-
Процесс заканчивается тем, что при некотором т <^ п окажется гт — 0.
Решение системы получается по формуле
т
X = Ло-\- 2^ CLiSi. (И)
Как правило, процесс протекает без вырождения, так что т=^п.
Контроль вычислений производится при помощи вычисления ска-
скалярных произведений (s», Asj) или скалярных произведений (гг, г$),
которые должны быть нулями.
Из формул A0) видно, что вычислительная схема метода сопря-
сопряженных градиентов близка к двучленной форме метода минимальных
итераций.
В табл. VI. 19 приведено решение системы (9) § 23 по методу
сопряженных градиентов.
Установим теперь связь между методом сопряженных градиентов
и методом Л-минимальных итераций.
Из рекуррентных соотношений для построения векторов г0,
rv .... гг и sv s2, si+1 ясно, что как одна, так и другая
системы векторов состоят из линейных комбинаций векторов г0,
Лг0 Л'г0.
Векторы г0, гх rt ортогональны. Следовательно, они лишь
скалярными множителями отличаются от векторов р0,plt .. .,р,метода
минимальных итераций, построенных исходя из ро = г0. Итак,
pt = k^i. Векторы же Sj si+l Л-ортогональны, так что они
лишь скалярными множителями отличаются от векторов qo = ro,
Решение линейной системы методом сопряженных градиентов
Таблица VI. 19
1
II.
III
IV
I
II
III
IV
г0
0.3
0.5
0.7
0.9
1.64
0.00522093
—0.01443433
0.01338442
—0.00413147
-11 • 10"8
3•10~8
0.0004318197
0.3
0.5
0.7
0.9
0.15214624
s3
0.00452345
—0.01452670
0.01371356
—0.00362386
—29- 10~8
1 • 10~8
0.0004318197
0.01041083
As-l
1.482
1.246
1.220
1.472
5.420
3.2464
0.50517496
As<t
0.00343581
—0.00983301
0.01071043
—0.00401315
0.00030008
0.0003198041
1.3502631
—0.44866929
—0.12944800
0.08368655
0.15638246
1 • ГО"8
0.24951983
Н
0.00058168
—0.00115718
—0.00107748
0.00128733
28-Ю"8
— 4 -10~8
2-Ю1
0.00000749560
—0.40302542
—0.05337488
0.19018892
0.29331408
4-Ю"8
0.24951983
0.001730603
0.000628773
—0.001308415
—0.000934710
0.00124960
62 ¦ 10~d
1 • 10~8
2 • 10~и
0.00000449560
As-i
—0.12915356
-0.03272691
0.02000433
0.04567392
—0.09620222
—0.07100037
3.5143454
Asi
0.00039923
—0.00079361
—0.00073895
0.00088325
—0.00025008
0.00000308381
1.4578070
X
—1.2577936
0.0434875
1.0391663
1.4823930
§ 69] НЕКОТОРЫЕ МЕТОДЫ СОПРЯЖЕННЫХ НАПРАВЛЕНИЙ 445
qu .... qt метода Л-минимальных итераций, т. е. si+1 —/^. Со-
Согласно расчетным фомулам метода сопряженных градиентов, по-
получим
kiPi = ki-tPi-i — aili_1Aqi_l.
Сравнивая эти формулы с двучленными формулами метода минималь-
минимальных итераций, заключаем, что
ki = li И 1 &
откуда
ki = li = (
Далее,
_ )
Коэффициенты ^i и h метода Л-минимальных итераций выра-
выражаются через коэффициенты ai и Ъ^ по формулам
A3)
й — "i
us — .
Отметим, что последовательные приближения Х(, вычисленные
по методу сопряженных градиентов, будут совпадать с последова-
последовательными приближениями, вычисленными по методу Л-минимальных
итераций, исходя из начального приближения Хо и qo = ro. Действи-
Действительно, соответствующие этим методам векторы направлений отли-
отличаются только нормировкой.
Это же обстоятельство следует и из теоремы 68.1. Действи-
Действительно, приближения Х{ обоих методов минимизируют функцию
ошибок среди векторов Xo-\-V, где V принадлежит подпространству,
натянутому на г0, Аг0, ..., А1~1гй.
Метод сопряженных градиентов можно применить и к решению
полной проблемы собственных значений. Ясно, что для векторов Гц
и Sj имеют место представления
Г; = Гг (А) Гп
A4)
где г^(() и Si(f) полиномы, определяемые по рекуррентным фор-
формулам
ro(t) = Si(t)^l
0 A6)
446 МЕТОД МИНИМАЛЬНЫХ ИТЕРАЦИЙ ¦ [ГЛ. VI
При невырожденном течении процесса полином rn(f) лишь ска-
скалярным множителем будет отличаться от характеристического поли-
полинома матрицы А. Это ясно хотя бы из того, что полиномы ri(t)
лишь постоянными множителями отличаются от полиномов Pi(t)
метода минимальных итераций.
Легко проверяется, что если Xj собственное значение матрицы А, то
есть собственный вектор, принадлежащий собственному значению \t.
Это следует из аналогичной формулы метода минимальных итераций.
Далее, из рекуррентных соотношений ясно, что г,A)=1 при
/ = 0, 1, ..., п. Поэтому ri(f) = /1! • Заметим еще, что поли-
полиномы Si(t) при /= 1 п лишь нормировкой отличаются от поли-
полиномов qi-i(t) метода ,4-минимальных итераций.
4. Метод ортогонализации столбцов. Здесь А—любая неособен-
неособенная матрица, R—A'A, Zl — e1, ..,, Zn = en. В этом случае С = Л',
Формулами метода будут (мы считаем Хо = 0)
п
X— 2 aisi
(sj, A'Aej) _ (Asj, At)
(sj, A'Aej) — (Asj, Aj) ([b)
(A'F, Si) _ (F,
Ui (st, A'Aet) — (Asit A,) '
Здесь А} = Aei есть 1-й столбец матрицы А.
Векторы Ast, ..., Asn образуют ортогональную систему (ибо
ASi) = (Sj, A'ASi) = (Sj, Rsj) = 0 при j ф i) и
Поэтому векторы Asv .... Asn фактически находятся процессом
ортогонализации столбцов матрицы А.
Векторы направлений st sn можно строить затем по формуле
si — ei
яспользуя вычисленные уже коэффициенты ортогонализации ¦)(#•
Однако построения векторов st, ..., sn можно избежать. Именно,
нетрудно проверить, что искомые неизвестные определяются по
§ 69] НЕКОТОРЫЕ МЕТОДЫ СОПРЯЖЕННЫХ НАПРАВЛЕНИЙ 447
рекуррентным формулам
хп = ап
хп-1==ап-1 Чп,п-1хп A7)
По существу метод ортогонализации столбцов эквивалентен приме-
применению метода ортогональных векторов к системе, полученной из дан-
данной системы 1-й трансформацией Гаусса.
В табл. VI. 20 дается пример решения системы уравнений мето-
методом ортогонализации столбцов по данным табл. II. 1.
Табл. VI. 20 заполняется по схеме.
1л л л л Р Л с /\ с Л сп А ч л
./~1 л *^2 ^^3 ^^4 /luj JiOn. '*1 1О4
II контроль (Asu ASj)
III S>' S%
(Ait Asd
IV ¦ ТУ
V a1 a2 a3 a4
VI V V V V
• * " " ^" Ъ 4
5. Метод ортогонализации строк *)• Здесь А любая неособен-
неособенная матрица, R = AA', Z1 — e1 Zn = en. В этом случае С = Е,
Формулы метода таковы
А" =2 aiA'Si
<-i A8)
'Si, et) ~~ (A'Si, A'ei) '
Здесь векторы s4 получаются по формулам
Ъ = ег — Tn«i— •¦¦ — Ti, 1-Л-1.
где A9)
_ (Sj, AA'et) (A'sj, А'е^ _ U'sj. A*)
TiJ== (sJt AA'ej) = (A'Sj, A'ej) ~~ (A'sjt A*)
и А'ег = А1 есть /-я строка матрицы А.
Ю. Шрейдер [1].
Решение системы уравнений методом ортогонализации столбцов
Таблица VI. 20 ?
оо
I
II
III
IV
V
VI
At
1
0.47
—0.11
0.55
А
0.17
1
0.35
0.43
А*
—0.25
0.67
1
0.36
А,
0.54
-0.32
—0.74
1
F
0.3
0.5
0.7
0.9
Asx
1
0.47
—0.11
0.55
1.5355
1.5355
0.5457506
0.0995767
0.6649300
0.6206447
0.4408886
i
Asi
—0.3757506
0.7434972
0.4100326
0.1298372
—0.420-10~7
0.8789610
0.8789610
1.1932893
—0.6990200
0.7541856
—0.3630312
Аяя
0.0988025
—0.2640083
0.5216659
0.1502995
0.750-10
—0.389-10"'
0.3741876
0.3741875
—0.2616262
1.0638310
1.1667985
AsA
—0.3617379
—0.1818692
—0.2437552
0.7643696
—0.720-10"'
0.222-10"'
-0.376-10"'
0.8076082
0.8076081
0.3935672
0.3935672
и
g
X
5
s
>
В"
X
E
X
s
-i
n
¦о
>
5*
§ 69]
НЕКОТОРЫЕ МЕТОДЫ СОПРЯЖЕННЫХ НАПРАВЛЕНИЙ
449
Таким образом, основную роль в формулах метода играют вспо-
вспомогательные векторы A'si, которые, очевидно, могут быть получены
ортогонализацией строк А1 матрицы А по формулам
% = Л* — blA% — ... — Ti, г - lA'st _ t
B0)
с прежними значениями коэффициентов fy.
Сами векторы sl sn нужны лишь для вычисления числителей
Fi = (F, s^ коэффициентов а{. Так же как в предыдущем методе,
их можно исключить. Действительно, имеем
Здесь fi = (F, e?) есть t-я компонента вектора F. Таким образом,
числа Ft находятся параллельно с вычислением ортогонализованных
строк A'Si по тем же рекуррентным формулам.
Метод эквивалентен применению метода ортогональных векторов
к системе, полученной 2-й трансформацией Гаусса.
В табл. VI. 21 дается решение системы методом ортогонализации
строк. Таблица заполняется по схеме
I
II
III
IV
V
VI
6. Метод Д'Д-минимальных итераций. Здесь А неособенная
матрица, R = A'A, Z1 = q0, Z2 = Rq0 Zn = #'l-1?0; C = A',
B = E, /?!==/?.
Формулы метода и пример даны в § 65.
7. Метод АА'-минимальных итераций. Здесь А неособенная
матрица, R = AA', Zx = q0, Z2 = Rq0 Zn = Rn~1qQ; C — E,
B = A', R1==E.
Формулы метода и пример даны в § 65.
8. Метод сопряженных, градиентов после первой трансформа-
трансформации Гаусса. Пусть А неособенная матрица. Применение метода со-
сопряженных градиентов к системе
Л1 Л2
/l h
Контроль
Л3
/з
Л4 /1/р
Л ./ i> ч
Л Fi
А'
Р-.
(А
(А'
(А'
Ы
S2
, F
'Si
'Si,
Si,
a2
Л'53 A'si X
3 -^4
A'sj)
A'Sj)
A*)
a3 a4
A'AX=A'F,
Решение системы уравнений методом ортогонализации строк
Таблица VI. 21
1
II
III
IV
V
VI
i
0.17
—0.25
0.54
0.3
А*
0.47
1
0.67
—0.32
0.5
A*
-0.11
0.35
1
0.74
0.7
Ai
0.55
0.43
0.36
1
0.9
A'Sl
1
0.17
—0.25
0.54
0.3
1.3830
1.3830
0.2167028
—0.5062184
0.7759219
0.2169197
A'sz
0.2532972
0.9631605
0.7241757
—0.4370195
0.4349892
1.05 • 10"'
1.7072541
1.7072541
0.7947344
0.2209139
0.2547888
A's9
01949144
—0.3293997
0.2979181
—0.1193276
0.5061646
2.20- 10
2.87-10"'
0.2494901
0.2494900
—0.1864445
2.0287971
A'Si
—0.2455381
0.0239030
0.4495452
0.6552979
0.6654999
0.240-10"'
0.614- Ю"'
—0.263-10"'
0.6923665
0.6923665
0.9611960
X
0.4408885
—0.3030308
1.1667984
0.3935672
г
и
I
Е
X
S
н
га
5t
<
Таблица VT.22 '¦*»
Решение системы линейных уравнений методом
1
II
III
IV
I
II
III
IV
0.3
0.5
0.7
0.9
«1
0.953
1.183
1.284
0.384
3.804
4.103810
0.015880373
S3
—0.00733766
—0.06667332
0.09703019
—0.06290488
0.67939954
Ast
1.04047
2.36831
1.30906
1.87908
6.59692
11.936050
0.34381642
Азц
—0.07689831
0.01501777
0.12105128
—0.06067925
-0.00150851
0.024474267
0.59509231
—0.05773067
—0.31426387
0.24992368
0.25394144
Гч
0.15056225
—0.10470617
0.09857365
—0.02007222
сопряженных
A'rt
—0.09325850
—0.12740998
0.14521847
0.13838779
0.7.10~7
0.065170035
А'гя
0.07946753
—0.05324086
—0.01644605
0.02179287
0.35 • 10"в
—0.88 • 10~8
—0.13 • 10~8
0.0098950792
градиентов
«2
—0.07812450
—0.10862350
0.16560887
0.14448585
0.22348381
«4
0.07448233
—0.09853868
0.04947622
—0.02094468
после первой трансформации Гаусса
As 2
—0.05997035
—0.08061954
0.02926481
0.11442846
0.00310338
0.024046255
2.7101948
Asi
0.03405157
—0.02368062
0.02229369
—0.00453959
0.0022378977
4.421о959
0.10480066
—0.09576921
0.17061034
—0.05618198
0.4408886
—0.3630310
1.1667984
0.3935672
А'го_
0.01012190
—0.04239773
0.06001929
—0.09519513
—0.51 • 10
0.65 ¦ 10"8
0.014564448
452 МЕТОД МИНИМАЛЬНЫХ ИТЕРАЦИЙ [ГЛ. VI
полученной из системы AX=F первой трансформацией Гаусса дает
п
X— Хо-\- 2 aisi
_ Gг-_„ п_л
», A'Ast)
Здесь /"j невязка преобразованной системы. Ясно, что
где г» невязка исходной системы. Принимая это во внимание и пре-
преобразуя скалярные произведения, придем к следующим расчетным
формулам:
п
__ (А'п-Ь A'n-i)
(As{, Ast)
A'r0,
ri^l — aiAsi B2)
Метод контролируется выполнением условий ортогональности
(A'rit A'rj) = Q.
В табл. VI.22 приводится иллюстративный пример с данными
табл. II. 1.
9. Метод сопряженных градиентов после второй трансформа-
трансформации Гаусса. Пусть А неособенная матрица. Применение метода со-
сопряженных гоадиентов к вспомогательной системе
I
II
III
IV
1
II
III
IV
ro
0.3
0.5
0.7
0.9
1.64
gi
0.953
1.183
1.284
0.384
3.804
4.103810
0.16233143
g*
0.01312607
—0.05498055
0.07783232
—0.12344761
-0.08746977
0.024492337
3.8927078
Решение линейной системы
Agi
1.04047
2.36831
1.30906
1.87906
6.59692
0.39962864
Ag$
—0.08234041
0.04283959
0.14849649
—0.11185027
—0.00285460
2.7754180
''I
—0.11580161
—0.44644450
¦0.17686213
0.14906582
0.4 ¦ 10~8
0.26622354
0.38156664
—0.14982089
—0.26506842
0.16220935
0.68 • 60~7
-0.14- 10~7
0.22-10"9
0.26461254
A'rt
—0.26309916
—0.34013073
—0.03964159
0.09851721
—0.54435427
A'ro
0.42952349
-0.10797849
—0.40244471
0.61234865
0.53144894
методом Крейга
gi
-0.10839731
—0.14809265
0.16879197
0.16085248
0.07315449
0.088045659
0.25533607
Si
0.48061945
—0.32200171
—0.09946623
0.13180318
0.19095469
0.36194577
Ag,
—0.08891071
—0.13742156
0.00985241
0.09831923
—0.11816063
3.0236986
Agi
0.52191943
—0.20492996
—0.36256932
0.22187530
0.17629545
0.73108339
Таблица VI. 23 <&
СП
со
г*
0.15303758
—0.03092312
0.14707141
—0.14822190
—0.9 • 10~8
0.2-10~8
0.067976472
X
0.4408885
—0.3630310
1.1667983
0.3935672
А'г, .
0.04080381
—0.01716715
0.03473364
—0.16451905
—0.10614875
НЕКОТОРЫ
и
•2
И
ч
Е
сош
3ЯЖЕ
ННЫХ НАПРАВ
ЛЕНИЙ
453
454 МЕТОД МИНИМАЛЬНЫХ ИТЕРАЦИЙ [ГЛ. VI
полученной из исходной системы AX=F второй трансформацией
Гаусса, дает
(slt
b _ in, n)
Здесь Г{—невязки преобразованной системы, которые, очевидно, со-
совпадают с невязками исходной системы.
Обозначим
Так как X— A'Y, получим после легких преобразований сле-
следующие расчетные формулы:
gi = А'го
(П, п) B3)
Очевидно, что (rit г^) = 0 при i=hj.
Последний метод равносилен методу, описанному Крейгом [1],
хотя несколько отличается от него по вычислительной схеме.
В табл. VI. 23 дана численная иллюстрация метода для си-
системы табл. II. 1.
ГЛАВА VII
ГРАДИЕНТНЫЕ ИТЕРАЦИОННЫЕ МЕТОДЫ
В настоящей главе будут изложены итерационные методы, при-
пригодные как для решения линейных систем, так и для решения частич-
частичной проблемы собственных значений в случае положительно-опре-
положительно-определенной матрицы и основанные преимущественно на идее релаксации,
которая уже была освещена в гл. III и V. В отличие от методов,
изложенных в этих главах, векторами, в направлении которых
осуществляется минимизация выбранного функционала, будут не коор-
координатные векторы, а векторы, связанные с самим функционалом—¦
именно, это будут градиенты функционала. Именно такой выбор
направления минимизации связан с тем, что, как известно (п. 1 § 14
гл. I), направление, противоположное направлению градиента функ-
функционала в данной точке, обеспечивает в окрестности этой точки наи-
наиболее быстрое убывание функционала. По этой причине некоторые
градиентные методы называются также методами наискорейшего спуска.
Идеальным градиентным методом явилось бы построение линии
наискорейшего спуска, исходящей из начального приближения и при-
приводящей к точке, дающей минимум функционала, т. е. линии, на-
направление которой в каждой точке противоположно направлению
градиента функционала в этой точке. Дифференциальное уравнение
линии наискорейшего спуска есть
~ = -?(t)gradF(X), A)
где р (t) любая положительная функция от параметра t. Выбор функ-
функции р (t) влияет лишь на параметризацию линии наискорейшего спуска.
Например, если при решении системы AX=^F с положительно-
определенной матрицей А в качестве функционала взята функция
ошибок, то уравнение A) при р(/)=^1 будет
*? = Р — АХ. B)
Следовательно, линия наискорейшего спуска будет определяться как
решение системы линейных дифференциальных уравнений с постоян-
постоянными коэффициентами.
456
ГРАДИЕНТНЫЕ ИТЕРАЦИОННЫЕ МЕТОДЫ
[ГЛ. VII
При выбранной параметризации искомое решение данной алге-
алгебраической системы получается как lim X(t), независимо от выбора
t->co
начального приближения.
Действительно, легко видеть, что общим решением системы B)
является X— Х*-\- e~AtC, где X* точное решение системы AX=F,
а С произвольный постоянный вектор.
В одношаговых методах наискорейшего спуска траектория наи-
наискорейшего спуска, исходящая из данного начального приближения,
заменяется ломаной, состав-
составленной из отрезков касатель-
касательных к траекториям наиско-
наискорейшего спуска, проходящим
через вершины этой лома-
ломаной (рис. 6).
Первым среди градиент-
градиентных методов появился метод
наискорейшего спуска, пред-
предложенный Л. В. Канторови-
Канторовичем [1] и независимо от него
Темплем [1].
Детальное изучение этого
метода показало в ряде слу-
случаев медленную сходимость
процесса, и это обстоятель-
обстоятельство привело к развитию
Рис. 6. других градиентных мето-
методов— методов с неполной
релаксацией и s-шаговых процессов. Последние процессы естественным
образом (именно при s — п) оказались связанными с методом сопря-
сопряженных градиентов (в случае решения системы) и с методом мини-
минимальных итераций (в случае решения проблемы собственных значе-
значений). Таким образом, эти последние методы можно рассматривать
как предельные случаи многошаговых методов спуска.
В §§ 70—73 мы рассмотрим итерационные градиентные процессы
для решения линейных систем, в §§ 74—76 для решения частичной
проблемы собственных значений. Как правило, матрица А считается
в этой главе положительно-определенной.
§ 70. Метод наискорейшего спуска для решения
линейных систем
Пусть А положительно-определенная матрица и пусть
ваданная . линейная система. В. работах Л. В. Канторовича [1]—[3]
решение этой системы связывается с задачей отыскания вектора,
§ 70] МЕТОД НАИСКОРЕЙШЕГО СПУСКА ДЛЯ РЕШЕНИЯ ЛИНЕЙНЫХ СИСТЕМ 457
дающего минимум функционалу
X) — 2(F, X), B)
отличающемуся лишь постоянным, но заранее неизвестным, слагаемым
(АХ*, X*) от функции ошибки f(X) = (AY, Y). Здесь X" — точное
решение системы, совпадающее с вектором, реализующим минимум
Н(Х), Y = X* — X— вектор ошибки.
Поставленная задача решается следующим образом. Выбирается
произвольный вектор Хо. Вычисляется направление, противоположное
градиенту функционала Н(Х) (или, что то же самое, градиенту
функции ошибки) в этой точке, которое совпадает с направлением
невязки ro = F — АХ0 выбранного начального приближения. Из
точки Хо мы двигаемся в выбранном направлении до точки Хх,
в которой функционал Н(Х) становится минимальным.
Так как
(АХ0, Х0)+2а(АХ0, го) + аЦАго. ro) — 2(F, X0) — 2a(F. ro)
ro, r0) =
то это выражение достигает минимума при
(г0, го)
и этот минимум равен
Итак,
где ro=*=F — АХ0
„ _ (г0, г0)
"°~ (Аго,го)
Далее определяется Х2 = Хх -f- atrlt где rx — F — АХХ и
_ _
1
, rt)'
458 ГРАДИЕНТНЫЕ ИТЕРАЦИОННЫЕ МЕТОДЫ [ГЛ. VII
и процесс продолжается далее по формулам
Х*+1 = Х* + *кГ*
г р л у _ г „ Аг *¦ >
к — — к — к — 1 — к—1 'к — 1*
где
ак==-Ш>- F)
При этом
Заметим сразу, что при фактическом проведении процесса век-
векторы гк, особенно при большом порядке матрицы системы, удобнее
вычислять по формуле гк — Г]С_1 — ак_1Агк_1. Однако, вследствие
ошибок округления, так вычисленные векторы гк после нескольких
шагов процесса могут начать отклоняться от истинных невязок
F — АХк. Поэтому следует время от времени вычислять векторы гк
по формуле rk = F—АХк.
Теорема 70.1 Последовательные приближения Хо, Хи Хг, ...
сходятся к решению системы AX-—F с быстротой геометри-
геометрической прогрессии 1).
Доказательство. Покажем прежде всего, что последователь-
последовательность значений функции ошибок стремится к нулю при k —*¦ оо. Имеем
(Агк> гк) '
С другой стороны,
J K^^lc) "''""* v^^ ^*А> к/'
Поэтому
Сь- гк)г
(А Vfc- гк)(Агк, гк)
Оценим снизу вычитаемое в правой части последнего равенства.
Пусть ^^^^ ••• <1^и собственные значения матрицы A, Ut,
U2 Uп принадлежащие им собственные векторы, ортогональные
друг к другу и нормированные так, что (Ub Ui) = 1 при / = 1, . . ., п.
Так как А положительно определена, все Х; > 0. Пусть т
\п <; М. Пусть далее
гк = с,и^ ... +cnUn.
Л. В. Канторович [2].
§ 70] МЕТОД НАИСКОРЕЙШЕГО СПУСКА ДЛЯ РЕШЕНИЯ ЛИНЕЙНЫХ СИСТЕМ 459
причем не все с4 равны нулю. Тогда
Агь = Ci\Ux + . .. + cn\nUn
Следовательно,
(гк> гк) — 2j ci
И
и потому
' п
k' rk) v 2V I 2
2x Z C
i
t=l i=l
Для оценки снизу последнего отношения применим неравенство
1-
п
1
справедливое при условии, что все числа at > 0, а числа fi удовле-
удовлетворяют неравенствам 0 ¦< т <^ f» <C ^W-
Это неравенство обосновывается следующим образом. Выражение
рассматриваемое как функция одного из параметров -ft ПРИ фиксиро-
фиксированных остальных, имеет вид
причем А > 0 и В > 0. Последняя функция, очевидно, не имеет
максимума при положительных -значениях ^ и потому при изменении
7, в интервале (m, A1) будет иметь максимум на одном из концов.
Таким образом, выражение Г при изменении f4 в интервале (m, M)
принимает максимальное значение, когда некоторые ^» равны т,
а остальные М.
460 ГРАДИЕНТНЫЕ ИТЕРАЦИОННЫЕ МЕТОДЫ [ГЛ. VII
Без нарушения общности можно считать, что ~[i — m ПРИ *== 1.
..., k и ^i = M при Z = ft-|- 1 п.
Введем обозначения
• S, = S а,
г = 1
п
52 = 2j «г-
Тогда
Далее
Итак,
m
= 1
что и доказывает неравенство (8).
На основании неравенства (8)
ж~^У in.
и, следовательно,
M-m-i*
i
Итак,
и, следовательно,
Таким образом, f(Xk+1)-*- 0 при &-»-оо и потому ^i+1 ~+X*, где
точное решение системы AX=.F.
§ 70] МЕТОД НАИСКОРЕЙШЕГО СПУСКА ДЛЯ РЕШЕНИЯ ЛИНЕЙНЫХ СИСТЕМ 461
Оценим теперь длину вектора ошибки, т. е. вектора Yk~X*—Хк.
Так как
\
то
Тем самым доказано, что | Yk\ стремится к нулю со скоростью гео-
геометрической прогрессии. Теорема доказана.
Оценке для f(Xk) можно придать несколько иную форму, если
ввести в рассмотрение Р-число обусловленности, т. е. число р = г^.
Именно, можно принять, что т^Х^ М — \п. Тогда
Г)=EттГ
Отметим два свойства приближений Хк метода наискорейшего спуска.
1. Невязки двух последовательных приближений ортогональны
друг другу.
Действительно, rk+1 = rk — akArk, откуда (rk+1, rk) = (rk, гк) —
— ак (Агк, гк) = 0 на основании определения ак.
2. Каждое последующее приближение ближе к точному решению,
чем предыдущее, т. е.
Иначе говоря, длина вектора ошибки при переходе к новому при-
приближению строго убывает.
Действительно,
Yjc+l — ^к akrk
и, следовательно,
l, rk) =
^и, гк)(Агк, Гк) — (гк, гк)Ц.
Vk' Гк)
Покажем, что
(У* rk)(Ark, rk) — (rk
Положим А = В*, где В положительно-определенная матрица. Тогда
<Yk> rk){Ark, rk) — (rk, rkyt = {A~1rb, rh)(Ark, rk) — (rk, rftJ =
= {B~\. B~\rk) {Brk, Brk)-{Brk. B-'rX> 0
462
ГРАДИЕНТНЫЕ ИТЕРАЦИОННЫЕ МЕТОДЫ
[ГЛ. VII
в силу неравенства Коши — Буняковского. Таким образом,
Уи) — «*(Г*. rk) < <yk, Yk),
ибо аА>0 и (Yk, rk) = (AYk, Yk)>0.
Наконец, из сравнения соответствующих формул вытекает, что
приближение Хк+1 совпадает с первым приближением метода сопря-
сопряженных градиентов, проводимого из начального приближения Хк.
Решение системы линейных уравнений
I
II
III
IV
о о о о
0.76
0.08
1.12
0.68
2.3008
1.8744460
Аг0
0.3616
0.0496
0.6576
0.3120
1.3808
1.227456
*i
1.4245790
0.1499557
2.0993795
1.2746233
Г\ — '"О — а0-™ 0
0.08220033
— 0.01297252
— 0.11263569
0.09517285
Приведем примеры применения метода наискорейшего спуска.
Пример 1. Решим систему с матрицей
0.
0.
0.
0.
78
02
12
14
—0.02
0.86
—0.04
0.06
—0.12
—0,
0.
—0.
.04
.72
.08
—0.14
0.06
— 0.08
0.74
и свободным членом @.76, 0.08, 1.12, 0.68)'. В табл. VII. 1 приведено
начало вычислительного процесса (чтобы пояснить вычислительную
схему метода) и результаты последующих шагов.
Здесь в первой части таблицы записываются последовательно ве-
векторы Xit /-j, Ari% во второй — результат контрольного вычисления по
столбцовым суммам для Arit в третьей — соответствующие скалярные
произведения (rit rt) и (Arit г^, в четвертой — коэффициенты а,. Для
сравнения вектор гх вычислен двумя способами.
§ 70] МЕТОД НАИСКОРЕЙШЕГО СПУСКА ДЛЯ РЕШЕНИЯ ЛИНЕЙНЫХ СИСТЕМ 463
Сравнение хода процесса наискорейшего спуска с результатами
вычислений по методу последовательных приближений и циклическому
одношаговому процессу показывает, что в данном примере метод
наискорейшего спуска сходится быстрее. Именно, восьмой шаг ме-
метода наискорейшего спуска дает лучшие результаты, чем десятый шаг
в обоих упомянутых методах. Десятый же шаг дает решение уже
с точностью до 1 • 10~6.
Таблица VII. I
по методу наискорейшгго спуска
r1 = F — AXi
0.08220030
— 0.01297254
— 0.11263567
0.09517284
0.02866984
1.2587313
Агх
0.06456777
— 0.00258459
— 0.09805664
0.06715236
0.03107890
0.02277678
*2
1.5280471
0.1336268
1.9576015
1.3944203
*8
1.5349633
0.1220118
1.9751502
1.4129515
X,
1.5349634
0.1220090
1.9751560
1.4129545
•^10
1.5349650
0.1220097
1.9751560
1.4129552
В качестве 2-го примера рассмотрим решение системы (9) § 23.
Результаты, полученные по методу наискорейшего спуска, помещены
в табл. VII. 2.
Таблица VII. 2
Решение системы линейных уравнений по методу
наискорейшего спуска
*1
^18
^25
¦^80
Хц)
-^52
0
0.1515525
—1.2546235
—1.2573084
—1.2577348
—1.2577912
—1.2577937
0
0.2525875
0.0434210
0.0435634
0.0434859
0.0434873
0.0434873
0
0.3536225
1.0365064
1.0389273
1.0391170
1.0391642
1.0391662
0
0.4546575
1.4786412
1.4820379
1.4823232
1.4823900
1.4823928
464
ГРАДИЕНТНЫЕ ИТЕРАЦИОННЫЕ МЕТОДЫ
[ГЛ. VII
Теоретические оценки быстроты сходимости метода наискорей-
наискорейшего спуска показывают, что с возрастанием числа обусловленности
матрицы коэффициентов сходимость метода наискорейшего спуска
быстро замедляется. Оказывается, что теоретические оценки почти не
являются завышенными, и в действительности процесс очень медленно
сходится даже при не очень боль-
больших числах обусловленности. Так,
в последнем примере Р-число
обусловленности яа 10.
Методу наискорейшего спуска
можно придать следующую гео-
геометрическую интерпретацию. Рас-
Рассмотрим в «-мерном пространстве
семейство поверхностей
Рис. 7. где /(Х) —функция ошибки. Это
семейство есть семейство подобных
эллипсоидов. Процесс наискорейшего спуска геометрически может
быть объяснен так. Через приближение Хо проводится эллипсоид
в точке Хо проводится нормаль к этому эллипсоиду и затем в се-
семействе находится эллипсоид, касающийся этой нормали. Точка ка-
касания W будет следующим приближением. Для п = 2 геометрическая
картина показана на рис. 7.
Геометрически очевидно, что если эллипсоиды семейства вытянуты
в одном направлении и какое-то приближение попало довольно близко
Рис. 8.
к большой оси, то и последующие приближения будут близки к кон-
концам больших осей подобных эллипсоидов. Так, для п = 2, если на-
начальное приближение находится в точке, нормаль к которой обра-
образует угол в 45° с большой осью соответствующего эллипса, то и
для всех последующих приближений угол между нормалью и боль-
большой осью будет равняться ± 45° (рис. 8). Нетрудно убедиться (для
п = 2), что именно при таком выборе начального приближения схо-
сходимость процесса будет самой медленной и быстрота сходимости
будет совпадать с теоретической оценкой.
§ 71] ГРАДИЕНТНЫЙ МЕТОД С МИНИМАЛЬНЫМИ НЕВЯЗКАМИ 465
§ 71. Градиентный метод с минимальными невязками
Этот метод описан в работе М. А. Красносельского и С. Г. Крейна [1].
Пусть А положительно-определенная матрица, Хо начальное прибли-
приближение к решению системы AX—F. Следующее приближение Xt
ищется, так же как и в методе наискорейшего спуска, в виде Х0-\-фг0,
но параметр р подбирается так, чтобы минимизировалась длина
вектора невязки \г\ или, что то же самое, (г, г) — \г\2.
Таким образом, здесь минимизируется функционал (г, г) в направле-
направлении, противоположном градиенту другого функционала, именно
функции ошибок. После выполнения первого шага процесс повто-
повторяется.
Выведем формулы, связывающие соседние приближения. Пусть
^+i = ^;c + SVfc. (О
тогда
rk+i = rk — ^kArk. B)
Следовательно,
, Ark) =
Ч" к! (Агк, Агк)^у "• к>\Ук (Агк,Агк)
откуда следует, что (гк + 1, гк+1) принимает минимальное значение
равное (гк, гк) /"' Г,к при %к = :. Г"' Г.к— .
v Кк' к> (Ark, Ark) v ™ (Агк, Агк)
Итак, рабочими формулами метода будут
rk_1$k_1Ark_1
гк< гк)
й
Н {Агк, Агк) •
Теорема 71.1. Последовательные приближения Хо, Xv ...
сходятся к решению системы AX=F с быстротой геометри-
геометрической прогрессии.
Справедливость теоремы будет следовать из более общей теоремы,
которая будет доказана в следующем параграфе.
В табл. VII. 3 приведено решение первого примера § 70.
Быстрота сходимости процесса для данного примера такая же,
как и в методе наискорейшего спуска.
30 Зак. 974. Д. К. Фаддеев и В. Н. Фаддеева
466
ГРАДИЕНТНЫЕ ИТЕРАЦИОННЫЕ МЕТОДЫ
[ГЛ. VII
Решение системы линейных уравнений градиентным
I
II
III
IV
о о о о
Го
0.76
0.08
1.12
0.68
1.227456
1.8513763
АХ0
0.3616
0.0496
0.6576
0.3120
1.3808
0.66299648
хх
1.4070460
0.1481101
2.0735415
1.2589359
rl = F--AX1
0.09054233
—0.01182826
—0.09746508
0.10237059
0.22033655 ¦ КГ1
1.2620108
§ 72. Градиентные методы с неполной релаксацией
Пусть по-прежнему А положительно-определенная матрица, и
ищется решение системы AX—F.
Рассмотрим итерационный процесс, в котором каждое последую-
последующее приближение получается из предыдущего изменением в направ-
направлении, противоположном градиенту функции ошибок, причем так,
что на каждом шаге функция ошибок уменьшается. Формулы для
получения последовательных приближений, очевидно, должны иметь
вид
0)
B)
где ак соответствующий коэффициент в методе наискорейшего спу-
спуска. Имеем
— 2тй {гк, rk) + fk (Ark, гк) =
Для дальнейшего исследования нам удобно положить
C)
• § 72] ГРАДИЕНТНЫЕ МЕТОДЫ С НЕПОЛНОЙ РЕЛАКСАЦИЕЙ 46?
Таблица VII. 3
методом с минимальными невязками
П = г0— $0Аг0
0.09054233
—0.01182826
-0.09746505
0.10237059
Агх
0.06822351
-0.00194231
—0.08875643
0.07016581
0.04769058
0.17459165-Ю
Хо
1.5213114
0.1331827
1.9505396
1.3881287
*9
1.5349632
0.1220091
1.9751557
1.4129543
¦^10
1.5349648
0.1220099
1.9751558
1.4129551
Из этой формулы ясно, что для того, чтобы f(Xk+l) было бы
меньше, чем f{Xk), необходимо и достаточно выполнение для мно-
множителей релаксации qk неравенств
0 < дк < 2.
D)
Будем называть группу методов, в которых не все qk равны 1,
методами неполной градиентной релаксации (одноша-
говыми). Если все множители релаксации qk^.\, но не все равны
единице, метод называется методом нижней релаксации, если
все qk^-1, но не все qk — 1, — методом верхней релаксации.
Так, метод с минимальными невязками является методом нижней
релаксации, ибо в нем
Як = -^7 =
h
ак
(Агк,
(Агъ Агк) {rk, rk)
E)
по неравенству Коши—Буняковского. Здесь знак равенства возможен,
только если гк есть собственный вектор матрицы А.
В группу методов неполной релаксации входит и градиентный
метод с постоянным множителем ?& = Т' если этот множитель
удовлетворяет неравенству
F)
где М наибольшее собственное значение матрицы А.
468 ГРАДИЕНТНЫЕ ИТЕРАЦИОННЫЕ МЕТОДЫ [ГЛ. VII
Действительно, в этом предположении
2
Условие 0 < f < -j^ является так же необходимым для того, чтобы
функция ошибки уменьшалась при любом начальном векторе. Дейст-
Действительно,
О < qk < 2
дает
откуда
(Агк, гк) •
Так как последнее неравенство должно выполняться при всех гк,
должно быть выполнено неравенство
2 (г, г) 2
Заметим, что градиентный метод с постоянным множителем есть
не что иное, как процесс последовательных приближений, применен-
примененный к системе, подготовленной следующим образом
Необходимые и достаточные условия сходимости метода совпадают
2
с условием 0 < у < -тт-. Действительно, наибольшее по модулю соб-
собственное значение матрицы Е—*\А будет большее по модулю из
чисел 1—-j-Ж и 1—у/к. Таким образом, для сходимости метода
последовательных приближений необходимо и достаточно выполнение
неравенств
— 1 < 1—Т/к< 1
— 1 < 1—ТЖ< 1,
2 2
откуда следует, что у>0, f< — и 7<~%f- Выполнение третьего
неравенства обеспечивает выполнение второго.
Наибольшее по модулю собственное значение матрицы Е — у А
будет наименьшим из возможных, если 1—у/и = — A—~(М), т. е.
О АА — tn
если у=—-т—гг . В этом случае 1—-\т = „ —. Следовательно,
быстрота сходимости при таком выборе множителя у будет оцени-
оцениваться неравенстом
(M~m\k\Y I
J I Г
§ 72] ГРАДИЕНТНЫЕ МЕТОДЫ С НЕПОЛНОЙ РЕЛАКСАЦИЕЙ 469
т. е. имеет тот же порядок, что и в методе наискорейшего
спусках).
Вся группа методов неполной релаксации (включая и случай пол-
полной релаксации, когда все qk=\, что соответствует методу наиско-
наискорейшего спуска) естественно укладывается в общую схему итерацион-
итерационных методов, описанных в главе III. Именно, они получаются из
общей итерационной формулы
— АХк)
при
Теорема 72.1. Если в процессе неполной градиентной релак-
релаксации множители релаксации удовлетворяют условию е < qk <^
< 2— е, 0 < е < 1, то процесс сходится к решению со скоростью
геометрической прогрессии.
Доказательство. Пусть Xk — k-e приближение метода неполной
релаксации, удовлетворяющего условиям теоремы. Обозначим через Хк+1
приближение, получающееся из Хи одним шагом метода наискорей-
наискорейшего спуска, через Yu+l и Yu+l—соответствующие векторы ошибок.
Как мы видели выше
где
М — т \2
)
Следовательно,
f(Xk)-f(Xk+1) >A — x)f(Xk).
Далее
откуда
ибо
Таким образом,
f(Xk)—f(Xk+1) > Bqk — ql) (I —x)f(Xk),
и потому
/(**+i) < [1 - {2qk — q\){\ —х)]/(АУ < [1 — Bs — e*) A -
Положим
т1=1— Bs — S2)(l— x).
i) И. П. Натансон [1].
470 ГРАДИЕНТНЫЕ ИТЕРАЦИОННЫЕ МЕТОДЫ {ГЛ. VII
Ясно, что 0<х1<1, ибо 0 < 2s —е2< 1, 0 < 1-х < 1. Из по-
последнего нерапенства следует, что
Таким образом, при й-»оо f(Xk)->0 со скоростью геометрической
прогрессии, Kfc-э-О и Хк->Х*. Теорема доказана-.
Из доказанной теоремы следует, в частности, сходимость метода
с минимальными невязками, так как в этом случае множители qh
удовлетворяют неравенству
где е=
Действительно,
/ i А \2
\А2гк, А2гк)
{Агн,гк)ъ __ \А2гк, А2гк) (г, г)"
Здесь г = Л2/-й. Поэтому в силу неравенства (9) § 70 имеем
Неравенство qk^.\ было уже отмечено.
Быстрота сходимости метода при таком способе доказательства
сильно занижена. В упомянутой выше работе М. А. Красносельского
и С. Г. Крейна установлено, что быстрота сходимости имеет тот же
порядок, что и в методе наискорейшего спуска.
В оценке G) никак не учитывается, будет ли на данном шаге qk
больше или меньше 1. Есть основание предполагать, что если при-
применяется верхняя релаксация, приведенные оценки не являются
существенно завышенными. Для нижней релаксации они, по всей
вероятности, являются завышенными, так как при нижней релаксации
ломаная с вершинами в последовательных приближениях будет теснее
примыкать к линии наискорейшего спуска, чем аналогичные ломаные
для полной и верхней релаксации.
В вычислительном отношении удобно брать множители релакса-
релаксации дк не зависящими от k.
В табл. VII. 4 и VII. 5 приводятся результаты вычисления решения
системы (9) § 23 градиентным методом с применением неполной
релаксации при д = 0.8 и q=\.2. Из таблиц видно, что в данном
примере нижняя релаксация приводит к решению быстрее, чем пол-
полная (табл. VII. 2), а верхняя медленнее.
§72]
ГРАДИЕНТНЫЕ МЕТОДЫ С НЕПОЛНОЙ РЕЛАКСАЦИЕЙ
471
Таблица VII. 4
Решение системы линейных уравнений градиентным методом
с неполной релаксацией при q = 0.8
*i
Х\&
*85
0
0.1212420
— 1.2574919
— 1.2577926
— 1.2577936
0
0.2020700
0.0435581
0.0434876
0.0434873
0
0.2828980
1.0390689
1.0391658
1.0391662
0
0.3637260
1.4822318
1.4823922
1.4823928
Таблица VII.5
Решейие системы линейных уравнений градиентным методом
Xl
**ъ .
х&
Х<я
с неполной релаксацией
0
0.1818630
— 1.2251212
— 1.2551442
— 1.2566377
— 1.2577672
—1.2577904
0
0.3031050
0.0432191
0.0436275
0.0437154
0.0434887
0.0434875
при q =\.2
0
0.4243470
1.0164571
1.0373248
1.0386884
1.0391478
1.0391640
0
0.5455890
1.4498670
1.4797554
1.4816669
1.4823665
1.4823896
В заключение этого параграфа рассмотрим метод, являющийся
предельным случаем для метода верхней релаксации. Формулы метода 2)
следующие
где ак коэффициент метода наискорейшего спуска. В этом случае
функция ошибок от шага к шагу не уменьшается и последовательные
приближения не стремятся к решению. Однако, если начальное при-
приближение не ортогонально к собственному вектору, принадлежащему
наибольшему собственному значению матрицы А, то последователь-
последовательности Хо, Хг, ... и Xv Х3, ... сходятся. При этом полусумма преде-
пределов этих последовательностей дает решение системы, а полуразность
есть собственный вектор, принадлежащий наибольшему собственному
значению.
Доказательство соответствующей теоремы читатель найдет в упо-
упомянутой работе В. Н. Костарчука. >)
i)B. H. Костарчук [1].
472 ГРАДИЕНТНЫЕ ИТЕРАЦИОННЫЕ МЕТОДЫ [ГЛ. VII
§ 73. s-шаговые градиентные методы наискорейшего спуска
В предыдущих трех параграфах мы рассматривали одношаговые
градиентные методы, связанные с полной или неполной релаксацией
функции ошибок и установили, что наилучший результат за один
шаг дает метод наискорейшего спуска. Естественно поставить вопрос
о том, как определить множители ^ fg с тем, чтобы, исходя
из начального приближения А" , получить наилучший результат после s
шагов процесса и как объединить эти s шагов в один шаг нового
вычислительного процесса. Иначе говоря, как построить вычисли-
вычислительный процесс, один шаг которого равносилен s шагам одноша-
гового градиентного метода, выбранным согласно наилучшей стра-
стратегии.
Пусть
у у@)
— AX0)
A)
Тогда, переходя к векторам ошибки, получим
1 'О I 0л ' 0 \и Л 0-™/ * О
Y.2 = Yi~.liAYl =.(?~ТтИ!Y! с2)
КA) =YS= Ys_, — Ъ-^Уэ-i = (Б — Ъ-И) Ys-i,
откуда
. is~4, ' C)
где
- ... —csAs-\. D)
Таким образом, задача сводится к определению коэффициентов
cv ..., cg так, чтобы значение /(АгA)) функции ошибки было бы
наименьшим.
Эта задача была уже решена ранее в § 69 при изучении метода
сопряженных градиентов. Действительно, на стр. 445 было устано-
§ 73] S-ШАГОВЫЕ ГРАДИЕНТНЫЕ МЕТОДЫ НАИСКОРЕЙШЕГО СПУСКА 473
влено, что s-e приближение метода сопряженных градиентов миними-
минимизирует функцию ошибки среди векторов Ar@)-T-V, где вектор V
принадлежит подпространству, натянутому на г0, Аг0, .... As~1r0.
Итак, результат одного шага s-шагового метода наискорейшего
спуска совпадает с результатом s-ro приближения метода сопряжен-
сопряженных градиентов.
Именно,
> Л С (*Л\
— ^^ UjSjt \0)
где
s1 = /-0,
(sit Asi) (s{, Asi) F)
(/=1, 2 s— 1).
Поэтому при фактическом проведении s-шагового метода наиско-
наискорейшего спуска нам не нужны ни коэффициенты сх cs, ни, тем
более, коэффициенты ^, fg.
Однако нетрудно отдать себе отчет в том, что представляют
собой те и другие коэффициенты. При рассмотрении метода сопря-
сопряженных градиентов было показано, что
г8 = г8 (А) г0 G)
и, следовательно,
где rs(t) полином § 69, п. 3.
Но, с другой стороны,
= rs (А) К@),
Следовательно,
т. е. коэффициенты с1г ..., cs суть не что иное, как коэффи-
коэффициенты полинома rs(t). Далее, из равенства
A—ГоОО—TiO ¦¦• О—7e-iO=l+
следует, что числа f0 fs_1 суть числа, обратные к корням по-
полинома rs(t).
Отметим, что если вместо формулы E) вектор X ' вычислять
рекуррентно по формулам A), то на некоторых шагах этого про-
процесса может произойти даже увеличение функции ошибки, так как
не все числа у0, . . ., ^в_х обеспечивают релаксацию.
Двухшаговый метод наискорейшего спуска. Схема сопряженных градиентов
Таблица VII.6
хт
о о о о
Г0 = Sj
0.3
0.5
0.7
0.9
1.64
—0.15214623
Ast
1.482
1.246
1.220
1.472
5.420
3.2464
0.50517496
п
—0.44866929
—0.12944800
0.08368655
0.15638246
—0.40302542
—0.05337489
0.19018891
0.29331407
As,
—0.12915358
—0.03272692
0.02000431
0.04567390
—0.09620229
*<Ч
—1.2648181
0.0650097
1.0220120
1.4854645
—0.49392752| 0.2495198з| 0.071000367
3.5143456
хт
—1.2572773
0.0434888
1.0387864
1.4818603
х«>
—1.2577994
0.0435032
1.0391674
1.4823840
-1.2577932
0.0434873
1.0391658
1.4823923
Двухшаговый метод наискорейшего спуска. Схема минимальных итераций
Таблица VII. 7
х<1»
о о о о
го = Чо
0.3
0.5
0.7
0.9
3.2464
2.2806875
1.64
0.50517496
Ад0
1.482
1.246
1.220 .
1.472
5.420
7.404024
0.79779375
0.10565625
—0.37648125
—0.58061875
0.27821271
—0.49392750
—1.7753592
Mi
0.25566113
0.06478338
—0.03959875
—0.09041200
0.19043375
хт
— 1.2648180
0.0650097
1.0220119
1.4854643
XW
— 1.2572775
0.0434887
1.0387863
1.4818599
Х<Я
—1.2577994
0.0435032
1.0391673
1.4823841
|
•
ХЩ
—1.2577932
0.0434873
1.0391659
1.4823923
§ 73] ^-ШАГОВЫЕ ГРАДИЕНТНЫЕ МЕТОДЫ НАИСКОРЕЙШЕГО СПУСКА 475
Действительно, если s = n и за
вектор Un, то Оо =
1
принять число —• а за го
= дг0Оо = q^n • так что Яо ==
= YL = p п потому q0 > 2, если р > 2.
Вычисление приближения Х( можно проводить и пользуясь мето-
методом Л-минимальных итераций. Действительно, как мы видели (стр. 445),
последовательные приближения, полученные по этому методу, при
Я» = /"о совпадают с соответствующими приближениями метода сопря-
сопряженных градиентов.
Многошаговый метод наискорейшего спуска впервые был описан
в работах Л. В. Канторовича [2], [3]. В этих работах для составле-
составления последовательных приближений фактически находились коэффи-
коэффициенты с, cs посредством решения системы s линейных уравне-
уравнений. Эта система для первого шага имеет вид
(Го. гй) — (г0, Аг0) с1 —
(/¦о, Агй)~ (г0, А2г0)с1— . .
... -~(r0, A«rQ)cs
. — (/-о, A^1ro)cs
(/"с Л'-'го) — (г0. Акг0)с,— ... — {r0, A2S Vo)cs = 0.
(8)
Для каждого последующего шага начальная невязка г0 должна
быть заменена невязкой, полученной в результате предыдущего шага.
Рассмотрим применение двухшагового метода для нахождения ре-
решения системы (9) § 23.
Вычисления по разным схемам приведены в табл. VII. 6, VII. 7
и VII. 8.
Таблица VII. 8
Двухшаговый метод наискорейшего спуска. Схема с решением систем
О О О О
Го
0.3
0.5
0.7
0.9
Аг0
1.482
1.246
1.220
1.472
5.420
А?г0
3.63564
2.90652
2.74284
3.26676
12.55176
— 1.2648177
0.0650098
1.0220119
1.4854642
ХМ
— 1.2572769
0.0434889
1.0387865
1.4818605
X®
— 1.2577994
0.0435034
1.0391674
1.4823838
X®
— 1.2577931
0.0434873
1.0391657
1.4823923
476 ГРАДИЕНТНЫЕ ИТЕРАЦИОННЫЕ МЕТОДЫ [гл. VII
Для нахождения Л"A) в табл. VII. 8 вычисляем коэффициенты сх
и с2 из системы уравнений
3.2464ct + 7.404024с2 = 1.64
7.404024Cl+ 17.164478с2= 3.2464.
Это дает
с1 = 4.5542139 с2= 1.7753589.
При s > 2 1-я и 2-я схемы предпочтительнее, так как в последней
схеме на каждом шаге процесса нужно решать вспомогательную
систему линейных уравнений.
Так же как и одношаговые градиентные процессы, s-шаговый
метод наискорейшего спуска можно включить в общую схему ите-
итерационных процессов
полагая
при
Hf\t)=X-^p^. (9)
Действительно,
У<*> = r[k)(A) Y{b-X) = Y{k-X) + (г(к) (А)-E) Y^.
Отсюда
y(k—l) | i_[(k) , .4 I p
= X -\-Hs (A) {t -
Ясно, что полиномы Н(к) (t) здесь меняются от шага к шагу.
Установим теперь сходимость s-шагового процесса наискорейшего
спуска и оценим быстроту сходимости.
Прежде всего заметим, что один шаг s-шагового процесса наи-
наискорейшего спуска дает не худший результат в смысле уменьшения функ-
функции ошибок, чем s шагов одношагового метода наискорейшего спуска.
Отсюда непосредственно следует, что s-шаговый метод наискорей-
наискорейшего спуска сходится, и для функции ошибок имеет место оценка
f (Х^кЛ <" ( ^ —'
и, следовательно,
(И)
§ 731 S- ШАГОВЫЕ ГРАДИЕНТНЫЕ МЕТОДЫ НАИСКОРЕЙШЕГО СПУСКА 477
Однако для s-шагового метода наискорейшего спуска можно
дать и лучшие оценки г), сравнивая его со стационарным итерацион-
итерационным процессом
XW^X(k-1) + Hs(A)(F-AX(k-1)), A2)
где Hs(t) некоторый полином степени s—1.
Ясно, что каков бы ни был полином Hs(t), каждый шаг s-шаго-
вого метода наискорейшего спуска будет обеспечивать не худшее
уменьшение функции ошибок, чем один шаг, проведенный по фор-
формуле A2), исходя из предыдущего приближения метода наискорей-
наискорейшего спуска. Пусть Х^ -1' это приближение, л*' следующее при-
приближение s-шагового метода наискорейшего спуска,
)). A3)
Пусть далее у<-к\ Y(k) и K(ft) соответствующие векторы ошибки.
Из формулы A3) следует, что
где
Для оценки функции ошибки положим, как это делалось неодно-
неоднократно, А = В2, где В положительно-определенная матрица. Тогда
f(X(k)) = (AY(k\ Y{k)) = {BYik\ BYm) = | В
Ho
В Y(lt) = ВФ8 (A) Y(k~1} = Фа (A)BY(k-1
и потому
Пусть
Я8=\\Ф8(А)\\. A4)
Тогда
f(Xm)<Qtf(X^) A5)
и подавно
f(^)<Qlf(X^). A6)
Матрица Ф8(А) — симметричная, так что ее норма Qs равна наи-
наибольшему из модулей ее собственных значений, которые равны, оче-
очевидно, Ф8 (к,) Ф8 (Хп).
Полином Ф8 {t), очевидно, обладает свойством Ф8@) = 1, его сте-
степень равна s, в остальном он произволен. Мы получим наилучшую
1) М. Ш. Бирман [1].
478 ГРАДИЕНТНЫЕ ИТЕРАЦИОННЫЕ МЕТОДЫ [ГЛ. VII
оценку A6), если среди полиномов указанного вида выберем поли-
полином Ф8@ таким, что Qs — max <I>g (Xj) будет наименьшим. Эта наи-
i
лучшая оценка, конечно, зависит от Xt, .... Ап.
Для класса матриц, собственные значения которых заключены
в промежутке (т, М) можно дать оценку, зависящую от чисел т
и М, наилучшую для этого класса в целом. Для этого в качестве
полинома Ф8@ следует взять полином, наименее отклоняющийся от
нуля в промежутке (т, М) и нормированный так, что Ф8@)'=1.
„ „ „ „ , М — т. М 4- т
Линейной заменой t= —^—х J—• мы сведем задачу к по-
построению полинома, наименее отклоняющегося от нуля в промежутке
— 1^Т-С1 и принимающего в точке х0 = м_т- значение 1. Реше-
Решение последней задачи 1) дается полиномом
f cossarccosx
4 ' cos s arccos т0 v '
причем максимум отклонения равен
1 1
Ls = max | Ts (x) | = •
cos s arc cos x0 | Ts (т0) '
где Ts (t) = cos s arccos x — полином Чебышева.
Известно 2), что
г /-л -
1 s\~) —
2
Поэтому
L 2
(М + т /~(М + т\* _ \в (М + т Г(М + т\* \'
\М — т^Г \М — т) ) ~Т~\М — т~\ \М — т) )
A8)
В частности,
г M — m . (M — mK
1 — M + m ' 2 ~ (M + m)^ + AmM '
1з==(М + m) [(M + my + 2mM] ' "' ^19^
Легко видеть, что
/ГКГ> ... B0)
*) В. Л. Гончаров. Теория интерполирования и приближения функций,
ГТТИ, 1934, стр. 281.
2) В. Л. Гончаров. Там же, стр. 27.
§ 73] S-ШАГОВЫЕ ГРАДИЕНТНЫЕ МЕТОДЫ НАИСКОРЕЙШЕГО СПУСКА 479
Последние неравенства означают, что при достаточно большом N
результат применения — шагов s-шагового процесса дает лучшее
приближение, чем . шагов s—1-шагового процесса.
Заметим, что в приведенных рассуждениях мы не использовали
результатов Л. В. Канторовича об оценке функции ошибок в одно-
шаговом методе наискорейшего спуска, и потому равенство
. М — т
1 = М + т
дает другой вывод оценки A0) § 70.
Можно дать и другие, более точные оценки для быстроты схо-
сходимости s-шагового метода наискорейшего спуска, если иметь более
точную информацию о расположении собственных значений матрицы А.
Так, в работе Б. А. Самокиша [1] рассматривается ситуация,
когда известно наибольшее собственное значение X, и известен проме-
промежуток (т, MJ, в котором расположены все остальные собственные
значения.
В этом случае в качестве Ф8 {t) можно взять полином наименее
уклоняющийся от нуля на множестве, состоящем из точки Хх и про-
промежутка (т, Ж,). Обозначим отклонение -от нуля выбранного поли-
полинома через Ls. Тогда
О1 гл 3 — COS —
— . , 2А, — М, — т s
/.„ < /.„, если а = —4т ; > .
Далее, Ls, монотонно возрастая, стремится при а-+оо к La_lt
построенному для промежутка (т, Mj).
Можно подсчитать, что для двухшагового метода наискорейшего
спуска
-г Мл — т ,. . \л -4- т.
' — , если Мл < —!—г;—.
Для произвольного s соответствующие оценки получаются при
помощи полиномов, изучавшихся Е. И. Золотаревым *), и оказываются
громоздкими. Б. А. Самокишем [1] предложена приближенная формула
(х, в) '
v = x-\-Yt2—
J) E. И. Золотарев. Приложение эллиптических функций к вопросу
о функциях, наименее и наиболее отклоняющихся от нуля. [Поли. собр. соч.,
вып. 2].
480 ГРАДИЕНТНЫЕ ИТЕРАЦИОННЫЕ МЕТОДЫ [ГЛ. VII
§ 74. Определение алгебраически наибольшего собственного
значения симметричной матрицы и принадлежащего ему
собственного вектора градиентными методами
Экстремальная теория собственных значений позволяет применить
релаксационные градиентные методы и к определению крайних соб-
собственных значений (т. е. алгебраически наибольшего \ и алгебраи-
алгебраически наименьшего Х„) симметричной матрицы А, так же как и
принадлежащих им собственных векторов. Действительно,
(АХ, X)
. (АХ, X)
причем собственными векторами, принадлежащими этим собственным
значениям, будут векторы, реализующие экстремум. Таким образом
задача отыскания \ или Хп связывается с задачей максимизации или
минимизации функционала
(АХ, X)
Ввиду полной аналогии теории мы рассмотрим вопрос об отыскании
алгебраически наибольшего собственного значения и принадлежащего
ему собственного вектора.
Как было выяснено в § 14, градиентом функционала \х (X) будет
где
A)
Направление градиента совпадает с направлением вектора ?, так как
(X, X) > 0. Если X не является каким-либо собственным вектором
матрицы А, то 1ф0. Во всем дальнейшем, говоря о градиенте функ-
функционала \>-(Х), мы будем подразумевать под этим вектор &.
Пусть Хо — произвольный вектор, не являющийся собственным
вектором матрицы А. Пусть
^ = A-0 + TS0. B)
Из свойств градиента следует, что при достаточно малом по мо-
модулю f справедливы неравенства (л, (Xt) > (*¦ (Хо) при f > 0 и ц (XJ <
< [х (Л"о) при у < 0.
Выясним подробнее, как ведет себя разность ^(Х,) — \>-(Х0) при
изменении у по всей вещественной оси.
§ 74] ОПРЕДЕЛЕНИЕ НАИБОЛЬШЕГО СОБСТВЕННОГО ЗНАЧЕНИЯ 481
Имеем
(AXV X,) = (АХ0, Хо) + 2Т (АХ0, ?0) + f (A-o, t0) =
Т2
ибо
Далее
ибо (А-о, Ео) = 0.
Таким образом,
2? (So, So)
- 1 + ft
где
to = /у0' у ; •
Поэтому
где
2
Из равенства D) ясно, что ft (XJ = jx (A^) при ]=0и при f = — .
Кроме того, ясно, что р.(^) — р.(^0) есть непрерывная функция от ?
при всех вещественных f, включая f = оо, так как lim [(а^!) —
— Iх (Хо)]= lim [(aC^) — {1,(^0)] = —s0. Отметим, что ^(Х^ —
7 ->- —со
— Р(ХО) = — s0 еще в одной точке, именно при 7= г- Таким
2^5
образом, график ^(Х^ — ;х(Aq), в зависимости от знака s0, имеет вид,,
изображенный на рис. 9,10, 11.
Из графиков видно, что неравенство a (XJ — (j.(A)>0 вы-
2
полняется в области 0<f<—, если s0 > 0, в области f > 0ь
S° 2
если s0 = 0, и в области у > 0 или у < — , если s0 < 0.
so
31 Зак, 974. Д. К. Фаддеев и В. Н, Фаддеева
482
ГРАДИЕНТНЫЕ ИТЕРАЦИОННЫЕ МЕТОДЫ
[ГЛ. VII
Покажем, что для данной матрицы А можно указать такой про-
промежуток изменения у, в котором \i(Xl) — i>.(X0) ;> 0 независимо от вы-
выбора Хо, т. е. независимо от величины s0. Именно таким промежут-
2
«ом является 0 < у < -^ . Действительно, при s0 ^ О, [J- (XJ —
'—li(X0)^>0 при любом положительном у, если же so > 0,- то
'i)-K*o).
2
0, при 0
«2
иоо — =
«О
2
M — m
Рис. 9.
Рис. 10.
Рис. 11.
Найдем теперь значения параметра у, при которых \у
будет принимать экстремальные значения. Из приведенных графиков
ясно, что максимум лежит направо, минимум — налево. Производная
от [J-(^i) — у- (Хо) по у (с точностью до положительного множителя)
будет
B — 2Т50) A + ft*) — 2^1 BТ —
= - Iftl — 2Т50 + 2,
и потому критические значения
из квадратного уравнения
а и а параметра у определяются
—1=0-
§ 74] ОПРЕДЕЛЕНИЕ НАИБОЛЬШЕГО СОБСТВЕННОГО ЗНАЧЕНИЯ 483.
Положительный корень этого уравнения
^зо + У^ + 4^ = 2
реализует максимум, отрицательный корень
4
«0 = ^2
2'S
реализует минимум. При этом
, (Хо + аод-, (Хо) = 2a;7f!0 '§ = fe^ ^о = ао^2о, (8)
1 ( а/' 'Т1 — a0s0
(х (^0 + ао?о) — ix (Хо) = aotl (9)
Отметим два свойства корня а0.
Действительно,
(i (A-x) — ix (|0) = jjl (Ао + ао|о) ^
на основании уравнения для а0.
2. o^KAo+OoSo) —ii(A0)<M —т. A1)
Коэффициент а0 будем называть оптимальным коэффициентом.
Рассмотрим теперь следующую группу итерационных процессов,
которые естественно назвать градиентными. Пусть Хонекоторый началь-
начальный вектор, отличный от нулевого. Построим последовательность
векторов
** = **-i + Tfc-ie*-i (ft=l. 2. ...). A2)
где
Ьн-х = АХ*-1 — У*-Л-1. A3)
(jfc_j = [л. (Afc_1), a yfc_x некоторое положительное число, выбираемое
так, чтобы во всяком случае \ik было бы меньше, чем \>ji-i-
Отметим, что если Хк_1 ф 0, то и Хк Ф 0. Действительно,
Таким образом, описанный процесс продолжим неограниченно.
Две следующие теоремы *) дают достаточные условия сходимости
градиентных методов.
1) Хестинс и Каруш [1].
31*
484 ГРАДИЕНТНЫЕ ИТЕРАЦИОННЫЕ МЕТОДЫ [ГЛ. VII
Теорема 74.1. Если на всех шагах градиентного процесса
то последовательность \>-(Хк) сходится к наибольшему собствен-
собственному значению матрицы А в инвариантном подпространстве,
порожденном вектором Хо, а последовательность векторов Хк
сходится по направлению к соответствующему собственному
вектору.
Доказательство. Пусть Ult ..., Ur — нормированные собствен-
собственные векторы, образующие базис циклического подпространства Ро,
порожденного вектором Хо, Xt > К2 > ... >/Y— соответствующие
им собственные значения. Пусть
л0 = fli Ui_-\- ... -\-ar Ur.
Тогда (теорема 11.8) а'0' ф 0, . . ., 4-0) ф 0. Без нарушения общности
можно считать, что ai > 0.
Ясно, что все векторы Xv . . ., Xk, . . . содержатся в подпростран-
подпространстве Ро и потому
Покажем, что а^ >0. Имеем
) = (Хк, Ul) = {.Xh_l, ид + и-
= (Xk_v f/
ибо все множители последнего произведения положительны.
Отметим прежде всего, что процесс может стабилизироваться,
если на каком-либо шагу окажется, что ?fc = 0. В этом случае век-
вектор Хк будет собственным вектором матрицы А и так как (Хк, и{) =
= а[к>> > 0, то этот собственный вектор будет пропорционален Ut.
Таким образом, в случае стабилизации процесса теорема доказана.
Обратимся к рассмотрению общего случая, когда Чк ф 0. Введем
обозначение
* ~~ \xk\'
Тогда
причем b(i] > 0.
§ 74] ОПРЕДЕЛЕНИЕ НАИБОЛЬШЕГО СОБСТВЕННОГО ЗНАЧЕНИЯ
Далее
485
- а{';) (Хх — jj
а<*>
а<*> (X, — ;
Следовательно,
2
k, xk)
i= 1
Так как \it < ;j2 < . . . < \'k < . . . < M =Xt, то tim ий существует.
к ->- схз
Обозначим его через и. По условию теоремы
*l< C )° (A)
Поэтому 31 ЬГ (Хг — ]JkJ~> О при fe-»oo, т. е. ?>; (X;— ''^J->0
привсех1' = 1,2 г. Если Xj—\ьфО, то Ь(к)-> О при fe—>¦ со. Этого
однако не может быть при всех г =- 1.2 г, ибо 2#* 2 = 1 • Итак,
найдется такое J, что ij. = X?-. Тогда \imbi =0 при 1ф/,
к ->- оэ
a Htn6f2=l.
Покажем, что у=1. Если допустить, что у> 1, то
bf
¦о.
С другой стороны, имеем
ai
а)
ибо
> 0, так как у > 0 по построению и \>.к х
<;j. = X^<X1. Полученное противоречие показывает, что У=1.
Итак, мы доказали, что pfc —>- Xt при k—> оо. Тем самым уста-
установлено, что ^fcJ-»-l и так как Ь^ > 0, то -^к)->1. При этом
Z»Dfc) -»• 0 при / = 2 г. Но
486 ГРАДИЕНТНЫЕ ИТЕРАЦИОННЫЕ МЕТОДЫ [гЛ. VII
Следовательно,
I xk\
т. е. последовательность Хк сходится к Ui по направлению.
Теорема 74.2. Если сверх условия теоремы 74.1 все числа ук
ограничены сверху в совокупности, то \imXk — LUlt где L неко-
торое положительное число.
Доказательство. В силу теоремы 74.1 нам надо доказать, что
\Xk\—>-L при к~>-оо. Но
(хк, хь) = (xk_v xk^)+TLi (h-v М = 0
Следовательно,
Бесконечное произведение
Н
со
сходится, ибо 2 4 сходится (так как он мажорируется сходящимся
4 = 0
оо
рядом У, ^(^+1 — I'fe))' a Tft ограничены сверху по условию теоремы.
Рассмотрим теперь несколько частных градиентных методов.
1. Yfc = T1^ const — метод постоянного множителя. В этом слу-
случае для возрастания \i.k на каждом шаге процесса при любом началь-
начальном векторе необходимо, как мы видели, выполнение неравенства
Покажем, что при выполнении этого неравенства выполняются и
условия теорем 74.1 и 74.2. Действительно, пусть у = м_т>
О < р < 2. Тогда
§ 74] ОПРЕДЕЛЕНИЕ НАИБОЛЬШЕГО СОБСТВЕННОГО ЗНАЧЕНИЯ 487
ибо i\-i <^/2. где / сферическая норма матрицы А. Действительно,
lk
(Xk, Xk) — (Xk, Afc) —
k, AXk) __ \\AXkP
{Xk, Xk)i ^ (Afc Ak) — |A-ft|s
Остальные условия теоремы, очевидно, выполняются.
2. Ya: = «л, где afc — оптимальный коэффициент &-го шага —
метод наискорейшего спуска. В этом случае [Х 2 к~1'=ак,
4-1
и потому для проверки условий выполнения теоремы 74.1 надо убе-
убедиться в ограниченности снизу чисел ак. Но мы установили ранее,
что afc^-rj , так что ограниченность снизу действительно имеет
место.
Чтобы убедиться, что условие теоремы 74.2 тоже выполнено,
нужно доказать ограниченность чисел ак сверху. Здесь, в отличие
от предыдущих оценок, оказывается, что верхняя граница существует,
но зависит от начального приближения. Именно, нетрудно видеть,
что все значения ак при достаточно больших k удовлетворяют условию
Действительно,
При достаточно большом k, и(Хк) становится сколь угодно близко
к Xj, т. е. }х (Хк) > Xj — s, при е > 0. С другой стороны, %к_1 орто-
ортогонален Хк_1 и, следовательно, %к-1 после нормировки (к единичной
длине) подходит сколь угодно близко к подпространству, ортогональ-
ортогональному к Uу. В этом подпространстве и. (X) не превосходит Х2. Поэтому
Pfe-K^ + s. при достаточно большом к. Следовательно, при
достаточно большом k
если взять е < * 2 , Таким образом, теорема 74.2 оказывается
справедливой и для метода наискорейшего спуска.
3. Yfc = P*fc> гДе хк — оптимальный коэффициент fe-ro шага,
0<Р< 1—метод неполного наискорейшего спуска. Для справед-
справедливости теоремы 74.1 надо доказать, что последовательность
488 ГРАДИЕНТНЫЕ ИТЕРАЦИОННЫЕ МЕТОДЫ (ГЛ. VII
¦ ограничена снизу. Имеем
ц (Хк+Х) - у. (Хк) __ 2afeP - 4$\ _
Следовательно,
М — т'
Справедливость теоремы 74.2 доказывается так же, как и в методе
наискорейшего спуска.
4. *Гъ = —.... = степенной метод. В этом случае
Имеем
/ V \ / V \ II ft О / V \ 1 /С Ч
Ц. (Afc + t) — ^ (Afr) rfc rfc Jp.jc — S]e jl[Aic) -f- (x (S/,-)
4 ~" <*¦ ~Ti+tl ~~
i + -f
Если Л положительно-определенная матрица, то
где / — сферическая норма матрицы А. Очевидно также, что
TV——-^—. Таким образом, в случае положительно-определенной
матрицы степенной метод является не только сходящимся, но и релак-
релаксационным, ибо на каждом шаге происходит увеличение [i.(Xfc).
В случае произвольной симметричной матрицы этого может не быть
на первых шагах процесса. Однако, если \ > — \п, т. е. алгебраи-
алгебраически наибольшим является собственное значение, наибольшее по
Таблица VII. 9
Определение наибольшего собственного значения градиентным методом с постоянным множителем у = 0.6
I
II
III
IV
'Хо
0.34
0.20
0.90
0.75
1.5281
1.8300504
ЛХ0
1.4050
0.9608
1.3120
1.2604
4.9388
2.7965
0.78278286
0.59478992
— 0.33444536
— 0.11213780
*1
0.80966972
0.55687395
0.69933278
0.68271732
2.3087048
Х2
0.81117064
0.63814979
0.60957215
0.70658793
2.3226218
X,
0.80557137
0.63972334
0.60444577
0.71601739
2.3227458
*4
0.80682530
0.64009468
0.60307521
0.71543204
2.3227486
*4
1.0000
0.7934
0.7475
0.8867
Х7
1.00000
0.79359
0.74781
0.88732
2.3227488
Таблица VII. 10
Определение наибольшего собственного значения методом наискорейшего спуска
Х0
0.34
0.20
0.90
0.75
1.5281
1.8300504
АХ0
1.4050
0.9608
1.3126
1.2604
4.9388
2.7965
«о
0.78278286
0.59478992
— 0.33444536
— 0.11213780
— 0.18-Ю
1.09095264
Ai0
0.77798318
0.76719557
0.25391984
0.59262847
2.39172706
0.91393373
Хг
0.87034015
0.60297379
0.67341123
0.67402596
2.3137407
Хо_
0.82112664
0.65447856
0.62913176
0.73573673
2.3226083
х3
0.82844787
0.65670073
0.62014585
0.73327297
2.3227463
х,
0.82774590
0.65693195
0.61926655
0.73460252
Хъ
0.82787672
0.65697730
0.61910096
0.73455418
1
2.3227487
2.3227488
х,
1.0000
0.7936
0.7481
0.8875
Хъ
1.00000
0.79357
0.74783
0.88727
о
м
)а
п
fcl
w
X
S
м
>
S
я
о
ег
В
m
О
О
т
о
н
а
га
я
о
о
со
X
>
м
л*
00
490
ГРАДИЕНТНЫЕ ИТЕРАЦИОННЫЕ МЕТОДЫ
[ГЛ. VII
модулю, то из факта сходимости по направлению векторов Хк и ?/,
следует, что [а(Лгй)->Х1 а [^(^)^-/я и, следовательно,
h li + V
начиная с некоторого места. Таким образом, и в этом случае степен-
степенной метод сохраняет релаксационный характер, начиная с некоторого
шага процесса.
В табл. VII.9 определяется наибольшее собственное значение
матрицы D) § 51 градиентным методом с постоянным у, в табл. VII. 10
методом наискорейшего спуска. В табл. VII. 11 для той же матрицы
определяется наименьшее собственное значение.
В последней строке таблиц записываются значения а (X).
На каждом шаге процесса в табл. VII. 10 оптимальный коэффи-
коэффициент находится по формуле F). Для первого шага имеем
так что
50= 0.99 231126, ^0 = 0.71392752,
2
V3.8403917 +0.99231126
= 0.67750609.
Приведем также значения
(*! = 0.60271425, а2 = 0.51669127, а3 = 0.59837767,
а4 = 0.51670397.
Таблица VII. П
Определение наименьшего собственного значения методом
наискорейшего спуска
0.34
0.20
0.90
0.75
1.5281
1.8300504
АХ0
1.4050
0.9608
1.3126
1.2604
4.9388
2.7965
0.78278286
0.59478992
- 0.33444536
-0.11213780
— 0.18-10
1.09095264
0.83773917
АЬ
0.77798318
0.76719557
0.25391984
0.59262847
2.39172706
0.91393373
Xj
— 1.2783558
- 1.0296919
1.5914454
0.9818381
X,
-2.0012022
- 0.2776540
1.0838913
1.5991528
0.24227723
Х„
— 2.0088782
-0.2691368
1.0828515
1.5917026
0.24226089
х13
1.0000
0 3140
-0.5И90
— 0.7923
§ 74] ОПРЕДЕЛЕНИЕ НАИБОЛЬШЕГО СОБСТВЕННОГО ЗНАЧЕНИЯ 491
На каждом шаге процесса в табл. VII. 11 оптимальный коэффи-
коэффициент <хк находится по формуле G). Для первого шага имеем
so = 0.99231126, ft — 0.71392752
Z ~2= — 2.0674390.
Zo = ..
/3.8403917—0.99231126
Сравнение табл. VII. 9 и VII. 10 показывает, что в данном примере
метод постоянного множителя с -[ = 0.6 сходится лишь немного мед-
медленнее, чем метод наискорейшего спуска. Объем же вычислений для
одного шага метода постоянного множителя вдвое меньше, чем в ме-
методе наискорейшего спуска.
Вопрос о выборе значения постоянного множителя пока не иссле-
исследован. Для положительно-определенной матрицы во всяком случае
, 2
в качестве т может быть взято число не превосходящее ... .
IIАII i
Вычисления, проведенные для матрицы D) § 51 при у = 0.5,
•у = 0.4, f = 0.3 и -[ = 0.25, показывают, что с уменьшением у схо-
сходимость процесса замедляется.
Применение неполного наискорейшего спуска при C = 0.8 и В = 0.9
в рассматриваемом примере оказалось не целесообразным, так как
сходимость процесса не улучшилась.
Возвратимся теперь снова к методу постоянного множителя, при-
причем будем считать на этот раз, что
Отметим следующее важное свойство последовательных приближений.
О
Лемма. Если, в методе постоянного множителя т = -^—•
и 0 < В < 1, то lim -j^r = 0 при i < j.
fc.>co 4
Здесь «(*), aW, . . ., а* коэффициенты в разложении приближе-
приближения Хк по собственным векторам Ult . . ., Ur, содержащимся в инва-
инвариантном подпространстве Ро, порожденном начальным приближением.
Доказательство. Пусть
Тогда
причем
492 ГРАДИЕНТНЫЕ ИТЕРАЦИОННЫЕ МЕТОДЫ [ГЛ. VII
Отсюда следует, что а?] > 0, ибо 1+т (Xi-<jk_1)= 1-fp ^~ > 0.
Обозначим
Очевидно, в силу выбора C
0 <ЬГ <§,_!< ... <82<81=1.
Так как «'^ —>¦ Xt, то ,ft_1) -» 8f. Поэтому
и 0<-г~<1, если / < j. Следовательно, начиная с некоторого
места,
О А U-
Выбирая s так, что -r-+s< 1, получим, что -—¦.—> 0 при /<у.
В этом „суженном" методе постоянного множителя интересным яв-
является и поведение последовательности ?^.
Теорема 74.3.') Если в методе постоянного множителя
Доказательство. Имеем
хк=4% + 4fc)t/2 + ... + Л. 4S) > о,
причем
так как г ~^> 2. Имеем далее
IV 6 \ i\ Л ч СО2 i /1 \ (Й) 2 г 1/1 \ (к) 2
\Л.т., <ij.) = U == (t\* \1ъ) и\ —4— (Лд Uj>) Wo ~i— . . . —f~ \^r №к) "г
Отсюда, поделив на а[ , после перехода к пределу получим, на осно-
основании предыдущей леммы,
Хестинс и Каруш [1].
§ 74] ОПРЕДЕЛЕНИЕ НАИБОЛЬШЕГО СОБСТВЕННОГО ЗНАЧЕНИЯ 493
Но
и, следовательно,
1
На основании § 13 (стр. 118) заключаем, что последовательность
стремится по направлению к U2.
Далее,
В качестве примера проведем описанный процесс для матрицы
.22 0.02 0.12 0.14
0.02 0.14 0.04 —0.06
0.12 0.01 0.28 0.08
.0.14 —0.06 0.08 0.26
Здесь точными-значениями являются ^ = 0.48, Х2 = 0.24, Х3 = 0.12,
Х4 = 0.06, Ul = (l, 0, 1, 1)', U2 = @, —I, —1, 1)'.
Для применения метода постоянного множителя можно взять j = 1.
Имеем
0.34
0.20
0.90
0.75
V-
0.72458928
0.00013557
0.72473074
0.72445458
0.48000000
0.008256 ¦ 10
—0.323536 • 10 ~i
—0.336452 ¦ Ю-4
0.328216 ¦ 10
0.239942
0.724591532513
0.000000981434
0.724592515860
0.724590551128
0.48000000
?43
0.000237 ¦ 10~6
—0.235470-10
—0.235923 • 10
0.235687 ¦ 10
0.23999989
Св
0.001
—0.998
—1.000
0.999
Мы видим, что при k — 43 второе собственное значение определяется
с точностью до 1 • 10~7. Собственный вектор, ему принадлежащий,
определяется значительно хуже.
Совсем иную картину мы имеем в методе наискорейшего спуска.
Здесь последовательность 1к не является сходящейся. Более того, спра-
справедлива следующая теорема.
494 ГРАДИЕНТНЫЕ ИТЕРАЦИОННЫЕ МЕТОДЫ [ГЛ. VII
Теорема 74.4. Градиенты соседних приближений метода
наискорейшего спуска ортогональны.
Доказательство. Имеем
k+l Рй + Л+1 = A
Следовательно,
(Уи> h) = (AXk' У+ «*(>% У~Рй+1№. У — ЧУн+Лъ- У
= [ 1 + 4V- (У — afc!Jfc+il (У У = О,
так как
1 1
§ 75. Решение частичной проблемы собственных значений
с помощью полиномов Ланцоша
Установленное в теореме 74.3 свойство последовательности гра-
градиентов приближений суженного метода постоянного множителя допу-
допускает обобщение, позволяющее находить несколько собственных зна-
значений и принадлежащих им собственных векторов с заранее фикси-
фиксированным числом т собственных значений, подлежащих определению.
Введем следующее обозначение. Через /?№), pW P(m-\ °^°"
значим первые т векторов Ланцоша, построенные из начального
вектора Xh, через p^(t), p[kHt) P^-iV) соответствующие им
полиномы. Ясно, что pW = Xk, pW = \k.
Теорема 75./. Пусть Xk=pW = а[кЮ1 + я^'Ц, + • • • + а&Юг
последовательность векторов в подпространстве, натянутом
на нормированные собственные векторы Uv U2, ..., Ur симме-
симметричной матрицы А, соответствующие собственным значениям
a(k) a(k) а(к)
h>\> ¦ ¦ ¦ Ж- Пусть -щ-+0, ~-+ 0, "Щ-"* при к~^°°-
Тогда, если pW = p(k)(A)pW 1-й вектор Ланцоша, то соответ-
соответствующие полиномы jo|fc) (t) сходятся к полиному pi (t) =(t — ХЛ. . .
.. . (t — Х^^, а векторы /j(fc) сходятся по направлению к вектору Ui+1.
Доказательство. Будем доказывать теорему по индукции. Для
1 — 0 утверждение справедливо, ибо
4*>
а(к)
§ 75] РЕШЕНИЕ ЧАСТИЧНОЙ ПРОБЛЕМЫ 495
Допустим, что утверждение теоремы справедливо для индексов
О, 1, .... i—1 и в этом предположении докажем его для индекса L
Имеем
где
В силу индукционного предположения
1) Pjk)(t)-+Pj(O при j<i,
2) V(P^Uj+1 при У<Л
Докажем то же самое для j = i. Имеем
Р?) @ = (* — «i^) P^'i @ — PJVffa @,
где
-У да
В силу индукционного предположения
Далее,
> 0 в силу условия теоремы. Следовательно, Bi1\ -> 0 при
и потому
496 ГРАДИЕНТНЫЕ ИТЕРАЦИОННЫЕ МЕТОДЫ [ГЛ. VII
Для доказательства второго утверждения нам надо установить,
что коэффициенты Ь$ -> 0 при &->-оо, если s=?/-|-l.
Для s>-i + 2 это устанавливается очень просто. Именно,
В силу условия теоремы -щ >0 при s^i-\-2 и, в силу уже
_ аг+1
доказанного, Р^(К)~^1
Труднее устанавливаются предельные соотношения Ь^ —>¦ 0, если
г. Для доказательства положим
где
В силу условия теоремы -^±- ->¦ 0 при s -^ t. Докажем, что
стремятся при к—>¦ со к конечным пределам. Тем самым будет уста
новлено, что bsi —>0 при 5^/.
Для доказательства используем ортогональность вектора
к векторам р№, .. ., р^1!}^ Имеем
О = (pf\ PW) = aW
Поделим это равенство на fi!|+'12/?|fc4^j+i) и перенесем члены,
начиная с г + 1-го, в другую часть равенства. Получим
C)
где
§ 75] РЕШЕНИЕ ЧАСТИЧНОЙ ПРОБЛЕМЫ 497
Система равенств C) при s = 0 I— 1 может рассматриваться.
как система линейных уравнений относительно коэффициентов
c\v еда.
При стремлении k к бесконечности коэффициенты этой системы
р№Н\\ стремятся к конечным пределам /? fX.Y В свою очередь,
к конечным пределам стремятся и свободные члены системы. Именно,
4''^— PsQh+i),
ибо
-^-+0 при
й7, + 1
Рассмотрим предельную систему
СцР0 (К) + c2iPo (хг
Эта система имеет треугольную матрицу, ибо р1 (X1)=Jo2(X1) =
= РгОъ)~ ¦ ¦ ¦ =i°i-i(^-i)=0, иее определительД^ро(Х1)р1(Хг) . . .
•• -Pi-iO^i) He равен нулю.
В силу теоремы 13.1 ее решение с^ сц будет предельным
для c\V с№).
Итак, мы установили, что последовательность effl, ..., № имеет
конечные пределы. Следовательно,
ДО = сЙ>п|-*0 при s</.
Таким образом,
а потому векторы pW сходятся к Ui+1 по направлению. Теорема
полностью доказана.
Заметим, что в процессе доказательства теоремы мы получили
оценку быстроты сходимости. Именно
==0(ж] при
498 ГРАДИЕНТНЫЕ ИТЕРАЦИОННЫЕ МЕТОДЫ [ГЛ. VII
В лемме § 74 было доказано, что последовательные приближе-
приближения Хк, вычисленные по методу постоянного множителя при 0 < f <
< -ft , удовлетворяют условиям теоремы 75.1.
Тем самым доказано, что если
/?№ J°to-i вект0Ры Ланцоша, построенные исходя из р№)==Хк,
то р(*К ..., .P^I-l сходятся по направлению к первым (в порядке
убывания собственных значений) собственным векторам, лежащим
в подпространстве, порожденном начальным вектором Хо.
Отметим, что при вычислении векторов р№> P^m-v исхол-я
из вектора Хк, приходится производить вычитание близких величин,
так что указанный процесс мало пригоден для практических вычислений.
Мы это уже видели на последнем примере § 74.
В заключение заметим, что условиям теоремы 75.1 удовлетворяет
и степенной метод. Поэтому, если
?Li векторы Ланцоша, построенные исходя кз
то р№ P^m-i СХ°ДЯТСЯ п0 направлению к соответствующим соб-
собственным векторам, лежащим в подпространстве, порожденном началь-
начальным вектором Хо.
§ 76. s-шаговый метод наискорейшего спуска
По сути дела, первое приближение Xt любого градиентного метода
лежит в подпространстве Р , натянутом на векторы Хо и АХ0, и
в методе наискорейшего спуска оно осуществляет максимизацию
функционала р(Х) в этом подпространстве. Второе приближение Х2
любого градиентного метода лежит в подпространстве Р , натянутом
на Хо, АХ0, А2Х0, третье в подпространстве Р^\ натянутом' на Хо,
АХ0, А2Х0, А3Х0 и т. д. Однако уже второе приближение, даже
по методу наискорейшего спуска, не будет максимизировать \i(X)
в подпространстве P^s\ Естественно поставить вопрос об отыскании
вектора, осуществляющего максимизацию функционала \i(X) в под-
подпространстве р(8+1>, натянутом на векторы Хо, АХ0 АвХ0, при
заранее фиксированном числе 5. Решение поставленной задачи позво-
позволит построить итерационный процесс для определения алгебраи-
алгебраически наибольшего собственного значения симметричной матрицы
и принадлежащего ему собственного вектора — так называемый s-miro-
вый метод наискорейшего спуска, который заключается в следующем.
§ 76] 5-ШАГОВЫЙ МЕТОД НАИСКОРЕЙШЕГО СПУСКА 499
Берется начальное приближение Хо, строится вектор Xv осуще-
осуществляющий максимизацию р(Х) в подпространстве Ро > натянутом
на векторы Хо, АХ0 А*Х0, затем ищется вектор Х2, осуще-
осуществляющий максимизацию \i(X) в подпространстве Р± , натянутом
на векторы Xlt AXV . . ., AsXl и т. д.
Прежде чем выяснить сходимость процесса, покажем, как осуще-
осуществляется решение задачи о максимизации \>.(Х) в подпространстве
Pos+1). В этом подпространстве выбирается какой-либо базис Vo,
Vx, ..., Vs. Пусть X любой вектор подпространства и пусть
X=baVQ + byl + ... + bsVs, A)
причем не все Ь{ равны нулю.
Сопоставим вектору .^вектор Л'арифметического пространства /?(? +1)
с компонентами b0, Ьи . . ., bs. Тогда
(Х,Х)= 2 cijbibj = (CX,X)
'-"Г _ _ »)
(АХ, X) = 2 dijbibj = (DX, X),
i = 0, / = 0
где
Очевидно, что матрица С положительно определена. Таким образом,
наша задача свелась к максимизации функционала
4 D)
(СХ, X)
в пространстве R +1\
Искомый максимум jj/°) получается как наибольший корень урав-
уравнения \D — Ct\ = O, а реализующий его вектор определяется из
системы линейных однородных уравнений (О — jj.(°)C).Af=O. Соот-
Соответствующий ему вектор Xt получается затем из разложения A).
Таким образом, наша задача сводится к решению частичной обобщен-
обобщенной проблемы собственных значений для матрицы 5-j-1-го порядка.
Если за базис взять векторы Хо, АХ0, . . ., ASXO, то
су - {А%, AjX0) = (Ai+%, Xo)
di} = (Ai+1XQ, А%) = {А*+>+1Х0, Хо).
Решение задачи сильно упрощается, если в подпространстве
взять какой-либо ортогональный базис. Очень удобным для этой
32*
500
ГРАДИЕНТНЫЕ ИТЕРАЦИОННЫЕ МЕТОДЫ
[ГЛ VII
цели оказывается базис р0, pv . . ., ps, состоящий из первых (s-f- 1)
векторов Ланцоша *). В этом случае
Cij = (Pi, Pj)
и потому
Cij —0 1фу, сц = (р{, р{). .F)
Далее dij^(Api, pj), так что
diJ — ° при |*—У|>1; dii — (Api,pi) — ai(pi,pi), ^
Таким образом,
\D — Ct\ =
«о(Ро-Ро) — t(Po,Po) k(Po,Po) 0 ... О |
Pi (Ро. Ро) Ч (Pi. Pi)—t (Pi, Pi) fa (pi, Pi) ¦¦¦ 0 ' =
0
0
0
«o(Po.Po)—^(PcPo) Pi(Po-Po) 0 .
(Pi- Pi) «i (PvPi) — t (Pu pj fa (Pi. Pi)
0
0
0
[ибо
— t(p8,Ps)\
= (Po> Po) (Pv Pi) •¦¦ (Ps'Pa)
ao —
0 0
0 0
0 0 0
где /s = (—1)8+1(/>о. Po) ¦•• (Ps< Ps), a ps+1(t) есть (s f 1)-й полином
Ланцоша.
Итак, значение (х(°) максимума \i(X) в подпространстве Pq
есть наибольший корень (s-j-l)-ro полинома Ланцоша ps+i(t).
Обратимся теперь к определению вектора, реализующего этот
максимум. Координаты b0, bl, . . ., ?s этого вектора (относительно
базиса р0, рх, .... ps) определяются из системы линейных однород-
однородных уравнений
[<*о (j°o. Po) — ^@) (Ро> Ро)] Ьо + Pi (А>. ^о) *i = О
Pi (Po, Ро) К + [^ (pv ру) — (i(°) (jolt Pi)] *! + Р2 (Pi. Pi) h = 0 (9)
i) Каруш [1].
§ 76] S-ШАГОВЫЙ МЕТОД НАИСКОРЕЙШЕГО СПУСКА 501
Сделав подстановку
{Pi. Pi) '
нимание, что ^
ления Ь[ систему
и принимая во внимание, что J3v = 7—¦ " ^ ч, получим для опреде-
r (Pi-uPi-i) *
&,' = 0
Положим
Тогда
*;=о(о)—s) ^ - рл=(^(о) - аг)Рх ?о))-
и f. д. Из предпоследнего уравнения получим
Последнее уравнение окажется удовлетворенным, так как
Итак,
и вектор Хх, реализующий максимум, дается формулой
»• (Ю)
Выведенные формулы позволяют придать следующую форму
S-шаговому методу наискорейшего спуска. За начальное приближе-
приближение берется произвольный вектор Хо. После того как построен
вектор Хк, строится вектор Хк+1 по формуле
)
i = 0V i ' vi )
где векторы /jW, p(*\ . .., р№) суть векторы Ланцоша, построенные
исходя из вектора pffl = Xk по рекуррентным соотношениям метода
минимальных итераций; [J.W — наибольший корень полинома Лан-
Ланцоша ^
502 ГРАДИЕНТНЫЕ ИТЕРАЦИОННЫЕ МЕТОДЫ [ГЛ. VII
Теорема 76.1. Пусть последовательность векторов Хо,
Хх, . . ., Xk, . . . строится так, что Хк реализует максимум
{АХ X)
/ v' v\ 8 подпространстве, натянутом на векторы Хк_и
(Л, Л)
АХк_,, ..., AsXk_v Тогда отношения ¦ к' * сходятся к наи-
большему собственному значению матрацы А в инвариантном
подпространстве, порожденном вектором Хо, а векторы Хк схо-
сходятся по направлению к принадлежащему этому собственному
значению собственному вектору.
Доказательство. Пусть г = г0 размерность инвариантного под-
подпространства, порожденного вектором Хо, \х > Х2 > ... > \г — соб-
собственные значения матрицы А на этом подпространстве, Ul, U2 Ur
соответствующие нормированные собственные векторы. Тогда
Все коэффициенты а\ , а\', . . ., аг отличны от нуля, и без нарушения
общности их можно считать положительными.
Далее, через rk обозначим размерность инвариантного подпро-
подпространства, порожденного вектором Хк. Так как каждый последующий
вектор Хк содержится в инвариантном подпространстве, порожденном
предшествующим вектором Хк_х, то rQ'^.rl'^ ... ^ гк~^> .. .
Рассмотрим прежде всего вырожденный случай, когда при неко-
некотором k окажется rfcO-f-l. Тогда подпространство, натянутое
на векторы Хк, АХк, .... АяХк, само будет инвариантным (если
ги < s -\- 1, то среди перечисленных векторов будут линейно-зави-
линейно-зависимые) и вектор Хк+1, на котором реализуется максимум у\
в этом подпространстве, окажется собственным вектором матрицы А.
На следующем шаге подпространство, натянутое на векторы Хк+Х,
АХк+х, . . ., А8Хк+1< будет одномерным, так что процесс стабилизи-
стабилизируется. В дальнейшем мы покажем, что так полученный собственный
вектор будет пропорционален Uu и тем самым для вырожденного
случая теорема будет доказана.
Обратимся теперь к рассмотрению одного невырожденного шага
процесса. Пусть
Хк = a^U, + 4к)и2 + ... + аРиг,
p(fc), j = 0 s, s -\- 1—векторы Ланцоша, построенные исходя
из вектора Хк, pW{t) — соответствующие полиномы, pW их наиболь-
наибольшие корни. Как мы видели выше, и,№ есть максимум ¦ • v' „¦. -
®т~^ (si, Л.)
в подпространстве, натянутом на векторы Хк, АХк А8Хк, кото-
который мы раньше обозначали через {iX*\ так что
§ 76] 5-ШАГОВЫЙ МЕТОД НАИСКОРЕЙШЕГО СПУСКА 50<$
Согласно формуле A1)
В свою очередь,
Следовательно,
где
U,+ ...+ aWpf) (kr) Ur.
аг ' = i
Сделаем некоторые выводы из построенных формул. Так как корни
полиномов Ланцоша разделяются, мы имеем ]*(*' •< ji^fe' •<...<
< \>-^ < ^W <; \< так чт0 l^s+'i и \ строго больше всех корней
полиномов p\k)(t). Следовательно, Ж'й) > 0. Мы предположили, что
af> > 0. Поэтому a.W > 0 a^fc+1) > 0, так что инвариантное под-
подпространство, порожденное вектором Хк+1, включает собственный
вектор Uu принадлежащий собственному значению Xv Следовательно,
если для Xk+i имеет место вырожденный случай, то на следующем
шаге в подпространстве, натянутом на векторы Хк+1, АХк+1, . . .
.... AsXk+1 (оно будет инвариантным!), максимум отношения ' .
(л, л)
будет достигаться именно на собственном векторе i/v
Теперь остается рассмотреть процесс, протекающий без вырожде-
вырождения. Прежде всего заметим, что
так что существует
lim
й:> со
Положим
Хк = \Хк\ (b^U, + • ¦ ¦ + b™Ur). A4).
Так же как при доказательстве теоремы 74.1, прежде всего дока-
докажем, что один из коэффициентов bj '^ 1, а остальные коэффициенты
\к) С этой целью снова рассмотрим отношение
k ~ (Xk, Xk) ~ x ll — РКлк)\ + +l>
504 ГРАДИЕНТНЫЕ ИТЕРАЦИОННЫЕ МЕТОДЫ [ГЛ. VU
В наших обозначениях
л offu*p_:eW
Но
Р W = (/ — of>) (* — aW) — /f > @- A6)
Здесь а^ = \ь(ХЛ, a$u) = i*(JpAft)). рB*Ч0 — второй полином Ланцоша.
Подставим в A6) * = [х (A"ft+1) = t^+r Ясно, что /^ O^+i) > 0,
ибо aWj при s> 1 больше обоих корней полинома p^(t). Поэтому
Отсюда следует, что Р^'—>0, так как первый множитель правой
ча^ти неравенства A7) стремится к нулю, а второй ограничен.
Из равенства A5) заключаем, что Щ [Х4 — jx (Xft)]2 —> 0 при всех
г=1, 2 г. Из множителей (^ — \х(Xh)) стремиться к нулю
может не более чем один, все же b\ не могут стремиться к нулю,
г
ибо 2^(*йJ—'• Поэтому ji (Хк) -> X ,¦ при некотором определенному,
i = i
а все i(fft) при i^=y стремятся к нулю и ^feJ
Таким образом, векторы Хк сходятся по направлению к
Остается доказать, что _/=1.
Если допустить, что У> 1, мы получим, что
• 0 при к —* оо.
bf>
Но, с другой стороны,
Покажем, что —щ > 1. Действительно,
4=0
§ 76J 5-ШАГОВЫЙ МЕТОД НАИСКОРЕЙШЕГО СПУСКА 505
Но 1А^с\ = 1А(-^гй+1)<1^-. так чт0 ^- больше всех корней (s-f-l)-ro
полинома Ланцоша при любом к и подавно больше всех корней поли-
полиномов pf>(t). Так как, кроме того, \ > X , то pf) (Xt) > pf) (Х^ для
/=1, 2, ..., s и, следовательно,
Таким образом,
Это неравенство выполняется при всех к и находится в противоречии
с предельным соотношением
Поэтому неравенство j > 1 невозможно. Теорема доказана.
Замечание. Если процесс наискорейшего спуска вести па
формулам
S
то вектор Xh+1 — Xk будет ортогонален к вектору Хк. В этом
случае последовательность векторов Хк будет сходиться к Ut (а не
только сходиться по направлению). Этот факт, доказанный Кару-
шем [1], легко вытекает из оценок быстроты сходимости процесса.
Теорема 76.2, В s-шаговом методе наискорейшего спуска,
при достаточно больших k, имеет место неравенство
К — Н+1 < О + s) <2s (Xt — 1Ай).
Здесь Qs есть наименьшее отклонение от нуля в точках сово-
совокупности Х2, ..., Хг полиномов Fs{t) s-й степени, нормирован-
нормированных условием Fs (X,) = 1.
Доказательство. Пусть Ф8(()—полином, реализующий наи-
наименьшее уклонение от нуля на совокупности точек Х2, . , ., Хг при
нормировке Ф8(Х1)=1.
Допустим, что построено приближение Хк. Наряду со следующим
приближением Хк+1 рассмотрим вектор Хк+1 = <&S(A)Хк. Через р.,.,
Pk+v Рк+i обозначим соответствующие значения функционала \ъ(Х).
Ясно, что
так как рк+1 есть максимум ji (X) в подпространстве
есть одно из значений [j. (X) в том же подпространстве.
506 ГРАДИЕНТНЫЕ ИТЕРАЦИОННЫЕ МЕТОДЫ [ГЛ. VII
Сравним теперь ^ — !\+1 и \ — [J-u- Пусть
разложение вектора Хк по собственным векторам, содержащимся
в инвариантном подпространстве, порожденным вектором Хо. Тогда
Xu + i ~== @l U \ ~\~ ^s B) ^2 ^2 —1 ¦ * * ~1~ s (
Далее
, .. , (АХк,Хк)
_
Таким же образом
1
Так как
|Ф8(^)[^B8 при 1=2 г,
то
1
Поэтому
где
Таким образом,
1 — Ь()
где ол = ~—. В силу теоремы 75.1, b[kJ-+1 при fe->oo, так
что afc станет меньше е при достаточно больших fe, и потому
§ 76] S-ШАГОВЫЙ МЕТОД НАИСКОРЕЙШЕГО СПУСКА 507
Полученные оценки показывают, что быстрота сходимости после-
последовательности рк к \ не меньше, чем быстрота сходимости геоме-
геометрической прогрессии со знаменателем Q^ A —|— s).
Ясно, что Qs не превосходит уклонения от нуля полинома, наи-
наименее уклоняющегося от нуля на промежутке (А2, \г) при прежней
нормировке в точке t — \. Это наименьшее уклонение равно как
известно
? J2
при
Применение двухшагового метода наискорейшего спуска к ма-
матрице D) § 51 при ^=@.34, 0.20, 0.90, 0:75)' дает
A,@) = 1.8300504
(id) = 2.3227312
(iB) = 2.3227487.
При этом
Xt =A.000, 0.799, 0.752, 0.887/
^2 = A.0000, 0.7931, 0.7479, 0.8867/.
Таким образом, применение двух шагов оказывается здесь доста-
достаточным для получения первого собственного значения с высокой
точностью. Соответствующий же ему собственный вектор опреде-
определяется со значительно меньшей точностью.
ГЛАВА VIII
ИТЕРАЦИОННЫЕ МЕТОДЫ ДЛЯ РЕШЕНИЯ ПОЛНОЙ
ПРОБЛЕМЫ СОБСТВЕННЫХ ЗНАЧЕНИЙ
Итерационные методы решения полной проблемы собственных
значений появились в самое последнее время. Естественно, что они
значительно более трудоемки, чем итерационные методы решения
частичной проблемы. Как правило, их практическое осуществление
даже для матриц не очень высокого порядка, требует применения
быстродействующих вычислительных машин.
Однако несомненным их преимуществом перед точными методами
(гл. IV) является возможность вычисления всех собственных значений,
минуя вычисления характеристического полинома.' Как уже отмечалось
выше, ошибки округления в коэффициентах характеристического
полинома могут сильно влиять на точность вычисления его корней.
§ 77. Алгорифм деления и вычитания
Алгорифм (Рутисхаузер [2]), к описанию которого мы переходим,
является надстройкой над биортогональным алгорифмом. Этот алго:
рифм позволяет определять собственные значения матрицы А как
пределы последовательностей чисел, которые строятся рекуррентно
по несложным формулам. Начальными данными алгорифма служат
коэффициенты рк и ак двучленной формы биортогонального алгорифма.
Прежде всего мы изложим теорию метода в простейшем случае,
предполагая матрицу А, для которой строится алгорифм, положи-
положительно-определенной.
Алгорифм основан на свойствах нескольких бесконечных после-
последовательностей векторов /?№), лежащих в циклическом инвариантном
подпространстве, порожденном начальным вектором Хо.
Это дает право при изложении теории метода считать все
собственные значения матрицы А попарно различными и все компо-
компоненты в разложении начального вектора Хо по собственным векторам,
отличными от нуля.
При фиксированном k векторы рФ\ / = 0, 1 я—: 1, строятся
посредством Л*-ортогонали§ации последовательности векторов Хо,
§ 77] АЛГОРИФМ ДЕЛЕНИЯ И ВЫЧИТАНИЯ 509
АХ0, .... Ап~1Х0. При всех к будет р^ = Х0, pf)=pW(A)X0,
где pW(t) = tl-f- ••• полиномы степени /.
Покажем, что векторы pW связаны простыми рекуррентными
соотношениями
Ap(k+i)_p(ft) = р^+Чр^! (г = 1, 2, ...,«)
р(*) _p(fc+i) = a(k+i)p(k+i) (/ = i, 2 л — 1). A)
(При г = и считаем pW = 0).
Действительно, вектор ApWj^—pW принадлежит подпростран-
подпространству Р , натянутому на векторы A'q, Л^о, . . ., Л*^, и Л^-орто-
гонален к векторам Хо, АХ0, . . ., Аг~2Х0. В силу единственности
нормированного вектора, удовлетворяющего этим условиям, вектор
Apf'i-i)—Р^ лишь численным множителем отличается от векторар^^.
Аналогично, вектор р(*)—-р^+г> принадлежит подпространству PW,
А "*3-ортогонален к Хо, АХ0, ..., Аг~2Х0 и, следовательно, лишь
численным множителем отличается от вектора pWj^-
Между полиномами /?(.*)(/), очевидно, тоже выполняются соотно-
соотношения
tpt\1} w—pf (о = ptVM-'i (о
B)
Выведем теперь зависимость между числами рМ и о№). С этой
целью перейдем к трехчленным соотношениям, связывающим век-
векторы p^lv р^\ P^ly Такие соотношения можно построить двумя
способами. Во-первых, исключая из соотношений
Mi}—р? } =
Apf) — Apf+V = oV
векторы Лр(^+1' и Ар^^К получим
^+(a("+1)+P(^1V^-^(")+PtV)a?+V^1 = o. C)
Во-вторых, исключая из соотношений
р(к-\)_р(к) _6(
векторы pfc1' и р^~гК получим
510 ИТЕРАЦИОННЫЕ МЕТОДЫ ДЛЯ РЕШЕНИЯ ПОЛНОЙ ПРОБЛЕМЫ [ГЛ. VIII
Сравнивая трехчленные соотношения C) и D), заключаем, что
Последние соотношения позволяют последовательно строить
числа р(^+1>, о^+Ч в порядке р<*+1), а^+У, р(*+1>, ..., р^_+У, а<^+р, ^"+1\
как только числа р^\ aW уже построены.
Вычислительными формулами алгорифма (схема деления и вычи-
вычитания— QD) являются, при k^>>\,
^ (/ = 0, 1, .... и— 1)
Р г — 1
При этом надлежит считать eW = o№) —0. Начальная строка
алгорифма
fJo ' i »-r I'n-i
определяется коэффициентами двучленных формул метода минималь-
минимальных итераций или получается из коэффициентов а4 и ^ трехчленных
формул этого метода в виде
^ = «0- ^ = -Ш-. Р?> = «*-о?>- G)
P»-i
Для вычисления собственных значений матрицы (на инвариантном
подпространстве, порожденном вектором Хо) нужно составить только
последовательность чисел pW, a|ft). Векторы же pf) строить нет
необходимости, так что их введение нужно только для пояснения
теории метода. Именно, верна следующая теорема.
Теорема 77.1. Пусть А положительно-определенная матрица,
Хо данный вектор, Xt ]> \2 ]> ... > Хг собственные значения
матрицы А на инвариантном подпространстве, порожденном
вектором Хо. Пусть pW (/ = 0, 1 г— 1) uaW(i= 1, . . ., г —1)
числа, построенные согласно схеме деления и вычитания. Тогда
Нт р(*> = А limof) = 0. (8)
& > со ft ->- со
Доказательство. Полиномы /?(*)(?) = ?*-}- ... характеризуются
условиями ортогональности (Акр№)(А)Хо, pW (А)Хо~) = 0 при г^=у. Эти
( - * \
условия можно переписать в форме \pW(A) А2Х0, р^ЦА) А2Х0) = 0,
что означает, что pW(t) суть полиномы Ланцоша, построенные
для начального вектора ^
§ 77] АЛГОРИФМ ДЕЛЕНИЯ И ВЫЧИТАНИЯ 511
к
Последовательность векторов А^Х0, очевидно, удовлетворяет
условиям теоремы 75.1. Следовательно, имеет место предельное
соотношение
Переходя к пределу в вытекающем из B) равенстве
получим
Для oW получим аналогично
Теорема доказана.
Теперь перейдем к обобщению алгорифма в двух направлениях.
Во-первых, распространим его на любые матрицы с вещественными
различными собственными значениями и, во-вторых, введем в рас-
рассмотрение более широкий класс весовых функций, управляющих
ортогонализацией. Как мы увидим ниже, рациональный выбор после-
последовательности весовых функций может значительно ускорить сходи-
сходимость процесса.
Пусть
<Ро(')=1. 9i(t) = t. ?k(t) = t(t — t2) ...(t — tk) (Л = 2, 3, ...) (9)
последовательность полиномов. Каждый последующий полином полу-
получается из предшествующего умножением на линейный двучлен.
Пусть, далее, А данная матрица, собственные значения которой
вещественны и различны, Хо и Ко некоторые начальные векторы.
Исходя из системы векторов Хо, АХ0 Ап~1Х0 и системы
векторов Ко, A'Y0 A'n~1Y0, построим системы векторов pW,
pf> P(n-i и Р^> Pf]> • • ¦> P(n-i биортогональных по весу <?к{А).
Мы будем предполагать, что начальные векторы Хо и Ко выбраны
так, что при всех & = 0, 1, ... построение векторов pW Pn-i
и pW P^n-i возможно, т. е. что процесс ортогонализации про-
протекает при любом к без вырождения.
Векторы' /Aft) вполне характеризуются выполнением следующих
двух требований:
) pp{H где р«Ю = Ч+
2) («р* (^4)pf. Л'%) = 0 при У = 0, 1 i — 1.
512 ИТЕРАЦИОННЫЕ МЕТОДЫ ДЛЯ РЕШЕНИЯ ПОЛНОЙ ПРОБЛЕМЫ [ГЛ. VIII
/ra<*> . . . mW t
l г
:(*)... m^_x
Нетрудно дать явные формулы для векторов рф) и полино-
полиномов pW(t). Именно, положив
где
мы будем иметь
.A1)
7 = 0. 1 /-!)•
mf =
) . . .
.
Поэтому вектор pW(A)X0 лишь численным множителем отли-
отличается от вектора р(*). Этот множитель равен —щ, где
A2)
Таким образом, для обеспечения невырожденного течения процесса
ортогонализации на каждом шагу нужно предположить, что все
определители ДDй) отличны от нуля.
Тогда
где
A3)
Отметим одно, важное для дальнейшего, свойство полино-
полиномов^*)^). Именно, докажем справедливость тождества
Действительно, в силу равенства <рй
= (% (^) И - *к+1Е) А>Х0, Yo) =
= («Р» (^ ^/+ ^о. Ко) — tk+l (cpfc (Л)
— 'ft+i^ имеем
, Ко) = «5*Л —
§ 77] АЛГОРИФМ ДЕЛЕНИЯ И ВЫЧИТАНИЯ
Отнимая в определителе
1
513
-i ' • ш "i-l
из каждой строки предыдущую, умноженную на,/А+1, получим
nW .. . mW I
и№+1) m(ft+1) О
о ¦ * ¦ i—i..
2*-2
Легко устанавливается, что векторы
соотношениями:
а полиномы pf>(t) — соотношениями:
—j0^ @ = Pt+iV?x @
p(f > @
связаны рекуррентными
A5)
A6)
Коэффициенты р№ и aW в свою очередь удовлетворяют соот-
соотношениям:
A7)
Эти соотношения выводятся посредством сравнения трехчленных
соотношений, связывающих векторы р^х, р^\ P^lv которые полу-
получаются двумя способами из двухчленных соотношений, точно так же,
как это делалось выше.
Соотношения A7) позволяют последовательно вычислять коэф-
коэффициенты р^+Ч и а<*+1) в порядке р^+1>, <sf+i\ pf+1\ ag+V Рп-'Р >
о'^Д1', Pn'-i^' как только числа предыдущей етроки уже вычислены.
Вычислительными формулами (схема деления и вычитания со сдви-
сдвигом) являются
(/ = 0, 1, .... я—1)
A8)
(/=1, ...,п~1).
При этом нужно считать,'что oW = a№__~Q.
33 Зак. 974. Д. К Фаддеев и В. Н. Фаддеева
514 ИТЕРАЦИОННЫЕ МЕТОДЫ ДЛЯ РЕШЕНИЯ ПОЛНОЙ ПРОБЛЕМЫ [ГЛ Vllt
Начальная строка составляется из коэффициентов двучленных
формул биортогонального алгорифма, которые могут быть вычислены
непосредственно или найдены при помощи коэффициентов трехчлен-
трехчленных формул. :
Если считать, что все ^ = 0, то формулы A8) в точности
совпадут с формулами схемы QD, выведенными выше для положи-
положительно-определенной матрицы А.
Для дальнейшего окажется полезной следующая явная формула
для коэффициента ^№\ Именно
д№) д№+1)
±±J
+
t -— 1
Для вывода этой формулы положим t = t1c+l в первом из соот-
соотношений A6). Тогда
Теорема 77.2. Если весовые полиномы %(/) и начальные
векторы Хо a Yo выбраны так, что
1) все Д1Й) ф 0,
2) последовательность tk сходится к конечному пределу х,
3) при некоторой нумераций собственных значений
1*1 —*l>l*2—t|> ••• >\К—4
то последовательности р^> сходятся к пределам Xi+1 — т, а'по-
а'последовательности а(А> сходятся к нулю.
Доказательство. Заметим прежде всего, что, при выполнении
условий теоремы, т Ф Х^ при /=1 п — 1. Равенство же т = Хп
не исключено.
Выведем асимптотические формулы для р(й+1'. Для этого оценим
прежде всего определитель Д(*). Пусть
yO = d1V1-\- .... +dnVn,
где Uu ..., Un — собственные векторы матрицы А, принадлежащие
собственным значениям Х1( ..., Хя, занумерованным согласно усло-
условию 3) теоремы. Соответственно, Vu .... Vn собственные векторы
матрицы А'. Тогда
где
§ 771 алгорифм деления и вычитания
Следовательно,
515,
(X.) X* . . .
(X.) X*
Д№ =
Здесь все суммы распространены на 5= 1, 2, .. ., п.
Матрицу, находящуюся под знаком определителя Д^ , можно
представить как произведение следующих двух прямоугольных мат-
матриц:
_ 1 х„... хг1 _
Воспользовавшись известной теоремой об определителе произве-
произведения двух прямоугольных матриц, получим
1 Xs ... ^"х 2
'= 2
... х;
i-l
Нетрудно видеть, что при достаточно большом k
и более того,
Действительно,
—г I I * S ,
0 R a Jt0 f 1
Выберем k0 настолько большим, чтобы при s^>k0
h-i - ta
где s малое число, такое, что
33*
516 ИТЕРАЦИОННЫЕ МЕТОДЫ ДЛЯ РЕШЕНИЯ ПОЛНОЙ ПРОБЛЕМЫ [ГЛ. VIII
Тогда
при k —> оо.
Поэтому преобладающим слагаемым в Д^4) будет то, в котором
5,= 1, s2 = 2, .... Si = i. Следующим по величине будет то, в ко-
котором $!—1, s2=2, .... 5i_1 = /—1. 5; = /+1. Следовательно,
х, ... хГ 2
1 х, ... хг
B0)
Эта формула верна для /=1, 2 п—1. При / = 0 мы
должны считать До&) = 1, при / = п верна точная формула
Далее,
B1)
К
1 \... Х^
Для /<n—1 величины * Д4 и
порядки малости, ибо
Д4
1+0
имеют одинаковые
рядка
При / = п—1 порядок малости
может быть выше по-
'- если T=r
§ 77] АЛГОРИФМ ДЕЛЕНИЯ И ВЫЧИТАНИЯ
Поэтому при 1^.п — 1 верна формула
517
. B2)
B3)
Отсюда получаем асимптотические формулы для p(fc+1'. Именно,
при г = 0, 1 п — 2
Для i = n верна точная формула
Для p^''_V! асимптотическая формула имеет более простой вид
Переходя к пределу, получим
limp(*+1>=X. —х A = 0, 1 и—1),
что и требовалось доказать.
При доказательстве теоремы мы получили и оценку быстроты
сходимости последовательностей p(fc>.
Остается доказать, что последовательности а<*) стремятся к нулю.
Имеем
Мы уже установили, что —^
k ^ h
и, следовательно, при
X. —т
Поэтому ] a(fc)| < ] oj*o) | qk-K -» 0.
518 ИТЕРАЦИОННЫЕ МЕТОДЫ ДЛЯ РЕШЕНИЯ ПОЛНОЙ ПРОБЛЕМЫ [ГЛ. VIII
Из доказанной теоремы следует, в частности, что если взять
t2 = t3=...—O (схема QD), то при \\ | > | л2| > . . . > |ХП|,
получим
р
Точнее
B6)
Таким образом, результат теоремы 77.1 распространяется на
любые матрицы с вещественными собственными значениями, удовле-
удовлетворяющими неравенствам |^i|>|^2|> ... >|^»|. если только
предположить, что все Д(*> не равны нулю.
В работе Рутисхаузера [2] рассматривается и случай комплекс-
комплексных собственных значений, а также возможные вырождения про-
процесса. Задача вычисления собственных векторов рассмотрена в ра-
работе [4].
Сходимость алгорифма деления и вычитания, особенно при нали-
наличии близких собственных значений, довольно медленна. Так как этот
процесс к тому же не самоисправляющийся1 при длительном его
проведении возникает опасность некоторого накопления ошибок
округления. Тем более интересна возможность использования сдвигов
для ускорения сходимости процесса. Именно, при некотором опре-
определенном выборе сдвигов получается процесс с квадратичной схо-
сходимостью поочередно для каждого собственного значения.
Теорема 77.3. Пусть на некотором шаге процесса QD (со
сдвигом или без сдвига) в условиях предыдущей теоремы уже
получено, что
\K-№U-tu\<*-
Тогда, взяв
получим
где (J.— некоторая константа.
Доказательство. Можно доказать, что в асимптотической фор-
формуле B5) порядок остаточного члена, в условиях теоремы 77.2,
оказывается точным. Именно,
+«,>
].
где М — некоторая константа, sft ->¦ 0. Поэтому
§ 77] АЛГОРИФМ ДЕЛЕНИЯ И ВЫЧИТАНИЯ . 519
где г'к —>0. При ":
имеем
ля Pn-1 'fc + 1 кп Pn-1 cft ^ 4 /ч
откуда
IX о^+Ч t I — ^~f"-'~^ п | ?'
|л» P»-i rfc+i|— IXb-j —f4| l1^^
при
Опишем теперь упомянутый процесс с ускорением. Допустим для
простоты, что все собственные значения положительны и \ > \г >
> . . . > Х„.
Пусть сделано несколько шагов алгорифма QD без сдвига, так
что в грубом приближении последний столбец начал стабилизиро-
стабилизироваться. Пусть это произошло на k1 шаге. Тогда берем ^+1=p^i\i
t.. =p<?t+1)-\-tk +1, ... В новом процессе мы получим квадратич-
квадратичную сходимость последовательности tk к Хп; последовательности же
a\i-i и Pn*-i СХ°ДЯТСЯ с той же быстротой к нулю.
Пусть при k = k2 числа u^j и pWj практически станут равными
нулю. Тогда можно принять, с той же степенью точности, Х^рк/*,
и перейти к процессу с ускорением для определения )-„_!. Именно,
полагаем *fti+1 = p(?>a, /fci+a =P^i+21) + ^2+1, ••• При этом мы вы-
вычеркиваем из схемы столбец, состоящий из значений р^, так как
последние более не нужны ни для определения Хи, ни для продолже-
продолжения схемы, ибо oWj стало и остается равным нулю. После опреде-
определения Х^.^ переходим, поочередно, к определению Хп_2, ~кп_ъ, . .., \.
То, что в этом процессе для каждого собственного значения
будет иметь место квадратичная сходимость, следует из того, что по
ходу процесса векторы рЮ, р[к\ ..., р^]_\ будут попадать в инва-
инвариантные подпространства убывающих размерностей и Xn_j, Xn_2, . . .
..., \ будут играть поочередно роль наименьших собственных зна-
значений.
Указанный процесс можно применять уже при переходе ко вто-
второй строке, полагая t2 = pW_v t3 — ^2==Ри-1 ••• При этом, однако,
несколько первых сдвигов будут иметь случайный характер, и про-
процесс начнет быстро сходиться, лишь как только, один из сдвигов
окажется близким к какому-либо собственному значению. Именно
Таблица VIII. 1 <*
«и..
; i
' 2
. 3
13"
14;'
. 21
; 22
• 69
0
, 0
¦0,
0-
0
0
.; #>
2.3
2.318
2.32154631
2.32274877
2.32274878
0.018
0.00354631
0.00086282
0.00000001
0
Схема QD без
0.45668599
0.56483658
0.64195158
0.77144752
0.77580825
0.79176600
.0.79272376
0.79670669
ф
0.11169690
0.07797782
0.04187854
0.00436073
0.00370478
0.00095776
0.00077598
0.00000002
СДВИГОВ
0.39432359
0.34476467
0.35983483
0.65910897
0.65545035
0.64226676
0.64149080
0.63828384
4*>
0.02841890
0.05694870
0.10032731
0.00004616
0.00001706
0.00000002
0.00000001
,?>
0.69087470
0.63392600
0.53359869
0.24228792
0.24227086
0.24226076
0.24226075
0
0
0
0
0
0
S
4.00000008
4.00000008
4.00000008
4.00000008
4.00000008
Схема QD со сдвигами
Таблица VIII. 2
к
1
. 2
3
¦ 4
5
6
; 7
8
9
¦ 10
: 11
, 12
0
0
0
0
0
0
0
0
0
0
fo
2.3
1.62712530
1.88650993
1.74666689
1.70093830
1.68571630
1.68447566
1.68446492
1.52212470
1.52601476
0.018
0.00505207
— 0.00034156
0.00004267
-0.00000591
0.00000183
-0.00000037
0.00000009
-0.00000002
0.00000001
0.45668599
— 0.12754388
-0.21819971
—0.23556821
—0.52182138
-0.34109351
— 0.42142991
— 0.38646683
-0.56228077
-0.55450062
-0.55444604
0
0.11169690
— 0.34532995
0.12217565
— 0.24048782
0.19594579
— 0.07909430
0.03497354
— 0.01347365
0.00389008
0.00002729
0
0.39432359
0.07719774
0.46368721
0.42517207
0.13768376
0.18634588
0.14888740
0.16234031
— 0.00389008
— 0.00002729
0
•?>
0.02841890
0.25433256
— 0.13950148
-0.04577126
— 0.01521609
—0.00124247
-0.00001037
0
0.69087470
—0.25433256
0.13950148
0.04577126
0.01521609
0.00124247
0.00001037
0
'к
0
0.69087470
0.43654214
0.57604362
0.62181488
0.63703097
0.63827344
0.63828381
0.80062412
0.79673404
0.79670675
0.24226071
У
0.63828381
2.32274880
0.79670675
0.24226071
и
¦о
>
S
о
S
¦в
га
В
и
о
in
О
SS
Е
§ 77J АЛГОРИФМ ДЕЛЕНИЯ И ВЫЧИТАНИЯ 521
это собственное значение будет определено первым. Следующим,
вообще говоря, определится собственное значение, ближайшее к по-
полученному.
Применение сдвига возможно,и на первом шагу процесса, т. е.
можно взять весовой полином ср?с(О равным (t — t^)(t —12) ... (t—ik)
при ttr^0. Это влечет за собой изменение начальной строки про-
процесса. Легко видеть, что она в этом случае должна быть построена
по формулам
Йг) = «о — к
W = ^- (/=1. 2. .... я—1)
-ai —^i a=L 2 п—\).
В этой форме QD процесс полезен для уточнения полученного
каким-либо другим способом грубого приближения к одному из соб-
собственных значений. За ty следует взять это известное грубое при-
приближение и далее применять процесс QD со сдвигами так, как он
описан выше.
В табл. VIII. 1—VIII. 6 приводится числовой материал, иллю-
иллюстрирующий ход QD процесса.
В табл. VIII. 1 дается ход QD процесса без ускорения для по-
положительно-определенной матрицы D) § 51. Первая строка таблицы
заполняется по данным табл. VI. 16.
В табл. VIII. 2 приведен для той же матрицы QD процесс со
сдвигами
В этом случае все четыре собственных значения определяются
после двенадцати шагов процесса.
В табл. VIII. 3 дается ход QD процесса для не положительно-опре-
положительно-определенной (и даже несимметричной) матрицы Леверье. Первая строка
схемы взята из табл. VI. 17.
В табл. VIII. 4 приводится для матрицы Леверье QD процесс
со сдвигами
Г1 h *3 Г4 Г5 *6 U
Наибольшие корни получились с невысокой точностью из-за не-
некоторой потери точности на 7-м и 8-м шагах.
В табл. VIII. 5 дается уточнение наибольших корней матрицы
Леверье при помощи схемы QD с постоянными сдвигами. ;
Наконец, в табл. VIII. 6 дается уточнение первого собственного
значения с изменением начальной строки процесса на tl = '— 17.863248
и с последующими постоянными сдвигами. ;
Схема QD без сдвигов
Таблица VIII. 3
СП
to
k
1
2
3
Л
5
6
35
137
— 7.5036210
— 7.7385254
— 8.1399653
— 8.8504320
— 10.002719
— 11.544774
— 18.653538
-17.869245
-0.23490436
— 0.40143988
-0.71046673
— 1.1522872
-1.5420554
— 1.5765705
0.06359643
0.00024064
Pi4
-13.224755
-14.406079
-14.354282
-13.386200
-11.«03176
-10.018732
-16.425749
-17.146687
— 1.5827643
— 0.65867010
-0.18420479
0.04096872
0.20787398
0.47753345
— 0.00000001
P?>
— 5.9951147
— 4.0143429
2.9772056
— 59.888936
— 23.015289
— 20.700562
— 7.5740424
1.3221017
6.8073437
— 62.825173
37.081521
2.7922606
0.61041324
— 0.00000061
p?>
-20.669372
-27.476717
35.348456
— 1.7330650
- 4.5253256
— 5.1357388
- 5.2986996
s
—47.888430
—47.888431
—47.888430
-47.888430
—47.888430
—47.888431
Схема QD со сдвигами
Таблица VIII. 4
k
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
—11.544774
— 7.9856057
— 9.7988040
—10.290623
—10.181126
— 7.7364329
— 6.8766234
— 5.5325301
- 2.0540356
76.093836
38.050238
19.031758
9.5291528
4.7910870
2.4482714
1.3273203
0.85398642
0.72281046
0.71090752
0.71080788
— 1.5765705
— 1.9779636
— 0.49000869
0.10949348
0.33883939
0.69227548
1.3421359
3.4784943
30.167151
-19.021799
— 9.5092398
- 4.7513026
- 2.3690329
— 1.1714078
— 0.56047554
- 0.23666694
— 0.06558798
— 0.00595147
— 0.00004982
0 ,
-10.018732
- 2.4274962
2.2994616
-31.506594
-15.806140
-13.331923
- 14.338991
- 17.813570
-47.980721
-19.021799
- 9.5092398
- 4.7513026
— 2.3690329
— 1.1714078
- 0.56047554
- 0.23666694
— 0.06558798
- 0.00595147
- 0.00004982
0
0.47753345
4.0721838
- 33.694752
16.039290
1.0606388
0.16753398
0.00195743
0.00000022
0
- 20.700562
-19.026594
14.997689
- 1.0452212
- 2.1058537
- 0.16753398
- 0.00195743
— 0.00000022
0
0.61041324
0.16476533
— 0.00181012
0.00000313
0
- 5.1357388
— 0.16476533
0.00181012
-0.00000313
0
'ft
0
- 5.1357388
— 5.3005041
- 5.2986940
- 5.2986971
— 7.4045508
- 7.5720848
- 7.5740422
- 7.5740424
^55.554763
- 36.532964
- 27.023724
-22.272421
-19.903388
-18.731980
-18.171504
-17.934837
-17.869249
-17.863298
-17.863248
— 17.152440
о
я
S
г
га
S
га
I
33
-а
Ml
Е
га
я
о
о
3
о
СП
Таблиц VIII. 5
Уточнение собственных значений по схеме QD с постоянными сдвигами
k
1
2
3
4
1
2
3
4
— 7.5036210
10.124723
10.431551
10.512406
— 7.5036210
9.4139146
9.7439104
9.8121496
— 0.23490436
0.30682839
0.08085477
0.04707054
— 0.23490436
0.32999583
0.06823921
0.04628936
Pf)
— 13.224755
2.7489003
6.1199180
11.565664
— 13.224755
2.0149249
6.6559696
12.107273
,?>
—1.5827643
3.4518725
5.4928163
0.68361875
—1.5827643
4.7092839
5.4975926
— 0.56503756
Р?>
— 5.9951147
9.7383625
1.4394264
0.75581584
1.3221017
— 2.8061198
0.0Э00319
0
|
— 5.9951147
7.7701431
—1.2443746
— 0.67935654
1.3221017
— 3.5169251
— 0.00001950
0
Р?»
— 20.669372
— 0.00000420
— 0.00001239
— 0.00001239
— 20.669372
— 0.00000690
0.00001260
0.00001260
tk
0
— 17.863248
— 17.863248
0
— 17.152440
— 17.152440
h
— 17.863260
—17.152427
Таблица VIII. 6
Уточнение собственного значения по схеме QD с измененной первой строкой
-з
О
ta
га
и
х
я
s
X
S
к
1
•2
3
Р?>
10.359627
10.529771
11.213829
0.17014447
0.68405768
0.51812919
й*>
4.2334445
8.4937461
11.084713
4.9443593
3.1090958
0.20977372
Й*>
5.3410097
0.74789640
0.53813359
— 1.4840175
0.00001091
0
Pf>
— 0.00000550
— 0.00001641
— 0.00001641
tk
— 17.863248
— 17.863248
к
— 17.863264
СЛ
ю
524 ИТЕРАЦИОННЫЕ МЕТОДЫ ДЛЯ РЕШЕНИЯ ПОЛНОЙ ПРОБЛЕМЫ [ГЛ. VIII
§ 78. Треугольный степенной метод
Треугольный степенной метод (Бауэр [7]) является обобщением
ступенчатого степенного метода, приспособленным для нахождения всех
собственных значений матрицы А. Мы будем предполагать, что все
собственные значения матрицы А вещественны и различны по абсо-
абсолютной величине. Обозначим их Хи .... Хп, занумеровав в порядке
убывания абсолютных величин.
Для обоснования треугольного степенного метода проведем сле-
следующие рассуждения. Пусть К и М произвольные матрицы. Рас-
Рассмотрим последовательность матриц А — КА М. Каждую из этих
матриц представим в виде произведения левой треугольной матрицы Си
с единичными диагональными элементами, диагональной Dk и пра-
правой треугольной Вк с единичными диагональными элементами'
л{^) С D R
Предполагается, что такое разложение возможно при всех к.
Тогда, при некоторых дополнительных ограничениях, матрицы
таковы, что
Игл
а матрицы Ск и Вк стремятся к предельным матрицам.
Докажем это. Прежде всего отметим (§ 1, п. 12), что
B)
где ffl верхний главный минор /-го порядка матрицы Л '. Оце-
Оценим ?^К Пусть А^Р^АР, где Л^^ Хп\. Тогда
А(к) = КАкМ = КР'^РМ.
Положим
Тогда
Чпп-
АкРМ-
~Рп
•• Рпп_
C)
§78]
ТРЕУГОЛЬНЫЙ СТЕПЕННОЙ МЕТОД
525
Д< '
Матрица минора Д< ' есть произведение двух прямоугольных матриц,
из которых первая составлена из первых / строк матрицы КР1,
вторая из первых i столбцов матрицы Л РМ. Поэтому
Pjti ¦ ¦. Phi
Phi
4
При достаточно большом k преобладающим слагаемым в
будет, вообще говоря, слагаемое, соответствующее _/j=l, ...
.. ,, уj = /. Вторым по величине слагаемым будет слагаемое, соот-
соответствующее /^=1, ..., ji_l = l—1, ji = t-\-\. Это верно, если
Яп
Ян
и Я„ =
Рп
Рн
Рп
Ра
ФО.
E)
Последние условия мы будем предполагать выполненными при
всех /. В этом предположении
о
Следовательно,
4-1 v«-ii-i"<-i<-i
Подобным же образом
Поэтому
F)
G)
_. »-.). (8,
Для наименьшего по модулю собственного значения мы получим
(9)
Обратимся теперь к исследованию матриц, Вк и Ск. Напомним
явные формулы для элементов матриц Вь и Ск (§ 1, п. 12). Именно,
, (к) _ Р§|
Сц = ¦
526 ИТЕРАЦИОННЫЕ МЕТОДЫ ДЛЯ РЕШЕНИЯ ПОЛНОЙ ПРОБЛЕМЫ [ГЛ. VIII
где Pii' = 7«' = М'\ a fyff и -^ суть некоторые миноры Z-ro по-
рядка матрицы А .
Очевидно, что рассуждения, которые мы применяли для оценки
главных миноров Д; , остаются в силе для оценки любых миноров,
так что
A0)
Здесь Qy, Рц, Qjit Pji некоторые миноры /-го порядка, соста-
составленные из элементов матриц КР~Х и РЖ. Поэтому
(И)
Таким образом, при сделанном выше предположении о неравен-
неравенстве нулю всех определителей Qu и Рц, все элементы by и с^
имеют пределы при k —>• со, причем равенства A1) дают оценку
быстроты сходимости.
Перейдем теперь к описанию вычислительной схемы метода.
Пусть Со произвольная матрица, А матрица с различными по
абсолютной величине вещественными собственными значениями, для
которой требуется решить полную проблему собственных значений.
Строим последовательность левых треугольных матриц Cv С2, ...
. . ., Ск, ... с единичными диагональными элементами посредством
рекуррентных соотношений:
АСХ = C2R2
' ' ' • ' ' 02)
Здесь Rt, Rz Rk, ...—правые треугольные матрицы.
Процесс следует вести до тех пор, пока матрицы Ск не стаби-
стабилизируются с достаточной точностью. То, что lim Ck существует,
легко доказывается. Именно, исключая из соотношений A2) матрицы
Clt С2, ..., Сй_х, получим
AkC0^CkRkRk^ ... Rx. A3)
§ 78] ТРЕУГОЛЬНЫЙ СТЕПЕННОЙ МЕТОД 527
Матрица RkRk-i ... Rx— правая треугольная. Поэтому матрицы Ск
и Rk #j._i .. . Rt совпадают с матрицами Ск и DkBk в предыдущих
обозначениях, построенных для матрицы
Следовательно, lim Ск = С существует.
к ->.оо
Одновременно со стабилизацией матриц Ск стабилизируются
и матрицы Rk, ибо при k —> с>о
Rk^Ck1ACk_l^-C~1AC=,R. A4)
Знание предельных матриц С и R дает возможность решить
полную проблему собственных значений для матрицы А.
Действительно, из равенства A4) следует, что собственные зна-
значения матриц А и R совпадают, а собственные векторы ?Д Un
матрицы А равны соответственно CVX CVn, где Vlt ..., Vn
собственные векторы матрицы R. Матрица R треугольная, так что
ее собственные значения равны ее диагональным элементам, а соб-
собственные векторы Vu ..., Vn легко определяются из решения тре-
треугольной системы.
Быстрота сходимости диагональных элементов матриц к искомым
собственным значениям может быть оценена из следующих сооб-
соображений.
Прежде всего из равенства
следует
Поэтому диагональные элементы матрицы Rk совпадают с диа-
диагональными элементами матрицы DkD^Llt быстрота сходимости ко-
которых к собственным значениям оценивается формулами (8) и (9).
Матрицы Ск и Rk можно вычислять на каждом шагу, пользуясь
компактной схемой метода Гауса. Однако матрицы Rk до стабили-
стабилизации процесса вычислять нет необходимости, так как для решения
поставленной задачи нужна лишь предельная матрица R.
Это позволяет ограничиться лишь вычислением матриц Ск, для
чего можно использовать, например, схему единственного деления
(с исключением по столбцам), применявшуюся в § 17 для вычисле-
вычисления определителя. Та же схема доставит нам диагональные элементы
матрицы Rk, так что приближенное определение собственных зна-
значений матрицы А не потребует дополнительных вычислений. Если
же нужно определить и собственные векторы, то на последнем шагу
процесса необходимо вычислить всю матрицу Rk, которая дает при-
приближенное значение для предельной матрицы R.
528 ИТЕРАЦИОННЫЕ МЕТОДЫ ДЛЯ РЕШЕНИЯ ПОЛНОЙ ПРОБЛЕМЫ [ГЛ. VIII
Треугольный степенной метод является самоисправляющимся про-
процессом, ибо каждое приближение Ск можно считать начальным при-
приближением.
В § 57 мы упомянули о связи ступенчатого степенного метода
с треугольным степенным методом. Теперь можно сказать об этом
несколько подробнее. Именно, r-ступенчатый степенный метод можно
излагать так. Исходя из прямоугольной матрицы с г столбцами С<г>,
надо образовать прямоугольную матрицу АСр, которую затем пред-
представлять в виде произведения левой ступенчатой прямоугольной ма-
матрицы С[' с единичной главной диагональю и правой треугольной
матрицы /?W r-ro порядка. Далее процесс повторяется. Легко ви-
видеть, что если матрицу С'р каким-либо образом дополнить до квад-
квадратной матрицы Со и применить к ней треугольный степенной метод,
то матрицы Ск' будут совпадать с матрицами, составленными из
первых г столбцов матриц Ск, а матрицы /?М будут левыми верх-
верхними клетками r-го порядка матриц Rk.
Поэтому суждения о сходимости треугольного степенного ме-
метода переносятся без изменения на л-ступенчатый метод.
Треугольный степенной метод допускает модификацию со сдви-
сдвигами. При надлежащем выборе сдвигов можно добиться квадратич-
квадратичной сходимости поочередно к каждому собственному значению.
Обоснование такой модификации заключается в следующем. Пусть
%(') = (' — *х) ¦¦¦ (t — h) A5)
последовательность полиномов, таких, что каждый последующий по-
полином получается из предыдущего умножением на линейный двучлен.
Предполагается, что tk->x и собственные значения матрицы А
в некоторой нумерации удовлетворяют условиям
Тогда, как мы видели в § 77,
nf^ _>0 при
)
Рассмотрим последовательность матриц
Ак) = К^к{А)М. A6)
где К и М некоторые фиксированные матрицы. Нетрудно провести
оценки миноров любого порядка, составленных из элементов матриц (Л)
Именно, любой минор порядка i равен
§ 78] ТРЕУГОЛЬНЫЙ СТЕПЕННОЙ МЕТОД . 529
где Q и Р некоторые числа, зависящие от расположения минора
внутри матрицы Ак. В частности, для верхних главных миноров
имеем
причем Qa и Pit имеют тот же смысл, что и в предыдущем пара-
параграфе. Вывод этих асимптотических формул ничем не отличается
от только что сделанного расчета для случая mk(t) = t ¦
Представляя матрицы А в виде
где матрицы Ск, Dk и Вк имеют прежнее строение, получим, оче-
очевидно, что
^фг^-*. A8)
а матрицы Ск и Вк стремятся при ft->oo к некоторым предельным
матрицам.
Вычислительная схема треугольногостепенногометода
со сдвигом такова. Берется произвольная матрица Со, составля-
составляется матрица (А — txE)C0, которая затем раскладывается в произведе-
произведение левой треугольной матрицы Ct с единичной главной диагональю
и правой треугольной матрицей Rv Далее, составляется матрица
(А — t^C^ и раскладывается в произведение треугольных матриц С2
и /?2 прежнего строения. Процесс продолжается. Ясно, что
CkRkRk_l... Rv A9)
Отсюда следует, что существуют предельные матрицы
С= lijn Ck и R= lim Rk,
и что Rk = DkBkBkUDuU, B0)
так что диагональные элементы г(й> матриц Rk совпадают с диаго-
диагональными элементами матриц DkDk\, которые, как мы видели, стре-
стремятся к числам \i — х. Точнее,
при i= 1, 2, .... п— 1.
Для последнего диагонального элемента /W асимптотическая фор-
формула будет проще. Именно,
34 Зак, 974. Д. К. Фаддеев и В. Н. Фаддеева
530 ИТЕРАЦИОННЫЕ МЕТОДЫ ДЛЯ РЕШЕНИЯ ПОЛНОЙ ПРОБЛЕМЫ [ГЛ. VIII
Для обеспечения квадратичной сходимости следует за ^+1 при-
принимать tk-\-rn Д° тех пор. пока, при некотором k — ku число г«
не станет равным нулю с требуемой степенью точности. Затем нужно
вычеркнуть из матрицы Cfcl последний столбец и перейти к ступен-
ступенчатому алгорифму при числе столбцов, равном п—1, принимая за
сдвиги числа tk+1==tk-\- r^li, k > kv После того как r^-i ока-
окажется практически равным нулю, из матрицы С^ вычеркивается по-
последний столбец и процесс продолжается как ступенчатый си — 2
столбцами и т. д.
Приближенными значениями для собственных значений будут
числа tk,, tk, tkn.
§ 79. ?/?-алгорифм
/,/?-алгорифм (Рутисхаузер [5]) заключается в следующем.
Матрица А раскладывается в произведение двух треугольных матриц
(левой и правой)
A = LlRv A)
причем левая матрица берется с единичными диагональными элемен-
элементами. Далее составляется матрица RtLx и для нее строится анало-
аналогичное разложение
RlL1 = L2R2. B)
Затем процесс повторяется. Таким образом, в результате про-
процесса строятся две последовательности матриц Llt L^, . .. и Ru R2
связанных соотношениями
А = L^
C)
Установим связь между /-/^-алгорифмом и треугольным степенным
методом при Со —?. С этой целью положим
L L ... Lk = Ck. D)
Ясно, что Ск есть левая треугольная матрица с единичной главной
диагональю. Докажем теперь, что
АС = С R E)
Для k = 1 имеем
§79]
LR-алгорифм
531
Допустим, что равенство E) справедливо для индексов, меньших к,
и докажем, что оно верно и для индекса k. Имеем
АСк_1 = ACk_2Lk_l = Ck-i^k-iLk-i — C]e^iLkRk = CkRk.
Тем самым равенство E) доказано.
Из равенства E) следует, что матрицы Ск и Lk /./^-алгорифма
совпадают с одноименными матрицами треугольного степенного ме-
метода при С0 = Е. Тем самым доказано, что в условиях сходимости
треугольного степенного метода диагональные элементы матриц Rk
сходятся к собственным значениям матрицы А.
Алгорифм LR по своей вычислительной схеме несколько проще,
чем степенной треугольный метод. Однако он не является само-
самоисправляющимся алгорифмом. Кроме того, он менее приспособлен
к определению собственных векторов матрицы, ибо для решения
этой задачи требуется восстановить матрицу Ск, что сводится к пере-
перемножению большого числа треугольных матриц и может сопрово-
сопровождаться нарастанием ошибок округления.
Следует отметить связь алгорифма LR с алгорифмом QD. Именно,
соотношения
p(
лежащие в основе QD алгорифма, равносильны следующим матрич-
матричным равенствам
p<*> 1
pW 1
о
О
1
Ря-1
1
о
О
о
о
Q
О
34*
532 ИТЕРАЦИОННЫЕ МЕТОДЫ ДЛЯ РЕШЕНИЯ ПОЛНОЙ ПРОБЛЕМЫ {ГЛ. V1I1
так что алгорифм QD можно рассматривать как /,/?-алгорифм, при-
примененный к некоторой начальной матрице
J— /.!#! —
О
О
О
о
a0 1
}i «, 1
. 1
Pn-i an-l_
где 0Cj = p;
Напомним, что в алгорифме QD в качестве исходных, значений
р'1' и а*1) берутся коэффициенты двучленных соотношений биортого-
нального алгорифма. Тем самым числа щ и {34, определяющие ма-
матрицу J, являются коэффициентами трехчленных соотношений биорто-
гонального алгорифма. Как мы видели, матрица У получается из
матрицы А преобразованием подобия, вызываемым переходом к ба-
базису, состоящему из векторов р0 Pn-v Поэтому собственные
значения матрицы У, а следовательно, и матрицы J совпадают
с собственными значениями матрицы А.
Применение алгорифма LR к матрицам общего вида требует
очень большого числа вычислительных операций. Число операций
значительно сокращается, если исходная матрица является ленточной,
т. е. такой, для элементов а^ которой выполняются равенства а^ =_0
при |/ — у|>т, где т некоторое число, значительно меньшее, чем
порядок п матрицы. Иными словами, ленточная матрица имеет вид
¦\ о
Сокращение числа операций в этом случае происходит за счет
того, что все последующие матрицы LkRk будут оставаться ленточ-
ленточными того же строения.
§ 80] ЛР-алгорифм 533
?/?-алгорифм допускает модификацию со сдвигами, рав-
равносильную соответствующей модификации степенного треугольного
метода при Со — Е. В этой модификации процесс происходит по сле-
следующему предписанию:
F)
где Lk и Rk матрицы прежнего строения.
Обозначим
Z.jZ-2 ... Lk = Ck
и убедимся в том, что
(Л — tkE)Ck_l = CkRk.
Для &=1 это верно при С0 = Е. Пусть утверждение верно для
индексов, меньших к. Докажем, что оно верно и для индекса k.
Действительно,
(А — tkE) Cfc_, = (A — tk^E) Ck_, — (tk — 4-х) Ck.t =
= Ck-lRk-l^k-l Ук ^fc-l)
= Ск_х (Ял_1/.й_1 — (tk — tk_t) E) =
= Ck-\LkRk = CkRk.
Тем самым мы убедились в том, что матрицы Ск и Rk совпадают
с одноименными матрицами треугольного степенного метода со сдви-
сдвигами /j, t2, ...
Так же как и в § 78, можно подобрать сдвиги так, чтобы
соответствующий метод LR со сдвигами имел квадратичную сходи-
сходимость. Именно, при этом следует брать
где /W — последний диагональный элемент матрицы Rk.
§ 80. АР-алгорифм
Вычислительная схема ЛР-алгорифма J) близка к вычислительной
схеме ?/?-алгорифма, но несколько более трудоемка на каждом шагу.
Сходимость же процесса, в условиях сходимости треугольного сте-
степенного метода, является квадратичной.
*)Рутисхаузер и Бауэр [1].
534 ИТЕРАЦИОННЫЕ МЕТОДЫ ДЛЯ РЕШЕНИЯ ПОЛНОЙ ПРОБЛЕМЫ [ГЛ. VIII
Алгорифм позволяет последовательно вычислять матрицы Ск тре-
треугольного степенного метода с номерами k, являющимися степенями
двойки (при Со — Е).
Положим
A*m = Aj:m, A)
где Ат—левая треугольная матрица с единичной главной диаго-
диагональю, Ето — правая треугольная матрица. Ясно, что Ат = С2т в обо-
обозначениях треугольного степенного метода при Со = ?.
Возводя равенство A) в квадрат, получим
АтЪтАтЪт- B)
Разложим теперь матрицу SmAm в произведение левой треуголь-
треугольной матрицы Lm с единичной главной диагональю и правой треуголь-
треугольной матрицы Rm
'-'т-А-т — LmRm. C)
Тогда получим
откуда
mm
у р у ^ '
т
Эти формулы позволяют последовательно вычислять матрицы Л
и Еот при /и = 0, 1, 2 начиная с матриц Ло и Ео, которые
находятся разложением исходной матрицы А в произведение двух
треугольных.
Матрицы Лш, в условиях сходимости треугольного степенного
метода, будут сходиться к предельной матрице С, причем сходи-
мость будет порядка О
т. е. сходимость будет квадра-
тичной.
Найдя матрицу С, строим затем матрицу R = C~1AC, что не
представляет труда, ибо С треугольная матрица с единичной главной
диагональю. Матрица R будет правой треугольной матрицей, той
самой, которая появлялась как предельная для матриц Rk в тре-
треугольном степенном методе. Собственные значения матрицы А равны
диагональным элементам матрицы R, собственные же векторы опре-
определяются при помощи матриц С и R, как в треугольном степенном
методе.
Недостатком только что описанной вычислительной схемы яв-
является стремительный рост (или стремительное исчезновение) элемен-
элементов матриц Ет с возрастанием т. Это явление частично устраняется
посредством нормировки на каждом шагу правых треугольных
матриц Еш к единичной главной диагонали. Под ЛР-алгорифмом и
§ 80] ЛР-алгорифм 535
подразумевают процесс с такой нормировкой. Выведем расчетные
формулы алгорифма ЛР.
Положим
где Дш диагональная матрица, Рш правая треугольная матрица с еди-
единичной главной диагональю. Тогда
лгт—л Д Р
Возводя в квадрат это равенство, получим
Л2т+1 Л Л Р Л Л Р
Разложим теперь матрицу РшЛт в произведение левой треуголь-
треугольной с единичной главной диагональю Lm, диагональной Dm и правой
треугольной с единичной главной диагональю" Rm
?mAm = LmDmRm. F)
Тогда
Л*т+) = AmbmLmDmRmAm-pm = Ат (Дт?шД-1) AmDmhm (Д/?ШДШ) Р„.
Ясно, что AmLmk.~n есть левая треугольная матрица с единичной
главной диагональю, матрица A.~^RmAm есть правая треугольная
матрица с единичной главной диагональю, а матрица ДшОшДт = AmDra
диагональная.
Поэтому
= Лш [AmLmAm )
где
Последние формулы и являются предписанием для алгорифма ЛР.
Начало процесса определяется разложением данной матрицы А в про-
произведение Л0Д0Р0.
Заметим, что каждый из множителей &mLmfc^ и A^RmAm стре-
стремится к единичной матрице.
Алгорифм ЛР заканчивается стабилизацией матриц Лт. По пре-
предельной матрице С определяется матрица R = C~1AC. Ее диагональ-
диагональные элементы дают собственные значения матрицы А, собственные же
векторы матрицы А суть
u^cv, un=cvn.
где Vu .... Vn собственные векторы матрицы./?.
536 ИТЕРАЦИОННЫЕ МЕТОДЫ ДЛЯ РЕШЕНИЯ ПОЛНОЙ ПРОБЛЕМЫ [ГЛ. VIII
§ 81. Итерационные процессы, основанные
на применении вращений
Вращения, уже рассматривавшиеся нами в § 51 в связи с пре-
преобразованием симметричной матрицы к трехдиагональной, можно
использовать для построения итерационных процессов, решающих
полную проблему собственных значений.
Эти процессы для симметричных матриц состоят в цепочке пре-
преобразований подобия, в результате которых в пределе получается
диагональная матрица, так что ее собственные значения определяются
непосредственно. Впервые такой процесс был предложен Якоби [1]
в 1846 г. Однако практическое применение его стало возможным
лишь с развитием быстродействующих счетных устройств. В настоя-
настоящее время имеется целый ряд модификаций метода Якоби.
Элементарный шаг каждого якобиева процесса заключается в пре-
преобразовании подобия посредством матрицы
1
(KJ)
¦¦¦ J
1
при c2-|~s2=l. Как мы видели в § 51, матрица Ту есть .матрица
вращения плоскости, натянутой на 1-й и у-й координатные векторы, на
угол 9 такой, что cos 9 = с, sin 9 — s. Матрица Ту ортогональна, так
что Tij = TJj .
Процесс в целом состоит в построении последовательности
матриц А — Л<0), АA\ АB), .... каждая из которых получается из
предыдущей при помощи элементарного шага. Эти элементарные
шаги должны быть подобраны так, чтобы матрицы Л(Л) безгранично
приближались к диагональной матрице при k -> оо.
Близость симметричной матрицы А к диагональной мы будем харак-
характеризовать числом t2(A), равным сумме квадратов всех недиасрналь-
§ 81] ПРОЦЕССЫ, ОСНОВАННЫЕ НА ПРИМЕНЕНИЙ ВРАЩЕНИЙ 537
ных элементов матрицы Л. Эта близость может быть также охарак-
охарактеризована любой нормой матрицы А— D, где D диагональная
матрица, составленная из диагональных элементов матрицы А.
Якобиев процесс будем называть релаксационным или монотон-
монотонным, если ^2(л(;с)) уменьшается на каждом шагу.
Выясним, как надо выбирать матрицу Тц при фиксированных
индексах / и j, чтобы Р(Т'АТ^ было меньше, чем t2(A).
Обозначим
Напомним (§ 51), что элементы матрицы С совпадают с элементами
матрицы А за исключением элементов, находящихся в строках с номе-
номерами I и j или в столбцах с номерами i и j. В частности, скк = акк
при к ф i, k Ф j.
Пусть
п
Легко видеть, что л2 (Л) = п2 (С). Действительно,
л2 (С) = Sp С2 = Sp (T^ATijf = Sp Л2 = л2 (Л).
Далее пусть
СЛ cJjl laji aii
Гс sl
Тогда С=Т'АТ, где 7"= , и следовательно, л2(С) = л2(Л).
s с
Ясно, что
ti (С) — /2 (Л) = п2 (С) —? с\к — п2 (Л) +
п
- к = 1 кк U jj U
ибо я2(С) = я2(Л) и скк = акк при к ф I, кф]. Следовательно,
, — р (Л) = п2 (Л) - 2й| . — я2 (С) + 2су = 2 (с^ — а2.),
так как л2(^~)= л2 (С).
Таким образом, для релаксационности процесса на данном шаге
нужно, чтобы | Сц | < | aij [. Этого можно добиться, только если
otf ФО.
Легко проверить, что
л — аи) cs = fly cos 29 + ^ (а# — й«) sin 26 =
. = о^ sin B8,-r- 2во>,
538
ИТЕРАЦИОННЫЕ МЕТОДЫ ДЛЯ РЕШЕНИЯ ПОЛНОЙ ПРОБЛЕМЫ [ГЛ. VIII
где ау= + у а%-\--^{ал—аиJ, tg26О= а<<_'д.. ¦ Угол 0О опре-
определен с точностью до целого кратного •=¦ . ]Чы будем считать,
что т < 90 <! -г- • При таком условии выбора 80
аи = sign (ап — ait)
| % + 1 (ал- — auf.
На рис. 12 приведен график с^ как функции от 8, в предположе-
предположении ац > О и 90 > 0. Ясно, что при других знаках ау и 80 соот-
соответствующие графики для Су будут иметь такой же вид с точностью
-71
\до 26,
Рис. 12.
до симметрии относительно оси абсцисс (при изменении знака аф
или относительно оси ординат (при изменении знака 80).
Из графиков можно заключить, что значения 8, обеспечивающие
неравенство t2 (с) < t2 (А), заполняют четыре интервала на проме-
промежутке (—те, те), каждый из которых примыкает одним из концов
к точкам 0, -н-, —-к-, —я (или —j— тс). В дальнейшем мы будем счи-
тать, что угол вращения 8 на каждом шагу якобиева процесса берется
из промежутка @, 28О) или B8О, 0), примыкающего к точке 0, так что
9 = ?е0, где 0<?<2 и |80|<-J.
Наибольшее понижение величины t2(A) за один шаг получится
при Сц = 0, что будет обеспечено при 6 = 80. По аналогии с релак-
релаксационными процессами для решения систем линейных уравнений мы
будем называть якобиевы процессы, в которых на каждом шагу
6 = 0о, процессами с полной релаксацией. Аналогично процессы,
в которых 0<<7<1, мы будем называть процессами с нижней
релаксацией, процессы, в которых 1 < q < 2,—процессами с верх-
верхней релаксацией.
Выбор пар индексов (lit j\) (i2, j2), .... (lk, jk) для последова-
последовательных шагов процесса можно осуществить априорно или с упра-
управлением по ходу процесса. Наиболее естественным для априорного
выбора является циклическое чередование пар, занумерованных тем
или другим способом.
§ 81] ПРОЦЕССЫ, ОСНОВАННЫЕ НА ПРИМЕНЕНИИ ВРАЩЕНИЙ 539
Перейдем к рассмотрению нескольких исследованных в настоящее
время якобиевых процессов.
1. Классический метод Якоби. Матрица вращения Тц выби-
выбирается на каждом шаге так,, чтобы элемент j-й строки и /-го столбца
преобразованной матрицы стал нулем. При этом пары индексов (I, f)
выбираются на каждом шаге так, чтобы аннулировался наибольший по
абсолютной величине недиагональный элемент матрицы, полученной
в результате предыдущего шага процесса. Таким образом, метод
Якоби является методом полной релаксации с управлением.
Легко доказывается сходимость метода. Действительно, пусть
А1' — матрица, полученная на k-и шагу процесса, а\ ]¦ ее наиболь-
наибольший по модулю недиагональный элемент. Тогда
tz
С другой стороны, ?(А{к))^п(п—1)(а{$кJ, откуда DfjkJ>
tz (Aw). Следовательно,
и потому
Таким образом, t[A ')—>0 при k —> со, что доказывает сходимость
процесса Якоби.
Дадим расчетные формулы одного шага метода, обозначая снова
исходную матрицу шага через А и полагая С = Т\.АТ{..
Как уже сказано выше, пара (г, ¦/') выбирается так, чтобы а^
был наибольшим по модулю элементом матрицы А. Далее
сш — аы при k=hi, кф],1ф1,
ckj = cjk = — saki + caki при k
Наконец,
_J_ г2п-. (9\
Ctj = (C2 S2) йу + CS (ujj йц) = 0.
Числа с к s определяются по формулам
. с = cos 9, s = sin 6, C)
где
2а« . тс
540 ИТЕРАЦИОННЫЕ МЕТОДЫ ДЛЯ РЕШЕНИЯ ПОЛНОЙ ПРОБЛЕМЫ [ГЛ. VIU
Формулы C) и D) можно заменить на
«-/¦±
I аи —
1 +
s = sign [ац (ан — aj})\ \ -A\ —
E)
где
Формулы B) можно заменить на
пц — a j j
с =
2
аи + aj
Ь- sign (пц —
Slgn (°и ~
Построение матрицы С, после того как числа с, s вычислены, можно
осуществлять и непосредственно по формулам § 51.
Если матрица не имеет кратных собственных значений, то, аннулируя
внедиагональные элементы с точностью до е, мы получим, что диа-
диагональные элементы приблизятся к собственным значениям уже с точ-
точностью до е2. Действительно, если недиагональные элементы сим-
симметричной матрицы
«21
Нг
•^22
¦Чп
¦Чп
являются малыми числами, то для ее собственных значений спра-
справедлива приближенная формула
F)
верная с точностью до малых 3-го порядка,
В самом деле, пусть ay = say, где s — малое число. Положим
X, = ап -f- &s2.
Тогда для определения k получим уравнение
еа,..
еа„
а2
22
еа12
еа„2
— ап —
= 0.
§81]
ПРОЦЕССЫ, ОСНОВАННЫЕ НА ПРИМЕНЕНИИ ВРАЩЕНИЙ
541
Вынесем е из первой строки и первого столбца определителя и заме-
заменим е нулем в получившемся уравнении. Получим
откуда
«2! Й22 — а11
«in
о
— а.
••¦ +:
с точностью до малых порядка е. Следовательно,
*22
«а — "зз
•+ •••
an —
Аналогично
Огрубляя последнюю формулу, получим
Применим метод Якоби для определения собственных значений
матрицы D) § 51.
Первый шаг процесса заключается в преобразовании вращением
при помощи матрицы Ти.
Вычисляя по формулам D), получим
с = s = 0.70710678.
Далее _
.66 0.60811183
0.60811183 1
0.53740115 0.32
0 0.01414214
Г' AT
' UAl 14
0
0.53740115
0.32 0.01414214
1 —0.22627417
-0.22627417 0.34
Следующие шаги требуют преобразований матрицами Г12, Г13, Ти,
Ти, Т13, Т24, Т23. В результате получилась матрица
2.3227487 —0.00048637 0.00001483 0.00004994
—0.00048637 0.63828393 0 0.00004930
0.00001483 . 0 0.79670201 0.00161630
0.00004994 0.00004930 0.00161630 0.24226544
542 ИТЕРАЦИОННЫЕ МЕТОДЫ ДЛЯ РЕШЕНИЯ ПОЛНОЙ ПРОБЛЕМЫ [ГЛ. VIII
Ее недиагональные элементы уже настолько малы, что для опреде-
определения собственных значений можно применить формулу F). Вычисляя,
получим
lt = 2.3227487 + 0.00000014 = 2.32274884
Х2 =0.63828393 — 0.00000014 = 0.63828379
Х3 = 0.79670201 +0.00000471 =0.79670672
>ч = 0.24226544 —0.00000471=0.24226073.
Результаты получились верными уже с точностью до 4 • 10~8 для
всех собственных значений.
Нетрудно показать, что в случае отсутствия кратных собствен-
собственных значений у исходной матрицы, метод Якоби обладает квадра-
квадратичной сходимостью.
Допустим, что процесс проведен настолько далеко, что все
недиагональные элементы матрицы стали по модулю меньше малого
числа г. Тогда, как мы видели выше, диагональные элементы при-
приблизятся к собственным значениям с точностью до г2. Поэтому на
каждом шагу процесса Якоби угол поворота 9 будет иметь поря-
2
2ац
док е, ибо tg 26 = , числитель имеет порядок е, а знамена-
знаменами — ajj
тель, равный Х4 — Х^-)-О(е2), ограничен снизу.
Все меняющиеся на этом шагу недиагональные элементы, кроме йу,
изменятся на величину порядка г2. Действительно,
Сы = cik = flfci cos 8 + akj sin 8,
откуда
сы — аы = flfci (cos б ^- 1) + akj sin 8 = О (s2).
Аналогично
В частности, элемент, аннулированный на предыдущем шаге,
станет, самое большее, величиной порядка г2. Поэтому после, самое
большее, ПГ~ шагов процесса, все внедиагональные элементы
станут величинами порядка е2. Это и доказывает квадратичную схо-
сходимость процесса.
Подсчет констант в приведенных оценках осуществлен в работе
Хенриси [1].
Скажем несколько слов о нахождении собственных векторов.
Пусть процесс доведен до того, что матрица
§81] ПРОЦЕССЫ, ОСНОВАННЫЕ НА ПРИМЕНЕНИИ ВРАЩЕНИЙ 543
оказалась практически диагональной. Тогда столбцы матрицы JJ Г,- j
и будут собственными векторами исходной матрицы А.
В случае, если собственные значения матрицы А попарно раз-
различны и внедиагональные элементы матрицы аннулированы с точ-
точностью до малого числа е, легко дать прием, позволяющий вычислять
компоненты собственных векторов Ut с точностью до величины е2.
Именно,
lmJm l
где
V
~ ( "u аг-1 i j П+Ц Hn V
\Hi— all ' Hi — a»-l»-l ' ' Hi — H+li+l ' '' Hi — ann)
Здесь atj — суть элементы матрицы Л(й\ на которой мы остановили
процесс.
В качестве примера определим собственный вектор матрицы, рас-
рассмотренной выше в связи с определением собственных значений, при-
принадлежащий наименьшему собственному значению.
Имеем
а44 — аи = — 2.08048326, а44 — а22~ — 0.39601849,
а44 — «зз = — 0.55445657,
гак что
V4 = (—0.00002400, —0.00012449, —0.00291521, 1)'.
Далее находим по формулам (8) § 51 последовательно векторы
' 14' 12^13^34^14^13^24^23^4 — ^4>
располагая их компоненты последовательно в графах I—IV табл. VIII. 7.
В графах V и VI приведены соответствующие коэффициенты с и s.
В последней строке приведен собственный вектор 04, нормирован-
нормированный к единичной первой компоненте.
Классический метод Якоби на каждом шагу процесса требует вы-
выбора наибольшего внедиагонального элемента. Эта операция при вы-
выполнении на быстродействующих машинах требует значительной
затраты машинного времени. Более удобными оказываются цикличе-
циклические якобиевы процессы и, в частности, циклические процессы с пре-
преградами. •
544 ИТЕРАЦИОННЫЕ МЕТОДЫ ДЛЯ РЕШЕНИЯ ПОЛНОЙ ПРОБЛЕМЫ [ГЛ. VIII
Таблица VIII. 7
Определение собственного вектора методом Якоби
i
2
2
1
1
3
1
1
.1
i
3
4
3
4
4.
3
2
4
I
- 0.00002400
- 0.00002400
0.00004740
0.03967421
0.03967421
-0.13986866
-0.10581153
- 0.71884900
1
II
- 0,00003556
- 0.02812808
-0.02812808
-0.02812808"
- 0.02812808
-0.02812808
- 0.09569928
-0.09569928
0.133128
HI
- 0.00291765
-0.00291765
-0.00291736
- 0.00291736
0.40999603
0.38743715
0.38743715
0.38743715
-0.538969
IV
1
0.99960433
0.99960433
0.99881670
0.91079448
0.91079448
0.91079448
0.56920890
- 0.791834
V
0.99953524
0.99960533
0.99970055
0.99921394
0.91066679
0.90350564
0.85934868
0.70710678
VI
0.03048475
0.02809253
0.02447059
-0.03964253
-0.41314164
0.42857618
0.51139013
0.70710678
2. Циклические якобиевы процессы. *) При проведении цикли-
циклического процесса выбирается определенная нумерация пар (i, j) и анну-
аннулирование внедиагональных элементов происходит по циклам, в те-
течение каждого из которых аннулируются по очереди элементы а^
в порядке выбранной нумерации пар индексов.
Элементарный шаг процесса ничем не отличается от элементар-
элементарного шага классического метода Якоби, так что рабочими форму-
формулами остаются формулы, выведенные выше. Как указано в статье
Грегори [3], сходимость метода установлена в неопубликованной еще
работе Форсайта и Хенричи.
После того, как внедиагональные элементы станут достаточно
малыми, сходимость процесса становится квадратичной, в чем легко
убедиться теми же рассуждениями, которые были приведены для
метода Якоби.
Наиболее естественной нумерацией пар является нумерация по
строкам слева направо и сверху вниз, именно
A, 2), A, 3) A, я), B, 3), .... B, я), ..., (я—1, я)
или по столбцам сверху вниз и слева направо
A, 2), XI, 3), B, 3), A, 4), B, 4), C, 4), ...
.... A. п), B, я) (я—1, я).
3. Циклические процессы с преградами.2) Промежуточное по-
положение между классическим методом Якоби и циклическим занимает
циклический метод с преградами. Недостатком циклического метода
является то обстоятельство, что по ходу процесса приходится анну-
1) Грегори [3].
2) Поп, Томпкинс [1].
§ 81]
ПРОЦЕССЫ, ОСНОВАННЫЕ НА ПРИМЕНЕНИИ ВРАЩЕНИЙ
545'
лировать малые внедиагональные элементы, хотя в матрице еще при-
присутствуют большие. Этот недостаток устраняется введением „преград".
Именно, вводится монотонно убывающая к нулю последовательность
чисел а1, а2 и при последовательном аннулировании внедиаго-
нальных элементов пропускаются те шаги, при которых приходи-
приходилось бы аннулировать элементы, меньшие чем at. После того, как все
внедиагональные элементы станут по модулю не больше alf „пре-
„преграда" сдвигается — число at заменяется на число а, и т. д.
Легко устанавливается, что процесс с преградами сходится.
Действительно, „преграда" at будет перейдена не более чем че-
через г2(Л)/а'^ элементарных шагов, так как за каждый шаг до прео-
преодоления преграды ах число t'2(A) уменьшается не менее чем на а\.
Аналогично, через конечное число шагов будут преодолеваться по-
последующие преграды а2, а3 и т. д. Так как ак -» 0, то через доста-
достаточно большое число элементарных шагов все внедиагональные эле-
элементы матрицы станут сколь угодно малыми. Это и доказывает схо-
сходимость процесса.
Как и прежде, при попарно различных собственных значениях, схо-
сходимость процесса будет, начиная с некоторого места, квадратичной.
4. Процессы Якоби с рациональными формулами. Элементарный
шаг процессов этой группы отличается от элементарного шага процес-
процессов с полной релаксацией выбором угла поворота вращения. Именно,
2
вместо формулы tg290— берется формула
е
tgT=7
2 (ан
если
2 (ац — aj
Q — -J-, если
2 (ац — aj
< /2—1:^0.414,
При малых углах 8 «^ 0О, только б всегда немного больше 60. Не-
Нетрудно проверить, что | 80| < | 6 | < | 2бо|, так что указанный выбор
угла вращения обеспечивает верхнюю релаксацию.
Для вычисления чисел с и s получаем рациональные формулы
1—
2а
Т-
Само преобразование вращения следует осуществлять по форму-
формулам § 51.
Выбор пар может осуществляться либо циклически, либо по ин-
индексам наибольшего по модулю внедиагонального элемента.
В литературе описаны и некоторые другие якобиевы процессы.
35 Зак. 974. Д. К. Фаддеев и В. Н. Фаддеева
546 ИТЕРАЦИОННЫЕ МЕТОДЫ ДЛЯ РЕШЕНИЯ ПОЛНОЙ ПРОБЛЕМЫ [ГЛ. VIII
Описанные методы почти без изменения переносятся на диагона-
лизацию эрмитовых матриц. Вместо элементарных вращений прихо-
приходится производить трансформации унитарными матрицами вида
1
... t
...J
((унитарные вращения).
Условия унитарности
c1s1
|52Р=1
|С2|2=1
. s2c2 — О
позволяют выбирать числа ct, slt c2 и s2 в виде
Здесь 8, a, p, f, 8 —вещественные числа, причем
a— p — f + 8 = 0 (mod 2u).
JV\bi не будем здесь приводить соответствующих рабочих формул.
В случае произвольной матрицы преобразованиями подобия по-
посредством вращений привести матрицу к диагональной форме уже
невозможно.
Однако верна следующая теорема И. Шура. Для любой ком-
комплексной матрицы А существует унитарная матрица U такая, что
U~'AU есть верхняя треугольная матрица.
Для доказательства рассмотрим матрицу А как матрицу опера-
оператора в некотором ортонормальном базисе и перейдем к новому орто-
яормальному базису, включающему один из собственных векторов
§ 82] СПЕКТРАЛЬНЫЙ АНАЛИЗ ПОСЛЕДОВАТЕЛЬНЫХ ИТЕРАЦИЙ
547"
матрицы. В этом новом базисе оператору будет соответствовать,
матрица
О #22 • • • *2П
0 bn2 . . . bnn_
Применяя то же рассуждение к матрице (п—1)-го порядка
... Ь2п -
получим
-XAU,U2^
с13
С23
¦ с.
. Сп
О О
О О
Продолжая процесс далее, принимая во внимание, что произве-
произведение унитарных матриц есть унитарная матрица, придем к требуе-
требуемому результату.
Теорема Шура дает основание предполагать, что, подбирая под-
подходящим образом последовательность унитарных матриц вращений,
можно добиться преобразованиями подобия приведения данной ма-
матрицы к треугольному виду.
Два таких процесса описаны в работах Гринштадта [1] и Лот-
кина [4]. В первой из них предлагается аннулировать поочередно за
счет подходящих унитарных вращений поддиагональные элементы.
Доказательство сходимости процесса отсутствует, дается только ука-
указание на экспериментальную проверку метода. Во второй работе
вращения подбираются так, чтобы сумма квадратов модулей поддиа-
гональных элементов уменьшалась на каждом шагу. Процесс оказы-
оказывается довольно сложным — на каждом шагу приходится решать,
вспомогательное кубическое уравнение.
Мы не будем описывать подробности этих процессов.
§ 82. Решение полной проблемы собственных значений при
помощи спектрального анализа последовательных
итераций
Этот метод, который принадлежит Ланцошу [7], заключается"
в следующем. Пусть матрица А симметрична 1), и ее собственные..
1) Рассуждения остаются в силе и в случае, если матрица А не сим-
симметрична, но имеет попарно различные вещественные собственные значения-
35*
1548 ИТЕРАЦИОННЫЕ МЕТОДЫ ДЛЯ РЕШЕНИЯ ПОЛНОЙ ПРОБЛЕМЫ [ГЛ- VIII
значения заключены в интервале (т, М). Вводится матрица
М — т
¦собственные значения \ilt ..., \in которой принадлежат уже проме-
промежутку (—1, 1). В случае положительно-определенной матрицы А
в качестве /га можно взять, например, нуль.
Вычислим последовательность векторов Хо, ХХ = ВХО,
Хк=2ВХк_1 — Хк_2 (Л = 2, 3, .... N).
Пусть
Х0 = и,-{- ... -+-?/,., B)
где Uv ..., Ur собственные векторы матрицы В, а следовательно,
и матрицы А.
Тогда
Xk=Tk(<s1)U1 + ¦¦• +Tk{Vr)Uf, C)
тде Tk(t) = cos karccost.
Положим u, = cos6j при 0 < 9j < тт. Ясно, что ТА (,u.j) =
= cos k arccos [Xj = cos kd^, так что
XJc = coskb1U1-{- ... +cos&9,.(/,.. D)
Отсюда и любая компонента вектора Хк, которую мы обозначим
•через хк, будет иметь вид
хм — a1coskQl-{- ... -4-or cos Л9Г, E)
где av .. ., аг некоторые определенные, но заранее неизвестные нам
числа (равные выбранным компонентам векторов Ul, ..., Ur).
Ланцош предлагает определять углы б,, ..., 8Г (а следовательно,
и собственные значения у.х, ..., ;аг), подвергая гармоническому ана-
анализу последовательность х0, xlt .... xN (для контроля следует взять
также и вторую последовательность, состоящую из других компо-
/ нент итераций Хк). При этом попутно определяются и амплитуды
щ, . . ., аг, которые являются выбранными компонентами собственных
векторов Uv ..., Ur. После того как собственные значения опре-
определены, остальные компоненты собственных векторов определяются,
как мы увидим ниже, без проведения полного гармонического ана-
анализа последовательности соответствующих компонент векторов х0,
xi xw
Рассмотрим сначала случай, когда
xk~acoskQ, k — Q N. F)
Пусть
Хп , tm , 2я/и .
ym = -?r-hx1cos-jr-t-x2cos-fi—h ...
i (N—1) Tim . Ntwi , _ ,.ч ,_ч
... +xiV_1cos-^ jf t-at^cos-^-, (ffi = 0 N). G)
§82]
СПЕКТРАЛЬНЫЙ АНАЛИЗ ПОСЛЕДОВАТЕЛЬНЫХ ИТЕРАЦИЙ
549
Последовательность у0,
последовательности х0, xl
. .., yN есть „трансформация Фурье"
лгу. Нетрудно проверить, что
Л/8 sin 8 . (8)
cos
— COS
Исследуем поведение ут в зависимости от изменения т при
фиксированном 8. Допустим сначала, что
в = ?р. (9)
где р — целое число.
В этом случае знаменатель выражения (8) обращается в нуль при
т = р и sinjV8==0. Следовательно, .Уот—0 при т Фр и, как не-
aN
трудно подсчитать, ур = —^—. Таким образом, среди значений ут
встретится единственное отличное от нуля значение ур.
Аналогично, если
8; = -^Л, (И)
где Pi — целые числа, то среди значений ут встретится г отличных
a-iN arN
от нуля значений yPi = ' , .... ур = ' , а все остальные
значения будут нулевыми. Это позволит определить как углы
$!,..., Ьг (по номерам р1% . . ., рг), так и амплитуды at аг
/по значениям yPi Ур). Уп
Вернемся теперь к иссле-
исследованию случая
хк = a cos /гб
в предположении, что 8 Ф-^р,
при целом р. Пусть
<1- A2)
Р Р*1
Рис. 13.
т
cos8>0 при
N. Поэтому значения ут будут иметь
В этом случае cos-
— cos 8 •< 0 при р-\- 1 ^ т
чередующиеся знаки при т изменяющемся от 0 до р. Знаки ур и yphl
совпадут, а затем снова будут чередоваться. Наибольшие абсолют-
абсолютные значения ут будут при т=р и т=р-{-\ и при удалении т
от р будут убывать (см. рис. 13).
Такое поведение последовательности ут дает возможность опре-
определить число р, а следовательно, в силу A3), и значение 8 с точ-
точностью ДО -jr.
550 ИТЕРАЦИОННЫЕ МЕТОДЫ ДЛЯ РЕШЕНИЯ ПОЛНОЙ ПРОБЛЕМЫ [ГЛ. VIII
После определения р можно получить уточненное значение для О
из легко проверяемой формулы
ур+х cos^j{p+\) + ypcos ~р
cos8 = 11 11—. A3)
Ур+1 + Ур
При переходе к общему случаю
хк = ахcoskbx -f- ... -\-arcoskbr A4)
картина будет несколько более сложной. В этом случае
v = vAL- vBL- -I- v(r)
v
где
Cos —-cos 8,
Qi = -%fbi+*i). o<xf<i.
При т, близком к pit слагаемое j>№ будет, вообще говоря, пре-
преобладать над остальными. В частности, ур-~у{? и У
р+1^
Поэтому ур и ур.+1 будут одного знака, и это позволит опреде-
лить pi, а следовательно, и 0{ с точностью до jy.
Однако при уточнении значения 6{ указанным выше приемом, влия-
влияние других слагаемых у(?, j ф i, может быть еще слишком значи-
значительным и им нельзя пренебрегать.
Ланцош предлагает, наряду с числами ут, ввести в рассмотре-
рассмотрение числа
гт = Ут-1 — 2Ут-{-Ут + 1- A6)
Ясно, что
Величина г^, при удалении т от pit убывает значительно быстрее,
чем у(*\ так что пики для гт выражены отчетливее, чем для ут.
Подсчитаем приближенно значение zW при т, близких к р^. Для
этого предварительно заменим точную формулу для yW более удоб-
удобной приближенной формулой, справедливой при т, близких к р{.
Положим m~Pi-\-q, где q небольшое целое число. Имеем
cos Тг cos 6^
(— 1)р<+* -^- (— I)"* sin тех, sin в«
sin6,-Fj — .,^i + ^O1 \
OiP/ Sin 7IT{
$ 82] СПЕКТРАЛЬНЫЙ АНАЛИЗ ПОСЛЕДОВАТЕЛЬНЫХ ИТЕРАЦИЙ 551
Соответственно
1 2 ¦ 1
g+l Ч^д-Г ч — д—
sin 7tx< 1
откуда следует, что г<$ убывает, как -г—^ при возрастании
Это дает основание считать
«jTV sin
zPi+i ~ zpi+i ~ я (T.
Отсюда
^i xt —2
и, следовательно,
2 — Ъ-
'+Г5
B0)
Точность этого приближенного равенства будет удовлетворитель-
удовлетворительной, если углы 84 не очень близки друг к другу.
Определив tj, находим амплитуды щ по формуле
Однако амплитуды а^ можно вычислять так же и по формулам
^ТТЖ^Г^-^ЬЧ + ^ь!]. B2)
Последняя формула, несколько менее точная, чем предыдущая,
требует знания лишь двух соседних значений ут. Ею разумно поль-
пользоваться при нахождении всех компонент собственного вектора ?/{
после того, как соответствующее собственное значение ^ вычислено.
Именно, нужно вычислить векторы ур„ yp.+i при /=1, . .., г
и применять формулу B2) ко всем их компонентам.
При практическом проведении метода в качестве N следует брать
достаточно большие числа, во всяком случае во много раз A0,20)
552 ИТЕРАЦИОННЫЕ МЕТОДЫ ДЛЯ РЕШЕНИЯ ПОЛНОЙ ПРОБЛЕМЫ [ГЛ. УИГ
превосходящие порядок матрицы. Для удобства вычислений следует
также брать число N кратным 180.
Метод требует очень большого числа операций (несколько миллио-
миллионов умножений при N =1080), и его осуществление возможно лишь
на быстродействующих счетных устройствах. В настоящее время он
был применен лишь для матриц невысокого порядка.
В работе Ланцоша рассматривается вопрос о влиянии на ход
процесса пары близких собственных значений и собственных значений,
близких по модулю.
ГЛАВА IX
УНИВЕРСАЛЬНЫЕ АЛГОРИФМЫ
Настоящая глава посвящена изложению теории и описанию вычи-
вычислительных схем, так называемых универсальных алгориф-
алгорифмов, в применении к задаче решения системы линейных уравнений
АХ= F или, в подготовленном виде, Х= BX-\-G.
Под универсальным алгорифмом мы подразумеваем итерационный
процесс, вообще говоря, не стационарный, осуществляемый по фор-
формулам вида
(или в случае подготовленной системы по формулам
в котором последовательность полиномов h^k) (t) (или/(А)(?)) строится
раз навсегда для обширного класса матриц с заданным расположе-
расположением собственных значений, например, для класса симметричных
матриц, все собственные значения которых расположены в известном
промежутке.
Характерной особенностью универсальных алгорифмов является
то, что быстрота их сходимости не зависит от порядка матрицы,
а определяется лишь ее обусловленностью.
Простейшим универсальным алгорифмом является алгорифм,
в котором
h{k) (t) = h = const.
Такой алгорифм есть не что иное, как процесс последовательных
приближений, примененный к системе AX=Fa подготовленной
к виду
X={E~hA)X-\-kF.
Основным принципом построения универсальных алгорифмов
является идея „подавления компонент". В следующем параграфе мы
ее поясним в простейшем случае.
554 УНИВЕРСАЛЬНЫЕ АЛГОРИФМЫ [ГЛ. IX
§ 83. Общая идея подавления компонент
Пусть AX=F система линейных уравнений, причем известно,
что все собственные значения матрицы Л вещественны, положи-
положительны и различны. Пусть далее X некоторый исходный вектор и
X' = X-\-h(A)[F — AX\, A)
где h(t) — некоторый полином (может быть, нулевой степени).
Как мы видели в гл. VII, последовательные приближения при
применении градиентных итерационных процессов в случае положи-
положительно-определенной матрицы А определяются по формуле A), при-
причем полином h(t) может меняться от шага к шагу. При этом в рас-
рассмотренных выше градиентных методах коэффициенты полиномов
существенно зависят как от матрицы А, так и от начального при-
приближения, так что описанные в гл. VII методы не являются универ-
универсальными в смысле данного выше определения.
Для построения универсальных алгорифмов исследуем фор-
формулу A) со следующей точки зрения. Обозначим через Y и Y' соот-
соответствующие векторы ошибок для приближений X и X'. Тогда
где
g(f)=l—th(t). B)
Пусть \, .. ., Х„ попарно различные собственные значения матрицы А
и Uу Un соответствующие им собственные векторы. Пусть
Y=alUl-{- ... +anUn.
Тогда
У = alg (I,) U,+ ...-\-ang (К) Un. C)
Таким образом, при переходе от приближения X к приближению Хг
компоненты вектора ошибки в разложении по собственным векторам
матрицы Л умножаются, соответственно, на значения gQ-,) g(Ki)>
которые естественно называть множителями затухания.
Переход от вектора X к вектору X' можно считать удачным, если
один или несколько множителейg{\), ..., g(^n) очень малы, а осталь-
остальные не слишком велики. „Подавив" таким образом одну или несколько
компонент вектора ошибки, можно перейти к следующему шагу
процесса, распорядившись им так, чтобы в нем подавлялись другие
компоненты.
В выборе полинома g(t) для одного шага процесса имеется ши-
широкий произвол. Единственным условием, связывающим выбор g(t),
является требование g(Q)=l. ч
Идеальным выбором полинома g(t) для данной матрицы Л является
такой, при котором g(\1)== ... =,g-(Xw) = O, ибо при таком выборе
.-§83]
ОБЩАЯ ИДЕЯ ПОДАВЛЕНИЯ КОМПОНЕНТ
555
уже один шаг процесса приводит к точному решению. По существу
к этому мы приходили в результате применения метода сопряженных
градиентов.
Выясним теперь критерии, которыми следует руководствоваться
при выборе универсального полинома g(t), исходя из естественного
предположения о том, что мы ничего не знаем о расположении собст-
собственных значений матрицы А, кроме промежутка (О, М), в котором
они содержатся.
Пусть на рис. 14 изображен график g (t).
Рис. 14.
Тогда множителями затухания g(\) gQ-n) будут ординаты гра-
графика с абсциссами \t Хга.
Ясно, что затухание будет наиболее эффективным в окрестности
корней полинома g(t), мало эффективным в окрестности точек, где
g(t) близко к + 1, и вместо затухания будет возрастание компонент
в точках, где \g(t)\ больше 1. Так, на рис. 14 затухание сильно для
собственных значений, близких к точкам а и Ь, а для собственных
значений из промежутка (с, d) затухание совсем не имеет места. Таким
образом, на каждом шагу процесса желательно подобрать полином
g(t) так, чтобы он возможно теснее примыкал к оси абсцисс и чтобы
\g(t)\ нигде в промежутке (О, М) не превышал единицы. Ясно, что при
этом наибольшую трудность будет представлять подавление компонент,
отвечающих близким к нулю собственным значениям, так как g@) = 1.
Это совершенно естественно, так как наличие близких к нулю собст-
собственных значений матрицы А свидетельствует о плохой обусловленности
системы.
Выбор полинома h(t) (а вместе с ним и g(t)) можно осуществлять,
применяя другой критерий, основанный на сравнении компонент
вектора ошибки У с компонентами невязки /¦ = /¦"— AX=AY при-
приближения X. Пусть
Тогда
+bnUn.
556 УНИВЕРСАЛЬНЫЕ АЛГОРИФМЫ [ГЛ. IX
= ft, (-i— ft (Xx)) t/t + . . . + ftn (-i- - h (K))un. D)
При этом подходе естественным становится такой выбор полинома
h(t), чтобы его значения на промежутке (О, М) возможно менее
отклонялись от значений функции -у.
Оба указанных критерия по существу близки друг другу. Именно,
выполнение одного из них влечет выполнение, в большей или мень-
меньшей степени, второго. Однако второй критерий предъявляет более
сильные требования к подавлению компонент, отвечающих малым
собственным значениям. Действительно, если
то
Первым критерием целесообразно руководствоваться в тех слу-
случаях, когда пользование формулой A) является элементарным шагом
в итерационном процессе, ибо множители затухания при проведении
нескольких шагов итерационного процесса просто перемножаются.
Если же формула A) применяется всего лишь один раз, то имеет
смысл руководствоваться вторым критерием, если есть основания
предполагать, что компоненты исходной невязки (например, свобод-
свободного члена F) имеют коэффициенты одного порядка в своем разло-
разложении по собственным векторам.
В случае, если о распределении собственных значений матрицы А
имеются какие-либо дополнительные сведения, можно ставить вопрос
о наилучшем выборе полинома g{t) данной степени в смысле пер-
первого или второго критерия. Так, если известно, что все собственные
значения заключены в промежутке (т, /И), то наилучшим в смысле
первого критерия будет полином g(t), наименее отклоняющийся от
нуля на промежутке (т, М), нормированный условием g(Q) = 1, наи-
наилучшим в смысле второго критерия будет полином h(t), наименее
отклоняющийся от у в том же промежутке. Ниже мы рассмотрим
универсальные алгорифмы, основанные на осуществлении такого
выбора.
Для системы, подготовленной к виду
X=BX-{-G, E)
§ 84] ПРИЕМ Л. А. ЛЮСТЕРНИКА 557"
при условии, что все собственные значения матрицы В лежат в про-
промежутке (—1, 1), один шаг универсального алгорифма производится
по формуле
X' = X-\-f(B)[BX-irG — X]. F)
Векторы ошибки двух соседних приближений в этом случае связаны
соотношением
где e(t)=\—A—t)f(t). Таким образом, здесь полином е(t) дол-
должен удовлетворять требованию еA)=1. Множителями затухания
будут значения efa), ..., е ((*¦„). где \il, ..., jj,n собственные зна-
значения матрицы В. Критериями для выбора полинома e(t) или поли-
полинома f(t) являются, во-первых, возможно малое отклонение от нуля
значений полинома e(t) на промежутке (—1, 1), нормированного
условием #A)=1, или, во-вторых, возможно малое отклонение
полинома f(t) от функции _ на том же промежутке.
§ 84. Прием Л. А. Люстерника для ускорения сходимости
метода последовательных приближений при решении
системы линейных уравнений1)
При решении системы X — BX-\-G методом последовательных
приближений в самом ходе процесса получается некоторая информа-
информация о расположении собственных значений матрицы В. Именно, если
наибольшее по модулю собственное значение ^ матрицы В оторвано
от остальных собственных значений, то оно может быть практически
определено из отношений одноименных компонент векторов л- —А/ '
и Х®) — Х{к-1). Действительно, Х{к+1) — Хт = Вк(Х1 — Хо), Х[к) =
— В ~*(XL — Хо), где Хо начальное приближение.
Зная Uj, можно уничтожить коэффициент при собственном ве-
векторе иг в векторе ошибки, исходя от приближения Х(к\ уже по-
построенного методом последовательных приближений. Для этого до-
достаточно ззять, при переходе от Х^' к следующему приближению X + »
в качестве полинома fyK>{t) константу -= . Действительно, соот-
соответствующий полином е '(t) равен I -. -, так что e(fc^(jAl) = 0.
Последний шаг тогда будет осуществлен по формуле.
X(-k + i) _ х(&) -I - (В Х'к)-\- G Х^) =
1 1 Ц1
A)
Л. А. Люстерник [1]
'558 УНИВЕРСАЛЬНЫЕ АЛГОРИФМЫ [ГЛ. IX
где Ar(ft+1' = BX<ft)-|-G есть следующее за Х(к) приближение метода
последовательных приближений.
Если метод последовательных приближений проводится по фор-
формуле
J
то формула A) приобретает еще более простой вид
L_B0. B)
Компоненты вектора ошибки для приближений, найденных по
¦формулам A) и B), будут, очевидно, иметь порядок О(\рг\к), где (а2
следующее за ^ по величине модуля собственное значение матрицы В.
Проиллюстрируем описанный прием на примере § 30. На основе
табл. III. 1 в § 53 (пример 3) было определено (j.j = 0.4800 из от-
отношений компонент 14-й и 13-й итераций вектора Q = @.76, 0.08,
1.12, 0.68/ матрицей В. Из той же таблицы
X{1S) = A.53490847, 0.12200958, 1.97509985, 1.41289889)'.
Вычислим
= (°-00005656> °. 0.00005656, 0.00005656/.
Таким образом,
Х{и) = A.534965, 0.122010, 1.975156, 1.412955)'.
Указанное решение совпадает с точностью до 1 • 10~6 с найден-
¦ным по методу Гаусса.
Отношения 7-й и 6-й итераций дают (§ 53) для ^ значение
1^ = 0.4792.
Так как
, 0.12201, 1.96551, 1.40333)'
¦и
-^^- = @.00962, 0.00002, 0.00963, 0.00960)',
U.52UO
ТО
0) = A.53495, 0.12203, 1.97514, 1.41293)'.
Из табл. III. 1 видно, что Х^ ближе к точному, чем
§ 85] ПОДАВЛЕНИЕ ПРИ ПОМОЩИ ПОЛИНОМОВ НИЗШИХ СТЕПЕНЕЙ
Прием Люстерника может быть применен и к циклическому
одношаговому процессу, ибо этот метод, применяемый к системе
Х= BX-\-G, равносилен методу последовательных приближений для
некоторой эквивалентной системы.
§ 85. Подавление компонент при помощи полиномов низших
степеней
Рассмотрим в свете идеи подавления компонент приемы подго-
подготовки системы АХ— F с положительно-определенной матрицей А
к применению метода последовательных приближений.
Для системы, подготовленной к виду X=X-\-h(F— АХ) =
— {Е — hA)X-\-hF, формула метода последовательных приближений
будет
M (ft1) { {k-1)). A)
В этом случае коэффициентами затухания будут значения 1 — ЛХ;
при i= 1, ... п.
Все коэффициенты затухания, очевидно, будут меньше единицы, и^
следовательно, процесс будет сходящимся, если -г > -у , т. е.
2
h < -j-r (рис. 15). Быстрота затухания компонент на разных частях.
Рис. 15.
промежутка (т, М) будет различной и наибольшая быстрота, оче-
очевидно, будет в зоне, примыкающей к точке ~г (если hy--~r\, или
на правом конце промежутка (если h ^ -г-г\ . Наиболее медленное
затухание будет на правом конце промежутка, если h < —^ ,
и на левом, если h > ^. —-. Ясно, что для ускорения процесса
последовательных приближений целесообразно время от времени
брать h = -»r или й = —, соответственно, если одно из этих чисел.
известно.
Именно в этом и состоит описанный выше прием Люстерника
в применении к подготовленной системе Х= ВХ-\- О при В = ?—АЛ*
G hF
560 УНИВЕРСАЛЬНЫЕ АЛГОРИФМЫ [ГЛ. IX
Действительно, собственными значениями рц матрицы В являются
как раз коэффициенты затухания |а;—1—ЛА;. Наибольшим из них
по модулю будет ^=1—hM или jxa = 1—hm. Один шаг при
=± дает
— " ^ м
или, переходя к матрице В,
1 ,г
= х(к) + j-±j- [G —(Е-В)Х{к)] =
= Х{к)•+ BX{k)+G-X^ = ^да _J
К такому же результату мы придем, если наибольшим собственным
значением матрицы В окажется 1—hm, и мы положим на А-(-1-м
шагу й = ж-.
Довольно эффективный прием подавления компонент мы получим,
если будем изменять константу h от шага к шагу так, чтобы ко-
пень -г- полинома g (t)=l—hkt двигался по промежутку
(-к-1 М\ справа налево. При этом зона эффективного подавления
компонент вектора ошибки будет передвигаться, накрывая, в конце
концов, весь промежуток.
Если мы захотим быстро подавлять компоненты собственных
векторов, принадлежащих собственным значениям, лежащим в про-
•^межутке @, -?>-)• то нам придется брать h ]> -j^-, что, однако, будет
приводить к возрастанию компонент, отвечающих собственным зна-
значениям, близким к М.
Если же стремиться строить процесс так, чтобы ни на одном
шагу не происходило увеличения каких-либо компонент, то для
дальнейшего сдвига зоны наиболее эффективного подавления ком-
компонент влево нужно обратиться к полиномам высших степеней.
Рассмотрим грубую схему выбора полиномов g^Ht) невысоких
¦степеней s, обслуживающих значительную часть промежутка @, М),
•с постепенным сдвигом зоны наиболее эффективного подавления ком-
компонент справа налево (метод „утюга", см. рис. 16). Как мы уже
видели, промежуток (-к-. М] хорошо обслуживается полиномами
лервой степени.
Известно, что из всех полиномов данной степени s, удовлетво-
удовлетворяющих требованиям gs @) = 1 и \gs (t) j <^ 1 при 0 ^ t <; М, наиболее
§ 85] ПОДАВЛЕНИЕ ПРИ ПОМОЩИ ПОЛИНОМОВ НИЗШИХ СТЕПЕНЕЙ 561
близким к нулю наименьшим корнем обладает полином Чебышева
для промежутка (О, М), т. е. полином
cossarccos
М '
Наименьший корень этого полинома равен ts = М sin2 -т- , так что
п
?,= 0,0В?'М
Рис. 16.
для последовательных полиномов Чебышева наименьшими корнями
будут
м о V'X 2 • V~
t. = ~, L= / M^0.147M, t3= / M^0.067M, ...
ч 2 ' ' 4 4
М.
16s^
Поэтому за счет полиномов второй степени мы можем расширить
зону действия метода от -^- до 0.147 М, за счет полиномов третьей
степени расширить ее до 0.067М и т. д. Таким образом, для матриц
с обусловленностью, меньше чем 15, можно ограничиться лишь поли-
полиномами до третьей степени включительно.
Полиной
Чебышева.
Рис. 17.
Выбор полиномов первой степени можно осуществить, например,
так. На промежутке (-=-, Ж) возьмем точки ао=:Ж>а1> ...
... > aPi ^--9- и положим g-Cft)(^)= 1 , fe—0, .... pv (рис. 17)
36 Зак, 974. Д. К.. Фаддеев и В, Н, Фаддеека
562
УНИВЕРСАЛЬНЫЕ АЛГОРИФМЫ
[ГЛ. IX
Затем, для построения полиномов второй степени выберем после-
довательность точек
О о *¦
P—Mt
,3 =^ 0.147Ж и положим
Pi +Рг)
(см. рис. 18). Эти полиномы, очевидно, удовлетворяют первым двум
требованиям, наложенным на полиномы gf) (t), и обращаются в нуль
при t = bk-Pl.
Для обслуживания зоны от 0.147М до 0.067М служат полиномы
3-й степени
г
где Cj точки между t2 и t3.
Мы не будем входить в подробности относительно выбора поли-
полиномов более высокой степени, так как ниже мы рассмотрим другие,
более просто выполняемые способы
подавления компонент, отвечающих
собственным значениям, близким
к нулю. Отметим только, что во
всем изложенном важную роль играет
знание числа М. Ошибка в оценке
этого числа в сторону уменьшения
имеет некоторую опасность. Ошибка
же в сторону увеличения может
лишь несколько увеличить объем
работы.
Выбор точек деления обусловливается требованием точности с одной
стороны и желанием иметь их как можно меньше (обслуживать зону
подлиннее) с другой стороны.
Приведем результат использования полиномов низших степеней
к нахождению решения системы (9) § 23.
Здесь Ж = 2.62. Взяв
Полоном
Щьшеёа.
Рис. 18.
*! = 1.20. ?2 = 0.
получим
*' = (—1.2284428,
= 2.30, аа=2.00. а4=1.70,
#3 = 0.6, #4 = 0.3,
= 1-40
0.0473912. 1.0233490, 1.4591532/
Приближение X' получено в результате применения 13 итераций.
Длина вектора ошибки построенного приближения составляет 1.85%
длины вектора ошибки начального приближения ^0=:@, 0, 0, 0)'.
§ 86] РАЗЛИЧНЫЕ ФОРМЫ ПРОВЕДЕНИЯ УНИВЕРСАЛЬНЫХ АЛГОРИФМОВ 563
Описанный прием выбора подавляющих полиномов является до-
довольно грубым, и как мы увидим ниже, при более тщательном выборе
полиномов может быть получен лучший результат при использова-
использовании того же числа итераций.
§ 86. Различные формы проведения универсальных
алгорифмов
Прежде чем перейти к описанию конкретных универсальных
алгорифмов, коснемся вопроса об их численном осуществлении, огра-
ограничиваясь рассмотрением одного шага процесса при различных спо-
способах задания полинома, определяющего этот шаг.
1. Известны коэффициенты полинома h(t), или, что то же
самое, коэффициенты g(t). Пусть
h(t) = c/-1 + clf-2+ ... +с*-1- A)
В этом случае вычисление X' можно производить двумя следую-
следующими способами.
а) Прежде всего вычисляется невязка r = F — АХ. Затем после-
последовательно вычисляются векторы Аг, Агг As~1r и, наконец, X'
находится как известная линейная комбинация уже известных век-
векторов
X' = X+cs_,r + cs..2Ar + ... + с0Л8-V B)
При таком построении вектора X' возможен рост ошибок округле-
округления с одной стороны, а также уничтожение значащих цифр с дру-
другой стороны, ибо, как правило, коэффициенты с0, сх. . .., cs_t имеют
разные знаки.
Ь) Вычислив r = F — АХ, находим последовательно векторы
Z1=/lZ0-|-Clr /g\
¦Zs_i = AZS_2 -\- cs_1r.
Ясно, что h(A)r = Zs_l и, следовательно,
X'=X+ZS_V
Этот способ есть по существу не что иное, как применение извест-
известной схемы Хорнера. При таком построении вектора X' ошибки округ-
округления сказываются несколько менее, чем в предыдущем способе.
2. Известны корни еи .... es полинома g(t). Тогда
36*
564 УНИВЕРСАЛЬНЫЕ АЛГОРИФМЫ [ГЛ. IX
В этом случае вектор X' может быть найден как последний член Zg
следующей последовательности векторов:
Z^X+^-iF — АХ)
1 ! ¦ E)
Zi = Zi_1+ — (F — AZt_J (I == 2, .. ., s).
Действительно, при всех i
X* = X* -f — (F — AX*),
где X* — точное решение системы, и потому
X*— Z, = (X* — Z^O — -f A(X* — Zl_1) = (E — ±а)(Х* — Z^.l).
Следовательно,
= g(A)Y=Y~h(A)AY=Y—h(A)(F — AX)
и
Zs = X*— K-f h (A) (F — AX) = X-\- h (A) {F — AX) = X'.
Эта схема впервые описана в работе Ричардсона [1].
При применении этой схемы наиболее опасными в смысле влияния
ошибок округления являются шаги, соответствующие малым корням s;.
Целесообразно располагать корни в порядке их убывания.
3. Известны рекуррентные соотношения для определения
полинома g(t). Мы рассмотрим случай наиболее часто встречаю-
встречающихся трехчленных соотношений. Пусть g(t) = gs(t), где
Вид рекуррентных соотношений выбран так, чтобы все полиномы gi('\
были нормированы условием ^t@)=l.
Строим последовательность векторов
при Х0 = Х и X1=X0—al(F —
Тогда
X' = Xs.
Действительно, из G) следует, что
Отсюда заключаем по индукции, что
§ 86] РАЗЛИЧНЫЕ ФОРМЫ ПРОВЕДЕНИЯ УНИВЕРСАЛЬНЫХ АЛГОРИФМОВ 565
В частности,
и потому
у у/
s — •
Следующие приемы относятся к системе, подготовленной к виду
Х=ВХ+О.
4. Известны коэффициенты полинома f(t), именно
81 82 !• (8)
a) Вычислив невязку начального приближения г= ВХ-\-О-—X,
вычисляем векторы Br Bs~1r и находим X в виде известной
линейной комбинации уже известных векторов
Х'=Х+ bs_,r+ ... +Ь0В°-1г. " (9)
b) Вычислив невязку г, строим последовательность векторов
Zo = V A0)
Zi=BZi_l-+bir (*=1, 2, .... s—1).
Тогда
X' = X-+ZS_V
5. Известны коэффициенты полинома e(t), именно
e(O = flo^ + fl1/»-1+ ...+as. A1)
а) Вычисляем последовательные приближения Х0 = Х, Хх = ВХ0 -\~
+ 0, ..., Xs = BXS_!-|-О и составляем их линейную комбинацию
аЛ_,+ . . . '+ asX0.
Она и будет искомым приближением X'.
Действительно, пусть
Тогда
Y1 = BY0, ..., YS =
— B)Y0 =
b) Вычисляем последовательность векторов по формулам
= 0 s—1). V ;
Тогда последний вектор Zs будет равен X'.
\
566 УНИВЕРСАЛЬНЫЕ АЛГОРИФМЫ [ГЛ. IX
6. Известны корни е,, .... es полинома e(t). Тогда
(t-ч) ¦¦¦((-**)
ибо еA)=1.
Переход от вектора X к вектору X' можно осуществить в 5 шагов,
полагая на 1-й шагу ец (t) = —, ибо при применении нескольких
* 1
шагов полиномы et(t)перемножаются. При этом/{(^)=: -, так как
1 — гъ
«4@ = 1 — Т=Т7 A —0=1 —/*@A —О-
Следовательно, вектор X' находится как s-й член Zs последова-
последовательности
L Z^J, A5)
начиная с Zo — X.
7. Известны рекуррентные соотношения для определения поли-
полинома f(t). Пусть /(/) = /,_! @. где
/* @ = (fli* -h PO/i-i @ — т*/*-2 @- '
Вычисляем последовательность векторов
r = BX+G — X, Zo = $or, Z1 = a1Br + pir.
Z^ajSZ^+PiZ,., —TlZ,_2 (/=1, 2. .... s-1). ( 7)
Ясно, что
8. Известны рекуррентные соотношения для определения
полинома еA). Пусть e{t)= es(t), где
e,(f) = (aif+Pi)*i-i(') —ТЛ-гС). " }
Предполагается, кроме того, что все полиномы ei(t) удовлетворяют
условию <?{A)= 1, так что at -|~pi= 1, а^ + рг — ~ii= 1. / = 2 s.
В этом случае Л"' будет равен вектору Xs в последовательности
Xi_2. Л )
Действительно, в силу условий <zx —f- pt = 1, aj + P» — Т«=1 имеем
X* = ал {ВХ* + О) + frX* — т ХХ*.
§ 87] АЛГОРИФМ, НАИЛУЧШИЙ В СМЫСЛЕ ПЕРВОГО КРИТЕРИЯ 567
Вычитая, получим
откуда по индукции
Yi = ei(B)Y0,
в частности, Ys = е (В) Yo и, следовательно,
Х'=Ха.
Как правило, наиболее удобными оказываются схемы, использую-
использующие рекуррентные соотношения.
§ 87. Универсальный алгорифм, наилучший в смысле
первого критерия1)
Пусть известно, что все собственные значения матрицы А рас-
расположены в промежутке (от, М), О <С от <С М, и различны. Подготовим
систему AX^=F к виду X=BX-\-G так, чтобы собственные значе-
значения матрицы В расположились в симметричном интервале с центром.
2
в начале координат. Очевидно, что для этого нужно взять h= .. —„
В = Е — НА, G = hF. Тогда все собственные значения матрицы В
A 1 \ М -\- т
' -")• где Т = м——^ ^-
Построим универсальный алгорифм
подобрав полином fs-\(f) так, чтобы при данной его степени 5—I
было обеспечено максимально возможное подавление компонент для
всего класса матриц В с собственными значениями, заключенными
в промежуток ( , — J.
Для этого в качестве полинома es(t)=\—A —0/a-i@ нужно,
очевидно, взять полином, наименее уклоняющийся от нуля на про-
промежутке ( , —|, нормированный условием es(l)=l.
Таким полиномом является
i) M. Ш. Бирман [1].
'568 УНИВЕРСАЛЬНЫЕ АЛГОРИФМЫ [ГЛ. IX
где
Ts (t) = cos s arccos t.
~ 5
На рис. 19 дан график Тъ(() при ^ = j.
Полиномы 7^(?) связаны простыми рекуррентными соотношениями.
Действительно, для полиномов Чебышева такими являются соотно-
соотношения
при T0(t)=l, T1(t) = t. Поэтому
Ь @ = [ 1 + %^р] «U (О - -rrflf f-2 @. f0@=1, fx @ = t.
C)
В соответствии с рекуррентными соотношениями C) универсаль-
универсальный алгорифм (§ 86 п. 8) строится по формулам
— lf2K'' Xi_2 (i=\, 2 s). D)
Для вычисления по формулам D) нужно
предварительно заготовить по рекуррентным
соотношениям значения ~Yt\ ¦ При возра-
стающем i эти значения довольно быстро стре-
стремятся к пределу
Рис. 19.
Быстрота сходимости описанного процесса при s —> со будет
иметь порядок
1 2
Т /v\ ^ ч »
* а \\) („ ! т/ у2 . } ) _)_ (у Т/ у2 1 )
так что процесс сходится значительно быстрее метода последо-
последовательных приближений, для которого быстрота сходимости бу-
будет »[~s-
25
Так, например, при f =^—- (-р1 = 0.96) будет
'3\8
Ш'-К!)' П
/_3
/24\й
в то время как f-s = l—I .
§ 87]
АЛГОРИФМ, НАИЛУЧШИЙ В СМЫСЛЕ ПЕРВОГО КРИТЕРИЯ
569>
При пользовании формулами D) вместо того, чтобы брать все
увеличивающиеся значения для s, можно брать не очень большие s,
но повторять процесс несколько раз, принимая приближение, полу-
полученное в конце цикла, за начальное приближение нового процесса.
Для данной матрицы А осуществить подготовку к виду, позво-
позволяющему использовать описанный процесс, не просто. Действительно,
если для оценки числа М можно воспользоваться хотя бы оценкой
Гершгорина, то определение числа от оказывается гораздо более
п * М -\- т
трудоемким. Процесс же определяется выбором числа 7="упг^ ¦
которое быстро приближается к единице при от —>¦ О, и слишком
грубый выбор "J может сильно замедлить быстроту сходимости про-
процесса (если истинное значение f будет значительно больше взятого
на основании грубых оценок М и от).
Описанный процесс по существу дела идентичен тому, с которым
сравнивался метод наискорейшего спуска при выводе оценок для
быстроты сходимости.
Для полинома Ts(t) легко вычислить коэффициенты, что даст
возможность использовать схему п. 5 § 86. Однако при пользовании
этой схемой происходит значительное уничтожение значащих цифр.
Несколько лучшей оказывается схема п. 6 § 86, использующая
корни полинома Ts (t). Очевидно, что эти корни равны
1 B1 — 1)я
= — cos-—ц——
s).
При пользовании этой схемой приближение Xs получится как.
последний член последовательности
Z, =Zi_1+
— Z;_2) (/=1
s).
начинающейся с Z0 = X0.
Ясно, что при таком способе построения Xs нужно заранее
фиксировать значение s. Сходимость процесса обеспечивается цикли-
циклическим повторением.
Для уменьшения влияния ошибок округления следует располагать
корни s в порядке их убывания, так как процесс наиболее чувстви-
чувствителен к ошибкам округления на тех шагах, где е близко к единице.
Покажем ход процесса на примере системы (9) § 23, принимая
за Ж и от трехзначные приближения к наибольшему и наименьшему
собственным значениям матрицы - системы, именно М = 2.322 и
т — 0.242. Это дает /г = 0.78003120, так что
0.21996880
0.32761310
0.42121685
0.51482059
0.32761310
0.21996880
0.24960998
0.34321373
0=
@.23400936, 0.39001560,
0.42121685
0.24960998
0.21996880
0.17160686
0.54602184,
— 0.51482059'
— 0.34321373
— 0.17160686
0.21996880_
0.70202808)',.
570
УНИВЕРСАЛЬНЫЕ АЛГОРИФМЫ
[ГЛ. IX
Далее f = 1.2326923, а = 0.26204959.
Имеем
Хо
Ха
мз
Хл
18
X..
22
х.
24
О
— 0.23400936
— 0.64639927
— 1.2463278
— 1.2571934
— 1.2577816
— 1.2577930
— 1.2577936
О
0.39001560
0.03264644
0.0430531
0.0436358
0.0434862
0.0434873
0.0434873
О
0.54602184
0.52125464
1.0292117
1.0389835
1.0391543
1.0391655
1.0391661
О
0.70202808
0.75775989
1.4685821
1.4821027
1.4823759
1.4823918
1.4823926
§ 88. Универсальный алгорифм, наилучший в смысле
второго критерия
Пусть для системы Х= ВХ-{-0 известно, что все собственные
значения матрицы В лежат в промежутке I , —J при i > 1.
Универсальный алгорифм будет наилучшим в смысле второго крите-
критерия, если определяющий его полином f(t) будет полиномом, наименее
отклоняющимся от 1 на промежутке ( , — J. Очевидно, что
f(t) = fF(*[t), где F (t) есть полином, наименее уклоняющийся от
функции на промежутке (—1, 1).
Полином степени s— 1, удовлетворяющий последнему требованию,
был известен еще Чебышеву. Именно,
2а2
7 — i
где
Таким образом,
2а2
Js-l @ — j t
В работе М. К. Гавурина [1], впервые предложившего такой выбор
полинома f(t), рекомендуется вычислять коэффициенты полинома f{t)
и затем искать решение как линейную комбинацию векторов В*г0
согласно схеме п. 4, а) § 86. При больших степенях' s происходит
сильное уничтожение значащих цифр.
§ 88] АЛГОРИФМ, НАИЛУЧШИЙ В СМЫСЛЕ ВТОРОГО КРИТЕРИЯ 571
Значительно более удобная вычислительная схема получается, если
перейти к полиному es{t). Имеем
,_2/аГв_1(тО+<
Положим
Полиномы T^^t) связаны рекуррентным соотношением
с коэффициентами, не зависящими от номера полинома. Поэтому любая
комбинация нескольких соседних полиномов Чебышева связана соот-
соотношениями такого же вида. В частности,
Умножив на а2 и переходя к полиномам егA), получим
ибо 2^ V« = 2 Va, ^ a^a~X = l-j-a. При этом
Таким образом, последовательные приближения можно вычислять п>
рекуррентным соотношениям
*, = A + a) (BAi_t + G) - а^_2
(согласно п. 8 § 86), начиная с начальных приближений Х1 и Хг,
которые вычисляются по формулам
О —Л).
При численном осуществлении алгорифма, наилучшего в смысле
2-го критерия, нужно располагать такой же информацией о располо-
расположении собственных значений матрицы коэффициентов, как и при поль-
пользовании алгорифмом, наилучшим в смысле 1-го критерия. Мы пока-
покажем ход процесса на примере системы (9) § 23, подготовленной
так же, как на стр. 569.
572
УНИВЕРСАЛЬНЫЕ АЛГОРИФМЫ
[ГЛ. IX
Здесь а = 0.26204959. Имеем
о
. 0.6844342
— 1.5527282
—0.7490792
— 1.2636344
—1.2571287
—1.2578043
— 1.2577941
—1.2577935
0
1.1407237
—0.4096498
0.3334810
0.0348866
0.0438702
0.0434744
0.0434870
0.0434875
0
1.5970131
0.3597126
1.1875589
1.0266917
1.0393853
1.0391495
1.0391660
1.0391665
0
2.0533026
0.63-43461
1.6324174
1.4668835
1.4826318
1.4823719
1.4823925
1.4823930
§ 89. Прием А. А. Абрамова для ускорения сходимости
метода последовательных приближений при решении
систем линейных уравнений
А. А. Абрамовым [1] предложен следующий прием ускорения
сходимости процесса последовательных приближений для системы,
записанной в виде X=BX-\-G, где В — матрица, все собственные
значения которой вещественны и лежат в промежутке (—1, 1).
Время от времени нормальное течение процесса последователь-
последовательных приближений, происходящего по формуле
Х{к) = ВХ(к~х)-\-О, A)
применение которой мы для краткости будем называть В-шагом,
прерывается одним или несколькими более сложными ??2-шагами,
.В4-шагами, к описанию которых мы переходим.
N В2-шаг заключается в построении приближения х(к+2) по фор-
формуле
~7?(к+2) о y-ik+2) у(к) /Оч
Л — Z А —Л . (Z)
где Х{к+2) второе последовательное приближение, построенное из^(А)>
т. е.
- О. C)
Таким образом, В2-шаг требует применения двух В-шагов и со-
составления одной линейной комбинации.
Далее, ?4-шаг заключается в построении приближения Х(к+А) по
формуле _ _
где X^k+i) получается из АГ(/С> двукратным применением ?2-шага.
§ 89] ПРИЕМ А. А. АБРАМОВА 573
Аналогично определяются 58-шаг, В16-шаг и т. д.
Как правило, при практических вычислениях следует ограни-
ограничиться употреблением лишь В, В2 ВА, В8-шагов, чередуя их друг
с другом в некоторой последовательности.
Из описания следует, что вычислительная схема процесса Абра-
Абрамова почти не сложнее вычислительной схемы классического метода
последовательных приближений. Объем же вычислений для процесса
gkvgktgksgks ^т е ПрОцесса_ состоящего из k0 S-шагов, &i В2-ша-
гов и т. д.) лишь немного больше, чем объем вычислений при /го~Ь
-\-2kl-\-4&2+ 8/г3 шагах процесса последовательных приближений.
Поясним теперь, почему применение процесса Абрамова дает
лучший результат по сравнению с эквивалентным по объему вычис-
вычислений результатом, полученным по методу последовательных прибли-
приближений.
Для этой цели вычислим множители затухания в компонентах
векторов ошибки для отдельных шагов процесса Абрамова.
Ясно, что
у{к+\) _
yW __ ^252 ?) y(ft) — в. F№) = Т (В)
Здесь полиномы T2{t), Т±Ц), ... суть не что иное, как полиномы
Чебышева
Ts (t) = cos s arccos t.
Это очевидно для s = 2, для s—4, 8, ... это верно в силу
известного соотношения
На рис. 20 даны графики функций t2 и |Т2(/)[ = [2^2—1 |, на
рис. 21 графики функций /4 и |'/4(^)J, на рис. 22 графики функций
Рассмотрение этих графиков позволяет сравнить множители за-
затухания компонент в разложении вектора ошибки для почти эквива-
эквивалентных по объему вычислений двух S-шагов и одного В2-шага
(рис. 20), четырех S-шагов и одного 54-шага (рис. 21) и, наконец,
двух В2-шагов и одного ?4-шага (рис. 22).
Именно из рис. 20 мы видим, что два S-шага выгоднее одного Вг-
шага при 0 <С t <" —^=яа0.58. Но один .82-шаг значительно выгод-
нее двух 5-шагов при^>-^=. Поэтому „подавив" достаточно ком-
компоненты вектора ошибки для собственных значений из промежутка
574
УНИВЕРСАЛЬНЫЕ АЛГОРИФМЫ
[ГЛ. IX
-=rz методом последовательных приближений, следует перейти
к 52"шагам-
Далее, 54-шаг оказывается более выгодным, чем два 52"шага
для промежутка 0.89 < t < 1 (рис. 22). Из рис. 21 следует также,
что один В4-шаг выгоднее четырех S-шагов для промежутка
0.86 <?< 1. Поэтому применение Д,-шагов следует начинать после
того, как В и ??2-шагами уже подавлены компоненты вектора ошибки
для промежутка 0<?<0.89.
Рис. 20.
Рис. 21.
Рис. 22.
Время от времени следует возвращаться к низшим шагам, для
подавления накопившихся ошибок округления на компонентах, отве-
отвечающих малым собственным значениям.
Мы не приводим здесь численного примера, так как метод Аб-
Абрамова укладывается как частный случай в группу бГ-процессов,
имеющих более единообразную вычислительную схему.
§ 90. fir-процессы
Метод Абрамова может быть несколько обобщен без усложнения
вычислительной схемы. Именно, процесс Абрамова можно рассматри-
рассматривать как частный случай „ВТ-процессов", которые заключаются
в следующем. Пусть дана система
X=BX+G A)
с матрицей В, имеющей вещественные собственные значения, распо-
расположенные в интервале (—1, 1). Пусть далее дана последовательность
букв В и Т, начинающаяся с буквы В. Например,
ВВ ТТТ ВТВТВВТТ .... B)
В соответствии с этой последовательностью строим последователь-
последовательные приближения Х^°\ Лг<1), ХB\ . . ., задавшись начальным прибли-
приближением ^@) произвольно. Приближение Х(к) строим следующим
§ 90] 57-процессы 575
образом: если в последовательности B) на k-м месте находится
буква В, то полагаем
х{к) = вх{к-1) + о. ^ C)
Если же на k-м месте находится буква Т, то полагаем
\ D)
Выясним, как изменяются компоненты вектора ошибки в ВТ-про-
цессе. С этой целью разобьем последовательность B), определяющую
процесс на „слова" так, чтобы каждое слово содержало букву В
один раз и с нее начиналось. Например,
ВВ ТТТ ВТ ВТВВТТ .. .=В (ВТТТ) (ВТ) (ВТ) В (В.ТТ) . .. ==
Здесь
Ясно, что
если на k-м шагу находится буква В и
если на k-м месте находится буква Т.
Рассмотрим, как влияет на вектор ошибки применение слова Bs.
Имеем
У(к+1) = В У(к) = 7\ (В) Y(k)
= 2BY{k+1)— Y{k) = BВ2 — Е) Y(k) = Тг (В) Y{k)
_ BВТ2 (В) — Тх (В)) Yik) = Г3 (В) Y(k)
К1''г8) = [2В7в_! (В) — 7S_2 (В)] Y{k) = Ts (В) Y{k).
Здесь полиномы Tj(t) определяются рекуррентными соотношениями
при начальных условиях T0(t)—l, Tl(t) = t и, следовательно, сов-
совпадают с полиномами Чебышева cos/arccos^. Таким образом, приме-
применение слова Bs влечет за собой умножение компонент вектора ошибок
на множители T^C^i)» •••• ^sdai)- Применение же последовательности
из букв В и Т влечет за собой умножение каждой компоненты век-
вектора ошибок на произведение значений в соответствующей точке,
полиномов Чебышева, отвечающих отдельным словам В8, из которых
состоит определяющая последовательность B).
576 УНИВЕРСАЛЬНЫЕ АЛГОРИФМЫ [ГЛ. IX
Процессы Абрамова являются частными случаями ВГ-процессов,
в которых определяющие последовательности состоят из слов В, В2,
ВА, Вя, .... Метод последовательных приближений записывается
как ВВВВ . .. -процесс.
Так же как в процессах Абрамова, применение слов с высокими
номерами ускоряет убывание компонент, отвечающих лишь собствен-
собственным значениям матрицы В, близким по модулю к единице. Поэтому
целесообразно вначале работать только со словами В, вводя более
длинные слова на последующих стадиях и возвращаясь к более
коротким словам для погашения ошибок от округлений.
Применим ВГ-процесс для нахождения решения системы (9) § 23,
2
подготовленной с h = -^т- (C) § 31).
Применение слова
в2 {BTTf {BTf
диет
*:=(—1.2577936, 0.0434873, 1.0391661, 1.4823926)'.
Взятое слово состоит из 38 букв, так что для получения прибли-
приближения потребовалось вычисление 38 итераций.
Как мы видели (§ 31), метод последовательных приближений дал
такую же точность при 75 итерациях.
Слово
Bi0 {BTf (ВТТK {BTTTf В2 {BTf,
состоящее из 43 букв, дает
*=(—1.2577945, 0.0434870, 1.0391667, 1.4823935/.
Это приближение хуже предыдущего.
Дополнив взятое слово еще буквами ТВ ВТ, получим
Аг=(—1.2577936, 0.0434874, 1.0391662, 1.4823927)'.
Более удачный выбор первого слова по сравнению со вторым
объясняется тем, что обусловленность взятой системы такова, что
нет необходимости прибегать к словам, более длинным, чем ВТТ.
Разумный выбор слова, управляющего В7"-процессом, может быть
осуществлен посредством следующего „ВГ-процесса с управлением".
По ходу этого процесса параллельно с последовательными прибли-
приближениями Хк должны вычисляться три системы вспомогательных век-
теров — невязки гк, векторы 5й = Вг^ и векторы sk — 2sk — Ot-i-
Положим
§ 91] ОБЩИЕ ТРЕХЧЛЕННЫЕ ИТЕРАЦИОННЫЕ ПРОЦЕССЫ 577
Эти векторы получаются из вектора Хк применением В-шага и 7-шага.
Вычисление векторов Zk+l и Zk+l не требует проведения итераций, ибо
+ rk) — Xjt-v
Вычислим их невязки wk+1 и wklrl. Легко видеть, что
i = ^вг-к — гк^ = 2sk — rk_t = sk.
Сравним нормы векторов sk и sk и положим
Xk+l = Zk + l =1= Xk -\- Гк
— с {>
rk + \ — sk'
если ||s&||<||sft||, и
^u+i=^ Zk+x = 2(Xk~{-rk) Xk_x
F)
rk+l — sk<
если ||sfc||> ||sft(|.
Затем вычисляются векторы sk+1 = Brk и sfc+1 = 2sfc t — rk>
и процесс продолжается дальше. Время от времени, для уменьшения
ошибок округления, следует непосредственно вычислять невязку г
по формуле г. =Sy5(rfc+1-|-G — ^+i> a не по формулам E) или F).
Применение В7-процесса с управлением к прежнему примеру при-
привело к слову ВТВТВТВТВТВВТВВВТВТВВТВВТВВТВВВТВТ —
= (BTf В (ВТ) В* (ВТJ В (ВТ) В (ВТ) В (ВТ) В2 (ВТJ C4 буквы), в ре-
результате получено приближение
(—1.2577936, 0.0434874, 1.0391661. 1.4823928/,
отличающееся от точного решения не более чем на 2 • 10" в каждой
компоненте. Невязки вычислялись непосредственно на 11, 16, 21, 26
и 31-м шагах.
§ 91. Общие трехчленные итерационные процессы
Изложенные выше ВГ-процессы и наилучший в смысле 1-го
критерия алгорифм укладываются в следующую общую схему трех-
трехчленных универсальных процессов1).
Для решения системы
(I)
1) Д. К. Фаддеев [2].
37 Зак. 974. Д. К. Фаддеев и В. Н. Фаддее«а
578 УНИВЕРСАЛЬНЫЕ АЛГОРИФМЫ [ГЛ. IX
С матрицей В, собственные значения которой заключены в проме-
промежуток (—1, 1), строится, исходя из некоторого начального прибли-
приближения Х^о), последовательность приближений по формулам
B)
afcX(fc-2). C)
Первый шаг можно формально рассматривать протекающим по общей
формуле C), считая at = 0.
Ясно, что если as + i = 0, то процесс, начиная с s-j-1-го ша'а,
протекает так, как будто s-e приближение принято за начальное, и
далее применяется процесс при a^ = as+9. otg = as+3 В част-
частности, циклическое повторение процесса с некоторыми а2, .. ., as
равносильно применению единого процесса, в котором последоват
тельность at, a2 as, as+1, . . . состоит из циклически повто-
повторяющихся отрезков 0, a2 ag.
В методе последовательных приближений все aft = 0, в ВТ-про-
цессах последовательность ак состоит из нулей и единиц, в опти-
оптимальном процессе afe—
кA)
Векторы ошибки в трехчленном процессе удовлетворяют соот-
соотношениям
так что
где Pk(t) последовательность полиномов, построенных по рекуррент-
соотношениям
Рк @ = ( 1 + «*) ^*-1 @ — ЧРк-2 (О-
Теорема 91. 1 Полиномы Рк (t) удовлетворяют неравенствам
\Рк(*)\< 1 при — 1 <^< 1, —1 <aft< I (ft = 2, 3, . . .)•
Доказательство. Обозначим РА.(^) = Ф(/, а2, . . ., ак). При фикси-
фиксированном t полином Ф (t, a2 ак) есть линейная функция от
каждого из аргументов а2, .,., ак. Поэтому при изменении пара-
параметров сс2 aft в кубе —1 ^ а2 ^ 1 —1 <! ак ^ 1 функ-
функция Ф(/, а2, ..., ак) принимает экстремальные значения в одной
из вершин куба, т. е.
где
^2= ±1 ^=±1.
§ 91] ОБЩИЕ ТРЕХЧЛЕННЫЕ ИТЕРАЦИОННЫЕ ПРОЦЕССЫ 579
Покажем, что
Рк (/) = Ф (t, е2 eft) = Т,к @ = cos sft arccos /.
причем чебышевский номер 5ft+1 каждого последующего полинома
на единицу больше или на единицу меньше номера sk предшест-
предшествующего.
Действительно, это верно для k = Q, ft=l, ибо
Ро @=1= То (*). Р, (f) = t = 7\ @.
Допустим, что это верно для полиномов Pk_l(t) и Рд@> т- е-
допустим, что Pk(t) = TSk(t) и Рй_х@==ПйТ1@- Тогда
При sfe+1==—1 получим
При ей+1 = 1 получим
Рк+х @ = 2/rSft @ — 7-gfcT1 @ = Т,к±1 (().
В обоих случаях полиномы P^+iCO и Рк@ оказались полиномами
Чебышева с соседними номерами.
Тем самым
что и требовалось доказать.
Можно доказать, что если 0<ай<а<1, то полиномы Pk(t)
равномерно стремятся к нулю во всяком промежутке —Т^^^
<^ Y < 1, так что трехчленный итерационный процесс в этих усло-
условиях будет сходящимся.
Отметим некоторые интересные частные случаи трехчленных
универсальных алгорифмов сверх указанных в начале параграфа.
1. Трехчленный алгорифм с постоянным а. Пусть ай = а,
0<а<1 при всех k ^ 2. Тогда, как легко видеть,
где
^i^ V— 1 J. rs = cos ft arccos/,
sin(fe+l)arccosf
sin arccos i
37*
580
УНИВЕРСАЛЬНЫЕ АЛГОРИФМЫ
[ГЛ. IX
Поэтому при -^ t ^ — имеем
Таким образом, если все собственные значения матрицы В заклю-
заключены в интервале I , —), процесс с постоянным ак = я~
== ("Г — V^T2—1 J сходится почти столь же быстро, как оптималь-
оптимальный процесс.
2. Универсальный алгорифм с поликомами Чебышева 2-го
рода. Пусть ак--
В этом случае
k—\
k+l •
1 sin Ik + l)arccos t
k+l
sin arccos t
есть полином Чебышева второго рода, нормированный условием
Я*A)=1.
Очевидно, что последовательность Pk(t) равномерно стремится
к нулю во всяком сегменте, внутреннем для промежутка (—1, 1),
хотя сформулированное выше достаточное условие сходимости здесь
не выполнено. Процесс будет сходиться довольно медленно, однако
его достоинство состоит в том, что даже при небольших k про-
происходит ощутимое погашение компонент в широком интервале.
Рис. 23.
Рис. 24.
Действительно, ближайший к 1 максимум модуля ой полинома Рк (О
асимптотически равен | cospj | = 0.217, где pt есть наименьший поло-
положительный корень трансцендентного уравнения tgt = t. Достигается
Pi
этот максимум
к единице.
в точке ^ =
1—,-
2 (*+!)«'
близкой
§91]
ОБЩИЕ ТРЕХЧЛЕННЫЕ ИТЕРАЦИОННЫЕ ПРОЦЕССЫ
581
Таблица 91.1
Значения <зк и ул
На рис. 23 и 24 даны графики полиномов РБ(/) и Pt(t), в табл. 91.1
приведены значения внутреннего максимума модуля ак полинома Pk{t)
для k = 2, 3 6 и границы промежутка
(—Тй- ?&)¦ в котором |Рй(ОК<»й-
Описанный универсальный алгорифм це-
целесообразно применять циклически при не
очень больших k. Применение т циклов
подавляет компоненты вектора ошибки из
интервала (— ~[к, *(к) с интенсивностью о™.
Приводим результаты решения си-
системы (9) § 23, подготовленной при
о
(C) § 31) по трехчленному алго-
алгоh =
рифму с постоянным а.
к
2
3
4
5
6
°й
0.333
0.272
0.250
0.239
0.233
п
0.707
0.816
0.878
0.913
0.935
*i
*2
¦^18
Х2ь
^40
0.22900763
—0.4055708
—0.5442885
— 1.2593757
— 1.2574775
— 1.2578296
— 1.2577930
— 1.2577939
0.38167939
0.0372933
0.1987509
0.0436874
0.0435276
0.0434832
0.0434875
0.0434874
0.53435115
0.3577880
0.7684031
1.0408131
1.0389918
1.0391862
1.0391659
1.0391664
0.68702290
0.5162869
1.0678660
1.4846543
1.4821385
1.4824220
1.4823924
1.4823932
х,
х2
Xis
Х2ь
0.22900763
—0.4055708
—0.4583667
— 1.2577739
— 1.2577920
— 1.2577939
0.38167939
0.0372939
0.2190763
0.0434788
0.0434873
0.0434873
0.53435115
0.3577880
0.7423973
1.0391330
1.0391649
1.0391662
0.68702290
0.5162869
1.0255501
1.4823466
1.4823909
1.4823929
Приведем еще результаты применения к той же системе алго-'
рифма с полиномами Чебышева 2-го рода. ¦- • *
582 УНИВЕРСАЛЬНЫЕ АЛГОРИФМЫ [ГЛ. IX
Циклическое проведение процесса через че?тыре шага уклады-
укладывается в общую схему при at = 0, а2 = 7з> «з^Уг. at = 3U> «5 = 0,
«в = 1/з. а7 = 1/2- а8=3/б> а9 = 0'--- Получим
*8
^Л |2
^16
^20
*24
^28
0
— 1.2048821
— 1.2594577
— 1.2576202
— 1.2578018
— 1.2577945
— 1.2577936
— 1.2577938
0
0.0715392
0.0409823
0.0437954
0.0434441
0.0434944
0.0434859
0.0434876
0
1.0432993
1.0371510
1.0393241
1.0391507
1.0391677
1.0391659
1.0391663
0
1.4836599
1.4800347
1.4825350
1.4823855
1.4823922
1.4823933
1.4823927
Применение полиномов более высоких степеней в данном случае
дает худший результат. Именно, процесс через шесть шагов при
Х\г
-^18
^24
^30
0
— 1.5437461
— 1.1941027
— 1.2734516
1.2543485
1.2586028
0.
0.
0.
0.
0.
0
0461754
0504107
0443237
0436402
0434955
0
1.2796197
0.9848809
1.0509812
1.0363966
1.0397846
0
1.8191787
1.4059616
1.4992437
1.4784862
1.4832740
§ 92. Универсальный алгорифм Ланцоша
Удобный универсальный алгорифм был предложен Ланцошем [6V
Мы изложим его с некоторыми незначительными изменениями, касаю-
касающимися предварительной подготовки системы. Именно, будем счи-
считать, что система подготовлена к виду
X=BX+G A)
(вместо Y = -^BY-\-2c0 в обозначениях автора) и все собственные
значения матрицы В находятся в промежутке (—1, 1). , -
§ 92] УНИВЕРСАЛЬНЫЙ АЛГОРИФМ ЛАНЦОША
В качестве полинома es{t) берется
- 7*8+1 (О
583
B)
где Ts+i полином Чебышева. Очевидно, что es{t) действительно есть
полином, ибо 7S + 1A)=1, и, следовательно, 1 — Ta + l(t) делится
на 1—t. Легко проверить, htO?sA)=1.
Действительно, положив ^ = cos9, получим,
что
Таблица 92.1
Значения as и ys
_ 1 — cos (s -!- 1) О
es\t> — (s +1JA —cos 0)
и, следовательно,
C)
sins
s+\
«.A)=
6>°
. „ i
s
3
4
5
6
7
as
0.0741
0.0625
0.0572
0.0543
0.0525
Та
0.334
0.541
0.683
0.750
0.806
Из формулы C) видно, что полином es(t) превращается при замене
^ = cos9 в ядро Фейера Ks(ft), нормированное условием /Cs@)= 1.
Приведем графики eb{t) и е6(/) (рис. 25 и рис. 26).
Рис. 25.
Рис. 26.
Последовательные максимумы полинома es(t) убывают при дви-
движении по оси абсцисс справа налево. Наибольший внутренний мак-
максимум as стремится- к пределу 0,0472 при s —> оо. В табл. 92.1
приведены значения внутреннего максимума as полиномов,es(t) для
s =3 6 и граница fs промежутка [—1, fs], в котором | es (t) |<!з8.
Сравнение с табл. 91.1 показывает, что при том же номере s
значения максимума модуля в алгорифме Ланцоша значительно меньше,
чем в алгорифме с полиномами Чебышева 2-го рода. Числа же fs
приближаются к 1 в последнее алгорифме боле.е 6bictpo.,
584 УНИВЕРСАЛЬНЫЕ АЛГОРИФМЫ [ГЛ. IX
Универсальный алгорифм Ланцо'ша проводится по схеме, исполь-
использующей рекуррентные соотношения для полинома
t (л
Выведем эти соотношения. Имеем
1 «@
1 - Тв+1
)»q —Q _
1KA
Поэтому
На основании соотношения
Ta+iM*=2tTe+l(f)— Ts(t),
получим
(s+2)H\ —t?fs(t)-(s+ 2L1— 0+1 =
(l— 0— 1.
После приведения подобных членов и сокращения на A—tJ мы
придем к соотношению
с начальными полиномами /_х = 0, /0=-2-.
Введем далее в рассмотрение полиномы
F,V) = {±^f,<!)- E)
Эти ¦ полиномы удовлетворяют еще более простому рекуррентному
соотношению
J , F)
при начальных условиях Fo(t) = -K, F1(t) — t-{-2. Последние со-
соотношения позволяют провести универсальный алгорифм следующим
образом.
Вычислив невязку начального приближения r = BX-\-Q — X, об-
образуем последовательность векторов
Г
0 ~
=2, 3. .... s— 1).
§ 92] УНИВЕРСАЛЬНЫЙ АЛГОРИФМ ЛАНЦОША 585
Тогда
В обозначениях Ланцоша (Y = -jBY-\-2co\ формулы приобре-
приобретают еще более простой вид
1вК+2с0— Y
1 = BZ0-\-4Z
0
Рассматриваемый универсальный процесс сходится при безгра-
безграничном увеличении s очень медленно, так как множители затухания
es+1(\)-i) на каждом фиксированном промежутке, содержащемся вну-
внутри (—1, +1), убывают лишь со скоростью -у.
Однако при небольших значениях s он дает значительное пода-
вление компонент вектора ошибки на довольно широком интервала
(— 1, fa) для собственных значений.
Циклическое повторение процесса обеспечивает хорошую сходи-
сходимость для систем с Р-числом обусловленности, не превосходящим
Ланцош рекомендует брать s = 7. В этом случае (в применении
к системе К= -i-BK+2coj
Z6 = j (В« -f- 4В» + 4В* + 4В2 + 16В + 32)
Вычисление вектора Ze рекомендуется производить не по рекур-
рекуррентным соотношениям, а по формулам схемы Хорнера (п. 86, п. 4, Ь).
Ланцош советует употреблять описанный универсальный алгорифм
для систем высокого порядка с целью предварительной подготовки
начального приближения при применении метода минимальных ите-
итераций, так как этот последний при таком выборе начального при-
приближения достаточно быстро становится вырожденным. Приводим
в качестве примера результат циклического применения процесса
Ланцоша при s = 9 для системы (9) § 23, подготовленной прн Л =
= 2/2.62. "
686 УНИВЕРСАЛЬНЫЕ АЛГОРИФМЫ - [ГЛ. IX
Первый цикл дает
АГ = (—1.2574119. 0.0428473, 1.0387672, 1.4829441)',
второй цикл:
*= (--1.2577870, 0.0434717, 1.0391658, 1.4823988)',
третий цикл:
Х=(—1.2577935, 0.0434868, 1.0391663, 1.4823931)'.
В результате третьего цикла B7 итераций) мы получаем компо-
компоненты решения с точностью до 3 • 10~7.
В данном примере четыре цикла при s=7 B8 итераций) дают
худший результат
Х={—1.2577659, 0.0434909, 1.0391514, 1.4823708)'.
§ 93. Универсальные алгорифмы, наилучшие в среднем
Как мы видели, при выборе полиномов, подавляющих компоненты
вектора ошибки решения системы
при условии, что собственные значения матрицы В заключены в про-
промежутке (—1, 1), нужно руководствоваться двумя плохо совмести-
совместимыми условиями, именно, малостью уклонения полинома от нуля
внутри промежутка (—1, 1) и обращением в единицу на его правом
конце.
Так как буквально удовлетворить этим двум- требованиям невоз-
невозможно, естественно пытаться удовлетворить первому из них в смы-
смысле малости среднего квадратического уклонения.
Именно, будем строить полином es(t), минимизирующий
fP(f)el(t)dt
в классе полиномов степени s, удовлетворяющих условию es(l) = 1.
Весовая функция p{t) > 0 может выбираться различным образом на
основе информации о плотности распределения собственных значений
данной матрицы В на промежутке (—1, 1) и информации о характере
распределения компонент начального вектора ошибок. Если такого
рода информация отсутствует, естественно брать р(?)= 1 при
-1 <*'<!•
§ 93] УНИВЕРСАЛЬНЫЕ АЛГОРИФМЫ, НАИЛУЧШИЕ В СРЕДНЕМ 587
Легко установить, что полиномы es(t) образуют ортогональную
систему по весу A—t)p(t). Действительно, пусть
ee(O=14-e1(l— t)+a2(l—tf+ ... +0,A—0'.
t
j= fP(t)et(t)dt. B)
-i
i
Тогда очевидно, что j,— = 2 / р(^)A—t)les(t)dt. Для экстре-
1
-1
мального полинома все частные производные равны нулю, так что
es(t) будет ортогонален по весу p(t) к полиномам A—tf при
/=1 s, а по весу A—t)p(t) к полиномам A—t)i-l при
/= 1, .... s и, следовательно, к любому полиному, степень которого
меньше s. В частности,
—t)p{t)es(t)ei(t)dt = O при / = 0, 1 s— 1. C)
-1
Из теории ортогональных полиномов следует, что при любой
весовой функции полиномы e{{t) связаны трехчленными рекуррент-
рекуррентными соотношениями
-i@ — Ti«*-2@- D)
Это позволяет строить последовательные приближения к решению
системы в универсальном алгорифме, наилучшем в среднем при дан-
данном выборе весовой функции, по формулам п. 8 § 86, как только
вычислены коэффициенты at, p4 и fi-
Для р (t) — 1 соотношения D) имеют вид
«0@=1. *i@ = ¦§'+-?
IJ "^ B/-l)(/+lJj e»-i W — B/_ 1) (г + i)i ei -г
Поэтому последовательные приближения вычисляются по формулам
На рис. 27 и 28 даны графики
ет_42?/6,9?/5_495 45 135 15 _^
ЧКЧ— п21 ^56г 112Г 2Г +112f ^56Г 112
588
УНИВЕРСАЛЬНЫЕ АЛГОРИФМЫ
В табл. 93.1 даны значения оа и fa, где <за и
смысл, что и в §§ 91 и 92.
[гл. ix
имеют тот же
Рис. 27.
Рис. 28.
Полиномы es(t) просто связаны с полиномами Лежандра
Таблица 93.1
Значения as и fs
— I)8
s
2
3
4
5
6
V»
v4
V.
Ve
V»
0.6
0.735
0.804
0.860
0.894
Именно,
При
2s- s!
мы придем к полиномам, ортогональным по
весу A—(f+1(l-{-f)9, т. е. к так назы-
называемым полиномам Якоби (гипергеометри-
(гипергеометрическим полиномам). Применение таких поли-
полиномов рассматривается в работе Штифеля [5].-
Универсальный алгорифм, наилучший в среднем при р(/)=1, был
^применен циклически для нахождения решения системы (9) § 23,
подготовленной при А = 2/2.62. Было получено
Хп
¦^30
¦^85
*Ш
0
—1.3813506
—1.2464295
—1.2588065
—1.2577045
—1.2578015
—1.2577939
-1-1.2577930
0
0.0338070
0.0446982
0.0433614
0.0434986
0.0434862 .
0.0434873
0.0434874
0
1.1209397
1.0325678
1.0397375
1.0391177
1.0391704
1.0391663
1.0391658
1 0
1.5985210
1.4726554
1.4832186
1.4823210
1.4823990
1.4823930
1.4823923
§ 94] МЕТОД ПОДАВЛЕНИЯ КОМПОНЕНТ В КОМПЛЕКСНОЙ ОБЛАСТИ 589
Здесь Хзъ оказался ближе к точному решению, чем Х36. Это сви-
свидетельствует о том, что один из корней полинома eb(t) оказался
близким к тому собственному значению, компонента которого была
еще недостаточно подавлена за счет предыдущих циклов.
Вообще, при пользовании специальными полиномами для подав-
подавления компонент вектора ошибки целесообразно использовать также
„аномальное" подавление, происходящее от близости одного из кор-
корней к собственному значению, подобно тому, как это делается в ВТ-
процессе „с управлением".
§ 94. Метод подавления компонент в комплексной области
Все рассмотренные до сих пор универсальные алгорифмы строи-
строились для систем с вещественными собственными значениями матрицы
коэффициентов.
Идея подавления компонент, в теоретическом плане, легко рас-
распространяется и на системы, матрицы которых имеют комплексные
собственные значения.
Пусть на плоскости комплексной переменной задано ограниченное
замкнутое множество S, дополнение к которому есть связная область Д,
содержащая точку 2 = 0.
Рассмотрим класс систем
AX=F
таких, что все собственные значения матриц А лежат на множестве S.
Для такого класса систем можно строить (в теоретическом плане)
универсальный алгорифм, наилучший в смысле первого критерия.
С этой целью достаточно построить полиномы gs (г), удовлетво-
удовлетворяющие требованию g-s@)=l и наименее уклоняющиеся от нуля
на множестве S, а затем строить приближения к решению системы
по формуле
где
Приведем оценку сходимости такого универсального алгорифма
при s—*¦ оо .
Пусть
полином, наименее уклоняющийся от нуля на множестве S и такой,
что корни полинома х8{г) лежат на множестве Е. Тогда уклонение
от нуля полинома gs(z) на множестве S не более, чем уклонение от
нуля полинома ,-/ . Обозначим уклонение от нуля полинома тв (z)
590 УНИВЕРСАЛЬНЫЕ АЛГОРИФМЫ [ГЛ. IX
через xg. Тогда, как известно,')
¦ = e
где G(z) функция Грина для области Д с логарифмической особен-
особенностью в точке 2 = 00. Поэтому, при г?Е
так что — lg lggpg^'<0. Положив 2 = 0. получим
где е сколь угодно малое положительное число, С(е) константа,
зависящая от е.
С другой стороны, пусть R = max\gs(z)\ и ?* — совокуп-
ность точек, таких, что \gs(z)\-^R, Ъ есть ограниченное замкнутое
множество, содержащее S, и дополнение к нему Д* есть связная
область, содержащаяся в Д. Ясно, что — lg р - есть функция
Грина для области Д*. Так как Д*с Д, то будет выполнено нера-
неравенство -^ lg H^li ^ G (г) для всех г ? Д*. Это неравенство будет
верно и для всех точек г?Д, ибо если 2^Д и .г(?Д*, то GB)>-0,
откуда
Итак
Таким образом, универсальный алгорифм, наилучший в смысле 1-го
критерия, сходится с быстротой геометрической прогрессии со знаме-
нагелем в-^-».
Общие способы построения полиномов g(z) неизвестны, так что
описанный алгорифм может применяться лишь к некоторым частным
областям. В § 97 будет установлена возможность построения
Е-универсальных алгорифмов при помощи конформного отображения
единичного круга на область Д (или на ее односвязную накрывающую),
которые для односвязных областей Д обладают почти той же
быстротой сходимости.
Технически проще строить универсальный алгорифм, наилучший
в среднем. Это сводится к построению полиномов gs(t), минимизи-
1) Г. М. Г о л у з и н. Геометрическая теория функций комплексного
переменного, ГИТТЛ, 1952, гл. VII.
§ 95]
ПРИМЕНЕНИЕ КОНФОРМНОГО ОТОБРАЖЕНИЯ
591
рующих Г | gs (z) [2 ф, где |х некоторая неотрицательная мера,
сосредоточенная на множестве S.
Нетрудно дать формулы для построения полиномов gs(z), как
только известна система ортогональных полиномов по мере \х. Пусть
{Pj(z)}—ортогональная система полиномов по мере \i. Будем
искать полином gs (z) в виде
Тогда
8
= 2 *,/
1=0
Условие gs(Q)=\ примет вид
По неравенству Коши — Буняковского
г=0
откуда
i-o
1
2
i-0
Равенство достигается при ct = —-—^-^ , где ^@) число ком-
i-o
плексно-сопряженное с Р{ @). Следовательно,
B) =
Ортогональные полиномы по данной мере для разных множеств S
изучались в классических работах Сеге, Бохнера и В. И. Смирнова.
§ 95. Применение конформного отображения
к решению линейных систем
До сих пор мы рассматривали универсальные алгорифмы для
систем Х= ВХ-\-0 при условии, что все собственные значения
матрицы В вещественные и заключены в промежутке (—1,1).
592 УНИВЕРСАЛЬНЫЕ АЛГОРИФМЫ - [ГЛ. IX
В. Н. Кублановской1) разработан метод, использующий аппарат
теории функций комплексной переменной, который позволяет строить
универсальные алгорифмы для систем X=BX-{-G при других
предположениях о расположении собственных значений матрицы В.
Вместо системы
X=BX+G A)
изучается система
X=zBX-\- О, B)
содержащая комплексный параметр 2. Решение последней системы есть,
очевидно, Х(г) — (Е— zB)~1G. Все компоненты решения являются
аналитическими и даже рациональными функциями от z с полюсами
только в точках — —, где ;лх \хп собственные значения
матрицы В. Действительно,
{Е — zB)-1Q = jI±7SjC(z)Q, C)
где С {г) союзная с Е— zB матрица. Элементы C(z) являются, оче-
очевидно, полиномами от z, корнями же знаменателя являются числа,
обратные к собственным значениям матрицы В. Имеем далее
(E — zB)-1G = G-)-zBG-{-z*BiG+ ... D)
Радиус сходимости этого ряда равен ¦ ,—г> и если • среди соб-
тах 11ч |
г
ственных значений матрицы В имеются собственные значения, по
модулю большие единицы, то интересующая нас точка z = 1 ока-
окажется за пределами круга сходимости.
Положим теперь
z = z Ода) = a{w -f- аг13)г + ..., E)
где z{w) — функция, мероморфная в единичном круге \w\ < 1, при-
принимающая значение z = 1 в некоторой точке 8 этого круга и не
принимающая внутри круга значений —, ..., — (тем самым, если
среди чисел ^ имеется нуль, функция z (/да) должна быть регуляр-
регулярной).
Все компоненты вектора X(z) будут регулярными функциями
от w в круге |гг»|<1. Действительно, знаменатель \Е—zB\ не
будет обращаться в нуль при \w\ < 1. В полюсах же функции z(w),
если они есть (что возможно только при \В\ФО), все компо-
компоненты X (z) будут равны нулю, ибо (Е — zB)~x G =
1/1 \-1
= —1~?'—^1 G-*0 при 2->оо. Поэтому решение Х(г) си-
В. Н. Кублановская [1], [2].
§ 95] ПРИМЕНЕНИЕ КОНФОРМНОГО ОТОБРАЖЕНИЯ 593
стемы B) может быть разложено в ряд по степеням w с радиусом
сходимости, не меньшим единицы.
Для построения этого ряда разложим функцию -г-—-г по сте-
1 — Zt
пеням w. Имеем
t2(atw + a2w2 + . . .J-f . . . =
= \ + bx(t)w + b2(t)w*+ ... + ft,(f),»i_|_ ..., F)
где bt(t) некоторые полиномы от t степени i. Коэффициенты поли-
полиномов ?>j(/) могут быть вычислены, как только известно разложение
функции z(w).
При w = б ряд F) превращается в разложение
± /N<+... G)
Используя теперь равенство F) для разложения решения X(z)
в ряд по степеням w, получим
Решение исходной системы Х=Х{\) найдется по формуле
Х=(Е— S)O = G + e61(B)G4-92^(S)O+ ••• (8)
Этот ряд всегда будет сходящимся, ибо О<|0|<1, и сходимость
будет тем быстрее, чем меньше | б |.
Допустим теперь, что относительно матрицы В известно, что все
ее собственные значения принадлежат некоторому ограниченному
множеству S, дополнение к которому есть односвязная область,
содержащая точку 1. В этих условиях естественно ставить вопрос
об 5-универсальном алгорифме, т. е. об алгорифме, применимом
ко всем системам X=BX-\-G, таким, что собственные значения
матрицы В принадлежат 5.
Построение 5-универсальных алгорифмов может быть осуще-
осуществлено посредством конформного отображения. Обозначим через D
область, которая получается из дополнения к 5 посредством ото-
отображения функцией —. Так построенная область D будет односвяз-
ной, будет содержать точки 0 и 1 и не содержать чисел, обратных
собственным значениям всех матриц В рассматриваемого класса.
Точка оо-может как принадлежать, так и ле принадлежать области D.
Для применения формулы (8)* ко всему классу рассматриваемых
систем можно взять в качестве z(w) любую функцию^ мероморфную
594 УНИВЕРСАЛЬНЫЕ АЛГОРИФМЫ [ГЛ. IX
в единичном круге, все значения которой принадлежат области D и
принимающую значение 1 в некоторой точке б этого круга. Такой
функцией является, в частности, функция, осуществляющая конфор-
конформное отображение единичного круга на область D. Из теории кон-
конформного отображения следует, что такой выбор функции z(w)
является наивыгоднейшим, так как именно при нем достигается
наименьшее возможное значение | 9 | .
Действительно, пусть г(w) = axw~j-a2"w2-f- ... какая-либо до-
допустимая функция, 2(8)= 1. Далее, z = z(w) — fl^-f- a2w2-\- ...
функция, осуществляющая конформное отображение единичного
круга на область D, w = F(z) — функция, обратная к z (w), б = /?A).
Покажем, что |б|<|6|.
С этой целью рассмотрим функцию W(w) = F(z(w)). Ясно, что
W@) = 0, W (w) регулярна в единичном круге, |W(w)|<l при
|гг»|<1. Согласно лемме Шварца1) для всех точек единичного
круга будет
| W (w) |< | w j.
Положив w — 6, получим
Знак равенства может иметь место, только если z (w) = z (wz),
Je|=l, т. е. если функция z{w) сама осуществляет конформное
отображение единичного круга на область D.
Метод конформного отображения может быть применен и
в случае, если дополнение к 5, а вместе с ней и D являются много-
многосвязными областями. В этом случае наивыгоднейшей z{w) является
функция, осуществляющая конформное отображение единичного круга
на универсальную накрывающую область D риманову поверхность.
Перейдем теперь к описанию вычислительных схем метода.
В работе [2] В. Н. Кублановской приведены вспомогательные
таблицы коэффициентов полиномов
для ряда отображающих функций z (w) при s = 5 и s= 10.
Это позволяет вычислять приближения LS(B)O к решению X как
линейную комбинацию последовательных итераций О, BG, B2G, .. .
или посредством применения схемы Хорнера. При этом приходится
заранее фиксировать число взятых в формуле (8) членов.
Ограничиваясь небольшим s трудно рассчитывать на получение
достаточной точности. Однако однократное применение приближен-
См. цитированную на стр. 590 книгу Г. М. Голузина, стр. 29
§ 95] ПРИМЕНЕНИЕ КОНФОРМНОГО ОТОБРАЖЕНИЯ 595
ной формулы X=^LS(B)G можно рассматривать как элементарный
шаг итерационного процесса Х^^ = Х^к~^-{- Ls (В) rk_v где Л4_1 =
^ ^
Легко построить вычислительные схемы метода, использующие
лишь коэффициенты uj отображающей функции z (w). Именно, из
тождества
[\ — t (ajW-\-a2w2 ~\- . . .)][l-{-bi(t)w-\-b2(t)w2~\- ...] = 1,
равносильного формуле F), получаем рекуррентные соотношения для
полиномов bj (t). Именно,
it. (9)
Обозначив bi (В) G = G,-, Go = G, получим
Oi = ?(a1Oi-i+ ... +а4О0) (/=1.2....)
Компоненты векторов G; будут или не возрастать, или возрастать
очень медленно, ибо радиус сходимости ряда EGiW' равен единице.
Рекуррентные соотношения, аналогичные (9), можно установить и
для полиномов Li(t). Именно, легко проверить, что
Это дает возможность строить по рекуррентным формулам сами
последовательные приближения JVj — Li_l(B) О. Именно,
Xl = G, X2=G-\- ax%BG
*i:=:O + a1S?A'i_1 + a262?Xi_2-f ... +ai_16i'~1SAr1. A2)
Очевидно, что формулам A2) можно придать вид
^ = 0, ^ = A—^0
^, = A— Й18 — а2б2— ... — а^^
i1 G). A3)
Вычисления по рекуррентным формулам A0), A2) или A3) требуют
несколько большего числа вычислительных операций, чем вычисле-
вычисление при помощи заранее вычисленных коэффициентов /у, но имеют
то преимущество, что нет необходимости заранее фиксировать число
членов ряда.
Формулы A3) соответствуют п. 7 § 86. Для получения формул,
аналогичных п. 8 § 86, введем в рассмотрение полином
'¦@=1— (i—O^i-i (О- О4)
596 УНИВЕРСАЛЬНЫЕ АЛГОРИФМЫ [ГЛ. IX
Легко проверить, что полиномы 1г($) связаны рекуррентными
соотношениями
+A_Й1е—... —Oi^tf-^t. A5)
Отсюда для 1-го приближения Хц — li (В) Хо получим
). A6)
Формула A6) превращается в формулу A3) при Х0 = 0.
Во многих случаях оказываются более удобными рекуррентные фор-
формулы, построенные исходя из коэффициентов dj разложения в ряд по
степеням w функции —. Эта функция будет регулярной, ибо 2 = 0
70)
только при tw = O (если область D многосвязна, функция — будет
мероморфной).
Пусть
W W
2 п* im Л— п~чт% \ 0 ! t 1 2 ! * ¦ • » 0 '" * V /
Тогда
— zt w ~ dQ-\- d]W -j- dow% -\- ... — tw
z
Отсюда, приравнивая коэффициенты при одинаковых степенях, получим
— 0*i @ = 0
А(О = о, A9)
так что
_х @ _^ bi.t @ — ... — %=i ft, (О (* > 3). B0)
*о «о ао
§ 95] ПРИМЕНЕНИЕ КОНФОРМНОГО ОТОБРАЖЕНИЯ 597
Формулы B0) позволяют вычислять векторы G» в формуле A0) по
рекуррентным соотношениям
Легко вывести также и рекуррентные формулы для полиномов
Ц (t) и li (t). Именно
Lt(t) = bJt=J!&Lt_l«)-^Lt-t(f)--... -^*=*-MO+ B2)
«О а0 "О
Далее,
«o
При /й@ = <. /2@ = ' — -T^ + ^t2-
Поэтому последовательные приближения можно вычислять по фор-
формулам
или по формулам
X, = BX0+G; Х2 = ^- (ВХХ + О) +
Bб)
«о
Рассмотрим теперь метод конформного отображения с точки зре-
зрения идеи подавления компонент. Пусть Хо исходное приближение.
598
УНИВЕРСАЛЬНЫЕ АЛГОРИФМЫ
(ГЛ. IX
\
X' = Xs=XQ-{-Ls_i(B)r0, ro = BXq-\-G — Xo. Тогда соответствую-
соответствующие векторы ошибок связаны соотношением
где /,@=1— A— t)Ls_x{t).
Оценим |/s@| Для любой точки t, принадлежащей множеству 5.
Пусть О<ро<1, СРо образ окружности |да|=р0 при отображе-
отображении z = z(w) единичного круга на область D. Имеем
1
dw
— tz{w)}
Пока
1
— ро> функция z(w) пробегает кривую СРо. Если t?S, то
не принадлежат области D. Поэтому 1—tz не равно нулю при
/ ? S, z?D и |1—tz\ равномерно ограничен снизу константой d9o,
пока z ? СРо, t ? S. Поэтому имеет место равномерная для t ?S оценка
Таким образом, на основании формулы G),
Ро
откуда
(ill)'
1 \ Ро /
<C(po)[(l+s)|0|f.
Ро
1
Здесь е= 1 положительное число, которое можно сделать сколь
Итак, компоненты
угодно малым, С(ро) = тах(A—^)| ; ггг-
вектора ошибки „затухают" по крайней мере со скоростью [(l-f-s)|9|]s-
Сделаем следующее замечание относительно применения метода
конформного отображения.
Если в систему Х= ВХ-\- G ввести параметр z в виде
где p(z) регулярная в области D функция, обращающаяся в единицу
при 2 = 1, то по методу конформного отображения решение исход-
исходной системы получим в виде
сг(В) 0+ ....
§96]
ПРИМЕРЫ S-УНИВЕРСАЛЬНЫХ АЛГОРИФМОВ
599
Где ct(t) полиномы, являющиеся коэффициентами в разложении функ-
функции
a (w)
.— tz{w) — W>-r-c,@'a>+c2@w2+ ••• Здесь о(да) = рB(та»))
функция, регулярная в единичном круге. При любом выборе функ-
функции а (г) (или, что то же самое, р (z)) порядок быстроты сходимости
будет одним и тем же.
§ 96. Примеры 5-универсальных алгорифмов
Рассмотрим теперь несколько конкретных 5-алгорифмов. Как мы
видели выше, каждый такой алгорифм определяется ограниченным
замкнутым множеством S, содержащим собственные значения матриц В.
1. 5—круг радиуса —, f > 1
с центром в начале координат
(рис. 29). В этом случае область D
есть внутренность круга радиуса f
с центром в начале координат. Ото-
Отображающая функция есть
z(w) = ~[W, 9 = — .
Поэтому последовательные прибли-
приближения вычисляются по формуле
т. е. в этом случае мы приходим
к классическому методу последова- рис 2д
тельных приближений.
2. 5 — отрезок вещественной оси I , —J, f > 1 (рис. 30).
В этом случае область D есть плоскость с двумя разрезами вдоль
- V _ /
Y
0
1
У
Рис. 30.
вещественной оси, исходящими из точек —
Отображающая функция есть
и f в бесконечность.
zkw)=Jv?L
-.. в==т—Ута —ь
600
УНИВЕРСАЛЬНЫЕ АЛГОРИФМЫ
¦ W
[ГЛ. IX
Однако в этом случае функция —г— будет еще проще. Именно,
^ = 1A + ^), так что do = d2 = ±, dl = d3 = di^ ... =о.
Поэтому последовательные приближения удобно строить по рекур-
рекуррентным формулам B5), которые обращаются в формулы
г^ -f- G) —
г = ВХ0 -f. G, Хг =
_2 при
2Т9) Х1 =
= A-1-62) фХ^ _|_ О) —
Процесс почти совпадает с универсальным трехчленным алгориф-
алгорифмом с постоянным множителем <х=62 (§ 91), отличаясь от него лишь
началом процесса.
3. 5 — эллипс с фокусами в точках и — и с вершинами
в точках , —, *[^>а^>1 (рис. 31). В этом случае область D
Рис. 31.
будет внутренностью некоторого овала. Отображающая функция есть
где 91 = if — У if2—1.
Снова функция , ¦ оказывается квадратным полиномом
Поэтому
§ 96] • ПРИМЕРЫ 5-УНИВЕРСАЛЬНЫХ АЛГОРИФМОВ
Из формул B5) получим
601
0\
Х2 = 2^ (ВХ, + О) + A — 2т8Х) Х1 = A + 6i) {ВХХ •+ G) - b\xlt
xt = (i + б?) (B^_t + о)—e?Ai_2.
Как мы видим, эти формулы совпадают с формулами, полученными
выше для отрезка вещественной оси.
/ i i ^
4. 5 — отрезок мнимой оси ( g-, -g-i (рис. 32). В этом
случае область D есть плоскость с двумя разрезами вдоль мнимой
оси, исходящими из точек — р/ и р/ в бесконеч-
бесконечность. Отображающая функция есть
f
Рис. 32.
Рис. 33.
Так же как и в предыдущем случае, функция —-—- будет квадрат
W 1 Z(W) 1
• = -ж-A—w2), и потому ао = -™
ным полиномом, именно
= щ, dx — db=di-= ... =0. Для последовательных прибли-
приближений из формулы B5) получаются рекуррентные формулы
5. 5—эллипс с фокусами в точках —ji и у/ и мнимой
полуосью —, а> 1 (рис. 33).
602
УНИВЕРСАЛЬНЫЕ АЛГОРИФМЫ
[ГЛ. IX
В этом случае область D будет внутренностью некоторого овала.
Отображающая функция есть
1 — 1
где р =
Р Р ' ~ J
Так как —?— = -— ?—w2, получим из формул B5) после про-
простых преобразований
X, = ВХ0 + С Х2 = A —
4 О) 4 e
О) +
Вычислительные формулы для приближений совпадают с формулами
п. 4 после замены в них 6 на Oj.
6. S — два касающихся круга, опирающихся на отрезки (о, —)
и (О, 1 как на диаметры, 7 > 1 (рис. 34). В этом случае
Рис. 34.
область D есть полоса —-j
' отображающая функция
Замечание. При практическом пользовании методом конформ-
конформного отображения • нет необходимости использовать наименьшее
известное нам множество S, содержащее собственные значения дан-
данной матрицы, в силу имеющейся информации. Множества 5 следует
§ 97] МЕТОД КОНФОРМНОГО ОТОБРАЖЕНИЯ 603
подбирать так, чтобы отображающая функция имела наиболее про-
простой вид. Небольшие изменения множества S влекут за собой лишь
небольшое увеличение б.
§ 97. Метод конформного отображения в применении
к неподготовленной системе
Метод конформного отображения может быть применен и непо-
непосредственно к решению системы
AX=F. A)
Пусть ?— ограниченное замкнутое множество, дополнение к кото-
которому Д (включая бесконечно удаленную точку) есть односвязная
область, содержащая точку 0. Мы будем считать, что все собствен-
собственные значения матрицы А принадлежат множеству Ъ. Рассмотрим си-
систему
АХ— uX=F, B)
зависящую от комплексного параметра и. Исходная система полу-
получается из B) при и = 0.
Положим, что функция и = и (w) отображает единичный круг
|да|< 1 на область Д так, что и@) = со. Обозначим через 6 про-
прообраз 0. Решение системы B) запишется в виде
Исследуем функцию . Эта функция регулярна в области Д,
включая точку и = со, при любом t, принадлежащем множеству Е.
Ясно, что функция u(w) имеет следующее разложение в ряд
It I' ttf)%\ 1 Я Я _.. Я (ЯЛшУ / Л\
\ / ~ ^ 0 ^ 1 2 "^ ~~ • ¦ • I \^)
причем с_! ф 0. Следовательно,
1 w_
t — и (w) ~~ с_1 + (t + с0) w + cyw"- -\- ...
..]. E)
где ditf) полиномы степени /. Радиус сходимости этого ряда будет
не меньше единицы.
В соответствии с разложением E) решение системы B) будет
Х(и) = w[d0(A)F¦+-wd{(A)F~\-w2d2(A)F-\- ...]. F)
604 УНИВЕРСАЛЬНЫЕ АЛГОРИФМЫ [ГЛ. IX
Решение же исходной системы представится в виде сходящегося
ряда
%F UF ^ ..], G)
отрезки которого дают приближенные решения системы.
Метод допускает следующее видоизменение. Вместо функции
1 • р (w)
;—г- можно ввести в рассмотрение функцию —~^—-,—гг. где
t — u(w) * r ^J w[t — и (w)\
p (w) любая регулярная в единичном круге функция, удовлетворяю-
удовлетворяющая условию р(8) = 8. Тогда
= «о @ + «, @ « + «к @ «"+¦¦•¦ (8)
где at(t) — некоторые полиномы от t. Радиус сходимости последнего
ряда по-прежнему равен единице. Соответственно решение системы A)
представится в виде
... (9)
Сравним теперь решение системы AX—F, найденное по ряду G).
с решением той же системы, найденным по ряду (8) § 95 после пред-
предварительной подготовки системы A) к виду Х~ BX-\-G при В =
= E — hA, O = Fh.
Собственные значения матрицы В связаны с собственными значе-
значениями матрицы А соотношением р.^ = 1 — к\. Поэтому за множе-
множество S для матрицы В можно принять множество точек 1—Ы при
t? Е. Тогда область D будет дополнением к множеству \ _th, ^6^»
так что [в силу однолистности функции _,, на всей плоскости
комплексного переменного, включая бесконечно далекую точку) D
получается из Д отображением посредством функции -рт.
Функция u{w) отображает единичный круг на область Д, следо-
следовательно г (w) = , ¦_ , —г отображает единичный круг на D, при-
причем 2@) = 0, 2F)= 1. Таким образом, функция z(w) удовлетворяет
требованиям § 95.
Положив ^=1—М (здесь t является „представителем" ма-
матрицы A, tx „представителем" матрицы В), имеем
где bi(t) коэффициенты в разложении функции ._ ,—-—г по степе-
степеням w. Подставив В — Е — hA и G = hFt получим
где pi@ =
§ 97] МЕТОД КОНФОРМНОГО ОТОБРАЖЕНИЯ 605
Ясно, что полиномы fyi(t) будут коэффициентами в разложении
функции
1 1 \ — hu(w)
\ — (\ — ht)z (w) ~~ \ — ht ~~ h{t — u (да))'
1 — hu (w)
а полиномы h$i(t) будут коэффициентами в разложении функции
1 — Ли (да)
t — и (w)
Таким образом, сопоставляя с формулой (8), получим, что
при p(w) = w(\—hu(w)).
Отсюда мы делаем заключение, что порядок быстроты сходимости
рядов, дающих решение системы AX—F при различных ее подго-
подготовках, не зависит от числа А, определяющего данную подготовку,
так как этот порядок определяется лишь числом б. Интересно отме-
отметить, что решение, даваемое рядом G), получается как предельный
случай решения подготовленной системы при h -*¦ 0.
Функция Грина О (и) для области Д и функция u(w) связаны,
как известно, следующим образом:
О(и) = —lg|w(a)|,
где w(u) функция, обратная u(w).
Поэтому
Таким образом, метод конформного отображения имеет такой же по-
порядок быстроты сходимости, какой имеет метод подавления компо-
компонент полиномами, наименее уклоняющимися от нуля (см. § 94).
Мы не будем останавливаться на разборе конкретных Е-алго-
рифмов, которые могут быть построены так же, как это делалось
при построении конкретных S-алгор.ифмов.
Остановимся теперь на случае, когда область Д многосвязна.
Метод конформного отображения распространяется на этот слу-
случай почти без изменений. Берется мероморфная в единичном круге
функция z(w), имеющая простой полюс в точке ^ = 0, принимаю-
принимающая значение 0 в некоторой точке б и не принимающая значений
из множества Б. Тогда
есть сходящийся ряд в круге | w \ < 1 при любом t? S. Решение
системы AX—F представляется в виде
X— d0F + bdx (A) F -i- 62d2 (A) F + . .. A0)
Ряд A0) будет сходиться тем быстрее, чем меньше |б(, так что
в качестве 8 следует брать наименьший по модулю прообраз точки
2 = 0, если их много.
606 УНИВЕРСАЛЬНЫЕ АЛГОРИФМЫ [ГЛ. IX
Наилучшей функцией z(w) является функция z = y(w), отобра-
отображающая единичный круг на односвязную накрывающую область Д
риманову поверхность.
Действительно, пусть z{w) какая-либо функция рассматриваемого
класса. Каждая ветвь функции ср~ (z(w)) будет регулярна внутри
единичного круга, так что многозначная функция у*1 (z (iv)) в дей-
действительности распадается на однозначные регулярные ветви. Выбе-
Выберем из них ту Ф(те>), для которой Ф@) = 0. Ясно, что |Ф(«»)|<
< 1 при |г»|<[ 1. По известной лемме Шварца
|Ф(то)|<|г»|. A1)
Пусть 6 наименьший по модулю прообраз точки 2 = 0 при ото-
отображении z = z(w) и 6О = ФF). Ясно, что <р(90) = 0, так что 60
является одним из прообразов точки 2 = 0 при отображении
z = y(w). Положив f = i в неравенстве A1) получим: •
Если обозначить через 0* наименьший по модулю прообраз то-
точки 2 = 0 при отображении z = <p(w), то подавно
Из той же леммы Шварца следует, что знак равенства возможен,
только если Ф(щ/) = ^ при |v|=l. т. е. если z(w) = tf(yw).
Тем самым доказано, что наименьшее по модулю число 0 доставляет
ФУНКЦИЯ 2 = cp(w).
Покажем теперь, что в случае многосвязной области метод кон-
конформного отображения дает худший результат, чем метод подавления
компонент при помощи полиномов, наименее уклоняющихся от нуля.
Пусть О (?) функция Грина для области Д с логарифмической
особенностью в точке 2 = оо. Обозначим через ф(г) наименьшее по
модулю значение функции <p-1(,z) (если их несколько, выбираем
какое-нибудь одно) и рассмотрим функцию Я(г) = — lg|tyB)|.
Ясно, что H{z) есть гармоническая функция в окрестности точки
2 = оо, исключая эту точку, в которой H(z) имеет логарифмическую
особенность, ибо ф(г) в окрестности бесконечно далекой точки сов-
совпадает с той ветвью функции у1 (г), для которой <р~!(оо) = 0.
Пусть 20 произвольная точка области Д, о круг с центром в то-
точке 20, содержащийся со своей границей 7 внутри области Д. Возь-
Возьмем ту ветвь функции у-1 {г), для которой ср-1B0) = ф(г0). Тогда
1ФС2) |<^| <?~1(z)\ во всех точках круга S, включая, его границу -j.
Ясно, что
H(Z0) - --lg i Г* Bo) I = i / - '
§ 97] МЕТОД КОНФОРМНОГО ОТОБРАЖЕНИЯ 607
ибо — ]g ] <р~1 (г) | есть гармоническая функция в круге 5 (через г
обозначен радиус этого круга). Поэтому
т г
Таким образом, Н(г) есть субгармоническая функция в области Д.
Далее, Н{г) — G(z) есть субгармоническая функция, ограниченная
в окрестности точки z = со, и ее наибольшее значение не может до-
достигаться внутри области Д. Допустим, что Д ограничена конечным
числом аналитических кривых. Тогда на границе Д как G{z), так и
И (г), определены и равны нулю. Следовательно, И (г) — ОB)<0
во всех точках области Д или H(z) = G(z) в Д. Вторая возможность
отпадает, ибо для многосвязной области Н(г) не является гармони-
гармонической функцией в точках, для которых имеется более одного про-
прообраза с наименьшим модулем. Итак, H(z) — О(г)<0 в А, В част-
частности, Я@) = —lg|9|< О@), откуда
|6|>е~О@). A2)
Предположение о границе области Д, при котором выведено не-
неравенство A2), снимается посредством предельного перехода от об-
областей Де, ограниченных s-линиями уровня для функции Грина ис-
исходной области Д.
Неравенство A2) означает, что быстрота сходимости метода кон-
конформного отображения уступает быстроте сходимости метода
подавления компонент при помощи полиномов, наименее уклоняю-
уклоняющихся от нуля.
Приведем один пример, иллюстрирующий это обстоятельство.
Пусть ? есть совокупность двух отрезков (— Ь, — а) и (а, Ь)
вещественной оси (рис. 35). В этом случае область Д двусвязна.
-6 -а 0 a S
Рис. 35.
Функция, отображающая единичный круг на универсальную накры-
накрывающую, задается уравнением
4kx . Г
¦—- arctg w = / -
— oo
Здесь
со 2
= f dJ f _ d<?
sin'2
608 УНИВЕРСАЛЬНЫЕ АЛГОРИФМЫ [ГЛ.
При этом
т. к,
р 2" к1
где
2 у ( f(z2 — д2) Fа — г9-) J Yb2 — (б2 — a?)
Если взять а = 1, 6 = У , то kx = fe2 и потому
0.6558.
Покажем, что метод подавления компонент приведет к-процессу
с более быстрой сходимостью.
Рассмотрим полином
Ts C — 2*2)
где Ts(f) — cos 5arc cos Л При ^?Е
Далее, ?s@)=l- Положим
и найдем приближение
Тогда
K2s = X* — X2S =Y0— h2s_, (A) AY0 = g2s (A) Yo.
Следовательно, компоненты вектора Y2s в разложении по собствен-
собственным векторам умножаются на множители g2s(^i). Но
Итак, используя 2s итераций начального вектора, мы получили для
погрешности оценку порядка (У2 — l) ?»@.4142) , в то время
как метод конформного отображения с использованием такого же
числа итераций дает быстроту сходимости порядка 02s?« @.6558J8.
§ 98] РЕШЕНИЕ ЧАСТИЧНОЙ ПРОБЛЕМЫ 609
§ 98. Применение идеи подавления компонент к решению
частичной проблемы собственных значений
Степенной метод для определения собственного вектора, принад-
принадлежащего наибольшему по модулю собственному значению, основан
на том, что последовательность векторов AkY0, при произвольном
начальном векторе Ко, сходится по направлению к указанному соб-
собственному вектору.
Действительно, компоненты собственных векторов Ux Un
в разложении начального вектора
в результате ft-кратного применения итерации матрицей А получают
множители Xi, ... , Х^, среди которых Х^ преобладает над осталь-
остальными. Если нормировать процесс так, чтобы коэффициент при Ut
оставлять равным единице, то остальные компоненты „подавляются"
стремящимися к нулю множителями (г-?1 , . . ., (т^1 . Эта идея „по-
„подавления" компонент может быть обобщена следующим образом.
Пусть известно, что все собственные значения матрицы А, кроме
одного Xj, подлежащего определению, лежат на некотором ограни-
ограниченном множестве S, дополнение к которому А есть связная область
плоскости комплексной переменной г. Пусть xfc (t) = tk -\- ... поли-
полином fe-й степени, наименее уклоняющийся от нуля на множестве ?
такой, что его корни, в свою очередь, лежат на множестве Б.
Построим вектор —тту ~* С<4) Ко- Будем предполагать, что Ко
имеет ненулевую t-ю компоненту в разложении по собственным
векторам. Ясно, что /-я компонента построенного вектора будет пре-
прежней, а остальные компоненты приобретут множителей к.. у (j Ф I)-
Модули этих „множителей подавления" удовлетворяют неравенству
i Он) I'
Здесь xft= max I xk(t)\. Известно1), что
где G(t) есть функция Грина для области Д. Поэтому последова-
последовательность векторов то(Л)Ко> х1(Л)К0, ... сходится по направлению
к собственному вектору, принадлежащему собственному значению Xit
!) См. цитированную на стр. 590 книгу Г. М. Голузина, гл. VII.
39 Зак. 974. Д. К. Фзддеев и В. Н. Фаддеева
610 УНИВЕРСАЛЬНЫЕ АЛГОРИФМЫ [ГЛ. IX
-к\вA.) -е]
с быстротой е , где е сколь угодно малое число. После
определения собственного вектора собственное значение Xf опреде-
определяется без труда.
§ 99. Применение конформного отображения к решению
частичной проблемы собственных значений
Степенной метод может быть интерпретирован также следующим
образом. Рассмотрим вектор Y(w) = (E—wA)'1 Yo. Его компоненты
являются аналитическими функциями от комплексной переменной w,
имеющими полюса в точках г- <—, где | Х: [ > | Х21 ~^> ...
¦ ¦ • ^> ! ^п I — собственные значения матрицы А. Наименьшим по мо-.
дулю полюсом будет число, обратное к наибольшему по модулю
собственному значению. Разложим вектор Y (w) в ряд по степеням w
Y(w) = (?— wA)'1 Yo= YQ-{-wAY0-\rw'-A2Y0-\- ... A)
Радиус сходимости этого ряда будет, очевидно, равен'ту—, и на
его круге сходимости будет существовать единственный простой
полюс г-. Компоненты вектора Y(w) будут аналитическими функ-
функциями, имеющими, вообще говоря, простой полюс =— на границе
сходимости ряда A). Для любой такой компоненты y(w) имеем
у (w) = уо-\- yxw + y2w2 + B)
Здесь ук есть выбранная компонента вектора AkY0.
Предельная формула
X limi!*±l C)
fc Ук
может быть истолкована как результат применения теоремы Кёнига
о коэффициентах разложения функции, имеющей единственный про-
простой полюс на границе круга сходимости.
Оценка быстроты сходимости процесса (порядка
где X,
•2
следующее по модулю собственное значение матрицы А) также сле-
следует из теоремы Кёнига.
Такое рассмотрение степенного метода позволяет обобщить его
в следующем направлении. Пусть
c2w2
c2w2—
есть мероморфная в единичном круге функция, и@) —со, u-(fi) = \v
0 < | б | < 1, причем при | w | <С-19 |, w Ф 9, и (w) не принимает зна-
значений, равных собственным значениям матрицы А.
Рассмотрим вектор {А — u(w)E)~1 Yo. Согласно формуле F) §97
1Y0^w[d0 (A) Yo-\-d1(A)Yow-{'d2(A)Yow2 + ...],
§ 98J РЕШЕНИЕ ЧАСТИЧНОЙ ПРОБЛЕМЫ 611
где di(t) некоторые полиномы степени I. Любая компонента вектора
(А—u(w)E)~1 будет мероморфна в единичном круге и регулярна
в круге |tw|<^|9|, кроме точки w = b, в которой она, вообще го-
говоря, будет иметь простой полюс.
Следовательно, по теореме Кёнига отношения выбранных компо-
компонент векторов dk+i(A)Y0 и dk(A) Yo будут стремиться к 9, а сами
векторы будут сходиться по направлению к собственному вектору,
принадлежащему собственному значению Х;. Собственное значение
найдется как а (9). Быстрота сходимости процесса будет иметь по-
A к
рядок р , где 19* |^>1, если внутри единичного круга нет про-
прообразов собственных значений, кроме 9. Если же в единичном круге
имеются также прообразы собственных значений матрицы А, то 6*
есть наименьший из них по модулю.
Допустим теперь, что относительно собственных значений мат-
матрицы А известно, что все они, кроме одного, подлежащего опре-
определению, лежат на ограниченном замкнутом множестве ?, дополне-
дополнение к которому Д есть односвязная область. В этом случае в ка-
качестве функции и (w) следует взять функцию, осуществляющую
конформное отображение единичного круга на область Д. По сообра-
соображениям, изложенным в § 95, такой выбор функции будет наивыгод-
наивыгоднейшим в смысле быстроты сходимости полученного процесса.
При проведении вычислений можно пользоваться вспомогатель-
вспомогательными таблицами для коэффициентов последовательных полиномов
dk{t). Векторы dk(A)Y0 можно также строить по рекуррентным со-
соотношениям.
Отметим также, что так как векторы dk(A)Y0 сходятся по на-
направлению к собственному вектору матрицы А, принадлежащему
определяемому собственному значению Х;, то последнее можно на-
находить как отношение компонент векторов Adk(A)Y0 и dk(A)Y0,
(а не как образ 9).
Впервые использование конформного отображения для нахождения
собственных значений было предложено В. Н. Кублановской [1],
[2], которая вместо функции u(w) рассматривала функцию z{w) =
= —.—г, отображающую единичный круг на область Д, полученную
из области Д отображением посредством 2 = —. В этих работах ис-
исследуется функция
(Е — г А) = — и(А — иЕ)'1,
полюса которой совпадают с полюсами рассмотренной выше функции
А — иЕ. В работе [2] приведены таблицы коэффициентов соответст-
соответствующих полиномов для ряда областей Д.
ЗАКЛЮЧЕНИЕ
Значительное число методов, рассмотренных нами в настоящей
книге, далеко не исчерпывает всего многообразия приемов, предло-
предложенных для численного решения основных задач линейной алгебры.
Так, нами совершенно опущены методы „Монте-Карло", обоснование
которых имеет более теоретико-вероятностный, чем алгебраический
характер. Из многочисленных схем исключения рассмотрены лишь
немногие наиболее употребительные, описаны далеко не все итера-
итерационные процессы. Почти не рассматривались схемы, приспособлен-
приспособленные для решения задач частного вида, имеющих узкую область при-
применения. Наконец, в книге не отражены приемы, опубликованные
в самое последнее время.
И хотя уже рассмотренный материал дает основание поставить
вопрос о том, какие из описанных методов должны быть рекомен-
рекомендованы для практических расчетов предпочтительнее перед другими,
на этот вопрос трудно и даже невозможно дать определенный ответ,
так как в различных конкретных условиях к методам должны предъ-
предъявляться разные требования.
Важнейшим из критериев оценки качества численного метода яв-
является его надежность, т. е. способность перенести в решение
задачи почти всю информацию, содержащуюся в ее условии. Однако
кроме критерия надежности имеются и другие, достаточно сущест-
существенные.
Это — простота вычислительной схемы. Далее, мини-
минимальность числа вычислительных операций; мини-
минимальная загрузка памяти для машин с программным упра-
управлением или компактность записи при пользовании настоль-
настольными машинами. Часто важной оказывается возможность использования
индивидуальных особенностей задачи, облегчающих ее
¦решение (преобладание диагональных элементов матрицы, наличие
большего числа нулевых элементов и т. д.). Наконец, иногда важна
приспособленность метода к серийному решению однотипных задач.
Каждый заслуживающий внимания численный метод должен в той
или иной мере удовлетворять всем указанным требованиям. Но в раз-
различных конкретных условиях удельный вес каждого требования мо-
может быть различным. Даже такое, казалось бы, необходимое требо-
требование, как надежность, может отступать на задний план, например,
при решении большой серии однотипных задач, не требующих зна-
значительной точности результата. Часто из двух методов, в одном из
которых проще вычислительная схема, но требуется большее число
ЗАКЛЮЧЕНИЕ 613
вычислительных операций, чем в другом, следует предпочесть пер-
первый. Однако в задачах, связанных с матрицами высоких поряд-
порядков, критерий минимальности числа вычислительных операций может
оказаться решающим.
Сравнение методов по критериям простоты вычислительной схемы,
загрузке памяти, приспособленности к индивидуальным особенностям
задачи и серийности не представляет труда. Учет количества вычи-
вычислительных операций тоже не сложен как в точных методах, так
и в итерационных, если заранее известна быстрота сходимости.
Значительно сложнее оценивать методы по критерию надежности.
По сути дела, при приближенной постановке вычислительных задач
в их решении всегда имеется неопределенность в исходных данных.
Эта неопределенность может быть значительной, например, при ре-
решении плохо обусловленной системы. Численный метод должен счи-
считаться надежным, если при его применении решение получается
с погрешностью, не превосходящей существенно указанной выше
неизбежной погрешности, обусловленной неопределенностью исход-
исходных данных.
Основными факторами, снижающими надежность метода, являются
ошибки, происходящие от округления в промежуточных вычислениях.
Таким образом, строгий учет надежности должен основываться на
оценке влияния ошибок округления. Практически интересными яв-
являются вероятностные оценки, так как оценки „на максимум" почти
всегда практически завышены, в силу малой вероятности их реализации.
В литературе имеется довольно много работ, посвященных ис-
исследованию влияния ошибок округления в основных арифметических
операциях и в некоторых численных методах линейной алгебры.
Сюда относятся работы: Нейман и Голдстайн [1], Тюринг [1], Голд-
стайн и Нейман [1], Дуайр и Уо [1], Абрамов [2], [3], Хаусхольдер [3],
[11], Голдстайн, Меррей и Нейман [1], Карр [1] и др. В частности,
детальному анализу подвергнута Нейманом и Голдстайном схема
главных элементов Гаусса. Однако в настоящее время далеко не
все основные методы подвергнуты такого рода исследованию.
Более того, иногда такое исследование оказывается принципи-
принципиально невозможным, в силу зависимости влияния ошибок округления
от факторов, которые заранее нельзя учесть.
Так, при проведении схемы единственного деления при решении
системы линейных уравнений с заранее фиксированным порядком ис-
исключения неизвестных, надежность результата определяется в значи-
значительной степени тем, будет ли происходить уничтожение значащих
цифр по ходу процесса или нет, что, в свою очередь, зависит от
существования или несуществования малых главных миноров у мат-
матрицы коэффициентов. Для одной и той же системы может оказаться,
что при различном выборе порядка исключения неизвестных различ-
различной будет и надежность результата. Наиболее надежным будет вы-
выбор порядка исключения, совпадающий с порядком в схеме главных
614 ЗАКЛЮЧЕНИЕ
элементов. Таким образом, схема единственного деления с фиксиро-
фиксированным порядком исключения неизвестных оказывается не безусловно
надежным методом и во всяком случае менее надежным, чем схема
главных элементов. Однако отсюда еще не следует, что схема глав-
главных элементов всегда предпочтительнее, так как ее реализация
значительно сложнее, чем реализация схемы с фиксированным по-
порядком исключения. Многие другие численные методы линейной
алгебры оказываются не безусловно надежными. Такими оказываются
биортогональный алгорифм и метод минимальных итераций. Их на-
надежность зависит во многом от удачного выбора начального вектора.
Среди методов определения собственных значений наиболее надеж-
надежными являются те, в которых собственные значения определяются
минуя вычисление коэффициентов характеристического полинома,
так как незначительные ошибки в определении этих коэффициентов
могут повлечь значительные ошибки в вычислении корней. Но вместе
с тем итерационные методы для решения полной проблемы собствен-
собственных значений оказываются значительно более трудоемкими, чем точные,
связанные с вычислением коэффициентов характеристического полинома.
Нам представляется, что в оценке применимости не безусловно
надежных методов основное значение имеет опыт их использования
и лишь по мере обобщения этого опыта будет возможно выска-
высказать более определенные суждения по этому вопросу.
Скажем еще о некоторых приемах, повышающих надежность
методов. Теоретически говоря, каждый „точный" метод линейной
алгебры имеет в себе неограниченный запас надежности, который
может быть реализован за счет точности проведения промежуточ-
промежуточных вычислений. Значительное повышение точности на всем протя-
протяжении вычислительного процесса часто оказывается невозможным,
и повышение точности следует применять в наиболее „уязвимых"
ситуациях. Источником значительных ошибок от округления является
п
вычисление сумм произведений 2 аФи с округлением до данного
к = 1
количества цифр в каждом слагаемом. Эту операцию часто целесо-
целесообразно проводить с двойной точностью, вычисляя каждое
¦слагаемое без округления и отбрасывая лишние знаки после выпол-
выполнения сложения. Конечно, применение двойной точности иногда
оказывается излишним, например, при проведении самоисправляю-
самоисправляющегося итерационного процесса.
При пользовании не безусловно надежными методами часто мо-
может быть целесообразно проводить алгорифм в двух неэквивалент-
неэквивалентных вариантах; например, проводить схему единственного деления
при двух выборах порядка исключения неизвестных; применять би-
биортогональный алгорифм исходя из двух начальных векторов и т. д.
Неплохой косвенной проверкой надежности вычислений может
служить применение контролей по ходу процесса.
ДОПОЛНЕНИЕ
Изложим еще один итерационный процесс для решения полной
проблемы собственных значений, сообщенный авторам В. Н. Кубла-
новской. Процесс заключается в следующем.
Пусть матрица А симметрична и ее квадрат не имеет кратных
собственных значений. Строим последовательность матриц
= Ak;
Здесь Pt ортогональные матрицы, А(- левые треугольные. Матрицы Pt
могут быть вычислены, например, как произведения матриц враще-
вращения или матриц отражения, подобно тому, как это делалось в § 16
при решении линейных систем.
Покажем, что последовательность матриц Ak сходится к диаго-
диагональной матрице, составленной из собственных значений матрицы А,
расположенных в порядке убывания модулей, а матрица Qk=P{ . .. Pk
при достаточно большем k имеет столбцы сколь угодно близкие
к нормированным собственным векторам матрицы А.
Для доказательства установим связь процесса с /./^-алгорифмом,
примененным к матрице А2.
Имеем
AtAj = APtP[A = A2
А'А =Р'А2Р —Л2 — АЛ'
Пусть Д; диагональная матрица, составленная из диагональных
элементов А(. Положим
Ясно, что Lk есть левая треугольная матрица с единичной диаго-
диагональю, a Rk есть правая треугольная матрица с диагональю Д^
616 ДОПОЛНЕНИЕ
Легко проверяется, что L^R^ —А2 и Rlt_lLk_l — LkRk, т. е. матрицы
L, и Rt совпадают с одноименными матрицами ?,/?-алгорифма, при-
примененного к матрице А2.
Ввиду того, что матрица А2 положительно определена и ее соб-
собственные значения попарно различны, ?/?-алгорифм для нее сходится,
в частности, диагональные элементы матриц Rk сходятся к квадратам
собственных значений матрицы А. Следовательно,
Sp Rk = Sp Д1 -». Sp A\
Далее, положив Kk — (liji k), имеем
Sp А2 == Sp4 = Sp A*Aft = 2 ll k =
1,1
V i2 i V /2 с л2 ! V /2
= 2j hi, k -\- Zi 1Ч, ь = SP д* + 2j *//, ft-
i i>j 1>1
Поэтому, при k ->¦ со, 2 Ф, ft -»¦ 0, так что все недиагональные
i>l
элементы матрицы Kk стремятся к нулю. Следовательно,
А\ = КК -*[К"-- Ч] привоз.
Матрицы Ak при достаточно больших fe становятся сколь угодно
близкими к диагональным матрицам [±Xi, ..., ± \п\. Но так как
матрицы Ak при всех k подобны матрице А, то
Далее, Л& = Q^Qft и, следовательно, при достаточно большом k
столбцы матрицы Qk сколь угодно близки к собственным векторам
матрицы А, нормированным, в силу ортогональности Qk. В силу
неоднозначности выбора матриц Рк, последовательность матриц Qk
может не быть сходящейся. Она будет сходящейся лишь с точ-
точностью до знаков столбцов. Сходимость будет иметь место, если,
начиная с неквторого места, брать на каждом шагу матрицу Pk
возможно более близкой к единичной.
Процесс позволяет использовать для ускорения сходимости как
сдвиги (подобно ?./?-алгорифму), так и уточняющие формулы метода
Якоби.
ЛИТЕРАТУРА
Абрамов А. А. [1] Ускорение сходимости в итеративных процессах
Докл. АН СССР, 1950, 74, 1051—1052; М. R., 12, 861.
[2] О влиянии ошибок округления при решении уравнения Лапласа.
Вычисл. машем, а вычисл. техника, 1953, 1, № 1, 37—40; М. R., 16, 1156.
[3] Об ошибке округлений при решении систем линейных уравнений.
Докл. АН СССР, 1954, 97, №2, 189—191; Р. Ж. М., 1955, 6107.
[4] Об ошибке округлений при решении систем линейных уравнений.
Ber. Internat. Math.-Kolloq., 1955 A957), Nov., 151—153; Р. Ж. М.,
1958, 6232.
Азбелев Н. и Виноград Р. [1] Процесс последовательных прибли-
приближений для отыскания собственных чисел и собственных векторов. Докл. АН
СССР, 1952, 83, № 2, 173—174; М. R., 14, 126.
Алберт (Albert A. A.). [I] A rule for computing the inverse of
a matrix. Amer. Math. Monthly, 1941, 48, 198—199; M. R., 2, 100.
Алескеров С. С. [1] К вопросу решения системы линейных числен-
численных уравнений. Тр. Азербайдж. индустр. ин-та, 1957, 16, 5—10; Р. Ж. М.,
1958, 4254.
А л лен (Allen D. N. de О). [1] Relaxation methods. Mc-Graw-Hill
Book Company, inc., New York — Toronto — London, 1954/257 pp;M. R., 15, 831.
Ал лен (Allen D. W.). [1] Numerical solution of „n" linear equations in
„n" unknowns, and the evaluation of „n" th order determinant (complex coef-
coefficients). J. Roy. Aeronaut. Soc, 1956, 60, 350—353; M. R., 17, 1137.
Альтман (Altman JM.). [1] On the solution of linear algebraic
equations. Ball. Acad. Polon. Scl. cl. 3, 1957, 5, № 2, 93—97, IX; P. Ж. М.,
1959, 7478.
[2] On the approximate solution of linear algebraic equations. Ball. Acad.
Polon. Set. cl. 3, 1957, 5, № 4, 365—370, XXIX; P. Ж. М., 1959, 8560.
AHreflH4(Angelitch T. P.). [1] Resolutions des systemes d'equati-
ons lineaires algebriques par la methode de Banachiewicz. Srpska Akad.
Nauka. Zbornik Radova, 1952, 18, Mat. Inst. 2, 71—92; M. R., 14, 501.
Андерсен (Andersen E.). [1] Solution of great systems of normal
equations together with an investigation of Andrae's dotfigure. An arithmeti-
arithmetical-technical investigation. Geodaetisk Inst. Skrlften {Mem. Inst. Geod.
Danemark), 1947, 3, 11, 65 pp; M. R., 9, 622.
[2] Solution of great systems of normal equations. Bull. Geod., 1950, 15,
19—29; M. R., 11, 693.
Андри (AndreeR. V.). [1] Computation of the inverse of a matrix.
Amer. Math. Monthly, 1951, 58, 87—92; M. R., 12, 639.
Anapo (A par о Enzo). [1] Sulle equazioni algebriche matriciali. Attt
Accad. naz. Llncel. Rend. Cl. Set. fls., mat. e natur. Ser. 8, 1957, 22, 20—23;
M. R., 19, 685.
А ржаных И. С. [1] Распространение метода А. Н. Крылова на
полиномиальные матрицы. Докл. АН СССР, 1951, 81, № 5, 749—752; М. R.,
14, 92,
Арме, Гейтс и Зондек (Arms R. J., Gates L. D. and Zon-
dek В.). [1] A method of block iteration. J. Soc. Industr. and Appl. Math.,
1956, 4, № 4, 220—229; P. Ж. М., 1958, 2434.
618 ЛИТЕРАТУРА
Арнольди (Arnoldi W. E.). [1] The principle of minimized iteration
in the solution of the matrix eigenvalue problem. Quart. Appl. Math., 1951, 9,
17—29; M. R., 13, 163.
Аспейтия "(Azpeitia A. O.). [1] Vn metodo para el cilculo de la
matriz inversa. Rev. Real acad. dene, exact., fls. у natur., Madrid, 1956, 59,
№ 4, 463—470; P. Ж. М.. 1957, 8962.
Атта (Atta Susie A.). [1] Effect of propagated error on inverse of
Hilbert matrix. /. Assoc. Comput. Machinery, 1957, 4, № 1, 36—40; P. Ж. М.,
1959, 3244.
Африат (Afriat S. N.). [1] An iterative process for the numerical
determination of characteristic values of certain matrices. Quart. J. Math.,
Oxford. Ser. B), 1951, 2, 121—122; M. R., 12, 861—862.
Бабушка (Babuska Ivo). [1] О jednom numerickem feseni uplne
regularnich systemu linearnich rovnic а о jeho aplikaci na staticke feseni patro-
vych ramu. tasop. pestov. mat., 1955, 80, № 1, 60—88; P. Ж. М., 1956,
4107.
Базиль (Basile R.). [1] Resolution de systemes d'equations lineaires
algebriques et inversions de matrices au moyen des machines de mecanogra-
phie comptable. Complement pratique par R. Janin. Office National d'Etudes
et de Recherches Ae'ronautiques, Paris, 1949, 28; M. R., 11, 692.
Базиль u Жанен (Basile R. et Janin R.). [1] Resolution de
systemes d'equations lineaires algebriques et inversions de matrices au moyen
des machines de mecanographie comptable. Office National d'Etudes et de
Recherches Aeronautiques, Paris, 1949, 28; M. R., 12, 208.
Баллантайн (Ballantine J. P.). [1] Numerical solutions of linear
equations by vectors. Amer. Math. Monthly, 1931, 38, 275—277.
Бакман (Backman O.). [1] Rekursionsformeln zur Losung der Nor-
malgleichungen auf Orund der Krakovianenmethodik. Ark. Mat., Astr. Fys.,
1946, 33 A, № 1, 1—14; M. R., 8, 287.
Банахевич (Banachiewicz Т.). [1] Zur Berechnung der Deter-
minanten, wie auch der Inversen, und zur darauf basierten Auflosung der
Systeme linearer Oleichungen. Ada Astron., Ser. C, 1937, 3, 42—67.
[2] Calcul des determinants par la methode des cracoviens. Bull, intern.
Acad. Polon. Sci. A., 1937, 109—120.
[3] Sur la resolution numerique d'un systeme d'equations lineaires. Bull,
intern. Acad. Polon. Sci. A., 1937, 350—354.
[4] Principes d'une nouvelle technique de la methode des moindres carres.
Bull, intern. Acad. Polon. Sci. A., 1938, 134—135.
[5] Methode de resolution numerique des equations lineaires, du calcul des
determinants et des inverses et de reduction des formes quadratiques. Bull.
Intern. Acad. Polon. Sci. A., 1938, 393—401.
[6] La regie de Chio, cracoviens et matrices. Bull, intern. Acad. Polon.
Set. A., 1939, 405—412.
[7] An outline of the Cracovian algorithm of the method of least squares.
Astr. J., 1942, 50, 38—41; M. R., 4, 90—91.
[8] Fragmentos de novo algorithmo de methodo de minimo quadratos.
Roczntk Astr. Obserw. Krakov. Suppl. Internal., 1949, 20, 87—98; M. R.
11, 403.
[9] Sur la resolution des equations normales de la methode des moindres
earres. Soc. Set. Lett. Varspvle. C. R. Cl. Ill, Set. Math., Phys., 1948, 41,
63—68 A950); M. R., 13, 285.
[10] Resolution d'un systeme d'equations lineaires algebriques par division.
Ens Ignement Math., 1951, 39, A942—1950), 34—45; M. R., 12, 861.
Бандемер(ВапAел1ег Hans). [1] Berechnung der reellen Eigenwerte
einer reellen Matrix mit dem Verfahren von Rutishauser. Wiss. Z. Martin-Lu-
Martin-Luther Univ. Halle—Wittenberg. Math.-naturwiss. Relhe, 1957, 6, № 5,
807-814; P. Ж. М., 1959, 2015.
ЛИТЕРАТУРА 619
БандьОпадхьяй и Нарасимхан (Bandyopadhyay Q. and
Narasimhan R. К-)- [1] Special types of group relaxation for simultaneous
linear equations. Quart. J. Mech. and Appl. Math., 1956, 9, № 1, 122—128;
P. Ж. М., 1957, 2683.
Баранкин (Barankin Edward W.). [1] Bounds for the characte-
characteristic roots of a matrix. Bull. Amer. Math. Soc, 1945, 51, 767—770; M. R.,
7, 107.
[2] Bounds on characteristic values. Bull. Amer. Math. Soc, 1948, 54,
728-735.
Бартлетт (BartlettM. S.). [1] An inverse matrix adjustment arising
in discriminant analysis. Ann. Math. Statistics, 1951, 22, 107—111; M. R.,
12, 639.
Барч (Bartsch Helmut). [1] Ein EinschlieSungssatz fur die charakte-
ristischen Zahlen allgemeiner Matrizen-Eigenwertaufgaben. Arch. Math.,
1953, 4, № 2, 133—136; P. Ж. М., 1954, 3235.
[2] Abschatzungen fur die kleinste charakteristische Zahl einer posttiv-defi-
niten hermiteschen Matrix. Z. angew. Math, und Mech., 1954, 34, № 1—2,
72-74; P. Ж. М., 1955, 4710.
Бауи (Bawie O. L.). [1] Practical solution of simultaneous linear equati-
equations. Quart. Appl. Math., 1951, 8, 369—373; M. R., 12, 538.
Баукер (Bowker A. H.). [1] On the norm of a matrix. Ann. Math.
Statistics, 1947, 18, 285—288; M. R., 9, 75.
Бауэр (Bauer Friedrich L.). [1] Der Newton-Prozeji als qua-
dratisch konvergente Abkurzung des allgemeinen linearen stationaren
Iterationsverfahrens. 1. Ordnung (Wittmeyer-ProzefS) Z. Angew. Math, und
Mech., 1955, 35, № 12, 469—470; P. Ж. М. 1957, 912.
[2] Das Verfahren der abgekurzten Iteration fur algebraische Eigenwertpro-
bleme, insbesondere zur Nullstellenbestimmung eines Polynoms. Z. angew.
Math, und Phys., 1956, 7, № 1, 17—32; P. Ж. М., 1958, 752.
[3] Zur numerischen Behandlung von algebraischen Eigenwertproblemen
hoherer Ordnung. Z. angew. Math, und Mech., 1956, 36; M. R., 18, 766.
[4] Iterationsverfahren der linearen Algebra vom bernoullischen Konvergenz-
typ. Nachrtchtentechn. Fachber., 1956, 4, 171—175, 221. Diskuss; P. Ж. М.,
1957, 8266.
[5] Zusammenhange zwischen einigen Iterationsverfahren der linearen
Algebra. Ber. Internat. Math. Kolloq., 1955 A957), Nov., 99—111; P. Ж. М.,
1958, 103000. ч
[6] Beitrgge zum Danilewski-Verfahren. Ber. Internat. Math. Kolloq.,
1955 A957), Nov., 133—139; P. Ж. М, 1959, 5229.
[7] Das Verfahren der Treppeniteration und verwandte Verfahren zur
Losung algebraischer Eigenwertprobleme. Z. angew. Math, und Phys., 1957,
8, № 3, 214—235; P. Ж. М., 1958, 10299.
[8] On modern matrix iteration process of Bernoulli and Oreffe type.
/. Assoc. Comput. Machinery, 1958, 5, № 3, 246—258; P. Ж. М. 1959, 8573.
Беджарано и Розенблатт (Bejarano Gabriel О. and
Rosenblatt Bruce R.). [1] A solution of simultaneous linear equations and
matrix inversion with high speed computing devices. Math. Tables and
other Aids Comput., 1953, 7, № 42, 77—81; P. Ж. М., 1954, 3837.
Белл (BellW. D.). [1] Punched card techniques for the solution of
simultaneous equations and other matrix operations. Proc. Sclent.
Comput. Forum, 1948, N. Y., I. B. M. Corp.. 1950, 28—31; M. R., 13, 387.
Бендиксон (Bendixson I.). [1] Sur les racines d'une equation
fondamentale. Ada Math., 1902, 25, 359—365.
Берардино (Di Berardino V.). [1] Risoluzione dei sistemi di equ-
azioni algebriche lineari per incrementi successivi delle incognite. Nuovo metodo
di calcolo. Rlv. catasto e serv. teen, erarlall, 1956, 11, № 5, 6, 334—338; P.
Ж. М., 1958, 7200.
620 ЛИТЕРАТУРА
[2] II metodo di Hardy Cross e la sua giustificazione mediante un nuovo
procedimento di risoluzione dei sistemi di equazioni algebriche lineari. Irigeg-
nerla ferrovlaria, 1957, 12, № 10, 821—831; P. Ж. М., 1959, 876.
БерардиноиДжирарделли (DiBerardinoV. e Oirardel-
li L.).[l] Nuovo metodo di risoluzione di particolari sistemi di equazioni algebri-
algebriche lineari. Sistemi a catena. Rlv. catasto e serv. tech. erarlall, 1957, 12, № 1,
46—50; P. Ж. М., 1958, 7201.
Берардино и Франди (Di Berardino V. e Frandi P.).
[1] Formute ricorrenti per la risoluzione graduate dei sistemi di equazioni
algebriche lineari. Archlmede, 1950, 2,108—113; M. R., 13, 586.
[2] Formule ricorrenti per la risoluzione graduate dei sistemi di equazioni
algebriche lineari. Rtcerca SeL, 1950, 20, 662—666; M. R., 13, 587.
Б е р г e p (B u r ge r A. P.). [1] Inversion of matrices with the aid of
punched card machines. Stattstica, Rijswijk, 1952, 6, 121—133; M. R., 14, 1128.
Берджер и Сейбл (Berger E. J. and Saibe 1 Edward). [1]
On the inversion of continuant matrices. /. Franklin Inst., 1953, 256, № 3,
249—253; P. Ж. М., 1954, 5067.
Бёрджесс (Burgess H. Т.). [1] On the matrix equation BX = C. Amer.
Math. Monthly, 1916, 23, 152—155.
Берри (Berry С. Е.). [1] Acriterion of convergence for the.classical
iterative method of solving linear simultaneous equations. Ann. Math. Statistics,
1945, 16, 398-400; M. R., 7, 338.
Б e p щ-3 упан и боттенбрух (Borsc h-S upan W. und Botten-
bruch H.). [1] Eine Methode zur Eingrenzung samtlicher Eigenwerte einer
hermiteschen Matrix mit iiberwiegender Hauptdiagonale. Z. angew. Math, und
Mech., 1958, 38, № 5-6, 169—171; P. Ж. М., 1958, 10301.
БиденхарниБлатт (BiedenharnL. C.and BlattJ. M.). [1]
A variation principle for eigenfunctions. Physical Rev., 1954, B) 93, 230—232;
M. R., 15, 745.
Билый (В i 1 у J.). [1] Solution of a system of linear equations with
large coefficients in the diagonal. Aktuarske Vedy, 1949, 5, № 3, 114—127;
M. R., 11, 403.
Бингхэм (Bingham M. D.). [1] A new method for obtaining the
inverse matrix. /. Amer. Statist. Assoc, 1941, 36, 530—534; M. R., 3, 154.
Бирман М. Ш. [1] Некоторые оценки для метода наискорейшего
спуска. Успехи матеМ. наук, 1950, 5, № 3, 152—155.
[2] Об одном варианте метода последовательных приближений. Вестн.
Ленингр. ун-та, серия матем., физ: и хим., 1952, 9, 69—76.
[3] О вычислении собственных чисел методом наискорейшего спуска.
Л., Записки Горн, ин-та, 1952, 27, № 1, 209—216.
Бицено и Боттема (Biezeno С. В. and Bottema О.). [1] The
convergence of a specialized iterative process in use in structural analysis.
Proc. Kfltiinkl. nederl. akad. wetensch., 1946, 49, 489—499 (Also Indagationes
math., 8); M. R., 9, 104.
Бишоп (Bisshopp К. Е.). [1] The inverse of a stiffness matrix.
Quart. Appl. Math., 1945, 3, 82—84; M. R., 6, 218.
Блан и Линигер(В1апс С h. et Liniger W.). [1] Erreurs de chute
dans la resolution de systemes algebriques lineaires. Comment, math, helv.,
1956, 30, № 4, 257—264; P. Ж. М., 1957, 1839.
Блэк (Black A. N.). [1] Further notes on the solutions of algebraic
linear simultaneous equations. Quart. J. Mech. and Appl. Math., 1949, 2,
321—324; M. R., 11, 743.
Б л ю менталь (Blumenthal О.). [1] Ober die Oenauigkeit der Wur-
zeln linearer Qleichungen. Z. Math, und Phys., 1914, 62, 359—362.
Бодевиг (Bodewig E.). [1J Comparison of some direct methods for
computing determinants and inverse matrices. Proc. Konlnkl nederl. akad.
wetensch., 1947, A, 50, 49—57 (Also Indagationes math., 9); M. R., 8, 407.
ЛИТЕРАТУРА 621
[2] Bericht iiber die verschiedenen Methoden zur LCsung eines Systems
linearer Gleichungen mit reellen Koeffizienten I, II, III, IV, V. Proc. Koninkl.
nederl. akad. wetensch., 1947, 50, 930—941; 1104—1116; 1285—1295; 1948, 51,
53—64; 211—219 (Also Indagationes math., 9; 10); M. R., 9, 250, 382, 621.
[3] Bericht iiber die Methoden zur numerischen Losung von algebraischen
Eigenwertproblemen. I, II Atti. Sem. Mat. Fts. Univ. Modena, 1951, № 3,
3-39; № 4, 133-193; M. R., 13, 991.
[4] A practical refutation of the iteration method for the algebraic eigen-
problem. Math. Tables and Other Aids Comput., 1954, 8, № 48, 237—240;
P. Ж. М., 1956, 762.
[5] Zum Matrizenkalkul. I—V. Proc. Koninkl. nederl. akad. wetensch.,
1955, A 58, № 1, 95—106; 1956, A 59, № 3, 301—304; 1956, A 59, № 3,
305—312; 1957, A 60, № 1, 82—87; 1957, A 60, № 3, 242—247. (Also Inda-
Indagationes math., 17; 18; 19); P. Ж. М., 1955, 4876; 1957, 4614; 1958, 3298, 3299;
1959, 881,
[6] Matrix calculus. Amsterdam, North-Holl. Publ. Co., 1956, xii, 334;
' M., 1957, 4623.
[7] Zu Stiefels Berechnung der Eigenwerte aus den Schwarzschen Konstan-
ten. Z. . angew. Math, und Mech., 1958, 38, № 1—2, 72—73; P. Ж. М.,
1959, 880.
Бодевиг и Цюрмюль (Bodewig E. undZurmuhl R.). [1] Zu
R. Zurmuhl. Zur numerischen Auflosung linearer Oleichungssysteme nach dem
Matrlze lverfahren von Banachiewicz. Z. angew. Math, und Mech., 1950, 30,
130—132; M. R., 11, 743.
Боли (Bolie Victor W.). [1] Minimum-storage matrix inversion.
Z. angew. Math..und Mech., 1958, 38, № 9—10, 369—372; P. Ж. М., 1959, 5223.
Больц (Boltz H.). [1] Entwicklungsverfahren zur Ausgleichung Geoda-
tischer Netze nach der Methode der kleinsten Quadrate. Vertiff. Preussischen
Geod. Inst., 1923, 90.
Бондарь Н. Г. [1] О точности некоторых приближенных методов
вычисления собственных чисел квадратных матриц. Тр. Днепропетровского
ин-та инж. ж.-д. транспорта, 1953, 23, 61—69; Р. Ж. М., 1954, 3468.
Бородянский М. Я. [1] Приведение некоторого типа матриц
к диагональному виду. Тр. Киевск. Технол. ин-ma пищ. пром-ти, 1953, 13,
195—196.
Б от т е м а (В о 11 e m а О.). [1] A geometrical interpretation of the rela-
relaxation method. Quart. Appl. Math., 1950, 7, 422—423; M. R., 11, 403.
Бошан (Boschan Paul). [1] The consolidated Doolittle technique.
Ann. Math. Statistics, 1946, 17, 503.
Бранстеттер (Branstetter R. D.). [1] A round-off theory for scalar
products. Jowa State Coll. J. ScL, 1954, 28, № 3, 283—284; P, Ж. М.,
1955, 4715.
Браун (Browne E. Т.). [1] The characteristic equation of a matrix.
Bull. Amer. Math. Soc, 1928, 34, 363—368.
[2] The characteristic roots of a matrix. Bull. Amer. Math. Soc, 1930, 36,
705—710.
[3] Limits to the characteristic roots of a matrix. Amer. Math. Monthly,
1939, 46, 252-265.
Браун и Бассетт (Brown R. D. and BassettJ. M.). [1]
A method for calculating the first order perturbation of an eigenvector of a
finite matrix, with applications to molecular-orbital theory. Proc. Phys.
Soc, 1958, 71, № 5, 724—732; P. Ж. М., 1959, 4249.
Б pa у эр (Brauer Alfred). [1] Limits for the characteristic roots
of a matrix. I—VI (VI совм. сЛа Б о р д (L a BordeH. T.)). Duke Math.
/.,•1946, 13, 387-395; 1947, 14, 21—26; 1948, 15, 871—877; 1952, 19, 75—91;
1952, 19, 553-562; 1955, 22, 253-261; M. R., 8, 192; 8, 559; 10, 231; 13, 813;
14, 836; 17, 1044.
622 ЛИТЕРАТУРА
[2] On the characteristic equations of certain matrices. Bull. Amer. Math.
Soc, 1947, 53, 605-607; M. R., 8, 559.
[3] Matrices with all their characteristic roots in the interior of the unit
circle. J. Ellsha Mitchell Set. Soc, 1952, 68, 188—183; M. R., 14, 836.
[4] Ober die Lage der charakteristischen Wurzeln einer Matrix. /. reine
und angew. Math., 1953, 192, № 2, 113—116; P. Ж. М., 1954, 5451.
[5] Bounds for characteristic roots of matrices. Nat. Bur. Standards. Appl.
Math. Ser., 1953,29, 101—106.
[6] Bounds for the ratios of the coordinates of the characteristic vectors
of a matrix. Proc. Nat. Acad. U. S. A., 1955, 41, № 3, 162—164; P. Ж. М.,
1956, 2780.
[7] The theorem of Ledermann and Ostrowski on positive matrices. Duke
Math. J., 1957, 24, № 2, 265—274; P. Ж. М., 1958, 2733.
[8] A new-proof of theorems of Perron and Frobenius on nonnegative
matrices. I. Positive matrices. Duke Math. J., 1957, 24, № 3, 367—378.
[9] A method for the computation of the greatest root of a positive matrix.
/. Soc. Indust. Appl. Math., 1957, 5, 250—253; M. R., 19, 1197.
Бреннер и Рейтуиснер (Brenner J. L. andReitwies-
ner O. W.). [1] Remark on determination of characteristic roots by iteration.
Math. Tables and Other Aids Comput., 1955, 9, № 51, 117—118; P. Ж. М.,
1957, 903.
Бродский М. Л. [1] Вероятностные оценки погрешностей при опре-
определении собственных значений и собственных векторов варьирующейся
матрицы. Успехи матем. наук, 1952, 7, № 5, 205—214; М. R., 14, 692.
Брок (Brock John E.). [1] Variation of coefficients of simultaneous
linear equations. Quart. Appl. Math., 1953, 11, № 2, 234—240; P. Ж. М.,
1954, 2351.
Брукер и Самнер (Brooker R. A. and Sumner F. H.).
[1] The method of Lanczos for calculating the characteristic roots and vectors
of a real symmetric matrix. Proc. Inst. Electr. Engrs., 1956, В 103 Suppl.
№ 1, 114—119. Discuss., 120—122; P. Ж. М., 1958, 2439.
Брунер (Bruner N.). [1] Note on the Doolittle solution. Economet-
rlca, 1947, 5, 43—44; M. R., 8, 407.
Бур дина В. И. [1] К одному методу решения систем линейных
алгебраических уравнений. Докл. АН СССР, 1958, 120, № 2, 235—238; Р. Ж. М.,
1959, 5218.
Буркхард (Burkhardt Felix). [1] Ober spezielle lineare Oleichungs-
systeme mit der Eigenschaft lim (g — Si)v Nullmatrix. Wlss. Z. Univ. Leipzig,
V ->- CO
1952/53, № 5, 187—192; P. Ж. М., 1956, 4106.
Бьерхаммар (Bjerhammar A.). [1] Rectangular reciprocal matri-
matrices with special reference to geodetic calculations. Ball, geod., 1951, 188—220;
M. R., 13, 312.
[2] Triangular matrices for adjustment of triangular networks. Kungl.
Tekn. HOgsk. Handl., Stockholm, 1956, 105, 82.
Бэтсле (Baetsle P. L.). [1] Sur les methodes iteratives de calcul
numerique des vecteurs propres d'une matrice. IH-e Congres National des
Sciences, Bruxelles, 1950, 2, 104—106; M. R., 17, 666.
[2] Systematisation des calculs numeriques de matrices. Bull, geod., 1951,
22—41; M. R., 12, 861.
Бюкнер(Вйскпег H.). [1] Ober ein unbeschrankt anwendbares Iterati-
onsverfahren fUr Systeme linearer Oleichungen. Arch. Math., 1950, 2, 172—177;
M. R., 11, 743.
Важевский (Wazewskl Tadeusz). [1] Sur l'algorithmisation des
methodes d'eliminations successives. Ann. Soc. polon., 1953, 24, № 2, 157—164;
P. Ж. М., 1956, 4108.
ЛИТЕРАТУРА 623
Вазов (Wasow W. R.). [1] A note on the inversion of matrices by
random values. Math. Tables and Other Aids Comput., 1952, 6, 78—81.
Варга (Varga Richard). [1] Eigenvalues of circulant matrices.
Pacif. J. Math., 1954, 4, № 1, 151—160; P. Ж. М., 1956, 4918.
[2] A comparison of the successive overrelaxation method and semi-itera-
semi-iterative methods using Chebyshev polinomials. /. Soc. Industr. and Appl. Math.,
1957, 5, 39—46; P. Ж. М., 1958, 9266.
Васидзу (Washizu K-). [1] On the bounds of eigenvalues. Quart.
J. Mech. and Appl. Math., 1955, 8, № 3, 311— 325; P. Ж. М., 1956, 6864.
Василевский С. [1] Схема для решения нормальных уравнений
на вычислительных машинах. Тр. Латвийского ун-та, 1940, 3, № 11, 3—12;
М. R., 3, 154.
Вебер (Weber R.). [1] Sur les methodes de calcul employees pour
la recherche des valeurs et vecteurs propres d'tme matrice. Rech. aeronaut.,
1949, № 10, 57—60; M. R., 11, 266.
Вегнер (Wegner Udo). [1] Bemerkungen zur Matrizentheorie.
Z. angew. Math, und Mech., 1953, 33, 262—264; M. R., 15, 388.
[2] Contributi alia teoria dei procedimenti iterative per la risoluzione nume-
rica dei sistemi di equazioni lineari algebriche. Attl Accad. naz. Llncel Mem.,
cl. sci. fis., mat. e natur., 1953, 4, № 1, 1—48; P. Ж. М., 1954, 5781.
Вей ленд (Way land H.). [1] Expansion of determinantal equations into
polynomial form. Quart. Appl. Math., 1945, 2, 277—306; M. R., 6, 218. (Есть
перевод. Успехи матем. наук, 1947, 2, № 4, 128—158.)
В е йне р (Wein ег В. L.). [1] Variations of coefficients of simultaneous
linear equations. (With Discussion). Trans. Amer. Soc. Civil Engrs, 1948, 113,
1349—1390.
Вейссингер (Weissinger Johannes). [1] Ober das Iterationsver-
fahren. Z. angew.- Math, und Mech., 1951, 31, 245—246.
[2]. Zur Theorie und Anwendung des Iterationsverfahrens. Math. Nachr.,
1952, 8, 193—212.
[3] Verallgemeinerung des Seidelschen Iterationsverfahrens. Z. angew. Math,
und Mech., 1953, 33, 155—163.
В е н к'е (W e n k e К 1 a u s). [1] Erfahrungen und Probleme bei der Iochkarten-
massigen Berechnung von Kehrmatrizen. Nachrlchtentechn. Fachber., 1956, 4,
198—201, 227; P. Ж. М., 1958, 1596.
Верзу (Verzuh F. M.). [1] The solution of simultaneous linear equations
with the aid of the 60-r calculating punch. Math. Tables and Other Aids
Comput., 1949, 3, 453—462; M. R., 11, 57.
Взорова А. И. [1] О решении системы линейных алгебраических урав-
уравнений способом Ю. А. Щрейдера. Вычисл. матем. и еычисл. техника, 1953,
№ 1, 90—94; Р. Ж. М., 1954, 5266.
В и л а н д т (W i е 1 a n d.t Н е 1 m u t). [1] Ein Einschliessungssatz fur charakte-
ristische Wurzeln normaler Matrizen. Arch. Math., 1949, 1, 348—352;
M. R., 11, 4.
[2] Die Einschliessung von Eigenwerten normaler Matrizen. Math. Ann.,
1949, 121, 234—241, M. R., 11, 307.
[3] Inclusion theorems for eigenvalues. Nat. Bur. Standards. Appl. Math.
Ser., 1953, 29, 75—78; P. Ж. М., 1956, 1975.
[4] Einschliessung von Eigenwerten hermitescher Matrizen nach dem Absch-
nittsverfahren. Arch. Math., 1954, 5, № 1—3, 108—114; P. Ж. М., 1956,4103.
[5] An extremum property of sums of eigenvalues. Proc. Amer. Math. Soc,
1955, 6, № 1, 106—110; P. Ж. М., 1956, 6394.
Виноград (Vinograde В ). [1] Note on the escalator method.
Proc. Amer. Math. Soc, 1950, 1, 162—164; M. R., 11, 618. ..
BHTMeftep(Wittmeyer Helmut). [1] Etnflussder AnderungelnerMat-
AnderungelnerMatrix auf die Losung des zugehbrlgen Gletchungssystems, sowie auf die charac-
terlstlschen Zahlen und die Elgenvektoren. Dissertation. Darmstadt, 1934.
624 ЛИТЕРАТУРА
[2] Einfluss der Anderung einer Matrix auf die L6sung des Z ugehflrigen
Gleichungssystems, sowie auf die charakteristischen Zahlen und di e Eigenvektoren.
Z. angew. Math, und Mech., 1936, 16, № 5, 287—300.
[3] Ober die L6sung von linearen Gleichungssystemen durch Iteration.
Z. angew. Math, und Mech., 1936, 16, № 5, 301—310.
[4] Berechnung einzelner Eigenwerte eines algebraischen linearen Eigen-
wertproblems durcli „Storiteration". Z. angew. Math, und Mech., 1955, 35, № 12,
441—452; P. Ж. М., 1957, 2686.
Вольта (Volta E.). [1] Un nuovo metodo per la risoluzione rapida di sistemi
di equazioni lineari. Atti Accad. naz. Llncel. Rend. Cl. sci. fis., mat. e natur.
ser. 8, 1949, 7, № 50, 203—207; M. R., 11, 743.
Bopx (Worch O.). [1] Ober die zweckmassigste Art, lineare Oleichungen
durch Elimination aufzulOsen. Z. angew. Math, und Mech., 1932, 12, 175—181.
В рис (VriesD. d e). [1] Eigenwaarden vanmatrices. Tljdschr. kadaster en
landmeetkunde, 1953, 69, N° 5, 316—322; P. Ж. М., 1956, 4104.
Вучкович(Вучковил Милорад). [1] Систем линеарних )'едначина
и н.егова примена у решаван>у статички неодреАених конструкци]а. Изградна,
1956, 10, № 7, 8, 3—13; Р. Ж. М., 1958, 2437.
Вуяклия (Vujaklija О.). [1] Sur le calcul des determinants. Godisnjak
Techn. Fak. Univ. Beograd, 1946—47, № 1—4, 1949; M. R., 11, 154.
Гаврилов Ю. M. [1J Про збгжшсть простих iiepauifl та критерП знако-
визначеност1 квадратичных форм. Допое1д1 АН УРСР, 1953, № 6, 389—393;
Р. Ж. М., 1955, 436.
[2] О сходимости итерационных процессов и критериях знакоопределён-
знакоопределённости квадратичных форм. Изв. АН СССР, сер. мат.,' 1954, 18, № 1, 87—94;
Р. Ж. М., 1955, 437.
[3] Про зб1жшсть простих, а також групових iTepauifl при розв'язуванш
систем нормальних ривнянь. Науч. зап. Львовск. политехи, ин-та, 1955,
29, 114—120; Р. Ж. М., 1956, 8348.
Гавурин М. К. [1] Применение полиномов наилучшего приближения для
улучшения сходимости итеративных процессов. Успехи матем. наук, 1950, 5,
№ 3, 156—160; М. R., 12, 209.
Гантмахер Ф. Р. [1] К алгебраическому анализу метода ак. А. Н. Кры-
Крылова преобразования векового уравнения. Тр. 2-го Всесоюзного матем.
съезда, 1937, 45—48.
[2] Теория матриц. Гостехиздат, 1953.
Г аре a (Oarza A. de la). [1] Error bounds on approximate solutions to
systems of linear algebraic equations. Math. Tables and Other Aids Comput.,
1953, 7, № 42, 81—84; P. Ж. М., 1954, 3838.
[2] Error bounds for a numerical solution of a recurring linear system.
Quart. Appl. Math., 1956, 13, № 4, 453—456, P. Ж. М., 1958, 4239.
Гастинель (Oastinel Noel). [1] Procede iteratif pour la resolution
numerique d'un systeme d'equations lineaires. C.r. Acad. set., 1958, 246, № 18,
2571—2574; P. Ж. М., 1959, 4244.
Гатман (Outtman L.). [1] Enlargement methods for computing the
inverse matrix. Ann. Math. Statistics, 1946, 17, 336—343; M. R,, 8, 171.
Гатто (О at to F.). [1] Sulla risoluzione numerica dei sistemi di equazioni
lineari. Ricerca Sci., 1949, 19, 1385—1388; M. R., 11, 743.
Гатшолл (Qutshall W. D.). [1] Practical inversion of matrices of
high order. Proc. Comput. Sem. Dec. 1949, N. Y., IBM Corp., 1951, 171—173;
M. R., 13, 387,
Гаусс (Gauss С F). [1] Supplementum theoriae combinationis observa-
tionum erroribus minimis obnoxiae. Werke, Qottingen, 1873, 4, 55—93.
Г а у ч и (О a u t s с h i Werner). [Г] The asymptotic behaviour of powers of
matrices. Duke Math. J., 1953, 20, 127—140; M. R., 15, 94.
[2] The asymptotic behaviour of powers of matrices. II. Duke Math. J.,
1953, 20, № 3, 375-379; P. Ж. М., 1954, 3620.
ЛИТЕРАТУРА 625
[3] Bounds of matrices with regard to an Hermitian metric. Compositio
Math., 1954, 12, 1—16.
[4] On norms of matrices and some relations between norms and eigen-
eigenvalues. Philosoph.-N'aturwiss. Fak. der Universltat Basel, Basel, Buchdruckerei
Birkhauser АО, 1954, 39 S.; P. Ж. М., 1959. 5559.
Гейрингер (Oeiringer H.). [1] Zur Praxis der Losung linearer Glei-
chungen in der Statik. Z. angew. Math, und Meek., 1928, 8, 446—447.
[2] On the numerical solution of linear problems by group iteration. Bull.
Amer. Math. Soc, 1942, 48, p. 370.
[3] On the solution of systems of linear equations by certain iteration me-
methods. Relssner Anniversary Volume, Contrlb. Appl. Mech., 1948, 365—393,
Ann. Arbor, Mich.; M. R., 10, 574.
Гельфанд И. М. [1] Лекции по линейной алгебре. Изд. 2-е, М. Л.
1951.
Герман (Herrmann A.). [I] Bestimmung der hoheren Eigenwerte einer
Matrix durch Iteration. Ann. Univ. Saravlensls, 1952, 1, 220—223; M. R., 14, 1129.
Германский (Oermansky Boris). [1] Zur angenaherten Auflosung
linearer Gleichungssysteme mittels Iteration. Z, angew. Math, und Mech., 1936,
16, 57—58.
Г е р ш г о р и н С. А. [1] Ueber die Abgrenzung der Eigenwerte einer Matrix.
Изв. АН СССР, сер. матем., 1931, 7, 749—754.
Гест (Guest I.). [1] The solution of linear simultaneous equations by matrix
iteration. Austral. J. Phys., 1955, 8, № 4, 425—439; P. Ж. М. 1957, 6710.
Гивенс (Oivens Wallace). [1] A method of computing eigenvalues
and eigenvectors suggested by classical results on symmetric matrices. Nat
Bur. Standards. Appl. Math. Ser., 1953, 29, 117—122; P. Ж. М., 1956, 6861.
[2] Numerical computation of the characteristic values of a real symmetric
matrix. U. S. Atomic Energy Comm. Repts., 1954, ORNL—1574, 107 pp.; Р.Ж. M.,
1956, 8347.
[3] The characteristic value-vector problem. J. Assoc. Comput. Machinery,
1957, 4, № 3, 298—307; P. Ж. М., 1959, 2014.
[4] Computation of plane rotations transforming a general matrix to trian-
triangular form. J. Soc. Industr. and Appl. Math., 1958, 6, № 1, 26—50; M. R., 19, 1081.
Глодан (Oloden A.). [1] La methode du Luxembourgeois B. I. Clasen
pour la resolution d'un systeme d'equations lineaires (methode des coefficients
egaux). Rev. hlstoire set., 1953, 6, № 2, 168—170; P. Ж. М., 1954, 2353.
Голдстайн и Нейман (Goldstine H. and Neumann J.). [1] Numerical
inverting of matrices of high order, II. Proc. Amer. Math. Soc, 1951, 2, 188—
202; M. R., 12, 861.
Голдстайн, Меррей и Нейман (Goldstine H. H., Mur-
Murray F. I. and J. von Neumann). [1] The Jacobi method for real symmetric
matrices. J. Assoc. Comput. Machinery, 1959, 6, № 1, 59—97.
Голдстайни Хоруиц (Goldstine H. H. and H о r w i t z L. P.). [1].
A procedure for the diagonalization of normal matrices. /. Assoc. Comput.
Machinery, 1959, 6, № 2, 176—195.
Гопштейн H, M. [1] О решении однородных линейных уравнений
методом итерации. Докл. АН СССР, 1944, 43, 332—395; М. R., 6, 218.
Готхардт (Gotthardt E.). [1] Boltzsches Entwicklungsverfahren und
Gaufischer Algorithmus. Z. Vermessungswesen, 1953, 78, № 4, 97—104. .
Гофман (Hoffman A. i.\ [1] Lower bounds for the rank and location
of the eigenvalues of a matrix. N.at. Bur. Standards. Appl. Math. Ser., 1954,
39, 117—130.
Гофман и Виландт (Hoffman A. J. and WielandtH. W.). [1]
The variation of the spectrum of a normal matrix. Duke Math. J., 1953, 20,
№ 1, 37—39; P. Ж. М., 1953, 587.
Гофман Ш. M. [1] К вопросу о решении системы линейных алгебраи-
алгебраических уравнений. Докл. АН Уз. ССР, 1949, № % 7—10.
626 ЛИТЕРАТУРА
[2] Об оценке одного определителя и о некоторых неравенствах", связан-
связанных с итерационными процессами Зейделя. Тр. Ташкентск. ин-та ж.-д.
трансп., 1956, вып. 5, 178—186.; Р. Ж. М., 1957, 902.
[3] Об одном варианте решения системы трёхчленных матричных урав-
уравнений. Тр. Ташкентск. ин-та ж.-д. трансп., 1956, вып. 5, 204—206: Р. Ж. М
1957, 2684.
Грандалл(Огапс1а11 S. Н.). [1] On a relaxation method for eigen-
eigenvalue problems. /. Math, and Phys., 1951, 30, 140—145; M. R., 13, 496.
[2] Iterative procedures related to relaxation methods for eigenvalue
problems. Proc. Roy. Soc, Ser. A, 1951, 207, 416—423; M. R., 13, 163.
Грегори (Gregory Robert Т.). [1] Computing eigenvalues and
eigenvectors of a simmetric matrix on the ILLIAC. Math. Tables and Other
Aids Comput., 1953, 7, 44, 215—221.
[2] On the convergence rate of an iterative process. Math. Mag., 1955, 29,
№ 2, 63—68; P. Ж. М., 1955, 7646.
[3] Results using Lanczos method for finding eigenvalues of arbitrary
matrices. J. Soc. Industr. and Appl. Math., 1958, 6, № 2, 182—188.
Грей (Gray H. J. Jr.). [1] Numerical methods in digital real-time simu-
simulation. Quart. Appl. Math., 1954, 12, 133—140; M. R., 15, 991.
Гринспан (Greenspan Donald). [1] Methods of matrix inversion.
Amer. Math. Monthly, 1955, 62, № 5, 303—318; P. Ж. М., 1956, 6870.
ГриншТат (Greenstadt J.). [1] A method for finding routs of arbitrary
matrices. Math. Tables and Other Aids Comput., 1955, 9, № 50, 47—52.
Г р о н e (G г о h n e D). [1] Rechenverfahren zur Auflosung von Gleichungs-
systemen. Veroffentltchungen Math. Inst. Tech. Hochschule Braunschweig,
1946, № 4, i -f 28p.
Гроссман Д. П. [1] К проблеме численного решения системы одно-
однородных линейных алгебраических уравнений. Успехи матем. наук, 1950, 5,
№ 3, 87-103; М. R., 13, 586.
Грушка (Hruska V.). [I] LOsung von Gleichungssystemen durch das
Iterationsverfahren. Acad. Tcheque. Scl. Bull. Cl. Sci. Math. Nat., 1943, 44,
239-304, 399-422.
Гуарне (Gouarne Rene). [1] Methodes algkbrlques de la physique
et de la chtmie. Resolution rapide des systemes d'equations lineaires. These
Doct. Sci. math. Ann. Univ.' Paris, 1956, 26, № 4, 588—591; P. Ж. М., 1958, 1599.
[2] Calcul automatique des determinants. С r. Acad. scl., 1957, 245, № 8,
824—826; P. Ж. М., 1959, 3246.
[3] Remarques sur le calcul automatique des determinants et polynomes
caracteristiques par la methode des cycles. C. r. Acad. sci., 1957, 245, № 23,
1998—2000, P. Ж. М., 1959, 3247.
[4] Calcul automatique des polynomes caracteristiques. C. r. Acad. scl.,
1957, 245, № 14, 1114—1117.
Губерман (Губерман I. О.). [1] Спрощена схема розв'язання
систем лшшних алгебра1чних р1внянь. Прикл. мехаЫка, 1957, 3, № 1, 108—¦
112; Р. Ж. М., 1957, 8268.
Гуди (Goodey W. J.). [1] Note on the improvement of approximate
latent roots and modal columns of a simmetrical matrix. Quart. J. Mech. and
Appl. Math., 1955, 8, № 4, 452—453; P. Ж. М., 1956, 6865.
Давыдов. В. В. [1] Решение трехчленных уравнений, встречающихся
в строительной механике корабля. Тр. Горькоеск. ин-та инж. водн. трансп.,
1957, 14, 10-24; Р. Ж. М., 1958, 3297.
Данилевский А. М. [1]О численном решении векового уравнения.
Матем. сб., 1937, 2, [44], 169—171.
Данциг и Орчард-Хейс (Dantzig George В. and Or-
Orchard-Hays Wm). [1] The product form for the inverse in the simplex
method. Math. Tables and Other Aids Comput., 1954, 8, № 46, 64—67;
P. Ж. My 1956, 6149.
ЛИТЕРАТУРА 627
Даун и нг и Хаусхолдер (Downing А. С. Jr. and Hauschol-
der A. S). [1] Some inverse characteristic value problems. J. Assoc. Comput.
Machinery, 1956, 3, № 3j 203-207; P. Ж. М., 1957, 8963.
Деминг (Deming H. Q.). [1] A systematic method for the solution
of simultaneous linear equations. Amer. Math. Monthly, 1928, 35, 360—363.
Д е и и-П апен и Кауфман (Deni s-P apin M. et Kaufmann A.).
[1] Cours de calcul matrlciel applique. Electro-techn., hydraul., radio, 1958,
237, Suppl., 150—157; P. Ж. М., 1959, 5555.
Дервидюе (Derwidue L). [1] La methode de L. Couffignal pour la
resolution numerique des svstemes d'equations lineaires. Mathesls, 1954, 63,
№ 1—2, 9—12; P. Ж. М., 1955, 4712.
[2] Une methode mecanique de calcul des vecteurs propres d'une matrice
quelconque. Bull. Soc. rov. set., Liege, 1955, 24, № 5, 150—171; P. Ж. М.,
1956, 9115.
Джери (О e r i О e r o). [1] II simbolismo delle matrici nella soluzione
del sistema normale gaussiano. Riv. catasto e serw. teen, erartali, 1954, 9,
№ 2, 117—120; P. Ж. М., 1955, 6111.
Диаш Агуду (D i a s Agudo R о I d a~o F e r n a n d o). [1] On the
characteristic equation of a matrix. Univ. Lisboa Rev. Fac: Cl. A. Ci. Mat.,
1954, B) 3, 87—136; P. Ж. М., 1957, 6854.
Димсдаль (Dimsdale В.). [1] The non-convergence of a characte-
characteristic root method. J. Soc. Indastr. and Appl. Math., 1958, 6, № 1, 23—25,
P. Ж. М., 1959, 5227.
Дмитриев Н.и Дынкин Е. [1] Характеристические корни стохасти-
стохастических матриц. Изв. АН СССР, сер. матем., 1946, 10, № 2, 167—184; М. R.,
8, 129.
Дойл (Doyle Thomas С). [1] Inversion of symmetric coefficient
matrix of positive-definite quadratic form. Math. Tables and Other Aids Corn-
put., 1957, 11, № 58, 55—58; P. Ж. М., 1958, 6214.
Дуайр (Dwyer P. S.). fl] The solution of simultaneous equations.
Psychometrika, 1941, 6, 101—129; M. R., 2, 367.
[2] The evaluation of the determinants. Psychometrika, 1941, 6, 191—204;
M. R., 2, 367.
[3] The evaluation of linear forms. Psychometrika, 1941, 6, 355—365;
M. R., 3, 154.
[4] The Doolittle technique. Ann. Math. Statistics, 1941, 12, 449—458;
M. R., 3, 276.
[5] Recent developments in correlation technique. /. Amer. Statist. Assoc,
1942, 37, 441-460; M. R., 4, 164.
[6] A matrix presentation of least squares and correlation theory with
matrix justification of improved methods of solution. Ann. Math. Statistics,
1944, 15, 82-89; M. R., 5, 245.
[7] The square root method and its use in correlation and regression.
J. Amer. Statist. Assoc, 1945, 40, 493—503; M. R., 7, 338.
[8] Linear Computations, 1951, pp. 344, New York, Wiley; P. Ж. М.,
1954, 1829.
[9] Errors of matrix computations. Nat. Bur. Standards. Appl. Math. Ser.,
1953, 29, 49—58; P. Ж. М., 1956, 6868.
Дуайр иУо (Dwyer Paul S. and Waugh Frederick V.). [1]
On errors in matrix inversion. /. Amer. Statist. Assoc, 1953, 48, № 262,
289—319; P. Ж. М., 1954, 5785:
Дункан (Duncan W. J.). [1] Some devices for the solution of large
sets of simultaneous linear equations. Pkllos. Mag., 1944, G) 35, 660—670;
M. R., 7, 84.
Дьюранд (Durand David). [1] A note on matrix inversion by the
square root method. /. Amer. Statist. Assoc, 1956, 51, № 274, 288—292;
P. Ж. М., 1958, 6215.
40*
628 ЛИТЕРАТУРА
Дюло (Duleau Jacques). [1] Resolution numerique de certains
systemes d'equations lineiares vectorielles. C. r. Acad, sci., 1956, 242, № 7,
870—873; P. Ж. М., 1956, 9130.
Енне (Jenne W.). [1] Zur AuflOsung linearer Gleichungssysteme. Astr.
Nachr., 1949, 278, 79-95.
Енсен (Jensen H.). [1] An attempt at a systematic classification of
some methods for the solution of normal equations. Geod. Inst. Medd., 1944,
№ 18, 45 pp; M. R., 7, 488.
Ершов А. П. [1] Об одном методе обращения матриц. Докл.
АН СССР, 1955, 100, № 2, 209-211; Р. Ж. М. 1955, 4242.
Жанен (Janin R.). [1] Resolution de systemes d'equations algebriques
lineaires d'ordre eleve, a l'aide des methodes mecanographiques (Emploi du
calculateur electronique). Rech. aeronaut., 1955, № 44, 47—50; P. Ж. М., 1956,
4914.
Живоглядов В. Г. [ 1 ] О некоторых численных методах решения
системы линейных алгебраических уравнений, их приспособлении для
других вычислений и об ошибках округления в этих процессах. Авто-
Автореферат дисс. канд. физ. матем. н. Казанский ун-т, Казань, 1955; Р. Ж. М.,
1956, 1689.
Задунайский (Zadunaisky Pedro E.). [1] Un metodo de
iteracion para la resolucion de sistemas de ecuaciones lineales algebraicas.
Rev. Union mat. argent, у Asoc. fis. argent:, 1955, 17, 335—343; P. Ж. М.,
1957, 8265.
Зассенфельд (Sassenfeld H.). [1] Ein hinreichendes Konvergenz-
kriterium und eine Fehlerabschatzung fur die Iteration in Einzelschritten bei
linearen Qleichungen. Z. angew. Math, und Mech., 1951, 31, 92—94; M. R.,
14, 692.
Зейдель (Seidel L.). [1] Ober ein Verfahren, die Qleichungen, auf
welche die Methode der kleinsten Quadrate fiihrt, sowie lineare Oleichungen
iiberhaupt, durch successive Annaherung aufzul6sen. Abh. math.-phys. KL,
Bayrische Akad. Wiss., Miinchen, 1874, 11, № 3, 81—108.
Зинден (Sinden Frank W.). [1] An oscillation theorem for algebraic
eigenvalue problems and its applications. Mitt. Inst. angew. Math., Zurich,
1954, 4, 57 pp.; M. R., 16, 666.
Зы лье в В. П. [1] Признаки сходимости и оценки погрешностей реше-
решений системы линейных алгебраических уравнений способом итераций в мат-
матричном изложении. М.—Л., Инжен. строит, ин-т им. Куйбышева. Сб. трудов,
1939, 2, 232—245.
Иванов В. К. [1] О сходимости процессов итерации при решении си-
систем линейных алгебраических уравнений. Изв. АН СССР, сер. матем.,
1939, № 4, 477-483; М. R., 2, 118.
Идельсон Н. И. [1] Вычисление весов неизвестных в методе наимень-
наименьших квадратов. Астр, журнал, 1943, 20, 11—13; М. R., 6, 51.
Йосса (Jossa F.). [1] Risoluzione progressive di un sistema di equazioni
lineari. Analogia con un problema meccanico. Rend. Accad. Sci. fls. e mat.,
Napoli, Ser. 4, 1940, 10, 346—352; M. R., 8, 535.
Исхак (Ishaq M.). [1] Sur les spectres des matrices. Semin. P. Dubreil
et Ch. Pisot. Fac. sci. Paris, 1955—1956, 9, № 14, 1—14; P. Ж. М., 1958,
2730.
И т о (I t о M.). [1] A geometrical study of the characteristic equation. Tdhoku
Math. J., 1932, 35, 294—303.
Ka йр о ни (Cai г о n i Mario). [1] Osservazioni sui procedimenti di
approssimazioni successive nel metodo delle forze. Ingegnere, 1957, 31, № 5,
410-420; P. Ж. М., 1958, 2436.
Калиновская (Кал1новська С. С). [1] Оцшка швщкост! зб'ш-
hoctj деяких перацШних процеав. Наук. зап. Луцьк. держ. пед. 1н-ту, 1955,
3, № 2, 11-17; Р. Ж. М., 1956, 7649.
ЛИТЕРАТУРА 629
Камела (К a me la С). [1] Die Losung der Normalgleichungen nach
der Methode von Prof. Dr. T. Banachiewicz (sogenannte „Krakovianenmethode").
Schwelz. Z. vermessungswesen Kulturlech., 1943, 41, 225—232, 265—275; M. R.
7, 488.
Кан (Khan N. A.). [1] A theorem on the characteristic roots of mat-
matrices. J. Univ. Bombay, sect. A., 1955, 38, 13—18.
Канторович Л. В. [1] Об одном эффективном методе решения
экстремальных задач для квадратичных функционалов. Докл. АН СССР,
1945, 48, № 7, 455—460; М. R., 8, 30.
[2] О методе наискорейшего спуска. Докл. АН СССР, 1947, 56, № 3,
233—236; М. R., ' , 308.
[3] Функциональный анализ и прикладная математика. Успехи матем. наук,
1948, 3, № 6, 89—185, М. R., 10, 380.
[4] Метод Ньютона. Тр. Матем. ин-та АН СССР, 1949, 28, 104-144;
М. R., 12, 419.
Каппус (Kappus R.). [1] L'algorithme de Oauss modernise et son
application a des systemes d'equations lineaires degeneres ou mal ordonnes.
Note techn. O. N. E. R. A., 1953, № Ц, 133 p. ш.; р. ж. М., 1959, 5215.
Каприоли (Caprioli Luigi)- [1] Sulla risoluzione dei sistemi di
equazioni lineari con il metodo di Cimmino. Boll. Unlone mat., 1953, 8, № 3,
260—265; P. Ж. М., 1955, 6110.
Карпе левич Ф. И. [1] Характеристические корни матриц с неотри-
неотрицательными коэффициентами. Успехи матем. наук, 1949, 4, № 5C3), 177—
178; М. R., 11, 154.
[2] О характеристических корнях, матриц с неотрицательными элемен-
элементами. Изв. АН СССР, сер. матем., 1951, 15, 361—383; М. R., 13, 201.
Карр (Carr Jonh W.). [1] Error analysis in floating point arithmetic.
Comm. Assoc. Comput. Machinery, 1959, 2, № 5, 10—15.
Карри (Currie J. C). .[1] Cassini ovals associated with a second
order matrix. Amer. Math. Monthly, 1948, 55, 487—489; M. R., 10, 177.
Карри (Curry H. В.). [1] The method of steepest descent for non linear
minimization problems. Quart. Appl. Math., 1944, 2, 258—261; M. R., 6, 52.
Каруш (Karush W.). [1] An iterative method for finding characte-
characteristic vectors of a symmetric matrix. Pad/. J. Math., 1951, 1, № 2, 233—247;
M. R., 13, 388..
[2] Convergence of a method of solving linear problems. Proc. Amer.
Math. Soc, 1952, 3, 839—851; M. R, 14, 1127.
Касадзима (Kasajima Tomomi). [1] A note on a theorem of
Rutishauser. Comment, math. Univ. St. Paull, 1957, 6, № 1, 89—91; P. Ж. М.,
1959, 7488.
Кассина (Cassina U.). [1] Sul numero delle operazioni elementari
necessarie per risoluzione dei sistemi di equazioni lineari. Boll. Unlone mat,
Hal., ser. Ill, 1948, 3, 142—147; M. R., 10, 405.
Кассинис (Cassinis Oino). [1] I metodi di H. Boltz per risoluzione
dei sistemi di equazioni lineari e il loro impiego nelle compensazioni della
triangolazione. Rtv. catasto e ser. teen, erartall, 1944, 1.
[2] Risoluzione dei sistemi di equazioni algebrfche lineari. Rend. Sem. mat.
e fls., Mllano, 1946, 17, 62—78; M. R., 9, 622.
Като (К a t о Т.). [1] On the upper and lower bounds of eigenvalues.
J. Phys. Soc. Japan, 1949, 4, 334—339; M. R., 12, 447.
Кауден (Cowden D. J.). [1] Correlation concepts and the Doolittle
method. /. Amer. Statist. Assoc, 1943, 38, 327—334; M. R., 5, 42.
Качмаж (Kaczmarz S.). [1] Angenaherte Auflosung von Systemen
linearer Gleichungen. Bull. Intern. Acad. Polon. Set. A, 1937, 355—357.
KauiaHHH(Kasanin R.). [1] Interpretation geometrique du schema de
Banachiewicz. Srpska Akad. Nauka. Zbornlk Radowa, 1952, 18, Mat. Inst.,
2, 93—96; M. R., 14, 501.
630 ЛИТЕРАТУРА
Кваде (Quade W.). [1] Auflosung Hnearer Oleichungen durch Matrizen-
iteration. Ber. Math.-Tagung Tubingen, 1946, 1947, 123—124; M. R., 9, 104.
Келли (Kelly J.). [1] Matrix multiplication on the IBM Card—Pro-
Card—Programmed Electronic Calculator. Proc. Comput. Sem. Dec. 1949, N. Y: IBM Corp.,
1951, 47—48; M. R., 13, 387.
Кенуй (QuenouilleM. H.). [1] A further note on discriminatory
analysis. Ann. Eugenics, 1949, 15, 11—14; M. R., 11, 743.
Керкхофс (Kerkhofs W.). [1] Resolution de systemes d'equations
simultanees a un grand nombre d'inconnues. Ossature Metallique, 1947, 12,
187—195; M. R., 10, 70.
Кертисс (Curtiss J. H.). [1] A generalization of the method of
conjugate gradients for solving systems of linear algebraic equations. Math.
Tables and Other Aids Comput., 1954, 8, № 48, 189—193; P. Ж. М., 1956,
4105.
[2] A theoretical comparison of thp efficiencies of two classical methods and
a Monte Carlo method for computing one component of the solution of a set
of linear algebraic equations. Svmpos. Monte Carlo Methods, New York,
John Wiley and Sons Inc., 1956, 191—233; P. Ж. М., 1958, 8272.
Керубино (Cherubino Salvatore). [1] Calcolo delle matricl.
Montr, mat. Consiglio naz. ricerche, 4, Roma. Ed. Cremonese, 1957, VII, 322 p.;
P. Ж. М., 1958, 9554.
Кикукава (Kikukawa M.). [1] A numerical method for multipli-
multiplication, reciprocation and division of matrices and for the solution of simultaneous
linear algebraic equations. Tech. Rep. Osaka Univ., 1952, 2, 11—30; M. R.,
14, 501.
Кимбалл (Kimball Bradford F.). [1] Note on computation of ortho-
orthogonal predictors. Ann. Math. Statistics, 1953, 24, 299—303; M. R., 14, 1019.
Кинкейд (Kincaid W. M.). [1] Numerical methods for finding charac-
characteristic roots and vectors of matrices. Quart. Appl. Math., 1947, 5, 320—345;
M. R., 9, 210.
Кио (Chio F.). [1] Metnolre sur les Functions Connues sous le Norn,
de Resultants ou de Determinants, Turin, 1853.
Клазен (Clasen B. I.). [1] Sur une nouvelle methode de resolution
des equations lineaires et sur l'application de cette methode au calcul des
determinants. Ann. Soc. sclent., Bruxelles, 1888, 12, A 50—59, В 251—281.
Клер (Clerc D.). [1] Sur le calcul par iteration des modes propres
d'ordre superieur. I. part. Rech. aeronaut., 1956, № 54, 39—48; P. Ж. М., 1957,
7400.
Кнёдель (Knodel W.). [1] Lineare Gleichungen. Beispiele aus den
Anwendungen, Losungsmethoden, Lochkartenverfahren. MTW—MM., 1956,
138—140; P. Ж. М., 1957, 1838.
Когбетлянц (Kogbetliantz Ervand George). [1] Diagona-
lization of general complex matrices as a new method for solution of linear
equations. Proc. Internat. Congr. Math., 1954, 2, Amsterdam, 1954, 356—357;
P. Ж. М., 1955, 6109.
[2] Solution of linear equations by diagonalization of coefficients matrix.
Quart. Appl. Math., 1955, 13, № 1, 123—132; P. Ж М., 1958, 1595.
Кози (Causey Robert L.). [1] Computing eigenvalues of non-
hermitian matrices by methods of Jacobi type. J. Soc. Industr. and Appl.
Math., 1958, 6, № 2, 172-181.
[2] On'some error bounds of Givens. J. Assoc. Comput. Machinery, 1958,
5, № 2, 127—131; P. Ж. М., 1959, 5228.
Коллар (Collar A. R.). [1] On the reciprocation of certain matri-
matrices. Proc. Roy-Soc. Edinburgh, 1939, 59, 95—206.
[2] Some notes on Jahn's method ior the improvement of approximate
latent roots and vectors of a square matrix. Quart. J. Mech. and Appl.
Math., 1948, 1, 145—148; M. R., 10, 152.
ЛИТЕРАТУРА 631
Коллац (Collatz L.). [1]. Fehlerabschatzung fur das Iterations-
verfahren zur AuflOsung linearer Gleichungssysteme. Z. angew. Math, und
Mech., 1942, 22, 357—361; M. R., 5, 50.
[2] Einschliessungssatz fur die charakteristischen Zahlen von Matrizen
Math. Z., 1942, 48, 221—226; M. R., 5, 30.
[3] Elgenwertaufgaben mlt technlschen Anwendungen. Mathematik und
ihre Anwendungen in Physik und Technik, Reitie A, 1949, 19, Akademische
Verlagsgesellschaft, Leipzig, XVII+ 466 pp; M. R., 11, 137.
[4] Ober die Konvergenzkriterien bei Iterationsverfahren fur lineare Gleich-
ungssysteme. Math. 2., 1950, 53, 149—161; M. R., 12, 361.
[5] Zur Herleitung von Konvergenzkriterien fur Iterationsverfahren bei
linearen Gleichungssystemen. Z. angew. Math, and Mech., 1950, 30, 278—280.
[6] Zur Fehlerabschatzung bei linearen Gleichungssystemen. Z. angew. Math,
und Mech., 1954, 34, № 1—2, 71—72; P. Ж. М., 1955, 439.
К он (Ко tin W.). [1] A variational iteration method for solving secular
equations. Chem. Phys., 1949, 17, 670; M. R., 11, 136.
Конференция. Conference on matrix computations (Wayne State Univ.
sept. 3rd—6th, 1957). J. Assoc. Comput. Machinery, 1957, 4, № 4, 520—523.
Коско (Kosko E). [1] Reciprocation of triply partitioned matrices.
J. Roy. Aeronaut. Soc, 1956, 60, 490—491; M. R., 18, 418.
[2] Matrix inversion by partitioning. Aeronaut. Quart., 1957, 8, № 2,
157—184; P. Ж.М., 1958, 751.
К ост арчу к В. Н. [1] Об одном методе решения систем линейных
уравнений и отыскания собственных векторов матрицы. Докл. АН СССР,
1954, 98, № 4, 531-534; Р. Ж. М., 1955, 4709.
[2] Застосування методу мшмальних нев'язок до знахождения власних
чисел матрица Наук. зап. Житомирськ. держ. пед. 1н-т, сер. ф1з.-мат.,
1957, 3, 63—76; Р. Ж. М., 1958, 1598.
Костарчук В. Н. и Пугачев Б. П. [1] Точная оценка умень-
уменьшения погрешности на одном шаге метода наискорейшего спуска. Тр. семин.
по функцион. анализу. Воронежск. ун-т, 1936, 2, 25—30.
Коструи Boppy(KostroJ. i Borro L.). [1] Resolugao de sistemas de
equacoes lineares pelo metodo de Cross. Tecnica, 1953, 28, № 230, 365—370;
P. Ж. М., 1953, 1407.
Котелянский Д, M. [1] О расположении точек матричного спектра.
Украин. машем, журн., 1955, 7, № 2, 131—133; М. R., 17, 228.
[2] О некоторых достаточных признаках вещественности и простоты
матричного спектра. Метем, сб., 1955, 36G8), 163—168; М. R., 16, 894.
[3] О влиянии преобразования Гаусса на спектры матриц. Успехи матем.
наук, 1955, 10, № 1, 117—121; Р. Ж. М., 1956, 1055.
Коши (Cauchy A. L.). [1] Methode generate pour la resolution des
systemes d'equations simultanees. C. r. Acad. set., 1847, 25, 536—538.
Коюар (CoQard A.). [1] Resolution d'un systeme d'equations lineaires
par approximations successives. Genie civil, 1953, 130, № 6, 114; P. Ж. М.,
1953, 454.
Крандалл (Crandall S. H.). [1] Engineering analysis; A survey
of numerical procedures. McGraw-Hill Book Co., Inc. New York — Toronto—
London, 1956; M. R., 18, 674—675.
Краруп и Свейгард (Krarup Т. and S v e j g a r d В.). [1] A method
for matrix multiplication, matrix inversion, and problems of adjustment by
punched card equipment. Geodoet Inst. Kobenhavn. Medd., 1956,31, 31; M. R.,
18, 337.
Красносельский М. A. [1] О некоторых приемах приближенного
вычисления собственных значений и собственных векторов положительно-
определенной матрицы. Успехи матем. наук, 1956. 11, № 3, 151—158; Р. Ж. М.,
1957, 1841.
632 ЛИТЕРАТУРА
Красносельский М. А. и Крейн С. Г. [1] Итеративный про-
процесс с минимальными невязками. Машем, сб., 1952, 31 G3), 315—334; М. R.,
14, 692.
B] Замечание о распределении ошибок при решении системы линейных
уравнений при помощи итерационного процесса. Успехи матем. наук, 1952,
7, № 4, 157—161; М. R., 14, 501.
Краут (С rout P. D.). [1] A short method for evaluating determi-
determinants and solving systems oi linear equations with real or complex coefficients.
Trans. Amer. Inst. Elec. Engng, 1941, 60, 1235—1240.
Крейг (Craig Edward J). [1] The N-step iteration procedures.
J. Math, and Phys., 1955, 3t, № 1, 64—73; P. Ж. М., 1956, 6866.
Крейсиг (Kreyszig E.). [1] Die Einschliessung von Eigenwerten
hermitescher Matrizen beim Iterationsverfahren. Z. angew. Math, and Mech.,
1954, 34, № 12, 459-469; P. Ж. М., 1956, 4919.
[2] Die Ausnutzung zusatzlicher Vorkenntnisse fur die Einschliessung von
Eigenwerten beim Iterationsverfahren. Z. angew. Math, and MeCh., 1955, 35,
№ 3, 89-95; P. Ж. М., 1956, 4920.
[3] Einschliessung von Eigenwerten und Mohrsches Spannungs diagramm.
Z. angew. Math mid Phys., 1958, 9a, № 2, 202—206; P. Ж. М., 1959, 7483.
Кроккет и Чернов (Crockett Jean Bronfenbrenner
and Chernoff Herman). [1] Gradient methods of maximization. Pad/. J.
Math., 1955, 5, N° 1, 33—50; P. Ж. М., 1956, 4925.
Крон (К г о п Gabriel). [1] Detailed example of interconnecting piece-
wise solutions. J. Franklin Inst., 1955, 259, № 4, 307—333; P. Ж. М., 1956,
6872.
B] Inverting a 256X256 matrix. Engineering, 1955, 179, № 4 650, 309—312;
P. Ж. М., 1956, 4915.
[3] Improved procedure for interconnecting piece-wise solutions. J. Fran-
Franklin Inst., 1956, 262, 385—392; M. R., 19, 64.
[4] Factorized inverse of partitioned matrices. Matrix Tensor Quart., 1957,
8, 39—41; M. R., 19, 1198.
Крылов А. Н. [1] О численном решении уравнения, которым в тех-
технических вопросах определяются частоты малых колебаний материальных
систем. ИАН ОМЕН, 1931, 4, 491—539.
Крылов Н. М. и Боголюбов Н. Н. [1] Новые методы для реше-
¦•ния некоторых математических проблем, встречаемых в технике. Укр. научн.
ин-т сооружений, 1933, 78, 78—95.
Кублановская В. Н. [1] Применение аналитического продолже-
продолжения в численных методах анализа. Автореферат дисс. канд. физ. матем. н.,
ЛГУ, Л. 1955; Р. Ж. М., 1956, 1688.
[2] Применение аналитического продолжения методом замены перемен-
переменных в численном анализе. Тр. Матем. ин-та АН СССР, 1959, 53, 145—185.
Кунц (KunzK. S.). [1] Matrix methods. Proc. Comput. Sent. Dec, 1949,
№ 9, IBM Corp., 1951, 37—42; M. R., 13, 496.
Купер (Cooper J. L. В.). [1] The solution of natural frequency equa-
equations by relaxation methods. Quart. Appl. Math., 1948, 6, 179—183; M. R.,
10, 70.
Куффиньяль (Couffignal Louis). [1] Recherches de mathema-
tiqites utilisables. La resolution numerique des systemes d'equations lineaires.
I. L'operation fondamentale de reduction d'un tableau. Revue scl., 1944, 82,
67—78; M. R., 8, 128.
[2] Sur ia precision des solutions approchees d'un systeme d'equations
lineaires. С r. Acad. sci., 1948, 227, 30—32, M. R., 10, 212.
[3] Sur la resolution numerique des systemes d'equations lineaires. II. Rev.
set., 1951, 89, 3—10; M. R., 13, 284.
[4] Methodes pratiques de realisation des calculs matriciels. Rend. mat. e
appl., 1954, 14; № i_2, 85-97; P. Ж. М., 1956, 6867.
ЛИТЕРАТУРА 633
Лаврентьев М. М. [1] К вопросу об улучшении точности решения
системы линейных уравнений. Докл. АН СССР, 1953, 92, № 5, 885—886;
Р. Ж. М., 1954, 3839.
[2] О точности решения линейных уравнений. Матем. сб., 1954, 34G6)
№ 2, 259—268; Р. Ж. М., 1954, 5784.
[3] Об оценке точности решения систем линейных уравнений. Докл.
АН СССР, 1954, 95, № 3, 447-448; Р. Ж. М., 1955, 4714.
Лавут А. П. [1] Расположение собственных чисел преобразований Зей-
деля для систем нормальных уравнений. Успехи матем. наук, 1952, 7, № 6,
197—202; М. R., 14, 1128.
Ладерман (Laderman J.). [1] The square root method for solving
simultaneous linear equations. Math. Tables and Other Aids Comput., 1948,
3, 13—16; M. R., 9, 622.
Ламин (Lamine Т.). [-1] Diagonalisation des matrices. Bull. Assoc. Ingrs
issus Ecole appllc, artill et genie, 1958, 36, № 1, 49—74; P. Ж. М., 1959, Г252.
Лангефош (Langefors В.). [1] Approximate solution of simulta-
simultaneous equations by means of transformation of variables. Applications to aero-
aeronautical problems. SAAB TN, 1953, № 7, 26 pp; P. Ж. М., 1959, 3241.
[2] Ill-conditioned matrices. SAAB TN, 1953, № 22; P. Ж. М., 1956, 8349.
[3] On the practical solution of linear equations. SAAB TN, 1955, № 35,
24 pp; P. Ж. М., 1959, 9505.
Ланцош (Lanczos Cornelius). [1] A simple recursion method for
solving a set of linear equations. Bull. Amer. Math. Soc, 1936, 42, 325; M. R.,
1, 97.
[2] An iteration method for the solution of the eigenvalue problem of
linear differential and integral operators. /. Res. Nat. Bur. Standards, 1950,
45, № 4, 255—288; M. R., 13, 163.
[3] An iteration method for the solution of the eigenvalue problem of li-
linear differential and integral operators. Proc. Second. Symp. Large-Scale Di-
Digital Calcul. Mack., A949), 1951, 164—206; M. R., 13, 589.
[4] An iteration method for the solution of the eigenvalue problem of li-
linear differential and integral operators. Proc. Symp. Spectral Theory and
Differential Problems. Oklahoma Agricultural Mech. College, 1951, 301—316;
M. R., 13, 497.
[5] Solution of systems of linear equations by minimized iterations. J. Res.
Nat. Bur. Standards, 1952, 49, № 1, 33—53; M. R., 14, 501.
[6] Chebyshev polynomials in the solution of large-scale linear systems.
Proc. Assoc. ComputMach., Meeting at Toronto Out., 1952, Sept. 1953,124—133;
P. Ж. М., 1954, 5262.
[7] Spectroscopic eigenvalue analysis. J. Wash. Acad. Set., 1955, 45, № 10,
315—323; P. Ж. М., 1956, 9114.
[8] Applied analysis. Prentice Hall, Inc., Englewood Cliffs., N. Y., 1956,
XX + 539 pp.; P. Ж. М., 1958, 4265.
[9] Iterative solution of large-scale linear systems. /. Soc. Indust. and
Appl. Math., 1958, 6, 1, 91—109; M. R., 20, 70.
Леверье (Leverrier U. J. J.). [1] Sur les variations seculafres des
elements des orbites. J. Math., 1840.
[2] Recherches Astronomiques. Ann. I'Obser., Paris, 1856, 11, 128.
Легра (Legras Jean). [1] La methode de relaxation. Age nucleaire,
1957, № 6, 65—66; P. Ж. М., 1958, 6208.
Ледерман (Ledermann Walter). [1] Bounds for the greatest la-
latent-roots of a positive matrix. /. London Math. Soc, 1950, 25, 265—268; M. R.,
12, 312.
Лейдерман Ю. P. [1] Об одном способе решения системы линейных
алгебраических уравнений, когда обычные методы последовательного при-
приближения неприменимы. Докл. АН Узб. ССР, 1953, № 1, 8—11; Р. Ж. М.,
1953, 902.
634 ЛИТЕРАТУРА
[2] К вопросу о решении системы линейных алгебраических уравнений
методом последовательных приближений. Докл. АН Узб. ССР, 1953 ДО> 10
6—9; Р. Ж. М., 1954, 4919. " '
[3] Об одном методе решения . совместных линейных алгебраических
уравнений. Тр. Ин-та матем. и механ. АН Узб. ССР, 1954 в 13 153—158'
Р. Ж. М., 1957, 6711.
Ленти [Lenti Raumo]. [1] Eine Methode von sukzessiven Projekti-
onen zur Luzung der linearen algebraischen Vektorgleichung und ihre Anwen-
dungen fur Inversion von Matrizen. Soc. Sci. Pennlca. Jr. Phys.-Math. 1958,
XXI s.
Лепперт (Leppert E. L.). [1] A fraction series solution for cha-
characteristic values useful in some problems of airplane dynamics /. Aero-
Aeronaut. Sci., 1955, 22, № 5, 326—328; P. Ж. М., 1956, 5510.
Ливенс (Leavens D. H.). [1] Accuracy in the Doolittle solution.
Econometrica, 1947, 15, 45—50; M. R., 8, 407.
Лидс кий В. Б. [1] О собственных значениях суммы и произведения
симметричных матриц. Докл. АН СССР, 1950, 75, 769—772.
Липецкий В. Д. [1] Решение системы трехчленных уразнений с по-
помощью фокусных отношений. Научн. тр. Ленингр. инж.-строит. ин-та,
1954, 17, 185—190; Р. Ж. М., 1956, 765.
Литвинов (Л i т в i н о в М. В.). [1] Обчислення коэфЩент1в впливу
для складе'них аткових областей за допомогою матричних перетворень. До-
noeldl АН УРСР, 1955, № 3, 222-226; Р. Ж. М., 1956, 6871.
Ловаш-Надь (Lowas s-N a gy V i k t or). [1] Matnxzamitas Miiszaki
matematikai gyakorlatok. С IV. Budapest, Tankonyvkiado, 1956; P. Ж. М.,
1958, 6487.
Ломан (Lohman J. В.). [1] An iterative method for finding the smal-
smallest eigenvalue of a matrix. Quart. Appl. Math., 194Э, 7, 234; M. R., 10, 743.
Лонсет (Lonseth А. Т.). [1] Systems of linear equations with coef-
coefficients subject to error. Ann. Math. Statistics, 1942, №3, 332—337; M. R., 4, 90.
[2] On relative errors in systems of linear equations. Ann. Math. Statis-
Statistics, 1944, 15, 323—325; M. R., 6, 51.
[3] An extension of an algorithm of Hotelling. Berkeley Symp. Math.
Stat. Prob., 1945, 1946, 353—357; M. R., 10, 627.
[4] The propagation of error in linear problems. Trans. Amer. Math. Soc,
\1947, 62, 193—212; M. R., 9, 192.
Лопшиц A. M. [1] Численный метод нахождения собственных зна-
значений и собственных плоскостей линейного оператора. Тр. сем. по векторн.
и тензоры, анализу, 1949, 7, 233—259; М. R., 13, 991."
[2] Экстремальная теорема для гиперэллипсоида и ее применение к ре-
решению системы линейных алгебраических уравнений. Тр. сем. по векторн.
и тензоры, анализу, 1952, 9, 183—197; М. R., 14, 1127.
Лоткин (Lotkin M-ark). [1] A set of test matrices. Math. Tables
and Other Aids Comput., 1955, 9, № 52, 153—161; P. Ж. М., 1957, 2685.
[2] Characteristic values of arbitrary matrices. Quart. Appl. Math., 1956,
14, № 3, 267—275; P. Ж. М., 1957, 8964.
[3] The diagonalization of skew-Hermitian matrices. Duke Math. J.,
1957, 24, 9-14; M. R., 19, 685.
Лоткин и Ремидж (Lotkin Mark and R e m a ge R u s s e 11). [1]
Scaling and error analysis for matrix inversion by partitioning. Ann. Math.
Statistics, 1953, 24, 428—439; P. Ж. М., 1954, 5265.
[2] Matrix inversion by partitioning. Proc. Assoc. Comput. Mach., Meeting
at Toronto, Ont., 1952, Sept. 1953, 36—41; P. Ж. М., 1954, 5264.
Лоу (Lowe J.). [1] Solution of simultaneous linear algebraic equations
using the. IBM Type 604 Electronic Calculating Punch. Proc. Comput. Sem.,
Pec. 1949, N. Y. IBM Corp., 1951, 54-56; M. R., 13, 388.
ЛИТЕРАТУРА 635
Люстерник Л. А. [1] Замечания к численному решению краевых
задач уравнения Лапласа и вычислению собственных значений методом се-
сеток. Тр. Матем. ин-та АН СССР, 1947, 20, 49—64; М. R., 10, 71.
[2] О сходимости при случайных начальных данных и накоплении оши-
ошибок итерационного процесса решения системы алгебраических уравнений.
Вычисл. машем, и вычисл. техника, 1953, № 1, 41—45; Р. Ж. М., 1955, 435.
[3] Решение задач линейной алгебры методом непрерывных дробей.
Тр. семин. по функцион. анализу. Воронежск. ун-т, 1956, 2, 85—90;
Р. Ж. М., 1957, 5971.
Лузин Н. Н. [1] О методе ак. А. Н. Крылова составления векового
уравнения. ИАН ОМЕН, 1931, 903—958.
[2] О некоторых свойствах перемещающегося множителя в методе
акад. А. Н. Крылова. I, II, III. ИАН ОМЕН, 1932, 596—638, 735—762,
1065—1102.
Лукашевич и Вармус (Lukaszewicz Jozef i Warmus
M i e с z у s 1 a w). [1] Metody numeryczne i graflczne. I. Paiistwowe Wydaw.
Nauk., Warszawa, 1956, 429 pp.; M. R, 18, 235.
Лэн Сень-мин (Leng Sen-ming). [1] The characteristic roots
of a matrix. Duke Math. J., 1952, 19, № 1, 139—154; M. R., 14, 7.
Лю и Кван (Loo W. et К wan С h а о - С h i h). [1] La methode de
col dans le probleme de relaxation. Ada Math, sinica, 1955, 5, 497—504;
M. R., 17, 791.
Мадзарелла (M a z z a r e 11 a F.). [1] Semplificazione alia soluzlone
di un sistema di equazioni lineari. Rend. Accad. sci. fis. e mat., Napoli Ser
4, 1945, 13, 197—201; M. R., 8, 287.
Мадич (Мадип П е т а г). [1] L'etude de solubilite des systemes des
equations algebriques lineaires. Bull. Inst. Nuclear Sci. „Boris Kidrich", 1952,
18, 13—15; M. R., 17, 1008.
[2] Домен грешке у решеньима система линеарних алгебарских ]една-
чина.. Весн. Друшт. матем. и физ. Н. P. Cpffuje, 1956, 8, № 3—4,
191—194; Р. Ж. М., 1958, 1594.
[3] Sur une methode de resolution des systemes d'equations algebriques
lineaires. C. r. Acad. sci., 1956, 242, № 4, 439—441; P. Ж. М., 1956, 9129.
Майер и Шмидтмайер (Mayer Daniel a Schmldtmayer
Josef). [1] Vyjadfeni inversnf matice konvergentnf geometrickou fadou. Apli-
kace mat, 1957, 2, № 1, 24—37; P. Ж. М., 1958, 2438.
Мак-Миллан (Mac Millan R. H,). [1] A new method for the
numerical evaluation of determinants. J. Roy Aeronaut. Soc, 1955, 59, № 539,
772—773; P. Ж. М., 1956, 6151.
Маккензи (Mackenzie J. K-). [1] A least squares solution of
linear equations with coefficients subject to a special type of error. Austral.
J. Pkys., 1957, 10, 1, 103—109; P. Ж. М., 1958, 7204.
Мальцев А. И.[l] Основы линейной алгебры. Изд. 2-е, Гостехиздат, 1956.
Манье (Magnier А.). [1] Sur le calcul numerique des matrices. С г.
Acad. set., 1948, 226, 464—465; M. R., 9, 471.
Марков (Марков О. О.). [1] До питания про метод релаксаци.
Наук. зап. Херсоньск. держ. пед. Ш-т, 1956, 7, 45—48; Р. Ж. М., 1958, 9265.
Маркус (Marcus M.). [1] An eigenvalue inequality for the product
of normal matrices. Amer. Math. Monthly, 1956, 63, 3, 173-174; P. Ж. М.,
1957, 2063.
[2] On the optimum gradient method for systems of linear equations. Proc.
Amer. Math. Soc, 1956, 7, № 1, 77—81; P. Ж. М., 1957, 2681.
Mac л Ob П. Г. [1] К определению обратных матриц потенциальной
энергии многоатомных молекул (Метод определителей). Докл. АН СССР,
1949, 67, 819—822.
[2]. К определению обратных матриц потенциальной энергии многоатом-
многоатомных молекул. Л., Зап. Горн, ин-та, 1949, 24, 185.
636 ЛИТЕРАТУРА
[3] К определению обратных матриц потенциальной энергии много-
многоатомных молекул (Метод комбинированного наискорейшего спуска) Докл.
АН СССР, 1950, 71, 867—870; М. R., 12, 152.
[4] К методике определения колебаний многоатомных молекул. Метод
комбинированного наискорейшего спуска. ЖЭТФ АН СССР 1950, 20,
609—618; М. R., 12, 640.
[5] К определению обратных матриц потенциальной энергии много-
многоатомных молекул (Приближенные методы нахождения коэффициентов влия-
влияния). Докл. АН СССР, 1950, 70, 985.
[6] Метод ргшения системы однородных линейных уравнений при рас-
расчете колебаний полиатомических молекул. ЖЭТФ АН СССР, 1952, 22,
276—283; М. R., 14, 322.
М а су ям а (М a s u у a m a M.). [1] On a numerical method of solution
of the equation | К—Мй | =0. Rep. Statist. Appl. Res. Union Jap. Sci. Eng.,
1951, 1, 26-28; М„ R., 13, 283.
Мачинский (Matschinski M.). [1] Ober eine form der Lo'sung
linearer Gleichungsysteme. Portugaliae math., 1955, 14, № 3—4, 133—139;
P. Ж. М., 1958, 5187.
Маянц Л. С. [1] Метод возмущений с применением двойной итерации.
Докл. АН СССР, 1945, 48, № 5, 334—337; М. R., 8, 54.
[2] Метод уточнения корней вековых уравнений высоких степеней
и численного анализа их зависимости от параметров соответствующих
матриц. Докл. АН СССР, 1945, 50, 121—124; М. R, 14, 1129.
Медлин (Medlin Gene W.). [1] Bounds for the characteristic roots
of matrices with real elements. Duke Math. J., 1952, 19, 563—565; M. R.,
14, 836.
[2] On bounds for the greatest characteristic root of a matrix with po-
positive elements. Proc. Amer. Math. Soc, 1953, 4, 769—771; P. Ж. М., 1955, 85.
[3] On limits of the real characteristic roots of matrices with real ele-
elements. Proc. Amer. Math. Soc, 1956, 7, № 5, 912—917; P. Ж. М., 1957, 6154.
Мейер и Холлингсуэрт (Meyer H. 1. and Hollings-
worth B. J.). [1J A method of inverting large matrices of special form.
Math. Tables and Other Aids Comput., 1957, 11, № 53, 94—97; P. Ж. М.,
1953, 6213.
Мейзлик (M e j z 1 i k L a d i s 1 a v). [1] Riesenie systemov linearnyeh
rovYifc priamymi metodami. Inien. stavby, 1954, 2, № 3, 110—116; P. Ж. М.,
1955, 438.
Мелке (M e h m k e R.). [1] Praktische Lo'sung der Grundaufgaben iiber
Determinanten, Matrizen und lineare Transformationen. Math. Ann., 1892, 103,
300—318.
[2] К способу Зейделя, служащему для решения системы линейных
уравнений с весьма большим числом неизвестных посредством последова-
последовательных приближений. Матем. сб., 1892, 16, № 2, 342—345.
Мемке Р. и Некрасов П. А. [1] Решение линейной системы
уравнений посредством последовательных приближений. Матем. сб., 1892,
16, 437—459.
Мендельсон (Mendelsohn N. S.). [1] Some elementary properties
of ill-conditioned matrices and linear equations. Amer. Math. Monthly, 1956,
63, № 5, 285—295; P. Ж.. М., 1957, 6850.
[2] Some properties of approximate inverses of matrices. Trans. Roy. Soc.
Canada, sec. 3, 1956, 50, 53—59; P. Ж. М., 1959, 5221.
[3] An iterative method for the solution of linear equations based on the
power method for proper vectors. Math. Tables and Other Aids Comput.,
1957, 11, № 58, 88—91; P. Ж. М., 1958, 2435.
[4] The computation of complex proper values and vectors of a real matrix
with application to polynomials. Math. Tables and Other Aids Comput., 1957,
11, № 58, 91—94; P. Ж. М., 1958, 2440.
ЛИТЕРАТУРА 637
М е н л и (М а п 1 е у R. О.). [1]' Roots of frequency equations. Nature and
distribution of roots. Aircraft Engrg., 1944, 16, 203; M. R., 6, 74.
Меррей (Murray F. J.). [1] Simultaneous linear equations. Proc.
Sclent. Comput. Forum., 1948, IBM Corp., 1950, 105—106; M. R., 13, 496.
Мизес и Гейрингер (Misses R. and Geringer H.). [1]
Praktische Verfahren der Gleichungsauflosung. Z. angew. und Mech., 1929,
9, 58—77, 152—164.
Микеладзе Ш. E. [1] О разложении определителя, элементами ко-
которого служат полиномы. Прикл. матем. и механика, 1948, 18, 219—222;
М. R., 9, 622.
Милн (Milne W. Е.). [1] Numerical calculus. Princeton 1949, London
1950; M. R., 10, 483.
Миро (M i г о u x Jean). [1] Une nouvelle machine analogique a ite-
iteration matricielle donnant les racines des equations algebriques. L'iteration des
matrices ayant des valeurs propres de modules voisins., Ann. telecommun,
1956, 11, 226-232; M. R., 19, 769.
Ми реки и (Mirsky L.). [1] The norms of adjugate and inverse mat-
matrices. Arch. Math., 1956, 7, № 4, 276—277; P. Ж. М., 1958, 5498.
[2] Inequalities for normal and Hermitian matrices. Duke Math. J., 1957,
24, № 4, 591—599; P. Ж. М., 1958, 8578.
Митани. [1] Численное решение системы линейных алгебраических
уравнений на вычислительной машине. Bull. Electrotechn. Lab., 1955, 19,
№ 8, 576—581; Р. Ж. М., 1957, 5959.
Митра (Mitra S. К.). [1] On an orthogonalisation method of eva-
evaluating the reciprocal and ihe determinant of a matrix and its Gaussian trans-
transform. Proc. Second Congr. Theor. and Appl. Mech., New Delhi, Octob., 1956,
261-268; M. R., 19, 1080.
Митчелл (Mitchell H. F. Sr.). [1] Inversion of a matrix of order
38. Math. Tables and Other Aids Comput., 1948, 3, 161—166; M. R.,
10, 152..
Митчелл и Ратерфорд (Mitchell A. R. and Ruther-
Rutherford D. E.). [1] On the theory of relaxation. Proc. Glasgow Math. Assoc,
1953, 1, 101—110; M. R., 15, 353.
Михкович (M i с h k о v i t с h V. V.). [1] Resolution des systemes
d'equations lineaires algebriques a l'aide des cracoviens. Srpska Akad. Nauka.
Zbornlk Radova, 1952, 18, Mat. Inst., 2, 53—70; M. R., 14, 501.
Моррис (Morris J.). [1] On a simple method for solving simulta-
simultaneous linear equations by means of successive approximations. ./. Roy. Aero-
Aeronaut. Soc, 1935, 39, 349.
[2] A succesive approximation process for .solving simultaneous linear
equations. Aeronaut. Res. Comm., 1936, Rep. 1711, 1—12.
[3] Frequency equations. Aircraft Engrg, 1942, 14, 108—110; M. R., 4, 90.
[4] An escalator process for the solution of linear simultaneous equations.
Phllos. Mag., 1946, GK7, 106—120; M. R., 8, 287.
[5] The escalator process for the solution of damped Lagrangian frequency
equations. Philos. Mag., 1947, GK8, 275—287; M. R., 9, 210.
[6] An application of the escalator process. Solution thereby of quasi-
Hermitian frequency equations encountered in specific practical problems. Air-
Aircraft Engrg, 1951, 23, 136—137; M. R., 12, 862.
Моррис и Хед (Morris J. and Head J. W.). [1] Lagrangian
frequency equations. An „escalator" method for numerical solution. Aircraft
Engrg, 1942, 14, 312-314, 316; M. R., 4, 148.
[2] The „escalator" process for the solution of Lagrangian frequency equa-
equations. Philos. Mag., 1944, GK5, 735—759; M. R., 7, 84.
Моррисон (Morrison J. F.). [1] The solution of three-term simulta-
simultaneous linear equation by the use of submatrices. Enginearing J., 1946, 29,
80—83; M. R., 8, 128.
638 ЛИТЕРАТУРА
Моултон (Moulton F. R.). [1] On the solutions of linear equations
having small determinants. Amer. Math. Monthly, 1913, 20, 242—249.
Мункельт (Munkelt Karlj. [1] Formeln zur maschinellen Berech-
nung von Kehrmatrizen. Dtsch. hydrogr. Z., 1956, 9, № 3, 143—146; P. Ж. М.,
1955, 4248.
Мюли г и Копперман (Мfih 1 ig F. and Koppermann E.).
[1] Die Rechenvorschrift des „modernisierten" Gaufischen Algorithmus in ihrer
einfachsten Form. Z. Vermessungswesen, 1953, 78, № 12, 389—393; P. Ж. М.,
1955, 4713.
Мюллер (Mii Her E.). [1] Qenauigkeit der bei Reduktion von Fehler-
gleichungen eliminierten Unbekannten. Z. Vermessungswesen, 1942, 71,
186—190; M. R., 5, 161.
Наглер (N a g 1 e r H.). [1] On the simultaneous numerical inversion of
a matrix and all its leading submatrices. Math. Tables and Other Aids Comput,
1956, 10, № 56; 225—226; P. Ж. М., 1957, 8271.
Натансон И. П. [1] К теории приближенного решения уравнений. Уч.
зап. Ленингр. гос. пед. ин-та им. А. И. Герцена, 1948, 64, 3—8.
Невилл (Neville Е. Н.). [1] Ill-conditioned sets of linear equations.
Philos. Mag., 1948, G) 39, 35—48; M. R., 9, 382.
Нейман (vonNeuman J.). [1] Some matrix inequalities and metriza-
tion of matrix-space. Изв. ин-та матем. и механики. Томский ун-т, 1937,
1, № 3, 286—299.
Нейман и Голдстайн (von Neumann J. and Ooldstine H. H.). [1]
Numerical inverting of matrices of high order. Bull. Amer. Math. Soc, 1947, 53,
1021—1099; M. R., 9,471.
Некрасов П. A. [1] Определение неизвестных по способу наименьших
квадратов при весьма большом числе неизвестных. Матем. сб., 1885, 12
189-204.
[2] К вопросу о решении линейной системы уравнений с большим числом
неизвестных посредством последовательных приближений. Приложение
к т. LXIX. Записки Ак. Наук, 1892, № 5, 1—18.
Николаева М. В. [1] О методе релаксации. Тр. Матем. ин-та
АН СССР, 1949, 28, 160—182; М. R., 12, 539.
Ньюмарк (NewmarkN. M.). [1] Bounds and convergence of relaxation
and iteration procedures. Proc. First U. S. Nat. Congr. Appl. Mech. Chicago,
1951, N. Y. Amer. Soc. Mech. Eng., 1952; M. R., 15, 353.
О л т (A 11 F. L.). [1] Machine methods for finding characteristic roots Of a
matrix. Proc. Comput. Sem. Dec, 1949, N. Y. IBM. Corp., 1951, 49—53; M. R.,
13, 496.
Ольденбургер (Oldenburger Rufus). [1] infinite powers of mat-
matrices and characteristic roots. Duke Math. J., 1940, 6, 357—361; M. R. 1, 324.
Орлов (Orloff Co n s t an ti n). [1] Methode spectrale pratique deva-
devaluation numerique des determinants et de resolution du systeme d'equations line-
aires. Весн. Друштва матем. и физ. Н. Р. Срби}е, 1953, 5, № 1—2, 17—30;
Р. Ж. М., 1956, 7651.
Осборн (Osborne Elmer E.). [1] On acceleration and matrix deflation
processes used with the power method. J. Soc. Indust. and Appl. Math., 1958, 6,
№ 3, 279-287.
Островский (OstrowskiA. M.). [1] Sur la variation de la matrice in-
inverse d'une matrice donnee. C. r. Acad. scl., 1950, 231, 1019—1021; M. R., 12, 396.
[2] Un nouveau theoreme d'existence pour les systemes d'equations'. C. r.
Acad. scl., 1951, 232, 786—788; M. R., 12, 596.
[3] Sur les matrices peu differentes d'une matrice triangulaire. C. r. Acad. set,
1951, 233, 1558—1560; M. R., 13, 900.
[4] Sur les conditions generates pour la regularite des matrices. Univ. Roma
1st. Naz. Alta. Mat. Rend. Mat. e Appl., 1951, E) 10, 156-168; M. R., 14, 125.
[5] Ueber das Nichtverschwinden einer Klasse von Determinanten und die
ЛИТЕРАТУРА 639
Lokalisierung der charakteristischen Wurzeln von Matrizen. Composltlo Math.
1951, 9, 209—226; M. R., 13, 524.
[6] Bounds for the greatest latent root of a positive matrix. /. London
Math. Soc, 1952, 27, № 106, 253—256; M. R., 14, 126.
[7] On over and under relaxation in the theory of the cyclic single step
iteration. Math. Tables and Other Aids Comput. 1953 7 159—159- p Ж М.,
1954, 5783.
[8] On the linear iteration procedures for symmetric matrices. Rend mat.
e appllc, 1954, 14, № 1—2, 140—163; P. Ж. М., 1956, 8346.
[91 On nearly triangular matrices. J. Res. Nat. Bur. Standards 1954, 52,
№ 6, 319—345; P. Ж. М., 1955, 4232.
[10] Ober Normen von Matrizen. Math. Z., 1955, 63, № 1, 2—18; P. Ж. М.,
1956, 6395л
[11] Ober Verfahren von Steffensen und Householder zur Konvergenz-
verbesserung von Iteralionen. Z. angew. Math, und Phys., 1956, 7, № 3,
218—229; P. Ж. М., 1957, 911.
[12] Determinanten mit uberwiegender Hauptdiagonale und die absolute
Konvergenz von linearen Iterationsprozessen. Comment, math, helv., 1956, 30,
№ 3, 175—210; P. Ж. М., 1957, 5960.
[13] On Oauss'speeding up device in the theory of single step iteration.
Math. Tables and Other Aids Comput., 1958, 18, № 62, 116—132.
Панов Д. Ю. [1] Решение систем линейных уравнений. Добавление
к книге Д. Скарборо. «.Численные методы математического анализа),
М.-Л., 1934.
П а н ц (Рапс Vladimir). [1] Upravena relaxacni methoda. Apllkaoe
mat., 1957, 2, № 3, 184—201; P. Ж. М., 1958, 7206.
Паркер (Parker W. V.). [1] The characteristic roots of a matrix.
Duke Math. J., 1937, 3, 484—487.
[2] Limits to the characteristic roots of a matrix. Duke Math. J., 1943,
10, 479—482; M. R., 5, 30.
[3] The characteristic roots of matrices. Duke Math. J., 1945, 12, 519—526,
M. R., 7, 107.
[4] Characteristic roots and the field of values of a matrix. Duke Math. J.,
1948, 15, 439—442; M. R., 10, 4.
[5] Sets of complex numbers associated with a matrix. Duke Math. J.,
1948, 15, 711—715; M. R., 10, 230.
[6] Characteristic roots and field of values of a matrix. Bull. Amer. Math.
Soc, 1951, 57, 103—108; M. R., 12, 581.
Паркес(Рагкев Е. W.). [1] Linear simultaneous equations. Some prac-
practical aspects of their solution in respect to the time involved with a series and
the relative accuracy of the results. Aircraft Engrg, 1950,22,48,56; M. R., 11,618.
Пароди (Parodi M a u r i с e). [1] Remarque sur la stabilite. C. r. Acad.
set, 1949, 228, 51—52; M. R., 10, 501.
[2] Complement a un travail sur la stabilite. С. г. Acad. set., 1949, 228,
1198—1200; M. R 10, 501.
[3] Sur les limites des modules des racines des equations algebriques. Bull.
Set. Math., B), 1949, 73, 135—144; M. R., 11, 307.
[4] Quelques proprietes des matrices H. Ann. Soc. sci. Bruxelles., ser. I,
1950, 64, 22—25; M. R., 12, 234.
[5] Sur une limite superieure du rapport des valeurs caractertstiques de
deux matrices symetriques definies positives, a elements reels, dontles ele-
elements correspondants different peu. C. r. Acad. sci., 1950, 230, 705—707;
M. R-, 11, 413.
[6] Sur des families de matrices auxquelles est applicable une methode
d'iteration. С r. Acad. set., 1951, 232, 1053—1054; M. R., 12, 639.
[7] Sur un theoreme de M. Ostrowski. С. г. Acad. sci., 1952, 234, 282—284;
M. R., 14, 126.
640 ЛИТЕРАТУРА
[8] Sur quelques proprietes des valeurs caracteristiques des matrices carrees
Mem. set. Math., 1952, 118, 64 pp.; M R., 14, 236.
[9] Sur la localisation des valeurs caracteristiques des matrices dans le
plan complexe. C. r. Acad. set., 1956, 242, 2617—2618; M. R., 18, 4.
[10] Sur une methode de localisation des valeurs caracteristiques de certai-
nes matrices. C. r. Acad. set., 1957, 244, 1597—1598; M. Ry 19, 379.
Пельтье (Peltier Jean). [1] Determination de vecteurs propres de
certaines matrices a determinant faible. C. r. Acad. set., 1955, 240, № 23, 2201—2203;
P. Ж. М., 1957, 901.
[2] Mecanisation des problemes lineaires sur machines electroniques. C. r.
Acad. sci., 1957, 244, № 8, 1003—1005; P. Ж. М., 1959, 3243.
Пен розе (Penrose R.). [1] On best approximation solutions of linear
matrix equations, Proc. Cambridge Phllos. Soc, 1956, 52, 17—19; M. R., 17, 536.
Перес (Peres M.). [1] On solution of systems of simultaneous linear
equations. Las Cienclas. Madrid, 1952, 17, 443—449; M. R., 17, 1137.
Перселл {Purcell Everett W.). fl] The vector method of solving
simultaneous linear equations. J. Math, and Phys., 1953, 32, 180—183; P. Ж. М.,
1954, 5787.
Петри (Petrie George W.). [1] Matrix inversion and solution of si-
simultaneous linear algebraic equations with the IBM 604 electronic calculating
punch. Nat. Bur. Standards. Appl. Math. Ser., 1953, 29, 107—112; P. Ж. М.,
1956, 3332.
Планкетт (Plunkett R.). [1] On the convergence of matrix itera-
iteration processes. Quart. Appl. Math., 1950, 7, 419—421; M. R., 11, 464.
Покорна (Pokopna O.). [1] Reseni soustav linearnich algebraickych
rovnic minimisaci souftu ttvcrcu residui. Sbor. Ceskosl. akad. ved. Lab.
mat. stroju, 1954, № 2, 111—116; P. Ж. М., 1956, 3329.
[2] Reseni soustav linearnich algebraickych rovnic prehled a srovnani metod.
Stroje zpracov. Inform., 1955, 3, 139—196; P. Ж. М., 1957, 6151.
[3] Schema pro feseni soustav linearnich algebraickych rovnic eliminaci. Aplt-
kace mat., 1957, 2, № 3, 235-241; P. Ж. М., 1958, 6209.
П о л л а ч e к -Г ей ри н г е р (Р о 11 а с г е к - О е ir i n g e r H.). [1]
Zur Praxis der LOsung linearer Oleichungen in der Statik. Z. angew. Math,
und Mech., 1928, 8, 446—447.
Поп и Томпкинс (Pope David A. and Tompkins C.). [1]
Maximizing functions of rotations - experiments concerning speed of diagona-
lization of symmetric matrices using Jacobi's method. J. Assoc. Comput. Machi-
Machinery, 1957, 4, № 4, 459—466; P. Ж. М., 1959, 2013.
Попович (Popovici Const. C). [11 Asupra metodei itera{iei, apli-
cata la un sistem de ecuafii lineare. Studtt $1 cercetari mat., 1953, 4, №1—2.
233—247; P. Ж. М., 1955, 3987.
Портер (Porter R. E.). [1] Single order reduction of a complex
matrix. Proc. Comput. Sem. Dec, 1949, N. Y., IBM Corp., 1951, 138—140;
M. R., 13, 387.
Потрон (Potron Г Abbe). [1] Sur les matrices non negatives, et
les solutions positives de certains systemes lineaires. Bull. Soc. math. France,
1939, 67, 56-61; M. R., 1, 97.
Пугачев Б. П. [1] О двух приемах приближенного вычисления
собственных значений и собственных векторов. Докл. АН СССР, 1956, 110,
№ 3, 334—337; Р. Ж. М.,. 1957, 5181. .
[2] Об одном методе приближенного отыскания собственных значении.
Тр. 3-го Всесоюзного матем. съезда, 1956, 2, 153—154; Р. Ж. М.. 1956,
9113.
Райли (Riley James D.). [1] Solving systems of linear equations
with a positive definite, symmetric, but possibly Ill-conditioned matrix. Mafft.
'Tables and Other Aids Comput., 1955, 9, № 5i, 96-Ю1; P. Ж. М., 1957, 5958.
ЛИТЕРАТУРА 641
Раймонди (Raymondi С). [1] Contribute) allo studio dei sistemi
elastici staticamenta indeJerminanti. Attl. 1st. Costruzlonl Univ. Pisa, 1949,
13, 1—15; M. R., 13, 537.
Райе (Rice L e p 1 n e H a 11). [1] The rank of a matrix, the value of a
determinant, and the solution of a system of linear equations. J. Math, and
Phys., 1932, П, 146—149.
Райт (Wright L. Т., Jr.). [1] The solution of simultaneous linear
equations by an approximation method. Cornell Univ., Engrg. Exper. Station
Bull., 1943, 31, 6 pp; M. R., 5, 110.
Растон (Rushton S.). [1] On least squares fitting by orthonormal
polynomials using the Choleski method. J; Roy. Statist. Soc, Ser. B, 1951, 13
92—99; M. R., 13, 990.
Ратерфорд (Rutherford D. E.). [1] On the rational solution of
the matrix equation sx = xt. Proc. Konlnkl. nederl. akad. wetensch, 1933 36,
432—442.
Рахман (Rahman A.). [1] Numerical evaluation of determinants. Bull.
cl. sci. Acad. roy. Belgique, 1954, 40, № 8, 798—801; P. Ж. М., 1956, 764.
Реджини (Reggini Horacio C). [1] Resolucion de sistemas de
ecuaciones lineales. Cienc. у teen., 1952, 125, № 628, 158—167; P. Ж. М.,
1959, 4245.
Редхеффер (Redheffer R.). [1] Errors in simultaneous linear equa-
equations. Quart. Appl. Math., 1948, 6. 342—343; M. R., 10, 152.
Рейерсёль (Reiersel O.). [1] A method for recurrent computation
of all the principal minors of a determinant, and its application in confluence
analysis. Ann. Math. Statistics,- 1940, 11, 193—198; M. R., 2, 61.
Рейх (Reich E.). [1] On the convergence of the classical iterative
method of solving linear simultaneous equations. Ann. Math. Statistics, 1949,
20, 448—451; M. R., 11, 136.
Рихтер (R i с h t e r Hans). [1] Bemerkung zur Norm der Inversen
einer Matrix. Arch. Math., 1954, 5, № 4—6, 447—448; P. Ж. М., 1956,
1054.
Ричардсон (Richardson L. E.). [1] A purification method for
computing the latent columns of numerical matrices and some integrals of
differential equations. Phil. Trans. Roy. Soc. London, Ser. A, 1950, 242,
439—491; M. R., 12, 133.
Риччи (Ricci L). [1] Confronto fra i metodi di Banachiewicz, Roma
e Volta per la risoluzione dei sistemi di equazioni algebriche lineari. Attl.
Aecad. naz. Lincet. Rend. Cl. sci. /is., mat. e natur. ser. 8, 1949, 7, 72—76:
M. R., 11, 743.
Рой (Roy S. W.). [1] A useful theorem in matrix theory. Proc. Amer.
Math. Soc, 1954, 5, 635—638; M. R., 16, 4.
Ролл (Rail L. В.). [1] Error bounds for iterative solutions of Fredholm
integral equations. Pacif. J. Math., 1955, 5, Suppl. № 2, 977—986; P. Ж. М.,
1957, 5178.
Рома (Roma M. S.). [1] II metodo dell'ortogonalizzazione per la riso-
risoluzione numerica dei sistemi di equazioni lineari algebriche. Rlcerca Set., 1946,
16, 309—312; M. R., 8, 171.
[2] II metodo dell'ortogonalizzazione per la risoluzione numerica dei sis-
sistemi di equazioni algebriche. Pubbllcazioni 1st. Appl. Calcolo, 1947, 189,
12 pp; M. R., 10, 574.
[3] Sulla risoluzione numerica dei sistemi di equazioni algebriche lineari
col metodo della ortogonalizzazione. Pubblicaztonl 1st. Appl. Calcolo, 1950,
283; M. R., 13, 691.
Poccep (Rosser J. Barkley). [1] A general iteration scheme for
soiving simultaneous equations. Bull. Amer. Math. Soc, 1950, 56, 176—177.
[2] A method o! computing exact inverses of matrices with integer coeffi-
coefficients. J. Res. Nat. Bur. Standards, 1952, 49, 349—353; M. R., 14, 1128.
642 ЛИТЕРАТУРА
[3] Rapidly converging iterative methods for solving linear equations.
Nat. Bur. Standards. Appl. Math. Ser., 1953, 29, 59—64; M. R., 15, 651.
Россе р, Хестинс, Каруш и Ланцош (Ros-ser J. В., Hes-
tenes M. R., Karuch W. and Lanczos C). [1] Separation of close
eigenvalues of a real symmetric matrix. J. Res. Nat. Bur. Standards, 1951,
47, № 4, 291-297; M. R., 14, 92.
Рот и Скотт (Roth J. P. and Scott D. S.). [1] A vector method
for solving linear equations and inverting matrices. J. Math, and Phys., 1956,
35, № 3, 312—317; P. Ж. М., 1958, 749.
Рубинштейн и Ратледж (Rubinstein' H. and Rut-
ledge Y. D.). [1] High order matrix computations on the Univac. Proc.
Assoc. Comput. Mach., 1952, 181—186; M. R., 14, 1019.
Руджьеро (Ruggiero R. J.). [1] Investigation of three methods
for solving the flutter equations and their relative merits. J. Aeronaut. Set.,
1946, 13, 3—22; M. R., 7, 338.
Ружичка (Ruzifika Miroslav). [1] Zkraceni iterauniho zpusobu
vypoutu systemu linearnich rovnic. Inzen. siavby, 1957, 5, № 9, 490—492,'
P. Ж. М., 1958, 8288.
Рутисхаузер (Rutishauser Heinz). [1] Beitrage zur Kenntnis
des Biorthogonalisierungs-Algorithmus von Lanczos. Z. angew. Math, und
Phys., 1953, 4, № 1, 35—56; P. Ж. М., 1953, 453.
[2] Der Quotienten-Differenzen-Algorithmus. Z. angew. Math, und Phys.,
1954, 5, № 3, 233—251; P. Ж. М., 1955, 5316.
[3] Anwendungen des Quotienten-Differenzen-Algorithmus. Z. angew.
Math, und Phys., 1954, 5, № 6, 496—503; P. Ж. М., 1956, 4926.
[4] Bestimmung der Eigenwerte und Eigenvektoren einer Matrix mit Hilfe
des Quotienten-Differenzen-Algorithmus. Z. angew. Math, und Phys.,
1955, 6, № 5, 387—401; P. Ж. М., 1956, 6862.
[5] Une methode pour la determination des valeurs propres d'une mat-
rice. С r. Acad. set., 1955, 240, № 1, 34—36; P. Ж. М., 1956, 4916.
[6] Der Quotlenten-Differenzen-Algorithmus. Mitt. Inst. angew. Math.
Eidgenoss. techn. Hochschule Zurich, 1957, № 7, 745; P. Ж. М., 1958, 760.
[7] Solution of eigenvalue problems with the LR-transformation. Nat.
Bur. Standards. Appl. Math. Ser., 1958, 49, 47—81; M. R., 19, 770.
[8] Zur Bestimmung der Eigenwerte schieisymmetrischer Matrizen. Z. Angew.
Math, und Phys., 1958, 9b, № 5—6, 586—590; P. Ж. М., 1959, 7482.
Рутисхаузер и Бауэр (Rutishauser Heinz et Bauer
Fried rich L.). [1] Determination des vecteurs propres d'une matrice par
une methode iterative avec convergence quadratique. C. r. Acad. sci., 1955,
210, № 17, 1680—1681; P. Ж. М., 1956, 4917.
Сабров и Хиггинс (Sabroff R. R. and Higgins T. J.).
[П A critical study of Kron's method of „tearing". Matrix Tensor Quart.,
1957, 7, 107—113; M. R., 19, 64.
Самсонов К. В. [1] Прибор для решения системы линейных алге-
алгебраических уравнений методом итерации. Прикл. матем. и механика, 1935.
2, 309—313.
Самокиш Б. А. [1] Исследование быстроты сходимости метода наи-
наискорейшего спуска. Успехи матем. наук, 1957, 12, № 1, 238—240.
CaMy9JCOH(Samuelson P. A.). [I] A method of determining
explicitly the coefficients of the characteristic equation. Ann. Math. Statistics,
1942, 13, 424—429; M. R., 4, 148.
[2] Efficient computation of the latent vectors of a matrix. Proc. Nat. Acad.
Set. U. S. A., 1943, 29, 393—397; M. R., 5, 161.
[3] A convergent iterative process. J. Math, and Phys., 1945, 24,
131—134.
[4] Solving linear equations by continuous substitution. Bull, Amer. Math.
Soc, 1950, 56, 159.
ЛИТЕРАТУРА 643
Саттерсуайт (Satterthwaite F. E.). [1] Error control in matrix
calculation. Ann. Math. Statistics, 1944, 15, 373—389; M. R., 6, 218.
Сауселл (Southwell R. V.). [1] Relaxation Methods In engine-
engineering Science, a Treatise on Approximate Computation. Oxford Univ. Press,
1940.
[2| Relaxation Methods In Theoretical Physics. Oxford Univ. Press., 1946.
Сейбл (Saibel Edward.). [1] A modified treatment of the iterative
method. J. Franklin Inst., 1943, 235, 163—166; M. R., 4, 148.
[2] A rapid method of inversion of certain types of matrices. J. Franklin
Inst., 1944, 237, 197—201; M. R., 5, 245.
Сейбл и Берджер (Saibel Edward and Berger W. J.). [1]
On finding the characteristic equation of a square matrix. Math. Tables and
Other Aids Comput., 1953, 7, № 49, 228—236; P. Ж. М., 1954, 5786.
Семендяев К. А. [1] О нахождении собственных значений и инва-
инвариантных многообразий матриц посредством итераций. Прикл. матем. и ме-
механика, 1943, 7, 193—222; М. R., 6, 51.
Серебрянников С. В. [1] О решении численных уравнений ме-
тадом итераций. Новочеркасск. Тр. инж. мелиорат. ин-та, 1939, 3,
168—172.
Синг (Synge J. L.). [1] A geometrical interpretation of the relaxa-
relaxation method. Quart. Appl. Math., 1944, 2, 87—89; M. R., 6, 50.
Синго (Shin go Takaichi). [1] An exact method of solving the
linear simultaneous equations with the principal diagonal coefficients and those
adjacent to them only. Trans. Japan soc. Civil. Engrs, 1954, № 19, 1—7;
P. Ж. М., 1956, 1681.
Синомия (Shinomiya Tetsuro). [1] Обращение матриц методом
последовательных приближений. Res. Repts Рас. Engng Glfu Prefect. Univ.,
1955, № 5, 5—10; P. Ж. М., 1958, 4252.
[2] Практический метод обращения матриц при помощи вычисления
определитей. Res. Repts Рас. Engng. Glfu Prefect. Univ., 1956,6, 1—6; P. Ж. М.,
1958, 4253.
[3] Some notes on the process of reversing a matrix. Proc. 5th Japan
Nat. Congr. Appl. Mech., 1955, Tokyo, 1956, 481—484; P. Ж. М., 1958, 10302.
Синомия и От и. [1] Несколько формул для обратных матриц. Trans.
Japan. Soc. Civil. Engrs, 1955, 24, 78—82; P. Ж. М., 1956, 7109.
С к от то (Sc-otto L. O.). [1] Sul calcolo ed affinamento delle carat-
teristiche delle vibrazioni dei sistemi elastici ad n gradi di liberta. Rend. 1st.
Lombardo scl. e lettere Cl. set. mat. e natur. Ser. 3, 1956, 21 (90), 89—106;
M. R., 18, 676.
Снайдер (Snyder James N.), [1] On the improvement of the so-
solutions to a set of simultaneous linear equations using the ILLIAC. Math.
Tables and Other Aids Comput., 1955, 9, № 52, 177—184; P. Ж. М., 1957, 2682.
Соколов (Sokoloff N. P.). [11 Sur l'application des determinants
superieurs a la resolution de certains systemes d'equations Hneaires. Ann. Soc.
Sclent. Bruxelles, Ser. I, 1937, 57, 60—66.
Станкевич (Stankiewicz L.). [1] Stir Ies operations arithmetiques
dans le calcul des inverses d'apres la methode de M. T. Banachiewicz. Bull,
intern. Acad. Polon. Scl. A., 1937, 363—376.
[2] Sur Ies methodes de Cesari et Kaczmarz relatives a la resolution de
systemes d'equations lineaires a l'aide d'approximations successives. Bull. In-
Intern. Acad. Polon. Scl. A, 1937, 521—529.
Стейн (Stein M.). [1] Gradient methods in the solution of systems of
linear equations. /. Res. Nat. Bur. Standards, 1952, 48, № 6, 407—413; M. R.,
14, 322.
[2] Determining the mode shapes and frequencies of low aspect ratio
multispar winks. J. Aeronaut. Set., 1955, 22, Ns 2, 137—138, P. Ж. М., 1958,
8237. '
644 ЛИТЕРАТУРА
Гтейн (Stein P.). [1] The convergence of Seidel iterants of nearly
symmetric matrices. Math. Tables and Other Aids Comput., 1951 5
237—239.
[2] A not§ on inequalities for the norm of a matrix. Amer. Math Mon-
Monthly, 1951, 58, 558—559; M. R., 13, 717.
[3] A note on bounds of mul.iple characteristic roots of a matrix / Res
Nat. Bur. Standards, 1952, 48, 59—60; M. R., 13, 813.
[4] A note on the bounds of the real parts of the characteristic roots of
a matrix. J. Res. Nat. Bar. Standards, 1952, 48, 106—108; M. R., 14, 8.
Стейн и Розенберг (Stein P. and Rosenberg R. L.). [1] On
the solution of linear simultaneous equations by iteration. J. London Math.
Soc, 1948, 23, 111—118; M. R., 10, 485.
Стерн (StearnJ. L.). [1] Iterative solutions of normal equations. Bull.
Geod., 1951, 331—339; M. R., 13, 990.
Стесин И.М. [1] Вычисление собственных значений при помощи не-
непрерывных дробей. Успехи машем, наук, 1954, 9, 191—198; Р. Ж. М., 1957,
4384.
Стоякович (Сто]аковий Мирко). [1] О неким поступцима за
решаванье система линеарних алгебарских )едначина. 36. Маш. фак. Ун-т
Београду, 1954—1955 A956), 19—27; Р. Ж. М., 1957, 8957.
Суиндлхерст (Swindlchurst Beverly). [1] On the solution
of simultaneous linear equations. Proc. Montana Acad. Sci, 1956, 16, 59—60;
P. Ж. М. 1959, 5220.
Сурьо (Souriau J. M.). [1] Une methode pour la decomposition
spectrale et l'inversion des matrices. C. r. Acad. sci., 1948, 227, 1010—1011;
M. R., 10, 348.
Сурьо и Боннар (Souriau J. M. et Bonnard R.). [1] Theorie
des erreurs en calcul matriciel. Rech. aeronaut., 1951, № 19, 41—48; M. R.,
12, 638.
Тага (Taga Y.). [1] О линейных вычислениях на автоматической
релейной вычислительной машине Института математической статистики.
Proc. Inst. Statist. Math., 1957, 5, № 1, 32—48; Р. Ж. М., 1958, 4251.
Таккер (Tucker L. R.). [1] The determination of successive principal
components without compuiation of tables of residual correlation coefficients.
Psychometrtka, 1944, 9, 149—153; M. R., 6, 51.
* Таккерман (Tuckerman L. В.). [1] On the mathematically sig-
significant figures in the solution of simultaneous linear equations. Ann. Math.
Statistics, 1941, 12, 307—316; M. R., 3, 154.
Тауски (T a u s s k у О 1 g a). [1] Bounds for characteristic roots of
matrices. Duke Math. J., 1948, 15, 1043—1044; M. R., 10, 501.
[2] A recurring theorem on determinants. Amer. Math. Monthly, 1949, 56,
672—676; M. R., 11, 307.
[3] Notes on numerical analysis. II. Notes on the condition of matrices.
Math. Tables and Other Aids Comput., 1950, 4, 111—112; M. R., 12, 361.
[4] Bounds for characteristic roots of matrices. II. J. Res. Nat. Bur. Stan-
Standards, 1951, 46, 124—125; M. R,, 13, 311.
Тауски и Тодд (Taussky Olga and Todd John). [1] Sys-
Systems of equations, matrices and determinants. Math. Mag., 1952, 26, 9—20,
71—78; M. R., 14, 715.
Темпл (Temple O.). [1] The general theory of relaxation methods
applied to linear systems. Proc. Roy. Soc. Ser. A., 1939, 169, 476—500. .
[2] The accuracy of Rayleigh's method of calculating the natural frequen-
frequencies ol vibrating systems. Proc. Roy. Soc. Ser. A, 1952, 211, 204—224; M.-R.,
13, 691.
ТернбуллиЭйткен-(ТигпЬиП H.W.and A.C.Aitken).
[1] An Introduction to the theory of canonical matrices. London, Blackie &
Son, Ltd, 1932.
ЛИТЕРАТУРА 545
Тернер (Тег пег L. R.). [1] Improvement in the convergence of
methods of successive approximation. Proc. Comput. Sem., Dec. 1949, N. Y. IBM
Corp., 1951, 135—137; M. R., 13. 586.
Террачини (Terracini Alessandro). [1] Un procedimento per
la risoluzione numerica dei sistemi di equazioni lineari. Rlc. tngegn., 1935, 3.
40—48.
Тодд (Todd J.). [1] The condition of certain matrices. I. Quart. J. Mech.
and Appl. Math., 1949, 2, 469—472; M. R., 11, 619.
[21 The condition of a certain matrix. Proc. Cambridge Philos. Soc, 1950,
46, 116—118; M. R., 11, 403.
[3] Experiments on the inversion of a 16X16 matrix. Nat. Bur. Standards.
Appl. Math. Ser., 1953, 29, 113—115; P. Ж. М., 1956, 3333.
[4] The condition of certain matrices. II. Arch. Math., 1954, 5, № 4—6,
249—257; P. Ж. М., 1956, 763.
[5] The condition of matrices. Proc, Internat. Congr. Math., 1954, 2, Am-
Amsterdam, 1954, 385—386; P. Ж. М., 1955, 4244.
[6] The condition of the finite segments of the Hilbert matrix. Nat. Bar.
Standards. Appl. Math. Ser., 1954, 39, 109—116; M. R., 16, 861.
[7] The condition of certain matrices. III. J. Res. Nat. Bur. Standards,
1958, 60, № 1, 1—7; P. Ж. М., 1958, 6217.
Тодоров (Todorow Marko). [1] Ober die iterative Behandlung
linearer Gleichungssysteme. Bautechnik, 1958, 35, № 4, 136—138; P. Ж. М.,
1959, 877.
Турецкий (Turetsky R.). [1] The least square solution for a set
of complex linear equations. Quart. Appl. Math., 1951, 9, 108—110; M. R.,
12, 641.
Тюринг (Turing A. M.). [1] Rounding-off errors in matrix pro-
processes. Quart. J. Mech. and Appl. Math., 1948, 1, 287—308; M. R., 10, 405.
(Есть перевод. Успехи матем. наук, 1951, 6, № 1, 138—162.)
Тэртон (Turton F. J.). [1] On the solution of the numerical simul-
simultaneous equations arisinq in the analysis of redundant structures. J. Roy-
Aeronaut. Soc, 1945, 49, 104—111; M. R., 6, 218.
Уагнер (Wagner Harvey M.). [1] A partitioning method of in-
inverting symmetric definite matrices on a card-programmei calculator. Math.
Tab'.es and Other Aids Comput., 1954, 8, № 47, 132—139, P. Ж. М., 1956,
3334.
Уилер и Наш (Wheeler D. J. and Nash J. P.). [1] Digital
computer methods for solving linear algebraic equations and finding eigen-
eigenvalues and eigenvectors. Digital and Analog Computers and Computing Me-
Methods. Symposium at the 18 th Appl. Mech. Dlv. Conf. of the Asme held at
the Univ. of Minnesota, June 18—20, 1953, N. Y. 1953, 21—35; P. Ж. М.,
1955, 1519.
Уилкинсон (Wilkinson J. N.). [1] The calculation of the latent
roots and vectors of matrices on the pilot model of the А. С. Е. Proc. Cam-
Cambridge Philos. Soc, 1954, 50, Ns 4, 536—566; P. Ж. М., 1955, 6108.
[2] The use of iterative methods for finding the latent roots and vectors
of matrices. Math. Tables and Other Aids Comput., 1955, 9, №52, 184—191;
P. Ж. М., 1957, 8965.
Уилкс (Wilkes M. V.). [1] Solution of linear algebraic and differen-
differential equations by the long-division algorithm. Proc. Cambridge Philos. Soc,
1956, 52, № 4, 758—763; P. Ж. М., 1957, 3524.
У л и г (U h 1 i g J.). [1] Untersuchung der Genauigkeit einer Reihe von Ver-
fahren zur Bestimmung von charakteristischen Zahlen und der Eigenvektoran
einer Matrix. Z. angew. Math, und Mech., 1957, 37, 7—8, 265; P. Ж. М.,
1959, 7486.
[2]. Uber ein inverses Eigenwertproblem. Z. angew. Math, und Mech.,
1958, 38, 7—8, 284; P. Ж. М., 1959, 5226. - -
646 ЛИТЕРАТУРА
Ульман (U 11 man J.)- [1] The probability of convergence of an itera-
iterative process of inverting a matrix. Ann. Math. Statistics, 1944, 15, 205—213;
M. R., 6, 51.
У майский A. A. [1] Курс строительной механики. 1935 г.
Унгер (Unger H.). [1] Orthogonalisierung von Matrizen nach
E. Schmidt und ihre praktische Durchfiihrung. Z. angew. Math, und Mech,
1951, 31, 53-54; M. R., 14, 692.
[2] Zur Auflosung umfangreicher linearer Qleichungssysteme. Z. angew
Math, und Mech., 1952, 32, 1—9; M. R.,14, 92.
[3] Zur Praxis der Biorthonormierung von Eigen-und-Hauptvektoren.
Z. angew. Math, und Mech., 1953, 33, 319—331; M. R., 15, 560.
[4] Ober direkte Verfahren bei Matrizeneigenwertproblemen. Wiss. Z. Techn.
Hochschule Dresden, 1952, 1953, 2, № 3, 449—456; P. Ж. М., 1958, 10298.
Уо (W a u g h F. V.). [1] A note concerning Hotelling's method of in-
inverting a partitioned matrix. Ann. Math. Statistics, 1945, 16, 216—217; M. R.,
7, 84.
[2] Inversion of the Leontief matrix by power series. Econometrica, 195Э,
18, 142—154; M. R, 12, 133.
Уо и Дуайр (Waugh F. V. and Dwyer P. S.). [1] Compact compu-
computation of the inverse of a matrix. Ann. Math. Statistics, 1945, 16, 259—271;
M. R., 7, 218.
Уокери Уэстон (Walker А. О. andWestonJ. D.). [1] Inclu-
Inclusion theorems for the eigenvalues of a normal matrix. J. London Math. Soc,
1949, 24, 28—31; M. R., 10,501.
Уэбб (WebbJoh n). [1] Matrices. 1. Electr. Rev., 1956, 159, № 6, 237—240.
[2] Matrices. II. Solution of simultaneous equations. Electr. Rev., 1956, 159,
№ 9, 397—400; P. Ж. М., 1958, 750.
Фабиан (Fabian Vaclav). [1] Zufalliges Abrunden und die Kon-
vergenz des linearen (seidelschen) Iterationsverfahren. Math. Nachr., 1957, 16,
№ 5—6, 265—270; P. Ж. М., 1958, 7203.
Фаддеев Д. К. [1] О преобразовании характеристического уравнения мат-
матрицы. Л., Тр. ин~та инж. пром. строит., 1937, № 4, 78—96.
[2] О некоторых последовательностях полиномов, полезных для построения
итерационных методов решения систем линейных алгебраических уравнений.
Вести. Ленингр. ун-та, 1958, № 7, 155—159; Р. Ж. М., 1959, 875. ц .
^ [3] К вопросу о верхней релаксации при решении систем линейных урав-
уравнений. Изв. высших учебн. заведений. Математика, 1958, № 5, 122—125;
Р. Ж. М, 1959, 5219.
[4] Об обусловленности матриц. Тр. Матем. ин-та АН СССР, 1959, 53,
387—391.
Фаддеев Д. К. и Фаддеева В. Н. [1] Вычислительные методы ли-
линейной алгебры. Тр. 3-го Всесоюзного матем. съезда, 1958, 3, 434—445.
Фаддеева В. Н. [1] Вычислительные методы линейной алгебры. Гос-
техиздат, 1950; М. R., 13, 872.
Фальк (F а 1 k Sigurd). [I] Ein ubersichtliches Schema fur die Matrizen-
multiplikation. Z. angew. Math, und Mech., 1951, 31, 152—153; M. R. 12, 751.
[2] Neue Verfahren zur direkten Losung des allgemeinen Matrizeneigen-
wertproblemes. Z. angew. Math, und Mech., 1954, 34, № 8/9, 289—291; P. Ж. М.,
1956, 761.
[3] Das Ersatzwertverfahren als Hilfsmittel bei der iterativen Bestimmung
von Matrizen-Eigenwerten. Abhandl. Braunschweig, wiss. Ges., 1956, 8,
99—110; P, Ж. М., 1958, 6219.
Фань Цюй (Fan К у). [1] Note on circular disks containing the eigen-
eigenvalues of a matrix. Duke Math- J., 1958, 25, 3, 441—445; P. Ж. М., 1959, 7485.
Фань Цюй и Гофман (Fan Ky and Hoffman A. J. [1] Lo-
Lower bounds for the rank and location of the eigenvalues of a matrix. Nat.
bur. Standards. Appl. Math. Ser., 1954, 39, 117—130; P. Ж. М., 1958, 5190.
ЛИТЕРАТУРА 647
Фарнелл (FarnellA. В.). [1] Limits for the characteristic roots of
a matrix. Ball. Amer. Math. Soc, 1944, 50, 789—794; M. R., 6, 113.
[2] Limits for the field of values of a matrix. Amer. Math. Monthly,
1945, 52, 488—493.
Феллер и Форсайт (Feller W. and Forsythe О. Е.). [1]
New matrix transformation for obtaining characteristic vectors. Quart. Appl.
Math., 1951, 8, 325—331; M. R., 12, 538.
Фельберг (Fehlberg E.). [1] Bemerkungen zur Konvergenz des
Iterationsverfahrens bei linearen Oleichungssystemen. Z. angew. Math, und
Mech., 1951, 31, 387—389; M. R., 13. ..990.
Фёттер (Voetter H.). [1] Ober die numerishe Berechung der Eigen-
werte von Sakulargleichungen. Z. angew. Math, und Phys., 1952, 3, 314—316;
M. R-, 14, 501.
Феттис (Fettis H.). [1] A method for obtaining the characteristic equa-
equation of a matrix and computing the associated modal columns. Quart. Appl.
Math., 1950, 8, 206—212; M. R., 12, 209.
Фидлер и Птак (Fiedler M. und Ptak V). [1] Ober die Kon-
Konvergenz des verallgemeinerten Seidelschen Verfahrens zur Losung von Syste-
men linearer Qleichungen. Math. Nachr.. 1956, 15, 31—38; P. Ж. М., 1959, 104, 84.
Филиповский (F i 1 i p о ws k у R.). [1] Numerical calculations in elec-
electrical engineering and electronics. I. Calculation of determinants of higher or-
order and the solution of simultaneous algebraic equations. J. Madras Inst. Tech.,
1952, 1, 64—88; M. R., 14, 692.
Фишбак (Fischbach Joseph W.). [1] Some applications of gra-
gradient methods. Proc. Sympos. Appl. Math., 6, New York — Toronto — London,
1956, 52—72; P. Ж. М., 1957, 5962.
Фишер и Фуллер (Fisher Michael E. and Fuller А. Т.). [11
On the stabilization of matrices and the convergence of linear iterative processes.
Proc. Cambridge Phllos. Soc, 1958, 54, 417—425; P. Ж. М., 1959, 8561.
Фландерс и Шортли (Flanders D. and Shortley Q.). [1]
Numerical determination of fundamental modes. J. Appl. Phys., 1950, 21,
5326—1332; M. R., 12, 640.
Фломенхофт (Flomenhoft ii. i.). [1] A method for determining
mode shapes and frequencies above the fundamental by matrix iteration. J. Appl.
Mech., 1950, 17, 249—256; M. R., 12, 287.
Фокс (Fox L.). [1] Some improvements in the use of relaxation me-
methods for the solution of ordinary and partial differential equations. Proc. Roy.
Soc. Ser. A, -1947, 190, 31—59.
[2] A short account of relaxation methods. Quart. J. Mech. and Appl. Math.,
1948, 1, 253—280; M. R., 10, 574.
[3] Practical methods for the solution of linear equations and the inversion
of matrices. J. Roy. Statist. Soc. Ser. В., 1950, 12, 120—136; M. R., 12, 538.
[4] Escalator methods for latent roots. Quart. J. Mech. and Appl. Math.,
1952, 5, 178—190; M. R., 14, 92.
[5] Practical solution of linear equations and inversion of matrices. Nat. Bur.
Standards. Appl. Math. Ser., 1954, 39, 1—54; P. Ж. М., 1957, 8956.
Фокс, Хаски и Уилкинсон (Fox L., Huskey H. D. and
Wilkinson F. H.). [1] Notes on the solution of algebraic linear simulta-
simultaneous equations. Quart. J. Mech. and Appl- Math., 1948, 7, 149—173; M. R.,
10, 152. (Есть перевод. Успехи матем. наук, 1950, 5, № 3, 60—86.)
Фокс и Хейс (Fox L. and Hayes J. О.). [1] More practical
methods for the inversion of matrices. J. Roy. Statistics Soc. Ser. В., 1951,
13, 83-91; M. R., 13, 990.
"Фор, Симон-Су исс и Рона (F a u г е О., S i m о n-S и i s s e J. et
Rona Th.). [1] Deux circuits analogiques pour l'inversion des matrices symet-
riques et la recherche de la vitesse critique de flutter. Proc. Seventh. Internat.
Congress Appl. Mech., 1948, 4, 81—95; M. R., 11, 403.
648 ЛИТЕРАТУРА
Ф орсайт (Forsy th е О. Е. ). [1] Gauss to Oerling on relaxation.
Math. Tables and Other Aids Comput., 1951, 5, 255—258.
[2] Alternative derivations of Fox's escalator formulae for latent roots.
Quart. J. Mech. and Appl. Math., 1952, 5, 191—195; M. R., 14, 92.
[3] Tentative classification of methods and bibliography on solving systems
of linear equations. Nat. Bur. Standards. Appl. Math. Ser., 1953, 29, 1—28:
M. R., 15, 164.
[4] Solving linear algebraic equations can be interesting. Bull. Amer. Math.
Soc, 1953, 59, № 4, 299—329; P. Ж. М., 1954, 3840.
Форсайт и Лейблер (Forsythe Q. E. and L e i b 1 e r R. A.). [1]
Matrix inversion by a Monte Carlo method. Math. Tables and Other Aids
Comput., 1950, 4, 127—129; M. R., 12, 361.
Форсайт и Моцкин (Forsythe Q. E. and Motzkin T. S.).
[1] Asymptotic properties of the optimum gradient method. Bui. Amer. Math.
Soc, 1951, 57, 183.
[2] Acceleration of the optimum gradient method. Bui. Amer. Math. Soc,
1951, 57, № 4> 304.
[3] An extension of Gauss'transformation for improving the condition of
systems of linear equations. Math. Tables and Other Aids Comput., 1952,
6, 9—17; M. R., 13, 991.
Форсайт и Страус (Forsythe G. E. and Straus Ernst G.).
[1] On best conditioned matrices. Proc. Internat. Congr. Math., 1954, 2, Am-
Amsterdam, 1954, 102—103; P. Ж. М., 1956/ 2791.
[2] On best conditioned matrices. Proc. Amer. Math. Soc, 1955, 6, № 3,
340—345; P. Ж. М., 1956, 7882.
Форсайт и Страус (Forsythe G. E. and Straus LouseW.).
[1] The Souriau-Frame characteristic equation algorithm on a digital compu-
computer. /. Math, and Phys., 1955, 34, № 3, 152—156; P. Ж. М., 1957, 900.
Форсайт и Форсайт (Forsythe A. I. and Forsythe G. E.).
[1] Punched-card experiments with accelerated gradient methods for linear
equations. Nat. Bur. Standards. Appl. Math. Ser., 1954, 39, 55—69; P. Ж. M._
1958, 10296.
Форсайт, Хестинс иРоссер (Forsythe G.E., HestenesM. R.
and Rosser J. B.) [1] Iterative methods for solving linear equations. Bui.
Amer'. Math. Soc, 1951, 57, 480.
Франк (Frank W. L). [1] Computing eigenvalues of complex mat-
Vices by determinant evaluation and by methods of Danilewski and WielandL
J. Soc. Indust. and Appl. Math., 1958, 6, № 4, 378—392.
Франке (Franckx Ed.). [1] Resolution pratique des systemes line-
aires par la methode des matrices de relaxation. Bull. Soc roy. set. Liege,.
1957, 26, № 7—12, 390—395; P. Ж. М., 1959, 3242.
Фрёберг (Frdberg Carl-Eric). [1] Solutions of linear systems
of equations on a relay machine. Nat. Bur. Standards. Appl. Math. Ser.,
1953, 29, 39—42; P. Ж. М., 1956, 3331.
Фрезер (Frazer R. A.). [1] Note on the Morris escalator process
for the solution of.linear simultaneous equations. Philos. Mag., 1947, G) 38,
287—289; M. R., 9, 250.
[2] Some problems in aerodynamics and structural engineering related
to eigenvalues. Nat. Bur. Standards. Appl. Math. Ser., 1953, 29, 65—74; M. R.,
15, 164.
Фрезер, Дункан и Коллар (Frazer R. A., Duncan W. J. and
Collar A. R.) [1]. Elementary matrices and some application to dynamics
and differential equations. 1946; M. R., 8, 365. (Имеется перевод. Теория
матриц и ее приложения к дифференциальным уравнениям и динамике.
Изд. иностр. литер., Москва, 1950.)
[2]. Elementary Matrices. Oxford Univ. Press, 1951-
ЛИТЕРАТУРА 64{>
Фрейм (Frame J. S.). [1] A simple recursion formula for inverting
a matrix. Bull. Amer. Math. Soc, 1949, 55, 1045.
Фрейре (Freire Remy). [1] A matricial method for the solution of
certain systems of linear equations. Soc. Parana Mat Anuarlo, 1956, 3, 54—59.
Фридрих и Енйе (Friedrich К. und Jenne W.). [1] Geometrischan-
schauliche Auflosung linearer mit Nullkoeffizienten ausgestatteter Gleichungs-
systeme. Deutsche Akad. Wiss. Berlin. Veroff. Geodnt. Inst. Potsdam, 1951,
5, 68; M. R., 13, 387.
Фриман (Freeman G. F.). [1] On the iterative solution of linear
simultaneous equations. Phllos. Mag., 1943, G), 34, 409—416; M. R., 5, 50.
Фрухтер (Fruchter В.), [1] Note on the computation of the in-
inverse of a triangular matrix. Psychometrlka, 1949, 14, 89—93; M. R., 11, .403.
ФУРУЯ (Furuya Shigeru). [1] Methods of numerical calculation for
simultaneous linear equations and inverse matrices. Sugaku, 1957/1958, 9,
240—249; M. R., 20, 1406.
Халлерт (Hallert В.). [1] Ober einige Verfahren zur L0sung von
Normalgleichungen. Z. Vermessungswesen, 1943, 72, 238—244; M. R., 8, 171.
Хаммерсли (Hammersley J. M.). [1] The numerical reduction
of nonsingular matrix pencils. Phllos. Mag., 1949, G) 40, 783—807; M. R.,
11, 464.
Харман (Harman Harry H.). [1] The square root method and
multiple group methods of factor analysis. Psychometrlka, 1954, 19, 39—55^
M. R., 16, 177.
Хаусхольдер (Householder Alston S.). [1] Some numerical
methods for solving systems of linear equaiions. Amer. Math. Monthly, 1950,
57, 453—459; M. R., 12, 538.
[2] Errors in iterative solution of linear systems. Proc. Assoc. Comput.
Mach. Meeting at Toronto, Ont., 1952, Sept. 1953, 30—33; P. Ж. М., 1954,
5263.
[3] Principles of numerical analysts. McGraw-Hill Book Co., 1953;
M. R., 15, 470. (Имеется перевод. Основы численного анализа. Изд. иностр.
литер., Москва, 1956.)
[4] The geometry of some iterative methods of solving linear systems.
Nat. Bur. Standards. Appl. Math. Ser., 1953, 29, 35—37; P. Ж. М., 1956,
3157.
[5] On norms of vectors and matrices. Oak Ridge Nat. Lab. Oak. Ridge
Tenn. Rep. ORNL 1756, 1954, 18 pp.; P. Ж. М., 1957, 6855.
[6] Terminating and nonterminating iterations for solving linear systems.
/. Soc. Industr. and Appl. Math., 1955, 3, № 2, 67—72; P. Ж. М., 1958, 1593.
[7] On the convergence of matrix iterations. /. Assoc. Comput Machi-
Machinery, 1956, 3, № 4, 314—324; P. Ж. М., 1958, 6211.
[8] A survey of some closed methods for inverting matrices. J. Soc. In-
Industr. and Appl'. Math., 1957, 5, 155—169; M. R., 19, 982.
[9] A class of methods for inverting matrices. /. Soc. Indust. and AppL
Math., 1958, 6, № 2, 189—195.
[10] The approximate solution of matrix problems. /. Assoc. Comput.
Machinery, 1958, 5, № 3, 205—243.
[11] Generated error in rotational tridiagonalization. J. Assoc. Comput.
Machinery, 1958, 5, № 4, 335—338.
[12] Unitary triangularization of a nonsymmetric matrix. /. Assoc. Comput.
Machinery, 1958, 5, № 4, 339—342.
Хед и Оултон (Head Y. W. and Oulton G. M.). [1] The
solution of ill-conditioned linear simultaneous equations. Aircraft Engng, 1958,.
30, 356, 309—312; M. R., 20, 343.
Хейнрих (Heinrich Helmut). [1] Bemerkungen zu den Verfah-
Verfahren von Hessenberg und Voetter. Z. angew. Math, und Mech., 1956, 36,
250—252; P. Ж. М., 1959, 7481.
•650 ЛИТЕРАТУРА
[2] Zur Eingrenzung der charakteristischen Zahlen einer beliebigen
Matrix. Technik, 1958, 13, № 2, 82—86; P. Ж. М., 1958, 9264.
Хейс и Виккерс (Hayes J. О. and Vickers Т.). [1] The fitting
of polynomials to unequally-spaced data. Philos. Map., 1951, G) 42
1387—1400; M. R., 13, 990.
Хеллер (Heller J.). [1] Ordering properties of linear successive
iteration schems applied to multi-diagonal type linear systems, J. Soc. In-
dustr. and Appl. Math., 1957, 5, 238—243; M. R., 19, 1080.
Хенричи (Henrici P.). [1] On the speed of convergence of cyclic
and quasicyclic Jacobi methods for computing eigenvalues of Hermitian mat-
matrices. J. Soc. Industr. and Appl. Math., 1958, 6, № 2, 144—162; M. R., 20, 343.
[2] The quotient-difference algorithm. Nat. Bur. Standards. Appl. Math.
Ser., 1958, 49, 23—46; M. R., 20, 233.
Херцбергер (Herzberger M.). [1] The normal equations of the
method of least squares and their solution. Quart. Appl. Math., 1949, 7,
217—223; M. R., 11, 57.
Херцбергер и Моррис (Herzberger M. and Morris R. H.).
[1] A contribution to the method of least squares. Quart. Appl. Math., 1947,
5, 354-357; M. R., 9, 210.
Хестинс (Hestenes Magnus R.). [1] Determination of eigenvalues
and eigenvectors of matrices. Nat. Bur. Standards. Appl. Math. Ser., 1953,
29, 89-94; P. Ж. M., 1956,-6863.
[2] Iterative computational methods. Communic. Pure and Appl. Math.,
1955, 8, 8595; M. R., 16, 863.
[3] The conjugate-gradient method for solving linear systems. Proe.
Sympos. Appl. Math., 6., New York — Toronto — London, 1956, 83—102;
P. Ж. М., 1959, 878.
[4] Inversion of matrices by biorthogonalization and related results.
J. Soc. Industr. and Appl. Math., 1958, 6, 51—90.
Хестинс иКаруш (Hestenes Magnus R. and К а г u s h W.).
[1] A method of gradients for the calculation of the characteristic roots and
vectors of a real symmetric matrix. J. Res. Nat. Bur. Standards, 1951, 47,
45—61; M. R., 13, 283.
Хестинс и Штифель (Hestenes Magnus R. and Stie-
f e 1 Eduard). [1] Methods of conjugate gradients for solving linear systems.
J. Res. Nat. Bur. Standards, 1952 A953), 49, 409—436; P. Ж. М., 1956, 7645.
Хехт (Н е с h t Josef). [1] Poznamka k reseni soustav algebraickych
linearnich rovnic. Aplikace mat., 1958, 3, 233—237; P. Ж. М., 1959, 5217.
Хлодовский И. Н. [1] К теории общего случая преобразования
векового уравнения методом акад. А. Н. Крылова. ИАН ОМЕН, 1933, 8,
1077-1102.
Хол (Н о е 1 Р. О.). [1] The errors involved in evaluating correlation
determinants. Ann. Math. Statistics, 1940, 11, 58—65.
[2] On methods of solving normal equations. Ann. Math. Statistics,
1941, 12, 354—359; M. R., 3, 154.
Хольдт (Holdt Richard Elton). [1] An iterative procedure
for the calculation of the eigenvalues and eigenvectors of a real symmetric matrix.
J. Assoc. Comput. Machinery, 1956, 3, № 3, 223—238; P. Ж. М., 1957, 8966.
Хольцер и Мелан (Holzer L. und Melan E.). [1] Ein Bei-
trag zur AuflOsung linearer Gleichungssysteme mit positiv definiter Matrix
mittels Iteration. Akad. Wiss. Wien, S.-B. Ha, 1942,151, 249—254; M. R., 8, 407.
Хорви (Horvay Q. ). [1] Solution of large equation systems and
eigenvalue problems by Lanczos' matrix iteration method. Gen. Electr. Co.,
Knolls Atomic Power Lab. Schenectady, N. Y., Rept., 1953, № KAPL-1004,
113 pp; P. Ж. М., 1957, 8958.
Хорст (Horst Paul). [1] A method for determining the coefficients
of a characteristic equation. Ann. Math. Statistics, 1935, 6, 83—84.
ЛИТЕРАТУРА 651
XoTe'flflHHr-(Hotelling H.). [1] Analysis of a complex of sta-
statistical variables into principal components. J. Educ. Phys., 1933, 24, 417—441,
498-520.
[2]. Simplified calculation of principal components. Psychometrlka, 1936,
1, 27—35.
[3] Some new methods in matrix calculation. Ann. Math. Statistics, 1943,
14, 1—34; M. R., 4, 202.
[4] Further points on matrix calculation and simultaneous equations. Ann.
Math. Statistics, 1943, 14, 440—441; M. R., 5, 245.
[5] Practical problems of matrix calculation. Proc. Berkeley Symp. Math.
Stat. Prob., 1945, 1946, 275—293; M. R., 10, 574.
Xy б л а. ров а С. Л. [1]K вопросу о механизации решения больших
систем нормальных уравнений. Сб. реф. Центр, н.-и. ин-та геод. аэро-
аэросъёмки и картогр., 1954, № 1, 15—16; Р. Ж. М., 1958, 8286.
Цурмюль (Zurmuhl R.). [1] Das Eliminationsverfahren von Gauss
zur Auflosung linearer Qleichungssysteme. Ber. Inst. Prakt. Math., Т. Н. Darm-
Darmstadt, Prof. Dr. A. Walther, Z. W. B. Unters. u. Mitt., 1944, 774, 11—14.
[2] Zur numerischen Auflosung linearer Qleichungssysteme nach dem
Matrizenverfahren von Banachiewicz. Z. angew. Math, und Mech., 1949, 29,
76—84; M. R., 10, 743.
[3] Matrizen. Berlin—Oottingen — Heidelberg, 1950; M. R., 12, 73.
[4] Zur Iteration einzelner Eigenwerte von Matrizen. Z. angew. Math, und
Mech., 1957, 37, № 5—6, 228; P. Ж. М., 1958, 1597.
Чанселлор, Шелдон и Татум (Chancellor Justus, She-
Sheldon J. W. and Tatum Q. L.). [1] The solution of simultaneous linear
equations using the IBM Card-Programmed Electronic Calculator. Proc. Indus.
Comput. Sem., N. Y., IBM Corp., 1951, 57—61; M. R., 13, 587.
Чезари (Cesari Lambert o). [1] Sulla risoluzione dei sistemi di
equazioni lineari, per approssimazioni sucessivi. Atti Acad. naz. Lincei, Rend.
Ser. 6, 1937, 25, 422—428.
[2'] Sulla risoluzione dei sistemi di equazioni lineari per approssimazioni
successive. Estratta delta Rass. Poste, Telegr. e Telef., 1937, 4, 37.
Черенков Ф. С. [1] О решении систем линейных уравнений мето-
методом итерации. Машем, сб., 1936, 1 D3), № 6, 953—958.
Чжао-Фан-Сюн (С h а о F. Н.). [1] A gradient method for solving
simultaneous equations. Ada math, sinica, 1953, 3, 328—342; M. R. 17, 194.
[2] Конечно-разностный метод для решения систем линейных алгебраи-
алгебраических уравнений. Ada math, sinica, 1955, 5, № 2, 149—159; Р. Ж. М.,
1957, 8264.
[3] Метод табулирования для решения системы линейных алгебраических
уравнений. Chinese J. Civil Engng, 1956, 3, № 4, 463—474; Р. Ж. М., 1957, 8267.
[4] Сравнение градиентных методов. Ada math, sinica., 1957, 7, № 1,
63—78; Р. Ж. М., 1958, 10295.
Чженьи Уиллоуби (ChenT.C. and WilloughbyR. A.). [1]
A note on the computation of eigenvalues and vectors of Hermitean matrices.
IBM J. Res. and Developm., 1958, 2, № 2, 169—170; P. Ж. М., 1959,-5230.
Чжоу (Chow C). [1] Gradual developing method. Bull. Ge'od., 1951,
221-229; M. R., 13, 496.
Чикала (Cicala P.). [1] Determination of modes and frequencies above
the fundamental by matrix iteration. J. Aeronaut. Sci., 1952, 19, 719—720;
M. R., 14, 587.
Чиммино (Cimmino Qianfranco). [1] Calcolo approssimato per
resolimoni dei sistemi di equazioni lineari. Rtcerca Scien. Roma, B), 1938,
9, 326—333.
Шанкс (Shanks Daniel). [1] On analogous theorems of Fredholm
and Frame and on the inverse of a matrix. Quart. Appl. Math., 19i>§> 13,
95—98; P. Ж. М., 1957, 8270.
652 ЛИТЕРАТУРА
Шварц (Schwarz H. R.). [1] Ein Verfahren zur Stabilitatsfrage bei
Matrizen-Eigenwertproblemen. Z. angew. Math, und Phys., 1956, 7, 473—5Э0;
M. R., 18, 676.
Шерман (Scherman Jack). [1] Computations relating to inverse
matrices. Nat. Bur. Standards. Appl. Math. Ser., 1953, 29, 123—124; P. Ж. М.,
1956, 6150.
Шерман и Моррисон (Sherman J. and Morrison W. S.).
[1] Adjustment of an inverse matrix corresponding to a chang in one element
of a given matrix. Ann. Math. Statistics, 1950, 21, 124—127; M. R., 11, 693.
Шмейдлер (Schmeidler W.). [1] Vortrage ttber Determinant en
und Matrlzen mlt Anwendungen In Physlk and Technik. Berlin, 1949.
Шмидт (Schmidt R. J.) [1] On the numerical solution of linear
simultaneous equations by an iterative method. Phllos. Mag., 1941, G) 32,
369—383; M. R., 3, 276.
Шмитмайер (Schmidtmayer Josef). [1] Ober die Auflosung
des Systems linearer algebraischer Qleichungen mit komplexen Koeffizienten.
Z. angew. Math, und Mech., 1958, 38, 74—77; M. R., 19, 1080.
Шмидтмайер и Майер (Schmidtmayer Josef a Mayer
Daniel). A] Vyhodne feseni linearnich problemu v oboru komplexnich Cisel.
S'aboproudy obzor, 1958, 19, № 7, 472—477; P. Ж. М., 1959, 4246.
Шмульян Ю. Л. [1] Замечание по поводу статьи Ю. М. Гаврилова
„О сходимости итерационных процессов". Изв. АН СССР, сер. машем., 1955,
19, № 2, 191; Р. Ж. М., 1956, 5507.
Шнейдер (Schneider Hans). [1] Regions of exclusion for the
latent roots of a matrix. Proc. Amer. Math. Soc, 1954, 5, № 2, 320—322;
P. Ж. М., 1956, 760.
Шоу (Shaw T. S.) [1] An Introduction to relaxation methods.
N. Y. Dover, 1953, 396 pp.; M. R. 15, 353.
ШперльCроег1 Ch. A.). [1] A fundamental proposition in the solu-
solution of simultaneous linear equations. Trans. Actuar. Soc. Amer., 1943, 44,
276—288; M. R., 5, 161.
[2] On solving simultaneous linear equations. Trans. Actuar. Soc. Amer.,
1944, 45, 18—32, 67—69; M. R., 6, 50.
Шредер (Schroder Johann). [1] Elne Bemerkung zur Konvergenz
der Iterationsverfahren fur lineare Qleichungssysteme. Arch. Math., 1953, 4,
№ 4, 322-326; P. Ж. M.,1954, 4191.
[2] Neue Fehlerabschatzungen fur verschiedene Iterationsverfahren. Z. an-
angew. Math, und Mech., 1956, 36, № 5—6, 168—181; P. Ж. М., 1957, 1827.
Шрейдер Ю. A. [1] Решение системы линейных совместных алгебраи-
алгебраических уравнений. Докл. АН СССР, 1951, 76, 651—654; М. R., 12, 639.
Штифель (Stiefel Е.). [1] Ober einige Methoden der Relaxations-
rechnung. Z. angew. Math, und Phys., 1952, 3, 1—33; M. R., 13, 874.
[2] Zur Interpolation von tabellierten Funktionen durch Exponentialsuramen
und zur Berechnung von Eigenwerten aus den schwarzschen Konstanten.
Z. angew. Math, und Mech., 1953, 33, № 8—9, 260—262; P. Ж. М., 1954,
4195.
[3] Some special methods of relaxation technique. Nat. Bur. Standards.
Appl. Math. Ser, 1953, 29, 43—48; P. Ж. М., 1956, 7643.
[4] Ausgleichung ohne Aufstellung der Qausschen Normalgleichungen.
Wiss. Z. Techn. Hochschule Dresden, 1953, 2, 441—442; M. R., 16, 1155.
[5] Relaxationsmethoden bester Strategie zur Losung linearer Qleichungs-
Qleichungssysteme. Comment, math, helv., 1955, 29, 157—179; P. Ж. М., 1956, 7644.
[6] Kernel polynomials In linear algebra and their numerical applica-
applications. Four lectures on solving linear equations and determining eigenvalues,
Nat. Bur. Standards, Washington, 1955, 52 pp.; M. R., 17, 790.
[7] Kernel polinomials in linear algebra and their numerical applications.
Nat. Bur. Standards. Appl. Math. Ser., 1958, 49, 1—22; M. R., 19, 1080.
ЛИТЕРАТУРА 553
Шур (Schur- J.). [1] Ober Potenzreihen, die im Inneren des Einheits-
kreises beschrankt sind. /. retne und angew. Math., 1917, 147, 205—232.
Шура-Бура М. P. [1] Оценка погрешностей при вычислении обрат-
обратной матрицы для матрицы высокого порядка. Успехи машем, наук 19^1 fi
№ 4, 121—150; М. R., 13, 284. „
3repBapii(EgerwaryJen6). [I] Ober die Faktorisation von Matri-
zen und ihre Anwendung aui die Lusting von liriearen Gleichungssystemen
Z. angew. Math, und Mech., 1955, 35, № 3, 111—118; P. Ж. М., 1956, 6389'.
[2] Az inverz matrix altalanositasa. Magyar tud. akad. Mat. kutatd ini
kozl., 1956, 1, № 3, 315—324; Р.-Ж. M., 1959, 3513.
[3] Regi es uj modszerek linearis egyenletrendszerek megoldasara. Magyar
tud. akad. Mat. kutatd Int. kozl, 1956, 1, 1—2, 109—123; P. Ж. М., 1959, 7479.
[4] Uber eine Veralgemeinerung der Purcellschen Methode ztir Aufiosung
linearer Qleichungssysteme. Osterr. Ingr.-Arch., 1957, 11, 4, 249—251; P. Ж М
1959, 5216. ' "
Эйземан (Eisemann Kurt). [1] Removal of ill-conditioning for mat-
matrices. Quart. Appl. Math., 1957, 15, № 3, 225—230; P. Ж. М., 1958, 6216.
Эйзен (Eisen Axel.). [1] Beitrag zur Losung linearer Gleichungen
Internat. Vereinlg. Bracken, und Hochban., 1935, 3, 56—66.
Эйткен (Aitken A.), [lj On Bernoullis numerical solution of algebraic
equations. Proc. Roy. Sec. Edinburgh, 1926, 46, 289.
[2] Further numerical studies in algebraic equations and matrices. Proc
Roy. Soc. Edinburgh, 1931, 51, 80.
[3] On the evaluation of determinants, the formation of their adjugates,
and the practical solution of simultaneous linear equations. Proc. Edinburgh
Math. Soc, II, 1933, 3, 207—219.
[4] Studies in practical mathematics. I. The evaluation with applications,
of a certain triple product matrix. Proc. Roy. Soc. Edinburgh, 1937, 57, 172—181.
[5] Studies in Practical Mathematics. II. The evaluation of the latent roots
and latent vectors of a matrix. Proc. Roy. Soc. Edinburgh, Set. A., 1936, 1937,
57, 269—304.
[6] Studies in practical mathematics. V. On the iterative solution of
a system of linear equations. Proc. Roy. Soc. Edinburgh, Ser. A, 1950, 63,
52—60; M. R., 12, 56.
[7] Determinants and matrices. 9 th ed. Edinburgh—London, Oliver and
Boyd; New York, Interscience, 1956, vii, 144 pp.; P. Ж. М., 1957, 6159.
Юргенс (Jtirgens E.). [1] Zur Aufiosung linearer Qleichungssysteme
und numerischen Berechnung von Detertnlnanten. Festgabe. Aachen Palm., 1886.
Якоби (Jacobi С. О. J.). [1] Ueber eine neue Auflosungsart der bei
der Methode der kleinsten Quadrate vorkommenden linearen Qleichungen.
Astr. Nachr., 1845, 22, № 523, 297—306; Jacobis Werke 3, 467.
Ян (J a h n H. A.). [1] Improvement of an approximate set of latent roots
and modal columns of a matrix by methods akin to those of classical perturba-
perturbation theory. Quart. J. Mech. and Appl. Math., 1948, 1, 131—144; M. R., 10, 152.
Янг (Joung David). [1] On Richardson's method for solving linear
systems with positive definite matrices. /. Math, and Phys., 1954, 32, 243—255;
P. Ж. М., 1954, 5782.
[2] Iterative methods for solving partial difference equations of elliptic type.
Trans. Amer. Math. Soc, 1954, 76, № 1, 92—111; P. Ж. М., 1955, 4, 1953.
13] On the solution of linear systems by iteration. Proc. Sympos. Appl.
Math., 6, New York — Toronto — London, 1956, 283—298; P. Ж. М., 1957, 5961.
654 ДОПОЛНИТЕЛЬНАЯ ЛИТЕРАТУРА
ДОПОЛНИТЕЛЬНАЯ ЛИТЕРАТУРА
Анзорге (Ansorge R.). [1) Ober ein Iterationsverfahren von G.
Schulz zur Ermittlung der Reziproken einer Matrix. Z. angew. Math, u.ii
Mech., 1959, 39. № »!it 164—165.
[2] Bemerkungen zu einem Iterationsverfahren von Bodewig zur Auflosung
linearer Gleichungsysteme. Z. angew. Math, und Mech., 1959, 39, № 3/4, 165.
[3] Das Hertwigsche Iterationsverfahren zur Aufldsung linearer Gleichungs-
systeme als Gesamt-und Einzelschrittverfahren. Z. angew. Math, und Mech.,
1959, 39, № 5 6i 248—249.
Бауэр (Bauer Fridrich L.). [9] Sequential reduction to trldiagonal
form. J. Soc. Industr. and Appl. Math., 1959, 7, № 1, 107—113.
Бейкер (Baker George A.). [1] A new derivation of Newtons ¦
identities and their application to the calculation of the eigenvalues of a matrix.
J. Soc. Industr. and Appl. Math., 1959, 7, № 2, 143—148.
Бессмертных Г. А. [1] Об одновременном отыскании двух соб-
собственных чисел самосопряженного оператора. Докл. АН СССР, 1959, 128,
№ 6, 1106—1109.
Браун (Brown J.). [1] Propagation in coupled transmission line sys-
systems. Quart. J. Mech. and Appl. Math., 1958, 11, 236—243.
Брёдер и Смит (Broeder George G. and Smith Harry J.).
[1] A property of semi-definite Hermitian matrices. J. Assoc. Comput. Machi-
Machinery, 1958, 5, № 3, 244—245.
Вильсон (Wilson L. В.). [1] Solution of certain large sets of equations
on Pegasus using matrix methods. Comput. J., 1959, 2, № 3, 130—133.
Вилф (Wilf Herberts.). [1] Matrix inversion by the annihilation
of rank. J. Soc. Industr. and Appl. Math., 1959, 7, № 2, 149—151.
В инн (W у n n P.). [1] A sufficient condition for the instability of the
tf-rf-algorithm. Namerische Math., 1959, 1, № 4, 203—207.
[2] On the propagation of error in certain non-linear algorithms. Name-
Namerische Math., 1959, 1, № 3, 142—149.
Ган (Gun G.). [1] Limits for the characteristic roots of a matrix. I.
Advancement in Math., 1958, 4, 450—456; M. R., 20, 6, 3893.
Гольдбаум Я. С. [1] К преобразованию векового уравнения. Прикл.
матем. и механика, 1958, 22, № 4, 539—541.
Гринспан (Greenspan Donald). [2] On popular methods and
^extent problems in the solution of polynomial equations. Math. Mag., 1958, 31,
№ 5, 239—253; P. Ж. М., 1959, 8572.
Дюк (Duck W.). [1] Eine Fehlerabschatzung zum Einzelschrittverfahren:
bei linearen Gleichungssystemen. Numerische Math., 1959, 1, № 1, 73—77.
Катхил и Варга (Cuthill Elizabeth H. and Varga
Richard S.). [1] A method of normalized block iteration. J. Assoc. Comput.
Machinery, 1959, 6, № 2, 236—244.
Ланцош (Lanczos C). [10] Linear systems in self-adjoint form
Amer. Math. Monthly, 1958, 65, № 9, 665—679.
Лоткин (Lotkin Mark). [4] Note on the method of contractants
Amer. Math. Monthly, 1959, 66, № 6, 476—479.
[5] Determination of characteristic values. Quart. Appl. Math., 1959, 17, № 3,
Мак-Гинн (McGinn Laurence C.) [1] The matrix math com-
compiler. J. Franklin Inst., 1957, 264, № 5, 415—416; P. Ж. М., 1959, 11619.
Манайра (Manaira Mario). [1] L'inversione delle matrici con
L'UNIVAC. Idee e stst., 1958, № 24—25, 9—11; P. Ж. М., 1959, 8562.
M a p а т x e (C. R. M a r a t h e). [1] Note on soms semimoduli of a rec-
rectangular matrix. Amer. Math. Monthly, 1958, 65, № 4, 259—263.
Мирский (Mirsky L.). [3] On the minimization of matrix norms.
Amer Math. Monthly, 1958, 65, № 2, 106—107; P. Ж. М., 1959, 8823.
-" ДОПОЛНИТЕЛЬНАЯ ЛИТЕРАТУРА 655'
[4] Diagonal elements of ortogonal matrices. Amer. Math Monthly 1959, 66r
№ 1, 19^22.
Монжаллон (Monjallon Albert.). [1] Initiation аи calcul
matriciel. Matrices. Determinants. Applications a I'algebre et a la geomitrle
analytique. Paris, Librairie Vuibert, 1955, 131 pp; P. Ж. М., 1959, 8834.
Мостовский и Штарк (Mostowski An'drze'j a Stark
Marcel i). [1] Algebra liniowa (Bibliot. mat., 19), Warszawa, PWN 1958 88 s.;
P. Ж. М., 1959, 9789.
Нитше (Nitsche J.). [1] Einfache Fehlerschranken beim Eigenwert-
problem symmetrischer Matrizen. Z. angew. Math, und Mech., 1959 39, № 7/q,
322-325.
Нобл (Noble В.). [1] The numerical solution of an infinite set of
linear simultaneous equations. Quart. Appl. Math., 1959, 17, № 1, 98—102.
Ньюмен и Тодд (Newman Morris and T о d d J о h п.). [1] The
evaluation of matrix inversion programs. /. Soc. Industr. and Appl. Math.,
1958, 6, № 4, 466—476.
Пароди (Parodi Maurice). [11] Sur une methode de localisation
des valeurs caracteristiques de certaines matrices. C. r. Acad. set., 1958, 247,.
№ 5, 571—573; P. Ж. М., 1959, 10834.
Пугачев Б. П. [3] Об одном способе одновременного вычисления
двух границ спектра. Тр. семин. по функцаон. анализу. Воронежск. ун-т,
1957, 5, 52—70.
[4] К вопросу о быстроте сходимости метода нормальных хорд. Тр.
семин.по функцией, анализу. Ростовск. н/Д и Воронежск. гос. ун-ты, 1960,
3—4, 77—80.
[5] Исследование одного метода приближенного вычисления собствен-
собственных чисел и векторов. Тр. семин. по функцион. анализу. Ростовск. н/Д и
Воронежск. гос. ун-ты, 1960, 3—4, 81—97.
Рутисхаузер (Rutishauser Heinz). [9] Zur Matrizeninversiorr
nach Gauss-Jordan. Z. angew. Math, und Phys., 1959, 10, № 3, 281—291.
[10] Deflation bei Bandmatrizen. Z. angew. Math, und Phys., 1959, 10,.
№ 3, 314—319.
Райхль (Raichl Jiff.). [1] The economical coding of high-order
matrices for automatic computers. Stroje na zpracovani informaci, 1956, 4,
257—271; M. R., 20, 6, 4345.
Розенблюм (Rosenblum Marvin). [1] On the Hilbert matrix 1.
Proc. Amer. Math. Soc, 1958, 9-, № 1, 137—140.
[2] On the Hilbert Matrix II. Proc. Amer. Math. Soc, 1958, 9, № 4,
581—585.
Сархан и Гринберг (Sarhan A. E. and Oreenberg B. O.).. [1]
Inverting patterned matrices. Abstr. Short communs Internat. Congress Math,
in Edinburgh, Edinburgh, Univ. Edinburgh, 1958, 128; P. Ж. М., 1959, 8563.
Tannep (T u p p e r S. J.) [1] Ill-conditioned linear equations. Math.
Gas., 1958, 42, № 342, 299—300; P. Ж. М., 1959, 9507.
Уайт (White Paul A.). [1] The computation of eigenvalues and
eigenvectors of a matrix. J. Soc. Industr. and Appl. Math., 1958, 6, № 4,
393—437.
Уилкинсон (Wilkinson J. H.). [3] Linear algebra on the Pilot A.C.E.
Automatic Digital Comput. at N. P. L., 1955, 129—137.
[4] The calculation of the eigenvectors of codiagonal matrices. Comput. J.,
1958, 1, 90—96.
[5] The calculation of eigenvectors by the method of Lanczos. Comput. J.,
1958, 1, № 3, 148—152.
[6] The evaluation of the zeros of ill-conditioned polynomials. Part 1.
Numerische Math., 1959, 1, № 3, 150—166.
[7] The evaluation of the zeros of ill-conditioned polynomials. Part II.
Numerische Math., 1959, 1, № 3, 167—180.
€56 ДОПОЛНИТЕЛЬНАЯ ЛИТЕРАТУРА
[8] Stability of the reduction of a matrix to almost triangular and trian-
triangular forms by elementary similarity transformations. J. Assoc. Comput. Machi-
Machinery, 1959, 5, № 3, 336—359.
Уиндли (WindleyP. F.). [1] Transposing matrices in a digital com-
computer. Comput. J., 1959, 2, № 1, с 47—48.
Форсайт (Forsythe Q. E.). [5] Singularity and near singularity in
numerical analysis. Amer. Math. Monthly, 1959, 65, № 4, 229—240.
Франк (Frank W. L.). [2] Finding zeros of arbitrary functions.
J. Assoc. Comput. Machinery, 1958, 5, № 2, 154—160.
Фреберг (Froberg С. Е.). [2] Diagonalization of Hermitian matrices.
Math. Tables and Other Aids Comput, 1958, 12, 219—220.
Хаусхольдери Бауэр (Householder Alston S. and Bauer
Fried rich L.). [1] On certain methods for expanding the characteristic
polynomial. Numerische Math., 1959, I, № 1, 29—37.
Хенричи (Henrici P.). [3] On the speed of convergence of cyclic
and quasicyclic Jacobi methods for computing eigenvalues of Hermitian mat-
matrices. Abstr. Short communs Internat. Congress Math, in Edinburgh. Edin-
burg, Univ. Edinburgh, 1958, 160; P. Ж. М., 1959, 8565.
Хорник (Hornick S. D.). [1] IBM 709 Tape Matrix Compiler. Comm.
Assoc. Comput. Machinery, 1959, 2, № 9, 31—32.
Шехтер (Schechter S.). [1] On the inversion of certain matrices.
Math. Tables and Other Aids Comput., 1959, 13, 73—77.
Шелдон (Sheldon J. W.). [1] On the spectral norms of several iterative
processes. J. Assoc. Comput. Machinery, 1959, 6, № 4, 494—505.
Шмидтмайер (Schmidtmayer Josef). [2] Linear computa-
computations over a complex field. J. Roy. Aeronaut. Soc, 1958, 62, № 570, 451—455;
P. Ж. М., 1959, 10483.
Ill рей дер Ю. А. [2] Решение систем линейных алгебраических урав-
уравнений по методу Монте-Карло. Вопр. теории мптем. машин. 1. М., Физ-
матгиз, 1958, 167—171; Р. Ж. М., 1959, 8559.