Текст
                    УНИВЕРСИТЕТСКАЯ СЕРИЯ Том 12
Основана в 1998 г. издательством "Научная книга" (ИДМИ)
ЛЕКЦИИ ПО
СОВРЕМЕННЫМ АСПЕКТАМ
ЛИНЕЙНОЙ АЛГЕБРЫ
С. К. Годунов
Институт математики
им.С.Л.Соболева СО РАН
Новосибирск, Россия
Новосибирск • Научная книга • 2002


Г59 Годунов С. К. Г59 Лекции по современным аспектам линейной алгебры — Новосибирск: На- Научная книга (ИДМИ), 2002. — 216 с. Ил. — (Университетская серия. Т. 12). ISBN 5-881194K8-6 Книга следует курсу лекций, прочитанных автором и его коллегами в Новосибирском государственном университете по материалам моногра- монографии С. К. Годунова "Современные аспекты линейной алгебры", изданной в оригинале в "Научной книге" (ИДМИ) в 1997 г. и в переводе на английский язык Американским математическим обществом в 1998 г. Исследования С. К. Годунова по линейной алгебре являются прямым продолжением его работ по вычислительным методам решения приклад- прикладных задач математической физики на компьютерах. Для объяснения и понимания причин парадоксов, с которыми по сей день сталкиваются вы- вычислители, потребовалось 35 лет напряженной работы. Данная книга, при сохранении главных идей, изложенных в предшествующей монографии, адаптирована для студентов и читателей с минимальной математической подготовкой: упрощены доказательства, отобран и переформатирован ма- материал, а также добавлен материал (частично в виде задач и упражнений), больше внимание уделено непосредственно вычислительным проблемам. Для студентов и преподавателей ВУЗов по специальностям алгебра, математический анализ, прикладная математика, информатика и особенно для разработчиков вычислительных алгоритмов. Издании осуществлено при финансовой поддержке Российского фонда фундаментальных исследований по проекту 01-01-14039 © С. К. Годунов,2002 ISBN 5-88119-038-6 © Художественное оформление. Н. А. Рожковская, 2002
Предисловие Осенью 1998 г., после выхода в свет моей книги "Современные аспекты ли- линейной алгебры" [Годунов; 6] декан механико-математического факультета Новосибирского госуниверситета чл.-корр. РАН С. С. Гончаров пригласил меня прочесть лекции по материалу книги в качестве обязательного се- семестрового курса для магистрантов. Я принял это приглашение. Основная трудность при подготовке лекций состояла в том, что надо было выделить и систематизировать, изложив в доступной студентам форме, самое су- существенное из представленных в монографии идей и фактов. Указанная монография [Годунов; 6] была моей первой попыткой вы- выявить и единообразно представить тот материал из линейной алгебры и смежных областей математического анализа, который необходим для осо- осознанного подхода к решению задач математической физики на современ- современных компьютерах. Эти задачи лежат в основной области моих научных интересов. Исследуя прикладные задачи математической физики, мне еще в середине 60-х годов пришлось столкнуться с целым рядом удивитель- удивительных парадоксальных явлений, на объяснение и понимание причин которых ушло 35 лет напряженной работы. На мой взгляд, в данных лекциях уда- удалось развить и выпукло изложить основные идеи книги в доступной форме для читателей с минимальной предварительной математической подготов- подготовкой. Курс лекций по алгебре с использованием моих заготовок в виде слай- слайдов с формулами, которые я демонстрировал на своих лекциях, продолжали читать мои ученики и коллеги в последующие годы и по настоящее вре- время. Опираясь на эти же слайды, я попытался подготовить развернутый конспект лекций, который и составил содержание этой книги. Данная книга предназначается не только для студентов и исследовате- исследователей, работающих в области компьютерных вычислений, но и для препода- преподавателей и лекторов высших учебных заведений. Я надеюсь, что представ- представленные лекции будут способствовать переосмыслению основных понятий, включаемых в стандартные курсы алгебры и дифференциальных уравне- уравнений, а также, возможно, и в курсы вычислительной математики и ин- информатики. Изложенный материал — полностью или частично — может использоваться при построении и чтении спецкурсов. В различных аудиториях, несомненно, будет различный уровень мате- математической подготовки. Поэтому для удобства читателя часть материала выделена как дополнртельная (иногда в виде серии задач). При первом чтении эти дополнения можно пропускать, особенно если они посвящены известным читателю фактам.
Предисловие В основном тексте также содержится значительное количество задач, в которых предлагает:я провести не очень сложное, но детальное доказа- доказательство сформулированных утверждений. Для лучшего усвоения ново- нового материала, можно порекомендовать читателю сначала прочитать текст лекции, не останавливаясь на задачах, понять основную идею - а затем уже вернуться к детальной проработке материала, включая решение задач. По мере накопления от лекции к лекции теоретического материала, я включаю в текст отступления от основного материала — дискуссии с иллюстративными примерами. Первая дискуссии проводится в лекции 7. Здесь речь идет о том, что не стоит уделять слишком большого внимания вычислению отдельных соб- собственных значений и соответствующих идеальных собственных векторов. Во многих случаях собственные значения собраны в кластеры и изобража- изображаются на "спектральных портретах матриц" спектральными пятнами. Поэ- Поэтому и возникает вопрос о расслоении спектра на кластеры и о выделении отвечающих им подпространств. Формализацию расслоения предлагает- предлагается осуществлять при помощи интегральных критериев дихотомии спект- спектра, определяемых через решения алгебраических матричных уравнений, предложенных А. Я. Булгаковым и естественно обобщающих известные уравнения Ляпунова в теории устойчивости. Изучаемые уравнения содер- содержат в качестве неизвестных также матрицы проекторов на инвариантные подпространства, t Дискуссия в лекции 12 также посвящена расслоению спектра. Здесь рассматриваются матрицы, полученные при разностных аппроксимаци- аппроксимациях эллиптических дифференциальных операторов. Такие матрицы очень большого размера и с большой нормой часто встречаются в приложени- приложениях. В предшествующей монографии [Годунов; б] изложено предложенное В. Б. Лидским в 1958 г. доказательство, основанное на тонких фактах теории целых аналитических функций и выработанное в развитие идей М. В. Келдыша (см. [Лидский; 1], [Келдыш; 1], [Келдыш-ЛидскиЙ; 1]). На лекциях 1998 г. также приводилась теорема Лидского с несколько упро- упрощенным доказательством на основе использования полиномов Чебышева, наименее уклоняющихся от нуля. Ю. М. Нечепуренко, слушавший мои лекции, сумел предложить дальнейшее упрощение, совсем исключившее из доказательства использование комплексного переменного (см. [Godunov- Nechepurenko; 1]). Именно в таком виде теорема Лидского приведена в конце лекции 12. В то же время, основное содержание лекции 12 составля- составляют модельные примеры, которые позволяют надеяться, что в практичес- практических задачах спектр расслаивается гораздо более четко, чем это прогнозиру- прогнозирует теорема Лидского, охватывающая слишком широкий класс операторов. Дискуссия в лекции 12 может заинтересовать специалистов по спектраль- t По-видимому, один из первых приемов построения проекторов Р+ = V, I-P = 7>_ на инвариантные для квадратной матрицы А подпространства с собственными значени- значениями в правой и левой комплексной полуплоскостях был описан в 1971 г. А. А. Абрамо- Абрамовым [Абрамов; 1]) в виде следующей изящной процедуры: So = А, 5^+] - ^(Sk + S^1), S = Hm^^ Sk, V+ — ~{1 + S), V- = j(/ - 5), получившей название метод матричной сигнум-фуниции. Дело в тем, что 52 = /, SV+ = 7>+, SV- = -V-. Эти равенства делают естественным обозначения S = sgnA.
Предисловие vii ной теории несамосопряженных операторов, которым должны быть извест- известны факты, с помощью которых можно ответить на поставленные вопросы. В последних двух лекциях и в заключающей их дискуссии обсуж- обсуждается теория Штурма и использование этой теории для прецизионного вычисления собственных векторов симметричных (эрмитовых) матриц. Разбираются удивительные вычислительные парадоксы, с которыми мы с Г. П. Прокоповым столкнулись еще в конце 60-х годов [Годунов-Прокопов: 1]. Аналогичные парадоксы, опубликованные несколько позднее [Paige; 1] в 1971 г., вызвали целую серию исследований различных авторов и способст- способствовали разработке эффективных вычислительных алгоритмов (см. [Paige; 2], [Друскин-Книжнерман; 1, 2], [Grenbaum-Druskin-Knizhnerman; I], [Van der Vost; 1], [Fernando; l], [Parlet; 1]), Для разгадки этих парадоксов я привлек своих учеников В. И. Костина и А. Д. Митченко. Разработанные в результате этих исследований вычислительные приемы опубликованы в [Годуное-Костин-Митченко; 1] и схематично изложены в лекциях 13 и 14 с иллюстрацией вычислительными примерами, подготовленными Э. А. Би- бердорф, К сожалению, не все принципиальные вопросы, даже достаточно по- понятые к настоящему времени, здесь поставлены и разъяснены. Естест- Естественно, что отбор материала, который можно изложить в курсе за один семестр, я проводил в соответствии с моим опытом, вкусами и возмож- возможностями. Так, подробчо осветив в лекции 6 теорию простейшего варианта <ЗЯ-алгоритма, я дажо не упомянул самый употребительный его вариант со сдвигами спектра {см. [Кублановская; 1], [Francis; 1], [Уилкинсон; 1], [Голуб-Ван Лоун; 1]). Дело в том, что я очень долго размышлял над выра- выработкой строго формализованного критерия сходимости фЯ-алгоритма (пос- (после многолетних дискуссий с коллегами мы его предложили в совместной с С. В. Кузнецовым работе [Годунов-Кузнецов; 1]). Я очень сожалею, что на анализе роли сдвигов мы не останавливались. На окончательную редакцию текста существенно повлияли дискуссии с Ю. М. Нечепуренко, который внимательно прочитал рукопись и сделал ряд замечаний. Издание этих лекций было бы совершенно невозможно без давления, которое на меня все это время оказывала редактор Т. Н. Рожковская, про- проделавшая колоссальную работу по приведению рукописи в легко читаемую изящную форму. Я должен отметить, что и предшествующая книга [Го- [Годунов; 6] была составлена из материалов моих разрозненных лекций по инициативе Т. Н. Рожковской, с ее помощью и под ее редакцией. Очень существенно, что издание поддержано Российским фондом фун- фундаментальных исследований. С. К. Годунов Новосибирск Академгородок 25 октября, 2001
Содержание Лекция 1 1 Евклидово пространство. Унитарные преобразования. Теорема Шу- Шура и ее вариант для эрмитовых матриц. Дополнительный материал в задачах. Вариационный принцип Вебера — Рэлея Лекция 2 15 Теоремы о сингулярном разложении квадратных и прямоугольных матриц, изложенные в виде серии задач. Уравнение Сильвестра, неод- неоднородное и однородное. Разрешимость однородного уравнения Силь- Сильвестра. Индуктивное (по размерностям) доказательство критерия раз- разрешимости неоднородного уравнения Сильвестра. Применение уравне- уравнения Сильвестра в геореме о подобном приведении матриц к клеточно диагональному виду Лекция 3 31 Уравнение Ляпунова и гурвицевы матрицы. Схематичное изложе- изложение теории устойчивости обыкновенных дифференциальных уравне- уравнений. Случай постоянных коэффициентов и построение интегрального представления решения матричного уравнения Ляпунова. Аналог тео- теоремы Ляпунова в случае дискретных векторных последовательностей Лекция 4 41 Проекторы и их свойства. Проекторы на инвариантные подпространст- подпространства. Интегральная формула для инвариантного проектора. Дихотомия матричного спектра. Интегральный критерий дихотомии и его обос- обоснование. Круговая дихотомия и оценка соответствующего проектора. Дополнительный материал в задачах Лекция 5 53 Логарифмическая субгармоничность суммы квадратов модулей ана- аналитических функций и анализ зависимостей \\(Ня.(А)д,д)\\, ||Яд(А)||, tr Hr{A) от радиуса R. Вариант, применимый для критерия дихото- дихотомии прямой Re А — а. Алгебраические уравнения для Hr(A) и Vr{A). Существование и единственность ix
х Содержание Лекция 6 65 Изучение степеней Лк при известной норме ||#д(.А)|| и оценка эле- элементов клеточно диагонального представления матрицы Л. Решение матричных уравнений для Hr{A). Дополнительный материал в зада- задачах. Ортогонально степенной фЛ-алгоритм и его сходимость. Лемма, которую можно пропустить. Рекомендуемые компьютерные экспери- эксперименты. Ортогональные прогонки. Оценки матричных итераций на инвариантных подпространствах Лекция 7 87 Вычислительные парадоксы при расчете собственных значений. По- Понятие об е-слектре. Необходимая осторожность при использовании теоремы о непрерывности. Двумерные и одномерные спектральные портреты. Обсуждение теорем Ляпунова об устойчивости решений дифференциальны;; уравнений. Всегда ли следует ждать, что спектр расслоится на кластеры? Спектры семейств разностных операторов — предшественники г-спектров Лекция 8 107 Отношение Рэлея для не эрмитовых матриц. Область значений (хаус- дорфово множество); Теорема Хаусдорфа о выпуклости. Оценки |)ем|| и ||(А/ — Л))), вытекающие из рассмотрения области значений. Сек- ториальные операторы. Критерий секториальности. Дополнительный материал в задачах Лекция 9 115 Эрмитовы окаймления диагональных матриц. Перемежаемость собст- собственных чисел. Обобщения на окаймления любых эрмитовых матриц. Вариационный принцип Куранта — Фишера. Окаймление прямоуголь- прямоугольных матриц и перемежаемость. Неравенство между положительными степенями сингулярных чисел матрицы и ее подматрицы. Неравенства Германа Вейля между собственными и сингулярными числами Лекция 10 129 Мажорирующие последовательности и теорема о неравенствах для вы- выпуклых функций. Вывод неравенств между последовательностями соб- собственных значений и сингулярных чисел. Доказательство теоремы о выпуклых функциях. Применение этой теоремы. Как изменяются сингулярные числа при добавлении к матрице слагаемого известного ранга. Вариационный принцип Алахвердиева и его следствия Лекция 11 139 Описание аппроксимируемых дифференциальных операторов. Метод слабой аппроксимации для построения их конечномерных моделей. Оценки операторов, секториальность конструируемых моделей. Срав- Сравнение сингулярны-х чисел модельного несамосопряженного оператора
Содержание с сингулярными числами и собственными значениями самосопряжен- самосопряженного оператора. Поостейший выбор базисных функций и оценка син- сингулярных чисел в двумерной модели. Обобщение. Спектральные обу- обусловленности в задачах различных размерностей Лекция 12 153 Нормальные операторы. Оценка их резольвенты с учетом малого воз- возмущения. Расслоение спектра. Обсуждение результатов, О расслоении спектра без предположения о "почти нормальности". Элементарное доказательство теоремы Лидского Лекция 13 165 Рекуррентные соотношения для определителей главных характерис- характеристических миноров трехдиагональных матриц и последовательность Штурма из их отношений. Тригонометрическая параметризация по- последовательности Бтурма. Производные угловых параметров членов последовательност л Штурма по коэффициентам рекуррентных соотно- соотношений. Теорема Штурма и ее применение в вычислительной практике для указания точных границ собственных значений. Вычисление при- приближенной последовательности Штурма, ограничивающей сверху (или снизу) точную последовательность. Метод бисекций. Оценка погреш- погрешности Лекция 14 173 Связь последовательности Штурма с компонентами собственного век- вектора трехдиагональной матрицы, Пример матрицы с парадоксальной зависимостью крайнего элемента последовательности Штурма от А. Двусторонние последовательности Штурма. Использование для их рас- расчета мажорирующих и минорирующих последовательностей. Арифме- Арифметика "вынесенных порядков". Вычисление компонент собственного вектора и последующая его нормировка. Иллюстративный пример. Литература 193 Предметный указатель 201
Лекция 1 Евклидово пространство. Унитарные преобразования. Теорема Шу- Шура и ее вариант для эрмитовых матриц. Дополнительный материал в задачах. Вариационный принцип Вебера — Рэлея. Предполагается, что читатель хорошо знаком с основными положениями теории евклидового пространства, которое далее, как правило, будет счи- считаться комплексным. Линейные преобразования в таких пространствах и линейные отображения какого-либо из этих пространств на другое после выбора базисных векторов описываются квадратными или прямоугольны- прямоугольными матрицами. Мы начнем с краткого напоминания определений исполь- используемых понятий и доказательства некоторых основных положений. Комплексное евклидово пространство Остановимся на понятии TV-мерного комплексного евклидова простран- пространства Hpj, элементами которого являются векторы x,y}z, Эти векто- векторы можно умножать на комплексные скаляры at0tft... и рассматривать всевозможные конечные суммы вида ах + 0у + yz + Произведения и суммы также принадлежат Hn- Размерность N означает, что в этом пространстве число линейно независимых векторов не может превышать N, и что существуют N линейно независимых векторов. Иными словами, если х*1' е Hx,xW ? jjN} ...txW ? Hn и при этом J ^ N + 1, то сущест- существуют J скаляров aW,а&\ . -,q^j\ среди которых есть отличные от нуля комплексные числа такие, что В то же время существует совокупность из N векторов е*1* е #/v,e<2> Я^.-.е^^ G Hn таких, что из равенства следует, что все скаляры а^,о^,...,о^ — нулевые (aW = qW = ¦¦¦ = ac(N) s= 0). Векторы e^,eB',...,«W могут быть выбраны в качестве базиса пространства Hn, и при этом каждый вектор х € Hn однозначно предста- представим в виде линейной комбинации базисных векторов
Лекция 1 Скалярные коэффициенты х3 называются компонентами вектора в выбран- выбранном базисе, и из них удобно составить вектор-столбец В дальнейшем на определенных этапах наших рассуждений будет удобно фиксировать тот или иной базис в пространстве #лг, и тогда на протя- протяжении всего этапа можно отождествлять вектор х с вектор-столбцом его координат в выбранном базисе, т.е. пользоваться записью /ХЛ «с = или х = Как правило, использование этого удобного, но не слишком аккуратного приема не будет специально оговариваться. Евклидово пространство HN снабжается скалярным произведением {х, у). Запись (-, ¦) означает скалярную функцию двух векторных аргумен- аргументов х и у, удовлетворяющую определенному набору требований — аксиом. Аксиомы скалярного произведения Для любых х,у, г е #jv A) (х,у) = (у, х) — комплексное число, которое при перестановке векторов х, у меняется на комплексно сопряженное. B) Бели х ф 0, то (аг, х) - (ж, ж) > 0. Если яг = 0, то (х, х) = 0. C) (ах,у)*=а(х,у). D) (* + У,*) = (*,*) + (»,*). Среди различных возможных базисов пространства ## существуют так называемые ортонормнрованные базисы. Любой из таких базисов со- составляют векторы eW,e<2),...,eW такие, что (е^.еШ) ~ о при г ф j и Для векторов N N которые символически записываются вектор-столбцами X = /Х1 \ х2 . У = /У1\ У2 \Ум/
Лекция 1 3 координат в ортонормированием базисе, скалярное произведение задается формулой N 3-1 В дальнейшем, как правило, предполагается, что в пространстве Н^ вы- выбран ортонормнрованный базис и скалярное произведение вычисляется по указанной формуле. Линейные преобразования. Собственные значения и собственные векторы Линейное преобразование А : Н^^Нм, у = Ах, отображающее про- пространство tfjv в себя, описывается с помощью правила преобразования ко- координат N Коэффициенты a,j, входящие в это правило, образуют квадратную мат- матрицу, которую мы будем, также как и преобразование обозначать той же буквой А л _ an ai2 a21 a22 O.NNJ Это отождествление законно, пока базис в Н^ фиксирован. (В различных базисах одно и то же линейное преобразование описывается различными матрицами.) • Квадратная матрица Л, у которой все элементы главной диагонали равны 1 {an = l,l^i^ N), а все остальные элементы равны нулю (a,j = 0, i ф j, 1 ^ i, j ^ N), называется единичной матрицей и обозначаемся через /дг или просто через /, если ее размер ясен из контекста. • Каждой N х TV-матрице А можно сопоставить N комплексных чисел Ai, А2,..., Xn — корни характеристического уравнения det[A - XI) = (-X)N + М-А)"-1 + • ¦ ¦ + алг-1(-А) + aN = О, которые называются характеристическими числами или собственными зна- значениями матрицы А. Согласно правилам вычисления определителей характеристическое ура- уравнение не меняется при замене матрицы А транспонированной матрицей Ат с элементами а? = в^. Поэтому наборы характеристических чисел мат- матриц А и Ат совпадают. В любом курсе линейной алгебры доказывается, что на самом деле Xj(A) не изменятся, если мы будем использовать запись одного и того
Лекция 1 же линейного преобразования в различных базисах, причем нет необхо- необходимости предполагать, что эти базисы ортонормированы. Таким обра- зом, \i(A)y \2(А), • • • > ^n(A) естественно считать собственными числами линейного преобразования Л, а не только матрицы, представляющей его в том или ином базисе. Это очень важное обстоятельство, но мы не будем подробно его обсуждать. Читателю рекомендуется освежить в памяти об- обоснование сформулированного утверждения. Если А„ — какое-либо собственное значение матрицы Л, то det[A — Ап7] = 0 и соответственно система линейных уравнений [А-ХпГ\ ~[A-XnI)f = для компонент /ь/г, ¦ • • ,/n вектора / имеет хотя бы одно решение такое, что среди компонент /, есть ненулевые, т.е. существует решение / ф О такое, что N N t=l Пусть последняя компонента /дг вектора / имеет аргумент a: /yv = |/лг| с*л. Очевидно, что если fN ф О, то число 0 ^ а < 2тг определено однозначно. При /л/ = 0 можно считать, что о = 0. Положив gj — 3. v(f'f) и составив вектор д - {д\,д2, ¦¦ -,5Л'). нетрудно убедиться в том, что Ад = , {9,9) = 1 и (<?,e(N)) = (e(N\g) = -j^L ^ 0, если вектор е1 ' = \Т - является последним по списку используемых нами базисных векторов е^, е^,...,^^. Таким образом, собственному значению \п можно сопоста- сопоставить нормированный собственный вектор д (Ад ~ Хпд, (д,д) = 1) такой, что (д,е(дг)) = (e^N\g) ^ 0. (Иными словами (д^^^), {e^N\g) вещественны и неотрицательны.) При этом оказывается, что {g + e^N\g~e^N^) = 0, т.е. векторы g±e(N^ ортогональны. Действительно, 7=1 + 0-0-1=0. Mb! скоро воспользуемся описанной нормировкой собственного вектора gt но предварительно напомним понятия сопряженного линейного преобразо- преобразования и унитарного преобразования.
Лекция I В нижеследующем равенстве наряду с квадратной N х /V-матрицей А с элементами a,j (i — номер строки, j — номер столбца) участвует матрица В с элементами bij} занумерованными аналогичным образом. При этом предполагается, что b,j = a^ (или, что то же самое, 6/, = а,5): N N N J=l 1=1 1=1 • Матрица В, полученная из А транспонированием (заменой строк на столб- столбцы и наоборот) и последующей заменой всех элементов на комплексно- сопряженные обычно обозначается А' (В ~ А' = Ат) и называется сопря- сопряженной матрицей к А. • Линейное преобразование, описываемое матрицей А' в том же базисе, в котором преобразование А описывается одноименной матрицей, называет- называется сопряженным преобразованием к А. Итак, для каждого преобразования А пространства Ядг в Н^ сущест- существует преобразование А' к нему сопряженное такое, что (Ах,у) = [х,А"у) при любых х, у е Н^. • Линейное преобразование U : Н^^Н^ называется унитарным, если оно сохраняет скалярное произведение векторов, т.е. (х,у) = (Ux,Uy). Так как [х,у) = (U'(Jx,y) при любых х, у, нетрудно проверить (сде- (сделайте эту проверку!), что VU = /. Это равенство и означает унитарность преобразования U (описывающая его матрица унитарна). Задача 1.1. Доказать равенство [А ¦ В]' = В" А* и проверить, что про- изведение U = U2U1 двух последовательно выполненных унитарных преоб- разований Ui, Ui тоже будет унитарным. Унитарные отражения Рассмотрим очень простой, но важный для дальнейшего пример уни- унитарного преобразования. Пусть г — какой-либо ненулевой вектор. Ассоци- Ассоциируем с этим вектором линейное преобразование у = Ux, построенное по формуле (г, г) которую перепишем в покомпонентном виде N О Гк Ук — Хк - * N ЕГ2 m
6 Лекция 1 Из этой записи вытекает следующее представление матричных элементов Uki матрицы U: а это представление приводит нас к выводу, что матрица U самосопряжен- самосопряженная, т.е. U = U'. Заметим, что преобразование U переводит вектор от, коллинеарный вектору г, в вектор — ох, т.е. меняет знак всех его компо- компонент. Действительно, (ост г) JJar = or — 2 ——Ц- г = аг — 2от = —аг. (г, г) Если вектор г ортогонален г, т.е. (г, г) = 0, то 1/* = ,2?4г = ,, (г, г) т.е. такой вектор при преобразовании U не меняется. Любой вектор х можно представить в виде суммы двух слагаемых х — z + art где а = (х,г)/(г,г). При этом, как легко проверить, (г,г) = (х, г) - а(г, г) = 0. Поэтому Uх — Uz + Vаг = z — аг, U х = U(z — аг) — z + аг — х. • Преобразование U можно рассматривать как отражение относительно плос- плоскости, состоящей из векторов, ортогональных вектору г, при котором эта плоскость остается неподвижной. Равенство U2x = x означает, что вы- выполнив такое отражение дважды, мы возвращаем все векторы в исходное положение. Итак, мы показали, что V = U' и U2 = /, откуда, как следствие, вытекает равенство U'U — I {U'U = U'2 = /), означающее, что построенное преобразование отражения унитарно. Очевидно, что U~l — U = U*. Теорема Шура Вернемся к рассмотрению матричного оператора А, имеющего собст- собственное значение Ajv и нормированный собственный вектор д {Ад = XNg, (9,9) — li (9 + ^NK9 ~ e'/V)) — 0)- Напомним, e^f обозначает базисный вектор: e(N> = ГОД ..., 1)т. Если д ф e*N\ то, выбрав г = д ~ e^N^ ф 0, построим с помощью этого вектора преобразование отражения U: у,=,2?4г=,2, \: (г, г) (д-е{"),д- При таком отражении окажется, что Ug = e^N^ и, следовательно, U2g = д. Иными словами, векторы д и е^ переводятся отражением V
Лекция 1 друг в друга. Вот доказательство сделанного утверждения: = В этой выкладке мы воспользовались тем, что {g + e^N\g~ e^) = 0. При- Применив к обеим частям равенства Ад = Х/чд преобразование U: V Ад ~ и заметив, что д = Ue^N\ Ug = e(N\ мы приходим к соотношениям которые означают, что координатный вектор е^ является собственным вектором матрицы А ~ U~lAU, соответствующим собственному значению Хм. Если д = е^ (случай, оставленный пока без рассмотрения), то можно положить U = U* = /jv, А — А. Напомним, что матрица А подобна матрице Л, т.е. она описывает то же самое преобразование пространства Ндг, но использует для этого другой базис, а именно, координатный базис из столбцов матрицы 1/~1. Напомним, что матрица U~l ~U" ~U унитарна, и поэтому А описывает то же самое линейное преобразование, что и А, но в другом ортонормированном базисе. Иными словами, А унитарно подобна матрице А. В частности, А и А имеют одинаковые собственные значения. Элементы матрицы А будут обозначаться a,j. Равенство AeW — Адге^, переписанное покомпонентно an a2N приводит к равенству 01 Выберем какое-либо другое собственное значение A^_j матрицы А. (Если A/v было кратным, то A/tf_l может иметь то же числовое значе- значение, что и А/у.) Очевидно, что X^-i является собственным значением для A(N~lK Подберем унитарное отражение V (V* = V, V2 = V*V = /jv_i) N — 1-мерного координатного пространства, в котором действует матрица
Лекция 1 l\ так, чтобы выполнялось равенство О о х Ajv-i. Очевидно, что построение V совершенно аналогично описанному выше по- построению U. Рассмотрев составное унитарное преобразование V TV-мерного коор- координатного пространства V Lo 01 о 0 U мы приходим к следующему выводу: V*AV = A(N-2) = V'U*AUV = [UV]*A[UV]. Описанную сейчас процедуру подбора последовательных унитарных преобразований, с помощью которых аннулируются лежащие выше глав- главной диагонали элементы полученной в результате преобразований матрицы А, можно, очевидно, продолжать до тех пор, пока мы не получим нижнюю треугольную матрицу, на главной диагонали которой расположены собст- собственные значения Xj{A) снизу вверх в том порядке, в котором мы их вы- выбирали. Обозначив через V~l унитарное преобразование, полученное как произведение преобразований на последовательных шагах (V'1 = UV...), заметим, что матрица А представима в виде х А: О = /)¦ Транспонированная матрица Ат имеет те же самые собственные зна- значения, что и матрица А. Поэтому существует унитарное преобразование Q {Q'Q= I) такое, что Ат = X А- О Q- X X A./V.
Лекция 1 Перейдем к транспонированным матрицам: А = [Q-l]T QT, Теперь воспользовавшись унитарностью матрицы Q — [Q 1]т, мы закан- заканчиваем доказательство следующего важного утверждения. Теорема 1.1 [И. Шур A909)]. Для каждой N х N-матрицы А существуют унитарные подобные преобразования V, Q (V*V = In, Q"Q = In), которые приводят А к треугольному виду (верхнему и нижнему соответственно) x А2 A — "P [Ai X X A2 X A/v_ При этом собственные значения Xj{A) расположены на главных диагоналях треугольных матриц в некотором заранее указанном порядке. Столбцы p(i) HqW матриц V = {р^ :р<2>:.. .:pW) hQ = (qM :qW !... :.qW) состоят из координат векторов ортонррмированного базиса, в котором линейное преоб- преобразование А из Hpj в Нм изображается треугольной матрицей (верхней или нижней соответственно). Теорема Шура для эрмитовых матриц Рассмотрим квадратную эрмитову N х ^/-матрицу А т.е. А = А'. По теореме Шура существует унитарная матрица V (V'V = /) такая, что х X X Применим операцию сопряжения к правой и левой частям этого равенства: А = А' = х X X X X [V]' =V X X X V*.
10 Лекция 1 Вследствие этого матрица VAV одновременно будет, как верхней, так и нижней треугольной: х X X X X о X X X что возможно лишь когда матрица VAV = V 1AV диагональна: ГА, V~lAV = О An. Легко видеть, что V~lAV = VAV = VA*V = [VAV]* = [V~XAV]\ т.е. диагональная матрица V1AV не меняется при операции сопряжения, что возможно лишь если все собственные значения \j(V~1AV) = Xj{A) вещест- вещественны. Таким образом, мы обосновали Следствие теоремы Шура. Для каждой эрмитовой матрицы А — А' су- существует унитарное подобное преобразование V, приводящее ее к диагонально- диагональному виду с вещественными собственными значениями А^(Л) на его диагонали. Дополнительный материал (в задачах) Задача Д1.1. По заданному TV-мерному (N 3) вектору и = («1.U2,. ..,ит)т определить унитарное преобразование отражения V так, чтобы у вектора Vu = v = {vx,v2,. ..vn)T первые к (N-2 ^ к ^ 0) компонент остались неизменными: v: = щ, v2 = и2,.. .Vk = щ, тогда как компоненты г^+2, щ+з, ¦ ¦ ¦, vn оказались бы нулевыми. Очевидно, что при этом \vk+i\ = yJ2j=k+i \из\2- Задача Д1.2. Для N х //-матрицы А указать унитарное отражение V, (VV = In, "P2 = I), при котором матрица VAV окажется следую- следующего вида: VAV = ххх ххх 0 х х 0 х х о Иными словами, в первом столбце VAV все элементы, кроме двух верхних, должны стать нулями.
Лекция 1 П Задача Д1.3. Для произвольной N х /V-матрицы А построить уни- унитарное подобное преобразование U (U'U = /), приводящее ее к так называемому верхнему гессенбергову виду В = UAU' = X X X X X X О х X X X X X 0 X X X X X X X X X X X X так, что bij = 0 при j ^ г + 1. Задача Д1.4. Доказать, что для любой эрмитовой N xjV-матрицы А = А' существует подобное унитарное преобразование^/, приводящее А к трехдиагональному виду (dj вещественные, dj = dj): U*AU = d2 '-1 dN Это утверждение можно усилить и обосновать возможность выбора С/, при котором трехдиагональная матрица окажется вещественной. Двумерное (в плоскости базисных векторов e^k~l\ e^) вращение на угол ifk задается матрицей С^к\ у которой С,-,- = 1, i ф к,к — 1, кк =Ck-\k-i=ck= cosipk, С$_i = -Cf_\к = sk = sintpk, 1, c\j = 0, если i ф j и среди г, j есть отличные от A, Ar — 1. Цепочкой двумерных вращений называется ортогональное преобразо- преобразование с = ^^)W Задача Д1.5. Параметры с*, sk цепочки двумерных вращений С, пе- переводящей вещественный вектор х {\\x\\ ф 0) в вектор Сх = ±||х||е^', связаны с координатами х, соотношениями N N 0, cj > -1, - 1. Задача Д1.6. Если цепочка двумерных вращений из задачи Д1.5 стро- строится по собственному вектору х (х ф 0), отвечающего собствен- собственному значению Л трехдиагональной (вещественной и такой, что bj = bj ф 0) матрицы из задачи Д 1.4, то ее параметры связаны ра- равенствами
12 Лекции 1 s2ci(d]_ -A) +c2b2 =0, Cj-ibj + sj+iCj{dj - A) + Cj+i6j-+i =0 B ^ j ^ N), ibtf -f cw(dpj — A) = 0. При этом Sj > 0, Cj > 0. Задача Д1.7. Если А = Д* из задачи Д1.4, a sfcl с* удовлетворяют соотношениям из задачи Д1.6, то матрица CU'AUC* так же, как и матрица VAU, трехдиагональна CVAVC = 0 0 Замечание. Можно показать с помощью трудоемкой выкладки (см. [Митченко; 1]) что при 2 ^ j <; N - 1 ¦*j , Cj Cj _ ] CjCj+\ *j Более прозрачный, но более длинный вывод предложен О. П. Кири- люком и описан в [Годунов-Антонов-Кирилюк-Костин; 1]. Задача Д1.8. Подобрать унитарные (ортогональные в веществен- вещественном случае) отражения VUV2, ¦ ¦ ¦ ,Vm-\ так, чтобы их произведе- произведения Q = Т>м~\Рм-2---Т>2'Р\ осуществляли так называемое QR- разложенис М х Л'-матрицы A (N ^ М, А =. QR), где Q — орто- ортогональная (унитарная) матрица, а Я — верхняя треугольная N х N- матрица. Задача Д1.9. Если вещественная М х Лг-матрица Л (N <: М) верх- верхняя гессенбергова (см. задачу Д1.3), то ее <2Я-разложение А - QR можно осуществить, выбирая в качестве Q цепочку двумерных вра- вращений Q = СмСм-1 -СзС'з, т.е. заменив отра?кения Vj из задачи Д1.8 вращениями Ск+\- Задавшись некоторым, вообще говоря, произвольным нормирован- нормированным вещественным вектором е*1* с помощью симметричного (А = А') вещественного оператора строится последовательность векторов е^^е^'.е*3' ... последующему правилу: ^2 3,
Лекция 113 выбирая коэффициенты dj из условия dj = - ... ',.. , Коэффициент bj выбирается так, чтобы цУ) оказался нормированным (|fe(jJ|| = 1, (е(Л]е(Л) — 1). Это возможно, если выражение в квадратных скоб- скобках отлично от нуля. При невозможности выбрать Ьп+1 ограничимся векторами е':',е^2\ ... ,е^"*. Задача Д1.10. Доказать, что по построению (е^.е^)) = О, (e0)ietj-2)) = 0 и e(j) = nU-i)[A)eU)t где ^'"^(Л) = а^А^1 + aj~-2 А'~2 + ¦ ¦ ¦ + а^^А + a$l'I есть полином от Л с ненулевым старшим коэффициентом a^Zi Ф 0. Задача Д1.11. Пользуясь условием А — А', доказать по индукции. что в действительности (е^\е^) = 0 при всех k ^ j - 1, т.е. e(i),е^,... ,e(fc) образуют ортонормироваиный базис в пространстве Крылова вектора е'°) (т.е. в линейной оболочке векторов N N Задача Д1.12. Если А = А* и х = ^ XjeW, у = Ах = ? У;е<^, где efj1' векторы базиса из задач ШЛО, Д1.11, то г/1 = d\Xi +b2x2, Уз = hjxj-i + d3xj + bj+ixj+i, 2 ^ ; ^ N - 1, ^i + Предложенный Ланцошем [Lanczos; 1] (см. также [Хаусхолдер; 1]) и описанный в задачах Д1.10-Д1.12 прием вычисления трехдиаго- нальной матрицы симметричного оператора широко используется. У нас еше будет повод остановиться на удивительных парадоксах, с которыми можно столкнуться при его компьютерной реализации. ¦ Вариационный принцип Вебера — Рэлея Рассмотрим эрмитову N х iV-матрицу AN = A*Nl которая приводится с помощью унитарного преобразования U (U*U = In) к каноническому виду А^ = VDnU с диагональной матрицей Dn, у которой все ненулевые элементы (они лежат на главной диагонали) вещественны: l A2 О А, Диагональные элементы Л, являются собственными значениями матрицы Л/v, т.е. корнями характеристического уравнения det[A/— Лдг] = 0. Нам удобно считать их занумерованными в порядке неубывания: Ад $; А2 ^ ¦ ¦ ^ А/у. Матрице An поставим в соответствие эрмитову форму (Anx,x) и так называемое отношение Рэлея [Anx,x)/(x>x), аргументом которых яв- является некоторый отличный от нуля вектор х. Когда вектор х пробегает
14 Лекция 1 все ненулевые векторы УУ-мерного комплексного евклидова пространства Я//, отношение Рэлел пробегает некоторое множество числовых значений. Все эти значения вещественны. В самом деле, так как (х,х) > О, AN = A*N, имеем , х) = (х, Л},,) = (х, Мы покажем, что множество значений отношения Рэлея совпадает с от- отрезком [А 1, A/sr] вещественной оси. С каждым вектором х можно связать вектор у такой, что (x,i) = {у,у), с помощью унитарного преобразования U: у — Ux, х = U'y, Очевидно, что если х пробегает все ненулевые векторы Я-мерного пространства, то у также пробегает все пространство (ANx,x) = (U'DNUx,x) = (DNUx,Ux) = {DNy,y)t Ясно, что области значений отношений Рэлея ~—~- и -Ц—~^- совпала- I.*.*; \У>У) ют, а последнее отношение в координатной форме выглядит так: ^2ум (Dfjy. у) Из этой записи очевидно, что Xi < —.—^- < А^ и любое значение А ~ (У. У) A - s)Ai + sXn @ ^ s ^ 1) из отрезка Ai ^ А ^ Адг будет отношением Рзлея при некотором ненулевом векторе у. В качестве такого у можно выбрать вектор с вещественными координатами yi = л/1 - s, у2 = уз = •¦¦ = удг-1 = 0, улг = у/$- Следствием приведенного описания области п (Ллгг.х) значений, принимаемых отношением Рэлея ^-j г-1, являются равенства = max-^т ~, х в ( ) Эти равенства составляют содержание вариационного принципа Рэлея для мак- максимального и минимального собственных значений эрмитовой матрицы Ая, который был сформулирован Вебером в 1869 г. и активно использован Рэ- лей в работах 1899-1919 г., которые получили широкую известность в связи с чем вариационный принцип, как правило, связывают с именем Рэлея. • Эрмитова матрица А — А* называется положительно определенной (не- (неотрицательно определенной) (А > О, А ^ 0), если для любого ненулевого вектора х {х ф 0) справедливо неравенство (Ах,х) > 0 ((Ах,х) ^ 0). Критерий (следствие вариационного принципа Вебера — Рэлея). Для по- положительной (неотрицательной) определенности матрицы А = А' необходима и достаточна положительность (неотрицательность) всех ее собственных зна- значений Xj(A).
Лекция 2 Теоремы о сингулярном разложении квадратных и прямоугольных матриц, изложенные в виде серии задач. Уравнение Сильвестра, неоднородное и однородное. Разрешимость однородного уравнения Сильвестра. Индуктивное [по размерностям) доказательство кри- критерия разрешимости неоднородного уравнения Сильвестра. При- Применение уравнения Сильвестра в теореме о подобном приведении матриц к клеточно диагональному виду. Сингулярное разложение Рассмотрим произвольную невырожденную квадратную к х fc-матрицу В, т.е. det В ф О, и с ее помощью построим матрицу А = В* В такую, что det Л = (det В*) det В = deli? ¦ det В = |det?|2 > 0. Воспользовавшись представлением "«1 A = V в котором участвует унитарная матрица V, и рапенствами 6etV — defP* = I :, |defp|2 =detP -detp = 1, det A = det V ¦ sis2 ¦¦¦sfedet7?* = ¦ defp - $]_s2 • • • Sk — |detPj2 ¦ s\S2 ¦ ¦ ¦ sk = «i«2 ¦¦¦**, заключаем, что S{ ф 0 при всех i и s\s2 ¦ ¦ ¦ sk > 0. На самом деле все собственные значения si матрицы А строго положительны. Действительно, выберем вектор /0\ х = — единица в г-й строке, 0 1 0 W который заведомо отличен от нуля, так как (г,г) = (V*x,V*x) = 1. Мы здесь воспользовались унитарностью "Р. Так как В не вырождена, Вх ф 0, 15
16 Лекция 2 (В*Вх,х) ~ (Вх,Вх) > 0. С другой стороны / (В*Вх,х) - (Ах,х) = \ Ski V'x,x =Si. Теперь положительность $,- очевидна. Нам удобно положить <г, = и записать доказанное утверждение в виде равенства 2 V* = VT,2V\ где ^ > О Доказанное равенство, в свою очередь, эквивалентно соотношению которое означает, что матрица Q = BV?~l унитарна, так как Q'Q - I. Теперь ясно, что для матрицы В справедливо представление В = QZV с унитарными матрицами V, Q и диагональной матрицей Е, все диагональ- диагональные элементы которой с» строго положительны. Утверждение, которое мы сейчас обосновали, может быть обобщено для вырожденных и прямоугольных матриц В. М х УУ-матрица В (М строк, N столбцов) определяет отображение у — Вх TV-мерного вектора х (элемент пространства HN) в элемент (век- (вектор) пространства Им- При этом предполагается, что в пространствах HN и Нм выбраны ортонормированные базисы, а векторы у, х представлены столбцами своих координат в этих базисах. Скалярные произведения бу- будем обозначать через {x^1\x^)hn и {у^\у^)нм- В ортонормированных базисах скалярные произведения вычисляются через координаты х\ \ уу по формулам N М • М х //-матрица В и N х М-матрица В" называются сопряженными, если {у,Вх)Им = {В'у>х)нм для любых векторов х е Нц, у € Ям-
Лекции 2 17 В случае ортонормированных базисов В* получается из В транспони- транспонированием и последующей заменой всех элементов комплексно сопряженны- сопряженными (В' = Вт). При этом оказывается, что (В*)' — В. Теорема 2.1 (о сингулярном разложении). Для любой М х N-матрицы В можно подобрать унитарные М х М-матрицу Q и N х N-матрицу V (Q'Q = Ы> 'Р*^ = In), через которые матрица В записывается в каноническом виде В = QKV*, где К — прямоугольная матрица, составленная из диагональной клетки Е и (при N ф М) клетки нулевой: К = < M N-M N }M-N N > M, N = M, N < М, N где около фигурных скобок указано число строк или столбцов у соответству- соответствующих клеток. Квадратная диагональная матрица имеет неотрицательные диагональные элементы будем упорядочивать следующим образом: о>о которые, как правило, o-i ^ ¦ - • ^ ffi ^ 0. • Числа <tj называются сингулярными числами матрицы В (или линейного преобразования В). Эти числа однозначно определяются по матрице В, несмотря на то, что однозначности для преобразований V, Q, участвующих е каноническом виде, может и не быть. Мы изложим схему доказательства теоремы о сингулярном разложе- разложении в виде последовательности сравнительно несложных утверждений, до- доказательство которых предлагается в виде задач, снабженных достаточно подробными указаниями. Задача 2.1. Если столбцы Mx/V-матрицы В линейно зависимы, т.е. су- ществует ненулевой вектор х, для которого Вх = 0, то существует унитар- ная # х Л^-матрица V\ (PfPi = In) такая, что последний столбец матрицы В\ = BV\ окажется нулевым. Указание. V\ можно разыскивать в виде преобразования отражения, как при доказательстве теоремы Шура. Задача 2.2. Для любой М х tf-матрицы В можно подобрать унитарное N х N преобразование V такое, что все ненулевые столбцы произведения
18 Лекция 2 В = BV окажутся линейно независимыми. При этом как у В, так иу В, одновременно либо существует, либо отсутствует линейная зависимость между строками. Указание. V надо строить в виде последовательности унитарных пре- преобразований, каждое из которых приводит к увеличению числа нулевых столбцов преобразованной матрицы, до тех пор, пока все остальные столб- столбцы не окажутся линейно независимыми. 1 Задача 2.3. Для любой М х W-матрицы можно подобрать унитарные N х N-матрицу V и М х М-матрицу Q такие, что произведение Q"BV будет иметь следующую блочную структуру: Q*BV = , где все столбцы и все строки клетки В линейно независимы. Указание. Воспользоваться приемами из задач 2.1, 2.2 и применить их к матрице [BV]'. Задача 2.4. Для любого ненулевого вектора Ь= (Ьц,^,--- >ЬМ)Т', всег- всегда можно подобрать унитарную М х М-матрицу Qq такую, что Qob = (/3,0,0,....0), где |Д| = -1 Указание. Опять воспользоваться преобразованиями отражения. * Задача 2.5. Для любой М\ х /Vi-матрицы В} у которой все столбцы линейно независимы и Mi ^ N\, можно подобрать унитарное Mi x Mi- преобразование Q такое, что Q'B = X 0 0 х ... х ... 0 ... X X X 0 о о где все диагональные элементы Л^ хЛ^ треугольной клетки в правой части ненулевые. Указание. Составить матрицу Q в виде произведения отражений с по- помощью приема из задачи 2.4. Из результата задачи 2.5 можно вывести, что число линейно независи- независимых строк матрицы В равно Ni и совпадает с числом линейно независимых столбцов. Такое же утверждение о том, что если все строки матрицы В линейно независимы, то число линейно независимых столбцов совпадает с числом строк, можно обосновать переходом от В к В* (или к Вт) и срав- сравнением с уже доказанным.
Лекция 2 19 В результате заключаем, что если все строки и все столбцы матри- матрицы В линейно независимы, то эта матрица квадратная (Mi = N\) и ее определитель отличен от нуля fdetS ф 0). Поэтому N\ х /Vj-матрица В представима с помощью унитарных матриц V, Q {V"P = /дт,, Q*Q = //у,) в виде В = QSP', где ? = tj >0. После этих замечаний на основе решения задачи 2.3 почти очевидно, как решить следующую задачу. Задача 2.6. Обосновать справедливость представления матрицы В, описанного в формулировке теоремы 2.1 о сингулярном разложении. Дока- Доказать, что изменения порядка сингулярных чисел на главной диагонали ? можно добиться включением в унитарные V, Q дополнительных унитар- унитарных множителей — матриц перестановок. Задача 2.7. По матрице В из формулировки теоремы 2.1 о сингуляр- ном разложении и по матрице S* составить блочную (М + N) х (М + N)- матрицу В = \ p. n c вещественными собственными значениями А;, упорядоченными следующим образом: Am+n ^ ^m+n-i ^ ... ^ А^ Дока- Доказать, что эта последовательность при М ^ N совпадает с упорядоченной последовательностью &м ^ &м-\ ^ ^ ""х ^ 0H. - - - ,0 ^ -o"i ^ ¦ ¦ ¦ ^ —о"м-1 ^ -о"аг, N — M нулеЯ а при М ^ N -с последовательностью cr,v ^ ffjv-i ^ ^ o-i ^ 0,0,... ,0 ^ -o-t ^ ^ -o-/v-i ^ -ffjv- \f — N нулей Из утверждения задачи 2.7 следует, что сингулярные числа a-j любой прямоугольной матрицы В определяются однозначно. Задача 2.8. Указать примеры матриц В (небольших размеров), которых в сингулярном разложении выбор унитарных множителей V, Q неоднозначен. В унитарном пространстве II^ естественно вводится понятие нормы ||х|| = \[х\\цы вектора по формулам \\х\\н„ = у/[х,х)-ны- При этом 1И1 ^ 0, ||х||> 0, если хфО, \\х + у|| ^ ||х|| + ||3/|f, \\Ux\\ = ||х||, если V*V = In, т.е. если U — унитарное преобразование.
20 Лекция 2 • Норма линейного отображения, задаваемого матрицей В (у — Вт., у; = N Y2 bijXj, 1 $С г $: М) и отображающего вектор х € Н.ы в вектор у б Им, определяется равенством \\Вх\\м Задача 2.9 (которая будет часто использоваться в дальнейшем). По- Показать, что , N > М. По-видимому, все или почти все факты этой и предыдущей лекций читателям известны из линейной алгебры и глав вычислительной матема- математики, посвященных алгебраическим задачам. Тем не менее, мы осветили их довольно подробно, так как они играют в дальнейшем изложении важ- важную роль и от читателей требуется свободное владение этими фактами. Дополнительный материал (в задачах) Задача Д2.1. Вычислить норму прямоугольной вещественной Bx1)- матрицы В = . . Задача Д2.2. Вычислить норму прямоугольной матрицы В~ 1 0 0 '"I 0 0 0 0 1 0 0 а2 0 0 0 0 1 0 0 0 0 Ответ. \\B\\ = -/l + [max{(Ti, иа}]2. Задача Д2.3. Доказать следующую теорему. Теорема 2.2. Норма прямоугольной составной матрицы В- 'ЛГ М\ }L - N строк вычисляется по формуле \\B\\ = \Jl + |[М||2. Задача Д'2.4. Для произвольной N х М-матрицы Л доказать сущест- существование унитарных отражений
Лекция 2 21 V, Q (V2 = V = IN,Q2 = Q = IM>V = 'P,QA = Q) таких, что у VAQ — В ненулевыми окажутся: в первом столбце - только элемент 6ц, а в первой строке — только элементы 6ц, 612: VAQ = X 0 0 X X X 0 ., X X . . . 0 X X .0 х х Указание. Надо использовать задачу ДМ аналогично, как это было сделано в задаче Д1.2. Задача Д2.5- Для произвольной N х iW-матрицы обосновать сущест- существование унитарных преобразований U, V (U'U ~ In, V*V = Ы), при которых В = U*AV оказывается двухдиагональной: В- (bij = 0, если » ^ j + 1 и i ^ j - 2). При этом можно добиться того, чтобы все ненулевые элементы были вещественны: Ьц = а,-, Ьц+1 = bi+i {aj = а,-, bi = bi). Задача Д2.6. Воспользовавшись перестановкой строк и столбцов со- составной матрицы В из задачи 2.7, доказать, что вычисление сингу- сингулярных чисел двухдиагональной N х М-матрицы В из задачи Д2.5 сводится к вычислению собственных значений вещественной сим- симметричной LxL-матрицы (L = N+M) с нулевой главной диагональю V- о о ь2 о аз аз О Уравнение Сильвестра В наших исследованиях важную роль будут играть разнообразные матричные уравнения. В качестве первого примера мы рассмотрим так называемое уравнение Сильвестра АХ - ХВ = С. B.1) В этом уравнении в качестве неизвестного выступает прямоугольная мат- матрица X, имеющая М строк и N столбцов. Такие же размеры у стоящей в
22 Лекция 2 правой части матрицы С. "Коэффициенты" А и В --матрицы квадратные. Очевидно, что они должны иметь размеры М х М и N х N соответственно (только при этом условии определены произведения АХ и ХВ, входящие в запись уравнения. Эти произведения должны быть матрицами одинаковых размеров, совпадающих с размерами матрицы С). Матричное уравнение Сильвестра можно рассматривать как систему линейных уравнений для MN неизвестных хтп элементов матрицы X, со- составленную из MN равенств N =с A М, 1 N). Лемма 2.1. Если матрицы А и В имеют одно и то же собственное значение X, т.е. det[A—XIм) ~ 0 wdet[B—А/дг] = 0, то однородное уравнение Сильвестра АХ - ХВ = О, B.2) в правой части которого стоит М х N-матрица с нулевыми элементами, имеет нетривиальное (отличное от нуля) решение X. Начнем доказательство с того, что отметим существование ненулевых (М-мерного) вектора у и (//-мерного) вектора х, являющихся собственны- собственными векторами матриц А и В и отвечающих их общему собственному зна- значению А, т.е. Ау = Ху и Втz = Xz. Заметим, что из равенства Втz = Xz вытекает равенство zTВ = XzT или, в подробной записи, [*1 Z-i . . . Zn] &21 A/Vl Xz2 . ..Xzn]. Положим X = у ¦ z1 = T _ /УЛ \ум/ У222 V2ZN 1УМ21 B.3) Тогда AX = AyzT = XyzT - XX, XB = yzTВ = y[Xz]TВ = XyzT = XX. Теперь уже очевидно, что построенная матрица X является решением од- однородного матричного уравнения B.2). Из теории систем линейных урав- уравнений известно, что если число уравнений равно числу неизвестных и од- однородная система разрешима, то неоднородная система может быть нераз- неразрешимой при некоторых правых частях. Поэтому при наличии у матриц А и В общего собственного значения можно указать матрицу С такую, что уравнение АХ - ХВ = С не имеет решения. Теорема 2.3. Если матрицы А и В не имеют общих собственных значе- значений, то неоднородное уравнение Сильвестра B.1) разрешимо при любой правой
Лекция 2 23 части С. (Из общей теории линейных уравнений известно, что такая разре- разрешимость влечет за собой единственность решения). При доказательстве этой теоремы можно ограничиться треугольными матрицами А и В, считая, что А — верхняя, а В — нижняя треугольная. В самом деле, на основании теоремы Шура мы можем подобрать унитарные матрицы V, Q (V"P = 1м, Q'Q = In) с помощью которых А, В пред- ставимы в виде А = VAqV*, В = QB0Q* с треугольными матрицами Ло и Во, на главных диагоналях которых размещены собственные значения матриц А и В соответственно. Еще раз подчеркнем, что До должна быть верхней, a Bq — нижней треугольной. Переписав теперь уравнение Силь- Сильвестра в виде VAoV*X — XQBqQ* = С, мы заменим его эквивалентным равенством, которое получается из исходного умножением слева и справа на невырожденные матрицы V и Q соответственно: AqVXQ - V'XQBo = VCQ. Если мы сумеем найти решение У уравнения AqY — УВо = VCQ, то нужное решение исходного уравнения можно вычислить по формуле X = VYQ*. Доказательство разрешимости уравнения B.1) при условии отсутствия общих собственных значений у матриц А и В удобно провести по индук- индукции. Сначала рассмотрим уравнения с матрицами небольших порядков М ^ '2, N ^ 2. При этих ограничениях для треугольных матриц А, В уравнение Сильвестра принимает один из следующих четырех видов: = Сц. Условие отсутствия общих собственных значений у матриц А, В сводится к неравенству аи ф Ьп. Уравнение разрешимо, и решение имеет вид хп = cu/(ou -6ц). 2. М = 1, N = 2: Ь2 22- Решение существует и имеет вид 6и). 3. М = 2, Лг= 1: Решение существует и имеет вид - 6ц).
24 Лекция 2 А. М = 2, Л'= 2; 1 Г _ 1 Г 1 Ti л 1 Г 1П ^12 ЖI #12 _ Хц #12 &11 U __ |С11 С12 Q22 9^ 2i Oil 7^ 2i 022 т^ "lli Ojj т^ «II- Решение существует и вычисляется по формуле - Ьп). Таким образом, при М ^ 2, Л' ^ 2 требуемое утверждение справедли- справедливо. Распространим его на большие М, N по индукции. Предположим, что мы уже доказали утверждение для любых уравнений Сильвестра с раз- размерами М, N при М ^ mj) N ^ m.j и с любыми допустимыми парами матриц А, В, не имеющими общих собственных значений. Покажем раз- разрешимость такого рода уравнений при М ^ п^ + 1, Л' ^ rnj+i, "V+i = 2mj. Случай m0 = 2 уже рассмотрен. Любая верхняя треугольная М х М-матрица А при М ^ 2ту либо является М х М-матрицей Ап (М ^ т^), либо ее можно разбить на клетки . _ \Ап Ai2 А ~ [ О А,, так, что Ап —- квадратная матрица порядка Afi ^ m_j и Л22 — квадратная матрица порядка М2 ^ trij. Совокупность собственных значений матриц Лц и ^22 исчерпывает все собственные значения А, Точно так же нижняя треугольная N х /V-матрица В при Af ^ Ъщ либо является матрицей 5П такой, что N ^mJ> либо ее мо?кно разбить на клетки П #22 с размерами Nx х N\> N2 х Л^2 (^ ^ mj} N2 ^ mj) диагональных клеток Вц, В22. При этом, очевидно, что если хотя бы у одной из матриц А, В порядок М (или N) превышают тп,-, то мы придем к одной из следующих трех форм уравнения Сильвестра: W К)" л'} \х"\ - \ХХ1} В» = [С ^22j |_^2lJ [A2]J (b) >lii[A:n^i2]™[^n^i2]F^J q2 I =[CnCl2]. лл Ин ^12 \ЛП Л12 _ An Д12 Ltfn U _ On O12 1 J L 0 ^22] [^21 ^22] [A-2i X22j [B21 B22\ ~ [C21 C22 Здесь неизвестная матрица ЛГ и правая часть С также разбиты на клетки соответствующих размеров. Ка?кдое из этих матричных уравне-
Лекция 2 25_ ний можно превратить в систему матричных равенств, которым должны удовлетворять Лу: (л ¦**22У*21 ¦Л21«11 — ^21i / л v v о У* ... ЛцЛ12 Х12В2И ¦All ^11 — ХцВц = Си + — ^22-^22 = , ч ^22^21 — ^21^11 = ^^ — ^12^22 = В каждом варианте (а), (Ь), (с) эти уравнения последовательно раз- разрешимы одно за другим. Решение каждого из них существует, так как у клеток An, Bjj по предположению отсутствуют общие собственные зна- значения, а размеры этих клеток не превышают mj x mj. Таким образом, для каждого уравнения можно найти соответствующую клетку Хц, Х^, ¦^22, Х2\ на основании предположения индукции о разрешимости уравне- уравнения Сильвестра при Ы ^ mj, N ^.mj. Тем самым завершено доказательство теоремы о разрешимости урав- уравнения Сильвестра, в случае, когда матрицы А, В не имеют общих собст- собственных значений. Клеточная диагонализация квадратных матриц В дальнейшем мы будем неоднократно использовать матричное урав- уравнение Сильвестра в различных задачах о расположении собственных значе- значений матричных операторов. Сейчас приведем пример, демонстрирующий роль решений уравнения Сильвестра при отыскании подобного преобразо- преобразования, приводящего матрицу к диагональному или клеточно диагонально- диагональному виду. По теореме Шура существует унитарное преобразование U (U*U = 7/v), с помощью которого JV х ЛГ-матрица А может быть записана в виде i х ... > А2 ... > Адг. в котором средний множитель — верхняя треугольная матрица, на диа- диагонали которой размещены собственные значения Xj = Xj{A) матрицы А. Порядок расположения собственных значений на диагонали произволен, но каждому порядку соответствует свое специально подобранное U. Разобьем все собственные значения на группы: Ai, Аг,. - - , Afc,; Хь ±.
26 Лекция 2 (fc] + k2 + . ¦ ¦ + kn = N), озаботившись только тем, что, если какое-либо собственное значение имеет кратность р, то все р копий собственных зна- значений, с ним совпадающих, попали бы в одну группу. Иными словами, в различных группах не должны присутствовать совпадающие собственные значения, т.е. должно быть А; ф \j. если они не лежат в одной группе. На основании теоремы Шура существует матрица U, для которой у множите- множителя в виде треугольной матрицы собственные значения на главной диаго- диагонали выстроятся в выбранном нами порядке, т.е. сначала А], А2,... , Ai, из первой группы, затем — Л*1+1, АА1+2,. -. ,Afcj+(t2 из второй группы и т.д. Затем разобьем треугольную матрицу на прямоугольные клетки ГА, х А2 Л 22 Л2п так, чтобы диагональные клетки Ajj оказались квадратными: An ~ X ... X A2 ... x i-l+1 0 ¦ A Иными словами, теорема Шура позволяет утверждать существование кле- точно треугольного представления A = U 'Ап х А-22 О А2п Ann где квадратные диагональные клетки Ац и Ajj при i ф j не имеют общих собственных значений, а собственные значения матрицы А размещены по этим клеткам произвольным, заранее заданным способом. Оказывается, что можно добиться дальнейшего упрощения вида кле- точно треугольной матрицы в рассматриваемом представлении, однако це- ценой того, что унитарные взаимно-обратные множители U, U" = U'1, при- придется при этом заменить матрицами Т, Т'1, которые совсем необязательно будут унитарными. Существенно, что Т должна быть матрицей невырож- невырожденной, чтобы обеспечить существование обратной Т~1.
Лекция 2 27 Сначала клеточно треугольную матрицу 'А х АХп * А2п в которой клетка Ац имеет размер &i x fcb запишем в виде Ап О используя обозначения С\ = Ann Очевидно) что Ац и В\ не имеют одинаковых собственных значений. Те- Теперь постараемся подобрать ki x (N - &1)-матрицу Ль так, что О Bv Ли С, О 5i /*, 0 Л, Очевидно, что нужное нам Ht должно быть решением уравнения Сильвест- Сильвестра AuRi - RiBi = -Ci, которое однозначно разрешимо, поскольку Ли и В\ но имеют общих собственных значений. Воспользовавшись равенством о iN-k -lN и обозначением
28 Лекция 2 приходим к выводу о том, что X .., X **1л A22 ... x A2n An 0 0 0 ... 0 О Л22 -423 x ¦ ¦ ¦ A2n Азз : : Азп wl Для дальнейшего клеточно треугольную матрицу 'An 0 0 0 зз Алп удобно представить схематично как А2 С3 О Ih An О О А22 О О 42з А24 В-) = Азз ¦"пц. Очевидно, что клетки А2 и В2 не имеют общих собственных значений. По- Повторяя почти дословно все рассуждения, проведенные при построении мат- матричного множителя Si, мы установим существование матрицы S2 (detS2 =
Лекция 2 29 1) такой, что А2 С2 О В2 и, следовательно, ц х An О О А22 х А2п 33 О лл ... A лп Апп ¦ A3n ¦ A4n Пользуясь описанным приемом можно продолжить последовательное ан- аннулирование клеток Aij справа от главной клеточной диагонали путем по- построения матричных множителей S2,54l... ,Sn-i (det Sj = 1). В результа- результате получаем представление и гл, = 5l^2 ¦ . -Sn-l -1 o n-l ' ' ¦'-'2
30 Лекция 2 = USiS2.-Sn-i (очевидно, что jdetT| = \det(J\ = 1, delT 0), мы завершаем доказательство равенства А = Т -1 B.4) Теорема 2.4. Для произвольной матрицы А существует невырожденное подобное преобразование, приводящее А к клеточно диагональному виду, та- такое, что собственные значения матрицы А оказываются размещены заранее выбранным допустимым способом по диагональным клеткам Ajj. Будем говорить что размещение допустимо, если у любых двух раз- различных клеток не существует общих собственных значений. В частности, можно добиться того, что в каждой клетке все собственные значения ока- окажутся одинаковыми, а размер клетки будет совпадать с кратностью ее собственного значения. Некратным собственным значениям при этом бу- будут отвечать 1 х 1-клетки, т.е. числа.
Лекция 3 Уравнение Ляпунова и гурвицевы матрицы. Схематичное изложе- изложение теории устойчивости обыкновенных дифференциальных урав- уравнений. Случай постоянных коэффициентов и построение интег- интегрального представления решения матричного уравнения Ляпунова. Аналог теоремы Ляпунова в случае дискретных векторных после- последовательностей. Уравнение Ляпунова Мы начинаем изучение одного важного частного случая уравнения Силь- Сильвестра -— матричного уравнения Ляпунова, которое играет важную роль в исследовании устойчивости решений дифференциальных уравнений. Тео- Теория устойчивости широко используется в различных технических прило- приложениях. Целый ряд ее принципиальных положений основан на фактах из линейной алгебры. Матричное уравнение Ляпунова ХА + А'Х + С = 0 C.1) является уравнением Сильвестра, где "коэффициенты" А, А", неизвест- неизвестная X и "правая часть" С суть квадратные матрицы одинаковых разме- размеров N х N. Чтобы уравнение C.1) было однозначно разрешимо при лю- любой правой части С, необходимо и достаточно, чтобы матрицы А и -А" не имели общих собственных значений. Это утверждение следует из об- обоснованного выше критерия разрешимости уравнении Сильвестра. Если АЬА2,... ,An — полный набор собственных значений Xj(A) матрицы А, то полный набор собственных значений матрицы (-А') состоит из ХЛ-А*) = -А: (А), Х2(-А') = ~Х2(А),..., \N(-A') = -XN(A). (Читателю рекомендуется убедиться в этом самостоятельно.) Поэтому критерий безусловной разрешимости уравнения Ляпунова эквивалентен условию Х{(А) + \j(A) 4- 0 при любых i, j. Очевидно, что этот критерий заведомо выполнен, если все собственные значения Xj{A) матрицы А лежат строго в левой комплексной полуплоскости (Re А,(Л) < 0, i = 1,2,... , N), Для проверки справедливости этого достаточного условия безусловной разре- разрешимости часто употребляется критерий Гурвица. а сами матрицы А, весь спектр которых расположен строго в левой комплексной полуплоскости, называются гурвицевыми. Отметим еще один важный факт. 31
32 Лекция 3 Если А — гурвицева матрица и С — эрмитова матрица (С = С), то решение X уравнения Ляпунова C.1) эрмитово (X — X"). Действительно, если X удовлетворяет C.1) то, применив операцию сопряжения к левой части, [ХА + А*Х + С\* = А'Х* + Х*А + С" = Х*А + Л* Л" + С = 0. Поэтому как X, так и X', удовлетворяют одному и тому же уравнению Ля- Ляпунова, подчиненному критерию безусловной однозначной разрешимости. Отсюда следует X = X*. D Напомним некоторые факты из теории обыкновенных дифференци- дифференциальных уравнений с постоянными коэффициентами. Для любого вектора z^ € #л/ существует непрерывно дифференциру- емое по t решение x{t) векторного уравнении -—- = Ах с начальным усло- dt вием г@) = *^°)( представимое в виде *М = е"*С°\ C.2) где матрица etA, называемая матричной экспонеитой, может быть вычис- вычислена при любом конечном t с помощью сходящегося ряда fc=l Можно доказать, что etA не вырождена при любом t, какова бы ни была матрица А. Если А — гурвицева матрица, т.е. ReXj(A) ^ -8 для всех собственных значений матрицы Л, то существует константа р = ц(А) > 0 такая, что Пусть С = С* — положительно определенная матрица, т.е. (Сх,х) ~f(x,x), где 7 > 0. С помощью С и etA построим квадратичную форму матрица etA'CetA которой при любом t положительно определена. Для гур- вицевой матрицы А при некоторых 6 > 0, р. > 0 справедливы оценки (t > 0) обеспечивающие сходимость матричного интеграла (еы*Се1А = Х. C.4)
Лекция 3 35 Так как е<'+7->л = etAerA и е<е+г)д* = етА'etA' ,1 имеем оо со f dtetA*CetA = етА' \ f dtetA'СегА\етА, C.5) О dr оо = A'eTA'\fdtetAtCetA\erA+eTAt\[dtetA*CetA\eTAA. C-6) о о При г = 0 равенство C.6) принимает вид уравнения Ляпунова C.1). Таким образом, для гурвицевой матрицы А мы не только установили разреши- разрешимость C.1), что уже было сделано выше, но и получили для него явную формулу в виде интегрального представления C.4). Так как подынтег- подынтегральная матрица ем*Сем при любом t положительно определенная, поло- положительно определенной будет также матрица X: (Хх,х) ^ Цх,х), 4 > 0. Мы наметили, опустив технические детали, схему доказательства следую- следующей теоремы Ляпунова. Теорема 3.1 (первая теорема Ляпунова). Если А — гурвицева матрица и С — С* — положительно определенная матрица, то единственное решение X уравнения Ляпунова C.1), представимое в виде матричного интеграла C.4), является эрмитовой положительно определенной матрицей. Из соотношений -п{Хх,х) = ~{Сх,х) < al ¦ вытекают неравенства (t ^ 0) Если Aj0 = Aj0 (A) — какое-либо собственное значение матрицы А, а а(о) — соответствующий собственный вектор (Аа(°> — А;о(Л)а^0^), то реше- 1Вообще говоря, елев
34 Лекция 3 ние x{t) уравнения с начальным условием i@) = а@) C.8) дается формулой и при этом \\x(t)\\ = ||a^°'|[etReA«. Поэтому j|a@)||etReA>o ^ уа( что возможно лишь при ReAj0 < 0 и, более того, при Итак, мы доказали следующее утверждение. Теорема 3.2 (вторая теорема Ляпунова). Если существуют положительно определенные эрмитовы матрицы X = X" > 0, С = С* > 0, связанные с матрицей А уравнением Ляпунова C.1), го матрица А гурвицева и все ее собственные значения Xj(A) лежат в полуплоскости ReA < — . ... . — < *№ П1|л|| 0. Уточним неравенства, полученные при доказательстве этой теоремы. Оценки с нормой \\X\\ решения X матричного уравнения Ляпунова Из представления матричной экспоненты C.3) следует 1 e-2|t|||A|] (?tAr Гр1Ат\ — (CptAr ptAr\ > \\rtAr\\2 > - \\C 4] \\C '¦Ц Поэтому с-а|*|1И11Л, , (Х ,) r j ЦС-М 0
Лекция 3 35 Эти оценки позволяют неравенство для я(«), полученное при доказательст- доказательстве теоремы, переписать следующим образом: 1М*)Н Часто удобно при выяснении, является ли данная матрица А гурви- цевой, в качестве правой части уравнения Ляпунова рассматривать С = 2||Л||/. Тогда X — это решение уравнения ХА + АвХ + 2\\А\\1 = 0, кото- которое в случае гурвицевой матрицы А не только существует, но и является положительно определенной матрицей. Норма ||A"|j = н(А) такого решения участвует в оценке удобной для использования в приложениях. Дискретное уравнение Ляпунова Приведем еще один важный пример уравнений, теория которых осно- основана на свойствах уравнения Сильвестра: X -А*ХА = С, (ЗЛО) где X, А, С — квадратные N х TV-матрицы. Это уравнение использу- используется в теории устойчивости рекуррентных последовательностей, элемен- элементы которых — векторы Xj — связаны линейными соотношениями Xj — Axj-i + b. При анализе таких последовательностей роль матричного урав- уравнения X — А*ХА = С аналогична роли уравнения Ляпунова C.1) в изуче- изучении устойчивости функций "непрерывного" аргумента, удовлетворяющих дифференциальному уравнению dx На основании этой аналогии уравнение X — А'ХА = С называется дискрет- дискретным уравнением Ляпунова. Теорема 3.3. Если все собственные значения N х N-матрицы А лежат внутри единичного круга, то матричное уравнение C.10) имеет единственное решение X. Если при этом С = С*, то X = X*. Более того, если С = С* — положительно определенная матрица, то X — X* также положительно определенная. Для доказательства этой теоремы понадобится следующая Лемма 3.1. Если все собственные значения N х N-мвтрицы А нулевые, то AN = 0. Доказательство. На основании теоремы Шура матрица А может быть представлена в виде А = UAqU*, где U — унитарная матрица, а Ац —
36 Лекция 3 верхняя треугольная с нулевой главной диагональю: ГО х О Q X X 0J Поэтому AN = [UAoUm][UAotr] ¦ -. [VAolT] = VA$U\ Ненулевые элементы, если они существуют, матрицы Ао расположены на N — 1 диагоналях, лежащих выше главной. (Последняя из этих диаго- диагоналей состоит только из одного элемента (-Ao)in-) Пользуясь правилом перемножения матриц, нетрудно убедиться, что А\ будет также верхней треугольной, но ее ненулевые элементы могут лежать только на N — 2 диа- диагоналях, так как диагональ, ближайшая к главной и примыкающая к ней сверху, окажется у А% также нулевой. Вычисляя по индукции А% = -ЛоЛд, А% = AqAq, ... , А$ = АоА?~1, и пользуясь правилами матричного умноже- умножения, можно убедиться, что все возможные ненулевые диагонали матрицы А% = ЛоЛ^ расположены в верхнем правом углу, а число N— р этих диаго- диагоналей на единицу меньше, чем у матрицы Арй~1. В частности, все элементы матрицы Aq окажутся нулевыми и, следовательно, А$ = 0. Приведем схе- схематическое изображение матриц А% в случае N = 4: Ао = Al = О х х х О 0 х х О О О х 0 0 0 0, 0 0 0 х 0 0 0 0 0 0 0 0 0 0 0 0 AN — 0 0 х х 0 0 0 х 0 0 0 0 .0 0 0 0. 0 0 0 0' 0 0 0 0 0 0 0 0 0 0 0 0 Теперь уже очевидно, что AN = UA$V* = UW - 0. Q Следующая лемма содержит утверждение о свойствах решения дис- дискретного уравнения Ляпунова. Лемма 3.2. Если все собственные значения N х N -матрицы А нулевые, то дискретное уравнение Ляпунова (ЗЛО) разрешимо при любой матрице С в правой части. Доказательство. Выпишем явную формулу для решения X: X = С + А*СА + {А'JСА2 + .., + {A*)N-lCAN~l. C.11)
Лекция 3 37_ В силу леммы 3.1 AN = О, (A')N = О, {A*)NCAN = О, А-К А = А*СА + [A'fCA2 + ... + {A')N-lCAN~l + (A*)NCAN = АШСА + {A'fCA2 + ... + {A')N~lCAN-1. Поэтому очевидно, что матрица X вида C.11) действительно удовлетворя- удовлетворяет уравнению C.10). D Лемма 3.3. Если N х N-матрица А не вырождена {detA ф 0) и все ее собственные числа Xj (А) лежат строго внутри единичного круга комплексной плоскости (|Aj-(>l)| < 1, j' = l,2,...N}, то дискретное уравнение Ляпунова (ЗЛО) разрешимо при любой матрице С в правой части. Доказательство. Заменив уравнение (ЗЛО) равенством ХА~Х — А*Х = СА~1, которое эквивалентно в силу невырожденности А, и заметив, что > l iAD*)l |XD)I 1( те- матРицы А~х и А" не имеют общих собственных значений, можно воспользоваться критерием разрешимости уравнения Сильвестра, из которого следует разрешимость в нашем случае. D Оказывается, что требование невырожденности А в критерии разре- разрешимости дискретного уравнения Ляпунова, приведенное в лемме 3.3, из- излишне. Ниже показано, как можно от него освободиться. При первом чтении это доказательство, можно пропустить. Отступление По теореме Шура каждая матрица А, у которой все собственные значения Xj(A) лежат строго внутри единичного круга, а некоторые из собственных значений «? л тт \А\\ А\2\ ттл тт равны нулю, может быть представлена в виде А ~ и п . и , где и — [ ] унитарная матрица, все собственные значения квадратной клетки А22 нулевые, а все собственные значения квадратной клетки Ап отличны от нуля и распо- расположены строго внутри единичного круга. Вместо неизвестной матрицы X мы будем искать матрицу Очевидно, что зная У, мы сумеем определить X, так как X = UYU*. Уравне- Уравнение X - А"ХА = С, переписанное в виде UYU* - A*UYU*A = С, очевидно эквивалентно уравнению У — [U*AU]*Y[U'AU] = U*CU. Обозначив тт*CU - \Dn и ьо —
38 Лекция 3 перепишем уравнение для У, используя клеточное разбиение входящих в него матриц |Yu У«1 _ Мн 0 1 \Уп Уп] Mu A»l _ \Dn D12] [У21 V22J [А;2 Л52] [У21 y22j [ О >L22J [D21 D22\ ¦ В свою очередь, как нетрудно проверить, ввиду невырожденности Ац и А*х эта запись эквивалентна следующей системе для Уц, yi2, У21, Y22: У22 — -^22^22-^22 = -^22 + Л 12^12-^22 + -<4 22^21 Л12 Разрешимость устанавливается сначала для первого уравнения этой сис- системы, затем для второго, потом для третьего и, наконец, для четвертого. В правую часть каждого последующего уравнения могут входить решения всех предыдущих. Разрешимость первого и последнего уравнений вытекает из дока- доказанных выше лемм 3.2 и 3.3 соответственно, а второго и третьего — из критерия разрешимости уравнения Сильвестра (теорема 2.3). ¦ Итак, разрешимость матричного уравнения для У, а следовательно и уравнения X -А*ХА — С при любой правой части С установлена. Единст- Единственность решения вытекает из разрешимости при любой матрице С (Дис- (Дискретное уравнение Ляпунова можно переписать покомпонентно в виде сис- системы из N2 линейных уравнений для N2 элементов хц матрицы X. Мы уже указывали при доказательстве теоремы 2.3, что разрешимость такого рода линейной системы влечет единственность решения.) Заметим, что если "правая часть'* С — эрмитова матрица (С = С), то и решение X дискретного уравнения Ляпунова X - А*ХА = С является эрмитовой матрицей (X = X"). В самом деле, применив к обеим частям уравнения X ~ А*ХА = С операцию сопряжения, мы установим, что X" удовлетворяет уравнению X* — А*Х'А = С — С. Вследствие единствен- единственности решения X = X*. Для доказательства утверждения о том, что из положительной опреде- определенности матрицы С — С" следует положительная определенность матрицы X, удобно использовать бесконечный ряд X = С + А*СА + (Л*JСЛ2+ ..., который является обобщением формулы представления решения (см. лем- лемму 3.2) в случае, когда все собственные значения матрицы А нулевые и ряд оказывается конечной суммой. Если для степеней А и А* мы имели бы оценку \\АП)\ ~ ||[Л*)Л|| ^ /ipn (/х > 0, 0 < р < 1), то сходимость ряда бы- была бы обеспечена. Тогда мы могли бы воспользоваться тем, что слагаемые [А']ПСАП — неотрицательно определенные матрицы, а С = С* — поло- положительно определенная матрица, и, следовательно, сумма таких матрицы будет положительно определенной матрицей. Нетрудно проверить, что в случае сходимости сумма ряда X является решением изучаемого уравне- уравнения. Единственность решения при сделанном предположении |А7-(Л)| < 1 уже была доказана. Задача 3.1. Доказать оценку ||А|| ^ fipn, если |А^(Л)| < 1 при всех j.
Лекция 3 ?? Указание. Использовать преобразование Шура матрицы А к треуголь- треугольному виду и добиться нужной малости внедиагональных элементов тре- треугольной матрицы последовательным подбором нормирующих коэффици- коэффициентов для базисных векторов. На этом мы завершаем обоснование теоремы о разрешимости дискрет- дискретного уравнения Ляпунова. Приведем еще две важные леммы, которые так же, как и доказан- доказанная теорема, являются аналогом утверждений о решениях "непрерывного" уравнения Ляпунова. Лемма 3-4. Если существуют эрмитовы положительно определенные мат- матрицы К = К* > О, С = С* > 0, связанные равенством К — В*КВ = С, то все собственные значения \j(B) матрицы В по модулю строго меньше 1 (|) Доказательство. Выбрав какой-либо вектор /, положим z0 = f, zj = {j = 1,2,3,...)- Тогда 0 ^ {Czj.zj) = (Kzjtzj) - (B'KBzj}Zj) = (Kzitzj) - (KBzj,Bzs) откуда 0 ^ (Kzj+i,zj+i) = (Kzj,zj) - (Czj,zj). Заметим, что и выведем оценки О ^ (Kzj+l,Zj+i) ^ {KzjtZj) - l-——-—\(KzjtZj)t ИЛН11° II I 11*11 ||с- В частности, если Bf = А/, т.е. если А — какое-либо собственное значение, а / — соответствующий ему собственный вектор матрицы В, то Bkf = Afc/, zk = Xkf. При этом откуда и следует неравенство доказывающее лемму. D Лемма 3.5. Если существуют эрмитовы положительно определенные мат- матрицы К = К* > О, С = С* > 0, связанные равенством К — В* К В — —С, то
40Лекция 3 все собственные значения Aj(?) матрицы В по модулю строго больше чем 1 1). Доказательство. Очевидно, что В'КВ = К + С — положительно опре- определенная матрица, и поэтому В не вырождена. Переписав равенство из условия леммы в виде К ~ В~*КВ~Х = В~*СВ~1, заметим, что оно от- отличается от соотношения К - В'КВ = С из лемме 3.4 лишь В •-» В~1, С ^ В~*СВ~Х (это тоже эрмитова положительно определенная матрица). На основании леммы 3.4 JAj(^-1)f < 1 или, что то же самое, |Aj(B)| > 1. О Напомним (см. лекцию 2), что если все собственные значения мат- матрицы В меньше 1 по модулю, то матричное уравнение X - В*ХВ ~ Р однозначно разрешимо при любой матрице F в правой части и при этом, если F = F*, то X = X*. Аналогичное утверждение справедливо и тогда, когда все собственные значения матрицы В лежат строго вне единично- единичного круга. При этом уравнение У - В* У В = ~F эквивалентно уравнению У-B~"YB~l = B~*FB~l, однозначная разрешимость которого следует из предыдущего утверждения. Лемма 3.6. Если какие-либо эрмитовы положительно определенные мат- матрицы К — К* > 0, С = С* > 0 связаны одним из равенств К - В*KB = +С или К — В* К В = —С, то матричное уравнение X — В*ХВ = F однозначно разрешимо при любой F и при этом, если F — F", то X — X*.
Лекция 4 проекторы и их свойства. Проекторы на инвариантные подпро- подпространства. Интегральная формула для инвариантного проектора. Дихотомия матричного спектра. Интегральный критерий дихото- дихотомии и его обоснование. Круговая дихотомия и оценка соответству- соответствующего проектора. Дополнительный материал в задачах. Проекторы • Линейный оператор V, действующий на векторы N-мерного пространства и отображающий их в векторы того же пространства, называется проекто- проектором, если V2 ~ V. Очевидно, что проектор изображается квадратной N х /V-матрицей. Пусть А является собственным значением проектора V, т.е. пусть существует ненулевой вектор х такой, что Vx = Хх. Так как V2x = XVx = Х2х и Ах = Vx = V2x = Х2х, имеем (А - Х2)х = 0 а, следовательно, А - А2 = АA — А) = 0. Таким образом, проектор может иметь в качестве собственных чисел только А = 0 или А = 1. На основании теоремы Шура V допускает каноническое представление I U22 с унитарными N x ЛГ-множителями U, U*, в котором квадратные N\ x N\ и N2 x /У2-нлетки ?>ц и ?J2 имеют в качестве собственных значений, соот- соответственно, только единицу и нуль (Ni + N2 = N); Xj(Du) = 1, Aj(D22) = 0. Отсюда, в частности, следует, что D22 является нильпотемтной матрицей: D^i = 0 (см. лемму 3.1). Воспользуемся каноническим представлением D.1) и равенством V2 = V из определения проектора: 0 D22\" ^ [ 0 D22\U* ~и \ 0 ?>22| | 0 D2U DnDl2 + D12D22\ ц. = v = u откуда следуют равенства Оц = D\x и D22 — D\2. Очевидным следствием будут также равенства D22 = D\2 — D\2 = ... = D%?. Так как D?J = 0, имеем D22 = 0. Итак, у клетки D22 не только все собственные значения, но и все ее элементы нулевые. 41
42 Леиция 4 Все собственные значения клетки ?>ц равны единице, а все собствен- собственные значения клетки Du—In1 —нули: Xj(Du— /^,) = 0. В силу D\} = D\\ (?>„ - /jv, J = D2U - 2Dn + /jv, = Dii " 2Ai + /* = ~{Dn - JNx), Матрица Dn — IwL нильпотентна, так как все ее собственные значения нулевые: (Dn - /w,)Nl = 0. Теперь ясно, что Dn — /^ = 0 и Dn = /n,- Мы доказали, что проектор V в комплексном евклидовом пространстве допускает каноническое представление <Т> - П \IN^ Щ Г!' TJ-JJ - Г 0 0 ' и и — jh- Непосредственная проверка показывает, что каждая матрица, имеющая та- такое представление, является проектором: Ь *{}-=V. D.2) Если V — проектор, то I — V = 1^ — V тоже будет проектором, как это очевидно из равенств Любой вектор х представим в виде суммы х = y+z, где у = Vx, z = (I— V)x, т.е. в виде суммы двух векторов, которые лежат в подпространствах, на которые операторы V и (/ — V) проектируют все исходное пространство. Из равенства ФA — Т>) = {1 — V)V = 0 следует, что эти пространства не пересекаются. Из представлений нетрудно вывести, что размерности Ni и N% = N~Ni подпространств образов операторов V и I — V, могут быть вычислены по формулам N2 ~tt{J~V) = rank(/ - V). D.3) Из равенств Q]u; справедливых, если Ni > 0 и iV2 > 0 одновременно, следует, что норма \\п = V\\ совпадает с нормой любой из составных матриц [INl М], М
Лекция 4 43 Используя результат задачи Д2.3, получаем важное равенство l. D.4) При этом \\V\\ = 1 только тогда, когда клетка Ы нулевая, и в этом случае V = V. Если N\ либо N2 равно нулю, то Р — 0 либо V — 1. При этом всегда V = V и \\V\\ ^ 1. Итак, из неравенства ||"Р|| > 1 следует V ф V. Если V = V*, то для любых векторов х, у справедливо равенство (Рх, [/ - V)y) = ([I - V')Vx, у) = {[V - V2]x, у) = О, означающее, что подпространства, на которые осуществляют проектиро- проектирование операторы V} I - V, в этом случае взаимно ортогональны. • Оператор V — V2 = V называется оператором ортогонального проектиро- проектирования или ортогональным проектором. Напомним, что ненулевой проектор V ф О, V2 — V, всегда имеет нор- норму, не меньшую единицы (\\V\\ ^ 1) и равенство \\V\\ — 1 выполняется только тогда, когда V — V*, т.е. когда Ф — ортогональный проектор. Еще одно свойство проекторов указано в следующей теореме. Теорема 4.1. Если V\ и Vi — два проектора таких, что \\Vi - Р3\\ < 1» то trPi = trTV Иными словами, V\ и Vi осуществляют проектирование на подпространства одинаковой размерности. Доказательство. Сначала заметим, что матрицы I-V1+V2 и не вырождены ввиду неравенств (р = \\~Pi - - Va)]x\\ } [\х\\ - |[(Pi - Pa)i|| ^ A - р)\\х\\. Ввиду невырожденности ранги произведений V^I-Vi+Vi) и совпадают с рангами их первых множителей V\ и Р2. rank Pi =Ta.nk{Vi{I-Vi+V2] = Ta.nk[V1 - V\ + ViV2] = rank "Pi P2, / -V2 + V\] = rank[7>2 -V\ + V2VX] Как известно, ранг произведения матриц не превышает минимального ран- ранга сомножителей: rank Pi = rank V\ V2 $ min{rank7>i, rankP2}, — rankP2Pi Последние неравенства совместны лишь тогда, когда rankPi = rank7^, т.е. когда UPi = trP2. D Инвариантные проекторы Если спектр какой-либо квадратной N х //-матрицы А можно раз- разбить на две непересекающиеся части, то согласно следствию теоремы Шу- Шура можно представить матрицу А в виде
44 Лекция 4 где клетки Ац и Л22 размеров N\xN\ и N2 x N2 не имеют общих собствен- собственных значений. При этом векторы, компоненты которых образуют столбцы прямоугольных N х Ni-лпетки 7\ и N х Л^2-клетки 7а, составляющих пре- преобразующую матрицу Т: Т = [7\ :7а], будут базисами инвариантных для А подпространств, отвечающих тем собственным значениям матрицы Л, которые входят в спектры клеток Ац и An соответственно. Например, если Т— \Г\\Г2], то проекторы 1-1 осуществляют проектирование на линейные оболочки столбцов матрицы Т, входящие в Ti и Т2, т.е. на инвариантные подпространства матрицы Отметим, что выбор базиса в пространстве неоднозначен. Например, если столбцы прямоугольной матрицы Т\ образуют базис некоторого под- подпространства, то столбцы матрицы 5\ = TiA'i также являются базисом этого же подпространства при любой невырожденной квадратной N\ x ЛГГ матрице Ki. Задача 4.1. Проверить, что V2 = V, т.е. V и I — V являются проекто- проекторами, и эти проекторы не изменятся, если базисы Т\ и Т2 заменить на Т\К\ и Т^Кг с невырожденными N\ х ^-матрицей К\ и N2 х ^-матрицей Х2- Проектор V является проектором на некоторое инвариантное подпро- подпространство матрицы Л, если AVz = VAVx для любого вектора х, т.е. Л?3 = VAV, Если дополнительный проектор I-V также осуществляет проектиро- проектирование на инвариантное для А подпространство, то A{1~V) = [I—V)A{I—V). Упростим последнее равенство и тем самым покажем, что оно эквивалент- эквивалентно равенству VA = VAV. Имеем А{1-V) = (I~V)A{I-V), A-AV = A-VA-AV+VAV, Q = VAV-VA. Итак, если V и I — V суть проекторы иа инвариантные для матрицы А подпространства, то AV = VAV и РА = VAT и, следовательно VA = AV — т.е. проектор V, так же как и проектор I — V, коммутирует с А ({/ — V)А = A{I~V)). Наоборот, еслиТ2 = 9 иТ>А = AV, toVAV ~V-VA = V2A = VA и VAV -VAV = AV2 - AV и, следовательно, V и I -V проектируют на инвариантные для А дополнительные друг к другу подпространства. • Если V2 — V и одновременно VA = AV, то V называется инвариантным проектором для матричного оператора А.
Лекция 4 45 Интегральные представления Для изучения и вычисления инвариантных проекторов часто исполь- используется аппарат интегральных представлений, основанный на теории функ- функций комплексного переменного. Предположим, что 7 — гладкий контур без самопересечений на плос- плоскости комплексного переменного А и этот контур делит плоскость две час- части — внутреннюю и внешнюю. Если внутри области, ограниченной кон- контуром 7, и на нем самом нет ни одного собственного значения А матрицы А, то все матричные элементы матрицы [XI - А]~1 будут регулярными аналитическими функциями на контуре -у и внутри области, ограничен- ограниченной контуром 7- По теореме Коши интеграл по такому контуру от любого элемента Я^(А) матрицы Я(А) = [XI — А] равен нулю. Это утверждение можно записать в виде символического матричного равенства <?dXR{X)=L ?dX[XI-A]-l = Q. D.6) i i В другом предельном случае — контур 7 охватывает все собственные значения А матрицы — вычисление интеграла <?d\[\I-A}-1 D.7) также не представляет большого труда. Действительно, вне области, огра- ограниченной этим контуром, все элементы матрицы R(X) = [XI — А} будут регулярными аналитическими функциями и на основании теоремы Коши интеграл D.7) не будет меняться при расширении контура -у. Например, не меняя значения интеграла D.7), можно превратить контур у в окружность достаточно большого радиуса р: ?dX[XI-A]~l= ( d{peiv)-\peivl - А] = : f ddl- — л] . При р j > 1ИН -!' Поэтому имеем \\ Р J Р 1 г e->V I L р ' \ р [ + р h\ 3=0 '1ИИУ 1И1 ч р ; p(i-W/p) 21ГЦЛЦ 45 р{\ - \\А\\/р)'
46 Лекция 4 lldXlXI-A]-1- рA-\\а\\/рУ Так как изучаемый интеграл по контуру -у не зависит от р, то можно быть уверенным в том, что если область, ограниченная 7. содержит все точки спектра матрицы А. Несколько раньше мы уже показали, что если внутри 7 нет ни одной точки спектра, то ^-. ?dX[XJ-A)-1=0. 2т J В общем случае предположим, что А допускает каноническое пред- представление D.5), где все собственные значения клетки Ац лежат внутри области, ограниченной 7> а точки спектра An — вне этой области. При этом = Т = Т 2-, <f> d\[\INl - J-. 1-1 о o Оказалось, что вычисляемый интеграл равен инвариантному проектору на инвариантное для А подпространство, отвечающее всем точкам спектра А, лежащим внутри области, ограниченной контуром 7- Матрица Я(А) == [XI —А]'1, зависящая от комплексного параметра А, в интегральном представлении инвариантного проектора, часто использует- используется в теории линейных операторов. Она называется резольвентой матрицы А. Дихотомия спектра Чтобы интеграл вида ф dXf{X) • (XI — A)~l по какому-либо контуру 7 7 имел смысл, естественно требовать, чтобы /(А) на этом контуре 7 была ограничена и чтобы контур 7 н^ проходил через собственные значения Xj(A) оператора А. (В точке А = Xj резольвента (XI -А)'1 не определена, а в окрестностях таких точек ее норма не ограничена.)
Лекция 4 ?7 • Будем говорить, что замкнутый самонепересекающийся контур 7, на котором ||(А7 — J4J х |{ ограничена, осуществляет дихотомию спектра мат- матрицы А, т.е. деление этого спектра на две части, одна из которых лежит внутри, а другая вне области, ограниченной контуром у. Конечно, та или иная из этих частей спектра может оказаться пустой. Наряду с замкнутыми контурами конечной длины /7 мы будем рассмат- рассматривать иногда некоторые контуры бесконечной длины, уходящие на бес- бесконечность. Типичным примером является прямая Re A = а комплексной плоскости. Если на такой прямой резольвента (XI — Л) ограничена, т.е. ||[(а + it)I — А]\\ ^ т, то эта прямая осуществляет дихотомию спектра матрицы А, т.е. разделяет собственные значения \j[A) на две группы, в одной из которых ReXj(A) < а, а в другой — Re\j(A) > a. Каждому контуру 7 сопоставим эрмитову форму = <? \\{\I-Aylx\\2\d\\= (через \d\\ обозначен элемент длины контура). Матрица ,/7 этой квадра- квадратичной формы также задается интегралом D.8) ч В частности, если 7 — прямая X — a + it (-со < t < +oo), то = /" dt[(a - it)I - A']~l[(a + И)I - А)'1. В качестве числовой характеристики "качества дихотомии" спектра будем использовать норму ||J7|| или след tr/y матрицы J7. Этот выбор обусловлен неравенством А€7 где 1-, — Ф \dX\ — длина контура. Для контура у вида Re A = а бесконечной длины /7 = оо оценка принимает совсем простой вид Приведем несложное доказательство анонсированного неравенства меж- между гти,(А) и ||J7||. Ограничимся случаем замкнутого контура ограниченной длины. Слушателям настоятельно рекомендуется внести необходимые из- изменения в доказательства для случая контура вида Re A — а.
48 Лекция 4 Выберем на у точку Ао G 7 такую, что ||(Ао/ — Л)"!! = тах||(А/ — Л)!! = пъу(А). Если длина /7 конечна и (А/- А) определена на всех точках контура, то такая точка Ао существует. Если бы оказалось, что на контуре есть точка Аь в которой (XI — А)'1 не определена, то А = Ai обязано быть собственным значением матрицы А. Иными словами, det(Ai/ — A) = 0. При этом где В(Х) — матрица союзная к XI — А, т.е. составленная из элементов, каждый из которых — алгебраическое дополнение к соответствующему элементу XI — А. Все элементы В(Х) •— полиномы от А. Если Ai — соб- собственное значение кратности р, то det[A/ - А] = (А - Aj)p ¦ q(X), q(Xx) ф 0. Кроме того, среди элементов союзной матрицы В[Х) должны существо- существовать элементы, которые не делятся нацело на (А — Ai)p, так как в про- противном случае (Xil — A)~l была бы определена. Вышесказанные сообра- соображения приводят к выводу, что в некоторой окрестности точки А = Х\ \\(Х1 - .А)!! ^ const [A - Aii и существует такой вектор х ф 0, для ко- которого ||(А/ - A)~*z||2 ^ const/|A - Ai|2 в этой окрестности. Поэтому на гладкой кривой 7, проходящей через точку А = Ai, интеграл не может быть ограниченным. В этом случае принято считать ||^|| = оо. Итак, при Ц^Ц < оо на 7 существует точка Ао с требуемыми свойст- свойствами и существует ненулевой вектор xq такой, что ||(Ы - A)-*xQ\\ = т,И) ¦ |Ы, пь(Л) = тах||(А/ - ^)-ж||. Легко убедиться в справедливости равенства (XI - А)~1 — (Ао/ — А)~1 = (Ао - А)(А0/— А)~1(А/ — А)'1, из которого при произвольном А имеем : ^^ Пусть теперь точка А лежит на контуре 7 и ее можно соединить с точкой Ао дугой этого контура, причем длина такой дуги равна s(X). Оче- Очевидно, что |А - Ао| ^ в(А), и поэтому Обозначим через А'о самую удаленную от Ао точку нашего контура.1 Точки Ао и Х'о разбивают контур на две дуги 71 и 72, каждая из которых имеет 1Иоа удалением одной из точек контура от другой мы понимаем длину кратчайшей из дуг контура, эти точки соединяющей.
Лекция 4 49 длину 1-,/2. Для интегралов - A)-lx0\\2\d\\t I ||(А/ - A)-lx0\\*\d\\, в которых \d\\ можно заменить на ds(X), справедливы оценки = i/ iKApZ-ii)-1! Так как 1 - A)'lx\\*ds{\) + J \\{М - Л)-1 имеем С другой стороны очевидно, что 1-,™^ ^ ИЛ11- Итак I т2 '1 Правая часть последнего соотношения эквивалентна неравенствам справедливым лишь тогда, когда или когда Последнее ограничение несущественно, так как по смыслу т^ > 0.
50 Лекция 4 В результате получаем требуемую двустороннюю оценку. Теорема 4.2. Для контура 7 величина т., = тах||(А/ - А)!! и норма \\J-,\\ матрицы J7, имеющей интегральное представление D.8), подчинены не- неравенствам D 91 4 "" '" ' I/ lfi "" '" ' / "* '" ' В качестве типичного контура рассмотрим окружность |А| = Л (А = Яе"*5), используя вместо J7 и т7 обозначения Jr и тд, что не должно вызывать недоразумений. Заметим, что 2тг ~JR(A)= f dpiRe-^I - A')-\Rei4} - A)~lЯ О 2тг 1 7. Л е'" .Л/. е-> Л 2тг где 1 7. Л elV .Л/, e"iv> Л Я отличается от Jr(A) (= J7) только множителем Я/Bтг). Если 7 — окруж- окружность |А| = Я, то иногда вместо тп^(А) будем использовать nR{A) = Ятах^Яе1^/ - A)-l\\ = max _i А После введения таких обозначений одно из утверждений теоремы 4.2 в случае окружностей принимает вид | (\\HR(A)\\ + yJ\\HR(AW + ^ ||Яд Проектор Т'яС^) на инвариантное для А подпространство, отвечающее всем точкам спектра А лежащим внутри круга |А| < Я, определяется интегралом u.
Лекция 4 51 Поэтому Здесь было использовано неравенство Буняковского. Итак, мы доказали важную оценку ||7>д(А)|| ^ л/||Яд(Л)||. Дополнительный материал (в задачах) Задача Д4.1. Используя матричное тождество z\\A-B\\\\(I-zA)-i\\ доказать неравенство справедливое при положительном знаменателе правой части, и его следствие: ,,—iip \ ~1 / _—tie \ —1 R 1-||Л-В||пд(Л)/Л 1Г||Л-ВЦ[]|ЯЛ(Л)Ц - тгЦЛ - ВЦ [цЯл (Л)|| Задача Д4.2. Обосновать непрерывную зависимость матриц Яд(Л), 'Ря(Л) от матричного аргумента Л, получив (в предположении \\А - В\\ ^ а) оценки вида ЩА - В\\, \\Тя(А) - 7>R(B)\\ ^ р\\А - ВЦ с постоянными a, h, p, зависящими лишь от R и ||Ял(Л)(|.
52 Лекция 4 Задача Д4.3. Если у матрицы А нет собственных значений АЛ(Л) на мнимой оси (Tte\j{A) Ф 0 и R > (|Л||, то инвариантный для А проек- проектор {РА = AV) -1 -Л -ir/2 осуществляет проектирование на инвариантное для А подпростран- подпространство, соответствующее всем собственным значениям А:-(Л), лежащим в левой комплексной полуплоскости A1еАл(Л) < 0). Доказать, что +R lim ~ /dtUtl - А)-1, л-юо 2тг У v ; -л +л I -V ~ ~1 - lim —- / 2 Л—too 2тг j ~R Задача Д4.4. Доказать тождество А*[-Ш - A*]~lC[itI- A]~l + [-HI - А']~1С[Ш - А]'1 А = -С[й/ - Л] - [HI - А']-1С и вывести из него уравнения А*Х + ХА-{1- V)C{I -V)+VCV~ 0, V*X = XT, которым удовлетворяет матричный интеграл л л-юо 2тг J -л оо 1 Г 2тг J Через V hV* обозначены проекторы, инвариантные для Л и Л* соот- соответственно, отвечающие точкам спектра, лежащим в левой комплекс- комплексной полуплоскости. Доказать, что если С = С > 0, то X = X' > 0. Указание. Воспользоваться предыдущей задачей и тождеством ~V) -VCV.
Лекция 5 Логарифмическая субгармоничность суммы квадратов модулей ана- аналитических функций и анализ зависимостей \\(Нц(А)д,д)\\, \\Нц(А)\\, tr Hr(A) от радиуса R. Вариант, применимый для критерия дихо- дихотомии прямой Re А = а. Алгебраические уравнения для Hr(A) и Vr(A). Существование и единственность. Применение субгармонических функций Рассмотрим аналитическую функцию /(С), С = ?+»?, определенную в неко- некоторой области комплексной плоскости. Как хорошо известно, вещественная и(?, т)) и мнимая v{?, rf) части этой'функции f(() = u(?, j))+iv(?, rj) являются функциями гармоническими и связаны уравнениями Коши — Римааа u« + uw = 0 щ = v4J Vtf + v1}t}=0 u^ = ~vf. E.1) С помощью этих равенств нетрудно убедиться, что функция |/(С)|2 = «2(^i*?) +v2(Z,v) имеет первые и вторые производные Г2 ?rl/(OI' = связанные соотношениями = Buti{ - Ivurf + Buu4 + Ivud2 = 4(u2 + v2){u\ + xt]) = 2(u| + uj 53
54 Лекция 5 Следствием этих соотношений является равенство которое, обозначив ?^{^,ij) = |/(С)|2 ^ 0, перепишем в виде E.2) Нам удобно пользоваться следующей эквивалентной формой равенства E.2): Обозначим 3=1 3=1 Допустим, что в каждой точке С € П хотя бы одна из аналитических там функций /^@ отлична от нуля. При этом ? > 0 всюду в О,. Элементарное следствие неравенства треугольника неотрицательность выражения ??' + ?}$ (что вытекает из E.2)) и нера- неравенство Буняковского Е +4я j Е f tf) - \ приводят к неравенству дЧ или к эквивалентному неравенству д2\п? д2\п? + справедливому внутри Q. • Функции, удовлетворяющие неравенству E.3), называются логарифми- логарифмически субгармоническими. При построении теории логарифмически субгармонических функций удается отказаться от предположения о наличии вторых и даже первых частных производных, однако для наших целей такие обобщения не потре- потребуются.
Лекция 5 55 Пусть В(С) — невырожденная в Q N х УУ-матрица, элементы 6,j(C) ко- которой являются регулярными аналитическими функциями, D — D* > 0 — постоянная эрмитова положительно определенная матрица, д — постоян- постоянный ненулевой вектор. Определим две функции fitf.i?) = (B'DBg.g) = (DBg,Bg), Эрмитова матрица D может быть представлена в каноническом виде и, где U — унитарная матрица и d{ > 0. Обозначив через матрицы С = (/В, получим для ?i и ?2 представления элементы N В, К, rj) = (DBg, Bg) = N ? Cij9j N N Мы видим, что каждая из функций Е\ (?,»?) и^2(^>»?) является суммой квад- квадратов модулей аналитических функций и по доказанному выше удовлетво- удовлетворяет соответственно неравенствам 0, д2\п?2 д2\п?2 E.4) Контрольный вопрос. Как в приведенном рассуждении использовано условие невырожденности матрицы Задача 5.1. Используя принцип максимума для ?i, доказать, что||(А/— Л)!! принимает максимальные значения в замкнутой области комплекс- комплексной плоскости А на границе, если эта область не содержит собственных значений матрицы А. В качестве B[Q можно, например, взять B(Q = (/ — е~С~**А)~г = (/ — е-?~1Т'~"М)~1 в некоторой области, где это выражение имеет смысл, т.е. где det(/ - е~"^~"М) ф 0 при любых вещественных (р. При этом E.5) = ([I - Определим 2-я - ^ f 2w E-6)
56 Лекция 5 Из E.6) и E.4) очевидно, что пйк,!?) , d^ine^rj) ^ a2 in fee,»?) tfMn&tt,?) ^ Кроме того, из E.6) и E.5) следует, что ?i(?,ч) и ?2(^.1?) не зависят от tj, и поэтому будем писать ?\ = ?х(?) и^2 = ЙШ- Из сказанного очевидно, что где rjb+rt = cC+*4+iv| ЙAПГ) = (Hr{A)g,g), €2{\nr) = tiHr{A), -— л] О Итак, матрица Нг (А) удовлетворяет неравенствам ——2 In(tfr{A)g,g) i> 0, {d^,2 IntrHr{A) ^ 0 E.8) в любом кольце R\ ^ г ^ R2, которое не содержит точек спектра матрицы А. Иными словами \п(Нг(А)д,д) и lnttHr(A) — выпуклые (в этом кольце) функции от In г. Поэтому ЫИг[А)9>9)* ^Hr(A)^n{R2MlntrHRAA] Положив r=R\ аЩ, 0 ^ а ^ 1, удобно переписать эти неравенства в виде Если вектор g выбран так, что ||^|| = 1, и при этом (HRi-aRO(A)g, g) = Н^л'-а-И)!!. то №.М)*,*) ^ ЦЯД1(Л)||, (HRt(A)s,9) ^ 1|ЯДаЯ(Л)|| и мы приходим еще к одному полезному неравенству ||ЯД.-Л?(Л)|| ^ НЯя.ИЛГ-НЯяЛ^Н". E-Ю) Из E.9) и E.10) следует что графики функций ||//к(Л))[, tr HR{A) от аргу- аргумента Я, которые уходят в бесконечность, когда R приближается |А,(Л)|, не могут иметь точек максимума и точек перегиба между этими "беско- "бесконечностями".
Лекция 5 57 Возьмем теперь в качестве контура у прямую линию Re A = а, а в качестве </7 — интеграл +00 Ja~b ! dt[{a - it)I - Am]'lD[(a + й)/ " 4, —oo где b — вещественная положительная постоянная. Полагая [tf + it)I - А)'1 = [(? + iV + it)I - A]~\ in + H)J ~ A]-1}, определим [jtjj = f dt?i{a,T]st), —oo +OO (Читателю рекомендуется проверить законность этого определения в слу- случае, когда прямая ? = а + it не содержит точек спектра матрицы А.) Оче- Очевидно, что ?1@,17) и ?2{а,у) от т} не зависят, и этот аргумент в их обозна- обозначении можно опустить. Очевидно также, что ^0, да2 ' Иными словами, логарифм значения (Jag,g) квадратичной формы (D = D* > 0, 6 вещественное и положительное) +00 {Hag,g) = 6 / dt[{a - ft)/ - А'^ является выпуклой функцией от а внутри любого интервала ах < a < «2i не содержащего вещественных частей Re Л; (Л) точек спектра матрицы А. Выпуклой функцией от а будет также логарифм следа матричного интеграла +ОО Ь [ dt{{a - it)I - A*]~lD[{a + it)I - Л]. Напомним, что в лекции 4 было предложено использовать интегралы такого рода в качестве критериев дихотомии.
58 Лекций 5 Алгебраические уравнения Приступая к выводу уравнений для матриц Hr{A) и Vr{A), имеющих интегральные представления 2т - 1 1 E.11) E.12) напомним оценки, установленные в лекции 4: Если норма ЛЯд(Л)|| конечна, то для любого <р норма матрицы ( / — А R конечна или, что тоже самое, норма конечна при всех г, ле- -1 на этой жащих на окружности \z\ = 1. Элементы матрицы (/- —А) V Rz J окружности — рациональные ограниченные функции. Они будут ограниче- ограничены и в некоторой окрестности этой окружности — в кольце l/p < \z\ < р, если р > ] достаточно близко к 1. В этом случае внутри такого кольца справедливо разложение в ряд Лорана E13> В частности при z = etlp (на окружности \z\ = 1) При этом — 1 Известные свойства ряда Лорана гарантируют справедливость неравенств I|G*|| = ||С:Ц^ const//, с помощью которых нетрудно обосновать законность проводимых ниже выкладок.
Лекция 5 59 Пусть F = F* > Q ~ эрмитова положительно определенная матрица. Рассмотрим выражение /+0О и проинтегрируем его по <р: 2ж -1 Интеграл в левой части E.14) от интеграла в E.11) для Hr{A) только по- постоянным матричным множителем F в подынтегральном выражении, и мы будем использовать для него то же самое обозначение: 2х -1 -1 Оказывается, что Я = Hr{A) и V = Рд(А) связаны некоторыми ал- алгебраическими уравнениями, к выводу которых мы переходим. Так как норма ||Яд(Л)|| конечна, матрица А допускает представление E.15) где матрица Т не вырождена (det T Ф 0), а собственные значения клеток А\ и Л2 расположены, соответственно, внутри и вне круга jAj < R: |Aj(yli)| < R, |Aj(A2)| > Д.1 Ясно, что -1 -1 и при \z\ - 1 -1 -1 Я Я -з -Ь-2 'Оставляем читателю рассмотрение исключительных ситуаций, когда одна из мат- матриц Ai, Аг в представлении E.15) отсутствует, т.е. случай, когда весь спектр матрицы А лежит либо строго внутри, либо строго вые круга |AJ < R.
60 Лекция 5 На основании этих разложений и равенства E.13) получаем для матричных коэффициентов Gk ряда Лорана формулы О 0. о о о т -1 -А = 0,-1,-2,... , * = 1,2,3 Обозначая через E.16) fc=0 суммы слагаемых, в которые Gj и G*i входят с неположительными или положительными индексами j соответственно, и вспоминая представления проекторов V = Vr{A), I -V нетрудно убедиться в том, что Go = V, ~ = 2,3,4,...), ^ 1 E.17) Из E.17) и E.16) получаем Я_ =V*H = HV -V'HV = Я+ = (I-V*)H = Я(/ -V) = {I-V')H{I E.18) ял(л) = я = ?с?;[р*
Лекция 5 61 Сравнивая последнее равенство в E18) с E.114), мы убедимся, что для Hr(A) одновременно справедливы два интегральных представления Ня(А) 2т . о 0 F('- Из E.17) и E.18) вытекают матричные уравнения для Я+, Я_, Я: - i А*Н+А = - Я - -^ Л*ЯЛ = VFT ~{I- V*)F{I - V). Теперь мы уже в состоянии выписать анонсированную систему уравнений для матрицы Я и проектора V: V2 = V, VA-AV, H = H\ V*H 1 E-19) Н ~-рА'НА = V*FV - (/ - 1>m)F{I - V). В эту систему включены условия эрмитовости матрицы Я, а также равен- равенства V2 = V и VA =. AV, которым удовлетворяет любой проектор V такой, что V и / — V одновременно являются проекторами на инвариантные для А подпространства. Из всего сказанного выше ясно, что если на окружности |А| = R не ле- лежит ни одного собственного значения матрицы А, то система E.19) разре- разрешима и решением будут положительно определенная матрица Я = Я' > О ""* 1 / _|М \ ~1 E.20) \ л. / v л, / О и проектор v = h/^G~^~л) ¦ E21) Доказательство единственности Нам осталось показать, что если рассматриваемая система имеет ре- решение Я, V, где Н = Я* > 0, то это решение единственно и окружность |А| = R осуществляет дихотомию спектра матрицы А. (Уже показано, что
62 Лекция 5 в этом случае решение Я, Т представимо формулами с помощью только что приведенных интегралов.) С помощью равенств E16)—E.18) легко убедиться, что для любого вектора у tiFGwGiy), ^ (Н+Ау> Ау) > jg {FAG, у, AGX у) = (F[I - Т]у, [I - Т]у). В частности, при F = / 1 1 , -ф{НАу,Ау) ^~{Н+Ау,Ау) }> ||(/ -Т)у\\2. Докажем единственность решения системы E.19) в предположении, что матрица Н = Н* положительно определенная. Сначала для предъяв- предъявленного выше решения Я, Т построим вспомогательные матрицы #+ = (/- ТУН{! - V), Я_ = Т*НТ и заметим, что я = [(/ - v) + тун = {1-тун + т'н = (/-ТУA -Т)*Н + Т*Т*Н = (/ -Т)'Н{1 -Т) + Т'НТ, т.е. Н = Я+ + Я_. Очевидно, что Я+ и Я_ неотрицательно определены. Умножая обе части уравнения И - — А*НА = T*FT ~{I- T)F{I - Т) слева на Т5' а справа — на Т и пользуясь тем, что 7>М* = А'Т", AT = (Т*J=Т*, Т2=Т, получаем Аналогично, умножая на / — Т* и / — Т, получаем ^ - V). Равенства ТА = AT и "Р2 — Т означаю^ что Т w I -T являются проекто- проекторами на дополнительные непересекающиеся инвариантные для А подпро- подпространства. При этом существует невырожденная преобразующая матрица Т (detTVO) такая, что Ах О О А2 Т = О ojJ '
Лекция 5 63 где Ai и А2 — квадратные диагональные клетки размеров NixNi и N2 x ЛГ2 соответственно. Очевидно, что [о oj^^lo о]г -г [о o [F С" "I 11 l2 = T*FT — положительно определенная эрмитова мат- ^21 ^22J рица. При этом ее диагональные клетки Ец и Е%2 также положительно определенные. Аналогично =V* HV — Т~* u Г' К = Г"ЯТ = Г (Я_ + Я+)Т = К Подчеркнем, что из положительной определенности Я и из невырожден- невырожденности Г следует положительная определенность клеток Кц = -^Ti > О, #22 = ¦й'гг > 0. Используя полученные представления, можно преобразо- преобразовать уравнения для Я+ и Я_ так, что Теперь вспомним леммы 3.4-3.6, доказанные в конце лекции 3. Эти леммы утверждают, что из приведенных выше равенств ввиду положи- положительной определенности клеток Кц, Ец} К22, Е22 следует, что весь спектр клетки А-2 лежит строго внутри круга радиуса Я (|Aj(.Ai)| < Я), а весь спектр клетки А\ — строго вне этого круга (|Л^(Л2)| > Я). При этом Кц, #22 определяются однозначно по известным Ец, Е22, Ль Л2. Из этих утверждений и представлений Ai °lr-i v~t\j^ °1t-1 О А2\ ' ~~ [ О Oj следует, что V действительно является проектором на инвариантное для Л подпространство, отвечающее части спектра Л, лежащей внутри круга радиуса Я. Иными словами, действительно 2т . , If/ e~%4> V = J- ldvll-—A
64 Лекция 5 Из единственности Кп, К2ц следует единственность Я+, Я_ и Я = Я+ + Важное замечание. Утверждение о единственности в последней фразе справедливо несмотря на то, что преобразующая матрица Т в представ- представлениях для V и для А определена неединственным образом. При разборе приведенного доказательства читателю следует обратить особое внимание на это обстоятельство и самостоятельно восполнить пробел в нашем изло- изложении. В дальнейшем, как правило, будем считать, что F — I. Приведем окончательную формулировку доказанного утверждения. Теорема 5.1. Если модули всех собственных значений \j(A) отличны от Я (|Aj(.A)| ф Я), то система матричных уравнений AHA = PP(IV)(IP)) H = H\ V*=V, VA-AV имеет решение Н, V. Среди этих решений (если их более одного) имеется такое, что Я — положительно определенная матрица (Я > 0). Наоборот, из существования решения с Я > 0 уравнений E.22) следует, что \Xj[A)\ Ф Я для всех Xj(A). Решение Н, V, где Я > 0, единственно и представимо в виде интегралов 2* () , E.23)
Лекция 6 Изучение степеней Ак при известной норме \\Hr(A)\\ и оценка эле- элементов клеточно диагонального представления матрицы А. Реше- Решение матричных уравнений для Hr(A). Дополнительный материал в задачах. Ортогонально степенной QR-алгоритм и его сходимость. Лемма, которую можно пропустить. Рекомендуемые компьютер- компьютерные эксперименты. Ортогональные прогонки. Оценки матричных итераций на инвариантных подпространствах. Мы продолжаем исследование матричного оператора А с использованием вспомогательной эрмитовой матрицы Нц{А) = Я, норма ||#|{ которой слу- служит критерием дихотомии спектра А окружностью |А| = R. Через V и I—V обозначаются инвариантные для А проекторы (АР = VA) на инвариант- инвариантные для А подпространства, отвечающие собственным значениям внутри и вне круга |А| < R соответственно. Теорема 6.1. Справедливы неравенства F.1) Доказательство. Мы используем обозначения из лекции бив процессе доказательства будем напоминать некоторые равенства и неравенства, о которых там шла речь. Матрица Н — Н* раскладывается в сумму двух неотрицательных эр- эрмитовых матриц Я_ = #1 > 0 и Н+ = FI+ > 0: Н = Я- + Н+, Я_ =VHV, Я+ =(I-V-)H(I-V). Любой вектор z однозначно представим в виде г — х + у, где х = Vz, у= (I - V)z. При этом {H-z,z) + {H+z,z) = [Hz,z). Из матричного уравнения Я - jgA'HA = V'V -{I- V)(I - V) F.3) 65
66 Лекция 6 следует, что (Я*,*) - ±(НАХ>Ах) = {х,х) $ (Нх,х). Полагая х = VAkz — AkVz, получаем P*Pz||a = {АкТггАк7>г) $ (ЯAkVzyAkTz). Приведем еще одно следствие матричного уравнения (г = Ak~lVz): {НАх,Ах) = которое приводит к неравенствам для х — Vz: ±. v1 \\щ\) Vii2. Последнее неравенство эквивалентно неравенству F.1). Для вектора у = (I - V)z из F.3) вытекают соотношения (у,у) = ±(НАу,Ау) - (Ну,у), ^{НАу,Ау) > ||у||2. Можно заменить в F.3) вектор у вектором pfc_1 А*~гу = к_1 Ak~1(I-V)z, так как оба лежат в одном и том же инвариантном для А подпространстве: После этих подготовительных замечаний становятся очевидными сле- следующие цепочки неравенств и равенств: ±;(H+AkztAkz) =
Лекция 667 Из этих соотношений вытекает неравенство эквивалентное требуемому неравенству F.2). ? Клеточная диагонализация Как мы знаем, матрица А допускает представление • 7,3*•¦ где U — унитарная матрица, |Л;(?)| > 1, |Aj(C)( < 1. Проектор V = U \п г \U* инвариантен для Л, так как \у In?} Этот проектор осуществляет проектирование на инвариантное подпростран- подпространство, в котором [Ал- (Л) | = [Aj(C)[ < Д, и его норма допускает оценку y/\\HR(A)\\ = Теорема 6.2. Справедливы неравенства \\Ц\ ^ \/Щ, F-4) \\н\у V«"'Y |[Я|| -А/2 и их очевидное следствие F-7) Доказательство. Представим //-мерный вектор г в виде % U _ .. к j } Ni компонент AT1 2 компонент
68_ Лекция 6 так что ||г|| = ^/(KIIJv, + IMIJv3> и пользуясь соотношениями найдем \\РА\ = UkVz\\ = В этих обозначениях неравенства F.1) и F.2) принимают вид ( ) + lic^nk ^ я* ViM(i - + \\сч\к z 7ГТИI1 + Ш\) ш Ввиду произвольности векторных компонент ?, т\ из последних неравенств вытекают требуемые неравенства F.5) и F.6). ? Алгоритм решения матричных уравнений (описание идеи) Теперь мы опишем несложный итерационный процесс, с помощью ко- которого можно решать матричные уравнения (F = F* и, как правило, F > 0) A*HA = rFP-{I-P)F(r-P) АР - РА, Р2 = I, Р'Н ~ HP, и при этом определить ]|#|| — параметр дихотомии спектра А окружнос- окружностью |Л| — Я (см. лекцию 5). Мы рассмотрим лишь вариант с Л = /, так как общий случай сводится к этому специальному заменой —А на А. Начнем с описания идеи, на которой основан алгоритм. Она заклю- заключается в использовании соотношений между решениями двух систем мат- матричных ленточных уравнений, отличающихся друг от друга только числом неизвестных матриц. У одной из систем неизвестных ровно вдвое больше, чем у другой. Соответственно и числа уравнений, входящих в эти систе- системы, отличаются вдвое. Пусть мы уже решили систему из двух уравнений C6-9)
Лекция 6 69 и вычислили с использованием ее решений матрицу Следующий шаг состоит в решении системы из четырех уравнений = X™ - АХР = О, FЛ0) Удобно ввести дополнительные матричные неизвестные К^ = X Х[\ LW = Х\* — Xf' и переписать с их помощью решаемую систему: = 0, F.11) Число матричных неизвестных в этой системе — шесть. Бели сравнить ее уравнения с уже решенными на предыдущем этапе системой F.9), то становятся очевидными соотношения из которых вытекают уравнения для К^2\ Нас интересует также вычисление суммы Нетрудно заметить, что, зная матрицы Н^\ К^2\ It2', эту сумму можно найти по формуле Аналогично проведенным выше рассуждениям можно перейти от сис- системы четырех матричных уравнений к системе для восьми неизвестных матриц. После следующего удвоения числа уравнений и неизвестных, оно окажется равным 16. Этот процесс можно продолжить и далее.
70 Лекция 6 В качестве итога приведем схему вычислительной процедуры, осно- основанной на описанной выше идее, решения системы и попутного расчета матрицы Заметим, что не все неизвестные матрицы будут определяться. При каж- каждом N вычисляются лишь X* и X^N\X. Однако это обстоятельство не служит препятствием при вычислении H^N<i по предлагаемой схеме. Схема алгоритма 1. Используются исходные данные из решения 2. При п= l,2t...,N последовательно находим 1<(п\ системы и с их помощью вычисляем х[п', Х\п\ Н^\ [п) = х^ х[ Заметим, что, исключив неизвестные X?N\ Х$ . мы, мы придем к весьма простым по виду уравнениям из систе- систеПользуясь каноническим представлением матрицы А /У [
Лекция 6 71 легко убедиться в том, что («) _ тт («) _ L 1 IN,\ *2" О и, кроме того, V"(n) o2"-lv(n) — П Г2п — D 11 — U, 0 u; Решения последних уравнений выписываются явно: V^"^ — Ri~2'*/T.r R1"'*-1 7(n5 — (Г . Г Yl —& VN\ "В ) ¦ L\ — —\}Иъ — {~ Так как (см. теорему 6.2) >l-2' при N -*¦ оо имеем 0 "/at, 0 L /n3. I ' /^ 0 0 0 о ) ¦ ye2"-' Ni Ij 0 IN: o' i т.е. где Т1 и lim lim X["> = -I лг3 — P — инвариантные для А проекторы на подпространства, отвечающие собственным значениям Л,(Л), лежащим внутри и вне круга |А|<Л=1. Теперь полезно вспомнить про матрицы Грина Gk (см. лекцию 5), которые в данном случае Я = 1 являются решениями уравнений О, = О, = ±l,±2,±a,... и определяются этими уравнениями однозначно при условии ||Gfc|| < const. Оказывается, что при любом фиксированном к lim X N-юо ' (JV) 1,
72 Лекция 6 Кроме того, lim #<"> = Jim T[XlN)YFXlN)= У G'kFGk. Задача 6.1. Обосновать предельные переходы при N -юо. Напомним доказанное в лекции 5 представление 2* оо Я = J- fdlp(J-€ilfiAm)'1F{I~e-ilfiA)-l= У" G^G*. 27Г ^ fc=-oo Итак, выполняя описанную итерационную процедуру, мы осуществляем расчет проектора V и интеграла дихотомии Я: 7>= lim Jd?\, Я= lim Скорость сходимости тем выше, чем быстрее убывают ||Я~2 ~'|| и \\С2 ~х\\ с ростом JV. Иными словами, процесс тем быстрее сходится, чем меньше норма ||tf [J, т.е. чем лучше дихотомия спектра единичной окружностью. Мы сознательно не останавливаемся на обсуждении того, каким спо- способом решать систему линейных уравнений с составной матрицей коэффи- коэффициентов А — ~ЛЛ1 ( при вычислении К^ и ?("). Для этого можно использовать любую про- программу решения линейных уравнений при условии, что решаемая система хорошо обусловлена, т.е. произведение норм Н-А^НЙ^]!! не слишком ве- велико. Подробное изложение алгоритма и ряд его обобщений можно найти в [Годунов-Нечепуренко; 1]. Задача 6.2. На основе использованных выше канонических представле- представлениях матриц А, х[п\ Х$) получить оценки для fi(A^) = \\Л и доказать, что lim n-t-oo Дополнительный материал (в задачах) Задача Д6.1. Доказать, что при 0 < т < l/\\D\\ итерационные процес- процессы
Лекция 6 73 (I) Fq = 0, Cq — G = G*t Cj = T^Cj-i+Ci-Д Fj = ^_! + Ch Uj< oo. (II) сходятся к пределам т Л = lim Aj = eTD, F= Mm Ft = [ dt etD* GetD J-+OO j-KX> ' J 0 и оценить погрешности \\Aj - A\\, \\Fj - F\\. Задача Д6.2. Доказать,что решения X, Р уравнений X - А*ХА = P*FP -{I- P*)F{I - Р), АР = РА, Р2 = /, Р'Х =¦ ХР, т в которых А = erD, F — / dtetD GetD, служат одновременно и реше- о ниями уравнений, предложенных Булгаковым D'X + XD + P*GP -(I- P" DP + PD, P2 = I, P'X = XP. Указание. Воспользоваться представлением Малышева А=0 J L k=0 fc=O Напомним задачу Д4.4, в которой предлагалось доказать, что урав- уравнениям Булгакова удовлетворяет матричный интеграл = ~ [ di[-itI-D*)-lG[itI-D)-\ имеющий смысл, если на мнимой оси нет собственных значений D. Из этого вытекает существование решения, причем при G = G* > О решение эрмитово и положительно определено, X = X' > 0. Можно доказать, что такое решение единственно. ¦ Мы завершим эту лекцию теорией простейшего варианта очень рас- распространенного вычислительного алгоритма, известного как ортогонально- степенной метод, который применяется для расчета базисов инвариантных подпространств линейных операторов. Используя критерий круговой ди-
74Лекция 6 хотомии, из которого вытекает расслоение спектра на две части, лежащие вне и внутри круга |Л| < г, мы не только дадим квалифицированные оцен- оценки скорости сходимости метода, но и учтем влияние на эту сходимость вычислительных погрешностей, неизбежных в реальных расчетах. Простейшая модель Начнем с описания идеи, положенной в основу изучаемого нами алго- алгоритма, на простейшем примере клеточно диагональной N х //-матрицы В О С такой, что все собственные значения Ni х /Vj-клетки В по модулю больше г, а весь спектр (N - Ni) x (N - N\ )-клетки С лежит внутри круга |А| < г. В этом случае существуют 7^1 и 0 < р < 1 такие, что Пусть §о — невырожденная матрица. Будем считать ее ортогональ- ортогональной {Q'QQo = In)- Рассмотрим подматрицу Qo матрицы Qo, составлен- составленную из первых Ni столбцов. Очевидно, что эти столбцы ортонормированы: QlQo = /jvi - Разобьем Qo на клетки у° 1 } Nl строк Zo J } N2 строк Nt столбцов и, предполагая, что Уо не вырождена, определим Qi,Q2,-- ,Qn,-- равен- равенствами где Rj — некоторые невырожденные матрицы. При этом где матрица Rj = RjRj-i ¦ ¦ Rt невырождена. Предполагая, что Qj разбита на клетки аналогично тому, как была разбита Qq. /\ I Yj 1 } N\ СТрОК L 3 \ J 2 СТРОК> N, столбцов мы легко установим, что Yj = r^B^oRJ1 и Zj = t^C^ZqRJ1. Нам удоб- удобно определить прямоугольную (N2 строк и Nx столбцов) матрицу Xj = ZjYf1 = C3ZqYq1B~J = CjXqB~j. Очевидно, что Xj не зависит от г и от конкретного выбора невырожденных матричных множителей Rj. Кроме того,
Лекция 6 75 Иными словами, ||X,-|| -*¦ 0 при j -»¦ со. Обычно Rj выбираются так, чтобы обеспечить ортонормированность столбцов у всех Qj {QjQj = /#,)¦ Для этого применяется процедура QR- разложения. В результате этой процедуры произведение AQj~\ записыва- записывается в виде произведения Qj {QjQj = Iffi) на правый треугольный мно- множитель Rj (AQj-i = QjRj)- Расчет столбцов Qj и элементов треугольной матрицы удобно осуществлять с помощью последовательности ортогональ- ортогональных отражений (см. задачу Д1.3 в лекции 1). Описание вычислительной схемы С?Я-разложения обычно довольно подробно дается в курсах вычисли- вычислительных методов. Подробный разбор этой схемы с тщательным анализом влияния вычислительных погрешностей можно найти в [Годунов-Антонов- Кири люк-Костин; 1]. Так как iNx = y;yj+z]Zj = y;(iNi +x;xs)Yjt Ъу:A + х]хму; = улу; и YjYj не вырождена (по правилу определения Yj через Yj-\), имеем Пользуясь этими представлениями и неравенством ||^-|j ^ 7V2j'||-^o||i мож- можно вывести оценки из которых следует, что при достаточно больших j матрица ГУ; ] } встрой 3 ~ [ h \ } ^2 строк состоит из почти нулевой клетки Zj и квадратной почти унитарной клет- клетки Yj. Иными словами, линейная оболочка векторов, координаты которых заполняют столбцы Qj, с ростом j все с большей точностью приближает- приближается к инвариантному для А подпространству, в котором все собственные значения по модулю больше г. Заметим, что при этом столбцы матрицы Qj не обязательно сами стре- стремятся к какому-либо пределу. При различных ; они могут аппроксимиро- аппроксимировать различные векторы. Обоснование сходимости (общий случай) Пусть теперь матрица А допускает представление, несколько более сложное, чем рассматривалось выше:
76 Лекция 6 где U — унитарная матрица (U*U = I) , и пусть известны оценки норм ||?||, ||-В~п||, ||СП||. Напомним, что такие оценки могут быть получены с использованием критерия дихотомии ||Ян(Л)|| (см. теорему 6.2). Будем считать, что 1|в-"|| цс»|| ^ 7Vn, 7 > 1, о < р < 1, нв-1!! ^ 7/г. Пусть опять <3о — матрица с N\ ортонормироваиными столбцами и Qj определены равенствами Воспользуемся представлением 1 ГУ где Yj — невырожденная квадратная матрица. (На самом деле достаточно предположить, что не вырождена только Qq. Тогда автоматически Yj, так же как и все Я,-, будут не вырождены.) Итак, ? 1Г-1! - и \In> о \[\u[ Существует невырожденная матрица Rjt осуществляющая ^Я-разложение j-i = QjRj, и при этом Введем обозначение Xj = ZjYf1. Заметим, что Xj — CXj-\B~lt запишем Qj в виде п.-и \Iffi + LXA у. так что Ясно, что / + X]Xj + X]V + LXj + X]L*LXj }I- ЩЩ \\X\\t и при достаточно малых \\Xj\\ l-2||Ly-|№ll
Лекция 6 77 Для \\Xj\\ так же, как и в разобранном выше простейшем случае, справед- справедлива оценка Из представления Qj через Х3- и^-с учетом приведенных оценок для \\Xj\\, Ц/jVi - yfyj\\, так же, как и в простейшем случае, можно установить схо- сходимость линейных оболочек столбцов Qj к инвариантному для А подпро- подпространству. Впервые фЯ-алгоритм в описанной выше простейшей форме был пред- предложен в 1961 г. (см. [Кублановская; 1] и [Francis; 1]). Если перед проведением (ЭЯ-алгоритма преобразовать матрицу А в гессенбергову матрицу Aq при помощи ортогонального подобного преобра- преобразования (см. задачу Д1.3), то на всех итерациях фЯ-разложение можно осу- осуществлять с помошью цепочек двумерных вращений Qj = С$С$_Х ••¦C% (см. задачу Д1.9): Ао = QxRu A,--i = QjRj, Aj - RjQj. При этом все матрицы Aj, получаемые таким образом из верхней гессен- берговой матрицы Ао, будут также верхними гессенберговы, в чем неслож- несложно убедиться. Использование критерия круговой дихотомии при анализе сходимости фЯ-алгоритма описано в [Годунов-Кузнецов; 1]. Учет влияния погрешностей округления Остановимся на учете влияния вычислительных погрешностей, возни- возникающих из-за неизбежных округлений при компьютерном осуществлении арифметических операций. Анализируя составленную для расчета про- программу и принимая во внимание число двоичных разрядов, отводимых для представления чисел, можно смоделировать Qj, Rj, получаемые в ре- реальном расчете, как матрицы, удовлетворяющие следующим равенствам: (А + ?J1})<fc_i = QjRj, Q*jQj = In, + Ef\ в которых появились вызванные погрешностями дополнительные слагае- слагаемые Еу* и Е^. Предполагается, что где параметр s определен на основе информации об используемой разряд- разрядной сетке и учитывает качество составленной программы. Множитель г в оценке ||2?}- || означает, что уровень допустимой погрешности оценива- оценивается в сравнении с радиусом г окружности, осуществляющей дихотомию спектра. Мы упростим эту близкую к реальной постановку задачи и будем считать, что Еу s 0. Итак, мы сосредоточимся на анализе матриц Qj таких, что {А + Ej)Qj.1 = QjRj, Q)Qj = INi, ||Я;|| < er.
78 Лекция 6 Пользуясь каноническим представлением матрицы А о L\\B 01 \INl -L О С 0 In, запишем матрицу А + Ej следующим образом: L где j - U дК» д! (Я 1и Так как очевидно, что О In, U', Как мы знаем, ||Lj| оценивается через ||#|| = ||ЯГ(Л)Ц (\/1 + j|L|J2 Так же через ||Я|| можно оценить \\В~1\\ ^ —, ,,„,,- Поэтому, зная и параметр дихотомии ||#г(.4)|| и задавшись характеристикой точности е, мы имеем пропорциональную е оценку сверху для произведений ||А^|| ¦ \\В'1\\. Реализация изучаемого нами вычислительного процесса с погрешнос- погрешностями состоит в построении матриц Qj таких, что Представим Qj (как и в случае, когда погрешности не учитывались) в виде При этом очевидно, что г. L о О) (Я 122 t= U
Лекция 6 79 Если Yj-i и Yj не вырождены, то из приведенного равенства следует, что Xj и Xj^x связаны рекуррентным соотношением которое и будет предметом нашего дальнейшего исследования. Будет установлено, что при достаточно малом е процесс расчета X можно продолжить неограниченно, так как все матрицы В + А^ +A\3jXj~\ будут невырожденными. При этом из невырожденности У}_1 и равенст- равенства Yj = (В + Ли + A)$Xj-i)Yj-iRjl следует невырожденность Yj и воз- возможность вычисления Xj. Поэтому методом индукции можно обосновать неограниченную продолжимость описываемого итерационного процесса. Переходя к детальному исследованию рекуррентных соотношений хп = [схп.! + дй> + дй^-да + дй} +Й> хп^)-\ перепишем правую часть этой формулы следующим эквивалентным, хотя и громоздким образом: СХп-\В~ Анализируя эту запись и пользуясь оценками для |[С|| ¦ \\В 1\\ и для ||?~1||, можно показать, что при достаточно малом е /~* V D" 1 _i_ D ¦ 2A- где 6 — некоторый пропорциональный е параметр. : Естественно предположить, что при достаточно малой норме ||Ло|| и достаточно малом числе S при всех п = 1,2,3... справедлива оценка <5Ц^п|| < 1/2 или, что то же самое, неравенство 5/2A - S\\Xn\\) < 1. При таком предположении что позволяет оценить \\Хп\\ с помощью леммы 6.1 ниже следующим обра- образом: 111 1-^-«о72 «о7а 1 - р2 - SkoY откуда следует непротиворечивость предположения 6\\Х0\\ > 1/2 при до- достаточно малых S. Кроме того, теперь ясно, что процесс расчета следует 1Я позволю себе опустить это рутинное исследование, чтобы не нагнать скуки, за- затрудняющей понимание существа совсем простого вопроса.
80 Лекция 6 завершать после такого числа п итераций, при котором оказывается, что Оценка ||ХП]|, характеризующая погрешность, после этого стабилизируется и не может опуститься ниже, чем Остается сформулировать и доказать обещанную лемму (при первом чте- чтении подробный разбор этих кропотливых построений можно пропустить). Лемма, которую можно пропустить Лемма 6.1. Пусть 7 ^ 1, р < I, kj2 < 1 — р2, / ^ 0, и пусть последователь- последовательность прямоугольных N2 х Ni-матриц связана соотношениями Xn = CXB с квадратными N2 x ^^-матрицей С и N\ x Ni-матрицеЙ В такими, что l|5J'lli|c-'-|K7VJ. В этом случае имеет место оценка <614> Справедливость леммы вытекает из почти очевидного равенства приводящего к неравенствам \\Xn\\ 1 1 _
Лекция 6 81 последнее из которых совпадает с требуемой оценкой F.14) в формулировке леммы. D Рекомендуемые эксперименты Для того, чтобы лучше понять содержание проведенного анализа вли- влияния погрешностей на сходимость ортогонально-степенного метода {QR- алгоритма), полезно провести на компьютере эксперименты. 1. Задавшись N х TV-матрицей А, каким-либо вектором v и размер- размерностью М (М < N), постройте начальный ортонормированный базис из М векторов, координаты которых составляют столбцы N х М-матрицы Qo (QlQo = In) по следующему правилу: m 1 г(*> = Через П обозначается М х Af-матрица циклической перестановки .0 0 0 0 1 0. Чтобы слишком большая точность, с которой арифметические операции выполняются на компьютере, не затруднили наблюдения за влиянием по- погрешностей, рекомендуется их моделировать введением принудительных N х М-матриц 6&j погрешностей Aj = Aj-iII, конструируемых из некото- некоторой начальной матрицы Ai последовательными перестановками столбцов E — постоянный параметр, задающий уровень моделируемой точности вычислений: 5- ИГ4,10-7,10"8,-. -)¦ Осуществляя моделируемый алгоритм по формулам где QjQj — In, Rj — верхняя треугольная матрица, можно анализировать его сходимость, наблюдая М х Af-матрицы Aj =
82 Лекций 6 2. Приведем еще один вариант итерационного процесса, за которым интересно и полезно наблюдать: SAj = j = VjU, где VjVj = 1м, Rj — верхняя треугольная матрица. Очевидно, что столб- столбцы матрицы Vj задают координаты базисных векторов того же подпро- подпространства, что и столбцы матрицы Qj. Первый столбец матрицы Qj (он же — последний M-ft столбец матрицы Vj) содержит координаты вектора, который мы обозначим р^\ Из этих векторов можно составить последова- последовательность сколь угодно большой длины рA\рB\ .. .,p(k\p(k+1\p(k+2\..., и последовательность N х М-матриц Uj с ортонормированными столбцами из = \pj'Pj+i'-- ¦¦¦Pj+M-i]- Ортонормированность можно проверить, вычисляя произведения UfUj, ко- которые должны оказываться единичными. Вычисляются также последовательность матриц Bj = UJAUj и последовательность строк, каждая из которых содержит М ненулевых элементов Cjj-!, Cjj, Cjj+i, Cjj+2, ..., cjj+m-2, определяемых по фор- формуле Cjk = (Apj-i,pk)- Из этих строк составляется гессенбергова ленточная матрица C2J О О С32 0 С23 с43 С2М О с произвольным числом строк, а также квадратные подматрицы С^гл', со- составленные из одинакового числа столбцов и строк с элементами c^i (г ^ Приведем исходные данные для первой серии экспериментов, размыш- размышления над результатами которых, возможно, заинтересуют читателя. Положив N = 9, М = 7 (или М — 3) в качестве матрицы А и началь- начального вектора v целесообразно выбрать А = 30 И 25 10 20 б 15 3 2 1 3/8 1/10 1/12 1/100 1/16 1/100 1/20 v = 1 1
Лекция 6 53 Наблюдая за матрицами Aj при различном уровне S погрешностей, надо указать в каждом случае, после какого числа итераций следует завершать процесс, если мы интересуемся получением базиса только для тех или иных конкретных инвариантных подпространств. Здесь полезно сравнение ва- вариантов М = 7 и М = 3. С помощью какой-либо стандартной подпрограммы, входящей в ма- математическое обеспечение, предлагается вычислить собственные значения матриц Bj, c№*t+9N\ С^+4ЛГ^ при достаточно больших j, а затем сравнить их с собственными значениями матриц Aj и исходной матрицы А. Как собственные значения матрицы C^+5JVJ изменяются при замене j на j + l,j + 2,.. -,j + N? Что остается в наблюдаемых фактах неизменным при изменении уровня погрешностей? (Например, при замене 6 = 10~6 на S = Ю-3 или S = Ю-10, Ю-12, Ю-16)? Намеченная схема компьютерных игр увлекательна и поучительна. Отступление Специальная модельная система линейных уравнений Остановимся кратко на том, как фЯ-алгоритм может быть использован для вы- вычисления векторов у, х, связанных следующей специальной системой линейных уравнений: Апх = у (или х = А~пу), в которой п — достаточно большое число и матрица А (она предполагается невы- невырожденной) после возведения в степень ±п оказывается очень большой нормы. Во многих случаях, когда такого рода системы появляются в приложениях, уда- удается избежать прямого вычисления Л" и получить решение, если только оно хорошо обусловлено заданными А, В, С. Сначала остановимся на критерии хорошей обусловленности. Пусть А до- допускает подобное преобразование к клеточно диагональному виду, в котором модули всех jVt собственных значе- значений клетки Ai больше 1, а у N2 х Л^-клетки А% — меньше 1. Иными словами, единичная окружность |А{ = 1 осуществляет дихотомию спектра матрицы А. Обозначая через ?i, ?2, 1711 V2> fi> Фг компоненты векторов y ]Nl а через Bij, C,j — клетки, составляющие преобразованные из заданных В и С матрицы BS= l"Bu Вп
84 Лекция 6 можно записать рассматриваемую систему в виде Вп В12] (А^пщ\ \Сц С12 Вц В22\ \ Ь ) [Сп С22 При больших п нормы |[Л^*П||, ||^2II очень малы и система аппроксимируется уравнениями 6 = 0, CnTji = <pi, В22& = <Р2, т = О, которые разрешимы, если квадратные клетки В22, Си матриц В$, CS не вы- вырождены, т.е. если ||В22|П|В^1(| и ЦСиЦЦСГ^Н не слишком велики. Эти два предположения вместе с критерием дихотомии спектра А единичной окружнос- окружностью (через него оценивается ||Sj| jjS]!) и составляют условия, обеспечивающие обусловленность решений рассматриваемой системы при больших п. Алгоритм, который будет сейчас описан, работает, если среди первых N\ базисных векто- векторов, координаты которых образуют столбцы составной Ni x /^i-матрицы о нет векторов, ортогональных инвариантному подпространству матрицы А, отве- отвечающему всем ее собственным значениям, превышающим 1 по модулю. Также необходимо, чтобы в базисе, описываемом N х ^-матрицей V - \!n'- "~ [ О не содержалось векторов, ортогональных дополнительному инвариантному под- подпространству, В КОТОРОМ |Aj-(j42)| < 1. Сначала выполняются две последовательности фЯ-разложениЙ где QjQj = /jv,, Vl_{Pk~i = In3x a Rj, Tfc-i — верхние треугольные матрицы размеров Ni x Ni и^х N2 соответственно. Вычисляются также произведения обращений полученных треугольных матриц - Пх К2 ...Пп , I - Io ij ...ln_i. Предлагается искать решения х, у в виде х = Vou + QnRv, у = VqTu -f Qnv путем решения системы из N уравнений [BVo + CV0T]u + [CQn + BQnR]v = f для N неизвестных (Л^2 компонент вектора и, Ni компонент вектора V, N — Нетрудно строго обосновать описанный прием на основе изложенного выше материала. Надо использовать тот факт, что при достаточно большом п столбцы
Лекция 6 85 матриц Qn> Vq содержат координаты базисных векторов подпространств, ап- аппроксимирующих подпространства, инвариантные для для А. Эти подпростран- подпространства отвечают собственным значениям Xj(A), лежащим вне и внутри единич- единичного круга. Кроме того, ||Т|| = ЦА'"^!!. 11-ЯЦ ^ 1Ип<Эо1Г\ и при большом п эти нормы малы. Ортогональные прогонки Описанный прием может быть использован при решении краевой задачи для Системы из N обыкновенных дифференциальных уравнений с постоянной матрицей D коэффициентов После вычисления А = erD (см. задачу 6.1), где г = l/nt и введения обозначений г@) = х, г{1) = у она сводится к рассмотренным уже уравнениям у = Апх, Вх+Су = /. Надо только, чтобы у матрицы D существовала дихотомия спектра мнимой осью: О, R« Ajv1+I(D) > 0,.. .,ReAN(Z>) > 0, и чтобы исходные для проводимых построений базисные матрицы Qo, Vn под- подчинялись указанным выше условиям. Описанная методика (ортогональная прогонка) решения краевых задач до- допускает обобщения на неоднородные уравнения x(t) = Dx{t) + g{t) и даже на уравнения с переменной матрицей коэффициентов D(t) (см. [Годунов; I]). А. А. Абрамов [Абрамов; 3] предложил использовать для решения крае- краевых задач метод дифференциальной ортогональной прогонки, в которой QR- разложение матрицанта X{t) системы jtX{t)=D{t)X{t), Х{0) = 1 осуществляется при всех t из рассматриваемого отрезка 0 ^ t ^ / путем решения матричного дифференциального уравнения ±z(t)=V[t)z{t)-zR{t)t z@) = /at, в котором верхняя треугольная матрица R(t) связана с z(t) равенством Это соотношение, которым R(t) однозначно определена, обеспечивает ортого- ортогональность матрицы z{t): z"{t)z(t) = In- Достаточно детальное обсуждение во- вопросов, поднятых в этом отступлении, содержится в учебном пособии [Бахвалов; I]. ¦
Лекция 7 Вычислительные парадоксы при расчете собственных значений. По- Понятие об е-спектре. Необходимая осторожность при использовании теоремы о непрерывности. Двумерные и одномерные спектраль- спектральные портреты. Обсуждение теорем Ляпунова об устойчивости ре- решений дифференциальных уравнений. Всегда ли следует ждать, что спектр расслоится на кластеры? Спектры семейств разност- разностных операторов — предшественники е-спектров. Подавляющее число специалистов в областях, смежных с математикой, как, например, физики, механики, инженеры-конструкторы, не обязаны при использовании математических результатов каждый раз глубоко вни- вникать во все тонкости рассуждений и детали вычислительных алгоритмов, с помощью которых нужные им утверждения или числовые значения полу- получены. В настоящее время подавляющее число расчетов и прикидок, кото- которые приходится ежедневно проводить во время обработки экспериментов и в процессе инженерных разработок, выполняются на персональных ком- компьютерах с помощью стандартных программ, входящих в ту или иную версию математического обеспечения, имеющегося у пользователя. Раз- Разработчики этих версий не предоставляют пользователям детального опи- описания используемых алгоритмов, и поэтому пользователи вынуждены до- доверять (и, как правило, безусловно доверяют) результатам, полученным с помощью используемых ими стандартных программ. Однако такое дове- доверие приводит иногда к конфузам. Надо, правда, отметить, что конфузы, которые имеются в виду, свя- связаны зачастую не с погрешностями, допущенными разработчиками алго- алгоритмов, а с тем, что задача, которая решается программой, поставлена не совсем корректно. И в этом виноваты вовсе не составители алгоритмов, а математики, которые в своих курсах, на которых обучаются как пользова- пользователи, так и разработчики алгоритмов, не обращают должного внимания на критерии, обеспечивающие корректность постановки базовых математи- математических задач. Следует иметь в виду, что из-за необходимости использова- использования округлений при выполнении элементарных арифметических операций все вычисления на компьютерах проводятся приближенно. Поэтому и ре- решения задач, выдаваемые компьютером, являются приближенными. Как правило, это обстоятельство никого не смущает: ведь в обычной для на- настоящего времени практике используются расчеты, которые выполняются на основе арифметических операций с шестнадцатизначными представле- представлениями чисел, т.е. относительная точность каждой арифметической опера- 87
88 Лекция 7 ,-is ции — это величина порядка 10~16, тогда как погрешность окончательного результата, оцениваемая через 10~8, руется без каких-либо колебаний. 10~10, в большинстве случаев игнори- Вычислителъные парадоксы при расчете собственных значении Приведем несколько примеров, иллюстрирующих описанную ситуа- ситуацию и показывающих, что, например, к расчетам собственных значений у матриц надо относиться с большой осторожностью. Впрочем, такую же осторожность следует проявлять и в истолковании используемых в прило- приложениях утверждений относительно процессов, управление которыми осу- осуществляется с помощью тех или иных матриц. В качестве примера такого рода можно указать итерационный про- процесс un+i Aun = / решения системы линейных уравнений и Аи = f г г или эволюцию с возрастанием времени вектора u(t)t который в начальный момент времени известен (и@) = /), а при t > 0 его эволюцию определяет векторное дифференциальное уравнение -— = Аи. В первом случае для обеспечения безусловной сходимости процесса не- необходимо, чтобы все собственные значения Xj{A) не превышали по модулю г (|Aj{.A)( < г), а во втором — для устойчивости (точнее, для асимптоти- асимптотической устойчивости) состояния равновесия и = О, т.е. для того, чтобы все решения рассматриваемого векторного дифференциального уравнения стремились к нулю при t -> oo, необходимо, чтобы весь спектр матрицы А лежал строго в левой полуплоскости (ReAj(.A) < 0). Надо сказать, что существенная часть приложений спектрального ана- анализа матричных операторов связана именно с этими вопросами, ответ на которые и должен подтвердить, лежат ли все собственные значения в левой комплексной полуплоскости или в круге заданного радиуса г. Пусть, например, требуется выяснить, будет ли сходиться итераци- итерационный процесс С = 1 5 "n" щей С, 289 1152 -29 512 1053 -287 -2176 составленной 2064 30 -2000 128 2256 -16 -287 336 1312 756 640 -504 1712 -1565 из целочисленных элеп 128 512 384 0 -384 -128 -512 80 288 1008 640 -756 1968 -541 32 128 224 512 800 -30 -1152 ленто! 16 32 48 128 208 2032 -289 G.1) Иными словами, надо установить, лежат ли все собственные значения Xj(C) матрицы С внутри круга |Aj(C)| < 5. Для решения этого вопроса естественно провести расчет на компьютере. Пользуясь одной из имею-
Лекция 7 89 щихся в Вашем распоряжении программ, Вы получаете ответ, который вас разочаровывает — существуют точки спектра, лежащие вне данного круга, а именно: Вы находите следующую совокупность собственных значений матрицы С: Ai = 6,624, А2,з = 4,065 ± 4,381t, А4,5 = -1,472 ± 5,449*. Ав,7 =-5,906 ±2,371». Все эти собственные значения по модулю превосходят пять, и поэтому оче- очевидно, что интересующий нас итерационный процесс будет расходиться. Однако возможно, что Вы усомнитесь в результате и обратитесь к своему коллеге, который использует другую программную версию. Он решит с помощью этой версии ту же задачу, но получит совсем другой, хотя также неутешительный, результат: Ai = -6,18, А2,3 = -3,83 ± 3t96i, А4,5 = 1,33 ± 5,02», А6,7 = -3,83 ±3,96». То, что Ваш коллега выписал собственные значения с меньшим числом значащих цифр, не мешает Вам убедиться, что его результат совершенно отличен от Вашего. Приведенные результаты вычислений действительно были получены по моей просьбе в различное время на совсем разных компьютерах и даже в разных странах. Так что читатель не должен удивляться, если, повторив описанный эксперимент, он получит иной набор собственных значений, отличный от приведенных выше. Можно и далее провоцировать компьютер, получая все новые и новые наборы собственных значений той же матрицы. Так, спектр не изменится при замене матрицы С подобными ей матрицами D = P~lCP, F = Р~2СР2 (detP ф 0). При этом матрицы D, F останутся целочисленными, если по- подобное преобразование сводится к одновременной и одинаковой переста- перестановке столбцов и строк. Эти условия будут соблюдены, если выбрать в качестве Р матрицу 0 0 0 10 0 0" 0 0 0 0 10 0 0 0 0 0 0 10 Р= 0 0 0 0 0 0 1 10 0 0 0 0 0 0 10 0 0 0 0 .0010000. и, рассчитав соответствующие D и F, опять обратиться к тем же версиям программного обеспечения. При этом оказывается, что опять появятся новые варианты рассчитанных спектров. Так, Вы установите, что \i [D) = 6,005, А2,з(?>) = 3,651 ± 3,784:, А4,в(Л) = -1,331 ±4,699», Ав.7(?>) = -5,322 ±2,014»; Ai (F) = 8,095, А2,з(Л = 4,984 ±5,709», X4i5{F) = -1,825 ±7,052i, A6|7(F) = -7,207 ±3,090».
90 Лекция 7 Тогда как Ваш коллега предоставит следующий список: Xi(D) = -8,10, А2,з@) = -5,07 ± 5,70г, X4>S(D) ~ 1,76 ± 7,2i, X6t7{D) = 7,36 ± 3,22i; Aj(F) = 5,34, A2,3(F) = 3,21 ± 3,09», = -1,15 ± 3,89i, X6i7(F) = -4,73 ± 1,63г. На самом деле имеется возможность определить спектр матрицы С абсолютно точно, без каких-либо погрешностей. Оказывается, что С — L HL, где L w R — целочисленные треугольные матрицы: L= " 1 0 1 0 0 1 t о ' 1 0 0 0 0 0 0 0 1 0 0 0 0 1 0 0 1 0 1 0 1 2048 -2 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 1 0 1 256 1024 4 0 0 0 0 о о ¦ 0 0 0 0 0 0 0 0 1 0 о l. 128 512 512 ] 0 0 0 0 64 256 024 512 -4 0 0 32 128 256 512 1024 2 0 16 32 64 128 256 2048 -1 R = Поэтому спектр матрицы С совпадает со спектром матрицы Я, т.е. с эле- элементами, стоящими у этой матрицы на главной диагонали: А! (С) = 0, А2|3(С) = ±1, A4l5(C) = ±2, Ae.r(C) = ±4. Таким образом, разнобой в результатах, полученных с помощью ком- компьютера, вызван погрешностями выполнения арифметических операций. Почему в рассматриваемом примере эти погрешности оказались столь зна- значительными, скоро будет разъяснено. Причины скрываются в выборе при- примера и недостаточно корректной постановке самой математической задачи о расчете матричного спектра, а вовсе не в дефектах вычислительного ал- алгоритма или реализующей его программы. Приведенные примеры были рассчитаны с использованием относительной точности 10в. Я должен за- заметить, что когда один из моих коллег после дискуссии, подобной той, что описана выше, использовал версию, допускающую повышенную точность (порядка 10~22), он получил точные собственные значения матрицы С. Понятие об е-спектре Для разъяснения сложившейся ситуации надо ввести понятие е-спектра матрицы.
Лекция 7 91 • Комплексное число А принадлежит е-спектру N х ЛГ-матрицы А (А е Л?(Л)), если существует N х /V-матрица А с нормой, не превышающей е ¦ \\A\\ (!|Д|| ^ е||Л||), при которой det[A/ - (Л + А)] = 0. Иными словами, А должно быть точным собственным значением воз- возмущенной матрицы А + Д. Часто е-спектр Ае(А) определяется иначе. • Комплексное число А принадлежит е-спектру Ас (А), если либо<Ы[А/—А] = 0, либо если норма резольвенты (А/ - А)~1 превышает 1/(е||Л||) (||(А/ — Если условиться, что равенства det[A/ — Л] = 0 и ||(А/ — Л) 1\\ = оо имеют одинаковый смысл, то можно ограничиться формулировкой лишь второй из перечисленных возможностей. Несмотря на различие формулировок, они описывают одно и то же множество Л?(Л). Задача 7.1 (обязательная!). Доказать эквивалентность определений е- спектра. Указание. Надо воспользоваться сингулярным разложением матрицы XI- А при фиксированном значении А, чтобы определить, принадлежит ли это А е-спектру. Второе из приведенных нами определений, хотя оно и несколько фор- формально, позволяет разработать технологию графического изображения е~ спектров, тогда как первое выглядит более естественным и хорошо разъ- разъясняет смысл введенного понятия. Конечно, любой расчет собственных значений неизбежно связан с по- погрешностями. Естественно предполагать, что рассчитанные величины яв- являются точными корнями характеристического уравнения det[A/ — А] не- некоторой матрицы А, близкой к Л, а степень этой близости характеризуется разрядной сеткой, используемой для представления чисел в памяти ком- компьютера и зависит от добротности выбранного для расчета алгоритма. Даже если у нас есть возможность задать интересующую нас матрицу Л с произвольно высокой точностью, то, помещая ее элементы в память компьютера, мы обязаны их размещать в ячейках стандартного разме- размера, отбрасывая все разряды, туда не помещающиеся. В настоящее время, как правило, используется представление чисел с относительной точностью 10~16. Поэтому естественно, что и матрица А, спектр которой выдается за спектр Л, должна отличаться от матрицы Л по норме не больше, чем на 10~16][Л||. Это означает, что рассчитанный спектр должен рассматривать- рассматриваться как некоторый набор комплексных чисел, принадлежащих Ле(Л) при е никак не меньшем, чем 10~16. Эта гипотеза, по-видимому, должна быть справедливой и в нашем примере, хотя у нас матрица С была целочис- целочисленной и могла быть помещена в компьютер без каких-либо погрешностей вынужденного округления. Однако округления все равно неизбежны во время последующего вычислительного процесса. Был проведен весьма дорогостоящий расчет е-спектров матрицы С ви- вида G.1) при различных е и выяснилось, что при е = 10~16 он представляет
92 Лекция 7 из себя почти круговое пятно радиуса примерно 7,5 с центром в начале координат. Поэтому любая точка комплексной плоскости внутри этого пятна с очень большой точностью может считаться собственным значе- значением, и мы не имеем никаких прав предъявлять претензии составителям стандартных программ, которые были использованы. Следует также заметить, что наличие у матрицы С точек А* 6 ЛГ(С) таких, что |А" | > г, на практике всегда приводит к тому, что итерационный процесс un+i — un + -Cun + Sn + f, в описание которого мы внесли векторы г 5п вычислительных погрешностей с \\Sn\\ < е, оказывается1 расходящимся, даже если все точные собственные значения матрицы С лежат строго внут- внутри круга радиуса г. Читатель может убедиться в этом, проделав несколько серий вычислительных экспериментов. Задача 7.2. Положив для простоты / = 0 (тогда последовательность векторов ип может сходиться только к нулевому вектору), очень поучи- поучительно при различных г (например, г = 5,6,10,30) провести расчеты с моделирующими погрешности правыми частями 6п = 10~pUnSQ, где П — матрица перестановок, упомянутая выше, а вектор So, например, такой; [100010]т = So. Начальный вектор можно выбирать произвольно. Как бу- будет зависеть поведение последовательности {ип} от параметров г и р? Необходимая осторожность при использовании теорем о непрерывности На первый взгляд, разобранный пример противоречит строго доказы- доказываемой теореме о том, что совокупность характеристических корней мат- матрицы непрерывно зависит от матричных элементов. Чтобы разобраться в существе вопроса, рассмотрим еще один пример. Рассмотрим квадратную матрицу Аш 25-го порядка, зависящую от параметра ш, следующего вида: **W — 0,625 0 О 10 0,625 0 о 10 0,625 10 0,625 0 10 0,625. G.2) При ш = 0 все собственные значения матрицы Лш равны 0,625, что сущест- существенно меньше единицы, а при \ш\ = 10 ¦ 85 и 2,6 ¦ 10~22 — все Aj(Aj располагаются на окружности А = 0,625 + l,25e*v, деля эту окружность на 25 равных частей. При этом среди \j(Au) наибольшим по модулю бу- будет число |A_j| rj 1,875 = 0,625 + 1,25. Естественно, что при п -> оо имеем \\Aq\\ -» 0, ||Л?|| -» оо, и это несмотря на то, что |[Л0-Л^|| = М sa 2,6 10~22! 'с выбирается на основе информации о числе используемых десятичных или двоичных разрядов в представлении чисел.
Лекция 7 93 Одна из наиболее аккуратных формулировок теоремы о непрерывной зависимости спектра от матричных элементов принадлежит Островскому и приведена в классической монографии [Уилксон; 1]. Мы незначительно видоизменим эту формулировку, чтобы упростить ее применение к анали- анализу изучаемого примера. Теорема 7.1. Если элементы atJ- и Ъц N х N-матриц А и В таковы, что |a,j| < 10 и \bij\ < 1, то для каждого собственного значения Х(А) матрицы А найдется собственное значение ^j{A + шВ) матрицы А 4- шВ в окрестности Применяя теорему 7.1 к нашему примеру, следует положить N = 25, = 10 • 8~25, откуда следует, что j - А| Ясно, что наш пример теореме Островского не противоречит, но подтверж- подтверждает) что схоластическое жонглирование термином "непрерывность" без ак- аккуратного указания модуля непрерывности приводит иногда к абсурду. Двумерные спектральные портреты Изображение спектра на комплексной плоскости естественно называть спектральным портретом матрицы. Можно, например, нанести изолинии с постоянным значением нормы резольвенты ||(А/ — А)'1]] — 10~*/]|Л|| при к = 5,7,11,15. Для наглядности можно раскрасить в разные цвета области, ограниченные этими изолиниями. Когда такие портреты стали реализовы- вать, то оказалось, что они могут быть весьма и весьма разнообразными. Например, спектральный портрет матрицы С вида G.1) достаточно прост. Почти круговой овал с к = 16, о котором уже шла речь, окружен серией почти концентрических овалов, все менее и менее отличающихся от окружностей, отвечающих значениям к = 12, к = 8, к = 4. Все точки ее почти спектра A.10->g(C) собираются в одно спектральное пятно (радиуса «7,5). На рис. 7.1 изображен спектральный портрет треугольной матрицы о -2 25 0 0 0 0 0 0 0 0 0 0 0 -3 0 0 0 0 0 10 2 0 0 0 0 3 15 0 0 0 0 3 3 15 3 0 0 3 3 3 10 -2 0 0 0 0 0 25 -3 G.3) на которой заштрихованы области, покрывающие A10-s(B) и Л10-в(?). Эти области оказались совсем не малыми.
94 Лекция 7 -3 -3 Рис. 7.1. Спектральный портрет матрицы В вида G.3) Как правило, ЛЕ(Л) разбивается на несколько "спектральных пятен" 1 т.е. связных зон, в каждой из которых |[(А7 — А)~1\\ > Надо отметить, что любое спектральное пятно обязательно должно со- содержать внутри себя хотя бы одно собственное значение. В противном слу- случае т.е. если собственных значений нет в ограниченной замкнутой области, граница которой является линией на которой j|(A7—A)"!! = const — 1/еЦЛЦ, то с помощью принципа максимума для этой нормы (см. задачу 5.1) мож- можно доказать, что внутри этой области всюду норма ||(А7- А)~~1\\ не превы- превышает граничных значений и, следовательно, эта область (TO4Heej ее внут- внутренность) не принадлежит ЛС(Л). Чтобы выполнялся принципа максимума для нормы резольвенты, надо предположить, что в рассматриваемой облас- области нет собственных значений. Отсюда и следует необходимость сущест- существования точек спектра Xj(A) в каждом ограниченном спектральном пятне. Конечно, спектральное пятно может содержать несколько точек спектра.
Лекция 7 95 Интеграл, взятый по кривой 7, ограничивающей спектральное пятно, представляет собой, как мы знаем, инвариантный проектор, отвечающий всем собственным значениям, попавшим в пятно. Таким образом, спектральные пятна дают наглядное представление о том, на сколько инвариантных подпространств можно естественным образом разбить все iV-мерное пространство, в котором действует оператор, описыва- описываемый матрицей А. При повышении точности (уменьшении е) инвариантные подпростран- подпространства дробятся при дроблении пятен, но мы уже видели, на примере мат- матрицы С, что этого процесса можно и не заметить даже при весьма малом е = 10~16. Отвечающее этому е пятно естественно считать практически неделимым, хотя все собственные значения матрицы С различны. Экран монитора состоит из большого числа светящихся точек (пиксе- (пикселей). Изображая на экране какой-либо прямоугольник комплексной плос- плоскости, мы сопоставляем каждому пикселу отвечающее координатам его центра число А. Например, при разрешающей способности экрана 640 х 350 точек, мы сопоставляем пикселам 224 000 точек комплексной плоскости. Для каждой из этих точек (т.е. для соответствующего А) можно опре- определить е = 1/||(А/ - Л)]!, при котором А е Ле(Л), и в зависимости от величины е выбрать цвет окраски соответствующего пиксела. После того, как все пикселы будут окрашены, на экране появится картинка, которую естественно назвать спектральным портретом матрицы А. Желание и возможность строить спектральные портреты возникли в начале 90-х годов почти одновременно в нашем коллективе в Новосибирске (где вместе со мной эту проблему изучали В. И. Костин и О. П. Кирилюк) [Годунов-Кирилкж-Костин; 1], [Годунов; 5] и в коллективе, возглавляемом профессором Л. Трефетхеном (работавшим в те годы в США, а в насто- настоящее время — в Великобритании) flVefethen; 1, 2]. В дальнейшем тема спектральных портретов широко разрабатывалась [Trefethen; 3, 4], [Reddy- Trefethen; 1], [Tisseur-Higham; 1], [Gallestey; 1], [Lavallee-Sadkane; 1]. Одномерные спектральные портреты На мой взгляд, для инженерных приложений удобнее вместо подроб- подробных двумерных портретов пользоваться портретами одномерными. Выберем на комплексной плоскости какое-либо семейство кривых ее заполняющих таких, что каждая из кривых делит плоскость на две части. Например, можно взять систему концентрических окружностей или пря- прямых, параллельных мнимой оси. По каждой из этих кривых вычисляется интеграл норма \\Z~,\\ которого служит критерием качества дихотомии спектра мат- матрицы А кривой 7- Кривые 7 нумеруются некоторым параметром (Для
96 Лекция 7 окружностей А = гегч> — это радиус г, для прямых А = а + И — коорди- координата а пересечения с мнимой осью). График зависимости \\Zy\\ от этого параметра называется одномерным спектральным портретом. Рис, 7.2. Зависимость ||Яд(Л){[ от Ятя Яд(Л) вида G.4) Pl4C. 7.3. Фрагмент рис. 7.2
Лекция 7 97 На рис. 7.2 изображена зависимость ]|Нд(Л)Л от радиуса R, где 2т 1 ЯД(Л) = - 1 л 30 14 25 10 20 6 15 3 А= 2 1 G.4) 1/8 1/10 1/12 1/100 1/16 1/100 1/20 Норма ||#д(.Д)|| отложена на ординате в логарифмическом масштабе. На рис. 7.3. детальнее изображена часть того же портрета. ю-г -1S -10 10 15 20 25 Рис 7.4. Зависимость ||Х«(.<4)|] от а На рис. 7.4 изображена зависимость от а нормы | + 0О , где =±- ( di[(a-it)I - In J G.5)
98 Лекция 7 для матрицы А = '20 14 19 10 20 3 15 1 0 G.6) -9 Величина ||Х0(Л){| опять откладывается по ординате в логарифмическом масштабе. Заметим, что так же, как И — Hr{A) с соответствующим проектором V — Vr{A) образует решение матричных уравнений Я - -^А*НА = V*V - (I - V'){I - V), так и X = Xa(A) с проектором V на инвариантное для А подпространст- подпространство, соответствующее точкам спектра Л,-(Л), ReAj < а, образует решение уравнений Булгакова Х{А - о/) + {А* - aI)X + V'V -{I- V'){I -V) = 0, X-X*t V'X = XV, V2=V, которыми удобно пользоваться для проверки точности вычисления И и X (см. задачи Д4.4, Д6.1, Д6.2). Одномерные спектральные портреты позволяют наглядно представить круговое (окружностями) или линейное (прямыми, параллельными мни- мнимой оси) расслоение кластеров и их размеры. К тому же они напоминают широко употребляемые физиками и инженерами резонансные кривые. Отметим, что изучение расслоения спектра с помощью одномерных спектральных портретов предпочтительно по причине того, что интеграль- интегральные критерии дихотомии во многих практических интересных случаях не- непрерывно зависят от исследуемых матриц и, в свою очередь, обеспечивают устойчивые и удобные для применений оценки решений дифференциаль- дифференциальных (или разностных) краевых задач, для которых эти матрицы входят в коэффициенты уравнений. Такого рода оценки аналогичны оценкам мат- матричных экспонент (см. лекцию 3) и являются их естественными обобщени- обобщениями (см. [Godunov-Bulgakov; 11]). Ниже мы остановимся на применениях оценок экспонент в дискуссии о содержании теорем Ляпунова. Обсуждение теорем Ляпунова об устойчивости решений дифференциальных уравнений Мы довольно подробно обсудили на предыдущих лекциях понятие спек- спектральной дихотомии и связанные с квадратичными формами критерии, обеспечивающие устойчивое расслоение матричного спектра на кластеры. Эти критерии представляют из себя либо варианты давно известных кри-
Лекция 7 99 териев Ляпунова в теории устойчивости движения, либо недавно разрабо- разработанные естественные обобщения критерия Ляпунова. Сейчас будут при- приведены примеры, которые пояснят причину, по которой мы уделили этим критериям столько внимания. По сложившейся практике преподавание теории устойчивости в кур- курсах механики и дифференциальных уравнений, читаемых в инженерно- технических ВУЗах, а порой и в университетах, вырабатывает у слушате- слушателей стандартное устоявшееся впечатление, что результатом анализа устой- устойчивости решений линейной системы х = Ах должна быть таблица собст- собственных значений \j(A) матрицы коэффициентов А. По этой таблице надо определить верхнюю границу S = maxjKeXj(A) их вещественных частей. Если она отрицательна (<$ < 0), то система, якобы, будет устойчивой. На самом деле такое понимание теории Ляпунова может привести в инженерных вопросах к катастрофическим последствиям. Надо, правда, отметить, что сам Ляпунов в этом не виноват. Причина неприятностей лежит, с одной стороны, в поверхностном восприятии введенных им поня- понятий, а с другой — в недопустимом для грамотных и ответственных инже- инженеров отношении к аккуратности в указании допусков, которым должны удовлетворять значения параметров рассчитываемой конструкции. Таки- Такими параметрами в рассматриваемой задаче являются элементы матрицы А. Величина допустимых допусков даже по абсолютно точно известным собственным значениям не может быть предугадана. Заметим, что и сами собственные значения, получаемые инженерами с помощью имеющегося в их распоряжении стандартного программного математического обеспече- обеспечения компьютеров, обычно не имеют никакого гарантированного сертифи- сертификата точности. На самом деле Ляпунов предложил критерий устойчивости в виде квадратичной формы (Хх,х) (X — X* > 0) такой, что на решениях систе- системы х = Ах значение этой формы не возрастает или даже строго убывает —{Хх,х) < 0. Напомним, что в случае устойчивости матрица X квадра- квадратичной формы (Xxtx) может быть найдена по произвольно выбранной по- положительно определенной матрице С = С > 0 путем решения матричного уравнения Ляпунова (см. лекцию 3). Отношение наибольшей и наимень- наименьшей осей эллипсоидов (Хх,х) = const, т.е. величина Ц^Ц/Ц^]], а также относительная скорость убывания с ростом t квадратичной формы (Хх,х), вычисляемая в виде отношения 1/(||Л"|| ¦ ЦС]!), могут быть использованы как критерии качества устойчивости. Заметим, что эти критерии зависят от имеющихся у исследователя возможностей выбора С = С* > 0. Задав- Задавшись какой-либо конкретной матрицей С и рассчитав по ней X, уже можно гарантировать справедливость квалифицированной оценки убывания \\x(t)\\ (см. лекцию 3) IWOII ^ I Известны процедуры, позволяющие либо вычислить X со всеми машинны- машинными знаками ее элементов, если \\X\\ не превышает заданного предела, ли- либо гарантированно убедиться, что такое превышение действительно имеет место. Сейчас мы на этом не останавливаемся.
100 Лекций 7 После того, как Ляпунов сформулировал и доказал теорему об устой- устойчивости, изучаемой с помощью оценок квадратичной формы (Хх,х) или других функций от вектора х — называемых теперь функциями Ляпунова — он доказал вспомогательное утверждение о существовании решения X уравнения ХА + А"Х + С = О при условии, что все собственные значения матрицы А лежат в левой полуплоскости, т.е. фактически установил при- приведенную выше оценку ||г(*)|(. В лекции 3 мы назвали соответствующее утверждение первой теоремой Ляпунова.2 При изложении этого материала в курсах механики и обыкновенных дифференциальных уравнений приводится обычно формулировка теоремы Ляпунова примерно следующего содержания: Теорема Ляпунова. Если Re А, (Л) < 0 при всех j, то существуют поло- положительные постоянные ~f и 8 такие, что для любых решений x(t) уравнения х = Ах справедлива оценка \\x(t)\\ ^ 7е~*е||х@)Ц- Заметим, что без указания конкретных значений f и 6 эта формули- формулировка для инженерных приложений бессодержательна. Именно с повторе- повторения варианта этой формулировки мы начали в лекции 3 изложение доказа- доказательств теории Ляпунова. Они были охарактеризованы как схематические, поскольку основывались на только что приведенной формулировке без ее подробного обоснования. Однако окончательные формулировки доказан- доказанных на их основе теорем уже никакого произвола и никаких недоговорен ностей не содержат, а полученное при этом неравенство абсолютно строгое. Отступление При исследовании, цель которого продемонстрировать справедливость гипоте- гипотезы о гурвицевости матрицы А, в качестве С удобно выбирать диагональную матрицу, кратную единичной. Обычно полагают С = 2||Л||/ либо С = 2а/, где а — наибольшее собственное значение эрмитовой матрицы -[А+А*). Нетрудно проверить, что на решениях уравнения х — Ах откуда \\x(t)\p ^ e2ta||i@)||2 и ||х(<)|| ^ е'в||а;@)||. В частности, при a < 0 отсю- отсюда следует экспоненциальное убывание ||ж(*)|| при t -*¦ оо. Мы скоро убедимся, что даже при a > 0 использование этой характеристики матрицы А бывает полезно. 2Здесь дано весьма схематизированное изложение структуры исследований Ляпуно- Ляпунова. Заметим, что он также рассматривал в качестве типичных "функций Ляпунова" однородные формы любой степени, а не только квадратичные (см. [Ляпунов; 1]).
Лекция 7 101 Если С = 2||Л||/, то, как было показано в лекции 3, решение X = X* > О уравнения Ляпунова ХА + А*Х 4- 2||Л||/ = 0 существует и единственно лишь, когда весь спектр матрицы А расположен в левой комплексной полуплоскости. Норма \\X\\ этого решения может быть использована в удобном для применений неравенстве ИОН ^ >ЛИехр{-*|И|1/||Х||}, которое показывает, что величина х{А) = \\X\\ служит удобным критерием гур- вицевости матрицы А. К сожалению, этот критерий неприменим для матриц А с большой нормой, например, как в случае матриц, появляющихся при разност- разностной аппроксимации эллиптических дифференциальных операторов. Такие опе- операторы неограниченные, а нормы их разностных аппроксимаций неограниченно возрастают при увеличении числа точек разностной сетки, т.е. при уточнении аппроксимации. Для решений уравнений x(t) = Ax(t) с такими матричными операторами А обычно используется оценка ||я;@1! ^ е*аЦаг{0I|, весьма эффек- эффективная при а < 0. Интересно отметить, что при а > 0 если наряду с величиной а использо- использовать норму \\X\\ решения уравнения Ляпунова ХА + А" X + 2а/ = 0, то можно опираться на неравенство Мы не будем останавливаться на его обосновании и отсылаем читателя к работе [Нечелуренко; 1] (см. также [Veselic; 1]). ¦ Иногда, формулируя обычно используемое для гурвицевых матриц не- неравенство ||z(*)|| ^ 7е~<51|1а;@I!) отмечают, что 6 можно выбрать как угодно близко к наименьшей (по модулю) вещественной части у собственных зна- значений (е > 0): 6 = min|ReAj(.A)| - е, ReAj < 0 (напомним, что в лекции 3 вместо S мы писали <5/2, считая, что S = тт;- |ReAjj). Однако при этом упускают из виду то обстоятельство, что, уменьшая е, можно вызвать не- непредсказуемый рост предэкспоненциального множителя 7. рост, делающий оценку практически непригодной для использования [Годунов; 4]. Проиллюстрируем эти утверждения простым примером. Система из 25 дифференциальных уравнении at I uXi, 1 = ^0, имеет матрицу коэффициентов --1 0 ш 10 -1 0 0 10 ... -1 10 -1 у которой при ш = 0 все собственные значения равны -1. Иными словами, Ло — гурвицева матрица и нулевое решение системы устойчиво. Решение
102 Лекция 7 этой системы нетрудно выразить явно. В частности, если zjstO) = 1, а все остальные компоненты начального вектора нулевые, 2,@) = 0, 1 ^ i ^ 24, то xi(i) = B5 - k)H2s~ke~l. Для рассматриваемого частного решения \\x(t)\\ ? l*i@l = 24!*24е-^22@)| = 24!tsV||r@)||. Воспользовавшись формулой Стирлинга, которая при п = 24 удивительно точна: и тем, что е'2 > 1/VZ, можно получить безусловно верные, хотя и гру- грубоватые неравенства свидетельствующие о том, что даже при 0 ^ ( ^ 1 в оценке постоянная 7 не может быть выбрана меньше, чем >/24~тг824!!! Собственные значения матрицы Аш при ш = —10 • 8~25 rj -2.6 ¦ 10~22 нетрудно вычислить явно, и среди них существует А(Д^) = 1/4. Заме- Заметим, что у матриц Ао, Аш все элементы, кроме одного, совпадают, а один нулевой элемент матрицы Ао заменяется при переходе к Аш на величи- величину, которая при признании допустимости погрешностей в представлении элементов порядка 10~20 должна оставаться незамеченной. Приведенные примеры показывают, что для практических примене- применений использование квадратичных функций Ляпунова и вообще матричных критериев спектральной дихотомии гораздо удобнее, чем использование собственных значений. Эти критерии приводят к гарантированным оцен- оценкам результата во многих случаях, когда спектральный анализ матриц предназначается для анализа поведения разнообразных инженерных кон- конструкций. В свое время утверждалось, что легче вычислить собственные зна- значения, чем решить матричное уравнение Ляпунова. Однако в настоящее время, когда широко распространены компьютеры и разнообразные про- программные средства, входящие в их математическое обеспечение, подобные аргументы в пользу собственных значений отпадают. Проблема расслоения спектра на спектральные кластеры Надо отметить, что примеры этой лекции наводят на вопрос, дейст- действительно ли спектр той или иной матрицы можно разбить на кластеры. Первый пример как раз представлял матрицу, у которой весь е-спектр при доступной для нашего выбора величине е сливается в одно пятно. Полезно было бы иметь определенную гарантию, что рассматривае- рассматриваемые матрицы действительно допускают четкое расслоение спектра. Такая информация особо необходима при изучении матриц гигантского порядка, возникающих при аппроксимации дифференциальных уравнений с частны-
Лекция 7 103 ми производными методом конечных элементов. По-существу, цель про- проведения спектрального анализа таких матриц обычно состоит в выделении базиса инвариантного подпространства, отвечающего важной для данных целей области спектра. После этого обычно рассматривают оператор толь- только на выделенном подпространстве не слишком большой размерности, и это его ограничение используется при решении разнообразных техничес- технических задач. Но чтобы такой базис построить, связанные с этим базисом собственные значения должны быть изолированы от остальных. Проблема расслоения спектра будет рассмотрена в лекции 12. До этого потребуется провести целый ряд подготовительных исследований. Отступление Я расскажу об одном эпизоде моей юности, который, по-видимому, послужил поводом того, чтобы у меня появилось любопытство и желание изобразить гра- графически матричный спектр с указанием точности его определения. К счастью, мне удалось заинтересовать этим вопросом моих коллег В. И. Костина и О. П. Ки- рнлюка, сумевших довести идею до работающей программы. Дело происходило в самом конце 50-х годов, когда мы с В. С. Рябеньким занимались написанием монографии, посвященной изложению вопросов теории разностных схем. Нам было поручено систематизировать те изобретения в этой области, которые были достигнуты в нашем институте (Институт прикладной математики АН СССР, организованный в 1953 г. М. В. Келдышем) в отделе, ру- руководимым И. М. Гельфандом. Изобретений было много, они были очень разно- разнообразными. Во многих случаях их обоснование носило эвристический характер, хотя и выглядело очень убедительным. На одном из семинаров И. М. Гельфанд и К. И. Бабенко рассказали о предлагаемом ими приеме исследования устойчивос- устойчивости граничных условий разностных операторов. Я на этом семинаре отсутство- отсутствовал и почувствовал затруднение, когда получил указание — включить описание предложенного метода в нашу монографию. В конспектах участников семинара после изложения приема следовали фра- фразы, что его обоснование вытекает из общих, хорошо известных теорем функцио- функционального анализа. По-видимому, мы с В. С. Рябеньким этим анализом владели недостаточно, чтобы такое объяснение принять. И. М. Гельфанд предложил об- обратиться за подробностями к К. И. Бабенко, а последний просто высказал не- неудовольствие, что его просят разъяснять азбучные истины. Нам все же удалось получить обоснование, вытекающее из предложения И. М. Гельфанда и К. И. Бабенко. Его изложению посвящена гл. VI нашей моно- монографии [Годунов-Рябенький; 1]. Понимание существа вопроса пришло из соображений, которые высказал И. Э. Шноль во время дискуссии по поводу анализа устойчивости следующей классической разностной схемы, аппроксимирующей дифференциальное урав- уравнение и граничное условие
J04 Лекция 7 на сетке, состоящей из точек х = nh = n/N, t = тт, в которых u{x,t) прибли- приближается значениями и™. Разностные соотношения, используемые для аппроксимации дифференци- дифференциального уравнения и граничного условия ¦^ = 0, после введения обозначения г = т/h приводят к матричному оператору, пере- переводящему значения сеточной функции на временном слое t = тпт (т.е. вектор um — [iig1,^,.. . ,«$]т) в ее значение на следующем слое t = [т + 1)г (т.е. в вектор и0 = [«о (N + 1)-матрицей ,«]"+1> ¦ ¦ -Ujv+1]T)- Этот оператор описывается (JV-f I) x 1 — г г 1-г 1-Г с характеристическим уравнением det[Rh - А/] = -АA - г - А}* = 0. Таким образом, у этой матрицы есть только два собственных значения: А = О и А = 1 — г. Получение решения ит на временном слое t = rnr из начальной сеточной функции и0, заданной при i = 0, описывается формулой um = R™u°. Для обеспечения сходимости сеточных функций к решению u(x,t) дифференци- дифференциальной задачи при h -у 0 г = т/h = const в области O^z^l.O^i^T1, необходимо обеспечение устойчивости, т.е. ограниченности норм степеней опе- оператора Rh {\\R^\\ ^ К, 0 ^ m $C T/(rh)). В этой оценке константа К не должна зависеть от h. Я не буду останавливаться на обосновании необходимости этого условия, так как оно детально изучается в курсах вычислительной математики. Кажется естественным, что для обеспечения устойчивости достаточно по- потребовать выполнения неравенства |А| = |1 — г| < 1, для чего можно использо- использовать отношение шагов т/h = г = 3/2. Однако расчет при г = 3/2 и достаточно маленьком шаге h не удается осуществить. Читателю рекомендуется в этом убедиться, задав, например, следующие начальные (при i — 0) данные: f ft 0 < т < 11I Известное теоретическое обоснование необходимости ограничиваться от- отношениями r/h ^ 1 вытекает из сравнения областей начальных данных, вли- влияющих на значения решений исходной задачи и се разностной аппроксимации. Соответствующий критерий устойчивости был впервые предложен в 1928 в клас- классической работе "О разностных уравнениях математической физики" [Курант- Фридрихс-Леви; 1] и носит название критерий Куранта.
Лекция 7 105 Складывается парадоксальная на первый взгляд ситуация. У матрицы нет собственных векторов с собственным значениями вне единичного круга, и даже близко к его границе. Все собственные значения (А = —1/2, А = 0) лежат в круге |А| ^ 1/2. В то же время, нормы степеней #?* оказываются гигантскими. При обсуждении описанной ситуации И. Э Шноль отметил аналогию со свойствами оператора дифференцирования -j-, определенного на интегрируе- ах мых в квадрате функциях, имеющих обобщенные первые производные, квадрат модуля которых также интегрируем на всей числовой прямой —оо < х < -foo. Спектр этого оператора состоит из всех чисто мнимых чисел iw, которым долж- должны были бы соответствовать собственные функции иш(х), удовлетворяющие уравнениям u'w(x) = iwuw(x), т.е. функции иш(х) = constelw*. Однако ин- интегралы квадратов модулей от этих функций и от их производных расходятся —-elwx = w) и они рассматриваемому пространству не принад- ах лежат. В то же время, в этом пространстве лежат "почти собственные" функ- функции оператора —-. Роль "почти собственных" выполняют, например, функции uWii(x) = <p(x/l)etwx, где Задача 7.3. Проверить, что /(w,/)/91(n,/) ~? 0 при / -? оо, где /<«,') = dx 2 4 — CO d 21 \dx d ( d " I T~ ax \ax dx, Возникло подозрение, что при уменьшении шагов h у операторов Ни тоже возникают "почти собственные векторы" с "почти собственными значениями", далекими от точных собственных чисел \j(Rh)- Наличие таких "почти собст- собственных" А с |А| > 1 может являться причиной роста ||Л™||- В результате описанных обсуждений возникло следующее определение. • Комплексное число А называется точкой спектра семейства операторов {Rh}> если для любого положительного е > 0 можно указать ho > 0 такое, что при любом h (О < h < ka) существует вектор и из соответствующего сеточного пространства Uh такой, что \\RhU — \и\\ ^ е||«||. Совокупность всех таких точек спектра называется спектром семейства операторов {Rh}. Используя это определение, нам с В. С. Рябеньким удалось изложить об- обоснование приема Гельфанда- Вабенко исследования устойчивости разностных схем, содержащих, как уравнения для внутренних точек, так и граничные усло- условия. Идея этого обоснования составляет содержание гл. VI [Годунов-Рябенький; 1] и получила дальнейшее развитие в работах [Годунов-Рябенький; 2], [Рябень- [Рябенький; 1,2].
106 Лекция 7 Подробное изложение теории спектров семейств операторов дано также во втором издании A967 г.) книги Рихтмайера и Мортона [Richtmyer-Morton; 1]. Оказалось, что спектру описанных выше семейств разностных операторов, аппроксимирующих уравнение щ —их = 0, принадлежат не только вычисленные точные собственные значения А = 0 и А = 1—г, ной все точки круга |А—1 + г| < г. При г = 3/2 этот круг содержит интервал —1 > А > 3/2, существенно выходящий за границу единичного круга. Цитируемая гл. VI нашей книги начинается с приведенного выше опреде- определения и следующей теоремы. Теорема 7.2. Если я?о = mo(h) —> оо при. h —»¦ 0 и хотя бы одна тонка Ао спект- спектра семейства {R/,} лежит вне единичного круга комплексной плоскости [т.е. |Ао| > 1), то нельзя указать общую для всех h постоянную К, чтобы при 0 < тп < mo(h) выпол- выполнялось неравенство ||Яд*[| < К. Кроме описанного примера, построение спектров семейств разностных опе- операторов, зачастую приводило к спектрам, состоящим из одного или нескольких "пятен" комплексной плоскости. Это обстоятельство и послужило основой ги- гипотезы, что не только у семейств разностных операторов, каждому из которых принадлежит бесконечное число матриц неограниченных размеров N х N, но и у некоторых конкретных матриц достаточно большого размера приближенные собственные значения могут покрывать массивные спектральные пятна. Проверка этой гипотезы и была предпринята в 90-91 годах во время тести- тестирования алгоритмов, осуществляющих с гарантированной точностью вычисле- вычисление сингулярных чисел и сингулярное разложение. Описанию использованных алгоритмов посвящены книги [Годунов-Антонов-Кирилюк-Костин; 1] и [Малы- [Малышев; 2] и препринты [Бибердорф-Попова; 1,2]. ¦
Лекция 8 Отношение Рэлея для не эрмитовых матриц. Область значений (ха~ усдорфово множество). Теорема Хаусдорфа о выпуклости. Оценки \\etA\\ и \\(Х1 - А}~1\\, вытекающие из рассмотрения области значе- значений. Секториальные операторы. Критерий секториальиости. До- Дополнительный материал в задачах. Если матрица А эрмитова (А — А") то она может быть подобным уни- унитарным преобразованием приведена к диагональному виду. При этом есе элементы диагональной матрицы окажутся вещественными. Иными сло- словами, эрмитова матрица А представима в виде А- «21 «12 «22 0-2N а-2 .«N1 «N2 ¦ ¦ ¦ где U*U — In, «i ^ «2 ^ ¦ ¦ ¦ ^ «n (все cij вещественны). Выясним, какие {Ax,x) значения может принимать отношение — г-, когда х пробегает всевоз- (х, х) можные ненулевые векторы ^-мерного унитарного пространства, в кото- котором действует оператор, описываемый матрицей А. Ясно, что каждому х ф 0 можно сопоставить вектор у = U'x ф 0. При этом х = Uy. Поэтому N {Ах,х) AUy,Uy {VAUy,y) (х,х) (Uy,Uy) [у,у) N N E Мы уже встречались с отношением {Ах,х} {х,х) для эрмитовых матриц и уста- установили, что возможные значения этого отношения заполняют выпуклую оболочку собственных значений ai,a2,... ,a/v матрицы А, т.е. отрезок [ai,ajv]. Напомним, что это отношение называется отношением Рэлея. В 1918 г. Теплиц предложил рассматривать возможные значения от- отношения (Au,u)/{u}u) не только для эрмитовых, но и для произвольных матриц. Область значений стала называться областью значений матрицы А или хаусдорфовым множеством матрицы А. Мы скоро поясним, почему появилось второе название. 107
108 Лекция 8 Заметим, что даже если матрица А вещественна, область значений А может содержать комплексные числа. (Мы имеем право рассматривать {Аи, и) отношение —. -±- для векторов и, компоненты которых не обязательно (и, и) вещественны.) Проиллюстрируем это утверждение примером. Действуя матрицей А = L . на вектор и с компонентами 1, i, no- лучаем " 2 Аи~ '3 41 Uj- \3 + При этом (( 3 t 4i) ¦(!)) = A + 20-1 +C + 4f). (-0 = 5-2, (и,«) = 1 • 1 + t • (-1) = 2, (Аи, и)/(и, и) = 2.5 - 0.5 г. Область значений матрицы А обозначается через 1У(Л). Прежде чем переходить к описанию возможных геометрических форм множества W(А), докажем несложную лемму. Лемма 8.1. Для любых комплексных чисел z\, z2 существует число <р @ ^ <р ^ я-) такое, что выражение extpz\ + e~>?122 вещественно. Доказательство. Когда ip меняется от 0 до я-, точка г = z(ip) = eitpzi + e"%tpzi пробегает связную непрерывную кривую, соединяющую точки z@) = zi + z2 и гGг) = exwzi + e~**22 = -B1 + z2). Либо обе эти точки лежат на вещественной оси (в этом случае можно положить <р = 0 или у> = тт), либо кривая z(tp) при изменении <р переходит из одной комплексной полуплос- полуплоскости, ограниченной вещественной прямой, в другую и пересекает при некотором <р вещественную ось. D Следствие 8.1. Для любых векторов u,v и любой матрицы А можно подо- подобрать число <р @ ^ ц> ^ тг) гак, что выражение exlp(Au, v) + е~Х1р(Ау, и) будет вещественным. Это следствие будет использовано при дальнейшем построении. До- Допустим, что мы нашли векторы и, и такие, что (к, и) = 1, {Аи, и)/(и, и) = 1, (v,v) = 1, (Avtv)/{v,v) z= 0. При этом |(tz,t>)| ^ 1. Очевидно, что векторы и, v неколлинеарны и, следовательно, |(«,и)| < 1. Выберем (р при котором выражение b = eilfi(Au,v) + e~itfl(Av,u) вещест- вещественно и рассмотрим семейство векторов w(s) = е"^A — s)u + sv, зависящих от вещественного параметра s, пробегающего отрезок [0,1]: 0 $С s ^ 1. Имеем w@),w@)) = (шA),юA)) s= 1 > 0 при 0 < s < 1, {w(s), w{s)) = (e'v[l - s]u + sv, e'>«[l - j] + su) = A - sJ(u, u) + s(l - s)[ef>(u, w) + c-iv(v, «)] + s2(v, w) = A - sJ + 5A - s) ¦ 2 Re [elv>(w, v)} + 52 ^ A _ SJ + S2 _ 2*(] - S) \{U,V)\ > [A - 5) - SJ = A - 2SJ > 0.
Лекция 8 109 Следовательно, при всех s е [0,1), (w(s),w(s)) > 0 {Aw(s),w(s)) = A - sf{Av,v) + 5A - s)[eilfi(Autv) + e'iv(Avtu)] + s2Dv,«) = A - sf ¦ 1 + bs{l - s). Ясно, 4Tq(Aw(s),w($)) для всех s из [0,1] вещественно, (A(w@),w@)) = 1, (Л(шA),юA)) = 0. Поэтому вещественное отношение . . . ,, , ме- (u)(e)Ti;(e)) ((),()) няясь от 1 (при s = 0) до нуля (при s — 1), будет покрывать весь отрезок [0,1]. Итак, если область значений W(A) матрицы А содержит точки zi = 1 и 22 = 0, то весь соединяющий их отрезок [0,1] принадлежит W(A). Пусть теперь для некоторой матрицы А установлена принадлежность W(A) различных точек z\ и z2 комплексной плоскости. Построим вспомо- вспомогательную матрицу Л- 1 л При этом (Ли,w) _ 1 [Аи,и) z2 (и,1") _ 1 {Аи,и) г2 (и, U) Zi - Z2 («, U) Zi - Z2 («, «) Я1 - Z2 (и, и) Zi - Z2 ' Если векторы u,v таковы, что (Аи,и) _ Av,v) _ —. г— — Z\ , — — — Z2, {и,и) (v,v) то (Аи, ц) _ гг ^ {Av,v) _ z2 z2 _ . (и, и) zi - г2 гх - г2 ' (v, v) гг - z2 zi~z2 По доказанному весь отрезок [0,1] обязан принадлежать W(A). Так как (Aw,w) (Aw,w) -——— = (zi - z2) —, r- + г2| (w,w) (ги.ш) можно заключить, что когда отношение —.—Ц-J- пробегает сегмент [0,1], (w,w) отношение . . ' ч будут пробегать весь прямолинейный отрезок, соеди- (w, w) няющий точки z1 и z2. Тем самым доказана следующая теорема. Теорема 8.1 [Хаусдорф, 1919]. Область значений W{A) произвольной мат- матрицы А выпукла. Именно благодаря этой теореме для W(A) установилось название "ха- усдорфово множество". В работе Теплица [Toeplitz; 1] было показано, что внешняя граница W(A) выпукла, но остался открытым вопрос, нет ли
ПО Лекция 8 внутри W(A) "пустот", не покрытых значениями отношений (Ли,и)/(и,и). Спустя год на этот вопрос полностью ответил Хаусдорф [Hausdorff; 1]. Задача 8.1. Доказать, что хаусдорфово множество замкнуто. Очевидно, что если А^ — собственное значение матрицы А, т.е. су- существует вектор и ф 0 такой, что Аи — Xju, то (Аи, u) __ (Ajtt.u) _Л (ц, и) _ (и, и) {и,и) 3 {и,и) 3' Иными словами, весь спектр А принадлежит W(A) и, более того, выпуклая оболочка спектра целиком лежит в W{A). С другой стороны, очевидно, что (Ли, и) \\Аи\\-\\и\\_\\Аи\\ т.е. W{A) целиком лежит в замкнутом круге \z\ ^ ||Л|| радиуса ||Л|| с центром z = 0. Для любых вектора и^Ои матрицы Л, очевидно, что (Ли, и) (А* и, и) л отношения —. ~- и —.—-~ будут комплексно сопряжены: (и, и) (и, и) (Ли, и) _ (и, Ли) (A*utu) (и, и) ~ (и, и) "" (и, и) Поэтому, хаусдорфовы множества W(A) и W(A") получаются друг из дру- друга зеркальным отражением относительно вещественной оси комплексной плоскости. Вследствие этого, если для всех z e W(A) справедливо нера- неравенство Re z ^ 7) т.е., 1У(Л) целиком лежит в замкнутой комплексной полуплоскости, ограниченной справа вертикальной прямой z ~ t + it, то 1У(ЛФ) также лежит в этой полуплоскости. Очевидно также, что при том же предположении хаусдорфово множес- множество эрмитовой матрицы - (Л + Л'] лежит на вещественной оси и образует отрезок [а, 6] (других выпуклых множеств на прямой не бывает), все точки которого также расположены левее точки с абсциссой 7- Действительно, _ 1 (Аи,ц) 1 [А*и,и) _ 1 + («,«)  (щи) +2 («,«)  («,«) при любом ненулевом векторе и. Из этого обстоятельства вытекает чрез- чрезвычайно важное следствие, составляющее содержание следующей теоремы. Теорема 8.2. Если W(A) целиком лежит в полуплоскости Re г ^ у, то ||емЦ ^ е* при t > 0.
Лекция 8 Ш Доказательство основано на следующей цепочке равенств: dt" ' ' = {AetAx,etAx) + (etAx, AetAx) = {[A + A*]etAx, etAx) = 2 (~ [A + A*]etAx, etAx }. Так как (~ [A + A'}etAx, etAx}/(etAx, etAx) ^ Ъ имеем Воспользовавшись равенством (etAx,etAx) — ||ема;||2' можно заменить по- последнее неравенство эквивалентными неравенствами --27' (— ||ptArll2 - 2-v HpmiII2 I < П — |ptArll2 - I < П — fe-274leMzll21 < 0 откуда е-^'Цс^хЦ2 ^ ||x||2 и \\etAx\\ ^ e*\\x\\ при ^0. D Столь же важно для приложений неравенство, которое составляет со- содержание теоремы 8.3 ниже. Сначала введем обозначение d(X,W(A))= inf 4 €W( Очевидно, что если А е W{A), т.е. А лежит внутри W(A), Tod{A,W(^)) = 0. Теорема 8.3. Справедливо неравенство Конечно, неравенство (8.1) содержательно только для значений А, ле- лежащих вне W{A). В случае А € W(A) оно тривиально: ||(А/ — Л)!) ^ оо. Доказательство. По определению d{X,w(A)) = inf |А-г|= inf A- (Ax,x) lx,x} = inf ([XI-A}x,x) (x,x) Следовательно, при любом х \{[\I-A}x,x)\^\\xf.d{KW{A)). (8.2) Если <*(A, W{A)} > 0, то из (8.2) вытекает, что матрица XI- А не вырождена, и, следовательно, для любого вектора у можно определить вектор х такой, что х — (XI - А)~1у. Подставляя такой вектор х в (8.2), находим , [XI - Л]»)! ^ ||[А/ - A]-lyf ¦ d(X,
112 Лекция 8 Осталось воспользоваться неравенством Буняковского чтобы обосновать неравенство Ifyll ¦ IP' - агЫ\ 2 11[а/ - АГЫМ которое при (XI - А)~1у ф 0 эквивалентно неравенству При у = 0 неравенство (8.3) тривиально, а при у ф 0 и при d(A, 1У(Л)) > О очевидно, что х — [XI — А]~1у ф 0, так как XI — А, а следовательно, и [А/-Л] не вырождены. Неравенство (8.3) справедливое при любом у, эквивалентно неравен- неравенству (8.1). О В приложениях часто удается пользоваться неравенствами из теорем 8.2 и 8.3 даже тогда, когда точные границы хаусдорфова множества не- неизвестны (их аккуратный расчет довольно хлопотлив), если имеются га- гарантии, что это множество лежит внутри той или иной известной нам области, которую легко описать. В качестве "охватывающих хаусдорфово множество" областей часто выбираются остроугольные клинья комплекс- комплексной плоскости, ограниченные двумя лучами, выходящими из точек А = ?о на вещественной оси так, что левая половина этой'оси, ограниченная спра- справа точкой <fo» оказывается биссектрисой угла, образованного указанными и v (Аи, и) лучами. Иными словами, все отношения А = —, ~ предполагаются та- (u,u) кими, что Re А = ?о- scos0, -ssinQ ^ Im A ^ ssin0 (О 0, ° < в < */2)- Оператор А, хаусдорфово множество которого лежит внутри такого клина, называется секториадьным. Любой конечномерный оператор, описываемый TVxiV-матрицеЙ, мож- можно считать секториальным. В самом деле, его хаусдорфово множество за- заведомо лежит внутри круга |А| ^ ||Л||, а сам этот круг можно заключить между двумя касающимися его лучами, выходящими из какой-либо точки вещественной оси А = д > ||Л||. Эти лучи образуют с вещественной осью угол в, вычисляемый с помощью уравнения sin в = ||Л||/?- В приложениях секториальные операторы обычно выделяются из опе- операторов, действующих в пространствах очень больших размерностей N. Например, мы увидим далее (см. лекцию 11), что матричные операторы, возникающие при аппроксимации методом конечных элементов или ме- методом конечных разностей эллиптических дифференциальных операторов допускают, как правило, построение сектора, содержащего область значе- значений (хаусдорфово множество). Этот сектор не зависит от точности, до- достигаемой при этой аппроксимации, т.е. не зависит от размерности TV используемых базисных функций или от числа точек в разностной сетке.
Лекция 8 Приведем некоторые простые условия, которые позволяют оценить размеры и положение сектора, содержащего область значений. В даль- дальнейшем мы увидим, что эти условия обычно выполнены для операторов, аппроксимирующих эллиптические дифференциальные операторы. Пусть оператор А допускает представление в виде A = -M*KM + L + Ht (8.4) где Л* — эрмитова положительно определенная матрица (А' = К* ^ kl > 0), L — кососимметрическая матрица L" = —L. Кроме того, пусть ||?и||^||Ми|| + ?|М| С^О.Л^О). ||#|К^. (8.5) Мы покажем, что, зная параметры к, I, Л, можно указать зависящий толь- только от них сектор, содержащий хаусдорфово множество. Этот сектор не зависит от конкретного выбора матриц М, К, нормы которых, так же как и норма всего оператора А, могут быть как угодно велики. Ввиду следующего представления Н и L: и того, что скалярные произведения (^ [Я + H']u,u), (-%[Н - Я*]«,«), (^[? — ?*]«,«), (M*KMu%n) = {KMu,Mu) вещественны, имеем P?uj Ы A 21 Im ^ (t*,u) : [L - ?•]„,« < Обозначив i = ||Afuj|/|Ju||, перепишем эти неравенства так: Im (8-6) Неравенства (8.6) выделяют на комплексной плоскости область, ограни- ченную сверху и снизу дугами парабол Re А = -к\ — I + Л, а справа— вертикальным отрезком: RewA = Л, — h/2 > ImA > Л/2. Описан- Описанная область содержит область, пробегаемую всеми возможными отноше- ниями —. г^-, т.е. хаусдорфово множество оператора А. В свою очередь, эту область можно заключить в сектор между двумя лучами, с общей вер- вершиной в точке вещественной оси, касающихся граничных параболических дуг при Im Ао = ±(lta + h/2). Значение t0 произвольное, но положительное. В точках касания Im Ао = ±(tto + h/2), ReA0 = — JfctJ + Л, а угол в между
114 Лекция 8 каждой из касательных и вещественной осью находится из уравнения: dim Ар /tf Re Ao 1 Ар / to / I 2kt0 Вершина выделенного сектора лежит в вещественной точке А = до = Re Ао + —-. Чем большее значение tQ мы выбираем, тем более пологими ока- оказываются касательные, а это приводит к тому, что до удаляется вправо: к q0 ~ ktl + h + jhi0. Можно выбирать ке *Ol a 9о, лишь бы оно превышало h (яо > Л), а уже по нему находить t0, т.е. точки касания. Итак, постулированные неравенства (8.5) для операторов А вида (8.4) действительно обеспечивают секториальность. Дополнительный материал (в задачах) Задача Д8.1. Вычислить W(A) для А = ~1 . . Задача Д8.2. Рассматривая вещественную треугольную матрицу А = _ - и зависящие от вещественного параметра t векторы [ cosi солеожит эллиптический диск - . . + Я Я' У2 показать, что W(A) содержит эллиптический диск — h — <С 1 на плоскости комплексного переменного г = х + гу. Г—1 2ое'^1 Задача Д8.3. Матрицы А = „ ч , 0 ^ <р ^ 2п, имеют одно и то же хаусдорфово мно?кество W(A). Задача Д8.4. Хаусдорфово множество W(A) любой матрицы А вто- второго порядка содержит эллиптический диск с фокусами Xi{A), X2{A) такой, что сумма расстояний 2а от этих фокусов до любой граничной точки диска равна |Ai — A2j/sin0, где в — угол между собственными векторами матрицы А. Примечание. На самом деле W(A) с этим диском совпадает. Доказа- Доказательство этого факта элементарно, но кропотливо. Задача Д8.5. Если \\(А) и Х2(А) некоторой N х Л^-матрицы А ле- лежат на границе И^Л), то собственные векторы, соответствующие этим собственным значениям, ортогональны (см. обобщение этого утверждения в [Годунов Тордиенко; 1]). ¦
Лекция 9 Эрмитовы окаймления диагональных матриц. Перемежаемость соб- собственных чисел. Обобщения на окаймления любых эрмитовых мат- матриц. Вариационный принцип Куранта — Фишера. Окаймление пря- прямоугольных матриц и перемежаемость. Неравенство между поло- положительными степенями сингулярных чисел матрицы и ее подмат- подматрицы. Неравенства Германа Вейля между собственными и сингу- сингулярными числами. Эрмитовы окаймления диагональных и эрмитовых матриц Рассмотрим эрмитову (m+ I) x (т + 1)-матрицу Am+i вида "ai Ьх Мы предполагаем сейчас, что а^ и 6m+i вещественны, среди а^ нет оди- одинаковых, а среди комплексных 6i,62l... ,6т нет нулевых (bkh > 0, fc = 1,2,... ,m). Кроме того, ai,a2,... ,om упорядочены следующим образом: ai < а2 < а3 < ... < ат. Раскладывая характеристический определитель det(Am+i - A/m+i) по последнему столбцу, получаем = (ai-A)(a2-A)...(am-AMA), где <р(\) — рациональная функция от А: <р{\) = \ 115
116 Лекция 9 Так как по предположению все произведения bjbj строго положительны, а все aj отличны друг от друга, |у>(Л)| обращается в оо т раз в точках А = а,-. Причем, <р(Х) -* —оо при А —> aj - 0 и <р[\) —* +оо при А -> а^ + 0. Когда А пробегает интервал a;_i < А < aj; {2 ^ j' $1 т), значение у?(А) непрерывно меняется от +оо до —оо и хотя бы в одной промежуточной точке А = AJ равно нулю: ^>(AJ) = 0, а^х < AJ < о,. Кроме того, у(А) -+ +со при Л -? —оо и ^>(А) ->¦ -оо при А -» ai - 0. Поэтому существует хотя бы одно значение А = А" < а\ такое, что <р{\\) = 0. Аналогично <р(\) -* +со при А -> am + 0 и (рт(Х) —> —со при А -> +оо и, следовательно, существует хотя бы одно значение A^+i (am < А^+1), при котором у>{А^+1) = 0. Если в некотором интервале —со < А < a-i, aj-t < A < aj, am < А < +оо окажется несколько нулей <р{Х), то в качестве A* (j = 1,2,... ,т+ 1) выберем только один из них. Ясно, что в нулях А = Yj (I ^ j ^ т + 1) функции характеристический определитель также обращается в нуль: - AJ/m+]] = (ai — Aj)(a2 - A*)... (am — A*)^(AJ) = 0. Все выбранные нули X\,Xl,... ,А^,А^+] лежат в различных интервалах А* < ai < А2 < 02 < A3 < аз < ... < Х*т < ат < А^, и поэтому среди них нет совпадающих. Так как полином <Зе{.[Лт+] -A/m+i] степени т+ 1 не может иметь более т+ 1 нулей, выбранные А^ совпадают с совокупностью всех собственных значений матрицы Am+i- При этом очевидно, что в каждом из интервалов —ос < А < ai, aj_i < A < a,, am < А < +оо может находиться только по одному характеристическому корню матрицы, так как иначе число корней превысило бы т+ 1. Итак, мы доказали, что у матрицы А О-2 О ь2 полученной окаймлением диагональной матрицы о JT-m ^ собственные значения перемежаются с ai,a2,... ,am, т.е. с собственными значениями окаймляемой матрицы Xi{A m+i a2 < . < Xm{Am+i) < а
Лекция 9 117 Заметим теперь, что XI \ Vti атхт К О \ /М \О/ + V\h\2 + Ы2 + ¦ ¦ ¦ + \Ьт\ Так как + ¦ • • + + IWil l**+i|. очевидно, что для каждого вектора х + Ы2 + -.. + \Ь Так как каждому собственному значению А матрицы Am+i отвечает хотя бы один ненулевой собственный вектор х ф 0, для которого Ат+\х = Хх, из последнего неравенства следует оценка произвольного собственного значе- значения A max \aj\ Этим замечанием мы скоро воспользуемся. Для нас будет важно, что при доказательстве этого неравенства предположение о том, что все а, различ- различны и что среди bj нет нулевых, не использовалось. Перейдем к обобщению доказанного утверждения о перемежаемости собственных значений \j{Am+i) с собственными значениями а,- окаймляе- окаймляемой диагональной матрицы Ат. А именно, мы откажемся от предположе- предположения о том, что среди glj нет совпадающих и о том, что среди bi1b2,--- ,Ьт нет нулевых. Но от предположения об упорядоченности aj мы отказывать- отказываться не будем, формулируя его в виде неравенств Докажем, что Aj(.Am+i) и в этом случае будут перемежаться с aj, но не обязательно неравенства будут строгими. Наша цель — обосновать для
118 Лекция 9 \j(Am+i) неравенства Аз ^ аз Положим aj(t) — aj + jtet bj = bj + te и заметим, что при 0 < i < 1 и достаточно малом е все bj окажутся ненулевыми, а ау(*) — строго упо- упорядоченными: a3(f) < a2(t) < ... < 2m(i). Поэтому собственные значения Xj(t) матрицы о2 о О ь2 ат Ьт будут перемежаться с aj[t): Xi(t) < ai{t) Из оценки Sm(i) max m+1 что Х\ ,-12 вытекает, что при 0 <i < 1 и достаточно малом е все величины |Aj(i)| ограничены одной и той же постоянной (|А,-(<)| ^ М). Следовательно, най- найдется последовательность №,№,№,... значений t, стремящаяся к ну- нулю, такая, что А,-(*(**) стремятся к некоторым пределам AJ. Очевидно, oi, aj-г ^ AJ ^ aj, B ^ j < т), ат ^ А^+1. Так как функция - A/m+i) непрерывна, переходом при t(*' -»¦ 0 к пределу в равенст- ^(*))-Ал-(*(*))/т+1) = 0 установим, 4Todet0m+l(O)-A>/m+i) = det(Am+i — \jlm+i) = 0. Иными словами, все построенные А^ действитель- действительно являются характеристическими корнями матрицы Ат+\. К сожалению, мы не можем теперь утверждать, что среди AJ нет совпадающих. В случае наличия таких совпадений существует опасность, что у Am+i могут найтись и какие-либо другие собственные значения, от- отличные от тех, которые мы получили в результате предельного перехода. Однако эти опасения несостоятельны благодаря теореме о том, что вся со- совокупность корней полинома непрерывно зависит от коэффициентов этого полинома. Читателю рекомендуется самостоятельно провести аккуратное доказательство. Теорема о непрерывной зависимости совокупности корней полинома от его коэффициентов является следствием доказываемой в курсе теории функций комплексного переменного теоремы Руше (см. [Марку- шевич; 1]).
Лекция 9 119 Доказанное утверждение о перемежаемости допускает обратное утверж- утверждение, доказательство которого мы опускаем: Если oi ^ о2 ^ ... ^ ат, a вещественные числа Ai, А2,.. ¦ , Am+i удовлетворяют условию перемежаемос- перемежаемости am m+i. то существует окаймление Лт+1 диагональной матрицы Ат с диагональными элементами а^, у которого корни характеристического уравнения det[Am+i — A/m+i] совпадают с Xj. Итак,справедлива Теорема 9.1 (о перемежаемости). Если aj ^ а2 ^ ... ^ am_i ^ am — неубывающая последовательность вещественных чисел, то собственные значе- значения Xj = ^j(Am+i) эрмитовой матрицы 0-2 О ^2 перемежаются с ctj: \ J- ^S \ J* ^ ^ \ S* Г. S* Л1 5; а1 ^ л2 ^ а2 ^ .. • 5; Лт ^ ат 5; Для любой такой перемежающейся последовательности можно подобрать ве- вещественное bm+l и комплексные &i, 62,... , bm такие, что Xj будут собствен- собственными значениями матрицы Am+i указанного вида. У этой теоремы есть несложно доказываемое, но очень удобное для применений обобщение. Теорема 9.2 (о перемежаемости). Для любой эрмитовой m x т-матрицы Ат с собственными значениями ai, a2, аз,... , am, занумерованными так, что o-i ^ 02 ^ «з $ - - ¦ ^ о-т, и любого эрмитова окаймления О-тптп+1 Om+lm+l. собственные значения Xj = Xj(Am+\) перемежаются с a\ta%,... ,am (Ai ^ a\ ^ А2 ^ 0.2 ^ ... ^ Am ^ am ^ Xm+i). Верно и обратное: для любой после- последовательности из Xj, перемежающейся с собственными значениями матрицы Ат, всегда можно подобрать окаймление Am+i, у которого спектр совпадает с Хл, Ао,... , Доказательство. Достаточно заметить, что матрица Ат некоторым унитарным преобразованием Um {U^Um = Im) приводится к диагонально-
120 Лекция 9 му виду U Обозначив и„ 0 0- легко проверить, что а, 0 02 h 0 ьт Ь\ b"i Ьт bm+i \bj = u /Olm+1 О2Ш+1 \0mm+li = U* aJ После этого замечания очевидно, что теорема 9.2 является непосредствен- непосредственным следствием теоремы 9.1. ? Вариационный принцип Куранта — Фишера Пусть А = А* — эрмитова N х JV-матрица, а векторы х выбираются не из всего пространства Ядг, где действует оператор, задаваемый матрицей Л, а только из подпространства, определяемого К линейными связями, которые заданы равенством Скх = 0, где Ск — N х /{"-матрица. Это подпространство имеет размерность N - k (к ^ К), не меньшую, чем N - К. Размерность равна N — К лишь тогда, когда все строки матрицы СК линейно независимы. Всегда можно подобрать унитарное преобразование U, преобразующее векторы х рассматриваемого N — ^-мерного подпространства в векторы у = (Jx, у которых лишь первые N — к компонент могут быть отличны от нуля:
Лекция 9 121 У = (yi,U2, • • ¦ ,улг-*,О,О,.. .)т¦ Мы будем обозначать через y(N~k) вектор, составленный из таких компонент: y(N~k1 = (ylt y2,..., y/v-fc)T- Отношение _ (Ах.х) Рэлея —. ~ для векторов х, подчиненное связи Скх = 0, можно записать (х,х) (BN-ky{N~k)) в виде отношения /... .. ... .:. . где BN~k — верхний главный (N-k) x (N - ?)-минор матрицы U*AU. По вариационному принципу Вебера — Рэлея (см. лекцию 1) \N-k{BN.k)= sup i?^*»J^-> U sup [(AxlX)/(x,x)}. Собственные числа А предполагаются упорядоченными так, что AJ+i На основании теоремы 9.2 о перемежаемости A ^ j ^ к) Хм-к[Вм-к) ^ A/v_fc(C Итак, '¦JY—Jfe V / ^ Oil^/ , » — ИДОЛ - - . I *7. X J СКх=О \Х,Х) Ск=О \Х,Х) (Читателю рекомендуется проверить, что верхняя грань действительно до- достигается). Конечно, выбирая различные матрицы Ск, задающие связи на век- векторы х, мы будем получать различные верхние грани отношения Рэлея. Оказывается, что существуют матрица Ск (все строки которой линейно , (Ах,х) , ... независимы) и вектор х такие, что — ~- = Хх~к{А), т.е. равенство в (9.1) достигается. Это легко проверить, записав А в каноническом виде Q. Г-1 AiJ где Q — унитарная матрица (Q*Q = In), и выбрав в качестве Ск матрицу, составленную из К верхних строк матрицы Q. Итак, Алг_ЛЛ) = тт max —.—'-~\. (9.2) Воспользовавшись тем, что Хк{А) ~ Xm-k+i{—A) и тем, что {~Ах, -A) = - mm max = max I mm -о (*,*)]'
122 Лекция 9 мы установим равенство \к(А)= max [ min ^ifll (9.3) Доказанные равенства (9.2), (9.3) составляют содержание вариацион- вариационного принципа Куранта — Фишера. Этот принцип является обобщением вариационного принципа Рэлея, изученного в первой лекции. Следствие принципа Куранта — Фишера. Если А и В — эрмитовы мат- матрицы (А = А*, В = В*) одинакового размера N х N и А ^ В (т.е. (Ах, х) > (Вх,х) при всех х), то Xj(A) ^ Xj(B), 1-^.j^.N. Окаймления прямоугольных матриц Теперь мы переходим к теоремам о перемежаемости сингулярных чи- чисел матриц, которые совсем не обязательно должны быть квадратными, и сингулярных чисел их окаймлений. Пусть аи 021 0-22 &2N Ami aM2 ¦ • ¦ Воспользовавшись правилом (см. задачу 2.7) определения сингулярных чисел А через собственные значения эрмитовой матрицы - доказать следующую теорему. легко Теорема 9.3. Сингулярные числа матрицы А перемежаются с сингуляр- сингулярными числами каждой из матриц &21 с = аи 021 022 0-М2 С2 О2ЛГ &MN полученных из А односторонним окаймлением, т.е. добавлением к А дополни- дополнительного столбца или дополнительной строки. Задача 91. Вспомнив указанное правило, аккуратно провести дока- доказательство теоремы 9.3. Из перемежаемости с очевидностью вытекает следующая теорема. Теорема 9.4. Если прямоугольная (или квадратная) матрица В получена из матрицы А большего размера удалением некоторого числа строк и столбцов, то справедливы неравенства (р > 0) 3=1
Лекция 9 123 (No(A), Nq(B) — это минимум числа строк и столбцов матрицы А или В соответственно). Кроме того, для к = 1,2,..., тт{ЛГ0(Д), ЛГ0(В)} ЛГО(Д) N0(B) П ffiH) 2» П "№¦ Лемма 9.1. Если С и D — прямоугольные матрицы размеров К х N и N х К соответственно (к ^ N), то определитель det [CD] их произведения не превышает по модулю произведения сингулярных чисел сомножителей к к ^)- (9.4) Доказательство. Воспользуемся сингулярными разложениями с = ъ№с) o]Q[, я = д N -К нулевых столбцов где Vi, V2 — унитарные К х if-матрицы, a Qit Q2 — также унитарные матрицы, но размеров N х N. Квадратные К х /С-клетки ?(с> и ?(в^ диагональны, и на их диагона- диагоналях расположены сингулярные числа матриц С и D соответственно. Оче- Очевидно, что CD = ViYt^QK^Vz, \detCD\ = |detQfc|detE(c>detEW, где Qk — верхний главный минор порядка К унитарной матрицы Q = Q\Qz- Так как все сингулярные числа матрицы Q равны единице, а матрица Qk получена из нее удалением некоторых строк и столбцов, сингулярные чис- числа cj(Qk) не превышают единицы. Поэтому |det<3#| = П^=1°3(Ф*) ^ *¦ Теперь неравенство (9.4) очевидно. Q Пусть А и В — квадратные N х W-матрицы, С — К х ЛГ-матрица, составленная из каких-либо различных строк матрицы А, а матрица D ана- аналогичным образом составлена из того же числа различных столбцов мат- матрицы В. При этом по теореме 9.3 <tn-.j+i(A) ^ сг#_,-+1(С), <rN-.j+i(B) ^ <?K-j+i(?>), I ^ j ^ К. На основании леммы 9.1 при 1 ^ к ^ К имеем = | det CD\ ^ (f[ ^-j+i(A)) Щ Эта оценка будет использована при доказательстве следующей теоремы Теорема 9.5. Сингулярные числа произведения АВ квадратных N х N- матриц А и В удовлетворяют неравенствам (N ^ А: ^ 1)
124 Лекция 9 П *j j=N-k+l N N П *' j=N~k+l Доказательство. Выберем какие-либо унитарные N х //-матрицы U, V, W и диагональные матрицы гг., .(А\ О о О о-у(Л) ^ 0, aj+1{B) ^ <tj{B) ^ 0. Положим А = VL^V, В = . Очевидно, что сингулярными числами матриц А и В являются со- соответственно^ (Л) и a-j(B). Если собрать кх//-матрицу Сиз mi,m2,.. .,mfc строк матрицы Л, a JV х //-матрицу 5 — из тц,п2,.. .,пк столбцов В, то их произведение CD можно получить из матрицы произведения АВ = U^AWVi^W, оставив в матрице лишь строки с номерами тьт2, ¦ ¦., т* и столбцы с номерами ni, пг, ¦.., гн. Положим m, = n, = i и обозначим CD через [ЛЯ]* = [6Т(л>1И?Б>1У]ь Иными словами, [[/Е^КЕ^'И']* — верхний главный минор матричного произведения, заключенного в квадратную скобку. Доказанное нами нера- неравенство запишется в этих обозначениях так: j=N-k-l П Пусть А и В — произвольные N х /V-матрицы с сингулярными числами <г,{А)г ajiB), A = ViZ^Ql, В = V2^[B)Q'2 {Vjt Qj — унитарные мат- матрицы), а сингулярное разложение их произведения выглядит так: АВ = Vz?iAB)Ql. Диагональные элементы <tj(AB) диагональной матрицы опять предполагаются упорядоченными (o-j ^ o-j-i ^ 0). <tn{AB) О <tn-i(AB) ох{АВ)\
Лекция 9 125 В этой записи использованы обозначения U Очевидно, что V = Q\V2, W = j=N-k+l и по доказанному выше N N iV П п Неравенства Германа Вейля Остановимся теперь на применении теорем о перемежаемости собст- собственных и сингулярных значений квадратных верхних треугольных мат- матриц. Пусть An — матрица вида ап 022 0-2N и пусть ее сингулярными числами являются <ri,o-2l... ,0-yv, занумерован- занумерованные так, что 0 ^ Gi ^ <т2 ^ ... ^ ffjv- Если ее дополнить снизу нулевой строкой (она при этом станет (TV + 1) х TV-матрицей), ее сингулярные чис- числа не изменятся. После этого, сделав еще одно дополнение — на этот раз при помощи окаймления справа новым столбцом, мы придем к треугольной (N + 1) х (N + 1)-матрице ап а22 0 с сингулярными числами ?i,52, - О ^ ?! ^ <7j ^ а2 ^ 0-2 ^ . - . ^ В силу теоремы 9.3 ее Иными словами, каков бы ни был последний столбец матрицы сингулярные числа перемежаются с сингулярными числами матрицы An- Ясно, что элементы о^, стоящие на главной диагонали у А^, являются собственными значениями этой матрицы. Пусть Xn(An) = an,Ajv-i(Ajv) = <*22,- ¦ ,М{Ац) и пусть эти собственные значения упорядочены так, что
126 Лекция 9 Фиксировав матрицу An , мы сконструируем из нее усеченные j xj-матрицы ^N °2 ._ A/v X О Ал/-1 ~ 0 Алг_ Xff x x 0 Алг-i x 0 0 Atf_; ,... ,An = x x AiJ Каждая из этих треугольных матриц является верхним главным минором исходной матрицы А&. Очевидно, что \XN\ = tri{Ai) ^ <т2(А2), |A Для матрицы третьего порядка 0 A#_i x 0 0 AN_: имеем = |detv43| = О ^ Поэтому о-2(Л = |det A2\. Ясно, что намеченную схему последовательных окаймлений и получения неравенств между произведениями jAjvj )A^_i| ¦ ¦ -|A/y_;-| и произведениями сингулярных чисел можно продолжить. Сформулируем окончательный ре- результат. Теорема 9.6. Для любой N х N-матрицы Ан справедливы неравенства Германа Вейля \XN\ \Хм~ |An| |A2| |A3|
Лекция 9 127 Как отмечено в формулировке теоремы, в этих неравенствах нет необ- необходимости предполагать А& верхней треугольной матрицей. На основании теоремы Шура любая ./V х iV-матрица представима в виде Cn = UnA^U^ с унитарной матрицей Un (U^Un = /jv) и верхней треугольной матрицей ГА, у которой на главной диагонали расположены собственные значения. Нам удобно считать, что они расположены в порядке невозрастания их абсо- абсолютных величин |Ajv| ^ |Ayv_i| ^ ... ^ |Ai|, как мы и условились при обосновании неравенств Вейлн для треугольных матриц. Легко убедиться, что сингулярные числа матриц CV и А^ совпадают, а также совпадают их собственные значения. Поэтому в окончательной формулировке можно отказаться от предположения, что А^ — верхняя треугольная матрица. D Неравенства Вейля были доказаны в 1949 г., а позднее — в 1954 г. — Р. Хорн показал, что они неулучшаемы. Он описал правило, следуя кото- которому по любым числам сг\,^2, ¦¦ ¦ >ffN и Аь А2. ¦ ¦ , А/у, удовлетворяющим неравенствам Вейля, удается построить iV x jV-матрицу, имеющую эти числа в качестве сингулярных и собственных значений соответственно. Подробное изложение теоремы Хорна можно найти в [Horn-Johnson; 1] и [Годунов; б].
Лекция 10 Мажорирующие последовательности и теорема о неравенствах для выпуклых функций. Вывод неравенств между последовательнос- последовательностями собственных значений и сингулярных чисел. Доказательство теоремы о выпуклых функциях, применение этой теоремы. Как изменяются сингулярные числа при добавлении к матрице слагае- слагаемого известного ранга. Вариационный принцип Алахвердиева и его следствия. Неравенства для сингулярных чисел и собственных значений лежат в осно- основе большого числа важных и полезных оценок. При выводе многих таких оценок используется теорема Фана о выпуклых функциях [Fan; 1]. Преж- Прежде чем формулировать эту теорему, дадим определение мажорирующих последовательностей. • Если для двух неубывающих последовательностей из N вещественных чисел аьаг,... ,ал/ (a, ^ aj+\) bi,b2i..., fe/v {bj ^ bj+i) справедливы нера- неравенства aw + a/v_i 4- o-N-г ^ &jv + 6n-i + bj^-2, a/v + адг_ i -Ь ... + a2 ^ 6/v + бдг-1 + ... + 62, a^ + o.n~\ -f . .. + a2 + ai ^ bN + 6W-i + . .. H- 62 + 61 - то говорят, что вторая последовательность мажорирует первую, и пишут Пусть Ф определена и непрерывна на вещественной оси при х > х0 (х0 может быть конечным или xQ = —00). Предположим, что Ф"(х) ^ О и, кроме того, пусть Ф(аг), Ф'(х), хФ'(х) стремятся к нулю при х -> х0 (если хо конечно, это означает, что Ф(х) по непрерывности может быть доопределена для х = xq значением Ф(жо).) 129
130 Лекций 10 Теорема 10.1. Пусть функция Ф(х) удовлетворяет сформулированными выше условиям. Если {а?}^ « {bj}^1, то при всех к (} ^ к ^ N) Мы воспользуемся этой теоремой, выбрав в качестве Ф(х) одну из следующих функций: Ф(х) - ерх (р > 0, х0 - -оо), Ф(х)=1пA +гх) (г>0, хо = 0), Ф(х) =хр (р> 1,хо = 0). Задача 10.1. Проверьте, что эти функции обладают требуемыми свой- свойствами. Теорема ЮЛ будет доказана ниже, а сейчас мы продемонстрируем, как ее использовать. Напомним, что на прошлой лекции для N х УУ-матриц Л и В были доказаны неравенства A ^ n ^ N) N N Y[ I^jM)! ^ JJ Vj[A) (неравенства Вейля), (ЮЛ) N N N П °ла) П *лв)% П ^АВ)- A0-2) j-N-n+l j=N-n+l j=N-n+l Заметим, что из A0.2) вытекает неравенство N N П <^И'К П **№) (^0««ое). A0.3) j=N-n+l j-N-n+l Полагая aj = In \j{A), bj = \n<Tj(A) или а;- = In aj(AB), bj = \n[(Tj(A)cj(B)]t из (ЮЛ), A0.2) получаем, что {а,}^ << {6j}f. На основании теоремы 10.1 с первыми двумя вариантами функции Ф(х) приходим к неравенствам Е \ыа)\"$ Е N N V^ 1«Г1Л.Г|Л>(Л)|] N Л" П [i + ^MMU П [i + ^H)]- (Ю-5)
Лекция 10 W N j=N-n+l N A0.6) j=N-n+l Для доказательства теоремы ЮЛ предварительно установил спомо- гательное утверждение. Лемма ЮЛ. Из отношения {uj}^ « {bj}^ следует, что кусочно-линейные функции A ^ k ^ N) N j=k N удовлетворяют неравенствам Ак {() Через (с — ?)+ мы обозначаем Доказательство леммы ЮЛ. Так как Л*г(О = (олг — л" - 0+ и ft/v ^ алг, имеем Требуемое неравенство при к = N доказано. Далее рассуждаем индукции. Допустив, что при некотором к неравенство Ak+i{?) — Bk+i{?) ^ 0 уже до- доказано, установим неравенство Ак{?)-Вк{?) ^ 0. Рассматриваются четыре возможных случая взаимного расположения чисел а*., Ьк, ?'¦ Случай I. ^ > max{afc,6fc}. Случай II. ak?t^bk. Случай III. ак >?>6*. Случай IV. ^ < min{ak,bk}- При изучении случаев I, II удобно рассмотреть разность Из предположения индукции и неравенства утверждение. В случае III, очевидно, aN ^ ад/_! ^ ... ^ afc aj - f для всех j = ft, fe + 1,... , Nt т.е. ^ 0 следует требуемое , и поэтому (ал- -^)+ = N
132 Лекция 10 Такое же утверждение справедливо и в случае IV. Поэтому в обоих случаях - в*(О = ?> - 0 - ?> - 0+ l [ Выражение во вторых квадратных скобках в правой части состоит, оче- очевидно, из неположительных слагаемых F, - ?) — (bj — ?)+ ^ 0. Поэтому N N - я* (о ^ Efe - о - E(fci - о = (djt + afc+i + ... + aff) - (bk + bk+1 + ... + bN) ^ 0. В случаях III, IV нам не пришлось использовать предположение индукции в*+1КК0. о Доказательство теоремы 10.1 основано на простом интегральном тож- тождестве, которое следует из цепочки очевидных равенств (х > у > хо): х J Ф'( У )] - [хФ'(аг) - уФ'(У)] + Ф(«) ~ Ф(У) (»-*)Ф'(уI- Переходя в равенстве т Ф(х) = j(x - ОФ"«) ^ + [ФЫ " (У " *)*'(»)] к пределу при у -ь х0) что возможно при наших условиях на Ф(у), в силу которых lim [Ф(у) — (у - х)Ф'(у)] = 0, мы получаем требуемое тождество X 00
Лекция 10 Ш Введем обозначение, как в лемме 10.1, N N и выпишем интегральные представления сумм, входящих в формулировку теоремы: N j=k j=k ;„ J=* Из положительности второй производной Ф"(?) и доказанного в лемме 10.1 неравенства А*(?) - ?*(?) ^ 0 вытекает справедливость теоремы. D Таким образом, мы завершили доказательство неравенств (Ю.З)-(Ю.б) и сформулируем их в виде теоремы. Теорема 10.2. Для N х N-матриц А, В справедливы неравенства A ^ n ^ N,p>0) Д Перед выводом последующих неравенств приведем несколько пред- предварительных утверждений. Во-первых, заметим, что для любых N х N- матриц А и В
134 Лекция 10 N N N Если Vl^ j+i j+i i=i j=i - Vk, Q*k = Qk, Ql — Qk — ортогональные проекторы, то N N 1 Если при этом trVk = tr Qk = N - к + 1 (размерность пространств, на которые совершается проектирование), то N N N N N E Если подобрать унитарные матрицы V, Q (W = Q*Q = In) так, что V{A + B)Qm = и положить TO N tr[Pk(A + B)Q'k] = j=N-k+1 В результате получаем (к = 1,2,...,N) \~^ (Ал У ; a3\A ^ j=N-k+l N - D) S. ? i=N-k+\ N E -^ A0.7)
Лекция 10 135 Иными словами, {aj}f « {6j}f> где aj = <rj(A + B), bj = <tj(A) + <tj{B). По теореме 10.1 для Ф(х) — хр (р > 1) при всех 1 ^ п ^ N j=N-n+l j=N-n+l Теперь остается воспользоваться известным неравенством Минковского 1/р г ( -ll/p г t -,1/p чтобы завершить доказательство следующей теоремы. Теорема 10.3. Если р ^ 1, то для любых М х N-матриц А и В при про- произвольных 1 ^ n ^ N справедливо неравенство N л 1/р г N л i/p г ^ 1 1/р 1П -I 1/р Г <Y Л 1/Р Г JV -I Замечание 10.1. Теорему 10.1 можно использовать лишь при р > 1. При р = 1 ссылаться на нее излишне, так как в этом случае утверждение теоремы 10.3 содержится в уже доказанном неравенстве A0.7). Еще ряд полезных неравенств для сингулярных чисел матриц, раз- разность между которыми имеет не слишком большой ранг, содержится в формулировке следующей теоремы. Теорема 10.4. Если две матрицы А и К^ имеют одинаковый размер и вторая матрица имеет ранг не больше, чем г, то для их сингулярных чисел справедливо неравенство a-j(A + К^) ^ <7j-T{A) {j ^ г + 1)- Сначала докажем простую лемму. Лемма 10.2. Если матрицы А^ и А^ отличаются только какими-либо элементами из последней строки, то trj(A^) ^ o-j-i(a№). Доказательство . Введем в рассмотрение прямоугольную матрицу А^, у которой на одну строку меньше, чем у матриц Л<°), А^1\ и которая из любой матрицы Л*0) или А^ получается вычеркиванием последней стро- строки. На основании теоремы о перемежаемости сингулярных чисел матрицы и ее одностороннего окаймления можно утверждать, что
136 Лекция 10 откуда П Лемму 10.2 можно интерпретировать следующим образом. Если мы добавляем к А^ любую матрицу того же размера, но с ненулевыми эле- элементами только в последней строке, то у полученной суммы А^ каждое сингулярное число <rj(AW) оценивается снизу через a-j-i(A^) (j ^ 2). Пусть KW — какая-либо матрица ранга, не превышающего г. Сингу- Сингулярное разложение матрицы К^ имеет вид = U ¦-1 0 0 О : О с унитарными матрицами Ut V и с неотрицательными кг 0,..., fcj ^0. Очевидно, что 0, fcr_i ^ = U fcr : 0 О : О V + U 0 0:0 0 *,._! : : О + ... т.е. К^ представима в виде суммы матриц К\, К2,...,КГ, каждая из которых имеет ранг, не превышающий единицу. Доказательство теоремы 10.4. Достаточно убедиться в том, что <т,- К) ^ <rj-i(A) при любой матрице К ранга 1. Элементы Jfey матрицы Гк 0 0 0 .0 0 oj можно записать в виде fctJ- = kxiiVj, где и» — компоненты первого столб- столбца и матрицы U, ъ vj — компоненты первого столбца матрицы V. Под- Подберем преобразование Р унитарного отражения (РР* = 1М) такое, что
Лекция 10 Pu = [О, О,... , о, е*"]т, т.е. , переводящее вектор с компонентами щ в век- вектор, у которого все компоненты, кроме последней, нулевые. Матрица РК имеем ненулевые элементы только в последней строке. Имеем ffj(A + К) = <rj(PA + PK) ^ <tj-x[PA) = a-j-iiA). О Неравенство в теореме 10.4 можно записать в виде Ч-Г{А) ^ inf <tj{A + K^)t A0.8) где нижняя грань берется по всем матрицам К^ ранга, не выше г. На самом деле, существует матрица JfJ , Для которой <rj(A + K$*) = ег,_г(Л). Иными словами, нижняя грань достигается и A0.8) можно уточнить: *1-г(А)= inf G,-(Л + ЛГ<г>) (>^г+1>2). A0.9) Равенство A0.9), доказанное Алахвердиевым в 1957 г., является вари- вариационным принципом, с помощью которого могут определяться или оцени- оцениваться сингулярные числа. В частности, из него следует, что <tj[A) харак- характеризует точность, с которой матрица А может быть приближена матрицей Ко** ранга N — j. Действительно, *3{А)= min <rN[A где K^N~3' обозначает матрицу КУ*~*\ на которой достигается минимум. Здесь мы воспользовались общепринятым определением нормы для линей- линейных операторов (матриц): \\A\\ = sup ib-^, \\A - Щ 3)\\ = sup -^ ?r- i-H, x?so |И| ,^о 11*11 а также тем фактом, что в евклидовом пространстве (Ах, Ах) / (АМг.г) Wsup v ; = (Ах, Ах) / (АМг.г) пг sjtO у [Х,Х) у„;о {Х,Х) Завершить обоснование вариационного принципа Алахвердиева пред- предлагается читателю, предварительно решив следующую легкую задачу. Задача 10.2. Доказать, что существует матрица К$> ранга не больше ? г такая, что <tj(A - Kq ) = o-j~r(A). Указание, При построении Kq воспользоваться сингулярным разло- разложением матрицы А. Из вариационного принципа A0.9) легко получаем важное Следствие 10.1. \crs{A + В) - <tj{A)\ ^ <rN{B) ~ \\B\\.
138 Лекция 10 Доказательство. Действительно, на основании теоремы 10.3 (tn{A + В + *<*-¦») ^ <rN(A trj{A +B)^ aN(B) + min trN{A Заменив в этом неравенстве А + В на А, В — на -В, получаем, что <jj{A) ^ o-n(-B) + <tj{A + В) = <?N(B) 4- <Tj(A + В). Мы показали, что -<rN{B) ^ trj{A + B)-trj(A) ^<rN{B). D Сформулируем еще одно следствие принципа Алахвердиева. Теорема 10.5. Для сингулярных чисел квадратных N х N-матриц А, В и их произведений АВ, ВА справедливы неравенства crjiBA) <$ ||В||^(Л), <tj{AB) ^ ||В||<гл-(Л). A0.10) При этом, если В не вырождена, то '"¦(Л)' AСШ) Доказательство. Действительно, матрица А может быть аппроксими- аппроксимирована матрицей K(N~i) ранга N - j с погрешностью, не превышающей ffj{A): \\А — К^~*Ц\ ^ cj{A). Какова бы ни была матрица В, ранг произве- произведения K^N~^B также не превышает /V - j. Поэтому из оценок \\ВА - BKW\\ $ \\B\\<rs{A), \\AB - KV получаем A0.10). При невырожденной матрицы В можно в них заменить матрицу А матрицей В~1А или АВ~1 и завершить доказательство, заме- заметив, что оценки а^(А)=а3(АВ ¦ В) ^ \\В-1\\(Т^(АВ), aj{A) = crj(B-1 BA}^ \\B~l\\trj(BA) эквивалентны A0.11). D Следствие 10.2. Если \\Lu\\ ^ а^/||Ли(|||«||, а^ЦЛЦ < 1, го отношение одноименных сингулярных чисел <tj матриц А, А 4- L ограничено сверху и снизу постоянными, не зависящими от j: Доказательство. Действительно, WLA-'uW A - ал/р=Й|)||и|| ^ ||(/ + ^Л-^иН ^ A 4- а- Следовательно, Утверждение следствия очевидно в силу теоремы 10.5 из оценок и пред- представления А + L = (I + LA~l)A. ?
Лекция 11 Описание аппроксимируемых дифференциальных операторов. Ме- Метод слабой аппроксимации для построения их конечномерных мо- моделей. Оценки операторов, векториальность конструируемых моде- моделей. Сравнение сингулярных чисел модельного несамосопряженно- несамосопряженного оператора с сингулярными числами и собственными значениями самосопряженного оператора. Простейший выбор базисных функ- функций и оценка сингулярных чисел в двумерной модели. Обобщение. Спектральные обусловленности в задачах различных размерностей. Мы приступаем к выводу очень важных для дальнейшего оценок сингу- сингулярных чисел для одного специального класса Матричных операторов. Речь будет идти о конечномерных аппроксимациях эллиптических дифференци- дифференциальных операторов, широко используемых в математической физике. Та- Такие аппроксимации обычно получаются с помощью процедуры, которая называется методом конечных элементов. Этот метод основан на понятии слабой аппроксимации. Предположения. Предварительные построения Мы ограничимся подробным разбором одного, сравнительно простого, но в тоже время типичного примера. Рассмотрим дифференциальный опе- оператор второго порядка D, применяемый к достаточно гладким скалярным функциям и(х,у), равным нулю на границе области определения п. Рас- Рассмотрим область простейшего вида — квадрат. В математической физике широко используются не только равные нулю на границе функции, но и функции, удовлетворяющие тем или иным граничным условиям. Но мы не останавливаемся на этих возможных обобщениях. Будем считать, что действие оператора D на и(х,у) описывается фор- формулой д + с{х,у)щ A1.1) где К{х,у) — строго положительный коэффициент. Можно считать, что K(x,y)t a(x,y), Ь(х,у), с(х,у) — достаточно гладкие функции, хотя требо- требования гладкости могут быть существенно ослаблены. Все коэффициенты предполагаются вещественными. 139
140 Лекция 11 Аналогично можно рассмотреть "одномерные" или "трехмерные" опе- операторы D, действующие на функции одной или трех независимых пере- переменных, которые определены в соответствующих областях и обращаются в нуль на границе: (в одномерном случае) д , . ди ,. .ди . .ди , . + Ф, y>z)-fa: + b(x> y'z>'o~ + с(ж' у> z>'fc + е(х'У> г>и (трехмерный случай) Мы не будем подробно разбирать эти примеры, од- однако, каждый раз, когда выводы зависят от размерности области опреде- определения оператора Dt мы будем отмечать эти различия и пояснять причину, их вызывающую. Предположим, что допустимые функции и{х,у) и v(x,y) принадлежат некоторому гильбертову пространству, т.е. определено скалярное произве- произведение (и, и), удовлетворяющее соответствующим аксиомам. В нашем при- примере скалярное произведение имеет вид (u,v) = w // u(xly)v(x,y)dxdy (и > 0) (И.2) п Аналогично в одномерном и трехмерном случаях можно считать, что (u,v)=w / u(x)v(x)dx, {utv)=w jlj u{x,y,z)v{x)yiz)dxdydz. n n После этих предварительных замечаний можно перейти к построениям, в результате которых оператор D будет аппроксимироваться конечномерной моделью D^. Выберем N линейно независимых допустимых функций и рассмотрим действие D только на функции вида и(х,у) = J2 &и(*\ обра- зуюшие ^/-мерное пространство. Не ограничивая общности считаем, что базисные функции и^(х,у) образуют ортонормированную систему
Лекция 11 N TV Очевидно, что если и = 5Z &и^ И"=Е Vju^\ T0 .=1 3-1 (Du,v) = ? ри^^ J Описанная процедура позволяет сопоставить оператору D некоторую N х JV-матрицу с элементами о\5 К Эта матрица определяет линейный опе- оператор DlN\ преобразующий в себя некоторое TV-мерное координатное про- странствопо формуле Л^^ = ?, где? = [?Ь6, ¦ ¦ ,ЫТ. ?= [6.6, ¦ ¦ ¦ ,?лг]т, fi = 51 D\j 4i- Матричный оператор ^"), построенный по этому правилу, j j принято называть слабой аппроксимацией оператора D. Нас не будет сей- сейчас интересовать, действительно ли решения уравнений с оператором D^ тем или иным образом приближают решение задачи с исходным операто- оператором D. Нам нужна лишь информация о числовых значениях сингулярных чисел матриц D^NK Воспользовавшись тождествами о Я„/ди dv du dv п an да дЬ ft \ dv Ldv I (da db\JJ J f содержащими в правой части интегралы вдоль границы дп области fi, и равенством u|afi = 0, можно представить оператор D в виде суммы трех операторов D = DK + L + Hi A1.3) где = а— + 6— + -( — + д- Ь, A1.4 дх ду 2\дх ду/
142 Лекция 11 1 /да db\ Ни = Си - - U- + з- )ti 2\дх ду/ так, что при этом — D'K, L = -Z", Я' = \uy\4xdy + ШГП2 l\u\2dxdy, n |(#u, ы)| ^ w(m2 + m3) // |u| «,u) и {Ни,и) вещественны). В этих оценках к, mi, ттг2, т3 обознача- обозначают константы, которые оцениваются сверху через максимальные значения коэффициентов К, \а\, |6|, |с| и их производных |а*|, \ЬУ\. Воспользовавшись неравенством Буняковского Ц Wd*dy ¦ Jj{\ux\2 + \u получим Re (Du,u) (u,u) —A: Im (Du,u) Im A1.5) Положив t = \ \u\2dxdy h = 2тах{т2,тз}, мы видим, что полученные оценки (и, и) im {Du,u)
Лекция 11 Н5 только обозначением операторов отличаются от неравенств (8.6) из лек- лекции 8, где было показано, что следствием таких оценок является сектори- альность оператора D. Кроме того, приведенные неравенства позволяют получить оценку для оператора L = L + Я определенного формулой ?« = а? + б? + ™. A1.6) ох ду Правая часть этой формулы состоит из слагаемых, входящих в запись опе- оператора D и не содержащих вторых производных и(х,у). Очевидно, что л +2w(max|c|2) j j \u\2dxdy. n Иными словами, ) f f К(u2x + u2y) dxdy \\Lu\\ ^ ^\{DKu>u}\ + 'r"\\u\\^ (П.7) где K + K A18) a Уi У — постоянные, которые зависят лишь от коэффициентов а{х,у), 6(х,у), c(x,y)t K(x,y) и их производных. Аналогично представлению D = Dk + L, можно записать D^ в виде суммы D(N> = D^ + X(N). При этом D%' и L^ — операторы, аппроксимирующие D и L. Эта аппрок- аппроксимация осуществляется по тому же правилу, по которому оператор определялся через D. Матричные элементы [D^ '].., L,-;-J находятся по формулам to-oh [^ ^ ] A1-9) n Очевидно, что D^ ' — эрмитова матрица, и поэтому (.D^ u,u) при любой u(i,y) из нашего конечномерного пространства вещественны и неположи- неположительны {{Dk 'u,u) ^ 0). На самом деле существует положительное число хо(щ > 0), при котором (DJf u,u) ^ — хо(и,и). Далее мы поясним и дока- докажем это утверждение, а пока принимаем в качестве постулата. При любом вещественном неотрицательном d ^ 0 эрмитова матрица dl — П"к ' не вырождена и, следовательно, обратима. Для нормы обратной
144 Лекция 11 матрицы имеем (((rfZ-^i*0)!!^ j-^T' A1.10) Кроме того, из неравенства xo(u,u) ^ (--OJf u,u) ^ {[dIN- DyK 'Jb,!i) следует, что собственные значения (все они положительны) эрмитовой матрицы -D^idlN - D^\ не превышают величины -——. Следо- вательно :|Н|2- Вспомним теперь (см. A1.7)), что ||?u|| ^ yJyt\{DKu, u)J + 7"||«Н2- Для справедлива такая же оценка. Положив v = [d/jv — D% ']ut находим Теперь выберем и фиксируем d > 0, при котором -Df>]-i||^i/3. (ii.il) Оценки (TjiDW) через ^(D^) После этих подготовительных построен-ий приступим к выводу нера- неравенства, связывающего сингулярные числа (Tj(D^) (вообще говоря) неса- несамосопряженного оператора ?)М с сингулярными числами эрмитова опера- оператора D{P {<т^П{р) = <Ti{~D{p), j = 1,2,... ,ЛГ). Так как -D{p положи- положительно определенная, сингулярные числа совпадают с соответствующими собственными значениями Aj(—Z?^ ). Используем соотношения = ffj([drN - D{P *i(dIN - EfM - и следствие из A1.11)
Лекция 11 145 благодаря которому Мы здесь опираемся на неравенства A1.10). Далее мы заключаем, что l*S{dIN - &Р) - d $ Vjidl* - tfJP - LW) - d $ ,; Итак, при достаточно большой не зависящей от j постоянной d спра- справедливо неравенство \аЛ0Р + Ц > ,i{DW) > \г,Aф) -. d-. (П.12) В проведенных рассуждениях не использовалась двумерность задачи. Эти же рассуждения почти дословно справедливы и в одномерном варианте, и в трехмерном. При этом следует считать, что D^p и L^ получены методом слабой аппроксимации приближениями к дифференциальным операторам DK И L: Dku=т \к^!)' Lu = a^i&+6^u (одномерный случай) д D / чди .ди . .ди . . Lu = а{х, ytz)-Q^ + b[x, y>z)-g- + с(х, у, z) — + e{z, у, z)u (трехмерный случай) Итак, мы обосновали чрезвычайно важный нетривиальный факт: син- сингулярные числа операторов ?)<") можно оценить снизу и сверху через собст- собственные значения эрмитова оператора О^к К Подчеркнем, что речь идет об оценке именно сингулярных чисел, а не собственных значений. Аналогич- Аналогичную оценку собственных значений получить не удается. Оценки a-j(D^) Идею, на которой основаны оценки собственных значений операто- (N) ров DKK ', мы продемонстрируем на типичном примере, когда область Q является квадратом О^х^тг, О^у^я-. При изучении этого приме- примера существенно используется вариационный принцип Куранта — Фишера,
146 Лекция 11 с которым мы познакомились в лекции 9, а также утверждения о собст- собственных значениях эрмитовых матриц, одна из которых является главной подматрицей другой (следствия теорем о перемежаемости). Для областей более общего вида аналогичные оценки можно получить на основе тех же самых принципов, но используемые при этом конструкции оказываются сложнее, а рассуждения виртуознее. Скалярное произведение (и, и) двух вещественных функций и(х,у) и и(аг,у), заданных в квадрате, определим формулой it >г (u,v) = — \ I u(x,y)v{x,y)dxdy. о о Мы ограничиваемся рассмотрением вещественного случая, чтобы не загро- загромождать изложение несущественными подробностями. Начнем с простейшего примера: где коэффициент К{х)у) постоянный {К{х>у) — Ко = const). Приступая к построению конечномерного аппроксимирующего опера- оператора D% , зафиксируем достаточно большое число Я > 0, выберем в ка- качестве базисных фуитхиР1и(-1Цх,у))и^(х,у),... ,«^(аг,у) все функции ви- вида A1.13) где венство п ? + m? ^ R2. Упорядочим эти функции так, чтобы выполнялось нера- h +mii ^ nh + mh "Ри ¦'i < 32- Например, при R = 5 существуют в точности N — 15 различных допустимых функций вида A1.13) которые могут быть упорядочены, например, так, как указано в таблице 3 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 nj 1 1 2 2 1 3 см 3 1 4 3 4 2 4 1 2 1 2 1 3 2 4 1 3 2 4 3 4 2 5 5 8 10 10 13 13 17 17 18 20 20 25 25
Лекция 11147 Непосредственным вычислением проверяем, что базисные функции A1.13) ортонормированы, т.е. Матричные элементы [-О^о Ьи3 оператора D^K , аппроксимирующего DKoJ могут быть вычислены по одной из следующих формул, каждая из которых приводит к одному и тому же результату: 0, На самом деле вторая формула предпочтительнее, так как она позво- позволяет выбрать в качестве базисных функции и&\ которые не имеют вторых производных. Именно вторая формула обычно лежит в основе метода сла- слабой аппроксимации. Пока для наших целей этот факт не имеет значения, но в дальнейшем мы будем вынуждены вновь вернуться к указанному об- обстоятельству. Приведенные формулы показывают, что матрица оператора DKKo', построенного на основе выбранного базиса, диагональна и на главной диагонали стоят собственные значения Xj = -A(n? -f- m?), отличающиеся только знаком от сингулярных чисел: *№к?) = М = *o(n? + m?) (j = 1,2,... , N = N(R)). В курсах уравнений математической физики и вариационного исчис- исчисления доказывается, что модуль наименьшего собственного значения |Ai|, который в нашем случае равен 2К0, является нижней гранью всех число- числовых значений интеграла // Kq[u\ + vfydxdy при допустимых функциях л и(х,у), обращающихся в нуль на границе и таких, что Очевидно, что при любой функции Л"(я,у) такой, что 1<{х,у) ^ Ко, и тем более для тех же функций и(х,у) имеем jj Щи* + u2y)dxdy ^ 2Щи, и).
148 Лекция 11 Это замечание эквивалентно утверждению, которое пока нами постули- постулировалось: существует >с0 > 0 такое, что \{Dku,u)\ — —{DKou,u) ^ ^o||w||2- Если этот факт справедлив для постоянного А'о и областей — квадратов, то с помощью вариационного принципа Куранта — Фишера можно его уста- установить в общем случае, в том числе и для операторов Dk , у которых коэф- коэффициент К(х, у) не постоянный. Однако следует обобщить также формули- формулировку принципа с тем, чтобы он стал применим не только в конечномерном случае. Мы не будем останавливаться на подробностях и ограничимся сде- сделанными замечаниями. Постараемся установить характер зависимости сингулярного числа ffj{DK ') от номера j. Число сингулярных чисел, не превышающих не- некоторого значения с, очевидно, совпадает с числом точек на плоскости с целыми положительными координатами п, т, лежащими внутри кругового сектора у/п2 + т2 ^ у/о-/К0, п > 0, m > 0. Число j таких точек примерно совпадает с площадью этого сектора: ? яз - —. Поэтому ctj « ;. Во 4 Ко Vя"/ всяком случае, начиная с достаточно большого j ^ j0, можно утверждать, что j - 5Я0тг > VjiD^J) > j - 2К0/ж. Пусть теперь К\ ^ K(xty) ^ Ко. В этом случае о о и, как нетрудно показать, при любом N-мерном векторе с координатами ?i,?2> - • ¦ >&/- Из вариацион- вариационного принципа Куранта — Фишера вытекает, что при любом 1 ^ j ^ N а, следовательно, при j и с учетом A1.12) получаем Существенно, что левап и правая части этой оценки не зависят от N, т.е. от числа выбранных базисных функций и^у Допустим, что все D^ равномерно не вырождены, т.е.
Лекция 11 149 Это предположение оправдано, например, если (fO'^+[D^']u,u) ^ -<*о1Ы|2 (do > 0). В этом случае И^*1]!! ^ I/do, очф**0) ^ d0 и при р > 1 сумму l)^S A1.14) можно оценить сверху постоянной 5, зависящей от do, d, K\, Ко, р, но не от размерности N пространства, из которого выбираются базисные функции. Эта сумма не изменяется при замене одного ортонормированного базиса этого пространства другим, а при удалении из такого базиса нескольких векторов, что уменьшает N, эта сумма не возрастает (см. теорему 10.4). На основе этого обстоятельства можно показать, что оценка A1.14) спра- справедлива вне зависимости от того, 'какие базисные функции «У(ж, у) вы- выбираются при построении аппроксимирующего оператора D^N\ если этот выбор ограничен линейными комбинациями функций из A1.13). Другой возможный выбор базисных функций На практике часто выбирают в качестве базисных функций у^Цх,у) функции кусочно-линейные и непрерывные. Надо лишь, чтобы они бы- были определены внутри рассматриваемой области (в нашем случае внутри квадрата О^аг^яг, 0 ^ у ^ тт) и чтобы на границе области они обра- обращались в нуль. На первый взгляд, такой выбор неудачен, так как мы занимаемся аппроксимацией дифференциального оператора второго поряд- порядка, а кусочно-линейные базисные функции вторых производных не имеют. Их первые производные постоянны в каждой подобласти, где v^(x,y) ли- линейна. Такие подобласти, являются, конечно, многоугольниками. На их прямолинейных границах первые производные имеют разрывы. Несмотря на это обстоятельство, не возникает никаких затруднений при вычислении матричных элементов [/?# ]у, ?-^\ D\p = [D^] по используемому нами правилу (метод слабой аппроксимации): о о о о A1.15) Действительно ли матричные операторы, построенные с помощью формул A1.15), аппроксимируют исходные дифференциальные операторы и в ка- каком смысле следует понимать аппроксимацию — мы не будем останавли- останавливаться на этих вопросах. Эти темы составляют предмет серьезных курсов приближенных вычислений или уравнений математической физики. На- Нашей целью является лишь получение для операторов О^к , D^ оценок зависимости их сингулярных чисел vj{Dk )> aj{^N^) 0T номера j. Очень существенно, чтобы в этой зависимости не участвовало N — размерность того конечномерного пространства, где действуют операторы.
150 Лекция 11 Теперь наметим с достаточной степенью подробности схему рассуж- рассуждений, обосновывающих справедливость оценок сингулярных чисел в слу- случае, когда в качестве базисных функций выбраны кусочно-линейные функ- функции ь^Цх,у). Не ограничивая общности можно считать, что v^(x)t[j — 1,2,..., N) ортонормированы. В математическом анализе доказывается, что для любого малого е > О можно подобрать функции v1(x,y)tv2(xiy)i... ,vN(x,у), которые будут непрерывны вместе со всеми своими производными и обращаться в нуль на границе границе в нуль, чтобы о о (s/2)' о о В свою очередь, каждую из гладких функций Р(х,у) можно приблизить конечной суммой с достаточно большим числом слагаемых вида у) = > *Pmh Sln ГПХ 8Ш ПУ> причем так, что о о (?/2)" о о Очевидно, что при этом (П.16) О О При построении аппроксимаций v^l\ v^2\ ... ,ь^ базисных функций, удов- удовлетворяющих неравенствам A1.16), можно добиться того, чтобы эти функ- функции оказались ортонормированными:
Лекция 11 15J так же, как и аппроксимируемые функции v^l\ «W,.... в^), Читателю ре- рекомендуется освежить в памяти необходимый материал из математичес- математического анализа и детально провести доказательство существования базисов и*1),и*2),... ,v^N\ удовлетворяющих условиям A1.16) и A1.17). Очевидно, что чем меньше е, тем меньше отличаются при выбран- выбранном N матричные элементы D^ и Ы1*), построенные с помощью описан- описанных выше процедур по базисам vW,v<2',... ,»W и v^'.v^,... ,v^N\ и тем меньше различие между сингулярными числами <?j{Dx ') и <rj(ErK '). Как уже отмечалось со ссылкой на теорему 10.4, оценкой A1.14) мож- можно пользоваться и на сокращенных базисах, полученных из первоначаль- первоначального удалением любого числа элементов. Следовательно, она верна и для оператора D^, построенного по базису из #*). Для операторов D^\ ин- индуцированных базисами из v^\ она выводится предельным переходом при j-» Ои, как уже было отмечено, для DKK ', построенного по базису из yW.iA2),... ,«("), получаем 3 Ь% Зо). Таким образом показывается, что неравенства A1.14) при р > 1 справед- справедливы не только для конечномерных операторов D^ \ построенных с помо- помощью базиса из функций v^(x,y) вида sinnj-z ¦ sinrrijy, но и, например, для базисов, состоящих из кусочно-линейных непрерывных функций. • Спектральным числом обусловленности оператора [D^N^]~X называется число Размерность и допустимые р Итак, нам удалось получить оценку vp([D^]~l) < const с независимой от N константой в правой части при любом р > 1 для оператора D^, дей- действующего на функции двух переменных х, у, с помощью слабой аппрок- аппроксимации эллиптического оператора D. Аналогичные оценки (но с другими ограничениями на степень р) могут быть получены и для операторов D^ аппроксимирующих эллиптический оператор D в одномерном или трех- трехмерном пространстве. Кратко остановимся на отличиях оценок для задач различных размерностей. У дифференциальных операторов с постоянными коэффициентами, дей- действующих на отрезке или в кубе О^х^тт, u(Q) = п{тг) = 0, d2u 02u d2u — +Q-2+ ^5-), О^х^тг.О^у^тг.О^х^тг, «@, у, z) = и(х, 0, г) = «(г, у, 0) = 0, «(тт, у, z) = «(г, х, г) = и{х, у, тт) = 0
152 Лекция 11 собственными функциями и собственными значениями будут: sinna:, -Кцп2 одномерный случай sinnx - sin my sin Iz, -K0(n2 + m2 -f l2) трехмерный случай Если при построении слабой аппроксимации D^J одномерного операто- оператора Dkq выбрать базис, составленный из собственных функций sinjx (j = 1,2,... ,N), то получим trjiD^J) = Ко ¦ j2 в отличие от двумерной задачи, в которой ffjiDxJ) та const -j. В трехмерном случае при каком либо фик- фиксированном а > 0 сингулярные числа a-j(D)i ') будут с точностью до знака совпадать с собственными значениями -Л'0(п2 + пг2 + I2). Вопрос читателю. Какие скалярные произведения (u,v) должны быть использованы в рассматриваемых одномерных и трехмерных задачах? Разумеется, что и здесь при построении аппроксимации D^ мы пред- предполагаем использовать базис составленный из собственных функций, упо- упорядоченных так, чтобы с увеличением номера базисной собственной функ- функции абсолютная величина собственного значения не уменьшались. Чис- Число сингулярных чисел, не превышающих а, совпадает с числом всех то- точек имеющих целочисленные координаты и лежащих в шаровом секторе: п2 + т2 +12 ^ с/Ко, п > 0, т > 0, 1 > 0 с радиусом y/aJJCo. Количест- Количество таких точек имеет порядок объема этого сектора, пропорционального кубу его радиуса, т.е. пропорционального о2!2. Поэтому номер ; и вели- величина VjiD^J) связаны соотношениями j sv ^^(D^J) и o-j(D^') та р1ъ. Эти оценки позволяют с помощью рассуждений аналогичных тем, которые проводились при изучении двумерного случая, получить для сингулярных чисел a-j(D^) аппроксимируемого оператора D^ ~ D^ + L^ следую- следующие утверждения: f=a const -j2 одномерный вариант const -j2/z трехмерный вариант и обосновать существование независящей от N оценки ^([О^Ц'1) спек- спектральной обусловленности: N h~° Такая оценка оказывается справедливой при р > 1/2 в одномерном случае р > 1 в двумерном случае Р > 2/3 в трехмерном случае В следующей лекции мы выясним, как выведенные сейчас оценки исполь- используются при анализе поведения нормы резольвенты оператора
Лекция 12 Нормальные операторы. Оценка их резольвенты с учетом малого возмущения. Расслоение спектра. Обсуждение результатов, О рас- расслоении спектра без предположения о "почти нормальности". Эле- Элементарное доказательство теоремы Лидского. Примеры, приводившиеся в лекции 7, показывают, что существуют матри- матрицы, все собственные значения которых собираются в одно большое "спек- "спектральное пятно" — кластер. Для таких матриц вычисление отдельных собственных значений или деление их на группы оказывается бессмыс- бессмысленным. В то же время, в приложениях обычно встречаются матрицы, у которых точки спектра группируются в не слишком объемные кластеры или выделяются индивидуально. Стоит разобраться, у каких матричных операторов такое расслоение спектра действительно имеет место. Чтобы возбудить у читателей интерес к поставленному вопросу, мы остановимся на двух примерах, посвященных соответственным исследованиям. Нормальные операторы Пусть два самосопряженных оператора DQ = Dq и В = В* коммути- коммутируют: BDo = D0B. Оказывается, что тогда эти операторы можно одновре- одновременно диагонализировать в общем для них ортонормированием базисе. Допустим, что мы уже выбрали ортонормированный базис, в котором Do диагоналей. Пусть некоторое собственное значение X(D0) = d0 имеет кратность т, т.е. m — размерность отвечающего ему инвариантного под- подпространства. Выберем в этом подпространстве какой-либо вектор х0- Яс- Ясно, что DqXq — doxo- Рассмотрим теперь цепочку векторов xq, Вх0, В2х0,.. ¦ и заметим, что все эти векторы являются собственными для Do с тем же собственным значением do: DQBkx0 = BkD0x0 = dQBkx0 (здесь мы воспользовались тем, что В и Do коммутируют: Do В = BDQ). Число линейно независимых векторов построенной цепочки mt не может превышать m (mi ^ m). Если гщ < тп, то в рассматриваемом подпростран- подпространстве можно выбрать вектор ац, не лежащий в линейной оболочке векторов хо, Bxq, B2xq, ... и расширить эту оболочку, чтобы она содержала не только Вкхо, но и В1х\. Если и теперь эта оболочка не покрывает рассматривае- рассматриваемого инвариантного подпространства оператора Do то ее можно и дальше пополнять аналогичным образом до тех пор, пока все оно не будет исчерпа- исчерпано. Напомним, что мы всегда имеем дело с операторами в пространствах 153
154 Лекция 12 конечной, хотя, возможно, и очень большой размерности. Из проведенных рассуждений видно, что инвариантное для Ьо подпространство, отвечаю- отвечающее собственному значению do, будет инвариантным также и для операто- оператора В. В рассматриваемом подпространстве можно выбрать ортонормирован- ный базис, в котором В представимо диагональной матрицей (с веществен- вещественным диагональными элементами). Но и Do также окажется в этом базисе диагональной со всеми одинаковыми диагональными элементами. Подобным образом производится диагонализация Вив остальных ин- инвариантных для ?>о подпространствах, отвечающих другим его собствен- собственным значениям. Описанное построение автоматически обеспечивает одно- одновременную диагонализацию Do и В. В конструируемом ортонормированием базисе будет диагональной так- также матрица оператора Do -I- iB. • Оператор называется нормальным, если существует ортонормированный базис, в котором этот оператор записывается в виде диагональной матрицы Сингулярные числа нормального оператора совпадают с модулями его собственных значений. Собственные значения нормального оператора не обязаны быть вещественными. Оценка резольвенты нормального оператора Пусть Di — невырожденный нормальный оператор, Aj = e1Wj|Aj|, и пусть |Ai(Z>1)| ^ Яо < Rlm Мы покажем, что если число \Xj(Di)\, лежащих в кольце Яо < |А| < Rlt меньше п и то существует г (Яо < г < R}) при котором 11 "Яо A - Ло/At) - 2п||С||/Лб" Ясно, что можно найти интервал (rOlri), лежащий целиком на [Яо,Я1] длины гх - г0 > (Ri - Яо)/п, на котором нет значений г = |Л,|. Выберем на этом интервале точку г =: 2rori/(ro + п). Существует хотя бы одно собственное значение Aj(D]), |A?(?>i)| ^ г, поскольку Яо ^ |Ai(Di)|. Для всех таких Xj имеем ri ~ го ^ n ri ~ го . „ Я1 — Яо Для любых Afc, |Afc| > r\ имеем гх — г0 и — г0 D Ri — Яо
Лекция 12 155 Итак, для выбранного г и любых / Отсюда следует, что диагональная в данном базисе матрица D\-rei<pI име- имеет минимальное сингулярное число не меньше, чем Ro(R\ — Ro)/BnRi). Матрица Di + C-rei<f>I уже не обязательно диагонально в данном фиксиро- фиксированном базисе, но если ||С|| < (Hi - iJo)i?o/Bi?in), то D\ + С — reivf имеет минимальное сингулярное число не меньше, чем (i?i - RQ)Ro/BRin) - \\C\\. Поэтому *' " " (Ri - RoWVRm) - \\C\\ _ J. 2n ~ Ro A-ЛЬ/Я1)-2п||С||/Яо" Так как у нормальной матрицы сингулярные числа совпадают с модуля- модулями собственных значений, спектральную обусловленность u\(Di) можно вычислять по формуле N / м iV |Ai(A)|' Ясно, что если |Ai| ^ Ro ^ \M\ ^ ---lAnl ^ R\, (Ro < Ri), то N - и „_: ,i_i и что поэтому для числа n{R{) собственных значений Xj[D\) таких, что |Ajt ^ Hi, имеет место оценка С учетом последней оценки получаем 1 - Д0/Д1 - 2ul(Dl)\\D^\[(R1/R0)\\C\\ (знаменатель предполагается положительным). Расслоение спектра После этих подготовительных построений можно перейти к анализу расслоения спектра операторов вида D = D0+iB + C, A2.1)
156 Лекция 12 где0?>0,7>0): /? \\D^C]\$ Будет также использована характеристика спектральной обусловленности isi(Dq) оператора Dq. Мы выберем неотрицательный вещественный параметр d ^ 0 (кон- (конкретный выбор этого параметра мы уточним ниже) и построим с его по- помощью вспомогательный оператор D = -dl + Do + iB 4- С Очевидно, что Поэтому утверждение Норма резольвенты (D — XI)'1 не обращается в бес- бесконечность на окружности |А| = г эквивалентно утверждению резольвента (D-Xl)'1 ограничена на окружности A = d+rexlp. Выбор d эквивалентен вы- выбору центра концентрических окружностей \Х — d\ = г, среди которых мы ищем те окружности, которые осуществляют дихотомию спектра операто- оператора D, т.е. такие, на которых заведомо ограничена резольвента оператора D. Так как операторы Dq = DQ < 0 и В = В" коммутируют и эр- эрмитовы, существует базис, в котором оба эти оператора записываются диагональными матрицами. Этот факт был уже использован ранее. В том же базисе диагональным будет также оператор D\ — —dl -f Dq + iB. Его собственные значения Xj(D\) вычисляются по собственным значениям Aj(jDi) = ~(d+dj) + ibj операторов Do, В, где dj = -Xj(Dq), bj = Xj(B). Так как построенный оператор D\ нормальный, его сингулярные числа совпада- совпадают с модулями его собственных значений. Предполагая упорядоченность О < di ^ d2 ^ ¦ ¦ ¦ ^ rfj: ^ dj+i ^ ¦ ¦ ^ dNi нетрудно проверить, что N vi Pi) = ^(d + dtf + bl/Y^ Предположение |j[—Д)]^2!! ^ 0 эквивалентно неравенству Щ ^ P2dj. Задача 12.1. Показать, что можно выбрать параметр d так, что при заданном фиксированном отношении q = R\/Rq выполнена оценка 1 - ^ + 2vy{Dl)^\\D^\\ \\C\\ = 1 - I + 2g»l{D1)\\D;1\\ \\C\\ < 1. щ Ко q Для такого параметра d найти Яоо, при котором D\ имеет хотя бы одно собственное значение, меньше по модулю, чем Rq0.
Лекция 12 157 Результат этой задачи, вместе с проведенными построениями, приво- приводит к следующему важному утверждению. Теорема 12.1. Для оператора D, описанного в A2.1), A2.2), и любого q > 1 можно указать d, Rqq такие, что в любом кольце Rq0 ^ RQ < |А — d\ < qRo на комплексной плоскости А найдется окружность А = d + ге1^ @ ^ <р ^ 27г), во всех точках которой выполняется неравенство \\[D — XI)~1\\ ^ к с постоянной к, зависящей только от g, \\Dq1\\, vi(D0) и от констант 0, у в A2.2). Обсуждение результатов В частности, если выбрать последовательность непересекающихся ко- колец с радиусами, растущими по геометрической прогрессии ZkRo < г < 2-3*До, то в каждом из этих колец найдется окружность, осуществляющая дихотомию спектра, и на этих окружностях нормы резольвент ограничены. Конечно, такого рода оценки могут быть эффективны лишь для опера- операторов очень большой размерности N и с большой нормой ||D|[. Приведенные оценки не используют ни N, ни |JD||. Целесообразно пользоваться изученными выше неравенствами при ис- исследовании конечномерных моделей дифференциальных операторов, напри- например, таких, о которых шла речь на предыдущей лекции Если для рассмат- рассматриваемого оператора используется спектральная обусловленность vp{D) при некоторым р > 2, то можно свести изучение к рассмотренному случаю, за- заменив вопрос о расслоении спектра оператора D вопросом о спектральном расслоении для некоторой степени Dm оператора D. Здесь мы не будем на этом останавливаться подробно. Приведем простейший пример оператора, почти укладывающегося в разобранную схему — разностную модель эллиптического оператора d2u д2и дч tdu . . Du - -a~l + ТТ + aя~ + &я~ + с(х> У)и> дх2 дуг ох ду определенную на сеточных функциях u(xt у) (х = n/N, у ~ m/N, 0 ^ n ^ N, О ^ n ^ M) внутри единичного квадрата, обращающихся на границе в нуль u@,y) = u(l,y) = tt(x,0) = u(x,l) = 0. Производные аппроксимируются разностными отношениями д2 и(х + Л, у) - 2ц(д, у) - и(х - Л, у) _ Д2ц дх2 № Ах*' ®L ц(ж' У + h) ~ 2ц(аг- V) ~ "t^- У ~ h) _ д2ц ду2 ~* Л2 du u(x + h,y) — tt(x - Л, у) _ Ли ЪЧ ""* 2Л ~ Д7' д u(x,y + h) — u(x,y—h) _ Ди ду~ "*" 2Л " Д^"
158 Лекция 12 Коэффициенты а и Ь будем считать постоянными, а коэффициент с{х,у) может не быть постоянным. В пространстве сеточных функций введем скалярное произведение 1 (здесь суммирование подразумевается по всем точкам сетки). Задача 12.2. Показать, что операторы удовлетворяют условиям A2.1), A2.2). Указание. Для диагонализации операторов Do, В используется базис, TitT Oil составленный из вектор-функций «&*¦*) (ж, у) отличающихся от sin sin — только множителями. Теперь можно пояснить, почему было сказано, что оператор рассмат- рассматриваемого примера "почти" укладывается в класс операторов, удовлетво- удовлетворяющих условиям теоремы о расслоении спектра. Дело в том, что для эллиптического оператора в двумерной области спектральная обусловлен- обусловленность vp(D) может быть ограниченной лишь при р > 1. Это обстоятель- обстоятельство подробно обсуждалось в предыдущей лекции. Оно приводит к другой оценке числа собственных значений нормального оператора Di таких, что и это является препятствием для автоматического повторения при р > 1 заключительной части построений, основанных на гипотезе р= 1. Еще одно неприятное ограничение, сужающее область применения этой теоремы, состоит в требовании, чтобы операторы DQ и В коммутирова- коммутировали. Именно благодаря этому ограничению, составленный из них оператор Do + iB оказался нормальным. В приложениях естественно ожидать ком- коммутируемости дифференциальных операторов с постоянными коэффициен- коэффициентами, что демонстрирует задача 12.2. Можно надеяться, что аналоги теоремы можно получить также в слу- случае, когда ограничение в виде жесткого равенства BD0—D0B = 0 заменяет- заменяется оценкой приемлемой малости \\BDq - DqB\\. Тогда применение теоремы к анализу дифференциальных операторов не должно вызывать затруднений и в случае непостоянных, но достаточно гладких коэффициентах. Доказанная теорема утверждает существование последовательности концентрических окружностей А = d + retv>, на которых ограничена норма резольвенты \\{D - А/)!) и, следовательно, ограничены нормы ||А'Г(-О)|[ матричных интегралов о вычисленных по этим окружностям.
Лекция 12 159 Напомним (см. лекцию 4), что проектор осуществляет проектирование на инвариантное для Z? подпространство, отвечающее собственным значениям ^(D) таким, что |А^(?>~Х| < Н. То же самое подпространство инвариантно также для оператора D и отвечает его собственным значениям Xj(D) таким, что |Aj-(Z>)| > 1/й. Переобозна- Переобозначив 1/Я через г и заменив D на D - dl, можно представить формулой 2тг Z7T J проектор на инвариантное подпространство, соответствующее Xj{D), ле- лежащему вне окружности А = d + rettfi. В силу неравенства Буняковского \\П ^ \/(Kr(D){D-di]u,[D-dI]u), т.е. для вектор-функций с ограниченной нормой \\Du\\ нормы их проекций ||"Ри|| ограничены одной и той же константой на всех окружностях. Чтобы эти проекции с ростом г убывали, надо требовать от « большей гладкости, т.е. оценок величин Ц1>ри|| при р > 1. Задача 12.3. Воспользовавшись тем, что произведение является полиномом от etp(pRD, доказать равенство R? Г ¦ 1 Vr{d ) = i^j ei epvd<fiDPY~^rD о Указание. Интеграл по замкнутому контуру от аналитической функ- функции равен нулю. Из этого представления проектора следует неравенство \}fPr(D)u\\ $ Все высказанные выше утверждения связаны с тем, что спектр рас- рассматриваемых операторов расслаивается, и есть смысл разыскивать бази- базисы инвариантных подпространств, отвечающих тем или иным кольцевым кластерам. Посвятив лекцию разбору проблем расслоения спектра на модельных примерах, мне хотелось бы вызвать интерес исследователей к дальнейше- дальнейшему изучению этой проблемы. Эта проблема заинтересовала меня после того, как были построены примеры, описанные в лекции 7. Я вспомнил, что близкие вопросы тщательно изучаются в функциональном анализе и
160 Лекция 12 это подтолкнуло меня к ознакомлению с работами М. В. Келдыша и его последователей, основанными на аппарате целых аналитических функций. По-видимому, первая оценка спектрального расслоения, как подгото- подготовительная для другого вопроса, была получена в 1958 г. В. Б. Лидским, развивавшим идеи, высказанные М. В. Келдышем в 1951 г. (см [Келдыш; 1], [Лидский; 1], [Келдыш-Лидский; 1] Работа Лидского была изложена в книге [Годунов; 6], а несколько упрощенный ее вариант читался на лекциях, по- положенных в основу настоящего издания. При последующих обсуждениях с Ю. М. Нечепуренко появилось совсем элементарное доказательство теоре- теоремы Лидского, которое приводится ниже (см. также [Годунов-Нечепуренко; 1]). При первом чтении это доказательство можно пропустить. Выбор и исследование модельной задачи, о которой шла речь выше, — результат бурных дискуссий с Ю. М. Нечепуренко. О расслоении спектра без условия "почти нормальности" Вспомогательная лемма Формулировка леммы Рассмотрим неубывающую последовательность положительных чисел ai ^ »2 ^ аз ¦ ¦ • 1 содержащую конечное или даже бесконечное число членов и такую, что сумма J2 aJ1> составленная с использованием всех ее элементов, не превосходит з единицы: YL^~ ^ 1- Считая, что положительный параметр г пробегает весь 5 интервал (Ro, #i), т.е. О < Яо < г < Дь образуем произведение г о, 3 которое обращается в бесконечность, когда г совпадает с одним из aj. В проме- промежутках между этими значениями тг(г) сходится к конечному значению. Лемма 12.1. Можно указать в = $(Rq/Ri) такое, кто тг(г) > e~flfll при всех Q < RQ < г < Яг. Доказательство этой леммы приводится ниже. Вспомогательное неравенство для резольвенты Начнем с элементарных тождеств: {D - re-^iy'D = -(/
Лекция 12 к= 1— 1 it—1 следствием которых при г > Ц?) 'Ц будут неравенства Считая, что сингулярные числа упорядочены по возрастанию номеров {<tj (Tj+i), проверим следующие неравенства и равенства: П (Tjil- П J=2 П [1 П [1 П 1- rp Итак, мы доказали (при г > Ц-О})) неравенство 1- )-ПЫ п 1- Окончательная оценка резольвенты Заметим, что [1 + *JP(D)} если г ^ R>. Здесь vp{D) — характеристика спектральной обусловленности матрицы D, введенная в лекции 11. Кроме того, между собственными и син- сингулярными значениями матрицы D~p имеет место неравенство (см. лекцию
162 Лекция 12 10) Ету^ = Ъхло-п\^ло-п i=i ' зК п j=i 3=1 и при ЦГГ'Ц < Яо ^ г ^ Я] Положив a,- = (J2i]|JD-i||~1)p^p(?>)|AJ-(?>)|''. имеем ? — <C 1. Итак, мы пока- зали, что при ЛоН^!! > 1 во всех точках отрезка R\ $: г ^ Rq справедлива оценка где ^ — ^ 1. На основании леммы 12.1 можно утверждать существование такого г из нашего отрезка, при котором П'-? -1 Тем самым доказано существование в кольце Л] > г > Яо окружности |А| = г, на которой \\D(D — А/)1| можно оценить через Яо, Я: и параметры, характе- характеризующие оператор D. Однако оценка сверху этой нормы получилась большой в отличие от случая операторов, рассмотренных в начале лекции, где норма ре- резольвенты оставалась при возрастании г ограниченной. Теперь интегральная оценка резольвенты растет даже не степенным образом, а как евгР. Подготовка к доказательству леммы 12.1 Приступая к доказательству леммы 12.1, т.е. выводу оценки модуля про- произведения ПО - r/Qj)' сначала разобьем это произведение на два сомножителя з тго(г) и 7Ti(r), включив в первый те и только те сомножители l—r/aj, у которых при некоторых г (Яо ^ г ^ R\) rjoij > 1. Если г меняется на отрезке [#o,i?i] @ < Яо ^ г <С Ят), то число Л^о таких сомножителей с неположительными 1 -r/ctj не превышает Rt. Действительно, из неравенств ai ^ а2 ^ ¦¦¦ ^ а,, 1 ^ — ^ — ^ ...— 5=
Лекция 12 163 следует, что j/ctj < 1 (l/j > l/ctj), так как иначе мы имели бы неравенства «2 При неположительности 1 — г/а;-, т.е. при r/ctj > 1 имеем 1 < г/о, < г/; Яг/j. Итак, тго(г) — это полином степени Nq (No < Ri) и при этом тго@) = 1. Полином iti(r) = Yi U ~ т/аз) состоит из положительных при г < множителей и имеет степень N — NQ. (Через N мы обозначаем число всех параметров ai, q2i ¦ ¦ -1 qn-) Возможно, что N = NQ и при этом 7Ti(r) = 1. Оценка ir0 (г) Произведение тго(г) = YI (^~г/ау)- содержащее No сомножителей, являет- 3=1 ся вещественным полиномом степени Nq таким, что тго(О) = 1- Среди всех таких полиномов отыскивается экстремальный такой, у которого тахло^г^д! |тго(г)| принимает наименьшее возможное значение. Таков полином существует и един- единствен. Это следует из развитой Чебышевым теории полиномов, наименее укло- уклоняющихся от нуля. Экстремальный для этой задачи полином может быть точно указан и описывается формулой У — ло -Яо В этой формуле Tjvo(ar) — классический полином Чебышева. Его удобно на различных интервалах описывать различными выражениями: \х\ ^ 1, При этом гпах,^! \TNo{x)\ = 1 и ]TNo{x)| > {2\x\)N°/2 при |г| ^ 11. Проверим последнее утверждение. Функция A*1, *) = 5КИ + *)"• + (N -О"'] имеет при 0 < t < \х\ положительную производную по t. Поэтому (M - После этих max (P/Vo / \ Ri замечаний Ml> -Rol Tn0 очевидно, что max Rr,<r<R,l " \2A + / lo/Ril)J >[ (R1 f \ + ffl R ч ! ] \ / -It /0 I1 -1
164 Лекция Пользуясь тем, что max |тго(г)| ^ max \PNo(r)\ и No < Ль приходим к окончательной оценке Завершеоие доказательстве леммы 12.1 Достаточно оценить тт\ (г) лишь, если я^ (г) не равно 1 тождественно. Преж- Прежде, чем приступать непосредственно к оценке тг], докажем, что при О <С а < 1, О <С х < 1 справедливо неравенство 1пA — ах) ^ xln(l — а). Действительно, при \ах\ < 1 сходится ряд и при этом Вспоминая, что в 7ri(r) входят лишь положительные сомножители 1 — r/<*j, с помощью проверенного неравенства убедимся, что In 1 =ln 1 — ^ —.In 1 - Поэтому ^ - r/Qi) } Вспоминая, что ?— ^ * (здесь суммируется только часть слагаемых — не з аз все 1 - r/ctj входят в xj(r)) и 1пA - Rq/Rx) < 0, мы приходим к требуемым оценкам я, Поэтому max ГТ Г а, Ro Лемма доказана.
Лекция 13 Рекуррентные соотношения для определителей главных характе- характеристических миноров трехдиагональных матриц и последователь- последовательность Штурма из их отношений. Тригонометрическая парамет- параметризация последовательности Штурма. Производные угловых па- параметров членов последовательности Штурма по коэффициентам рекуррентных соотношений. Теорема Штурма и ее применение в вычислительной практике для указания точных границ собст- собственных значений. Вычисление приближенной последовательности Штурма, ограничивающей сверху (или снизу) точную последова- последовательность. Метод бисекций. Оценка погрешности. Последовательность Штурма и ее тригонометрическая параметризация В этой лекции будут изложены общие идеи, связанные с методом Штурма и применением этого метода для расчета собственных значений симметри- симметрических трехдиагональных матриц. Конкретное применение этого метода к отысканию собственных векторов и дальнейшие обобщения будут рас- рассмотрены в следующей лекции. Напомним (см. задачу Д1.4 в лекции 1), что существует алгоритм, состоящий из последовательности ортогональных преобразований — отра- отражений, который преобразует произвольную квадратную симметрическую матрицу в подобную трехдиагональную матрицу. Поэтому, если мы умеем вычислять собственные значения матриц трехдиагональных, мы сможем вычислить собственные значения произвольной симметрической матрицы. Напомним также, что все эти собственные значения вещественны. Начнем с изучения характеристических определителей (полиномов) Dk(X) главных миноров порядка к трехдиагональных матриц вида. с2 r_i dN-i A3.1) 165
166 Лекция 13 Хотя такие матрицы будут симметричными только при bj — cj, 2 ^ j ^ TV, мы ограничиваемся менее жестким условием bjCj > 0, которое выполнено для симметрических матриц с элементами bj = с,- ф 0. (При наличии нулевых элементов bj вычисление собственных значений матрицы А сводится к аналогичным расчетам для матриц меньшего порядка.) Положив DQ(X) - 1, />i(A) = di - А, легко получить формулу для определителей Dk(X) главных характеристических миноров матрицы D: Dk(X) = (dk - А)?»А_,(А) - bkckDk.2(X) l^k^N, A3.2) которые можно переписать в следующем виде (bkck > 0): bk 16fc! Dk.l{X) {dk X) Вместо полиномов Dfc(A) удобно рассмотреть рациональные дроби положить Vo(X) = 0, Ьг = 1, c^+i = 1 и заменить A3.2) эквивалентными равенствами A ^ к ^ iV) ^| 0. A3.4) Определим тригонометрическую параметризацию рациональных дро- дробей Vk(X) угловыми параметрами <^(А), считая, что 7*к(Х) = tgy>A(A). Для упрощения выкладок при использовании формул A3.3) и A3.4) мы опус- опускаем знаки модуля, считая, что 6* > 0, с* > 0. Случай, когда среди Ьк} ск есть пары отрицательных, будет рассмотрен в лекции 14 при расчете компонент собственного вектора. Определяя <рк(Х), следует указать полуинтервал [l(k) - 1/2]тг ^ <рк < [1{к) + 1/2]яг, которому принадлежит <рк. Полагаем 1@) = 0, ^о(А) = О, - jt/2 ^ arctg-pfc(A) < т/2, - оо ^ Рк(Х) < +со, Очевидно, что когда А растет, изменяясь от —оо до А = d\, дробь Vi(X) = c2/(di -А) также растет от 0 до оо, принимая при дальнейшем росте А очень большие отрицательные значения, и Pi (А) -» -0 при А -^ +оо. Функция <Pi(X) монотонно возрастает и сначала пробегает значения из интервала @,я-/2), а затем — из интервала (^-/2,^), и <pi{di) = тг/2, (рг(+оо) = тт. Равенства A3.5) можно переписать следующим образом: dk - A-
Лекция 13 причем, если /тг > <^*_i(A) ^ (I — 1Oг, то у*(А) надо брать из того же полу- полуинтервала [(/ — l)ir,/jr], если tgWk(A) конечно и положительно, и из полуин- полуинтервала [lw, (I - 1)тг] в противном случае. Легко проверить, что все у* (А) оказываются монотонно возрастающи- возрастающими функциями А. Для описанной зависимости у>*(А) от А, 6А_1, dk-i, cki <pk-i введем обозначение <Рк =u{^,bk,dk,ck+u(pk-i)) A3.6) так что ^ A3.7) Дифференцируя обе части равенства A3.7), можно вычислить производ- производные от задаваемой им неявной функции по всем ее аргументам А, 6, d, с, 7, а также производные обратной функции -у = f(X,b,d,c,u). Приведем результаты этого вычисления 3w(A, btd,c, 7) _ 9w _ с cos2 7 дш _ be дш _ с sin 7 cos 7 Ш ~ ~ ~dd ~ ~H~' !hi~H} ~db~ Я ' —A)cos7 — 6sin7] A3.8) Я = c2cos2 7 + [(d- A)cos7-6sin7]2 > 0 и важные для дальнейшего следствия формул A3.8): (X3.9) Задача 13.1. Проверить формулы A3.8) и A3.9). Используя эти мулы, убедиться, что у>*(А) — монотонно возрастающая функция А. Теперь мы можем утверждать, что если среди "Pi(А), Яг(А), .. число отрицательных (и бесконечных) значений равно I, то (/ + 1/2)я- > VkW ^ (' - 1/2)тг. Индукцией по fc, проведение которой мы оставляем читателю, легко flOKa3biBaeTCflj что при возрастании аргумента А от -со до +оо функция <рк{Х) монотонно возрастает от 0 до кж. При этом существует в точности к значений А = Ху\ j; = 1, 2,... , к, при которых = U - ) Теорема Штурма Корни Aj ' полиномов Dk{X) обладают свойством перемежаемости, ко- которое описывается неравенствами
168 Лекция 13 Перемежаемость следует из приведенного выше описания функций у* (А), но мы рекомендуем читателю ее обосновать при решении следу- следующей задачи. 5 Задача 13.2. Пользуясь рекуррентными соотношениями A3.2), дока- доказать индукцией по fc, что полином ?>*(А) имеет разные знаки в соседних нулях А^_-х) и xf\ Утверждение о перемежаемости и результат задачи 13.2 составляют содержание теоремы Штурма, которая обычно включается в большинство стандартных курсов алгебры (см. например, [Курош; 1]). • Последовательность Vk{X) называется рациональной последовательностью Штурма, отвечающей вещественному параметру А. При этом мы изменяем традиции, принятой в стандартной учебной литературе, где это определение относится к последовательности самих полиномов Д)(А) = l,/>i(A), D2{X), ..., а не их отношений Vj(X). Из теоремы Штурма о перемежаемости непосредственно следует сле- следующее утверждение (см. [Sturm; 1]). Теорема 13.1. Если а последовательности Р0(А) = 0, "Pi(A), V2{\}, .... Vk(X) содержится в точности 1 ^ m ^ k отрицательных и бесконечных значе- значений, то AJn' ^ А и А < X)J+1, m<k, где А'- ' — корни полинома ?>*(А). • Последовательность уо(А), tpi(X),...,tpk(X), построенная из аргументов тригонометрической параметризации Pkity, называется тригонометричес- тригонометрической последовательностью Штурма. Метод бисекций Теперь опишем метод бисекций вычисления собственных значений симметрических трехдиагональных матриц. Пусть b2 d% 63 А = r-i bN A3.10)
Лекция 13 169 т.е. А — симметрическая трехдиагональная матрица с ненулевыми эле- элементами на побочных диагоналях. Иными словами, Cj — bj, cjbj — Щ > 0. При этом полиномы Де(А), а следовательно, и собственные значения А глав- главных миноров матрицы А и собственные значения самой матрицы А не ме- меняются при замене bj на —bj, т.е. они зависят только от \bj\. Именно бла- благодаря этому обстоятельству при вычислении собственных значений Xj(A) можно использовать приведенные выше рассуждения несмотря на то, что они проводились в предположении bj > 0 и cj > 0. Все собственные значения (симметрической) матрицы А вещественны и лежат на отрезке Х(А) ^ А ^ У [А), где Х(А) = min{rfi — |&21) rnin (dk — IM ~ \bk+i\),dn — \bn\}. Y(A)=m^{d1 + \b2lm3xJdk + \bk\ + \bk+l\)ldn + \bn\} l " } Задача 13.3. Доказать это утверждение. Указание, Если \dn-\\-\bN\ > 0, |rfi-A|-|62| > 0 и M*-A|-|6A| 0, при всех 2 ^ к ^ N — 1, то вещественное А не может быть собственным значением. Приступая к расчету, выделим в памяти компьютера ячейки для ниж- нижней х& и верхней у&) границ j'-ro собственного значения Xj(A) и занесем в них уже известные числа a:(J') = Х{А), у^ = У'(А) —* одни и те же для всех j = 1,2,.. .TV. В дальнейшем верхняя и нижняя границы будут сближаться, так что x*J) и y(i) будут оказываться все более точными приближениями Xj(A) снизу и сверху. Для расчета собственного значения Xjz(A) матрицы А действуем сле- следующим образом. Выберем А = \[х^ + у^°)] и рассчитаем последовательность Штур- Штурма Vo(X)iVi(X),'P2(X),... ,7V(A) так, чтобы элементы этой последователь- последовательности удовлетворяли равенствам A3.4), в которых Vq{X) — 0, b\ = 1, Ck+i = bk+i, cN+l = 1. Определив число I отрицательных (и нулевых) эле- элементов среди Vq, 7*2, ..-, Vn, на основании теоремы Штурма заключаем, что имеет место один из следующих вариантов: А( ^ А < Ai+i, если 1 ^ I ^ N - 1, А < Ai, если 1 = 0, Хм < А, если I = N. Теперь можно подкорректировать границы х^°\ у&°) для А,-о. Если I > jo, то Xja ^ А, а если / ^ Зо — 1, то А < AJo. В первом случае ytf°) заменим на А при неизменном х^°\ а во втором случае, не меняя yW°), заменим х^ на А. Так как А делит первоначальный отрезок [х^°\у^°У] пополам, после замены одной из границ отрезка на А = J[x«°* + у"")], длина его уменьшится в два раза. Коррекция для учета погрешностей округления При реальном расчете на компьютере арифметические операции вы- выполняются не абсолютно точно, а с округлениями. Полученный результат расчета можно истолковать как точный, но не для самой матрицы А, а
170 Лекций 13 для возмущенной матрицы А, полученной при замене элементов dk и bk главной и нижней побочной диагоналей близкими элементами 4 и Ьь а также при замене элементов bk верхней побочной диагонали их прибли- приближениями с^. Величина возмущения зависит от используемой разрядной сетки представления чисел, правил округления и конкретной программы, указывающей порядок выполнения арифметических операций, входящих в формулы для последовательного расчета последовательности Штурма. Итак, мы постулируем следующее: \bk-lk\<E'max{X(A),Y(A)], \bk -c*| < е1 тьх[Х(А),У(А)Ъ \dk-dk\<2e'm3x[X{A),Y{A)]t где е' — малый параметр, определяемый числом разрядов, используемых в компьютере для представления чисел. Так как \\А — Л|| ^ max - (bk - h? + Ffc+1 -ck+1)\ имеем \\A-A\\ Поэтому при назначении новой границы х^ или у^°) следует выбирать не число Л, которое использовалось при расчете последовательности Штурма, а сдвинуть А вправо или влево на са- Если корректируется нижняя грани- границы для Xj0, то вместо х^'°) мы принимаем А — еЛ) а если корректируется верхняя граница, то А -Ь еА ставится на место у^°\ При использовании таких подкорректированных сдвигов можно гарантировать,что рассчитыва- рассчитываемое собственное значение действительно окажется на отрезке [х^°\ у^°^]. Построение мажорирующих (минорирующих) последовательностей Теперь мы прервем на некоторое время описание процесса расчета собственных значений и обсудим некоторые видоизменения вычислений последовательности Штурма, которые окажутся полезными в дальнейшем при расчете собственных векторов. Для расчета Xj[A) такие видоизмене- видоизменения не требуются. Вычисляя 7\(А) и соответствующие им ^(Л), можно при необходи- необходимости добиться того, чтобы вычисленные числа v"lc(A) были строго мень- меньше, равными или строго больше точных значений ^jt(A). Для этого, ис-
Лекция 13 1TL_ пользуя формулу достаточно выполнять округления промежуточных результатов последо- последовательных арифметических операции так, чтобы результат расчета был подчинен точному соотношению где Icft+i|-16fc|, jSfc-dfcl, 16а|-16а|, А—А^о имели бы те или иные предписанные знаки и были бы достаточно малЫ) чтобы обеспечить желаемую точность. В каком именно направлении следует производить эти округления, каждый раз устанавливается на основе неравенств A3.8), A3.9) и соотношений Конечно, для возможности провести достаточно точный расчет мажо- мажорантных (минорантных) последовательностей Штурма необходимо иметь очень близкие границы для Aj0, т.е. такой расчет возможен, лишь тогда когда уже удалось получить очень малое уС*°) ~х^°К Действительно, если при построении последовательности для неизвестного заранее Aj0 мы ис- используем А из отрезка х#°) ^ А ^ j/j0', то надо положить А = j/J"°) для мажорирующей последовательности и А = х^°) для минорирующей после- последовательности. Во избежание громоздких технических подробностей мы не будем останавливаться на этом подробно, а лишь заметим, что, возмож- возможно, оценку A3.12) для ел придется заменить на аналогичную, но несколько большую. Еще раз подчеркнем, что с помощью направленных округлений можно добиться того, чтобы последовательность ^^(А) была точной последова- последовательностью Штурма для некоторой матрицы А, близкой к А, и, кроме того можно построить мажоранты или миноранты последовательности Фк(>ч0) для собственного значения А;-„ матрицы А (подробнее этот вопрос будет рассмотрен в следующей лекции). Завершение расчета собственных значений Вернемся к описанию процесса уточнения границ для собственных значений. После корректировки границ х^°\ у^"°) (точнее, одной из них) выберем новое А как среднее арифметическое новых границ, и для этого А рассчитываем последовательности Штурма {"Р/ДА)} а затем, определив число / = 1(\) отрицательных Я*(А), проведем новую корректировку границ Ж0о)) уЫ для Aj0 и т.д. При расчете AJO рекомендуется вносить корректировки и во все другие отрезки [z^\t/^)]( содержащие остальные собственные значения \j. Нуж- Нужно ли их вносить после окончания расчета последовательности Штурма, выясняется по числу / отрицательных элементов этой последовательности. Использование этого приема обычно позволяет ускорить вычислительный
172 Лекция 13 процесс, если после Xj0 будут рассчитываться и другие точки спектра мат- матрицы А. Заметим, что округления при расчете последовательностей Штурма можно организовать так, что среди 7>*(А) не будет нулевых и не будет возникать переполнения разрядной сетки из-за слишком больших чисел. При такой организации расчета достаточно считать в последовательности Штурма только строго отрицательные Р*, так как нулевые (и бесконечные) в этом случае будут отсутствовать. Несмотря на всю простоту описанного процесса, он очень эффекти- эффективен и весьма быстро сходится. Идея процесса была предложена Гивенсом [Givens; 1, 2], г удобная технологическая схема разработана Уилкинсоном, Бартом и Мартином [Barth-Maxtin-Wilkinson; 1]. Тригонометрическая параметризация последовательностей Штурма введена здесь для наглядности, хотя в описанной технологии она не исполь- используется. Эта параметризация будет полезна при описании на следующей лекции способа вычисления собственных векторов симметрических трех- диагональных матриц. Интересные разнообразные обобщения и приложе- приложения осцилляционных теорем Штурма можно найти в книгах [Гантмахер- Крейн; 1] и [Аткинсон; 1].
Лекция Ц Связь последовательности Штурма с компонентами собственного вектора трехдиагональиой матрицы, пример матрицы с парадок- парадоксальной зависимостью крайнего элемента последовательности Шту- Штурма от А. Двусторонние последовательности Штурма. Использо- Использование для их расчета мажорирующих и минорирующих последо- последовательностей. Арифметика "вынесенных порядков". Вычисление компонент собственного вектора и последующая его нормировка. Иллюстративный пример. Последовательность Штурма и компоненты собственного вектора Сначала покажем, как последовательности Штурма (см. лекцию 13) могут быть использованы для расчета компонент собственного вектора симмет- симметричной трехдиагональной матрицы А в предположении, что соответству- соответствующее собственное значение А уже вычислено. В лекции 13 мы сопоставили матрице А- 62 A4.1) и числу А последовательность значений Dk{\) главных миноров характе- характеристического определителя матрицы А и "рациональную последователь- последовательность Штурма" отношений 7>*(А) = [\bk+i\dk-i{\)]/ Dk(\). При этом 7Ч(А) = О, &i = 1, 6n+i = 1) так что "Pfc(^) @ ^ * ^ Ю связаны соотношениями \bk+i\ = 0. A4.2) Для учета погрешностей, допущенных при реальном вычислении по- последовательности {^(А)} мы моделировали влияние этих погрешностей, считая, что 7\(А) удовлетворяет не точным соотношениям A4.2), а анало- 173
174 Лекция 14 гичным соотношениям с возмущенными коэффициентами A4.3) Возмущенные коэффициенты bk, 5*f c/e+i можно рассматривать как элемен- элементы некоторой трехдиагональной не обязательно симметричной матрицы А = 64 f-I C/V y A4.4) При этом матрица A4.4) близка к исходной матрице А: \\А-А\\<еА. A4.5) Мы обсудили, как оценивать ел с учетом разрядной сетки для представ- представления чисел с компьютере и рассмотрели "тригонометрические последова- последовательности Штурма" угловых параметров, связанных с Vk (А) равенствами fc*+i| dk - X - |, или (если погрешности не учитываются) A4.6) При 1 ^ к ^ N имеем [t(k) - 1/2]тг < y>fc(A) < [l(к) + 1/2]тг, где /(*) — число отрицательных элементов среди Pi (A), Pi(A), ..., Р*(А). Компоненты ui, иг, ¦ ¦ ¦ ,"п собственного вектора и матрицы Л, отвеча- отвечающего собственному значению А, удовлетворяют равенствам (di - A)ui +b2u2 — О, bkuk-i + {dk - X)uk + Ьк+ущ+1 = 0, 2 = 0, N-h A4.7) которые позволяют связать ик с 7\(А). Бели А — собственное значение матрицы А, то D^(X) = det[A — XI] = 0 и, следовательно, — оо (напомним, что при построении последовательностей Штурма мы вводим дополнительные элементы 6] = 1, с^+1 = 6jv+1 = 1, которых нет на побоч- побочных диагоналях А), то в тригонометрической последовательности Штурма из VN(X) = 0 следует у*(А) = (;' - 1/2)тг. Более того, если собственные
Лекция 14 175 значения матрицы А занумерованы в порядке возрастания (Ai < А2 < ... < Ajv), то из ipN(A) = (j- 1/2)тг следует А = Aj. (Это утверждение устанавли- устанавливается с помощью теоремы Штурма и правила A4.6).) Отметим, что если среди bk нет равных нулю, то у матрицы А нет кратных собственных значений согласно теореме Штурма. Однако это об- обстоятельство не препятствует существованию столь близких друг к другу различных точек спектра матрицы А, что отличить их при реальном рас- расчете невозможно. Сравнивая A4.7) с A4.2) и учитывая Vn(\) = со, легко видеть, что l^k^N-L A4.8) Собственный вектор остается собственным вектором при любой нор- нормировке, т.е. при умножении на любое ненулевое число. Поэтому, поло- положив, например, ujy = 1 с помощью A4.8) можно вычислить все компоненты вектора «, а затем ввести другую нормировку с тем, чтобы получить ра- [ венство ||и|| = \ J2 lu*l2 = *• Ниже мы вернемся к этой процедуре, чтобы V*=i указать "подводные рифы", с которыми можна столкнуться при ее реали- реализации на компьютере. Парадоксальный пример Рассмотрим еще один нетривиальный, аспект расчета последователь- последовательности Штурма при уже известном с достаточной точностью собственном значении А = Aj0. Напомним, что приступая к расчету собственного век- вектора на основании равенств A4.8), мы должны быть уверены в том, что ?V(Aj0) = оо или, что то же самое, \bN\VN-i(\j0) - B* - Aio) = 0, где HN и dN достаточно близки к заданным элементам Ь^ и ds трехдиагональной матрицы А. Оказывается, что добиться этого совсем непросто. Следу- Следующий пример ярко демонстрирует возникающие при этом затруднения. Этот пример, придуманный В. И. Костиным, несмотря на свою простоту и небольшой размер E х 5) матрицы, моделирует парадоксальную ситу- ситуацию, наблюдавшуюся в реальных расчетах. Рассмотрим симметричную матрицу 2 1 1 1 + * О 6 О О О О О 6 26 6 О О О' 0 О 6 О 1 + * 1 1 2 и представим ее в виде суммы двух матриц, каждая из которых симмет- симметрична и неотрицательно определена: '2 10 0 0" 110 0 0 0 0 0 0 0 0 0 0 11 0 0 0 12 +6 0 0 0 0 0' 0 110 0 0 12 10 0 0 110 0 0 0 0 0
176 Лекция 14 Первое матричное слагаемое имеет однократное собственное значение О и двукратные 2/C + л/5) и (C + \/5)/2). Собственные значения второго слагаемого: 0, 0, 0, 4, 4, 34. С помощью вариационного принципа Куран- Куранта — Фишера (см. лекцию 9) можно показать, что при достаточно малом 4 ^ 0 неотрицательно определенная матрица As имеет единственное изоли- изолированное собственное значение на отрезке [0,34]. Поэтому с погрешностью не больше 34 можно считать А = 0 приближенным собственным значением матрицы As- Построим последовательность Штурма, полагая А = 0: Т+24' 1 1 + 24 24-А-47>2(А) 2 + 34' 2-А-4Р4(А) 2 + 44" При очень малых положительных 4 значение "Ps(O) оказывается очень близ- близким к 1 и не будет стремиться к бесконечности при 4 -+ 0, несмотря на то, что точность приближенного собственного значения А = 0 матрицы As улучшается. Напомним, что Xi(As) 6 [0,34] и для А = Ai должно выпол- выполняться равенство Vs(^i) = оо для всех достаточно малых 4. Задача 14.1. Вычислить последовательность Штурма из элементов Vk B4) и убедиться в том, что 0 < AiD) < 24. Правило построения составных и двусторонней последовательностей Штурма Опишем прием, с помощью которого можно добиться выполнения ра- равенства Pn(\) — оо, если известно достаточное приближение А собственно- собственного значения AJo. Сначала заметим, что расчет последовательности Pj(A), связанных ра- равенствами (cfc+i = можно вести не в порядке возрастания номеров it, а в порядке их убывания. Именно, положив 'Pjv(A) = оо, находим
Лекция 14 177 Однако теперь даже когда А — очень точное приближение собственного значения AJO у нас нет оснований считать, что полученное в результате вычислений V\ (А) будет удовлетворять требуемому равенству V\ (А) = ^-^ или, что тоже самое, равенству 7>о(А) = 0. Интересующая нас "точная" последовательность Штурма должна удов- удовлетворять равенствам где 1 ^ k ^ N, А яз Xjol bk и bk, ск ю b, dk и dA(fci = cN+l = 1). При реаль- реальных же вычислениях, двигаясь согласно возрастанию номера к, мы нахо- находим величины jPq(X),7>i'(X),.., ,'Р}}_1(Х),'Р^(Х), образующие, так называ- называемую "левостороннюю" последовательность Штурма. Двигаясь от к = N по убыванию номеров к, мы находим элементы "правосторонней" после- последовательности VJf{\) ~ оо, PJv_!(A),... tV^{X),Po{X). При этом, как пра- правило, Pjt(A) Ф оо, Vq(\) ф 0- Этот эффект является следствием влияния неустранимых при реальном расчете погрешностей округления. Ввиду на- наличия таких погрешностей коэффициенты 6*, с*, dk, аппроксимирующие заданные Ьк) dk в соотношениях, связывающих соседние элементы последо- последовательностей Штурма, будут различаться для правосторонней и левосто- левосторонней последовательностей. Чтобы преодолеть указанное затруднение, обратимся к тригономет- тригонометрической параметризации последовательностей Штурма. Каждому элементу V*(\) левосторонней последовательности можно сопоставить угловой параметр <р?{Х). Такие параметры образуют лева- стороннюю последовательность yJ(A) = 0, <pf[X), ^f(A),..., где ?>J(A) = &тсЩ7>?(\)+1(к) л-, 1(к) — число отрицательных элементов среди Vft7>}, ..., 7*jf. Конечно, если А = Aj0, то должно было бы выполняться равенство у)+(А) = (jo + l/2)f- Однако из-за ошибок округления при расчете Р^(А) это равенство выполняться не будет. Практически невозможно также со- сохранить точное равенство А = Aj0. При тригонометрической параметризации левосторонней последова- последовательности Штурма сопоставляются угловые параметры *»n(A) = (io + l/2)wlV^_l(A)I... , vHA), Po W, определяемые при 0 ^ к ^ N — 1по правилу <р^{Х) = arctgT^ + '(А)эг, где [[к) = jo — m(*)i a m(^) — число отрицательных элементов среди Vjl_l, ^iv-2> ••- ^к ¦ Для ЭТОЙ последовательности при А = Aj0 мы должны бы иметь равенство ?>п"(А) = 0, но при реальных вычислениях оно невозможно, как и равенство f%{X) = (jo - 1/2Oг. Иными словами, обе построенные последовательности Штурма, как и их тригонометрические параметризации, не годятся для наших целей. Однако в некоторых случаях из части элементов Т>^ (с параметрами <р^) и части элементов Vk (с параметрами y>J) можно составить "двусторон- "двустороннюю" последовательность Штурма такую, что она будет удовлетворять не только всем требуемым рекуррентным соотношениям с вычислительными
178 Лекция 14 погрешностями допустимого уровня, но и "граничным условиям" Пусть, например, для j0 мы вычислим приближение собственного зна- значения А = AJO и затем рассчитаем левостороннюю и правостороннюю по- последовательности Штурма, параметризуемые угловыми параметрами: 0 = vtWMW*--- >V%W* *>о(А).?>Г(А),--- ><МА) = (jo - 1/2)». Если одновременно y?jj"(A) > 0 и <р%(Х) > (io - 1/2)т или у>о (А) < 0 и VJv(A) < О'о —1/2)тг, то будем строить составную последовательность Штур- Штурма следующим образом. В последовательности разностей первый и последний элементы имеют противоположные знаки. Следова- Следовательно, найдутся два последовательных номера п — 1, п, при которых эле- элементы ^„.^(А) — ?V-i(A) и ^п(А)~^п (А) окажутся разных знаков или одно из них будет нулевым. (При наличии нескольких таких пар п — 1, п мы фиксируем одну из них.) Если у>„(А) = tfnW (хотя эта возможность маловероятна, полезно ее обсудить), то составим последовательность из элементов k<n, На самом деле ?*{А) при расчете компонент собственного вектора не ис- используются. Для расчета нужны Р*(А) = f 7>+(A), к < п, связанные уравнениями A ^ к и такие, что среди Pfc(A) имеется у0 отрицательных чисел. В этих уравне- уравнениях Ьк — \Ьк\) dk — dk, Cfc — \bk\ — достаточно малые величины, которым мож- можно пренебречь. Точность обеспечивается аккуратностью с которой произ- производился расчет левой и правой последовательностей Штурма. Если оказалось, что разности у^.^А) -yC-i{A)> ?>n(A)~^n(A) имеют противоположные знаки, то полагаем
Лекция 14 179 Поясним причину, по которой двусторонняя последовательность Штур- Штурма, образованная из 7>*(А), должна нас удовлетворить. Напомним, что на предыдущей лекции мы ввели специальные функции ш = w{\,b,d,с,7), 7 = f(\,b,c,w) и их использовали в соотношениях для угловых парамет- параметров тригонометрической параметризации последовательностей Штурма. С помощью этих функций можно выписать соотношения Здесь bi,3+,c++J; ^,2-,c^+1 — приближенные значения 6П) dn, cn+1 = 6n+i, участвующие в уравнениях моделирующих (с учетом вычислитель- вычислительных погрешностей) равенства, связывающие элементы вычисленных после- последовательностей Штурма. При этом 6+, <?+, с++1 относятся к левосторонней, а 6~, d~, c^+1 — к правосторонней последовательностям. Предполагается, что где е характеризует точность проведенных вычислений. Оказывается, что из последних неравенств, A4.9), того факта, что разности ft-\ ~ Фп-i и <р+ - <р~ имеют противоположные знаки, вытекает существование^, dj, с° таких, что |ЬЛ+1||<е, A4.10) и при этом <р~ связано с у?+ равенством ^=«(A,4!,3;,^+I)rf_l). A4.11) В результате мы оказываемся в уже знакомой ситуации, когда эле- элемент tp+ из правосторонней последовательности можно внести в левосто- левостороннюю последовательность, заменив 6^", 2?, cj+1 на фиктивные, но допус- допустимые^, 2°, с^+1. После этого последовательности имеют общий элемент Vn = V~ = V% с параметрами у'Й = Vn ¦ ^ак Уже было показано, в качест- качестве двусторонней последовательности из Vk (А) можно взять последователь- последовательность, составленную из V}, V}, ..., Т>+_г, Vn, V~+1) ...,Р^. Обоснование правила Приведем обоснование утверждения о существовании х 6°, dj, c°, связанных равенством A4.10) и достаточно близких к точным |6n|, dn, Ы = \Ьп\ при условии, что ^_2(А) - Vn-i(A) < 0 и у>+(А) - у"(А) > 0. Случай противоположных неравенств рассматривается аналогично.
180Лекция 14 Задача 14.2. Проверьте сформулированное утверждение после изуче- приведенного ниже доказательства. Начнем с построения вспомогательной величины и сравним ее с Так как у>+ > ip~ и j — монотонно возрастающая функция своего послед- последнего аргумента (см. лекцию 13), то Таким образом, Пусть 0 ^ г ^ 1 и /(г) определена формулой /(г) = 7[А, A - т)Ь- + г?+, A - rJ- + rd+, A - т)с^+1 + гс++1)«>-]. Очевидно, что /@) > у>*_! > /A) и существует г = г0, при котором /(г0) = vt-i- Тем самым, опираясь на непрерывность функции y(\,btd,cfuj) и на монотонную зависимость от последнего аргумента, мы доказали сущест- существование при которых выполнено равенство A4.11) и справедливы требуемые оценки A4.10). На этом мы полностью завершили описание (и обоснование) построе- построения "двусторонней" последовательности Штурма из односторонних после- последовательностей для А = Aj0) если у>о (А), <р%(Ь) - {jo - 1/2)я- имели одинако- одинаковые знаки. Если же эти знаки оказались различными, то левостороннюю после- последовательность, образованную из РЦХ), y>J(A), надо перевычислить и за- заменить на "мажорирующую" или "минорирующую" последовательность. Для мажорирующей последовательности <р%(\) — (jo — 1/2)т > 0, а для ми- норирующей — <pji{X) ~ (io - 1/2)тг < 0. Возможность построения таких последовательностей обсуждалась в лекции 13. Какую именно последо- последовательность следует использовать в качестве левосторонней, зависит от величины ^о (А) У вычисленной правосторонней последовательности. Для наших целей надо, чтобы знак величины <р%{Х) - (jo - 1/2)тг был противо- противоположным знаку величины <Ро(\). На этом мы завершаем описание вычислительных процедур расчета с весьма высокой точностью двусторонней последовательности Штурма
Лекция 14 Ш_ ^o(Aj0) = 0, ?V-i(.Xjo)l...17V(Ajo) =00, содержащей в точности jo-l стро- строго отрицательный элемент. (Обычно используемые программные реализа- реализации обеспечивают конечность и отличие от нуля всех 7>*, кроме Vq} Vn) Еще раз подчеркнем, что угловые параметры <у?ь(А) в процессе расчета не определяются. Все заключения о том, в каких интервалах они располага- располагаются, делаются на основании значений ^(А) и числа отрицательных эле- элементов в последовательности этих значений. Отметим также, что можно отказаться от перевычисления одной из последовательностей Штурма, ес- если обе последовательности с самого начала строить мажорирующими (или минориру ющими). Отыскание собственного вектора Завершив расчет двусторонней последовательности Штурма, можно перейти к расчету компонент собственного вектора на основе равенств A4.8). Однако при этом следует проводить умножения, используя специ- специальное программирование "арифметики вынесенных порядков". Для этого каждое число записывается в двух компьютерных ячейках. В первую ячей- ячейку заносится двоичный порядок р(/) этого числа, а во вторую — мантисса m{f) A/2 ^ т(/) < :.), с помощью которых число записывается в виде / = 2рО •>""(/)¦ При 'гаком представлении, за счет использования расши- расширенного диапазона для порядков можно работать с числами очень больши- большими и очень маленькими, не опасаясь аварийных остановов компьютера, а также очень больших компонент и аннулирования очень малых компонент вектора и, которые могут появляться при реализации расчетной схемы, вы- вытекающей из A4.8): uN = I, uk-i = -{sgnbk)Pk-1-uk{l + Sk-iI 2^k^.N. По сравнению с A4.8), эта формула содержит множитель 1 + &-д, чтобы при помощи $к-1 смоделировать погрешность машинного перемножителя. Ясно, что <5*_i оценивается через отношение последнего разряда мантиссы произведения к самой мантиссе, т.е. оценка |?д| < ет полностью определя- определяется числом двоичных разрядов, отводимых под мантиссу. Работая с числами из "арифметики вынесенных порядков", мы долж- должны для их умножения и других арифметических операций запрограмми- запрограммировать специальные процедуры. Такие процедуры бывает удобно приме- применять и при расчете самих последовательностей Штурма 7^ (А), особенно для получения мажорирующих и минорирующих последовательностей. Из формул A4.3), связывающих элементы используемой последовательности Штурма, и правил расчета вытекает, что + (d \) = 0, + (d A)(l + ?) = 0, т.е. рассчитанный вектор и будет собственным не для приближающей А матрицы А из A4.4), а для матрицы, которая от А отличается заменами bk на 6fc/(l + &_i) и ск+х —Ha?A+i(l + 5*). Для этой матрицы также можно
182 Лекция 14 пользоваться оценкой A4.5), несколько изменив оценивающий параметр ел, чтобы учесть влияние й*. Ограничимся здесь этим замечанием без довольно простых, но громоздких оценок. После завершения вычисления всех компонент вектора и в арифме- арифметике вынесенных порядков, вектор и надо нормировать, вычитая из всех порядков p{uk) максимальный из встречающихся, а затем переписать ком- компоненты вектора, используя обычное компьютерное представление чисел. Случается, что при этом некоторые компоненты аннулируются. Мы уви- увидим это на приводимых ниже примерах. После этой предварительной нор- нормировки, возможно, имеет смысл еще раз нормировать вектор так, чтобы его евклидова норма была единичной: Пример Для демонстрация алгоритма бисекций приведем поучительную тес- тестовую задачу. Начнем с описания процедуры построения симметричных трехдиагональных матриц сколь угодно высоких порядков с интересны- интересными свойствами. Это алгоритм Ланцоша (см. задачи Д1.10-Д1.12 в лекции 1) приведения к трехдиагональному виду эрмитовой матрицы оператора L. д2 д2 Пусть L — дискретная модель оператора Лапласа ^-г + -г-=-, действующего охг ду2 на функции и(х,у), определенные в квадрате O^i^ 1,0^ у^ 1 и обра- обращающиеся в нуль на его границе. Эти функции моделируются сеточными функциями итп = u(m/M,n/N), l^m^Af-l, l^n^N — 1. При записи разностного оператора используются нулевые величины ыОп = 0, ыт0 = 0, имп = 0, um/v = 0, которые моделируют граничные условия. Действуя на сеточную функцию итП) оператор L превращает ее в другую сеточную функцию по правилу — Um~1>n ~~ 2цт,п + Ц>п+1,п Цщ,п-1 — 2цт-п + "m.n-f-l Vmn - , 2 + , 2 ах "у hx = I/AT, hy - l/N. Скалярное произведение в (М - 1) х (N - 1)-мерном пространстве ве- вещественных сеточных функций определяется формулой M-1N-1 . M-1N-1 {U,V) - hxhy J2 ^ «m,nVmin = — ]Г J^ Um>nVmin. Нетрудно проверить, что оператор L самосопряжен: {Lu,v) = (u,Lv). Пол- Полная система собственных векторов оператора L состоит из (М — l)x(N — 1) сеточных функций «Йп* = sm(fc7r • mkx) ¦ sm{lv ¦ nky)} l^.k^M-1, l^l^N-1, которым отвечают собственные значения
Таблица 14.2 3 1 2 3 4 5 6 7 8 9 10 11 12 13 И 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 -23.5523912612626 -66.7758483723083 -117.027317836482 -125.815954720822 -125.404290660229 -231.417935503439 -184.78062 И 3334 2 -241.779894750233 -233.926092171511 -236.845460168222 -203.267519383787 -214.559848519119 -229.170351096765 -168.062125082392 -234.675908581938 -224.583525540150 -245.480894955134 -251.095172990599 -160.612888971237 -228.718349562292 -19.8480156522431 -48.9153611148634 -368.936997255644 -86.2024803833331 -330.068838664201 -102.753995906433 -281.951219345855 -160.025465661087 -237.493924771891 -197.959983079234 -224.476371202986 -227.040916204784 -1-96.498780964859 -210.601952335357 -240.639220566244 ¦189.674652807735 -208.568340471483 -190.688840476453 -201.533720136761 -19.5317071391481 -351.889215258956 ¦67.3030966586874 -339.143589620868 -80.8803981890008 -95.8078699833322 -307.416275735750 -143.836668350119 -248.321887867285 -231.792053819844 -248.922357674938 11.2518761582251 41.1550736383142 45.1626926043351 70.3788249284885 77.1490959373847 84.6094560950078 89.5945911244586 70.5147149613043 70.3444470599089 80.7813959633245 87.8260197666887 56.0887928204037 62.4396649997763 44.7363359253106 53.0639376011363 55.2703299930672 24.4657222809472 8.98377925699349 23.3914767119266 0.00000065403613 3.43815763723614 29.4665343061653 15.2585200347004 4G.3603300603838 42.1349979788830 47.4673483265934 53.1194391461019 57.4183657035312 50.2635454237589 32.5819739606680 55.2143375957081 60.6763603402734 22.9535951965067 24.7521015059037 19.5775474346218 41.0027660521595 4.64902323143602 40.4670861286484 4.56792917994936 0.369886987602932 79.4953141957114 0.171536003671107 40.6666262068052 3.16976708893152 48.8437337121806 2.59518835446777 64.3962257657517 4.85146015790172 56.5760328170184 3 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 di -186.637986973379 -182.940586675134 -177.415106687775 -88.1852437579308 -189.554503774144 -357.927332809842 -238.840520362524 -144.679390461742 -74.0522246207286 -235.196156975227 -255.585791224772 -242.241143451096 -73.8312932802615 -184.103259280247 -219.983140520211 -39.3197514671036 -204.400592969643 -181.363570519828 -293.575341333118 -363.328648812085 -210.582148912791 -231.190571147685 -99.6485169748540 -181.413438905817 -162.721066434253 -149.955664061405 -343.136893948458 -239.608912318978 -158.245462281048 -215.123219406933 -93.8027008678840 -43.0360814584680 -218.511896487967 -226.331485584380 -88.2262935717889 -372.476423634604 -286.518158359535 -133.341195235411 -264.016279773669 -60.8810107878161 -310.665247807627 -231.031085774084 -234.697938024599 -202.333225919609 -177.568484019325 -50.8548519317806 -137.653239253267 -178.222956741738 -135.094731233283 -254.870441638385 bi 37.9602972754136 38.0588273319781 43.7806186526732 80.5876202632480 64.1261926299178 2.57573792401604 43.2203850097771 36.3041128336993 49.9289858525686 3.20025554954318 8.92119544859743 95.8605785656765 1.52739666470572 0.559365218671756 114.766508550142 0.145758345878633 51.4338411910751 91.3859669412924 21.6438766963478 9.82638294681189 35.7021578008341 17.6744486240155 49.2106478633923 70.5167189717412 33.0566661948197 22.4591195202828 12.2528094873266 12.4771790243350 10.8255053513075 3.41224330467246 53.2854380073572 2.76852368910379 61.4548110971306 88.3787532542412 15.2776720362772 5.61893741620273 0.325357065762447 54.0988617379578 26.4652318907643 54.4093430684703 3.35942863170844 62.9363303815976 4.24023299191338 24.6417877625980 56.8268790986956 7.83785300323235 60.5277575983671 3.02456905385088 78.9514862887934 14.0747065556323
5
186 Лекция 14 При М = N = 7 (мы рассматриваем только этот случай) вычисленные по этой формуле Xj(A) приведены в табл. 14.1, где они расположены в порядке возрастания (т.е. в порядке убывания их модулей). Отметим, что среди 36 приведенных собственных значений только 19 различных. Задача 14.3. Выяснить причину этого явления. Сколько различных собственных значений окажется при М = N = 10? Процедуру Ланцо'иа построения трехдиагональной матрицы А для опе- оператора L надо начинать с выбора исходной вектор-функции u = umn. Затем ищутся базисные векторы в виде к + a32Lu aPpLpu где коэффициенты подобраны так, чтобы обеспечить ортонормированность этого базиса. Технология, предложенная Ланцошем (см. задачи Д1.10- Д1.12 в лекции 1), выглядит несколько иначе и требует меньшего числа операций. Однако существа дела этот факт не меняет. Она должна приво- приводить к тем же самым (с точностью до знаков ± вследствие произвола их выбора при нормировке) базисным векторам. Имеет место следующий важный для нас факт. Теорема 14.1 Если оператор L — L* имеет только I различных собствен- собственных значений, то линейная оболочка цепочки векторов u, Lu, L2u,..., постро- построенной по произвольному вектору и, не может иметь размерность больше I. • Линейная оболочка из теоремы 14.1 называется пространством Крылова оператора ?, порожденным вектором и. Задача 14.4. Доказать теорему 14.1. В силу теоремы 14.1 для любого начального вектора (т.е. сеточной функции umn) программа расчета элементов трехдиагональной матрицы должна завершиться не более, чем за 19 шагов, и выдать в качестве резуль- результата матрицу, описывающую действие оператора L не во всем 36-мерном пространстве сеточных функций, а только на некотором его подпространст- подпространстве (именно, на пространстве Крылова, порожденном начальным вектором). Взяв в качестве начального вектора сеточную функцию (х = т/7, у = п/7) итя = х2A — х)уA — у2}, мы с удивлением обнаружим, что про- программа, осуществляющая итерационный процесс Ланцоша расчета элемен- элементов трехдиагональной матрицы, не проявляет тенденции завершить свою работу после построения 19-го базисного вектора е<19\ Причина этого — влияние погрешностей округления, из-за которых теорема Ланцоша (зада- (задача Д1.12) становится кеверной, т.е. утверждение о том, что, ортогонали- зируя каждый новый базисный вектор только по отношению к двум пре-
Лекция 14 187 дыдущим, мы добиваемся его ортогональности ко всем предшествующим векторам, оказывается неверным. Мы не будем углубляться в дискуссию, а приведем в качестве иллюстрации пример трехдиагональной 100 х 100- матрицы, полученной описанным способом после 99 итераций. (Заметим, что другие программные реализации этого алгоритма трехдиагонализации так же, как и вычисления на других компьютерах, будут приводить к другим вариантам трехдиагональной матрицы, в чем читатель может убе- убедиться экспериментально.) Построенная матрица имеет несколько групп практически кратных собственных значений, несмотря на теорему о том, что кратность не может наблюдаться у симметричных трехдиагональных матриц, не имеющих нулей на побочной диагонали.1 Предложенное построение взято из нашей с Г. П. Прокоповым работы 1970 г. [Годунов-Прокопов; 1] и подготовлено по моей просьбе для этой книги Э. А. Бибердорф. Двусторонние последовательности Штурма пред- предложены и обоснованы в работе 1985 г. [Годунов-Костин-Митченко; 1], со- содержание которой излагалось в секционном докладе на Математическом конгрессе в Беркли 1986 г. [Годунов; 4]. Аналогичные наблюдения ите- итерационного процесса Ланцоша описал Пейдж [Paige; 1] в 1971 г., который, уделил большое внимание накоплению погрешностей при последовательной ортогонализации. Анализу такого рода явлений и их использованию посвя- посвящены многочисленные работы [Друскин-Книжнерман; 1, 2], [Greenbaum- Druskin-Knizhnerman; 1], [Van der Vorst; 1], [Fernando; 1], [Parlet; 1]. В табл. 14.2 указаны для построенной матрицы А = А" диагональные элементы dj) I ^ j ^ 100, и элементы &,-, 2 ^ ; ^ 100 на побочной диагонали. Собственные значения матрицы А, рассчитанные методом бисекций с погрешностью, не превышающей е = 5 ¦ 10~12, приведены в табл. 14.3. В частности, трехкратное собственное значение A3s = А36 = А37 = -239.614103055438 с выбранной точностью совпадает с точным собствен- собственным значением А<5>3) исходного оператора L. Вычисление собственных векторов, отвечающих этому (практически кратному) собственному зна- значению, производилось с использованием минорирующих и мажорирующих последовательностей Штурма. Мажорантную левостороннюю последовательность у>1 (А) мы постро- им, задав А = А + е и полагая <ру} = 0. График этой последовательности изображен жирной линией на рис. 14.1, на котором номер к элемента ^4 откладывается по оси абсцисс, а величина у>* /ir — по оси ординат. Мажорирующие правосторонние последовательности <рк (ty построе- построены при А = А — е так, что ^(iooI(A) = C5~l/2Or1 C6-1/2)», C7-1/2)*. Они получаются одна из другой сдвигом параллельно оси ординат и изоб- изображены на рис. 14.1 тонкими линиями. 1Если читатель проделал компьютерные эксперименты, рекомендуемые в лек- лекции б после изучения теории дя-алгоритма, то он должен был столкнуться с подобными эффектами.
188 Лекция 14 Двусторонние последовательности ^*(Л) составляются из той части левосторонней мажорирующей последовательности, которая- лежит левее ее точки пересечения с соответствующей правосторонней минорирующей, и из отрезка последней, справа от точки пересечения (см. рис. 14.2). Рис. 14.1 Рис. 14.2
Лекция 14 189 По трем построенным двусторонним последовательностям Штурма были сосчитаны с использованием арифметики вынесенных порядков ком- компоненты собственных векторов, изображенные в логарифмическом масшта- масштабе на рис. 14.3-14.5. Рис. 14.3 Рис. 14.4
190 Лекция 14 Рис. 14.5 В дальнейшем последовательности компонент этих векторов "регуля- ризировались" путем замены нулями компонент, по модулю не превыша- превышающих 10~8. После завершения расчета проверялось, с какой точностью вычисленные векторы удовлетворяют уравнению Av = Ли. Погрешности, установленные во время этой проверки для 35-го, 36-го и 37-го собственных векторов (номер соответствует использованной правосторонней последова- последовательности), приведены в табл. 14.4, для значений ||Ли — Av||/||v|| Таблица 14.4 Номер 35 36 37 до "регуляризации" 5.4. Ю-12 86 -КГ12 3.4 -Ю-13 после "регуляризации" 2.5 Ю-8 1.3 Ю"8 8.4 10"9 При регуляризации с е — 10 8 график 35-го собственного вектора "рассыпается" на независимые части, разделенные несколькими нулевыми компонентами, следующими друг за другом. Каждая из этих частей может претендовать на "звание" графика приближенного собственного вектора. В этом нет ничего удивительного, так как при рассматриваемом кратном А собственных векторов много. Они образуют трехмерное пространство.
Лекция 14191 В настоящее время существуют алгоритмы расчета собственных век- векторов, основанные на сходной идее встречного расчета вспомогательных величин при движении от верхнего левого угла матрицы вниз и от ниж- нижнего правого угла вверх, но без использования арифметики вынесенных порядков (см., например, [Parlet; 1] и [Malyshev; 1]). Следует заметить, что вычисление собственных векторов на основе по- последовательностей Штурма с помощью регуляризации проводилось нами с Г. П. Прокоповым в 1968 г. Тогда мы пользовались односторонними после- последовательностями Штурма, а благодаря регуляризациям мы могли игнори- игнорировать тот факт, что нам не удавалось добиться равенства 7V(A) = со. Мы не решились сообщить об этом приеме в окончательной публикации, так как у нас не было ясного понимания ситуации и гарантий, что использу- используемый прием всегда приводит к цели. Именно во время этих исследований по рекомендации В. С. Штаркмана мы начали использовать "арифметику вынесенных порядков." На мой взгляд, такой арифметике не уделяется должного внимания. С ее помощью, например, можно сконструировать прозрачно обосновываемые процедуры перемножения матриц, приводящие к гарантированной оценке погрешности ||[АВ]вычисленное - [Л?]точное|| < е|И|| • ||В|| с заранее заданным е. В книге [Годунов-Антонов-Кир и люк-Костин; 1] опи- описаны все детали процедур, которым посвящены эта и предыдущая лекции. На мой взгляд, что продумывание фактов, приведенных в этих лекциях, должно быть поучительным и полезным для получения ориентировки в многочисленных неожиданных препятствиях, возникающих при проекти- проектировании вычислительных алгоритмов даже для простейших классических задач линейной алгебры.
Литература Абрамов А. А. [1] О граничных условиях в особой точке линейных обыкновенных диф- дифференциальных уравнений // Журн. вычисл. математики мат. фи- физики. 1971. Т. 11. С. 275-278. [2] О численном решении некоторых алгебраических задач, возникающих в теории устойчивости // Журн. вычисл. математики мат. физики. 1984. Т. 24, № 3. С. 339-347. [3] О переносе граничных условий для систем линейных обыкновенных дифференциальных уравнений (вариант метода прогонки) // Журн. вычисл. математики мат. физики. 1961. Т.1, № 3. С. 542-545. Адамская И. А., Годунов С. К. [1] Метод сферических гармоник в задаче о критических параметрах // Журн. вычисл. математики мат. физики. 1964. Т. 4, № 3. С. 555- 570. Аткннсон Ф. [1] Дискретные и непрерывные граничные задачи. М.: Мир, 1968. Бахвалов Н. С. [1] Численные методы, М.: Физматгиз, 1973. Бнбердорф Э. А., Попова Н. И. [1] Решение линейных систем с гарантированной оценкой точности ре- результатов. I. Новосибирск, 1999. (Препринт/АН СССР. Сиб. отд-ние. Ин-т ядерн. физ.; № 99-49). [2] Решение линейных систем с гарантированной оценкой точности ре- результатов. II. Новосибирск, 2001. (Препринт / АН СССР. Сиб. отд- ние. Ин-т ядерн. физ.; № 2001-21) Булгаков А. Я. [1] Эффективно вычисляемый параметр качества устойчивости систем линейных дифференциальных уравнений с постоянными коэффици- коэффициентами // Сиб. мат. журн. 1980. Т. 21, *й 3. С. 32-41. 193
194 Литература [2] Обоснование гарантированной точности выделения инвариантных под- подпространств несамосопряженных матриц // Тр. Ин-та математики / АН СССР. Сиб. отд-ние. 1989. Т. 15. С. 12-92. Булгаков А. Я., Годунов С. К. [1] Круговая дихотомия матричного спектра // Сиб. мат. журн. 1988. Т. 29, № 5. С 59-70. Гантмахер Ф. Р. [1] Теория матриц. М.: Наука, 1988. Гантмахер Ф. Р., Крейн М. Г. [1] Осцилляционные матрицы и ядра и малые колебания механических систем. М.: Гостехиздат, 1956. Годунов С. К. [1] О численном решении краевых задач для систем линейных обыкно- обыкновенных дифференциальных уравнений // Успехи мат. наук. 1961. Вып. 3. С. 171-173. [2] Уравнения математической физики. М.: Наука, 1979. [3] Задача о дихотомии спектра матрицы//Сиб. мат. журн. 1986. Т. 27, № 5. С. 24-37. [4] Проблемы гарантированной точности в численных методах линейной алгебры / Proc. of the International Congress of Mathematicians, 1986: August 3-11, 1986, Berkeley. California. V. 2. P. 1353-1361. [5] Spectral portaits of matrices and criteria of spectral dichotomy. J. Herrber- ger and L. Atanasovaeds. Proc. Cont. Oldenburg, Germany (Oct., 1991) North-Holland and JMACS. 1991. 8 p. [6] Современные аспекты линейной алгебры. Новосибирск: Научная кни- книга (ЙДМИ), 1998 [English transl.: S. К. Godunov, Modern Aspects of Linear Algebra, Translations of Math. Monographs, Vol. 175, Providence RI: Amer. Math. Soc, 1998.] Годунов С. К., Антонов А. Г., Бирилюк О. П., Костив В. И. [1] Гарантированная точность решения систем линейных уравнений в ев- евклидовых пространствах. Новосибирск: Наука, 1992. Годунов С. Б., Гордиенко В. Т. [1] Хаусдорфовы множества матриц и оценка угла между инвариантны- инвариантными подпространствами // Сиб. мат. журн. 1995. Т. 36, N 3. С. 531-533. Годунов С. К., Кирилюк О. П., Костин В. И. [1] Спектральные портреты матриц. Новосибирск, 1990. (Препринт / АН СССР. Сиб. отд-ние. Ин-т математики; № 3).
Литература J95 Годунов С. К., Бостин В. И, Митченко А. Д. [1] Вычисление собственного вектора симметрической трехдиагональной матрицы // Сиб. мат. журн. 1985. Т. 26, № 5. С. 71-85. Годунов С. К., Кузнецов С. В. [1] Оценки сходимости ортогонально-степенного метода // Тр. Ин-та ма- математики / РАН. Сиб. отд-ние. 1994. Т. 26. С. 20-41. Годунов С. К., Нечепуренко Ю. М. [1] О кольцевом расслоении матричного спектра // Журн. вычисл. ма- математики мат. физики. 2000. Т. 40, № 7. С. 980-985. Годунов С. К., Проколов Г. П. [1] Применение метода минимальных итераций для вычисления собст- собственных значений эллиптических операторов // Журн. вычисл. мате- математики мат. физики. 1970. Т. 10, № 5. С. 1180-1190. Годунов С. К., Рябенький В. С. [1] Введение в теорию разностных схем. М.: Физматгиз, 1962. [2] Спектральные признаки устойчивости краевых задач для несамосо- несамосопряженных разностных уравнений // Успехи мат. наук. 1963. Т. 18, вып. 3. С. 3-14. Голуб Дж., Ван Лоун Ч. [1] Матричные вычисления. М.: Мир, 1999. Гохберг И. Ц., Крейн М. Г. [1] Введение в теорию линейных несамосопряженных операторов. М.: Наука, 1965. Далецкий Ю. Л., Крейн М. Г. [1] Устойчивость решений дифференциальных уравнений в банаховом про- пространстве. М.: Наука, 1970. Друскин В. Л., Книжперман Л. А. [1] Два полиномаильных метода вычисления функций от симметричных матриц // Журн. вычисл. математики мат. физики. 1989. Т. 29, № 12. С. 1763-1775. [2] Оценки ошибок в простом процессе Ланцоша при вычислении функций от симметричных матриц и собственных значений // Журн. вычисл. математики мат. физики. 1991. Т. 31, № 7. С. 970-983. Келдыш М. В. [1] О собственных значениях и собственных функциях некоторых классов несамосопряженных уравнений // Докл. АН СССР. 1951. Т. 77, № 1. С. 11-14.
196 Литература Келдыш М. В., Лидский В. Б. [1] Вопросы спектральной теории несамосопряженных операторов. Тру- Труды Четвертого Всесоюзного математического съезда. 1963. Т. 1. С. 101-120. Кублановская В. Н. [1] О некоторых алгоритмах для решения полной проблемы собственных значений // Журн. вычисл. математики мат. физики. 1961. Т. 1, № 4. С. 555-570. Курант Р., Фридрихе К., Леви Г.1 [1] О разностных уравнениях математической физики//Успехи мат. на- наук. 1941. Т. 8. Курош А. Р. [1] Курс высшей алгебры. М.-Л.: Гостехиздат, 1975. Левин Б. Я. [1] Распределение корней целых функций. М.: ГТТИ, 1956. Лидский В. Б. [1] О суммируемости рядов по главным векторам несамосопряженных операторов//Тр. Моск. мат. о-ва. 1962. Т. 11. С. 3-35. Ляпунов А. М.2 [1] Общая задача об устойчивости движения/ Классики естествознания. М.-Л.: ГТТИ, 1950. Малышев А. Н. [1] Гарантированная точность в спектральных задачах линейной алгеб- алгебры // Тр. Ин-та математики / АН СССР. Сиб. отд-ние. 1990. Т. 17. С. 19-104. [2] 3 Введение в вычислительную линейную алгебру. Новосибирск: На- Наука, 1991. [3] Parallel algorithm for solving some spectral problems // Linear Algebra Appl. 1993. Vol. 188/189. P. 489-520. Маркушевич А. И. [1] Теория аналитических функций. М.: Наука, 1967. •Перевод на русский язык статьи 1928 г. 2Это докторская диссертация А. М. Ляпунова, опубликованная впервые Харьков- Харьковским мат. обществом в 1892. 3См. также в этой книге: Дополнение. С. К. Годунов. Гарантированная точность в несимметричных спектральных задачах.
Литература 197 Мнтченко А. Д. [1] Алгоритмы исчерпывания трехдиагональных симметрических и двух- диагональных матриц. Новосибирск, 1984. (Препринт / АН СССР. Сиб. отд-ние. Ин-т математики; Л° 59). Ю. М. Нечепурепко [1] Об оценке нормы матричной экспоненты // Докл. РАН. 2001. Т. 377, N 5. С. 597-600. [2] Новая оценка нормы матрицы Грина // Докл. РАН. 2001. Т. 378, N 4. С. 450-451. Рябенький В. С. [1] Оператор граничного проектирования // Докл. АН СССР. 1969. Т. 185, N 3. С. 521-523. [2] Об устойчивости итерационных алгоритмов решения несамосопряжен- несамосопряженных разностных уравнений // Докл. АН СССР. 1979. Т. 193, N 3. С. 540-542. Сарыбеков Р. А. [1] Экстремальные квадратичные функции Ляпунова систем уравнений второго порядка /// Сиб. мат. журн. 1977. Т. 10. №5. С. 1159-1167. Унлксон Дж. [1] Алгебраическая проблема собственных значений. М.: Наука, 1970. Хаусхолдер А. С. [1] Основы численного анализа. М.: ИЛ, 1956. Barth W. Martin R. S., and Wilkinson J. H. [1] Calculation of the Eigenvalues of a symmetric tridiagonal matrix by the method of bisection // Numer. Mathematik. 1967. Bd. 9, H. 5. S. 386- 393. Davison ?. I. and Man F. T. [1] The numerical solution of A"Q + QA = -C, IEEE, Trans. Automatic Control. AC-13 A968), P. 448-449. FanK. [1] Maximum Properties and Inequalities in the Space of Matrices. Proc. AMS. 1951. Vol. 6. P. 111-116. Fernando K. V. [1] Accurate BABE Factorization of TVidiagonal Matrices for eigenproblems // Technical Report TR5/95 NAG Ltd. U.K. 1996.
198 Литература Francis J. G. F. [1] The QR-transformation. The unitary analogue to the QR-transforma- tion // Comput. J. Part I: 1961. V. 4. P. 265-271. Part II: 1961. V. 4. P. 332-345. Gallestey E. [1] Computing spectral value sets using the subharmonicity of the norm of rational matrices // BIT. 1998. Vol. 38, N.I. P. 22-33. Girens W. [1] A method of computing eigenvalues and eigenvectors suggested by classical results on symmetric matrices // Appl. Math. Ser. Nat. Bur. 1953. Vol. 29. P. 117-122. [2] Numerical computation of the characteristic values of a real symmetric matrix // USA ORNL. No. 1574. Godnnov S. K. and Bulgakov A. I. [1] Difficultes calcularives dans le probleme de Hurwitz et Methodes a les surmonter (Aspect calculatif du probleme de Hurwitz) // Lect. Notes Control Information Sci. 1982. Vol. 44 P. 845-857. Godunor S. K. and Sadkane M. [1] Some new algorithms for the spectral dichotomy methods // Linear Algebra Appl. 2003. Vol. 358. P. 173-194. Greenbaum A, Druskin V. Ь., and Knizhnerman L. A. [1] On solving indefinite symmetric linear systems by means of the Lanczos method // Журн. вычисл. математики мат. физики. 1999. Т. 39, № 3. С. 371-377. HausdorffF. [1] Das Wertvorrat einer Bilinearform // Math. Z. 1919. Bd 3. S. 314-316. Horn R. A. and Johnson Ch. R. [1] Topics in Matrix Analysis. Cambridge: Cambridge University Press, 1994. Laaczos C. [1] An iteration method for the solution of the eigenvalue problem of linear differential and integral operators // J. Res Nam Bur Stand. 1950. Vol. 145, No. 4. P. 255-282. Lavallee P. F. and Sadkane M. [1] Pseudospectra of linear matrix pencils by block diagonalization // Comput. 1998. Vol. 60B). P. 133-156.
Литература 199 Malyshev A. [1] Deflation of symmetric tridiagonal matrices. In: Commun. IWASEP3. Hagen, 2000. Paige С. С. [1] The computation of eigenvalues and eigenvectors of very large sparse matrices. Ph.D. Thesis, London, Univ. of London, 1971. [2] Accuracy and effectiveness of the Lanczos algorithm for the symmetric eigenproblem // Linear Algebra Appl. 1980. Vol. 34. P. 235-258. Parlet B. N. [1] Fernando's solution to Wilkinson's problem. An application of double factorization // Linear Algebra Appl. 1997. Vol. 267. P. 247-279. Reddy S. С and Trefethea L. N. [1] Lax-stability of fully discrete spectral methods via stability regions and pseudo-eigenvalues // Сотр. Meth. Appl. Mech. Engr. 1990. Vol. 80. P. 147-164. Richtmyer R. D. and Morton K. W. [1] Difference Methods for Initial-Value Problems. 2nd ed. Interscience Publishers, 1967. Roberts J- D. [1] Linear model reduction and solution of the algebraic Riccati equation by use of the sign-function // Int. J. Control. 1980. V. 32, N 4. P. 677-687. Sturm С [1] Sur une classe d'equations a differences partielles // J. Math. Pures Appl. 1836. Vol. 1. P. 373-444. Tisseur F. and Higham N. J. [1] Structured Pseudospectra for Polynomial Eigenvalue Problems, with Applications // SIAM J. Matrix Anal. Appl. 2001. Vol. 23A), P. 187- 208. ToepUtz 0. [1] Das algebraishe Analogen zu einem Satze von Fejer // Math. Z. 1918. Bd 2. S.187-197. Trefethen I. N. [1] Approximation Theory and Numerical Linear Algebra, Algorithms for PPEOZIMrion И. London; Chapman and Hall, 1990. [2] Pseudospectra of matrices. In: D.F.Griffits and G.A.Watson eds. Numeri- Numerical Analysis. 1991. Longman Sci. Tech. Publ. 1992. P. 234-266.
200 Литература [3] Pseudospectra of linear operators // SIAM Review. 1997. Vol. 39. P. 383-406. [4] Computation of pseudospectra // Acta Numerica. 1999. Vol. 8. P. 247- 295. Van der Vorst H. A. [1] An iterative solution method for solving f{A)x = g, using Krylov subspace information obtained for the symmetric positive definite matrix A f j J. Comput. Appl. Math. 1987. Vol. 18, No 2. P. 249-263. Veselic K. [1] Bounds for exponentially stable semigroups. Hagen, Fernuniversetat, 2001. (Preprint).
Предметный указатель Ляпунова функция 100 Алахвердиева принцип Аппроксимация — слабая В Вариационный принцип — Алахвердиева — Вебера — Рэлея — Куранта — Фишера Вебера — Рэлея принцип ВеЙля неравенства Г Гурвица критерий Д Дихотомия спектра К Клеточная диагонализация Куранта — Фишера принцип Л Ляпунова теорема 33, 34, Ляпунова уравнение — дискретное — матричное 137 141 137 13 122 13 127 31 47 67 122 100 35 31 М Матрица — союзная — неотрицательно определенная — нильпотентная — положительно определенная — самосопряженная — сопряженная — эрмитова Матричная экспонента Метод — бисекций — ортогонально-степенной Н Норма 0 Оператор — нормальный — секториальный — унитарный П Проектор — инвариантный — ортогональный 48 14 41 14 6 5 9 32 168 73 19 154 112 5 41 44 43 201
Предметный указатель 202 Расслоение спектра Резольвента Рэлея отношение Свойство перемежаемости Сильвестра уравнение Сингулярное разложение Сингулярное число Собственное значение Спектральный портрет 155 46 13 167 21 17 17 3 95 Шура теорема ц Цепочка — двумерных вращений Э Эрмитовы окаймления е-спектр фЯ-разложение 11 115 91 12 Теоремы о перемежаемости 119 Ф Функция — логарифмически субгармоническая 54 Характеристическое число 3 Хаусдорфа теорема 109 Хаусдорфово множество 107 Число — обусловленности 151 — сингулярное 17 — характеристическое 3 Ш Штурма последовательность 165 Штурма теорема 167
Научное издание академик Сергей Константинович Годунов ЛЕКЦИИ ПО СОВРЕМЕННЫМ АСПЕКТАМ ЛИНЕЙНОЙ АЛГЕБРЫ Серия учебных изданий для ВУЗов "Университетская серия" допущена к производству, поставке, реализации, использованию на территории Российской Федерации согласно гигиеническому заключению Министерства здравоохранения РФ № 54.НЦ.02.953.П.043.04.99 от 28.04.99 Издание подготовлено в A/^& с использованием кириллических шрифтов семейства RF6 Дважды лауреат МАЛОЙ ЗОЛОТОЙ МЕДАЛИ Сибирской ярмарки "КНИГА СИБИРИ - 97" и "КНИГА СИБИРИ - 98" НАУЧНАЯ КНИГА издательское подразделение Института дискретной математики и информатики Министерства образования РФ Заведующий чл.-корр. РАН С. С. Гончаров Главный редактор к.ф.-м.н. Т. Н. Рожковская обложка Н. А. Рожкоеская Подписано в печать 21 ноября 2002 г. Формат 70x100 Vie- Печать офсетная. Бумага для печати высокохудожественных изданий офсетным способом. Усл. печ. л. 24. Уч.-изд. л. 23,5. Заказ 01. Лицензия ЛР jNq 020853 от 31.01.99 г. ИДМИ, 630090, г. Новосибирск, а/я 48 Отпечатано по заказу ИДМИ ГП Новосибирский полиграфкомбинат, 630007. г. Новосибирск, Красный пр., 22