/
Автор: Самарский А.А. Гулин А.В.
Теги: вычислительная математика численный анализ математика
ISBN: 5-02-013996-3
Год: 1989
Текст
А. А. Самарский, А. В. Гулин ЧИСЛЕННЫЕ МЕТОДЫ Допущено Государственным комитетом СССР по народному образованию в качестве учебного пособия для студентов вузов, обучающихся по специальности «Прикладная математика» МОСКВА «НАУКА» ГЛАВНАЯ РЕДАКЦИЯ ФИЗИКО-МАТЕМАТИЧЕСКОЙ ЛИТЕРАТУРЫ 1989
ББК 22.19 С17 УДК 519.6 @75.8) Самарский А. А., Гулин А. В. Численные методы: Учеб. пособие для вузов.—М.: Наука. Гл. ред. физ-мат. лит., 1989.—432 с—ISBN 5-02-013996-3. Излагаются основные принципы построения и исследования численных мето- методов решения на ЭВМ различных классов математических задач. Наряду с тра- традиционными разделами, такими как интерполирование, численное интегрирование, методы решения задачи Коши для обыкновенных дифференциальных уравнений, большое место в книге занимают разностные методы для уравнений в частных производных и итерационные методы решения сеточных уравнений. Для студентов, обучающихся по специальности «Прикладная математика» и «Физика», а также для широкого круга специалистов, применяющих ЭВМ для научных расчетов. Табл. 2. Ил. 16. Библиогр. 46 назв. Рецензент доктор физико-математических наук А. А. Абрамов 1602120000—045 С 52-89 ^ 053@2)-89 © Издательство «Наука». Главная редакция физико-математической литературы, 1989 ISBN 5-02-013996-3
ОГЛАВЛЕНИЕ Предисловие 8 ЧАСТЬ I ВВЕДЕНИЕ В ЧИСЛЕННЫЕ МЕТОДЫ § 1. Математическое моделирование и вычислительный эксперимент . . 11 1. Схема вычислительного эксперимента (II). 2. Вычислительный алгоритм A2). 3. Требования к вычислительным методам A4). § 2. Погрешности округления 16 1. Представление вещественных чисел в ЭВМ A6). 2. Округление чисел в ЭВМ A7). 3. Накопление погрешностей округления A9). 4. Разностные уравнения пер- первого порядка B0). 5. Оценки погрешностей округления B2). § 3. Разностные уравнения второго порядка 25 1. Задача Коши и краевые задачи для разностных уравнений B5). 2. Однород- Однородное разностное уравнение второго порядка с постоянными коэффициентами B6). 3. Однородное разностное уравнение второго порядка с переменными коэф- коэффициентами B8). 4. Неоднородное разностное уравнение второго порядка C1). § 4. Разностная аппроксимация дифференциальных уравнений ... 34 1. Сетки и сеточные функции C4). 2. Разностная краевая задача C5). 3. Не- Некоторые разностные тождества C8). 4. Разностная задача на собственные зна- значения C9). 5. Свойства собственных значений и собственных функций D1). 6. Разрешимость и сходимость разностной задачи A3). 7. Метод прогонки D5). ЧАСТЬ И ЧИСЛЕННЫЕ МЕТОДЫ АЛГЕБРЫ И АНАЛИЗА Глава 1. Прямые методы решения систем линейных алгебраических урав- уравнений 48 § 1. Метод Гаусса численного решения систем линейных алгебраических уравнений 49 1. Основная идея методч D9). 2. Расчетные формулы E1). 3. Подсчет числа действий E3). § 2. Условия применимости метода Гаусса 54 1. Связь метода Гаусса с разложением матрицы на множители E4). 2. Теорема об LU-разложении E5). 3. Элементарные треугольные матрицы E8). § 3. Метод Гаусса с выбором главного элемента 60 1. Основная идея метода F0). 2. Матрицы перестановок F1). 3. Пример F2). 4. Общий вывод F5). 5. Доказательство теоремы 1 F6). 6. Вычисление опреде- определителя F7). § 4. Обращение матрицы 68 § 5. Метод квадратного корня 69 1. Факторизация эрмитовой матрицы F9). 2. Пример G0). 3. Общие расчетные формулы G1). 4. Подсчет числа действий G2). § 6. Обусловленность систем линейных алгебраических уравнений . . 74 1. Устойчивость системы линейных алгебраических уравнений G4). 2. Число обусловленности G6). 3. Полная оценка относительной погрешности G7). 4. Влияние погрешностей округления при решении систем линейных алгебраи- алгебраических уравнений методом Гаусса G9). 1* 3
Глава 2. Итерационные методы решения систем линейных алгебраиче- алгебраических уравнений 82 § 1. Примеры и канонический вид итерационных методов решения систем линейных алгебраических уравнений 82 1. Итерационные методы Якоби и Зейделя (82). 2. Матричная запись методов Якоби и Зейделя (83). 3. Каноническая форма одношаговых итерационных ме- методов (84) § 2. Исследование сходимости итерационных методов 86 § 3. Необходимое и достаточное условие сходимости стационарных итера- итерационных методов 90 1. Введение (90). 2. Норма матрицы (91). 3. Теорема о сходимости итерацион- итерационного метода (92). 4. Продолжение доказательства (93). § 4. Оценки скорости сходимости стационарных итерационных методов . 95 1. Скорость сходимости итерационного метода (95). 2. Оценки скорости сходи- сходимости в случае симметричных матриц А и В (96). 3. Правила действий с мат- матричными неравенствами (98). 4- Доказательство теоремы 1 A00) . 5. Оценка по- погрешности в случае несимметричной матрицы В A02). § 5. Многочлены Чебышева 103 I. Многочлен Чебышева на отрезке [—I, 1] A03). 2. Случай произвольного отрез- отрезка A05). 3. Другая нормировка многочленов Чебышева A06). 4. Примеры при- применения многочленов Чебышева A07). § 6. Итерационные методы с чебышевским набором параметров . . . 10i 1. Явный итерационный метод A09). 2. Численная устойчивость итерационного метода с чебышевским набором параметров A12). 3. Неявный чебышевскнй итерационный метод A13). 4. Случай, когда точные границы спектра неизвестны <1Н) § 7. Итерационные методы вариационного тииа 115 1. Метод минимальных невязок A16). 2. Метод минимальных поправок A18). 3. Метод скорейшего спуска A19). 4. Метод сопряженных градиентов A20). 5. Минимизация погрешности A21). 6. Выбор итерационных параметров в методе сопряженных градиентов A22). 7. Оценка погрешности в методе сопряженных градиентов A26). Глава 3. Интерполирование и приближение функций 127 § 1. Интерполирование алгебраическими многочленами 127 !. Интерполяционная формула Лагранжа A27). 1. Интерполяционная формупа Ньютона A29). § 2. Погрешность интерполирования 132 1. Остаточный член интерполяционной формулы A32). 2. Оптимальный выбор узлов интерполирования A34). 3. О сходимости интерполяционного процесса A34). § 3. Интерполирование с кратными узлами 136 1. Интерполяционный многочлен Эрмита A36). 2. Пример A38). § 4. Интерполирование сплайнами 140 1. Построение кубического сплайна A41). 2. Сходимость процесса интерполиро- интерполирования кубическими сплайнами A43). § 5. Другие постановки задач интерполирования и приближения функции 148 1. Примеры A48). 2. Общая постановка задачи интерполирования A51). 3. Наи- Наилучшее приближение функции, заданной таблично A52) . 4 . Сглаживание сеточ- сеточных функций A54). § 6. Наилучшие приближения в гильбертовом пространстве .... 156 1. Постановка задачи A56). 2. Сведение к алгебраической задаче о минимуме квадратичного функционала A57). 3. Следствия A59). Глава 4. Численное интегрирование и дифференцирование . . . 161 § 1. Примеры формул численного интегрирования 161 1. Введение A61). 2. Формула прямоугольников A62). 3- Формула трапеций A64). 4. Формула Симпсона A65). 5. Апостериорная оценка погрешности мето- методом Рунге. Автоматический выбор шага интегрирования A68). 6. Экстраполяция Ричардсона A69). § 2. Квадратурные формулы интерполяционного типа ...... 172 1. Вывод формул A72). 2. Оценка погрешности A74). 3. Симметричные форму- формулы A75). 4. Формулы Ньютона — Котеса. Численная устойчивость квадратурных формул A78). § 3. Метод Гаусса вычисления определенных интегралов 180 1. Постановка задачи A80). 2. Основная теорема A81). 3. Существование и единственность квадратурных формул наивысшей алгебраической степени точ- точности A83). 4- Свойства квадратурных формул Гаусса A84) . 5 . Частный ciy- чай формул Гаусса A85).
§ 4. Численное дифференцирование 186 1. Некорректность операции численного дифференцирования A86). 2. Примене- Применение интерполирования A88). Глава 5. Решение нелинейных уравнений и систем уравнений . . . 190 § 1. Примеры итерационных методов решения нелинейных уравнений . 190 1. Введение A90). 2. Метод простой итерации A91). 3. Метод Ньютона A93). 4. Метод секущих A94). 5. Интерполяционные методы A94). 6. Использование обратной интерполяции A95). § 2. Сходимость метода простой итерации 195 1. Теорема о сходимости A95). 2. Метод Эйткена ускорения сходимости A98). § 3. Сходимость метода Ньютона 199 1. Простой вещественный корень A99). 2. Кратные корни B02). 3. Односторон- Односторонние приближения B03). 4. Комплексный корень B05). § 4. Итерационные методы для систем нелинейных уравнений . . . 207 1. Общие понятия B07). 2. Сходимость стационарного метода B08). 3. Примеры итерационных методов B03). Глава 6. Численные методы решения задачи Коши для обыкновенных дифференциальных уравнений 214 § 1. Исходная задача и примеры численных методов ее решения . . 214 1. Постановка исходной задачи B14). 2. Примеры численных методов B14). § 2. Методы Рунге—Кутта 218 1. Общая формулировка методов. Семейство методов второго порядка B18). 2. Доказательство сходимости B21). 3. Методы третьего порядка точности B24). 4. Методы четвертого порядка точности B26). § 3. Многошаговые разностные методы 230 1. Формулировка методов B30). 2. Погрешность аппроксимации многошаговых методов B31). 3. Устойчивость и сходимость разностных методов B33). 4. При- Примеры многошаговых разностных методов B35). § 4. Сходимость и оценка погрешности многошагового разностного метода 236 I. Уравнение для погрешности B36). 2. Однородное разностное уравнение с по- постоянными коэффициентами. Частные решения B38). 3. Однородное разностное уравнение с постоянными коэффициентами. Устойчивость по начальным дан- данным B40). 4. Оценка решения неоднородного уравнения B13). 5. Оценки по- погрешности разностного метода B44). § 5. Численное интегрирование жестких систем обыкновенных дифференци- дифференциальных уравнении 247 1. Условно устойчивые и абсолютно устойчивые разностные методы B47). 2. Понятие жесткой системы дифференциальных уравнений B49). 3. Нелиней- Нелинейные системы дифференциальных уравнений B51). 4. Специальные определения устойчивости B52). 5. Чисто неявные разностные методы B55). ЧАСТЬ III РАЗНОСТНЫЕ МЕТОДЫ РЕШЕНИЯ ЗАДАЧ МАТЕМАТИЧЕСКОЙ ФИЗИКИ Глава 1. Вводные понятия 259 § 1. Примеры разностных аппроксимаций 259 § 2. Построение разностных схем интегро-интерполяционным методом . 262 1. Построение разностной схемы B62). § 3. Исследование аппроксимации и сходимости 265 I. Аппроксимация дифференциального уравнения B65). 2. Аппроксимация гра- граничного условия B67). 3. Уравнение для погрешности B68) .4. Разностные тож - дества и неравенства B69). 5. Доказательство сходимости B70). § 4. Разностные схемы для уравнения теплопроводности 272 1. Исходная задача B72). 2. Явная схема B72). 3. Неявные схемы B76). 4. Уравнения с переменными коэффициентами и нелинейные уравнения B79). § 5. Трехслойные разностные схемы 283 1. Разностные схемы для уравнения колебаний B83). 2. Трехслойные схемы для уравнения теплопроводности B85). § 6. Основные понятия теории разностных схем: аппроксимация, сходи- сходимость, устойчивость 286 1. Введение B86). 2. Погрешность аппроксимации и погрешность схемы B87). 3. Корректность разностной схемы. Сходимость. Связь между устойчивостью и сходимостью B90).
Глава 2. Принцип максимума для разностных схем 291 § 1. Разностная аппроксимация задачи Дирихле для уравнения Пуассона 291 1. Постановка разностной задачи B91). 2. Канонический вид разностного урав- уравнения B92). § 2. Принцип максимума для разностных схем. Основные теоремы . . 294 1. Исходные предположения B94). 2. Принцип максимума и его следствия B95). 3. Теорема сравнения. Устойчивость по граничным условиям B98). 4. Приме- Примеры B99). § 3. Доказательство устойчивости и сходимости разностной задачи Дирих- Дирихле для уравнения Пуассона 300 1. Устойчивость по граничным условиям C00). 2. Устойчивость по правой части и сходимость C02). § 4. Примеры применения принципа максимума 304 § 5. Монотонные разностные схемы для уравнений второго порядка, содер- содержащих первые производные 308 Глава 3. Метод разделения переменных 310 § 1. Разностная задача на собственные значения 311 1. Оператор второй разностной производной C11). 2. Задача на собственные зна- значения C12). 3. Свойства собственных значений и собственных функций C13). 4. Операторные неравенства C15). § 2. Задача на собственные значения для пятиточечного разностного опе- оператора Лапласа 317 1. Самосоиряженность C17). 2. Оценка собственных чисел. Положительность оператора C18). § 3. Исследование устойчивости и сходимости схемы с весами для урав- уравнения теплопроводности 320 1. Исходная задача и разностная схема C20). 2. Устойчивость схемы по началь- начальным данным C22). 3. Устойчивость по правой части и сходимость C24). 4. Схе- Схема с весами для двумерного уравнения теплопроводности C26). 5. Асимптотиче- Асимптотическая устойчивость C28). § 4. Решение разностного уравнения второго порядка методом Фурье . 332 § 5. Быстрое дискретное преобразование Фурье 334 § 6. Решение разностного уравнения Пуассона с использованием быстрого преобразования Фурье 337 Глава 4. Теория устойчивости разностных схем 339 § 1. Разностные схемы как операторные уравнения 339 1. Представление разностных схем в виде операторных уравнений C39). 2. Кор- Корректность операторных уравнений C42). 3. Операторы первой разностной произ- производной C47). § 2. Каноничг-ский вид и условия устойчивости двуслойных разностных схем 349 1. Канонический вид двуслойных разностных схем C49). 2. Устойчивость раз- разностных схем C51), 3. Теоремы об устойчивости по начальным данным C54). 4. Несамосопряженные разностные схемы C59). § 3. Канонический вид и условия устойчивости трехслойных разностных схем 362 1. Канонический вид C62). 2. Эквивалентность трехслойной схемы двуслойной C63). 3. Устойчивость по начальным данным C64). 4. Примеры C66). § 4. Об экономичных методах решения многомерных нестационарных задач математической физики 369 1. Недостатки обычных разностных методов C69). 2. Пример метода перемен- переменных направлений C72). 3. Абсолютная устойчивость продольно-поперечной схе- схемы C73). I. Понятие суммарной аппроксимации C76). Глава 5. Прямые и итерационные методы решения сеточных уравнений 378 § 1. Модельная задача 378 1. Введение C78). 2. Модельная задача C79). 3. Применение методов Якоби и Зейделя C81). 4. Метод верхней релаксации C84). § 2. Применение явного итерационного метода с оптимальным набором параметров 389 1. Явный итерационный метод с чебышевскими параметрами C89). 2. Приме- Применение к модельной задаче C90). 3. Применение чебышевского метода к разно- разностным аппроксимациям уравнений эллиптического типа C91).
§ 3. Попеременно-треугольный итерационный метод 394 1. Алгебраическая теория C94). 2. Применение к модельной задаче C98). 3. По- Попеременно-треугольный метод с чебышевскими итерационными параметрами D01). 4. Модифицированный попеременно-треугольный итерационный метод D02). § 4. Итерационный метод переменных направлений 404 1. Формулировка метода и исследование сходимости D04). 2. Пример D06). 3. Случай прямоугольной области D08). § 5. Метод матричной прогонки 411 1. Введение D11). 2. Запись разностного уравнения Пуассона в виде системы векторных уравнений D12). 3. Алгоритм матричной прогонки D14). 4. Устойчи- Устойчивость матричной прогонки D15). § 6. Метод редукции 418 1. Вывод основных формул D18). 2. Обращение матриц D21), 3. Вычисление правых частей D23). 4. Формулировка и обсуждение алгоритма D24). Список литературы .... . 426 Предметный указатель 428
ПРЕДИСЛОВИЕ В книге излагаются основы численных методов решения задач алгебры, анализа, обыкновенных дифференциальных уравнений и уравнений математической физики. Книга предназначена для сту- студентов вузов, специализирующихся в области прикладной мате- математики. Она может оказаться полезной также студентам других специальностей, желающим получить представление о методах ре- решения математических задач с помощью ЭВМ. Книга основана на курсе лекций, который читался в течение ряда лет студентам фа- факультета вычислительной математики и кибернетики Московского университета. В курсах численных методов изучаются вопросы построения, применения и теоретического обоснования алгоритмов приближен- приближенного решения различных классов математических задач. В настоя- настоящее время большинство вычислительных алгоритмов ориентирова- ориентировано на использование быстродействующих ЭВМ, что существенно влияет на отбор учебного материала и на характер его изложения. Следует отметить некоторые особенности предмета численных ме- методов. Во-первых, для численных методов характерна множествен- множественность, т. е. возможность решить одну и ту же задачу различными методами. Во-вторых, вновь возникающие естественно-научные за- задачи и быстрое развитие вычислительной техники вынуждают пе- переоценивать значение существующих алгоритмов и приводят к со- созданию новых. Перечисленные особенности предмета, его обшир- обширность и неоднородность делают иллюзорной попытку изложить предмет «во всей полноте и строгости». По. гаму авторы настоящей книги поставили перед собой задачу собрать минимальный мате- материал, достаточный для дальнейшей работы выпускников вузов в области применения и создания вычислительных методов. Вычислительный алгоритм естественно рассматривать как не- необходимую составную часть вычислительного эксперимента — эффективного метода решения крупных естественно-научных и на- народнохозяйственных задач. С этих позиций и ведется изложение численных методов в данной книге. Рассматриваются только те
методы, которые выдержали испытание практикой и применяются для решения реальных задач. Наибольшее внимание уделяется фундаментальным разделам численных методов — численному ре- решению систем линейных алгебраических уравнений и разностным методам решения задач математической физики. В то же время авторы сознают, что многие интересные и важные методы изложе- изложены недостаточно полно или совсем не вошли в книгу. За рамками книги остались такие этапы вычислительного эксперимента, как построение математической модели, программирование и органи- организация вычислений. В тех случаях, когда подробное изложение чис- численного метода оказывалось слишком громоздким, содержало мно- много выкладок или опиралось на труднодоступный студентам мате- математический аппарат, авторы предпочитали ограничиться харак- характерными примерами. Книга состоит из трех частей. Часть I является вводной, в ней дается представление о месте численных методов в общем процес- процессе математического моделирования и вычислительного экспери- эксперимента, а также рассматриваются на уровне примеров некоторые вычислительные алгоритмы. В части II излагаются традиционные разделы численных методов, такие как прямые и итерационные методы решения систем линейных алгебраических уравнений, ин- интерполирование, численное интегрирование, решение нелинейных уравнений, методы решения задачи Коши для обыкновенных диф- дифференциальных уравнений. Может возникнуть вопрос, зачем нуж- нужно столь подробно излагать методы, для большинства из которых уже давно существует хорошо зарекомендовавшая себя про- программная реализация? Дело в том, что сознательное использова- использование существующих программ и тем более создание новых улуч- улучшенных версий вряд ли возможно без изучения самих методов и связанных с ними теоретических представлений. В части III рас- рассматриваются разностные методы решения задач математической физики. Здесь большое внимание уделяется принципам построения разностных схем для различных задач, исследованию их устойчи- устойчивости и сходимости, методам решения сеточных уравнений. Для чтения части II требуется знание алгебры, анализа и обык- обыкновенных дифференциальных уравнений в объеме одного-двух кур- курсов вузовского обучения. Часть III предполагает знакомство с по- постановкой типичных задач математической физики. Каких-либо специальных предварительных сведений из области вычислитель- вычислительной математики не требуется, хотя могут оказаться полезными от- отдельные главы из книг Тихонов А. Н., Костомаров Д. П. Вводные лекции по прикладной математике.— М.: Наука, 1984. Самарский А. А. Введение в численные методы.— 2-е изд.— М.: Наука, 1987. Предполагается, что одновременно с изучением данного курса читатель овладевает навыками решения задач с помощью ЭВМ, а также участвует в работе студенческого семинара по численным методам. 9
Более подробное изложение отдельных разделов курса можно найти в книгах: Самарский А. А. Теория разностных схем.—2-е изд.—М.: Наука, 1983. Самарский А. А., Николаев Е. С. Методы решения се- сеточных уравнений.—М.: Наука, 1978. Самарский А. А., Попов Ю. П. Разностные методы ре- решения задач газовой динамики.—2-е изд.—М.: Наука, 1980. Авторы приносят глубокую благодарность декану факультета вычислительной математики и кибернетики МГУ академику А. Н. Тихонову, при активном участии которого обсуждались во- вопросы преподавания численных методов. Считаем также своим приятным долгом выразить благодар- благодарность нашим товарищам и сотрудникам по работе В. Б. Андрееву, Т. Н. Галишниковой, Л. М. Дегтяреву, Н. И. Ионкину, Н. Н. Ка- литкину, Д. П. Костомарову, Е. С. Николаеву, Ю. П. Попову, А. П. Фаворскому, И. В. Фрязинову за полезное обсуждение и сде- сделанные замечания по содержанию книги. А. А. Самарский, А. В. Гулин
ЧАСТЬ I ВВЕДЕНИЕ В ЧИСЛЕННЫЕ МЕТОДЫ § 1. Математическое моделирование и вычислительный эксперимент 1. Схема вычислительного эксперимента. Эффективное решение крупных естественно-научных и народнохозяйственных задач сей- сейчас невозможно без применения быстродействующих электронно- вычислительных машин (ЭВМ). В настоящее время выработалась технология исследования сложных проблем, основанная на по- построении и анализе с помощью ЭВМ математических моделей изу- изучаемого объекта. Такой метод исследования называют вычисли- вычислительным экспериментом. Пусть, например, требуется исследовать какой-то физический объект, явление, процесс. Тогда схема вычислительного экспери- эксперимента выглядит так, как показано на рис. 1. Формулируются ос- основные законы, управляющие данным объектом исследования (I) и строится соответствующая математическая модель (II), пред- представляющая обычно запись этих законов в форме системы урав- уравнений (алгебраических, дифференциальных, интегральных и т. д.). I Объект исследования 1 Л Ми тема ти ческа я модель Y Проведение вычислений и анализ результатов —1* Ш Численный ме тод (дискре тная модель и вычислительный алгоритм) Ы Программирование Вля ЭВМ ' Рис. 1. Схема вычислительного эксперимента При выборе физической и, следовательно, математической модели мы пренебрегаем факторами, не оказывающими существенного влияния на ход изучаемого процесса. Типичные математические мо- модели, соответствующие физическим явлениям, формулируются в виде уравнений математической физики. Большинство реальных процессов описывается нелинейными уравнениями и лишь в пер- первом приближении (при малых значениях параметров, малых от- отклонениях от равновесия и др.) эти уравнения можно заменить линейными. 11
После того как задача сформулирована в математической фор- форме, необходимо найти ее решение. Но что значит решить матема- математическую задачу? Только в исключительных случаях удается най- найти решение в явном виде, например в виде ряда. Иногда утверж- утверждение «задача решена» означает, что доказано существование и единственность решения. Ясно, что этого недостаточно для прак- практических приложений. Необходимо еще изучить качественное по- поведение решения и найти те или иные количественные характери- характеристики. Именно на этом этапе требуется привлечение ЭВМ и, как след- следствие, развитие численных методов (см. III на рис. 1). Под числен- численным методом здесь понимается такая интерпретация математиче- математической модели («дискретная модель»), которая доступна для реали- реализации на ЭВМ. Например, если математическая модель представ- представляет собой дифференциальное уравнение, то численным методом может быть аппроксимирующее его разностное уравнение совме- совместно с алгоритмом, позволяющим отыскать решение этого раз- разностного уравнения. Результатом реализации численного метода на ЭВМ является число или таблица чисел. Отметим, что в на- настоящее время помимо собственно численных методов имеются также методы, которые позволяют проводить на ЭВМ аналитиче- аналитические выкладки. Однако аналитические методы для ЭВМ не полу- получили пока достаточно широкою распространения. Чтобы реализовать численный метод, необходимо составить программу для ЭВМ (см. IV на рис. 1) или воспользоваться гото- готовой программой. После отладки программы наступает этап про- проведения вычислений и анализа результатов (V). Полученные ре зультаты изучаются с точки зрения их соответствия исследуемому явлению и при необходимости вносятся исправления в численный метод и уточняется математическая модель. Такова в общих чертах схема вычислительного эксперимента. Его основу составляет триада: модель — метод (алгоритм)—про- (алгоритм)—программа. Опыт решения крупных задач показывает, что метод ма- математического моделирования и вычислительный эксперимент со- соединяют в себе преимущества традиционных теоретических и экспериментальных методов исследования. Можно указать такие крупные области применения вычислительного эксперимента, как энергетика, аэрокосмическая техника, обработка данных на- натурного эксперимента, совершенствование технологических про- процессов. 2. Вычислительный алгоритм. Предметом данной книги явля- является изложение вопросов, отражающих лишь один из этапов вы- вычислительного эксперимента, а именно этап построения и исследо- исследования численного метода. Таким образом, здесь не обсуждаются исходные задачи и их математическая постановка, не рассматри- рассматриваются вопросы программирования и организации вычислений, ин- интерпретации результатов. Предварительные понятия о проблема- проблематике математического моделирования и вычислительного экспери- эксперимента читатель может получить из книг [36, 40]. 12
Необходимо подчеркнуть, что процесс исследования исходного объекта методом математического моделирования и вычислитель- вычислительного эксперимента неизбежно носит приближенный характер, по- потому что на каждом этапе вносятся те или иные погрешности. Так, построение математической модели связано с упрощением исход- исходного явления, недостаточно точным заданием коэффициентов урав- уравнения и других входных данных. По отношению к численному ме- методу, реализующему данную математическую модель, указанные погрешности являются неустранимыми, поскольку они неизбежны в рамках данной модели. При переходе от математической модели к численному методу возникают погрешности, называемые погрешностями метода. Они связаны с тем, что всякий численный метод воспроизводит исход- исходную математическую модель приближенно. Наиболее типичными погрешностями метода являются погрешность дискретизации и по- погрешность округления. Поясним причины возникновения таких по- погрешностей. Обычно построение численного метода для заданной мате- математической модели разбивается на два этапа: а) формулиров- формулировка дискретной задачи, б) разработка вычислительного алгоритма, позволяющего отыскать решение дискретной задачи. Например, если исходная математическая задача сформулирована в виде си- системы дифференциальных уравнений, то для численного решения необходимо заменить ее системой конечного, может быть, очень большого числа линейных или разностных алгебраических урав- уравнений. В этом случае говорят, что проведена дискретизация исход- исходной математической задачи. Простейшим примером дискретизации является построение разностной схемы путем замены дифферен- дифференциальных выражений конечно-разностными отношениями. В об- общем случае дискретную модель можно рассматривать как конеч- конечномерный аналог исходной математической задачи. Ясно, что ре- решение дискретизированной задачи отличается от решения исход- исходной задачи. Разность соответствующих решений и называется по- погрешностью дискретизации. Обычно дискретная модель зависит от некоторого параметра (или множества параметров) дискретиза- дискретизации, при стремлении которого к нулю должна стремиться к нулю и погрешность дискретизации. При этом число алгебраических уравнений, составляющих дискретную модель, неограниченно воз- возрастает. В случае разностных методов таким параметром является шаг сетки. Как уже отмечалось, дискретная модель представляет собой систему большого числа алгебраических уравнений. Невозможно найти решение такой системы точно и в явном виде. Поэтому при- приходится использовать тот или иной численный алгоритм решения системы алгебраических уравнений. Входные данные этой систе- системы, а именно коэффициенты и правые части, задаются в ЭВМ не точно, а с округлением. В процессе работы алгоритма погрешности округления обычно накапливаются, и в результате решение, полу- полученное на ЭВМ, будет отличаться от точного решения дискрети- 13
зированной задачи. Результирующая погрешность называется по- погрешностью округления (иногда ее называют вычислительной по- погрешностью). Величина этой погрешности определяется двумя факторами: точностью представления вещественных чисел в ЭВМ. и чувствительностью данного алгоритма к погрешностям округ- округления. Алгоритм называется устойчивым, если в процессе его работы вычислительные погрешности возрастают незначительно, и неус- неустойчивым — в противоположном случае. При использовании неус- неустойчивых вычислительных алгоритмов накопление погрешностей округления приводит в процессе счета к переполнению арифмети- арифметического устройства ЭВМ. Итак, следует различать погрешности модели, метода и вычис- вычислительную. Какая же из этих трех погрешностей является преоб- преобладающей? Ответ здесь неоднозначен. Видимо, типичной является ситуация, возникающая при решении задач математической физи- физики, когда погрешность модели значительно превышает погреш- погрешность метода, а погрешностью округления в случае устойчивых алгоритмов можно пренебречь по сравнению с погрешностью ме- метода. С другой стороны, при решении, например, систем обыкно- обыкновенных дифференциальных уравнений возможно применение столь точных методов, что их погрешность будет сравнима с погреш- погрешностью округления. В общем случае нужно стремиться, чтобы все указанные погрешности имели один и тот же порядок. Например, нецелесообразно пользоваться разностными схемами, имеющими точность 10"°, если коэффициенты исходных уравнений задаются с точностью 10~2. 3. Требования к вычислительным методам. Одной и той же ма- математической задаче можно поставить в соответствие множество различных дискретных моделей. Однако далеко не все из них при- пригодны для практической реализации. Вычислительные алгоритмы, предназначенные для быстродействующих ЭВМ, должны удовлет- удовлетворять многообразным и зачастую противоречивым требованиям. Попытаемся здесь сформулировать основные из этих требований в общих чертах. Далее в частях II и III книги эти требования кон- конкретизируются при рассмотрении алгоритмов численного решения типичных математических задач. Можно выделить две группы требований к численным методам. Первая группа связана с адекватностью дискретной модели исход- исходной математической задаче, и вторая группа — с реализуемостью численного метода на ЭВМ. К первой группе относятся такие тре- требования, как сходимость численного метода, выполнение дискрет- дискретных аналогов законов сохранения, качественно правильное поведе- поведение решения дискретной задачи. Поясним эти требования. Предположим, что дискретная модель математической задачи представляет собой систему большого, но конечного числа алгебраических уравнений. Обычно, чем точнее мы хотим получить решение, тем больше уравнений приходится брать. Говорят, что численный метод сходится, если при неограни- 14
ченном увеличении числа уравнений решение дискретной задачи стремится к решению исходной задачи. Поскольку реальная ЭВМ может оперировать лишь с конечным числом уравнений, на практике сходимость, как правило, не дости- достигается. Поэтому важно уметь оценивать погрешность метода в за- зависимости от числа уравнений, составляющих дискретную модель. По этой же причине стараются строить дискретную модель таким образом, чтобы она правильно отражала качественное поведение решения исходной задачи даже при сравнительно небольшом чис- числе уравнений. Например, дискретной моделью задачи математической физики может быть разностная схема. Для ее построения область измене- изменения независимых переменных заменяется дискретным множеством точек — сеткой, а входящие в исходное уравнение производные за- заменяются на сетке конечно-разностными отношениями. В резуль- результате получаем систему алгебраических уравнений относительно значений искомой функции в точках сетки. Число уравнений этой системы равно числу точек сетки. Известно, что дифференциаль- дифференциальные уравнения математической физики являются следствиями ин- интегральных законов сохранения. Поэтому естественно требовать, чтобы для разностной схемы выполнялись аналоги таких законов сохранения. Разностные схемы, удовлетворяющие этому требова- требованию, называются консервативными. Оказалось, что при одном и том же числе точек сетки консервативные разностные схемы более правильно отражают поведение решения исходной задачи, чем не- неконсервативные схемы. Сходимость численного метода тесно связана с его коррект- корректностью. Предположим, что исходная математическая задача по- поставлена корректно, т. е. ее решение существует, единственно и непрерывно зависит от входных данных. Тогда дискретная модель этой задачи должна быть построена таким образом, чтобы свой- свойство корректности сохранилось. Таким образом, в понятие кор- корректности численного метода включаются свойства однозначной разрешимости соответствующей системы уравнений и ее устойчи- устойчивости по входным данным. Под устойчивостью понимается непре- непрерывная зависимость решения от входных данных, равномерная относительно числа уравнений, составляющих дискретную модель. Вторая группа требований, предъявляемых к численным мето- методам, связана с возможностью реализации данной дискретной мо- модели на данной ЭВМ, т. е. с возможностью получить на ЭВМ ре- решение соответствующей системы алгебраических уравнений за приемлемое время. Основным препятствием для реализации кор- корректно поставленного алгоритма является ограниченный объем оперативной памяти ЭВМ и ограниченные ресурсы времени счета. Реальные вычислительные алгоритмы должны учитывать эти об- обстоятельства, т. е. они должны быть экономичными как по числу арифметических действий, так и по требуемому объему памяти. 15
§ 2. Погрешности округления 1. Представление вещественных чисел в ЭВМ. Одним из источ- источников вычислительных погрешностей является приближенное представление вещественных чисел в ЭВМ, обусловленное конеч- конечностью разрядной сетки. Хотя исходные данные представляются в ЭВМ с большой точностью, накопление погрешностей округления в процессе счета может привести к значительной результирующей погрешности, а некоторые алгоритмы могут оказаться и вовсе не- непригодными для реального счета на ЭВМ. Напомним о способах представления чисел в ЭВМ и связанных с ними погрешностях округления. Более подробно этот круг во- вопросов рассматривается в [6, 8, 15, 29]. При ручном счете пользуются десятичной системой счисления. Например, запись 103,67 определяет число Здесь 10 — основание системы счисления, запятая отделяет дробную часть числа от целой, 1, 0, 3, 6, 7 — числа из базисного набора {0, 1, 2, 3, 4, 5, 6, 7, 8, 9}, с помощью которого можно пред- представить любое вещественное число. ЭВМ работают, как правило, в двоичной системе, когда любое число записывается в виде последовательности нулей и единиц. Например, запись 0, 0101 в двоичной системе определяет число Как двоичная, так и десятичная системы относятся к позици- позиционным системам счисления. В позиционной системе с основанием г запись a = ±anan-i...aa,a-ia-2... A) означает, что Будем считать далее, что г — целое число, большее единицы. Каждое из чисел а, может принимать одно из значений @,1,... ...,/"—!}. Числа а, называются разрядами, например: а3 — третий разряд перед запятой, а_2 — второй разряд после запятой. Запись вещественного числа в виде A) называется также его представлением в форме числа с фиксированной запятой. В ЭВМ чаще всего используется представление чисел в форме с плаваю- плавающей запятой, т. е. в виде а=Мг*, B) где г — основание системы счисления, р — целое число (положи- (положительное, отрицательное или нуль) и г-'^|Л1|<1. C) Число М представляется в форме числа с фиксированной запя- запятой и называется мантиссой числа а. Число р называется поряд- порядком числа а. В виде B) можно единственным образом представить 16
любое вещественное число кроме нуля. Единственность обеспечи- обеспечивается условием нормировки C). Например, число 103,67 в форме с плавающей запятой имеет вид 0,10367-103, т. е. М=0,10367, р=з. Двоичное число 0,0101 = =0,101-2 ' имеет в двоичной системе мантиссу А/=0,101 и поря- порядок р=-1. Знак порядна Порядок Знак ман тиссы Мантисса 48 47 4Z 41 40 1 Рис. 2. Разрядная сетка В ЭВМ для записи каждого числа отводится фиксированное число разрядов (разрядная сетка). Например, в ЭВМ БЭСМ-6 для записи числа, представленного в форме с плавающей запятой, отводится 48 двоичных разрядов, которые распределяются следую- следующим образом: в разрядах с I по 40 помещается абсолютное значе- значение мантиссы, в 41 разряде-знак мантиссы, в разрядах от 42 до 47 - абсолютная величина порядка, в 48 разряде - знак порядка (см. рис. 2). Отсюда легко найти диапазон чисел, представимых в ЭВМ БЭСМ-6. Поскольку максимальное значение порядка в дво- двоичной системе равно 111 111=63 и мантисса не превосходит еди- единицы, то с помощью указанной разрядной сетки можно пред- представить числа, абсолютная величина которых лежит примерно в диапазоне от 2~вз до 263, т. е. от Ю-19 до 1019. Ту же 48-разрядную сетку можно использовать для представления чисел с фиксированной запятой. Пусть, например, разряды с 1 по 24 отводятся для записи дробной части числа и разряды с 25 по 47 —для записи целой части числа. Тогда максимальное число, которое можно представить с помощью дан- данной разрядной сетки, будет равно 11 ... I, 11 ... 1 <223«10'. 23 разряда 24 разряда Следовательно, в данном случае диапазон допустимых чисел в 1012 раа меньше, чем при использовании представления с плавающей запятой. Возмож- Возможностью существенного увеличения диапазона допустимых чисел при той же раз- разрядной сетке и объясняется преимущественное использование в ЭВМ представ- Ле5пЯ,«чисел в Ф°Рме с плавающей запятой. Комплексное число представляется в dBM в виде пары вещественных чисел. 2. Округление чисел в ЭВМ. Будем считать в дальнейшем, что вещественные числа представляются в ЭВМ в форме с плавающей запятой. Минимальное положительное число Ма, которое может быть представлено в ЭВМ с плавающей запятой, называется ма- машинным нулем. Мы видим, что для ЭВМ БЭСМ-6 число Af0^ Ю9. Число Мж = Мо называется машинной бесконечностью. Все ве- вещественные числа, которые могут быть представлены в данной ЭВМ, расположены по абсолютной величине в диапазоне от Ма до Мое. ?сли в процессе счета какой-либо задачи появится вещест- 17
венное число, меньшее по модулю чем Мо, то ему присваивается нулевое значение. Так, на ЭВМ БЭСМ-6 в результате перемноже- перемножения двух чисел 10~" и 1О~10 получим нуль. При появлении в про- процессе счета вещественного числа, большего по модулю чем М*,, происходит так называемое переполнение разрядной сетки, после чего ЭВМ прекращает счет задачи. Отметим, что нуль и целые числа представляются в ЭВМ особым образом, так что они могут выходить за пределы диапазона M0-i-Moo. Из-за конечности разрядной сетки в ЭВМ можно представить точно не все числа из диапазона Ма-^МХ, а лишь конечное мно- множество чисел. Число а, не представимое в ЭВМ точно, подверга- подвергается округлению, т. е. оно заменяется близким ему числом а, пред- ставимым в ЭВМ точно. Точность представления чисел в ЭВМ с плавающей запятой характеризуется относительной погрешностью \a-a\l\a\. Величина относительной погрешности зависит от способа округления. Простейшим, но не самым точным способом округле- округления является отбрасывание всех разрядов мантиссы числа а, ко- которые выходят за пределы разрядной сетки. Найдем границу относительной погрешности при таком способе округления. Пусть для записи мантиссы в ЭВМ отводится t двоичных разрядов. Предпо- Предположим, что надо записать число, представленное в виде бесконечной двоичной дроби где каждое из aj равно 0 или 1. Отбрасывая все лишние разряды, получим округленное число (# Таким образом, для погрешности округления справедлива оценка Далее заметим, что из условия нормировки |М|^0,5 (см. C)) следует, что в разложении D) всегда аг == 1. Поэтому \а\ ^2Р-2-' = 2р-', и для относитель- относительной погрешности округления получим оценку n-t + l При более точных способах округления можно уменьшить по- погрешность по крайней мере в два раза и добиться, чтобы выполня- выполнялась оценка м ^ ' E) 18
Итак, относительная точность в ЭВМ с плавающей запятой оп- определяется числом разрядов t, отводимых для записи мантиссы. Можно считать, что точное число а и отвечающее ему округленное число а связаны равенством A ) F) где |е|^2~'. Число 2"' называют иногда машинным эпсилоном. Оно характеризует относительную точность представления чисел в ЭВМ. Для ЭВМ БЭСМ-6 имеем ?=40, 2-'«10-'2, т. е. относитель- относительная точность представления чисел составляет 12 десятичных знаков. Соотношение F) справедливо лишь в случае \а\ ~^Ма, где Ма — машинный нуль. Если же число а мало, а именно |a|<Af0, то по- полагается а=Ь, что соответствует е=—1 в формуле F). 3. Накопление погрешностей округления. В процессе проведе- проведения вычислений погрешности округления могут накапливаться, так как выполнение каждой из четырех арифметических операций вносит некоторую погрешность. Будем в дальнейшем обозначать округленное в системе с пла- плавающей запятой число, соответствующее точному числу х, через fl(*) (от английского floating — плавающий). Считается, что вы- выполнение каждой арифметической операции вносит относительную погрешность не большую, чем 2"'. Это предположение можно за- записать в виде fl(fl*b)=a*6(l+e), G) где звездочка означает любую из операций +, ¦—, X, :, и |е| Если результат выполнения арифметической операции является машинным нулем, то в формуле G) надо положить е=—1. Может показаться, что предположение G) не обосновано, так как соглас- согласно F) каждое из чисел a u b записывается с относительной погрешностью 2~(, следовательно, погрешность результата может достигнуть 2-'+'. Однако ЭВМ обладает возможностью проводить промежуточные вычисления с двойной точ- точностью, т. е. с мантиссой, содержащей It разрядов, причем округлению до t разрядов подвергается лишь окончательный результат. Это обстоятельство по- позволяет добиться выполнения соотношения G). Для оценки влияния погрешностей округления на результат того или иного вычислительного алгоритма очень часто использу- используется предположение о том, что результат вычислений, искаженный погрешностями округления, совпадает с результатом точного вы- выполнения этого же алгоритма, но с иными входными данными. Рассмотрим, например, процесс вычисления суммы (8) трех положительных чисел. Пусть сначала находится сумма yt+y Тогда согласно G) получим Затем в результате сложения 2t и у3 получим число 19
где |е2|=^2~"'. Таким образом, вместо точного значения суммы z получаем приближенное значение Отсюда видно, что результат выполнения алгоритма (8), иска- искаженный погрешностями округления, совпадает с результатом точ- точного выполнения того же алгоритма (8), примененного к другим .исходным данным )A + е2)г/,-, 1=1,2, ^3= На этом же примере видно, что результирующая погрешность ¦зависит от порядка выполнения операций, так что вычисление сум- суммы (8) в обратном порядке (f/3+y2)+i/i может привести к другому .результату. Приведенный пример имеет чисто иллюстративное значение, так как число слагаемых в сумме (8) невелико, а погрешности е< малы. Практический интерес представляют оценки результирую- результирующей погрешности в зависимости от числа выполненных арифмети- арифметических действий п. Однако прежде чем перейти к получению таких ¦оценок, необходимо познакомиться с методами решения разност- разностных уравнений. 4. Разностные уравнения первого порядка. Предположим, что дадо вычислить сумму Тогда вычисления организуются обычно следующим образом. За- Задается начальное значение 2„ = 0 и затем последовательно, начиная с /=1, находятся числа zh связанные рекуррентным соотношением /=1,2,..., л, zo = Q. A0) Для вычисления произведения .достаточно задать начальное значение za—l и воспользоваться ре- рекуррентными соотношениями Zj = yjzi-l, /=1,2, ...,«, 2-0 = 1. A2) Уравнения A0) и A1) являются частными случаями линейного разностного уравнения первого порядка г,=<7Л-1 + ф1. /=1. 2, ..., п, A3) -где qjt ф,-— заданные числа, г,—искомые числа. Для уравнения A3) рассматривается задача с начальными условиями или задача Коши, которая состоит в отыскании всех ги /=1,2,... , п, при за- •20
данном начальном значении za. Ясно, что решение задачи Коши для разностного уравнения A3) существует и единственно. Коэффициенты qh правые части <р,- и искомое решение zt урав- уравнения A3) можно рассматривать как функции целочисленного ар- аргумента /, т. е. <7, = <7(/), Ф; = ф(/), 2j = z(/). Нам потребуется прежде всего записать решение уравнения A3) в явном виде. Подставляя в A3) вместо Zj-i выражение получим Теперь можно подставить сюда выражение для Zj-2, затем — для Zj-3 и т. д. В результате получим формулу, в которой z, выражается через Zj-U <fj-i+i, (fj-i+г,..., cpj. Эта формула имеет вид Zi = Qii2j-i+ ^ Qi.i-'Wk, /=1,2, ...,/ —1,/, / = 1,2, ...,n, A4) где \U / = 0' ,^,^. A5) 7 1 ^Z</ Строго доказать формулу A4) можно индукцией по числу / при каждом фиксированном I. Нам потребуется формула A4) при /=/, т. е. г, = Qnz0 + 2 Qi.i-ьЩ, / = 1, 2, . .., n, A6) где согласно A5) = /, .. <7*+ь В частности, если A3) является уравнением с постоянными ко- коэффициентами, т. е. qi=q для всех /, то из A6) получим г,- = q'z0 + ^ <Г*Ф*. / = 1, 2, . . ., п. A8) Явную формулу A6) можно использовать для получения раз- различных оценок решения z,- через начальные данные z0, заданные коэффициенты qt и правые части ф,. Лемма 1. Если для некоторого q~^0 выполнены неравенства /=l,2,...,n, A9) B0) 21 то для решения уравнения A3) справедливы оценки
Доказательство. Из A7) и A9) получаем, что Отсюда и из A6) следуют оценки B0). Замечание. Оценки B0) неулучшаемы в том смысле, что для уравнения A3) с постоянными коэффициентами и положительными га, <р;„ k=l, 2, ..., J, неравенства B0) выполняются согласно A8) со знаком равенства. 5. Оценки погрешностей округления. Приведем примеры оценок погрешностей округления, возникающих в результате выполнения вычислительных алгоритмов. Нас будет интересовать в основном зависимость результирующей погрешности от числа арифметиче- арифметических действий п и от величины г=2~1, определяемой разрядностью ЭВМ. Пример 1. Вычисление произведения п 2п = П У1 п вещественных чисел проводится по формуле 2i=#jzi-i, /=1|2, ¦ . . , П, Za=\. B1) Предположим, что в результате округления вместо точного зна- значения Zj_, получено приближенное значение Zj_,. Тогда согласно G) вместо yjZj-i получим величину где |е,-|^е=2~'. Таким образом, вместо г, получаем zi=(l + zj)yjzj-u т. е. приближенное значение 2j удовлетворяет рекуррентному соот- соотношению Zi = yiz-i-i> /=1,2, ...,«, го=1, B2) где ys = у,A+ г,). Результирующая погрешность равна п п 2п —"гп = Ц У\ — Т\ A + е/) у,, /=1 /=1 поэтому относительная погрешность есть 1=1 Для оценки относительной погрешности заметим, что I 1-|-eJ ^1 + е, /=1,2,...,«, е=2~', поэтому с точностью до величин второго порядка малости относи- относительно е можно считать, что Z"~2" <Zrw = n2-'. i'23) 22
При выводе оценки B3) предполагалось, что е=2 ', т. е. при перемножении не возникает чисел, меньших машинного нуля или больших машинной бесконечности. Однако может оказаться, что на каком-то этапе вычислений в качестве промежуточного резуль- результата будет получен либо машинный нуль Мо, либо машинная бес- бесконечность Л!». Поскольку оба указанных случая приводят к не- неверному окончательному результату, необходимо видоизменить вы- вычислительный алгоритм. Оказывается, что здесь существенным яв- является порядок действий. Пусть, например, М0=2~р и М„=2Р при некотором р>0. Пред- Предположим, что надо перемножить пять чисел г/,=2р/2, у2=2р/4, Уз=23рП, i/4=2"p/2, y5=2~2p//'. Каждое из этих чисел и их произве- произведение 2р/4 принадлежат допустимому диапазону чисел (Мо, М^). Однако произведение yiy2y3=23l"->Mai, поэтому при указанном по- порядке действий дальнейшее выполнение алгоритма становится не- невозможным. Если проводить вычисление в порядке у^у^УлУгУ^, то получим у5У4=2р/4<М0, следовательно, И(у5у4)=0 и все произ- произведение окажется равным нулю, т. е. получим неверный результат. В данном примере к верному результату приводит вычисление произведения в порядке УьУгУйиУг. В случае произвольного числа л сомножителей можно предложить следую- следующий алгоритм вычисления произведения (см. [6]). Предположим, что Ы<Ы<-..<1г/п|. причем |i/[|<!l, |«/п|^1. Будем сначала проводить умножение в порядке У[УпУп-1... до тех пор, пока впервые не получим число, большее единицы. За- Затем полученное частичное произведение будем последовательно умножать на (/2> Уз и т. д. до тех пор, пока новое частичное произведение не станет меньше единицы. Процесс повторяется до тех пор, пока все оставшиеся сомножители будут либо только большими единицы по модулю, либо только меньшими. Далее умножение проводится в произвольном порядке. Пример 2. Рассмотрим процесс вычисления суммы гп=у1+У2 + .. • + «/„. B4) Для простоты изложения предположим, что все </; положительны и больше машинного нуля. Тогда в процессе вычислений не может появиться нулевого результата. Алгоритм вычисления суммы B4) состоит в решении разностного уравнения A0) при начальном зна- значении г„=0. Получим уравнение, которому удовлетворяет приближенное оешение ij. Предположим, что вместо точного значения z,-_, в ре- результате накопления погрешностей округления получено прибли- приближенное значение z,-_,. Тогда согласно G) вместо z,- получим число где |е| Таким образом, приближенное значение 2,- удовлетворяет раз- разностному уравнению Zi = qizj-l->ry1, /=1,2,..., и, г„ = 0, B5) 23
где <7j= 1 —f—ej, z/j=(l+ ?j)#j. Можно считать, что уравнение B5) по- получено из исходного уравнения A0) путем внесения возмущений в коэффициенты и в правые части, причем для каждого / возму- возмущение пропорционально г, и не превосходит 2~'. Оценим теперь результирующую погрешность zn—zn. Для этого выпишем в явном виде решения уравнений A0) и B5), предпола- предполагая, что za=z0=0. Согласно A6), A8) имеем где ук — (]ъ.Ук- Поэтому для погрешности получим следующее выра- выражение: где Enk=qkQn,n-k—1=| . , , о , I <7n7n-i • • • qk+iQk—l, k=l, 2, . ..,п—\. B7) Коэффициент ?„4 в формуле B6) указывает, какую долю по- погрешности вносит k-e слагаемое суммы B4) в общую погрешность. Покажем, что чем меньше номер k, тем большая погрешность вно- вносится за счет ук. Для этого оценим приближенно величины Е„к. Так как <7j=1 + 6j и |е;| <е=2~', то \qn\ ^1+e, \qnqn-i ¦ ¦ ¦ ^+i7(.i < =sS A+ e)n~*+1. Отбрасывая величины второго порядка малости от- относительно е, можно считать, что и тогда \Enh\^(n-k+l)e, Л=1,2,...,л. B8) Из формулы B6) легко получить оценку относительной погреш- погрешности \zn—zn\/\zn\. Заметим сначала, что для положительных yi,...,yn последовательность ги определенная согласно A0), не- неотрицательная и монотонно возрастающая, т. е. k=\,2,...,n. Поэтому для yh=zh—zh-i справедливо неравенство O^jksSlZxI + l^-.ls^lz,,!, k=\, 2, ..., п. Отсюда и из B6) получим оценку \гп-гп\^2\гп\-% \Enk\. Учитывая приближенное неравенство B8), приходим к следующей 24
оценке относительной погрешности: Следовательно, относительная погрешность, возникающая при суммировании п положительных чисел, оценивается примерно как п22~', где t —число разрядов, отводимое для записи мантиссы. На- Например, при 2-' = 10~12, я=1СР получаем, что результирующая от- относительная погрешность не превзойдет 10~6. § 3. Разностные уравнения второго порядка 1. Задача Коши и краевые задачи для разностных уравнений. В п. 4 § 2 рассматривалась задача Коши для разностного уравне- уравнения первого порядка. Обратимся теперь к линейным разностным уравнениям второго порядка ajyj-i—c1y1+biyi+l = —fh A) где а;, b:, с,-, fj — заданные коэффициенты и правая часть и и- — ис- искомое решение. Индекс / в уравнении A) пробегает некоторое до- допустимое множество / целых чисел. Например, /={0,1,2,...}, /={1,2,...,^-1}, /={0,+1,±2,...}, где Л"> 1 — заданное целое число. Всюду в дальнейшем будем предполагать, что bj?=O, а,?=0 для всех допустимых /. Коэффициенты, правую часть и решение уравнения A) следует рассматривать как функции целочисленного аргумента /е/, т. е. yi=y(i),fi=f(i) и т. д. Уравнение A) имеет бесконечное множество решений. Каждое отдельное решение называется частным решением уравнения A). Общим решением уравнения A) называется такое двухпарамет- рическое семейство решений, которое содержит любое частное ре- решение. В пп. 3, 4 будет показано, каким образом строится общее решение уравнения A). Для того чтобы из совокупности всех решений уравнения A) выделить единственное, необходимо задать те или иные дополни- дополнительные условия. Задача Коши состоит в отыскании решения уи /=0,1,2,..., уравнения A), удовлетворяющего при /=0, 1 заданным начальным условиям Уо=Ц1, У1=ц.2. B) Если Ь,Ф0 для всех допустимых /, то уравнение A) можно раз- разрешить относительно yj+i, т. е. записать в виде У hi = ~ т- У hi + Т-У1-Т-- C) ь, bf ь, Отсюда следует, что задача Коши имеет единственное решение. 25
Более общая постановка задачи Коши состоит в отыскании при всех ; = 0, ±1, ±2,... решения уравнения A), удовлетворяющего условиям у-в=ц.|, i/jo+i = H2 с заданными /0, \ii, Цг. Если uj^O, 6;?=0 для всех /, то такая задача имеет единственное решение. Краевая задача состоит в отыскании решения уравнения я^-1-ед-+Ь;-г/я.,=-/я /= 1, 2,. . . , N-1, D) удовлетворяющего дополнительным условиям Уп=Н.1У1 + 11и Уп = Х2У.Ч-, + \12, E) где Xi, ц,-, i=l, 2 — заданные числа. В частности, при х1=х2=0 по- получаем краевые условия первого рода #о = Цч, Ул- = Ц2, F) а при х1=х2=1 —краевые условия второго рода. Достаточные ус- условия существования единственного решения краевой задачи D), E), а также алгоритм построения этого решения будут указаны в п. 7 § 4. 2. Однородное разностное уравнение второго порядка с посто- постоянными коэффициентами. Рассмотрим разностное уравнение 1=О, а?=0, Ь?=0, G) с вещественными коэффициентами а, Ь, с, не зависящими от /. Будем искать частные решения уравнения G) в виде yi=q}, (8) где q — число, подлежащее определению. Подставляя (8) в G), получим квадратное уравнение =0, (9) которое называется характеристическим уравнением, соответст- соответствующим разностному уравнению G). В зависимости от знака дискриминанта сг—4ab могут предста- представиться три различных случая. Если c2>4ab, то корни с + У^Ш с-У^пь 0) уравнения (9) вещественны и различны. В этом случае разностное уравнение G) имеет частные решения Если c1<4ab, то корни qt и q2 комплексно сопряжены. Функции A1) ив этом случае являются решениями разностного уравнения G), однако удобнее представить qt в тригонометрической форме: qi = r (cos ф + t sin ф), где /а . Viab — с2 с ,, о. — , Sin ф = — —^- , СОБф^ -= . A2) Ь 2 |/ ab 2Vab 26
В качестве решений уравнения G) можно взять функции У{,1) = г' cos (yep), у f > = г I sin (/ф) . Наконец, если c2=4ab, то уравнение (9) имеет кратный корень q=cjBb), а разностное уравнение имеет частные решения у? = 4, yf]=iq'- (is) Построим теперь решение задачи Коши ау^.-су^Ьу^^О, /=1, 2, . . . , A4) yo=|ii, У1=ц2, A5) исходя из найденных частных решений A1). В силу линейности и однородности уравнения G) любая линейная комбинация У\ = о-А + «2fli A6) также является его решением. Подберем параметры а4 и а2 таким образом, чтобы удовлетворялись начальные условия A5): а1 + а2=ц1, ai<7i+cc2<72=H2. A7) Решая систему A7), находим Qti==MiZ^Lt a2 = ^-^ . A8) <?2 — <?г <7г — ?1 Подставляя A8) в A6) и собирая коэффициенты при ци цг, по- получим, что решение задачи Коши A4), A5) в случае c2>4ab имеет вид Hi+J LH«, / = 0,1,2,..., A9) где <7i 2 определены согласно A0). В таком же виде представляется и решение задачи Коши A4), A5) в случае с2<С4а&. Заметим, что в этом случае ('С1 — ч'~ъ) _ _ { sin ((/ — 1) Ф) — Я\ sin Ф я{ — Ч[ fhx sin (/ф) q2 — Я! sin ф где г и ф определены согласно A2). Поэтому решение задачи Коши можно записать в виде sin((/l)y) + г/_, 5_ш0ф)_ sin ф + sin ф sin ф В случае c2=4ab, используя частные решения A3), можно пред- представить решение задачи Коши A4), A5) в виде Х B1) где q=cl{2b). 27
Аналогичным образом строится решение краевой задачи аун-сУ1+Ьуш = 0, /=1,2 N-], B2) #0=Hl, Ук=Ц2- B3) Если c2=?4ab, то V; = — Мч Н Да, B4) где ^,,2 определены согласно A0). Если же c2=4ab, то У,- = A - jj-) </Vi + "{г Т'^'К B5) где q=cjBb). 3. Однородное разностное уравнение второго порядка с пере- переменными коэффициентами. Для уравнения с переменными коэф- коэффициентами A) существует теория, аналогичная теории линейных дифференциальных уравнений, а именно: общее решение одно- однородного уравнения i = 0 B6) представляется в виде линейной комбинации двух его линейно не- независимых решений, а общее решение неоднородного уравнения A) —в виде суммы частного решения неоднородного уравнения и общего решения однородного уравнения. Изучим более подробно свойства разностного уравнения B6). Будем считать сейчас, что J= {0, ±1, ±2, ...}, т. е. уравнение B6) определено для всех целых у. Заметим прежде всего, что если щ и Vj — два решения уравнения B6), то и любая линейная ком- комбинация a-iUj+aiVj также является решением. Этот факт следует из линейности и однородности уравнения B6). Для дальнейшего потребуются понятия линейной зависимости и линейной независимости функций, заданных на множестве /. Две функции Uj и v} целочисленного аргумента уе/ называются линейно зависимыми, если существуют постоянные аи Кг, одно- одновременно не равные нулю и такие, что выполнено равенство a,iUj+a,2Vj = 0 для всех уе/. B7) Если же из условия B7) следует, что а! = а2 = 0, то функции и., v} называются линейно независимыми. Линейная зависимость решений щ, v, характеризуется значе- значениями определителей Wj [U, V] = "/и B8) являющимися аналогами определителя Вронского. Лемма 1. Если функции щ, v, линейно зависимы, то w, = для всех / 28
Действительно, согласно B7) для всех /еУ выполняются ра- равенства ujal+vja2 = 0, B9) u,-+1a,+u,-+1a2 = 0, где а\ -f- «2^0. Рассматривая B9) при каждом фиксированном' / как однородную систему линейных алгебраических уравнений относительно аи а2 и учитывая, что ol\ -f- a\ =^0, получим, что опре- определитель Wj этой системы равен нулю. Для решений однородного уравнения B6) справедливо утверж- утверждение, обратное лемме 1. Лемма 2. Если ии v, — линейно независимые решения одно- однородного уравнения B6) и а,фО, bj-фО для всех /, то определитель Wj[u, v] не обращается в нуль ни в одной точке j<=J. Доказательство проведем от противного. Предположим, что найдется точка /ое/, для которой wh[u, v]=Q. Рассмотрим си- систему уравнений uioai + vi*a2 = 0, C0) «/0+1И1 + "/o+l«2 = 0 относительно неизвестных аи а2. Поскольку определитель этой системы равен нулю, существует нетривиальное решение {а,, а2}. Образуем с помощью этого решения {at, oc2} функцию C1) и покажем, что Zj = 0 для всех /. Поскольку щ и Vj—решения однородного уравнения B6), функция C1) также является его решением, т. е. удовлетворяет уравнению +1 = 0. C2) Кроме того, согласно C0) выполнены условия zia = zk+i = 0. По предположению коэффициенты ah b, отличны от нуля для всех /. Следовательно, для уравнения C2) можно рассмотреть за- задачи Коши / = /о +1, /о + 2, .. ., ?/.« = 0, C3) ; ; / 1 ; о I /(р/О * 'О » * • * » z/.=2/iH = 0. C4) Из рекуррентных соотношений C3), C4) получаем, что 2^ = 0 для всех / = 0, ±1, ±2, ... Последнее означает, что a1uJi+a2uJ-=0 для всех /, причем а\-\- а\фЪ. Следовательно, функции ии Vj ли- линейно зависимы, что противоречит предположению леммы 2. 29 bf' с. ai &/ г--А- л. 2/0 = 2;'+1>
Следствие 1. Определитель B8), составленный для двух решений уравнения B6), или тождественно по j равен нулю, или отличен от нуля для всех /. Любая система из двух линейно независимых решений уравне- уравнения B6) называется фундаментальной системой. Теорема 1. Уравнение B6) с аф§, Ь^О, /е/, всегда имеет фундаментальную систему. Доказательство. Фундаментальную систему образуют, например, решения щ и vs следующих задач Коши: aiuHl—ciuj+bjUj+i = 0, / = 0, ±1, ±2, .... uo = Q, ц,= 1; aiVj-i—CjVj+bjvj+i = О, / = 0, ±1, ±2, ..., »0=1, », = 0. Действительно, и согласно следствию 1 ws[u, у]=^=0 для всех /. Но тогда согласно лемме 1 функции uh v} линейно независимы. Теорема 2. Если «,-, Vj — фундаментальная система решений уравнения B6), то его общее решение имеет вид yi = a1Uj+a2vj, C5) еде а, и а2 — произвольные постоянные. Доказательство. Пусть у, — любое решение уравнения B6) и Uj, Vj — два заданных линейно независимых решения. Надо показать, что найдутся постоянные а{ и а2, для которых справед- справедливо C5). Пусть у0 и (/t — значения решения ys в точках / = 0 и / = = 1 соответственно. Выберем постоянные at и а2 из условий yi- C6) Определитель этой системы wo[u, v]^0, так как и и v — линей- линейно независимые решения. Следовательно, при заданных у0, г/, си- система C6) имеет единственное решение (аь а2}. В силу единствен- единственности решения задачи Коши функция C5), построенная с по- помощью найденных постоянных а, и а2, совпадает с заданным ре- решением У;. Следствие. Любые три решения однородного уравнения B6) линейно зависимы. Пусть щ, vs, у, — любые решения уравнения B6). Если щ и v, линейно зависимы, то утверждение доказано. Если же и,- и vs ли- линейно независимы, то они образуют фундаментальную систему и согласно теореме 2 решение г/, представляется в виде линейной комбинации Uj и у,. В качестве упражнения предлагается проверить, что частные решения A1) уравнения G) с постоянными коэффициентами бу- будут линейно независимы при ц^фцг и линейно зависимы — при qi = q2. В последнем случае линейно независимыми будут решения 30
A3). Заметим, что вследствие предположения а#0 характеристи- характеристическое уравнение (9) не имеет нулевых корней. 4. Неоднородное разностное уравнение второго порядка. Об- Обратимся снова к неоднородному уравнению ед-i- ед+Ьл+1=— /;•• C7) Уравнение ед_1—см+Ь,у,+1 = 0 C8) называется однородным уравнением, соответствующим уравне- уравнению C7). Теорема 3. Общее решение неоднородного уравнения C7) есть сумма какого-либо его частного решения и общего решения соответствующего однородного уравнения. Доказательство. Пусть Y, — какое-либо частное решение неоднородного уравнения C7) и щ, v} — линейно независимые ре- решения соответствующего однородного уравнения C8). Тогда об- общее решение однородного уравнения C8) имеет вид а^+озд, где at и а2 — произвольные постоянные. Непосредственной подста- подстановкой проверяется, что функция yj = l'j+a1Mj+a2Uj C9) является решением неоднородного уравнения C7). Остается дока- доказать, что функция C9) является общим решением, т. е. что при соответствующем выборе параметров alt аг любое решение урав- уравнения C7) можно записать в виде C9). Пусть zs — любое реше- решение уравнения C7). Оно однозначно определяется заданием на- начальных условий z0 и zt. Поэтому для совпадения yh определен- определенного согласно C9), с заданным решением Zj достаточно потребо- потребовать 1/0 = 20, */i = Zi, Т. е. 0 = z0—Yo, Рассматривая эти условия как систему уравнений относитель- относительно «i, a2, получаем, что она имеет единственное решение, посколь- поскольку определитель отличен от нуля в силу линейной независимости решений ы„ Vj. Теорема 3 доказана. Частное решение неоднородного уравнения C7) можно постро- построить, если известны линейно независимые решения ии v^ соответст- соответствующего однородного уравнения C8). Для такого построения при- применяется метод вариации постоянных. Напомним метод вариации постоянных на примере дифференциального урав- уравнения У"(х)=Ч(х). D0) Пусть и(х), v(x)—линейно независимые решения соответствующего одно- однородного уравнения, т. е. и"(х)=0, о"(*)=0. D1) 31
Будем искать решение неоднородного уравнения D0) в виде * (*)-в (х) и (х)+Р (*)»(*), D2) где а.(х), P(.t)—функции, подлежащие определению. Для нахождения функций <х(х), $(х) необходимо получить два уравнения. Первое из них получается из требования, чтобы производная у'' (х) имела вид y'(x)=a(x)u'(x)+$[x)v'{x), D3) которое, очевидно, эквивалентно требованию ¦a'(x)u(x)+P'(x)v(x)=0. D4) Второе уравнение, связывающее а(х) и $(х), получается в результате под- подстановки D2) в исходное уравнение D0). Учитывая D3), D1), получим у" (х) = аи" (х) + pV' {х)+а'(х)и'(х)+Р(х)и'(х)=а'(х)и'(х)+$'(хH'(х). Следовательно, уравнение D0) будет выполнено, если а'(х)и'(х)+р'(х)о'(х)=-/(х). D5) Из системы уравнений D4), D5) найдем , Р(х) и (х) v' (х) — и' (х) v (х) и (х) v (х) — и (х) v (х) Знаменатель в полученных выражениях отличен от нуля, так как он является определителем Вронского для линейно независимых решений однородного урав- уравнения. Из выражений Dб) коэффициенты а(х), $(х) находятся в квадратурах. Обращаясь к разностному уравнению C7), будем искать его решение в виде yi = a,ui+$jvi, D7) где Uj, Vj — линейно независимые решения соответствующего од- однородного уравнения C8) и а}, р; — искомые функции. Потребуем по аналогии с D3), чтобы разность yj+i—г/, представлялась в виде у;+1—Vj). D8) Такое требование эквивалентно выполнению условия (aJ+.—а,)ы,+1+(р,+,—p,)i;J+1 = 0. D9) Далее, из D8) получим Уг-yt-i = «i-i («Г-"j-i) +Pi-i (у;~vi-i) или у,—yj.i=a.j(Uj—Uj-,)+$j(Vj—Vj-,)— q>j, E0) где ф1= («,—«,_,) (uj—u,_,) + (Pr-Pj-i) (Vr-Vj-i). Для дальнейшего удобно представить уравнение C7) в виде {ai—ci+bi)yj+bi{yj+,—yi)—ai(ys—yi-l)=—h E1) Подставляя в E1) выражения D7), D8), E0) и собирая ко- коэффициенты при а,-, р,-, получим а/ [(а/ — с/ + bi) Щ + */ (и/+1 — "/) — а/ («/ — «У-i)] + + Р/ [(а/ — с/ + 6/) у/ + fy- (У/ 32
Выражения, стоящие в квадратных скобках, равны нулю, пото- потому что и, и Vj являются решениями однородного уравнения C8). Следовательно, уравнение C7) будет выполнено, если потребо- потребовать а;-ф/=— fh т. е. (а, - ам) (и, - uhl) + (р,- - рм) (v, - vhl) = —^-. E2) Поскольку индекс / произволен, уравнение D9) можно перепи- переписать в виде (a,—«,_,)",+ (&—pJ-_1)oJ = 0. E3) Решая систему уравнений E2), E3), получим а,- — ам = Р/ — Р/-1 = — ¦ 'Jtut-i-utvt-i ai E4) xi viui-y-uivhx ai Знаменатель полученных выражений совпадает с определите- определителем uUj-Jk, v] (cm. B8)) и согласно лемме 2 не обращается в нуль ни в одной точке /. В результате суммирования каждого из урав- уравнений E4) получим А Подставляя найденные выражения для щ, Pj в формулу D7), получаем общее решение неоднородного уравнения C7) в виде у-, = аои,- 4 vk E5) где a0, ро — произвольные постоянные и и,-, и,- — линейно независи- независимые решения однородного уравнения C8). Отметим, что сумма является общим решением однородного уравнения C8), а сумма 4 vk ub vb 2 А. А. Самарский, А. В. Гул ни E6) 33
— частным решением неоднородного уравнения C7), соответству- соответствующим значениям ао = Ро = О. Следовательно, функция E5) являет- является общим решением неоднородного уравнения C7). В заключение параграфа отметим, что многие понятия и резуль- результаты, относящиеся к разностным уравнениям второго порядка, можно обобщить и на разностные уравнения произвольного по- порядка (см., например, [35]). § 4. Разностная аппроксимация дифференциальных уравнений Т. Сетки и сеточные функции. Для численного решения диффе- дифференциальных уравнений, обыкновенных и в частных производных, часто применяется метод сеток или разностный метод. В настоя- настоящем параграфе поясняются основные идеи разностного метода на самых простых примерах. Систематическое изложение теории раз- разностных методов содержится в ч. III (см. также [32]). Сеткой на отрезке [а, Ь] называется любое конечное множест- множество точек этого отрезка. Функция, определенная в точках сетки, на- называется сеточной функцией. Будем обозначать через «к сетку, удовлетворяющую условиям = b, A) и через /j —значение сеточной функции f(x) в точке л^ешл-, т. е. fi = f(Xi)- Точки ;с;е(о№ называются узлами сетки aN. Равномерной сеткой на [а, Ь] называется множество точек ш={хг = а+1п, » = 0, 1, ..., N}, B) где h= (b—a)IN — шаг сетки. Рассмотрим задачу о приближенном вычислении производных функции и(х), определенной и непрерывной на отрезке [а, Ь]. Бу- Будем считать, что и(х) обладает необходимой по ходу изложения гладкостью. Введем согласно B) сетку «Л и обозначим щ = и (xi), ы- . = (щ — и,-_,)/Л, ux,i = (ui+1 — Ui)/h, uQ =(ui+1 — Ui Выписанные здесь разностные отношения называются, соответ- соответственно, левой, правой и центральной разностными производными функции и(х) в точке x = xt. Если точка х{ фиксирована, а шаг h стремится к нулю (при этом t-»-oo), то каждое из упомянутых раз- разностных отношений стремится к значению производной функции и(х) в точке х^ Поэтому в качестве приближенного значения и'(х) можно взять любое из этих разностных отношений. Нетрудно получить выражение для погрешности, возникающей при замене дифференциального выражения разностным. Рассмот- Рассмотрим, например, левую разностную производную в точке x = xt и запишем ее в виде u(x) — u(x — h) Ux,i 34
По формуле Тейлора получим a (.v _ К) = и (х) - hu' (х) + —- и" @, ?<=(*- А, х), следовательно, и-хЛ = и'(Х1)-±иГ&). C) Погрешность и-(.—и'(^), возникающая при замене дифферен- дифференциального выражения и'(я) разностным выражением «*,<, назы- называется погрешностью аппроксимации. Из разложения C) видно, что погрешность аппроксимации является величиной О(п) при Л-»-0. В этом случае говорят, что имеет место аппроксимация пер- первого порядка. Приведем разложения, аналогичные C), для других разност- разностных отношений: их,{ = и' (хс) + А и" (d11), d1' «= (^, */«). D) а. ="'(*.¦) + —""(??'), ^'е^^.лг.чО- E) Из разложения E) видно, что центральная разностная произ- производная аппроксимирует и'(х) со вторым порядком и, следователь- следовательно, является более точным приближением к и'{х), чем левая или правая разностные производные. В дальнейшем наряду с C) — E) будем использовать менее детальную запись тех же разложе- разложений, а именно и- . = и\ + О (h), ux.c =u( + O(h), и*. = и\ + О (h>). Вторую производную и" (х) можно приближенно заменить в точке Xi^0)h второй разностной производной F) Разложение по формуле Тейлора приводит к следующему вы- выражению для погрешности: т. е. имеет место аппроксимация второго порядка. Мы привели простейшие примеры аппроксимации дифференци- дифференциальных выражений разностными на равномерной сетке. В общем случае погрешность, возникающая в результате замены дифферен- дифференциального выражения разностным, зависит как от распределения узлов сетки, так и от гладкости функции. 2. Разностная краевая задача. Первая краевая задача для уравнения u"(x)=-f(x) (8) состоит в отыскании функции и(х), дважды непрерывно диффе- 2* 35
ренцируемой на интервале (а, Ь), непрерывной на отрезке [а, Ь], удовлетворяющей уравнению (8) при хе(й, Ь) и дополнительным условиям и(а) =ixu u(b)=vL2, (9) где (ii, |i2 — заданные числа. Нетрудно построить решение задачи (8), (9) в виде квадратур. Предста- Представим и(х) в виде суммы двух функций: u(x) = v(x)+w(x), где и"(*)=0, xs(a, b), о(а) = ц,, v(b) = li2, A0) w"(x)=—f(x), *е=(а, b), w{a)=w{b)=0. A1) Решением задачи A0) является линейная функция A2) b— a b — a Далее, интегрируя уравнение A1), получим t w' (/) =w'(a)-\f (s) ds. a Интегрируя еще раз предыдущее соотношение и учитывая условие ю(а)=0„ получим х / t . w (x) = (x — a)w'(a) — [\\f (s) ds dt. a \a ) Из условия w(b)=0 получаем, что ь , t b — a , a и, следовательно, Ь , t % x , t Решение краевой задачи (8), (9) есть сумма функций A2) и A3). Для численного решения задачи (8), (9) введем на отрезке [а, Ь] равномерную сетку с шагом h согласно B) и заменим и"(х{) второй разностной производной и-х .. Тогда вместо дифференци- дифференциального уравнения (8) получим разностное уравнение второго по- порядка Л2 Это уравнение можно записать для t=l, 2, ..., N—1, т. е. во всех внутренних точках сетки сол- В граничных точках в соответствии с (9) следует положить ио = Ц|, uN = \i2. A5) 36
Таким образом, применение разностного метода позволяет за- заменить исходную дифференциальную задачу (8), (9) системой из (N—1) линейных алгебраических уравнений A4), A5) относи- относительно неизвестных ии и2, .. . , uN-i. Система уравнений A4), A5) называется разностной схемой или разностной краевой задачей, соответствующей исходной дифференциальной задаче (8) — (9). В дальнейшем, чтобы не было путаницы в обозначениях, будем через и(х) обозначать решение дифференциальной задачи и через yi = y{Xi) —-решение разностной задачи. Итак, мы получили разностную схему у^-Чу^Уи, =_/,> i=i,2,...,tf-lf A6) В связи с этой разностной схемой возникают следующие про- проблемы, которые типичны для разностных методов вообще. Во-пер- Во-первых, необходимо убедиться, что система линейных алгебраических уравнений A6) имеет единственное решение, и указать алгоритм, позволяющий получить это решение. И, во-вторых, надо показать, что при стремлении шага сетки h к нулю решение разностной за- задачи будет сходиться к решению исходной дифференциальной задачи. Вопросы разрешимости и сходимости разностной задачи A6) будут исследованы в п. 6. Построим по аналогии с A3) точное решение разностной зада- задачи A6). Представим у{ в виде суммы yi = Vi+Wi, 1 = 0, 1, ..., N, где vxx.i = 0> i=l. 2, ..., N—1, »o = |J.i, vy = [i2, A7) w;xj=-fi> /=1,2, .... JV —1, wo='wN=O. A8) Запишем A7) подробнее: vt-t—2Vi+vt+1 = 0, i = l, 2, ..., N—\, и заметим, что соответствующее характеристическое уравнение q2—2G+1=0 имеет кратный корень q=\. Поэтому согласно B5) из § 3, реше- решение разностной краевой задачи A7) имеет вид Учитывая, что ; х, — о. N b — а ' можно записать о( в виде, аналогичном A2), т. е. Ъ X: X; п Т^+7На- Ъ—а Ь — а 37
Найдем явное выражение для wt. Для этого перепишем урав- уравнение A8) в виде цТ.т - wIj = - Л//. /=1,2 N-1, и просуммируем по / от 1 до k. Тогда получим или Суммируя последнее уравнение по k от 1 до i—1 и учитывая, что а>о = О, получим 1-1 ft Отсюда и из условия wN = Q находим к=\. /=i следовательно, f,, i = 2, 3, ...,JV-1, B0) Формула B0) является разностным аналогом формулы A3). 3. Некоторые разностные тождества. Для сеточных функций выполняются разностные аналоги некоторых формул дифференци- дифференциального и интегрального исчисления. Для простоты изложения будем рассматривать равномерную сетку B). Разностными ана- аналогами формулы дифференцирования произведения (uv)' = u'v+ +uv' являются тождества = yiVXiC + yx,iVC+1. B1) Суммируя B1) по i от 1 до N—1, получим N-1 Л/-1 yuvN — i^t»! = 2 tyVx.t + 2 i=i i=i или JV-l N 2 %iu*,?=— 2 ftf/?,i°i' 1=1 i=2 38
Учитывая, что получим Обозначая = M#i — Уо)~ М-1 N N-1 (W, Z) = (w, z\ — перепишем последнее тождество в виде {У, vx) = — (и, у-] + yNvN — yovlm B2) B3) Тождество B3) является разностным аналогом формулы инте- интегрирования по частям * ь и называется формулой суммирования по частям. 4. Разностная задача на собственные значения. Задача на соб- собственные значения и"(х)+ки(х)=0, а<х<Ь, и(а)=и(Ь)=0 B4) имеет решение . ( nk \2 . ч ,пnk(х-а) , . 0 Л? — ¦ I ~¦"—~——¦ I ttfe \s*} ш Sill — у /с —~— 11 ?} • • • \ Ь — a J ' b—a Рассмотрим на равномерной сетке B) разностный аналог за- задачи B4), = 0, /=1,2,..., N-1, B5) Уо = У* = О, hN = b—a, yj = y(Xj), Xj Система уравнений B5) представляет собой задачу на собствен- собственные значения 0 0 0" 0 0 0 0 0 0 для симметричной матрицы 2—1 0 о 2—1 0 А = —1 0—1 2 —1 0 0 0 0 ... —1 2—1 _ 0 0 0 0 ... 0—1 2_ 39
порядка Л'—1. Поэтому существует ровно N—1 вещественных соб- собственных значений Я?'1), /г=1, 2, .... N—1, матрицы А. Построим в явном виде собственные значения и собственные функции зада- задачи B5). Перепишем разностное уравнение B5) в виде B6) и рассмотрим отвечающее B6) характеристическое уравнение <7»-B-ц)<7+1=0. B7) Общее решение уравнения B6) имеет вид yl = c1q[ + cig'i, B8) где сь с,_ — произвольные постоянные и qu q2— корни уравнения B7). Из граничных условий ya = yN = 0 получаем Cl + с2 = 0, сл? + ся<? = 0. Эта однородная система уравнений имеет нетривиальное реше- решение при условии Учитывая, что q^ — 1. приходим к условию qf = \. B9) Отсюда, представляя qt в тригонометрической форме ?i = pe", получим р= 1 и Ф = ^-. *=1,2, .... N-1. C0) С другой стороны, из уравнения B7) имеем следовательно, соэф= 1—0,5A, и из C0) получим и = 2 A — cos ф) = 4 sin2 — = 4 sin2 — . ^ v Yy 2 2Л/ Таким образом, собственные числа задачи B5) имеют вид U/2) =-±-sin2^-, k = \,2, ..., N-l, C1) где hN — b—a. Собственные функции г/j вычисляются согласно B8), где с2 = = —с{. Так как G^2 = 1. то У1 = Сх (<7{ - <?0 = сх (q[ - q;') = с, (е^ - e^)f 40
где ф определено согласно C0). Полагая Ci = —0,5/, получим ,,(k) <-;n n^i и ; io Л/ 1 И91 Собственные функции C2) определены с точностью до произволь- произвольного постоянного (не за- зависящего от /) множителя. Интересно сопоставить решения дифференциаль- дифференциальной B4) и разностной B5) задач на собствен- собственные значения. Значения собственных функций C2) разностной задачи совпа- 2.5000 1ОООО 5000 ю 25 50 к Рис. 3. Собственные значения дифференциаль- дифференциальной задачи (сплошная черта) и разностной схемы дают в точках сетки со значениями собственных функций дифференциаль- дифференциальной задачи. Спектр диф- дифференциальной задачи не ограничен, т. е. Хк-^°° при &-»-оо, в то время как спектр разностной задачи ограничен сверху при каждом фиксированном шаге h числом 4/г2. Для каждого фиксированного номера k^ka, где ka не зависит от h, собственные значения Я|А) разностной задачи сходятся при /i->0 к соответствующему собственному значению Kh дифференци- дифференциальной задачи, т. е. При этом собственные значения разностной задачи B5) всегда меньше соответствующих собственных значений дифференциаль- дифференциальной задачи B4). Погрешность Kk—Я*й) минимальна для малых но- номеров k и сильно возрастает с ростом k. На рис. 3 изображены гра- графики Кк (сплошная черта) и Я^' в зависимости от номера k для значений а = 0, Ъ= 1, N = 25 и N = 50. 5. Свойства собственных значений и собственных функций. Перечислим свойства собственных значений и собственных функ- функций разностной задачи B5). Прежде всего из C1) видно, что Последнее неравенство неулучшаемо, так как <, (м 4 « nh Л v-i = — COS ft2 2 (b — а) И COS"* 2(b-a) 1 при /г^-0. Оценку снизу для наименьшего 41
собственного значения Х{ можно уточнить. Обозначая а= = nh/B(b—а)), получим _л (sina. —¦ Л1 I V а где Кг = ( ) —наименьшее собственное значение дифферен- \ Ь — а / циальной задачи. Не ограничивая общности, можно предположить, что h^.(b—а)/3. Тогда а^я/б, и поскольку функция sin а/а мо- монотонно убывает при ае[0, я/6], получим /sin« [а ) " [ 2 л т. е. k[h) >9/(Ь_ оJ. C3) Таким образом, наименьшее собственное значение задачи B5) отделено от нуля константой б4 = 9/F—аJ, не зависящей от h. Покажем теперь, что собственные функции C2) задачи B5), отвечающие различным собственным значениям, ортогональны в смысле скалярного произведения C4) Запишем уравнение B5) для функций у(к) и уи) в виде ^,. + «'=0, C5) *0/+М'У) = о. C6) Умножим уравнение C5) скалярно на уи\ уравнение C6) — на г/ и вычтем из первого полученного равенства второе. Тогда будем иметь (yfx, У{1)) - (yfx, У™) = (W - ^"') Wk), </">)• C7) Из разностного аналога формулы интегрирования по частям B3), учитывая условия г/<" = г/^ = О, получим и точно так же {y{l,y{k)) — (y^y^] = -{y'ly^\. Следовательно, левая часть равенства C7) обращается в нуль, и поскольку Т^фУМ при 1гф1, получаем (ywt ум)=0, если кф1. Множество функций У= (Уо, Ук Уг,-.-, У*-1, У*), yj = y(X}), заданных на сетке B) и удовлетворяющих нулевым граничным 42
условиям уо = Ук = О, образует (N—1)-мерное линейное пространст- пространство Н относительно покоординатного сложения и умножения на число. Собственные функции ут, k=\, 2, ..., N—1, задачи B5) ортогональны и, следовательно, линейно независимы в Н. Тем са- самым множество собственных функций задачи B5) образует орто- ортогональный базис в Н. Нетрудно показать, что для всех k=\, 2, ..., N—\. Следовательно, множество собственных функций \x.w, k= 1, 2,... , с координатами b—a образует в Н ортонормированный базис. Любой элемент г/ей можно единственным образом представить в виде разложения 6. Разрешимость и сходимость разностной задачи. Обратимся к исследованию разностной задачи A6). Прежде всего теперь можно утверждать, что система линейных алгебраических уравне- уравнений A6) имеет единственное решение. Действительно, в предыду- предыдущем пункте показано, что матрица системы A6) не имеет нуле- нулевых собственных значений. Поэтому отвечающая A6) однородная система уравнений ц. 2t/j + U;+ =0 t= I 2 Л^ 1 Vo==V —0 имеет только тривиальное решение и, следовательно, неоднород- неоднородная система A6) имеет единственное решение. Исследуем сходимость при й-»-0 решения разностной задачи A6) к решению исходной дифференциальной задачи (8)—(9). Обозначим через погрешность в точке х{, т. е. разность между решениями задач B5) и (8)—(9). Подставляя в A6) вместо у{ сумму г{+и(х{), i= = 1, 2, ..., N—1, получим, что погрешность удовлетворяет разно- разностному уравнению +1 . •. 1 п М 1 у = 7 = 0 (^8^ ,q III ~ 1 »¦"-» » где ф, = u-x.-\-fi. C9) Сеточная функция г|5,- называется погрешностью аппроксимации или невязкой разностной схемы A6) на решении задачи (8)—(9). 43
Записывая 1|,\ в виде *.• = (";,,<-«'(*.¦)) + («"'(*<) +Л) и учитывая, что согласно (8) выполняется равенство и" (*,)+/, = О, получим 1" = "«.( — ""(*<)• Разложение по формуле Тейлора показывает, что если uIV(*) ограничена, то i|), = O(/i2) при /i->0. По этой причине говорят, что разностная схема A6) имеет второй порядок аппроксимации на решении исходной задачи (8)— (9). Наша ближайшая цель — по- показать, что схема A6) сходится, т. е. 2,-^-0 при /г->0 и, более того, имеет второй порядок точности, т. е. 2,- = О (п2). Воспользуемся возможностью получить решение задачи C8) в явном виде. Уравнение C8) отличается от изученного ранее уравнения A8) только обозначениями. Поэтому согласно B0) ре- решение задачи C8) представляется в виде * ¦= T37 2 h S A*/ - S h 2 h^> i = 2'z *• Из разложения по формуле Тейлора и ограниченности uIV(^) следует, что существует постоянная >0, не зависящая от А и от /и такая, что I.A», /=1, 2, ..., Л/-1. Поэтому из формулы D0) следует оценка т. е. Выражение в квадратных скобках равно i(N+i—2) и оценива- оценивается сверху числом 2N1. Таким образом, т. е. \zt\ =O(h2) при h-+Q, i=l, 2 Л^— 1. В этом случае говорят, что схема имеет второй порядок точности. Отметим, что приведенный здесь способ исследования сходи- сходимости, основанный на явном представлении решения разностной задачи, непригоден для более сложных задач. Другие методы ис- исследования сходимости разностных схем излагаются в части III. 44
7. Метод прогонки. Система уравнений A6) представляет со- собой частный случай систем линейных алгебраических уравнений с трехдиагональнои матрицей Л=[ай], т. е. с матрицей, все эле- элементы которой, не лежащие на главной и двух побочных диагона- диагоналях, равны нулю (atj=0 при j>i+l и j<Zi—1). В общем случае системы линейных алгебраических уравнений с трехдиагональнои матрицей имеют вид = —/,, / = 1, 2, ..., N— 1, D1) i+ii2- D2) Для численного решения систем с трехдиагональными матри- матрицами применяется метод прогонки, который представляет собой вариант метода последовательного исключения неизвестных. Осо- Особенно широкое применение метод прогонки получил при решении систем разностных уравнений, возникающих при аппроксимации краевых задач для дифференциальных уравнений второго по- порядка. Приведем вывод расчетных формул метода прогонки. Будем искать решение системы D1) в виде «Л-=ажг/ж+рж, / = 0, 1, ..., N— 1, D3) где aJ+i, Рй-i — неизвестные пока коэффициенты. Отсюда найдем Уl-i =>/«//]+ Р/ = a/ (a/+i«//+i + P/+0 + Р/ = = a/a/+i«//+i + (a/P/+i + р/), / = 1, 2, ..., N — 1. Подставляя полученные выражения для yjt yi^i в уравнение D1), приходим при /= 1,2,..., N—1 к уравнению (flja,—ct) +а&+М = 0. Последнее уравнение будет выполнено, если коэффициенты j+ Pi-M выбрать такими, чтобы выражения в квадратных скоб- скобках обращались в нуль. А именно, достаточно положить . Р/ с/ - aiai ci ~ aiai /=1,2 iV-1.D4) Соотношения D4) представляют собой нелинейные разностные уравнения первого порядка. Для их решения необходимо задать начальные значения alt pt. Эти начальные значения находим из требования эквивалентности условия D3) при / = 0, т. е. условия e/o—a^i + fJi, первому из уравнений D2). Таким образом, получаем ai = xIf р, = (ц- D5) Нахождение коэффициентов aj+I, pj+1 по формулам D4), D5) называется прямой прогонкой. После того как прогоночные коэф- коэффициенты аж, Pj+ii / = 0, 1, ¦•-, N—1, найдены, решение системы D1), D2) находится по рекуррентной формуле D3), начиная с 45
}=N—1. Для начала счета по этой формуле требуется знать у„, которое определяется из уравнений и равно (х2р^+р.г)/A—х2а*)- Нахождение у, по формулам У! = ai+1yi+1 + Р/+1, / = tf — 1, N — 2, ..., О, г/.v = — D6) 1 yCL называется обратной прогонкой. Алгоритм решения системы D1), D2), определяемый по формулам D4) — D6), называется методом прогонки. Применяются и другие варианты метода прогонки (см. [32]). Метод прогонки можно применять, если знаменатели выраже- выражений D4), D6) не обращаются в нуль. Покажем, что для возмож- возможности применения метода прогонки достаточно потребовать, что- чтобы коэффициенты системы D1), D2) удовлетворяли условиям а,Ф0, Ь,Ф0, |с^|а,-| + |&,|, /=1, 2, .... N-1, D7) |х,|^1, |х2|<1. D8) Заметим, что числа аь ft,-, с,-, хь х2 могут быть комплексными. Сначала докажем по индукции, что при условиях D7), D8) модули прогоночных коэффициентов <Xj, /=1, ..., iV—1, не превос- превосходят единицы. Согласно D5), D8) имеем |ai| = |xi|^l. Предпо- Предположим, что |а,|^1 для некоторого / и докажем, что |aj+i|^l. Из оценок \сг-оса|>| |Cj| — |ocj| \ъ\ |>| \cj\ — |a:-| | и условий D7) получаем \cj—aiai\^\bj\>0, т. е. знаменатели выражений D4) не обращаются в нуль. Более того, |С/-аЛ| Следовательно, |сс^|^1, /=1, 2, ..., N. Далее, учитывая второе из условий D8) и только что доказанное неравенство |аЛ-]<;1, имеем т. е. не обращается в нуль и знаменатель в выражении для у„. К аналогичному выводу можно прийти и в том случае, когда условия D7), D8) заменяются условиями a^O, b^O, \с,\>\а,\ + \Ь1\, }=l,2t...,N-l, .D9) |xi|<l, |х,|<1. E0) В этом случае из предположения |а;| ^1 следует 46
т. е. все прогоночные коэффициенты, начиная со второго, по моду- модулю строго меньше единицы. При этом |1—y.2aN\^l — |x2||aw|^ >1 — |aw|>0. Таким образом при выполнении условий D7), D8) (так же как и условий D9), E0)) система D1)—D2) эквивалентна системе D4) — D6). Поэтому условия D7), D8) (или условия D9), E0)) гарантируют существование и единственность решения системы D1), D2) и возможность нахождения этого решения методом про- прогонки. Кроме того, доказанные неравенства |с^| ^1, /= 1, 2, ..., N, обеспечивают устойчивость счета по рекуррентным формулам D6). Последнее означает, что погрешность, внесенная на каком-либо шаге вычислений, не будет возрастать при переходе к следующим шагам. Действительно, пусть в формуле D6) при / = /о+1 вместо yh+l вычислена величина yja+i=yk+i + f)k+i. Тогда на следующем шаге вычислений, т. е. при / = /0, вместо r/JO = c?J(,+,f/JO+1+.[Jio+i получим ве- величину ^Jrj = ajo+i(i/jo+i + 6Jo+i) + Pjo+i и погрешность окажется равной 6/. =Уи—Уи = «/of A'.+i- Отсюда получим, что |6jo[ ^ |ajo+,| |6jo+i| sg |б;о+1|, т. е. погрешность не возрастает. Отметим, что для разностной краевой задачи A6), записанной в виде ^-h2fj, /=1, 2, ..., JV—1, имеем uj = bj=\, с, = 2, xi = x2 = 0. Поэтому выполнены условия устой- устойчивости D7), D8) и решение задачи A6) можно отыскивать ме- методом прогонки.
ЧАСТЬ II ЧИСЛЕННЫЕ МЕТОДЫ АЛГЕБРЫ И АНАЛИЗА ГЛАВА 1 ПРЯМЫЕ МЕТОДЫ РЕШЕНИЯ СИСТЕМ ЛИНЕЙНЫХ АЛГЕБРАИЧЕСКИХ УРАВНЕНИИ В главах 1, 2 рассматриваются численные методы решения си- систем линейных алгебраических уравнений Ax = U A) где А — матрица ту.т, х= (хи х2, ..., хт)Т—искомый вектор, / = = (fi, /г, •••, fm)T—заданный вектор. Предполагается, что опреде- определитель матрицы А отличен от нуля, так что решение х существует и единственно. Для большинства вычислительных задач характер- характерным является большой порядок матрицы А. Из курса алгебры из- известно, что систему A) можно решить по крайней мере двумя спо- способами: либо по формулам Крамера, либо методом последователь- последовательного исключения неизвестных (методом Гаусса). При больших m первый способ, основанный на вычислении определителей, требует порядка пг\ арифметических действий, в то время как метод Гаус- Гаусса— только 0{пг3) действий. Поэтому метод Гаусса в различных вариантах широко используется при решении на ЭВМ задач линей- линейной алгебры. Методы численного решения системы A) делятся на две груп- группы: прямые методы и итерационные методы. В пряЖых (или точ- точных) методах решение х системы A) находится за конечное число арифметических действий. Примером прямого метода является ме- метод Гаусса. Отметим, что вследствие погрешностей округления при решении задач на ЭВМ прямые методы на самом деле не приводят к точному решению системы A) и называть их точными можно лишь отвлекаясь от погрешностей округления. Сопоставление раз- различных прямых методов проводится обычно по числу арифметиче- арифметических действий (а еще чаще—по асимптотике при больших m чис- числа арифметических действий), необходимых для получения реше- решения. При прочих равных условиях предпочтение отдается методу с меньшим числом действий. Итерационные методы (их называют также методами последо- последовательных приближений) состоят в том, что решение х системы A) находится как предел при п-+оо последовательных приближений х1п), где п — номер итерации. Как правило, за конечное число ите- итераций этот предел не достигается. Обычно задается некоторое ма- 48
лое число е>0 (точность) и вычисления проводятся до тех пор, пока не будет выполнена оценка IU<n)—*||<в. B) Число итераций п = п(е), которое необходимо провести для по- получения заданной точности е (т. е. для выполнения оценки B)), для многих методов можно найти из теоретических рассмотрений. Качество различных итерационных процессов можно сравнивать по необходимому числу итераций я(е). К решению систем линейных алгебраических уравнений сводит- сводится подавляющее большинство задач вычислительной математики. В настоящее время предложено колоссальное количество алгорит- алгоритмов решения задач линейной алгебры (см. [8, 35]), большинство из которых рассчитано на матрицы А специального вида (трехдиа- гональные, симметричные, ленточные, большие разреженные мат- матрицы). Прямые методы, которые рассматриваются в гл. 1, не предпо- предполагают, что матрица А имеет какой-либо специальный вид. На прак- практике они применяются для матриц умеренного порядка (порядка ста). Итерационные методы, рассмотренные в гл. 2, можно приме- применять и для матриц высокого порядка, однако их сходимость не очень быстрая. Более совершенные прямые и итерационные мето- методы, учитывающие структуру матрицы, излагаются в части III. § 1. Метод Гаусса численного решения систем линейных алгебраических уравнений 1. Основная идея метода. В ближайших двух главах рассмат- рассматриваются численные методы решения системы линейных алгебраи- алгебраических уравнений Ax = f, A) где А — вещественная квадратная матрица порядка т., a f — за- заданный и х — искомый векторы. Будем предполагать, что опреде- определитель матрицы А отличен от нуля. Тогда для каждого вектора f система A) имеет единственное решение. Запишем систему A) в развернутом виде апхг + апх2 + ... + ашхт = /ь «21*1 + а22*2 + ... + агпхт = /2, B) Метод Гаусса решения системы B) состоит в последовательном исключении неизвестных хи хг, ..., хт из этой системы. Предполо- Предположим, что <ХцФ0. Поделив первое уравнение на аи, получим Xi + СцХгА Vcimxm = yu C) где —/ = 2 m У! = — . 49 ii = —, / = 2, ..., m, У! = — .
Рассмотрим теперь оставшиеся уравнения системы B): auXi + ai2x2 + ... + aimxm = fit I = 2, 3, ..., m. D) Умножим (З) на а,-, и вычтем полученное уравнение из 1-го урав- уравнения системы D), i = 2, .... т. В результате получим следующую ^систему уравнений: E) F) uinjXj -f- . . . Здесь обозначено cti} — аи — Сцпц, /ll) = /г — Матрица системы E) имеет вид I A) ГA) i,/ = 2, 3 m. 1 сл, о 'Матрицы такой структуры принято обозначать так: X ... X" о X X о X X. где крестиками обозначены ненулевые элементы. В системе E) не- неизвестное х, содержится только в первом уравнении, поэтому в дальнейшем достаточно иметь дело с укороченной системой урав- уравнений "Г ¦ • • "Г О.т\Х\ -+"... "Т" UinmXm — G) Тем самым мы осуществили первый шаг метода Гаусса. Если .дШг^О, то из системы G) совершенно аналогично можно исклю- исключить неизвестное хг и прийти к системе, эквивалентной B) и имею- имеющей матрицу следующей структуры: X X ... X' 0 1 X ... X 0 0 X ... X _о 0 х ... х. При этом первое уравнение системы E) остается без изменения. 50
Исключая таким же образом неизвестные х3, хк, ..., хт, придем окончательно к системе уравнений вида Х\ "I ^12^ ~Т~ • • • ~Г С\т%т ==^/lt •^2 1 • • • i СчтХт = ?/2i (8) Хщ—i ~Т~ С/п—1,пЛп==|Лл—li Хщ == эквивалентной исходной системе B). Матрица этой системы с, с12 О О о О О 1 содержит нули всюду ниже главной диагонали. Матрицы такого вида называются верхними треугольными матрицами. Нижней тре- треугольной называется такая матрица, у которой равны нулю все элементы, расположенные выше главной диагонали. Получение системы (8) составляет прямой ход Метода Гаусса. Обратный ход заключается в нахождении неизвестных хи х2, ¦ ¦ ., х„, из системы (8). Поскольку матрица системы имеет треугольный: вид, можно последовательно, начиная с хт, найти все неизвестные. Действительно, хт = ут, хт-,=ут-,—ст-1тхт и т. д. Общие формулы,- обратного хода имеют вид ; = Ус— - = ут. A0) 2. Расчетные формулы. При реализации на ЭВМ прямого хода метода Гаусса нет необходимости действовать с переменными Xi, х2, ¦ ¦., хт. Достаточно указать алгоритм, согласно которому ис- исходная матрица А преобразуется к треугольному виду (9), и ука- указать соответствующее преобразование правых частей системы. По- Получим эти общие формулы. Пусть осуществлены первые k—1 ша- шагов, т. е. уже исключены переменные хи х2, ..., xh-i. Тогда имеем систему с12х2 -f- -f с1тхт = уи С2тХт — у2, =Ук-и A1) -f- "Am Xm = 61
Рассмотрим k-e уравнение этой системы a-kk Xk + ... + akm xm = fk и предположим, что af-^^O. Поделив обе части этого уравнения на й^', получим где Cki = • / = k -f- 1, k -f- 2, . . ., /П. ' ' (ft-1) ' I • I • . ukk Далее, умножим уравнение A2) па afk~l) и вычтем полученное со- соотношение из i-ro уравнения системы A1), где i = k + 1, k + 2, ..., т. В результате последняя группа уравнений системы A1) примет вид Xk ~Г Ck,k+lXk+l ~Т~ • • • ~Г" Ck.rn.Xtn == Ук, "k+i "Т • • • Т fl*+i,m*m === /ft+lt .+ ... +^ где ati ==а?ГУ) ~ а%~1)сЫ' i. / = ^ + 1. k + 2. • • •. m- /i = /i —¦ CLik Ук, t = ft "f" 11 ^ "f" 2, . . ., ffl. Таким образом, в прямом ходе метода Гаусса коэффициенты уравнений преобразуются по следующему правилу: afj = aki, k,j=\, 2, .... tn, i, / = ft+l, fe + 2, ..., m, /г = 1, 2, ..., m—1. Вычисление правых частей системы (8) осуществляется по фор- формулам ff = fk, yk = J±l-t ft=l,2, ..., tn, A5) Ak) г (й~1) {й—l) • » I ( » f о *ч /1 c\ U = H —a'ft Ук> l ==ft r '> ft "Г *. • • -t m- У1®) Коэффициенты Cij и правые части yh i= 1, 2, ..., tn, j — i+l, i + 2, ... 52
..., m, хранятся в памяти ЭВМ и используются при осуществлении обратного хода по формулам A0). Основным ограничением метода является предположение о том, что все элементы аыГ1', на которые проводится деление, от- отличны от нуля. Число oil' называется ведущим элементом на k-м шаге исключения. Даже если какой-то ведущий элемент не равен нулю, а просто близок к нему, в процессе вычислений может проис- происходить сильное накопление погрешностей. Выход из этой ситуации состоит в том, что в качестве ведущего элемента выбирается не Okk i а другое число (т. е. на k-м шаге исключается не хк, а дру- другое переменное xh j?=k). Наиболее последовательно такая страте- стратегия выбора ведущих элементов осуществлена в методе Гаусса с вы- выбором главного элемента (см. § 3). 3. Подсчет числа действий. Подсчитаем число арифметических действий, необходимых для решения системы B) с помощью мето- метода Гаусса. Поскольку выполнение операций умножения и деления на ЭВМ требует гораздо больше времени, чем выполнение сложе- сложения и вычитания, ограничимся подсчетом числа умножений и де- делений. Читатель по аналогии может самостоятельно найти требуе- требуемое число действий сложения и вычитания. 1. Вычисление коэффициентов cw, k = l, 2, .. ., m, j = k+l, k + 2, ..., m, по формулам A3) требует делений. 2. Вычисление всех коэффициентов ар по формулам A4) тре- требует "у (ш_?J = 12 + 22+ ... +(m-lJ=(m~1)mBm-') ft, 6 умножений. Таким образом, вычисление ненулевых элементов сц треуголь- треугольной матрицы С требует m(m—\) , (m—\)m Bm — 1) (m2 — 1) m 2 6 ~~ 3 операций умножения и деления. При больших m это число действий равно приблизительно пг3/3. 3. Вычисление правых частей ук по формулам A5) требует m делений, а нахождение /f по формулам A6) 53
умножений. Следовательно, вычисление правых частей преобразо- преобразованной системы (8) требует , т(т— 1) т (т+ 1) 2 ~~ 2 действий умножения и деления. В итоге для осуществления прямого хода метода Гаусса необхо- необходимо выполнить (д'-llffl , т(т+\) _т(т+\)Bт+\) действий, из которых основное число действий (порядка тп3/3) при- приходится на вычисление элементов матрицы С. 4. Для осуществления обратного хода метода Гаусса по фор- формулам A0) требуется умножений. Итак, для реализации метода Гаусса требуется выполнить т(т+ 1) Aт+ 1) , т (т — 1) _ т (та + 3/я — 1) 6 2 ~ 3 действий умножения и деления. Подчеркнем, что основное время расчета затрачивается на осуществление прямого хода. Для больших т число действий умножения и деления в методе Гаусса близко к т3/3. Это означает, что на вы- вычисление одного неизвестного тратится в среднем /п2/3 действий. По затратам времени и необходимой машинной памяти метод Гаус- Гаусса пригоден для решения систем уравнений B) общего вида с чис- числом неизвестных т порядка 100. § 2. Условия применимости метода Гаусса 1. Связь метода Гаусса с разложением матрицы на множители. В предыдущем параграфе было показано, что метод Гаусса преоб- преобразует исходную систему уравнений Ax=f A) в эквивалентную систему Сх=у, B) где С — верхняя треугольная матрица с единицами на главной диа- диагонали. Выясним теперь, как связаны между собой векторы правых частей f и у. Для этого обратимся к формулам A6) из § 1, из ко- которых последовательно получим /i = auyi, U = <h\4\ + а%У2, ¦ ¦ • и вообще fJ=bjiyi-\-b]2y2+ ...+ bSjyh j= 1, 2, .... т, C) Б4
где bjt—числовые коэффициенты, причем bjs=a<jirl). Соотношения C) можно записать в матричном виде f = By, D) где В —нижняя треугольная матрица с элементами а*'~1), / = = 1, 2, ..., т, (a^' = flu) ыа главной диагонали. Напомним, что ос- основное допущение при формулировке метода Гаусса состояло в том, что все aS.<rli фО. Поэтому на диагонали матрицы В стоят ненуле- ненулевые элементы, и, следовательно, матрица В имеет обратную. Подставляя в уравнение B) выражение для у в виде y = B~lf, приходим к уравнению Cx=B-*f, или, что то же самое, к уравнению BCx = f. E) Сопоставляя E) с уравнением A), приходим к выводу, что в ре- результате применения метода Гаусса получено разложение исход- исходной матрицы А в произведение А = ВС, где В — нижняя треуголь- треугольная матрица с ненулевыми элементами на главной диагонали и С — верхняя треугольная матрица с единичной главной диаго- диагональю. Теперь мы имеем право трактовать метод Гаусса следующим образом. Пусть заданы матрицы А и вектор f. Сначала проводится разложение А в произведение двух треугольных матриц, А = ВС. Затем последовательно решаются две системы уравнений By = f, F) Сх=у G) с треугольными матрицами, откуда и находится искомый вектор х. Разложение А = ВС соответствует прямому ходу метода Гаусса, а решение системы F) — G)—обратному ходу. Заметим, что в алгоритме, изложенном в § 1, разложение А = ВС и решение си- системы F) проводится одновременно. Далее, следуя стандартным обозначениям, нижние треугольные матрицы будем обозначать буквой L (от английского lower — ниж- нижний) и верхние треугольные — буквой U (от английского upper — верхний). 2. Теорема об LfZ-разложении. Обозначим через А^ угловой минор порядка / матрицы А, т. е. = detfa" Н Am= detA. Теоретическое обоснование возможности разложения матрицы в произведение двух треугольных матриц содержит следующая Теорема 1 (теорема об L/7-разложении). Пусть все угловые миноры матрицы А отличны от нуля, Д^О, /=1, 2, ..., т. Тогда 55
матрицу Л можно представить, причем единственным образом, в ви- виде произведения A = LU, (8) где L — нижняя треугольная матрица с ненулевыми диагональными элементами и U — верхняя треугольная матрица с единичной диа- диагональю. Доказательство. Докажем сформулированное утверждение сначала для матриц второго порядка. Будем искать разложение матрицы A = в виде hi 0 Г1 u121 kx кЛ Lo i J' где 1ц, ku L22, Щг—неизвестные пока числа. Для их нахождения при- придем к системе уравнений /21^12 + Uz~a22, которая имеет единственное решение Д11а22 — а21а12 По предположению теоремы а„=#=0, аиОггт^агАг, следовательно, элементы /и и /22 отличны от нуля. Дальнейшее доказательство проведем методом индукции. Пусть утверждение теоремы справедливо для матриц порядка k—1; дока- докажем, что оно справедливо и для матриц порядка k. Представим матрицу А порядка k в виде А = (9) и обозначим Г°п ¦¦¦ ellfe-i "I [aik 1 = , aft-i = . . bft-1,1 ••• Ofe-i.fe-J L^-lJ bk-i= (akl, ..., aft,s_i). Согласно предположению индукции существует требуемое разло- разложение матрицы Ak-i, т. е. где 56 f-i— соответственно нижняя и верхняя треугольные мат-
рицы, обладающие указанными в теореме свойствами. Будем искать разложение матрицы (9) в виде где /й_ь и,{-1—неизвестные пока векторы, lk-i = ('All 'а2, • • • ! 'ft,ft-l). Wfc-I = \Ulh, U2k, ¦ ¦ ¦ , Uh-l,h) ¦ Перемножая матрицы в правой части уравнения A0) и учитывая (9), приходим к системе уравнений Lk-iUk^ = ak-u (И) W/*-! = *»*_!, A2) lk-1Uk-i + lkk = akk. A3) Из предположения индукции следует существование матриц Щ1у Щ-1. Поэтому из A1) и A2) получим и, далее, Таким образом, LtZ-разложение матрицы А порядка k сущест- существует. Остается доказать, что 1ккф0. Рассмотрим определитель мат- матрицы А. Из разложения A0) следует, что det A = (det LK-t)lhh(det Uh-t) = (det L»_.)lhh. По условию теоремы detA^O, следовательно, 1ккф0. Тем самым индукция завершена и доказана возможность требуемого разло- разложения. Покажем теперь, что такое разложение единственно. Предполо- Предположим, что матрицу А можно разложить двумя способами: A = LiUi^UU2. Тогда L2 = LlUiU~21 и и.Щ^Ъ^и. A4) Матрица в левой части уравнения A4) является верхней треуголь- треугольной, а в правой части — нижней треугольной. Такое равенство воз- возможно лишь в случае, если матрицы U-JJ^1 и LT^L^ диагональные. Но на диагонали матрицы U^1 (а следовательно, и матрицы LilL2) стоят единицы, следовательно, эти матрицы единичные: Отсюда получаем (Ji = U2, L, = L2, т. е. разложение (8) единственно. Теорема об /.^-разложении полностью доказана. Замечание. Если хотя бы один из угловых миноров матрицы А равен нулю, то указанное LLZ-разложение невозможно. Это легко видеть на примере матриц второго порядка. 57
Следствие. Метод Гаусса можно применять тогда и только тогда, когда все угловые Шиноры матрицы А отличны от нуля. 3. Элементарные треугольные матрицы. Мы уже видели, что ме- метод Гаусса приводит к разложению исходной матрицы в произве- произведение двух треугольных. Более детально описать структуру этих треугольных матриц можно с помощью так называемых элемен- элементарных треугольных матриц. Матрица Z., называется элементарной нижней треугольной мат- матрицей, если она имеет вид —1 о о _0 hi О L о 1 В матрице L,- все элементы главной диагонали кроме /„• равны еди- единице. Из остальных элементов отличными от нуля могут быть толь- только элементы у-го столбца, расположенные ниже lj}. Обратной к Lj является элементарная нижняя треугольная матрица 0 0 . 0 ... 0 ... • — /Ч1 '7/ 1 0 О ... —I О ... О 1 Рассмотрим для наглядности сначала систему Ax=f, состоящую из трех уравнений: ^11-^1 I ^12*2 "Т" ^13*3 ==: /1> Й21*1 + Й22Х2 + Q23X3 == fi> A^) После первого шага исключения по методу Гаусса преобразован- преобразованная система принимает вид h хз — an 2 ац I' n a21a13 \ „ j: a12 f fl23 P3-/2 /1. \ an J au Отсюда видно, что матрица At системы A6) получается из исход- 58
ной матрицы А путем умножения А слева на элементарную мат- матрицу Г l/au О ОТ ?-1= —а21/ап 10, A7) L—a3i/an о ij так что Ai = LiA. При этом систему A6) можно записать в виде Матрицу A7) будем называть элементарной треугольной мат- матрицей, соответствующей первому шагу исключения метода Гаусса. Перепишем систему A6) в виде Х1 ~Г С12-^2 ~Г С13Х3 = tjy, и осуществим второй шаг метода Гаусса, т. е. исключим неизвестное хг из последнего уравнения. Тогда получим систему вида Х1 ~Г С12Х2 + С13Х3 = t/i, х2 + смх3=^у2, A9) Нетрудно видеть, что переход от A8) к A9) осуществляется путем умножения системы A8) на элементарную треугольную матрицу о B0) о 1/4V о О -а^/а^ 1 Таким образом, после второго шага исключения мы приходим к системе / / Д у— Т Г f (O]\ где матрицы L, и L2 определены согласно A7), B0). Наконец, ум- умножая B1) на матрицу -10 0-1 ¦= ° 1.0 .0 0 \/^_ получаем систему L^L^L^Ax — L-iLiLS B2) матрица которой U = LaL2LiA является верхней треугольной матри- матрицей с единичной главной диагональю. Отсюда следует, в частности, что A = LU, где L = L~yU^L~^—нижняя треугольная матрица. Таким образом, /-[/-разложение матрицы А может быть получено с по- помощью элементарных треугольных матриц: сначала строятся мат- матрицы Lu L2, Lz и вычисляется U = LxL2LiA и затем находится L = 59
= Z-i L2 L3 -Отметим, что матрицы Li имеют простой вид: 1 0 0" 0 ai1} 0 Гаи 0 ОТ L-1 ^21 I О 1 ^2 La3, 0 ll г10 0-, ' = о 1 о I L= Lo о e<«J причем на диагонали матрицы L расположены ведущие элементы метода исключения. Запись метода Гаусса в виде B2) детально описывает процесс исключения. Все сказанное выше переносится без изменения и на системы уравнений произвольного порядка B). Процесс исключения можно записать формулой LmLm-,... LlAx = LmU-i ¦ ¦ ¦ LJ, B3) где элементарная нижняя треугольная матрица Lh на k-м шаге исключения имеет вид ... о 0 ... 0" о 0 0 1 Матрица LA осуществляет исключение неизвестного xh из уравнений с номерами k+\, k + 2, ..., т. Матрицы L^1 существуют и имеют вид 1 ... О 0 ... О" akk 0 0 ... а<^> 0 ... 1 § 3. Метод Гаусса с выбором главного элемента 1. Основная идея метода. Может оказаться, что система Ax=f A) имеет единственное решение, хотя какой-либо из угловых миноров матрицы А равен нулю. Кроме того, заранее обычно неизвестно, все ли угловые миноры матрицы А отличны от нуля. В этих случа- 60
ях обычный метод Гаусса может оказаться непригодным. Избе- Избежать указанных трудностей позволяет метод Гаусса с выбором главного элемента. Основная идея метода состоит в том, чтобы на очередном шаге исключать не следующее по номеру неизвестное, а то неизвестное, коэффициент при котором является наибольшим по модулю. Таким образом, в качестве ведущего элемента здесь вы- выбирается главный, т. е. наибольший по модулю элемент. Тем самым, если detA^O, то в процессе вычислений не будет происходить де- деление на нуль. Различные варианты метода Гаусса с выбором, главного элемен- элемента проиллюстрируем на примере системы из двух уравнений f2. B) Предположим, что |а12| > [«и| - Тогда на первом шаге будем исключать переменное х2. Такой прием эквивалентен тому, что си- система B) переписывается в виде al2x2 + aiixl = fi, az2x2 + a2lXi = f2 C) и к C) применяется первый шаг обычного метода Гаусса. Указан- Указанный способ исключения называется методом Гаусса с выбором глав- главного элемента по строке. Он эквивалентен применению обычного метода Гаусса к системе, в которой па каждом шаге исключения проводится соответствующая перенумерация переменных. Применяется также метод Гаусса с выбором главного элемента по столбцу. Предположим, что |fl2i|>|on|. Перепишем систему B) в виде и к новой системе применим на первом шаге обычный метод Гаусса. Таким образом, метод Гаусса с выбором главного элемента по столбцу эквивалентен применению обычного метода Гаусса к систе- системе, в которой на каждом шаге исключения проводится соответ- соответствующая перенумерация уравнений. Иногда применяется и метод Гаусса с выбором главного эле- элемента по всей матрице, когда в качестве ведущего выбирается мак- максимальный по модулю элемент среди всех элементов матрицы си- системы. 2. Матрицы перестановок. В предыдущем параграфе было по- показано, что обычный метод Гаусса можно записать в виде где Lk, k = \, 2, ..., m,— элементарные нижние треугольные матри- матрицы. Чтобы получить аналогичную запись метода Гаусса с выбором главного элемента, нам необходимо познакомиться с матрицами перестановок. Определение 1. Матрицей перестановок Р называется квад- квадратная матрица, у которой в каждой строке и в каждом столбце только один элемент отличен от нуля и равен единице. 61
Определение 2. Элементарной матрицей перестановок Ри называется матрица, полученная из единичной матрицы переста- перестановкой k-я и 1-й строк. Например, элементарными матрицами перестановок третьего порядка являются матрицы ГО 1 ОТ ГО О П Г1 О О' Ла = 1 0 0 , Р13 = 0 1 0 , Р23 = 0 0 1 Loo IJ Li о oj Lo 1 о Отметим следующие свойства элементарных матриц перестано- перестановок, вытекающие непосредственно из их определения. 1°. Произведение двух (а следовательно, и любого числа) эле- элементарных матриц перестановок является матрицей перестановок (не обязательно элементарной). 2°. Для любой квадратной матрицы А матрица РЫА отличается от А перестановкой k-й и 1-й строк. 3°. Для любой квадратной матрицы А матрица АРЫ отличается от А перестановкой &-го и 1-го столбцов. 3. Пример. Поясним применение элементарных матриц переста- перестановок для описания метода Гаусса с выбором главного элемента по столбцу. Рассмотрим следующий пример системы третьего по- порядка: xl -f- х2 -f- х3 = /j, 2*i + x3 = f2, D) DX2 + оХ3 = [3. Система имеет вид A), где П 1 П E) p • ч 1=2 0 1 . Lo 5 3j Максимальный элемент первого столбца матрицы А находится во второй строке. Поэтому в системе D) надо поменять местами пер- первую и вторую строки и перейти к эквивалентной системе 5х2 -f- Зх3 = [3. ¦Систему F) можно записать в виде Pl2Ax = Pl2f, G) т. е. она получается из системы D) путем умножения на матрицу перестановок 12 ГО 1 <П = 1 0 0. Lo о ij Далее, к системе F) надо применить первый шаг обычного ме- метода исключения Гаусса. Этот шаг, как мы видели, эквивалентен 62
умножению системы G) на элементарную нижнюю треугольную матрицу (см. A7) из § 2) Г i о о' Л'= -1 , о 2 - О 0 1- В результате от G) перейдем к системе IDA v 1 Р или, в развернутом виде, 4- ' у '- h л 1 ' I Ло ¦ ¦ 2 2 (8) 2 *з —Л -у-» 5х2 Из последних двух уравнений системы (9) надо теперь исклю- исключить переменное х2. Поскольку максимальным элементом первого столбца укороченной системы Х2 + — *з = /i ^ ' является элемент второй строки, делаем в A0) перестановку строк и тем самым от системы (9) переходим к эквивалентной системе х 4- —х =J2- i"f 2 з 2 . *2+ j^3 = i А 2 которую можно записать в матричном виде как ¦Г 23^1' 12^X = ^ 23^-1* 12/- A1 A2) Таким образом, система A2) получена применением элементарной матрицы перестановок П 0 01 .= о о 1 L0 1 oj к системе (8). Далее, к системе A1) надо применить второй шаг исключения обычного метода Гаусса. Это эквивалентно умножению системы A1) на элементарную треугольную матрицу П 0 ОТ 0 1/5 0 . L0 -1/5 lj 63
В результате получим систему /^2* 23^1* 12^1 -^ 1^2* 23^-1*12/ A3) ИЛИ 3 5 ю A4) h Заключительный шаг прямого хода метода Гаусса состоит в за- замене последнего уравнения системы A4) уравнением что эквивалентно умножению A3) на матрицу по о - L3= о 1 о |_0 0 —10. Таким образом, для рассмотренного примера процесс исключе- исключения Гаусса с выбором главного элемента по столбцу записывается в виде L3LtPaLiP11Ax=LiLtP2tLlPi2f. A5) По построению матрица U=LaL2P23LlPl2A A6) является верхней треугольной матрицей с единичной главной диа- диагональю. Отличие от обычного метода Гаусса состоит в том, что в каче- качестве сомножителей в A6) наряду с элементарными треугольными матрицами Lh могут присутствовать элементарные матрицы пере- перестановок Ры. Покажем еще, что из A6) следует разложение PA = LU, A7) где L — нижняя треугольная матрица, имеющая обратную, и Р — матрица перестановок. Для этого найдем матрицу Li = P23LlP2i. A8) По свойству 2° матрица P23Li получается из матрицы Lt переста- перестановкой второй и третьей строк, — 2 0 --1/2 0 0 1 0 1 0- 64
Матрица ?t согласно свойству 3° получается из P^Li перестановкой второго и третьего столбцов, 1 0 --1/2 0 1 0 — 0 0 1- т. е. Li— нижняя треугольная матрица, имеющая обратную. Из A8), учитывая равенство P^l = Ри, получим r,PH = PML,. A9) Отсюда и из A6) видим, что и=Ь3Ь21,РиР1гА = L~lPA, где обозначено P=P2iPiz, L=L~l L^La1. Поскольку Р — матрица перестановок и L — нижняя треугольная матрица, свойство A7) доказано. Оно означает, что метод Гаусса с выбором главного эле- элемента по столбцу эквивалентен обычному методу Гаусса, приме- примененному к матрице РА, т. е. к системе, полученной из исходной си- системы перестановкой некоторых уравнений. 4. Общий вывод. Результат, полученный здесь для очень част- частного примера, справедлив и в случае общей системы уравнений A). А именно, метод Гаусса с выбором главного элемента по столбцу можно записать в виде '-'tnLln-i*m-i.!m_1Lm-t . . . L2P2/!L1r^li/1/4x = -i .. ¦ ^2'2,/1i^iPijJt B0) где Pkjk — элементарные матрицы перестановок такие, что ^.т и Lh—элементарные треугольные матрицы. Отсюда, используя соотношения перестановочности, аналогич- аналогичные A9), можно показать, что метод Гаусса с выбором главного элемента эквивалентен обычному методу Гаусса, примененному к системе PAx=Pf, B1) где Р — некоторая матрица перестановок. Теоретическое обоснование метода Гаусса с выбором главного элемента содержится в следующей теореме. Теорема 1. Если det АФО, то существует матрица перестано- перестановок Р такая, что матрица РА имеет отличные от нуля угловые ми- миноры. Доказательство теоремы 1 приведено в п. 5. Следствие. Если det^^O, то существует матрица переста- перестановок Р такая, что справедливо разложение PA = LU, B2) где L — нижняя треугольная матрица с отличными от нуля диаго- диагональными элементами и U — верхняя треугольная матрица с еди- единичной главной диагональю. 3 А. А. Самарский, А. В. Гулин 65
Следует подчеркнуть, что в методе Гаусса с выбором главного элемента матрица Р не задается заранее, а строится в процессе исключения, как это было показано в примере из п. 3. Как прави- правило, не требуется знать эту матрицу в явном виде. 5. Доказательство теоремы 1. Докажем теорему 1 индукцией по числу т — порядку матрицы А. Пусть т=2, г. е. A = аП а12 Если апФй, то утверждение теоремы 1 выполняется при /•=?, где Е — еди- единичная матрица второго порядка. Если ац = 0, то а^фО, так как det АфО. При этом у матрицы все угловые миноры отличны от нуля. Пусть утверждение теоремы верно для любых квадратных матриц поряд- порядка m—1. Покажем, что оно верно и для матриц порядка т. Разобьем матри- матрицу А порядка m на блоки А = А - \ а -\а™ Ат-1 — ¦ ат-\ — \ \-ат-1.1 ¦¦¦ am-i,m-iJ [ а' ' ' \ Ьт —1= (ат|, flm2i • • ¦ i 1m, m—l). Достаточно рассмотреть два случая: det Ат-1Ф0 и det Лт_| = 0. В первоы случае по предположению индукции существует матрица перестановок Ят-1 порядка т—1 такая, что Рт-\Ат-{ имеет отличные от нуля угловые миноры. Тогда для матрицы перестановок \Рт-г О имеем РА = РА Р п Г т—угт-\ Гm—i m—i причем det(fVl) = ±det АФО. Тем самым все угловые миноры матрицы РА отличны от нуля. Рассмотрим второй случай, когда det Лт_1 = 0. Так как det АфО, найдется хотя бы один отличный от нуля минор порядка т—1 матрицы А, полученный вычеркиванием последнего столбца и какой-либо строки. Пусть, например: "l.m-l -4-1.1 • ¦ а1-1,т-1 ¦ a/+l,m-i ат,т—i Ф0, B3) 66
где 1фт. Переставляя в матрице А строки с номерами / и т, получим матрицу PimA, у которой угловой минор порядка т—\ имеет вид . а 1,1 • ¦ • am—i,m—i и отличается от B3) только перестановкой строк. Следовательно, этот минор не равен нулю и мы приходим к рассмотренному выше случаю. 6. Вычисление определителя. В большинстве существующих стандартных программ одновременно с решением системы линей- линейных алгебраических уравнений A) вычисляется определитель ма- матрицы А. Пусть в процессе исключения найдено разложение B2), т. е. построены матрицы L и U. Тогда det(A4) =det L det ?/=det L = IJM... lmm, т. е. произведение диагональных элементов матрицы L равно опре- определителю матрицы РА. Поскольку матрицы РА и А отличаются только перестановкой строк, определитель матрицы РА может от- отличаться от определителя матрицы А только знаком. А именно, det (PA ) = det А, если число перестановок четно, и det(PA) = =—det А, если число перестановок нечетно. Таким образом, для вычисления определителя необходимо знать, сколько перестановок было осуществлено в процессе исключения. Если матрица А вырождена, то при использовании метода Гаус- Гаусса с выбором главного элемента по столбцу на некотором шаге исключения k все элементы /г-го столбца, находящиеся ниже глав- главной диагонали и на ней, окажутся равными нулю. Действительно, рассмотрим укороченную систему (см. (И) из § 1), которая получается на k-ы шаге исключения: B4) ! fill <k + ... + i При решении системы B4) могут возникнуть два случая: 1) хотя бы один из коэффициентов аЛ*',а^.й, ¦ • . ,<2m*L) отличен от нуля; 2) а^Г1' = а^\ = . . . = «т*1' = 0. Если для всех /г= 1, 2, ... ..., т реализуется первый случай, то систему A) можно решить методом Гаусса с выбором главного элемента по столбцу, и, следо- следовательно, det Л =?^=0. Если же det /4 = 0, то при некотором к реализу- реализуется второй случай. При этом дальнейшее исключение становится невозможным и программа должна выдать информацию о том, что определитель матрицы равен нулю. 3* в7
§ 4. Обращение матрицы Нахождение матрицы, обратной матрице А, эквивалентно реше- решению матричного уравнения АХ=Е, A) где Е — единичная матрица и X—искомая квадратная матрица. Пусть А=[ац], X=[xtj]. Уравнение A) можно записать в виде си- системы тг уравнений т 2 паху = 6l7, i, j = 1, 2, ..., m, B) 4=1 где 6„= 1 при i=/ и 8«=0 при 1ф\. Для дальнейшего важно заметить, что система B) распадается на т независимых систем уравнений с одной и той же матрицей А, но с различными правыми частями. Эти системы имеют вид Л*"> = 6Ш, /=1, 2, ...,т, C) где xU)^=(xtj, x2j, ..., xmj)T, у вектора 6Ш равна единице /-я компо- компонента и равны нулю остальные компоненты. Например, для матрицы второго порядка система B) распадается на две независимые системы fl12*21 = 1. аПХ И a22x11 = 0 a21;c :12 + 012*22 12 + a22*22 = 0, = 1. Для решения систем C) используется метод Гаусса (обычный или с выбором главного элемента). Рассмотрим применение метода Гаусса без выбора главного элемента. Поскольку все системы C) имеют одну и ту же матрицу А, достаточно один раз совершить прямой ход метода Гаусса, т. е. получить разложение A=LU и за- запомнить матрицы L и U. Для этого, как мы знаем (см. § 1), тре- требуется сделать т(т2—1)/3 действий умножения и деления. Обратный ход осуществляется путем решения систем уравнений D) /=1,2, ...,т, E) с треугольными матрицами L и U. Решение системы E) при каж- каждом / требует 0,5m(m—1) действий. Для решения системы D) надо еще добавить т делений на диагональные элементы матрицы L, так что здесь потребуется 0,5m(m+l) умножений и делений. Всего при каждом / на обратный ход затрачивается 0,5(т—\)т + + 0,5(т+ 1)т=т2 действий, а для всех / требуется т3 действий. Можно сократить число действий, принимая во внимание спе- специальный вид правых частей системы D). Запишем подробнее пер- 68
вые /—1 уравнений системы D): кхУи = О- кхУи + h&v = 0. *М.1#1/ + 1/-1.*Уы + • • ¦ + h-iJ-iyt-u = 0. Учитывая невырожденность матрицы L, отсюда получим Уи=У21=...=У1-ч==0. При этом оставшиеся уравнения системы D) имеют вид h/Уп = 1. 1чУа + к.1-иУ1+и +...-)- 1иУи = 0, 1=1+1,1+2, .... т. Отсюда последовательно находятся неизвестные yi} по формулам Уч = --Ы~1ш ¦ i = / + l,/ + 2t...,/n, F) Vll=\fln. ' G) Подсчитаем число умножений и делений, необходимое для про- проведения вычислений по формулам F). При фиксированном i для вычислений по формуле F) требуется 1 деление и i—у умножений. Вычисления по формулам F), G) при фиксированном / потребуют i—i+i действий. Наконец, решение указанным способом систем D) при всех /= 1, 2, ..., т потребует действий. Общее число действий умножения и деления, необходи- необходимое для обращения матрицы указанным способом, m(mi— 1) . т*(т— 1) . т (т + \) (т + 2) _ 3 3 2 6 ~т' Тем самым обращение матрицы требует не намного больше вре- времени, чем решение системы уравнений. § 5. Метод квадратного корня 1. Факторизация эрмитовой матрицы. Метод предназначен для решения систем уравнений Ax=f A) 69
<с симметричной (в комплексном случае — эрмитовой) матрицей. Он основан на разложении матрицы А в произведение A = SfDS, B) где S — верхняя треугольная матрица с положительными элемен- элементами на главной диагонали, S*—транспонированная к ней (или комплексно сопряженная) матрица, D — диагональная матрица, на диагонали которой находятся числа, равные ±1. Возможность представления B) можно получить как следствие теоремы об /.{/-разложении (см. § 2). Пусть все угловые миноры матрицы А отличны от нуля. Тогда справедливо разложение A = LU, где L — нижняя треугольная матрица, имеющая обратную, и U — верхняя треугольная с единичной диаго- диагональю. Представим матрицу L в виде произведения L=MK, где М — нижняя тре- треугольная матрица с единичной главной диагональю и К — диагональная матри- матрица, главная диагональ которой совпадает с главной диагональю матрицы L, т. е. /C=diag[/11, /И, .... Imm]. C) По условию диагональные элементы матрицы L отличны от нуля, и, следова- следовательно, разложение L = MK существует. Тогда Л = ЛЩ/, D) где М и U — треугольные матрицы с единичной главной диагональю и К — диа- диагональная матрица, имеющая обратную. Из условия А' = А получаем U'K'M' = = MKU и K~1M-1U'K' = UM-K E) Матрица, находящаяся в левой части равенства E), является нижней тре- треугольной, а в правой части — верхней треугольной. Поэтому из равенства E) следует, что обе матрицы ?Ш*~' и K~]M~lU*K* являются диагональными. Далее, поскольку матрица UM'~[ имеет единичную главную диагональ, она является единичной матрицей, L/AJ*-'=?, т. е. U = M'. Отсюда и из D) полу- получаем разложение А = МКМ\ F) Представим матрицу К, определенную согласно C) в виде произведения трех диагональных матриц: где обозначено D=diag [sign 1ц, sign /M, . •., sign lmm]. Тогда из F) получим разложение B), где S=\K\'l2M' — верхняя треугольная матрица с положительными элементами на главной диагонали. 2. Пример. Если разложение B) получено, то решение системы A) сводится к последовательному решению двух систем уравнений с треугольными матрицами S*Dy=r.f, G) Sx = y. (8) Покажем на примере матриц второго порядка как можно полу- получить разложение B). Пусть А — действительная симметричная матрица а12 70
Будем искать S и D в виде Lo s22j Lo где каждое из чисел dn, d22 может быть либо 4-1, либо —1. Тогда и из условия B) получаем три уравнения: Sll"ll == ^ll> S11S121 == °12i S12"ll I S2a«22 == ^22- Из первого уравнения находим flfH = sign аи, А'11 = ~|/|аи|. Далее, если аи=т^0, то s12 = a12/(sud11), и, наконец, т. е. d22 = sign (a22 — sjadu), sM = /| а%г — sl2dlx |. 3. Общие расчетные формулы. Получим разложение B) в слу- случае эрмитовой матрицы А произвольного порядка т. Если S=[sy] и D = diag[dli, ..., dmm], то элемент матрицы DS, имеющий индек- индексы (i, /), равен Кроме того, S*=[Jji], поэтому где Ли— число, комплексно сопряженное sti. Из условия B) полу- получаем уравнения /л 2 sudiisii = aih ;, / = 1, 2, . . ., т. ^(9) /=i Так как матрица А эрмитова, можно, не ограничивая общности, считать, что в системе (9) выполняется неравенство i^j. Перепи- Перепишем (9) в виде i-l m 2 siiSijdu + suSijdii + 2 SuSijdu = ац и заметим, что s;i=0 для />/. Таким образом, получим систему уравнений i-l _ SiiSijdu + ^ s/iSz/d// = ац, I ^ /. A0) 71
В частности, при i=j получаем т. е. i-x = sign аи — V Далее, при i<j из A0) получим i-i A1) A2) A3) По формулам A1) — A3) находятся рекуррентно все ненулевые элементы матриц D и S. 4. Подсчет числа действий. Метод квадратного корня применя- применяется обычно к системам с положительно определенной эрмитовой матрицей А. В этом случае из F) следует положительность диаго- диагональных элементов матрицы К, и тем самым D = E в разложении B). Если предположить дополнительно, что А — действительная матрица, то из A1) — A3) получим следующие расчетные формулы: stt = аи — s2a, t = 2,3 m, sli = аф1Ъ j = 2, 3, ..., m, A4) A5) sl7= , / = 2,3, ...,m, t = 2, 3, ...,/— 1. A6) Подсчитаем сначала число умножений. Вычисления по формуле A4) требуют умножений. Вычисления по формуле A6) при каждом фиксирован- фиксированном / требуют ъ п п_ (/ — 2) (/ — 1) 72
умножений, а всего здесь требуется " (/ — 2) (/ — 1) _ 1 V h(. п._ т(т-\)(т-2) /=2 ft=l умножений. Следовательно, общее число умножений т(т — 1) . m (от—1) (т — 2) т{т2— 1) 2 6 ~ 6 Число делений, необходимых для вычислений по формулам A4) — A6), совпадает с числом наддиагональных элементов матри- матрицы 5 и равно т(т—1)/2. Таким образом, общее число действий умножения и деления, не- необходимое для факторизации A = S'S, т (т2 — 1) . т. (т — 1) т (т — 1) (т + 4) trfi 6 2 ~ 6 ~6~' При больших т это число примерно в два раза меньше числа умножений и делений в прямом ходе метода Гаусса. Такое сокра- сокращение числа действий объясняется тем, что А — симметричная матрица. Заметим, что данный метод требует т операций извлече- извлечения корня. Если матрица А факторизована в виде A = S'S, то обратный ход метода квадратного корня состоит в последовательном реше- решении двух систем уравнений S'y=f, Sx=y. Решения этих систем находятся по рекуррентным формулам 1—1 fi-2 wi yi= '— , 1 = 2,3 т, su A7) Ус— S SiiXl xt= ^=^ , i = m — l,m — 2, .... 1, A8) Xm ^= Ут/Smm- Вычисления по каждой из формул A7), A8) требуют т деле- делений и 0,5т(т—1) умножений. Следовательно, всего для обратного хода требуется т{т+\) операций умножения и деления. Всего ме- метод квадратного корня при факторизации A = S'S требует m/mJ-\\ i m(m—l)(m + 4) _m(m» + 9m + 2) 6 6 операций умножения и деления и т операций извлечения квадрат- квадратного корня. 73
§ 6. Обусловленность систем линейных алгебраических уравнений 1. Устойчивость системы линейных алгебраических уравнений. При использовании численных методов для решения тех или иных математических задач необходимо различать свойства самой зада- задачи и свойства вычислительного алгоритма, предназначенного для ее решения. Для каждой математической задачи принято рассмат- рассматривать вопрос о ее корректности. Говорят, что задача поставлена корректно, если ее решение существует и единственно и если оно непрерывно зависит от входных данных. Последнее свойство назы- называется также устойчивостью относительно входных данных. Сфор- Сформулированное здесь общее и не очень четкое определение коррект- корректности должно уточняться при переходе к изучению конкретных классов математических задач. Так, хорошо известны определения и методы исследования корректности задачи Коши для систем обыкновенных дифференциальных уравнений, корректная поста- постановка типичных задач математической физики. Корректность исходной математической задачи еще не гаранти- гарантирует хороших свойств численного метода ее решения. Поэтому для корректно поставленных задач свойства численных методов долж- должны изучаться особо. Отметим, что часто возникает необходимость численного реше- решения некорректно поставленных задач. Этот круг вопросов подроб- подробно освещен в книге [38]. В настоящем параграфе вопросы корректности исходной задачи и численных алгоритмов ее решения рассматриваются на примере системы линейных алгебраических уравнений Ах=] A) с квадратной матрицей А порядка т. Хорошо известно, что для каждого m-мерного вектора / решение х задачи A) существует тогда и только тогда, когда det/l=?O. В этом случае можно опре- определить матрицу Л, обратную матрице А, и записать решение в виде х=А~Ч B) Для того чтобы убедиться в корректности задачи A), необходи- необходимо еще установить непрерывную зависимость решения от входных данных. В связи с этим возникает по крайней мере два вопроса. Первый: что считать входными данными задачи A), и второй: в ка- каком смысле следует понимать непрерывную зависимость? Ответ на первый вопрос очевиден: входными данными являются правая часть f и элементы ац, i, j= I, 2, ..., m, матрицы А. Соответственно различают устойчивость по правой части (когда возмущается толь- только правая часть /, а матрица А остается неизменной) и коэффи- коэффициентную устойчивость (когда возмущается только матрица А, а правая часть f остается неизменной). Чтобы можно было говорить о непрерывной зависимости, необ- необходимо ввести на множестве m-мерных векторов ту или иную мет- 74
рику. Будем считать, что решение и правая часть задачи A) при- принадлежат линейному пространству Н, состоящему из т-мерных векторов (вещественных или комплексных — безразлично). Введем в Н норму ||-||; конкретный вид этой нормы сейчас не имеет значе- значения, важно лишь, чтобы выполнялись все аксиомы нормы: IWI>0 для любого О#хеН, ||0||=0; | = \а\ \\x\\ для любого числа а и любого хеЯ; IMI + ]|i/ll для любых х, у^Н. Нормой матрицы А, подчиненной данной норме вектора, назы- называется число ||Л|!= sup ^J. C) Из определений следует, что ||Лх|1^|[Л||]|х|| для всех хе.Н, ||Л + Б|К||Л|| + ||Б||, \\АВ\\^\\А\\\\В\\ для любых матриц Л, В; ||?|| = = 1, где Е — единичная матрица. Наряду с основной системой уравнений A) рассмотрим «возмущенную систему» Ax = f, D) которая отличается от A) правой частью. Будем предполагать пока, что в матрицу А возмущений не вносится. Нас интересует, насколько сильно может измениться решение х в результате изме- изменения правой части. Обозначим 8х=х—х, 8f = f—f. Говорят, что система A) устойчива по правой части, если при любых /, f справедлива оценка E) где Af!>• О — постоянная, не зависящая от правых частей /, f. Оцен- Оценка E) выражает факт непрерывной зависимости решения от пра- правой части, т. е. показывает, что ||6xi|—>-0 при ||6/||-»-0. Наличие устойчивости очень важно при численном решении систем уравне- уравнений, поскольку почти никогда нельзя задать правую часть f точно, на самом деле вместо вектора / задается какой-то близкий ему вектор f. Погрешность 6f—f—f возникает, например, в результа- результате погрешностей округления. Легко показать, что если det^^O, то система A) устойчива по правой части. Действительно, из A) и D) следует уравнение для погрешности A(8x)=8f, откуда получаем бх=Л-1(б/), 11б*|К1й-1Нб/||, F) т. е. выполняется неравенство E) с константой М,= ||Л-1||. Заме- Заметим, что чем ближе к нулю определитель матрицы А, тем больше постоянная Mt и, следовательно, тем сильнее погрешность правой' части может исказить искомое решение. 75,
2. Число обусловленности. В оценку E) входят абсолютные по- погрешности решения 8х=х—х и правой части 6/=f—/. При реше- решении системы A) на ЭВМ с плавающей запятой более естественны- естественными характеристиками являются относительные погрешности Ш Получим оценку, выражающую относительную погрешность ре- решения через относительную погрешность правой части. Для этого используем неравенство НЯК1И1ПМ1, G) которое следует из A). Перемножив F) и G), придем к требуемой оценке где МА = ||Л-Ч111Л||. (9) Число МА, входящее в эту оценку, называется числом обуслов- обусловленности матрицы А и характеризует степень зависимости отно- относительной погрешности решения от относительной погрешности правой части. Матрицы с большим числом обусловленности МЛ на- называются плохо обусловленными матрицами. При численном ре- решении систем с плохо обусловленными матрицами возможно силь- сильное накопление погрешностей. Отметим следующие свойства числа обусловленности: 1°. МА^\. 2°. МА^\Хтз.ЛЛ)\/\кшп(А)\, где Хта(А) и XmlD(A)—-соответственно наибольшее и наименьшее по модулю собственные числа матрицы А. 3°. МАВ^МАМВ. Докажем свойство 2°. Число р(Л) = \XmaT(A) | называется спект- спектральным радиусом матрицы А. Покажем сначала, что для любой нормы вектора подчиненная ей норма матрицы удовлетворяет не- неравенству (Л)||Л|| (Ю) Рассмотрим собственный вектор у матрицы Л, отвечающий наи- наибольшему по модулю собственному значению. Справедливо равен- равенство из которого следует, что Ыу\\=\хвах(А)\\\у\\. С другой стороны, ]|Лг/||г^||Л||||г/||, и, следовательно, |WG4) | <; ^;1|Л||, т. е. получаем A0). Поскольку K^in(A) является максимальным по модулю собст- собственным значением матрицы А~\ для него выполняется неравенство 76
Отсюда и из A0) следует свойство 2°. Заметим, что правая часть неравенства 2° не зависит от выбора нормы. Существуют нормы и матрицы, для которых 2° выполняется со знаком равенства. Пусть Н — вещественное пространство со ска- скалярным произведением (У, с) = 2 УЫ и нормой \\y\\ =У(у, у). Тогда норма симметричной матри- матрицы А совпадает с ее спектральным радиусом: A1) Действительно, пусть (H-ftJ/feLi—ортонормированный базис собственных векторов матрицы А и хеН— любой вектор. Разлагая х по базису {ц*}, по- получим т *=1 4=1 и, далее, ш k=i Отсюда имеем т. е. ||А||^р(/1). Сопоставляя это неравенство с A0), получаем A1). Точно так же ||Л~'Ц = р(Л~') = |^тш(Л) |~', и, следовательно, МА=\К^(А)\/\1т1а(А)\ A2) для симметричной матрицы А и среднеквадратичной нормы векто- вектора, \\х\\=Цх,х). Свойство 1° следует непосредственно из 2°, а свойство 3°—из аналогичного свойства матричных норм, ЦЛВЦ^ЦЛЦЦВЦ. 3. Полная оценка относительной погрешности. Предположим теперь, что в системе A) возмущены как правая часть, так и коэф- коэффициенты. Рассмотрим наряду с A) возмущенную систему Лх = Г A3) и обозначим 6Л = А—А, Ьх = х—х, б/ = /—f. Справедлива следующая теорема (см. [6]). Теорема 1. Пусть матрица А имеет обратную и пусть выпол- выполнено условие ||бЛ||<||Л-'||-'. A4) Тогда матрица Ж=А-\-ЬА имеет обратную и справедлива следую- следующая оценка относительной погрешности: М1) vhii ii/ii/ \\А\\) При доказательстве будет использована т+щ. A6) 77
Лемма 1. Пусть С — квадратная матрица, удовлетворяющая условию ||C||<Cl и Е — единичная матрица. Тогда существует мат- матрица (Е-\-С)~\ причем Доказательство. Для любого вектора х имеем где 6=1—||СЦ>0. Поэтому однородное уравнение (?+С)х=0 имеет только нулевое решение: если (Е + С)х=-=0, то 0^О||х|| и * = 0. Поэтому в неравенстве A7) можем обозначить (Е+С)х=у, х=(Е+С)-1у и переписать A7) в виде ^&\\{Е+С)-'у\\. Отсюда получим \\(E + C)M^\\\\ \\l следовательно, выполнено A6). Доказательство теоремы 1. Докажем, что существует мат- матрица, обратная матрице Л+6Л. Имеем где С = Л~1бЛ. По условию A4) имеем 1, A8) поэтому согласно лемме 1 существует (Е-\-С)~\ а следовательно, и А-1. Нам осталось получить оценку A5). Представим 8х = х—х в виде bx = A-if—A-1f = A-l{f—f) + (A-i—A-i)f. Согласно A) имеем f—Ax, поэтому Ьх= (Л-1 А—Е)х+Ж-<8}. A9) Дальнейшие выкладки связаны с оценками норм матриц Л~1А—Е и А~\ Обозначим А = Л-*А—Е. B0) Имеем А = Л-±А—Е=(А+8А)-1А—Е=[А{Е+А-18А)]-1А—Е = 1(?— (?+С))= — По лемме 1 получим ||д|< 11СЦ M так как ||С||^||Л-1||||бЛ||. Далее, И А~х 11 " 1 — И Л-1 Ц Л 6^4 Q 78
Возвращаясь к A9), получим 1Ы-^ \\А'1\\\\бА\\\\х\\ | А-1 НИ 8/1 ^ 11 "^ 1—1| Л1|Ц8А |1 1—11 Л1||| 6Л || _ !ЫИЛ л х и)! g^ || — И I о^1 Сделаем преобразование Тогда получим неравенство 11 "^ 1_цл-М111бЛ|| которое совпадает с A5). Теорема 1 доказана. 4. Влияние погрешностей округления при решении систем ли- линейных алгебраических уравнений методом Гаусса. Метод Гаусса относится к прямым методам решения, поэтому он должен был бы давать точное решение задачи A) за конечное число действий. Од- Однако при задании на ЭВМ исходной информации (матрицы А, пра- правой части /) неизбежно вносятся погрешности округления. Поэто- Поэтому при проведении вычислений на ЭВМ точное решение почти ни- никогда не достигается. Результирующая погрешность вычислений тем больше, чем выше порядок матрицы. Кроме того, точность вы- вычислений зависит и от вида матрицы. Например, велика погреш- погрешность при решении систем уравнений с определителем, близким к нулю. Не надо думать, однако, что накопление погрешностей округ- округления делает непригодным метод Гаусса или другие численные ме- методы. Ведь обычно требуется знать решение не абсолютно точно, а лишь с какой-то степенью точности. Важно, чтобы результирую- результирующая погрешность вычислений находилась в пределах заданной точ- точности. Для этого необходимо проводить анализ влияния погреш- погрешностей округления на точность алгоритма. Поскольку полное проведение такого анализа весьма трудоемко и выходит за рамки данной книги, ограничимся лишь основными сведениями. Подробное изложение этого круга вопросов можно найти в книге [6]. Для большинства вычислительных алгоритмов влияние погреш- погрешностей округления можно учесть, рассматривая возмущенную си- систему A3). Считают, что решение системы A), искаженное по- погрешностями округления, совпадает с точным решением некоторой системы A3). Иначе говоря, процесс решения системы A) с уче- учетом погрешностей округления эквивалентен точному решению не- некоторой возмущенной системы A3). Предположим для простоты, что правая часть / задается точно. Пусть в результате погрешностей округления вместо точного ре- 79
шения системы A) получено точное решение возмущенной системы Ax = f. B2) В этом случае матрица 8А = А—А называется матрицей экви- эквивалентных возмущений. Каждому вычислительному алгоритму от- отвечает своя матрица эквивалентных возмущений. Если известна оценка нормы матрицы 8А, то погрешность, возникшую в резуль- результате погрешностей округления, можно оценить согласно A5), а именно 1И . м \\6A\\ 1 — МА Отсюда видно, что на точность решения влияют два фактора: число обусловленности матрицы А и эквивалентное возмущение ||6Л||/||Л||. Чем больше числа МА и ||бЛ||/||Л||, тем меньше точность решения. Подчеркнем, что число обусловленности не связано с ка- каким-либо численным алгоритмом, а характеризует только свойст- свойства исходной системы A). Величина эквивалентного возмущения оп- определяется численным алгоритмом. Тем самым при рассмотрении конкретных алгоритмов необходимо получать оценки соответствую- соответствующих эквивалентных возмущений. Так, в результате факторизации A = LU по методу Гаусса реше- решение системы A) сводится к решению двух систем Lz/ = /, Ux = y с треугольными матрицами. Погрешности округления приводят к тому, что вместо решения х системы Ux = y получаем решение х возмущенной системы Пх = у. Точно так же вместо решения у си- системы Ly = f получаем решение у системы Ly = f. Таким образом, можно считать, что вместо исходной системы A) точно решается возмущенная система Ax = f, где A = LD. Чтобы найти матрицу А, надо выписать все формулы метода Гаусса, внести в них погреш- погрешности округления и получить тем самым матрицы L н U. Далее следует оценить норму матрицы 5A = LU—LU. Опуская все эти весьма трудоемкие выкладки, приведем лишь окончательный ре- результат (см. [6]). Пусть t — число разрядов мантиссы в двоичном представлении чисел на ЭВМ с плавающей запятой, так что относительная по- погрешность округления действительного числа есть величина по- порядка 2~'. Тогда для эквивалентного возмущения метода Гаусса верна оценка где m — порядок матрицы. Таким образом, накопление погрешностей округления при ре- решении систем линейных алгебраических уравнений методом Гаусса 80
на ЭВМ с плавающей запятой приводит к тому, что искомое реше- решение определяется с относительной погрешностью !?=-?! = О (М„ -т. 2"'). B4) Отметим, что для машины БЭСМ-6 число 2~' равно приблизи- приблизительно 10~12. Рассмотрим пример применения оценки B4). Пусть методом конечных раз- разностей решается краевая задача и@)=иA)=0. B5) Введем равномерную сетку шА = {х{ = М, i = 0, ],..., N, hN= 1} и заменим B5) разностной схемой второго порядка точности N—\, ua = uN = 0. B6) Казалось бы, чем меньше возьмем шаг h, тем с большей точностью получим ре- решение задачи B5). Однако порядок m = N—1 системы линейных алгебраиче- алгебраических уравнений B6) обратно пропорционален шагу h. Значит, уменьшение ша- шага h приведет согласно B4) к увеличению погрешностей округления, и при не- некотором значении h погрешности округления могут превзойти погрешность разностного метода, пропорциональную №. Оценка B4) позволяет выбрать по- порядок шага Л, при котором погрешность округления еше не превосходит по- погрешности метода. Остановимся на этом подробнее. Поскольку матрица А системы B6) симметрична и положительно опреде- определена, ее число обусловленности равно отношению максимального собственного значения к минимальному, т. е. Как известно (см. п. 4 § 4 ч. I), для данной матрицы Km И) = ~~ sin* ^ , Xmax (A) = j2 cos' Щ- , поэтому Отсюда видно, что при малых h система B6) плохо обусловлена. Далее, m=O(h~l) и Поэтому правая часть равенства B4) оценивается как 0B~'Л~*). Для ТОГО чтобы погрешность округления имела тот же порядок, что и погрешность раз- разностного метода, достаточно потребовать 2~'h~3 =O(ft2), т. е. Л=ОB~'/5). В частности, при 2-'=10-12 приходим к выводу о том, что нецелесообразно брать шаг к меньше, чем 0,001, так как в противном случае накопление по- погрешностей округления может оказаться слишком велико. 81
ГЛАВА 2 ИТЕРАЦИОННЫЕ МЕТОДЫ РЕШЕНИЯ СИСТЕМ ЛИНЕЙНЫХ АЛГЕБРАИЧЕСКИХ УРАВНЕНИЙ § 1. Примеры и канонический вид итерационных методов решения систем линейных алгебраических уравнений 1. Итерационные методы Якоби и Зейделя. Перейдем к изуче- изучению итерационных методов решения систем линейных алгебраиче- алгебраических уравнений. Будем рассматривать систему Ax = f, A) где матрица А = [а.ц], i, j=\, 2, ..., т, имеет обратную, х = = \Xit Х2, ¦ ¦ ¦ , Хт) , /== (ft, ]2, . . . , [т) • Рассмотрим сначала два примера итерационных методов. Для их построения предварительно преобразуем систему A) к виду *< = -2 —*/- У, —*/ + — . « = 1,2, ...,m B) (при этом предполагается, что все ан отличны от нуля). Условимся, как обычно, считать значение суммы равным нулю, если верхний предел суммирования меньше нижнего. Так, уравне- уравнение B) при i= 1 имеет вид В дальнейшем верхний индекс будет указывать номер итерации, например ytl —1уП у11 уП\Т где я"—/г-я итерация i-й компоненты вектора х. В методе Якоби исходят из записи системы в виде B), причем итерации определяются следующим образом: '-г _ m '" f 2уж» ^ ^*? + о) п=0, 1, . . . , па, i= 1, 2, . . . , m. Начальные значения х\, i=\, 2, . . . , пг задаются произвольно. Окончание итераций определяется либо заданием максимального числа итераций па, либо условием шах где е>0 — заданное число. Позже в § 2 будет показано, что при определенных условиях на матрицу А метод Якоби сходится, т. е. ||хп—jc|| —*-0 при и->оо (здесь х — точное решение системы A), а хп — приближенное решение, полученное на л-й итерации). 82
Итерационный метод Зейделя имеет вид ^ aJL i=l, 2, ..., m, n = 0, 1, .... n0. D) Чтобы понять, как находятся отсюда значения *?+1, г=1, 2, ... ..., т, запишем подробнее первые два уравнения системы D): =-2 — *?+ — - E) = _ ^_ дП + 1 __ V ^ Wl + A . F) Первая компонента х^гХ вектора х"+1 находится из уравнения E) явным образом, для ее вычисления нужно знать вектор хп и значение ft. При нахождении х^+1 из уравнения F) используются только что найденное значение х^+1 и известные значения xj, / = 3, ..., ш, с предыдущей итерации. Таким образом, компоненты jc"+1 вектора xn+i находятся из уравнения D) последовательно, на- начиная с i=l. 2. Матричная запись методов Якоби и Зейделя. Для исследова- исследования сходимости итерационных методов удобнее записывать их не в координатной, а в матричной форме. Представим матрицу А си- системы A) в виде суммы трех матриц A=Ai+D+Az, G) где D = diaglau, агг, ¦¦-, amm]—диагональная матрица с той же главной диагональю, что и матрица А, матрица At — нижняя тре- треугольная и матрица Л2 — верхняя треугольная с нулевыми главны- главными диагоналями. Например, при /л=3 матрицы А\, Аг, D имеют вид ГО О (Л ГО ап a13l Гап 0 0 Ai = Ua 0 0 , А2 = О О Q23 , D = 0 а22 0 . la31 a32 Oj Lo О О J Lo 0 OaJ Представление системы A) в форме B) эквивалентно es запи- записи в виде матричного уравнения x = —D-1Aix—D-lAtx+D-if. Отсюда видно, что метод Якоби C) в векторной записи выглядит следующим образом: xn+i = — или, что то же самое, (8) 83
Метод Зейделя D) записывается в виде или Учитывая G), методы (8) и (9) можно переписать соответст- соответственно в виде D (хп" — х") + Ах11 = f, A0) {D + A1){xnrl—хп) + Axn = f. A1) Из этой записи видно, что если итерационный метод сходится, то он сходится к решению исходной системы уравнений. Очень часто для ускорения сходимости в итерационные методы вводят числовые параметры, которые зависят, вообще говоря, от номера итерации. Например, в методы A0), A1) можно ввести итерационные параметры %п+1 следующим образом: Способ выбора итерационных параметров выясняется при ис- исследовании сходимости. В теории итерационных методов сущест- существует два круга вопросов: а) при каких значениях параметров ме- метод сходится, б) при каких значениях параметров сходимость бу- будет наиболее быстрой (соответствующие параметры называются оптимальными). В дальнейшем (см. § 4) мы подробнее остановим- остановимся на этих вопросах в связи с конкретными итерационными мето- методами. Приведенные выше методы Якоби и Зейделя относятся к одно- шаговым итерационным методам, когда для нахождения хп+1 тре- требуется помнить только одну предыдущую итерацию х". Иногда ис- используются и многошаговые итерационные методы, в которых xn+i определяется через значения хк на двух и более предыдущих ите- итерациях, т. е. xn+i = F[xn, хп~\ . . . , хп-'\. 3. Каноническая форма одношаговых итерационных методов. На примере методов Якоби и Зейделя видно, что один и тот же итерационный метод можно записать многими различными спосо- способами. Поэтому целесообразно ввести какую-то стандартную форму записи итерационных методов. Условимся прежде всего записы вать итерационный метод не в координатной форме, а в матричной, Теперь хп будет обозначать вектор, полученный в результате n-Pi итерации. Канонической формой одношагового итерационного метода ре- решения системы A) называется его запись в виде Bn+1Xn+1~Xn + Axn = f, n = 0,\,...,no. A2) тл+1 84
Здесь В„+1 — матрица, задающая тот или иной итерационный метод, Тя+1 — итерационный параметр. Предполагается, что зада- задано начальное приближение х0 и что существуют матрицы В~п, я=1, 2, . . . , п0—1. Тогда из уравнения A2) можно последователь- последовательно определить все хп, п= 1, 2, . . . , п0. Для нахождения хп+1 по из- известным / и хп достаточно решить систему уравнений где Fn= (В„+1—rn+iA)xn+rn+lf. Итерационный метод называют явным (неявным), если Вп = Е (Вп=5^=?), где Е — единичная матрица. Как правило, неявные ите- итерационные методы имеет смысл применять лишь в том случае, когда каждую матрицу Вп обратить легче, чем исходную матри- матрицу А (т. е. когда решение системы уравнений с матрицей Вп тре- требует меньше машинной памяти или времени или алгоритмически проще, чем решение исходной системы). Например, в методе Зей- деля приходится обращать треугольную матрицу. В дальнейшем (см. § 4) будет показано, что преимуществом неявных методов яв- является более быстрая сходимость. Итерационный метод A2) называется стационарным, если Bn+i = B и т„+1 = т не зависят от номера итерации, и нестационар- нестационарным — в противоположном случае. Приведем еще несколько примеров итерационных методов. Методом про- простой итерации называют явный метод A3) с постоянным параметром т. Явный метод *"""*" +»,„ = , A4) с переменным параметром т„+1 называется итерационным методом Ричардсона. Для методов A3), A4) известен способ выбора оптимальных итерационных параметров в том случае, когда А — симметричная положительно определенная матрица (см. § 6). Обобщением метода Зейделя A1) является метод верхней релаксации (D + соА) *"+1~*" +Axn = f, A5) где ш>0 — заданный числовой параметр. В § 2 будет показано, что в случае симметричной положительно определенной матрицы А метод A5) сходится нри 0«а<2. Для получения расчетных формул перепишем A5) в виде В покомпонентной записи получим '-1 а- 2 2 т 171 п f- = A— со) х1} — ш У, -У-xf+co— , (=1,2 /п. 85
Отсюда последовательно, начиная с i=\, находим все /=а н т. д. § 2. Исследование сходимости итерационных методов Рассмотрим систему линейных алгебраических уравнений Ax = f A) с невырожденной действительной матрицей А и одношаговый ста- стационарный итерационный метод, записанный в каноническом виде B) где х0 задан. Говорят, что итерационный метод B) сходится, если \\хп—я||->- ->0 при л-)-оо. Под нормой вектора х будем понимать сейчас сред- среднеквадратичную норму Решение х системы A) будем рассматривать как элемент m-.мерного евклидова пространства Н со скалярным произведе- произведением m (и, v) = 2 «/У/. При формулировке условий сходимости будут использоваться матричные неравенства. Для действительной матрицы С неравен- неравенство С>0 означает, что (Сх, х)>0 для всех jcgW, хФО. Из нера- неравенства С>0 следует, что существует константа б>0 такая, что (Сх, х)^Ь\\х\\\ Действительно, если С>0 — симметричная матрица, то все ее собственные значения положительны и в качестве б можно взять минимальное собственное значение. Если С>0 — несимметричная матрица, то для любого хеЯ, хфО имеем (Сх, х) = | [(С*, х) + (х, Сх)] > О, где С — матрица, транспонированная к С. Поэтому в качестве б можно взять минимальное собственное значение матрицы Со = = 0,5(С+С*). Из оценки (Сх, х)^6\\х\\2 следует, что существует матрица С~у. Неравенство С^О означает, что (Сх, х) ^0 для всех jig//. Если Сг^О, то С может и не существовать. 86
Перейдем к исследованию сходимости итерационного метода B). Погрешность метода на п-й итерации характеризуется векто- вектором zn = xn—х, который согласно A), B) удовлетворяет однород- однородному уравнению В г""~г" +Azn = Q, п = 0, 1, .... го = хо-х. C) т Теорема 1. Пусть А — симметричная положительно опреде- определенная матрица, гГ>0 и пусть выполнено неравенство В—0,5тЛ>0. D) Тогда итерационный метод B) сходится. Доказательство. Достаточно показать, что среднеквадра- среднеквадратичная норма решения zn уравнения C) стремится к нулю при /г-voo и при любой начальной погрешности г0. Покажем сначала, что при условии D) числовая последовательность Jn= (Azn, 2„) является невозрастающей. Из уравнения C) найдем zn+i= (?—rfl-M)zn, Azn+i= {A-xAB-lA)zn, откуда получим (Azn+l, zn+i) = (Azn, zn)— x(AB~lAzn, zn)~ —x(Azn, B-lAzn)-\-x2{AB-lAzn, AB~lAzn). Вследствие симметричности матрицы А имеем (AB~lAzn, zn) = (Azn, B~lAzn), поэтому (Azn+U zn+i) = (Azn, zn)—2x((B—0,5xA)B-'Azn, B~lAzn). E) Отсюда, учитывая условие D), получаем неравенство {Azn+i, 2п+1) ^ (Azn, 2„). Таким образом, числовая последовательность Jn=(Azn, zn) мо- монотонна и ограничена снизу нулем. Следовательно, существует UmJn = J. F) Далее, из положительной определенности матрицы В—0,5тЛ следует существование константы б>0 такой, что ((В—0,5тЛ)Б-М2„, B-Mzn Отсюда и из E) получаем неравенство Переходя в этом неравенстве к пределу при п-+оо и учитывая F), убеждаемся в том, что существует lim Ц ш„ (I = О, п—=>оо где ьу„ = В~'Л2„. Наконец, замечая, что А—-положительно опреде 87
ленная и, следовательно, обратимая матрица, получим и тем самым lim |zn|| = 0. Теорема 1 доказана. Замечание. Как показано в [32, с. 527], нри условиях теоремы 1 для погрешности 2п=лсп—х итерационного метода B) справедлива оценка l|2n|U<pn||20|U, где ре@, 1), ||2п||л = (Azn, гп)ч>. Эта оценка означает, что метод сходится со скоростью геометрической прогрессии со знаменателем р. Константа р= = A—2т8.8/||?||2)''', где б — минимальное собственное значение матрицы А в fi. — минимальное собственное значение матрицы 0,5 (В' + В—хА). Применим теорему 1 к конкретным итерационным методам, рас- рассмотренным в предыдущем параграфе. Метод Якоби имеет следую- следующий канонический вид: D(xn+t—xn)+Axn = f, G) где D = diag[au, a22, ..., amm]. Таким образом, в данном случае B = D,x=\. Следствие 1. Пусть А — симметричная положительно опре- определенная матрица с диагональным преобладанием, т. е. a«>2Nl. i=l,2, ..., т. (8) Тогда метод Якоби сходится. Доказательство. Условие сходимости D) в данном случае имеет вид Л<2О. Покажем, что это матричное неравенство сле- следует из неравенств (8). Рассмотрим положительно определенную квадратичную форму m (Ах, х) = 2 auxixi и воспользуемся оценками m m / Л у у\ ^^"* \1 I л у2 I ^ь 1 I /Т ¦ • I у2 ^—~ 2 ?А i 2 #^J ' * тп тп о ^^j ' * ' 1 о f I I'lt 1.1=1 U=i Из условий симметричности и положительной определенности мат- матрицы А имеем a1{=aih au>0, i, /=1, 2, ..., m, и поэтому предыду- предыдущая оценка приводит к неравенству m m I Ay y\ ^ ^ 1 n •. I v2 ¦ ^^ v2 / ^ I /7.. I _U / (/1Л, xM=; 2j \ai]\Ai — 2j ч2j \U4 \> i,i=i 1=1 V?4» 88
Перепишем условие (8) в виде аи + S I аи \< 2а«. 1=1,2, ..../я. Тогда из неравенства (9) получим что и требовалось. Следствие 2. Пусть А— симметричная положительно опре- определенная матрица. Тогда метод верхней релаксации сходится при условии 0<со<2. В частности, метод Зейделя (со=1) сходится. Доказательство. Метод верхней релаксации приводится к каноническому виду B) с В = О + шЛ,, т=со. Напомним, что исход- исходная матрица А представляется в виде суммы Л = О + Л1+Л2, где Л,— нижняя треугольная, Л2—верхняя треугольная и D — диаго- диагональная матрицы (см. G) из § 1). Для симметричной матрицы Л матрица Л2 является транспонированной к Аи поэтому (Ах, х) = (Dx, х) + (Л,*, х) + (А2х, х) = (Dx, x) +2 (Л,*, х). Условие сходимости D) принимает вид (Вх, х)— 0,5со(Лх, д:) = i)x, x)—0,5a((Dx, х)+2(А1х, х)) = A— 0,5и) {Dx, и выполняется при 0<tu<2. Рассмотрим еще вопрос о сходимости метода простой итерации A0) с симметричной положительно определенной матрицей Л. Согласно D) метод сходится при условии Е—0,5тЛ>0. A1) Какие ограничения на параметр т накладывает условие A1)? Пусть h, t = l, 2, ..., m,— собственные значения матрицы Л, рас- расположенные в порядке возрастания. Условие A1) эквивалентно тому, что все собственные значения матрицы Е—0,5тЛ положитель- положительны. Достаточно потребовать положительности минимального соб- собственного числа этой матрицы, равного 1—0,5тАт. Таким образом, итерационный метод A0) сходится, если т<2Дта1, A2) где Xmai — максимальное собственное число матрицы А. 89
Условие A2) и необходимо для сходимости метода A0), т. е. если A2) нарушено, то найдется начальное приближение ха, при котором \\хп—яЦ-AO при я->-оо. Докажем последнее утверждение. Возьмем в качестве началь- начального приближения вектор xo = x-\-\l, где х — точное решение зада- задачи A), а |х — собственный вектор матрицы А, отвечающий собст- собственному числу Хт^=Хт, т. е. A\x = km\i. При таком выборе началь- начального приближения имеем za = x0—x=\i. Из уравнения C) при В = Е получим A А и, следовательно, zn=(l—x'km)n\i, ||zj|=|l—тА™| Если т= 2Х,„, то ||2п|| = ||ц||7^0 при п-+оо. Если же т> 2Кп, то |1—тХш,|>1 и ||zj|-voo при п-+оо. Таким образом, условие A2) необходимо и достаточно для сходимости метода простой итера- итерации A0). В заключение параграфа отметим, что теория итерационных ме- методов не заканчивается исследованием сходимости. При наличии хотя бы двух итерационных методов возникает вопрос о том, какой из этих методов сходится быстрее, т. е. для какого метода погреш- погрешность \\хп—х\\ станет меньше заданного числа е при меньшем чис- числе итераций п. Сюда же примыкает вопрос о нахождении итера- итерационных параметров, минимизирующих число итераций, необходи- необходимых для получения заданной точности. Этот круг вопросов будет подробно рассмотрен в следующих параграфах. § 3. Необходимое и достаточное условие сходимости стационарных итерационных методов 1. Введение. Некоторые итерационные методы решения систем линейных алгебраических уравнений уже рассматривались в § 1,2. Напомним необходимые для дальнейшего сведения. Пусть дана система уравнений Ax = f, A) где А=[а^], i, /=1, 2, . . . , т,— вещественная квадратная матрица, имеющая обратную, и х= (х„ х2, . . . , хп)Т, /= (fl7 /2, . . . , fm)T. Кано- Канонической формой одношагового итерационного метода называется его запись в виде Вп+1Хп+1~Хп +Axn=Lf, л = 0, 1, .... B) где п — номер итерации, х0 — заданное начальное приближение, хп= (ж", х%, ...,Хт)Т- Матрицы Вп+1 и числа т„+,>0 задают тот или иной конкретный итерационный метод. В настоящем параграфе подробно рассматриваются стационар- стационарные итерационные методы ВХ™~Хя+Ахл=и C) 90
в которых матрица В и числовой параметр т не зависят от номера итерации п. Погрешность итерационного метода C) vn = xn—х, где х — точ- точное решение системы A), удовлетворяет уравнению BVn+1~Vn + Avn'=0, n = 0, 1, .... Щ = хо — х, D) которое отличается от уравнения C) лишь тем, что является одно- однородным. Сходимость итерационного метода C) означает, что и„—>-0 в не- некоторой норме при л->-оо. Переписывая уравнение D) в разрешен- разрешенной относительно vn+i форме vn+i = Svn, E) где S = E—тВ-'Л, F) видим, что свойство сходимости итерационного метода целиком оп- определяется матрицей S. Необходимые и достаточные условия схо- сходимости в терминах матрицы 5 приведены ниже в п. 3. Матрица S называется матрицей перехода от п-й итерации к (п-\~\)-й. 2. Норма матрицы. При исследовании сходимости будем рас- рассматривать векторы хп и х как элементы m-мерного линейного про- пространства Н, в котором введена норма ||jc|| вектора х. Нормой мат- матрицы А, подчиненной данной норме вектора, называется число хФа \\x\\ Норму вектора в пространстве Н можно ввести различным обра- образом. Нам прежде всего потребуется норма ||х||с= max \xt\. Подчиненная ей норма матрицы А выражается через элементы мат- матрицы А следующим образом: т. \\А\\с= max ^ \аа\- Докажем это утверждение. Для любого вектора х справедливо неравенство Ах ||с = max 2 in max | Xj | max 2j I aij I = т f. e. G) 91
Чтобы завершить доказательство, достаточно построить вектор = (*J, х\ х°т)Т • для которого выполняется равенство Пусть функция И*о|1с= max 2 К/1 1*« Не- (8) я?/ I' = 1, 2, ...,m, достигает максимума при i=k, т. е. m ^„2^1 = 2 I-*/!- Рассмотрим вектор Хо, имеющий координаты „ _ | 1. если аА/->0, ' (— 1, если аЛ;- <0. Очевидно, что ||*ollc = l. Оценим снизу выражение для 1И^0||с Имеем (9) (Ю) = тах m 2 0 Ч 1 2 а -х0. Далее, исходя из определения A0) вектора лго, получим 2 v? и, следовательно, 1 Ах01, = max Последнее равенство справедливо в силу (9). Тем самым нашли вектор ха, для которого max Поскольку для каждого вектора * справедливо противоположное неравен- неравенство G), заключаем, что для х0 справедливо равенство (8). 3. Теорема о сходимости итерационного метода. Справедлива Теорема 1. Итерационный метод C) сходится при любом начальном приближении тогда и только тогда, когда все собствен- собственные значения матрицы S=E—хВ^А по модулю меньше единицы. Доказательство. Представим уравнение D) для погреш- погрешности vn=xn—х в виде E) — F). Докажем сначала необходимость условий теоремы 1. Предположим, что матрица 5 имеет собствен- собственное число s, для которого |s|>l, и покажем, что в этом случае можно так подобрать начальное приближение х0, чтобы погреш- погрешность vn — xn—х неограниченно возрастала при /j-voo. Пусть ц — собственный вектор матрицы S, отвечающий собственному числу 92
s, |s|>l. Возьмем в качестве начального приближения вектор xa = x+\i, так что начальная погрешность va = \i. Тогда из уравне- уравнения E) получим S и ||un||i= |s|"|||x||->oo при п—*-оо. Если |s| = l, то Ция|| = ||ц||-А0 при Я—»-оо. Доказательство достаточности условий теоремы 1 проведем сначала в предположении, что матрица S имеет т линейно неза- независимых собственных векторов. Пусть sk, k=\, 2, m,— собст- собственные числа матрицы S и цк, k=\, 2, ..., m,— отвечающие им линейно независимые собственные векторы. Разложим начальную погрешность va = xa—х по векторам цк: Тогда получим /71 vn — Snv0 = '2i cksnk\ik. k=l В любой норме справедлива оценка A1) где р= max \sk\—спектральный радиус матрицы S. Из оценки A1) в силу предположения теоремы 1 о том, что р<1, и следует сходимость метода. 4. Продолжение доказательства. В общем случае, когда систе- система собственных векторов матрицы S не является полной, доказа- доказательство достаточности условий теоремы 1 проводится с помощью приведения S к жордановой форме. Напомним (см. [12], стр. 147), что для любой квадратной матрицы S порядка т существует невы- невырожденная матрица Р такая, что матрица S = P~lSP имеет жорда- нову каноническую форму ""?! О ... О О 5, ... О о о где Sh либо собственное число матрицы S, либо жорданова клетка, т. е. матрица вида 0 0 0 1 s* 0 0 0 1 0 0 0 0 0 0 ... о - ... 0 ... 1 • ¦ . Su _ a sh — собственные числа матрицы S. 93
Помимо обычной жордановой формы нам потребуется еще так называемая модифицированная жорданова форма матрицы S. Она строится следующим образом. Применим к матрице 3 преобразование подобия D~lSD с диа- диагональной матрицей Z) = diag[l, е, ..., ет~']> гДе е — любое поло- положительное число. Нетрудно убедиться, что матрица имеет ту же блочно-диагональную структуру, что и матрица S, однако жордановы клетки имеют теперь следующий вид: 0 0 _0 ? 0 0 0 e 0 0 0 0 0 0 ... o- ... 0 ... e ... sk_ Матрицы S и S связаны равенством S = Q~iSQ, Q = PD. A2) Матрица S имеет в каждой строке не более двух отличных от нуля элементов, поэтому |]5||c^p(S) + e, A3) где p(S) —спектральный радиус матрицы S, т. е. p(S) = max \sk\. Напомним, что согласно A0) из § 6 гл. 1 подчиненная норма матрицы удовлетворяет неравенству A4) Покажем теперь, что можно найти такую норму вектора, для которой подчиненная норма матрицы станет сколь угодно близкой к ее спектральному радиусу. Точнее, справедливо следующее утверждение. Лемма 1. Для любого е>0 существует норма \\-\\, вектора такая, что для подчиненной нормы матрицы справедливо неравен- неравенство A5) Доказательство. Воспользуемся преобразованием A2) и определим норму вектора ||-||« равенством W.HIQ-^ll'c для любого вектора уеЯ. Для подчиненной нормы матрицы S имеем 94 \\S\\ — sup —— = sup . " "* уЛ\\У\\ ^ollQ-^ic
Обозначая Q~ly = x и учитывая A2), A3), получим отсюда SUpsUP х^а \\x\\c х^а \\x\\r что и требовалось. Завершим доказательство теоремы 1. Из уравнения E) полу- получим Vn = SnvB, n = 0,l,... A6) Пусть ||-||* — норма, для которой выполнено неравенство A5). По условию теоремы p(S)-<l, поэтому существует е>0 такое, что l|S||.^p(S) +e^<7< 1. Из A6) получим оценку M,^«^i:ikl^nikL 07) из которой следует, что ||ип||.-»-0 при любых начальных приближе- приближениях. § 4. Оценки скорости сходимости стационарных итерационных методов 1. Скорость сходимости итерационного метода. При практиче- практическом использовании итерационных методов важен не только сам факт сходимости, но и скорость, с которой приближенное решение сходится к точному. Так как при численном решении всегда осу- осуществляется конечное число итераций, необходимо знать, во сколь- сколько раз уменьшается начальная погрешность после проведения за- заданного числа итераций. Ответить на эти вопросы позволяет ана- анализ оценок погрешности итерационного метода. В предыдущем параграфе при доказательстве теоремы 1 была получена оценка A7), которую можно переписать в виде \\xn—x\\.^qn\\xn—x\\., л = 0, 1, .... A) где <7е@, П- Если для погрешности итерационного метода выпол- выполняются оценки вида A), то говорят, что метод сходится со ско- скоростью геометрической прогрессии со знаменателем q. Используя оценку A), можно определить число итераций, до- достаточное для того, чтобы начальная погрешность уменьшилась в заданное число раз. Действительно, зададим произвольное е>0 и потребуем, чтобы qn<.z, т. е. чтобы ^ / ч In A/е) /оч п^п0 (г) = —±-!-!- . B) 1пA/) Тогда из A) получим, что т. е. после проведения па(е) итераций начальная погрешность ||*о—*И» уменьшилась в е раз. Целая часть числа по(г) называ- называется минимальным числом итераций, необходимым для получения заданной точности е. OS
Выражение \n(\/q), находящееся в знаменателе числа гао(е), называется скоростью сходимости итерационного метода. Ско- Скорость сходимости целиком определяется свойствами матрицы пе- перехода 5 и не зависит ни от номера итерации п, ни от выбора на- начального приближения х0, ни от задаваемой точности е. Качество различных итерационных методов сравнивают обычно по их скоро- скорости сходимости: чем выше скорость сходимости, тем лучше метод. 2. Оценки скорости сходимости в случае симметричных матриц А и В. Продолжим изучение итерационных методов решения си- систем линейных алгебраических уравнений Ax = f. C) Будем по-прежнему рассматривать стационарные одношаговые итерационные методы В*™-*" +Axn=f. D) т Теорема о сходимости, доказанная в предыдущем параграфе, имеет принципиальное теоретическое значение и накладывает ми- минимальные ограничения на матрицы А и В. Однако ее непосредст- непосредственное применение к конкретным итерационным методам не всег- всегда возможно, так как отыскание или исследование спектра матри- матрицы S = E—хВ~1А является, как правило, более трудной задачей, чем решение системы C). В настоящем параграфе будет доказана теорема, в которой условия сходимости формулируются в виде легко проверяемых матричных неравенств, связывающих матрицы А и В. Аналогич- Аналогичная теорема о сходимости была доказана в § 2, однако там не бы- были получены оценки скорости сходимости. Будем рассматривать решение х системы C) и последователь- последовательные приближения хп как элементы конечномерного линейного про- пространства Н, а матрицы А, В и другие — как операторы, действую- действующие в пространстве Н. Предположим, что в Н введены скаляр- скалярное произведение (г/, v) и норма \\у\\—У(у, у). Для двух симмет- симметричных матриц А и В неравенство А~^В означает, что {Ах, х)~^ ^ (Вх, х) для всех хеЯ. В случае симметричной положительно определенной матрицы D будем обозначать ||z/||D = "|/(Z)y, у). Теорема 1. Пусть А и В — симметричные положительно определенные матрицы, для которых справедливы неравенства , E) где y», ч2— положительные постоянные, fa>'Yi- При Ь) F) итерационный метод D) сходится и для погрешности справедливы оценки K —-Ф, « = 0,1,..., G) 96
где |ML = V(/b, v), \\v\\*B = 1 (Bv, v) и p=Txi —-• (9) Доказательство теоремы 1 будет дано в п. 4. Сделаем необхо- необходимые замечания и приведем следствия из этой теоремы. Рассмотрим обобщенную задачу на собственные значения A0) Если для матриц А и В выполнены неравенства E), то из A0) для любого собственного вектора получим неравенства Tiffin, ц) < (Aii, ц) =Л,Eц, ц) <?,Eм„ ц). Отсюда следует, что ^"^), A1) где \т1п(В~1А) и ^maiE~M)—минимальное и максимальное соб- собственные числа задачи A0). Таким образом, наиболее точными константами, с которыми выполняются неравенства E), являются константы В этом случае параметр '1 А) называется оптимальным итерационным параметром, так как он минимизирует величину на множестве всех положительных fi> Чг, удовлетворяющих усло- условиям A1). Пусть Xmin(A) и XmiT(A)—соответственно минимальное и мак- максимальное собственные значения матрицы А. Следствие 1. Если Ат=А>0, то для метода простой ите- итерации Xn"~Xn + Axn = f A2) при т= тп= справедлива оценка l(A) + l(A) ° 4 А. А. Самарский. А. В. Гулин 97
Следствие 2. Для симметричной матрицы А и т„ = 2/Aт1п(у4) +Ята1(Л)) справедливо равенство \\Е—т0Л|| = р0, 1+1' lmax(A) В приложениях часто встречаются задачи с плохо обусловлен- обусловленной матрицей А, когда отношение Хтй1(А)/Кт1а(А) велико. В этом случае число р0 близко к единице и метод простой итерации схо- сходится медленно. Оценим число итераций по(е), которое требуется в случае малых ? для достижения заданной точности е, т. е. для получения оценки Из условия роп-<е получаем, что п^па(е), где " w In I и при малых | имеем 1*-, / 1 /л\ / 1 \ A4) Таким образом, метод простой итерации A2) в случае малых ? является медленно сходящимся методом. Ускорить сходимость итерационных методов можно двумя способами: во-первых, за счет применения неявных итерационных методов D), когда ВФЕ, и, во-вторых, оставаясь в классе явных методов, можно выбрать т = т„ зависящим от номера итерации и таким, чтобы уменьшить общее число итераций. Применяется и комбинация этих двух спо- способов, т. е. используются неявные итерационные методы с пере- переменными итерационными параметрами. Использование неявных итерационных методов D) объясняет- объясняется тем, что при соответствующем выборе матрицы В отношение Я, ¦ (В~М) r min для обобщенной задачи на собственные значения A0) будет больше, чем отношение ¦ . \пах 3. Правила действий с матричными неравенствами. Прежде чем переходить к доказательству теоремы 1, приведем необходи- необходимые для дальнейшего сведения из линейной алгебры. 1) Если А — вещественная симметричная матрица, то сущест- существует ортогональная матрица Q (т. е. QT=Q~1) такая, что A = QTAQ, где Л — диагональная матрица. На главной диагонали матрицы А находятся собственные значения матрицы А. Доказательство см. в [12, с. 156]. 2) Для симметричной матрицы А неравенство Л^О (Л>0) эквивалентно неотрицательности (положительности) всех ее соб- собственных значений. 98
Доказательство. Используя свойство 1), получим для лю- любого *<=#, что т (Ах, х) = (QTAQx, х) = (XQx, Qx) = ^ *#?• где Ju— собственные числа матрицы А и yt — J-я компонента век- вектора y = Qx. Отсюда сразу следует, что если все h^O (^>0), то (Ах, х)^0 для любого jte// ((Ax, х) >0 для любого хф§). Об- Обратно, пусть К, — любое собственное число матрицы А. Зададим вектор у, у которого все компоненты кроме /-й равны нулю, а у,— = 1. Так как матрица Q~l = QT существует, для заданного вектора у найдется вектор хеЯ такой, что Qx = y. Но тогда 0<(M x) = {Ay, у)=%}, т. е. Х^О. 3) Если Аг=А^>0, то существует А~\ Доказательство. Согласно 2) все собственные числа мат- матрицы А положительны, следовательно, det Л=И=0 и существует А~\ 4) Для симметричной матрицы S и любого числа р>0 эквива- эквивалентны следующие матричные неравенства: A5) A6) Доказательство. Согласно свойству 2) условие A5) экви- эквивалентно неравенствам где sk — собственные числа матрицы S. Отсюда получаем s k= 1, 2, ..., m, что в свою очередь эквивалентно A6). 5) Если АТ=А и А^О (Л>0), то существует матрица В, об- обладающая следующими свойствами: A7) Эта матрица называется квадратным корнем из матрицы А и обозначается А1'2. Доказательство. Пусть %(— собственные числа матрицы A, i—l, 2, ..., m. Согласно свойству 1) существует ортогональная матрица Q такая, что QAQT = A=diag[Kl, %г, ..., Xm]. Поскольку все %{ неотрицательны, можно определить матрицу Л'/2 как Л'л = diag [YK УК • • •, VQ. Тогда матрица B = QTAl/2Q обладает свойствами A7). 6) Пусть АТ=А и L — невырожденная матрица. Тогда эквива- эквивалентны неравенства T Q9
Аналогично, эквивалентны строгие неравенства А>0, LTAL>0. Доказательство. Для любого х^Н имеем (L ALx, х) = = (ALx, Lx). Значит, LTAL^0, если Л^О. Докажем обратное. Так как L-1 существует, любой хеЯ можно представить в виде x = Ly, где y = L~lx. Тогда получим (Ах, x) = (LTALy,y)^0, т. е. Л^О. 7) Если А и В — симметричные и L — невырожденная матри- матрицы, то эквивалентны неравенства Доказательство следует немедленно из F). 8) Пусть С =С>0 и а, E — любые действительные числа. Тог- Тогда эквивалентны неравенства Доказательство. Согласно 5) существует матрица С1/2 = = (С/2)ГХ). Используя свойство 7), перейдем от первого неравен- неравенства ко второму с помощью следующей цепочки эквивалентных неравенств: а (С~%) С (С~у*) ^ р (С-'Л) {(Г'А), а (С"'/2С'/2) (С'/гС~%) > рС, аЕ > рС'1. 9) Пусть Ат=А>0, Вг = В>0, а и $ —любые действительные числа. Тогда эквивалентны неравенства Доказательство. Умножая первое неравенство слева и справа на B~i/2, перейдем к эквивалентному неравенству C = B-i/2AB~l/2. Согласно 8) последнее неравенство эквивалентно неравенству ?С\ т. е. умножая которое слева и справа на В~1/2, получим ар 4. Доказательство теоремы 1. Уравнение для погрешности vn = = хп—х имеет вид BVn+1~Vn +Avn = 0, л = 0,1,..., A8) va = xa—х, откуда получим vnU = Svn, S = ?—тВ-М. A9) 100
Лемма 1. Пусть А и В— симметричные положительно опре- определенные матрицы и р>0 — число. Матричные неравенства Lz?B</ls?^B B0) т х необходимы и достаточны для того, чтобы при любых vo^H для решения задачи A8) выполнялась оценка ||0п+.На<рЫа, л = 0, 1, ... B1) Доказательство. Оценку B1) можно записать в виде ', B2) где wn = AU2vn, ||а>п||=У(а>„, wn). Из A9) получим, что функция wn удовлетворяет уравнению wn+l = Swn, B3) где S=Ai/2SA~i/2 = E—хС, С=А1/2В~1А'/г. Для решения этого урав- уравнения в силу симметричности матрицы S имеем |]шп+1||2= (Swn, Swn) = {S2wn, wn). Тем самым оценка B2) эквивалентна неравенству B4) и остается доказать эквивалентность неравенств B0) и B4). Согласно свойству 4) из п. 3, неравенство B4) эквивалентно двум матричным неравенствам или Так как C=Al/2B~'Ai/z — симметричная положительно определен- определенная матрица, согласно свойству 8) из п. 3, в этих неравенствах можно перейти к обратным матрицам, т. е. записать, что т т Подставляя сюда выражение для С, получим !=? а-'лва-'а ^ е ^ 1-±р а-'лва~у: Т X Умножая последние неравенства слева и справа на Аиг (см. свой- свойство 6) из п. 3), приходим к неравенствам B0). Лемма 1 доказана. Лемма 2. При тех же условиях что и в лемме 1, неравенства B0) необходимы и достаточны для выполнения оценки llt>»+iIU<pl|i;nL, л = 0, 1, ... B5) lot
Доказательство проводится почти так же, как и в лемме 1, только в качестве wn надо взять вектор В1/2ип, а в качестве С — матрицу В-"МВ-1/!. Для доказательства теоремы 1 теперь достаточно заметить, что матричные неравенства E) можно переписать в виде B0), где 1 + i ' Та ' Vi + У г После этого замечания утверждение теоремы 1 следует из лемм 1 и 2. 5. Оценка погрешности в случае несимметричной матрицы В. Пусть задана любая симметричная положительно определенная матрица D. Обозначим через S матрицу перехода итерационного метода D), т. е. S = E—rB~lA, и через vn — погрешность метода, vn = xn—х. Для исследования сходимости итерационных методов в случае несимметричных матриц А и В может оказаться полезной следующая простая Лемма 3. Если В~1 существует, то для выполнения оценок необходимо и достаточно выполнение матричного неравенства Р2 П ~-з. <^Л Q /07\ Доказательство. Учитывая уравнение для погрешности A9), перепишем B6) в виде (DSvn, Svn)^p*(Dvn, vn) или p2(Dvn, vn)^(STDSvn, vn), n = 0, 1,... Так как v0 произвольно, отсюда следует B7). Обратно, если выполнено B7), то II уя+1 |]Ь = (Dvn+1, Оя+1) = (STDSvn, vn) < р2 (Dvn, vn) = р21 vn fD, т. е. приходим к B6). В следующей теореме сформулированы достаточные условия сходимости метода D) в случае несимметричной матрицы В. Теорема 2. Пусть А — симметричная положительно опреде- определенная матрица и В — невырожденная матрица. Если выполнено матричное неравенство дГ+5_^Л^ 1~<* ВТА-*В B8) 2 2 2т V ' с константой ре@, 1), не зависящей от п, то итерационный метод D) сходится и для погрешности справедлива оценка II*»—*ILs?pnIU-0—*На. B9) Доказательство. Достаточно показать, что выполнены условия леммы 3 при D = A. Запишем неравенство B7) для D = A 102
в виде рМ> (Е—тАВт1)А (Е—хВ-'А). Раскрывая скобки в правой части этого неравенства, получим A. C0) Согласно свойству 7) матричных неравенств можно умножить каждую часть неравенства C0) справа на матрицу L = A~lB и од- одновременно слева — на матрицу LT=BrA-\ Тогда получим эквива- эквивалентное C0) неравенство т (В+Вт) ^ A— р2) ВтА-'В+хгА, которое совпадает с B8). Таким образом, из B8) следует B7) и согласно лемме 3 — оценка B9). Поскольку ре@, 1), из оценки B9) получаем, что \\хп—х\\А—>-0 при n-9-oo, т. е. метод D) сходится. Теорема 2 доказана. Замечание. Лемма 3 и теорема 2 остаются справедливыми и в случае комплексных матриц А и В, если только заменить ST и Вт на матрицы S* и В\ комплексно сопряженные с матрицами S и В. В частности, условие B8) принимает вид Во — 0,5тЛ 5* ^-^ В'А~1В, C1) где?0 = 0,5(В-кВ*). § 5. Многочлены Чебышева 1. Многочлен Чебышева на отрезке [—1, 1]. В ряде вопросов численного анализа, связанных с проблемой минимизации погреш- погрешности вычислительного алгоритма, нашли применение многочлены, наименее уклоняющиеся от нуля. Рассмотрим следующую задачу: среди всех многочленов сте- степени п со старшим коэффициентом 1 найти такой многочлен Тп(х), для которого величина max \Tn(x)\ *e[-i,i] является минимальной. Многочлен, обладающий этим свойством, называется многочленом, наименее уклоняющимся от нуля на от- отрезке [ — 1, 1] или многочленом Чебышева. В этом параграфе бу- будет показано, что функция 7\lU)=21-ncos(n arccos-r) A) является многочленом Чебышева. Рассмотрим сначала функцию Pn(jc)=cos(narccos;t), B) которая отличается от Тп(х) только постоянным множителем. Проводя преобразование cos ((п+1) arccos x) +cos ((n— 1) arccos x) = = 2 cos (rc arccos x) cos (arccos x) =2хРп(х), 103
убеждаемся в том, что справедливо рекуррентное соотношение Ря+1 (х) -ЧхРп (х) +Pn.t (х) = 0. C) Кроме того, согласно B) имеем P0(x) = l, Pi(x)=x. Отсюда и из C) по индукции легко доказать, что Рп{х) —многочлен степени п со старшим коэффициентом 2п~\ п=\, 2, ... Следовательно, Тп(х)—многочлен степени п со старшим коэффициентом 1. Замечание. Для вещественных х правая часть выражения A) опреде- определена только при |*|=^1. Если \х\^\, то многочлен Т„(х) доопределяется фор- формулой Тп (х) = Тп ((х + KF3T)" + (х - У^Г\)п). Возможность такого доопределения объясняется тем, что для любого комплекс- комплексного числа z справедливо тождество cos(/2arccos2) = 0,5(B+ У z1 — if + (z — Vz2—lf). Корни многочлена Тп(х) расположены в точках Xk=cosBk+l)n , k = 0, I, .... n—1, D) а экстремумы — в точках *ft=cos^-, k = 0, I, ...,n, E) п причем ГП(^) = (-1)Й2'-, k = 0, 1, .... л. F) •Следовательно, max 1Г,г(А-)| = 21Л G) л:е[-1Д] Докажем теперь, что среди всех многочленов степени п со старшим коэффициентом 1 многочлен Тп(х) наименее уклоняется от нуля на отрезке [—1, 1]. Пусть Qn(x)—любой многочлен сте- степени п со старшим коэффициентом 1. Обозначим |<?я||= max |Qn(jc)|. *e[-i.i] Лемма 1. Пусть существует система точек -i««_x< ...<<<*;^i (8) такая, что \Qn(x'k)\ = \\Qn\\, k = 0,\ n, (9 причем числа Qn(xk) имеют чередующиеся знаки. Тогда среди всех многочленов степени п со старшим коэффициентом 1 много- многочлен Qn{x) наименее уклоняется от нуля. Доказательство. Предположим обратное, т. е. что суще- существует многочлен Qn(x) степени п со старшим коэффициентом 1, для которого ||<?JI<||Q,,II и, следовательно, S04 с константой ре^и, I), не зависящей от п, то итерационный метоб D) сходится и для погрешности справедлива оценка U-0—x\\A. B9) Доказательство. Достаточно показать, что выполнены условия леммы 3 при D=A. Запишем неравенство B7) для D=A 102
для всех л:е[—1, 1]. Рассмотрим функцию R(x) = Qn(x)—Qn(x), которая является многочленом степени п—-1, отличным от тожде- тождественного нуля. Согласно условию леммы числа Qn (x'^j имеют че- чередующиеся знаки. Пусть для определенности = 0, 1, .... л (случай, когда Оп(хк) =(—l)ft+lIIQJI рассматривается аналогично). Тогда k' k = 0, I, .... я и согласно A0) получим, что многочлен R(x) на отрезке [ — 1, 1] меняет знак п раз, т. е. имеет п корней. Но это невозможно пото- потому, что R{x) — многочлен степени п—-1, отличный от тождествен- тождественного нуля. Полученное противоречие и доказывает лемму 1. Замечание. Справедливо утверждение, обратное лемме 1: если Qn(x) — многочлен со старшим коэффициентом 1, наименее уклоняющийся от нуля на [—1, 1], то найдется система точек (8), для которой выполняются равенстЕ:а (9), причем числа Qn(xn.') имеют чередующиеся знаки. На доказательстве этого утверждения останавливаться не будем. Согласно F), G) многочлен Тп(х) удовлетворяет всем усло- условиям леммы 1, поэтому он наименее уклоняется от нуля на отрез- отрезке [—1, 1] среди всех многочленов степени п со старшим коэффи- коэффициентом 1. 2. Случай произвольного отрезка. Иногда требуется найти мно- многочлен, наименее уклоняющийся от нуля на заданном отрезке [а, Ь], среди всех многочленов степени п со старшим коэффициен- коэффициентом 1. Эта задача сводится к предыдущей с помощью замены /_ 2 у Ь + а Ъ Ъ — а Ь — а переводящей отрезок а^л^Ь в отрезок — мене многочлен Чебышева 7n@=2'""cos(narccos/) преобразуется к виду Fn (х) = 2 cos n arccos v ^ ' , \ b — а .! причем коэффициент при х" оказывается равным 2п/(Ь—а)п. Сле- Следовательно, многочленом, наименее уклоняющимся от нуля на [а, Ь], среди всех многочленов степени п со старшим коэффициен- коэффициентом 1 является многочлен (Ь — а)" I 2х — (Ь+а)\ .,_. Тп (х) = — cos n arccos v ^ ' . A2) 22" V b — aj Корни этого многочлена расположены в точках а-\-Ь , Ь — a Bk-\-\)n . п , . /ТОЛ Xk ^ + COSV \ k = 0, 1, .... П— 1, A3) COS \ 105
а его максимальное отклонение от нуля равно max |7\,(*)|=-?=fl. A4) 3. Другая нормировка многочленов Чебышева. В теории ите- итерационных методов возникает следующая задача: найти много- многочлен Рп(х) степени п, наименее уклоняющийся от нуля на [а, Ь], среди всех многочленов степени п, принимающих при х=0 значе- значение 1. Ясно, что искомый многочлен отличается от многочлена A2) только нормировкой, т. е. Будем считать в дальнейшем, что Г„@)=?^=0. Если Г„@)=0, то задача не имеет решения в классе многочленов задан- заданной степени п. Например, для многочлена первой степени Pi(x)—ax+l имеем max Ц р1 (х) | = 1 + 1 а \ и минимум достигается при я=0. Но при этом Я>(х) перестает быть многочле- многочленом первой степени. Из A2), A5) получим при Ь>а>0, что 2х — (Ь + а) \ /|СЧ я arccos v , A6) b — a I где рп = (cos In arccos —i \ V a- Обозначая t a 1 — b 1 + 5 получим pn = I cos (n arccos I ]]] . A8) I \ \ Poll) Для дальнейших преобразований воспользуемся тождествами cos (я arccos (— 2)) = (— 1)" cos (n arccos 2) = = (_1)п0,5(B+|Лг»— i)" + (z — У22— 1)я). A9) При 2 = р~1 имеем 2 — Уг2 — 1= 1 / 1 = Ро |/ pj и, подставляя сюда выражение для р0 из A7), получим 106
Отсюда и из A8), A9) получаем где Рх = A — lA|)/(l + Yi). Таким образом, приходим к следующе- следующему выводу: среди всех многочленов степени п, принимающих при а: = 0 значение 1, наименее уклоняется от нуля на отрезке [а, Ь] многочлен Рп (Х) = (_ 1)" Яп cos (n arccos 2х~(ь+а)\ ? B0) V b— a j где i + pf i + Кб ь 6>а>0. Корни многочлена B0) расположены в точках ^ = ^ + ^cosi^U, ft=1|2 „. B2) 4. Примеры применения многочленов Чебышева. Пример 1. В теории интерполирования возникает следую- следующая задача. Рассмотрим многочлен со (я) = (х—х0) {x—Xi) — (х—хп) степени п+\. Требуется так подобрать числа хк (среди которых нет совпадающих чисел), принадлежащие заданному отрезку [а, Ь], чтобы минимизировать величину max | ш (х) |. [*] Поскольку старший коэффициент многочлена (и(х) равен 1, для решения данной задачи достаточно потребовать, чтобы а>(х) совпал с многочленом Чебышева р . ч F — а)п+1 I, . 1Ч 2х — (Ь + а) n+i (х) = — cos (л + 1) arccos ^^—- 2n+i \ Ь — а (см. A2)). Условие | co(x) | = | Tn+i(x) | будет выполнено тогда и только тогда, когда совпадут все корни многочленов со (я) и Tn+i{x). Корнями многочлена а>(х) являются числа х0, xit ..., хп, а корни Tn+i(x) определяются согласно A3) формулами ~ а-\-Ь , Ь—а B?+1)'я , ,, . /ооч xk = -\ cos -—:r—i— , k = 0, 1, . . . , п. B3) 2 2 2(л+ 1) ' V ' Таким образом, если задать точки хк по правилу а+Ь , Ь — a B4) 107
то величина отклонения многочлена ш(х) от нуля окажется мини- минимальной и равной max | a (jc) | = JK=[a.b] (b - a)'m Заметим, что для минимизации отклонения многочлена (и(х) от нуля не обязательно точки хк, /г = 0, 1, ...,«, располагать в том порядке, который указан формулами B4). Важно лишь, чтобы множество точек {х*}*=о совпало с множеством {xk}l=a корней мно- многочлена Чебышева. Такое множество точек {хк}1=а естественно назвать оптимальным. Если множество {х/г}'к=о оптимальное, то любая перестановка его элементов приводит также к оптималь- оптимальному множеству. Потребуем, например, чтобы выполнялось усло- условие Тогда для оптимальности множества {xk}1=o достаточно положить Xk=Xn-n, k = 0, 1,..., га, т.е. x>, 0.l,..... 2 2 2(n+l) Пример 2. При построении оптимальных итерационных па- параметров рассматривается следующая задача. Для многочлена ЫА.) = A—тД)A—тД) ••• О—тД) B5) подобрать параметры тЛ>0, k=l, 2, ..., п, так, чтобы минимизи- минимизировать величину max | Многочлен B5) удовлетворяет условию /п@) = 1. Поэтому дан- данная задача решается с помощью многочлена Чебышева B0). Кор- Корни многочлена B5) h = Tfev, k = 1, 2, ... ,п, должны совпадать с корнями многочлена Рп (К) = (— l)nqn cos f/г arccos u~(Vi + v») \ > B6) \ Тг — Vi / где Согласно B2) корни многочлена B6) расположены в точках ^= Vi + Vs +I^lLcos(Jizil^t fe=1|2 и. B8) Следовательно, если выбрать T-eJi±J&. + i=2Loose*=iiiL, 4=1,2 », B9) 108
то отклонение fn(X) от нуля окажется минимальным и равным max | /„ (к) \ = qn, t] где qn определено согласно B7). Здесь остается в силе замечание, сделанное в конце предыдущего примера. А именно, для оптималь- оптимальности набора параметров {tk}k=i не обязательно выбирать т* со- согласно B9), достаточно, чтобы множество {т^1}^ совпадало с множеством {^}?=1 корней многочлена Чебышева B6). § 6. Итерационные методы с чебышевским набором параметров 1. Явный итерационный метод. Рассмотрим систему линейных уравнений Ax=f A) с симметричной положительно определенной матрицей А. Будем решать эту систему с помощью явного нестационарного итераци- итерационного метода J!tz± ft a. = o,i , B) где ха задан. Поставим задачу об оптимальном выборе итерационных пара- параметров, т. е. о нахождении положительных чисел Ть т2, . . . , т„, для которых норма погрешности хп—х на п-й итерации минимальна. В дальнейшем в этом параграфе будем использовать среднеквад- среднеквадратичную норму 1*1 = Кет = 2 1*''12> /=1 где х> — /-я координата вектора х. Точная формулировка и решение задачи оптимизации итераци- итерационного метода B) содержатся в следующей теореме. Теорема 1. Пусть А — симметричная положительно опреде- определенная матрица, ^т1п(Л)>0 и Xmax(A)>0 — ее наименьшее и наи- наибольшее собственные значения. Пусть задано число итераций п. Среди методов вида B) наименьшую погрешность \\хп—х\\ имеет метод, для которого где 1-6 Ро = i D) = cos <2*-'>" , k= 1,2, ...,«. 2л 109
Если выбрать xh согласно C), D), то для погрешности будет спра- справедлива оценка \\х„—xll^gJUo—*||', E) где Доказательство. Для погрешности 2A=xft—л: получаем уравнение п— 1, 20 = лс0 — х. G) Из уравнения G) получим,что zh= {E—ThA) (?—т4-И) ... (Е—xtA)z0 для k= I, 2, ..., п и, в частности, где Г„ = (Е—ХпА) (?—т„_И)... (?—тИ). (8) Поскольку 7„—симметричная матрица, ее норма совпадает с ее спектральным радиусом (см. § 6 гл. 1) и выполняется оценка Il2j|s?|v|||zo||, (9) где v — максимальное по модулю собственное значение матрицы Тп. Оценка (9) неулучшаема, т. е. найдется вектор z0, для которого она выполняется со знаком равенства. Для доказательства теоремы остается подобрать параметры Tj, та, • • ¦, т„ так, чтобы минимизи- минимизировать | v|. Пусть Xk, k=\, 2, ..., m,— собственные числа матрицы А. Не ограничивая общности, можно считать, что 0<amln(A) =^s?X2?S • • • ^Хт=%тю{А). A0) Согласно (8) имеем шах |A- тЛ) A — таЬ*) ... A - xnh) \- A1) Очевидно, что max \fn(X)\, где /n(X) = A—т,А,) A—тЛ) • • • 0— т»Я,). Таким образом, приходим к задаче о нахождении min max | fn (X) |, Т,.т, Tn >.mD)<><^D) уже рассмотренной в примере 2 из п. 4 § 5. Полученные в этом примере формулы B9) для параметров т* совпадают с формулами C), D), а величина отклонения при данных параметрах равна |v|—<7п, где цп определяется согласно F). Теорема 1 доказана. по
Итерационный метод B) с параметрами хк> определенными со- согласно C), D), называется явным итерационным методом с чебы- шевским набором параметров. Замечание. В случае га=1 метод B)—D) совпадает с методом простой итерации ХШ — Ч Ч где Xmin (A) + ^max (Л) Из теоремы 1 следует, что т=т0 является оптимальным значением параметра т в методе простой итерации. Оценка E), F) в случае я=1 принимает вид 11*1—JflKpolUo—х\\. Точно так же для любой итерации k справедлива оценка откуда Эта оценка погрешности метода простой итерации была получена другим спо- способом в § 4 (оценка A3) из § 4). Подсчитаем число итераций, достаточное для получения задан- заданной точности е при использовании явного метода с чебышевским на- набором параметров. Из оценки E) получим, что IUn—x||<eii*0—*||, если <7„<е, где qn определено согласно F). Таким образом прихо- приходим к неравенству решая которое относительно 2= рТ"> 1, получим Р^ е Последнее неравенство будет выполнено, если потребовать В наиболее неблагоприятном случае, когда отношение (^)A(^ МЭЛО, ИМввМ ш
и из A2) получим следующее приближенное выражение для числа итераций: «o(«) = ^f. A3) Таким образом, при малых ? явный итерационный метод с че- бышевским набором параметров требует^для достижения заданной точности е числа итераций яо(§) =ОA/'У|). Именно в этом состоит его преимущество перед методом простой итерации, для которого согласно A4) из § 4 имеем яоF) =ОA/|). 2. Численная устойчивость итерационного метода с чебышев- ским набором параметров. Как уже отмечалось в примере 2 из п. 4 § 5 оценка погрешности E) остается одной и той же при различ- различном упорядочении набора итерационных параметров C). Теорети- Теоретически эти параметры можно использовать в любом порядке. Напри- Например, можно взять их в том порядке, как это указано в формуле C). Можно использовать параметры в обратном порядке, т. е. поло- положить Однако при практическом применении метода было обнаруже- обнаружено, что порядок выбора параметров существенно влияет на числен- численную устойчивость метода. Оказалось, что использование парамет- параметров в произвольном порядке может привести к недопустимо силь- сильному возрастанию вычислительных погрешностей. Дело в том, что рассматриваемый метод, вообще говоря, не гарантирует монотон- монотонного убывания погрешности от итерации к итерации. Запишем уравнение для погрешности G) в виде Норма оператора перехода Е—тй+,Л данного итерационного мето- метода может оказаться больше единицы для нескольких соседних ите- итераций, что и приведет к возрастанию погрешности. Иногда вычис- вычислительная погрешность возрастает настолько сильно, что происхо- происходит переполнение арифметического устройства ЭВМ. Здесь можно провести аналогию с вычислением произведения нескольких чисел. Рассмотрим следующий пример. Пусть на неко- некоторой ЭВМ машинным нулем является число Ма=10~р, а машин- машинной бесконечностью — число Мх= 10р, где р>0. Попытаемся вычис- вычислить на этой ЭВМ произведение пяти чисел 10р/2, 10р/\ 10-р/2, 103р/4, 10~3р/1. Это произведение равно 10р/4 и принадлежит допу- допустимому интервалу чисел (М0,М„). Однако результат вычисления на ЭВМ будет зависеть от того, в каком порядке перемножаются данные числа. При перемножении в порядке убывания 103р//' • 10р/2 ¦ 10р/4 ¦ 10-р/2 • 10-3р/4 уже выполнение первого умножения приводит к переполнению, так 112
как 105p/4>Afoo. После этого вычисления прекращаются, и мы про- просто не сможем вычислить все произведение. При перемножении в порядке возрастания 10~3р/4 • 10-р/2 ¦1 Qp/i ¦ 10/2 • 103?74 после первого умножения получаем число 10~5p/4<jW0, которое по- полагается равным нулю, следовательно, равным нулю оказывается и все произведение. Если же расположить сомножители в таком порядке: 10-3р/410"'2103"''410- р/210р/\ то удается довести вычисления до конца и получить правильный результат. В настоящее время известен алгоритм построения такого упо- упорядоченного набора итерационных параметров C), для которого итерационный метод B) является устойчивым. Подробное изложе- изложение этого алгоритма можно найти в [32]. 3. Неявный чебышевский итерационный метод. Скорость схо- сходимости явного метода B), C) зависит, как мы видели, от отно- отношения l = lmln(A)/Хтях(А) минимального собственного числа матри- матрицы А к максимальному: чем больше |, тем выше скорость сходи- сходимости. Рассмотрим теперь неявный итерационный метод В Xk^~Xk +Axk = f, k = 0, 1, ... , х0 задан, A4) с симметричной положительно определенной матрицей В и пере- переменными параметрами rh+l. Как и в случае стационарных методов (см. § 4), скорость сходимости метода A4) будет определяться уже не отношением собственных чисел матрицы А, а отношением 1 = Ът1п(В-1А)Гктах(В~1А) минимального и максимального собствен- собственных чисел обобщенной задачи A5) При соответствующем выборе матрицы В это отношение будет больше чем Кт1г,(А)/Кт^(А), а следовательно, итерационный метод A4) будет сходиться быстрее, чем явный метод B). Теория неявных итерационных методов легко сводится к теории явного метода. Для неявного чебышевского метода справедлива Теорема 2. Пусть А и В — симметричные положительно опре- определенные матрицы, a rkmm(B~iA), ктах(В~*А) —соответственно наи- наименьшее и наибольшее собственные значения задачи A5). Пусть задано число итераций п. Метод A4) имеет минимальную погреш- погрешность \\хп—х\\в, если параметры \h определить согласно C), D), где При этом справедлива оценка \\хп—*||в<<7»П*о—х\\в, A6) 113
где Доказательство. Погрешность zk=xh—х удовлетворяет од- однородному уравнению В Ч"~7к +Azk = Q, k = 0, I, .... га = х0 — х. A8) Умножим уравнение A8) на матрицу В~иг и обозначим vk = Binzh. Тогда получим уравнение —— —+Cvk = 0, k = 0, I,..., vQ => BVt (x0 — х), A9) где С = Б-1/2ЛБ~1/2. Уравнение A9) отличается только обозначе- обозначениями от уравнения G), которому удовлетворяет погрешность яв- явного итерационного метода. Поэтому нам остается лишь проверить выполнение условий теоремы 1 по отношению к матрице С. Матрица С является симметричной и положительно определен- определенной, причем ее спектр совпадает со спектром обобщенной задачи на собственные значения A5). В частности, ХтхЛВ^А) является ми- минимальным собственным числом ^mln(C) матрицы С, а Хтах(В-1А) — максимальным. Следуя теореме 1, выберем параметры тк согласно C), D), где 1=-Хтт(СIХт„(С). Тогда для решения уравнения A9) будет выполняться оценка Подставляя сюда vk=Binzk, k = 0, n, получим т. е. придем к требуемой оценке A6). Теорема 2 доказана. Замечание. При условиях теоремы 2 наряду с оценкой A6) справед- справедлива и оценка IUn—x||A^<7nlUo—*||а. Для доказательства достаточно переписать уравнение A8) в виде A9), где Vii=A'i'Zh, С=А'1'В~1А'1', и повторить рассуждения теоремы 2. Так же как и в случае явного метода, численная устойчивость неявного итерационного метода зависит от способа упорядочения итерационных параметров. Алгоритм построения устойчивого на- набора итерационных параметров тот же, что и для явного метода. 4. Случай, когда точные границы спектра неизвестны. В теоре- теоремах 1 и 2 фигурируют точные границы спектра матриц А и В~1А соответственно. Очень часто минимальные и максимальные собст- собственные значения не известны точно, а известны лишь оценки для них. Например, если выполнены матричные неравенства Ч^^А^ЧгВ B0) 114
с некоторыми константами "Y2>Yi>0, то можно утверждать, что Приведем теорему о сходимости итерационного метода A4) при условиях B0). Теорема 3. Пусть А и В — симметричные положительно опре- определенные матрицы, удовлетворяющие условию B0). Пусть задано число итераций п. Если параметры хк определить согласно C), D), где 1=^/^.,, то для погрешности будет справедлива оценка \\xn—x\\B^qJ\xo—x\\B, B1) где Доказательство. Как и при доказательстве теоремы 2, за- запишем уравнение для погрешности в виде A9). Из A9) получим где Тп= (E~rnC)(E—Tn~iC) ... (E—XiC). Отсюда следует ||i>JK <\\Tn\\\\v0\\. Пусть Cj—/-е собственное число матрицы С, /=1, 2, ..., т. Так как Тп—симметричная матрица, норма ||Г„|] совпадает с максиму- максимумом из модулей ее собственных значений max |A— хпс,-) A — Tn_!C/) ... A — x^cf) \ К fern и не превосходит величины max 1 A — т„с) A — Хп^с) ... A — Tlc) |. B3) Выбирая тй, ^=1, 2, ..., я+1, согласно C), D) при \ = '\J'i2, мы минимизируем величину B3) и приходим к оценке ||ГЛ^г/п, где qn определено согласно B2). Наконец, замечая, что l!yn|| = IUn—х\\3, приходим к требуемой оценке B1). Замечание. Хотя теорема 3 н не гарантирует оптимальности итераци- итерационного метода, из оценки B1) следует сходимость метода, причем при малых \ число итераций, достаточных для достижения заданной точности е, оценивается как ; In B/е) § 7. Итерационные методы вариационного типа *) В предыдущих параграфах рассматривались такие итерацион- итерационные методы решения системы Ax=f, A) При первом чтении этот параграф можно пропустить. 115
в которых для задания итерационных параметров требовалось знать границы v, и у, собственных значений матрицы А. Рассмотрим те- теперь итерационные методы вида B*k«-Xk +Axk = f, B) в которых параметры rk+i выбираются из условия минимума по- погрешности \\хк+1—x\\D при заданной погрешности \\хк—jc[|d. Здесь D — заданная симметричная положительно определенная матрица, \\v\\d = ']/(Dv, v). В зависимости от выбора матриц D и В получим различные итерационные методы. Скорость сходимости таких мето- методов не выше, чем у чебышевского итерационного метода. Преиму- Преимуществом их является то, что они не требуют знания границ спектра матрицы А. 1. Метод минимальных невязок. Рассмотрим систему A) с сим- симметричной положительно определенной матрицей А. Обозначим через rk=Axh-f C) невязку, которая получается при подстановке приближенного зна- значения xh, полученного на й-й итерации, в уравнение A). Заметим, что погрешность zk = xk—х и невязка гк связаны равенством Azh = rk. Рассмотрим явный итерационный метод Ь Ахк = f D) и перепишем его в виде Методом минимальных невязок называется итерационный ме- метод D), в котором параметр %h+l выбирается из условия минимума ||rfc+t|! при заданной норме \\гь\\. Получим явное выражение для ите- итерационного параметра rk+l. Из E) получаем и, следовательно, F) т. е. невязка rk удовлетворяет тому же уравнению, что и погреш- погрешность Z,k = Xh—X. Возводя обе части уравнения F) скалярно в квадрат, получим I rAw ||2 = || rk f - 2т,+1 (rk, Ark) + т|+11 An f. G) Отсюда видно, что ||rft+1|] достигает минимума, если \\Ark |f Таким образом, в методе минимальных невязок переход от k-H итерации к (й-Ы)-й осуществляется следующим образом. По най- найденному значению хк вычисляется вектор невязки гк=Ахк—/ и по U6
формуле (8) находится параметр тЙМ. Затем по формуле E) до- досчитывается вектор xh+l. Метод минимальных невязок E), (8) сходится с той же ско- скоростью, что и метод простой итерации с оптимальным параметром т. Справедлива Теорема 1. Пусть А — симметричная положительно опреде- определенная матрица. Для погрешности метода минимальных невязок выполняется оценка II/IU,—*) || <р»ЦЛ (*„—*) ||, и = 0, 1, ¦¦•, (9) где po = i^i, l= k™a{A) . A0) Доказательство. Рассмотрим тождество G). При задан- заданном векторе rk правая часть этого тождества достигает минимума, если Tft+i выбрать согласно (8). При любом другом значении хк+1 правая часть тождества G) может только увеличиться. Поэтому, полагая в G) тЛ+1 = т0, где то = - , A1) >.т1п(Л) + Ятах(Л) получим неравенство \\rh+1\\2^\\(E-x0A)rk\\* и, следовательно, 1к»+,1К1|?-т,Л||||г,||. A2) Согласно следствию 2 теоремы 1 из § 4 имеем ||?—т0Л||=р0, по- поэтому при всех k справедливо неравенство Ikft-uillsspoiktil, A3) или, что то же самое, неравенство Отсюда и следует оценка (9). Замечание. Используя доказательство теоремы 1, можно получить по- полезное неравенство (У, У? ^ (Ау, у) (А-*у, у) *? j (/| + -p|-j2 (у, у)*, A4) справедливое для симметричных положительно определенных матриц А и лю- любого вектора уфО. Для доказательства A4) запишем тождество G) при определенном согласно (8). Тогда получим (Ark, rk) Учитывая неравенство A3), получаем (Ark, г.J или (Ark, rkY^(rk, rk)(Ark, rk). 117
Сделав замену A'hrk=y и учитывая, что 1—ро2 = 4|/A+ |J, получим соответ- соответственно неравенства {у.У)г<{А-1у.у){Ау,у). (У. УJ> ^Sg)a (A-ly. у) (Ау, у), которые совпадают с A4). Обратно, если непосредственно доказать неравенства A4), то из них можно вывести утверждение теоремы 1. 2. Метод минимальных поправок. Запишем неявный итерацион- итерационный метод B) в виде xh—TB-'rh, A5) где rk=Axh—/ — невязка. Вектор называется поправкой на (й+1)-й итерации. Поправка ivk удовле- удовлетворяет тому же уравнению, что и погрешность zh = xh—х неявного метода, т. е. уравнению Tfe+i Будем предполагать, что В — симметричная положительно опре- определенная матрица. Методом минимальных поправок называется не- неявный итерационный метод B), в котором параметр тЛ+] выбира- выбирается из условия минимума нормы ||ш»Л.мfli = (Bwh+U wh+l)U2 при за- заданном векторе wh. В случае В = Е метод минимальных поправок совпадает с методом минимальных невязок. Найдем выражение для итерационного параметра xh+l. Пере- Перепишем A6) в виде и вычислим l^+ifs = ||вуа||в — 2xk+A(Awk, wk) + Xft+1 (fi"Ma, Awk). Отсюда следует, что \\wh+l |^ будет минимальной, если положить (Awb, /jу\ Для реализации метода минимальных поправок требуется на каждой итерации решить систему уравнений Bwk = rh, откуда най- найдем поправку wh, и решить систему уравнений Bvh = Awh, откуда найдем вектор vh = B~iAwh, необходимый для вычисления парамет- параметра Т.ь+1. Скорость сходимости метода минимальных поправок определя- определяется границами спектра обобщенной задачи на собственные зна- значения Ах=ХВх. A8) Теорема 2. Пусть А, В — симметричные положительно опре- определенные матрицы и ta,ln(?-M), ^max(S~M)—наименьшее и наи- 118
большее собственные значения задачи A8). Для погрешности ме- метода минимальных поправок выполняется оценка 1А (хп - х) ||fl_, *? р» | А (х0 - х) И^,, л = О, 1. • • • где Ро 1-К* *.m«(fl-M) Доказательство. Перепишем уравнение для поправки A6) в виде где vk = Bil2wk, C = B~U2AB~U2. Выражение A7) для итерационного параметра t*+i принимает вид Уравнения B0) и B1)—это те же самые уравнения F), (8), которые возникают в методе минимальных невязок. Поэтому мож- можно воспользоваться теоремой 1 и записать оценку A3), которая те- теперь примет вид K+ilKpolM, B2) где __ 1—g g '-min(C) Р g Заметим, что Xmla(C)=Xmla(B-lA) и Xma(C)=Xmtx(B-iA). Кроме того, Отсюда и следует оценка A9). 3. Метод скорейшего спуска. Рассмотрим явный метод D) и выберем итерационный параметр xh+i из условия минимума ||2t+1|L при заданном векторе zk, где zk+l=xh+i—x. Поскольку погрешность zh удовлетворяет уравнению имеем = || гк fA — Следовательно, Цг^Цл будет минимальной, если положить (Azk, Azk) {А*гк, Агк) 119
Так как величина zk=xk—х неизвестна (поскольку неизвестно точное решение х), надо учесть, что Azh=rh = Axh—f, и вычисление проводить по формуле B3) Так же, как и в теореме 1, доказывается, что метод скорейшего спуска сходится с той же скоростью, что и метод простой итерации с оптимальным параметром. т = т0. Для погрешности метода ско- скорейшего спуска справедлива оценка \\хп-х\\А^9пй\\ха-х\\А, /1 = 0, 1 B4) Неявным методом скорейшего спуска называется метод B), в котором параметр тЛ+1 выбирается из условия минимума |||| Так как погрешность zk = xh—х удовлетворяет уравнению получим 1 Zft« Та = 1 zk |[V— 2т4+1 (Azk, Br^Azk) + т2 или ||Zft+i ||л = ||z*||i — 2тА+1 {rk, wk) + rl+1 {Awk, wk). Следовательно, ||zft+1|^ будет минимальной, если положить k, При этом для неявного метода скорейшего спуска справедлива оценка B4), где 4. Метод сопряженных градиентов. Метод сопряженных гради- градиентов является двухшаговым итерационным методом, т. е. для на- нахождения новой итерации хп+1 используются две предыдущие ите- итерации хп и xa-i. Следовательно, здесь возрастает требуемый объем памяти, нужно помнить не только вектор хп, но и л;„_,. Применение двухшаговых методов оправдывается тем, что при правильном вы- выборе итерационных параметров скорость сходимости будет выше, чем у одношаговых методов. Например, рассматриваемый далее метод сопряженных градиентов при любом начальном приближении сходится за конечное число итераций. Пусть А — матрица системы A) и В — симметричная положи- положительно определенная матрица. Рассмотрим следующий класс не- 120
явных двухшаговых итерационных методов: В <**«-«»> +О-<W<«*-*^> +AXk = f, ft = l,2, ... B6) Здесь aft+i, тЬч— итерационные параметры, которые будут опреде- определены далее. Для начала счета необходимо задать два начальных приближения х0 и х,. Начальное приближение х„ будем задавать произвольно, а вектор х{ вычислять по одношаговой формуле, ко- которая получается из B6) при k = 0, щ = \, т. е. по формуле Bx-i^zl!L+Ax0=f. B7) Если параметры aA+(, тк+1 найдены, то новое приближение xh+l выражается через деэ предыдущих значения хк и xh-t по формуле x,,+i = ah+ixh+ A—aJ+,)ii-i—Tft+iaft+Ia>A, B8) где wh = B-irh, rk=Axk—f. 5. Минимизация погрешности. Перейдем к вопросу о выборе итерационных параметров в методе B6). Для погрешности zh = = xh—х получим уравнения zll+l = ak+1{E—7k+iB-iA)zk-lr(l—a,k+i)zh-l, /г = 1. 2, ..., z,= (?—riB-1AJ0. Введем, как и ранее, вспомогательную функцию vh = A1/2zk, для которой |iwft|| = llzJL. Функция vk удовлетворяет уравнениям Щ+1 = ak+l (Е — хк+1С) vk + A — ak+1) vk-u k=\,2, . . ., B9) vl = {E — TjC) v0, C0) где C = Ai/2B~1A1/2. Будем считать, что А и В — симметричные по- положительно определенные матрицы, удовлетворяющие неравен- неравенствам у, В < Л ===42-6, Т2>"Ь>°- C1) Тогда С* = С>0, причем ЕСЕ. C2) Исключая последовательно из уравнений B9), C0) векторы v1} v2, ¦ ¦ ¦, vh-i, найдем, что vh = Pk(C)v0, C3) где Ph{C) — многочлен степени k от оператора С, удовлетворяю- удовлетворяющий условию Рк@) =Е. Поставим задачу выбрать итерационные параметры тА, ak так, чтобы при любом л=1, 2, ... была бы минимальной ||yn|| = l|zn||A. Обратим внимание на отличие от постановки задачи, возникающей при построении оптимального чебышевского набора итерационных параметров (см. § 6). Там при фиксированном п требовалось най- найти параметры, минимизирующие ||2П||А. Теперь же требуется боль- большее— минимизировать HzJL при каждом п. 121
Параметр ti находится из условия минимума \\Vt\\ при заданном векторе и0. Так же, как и в методе скорейшего спуска, получаем C4) Отметим, что при таком выборе rt выполняется равенство (Cvu va) =. = 0, т. е. векторы и, и v0 ортогональны в смысле скалярного про- произведения {и, v)c~(Cu, v). Далее, рассмотрим погрешность vh=Ph(C)v0, возникающую на k-й итерации, и запишем многочлен Рк(С) в виде к l ft V / \ si I ' \*^ / где a\k) —числовые коэффициенты, определяемые параметрами а,-, Ti, ;=1,2, ...,k. Тогда к Найдем условия, которым должны удовлетворять коэффициен- коэффициенты а*/1', минимизирующие ||ип||2. Из C6) получим л а т. е. |]yj|2 является многочленом второй степени по переменным af\ ...,a^i. Приравнивая к нулю частные производные д\\ю„\\г/ /да^\ /= 1, 2, ..., п, приходим к системе уравнений 2 а(? (С\, С\) + (C'v0, v0) = 0, C8) решение которой af\ i=\, 2, ...,«, и обращает в минимум ||и„Ц!. 6. Выбор итерационных параметров в методе сопряженных гра- градиентов. Целью дальнейших рассуждений является нахождение па- параметров ак, тй, k = l, 2, ..., п, для которых выполнены условия C8). Заметим прежде всего, что C8) можно записать в виде (C'vo,vn)=O, /=1,2, ...,n. C9) Лемма 1. Условия C9) эквивалентны условиям {Cv,, о„)=0, / = 0, 1, .... я-1. D0) Доказательство. Согласно C6) имеем 122
поэтому / (Cvh vn) = {Cv0, vn) + 2 a'" (C'+4. vn) = 1=1 /rl 1=2 Пусть выполнены условия C9). Тогда, если /+1^п (т. е. / *^п— 1), то (Со0, о,) =0, (С2и0, оя) =0, ..., (CJ+1ra, Wn) =0. Поэтому из D1) при j^n—1 получим (Cvh o.)=0. Итак, условия D0) следуют из C9). Покажем, что верно и об- обратное, т. е. из D0) следует C9). Доказательство проведем индук- индукцией по числу /. Условие D0) при / = 0 совпадает с условием C9) при /=1. Предположим, что условия C9) выполнены для / = = 1, 2, ..., k, и покажем, что они выполнены и для j — k+1, где Из D0) при j = k получим, учитывая C6), 0 = (Cvk, vn) = ( Cv0 + 2 af]Ci+\, vn) = ftrl 1=2 По предположению индукции условия C9) выполнены при / = = 1,2, ..., k. Поэтому из D2) получим at1 (C+\, vn) = о. Поскольку ар ф 0 (так как Рк(С) —многочлен степени k), отсюда получаем (Ch+lv0, vn)=0, т. е. условия C9) выполнены и при / = Лемма 1 доказана. Она потребуется для построения оптималь- оптимальных итерационных параметров в методе B6). Заметим, что число п в лемме 1 предполагалось фиксирован- фиксированным, в то время как при постановке задачи оптимизации мы тре- требовали, чтобы ||flj| была минимальной при любом п=\, 2, ... По- Поэтому оптимальные параметры надо отыскивать не из условий D0) при фиксированном п, а из условий (Со,, о„)=0, /1=1,2,..., / = 0, 1,...,л—1. D3) Если такие параметры будут найдены, то это будет означать, что построена ортогональная (в смысле скалярного произведения {и, v)c=(Cu, v)) система векторов va, vu ..., vk, ... Поскольку пространство решений системы A) имеет размерность т, постро- 123
енная ортогональная система будет содержать не более т векто- векторов. Это означает, что начиная с некоторого п (п^.т) погрешности vn обратятся в нуль, т. е. метод сойдется за конечное число ите- итераций. Перейдем к построению итерационных параметров, для которых выполнены условия D3). Параметры а, и т, найдены согласно C4): JP^v^ D4) \\Cvof Пусть параметры п, х2, •. •, uft, а,, аг, ¦ ¦ ¦, ак уже выбраны опти- оптимальным образом. Тогда согласно D3) выполняются условия (CwJlw1)=0, i=l,2,...,k, / = 0, 1, ..., i— 1. D5) Построим оптимальные параметры xk+1, ак+1. Согласно лемме 1 при n=k+l должны выполняться условия (Си,-, vh+l)=0, / = 0, 1, ...,*. D6) Часть из этих условий, а именно условия D6) при / = 0, 1, ..., k—2, следует из D5). Действительно, согласно B9) имеем (vk+1, Cvj) = ak+1 ipk, Cvj) — ak+1xkn (Cvk, Cvj) + A — ah+l) (vk-u Cv,). Из D5) при i = k и [ — k—1 получим, соответственно, {Cv,,vk) = 0, / = 0, 1, .... k—l, (Cvhv,^) = 0, / = 0, 1, .... k-2. Поэтому (vll+l, Cvj) =—ak+ixk+i(Cvk, Cvs) D7) при / = 0, 1, .. ., k—2. Покажем, что для этих же значений / выполняются равенства (Cvk, Cvj) =0. Запишем уравнение B9) при k = \: vj+i = aj+, (E— xJ+1C) Vj+ A—aj+1) vHi и найдем отсюда CVj = Vj [Ujtl — A — K/+1) Vj-J. T/+i ai+iTi+i Умножая предыдущее соотношение скалярно па Cvh и учитывая симметричность матрицы С, получим (Си;, Cvk) = =-- -^- (и/, Си,) ! [(vj+u Су*) - A - а/+1) (»/_!, Си*)] = т/+1 a/+iT/+i = (Си/. и*) [(Си,и, Vk) — (l — щл) (Cvhl, vk)]. T/+i KyViTy+i Из D5) при i = k имеем (Cvj, vk) = 0, / = 0, 1, .... fe—1, (Co/+1, yA)==0, / = 0, 1, ..., k—2, {Cvhl,vk) = 0, /=1,2, .... ft. 124
Следовательно (Cvh Cvk) =0 при / = 0, 1, ..., k—2, и согласно D7) имеем (vh+l, Cvt) =0, /-0, 1, ..., k—2. Итак, из всех условий D6) остаются лишь два: {C'dk-u vk+i) = 0, D8) (Cvk, Vk+i) = 0. D9) Подставляя в D8) значение vk+i из B9),получим 0 = а^+1 (Vk, Cvt,-i) — a^+1TA+i {Cv^ Сиь-т) + A — <*ft+i) (Щ-i, Cv^). Согласно D5) при i = k, j = k—1 имеем (Cvh-i, oj=0, так что пре- предыдущее уравнение принимает вид —ah+ixk+i{Cvk, Cvh-i) + (\—ak+i) {Cvh-u vK-,\=Q. E0) Далее, подставляя в D9) значение vk+l из B9), получим 0 = ak+1 (vk, Cvk) — a-k+itk+i {Cvk, Cvk) + A — ak+1) (vk-u Cvk). Последнее слагаемое в этом тождестве равно нулю, так как соглас- согласно D5) при i = k, \ — k—1 имеем (vh-it Cyft) = (Cyft_,, vk)=0. Таким образом, приходим к тождеству ah+i[(Cvln vh)—iL+1(Cvh, Cvh)]=0, из которого находим значение параметра Обратимся теперь к уравнению E0) и исключим из него выра- выражение (Cvh, Cvk-i). Из уравнения B9) получим Cvh-,. = — v^ — [vk — A — о*) iv2], E2) *к akTk следовательно, (Cvk, Cv^1)= — (Cvk, da-0 — [(Cvk, vt) — A — ak) (Cvk, vk.2)]. 4 akTk Согласно D5) имеем (Cvk, vk-i) = (vk, Cvk^) == 0, (Cvk, vk-i) = (vk, Cvk-z) — 0. Поэтому (Cvk, Ca*_i) = (Cvk, vk). akTk Подставляя это выражение в E0), получим a-k*k (Cvk-v vk-i) 125
Отсюда приходим к рекуррентной формуле для параметров Формулами E1), E3) задаются выражения для итерационных параметров в методе сопряженных градиентов. Скалярные произ- произведения, входящие в эти выражения, вычисляются в процессе ите- итераций. Учитывая, что получим Cvk=Al/2wh, (Cvh, vk) = (wh, rk), (Cvk, Cuh) = (Awh, wh). Поэтому окончательно приходим к следующим формулам для определения итерационных параметров в методе сопряженных гра- градиентов: ^f) k = Q, I, .... E4) (Awk, wk) = 1 — , «=1,2,..., a! = l. E5) Ть ak (Ашь., wk_.) 7. Оценка погрешности в методе сопряженных градиентов. Выше отмечалось, что в методе сопряженных градиентов точное ре- решение системы уравнений A) получается за конечное число итера- итераций, равное порядку системы. Если порядок системы велик, то мо- может оказаться полезной и оценка погрешности. Эта оценка не хуже, чем в одношаговом итерационном методе с чебышевским набором параметров. Действительно, из выражения для погрешности C3) получаем Поскольку Рп(С) —многочлен степени п от оператора С, удо- удовлетворяющий условию Р„@)=?, выполняется оценка где Тп— многочлен Чебышева, наименее уклоняющийся от нуля на [тт., т.]. г„@) = 1. Таким образом, для погрешности метода сопряженных градиен- градиентов справедлива оценка \\хп—xl где <7« = 2pJ/(l+Pjn). 126
ГЛАВА 3 ИНТЕРПОЛИРОВАНИЕ И ПРИБЛИЖЕНИЕ ФУНКЦИЙ В настоящей главе излагаются вычислительные аспекты некото- некоторых задач теории приближения функций. Задача интерполирования состоит в том, чтобы по значениям функции f(x) в нескольких точ- точках отрезка восстановить ее значения в остальных точках этого отрезка. Разумеется, такая задача допускает сколь угодно много решений. Задача интерполирования возникает, например, в том случае, когда известны результаты измерения */*=/(**) некоторой физической величины f(x) в точках xh, k = Q, I, ..., п, и требуется определить ее значения в других точках. Интерполирование используется также при сгущении таблиц, когда вычисление зна- значений f(x) трудоемко. Иногда возникает необходимость прибли- приближенной замены или аппроксимации данной функции другими функциями, которые легче вычислить. В частности, рассматривает- рассматривается задача о наилучшем приближении в нормированном простран- пространстве Я, когда заданную функцию /е# требуется заменить линей- линейной комбинацией ср заданных элементов из Н так, чтобы отклоне- отклонение ||/—ф|| было минимальным. Результаты и методы теории ин- интерполирования и приближения функций нашли широкое примене- применение в численном анализе, например при выводе формул численного дифференцирования и интегрирования, при построении сеточных аналогов задач математической физики. § 1. Интерполирование алгебраическими многочленами 1. Интерполяционная формула Лангранжа. Пусть на отрезке Ь заданы точки xh, k = 0, 1, ..., я (узлы интерполирования), в которых известны значения функции f(x). Задача интерполиро- интерполирования алгебраическими многочленами состоит в том, чтобы по- построить многочлен п A) степени п, значения которого в заданных точках xh, k= 0, 1, ..., п, совпадают со значениями функции f(x) в этих точках. Для любой непрерывной функции f(x) сформулированная зада- задача имеет единственное решение. Действительно, для отыскания ко- коэффициентов а„, аи ..., а„ получаем систему линейных уравнений а0 + a.xi + а2х] + . . . + апх>} = / (*,-), i = 0, 1, ..., п, B) определитель которой (определитель Вандермонда [12, с. 33]) от- отличен от нуля, если среди точек хи i=0, 1, ..., п, нет совпадающих. Многочлен Ln{x), удовлетворяющий условиям Ln(Xi)=f(Xi), ( = 0, 1, ...,«, C) называется интерполяционным многочленом для функции f(x), построенным по узлам {*,}?. 127
Решение системы B) можно записать различным образом. Наи- Наиболее употребительна запись интерполяционного многочлена в форме Лагранжа и в форме Ньютона. Интерполяционная формула Лагранжа позволяет представить многочлен Ln(x) в виде линейной комбинации Ы*)=2 ск[х)Цхк) D) значений функции f(x) в узлах интерполирования. Найдем явное выражение для коэффициентов ск(х). Из условий интерполирования C) получаем 2 ck(xt)f(xk)=f(xt), i = 0, 1 п. ft=o Эти соотношения будут выполнены, если на функции ск{х) нало- наложить условия 0, 1фк, 1, i = k, i = 0, 1, .... п, которые означают, что каждая из функций ck(x), k = Q, 1, ..., п, имеет не менее п нулей на [а, Ь]. Поскольку Ln(x)—многочлен степени п, коэффициенты ch(x) естественно искать также в виде многочленов степени п, а именно в виде ск(х) =1к(х—х0) (x—xl)...(x—xh-l) (x—xk+i)...(x—xn). Из условия ск(хк) = 1 находим А-й1 = (Хк — Хо) (Xk — Xj) ... (Хк — Хк-т) {Хк — Xkvx) ... (Хк — Х„). Таким образом, коэффициенты ск{х) интерполяционного много- многочлена D) находятся по формулам П (*-*/> ^E) к() . Часто коэффициенты ск{х) записывают в другом виде. Введем многочлен (л(х) степени /г+1: (й(х) = (Х—Хо) (Х—Х^ . . .(Х—Хь-^ (Х—Хк) (Х—Х„+1)...(Х—Хп) F) и вычислим его производную в точке хк: ®'(хк) = (хк—Хо)... (хк—хк^) (xh—xh+l)... {xh—хп). Тогда получим, что / \ (S) (х) Си (X) = — . (х — хк) со' (хк) 128
Итак, интерполяционный многочлен Лагранжа имеет вид Ln (х) = V m(jc) /(**) G) ?j0 (* — ¦*¦*) «> (*а) или, более подробно, м*)=2 — 2. Интерполяционная формула Ньютона. Эта формула позволя- позволяет выразить интерполяционный многочлен ^п(х) через значение f(x) в одном из узлов и через разделенные разности функции f(x), построенные по узлам х„, хи ..., хп. Она является разностным ана- аналогом формулы Тейлора ()a f"(x0) + ... Сначала приведем необходимые сведения о разделенных раз- разностях. Пусть в узлах хье[а, b], k = 0, 1, ..., п, известны значения функции f(x). Предположим, что среди точек xh, & = 0, 1, ..., п, нет совпадающих. Разделенными разностями первого порядка назы- называются отношения xl — п, Будем рассматривать разделенные разности, составленные по соседним узлам, т. е. выражения f(x0, Xi), f(xu x2), ..., f(xn-i, х„). По этим разделенным разностям первого порядка можно по- построить разделенные разности второго порядка: flv y у\— f (хъ x-i) — f (Ч, х,) I (Х0> Х1> Х> fly у I \xn-li Xn-i, Аналогично определяются разделенные разности более высоко- высокого порядка. Например, если известны разности k-то порядка / \xh Xj+i, . . . /to, x3) xa i — xo xn- l, X,) то разделенная разность (k+ l)-го порядка определяется как ~ f (xi> xj+i x 5 А. А. Самарский, А. В. Гулнн 129
При вычислении разделенных разностей принято записывать их в виде таблицы Ч ¦ • хп /(¦«о) /(*а) • ¦ КХп) f (*о. *i) f (Хи х2) ¦ ¦ ¦ f{xn-V хп) / (х0, хъ х2) ¦ f (Xn-2< *«-!• Хп) ¦ / (ХО, *i,... Хп) Разделенная разность й-го порядка следующим образом выра- выражается через значения функции f(x) в узлах: h х,н, .... xhk) = (9) Эту формулу можно доказать методом индукции. Нам потребуется частный случай формулы (9): /=0. l f (Хд XL — Xn) ¦ A0) Интерполяционным многочленом Ньютона называется много- многочлен = / (*о) + (х~ хо) / (-«о. *i) + (* ~ -«о) {х — Xi) f (х0, xlt х2) + ... ... + (X — Хо) (X — Xj) ... (X — Хп-,) / (Хо, Х1г ..., Хп). (II) Покажем, что многочлен Рп(х) совпадает с многочленом Ла- гранжа (8). Рассмотрим наряду с Ln(x) многочлены L0(x)=f(x0), 130
I,(a), ..., !„_,(*) и представим Ln(x) в виде U (х) = Lo (x) + 2 {Li (x) - L/_x (x)). A2) Из условий интерполяции C) получаем, что при k=0, I, ..., /—1 и /==1, 2, ..., п. Следовательно, разность Lj(x)—L,_,U) представляет собой алгебраический многочлен сте- степени /, который обращается в нуль в точках х0, х1л ..., х^и т. е. Lj(x)—Lj^{x)=Ai(x—xo)(x—xi)...{x—xHi), A3) где Aj— числовой коэффициент. Этот коэффициент находится из условия L,{Xj) — Lj-i(х,) =А}(х—ха) (x{—xi)...(xj—xJ-i), откуда, учитывая условие Lj (х,) = /(х}), получаем Л^-^-^С/» , A4) (X Х) (X X^ Подставим в A4) вместо слагаемого Lj-^Xj) его значение, вы- вычисленное согласно (8), т. е. Lhl (x,) = = 'у f (xk) {Х' ~ Хо) {Х* ~Х>) '''(Х' ~ Xk~l] iX' Тогда получим (Г/ ~ xk> <xk - xo) ¦ ¦ ¦ (xk - xk-y) (xk - f^ (xk — xa)... (xk — xk_J (xk ~xktl) ... (xk — xM) (xk — Xj) Сопоставляя это выражение с A0), видим, что Л, совпадает с раз- разделенной разностью /-го порядка: A)=f(xB, xu ..., Xj). Отсюда и из A2), A3) приходим к интерполяционной формуле Ньютона (х — хо) I {х0, хг) + (х — х0) {х — хг) / (х0, хъ х2) + ... ... 4- {х — х0) (х — ач) ...(х — х„_,) / (х0, хи .... хп). A5) 5* 131
Подчеркнем еще раз, что формулы (8) и A5) представляют со- собой различную запись одного и того же многочлена удовлетворяющего условиям интерполяции B). Интерполяционную формулу Ньютона удобнее применять в том случае, когда интерполируется одна и та же функция f(x), но чис- число узлов интерполяции постепенно увеличивается. Если узлы ин- интерполяции фиксированы и интерполируется не одна, а несколько функций, то удобнее пользоваться формулой Лагранжа. Замечание. При выводе формулы A5) не предполагалось, что узлы Хо, Xi, ..., хп расположены в каком-то определенном порядке. Поэтому роль точ- точки х0 в формуле A5) может играть любая из точек х0, х\, ..., хп. Соответ- Соответствующее множество интерполяционных формул можно получить из A5) пере- перенумераций узлов. Например, тот же самый многочлен Ln(x) можно представить в виде I / v- у W у У \ f 1У V У 14. -f- (X Хп) [\ Xn-Y> I УХП< ХП-\< ХП-1> Т~ ¦ ¦ • ... + (* — хп) (х — хп_х) ... (х — ач) f (xn, хп_х л-0). A6) Если Jfo<x1<A-2< ... <хп, то A5) называется формулой интерполирования вперед, а A6) —формулой интерполирования назад. § 2. Погрешность интерполирования 1. Остаточный член интерполяционной формулы. Заменяя функ- функцию f(x) интерполяционным многочленом Ln(x), мы допускаем по- погрешность rn{x)=f(x)—Ln(x), которая называется погрешностью интерполирования или, что то же самое, остаточным членом интерполяционной формулы. Ясно, что в узлах интерполирования эта погрешность равна нулю. Оце- Оценим погрешность в любой точке хе[й, ft]. Для этого рассмотрим вспомогательную функцию g(s)=f(s)—Ln(s)—/Co)(s), A) где s^[a, b], К — постоянная и w (s) = (s—ха) (s—xt)... (s—xn). B) Пусть требуется оценить гп(х) в заданной точке ie[a, ft], не являющейся узлом интерполирования. Выберем постоянную К из условия g(x)=0. Для этого достаточно положить f (х) — 1„ (х) Предположим, что f(s) имеет п+1 непрерывную производную на отрезке a^s^ft. Функция g(s) имеет не менее п + 2 нулей на этом отрезке, а именно в точках х, xh, k=0, 1, ..., п. Поэтому про- производная ?'(s) имеет не менее чем л+1 нулей на [a, ft], ^"(s) — 132
не менее п нулей и т. д., функция gtn+tl(s) по крайней мере один раз обращается в нуль на [а, Ъ]. Тем самым существует точка |е[а, Ь], в которой g<"+1>(?) =0. Поскольку g<"+i)(s)=/<n+1)(s) получаем Таким образом доказано, что погрешность интерполирования можно представить в виде f(x)-La(x)= ^® оз (х), C) где |е[а, Ь] и оз(х) —многочлен, определенный согласно B). Отсюда следует оценка м 1/(*)-1„(*I< {п™ху | ев (л:) |, D) где /W,,^ = sup \f-"+i) {х)\. В частности, если f(x)—алгебрапче- х~[а.Ь] ский многочлен степени п, то интерполирование, проведенное по любым точкам х0, хи ..., хп, осуществляется точно, т. е. Ln(x) = Замечание. Наряду с интерполированием применяют и экстраполиро- экстраполирование, т. е. вычисление значений функции f(x) в точках *е[а, Ь] по приближен- приближенной формуле f(x)fnLn(x), где Ln(x)—интерполяционный многочлен. Однако погрешность экстраполирования обычно оказывается существенно большей, чем погрешность интерполирования. К этому выводу можно прийти, рассматривая поведение многочлена ш(х) внутри и вне отрезка [а, Ь]. Поскольку многочлены Лагранжа и Ньютона отличаются толь- только формой записи, представление погрешности в виде C) справед- справедливо как для формулы Лагранжа, так и для формулы Ньютона. Однако погрешность интерполирования можно представить и в дру- другом виде. Для этого рассмотрим разделенную разность + / (•*> *o> xii • • • > хп) (х — х0) {х — хг) ... (х — хп) (*0 — X) (X0 ~Xj) ... (XB —Xn) (Xn — X) (Xn — . имеющую порядок п+\. Отсюда найдем (JC — Хг) (X—X2) ... (X — Xn) f{x) = f (ха) ( .. . (х0 — х{) (х0 — х2) ... (х0 — хп) (х-хо)(х — х1) ... (х — хп_х) (Хп — Х0) (Хп ~Xj) ... (Хп — Xn_J х — х0) (x — Xj) . .. (x — xn)f(x, х0, хъ ..., хп) = = Ln (X) + (Х — Хо) (Х — Х,) ... (X — Хп) f (X, Хо, ... , Хп). 133
Таким образом, погрешность интерполяционной формулы мож- можно представить в виде f(x)—Ln(x)=(a(x)f{x, xa, а-!, .... хп). E) Сопоставляя C) и E), видим, что существует точка |е[а, Ь], для которой f(x,xo,Xl Хп)=±—М.. F) Формула F) устанавливает связь между разделенной раз- разностью порядка п+\ и (тг+1)-й производной функции f(x). 2. Оптимальный выбор узлов интерполирования. Величину | <в (х) \, входящую в оценку D), можно минимизировать за счет вы- выбора узлов интерполирования. Задача состоит в том, чтобы подо- подобрать узлы xk^[a, b], fe = 0, 1, ..., п, так, чтобы минимизировать величину max | (х — х0) (х — хх) ...(х- хп) [. Эта задача уже рассматривалась в примере 1 из § 5 гл. 2. Она ре- решается, как мы знаем, с помощью многочлена Чебышева Ты (х) = -1 2МД cos ^(я + 1) arccos ^_J j , G) причем в качестве узлов интерполирования надо взять корни мно- многочлена G), т. е. точки xk bcos-^?!k = 0, I, . .. , п. (8) 2 2 2(я+ 1) При этом max и оценка D) примет вид 3. О сходимости интерполяционного процесса. Возникает воп- вопрос, будет ли стремиться к нулю погрешность интерполирования f{x)—Ln{x), если число узлов п неограниченно увеличивать. Ответ, вообще говоря, отрицательный. Сформулируем определение сходимости интерполяционного про- процесса. Множество точек х-и i = 0, 1, ..., п, таких, что назовем сеткой на отрезке [а, Ь] и обозначим через Qn. До сих пор предполагалось, что число узлов интерполяции фиксировано. Пере- Переходя к изучению сходимости интерполяционного процесса, необхо- 134
цимо рассмотреть последовательность сеток с возрастающим чис- числом узлов, а именно последовательность Qo = {xq }, Их == \хо > xi }> • • • ^ == х х * } == \хо < х\ i Пусть функция f(x) определена и непрерывна на [а, Ь]. Тогда можно задать последовательность интерполяционных многочленов Ln[f(x)], построенных для функции f(x) по ее значениям в узлах сетки й„. Говорят, что интерполяционный процесс для функции f(x) схо- сходится в точке х*^[а, Ь], если существует Кроме поточечной сходимости рассматривается сходимость в различных нормах. Например, равномерная сходимость на отрезке [а, Ь] означает, что max |/(*)-M/(*)]|-*0 У> 1,0 при п->-оо. Свойство сходимости или расходимости интерполяционного про- процесса зависит как от выбора последовательности сеток, так и от гладкости функции f(x). Известны примеры несложных функций, для которых интерпо- интерполяционный процесс расходится. Так, последовательность интерпо- интерполяционных многочленов, построенных для непрерывной функции f(x) = \x\ по равноотстоящим узлам на отрезке [—I, 1], не сходится к функции \х\ ни в одной точке отрезка [—1, 1], кроме точек —1, 0, 1 (пример С. Н. Берн- штейна, см. [24, с. 519]). На рис. 4 в качестве иллюстрации изображен гра- о 5 фик многочлена L<,(x) при О^л:=?Г1, построенного для функции | а:| по рав- равноотстоящим узлам на отрезке [—1, 1]. Более общее утверждение содер- содержится в теореме Фабера (дока- (доказательство см. в [24, с. 515]): какова бы ни была последовательность сеток Qn, найдется непрерывная на [а, Ь] функция f(x) такая, что последова- последовательность интерполяционных много- многочленов Ln[f(x)] не сходится к f(x) равномерно на отрезке [а, Ь]. Для заданной непрерывной функции f(x) можно добиться схо- сходимости за счет выбора расположения узлов интерполяции. Спра- Справедлива теорема Марцинкевича (см. [24, с. 519]): если f(x) непрерывна на [а, Ъ\, то найдется такая последовательность 0,5 1,0 х Рис. 4. График интерполяцион- интерполяционного многочлена для функции 11 135
сеток, для которой соответствующий интерполяционный процесс сходится равномерно на [а, Ь]. Заметим, что построить такие сетки чрезвычайно сложно и, кро- кроме того, для каждой функции требуется своя сетка. В практике вычислений избегают пользоваться интерполяционными многочле- многочленами высокой степени. Вместо этого применяется кусочнополино- миальная интерполяция, пример которой будет рассмотрен в § 4. § 3. Интерполирование с кратными узлами 1. Интерполяционный многочлен Эрмита. В предыдущих пара- параграфах предполагалось, что в узлах интерполяции заданы только значения функции f(x). Более общая постановка задачи интерпо- интерполирования состоит в следующем. В узлах xk^[a, b], k = 0, 1, ..., пг, среди которых нет совпадаю- совпадающих узлов, заданы значения функции f(xk) и ее производных f{i)(xh) до порядка Nk-—1 включительно, t=l, 2, ..., Nk—1. Таким образом, в каждой точке хк, k — 0, 1, ..., пг, известны и, следовательно, всего известно N0 + Nt +.. . + Nm величин. Требу- Требуется построить алгебраический многочлен Нп{х) степени п = = Na+Ni + .. . + Nm—1, для которого Я<?(*к)=Р'(*к), k = 0, 1, ...,m, i = 0, 1, ..., Nh-L A) Многочлен Нп(х), удовлетворяющий условиям A), называется интерполяционным многочленом Эрмита для функции f(x). Число М„ называется кратностью узла xh. Докажем, что интерполяционный многочлен Эрмита существует и единствен. Условия интерполяции A) представляют собой систе- систему линейных алгебраических уравнений относительно коэффициен- коэффициентов а0, а{, ..., ап многочлена Нп(х) =ай + а1х + .. . + а„хп. Число уравнений этой системы равно числу неизвестных и равно Лг0 + Лг1 + .. . + Nm. Поэтому достаточно показать, что однородная си- система H{?(xk) = Q, й = 0,1, ...,«, ; = 0, 1, .... Nk—l, B) имеет только тривиальное решение аа=^а1 = .. . = о„ = 0. Группа условий B) при фиксированном k и t = 0, 1, ..., Nh—1 означает, что число xk является корнем кратности NK многочлена Нп(х). Таким образом, многочлен Нп(х) имеет всего с учетом крат- кратности не менее Na + Nl + ... + Nm=n+\ корня на [а, Ь]. Поскольку степень Нп(х) равна п, этот многочлен тождественно равен нулю, следовательно, равны нулю его коэффициенты и однородная систе- система уравнений B) имеет единственное решение aa = ai = .. . = ап=0. Неоднородная система A) однозначно разрешима при любых пра- правых частях. 136
Поскольку значения f(i)(xk), k — 0, 1, .... m, 1 = 0, 1, .... A'k— 1, входят только в правую часть системы A), коэффициенты о,- мно- многочлена //„(л:) выражаются линейно через значения f(i)(xh), и этот многочлен можно представить в виде линейной комбинации Нп(х)= 2 2 с« (*)/'"(**). &=0 (=0 где cft,(л;) — многочлены степени п. Ввиду громоздкости выражений для ch((x) мы их не приводим. Получим представление для погрешности интерполирования Для этого рассмотрим, как и в § 2, вспомогательную функцию g(s)=f(s)-Hn(s)-K<o(s), C) где К—постоянная и со (s) = (s — xof" (s — Xlfl ... (s — xm)N'n. D) Постоянную К выберем так, чтобы в точке интерполирования х выполнялось условие g(x)=0, т. е. положим f(x)-Hn(x) Узлы xh являются корнями кратности Nh функции g(s), k = = 1, 2, ..., т. Кроме того, точка ie[a, b] является корнем g(s). Таким образом, функция g(s) имеет с учетом кратности N0+Nt + ... .. . + Nm+ 1 =п + '2 корня на отрезке [a, ft]. По теореме Ролля про- производная g' (s) имеет по крайней мере один нуль между двумя со- соседними корнями функции g(s). Следовательно, g'(s) имеет не ме- менее т+\ корня на [а, Ь] в точках, не совпадающих ни с одной из точек х0, хи ..., хт, х. Кроме того, g'(s) имеет в точке xh корень кратности Nh—1, k = 0, I, ..., т. Таким образом, g'(s) имеет с уче- учетом кратности не менее корней на [a, ft]. Аналогично g"(s) имеет не менее п корней и т. д. Производная gin+t> (s) по крайней мере один раз обращается в нуль на [a, ft], т. е. существует точка |е[а, ft], в которой g-(n+1) (|) =0. Из C) имеем Так как to(s)—многочлен степени л+1 со старшим коэффициен- коэффициентом 1, имеем (o(n+1)(s) = (rt+l)! Поэтому из условия ^(п+1)(|)=0 получаем, учитывая выражение для К, следующее представление для погрешности интерполирования: f(x)-Hn(x) = -F^(x-xof'(x-x,)v'...(x-xm)}'m. E) 137
2. Пример. Пусть xo<Xi<x2 — точки, в которых заданы значения f(xo)=fc, f(Xi)=fu f'{xi)=fL f(x2)=f2. Требуется построить мно- многочлен третьей степени Н3(х) такой, что '*fu Ha{xt) = fa. F) Будем искать его в виде На (X) = С0 (X) /„ + С, (X) f, + С2 (X) /2 + 6Х (X) Д. где со(а:), сДх), С2(л), bt(x)—многочлены третьей степени. Ясно, что Н3(х) будет искомым интерполяционным многочленом, если, потребовать со(хо) = 1, с1(х0) = 0, с2(л;0) = 0, Ь1(х0)=0, co(*i) = Ot с1(дс1) = 1, c2(*i) = 0, bl{x1) = O, со(х2) = Оу сх(х2) = 0, с2(х2)=\, Ь1(х2) = 0, Найдем многочлены третьей степени, удовлетворяющие пере- перечисленным требованиям. Поскольку многочлен со(х) имеет кратный корень в точке xt и простой корень в точке х2, его можно искать в виде с0 (*) = К (х—х,J (х—х2). Из условия Со(х0):=1 находим Т7 (xa — Xi) (х0 — х%) Таким образом, с0(х) = (XxZ^f*Xx~^) ¦ G) Аналогично получаем с2 (Л) = (*--»о)(дс-*,)^ ^ (8) J, /^ \х ха) (х — хл) (х Х2> iq\ Далее, многочлен сг(х) будем искать в виде Ci (х) — (х—х0) (х—х2) (ах + р), где аир — постоянные, подлежащие определению. Из условия Ci(xj) = 1 находим aXl + p = 1- . A0) Условие с* (JCt) =0 приводит к уравнению (х— х„) (xi—x2)a+ (адс + р) Bдс,—х0—х2) =0. A1) 138
Из уравнений A0) и A1) находим ) о __ 1 / j , B*1 — Х0 — Х2) ХХ I — xa) 0*1 — X2) \ (xl — xd) 0*1 — xi) Таким образом, fr (x)=¦ *~ *°. 2? f1—*"^*l/w7— ~)^2 )' ^12^ Искомый интерполяционный многочлен Н3{х) имеет вид , Л (дс — Х])^*! — х0 — д:2) \ (х — х0) (х — хг) ,, . _j_ I ( ) (Jf) / (X X)(xx) (x — x^jx — x^ - . (a: —-ico)(^ —-ri)(x —x2) „ . . (*2 — X0) (*2 — *lJ ! (*1 — X2) (xl — Ao) Согласно E) погрешность интерполирования в случае много- многочлена A3) можно записать в виде / (х) - Н3 (х) = i^- (х - х0) (х — XlJ (х - х2), A4) где ?е(х0, х2). Интерполяционный многочлен Эрмита можно построить путем предельного перехода в многочленах Лагранжа и Ньютона. Поясним это на том же при- примере. Наряду с узлами *о, xit x2 введем узел х3 (отличный от хо, хи Хг) и по- построим по узлам jto, xi, Хг, хг интерполяционный многочлен Лагранжа Ц (х) = (*-*oH*-*iH*—*«> f (Хз) + Лхз — х0) (х3 — xj (х3 — х2) (х — х0) (х — х2) (х — хз) f(x), (х — хд) (х — ха) (х — *з) (a;x — л:0) (*х — л2) (Х! — х3) ' (д-0 — *,) (ха — *2) (хо—*з) (х2 — д:0) (х2 — ^) (л: л:) Получим многочлен A3) путем предельного перехода в A5). Зафиксируем точки х, Хо, хи х2 и устремим х3 к х\. Тогда последние два слагаемые перейдут в пределе в выражение (х— XlY(x-x2) (х — хо){х — х1)* / W + ; (') °6) Первые два слагаемые в A5) объединим следующим образом: -*3 — *^1 \-^3 — Л0/ ^ 3 — 2/ 11 — О/ \Л1 2/ / Поскольку при указанном предельном переходе величины х3—*4 и (х — xt) / (лг3) (х -У3) / (-Ух) стремятся к нулю, можно раскрыть неопределенность вида О/О, воспользовав- 139
шись правилом Лоииталя. Дифференцируя выражение A7) по Xs, получим функцию /(*i) (х — *i) Bх3 — хп — хй) . (xl-x0)(xl-x2) (ха-хпУ(х3-х2У ПХз) + , Г (* — *l) (*3 — *о) (*3 — так что .. . . j Г, (х — *i) Bхг — х0— x2) I hm а Ы = — 1 — / (xt) + Xr->Xi (Xi Х0) («! X2) L {Xl X0) (Xj — X2) J (X - JCj Г fo) (*1 — *о) (^1 — *2) Итак, первые два слагаемые в A5) переходят в пределе в выражение Г (x~x1)Bx1 — xi) — x2) 1 (* — jc0) (х — х2) —' т~. : ~ ; г f (xi) + L \Х\ —Xq) [х± —х2) J (х± — х0) (xi — х?,) , (x — x0) (x — xx) (x — xt) Отсюда и из A6) получаем многочлен A0). § 4. Интерполирование сплайнами Интерполирование многочленом Лагранжа или Ньютона на всем отрезке [a, b] с использованием большого числа узлов интер- интерполяции часто приводит к плохому приближению, что объясняется сильным накоплением погрешностей в процессе вычислений. Кро- Кроме того, из-за расходимости процесса интерполяции увеличение числа узлов не обязано приводить к повышению точности. Для того чтобы избежать больших погрешностей, весь отрезок [a, b] разби- разбивают на частичные отрезки и на каждом из частичных отрезков приближенно заменяют функцию j(x) многочленом невысокой сте- степени (так называемая кусочно-полиномиальная интерполяция). Одним из способов интерполирования на всем отрезке является интерполирование с помощью сплайн-функций. Сплайн-функцией или сплайном называют кусочно-полиномиальную функцию, опре- определенную на отрезке [а, Ь] и имеющую на этом отрезке некоторое число непрерывных производных. Слово «сплайн» (английское spline) означает гибкую линейку, используемую для проведения гладких кривых через заданные точ- точки плоскости. Мы не будем придавать слову «сплайн» какого-либо определенного технического смысла. Преимуществом сплайнов перед обычной интерполяцией явля- является, во-первых, их сходимость и, во-вторых, устойчивость процесса вычислений. В этом параграфе будет рассмотрен частный, но распространен- распространенный в вычислительной практике случай, когда сплайн определяется с помощью многочленов третьей степени (кубический сплайн). 140 138
1. Построение кубического сплайна. Пусть на [а, Ь] задана не- непрерывная функция f(x). Введем сетку a=xu<xi<.. . b и обозначим f<=f{xt), i = 0, I, ..., N. Сплайном, соответствующим данной функции f(x) и данным узлам {*i}f=o, называется функция s(x), удовлетворяющая следую- следующим условиям: а) на каждом сегменте [х^и xt], i=\, 2, ..., N, функция s(x) является многочленом третьей степени; б) функция s(x), а также ее первая и вторая производные не- непрерывны на [а, Ь]; в) s{x()=f(xt),i=0, \,...,N. Последнее условие называется условием интерполирования, а сплайн, определяемый условиями а)—в), называется также ин- интерполяционным кубическим сплайном. Докажем существование и единственность сплайна, определяе- определяемого перечисленными условиями. Приведенное ниже доказатель- доказательство содержит также способ построения сплайна. На каждом из отрезков [*(_,, х<], t = l, 2, ..., N, будем искать функцию s(x)=Si(x) в виде многочлена третьей степени Sl (х) = aL + bi (х - Xi) + 4 (х ~ *'J + ~ (х - *'K. 0) где ah bit cit di— коэффициенты, подлежащие определению. Пояс- Поясним смысл введенных коэффициентов. Имеем s'i (х) == bt + Cl (х - xi) + А (х - Xi)\ s'l (x) = ci + di (x — Xi), si (x) = di, поэтому Из условий интерполирования s(xt) =f{xx), i=l, 2, ..., N, полу- получаем, что a,=/(*,), i=\,2,...,N. Доопределим, кроме того, af, = f(x0). Далее, требование непрерывности функции s(x) приводит к условиям si(xi)=si+i{xi), i=l, 2, ...,iV-l. Отсюда, учитывая выражения для функций s,(x), получаем при /=0, 1,. . . , N—1 уравнения at = aUl + bi+l (Xi - xUl) + ^ (Xi - xUlJ + -%- (xc - xi+1K. 2 6 141
Обозначая h^Xi—Xt-i, перепишем эти уравнения в виде АА — 4гс< + ^Н'= /' — /<-!. » = 1,2, ...,#. B) 2 6 Условия непрерывности первой производной s't(Xi)=s'i+1(Xi), i= 1, 2, . . . , Л/— 1, приводят к уравнениям ctht - -j- hi = bt - bi-lt i = 2,3 JV. C) Из условия непрерывности второй производной получаем урав- уравнения di/i^cr-c,.,, t=2, 3,... , N. D) Объединяя B) — D), получим систему 3N—2 уравнений относи- относительно ЗЛ/ неизвестных bit cu d{, i= 1, 2,. . . , N. Два недостающих уравнения получают, задавая те или иные граничные условия для s(x). Предположим, например, что функ- функция f(x) удовлетворяет условиям f"(a)=f"(b) =0. Тогда естест- естественно требовать, чтобы s"(a)=s"(b)=0. Отсюда получаем s"i(xo) = Q, s"N{xN)=Q, т. е. c,-d,/i1=0, cN=Q. Заметим, что условие с,—d,/i,=0 совпадает с уравнением D) при i=l, если положить со=О. Таким образом, приходим к замкну- замкнутой системе уравнений для определения коэффициентов кубиче- кубического сплайна: Mi = cr— c.-i, i=\,2, ..., N, co = Cjv = O, E) /г2 hfii — ^-di = bi — bi-y, i = 2, 3, ... , N, F) ftA-^-ft + ^-di = /,— /,-!, t=l,2, ... , tf. G) 2 6 Убедимся в том, что эта система имеет единственное решение. Исключим из E) — G) переменные bh diy t = l, 2, ..., Л^—1, и по- получим систему, содержащую только с(, i=l, 2,.. . , N— 1. Для этого рассмотрим два соседних уравнения G): 2 6 Aj hl-i . , fi-i—fc-г i-i = -1—- Ci-i 2 6 ftM и вычтем второе уравнение из первого. Тогда получим ~ {hiCi - h^ct-J - - (hide- hUdi-д + /'~/г-1 2 6 лг 142
Подставляя найденное выражение для bi—bt^ в правую часть уравнения F), получим о о \ '4 '4-х I Далее, из уравнения E) получаем hidi = hi (d — d-i), ti-xdi-! = hi-! (ct-! — Ct-2) и, подставляя эти выражения в (8), приходим к уравнению h^d-, + 2 (h^ + АО ее-! + hA = 6 l-—^1 - f'-;~A'-2 Окончательно для определения коэффициентов ct получаем си- систему уравнений hiC^ + 2 (hi + hUl) d + hi +1a +1 = 6 ( fu'h — /'/'~1 ) , (9) \ hi+l "i 1 i=l,2 N-\, ca=cN=0. В силу диагонального преобладания система (9) имеет единст- единственное решение. Так как матрица системы трехдиагональная, ре- решение легко найти методом прогонки, которая в данном случае устойчива (см. п. 7 § 4 ч. I). По найденным коэффициентам с,- ко- коэффициенты Ь{ и dt определяются с помощью явных формул = —ct — di-\ , A0) 2 6 h n,- 2 6 Таким образом, доказано, что существует единственный куби- кубический сплайн, определяемый условиями а) — в) и граничными ус- условиями s"(a)=s"(b)=0. Заметим, что можно рассматривать и другие граничные условия. 2. Сходимость процесса интерполирования кубическими сплай- сплайнами*). Покажем, что интерполирование кубическими сплайнами является сходящимся процессом, т. е. при неограниченном увели- увеличении числа узлов N соответствующая последовательность сплайн- функций сходится к интерполируемой функции f(x). Оценки по- погрешности интерполяции r(x)=f(x)— s(x) зависят от выбора сеток и от гладкости f(x). Для простоты изложения будем рассматри- рассматривать сейчас последовательность равномерных сеток i=0, 1,..., N} *) Изучение этого раздела не обязательно для понимания дальнейшего ма- материала. Более подробное изложение см. в [201. 143
с шагом h=(b—a)lN. В этом случае основная система уравнений (9) принимает вид с^+Аа+с1у1 = 6[1хС, 1 = 1,2 N—1, A1) где обозначено f-xj =(/i-1-2/i+/i+i)//i2. От функции f(x) будем требовать существования непрерывной на [а, Ь] четвертой производной, f(jc)eC(l|[a, b]. Кроме того, предположим, что выполнены граничные условия /"(а) =/"(Ь) =0 и такие же условия для сплайнов. Обозначим Пусть sh(x) —кубический сплайн, построенный для функции f(x) на сетке <мЛ. В следующей теореме приведены оценки погрешно- погрешности интерполяции для функции f(x) и ее производных f'{x), }"{x). Теорема 1. Для fGCD)[a, b] справедливы оценки и(х)~8:1(х)\\С[аМ^М4И\ A2) ||rW-s;W||qaib]^M4^, A3) \\f"(x)-s:i(x)\\C[aib]^M4h\ A4) Из этих оценок следует, что при Л-*-0 (т. е. при N-+oo) после- последовательности stfix), t=0, 1,2, сходятся соответственно к функ- функциям /(i) (x), /=0, 1,2. Для доказательства теоремы 1 потребуется следующая лем- лемма 1, в которой даны оценки погрешности /" (хг) — s:i (хс) в узлах сетки. Будем обозначать I1с-(ш/,= пшх Лемма 1. Для f {x) <=C{i)[a, b] справедливы оценки Доказательство. Поскольку stl{xi)=ci, где с< — решение системы A1), достаточно получить оценку для погрешности zt= =Ci—f"(Xi), ?=1,2, . . . ,N-\. Подставляя d=Zi+ fl в A1), полу- получаем для 2; уравнения 2i_1 + 42i + 2i+i = i|li, t=l, 2, ..., N— 1, 2o = ZN = O, A6) где *i = 6/^-(//« +4/1+ /м). A7) Оценим решение системы уравнений A6) через правые части %. Для этого перепишем уравнение A6) в виде 144
и воспользуемся неравенствами Так как это неравенство справедливо при всех i, оно выполня- выполняется и в топ точке х{=хк, в которой достигается максимум \zt\, т. е. в точке, где Поэтому выполняется неравенство т. е. Для того чтобы получить отсюда неравенство A5), осталось оценить ||i|)|LM у где ч|з( определено согласно A7). Перепишем г|з4 в виде ^ = 6(/bii-/;)-/г2 (/")-,, A9) и воспользуемся разложениями (см. п. 1 § 4 ч. I) справедливыми для /(^еСD)[а, Ь]. Тогда из A9) получим т. е. при любом i=l,2,..., jV—1 справедлива оценка т ^2 max 2 ИЛИ /IV где Af4= max |/IV(*)|. Отсюда и из A8) получаем требуемое не- ле[й] равенство A5). Лемма 1 доказана. Перейдем к доказательству теоремы 1. Получим сначала оцен- оценку A4) погрешности f"(x) — s"h(x), возникающей при интерполи ровании f(x) кубическим сплайном sh(x). Рассмотрим отрезок [xt-i, Xi], где i — любое из чисел 1, 2, ..., N. На этом отрезке s"h (x)=ci-\-dl(x—xt) и согласно D) имеем s"h(x)=ci+ С'~См (x-xi) 145
или где JC ^~^ JC ' - Л / ^^™ Л a- -!=L, l_a=-i_. B0) Для сеточных функций и, определенных на сетке coft, обозначим так что Воспользовавшись тождеством /"W = (/")(a) + (/"W-/")<a), ¦представим погрешность /"(%)—s^(x) в виде f (х) - si (х) = {f] - cl)m + (/" (х) - /"Г. Отсюда получаем неравенство | /" (х) -s"h(x)\^\ (fl - сГ | + | (/" (x) - fi)w I, B1) справедливое для любого хе[х,_„ х{\. Оценим отдельно каждое из двух слагаемых в правой части неравенства B1). Для первого слагаемого, учитывая лемму 1, имеем ¦(ft — сс)т \ = \aV"i—ct) + (l—a) (fU - ct-y) \ < ^ a I /" (х) - si (x) |C((Bfc) + A - a) || /" (x) - sh (x) ||C(<ah) ^ | M4h\ т. e. 1(/;-с,Уа)|5С-М4/г2. B2) 4 Далее, рассмотрим выражение (/" (х) - ПГ = «(/" ix) -П) + A - а) (/" (х) - Цх). По формуле Тейлора имеем Г (х) - fl = (* - xt) Г (х) - {X~Xl)> /IV (Ь), /" (х) - /;_,=(х - хм) г w - ^J=^ /'v (b). где |;, ^е(л\_,, Xi). Отсюда и из B0) получим (Г (х) - ПГ = [a(x-Xi)+(\-a)(x- хм)] Г"[(х) - -1 [ее (х - х,-J /IV (I) + (l-a)(x- xi-J* Г (Ш = -_ (^^к-^) [(Л_Х)Г{Ь)+ {х_Xii)гт An 146
так что — max [(х — JCf-0 (Xi — x)]{ И4 (xL — x) + /И4 (х — Хг-,)} = 2Л ^^ Итак, второе слагаемое в правой части неравенства B1) оце- оценивается следующим образом: ^ B3) 8 Подставляя оценки B2) и B3) в неравенство B1), получим | /" (х) — s" (х) | < —— B4) для любого ^е[хм, xt]. Поскольку неравенство B4) справедливо для любого i=l, 2,. . . , N, из него следует оценка A4). Докажем теперь оценку A3). Рассмотрим на отрезке [хг-{, х(] функцию r(x)=f(x)—sh(x). По определению сплайна имеем r{Xi-i)=r{x^=Q, следовательно, найдется точка |е(х;-,,Х;), в ко- которой г'(?)=0. Поэтому И*) | = \г'{х)-г'{1) | = \г"(%) (х-1) | < |r"(S) \h, где ?е(х(_,, х^. Таким образом, и, учитывая A4), получим неравенство из которого следует оценка A3). Осталось получить оценку A2). Пусть х — любая точка из ин- интервала (х;_!, х(). Введем функцию g@=/@-s»@-^(<-*<-.) V-Xi), B5) где t^[x{-itXi] и /( — постоянная, выбираемая из условия g(x)=0, т. е. ^= f(x)-sk[x) (х — х^) {х — xt) Имеем g(Xi-t)=g(Xi)= g(x)=0. Поэтому найдется хотя бы одна точка |e(Xj_,, xt), в которой g"{b)=Q. Поскольку g"(t)=f"(t)~s"h(t)-2K, получим f"(l)-sh(l) = 2K, т. е. f (X) — Sft (X) = {X - Xi^) (X — Xi) . 147
Отсюда и из A4) получаем неравенство \1 (х) s.-i (х) | ^С —1| f (х) которое и приводит к оценке A2). Теорема 1 доказана. § 5. Другие постановки задач интерполирования и приближения функций I. Примеры. Во многих случаях возникает необходимость при- приближенной замены данной функции другими, более простыми функциями. Одним из способов такой замены является интерпо- интерполяция алгебраическими многочленами, подробно рассмотренная в предыдущих параграфах. Однако не всякую функцию целесооб- целесообразно приближать алгебраическими многочленами. Отметим в виде примеров несколько других способов интерполирования. Пример 1. Тригонометрическая интерполяция. Если \{х) — периодическая функция с периодом /, то естественно строить при- приближения с помощью функций щ (X) = uk COS 1- bk Sin , k = 0, 1, . . ., П. Таким образом, тригонометрическая интерполяция состоит в за- замене f(x) тригонометрическим многочленом т / \ -чп / \ г vi / п^х . , . nkx I n(x) = > ер/, (х) = ап 4- > ак cos f- bk sin коэффициенты которого отыскиваются из системы уравнений Tn(xi)=f(xi), /=1,2 2я+1, Пример 2. Приближение рациональными функциями. Пусть значения функции f(x) заданы в точках ха<х1<.. .<хп. Требуется построить функцию A) x' + bl_1xl-1+ ... +Ь0 (k, I — заданы), для которой 4>u(x,)=f(x,), j = 0, 1, .... п. B) Уравнения B) представляют собой систему из п+ 1 уравнения от- относительно k + 1+l неизвестного а0, аи ..., ah, b0, bu ..., Ь,_ь Бу- Будем требовать, чтобы число уравнений равнялось числу неизвест- неизвестных, т. е. n—k + l. Тогда придем к системе линейных уравнений 2 a'x'i ~ U S btX'l = f'x'r / = 0,1,...,* + /, C) 148
в которой неизвестными являются величины аи i=0,l,...,k, и bit 1=0, 1,... ,1-1. Пример 3. Дробно-линейная интерполяция. Пусть значения функции f(x) заданы в трех узлах, а именно в точках xt-i, xit xi+u причем хг-1<Хг<х1+1. Построим функцию vW = 3f±5L, D) +Ь для которой (p(Xj)=f(Xj), j=i—l,i,iJrl. Данная задача является частным случаем задачи, сформулированной в предыдущем при- примере, когда k—l=l. Поэтому для определения коэффициентов а0, аи Ьо можно воспользоваться системой уравнений C), которая в данном случае примет вид а0 + axxi — bji = Xift, E) ''О ~Г @1%1И Oq[i+1 == - Найдем в явном виде решение этой системы. Обозначим hi = хс — Xi-U /i?+1 = xiH — xi, % = 0,5 (hcH + hi), h i = ih-fi-i)IK fx,t = tf?+1 - fi)lhuu к ** = <!**-!-*,№• Применяя последовательное исключение неизвестных, приведем систему E) к треугольному виду Если /-". =т^0, то из F) последовательно найдем / xx,i /-". XX ,I При проведении вычислений по этим формулам может оказаться полезным тождество Используя приближение с помощью рациональных функций, необходимо следить за тем, чтобы на отрезке интерполирования знаменатель выражения A) не обращался в нуль. Другой опас- опасностью является такой неудачный выбор узлов интерполирования, при котором числитель выражения A) делится без остатка на зна- 149
мснатель. В последнем случае дробно-линейная функция D) вы- вырождается в константу. В качестве примера рассмотрим функцию f(x)=kx2, k?=0. Для нее /j~ =2/г^0 и система F) имеет единственное решение Ьо = — (*;_! + Xi + Xi+1), причем Следовательно, приближение f(x) с помощью функции D) не- невозможно вблизи точки x=—b(l=Xi-l-\-xi + xl+i. Кроме того, условие а,Ь0—а„?=0 приводит к следующим ограничениям па расположение- узлов интерполирования: ao=-kxi-1xixtvu Пример 4. Двумерная интерполяция. На плоскости хОу за- заданы три точки А{(хи у%), 1=1,2,3, не лежащие на одной прямой. Требуется, используя значения и{=и{хь г/,) функции и(х,у) в этих точках, построить аппроксимацию производных ди/дх, ди/ду. Для решения этой задачи воспользуемся линейной интерполяцией, т. е. будем считать, что u(x,y)=a(x-x1)+b(y-yl)+c. G) Тогда получим, что ди/дх=а, ди/ду=Ь, т. е. при интерполяции: функции и(х,у) с помощью линейной функции производные заме- заменяются константами. Явные выражения для коэффициентов а, Ь, с нетрудно найти из условий интерполирования u{xuy,)=Ui. Дейст- Действительно, из условия и{хи у,) =и, получаем, что с=и{. Далее, ре- решая систему а (х2 — х^ + Ь (у2 — yj =---- u2 — ult а (х3 — a-j) + Ъ {уъ — yj = u3 — ии (8) получим с где 1 д "з — «1 г/2 — — «1 #з — д = !/i "/I х , & — ч У-1 Уз 1 А Хо . Хз — ¦ — У\ 1 ¦Cl U, Ч «я — — «1 Выражения (8) и задают искомые приближения к производным ди/дх, ди/ду. Определитель Д данной системы не равен нулю, так как по ус- условию точки Аи А2, А3 не лежат на одной прямой. Заметим, что соотношения G), (8) можно записать в виде и — их х — jtj у — i/x tL<i — U-i Х% —¦ Х\ у% — Г/] ¦—¦ Uj U3 — Ui х3 — х1 г/з — I 150
т. е. в виде уравнения плоскости, проходящей через три заданные точки (хиуищ), 1=1, 2,3. 2. Общая постановка задачи интерполирования. Пусть на от- отрезке [а, Ь] задана система функций Фо(х),ф1 (*),... ,<Рп(*) (9) ,и введена сетка A0) Образуем линейную комбинацию Ф(х)=софо(х) + С1ф1 (х) + . . . + спуп(х) A1) •с числовыми коэффициентами с0, си . . ., сп. Задача интерполирова- интерполирования функции f(x) системой функций (9) на сетке A0) состоит в нахождении коэффициентов с0, си . . . , с„, для которых выполнены условия Ф (*,)=/(*;), /=0,1,... ,п. A2) Интерполирование алгебраическими многочленами является частным случаем сформулированной задачи, когда cph(x) =xh, k = =0, 1, . . . , п. Возникает вопрос о существовании и единственности решения общей задачи интерполирования. Запишем систему A2) 'более подробно: СоФо (*о) + С1Ф1 (*о) + ¦ ¦ ¦ + ЫРп (Хо) = f (Хо), С0% (Xl) + С1Ф1 (Xl) + ¦¦¦ + Сп<Рп (*i) = / (Jfi), СоФо (Хп) + С!фх (Хп) + . . . + СпЧп (Х„) = / (Хп). Для того чтобы эта система имела единственное решение, необхо- необходимо и достаточно, чтобы определитель матрицы "фо(*о) Ф1 (хо) ¦ ¦¦ ф„(*о)" А = Ф„ фо(*й) ф! (•*¦„) ¦•• <Ра(х„) A3) ¦был отличен от нуля. Более того, поскольку узлы х0, xlt... , хп мо- могут быть как угодно расположены на [а,Ь], лишь бы среди них не было совпадающих, необходимо потребовать, чтобы det АФО при любом расположении узлов. Выполнение или невыполнение этого требования зависит от выбора системы функций {ф* (х)}*=0. Система функций {ф^ (х)}?=0 называется системой Чебышева на [а,Ь], если определитель матрицы A3) отличен от нуля при любом расположении узлов xh^[a, ft], k = 0, 1, ..., п, когда среди этих узлов нет совпадающих. Таким образом, общая задача ин- интерполирования однозначно разрешима, если {q>k(x)}k=o чебы- шевская система функций. Функция ф(х), определенная согласно A1) и удовлетворяющая условиям интерполяции A2), называет- называется обобщенным интерполяционным многочленом по системе 151
Система алгебраических многочленов ук(х)=хк, k = 0, 1, ..., п, является чебышевской системой на любом отрезке [а, Ь]. Система тригонометрических многочленов <рк(х) (см. пример 1) является чебышевской системой на отрезке периодичности. Приведем примеры систем функций, не являющихся чебышевскими. Пусть на отрезке [—1, 1] задана система функций 3 Если в качестве узлов интерполирования взять, например, точки хп =— —, = —— , то получим .4 = [\D- т. е. данная система не является чебышевской на [—1, 1]. Менее тривиальным является пример системы <РоМ = 1, <pi (*)=**—1/4, *е[-1, 1]. Выбрав в качестве узлов интерполирования корни функции <pi(x), т. е. точки Хо = —0,5, xi = 0,5, придем к той же самой матрице А. Вообще, из A3) видно, что если какая-либо из функций Фо, фь . . . , ф„ обращается на отрезке [а, Ь] в нуль более чем п раз, то система не является чебышевской. Действительно, если, напри- например, q>j(xk)=0 для некоторого / и для k=0, l,...,n, то, выбирая точки ха, хи ..., хп в качестве узлов интерполирования, получим, что /-й столбец матрицы А содержит только нулевые элементы. Можно доказать, что справедливо следующее утверждение (см., например, [4]). Для того чтобы система {q>k (х)}1=<, была чебышевской на [а, Ь], необходимо и достаточно, чтобы любой об- обобщенный многочлен по этой системе, у которого хотя бы один из коэффициентов отличен от нуля, имел на [а, Ь] не более п нулей. Иногда это свойство принимается за определение чебышевской си- системы. 3. Наилучшее приближение функции, заданной таблично. Пусть значения функции f(x) и функций фДх), /=0,1,..., п, из системы (9) известны в точках хк^[а, b], k = 0, 1, ..., т. Если т>п, то задача интерполирования становится переопределенной. В этом случае можно рассматривать задачу о наилучшем прибли- приближении, которая формулируется следующим образом. Введем обобщенный многочлен A1) и будем рассматривать его значения только в узлах хк, т. е. Ф {хк) =с„ф0 (х„) + с,ф, (хк) +. . . + с„ф„ (х„), k=0, 1,... , т. Образуем разности гА = ф(лгЛ) —f(jt:ft), 6 = 0, 1, ..., tn, характеризующие отклонение в узлах xh точного значения функ- 152
ции f(x) от ее приближенного значения, полученного с помощью обобщенного многочлена A1). Для вектора погрешностей г= (/•„,/¦„ . . . ,гт)т можно ввести ту или иную норму, например, И= 2 r*\ = 2 ( \*=о ИЛИ \\г\= max rft|= max |<pft — f(xk)\. A5) Задача о наилучшем приближении функции /(х), заданной таб- таблично, состоит в нахождении коэффициентов с0, сь .. ., с„, мини- минимизирующих норму вектора г. В зависимости от выбора нормы по- получим различные задачи. Так, норме A4) соответствует задача о наилучшем среднеквадратичном приближении, а норме A5) — задача о наилучшем равномерном приближении функции, задан- заданной таблично. Если т=п, то независимо от выбора нормы решение с=(с0, с,,.. ., с„)т задачи о наилучшем приближении совпадает с решением задачи интерполирования. Действительно, в этом случае требование ||г||=0 приводит к условиям q>(xh)=f(xk), k=0,l,...,n, т. е. к задаче интерполирования. Пример 1. Построим наилучшее среднеквадратичное при- приближение для случая л=1, т=1, когда заданы fi=f(xt), i=0, 1,2. Обозначим ho=xl—xll, ht=x2—xt и будем искать обобщенный мно- многочлен (р(х) в виде (f(x)=ca + cl(x-xi). Тогда для r(x)=y(x)—f(x) получим, что ||г||2=/г(с0, с,), где Точку минимума Fico^i) найдем из условий FCt = FCl = Q, ко- которые приводят к системе уравнений {hi _ ho) Со + (hi + h\) с, = hxU - hjo. Отсюда получим с0 = ао/о + A — «о — аг) fi + «2/2. где K = ftt(fto + fti) a = К (ft0 + ft,) p = h, Bft, + 2 (/,20 + ftj + ^Ао) ' 2 2 (ft20 + hi + ft,ft0) ' 2 (Aj + ft2 + A,A0) Вводя обозначения й=0,5(/11 + /г2), /=/ь fx={f2—fi)/hl, f- — 153
= (/i—/о)//го> fxx — tf* — /j)^' можно записать коэффициенты с, и с, в виде Bft0 Если hi=h2=h, то Оценим погрешность полученного приближения. Проводя эле- элементарные выкладки, получим с учетом A6), A7), что г — с —f — h^h2 f ¦ 10 П~ Ъ + Ч + ЪН**" Отсюда имеем следовательно, Согласно F) из § 2 существует точка ?е(лг0, х2), для которой /-j =/"(^). Поэтому окончательно можно записать В частности, па равномерной сетке, когда hi=h2=h, получим т. е. погрешность имеет второй порядок по h. 4. Сглаживание сеточных функций. Пусть имеется таблица зна- значений {/<}'; =о функции f(х), полученная, например, путем изме- измерения некоторой физической величины или с помощью численных расчетов. Может оказаться, что f(x) сильно меняется на отдель- отдельных участках. В этом случае иногда целесообразно применить про- процедуру сглаживания, т. е. приближенно заменить f(x) другой, бо- более гладкой функцией у(х). Для построения сглаженных функций можно воспользоваться среднеквадратичными приближениями, рассмотренными в преды- 154
дущем пункте. Согласно A8) получаем, что многочлен фA)(*) наилучшего среднеквадратичного приближения, построенный по значениям /<_,, f{, fi+u имеет вид 1 2h /i-i . (X причем ft-i+tt+U, i = l,2, .... N-l. A9) Доопределим ф@)(х0)=/о, q>(lf)(xN)=fw и обозначим ф;=фт(xj, г=0, 1,...,JV. Процедура сглаживания по формулам A9) состоит в замене сеточной функции {/?}^=0 сеточной функцией fai}?Lo, определен- определенной согласно A9). То, что такая замена действительно осуществ- осуществляет сглаживание, можно иллюстрировать примером, приведен- приведенным в таблице. . fi ф ¦ 0 1 1 1 1 1 2 1 1 3 1 9. 3 4 0 1 3 5 0 О 6 0 0 7 0 10 3 8 10 10 3 9 0 10 3 10 0 0 11 0 II 12 0 A Здесь функция f{ имеет две особенности: разрыв при г=3 и вы- выброс при 1=8. Сглаживание приводит к размазыванию разрыва, а также к размазыванию выброса и уменьшению его амплитуды. На участках гладкости f(x) функция ц>(х) также остается гладкой. Для наглядности читателю предлагается построить графики функ- функций f(x) и ф(х). В рассмотренном случае сглаживание свелось к осреднению функции f(x) по трем соседним точкам. Можно проводить осред- осреднение и по большему числу точке, например по пяти точкам, когда 2 2 /=-2 /=-2 Чтобы выяснить, почему осреднение приводит к сглаживанию, вернемся к рассмотренному примеру. Будем считать, что f(x) задана на равномерной сетке шЛ={л:; = 1/1, j=0, 1, .... JV, hN = l), причем Сглаживание по формулам A9) приводит к функции 0 АГ 1 rr\ - П B0) т. е. к осреднению f(x) по трем соседним точкам. Таким образом, можно счи- считать, что процедура осреднения представляет собой замену сеточной функции: ( 155
h? неточной функцией Tf, где Т=Е+—Л, Е — единичный оператор, Л — оператор о второй разностной производной. Будем называть Т оператором осреднения. В п. 5 § 4 ч. I показано, что любую сеточную функцию /, для которой /0=/w = 0, можно представить в виде разложения N-i . *есоЛ, B1) где \1ь(х) —собственные функции оператора Л: 0. B2) Собственные функции и собственные числа оператора Л можно выписать в явном виде (см. п. 4 § 4 ч. I): s'n2 — , М*/) = У у sir '¦ь = ^r sin2 —- , u. (x,) = I/ — sin ft2 2Л/ " ™v '' У I N ' 6=1,2 ЛГ— 1, ; = 0, 1 N. Применяя к / оператор Т, получим согласно B1), B2) разложение 77 М= Sc/A!1/,. W. B3) к 1 h? 4 я/г где /fe = 1 — — Kk = 1 — — sin2 -— — собственные значения оператора Т. Коэффициент th в разложении B3) характеризует влияние оператора осред- осреднения Т на k-ю гармонику. Для низкочастотных гармоник, когда kjN мало, п/г имеем sin2 —- хО и(/, близко к единице. Для больших й, когда k/N»l, имеем 2/V sin2—-~ 1 и |Ы«1/3. Таким образом, оператор Т не подавляет низкочастот- 2N ные гармоники и уменьшает амплитуду высокочастотных гармоник примерно в три раза. Этим и объясняется эффект сглаживания. § 6. Наилучшие приближения в гильбертовом пространстве 1. Постановка задачи. В п. 3 § 5 рассматривалась задача о при- приближении функции, заданной таблично. Однако задачу о прибли- приближении функций можно сформулировать и в более общем виде, а именно в терминах теории приближений в линейных нормиро- нормированных пространствах. Пусть дано линейное нормированное пространство Н, может быть бесконечномерное, и в нем задана конечная система линейно независимых элементов Ф^ёеЯ, k=Q, !,...,«. A) Требуется приближенно заменить заданный элемент f^H линей- линейной комбинацией Ф=с(,ф0 + с1ф1+. . . + спф„. B) Элемент ф, определенный согласно B), называется обобщен- обобщенным многочленом, построенным по системе элементов A). 156
Будем расссматривать задачу о наилучшем приближении, со- состоящую в том, чтобы для заданного /еЯ среди всех линейных комбинаций вида B) найти такой обобщенный многочлен ф, для которого отклонение ||/-(Софо+С1ф, + - • . + С„фп)|| C) было бы минимальным. Элемент Ф = са% + ci(Pi + • • • + сп4'п, дающий решение этой задачи, называется элементом наилучшего приближения. Известно (см., например, [2]), что при весьма общих предпо- предположениях элемент наилучшего приближения существует и единст- единствен. В зависимости от выбора пространства Н, нормы || • || и си- системы {ф/г}А=о можно получить ту или иную конкретную задачу о наилучшем приближении. Рассмотрим более подробно задачу о наилучшем приближении в том случае, когда Н — вещественное гильбертово пространства со скалярным произведением (/, g)H и нормой \\f\\,, = i(f, f)H- Ти- Типичным примером гильбертова пространства является пространст- пространство L2(a, b) вещественных функций f(x), интегрируемых с квадра- квадратом на [а, Ь], причем (/, В)и = J / « S (х) dx, \\f\\u =(\\f (x) p dx \ '. D) Пусть задана конечная система линейно независимых элемен- элементов фАеЯ, k=0, [,...,п. В данном случае задача о наилучшем приближении состоит в том, чтобы для заданного элемента /е// найти обобщенный многочлен Ф = Софо + C/pj + ¦ • ¦ 4 С.„ГГП, E) для которого отклонение II/ — Ф||н =(/ —Ф, /~ф)н F) является минимальным среди всех обобщенных многочленов вида . . . + С„ф„. 2. Сведение к алгебраической задаче о минимуме квадратично- квадратичного функционала. Покажем, что сформулированная задача имеет единственное решение. Перепишем равенство F) в виде Т I / - Ф Тн = ^ Wi (фа, ф,)н - 2 ^ ск (/, Щ)н + || / (н. G) Пусть Л=[аь(] — матрица с элементами ам=(ц>н, 4>i)h, k, 1=0, \,..., п (8) 157
и с, ( — векторы, C=(C0,Cll ...,С„)Г, J=(fo,fu...,fn)T, где /i= (/, фОн, i=O, 1,.... и. Обозначая через п (и, v) =2 "'¦"'¦ скалярные произведения векторов и и и, можно записать тожде- тождество G) в виде || / - Ф fH = (Ас, с) - 2 (/, c)+\\f 1?,. (9) Отсюда видно, что задача о нахождении наилучшего прибли- приближения в гильбертовом пространстве Н сводится к минимизации функционала F(c) = (Ac,c)-2(f,c), A0) определенного на множестве вещественных (п+1)-мерных век- векторов. Отметим основные свойства матрицы А. Прежде всего, А — симметричная матрица, поскольку akl= (cfk, ц>,)н= (q>i, ц>к)H=alh. Кроме того, А — положительно определенная матрица. Докажем последнее свойство, исходя из тождества G). При /=0 из G) получим для любого вектора с. Предположим, что (Ay, t/)=0 для некото- некоторого у= (г/0, yit . . . , уп)т- Тогда для обобщенного многочлена имеем ||ф||н =(Ау, у)=0, следовательно, ф=2#*Ф*==0. Отсюда к=а в силу линейной независимости элементов ф„, ф,, ...,ф„ получим, что уа=У\ = - ¦ . = уп = 0. Таким образом, (Ас, с)>0 для всех сфО, т. е. А — положительно определенная матрица. Заметим, что поло- положительно определенными являются и матрицы всех угловых ми- миноров А. Следующая теорема сводит проблему минимизации квадратич- квадратичного функционала A0) к решению некоторой системы линейных алгебраических уравнений. Теорема 1. Пусть А — симметричная положительно опреде- определенная матрица и f—заданный вектор. Тогда функционал A0) имеет единственную точку минимума с. Вектор с удовлетворяет системе уравнений Ас = }. A1) 158
Доказательство. Заметим прежде всего, что система A1) имеет единственное решение, поскольку А — положительно опре- определенная матрица. Остается доказать, что вектор с минимизирует функционал A0) тогда и только тогда, когда он является решени- решением системы A1). Докажем сначала достаточность. Для любых век- векторов о и с имеем F (с + v) = (А (с + v), "с + v) — 2 (/, с + v) = = {Ас, с) - 2 (/, с) + 2 (Ac, v) — 2<f,v) + (Av, v), т. е. F (с + v) = F (с) + 2 (Лс - /, v) + (Av, v). A2) Предположим, что с является решением системы A1). Тогда из A2) получим F(c+v)=F(c) + (Av,v). В силу положительной определенности матрицы А отсюда следует неравенство F(c+v)>F(c) для любого ненулевого вектора v. Это и означает, что с —точка минимума функционала F(c). Докажем необходимость условия A1). Надо показать, что если с — точка минимума функционала A0), то выполнено уравнение A1). Для этого воспользуемся тождеством A2), в котором поло- положим v=Xy, где X — действительное число и у — произвольный век- вектор. Тогда получим F(c + Xy) = F (с) + 21 (Ас —},у) + I2 (Ay, у). Рассмотрим выражение в правой части этого тождества как функ- функцию % и обозначим g (к) = к2 (Ау, у) + 2Х (Ac -ly)+F(с). Поскольку с — точка минимума функционала F(c), при любых у и % выполняется неравенство F(c+Xy)'^F(c), т. е. g(K)^g@). Та- Таким образом, Х=0 является точкой минимума g(%) и, следователь- следовательно, g'@)=0. Отсюда получаем, что и в силу произвольности вектора у приходим к выводу, что Ас—}= =0. Теорема 1 доказана. 3. Следствия. Более подробно систему A1) можно записать в виде (Ф*. Ф')я = (/. Фа)/л k = 0,l, ... , п. A3) 1=0 Таким образом, элемент наилучшего приближения в пространстве Н имеет вид E), где коэффициенты ск, k = 0, 1, ...,«, отыскиваются 159
из системы A3). Из сказанного выше ясно, что алгоритм построе- построения элемента наилучшего приближения в гильбертовом простран- пространстве состоит в следующем: 1) вычисление элементов аы=(ц>к, ф;)н, k,l=0, \,. . . , п, матри- матрицы А; 2) вычисление правых частей (/, фь)н, k=0, 1,.... я; 3) решение системы A3); а 4) вычисление суммы ф= V С*Ф*- Как правило, каждый из этапов этого алгоритма осуществля- осуществляется приближенно, с помощью численных методов. Например, в случае пространства L2 необходимо уметь вычислять интегралы ь (ф*. f)u = J Ф* М / М d*. а что можно сделать, вообще говоря, лишь приближенно. Оценим теперь отклонение II/—ф||н, которое получается в ре- результате использования наилучшего приближения в гильбертовом пространстве. Докажем сначала, что справедлива Лемма 1. Если ф — элемент наилучшего приближения в Н, то (/-ф,ф)н = 0, A4) т. е. погрешность /—ф ортогональна элементу наилучшего прибли- приближения. Доказательство. Из A1) имеем (Ас, с) = (f, с). Как по- показано ранее, {Ас, с)=||ф|н. Далее, (/, с) = ^ ck (/, щ)н = if, 2 ckyk = (/, ф)н. А=о V k=a )Н Таким образом, приходим к тождеству совпадающему с A4). Следствие. Если ф — элемент наилучшего приближения в И, то A5) Доказательство следует из тождества и равенства A4). Наиболее часто среднеквадратичные приближения использу- используются в том случае, когда система {ф?}?=0 ортонормирована, т. с. (ф*,ф/)н= _ 160
Тогда система A3) решается в явном виде, ck=(f,(fk)H, k=0,l,...,n, A6) а погрешность приближения определяется формулой Числа ск, определенные согласно A6), называются коэффици- коэффициентами Фурье элемента f^H по ортонормированной системе {щ}1г=о, а обобщенный многочлен называется многочленом Фурье. ГЛАВА 4 ЧИСЛЕННОЕ ИНТЕГРИРОВАНИЕ И ДИФФЕРЕНЦИРОВАНИЕ § 1. Примеры формул численного интегрирования 1. Введение. В настоящем параграфе рассматриваются спосо- способы приближенного вычисления определенных интегралов 4x)dx, A) основанные на замене интеграла конечной суммой B) где ch — числовые коэффициенты и xh — точки отрезка [a, b], k = 0, 1, ...,«. Приближенное равенство называется квадратурной формулой, а сумма вида B)—квадра- B)—квадратурной суммой. Точки хк называются узлами квадратурной форму- формулы, а числа ch — коэффициентами квадратурной формулы. Раз- Разность (x)dx-2ickf(xk) называется погрешностью квадратурной формулы. Погрешность за- зависит как от расположения узлов, так и от выбора коэффициентов. 6 А. А. Самарский, А. В. Гулин 161
При оценке погрешности в приводимых ниже примерах функция f(x) предполагается достаточно гладкой. Введем на [а, Ь] равномерную сетку с шагом h, т. е. множество точек <Hh = {Xi=a + ih, ; = 0, \,...,N, hN = b—a), и представим интеграл A) в виде суммы интегралов по частичным отрезкам: { f(x)dx. C) Для построения формулы численного интегрирования на всем отрезке La, b] достаточно построить квадратурную формулу для интеграла D) J f(x)dx f(.x) на частичном отрезке [xt-lt х{] и воспользоваться свойством C). 2. Формула прямоугольников. Заменим интеграл D) выраже- выражением f(x{-4a)h, где Xi-42 = Xi—0,5 h. Геометрически такая замена означает, что площадь криволи- криволинейной трапеции ABCD заменяет- заменяется площадью прямоугольника ABCD' (см. рис. 5). Тогда полу- получим формулу •1-112 f(x)dx^f(Xi-.A)h, E) Рис. 5. Геометрический смысл фор- , мулы прямоугольников которая называется формулой прямоугольников на частичном отрезке [x,_i, x{]. Погрешность метода E) определяется величиной >*= \ f(x)dx~f(Xi-%)h, которую легко оценить с помощью формулы Тейлора. Действитель- Действительно, запишем г|); в виде F) и воспользуемся разложением 162
где t,i = %i(x)^[xi-i, x(]. Тогда из F) получим Обозначая M^.i = max |/"(*)|. оценим -ф,- следующим обра- зом: Таким образом, для погрешности формулы прямоугольников на частичном отрезке справедлива оценка \^[^^М2,с, G) т. е. формула имеет погрешность О (Я3) при /i-»-0. Заметим, что оценка G) является неулучшаемой, т. е. сущест- существует функция f(x), для которой G) выполняется со знаком равен- равенства. Действительно, для f(x) = (x—х^,йJ имеем M2i=2, /(x,_i/,) = = 0и xi f(x)dx-f (*;_¦/,) h = -| = ^ Mt.t. Суммируя равенства E) no i от 1 до N, получим составную фор- формулу прямоугольников {dx^^f{x^h. (8) a (=1 Погрешность этой формулы Ь N 1=1 равна сумме погрешностей по всем частичным отрезкам, N N Отсюда, обозначаяМ2= max |/"(^) |. получим Aj^i=^(b-Q) g) 1 ' 24 24 2 т. е. погрешность формулы прямоугольников на всем отрезке есть величина O(h2). 6* 163
В этом случае говорят, что квадратурная формула имеет вто- второй порядок точности. Замечание. Возможны формулы прямоугольников и при ином распо- расположении узлов, например такие формулы: Ь N Ь N J / (х) dx ~ 2 hf (xi-1) ¦ S / w ^ ~ 2A/ w • a i=i a i=i Однако из-за нарушения симметрии погрешность таких формул является вели- величиной О (К). 3. Формула трапеций. На частичном отрезке эта формула име- имеет вид ]nx)dx~fM + nxdh A0) и получается путем замены подынтегральной функции f(x) интер- интерполяционным многочленом первой степени, построенным по узлам *,-_!, х{, т. е. функцией U.i (X) = U(X- Xi-г) f (Xt) ~(X- Xi) f (Xi.,)). h Для оценки погрешности достаточно вспомнить (см. п. 1 § 2 гл. 3), что Отсюда получим f(x)dx- /(*f-'L = \ (f(x)-Lui(x))dx= \ (Х Xi-i(X Xi) f"gi(x))dx "i-i и, следовательно, Ifr1< М*'1** • A1) Оценка A1) неулучшаема, так как в ней достигается равенст- равенство, например, для f(x) = (х—х{J. Составная формула трапеций имеет вид '¦=i 2 = h @,5/0 + /i + • ¦ • + Av-i + 0,5/a,), A2) где f, = f {xt)t i = 0, 1,..., N, hN = b—a. 164
Погрешность этой формулы оценивается следующим образом: т<^=^М2, Ма= max \f"(x)\. Таким образом, формула трапеций имеет, так же как и форму- формула прямоугольников, второй порядок точности, Чг = О(/г2), но ее по- погрешность оценивается величиной в два раза большей (см. (9)). 4. Формула Симпсона. При аппроксимации интеграла D) заме- заменим функцию f(x) параболой, проходящей через точки (xjt }(x})), j = i—1, i—0,5, i, т. е. представим приближенно f{x) в виде где L2i(x)—интерполяционный многочлен Лагранжа второй сте- степени, * W ^Х X^ (х х^ f — 2 (x — *,-_,) (x — x,) /,_и + (x - Xi) (x — xt.%) /<}. A3) Проводя интегрирование, получим Г ил (х) dx = А (/,-_! + 4/,_.Л + /,), А = xi — xt-L J 6 Таким образом, приходим к приближенному равенству которое называется формулой Симпсона или формулой парабол. На всем отрезке [а, Ь] формула Симпсона имеет вид ь J :VA Чтобы не использовать дробных индексов, можно обозначить и записать формулу Симпсона в виде ь + 4 (/! + /,+ ... +^-0]. A5) Прежде чем переходить к оценке погрешности формулы A4), заметим, что она является точной для любого многочлена третьей 165
степени, т. е. имеет место точное равенство если f (x) =ao + aix+a2x2-\-a3x3. Это утверждение нетрудно прове- проверить непосредственно, что и предоставляется сделать читателю. Для оценки погрешности формулы Симпсона воспользуемся интерполяционным многочленом Эрмита. Построим многочлен третьей степени Н3(х) такой, что Я3 (Xt-г) = f (Х^), Я3 (Хс-уг) = f (Xl-y,), Из § 3 гл. 3 известно, что такой многочлен существует и единствен. Он построен в явном виде в примере из п. 2 § 3 гл. 3. Однако нам даже не потребуется явный вид многочлена Н3(х). Вспоминая, что формула Симпсона точна для любого многочлена третьей степени, получим п 3 (X) их = г (л з \Xi-i) -\- 4/7з (Х[—у2) -р п з [Xi)) == *i-\ Представим теперь f(x) в виде f(x)=Ht(x)+rt(x), xe=[xt-t, xt], A7) где t"i(x)—погрешность интерполирования многочленом Эрмита Н3(х). Интегрируя A7) и учитывая A6), получим j f(x)dx—±-{ft-х + 4/l_% -f ft) = j n(x)dx. A8) Согласно A4) из § 3 гл. 3 имеем поэтому из A8) для погрешности г|); формулы A4) получаем оценку х; М4.С где М,,,= sup |/lv(x)|. Вычисляя интеграл, приходим окончательно к оценке 166
Погрешность составной формулы Симпсона A5) оценивается так: ^ h*(b-a) M^ hN = b-a, M4= sup \flv(x)\. 2880 xs[a,b] Отсюда видно, что формула Симпсона существенно точнее, чем формулы прямоугольников и трапеций. На частичном отрезке она имеет точность O(hs), а на всем отрезке — ()(№). Приведем вывод формулы Симпсона, основанный на методе экстраполяции. Метод экстраполяции состоит в следующем. Проведем два расчета по формуле трапеций A2), первый расчет с шагом h, когда вычисляется сумма N h=(b—a)/N, и второй расчет — с шагом 0,5/г, когда вычисляется сумма Используя разложение по формуле Тейлора, можно показать, что для до- достаточно гладкой функции }(х) справедливо равенство где / — исходный интеграл A) и Ci — постоянная, не зависящая от h. Точно так же Отсюда получим, что т. е. выражение совпадает с интегралом / с точностью до величин О (А4). В данном примере не обязательно проводить расчет на двух сетках, так как можно построить явное выражение для суммы /л. Действительно, N N z it 4'/./2 - К = 2 to-i + 2А--% + W А - S ' а' Л = (=i N i=i 6 Таким образом, снова получим квадратурную формулу Симпсона. 167
5. Апостериорная оценка погрешности методом Рунге. Автома- Автоматический выбор шага интегрирования. Величина погрешности чис- численного интегрирования зависит как от шага сетки h, так и от глад- гладкости подынтегральной функции f(x). Например, в оценку A1), наряду с 1г, входит величина M2ii= max |/"(*I, которая может сильно меняться от точки к точке и, вообще говоря, заранее неизвестна. Если величина погрешности велика, то ее мож- можно уменьшить путем измельчения сетки на данном отрезке [x{-t, х{\. Для этого прежде всего надо уметь апостериорно, т. е. после проведения расчета, оценивать погрешность. Апостериорную оценку погрешности можно осуществить мето- методом Рунге, который мы поясним сначала на примере формулы тра- трапеций. Пусть отрезок [а, Ь] разбит на частичные отрезки [xt-i, х{], i=l, 2, . .., N, ха = а, xN = b, имеющие, может быть, разную длину h{ = Xi—Xi-i. На каждом частичном отрезке применяется формула трапеций j (*)dx« ;'У'~!1 h = U.,. Согласно A1) имеем h-lH,i~cLhl B0) где константа ct зависит от гладкости f(x) и заранее неизвестна. Измельчим на отрезке [л:,-ь х{\ сетку в два раза и повторим расчет с шагом 0,5ft, т. е. вычислим сумму 4 Тогда согласно B0) будем иметь Из соотношений B0), B1) можно исключить константу ct и по- получить оценку погрешности, которая содержит лишь известные ве- величины /м, 1ШЛ: U — lh,i ^5 — (Jhli,i — //1.1I 11 — //г/2,1 = -— (h — h,i) ^^ — (/й/2,1 — h,i). 8 7 Разумеется, метод Рунге можно применять и для оценки по- погрешности других квадратурных формул. Пусть какая-то квадра- квадратурная формула имеет на частичном отрезке порядок точности т, т. е. U—/fc,i»Cj/t(m. Тогда U — /а/2,1 ~ Ci —- v ^ / 163
откуда получим It-h.t^2n(lt-lH/i.d, B2) / / / Т -—- ft/2.^ h,i /0<5\ Л- — /л/г, ? ~ 2m_t— • B3) Возможность апостериорно оценивать погрешность позволяет вычислять интеграл A) с заданной точностью е>0 путем автома- автоматического выбора шага интегрирования h{. Пусть используется со- составная квадратурная формула где Ihi — квадратурная сумма на частичном отрезке, причем на каждом частичном отрезке используется одна и та же квадратур- квадратурная формула (например, формула трапеций, Симпсона и др.)- Про- Проведем на каждом частичном отрезке [Xi-it х(] все вычисления дваж- дважды, один раз — с шагом h( и второй раз — с шагом 0,5/i,- и оценим погрешность по правилу Рунге B3). Если для заданного е>0 будут выполняться неравенства ^!\ hl . , 2 N \П л/2.1 I 2m—1 b— a то получим 1=1 т. е. будет достигнута заданная точность е. Если же на каком-то из частичных отрезков оценка B4) не бу- будет выполняться, то шаг на этом отрезке надо измельчить еще в два раза и снова оценить погрешность. Измельчение сетки на данном отрезке следует проводить до тех пор, пока не будет достигнута оценка вида B4). Заметим, что для некоторых функций f(x) такое измельчение может продолжаться слишком долго. Поэтому в соот- соответствующей программе следует предусмотреть ограничение свер- сверху на число измельчений, а также возможность увеличения е. Таким образом, автоматический выбор шага интегрирования приводит к тому, что интегрирование ведется с крупным шагом на участках плавного изменения функции f(x) и с мелким шагом — на участках быстрого изменения f(x). Это позволяет при заданной точности е уменьшить количество вычислений значений f(x) по сравнению с расчетом на сетке с постоянным шагом. Подчеркнем, что для нахождения сумм Ihn>i не надо пересчитывать значения f(x) во всех узлах, достаточно вычислять f(x) только в новых узлах. 6. Экстраполяция Ричардсона. Способ повышения точности квадратурной формулы, рассмотренный в конце п. 4, можно обоб- обобщить на случай многократного измельчения сетки. 169
Предположим, что для вычисления интеграла A) отрезок [а, Ь] разбит на N равных отрезков длины h=(b—a) IN и на каждом частичном отрезке применяется одна и та же квадратурная фор- формула. Тогда исходный интеграл / заменяется некоторой квадратур- квадратурной суммой /ft, причем возникающая погрешность зависит от шага сетки h. Для некоторых квадратурных формул удается получить разложение погрешности h—/ по степеням h. Предположим, что для данной квадратурной суммы h существует разложение Ih = I + aihai + a2ha' + ... + aSm + 0 (ha'n+l), B5) где 0<а!<а2<.. .<am<am+1 и коэффициенты a,- не зависят от h. Подчеркнем, что получение подобных разложений является труд- трудной задачей анализа и здесь не рассматривается. Явный вид коэф- коэффициентов а,- нам не потребуется, однако величины а< предполага- предполагаются известными. Вычислим приближенно значение интеграла / по данной квад- квадратурной формуле на последовательности сеток с шагами ho = h, hlt hi, ..., hm. Для определенности будем предполагать, что сетка измельчается по геометрической прогрессии, т. е. hk = qkh0, k = Q, I, ..., т, где <7^@, 0- Вычисляя квадратурную сумму /Л при раз- различных значениях h, получим величины hk, k = 0, I, ..., m, причем согласно B5) будем иметь ht' hk = I + ajif + a2C + ... + аХ" + О (ht'n+1). B6) Обозначим /@)=/, 1^1 = hk. Исключая коэффициент а, из соот- соотношений получим / = ^ + О(С), B7) где обозначено /til _ /a) По формулам B8) можно вычислить величины /Л,*', й = 0, 1, ... ..., т—1. Согласно B7), они дают более точное, чем /j,1^, прибли- приближение к интегралу /. Этот процесс повышения точности можно про- продолжить, вычисляя величины /['j с помощью рекуррентных соотно- соотношений k_1 k_1 ^, \—q I j=l,2, ... ,m, k=\,2 tn—j+l, Ihl = hk, k = 0, 1 /в. 170
Лемма 1. Пусть для квадратурной суммы Ih справедливо раз- разложение B5) и сетка измельчается по правилу hk=qhh, k = 0, 1, ... ..., m. Тогда для величин Ihl_v определенных согласно B9), спра- справедливы разложения /</) _ г I uU)hai , «,(/) hai+l i i uU)ham j_ n /p,am+u ink_1 = 1 + Oj Ilk-! + Oj^h.k-1 + . . . + 0/n «A-i + (-> ("A-l ), /=1,2, ..., m, A= 1,2, ...,« — /+1, C0) где коэффициенты ?</> не зависят от сетки. Доказательство. Проведем его индукцией по /. При /=1 равенство C0) выполняется с Ь1/' = а; согласно B5). Предположим, что равенство C0) выполняется при / = / и докажем, что оно вы- выполняется при / = /+1. Имеем C1) и,следовательно, Далее, подставляя полученную разность в B9) при / = / и учи- учитывая C1), получим т \ т . . „ т. е. Отсюда получаем т. е. равенство C0) выполняется с / = /+ 1, причем 1-9 Лемма 1 доказана. 171
Из леммы следует, что суммы /^ совпадают с интегралом / с точностью до величин O(h '), т. е. порядок точности повышается по сравнению с исходной формулой в o^/at раз. Изложенный метод повышения точности называется методом экстраполяции Ричардсона. Его можно применять не только к квадратурным формулам, но и к самым различным сеточным функ- функциям, если только для них существуют асимптотические разложе- разложения по степеням К Подробное изложение метода экстраполяции по Ричардсону содержится в книге [23]. Применительно к формуле трапеций данный метод называется методом Ромберга. Существу- Существуют стандартные программы вычисления определенных интегралов методом Ромберга. Пример, приведенный в конце п. 4, является частным случаем метода B9), когда /„ — квадратурная сумма, со- соответствующая методу трапеций, т= 1, <7 = О,5. Отметим еще, что для формулы трапеций / ж ih = ^ 0,5 (Jс + А-0 К fL = f (Xi), разложение B5) имеет вид ь Здесь коэффициенты сгт совпадают с коэффициентами разложения функции W 2 eh — 1 в ряд Тейлора: G (К) = 1 + c2/t2 + c4/i4+... + cirhZr+... Доказательство формулы C2), называемой формулой Эйлера, можно найти, например, в [2, с. 165]. § 2. Квадратурные формулы интерполяционного типа 1. Вывод формул. Будем рассматривать формулы приближенно- приближенного вычисления интегралов $p(x)f(x)dx, A) а где р(х)>0 — заданная интегрируемая функция (так называемая весовая функция) и f(x)—достаточно гладкая функция. Рассма- 172
триваемые далее формулы имеют вид где xhe[a, b] и ck— числа, k = 0, 1, ..., п. В отличие от предыдущего параграфа, не будем разбивать от- отрезок [а, Ь] на частичные отрезки, а получим квадратурные форму- формулы путем замены f(x) интерполяционным многочленом сразу на всем отрезке [а, Ь]. Полученные таким образом формулы называ- называются квадратурными формулами интерполяционного типа. Как пра- правило, точность этих формул возрастает с увеличением числа узлов интерполирования. Рассмотренные в § 1 формулы прямоугольни- прямоугольников, трапеций и Симпсона являются частными случаями квадра- квадратурных формул интерполяционного типа, когда п — 0, 1, 2, р(х)==1. Получим выражения для коэффициентов квадратурных формул интерполяционного типа. Пусть на отрезке [а, Ь] заданы узлы ин- интерполирования xh, k = 0, I, ..., п. Предполагается, что среди этих узлов нет совпадающих, в остальном они могут быть расположены как угодно на [а, Ь]. Заменяя в интеграле A) функцию f(x) интерполяционным мно- многочленом Лагранжа п т / \ ^ (О (Х) ZZ_ (X — Xk) (?> (Xk где п. fflW = I] (X — Xj), Си' (Xk) = If {Xk — X/), получим приближенную формулу B), где b Р(х)а(х) dx^ k = 0,l,...,n. D) (x—xk)<u (хк) а Таким образом, формула B) является квадратурной формулой интерполяционного типа тогда и только тогда, когда ее коэффици- коэффициенты вычисляются по правилу D). Приведем пример квадратурной формулы, не являющейся формулой ин- интерполяционного типа. Рассмотрим интеграл 1 J / (х) dx E) о и выберем в качестве узлов точки хо=О, *i=0,5, Хг—\. Квадратурная формула интерполяционного типа, построенная по заданным узлам, совпадает с формулой Симпсона 1 /WdJC»-^(/@) + 4/@,5) + /(l)). F) о 173
Заменим теперь в E) функцию f(x) многочленом ф(дс) наилучшего средне- среднеквадратичного приближения первой степени. Согласно A8) из § 5 гл. 3 этот многочлен имеет вид Ф М = (/ (О - / @)) (^ -0,5) + 4" (/ @) + / @.5) + / A)). О Отсюда приходим к квадратурной формуле /W^«j(/@) + /@,5) + /(l)). G) о не совпадающей с F). 2. Оценка погрешности. Получим выражение для погрешности квадратурной формулы интерполяционного типа. Представим функ- функцию f(x) в виде f(x)=Ln(x)+rn+i(x), где Ь„(х) —интерполяционный многочлен для f(x), построенный по узлам ха, хи .. . , хп и гп+1(х) —погрешность интерполирования. Тог- Тогда получим ь ь ь J р (х) f (x) dx = J р (*) Ln (х) dx + jp (х) гп+1 (х) dx = fe=o Таким образом, погрешность i|)n+i квадратурной формулы B), D) равна ,+i (х) dx, (8) где rn+i(x) —погрешность интерполирования. Вспоминая выражение для погрешности интерполирования (см. C) из § 2 гл. 3) получаем f Отсюда приходим к следующей оценке погрешности квадратур- квадратурной формулы интерполяционного типа: м —^- \п -f- I)] \p(x)\a(x)\dx, A0) а f(«+D , где Mn+1 == max If '(*)!• Из формулы A0) видно, что справед- хе.[а.Ь] ливо следующее утверждение. 174
Квадратурная формула интерполяционного типа, построенная по п+1 узлу ха, хи ..., хп, является точной для любого многочлена степени п, т. е. если f(x) —многочлен степени п и ск — коэффициен- коэффициенты, вычисленные согласно D), то имеет место точное равенство A1) k=o Справедливо и обратное утверждение. Теорема 1. Если квадратурная формула k=0 точна для любого многочлена степени п, то она является квадра- квадратурной формулой интерполяционного типа. Доказательство. Достаточно показать, что dk = ch, где ck определены согласно D), k — 0, 1, ..., п. Рассмотрим многочлены Ф*(*) 1\, , ¦ А 0, (x — xk)a> (xk) имеющие степень п, и вычислим интегралы ь h = j р (х) 4>k (x) dx. По условию теоремы справедливы точные равенства п 1=0 Поскольку 0, получаем Ik = dh, k = 0, \, ..., п. С другой стороны, согласно D) имеем ь , С , \ ы(х) /* = \ р {X) У =Ck. J (x — xk)a (xk) Таким образом, dk=ck, k = 0, 1 п, что и требовалось. 3. Симметричные формулы. Для некоторых квадратурных фор- формул оценка погрешности A0) является грубой, так как она не учи- учитывает симметрии формул. Рассмотрим, например, формулу Симпсона I' A3) 173
для функции f(x)=x3. В данном случае имеем п = 2, /(п+1)(л:) =6, поэтому согласно (9) погрешность можно представить в виде 1 \р3 = f со (х) dx, где (й{х) =jc(x2—1). Благодаря симметричному расположению узлов имеем г}13 = 0. В то же время правая часть неравенства A0), равная отлична от нуля. Таким образом, оценка A0) не является точной для формулы Симпсона. Квадратурная формула B) называется симметричной, если 1) л четно; 2) узлы расположены симметрично относительно середины от- отрезка [а, Ь], т. е. 1±±-Хк = Хп^-1±±, k = 0, I, ...,«/2; A4) 3) cK = cn.h, * = 0, 1, ..., я/2. A5) Свойство A5) коэффициентов квадратурной формулы опреде- определяется не только симметричным расположением узлов, но и сим- симметрией весовой функции р(х). Говорят, что р(х) —четная функция относительно середины отрезка [а, Ь], если A6) 2 для всех #е[0, (Ь—а)/2]. Лемма 1. Если ск определены согласно D) и п четно, то соот- соотношения A5) являются следствием условий A4), A6). Доказательство. Покажем сначала, что л <о(*) = Т7 {x-xk) A7) является нечетной функцией относительно точки хп/г=(а+ЬI2. Имеем Л/ 2-1 w(x) = (x-xn/i) T\ (x-xk)(x-xn_k), откуда, учитывая условия A4), получим л/2-1 4=0 176
Следовательно, при любом t rt/2-l т. е. функция ы(х) нечетна относительно точки jcn/2- Из формулы A8) следует также, что и>'(х)— четная функция относительно ТОЧКИ Хп/2, ПОЭТОМУ ш'(*п-а)=о'(*а). A9) Рассмотрим теперь разность ь ck - cn_k = j р (х) со (х) ц (x) Л, B0) а где (х — хк)ы'(хк) (x-xn_k)a>' Учитывая A9) видим, что хп — xn-k 1 ^W = eowTT ' (х — х)(х — х ) ~ш'(х) \{х — х J—(лг — хJ]' откуда следует четность ц(х) относительно точки хп/г. Таким образом, подынтергальная функция в B0) нечетна относительно сере- середины отрезка [а, Ь\, и, следовательно, интеграл равен нулю. Лемма 1 доказана. Покажем теперь, что наличие симметрии повышает точность квадратурных формул. Справедлива Теорема 2. Пусть р(х) — четная функция относительно точки (а+Ь)/2 и пусть выполнены условия A4), где п — четное число. Тогда, если квадратурная формула интерполяционного типа B) точна для любого многочлена степени п, то она точна и для любого многочлена степени п+1. Доказательство. Достаточно показать, что формула точн» для многочлена Поскольку вследствие нечетности подынтегральной функции, необходимо до- доказать, что Представим /„ в виде суммы /«' + /п2), где Л/2-1 177
Из условий A4) получим или rt/2-l /t/2-1 Последнее равенство справедливо в силу того, что л— четное число. Таким образом, получаем Л/2-1 /„ = /U» + /»»= 2 (с* - с« B+1 Согласно лемме 1 имеем ck—cn_k, k=Q, 1, ..., n/2—1, т. е. /п=0, ¦что и завершает доказательство теоремы 2. 4. Формулы Ньютона—Котеса. Численная устойчивость ква- квадратурных формул. Формулами Ньютона — Котеса называются квадратурные формулы интерполяционного типа, построенные на равномерной сетке, когда хк—xk-l = h, k= 1, 2, . . . , п. Различают два типа формул Ньютона — Котеса: формулы замк- замкнутого типа и формулы открытого типа. В формулах замкнутого типа хо = а и хп = Ь, а в формулах открытого типа хотя бы один из узлов х0 или хп не совпадает с соответствующей граничной точкой отрезка [а, Ь]. Для простоты изложения рассмотрим лишь случай формул замкнутого типа, когда xk = a + kh, k = 0, I п, hn = b—a. В случае равномерной сетки можно упростить выражения для коэффициентов квадратурных формул. В формуле D) сделаем за- замену x = a + th, Osg^sgltt. Простые выкладки, которые мы опускаем, показывают, что в результате замены формула D) примет вид где k\(n~k)\ \ п У К ^ ' t- о Отметим, что формулы Ньютона — Котеса с «^10 редко ис- используются из-за их численной неустойчивости, приводящей к рез- резкому возрастанию вычислительной погрешности. Причиной такой неустойчивости является то, что коэффициенты формул Ньютона — Котеса при больших п имеют различные знаки, а именно при п^ ^10, р(х) = 1 существуют как положительные, так и отрицатель- отрицательные коэффициенты. Остановимся подробнее на значении знакопостоянства коэффи- коэффициентов для устойчивости вычислений. Рассмотрим квадратурную сумму /„=2с№>- B2) k=0 178
Предположим, что значения функции f(x) вычисляются с некото- некоторой погрешностью, т. е. вместо точного значения получаем прибли- приближенное значение f(xk)=f(xh)+6h. Тогда вместо /„ получим сумму 7п = 2 где B3) Поскольку квадратурная формула B), D) точна для /(*)== I, имеем я ft т. е. при р (х) >0 сумма 2с* = -И B4) ограничена числом М>0, не зависящим от п. Предположим теперь, что все коэффициенты ch неотрицательны. Тогда из B3), B4) получим оценку 8k\)M, B5> которая означает, что при больших л погрешность в вычислении квадратурной суммы B2) имеет тот же порядок, что и погрешность в вычислении функции. В этом случае говорят, что сумма B2) вы- вычисляется устойчиво. Если коэффициенты ch имеют различные знаки, то может ока- оказаться, что сумма не является равномерно ограниченной по п и, следовательно, по- погрешность в вычислении /„ неограниченно возрастает с ростом п. В этом случае вычисления по формуле B2) будут неустойчивы и пользоваться такой формулой при больших п нельзя. Таким образом, если необходимо сосчитать интеграл A) более точно, то имеются две возможности. Во-первых, можно разбить весь отрезок \а, Ь] на несколько частичных отрезков и на каждом из частичных Отрезков применить формулу Ньютона — Котеса с не- небольшим числом узлов. Полученные таким образом формулы назы- называются составными квадратурными формулами. Они часто приме- применяются на практике, хотя и не являются достаточно экономичными, поскольку требуют многократного вычисления значений функции 179
f(x). Во-вторых, можно попытаться выбрать узлы квадратурной формулы так, чтобы полученная формула имела большую точность, чем формула Ньютона — Котеса с тем же числом узлов. В следую- следующем параграфе рассматривается один из методов, основанных на выборе узлов квадратурной формулы, а именно метод Гаусса. Он приводит к квадратурным формулам с положительными коэффи- коэффициентами при любых п и существенно более точным, нежели форму- формулы Ньютона — Котеса. § 3. Метод Гаусса вычисления определенных интегралов 1. Постановка задачи. В предыдущем параграфе предполага- предполагалось, что узлы квадратурных формул заданы заранее. Было пока- показано, что если использовать п узлов интерполяции, то получим ква- квадратурные формулы, точные для алгебраических многочленов сте- степени п—1. Оказывается, что за счет выбора узлов можно получить квадратурные формулы, которые будут точными и для многочленов степени выше п—1. Рассмотрим следующую задачу: построить ква- квадратурную формулу d*«2c*/(x*), A) которая при заданном п была бы точна для алгебраического много- многочлена возможно большей степени. Обратим внимание, что здесь в отличие от § 2 для удобства изложения нумерация узлов начинает- начинается с k = 1. В настоящем параграфе будет показано, что такие квадратур- квадратурные формулы существуют. Они называются квадратурными форму- формулами наивысшей алгебраической степени точности или формулами Таусса. Эти формулы точны для любого алгебраического многочле- многочлена степени 2/г—1. Итак, потребуем, чтобы квадратурная формула A) была точна для любого алгебраического многочлена степени т. Это эквива- эквивалентно требованию, чтобы формула была точна для функций f(x) = = ха, а = 0, ],..., т. Отсюда получаем условия Jp() B) k=i которые представляют собой нелинейную систему т+1 уравнений -относительно In неизвестных С[, С2, . . • , Сп\ Х\, Х%, . ¦ • , Хп. Для того чтобы число уравнений равнялось числу неизвестных, ладо потребовать т = 2п—1. В дальнейшем будет показано, что си- система B) при т = 2п—1 имеет единственное решение. Однако сна- сначала рассмотрим несколько частных случаев, когда решение систе- системы B) можно найти непосредственно. 180
Пусть р(х) == 1, а= —1, Ь= 1. При я= 1 получаем т= 1 и систе- система B) принимает вид сх = С d* = 2, ^л?! = Г х dx = О, -i -i т. е. приходим к известной формуле прямоугольников которая точна для любого многочлена первой степени. При л = 2, т — Ъ система B) записывается в виде Отсюда находим " x2 -i- с х2 = — с х3 4- с х3 = О о т. е. получаем квадратурную формулу которая точна для любого алгебраического многочлена третьей степени. 2. Основная теорема. Возвращаясь к рассмотрению квадратур- квадратурных формул (!) общего вида, введем многочлен и (х) = (x—xt) (х—х2) ... (х—хп). C) Будем предполагать, что р(х) >0. Теорема 1. Квадратурная формула A) точна для любого многочлена степени гп = 2п—1 тогда и только тогда, когда выполне- выполнены два условия: 1) многочлен со (х) ортогонален с весом р (х) любому многочле- многочлену q(x) степени меньше п, т. е. ь ^p(x)to(x)q(x)dx = O; D) а 2) формула A) является квадратурной формулой интерполяци- интерполяционного типа, т. е. ь c*=fp(*)- "f0,, dx, 6=1,2 п. E) J (х — xk) со' (xk) а Доказательство. Необходимость. Пусть формула A) точна для любого многочлена степени т = 2п—1. Это значит, 181
что она точна и для многочлена a(x)q(x), имеющего степень не выше 2п—1, т. е. Ь п ^ р (х) со (х) q (x) dx = '21 c*co (xk) q (xk) = 0. a fe=i Требование E) выполняется в силу теоремы 1 из § 2 (если ква- квадратурная формула A) точна для любого многочлена степени п—1, то она является формулой интерполяционного типа). Достаточность. Пусть f(x)—любой многочлен степени In—1. Согласно теореме о делении многочленов, его можно пред- представить в виде f(x)=(o(x)q(x)+r(x), где q(x) и г(х) —многочлены, имеющие степень не выше п—1. При этом ь ь ь ь С р (х) f (х) dx = { р (х) со (х) q (х) dx + С р (х) r(x)dx= f р (х) г (х) dx. а а а а Последнее равенство справедливо в силу предположения D). Далее, поскольку г(х)—многочлен степени не выше п—1 и фор- формула A) является формулой интерполяционного типа, она точна для г(х), т. е. Ь п п п р(х)г (х) dx^^ СкГ (**) = S Ck(-f ^ ~~ ю ^ q (X/b)) = S Таким образом, т. е. формула A) точна для любого многочлена степени 2/2—1. Тео рема 1 доказана. Отметим, что использование теоремы 1 существенно упрощаем построение формул Гаусса. Условие D) эквивалентно требованиям ь f р (х) со(х) xadx = 0, сс = О, 1, ..., п— 1, F) а которые представляют собой систему п уравнений относительно п неизвестных х,, хг, ... , хп. Таким образом, для построения формул Гаусса достаточно найти узлы хи х2, ..., хп из соотношений орто- ортогональности F) и затем вычислить коэффициенты ch согласно E). Теорема 1 не гарантирует существования и единственности ре- решения системы F). Надо доказать еще существование и единствен- единственность многочлена а (х) степени п, ортогонального всем многочленам степени меньшей п, а также убедиться в том, что все корни такого многочлена расположены на отрезке [а, Ь]. 182
3. Существование и единственность квадратурных формул наи- наивысшей алгебраической степени точности. Представим искомый многочлен C) в виде G) Тогда условия ортогональности F) примут вид ь р (х) (аа + ахх + ... + омГ' + х") x*dx = 0, (8) Условия (8) представляют собой систему линейных алгебраиче- алгебраических уравнений относительно коэффициентов ап< аи ..., а„-,. По- Покажем, что соответствующая однородная система уравнений ь J р (х) (а0 + агх + ... + а^х™) х* dx = 0, (9) а а = 0, 1 я—1, имеет единственное решение ао = а, = .. . = ап_! = 0. Для этого умно- умножим уравнение (9) на аа и просуммируем по всем а. Тогда получим rt-i * / п-1 \ Ь Гп-1 л-1 т. e. V aixl\ dx = 0. A0) /=0 / Если хотя бы один из коэффициентов а,, / = 0, 1 п—1, от- отличен от нуля,то функция 1=0 может обратиться в нуль на [а, Ь] лишь в конечном числе точек. Отсюда и из условия р(л;)>0 следует, что равенство A0) возможно лишь в случае ай = а, = .. . = ап_1 = 0. Тем самым неоднородная система (8) имеет единственное решение. Следовательно, существует единственный многочлен co(x) степени п со старшим коэффициентом 1, ортогональный с весом р(х)>0 любому многочлену степени п—\. Теорема 2. Если со(х) — многочлен степени п, ортогональный на [а, Ь] с весом р(х)>0 любому многочлену степени меньше п, то все его корни различны и расположены на [а, Ь]. Доказательство. Предположим, что многочлен со(х) имеет различных корней нечетной кратности на [а, Ь]. Очевидно, 183
что т^п. Теорема 2 будет доказана, если покажем, что m = n. Обо- Обозначая эти корни через |ь |2, ..., |т, представим а>(х) в виде о (х) = (х- ЪГ (х - ЪГ ...(х- lmfm г (х), где alt а2, • • •, От — нечетные числа и функция г(х) не меняет знак на [а, Ь]. Вычислим интеграл /=$р(х)со(*)(*-У ... (x-l,n)dx = а ^р(х)(х-11Г+1 ¦ ¦ ¦ (x-lmfm+1r(x)dx. A1) а Поскольку cxt+1, ..., ат+ 1 четные числа и г(х) знакопостоянна на La, b], интеграл A1) отличен от нуля. С другой стороны, если т<п, то — многочлен степени меньше п и по условию теоремы имеем / = 0. Следовательно, т = п, что и доказывает теорему 2. Из теорем 1 и 2 следует, что для любого п существует, притом единственная, квадратурная формула, точная для любого много- многочлена степени 2л—1. 4. Свойства квадратурных формул Гаусса. Нетрудно показать, что 2л—1 — наивысшая точность формулы Гаусса, т. е. что сущест- существует многочлен степени 2и, для которого эта формула не является точной. Действительно, для многочлена C) имеем I со2 (х) dx > О, я! а НО Докажем теперь, что при любом п коэффициенты ск формул Га- Гаусса положительны. Рассмотрим многочлены Ш (х) имеющие степень 2п—2 и обладающие свойством Так как для этих многочленов формула Гаусса точна, справед- справедливы равенства Ъ п ^ р (х) <pf (x) dx = ^ ck<- о k=i откуда и следует, что с\>0, ?= 1, 2,..., п. 184
В п. 4 § 2 отмечалось, что свойство положительности коэффици- коэффициентов чрезвычайно важно для устойчивости вычислений и позволя- позволяет использовать формулы с большим числом узлов п. На практике применяются формулы Гаусса с числом узлов до 100. Для погрешности формул Гаусса справедливо представление a где 1<=(а, b). He приводя доказательства (см. [16, т. 1, с. 248]), отметим лишь, что оно основано на использовании интерполяционного многочле- многочлена Эрмита Н(х) с двукратными узлами H(xh)=f(xh), H'(xk)=f'(xk), k=l,2,...,n. 5. Частный случай формул Гаусса. Формулами Эрмита называ- называются формулы Гаусса для вычисления интеграла / (х) dx т. е. когда а= —Ь= —1, р(х) = A—x2)-in. Чтобы определить узлы соответствующей квадратурной форму- формулы, надо, согласно теореме 1, найти многочлен C), для которого dx — 0 A4) для любого многочлена q(x) степени меньше п. Можно показать (см. L2, с. 117]), что таковым является многочлен Чебышева со (дс) = Тп (х) = -^cos (n arccos x). (! 5) Поэтому узлами квадратурной формулы Эрмита являются корни этого многочлена ** = СО5B*-^1)Я, А=1,2 л. A6) Соответствующие коэффициенты вычисляются по формулам E) =\ **)<"" (.7) J Vl-x*TAxb)(x — xh) Ck: -1 и оказываются равными ск=л/п, k=l, 2, ... , п. Таким образом, формулы Эрмита имеют вид п где xk — корни многочлена Чебышева, определенные согласно A6). 185
§ 4. Численное дифференцирование 1. Некорректность операции численного дифференцирования. Задача численного дифференцирования состоит в приближенном вычислении производных функции и(х) по заданным в конечном числе точек значениям этой функции. Простейшие примеры фор- формул численного дифференцирования рассматривались в п. 1 § 4 ч. I. Напомним эти примеры. Пусть на [а, Ь] введена сетка a>h = {Xi = a + ih, i = 0, 1, ... ,N, hN = Ъ—а) и определены значения и{ = и{х{) функции и(х) в точках сетки. В качестве приближенного значения и'(х,) можно взять, например, любое из следующих разностных отношений: II— — ¦ , и.у *•' h h h *.i lh Возникающая в результате такой замены погрешность характе- характеризуется разложениями «-=«'(*)-Т"" Л (О ихЛ и(хд+и(й\ B) Li и, =u'{xt) + hlu'"{tf\ C) X,i 6 где Z}'\ /=1, 2, 3,— точки из интервала (х{-и xi+1). Вторую производную в точке х{ можно заменить отношением при этом " (*) + Четвертая производная uiv (х{) с точностью до величины О (/г2) аппроксимируется разностным отношением 1 Как правило, значения функции м(;с) в точках сетки шЛ вычис- вычисляются не точно, а с каким-то приближением. Например, элемен- элементарные трансцендентные функции вычисляются с помощью рядов, причем ряды заменяются конечными суммами. Другим источником погрешностей являются погрешности округления. Оказывается, что погрешность, возникающая при вычислении разностных отношений, намного превосходит погрешность в задании значений функции и(х) и даже может неограниченно возрастать при стремлении шага 186
сетки h к нулю. Поэтому операцию вычисления разностных отноше- отношений называют некорректной. Поясним причину некорректности на примере вычисления разностного отношения и- . == (щ—м;_,)//1. Разностное отношение и-1 хорошо приближает и'{х>\ только в том случае, когда шаг h достаточно мал. Требование малости вели- величины И, находящейся в знаменателе разностного отношения, как раз и является причиной некорректности операции численного диф- дифференцирования. Действительно, пусть вместо точного значения щ, «i_, вычислены приближенные значения щ = щ+&и u;_i = «i-i + 8t-i. Тогда вместо и-. будет вычислена величина и-. + F;—6f-i)//i. Сле- Следовательно, погрешность в вычислении первой разностной произ- производной окажется равной б- . = (б;—fii-J/h. В дальнейшем погрешности такого рода будем называть погреш- погрешностями округления (хотя их реальная природа может быть иной). Пусть известна граница б погрешностей б,-, 6,--i, т. е. |б;|^б, la*-.|<б. Тогда |й;.Л<2б/А, E) причем эта оценка достигается при б<=—Si_1 = 6. Из оценки E) видно, что вследствие малости h погрешность, возникающая при вычислении первой разностной производной, значительно превосхо- превосходит погрешность вычисления самой функции и(х). Если б не за- зависит от h, то погрешность 8- с неограниченно возрастает при h-*-0. Сказанное не означает, что нельзя пользоваться формулами чис- численного дифференцирования. Чтобы не происходило существенного понижения точности, надо следить за тем, чтобы погрешность округ- округления имела тот же порядок, что и погрешность аппроксимации. Например, из A) следует, что погрешность аппроксимации при замене и'{х) отношением и-с не превосходит величины 0,5/гМ2, где М2= шах |ы"(х)|. Естественно потребовать, чтобы и по- ле[о,4] грешность округления б-, была бы сравнима с погрешностью аппроксимации, например 26/A<Af2ft/2, F) где Мг не зависит от h. Это означает, что погрешность б при вычис- вычислении значений функции и(х,) должна быть величиной 0{h2). С другой стороны, неравенство F) показывает, что если величина б задана и мы не можем ее менять, то вычисления надо проводить не с произвольно малым шагом h, а с шагом, удовлетворяющим условию h^zhOt где Н0 = 2^д/М2. При вычислении производных более высокого порядка, когда в знаменатель разностного отношения входит hh, k> 1, влияние неточ- неточности в задании u(xt) сказывается еще сильнее. Например, при вычислении разностного отношения и~ -х t погрешность округления является величиной OF/i~4), где б —граница погрешности округ- округления функции и(х). В этом случае для того чтобы погрешность округления &^х-х t была сравнима с погрешностью аппроксимации, 187
надо потребовать, чтобы h^h0, где /j0 = O(S1/;), либо проводить вы- вычисление и(х{) с погрешностью б = О(Л6). Например, если 6~10~12, то шаг h надо брать примерно равным 0,01. При этом погрешность аппроксимации и погрешность округления будут примерно равны- равными ю-4. Вычисление производной и'(х) по заданной функции и(х) так- также является некорректной операцией в том смысле, что для огра- ограниченной функции и(х) производная и'(х) может быть сколь угод- угодно большой. Например, для u(x)=sincox имеем max |ы(*)|^1 и xs[a,b] max |u'(jc) | = |(й|->-оо при о)-»-оо. Строгие определения корректности математической задачи и способы решения некорректных задач изложены в книге [38]. 2. Применение интерполирования. Многие формулы численного дифференцирования можно получить как следствие интерполяцион- интерполяционных формул. Для этого достаточно заменить функцию и{х) ее ин- интерполяционным многочленом Ln(x) и вычислить производные мно- многочлена Ln(x), используя его явное представление. В отличие от п. 1 рассмотрим неравномерную сетку и обозначим через hi = xi—xt-u i=l, 2, ..., N, шаги этой сетки. В качестве примера получим формулы численного дифференциро- дифференцирования, основанные на использовании многочлена Лагранжа L2,(x), построенного для функции и(х) по трем точкам л:,-,, хи xi+1. Много- Многочлен L2i(x) имеет вид Z.2,,(*) = (х — xt) (х — х[+1) (х — х{_г) (х — xi+1) (х— *м) (x—Xj) G) Отсюда получим L'x.t (х) = [2x-Xl-xt) Bх-х^-хи1) Bх-х[1-х1) Ui А [2x-Xl-xt+1) Это выражение можно принять за приближенное значение и! (х) в любой точке д:е[л;;_ь xi+l]. Его удобнее записать в виде йл {х) = ± \ (х - х^О -^Р^ + (xw - х) ^tL } , (8) где hi=0,5(hi + hi+i), xi-41 = xi—0,5/i;. В частности, при x = xt получим hC+l Hi hi и если сетка равномерна, hi+i = ht = h, то приходим к центральной раЗНОСТНОЙ ПрОИЗВОДНОЙ, L2i; (Xi) = U° .. 188
При использовании интерполяционного многочлена первой сте- степени точно таким же образом можно получить односторонние раз- разностные производные и-1 н uXii. Далее, вычисляя вторую производную многочлена L2|j(*), полу- получим приближенное выражение для и'' (х) при ^e[j(w, xi+l]: На равномерной сетке это выражение совпадает со второй разност- разностной производной и-х .. Ясно, что для приближенного вычисления дальнейших производных уже недостаточно многочлена L2i(x), надо привлекать многочлены более высокого порядка и тем самым увеличивать число узлов, участвующих в аппроксимации. Порядок погрешности аппроксимации зависит как от порядка интерполяционного многочлена, так и от расположения узлов ин- интерполирования. Получим выражение для погрешности аппроксима» ции, возникающей при замене и'(х) выражением Ь'2Л(х). Будем считать, что хе[х,_,, *i+1] и что величины h(, h^, имеют один и тот же порядок малости при измельчении сетки. По формуле Тейлора в предположении ограниченности ulw (x) получим ui+k = и(х) + (xi+k — х) и' (х) + + (X{+k ~ Х? и" (х) + (*'+* ~*)8 и'" (Х) + О (V), 2 6 где k = 0, ±1, h = max{hu hi+l). Отсюда приходим к следующим раз- разложениям разностных отношений: "'~"'~г = «' (х) -(х- дг,_,Л) и" (х) + {(Х~Х21-У'J +-§;)"'" К+О (h\ A1) "' = W (x) + (хи,А - x) и!' (х) + + ( (Xi^-x)* + ^il) u'" (x) + О (hs). A2) \ 2 24 / Подставляя A1) и A2) в выражение для разностной производной (8) и приводя подобные члены, получим Отсюда видно, что разностное выражение (8) аппроксимирует и' {х) со вторым порядком. Несколько хуже обстоит дело с выраже- выражением A0), аппроксимирующим вторую производную. Из D) видно, 189
что на равномерной сетке в точке х = х{ имеет место аппроксимация О (К1). Покажем, что на неравномерной сетке (h{^hi+l) погреш- погрешность аппроксимации будет иметь только первый порядок. Подстав- Подставляя разложения A1), A2) в выражение A0) для L2,i (х), получим L'tti (х) = и" (х) + [хс -х + hi+lki) и" (х) + О (h>). Здесь даже на равномерной сетке второй порядок аппроксима- аппроксимации имеет место лишь в точке x = xit а относительно других точек (например, точек x = xi^i и x = xi+i) выполняется аппроксимация только первого порядка. ГЛАВА 5 РЕШЕНИЕ НЕЛИНЕЙНЫХ УРАВНЕНИЙ И СИСТЕМ УРАВНЕНИЙ § 1. Примеры итерационных методов решения нелинейных уравнений 1. Введение. Пусть задана функция f(x) действительного пере- переменного. Требуется найти корни уравнения f(x)=O A) «ли, что то же самое, нули функции f(x). Уже на примере алгебраического многочлена известно, что нули f(x) могут быть как действительными, так и комплексными. Поэто- Поэтому более точная постановка задачи состоит в нахождении корней уравнения A), расположенных в заданной области комплексной плоскости. Можно рассматривать также задачу нахождения дейст- действительных корней, расположенных на заданном отрезке. Иногда, пренебрегая точностью формулировок, будем говорить, что требу- требуется решить уравнение A). Задача нахождения корней уравнения A) обычно решается в два этапа. На первом этапе изучается расположение корней (в об- общем случае на комплексной плоскости) и проводится их разделе- разделение, т. е. выделяются области в комплексной плоскости, содержа- содержащие только один корень. Кроме того, изучается вопрос о кратно- кратности корней. Тем самым находятся некоторые начальные приближе- приближения для корней уравнения A). На втором этапе, используя задан- заданное начальное приближение, строится итерационный процесс, по- позволяющий уточнить значение отыскиваемого корня. Не существует каких-то общих регулярных приемов решения задачи о расположении корней произвольной функции f(x). Наи- Наиболее полно изучен вопрос о расположении корней алгебраических многочленов m. B) Например известно, что если для многочлена B) с действительными коэф- фицентами выполнены неравенства f(c)>0,f'(c)>0 f 190
то положительные корни f(x) не превосходят числа с. Действительно, из фор- формулы Тейлора получаем, что /(*)>0 при Численные методы решения нелинейных уравнений являются, как правило, итерационными методами, которые предполагают за- задание достаточно близких к искомому решению начальных данных. Прежде чем переходить к изложению конкретных итерацион- итерационных методов, отметим два простых приема отделения действитель- действительных корней уравнения A). Предположим, что f(x) определена и непрерывна на [а, Ь]. Первый прием состоит в том, что вычисляется таблица значе- значений функции f(x) в заданных точках xh^[a, b], k — 0, 1, ... , п. Если обнаружится, что при некотором k числа f(xh), f(xk+!) имеют раз- разные знаки, то это будет означать, что на интервале (xh, xk+t) урав- уравнение A) имеет по крайней мере один действительный корень (точ- (точнее, имеет нечетное число корней на (xh, xk+i)). Затем можно раз- разбить интервал (xh, xh+i) на более мелкие интервалы и с помощью аналогичной процедуры уточнить расположение корня. Более регулярным способом отделения действительных корней является метод бисекции (деления пополам). Предположим, что на (а, Ь) расположен лишь один корень х, уравнения A). Тогда f(a) и f(b) имеют различные знаки. Пусть для определенности Да)> >0, f(b)<0. Положим ха = 0,5(а + Ь) и вычислим f(x0). Если f(x,,) < <0, то искомый корень находится на интервале (а, х0), если же f{xa)>0, то х,^(х0, Ь). Далее, из двух интервалов (а, х0) и [хо, Ь) выбираем тот, на границах которого функция f{x) имеет различ- различные знаки, находим точку х, — середину выбранного интервала, вы- вычисляем f(Xi) и повторяем указанный процесс. В результате полу- получаем последовательность интервалов, содержащих искомый корень х,, причем длина каждого последующего интервала вдвое меньше, чем предыдущего. Процесс заканчивается, когда длина вновь полу- полученного интервала станет меньше заданного числа е>0, и в качест- качестве корня х, приближенно принимается середина этого интервала. Заметим, что если на (а, Ь) имеется несколько корней, то ука- указанный процесс сойдется к одному из корней, но заранее неизвест- неизвестно, к какому именно. Можно использовать прием выделения кор- корней: если корень х = х, кратности m найден, то рассматривается функция g(x)=f{x)/{x—x.)m и для нее повторяется процесс нахождения корня. 2. Метод простой итерации. Он состоит в том, что уравнение A) заменяется эквивалентным уравнением x = s(x) C) и итерации образуются по правилу xn+l = s(xn), п = 0, 1, .... D) 191
причем задается начальное приближение х„. Для сходимости боль- большое значение имеет выбор функции s(x). Эту функцию можно за- задавать различными способами, однако обычно она берется в виде s(x)=x + x(x)f(x), E) причем функция т(х) не меняет знака на том отрезке, где отыски- отыскивается корень. В § 2 будет показано, что метод простой итерации сходится при надлежащем выборе начального приближения ха, ¦если \s'(x.) | < 1, где х. — корень уравнения A). Отметим, что в форме метода простой итерации D) можно за- записать, по существу, любой одношаговый итерационный метод. В частности, если т(х) =т = const, то получим метод релаксации x^z^=f{Xn)< й = о,1,..., F) f{)< ,,, для которого s'(x) = 1 + т/'(х), и метод сходится при условии —2<тП*.)<0. G) Если в некоторой окрестности корня выполняются условия f'(x)<0, 0<mi<\ff(x)\<Mu (8) то метод релаксации сходится при те @, 2/Af,). Чтобы выбрать оптимальный параметр т в методе релаксации, рассмотрим уравнение для погрешности zn = xn—х.. Подставляя zn в F), получим уравнение Z"+i ~ Z" f(v |,| По теореме о среднем имеем f{x, + za) =f(x.) +znf'(x. + Qzn) =znf'(x. где 8е@, 1). Таким образом, для погрешности метода релаксации выполняется уравнение т Отсюда приходим к оценке I zn+1 [ ^ | 1 + т/' (х, + Qzn) | • | zn К max | 1 + т/' (х. + 0г„) [ • | гп\, X и если выполнены условия (8),то | гп+, [ < max {11—тМ, |, 11—да, |} | zn \. Таким образом, задача выбора оптимального параметра сводит- сводится к нахождению т, для которого функция <7(т) =тах{| 1—тМ,|, 11—т/п41} принимает минимальное значение. 192
Из рассмотрения графика функции q(x) видно, что точка мини- минимума определяется условием 11—хМ{\ = 11—тт,| и равна т = то При этом значении т имеем Я К) = Ро = так что для погрешности справедлива оценка |г„|, « = 0,1, ... 3. Метод Ньютона. Пусть начальное приближение ха известно. Заменим f(x) отрезком ряда Тейлора и за следующее приближение Xi возьмем корень уравнения Hi(x) = = 0, т. е. х —г ° Вообще, если итерация хк известна, то следующее приближение xk+i в методе Ньютона определяется по правилу Xk+l = xk-j^-, ft = 0,l, ... (9) x Метод Ньютона называют также методом касательных, так как новое приближение xk+i является абсциссой точки пересечения касательной, проведенной в точке (xh, f(xh)) к графику функции f(x), с осью Ох. Исследование сходимости метода Ньютона будет проведено в § 3. Здесь отметим без доказательства лишь две особенности этого метода. Во-первых, метод имеет квадратичную сходимость, т. е. в отличие от линейных задач погрешность на следующей итерации пропорциональна квадрату погрешности на предыдущей итерации: xk+l—x. = O{(xh—x.J). И, во-вторых, такая быстрая сходимость метода Ньютона гаран- гарантируется лишь при очень хороших, т. е. близких к точному решению, начальных приближениях. Если начальное приближение выбрано неудачно, то метод может сходиться медленно, либо не сойдется вообще. Модифицированный метод Ньютона применяют в том случае, когда хотят избежать многократного вы- вычисления производной f'(x). Метод A0) предъявляет меньше тре- 7 А. А. Самарский, А. В. Гулин 193
бований к выбору начального приближения ха, однако обладает лишь линейной сходимостью, т. е. хк+1—x. = O{xk—х.). Метод A0) гарантирует отсутствие деления на нуль, если 4. Метод секущих. Этот метод получается из метода Ньютона / (хк) — / (х,, ) (9) заменой }'{хк) разделенной разностью , вычис- хк ~ xk-\ ленной по известным значениям хк и хк-,. В результате получаем итерационный метод хкЛ = хк- , Ч~"к-1 /te), ?=1,2, .... A1) / () / К) который в отличие от ранее рассмотренных методов является двух- шаговым, т. е. новое приближение xh+l определяется двумя преды- предыдущими итерациями хк и xh-t. В методе A1) необходимо задавать два начальных приближения хи и xt. Геометрическая интерпретация метода секущих состоит в сле- следующем. Через точки (*,,_,, /(.^-,)), (хк, }(хк)) проводится прямая, абсцисса точки пересечения этой прямой с осью Ох и является новым приближением хк+1. Иначе говоря, на отрезке [хк-и х„] функ- функция f(х) интерполируется многочленом первой степени и за оче- очередное приближение xh+l принимается корень этого многочлена. 5. Интерполяционные методы. Идея интерполяционных методов состоит в том, что нахождение корней уравнения A) заменяется нахождением корней интерполяционного многочлена, построенного для f(x). Интерполяционный метод первого порядка приводит к методу секущих. Интерполяционный метод второго порядка назы- называется методом парабол. Метод Ньютона (9) можно получить, за- заменяя f(x) интерполяционным многочленом Эрмита первой сте- степени. Получим формулы метода парабол. Пусть приближения хк-г, xk-1} xh известны. Построим интерполяционный многочлен Ньютона (см. A1) из§ 1 гл. 3) P2(x)=f(xh) + (x—xh)f(xk> v,) + (x-i»)(x-is-,)fK, хк-„ хк-,) и обозначим z=x—xh. Тогда уравнение Р2(х)=0 примет вид az2 + bz+c = 0, A2) где a = f(xk, хк-и .vs_2), b = J{xh, xk.t) + (хк—xk.,)f(xk, xk-it xh-2), c = = f(xh). Решая уравнение A2), получим два, может быть комплексных, КОрНЯ, ZA) И ZB), ПО КОТОРЫМ ВЫЧИСЛИМ ,ГA)=-Гй + 2A), .ХB) = Xh+Z{2). В качестве следующего приближения в методе парабол выбирается то из значений хA>, хт, которое ближе к хк, т. е. отвечающее мини- минимальному по модулю корню уравнения A2). Метод парабол удо- удобен тем, что позволяет получить комплексные корни уравнения G), пользуясь вещественными начальными приближениями .<,,, х,, х2. 194
6. Использование обратной интерполяции. Ряд итерационных методов можно получить с помощью интерполирования функции х = <р(у), обратной f(x). Заметим, что если х,— корень уравнения f(x)=Q, то <p@)=x.. Таким образом, задача нахождения корня х, сводится к вычислению значения ср(О). Предположим, что известны приближения .г„, х1} . . . , х„ к корню xt. Тогда можно вычислить (/,¦ = /(*;), 1 = 0, 1, . . . , п, и считать, что по переменной у заданы узлы у„, уи . . . , уп и в них известны значе- значения xa = (f(yh), .... х„ = ф((/п). По данным ((/,, ф (#,-))> ' = 0, 1, ..., п, строится интерполяционный многочлен Ln(y) для функции ф(у) и в качестве следующего приближения хп+1 берется Ln@). Линейная обратная интерполяция (/г=1) приводит к методу се- секущих. Квадратичная обратная интерполяция (л=2) приводит к методу ( ) h, yk-u ук-г), отличному от метода парабол. Здесь у(ук, ук-\) и ф(уй, ук-и ук-2) — разделенные разности первого и второго порядков соответственно. Сделаем следующее замечание. Перечисленные выше итераци- итерационные методы в случае сходимости позволяют при заданных на- начальных приближениях найти лишь один из корней уравнения A). Чтобы отыскать другие корни, надо менять начальные приближе- приближения. Может оказаться, что и при других начальных данных метод сходится к тому же корню х = х>. Тогда целесообразно отделить этот корень, т. е. применить итерационный метод к g(x) =f(x)/(x—х,). § 2. Сходимость метода простой итерации 1. Теорема о сходимости. Перепишем уравнение /(х)=0 A) в эквивалентном виде x = s(x) B) и рассмотрим метод простой итерации xk+l = s(xk), k = 0, I, ..., х„ задан. C) Говорят, что итерационный метод сходится, если последователь- последовательность {хк} имеет предел при &->-оо. В следующей теореме формулируются условия на функцию s(x), гарантирующие существование и единственность решения уравнения B) и сходимость метода простой итерации к этому ре- решению. Напомним, что функция s(x) называется липшиц-непре- рывиой с постоянной q на множестве X, если для всех х', i"gI вы- выполняется неравенство \s(x')-s(x")\^q\x'-x"\. D) В дальнейшем в качестве X будем брать отрезок Ur(a)={x: \х—а\^г} E) длины 2г с серединой в точке а. 7* 195
Теорема 1. Если s(x) липшиц-непрерывна с постоянной <5*е е@, 1) на отрезке Ur(a), причем |s(a)-a|s?(l-<7)r, F) то уравнение B) имеет на отрезке Ur(a) единственное решение х, и метод простой итерации C) сходится к х. при любом начальном приближении хоеУ,(а). Для погрешности справедлива оценка \xh—x.\^qh\x,—x,\, ? = 0,1,2,... G) Доказательство. Сначала докажем по индукции, что хке=± e?/r(a), k—\, 2, ... , т. е. что метод простой итерации не выводит за пределы того множества, на котором s(x) липшиц-непрерывна с постоянной <7е@, 1). Предположим, что х;е(/,(а) при некотором /^0, и докажем, что тогда xj+1^UT(a). Из равенства xj+l—a = s(xj)—a=(s(x])—s(a)) + (s(a)—a) получим \xi+1—a\ < |s(x,)—s(a) | + \s(a)—a\. Учитывая условие липшиц-непрерывности, предположение индук- индукции и условие F), имеем \s(Xj) — s(a)\ ^q\xj — a\^qr, т. e.%,et/r(o). Оценим теперь разность двух соседних итераций xi+l—Xj. Имеем и поскольку все точки хи \= 1, 2, . . . , находятся на отрезке Ur(a), получаем оценку и,следовательно, |*j+i—*i |^|*i—*о|, /=1,2,... (8) Оценка (8) позволяет доказать фундаментальность последова- последовательности {xh}. Действительно, пусть р — любое натуральное число. Тогда р Xk+p — Xk = 2 (**+/ — Xkyj-i), i=y и согласно (8) имеем | у. l-i. I <Г I V У I V /?*+/-! nk * ^ I Г X I < ^ Г, X I т. e. |**+p —Jr*K-7^-|*i-*ol. k,p^l,2, ... (9) 1—<7 196
Поскольку правая часть неравенства (9) стремится к нулю при к—>-оо и не зависит от р, последовательность {xh} является фунда- фундаментальной. Следовательно, существует x,^Ur (a). k—*х> Переходя в C) к пределу при &->-оо и учитывая непрерывность функции s(x), получим x. = s(x.), т. е. х, — решение уравнения B). Предположим, что х/ — какое-то решение уравнения B), при- принадлежащее отрезку Ur{a). Тогда и по условию теоремы \x. — x'J^q\x, — x'J. Так как q<\, последнее неравенство может выполняться лишь при х,' = х„ т. е. решение единственно. Докажем оценку погрешности G). Из уравнения C) получим xh+i—x, = s (х„) —х, = s (xh) —s (х.), и так как xh, x,^UT(a), приходим к неравенству \xh+l—x.\s^q\xk—х,\, A0) справедливому для всех k = 0, 1, ..., из которого и следует оценка G). Теорема 1 доказана. Замечание 1. Если для погрешности какого-либо итерационного метода выполняется неравенство I хк—х. | < Af iqh | хо—х. |, где qe @, 1) и yW| не зависит от k, то говорят, что метод сходится линейно со скоростью геометрической прогрессии со знаменателем q. Такая терминология объясняется тем, что при А-»-оо погрешность убывает как qk. Замечание 2. Зафиксируем в неравенстве (9) индекс k и устремим р к бесконечности. Тогда получим оценку погрешности Qk |s(*e)-*o|, 6=1,2, ... (И) 1 — q В правую часть оценки A1) входят только известные величины, в то время как оценка G) содержит заранее неизвестное значение х.. Приведем следствия из теоремы 1, содержащие более удобные для проверки условия сходимости. Будем предполагать, что s(x) непрерывно дифференцируема на отрезке Ur(a). Следствие 1. Если \s'(x)\^q<l A2) для x^UT(a), выполнено условие F) и хое[/т(а), то уравнение B) имеет единственное решение x,^Ur(a), метод C) сходится и спра- справедлива оценка G). Действительно, из A2) следует D) с ^е@, 1). 197
Следствие 2. Пусть уравнение B) имеет решение х,, функ- функция s(x) непрерывно дифференцируема на отрезке UT(x.)={x: \х-х.\^г) A3) и |s'(a\)|<1. Тогда существует е>0 такое, что на отрезке Ut(x,) уравнение B) не имеет других решений и метод C) сходится, если только ,t,,e(/?(x,). Доказательство. Поскольку s(x) непрерывно дифференци- дифференцируема на отрезке UT(x.) и |s'(x.)|<l, найдутся числа <?e@, 1) и @, г] такие, что для всех jce?/e(jc.). 2. Метод Эйткена ускорения сходимости. Предположим, что ка- какой-либо итерационный метод имеет линейную сходимость, т. е. xk—x,~aq\ <7<=@, 1), /г=1,2, ... Числа a, q, x, заранее неизвестны, но их можно найти, используя три последовательных итерации xh, xk+i, xk+2. Составим уравнения (здесь равенства надо понимать как приближенные), из которых найдем Axk = хк?1 — xk — aqk (q—l), А2хк = Лл-*+1 — Ахк = aqh {q — IJ, *. = *«--^-. A4) Метод Эйткена ускорения сходимости состоит в том, что после вычисления хк, xh+u xh+2 производится пересчет по формуле y = x Д xh A5) и значение yk+, принимается за новое приближение. Если бы равен- равенство A4) выполнялось точно, то yfc+1 совпало бы с точным решением х.. В общем случае yh+1 дает лучшее приближение к х., чем очеред- очередная итерация хк+г. Подчеркнем, что главным предположением здесь является требование линейной сходимости основного итерационного метода. В случае методов, имеющих более высокую скорость схо- сходимости (например метода Ньютона), ускорение по Эйткену в фор- форме A5) неэффективно. На практике не обязательно проводить пересчет по формуле A5) на каждой итерации k. Употребительны методы, в которых та- такой пересчет осуществляется циклически, т. е. через определенное число основных итераций. С помощью метода Эйткена на основе известных итерационных методов можно получить иногда новые итерационные методы, об- 198
ладающие более высокой сходимостью. Рассмотрим, например, ме- метод релаксации т (см. F) из § 1), который имеет линейную сходимость, если M,>f'(x)>0, 0<x<2/Aft. Предположим, что при некотором k получены значения хк, хк+и хк+2. Вычислим согласно A5) величину A7) х '2 + Ч ¦хш - 2хш + -Ч. и исключим из A7) с помощью A6) величины хк+и хк+г- Имеем Xv+2 = -Tt+i — т/ (*/,-«) = хк — if (хк) — т/ (хк — т/ (**)), следовательно, i X Проведенные построения позволяют предположить, что одно- шаговый итерационный метод Г(ук) /1Й. ук+1 =у/, — г A о) l(yk)-l(yk-if(yk)) обладает более быстрой сходимостью, чем исходный метод релак- релаксации A6). Действительно, как показано, например, в [25], метод A8) прит=1 {метод Стеффенсена) имеет квадратичную сходи- сходимость. § 3. Сходимость метода Ньютона 1. Простой вещественный корень. Предположим, что уравнение f(x)=O A) имеет простой вещественный корень .v = .v#, так что /(-0=0, У(хш)Ф0. Будем предполагать, что j(x) дважды непрерывно диф- дифференцируема в окрестности корня х,. Исследуем сходимость ме- метода Ньютона хк» = хк—Щ^ k = 0, I, ... B) Заметим прежде всего, что B) можно рассматривать как част- частный случай метода простой итерации xh+t = s{x,), k = 0, I, . . . , C) для которого 5{Х)=Х—Ш-. D) / (х) 199
R § 2 было показано, что для сходимости метода C) достаточ- достаточно потребовать, чтобы в некоторой окрестности искомого корня выполнялось неравенство |s'(*)K<7<1. E) Для функции D) имеем 1 ' (Г WJ и если хш— корень f(x), то s'(x#) =0. Поэтому найдется окрестность корня, в которой выполнено неравенство E). Тем самым при над- надлежащем выборе начального приближения метод Ньютона сходит- сходится. Однако следствием малости s'{x) в окрестности х„ является не просто сходимость, а сходимость существенно более быстрая, чем в общем случае метода простой итерации. В следующей теореме доказано, что метод Ньютона имеет квадратичную сходимость, т. е. что он сходится и погрешность на (й+1)-й итерации пропорцио- пропорциональна квадрату погрешности на й-й итерации. Теорема 1. Пусть х. — простой вещественный корень уравне- уравнения A) и пусть 1'{х)Ф0 в окрестности Ur(x.) = {x: \х-х.\<г}. Предположим, что f"(x) непрерывна в Ur(x.) и 0<т1= inf \f'(x)\, M2= sup \f'(x)\, F) uW е1/) причем Тогда если xo^Ur(xt), то метод Ньютона B) сходится, причем для погрешности справедлива оценка l^-JCl^*-1!*.-*.!, (8) где М,\хо-х*\ L (9) 2т, Доказательство. Из уравнения B) получим хш x, Xk xt или F(x) = (x-x.)f'(x)-f(x). (И) Заметим, что F(х%) =0 и F'{x) = {x-x.)f"(x). A2) 200
Далее, воспользовавшись тождеством F(xk) = F(x,)+§ F'(t)dt ¦«. и выражением A2) для F'(t), получим =$ {t-x,)f"{t)dt. Так как функция t—х# не меняет знак на отрезке интегрирования, можно воспользоваться формулой среднего значения и записать, что F (Xli) = $ (* - х.) Г (i) dt = f" (Ы J (t - х,) dt = (х*~х*]*/" (у, X, it, где Е*=0Л+A—Qk)x,, [eft|<l. Обращаясь к A0), получим т. е. погрешность на (А+1)-й итерации пропорциональна квадрату погрешности на ^-й итерации. Докажем оценку (8) по индукции. При k = 0 из A3) получим По условию теоремы xo^Ur(xt), и поэтому согласно первому из ус- условий F) имеем |/'(*0) | ^ffJiX). Кроме того, |о = 0ол-о+A—6о)л:., io—x. = Q0(x0—хт), |?о—¦«.| ^ 10а| |х0—х.| т. е. |oet/r(x#). Но тогда согласно F) |/"(?0) | ^М2. Таким обра- образом, приходим к оценке , • М-1 (Хо — JC»)a , . | Х1 А, | 5== - Ч\Л0 Л,\' совпадающей с оценкой (8) при k=\. Предположим, что оценка (8) выполняется при k = t^l, и до- докажем, что она выполняется и при k = l-\-\. При k — l выражение A3) принимает вид Покажем, что х,, lj€sUr(xJ. Действительно, из (8) при k — имеем г. е. x,^Ur(xJ. Кроме то;о, s.--, -0Лх,—х.), |0,|<1. ¦t. следовательно, |,еЬ^(л.) 201
Теперь можно воспользоваться условиями F) и оценить |№)ISsMi Отсюда н из A5) получим M, (xL —. Из этого неравенства и из неравенства (8), имеющего следующий вид при k — l: Ъ <¦ n1Ul-Z \ у у 12 | XI Л. | ^-_ Ц | Х„ А. получим оценку хо х* \< т. е. оценку (8) при /г = /+1. Из оценки (8) следует сходимость ме- метода B), так как для <7^@, 1) правая часть неравенства (8) стре- стремится к нулю при k-^-сю. Теорема 1 доказана. Замечания. 1. Условие G) означает, что начальное приближение надо брать достаточно близко к искомому корню. 2. Выполнение равенства A3) означает, что метод имеет квадратичную схо- сходимость. 3. Поскольку х, заранее неизвестен, иногда трудно проверить условие Хо^ит(х,). Но если известно, что \f'(x)\^ini>0 в некоторой окрестности корня, то для оценки близости начального приближения к корню можно вос- воспользоваться неравенством |хо—xt\^.\f(x0)\/mi. A6) Действительно, откуда и следует A6). 2. Кратные корни. Говорят, что х, является корнем кратности р, если \ (х.) = Г СО = . . . = f(P~l) (хг) = 0, /(fl) (xt) Ф 0 Будем предполагать сейчас, что f-71^11 (x) непрерывна в окрестности корня хг кратности р. В случае корня кратности р квадратичную сходимость имеет метод Ньютона с параметром | = 0, A7) где х = р. Справедлива Теорема 2. Пусть хщ — корень кратности р уравнения A) и в окрестности UT(x.) = {x: \х-х.\<г) производная f-pt (x) отлична от нуля. Пусть f(p+i)(x) непрерывна в UT(x} и 0<mp= irif |/(p)(a-)|, MPH= sup | x~Ur(xt) x=Ur(x,) 202
причем Мо., \х<, — х. Тогда если x,e[/r(xj, то метод A7) при х = р сходится, причем для погрешности справедлива оценка где хп — х. х.\ \) Доказательство теоремы 2 мало отличается от доказательства теоремы 1 (см. [25]). Для погрешности xk+l—xs метода A7) с х = р получаем выражение A0), где = {x-x.)f'(x)-pf(x). F(m)(xt)=0, m = 0, 1, . . . , р— 1, р. Применяя формулу Тейлора с остаточным членом в интегральной При этом Применяя форме, получим, что Далее, воспользовавшись формулой среднего значения, получим представление F(xh) в виде Для оценки знаменателя выражения A0) используется формула Тейлора с остаточ- остаточным членом в форме Лагран- жа. В результате получаем, что Далее повторяются те же рас- рассуждения, что и при доказа- Рис 6 Монотонная сходимость метода тельстве теоремы 1. Ньютона 3. Односторонние приближе- приближения. Если в окрестности корня я, производная функции f (х) сохраняет знак и монотонна, то при- приближения xh, получаемые в методе Ньютона, сходятся к х. с одной стороны. Это означает, что последовательность {х,,} либо монотон- монотонно убывает, так что я, <1**-ц ¦<!¦?* для всех k, либо монотонно воз- 203
растает, так что xh<ixh+i<ix. для всех k. Монотонная сходимость метода Ньютона хорошо видна на рис. 6. Важное свойство моно- монотонности метода Ньютона более точно сформулировано в теоре- теоремах 3, 4. В этих теоремах предполагается, что на отрезке [а, Ь] уравнение A) имеет единственный корень хш и функция f(x) дваж- дважды непрерывно дифференцируема. Теорема 3. Пусть для всех хе[a, b] либо f'(x)>0, f"(x)>Q, A8) либо /'(*)< О, П*)<0. A9) Тогда последовательность {xh}, определенная согласно B) с ха = Ь, монотонно убывает и сходится к х%. Теорема 4. Пусть для всех х^[а, Ь] либо /'(*)> О, /"W<0, либо Г(х)<0, /"( Тогда последовательность {xh}, определенная согласно B) с хо = а, монотонно возрастает и сходится к х,. Поскольку формулировки и доказательства теорем 3, 4 совер- совершенно аналогичны, ограничимся доказательством теоремы 3. Доказательство теоремы 3. Монотонность последова- последовательности {xh} докажем по индукции. По условию ха = Ь. Предпо- Предположим, что для некоторого k^O выполняются неравенства *.<*»<&, B0) и докажем, что тогда x.<xk+i<:xh. B1) Перепишем уравнение B) в виде Xk — Xk+i == —— и воспользуемся формулой конечных приращений Лагранжа. Тогда получим *~ ft+1~ где ^e(x#, xh). Пусть выполнено условие A8). Тогда 0<-^-<1, B3) причем последнее неравенство является следствием монотонного возрастания У(х). Те же самые неравенства B3) выполняются и в случае условий A9). Таким образом, 0< fl(Xk) <xk х„ 204
и из B2) получим т. е. получим требуемые неравенства B1). Таким образом, после- последовательность {xh} монотонно убывает и ограничена снизу чис- числом xt. Поэтому данная последовательность имеет предел, который в силу непрерывности функции f(x) и условия {'(х^фО совпадает с корнем xt уравнения A). Теорема 3 доказана. Сделаем замечания относительно скорости сходимости метода Ньютона при условиях теорем 3 и 4. Если начальное приближение Хо выбрано достаточно близко к искомому корню, так что выполняется условие G), то согласно тео- теореме 1 метод имеет квадратичную сходимость и для погрешности справедлива оценка (8). Если же условие G) не выполнено, то на начальных итерациях погрешность будет убывать более медленно. Однако в силу сходимости последовательности {**} найдется номер k=k0, для которого очередное приближение хк» удовлет- удовлетворит неравенству 2т1 и с этого момента сходимость станет квадратичной. 4. Комплексный корень. Пусть f(z)—функция комплексного переменного z = x-\-iy и 2„=*„+'#*— простой нуль f{z). Будем считать, что f(z) аналитична в некоторой окрестности г.. Тогда можно рассматривать метод Ньютона zk-±^-, Л = 0, 1, ... B4) Сходимость метода B4) устанавливается в теореме 5, которая обобщает на комплексный случай теорему 1. Теорема 5. Пусть z* — простой корень уравнения f(z)=O и пусть f(z) аналитична в круге Предположим, что inf |/'(Z)| = mi>0, sup | Г B) I = M2, B5) B6) причем M21 z0 — 2m! Тогда если zogC/,B,), to метод B4) сходится, причем для по- погрешности справедлива оценка l^-z.K^U-z.l, B7) где ^I^-«.I<L Bg) 2,т1 Мб
Доказательство. Для погрешности получаем уравнение **«-*. = -^, B9) где F(Z) = (Z-zJ/'(z)-/B), F'{z) = (z-z.)f"(z). Воспользовавшись формулой Ньютона — Лейбница, получим т. е. ч F{zk)= j' (z-z,)f"(z)dz. C0) г, Докажем оценку B7) по индукции. При k = 0 из B9) получим ?1_г =ZM. C1) /' (z0) Так как 20е(Уг(г#), имеем согласно B5), что |/'(г0) | ~^тС>§. Да- Далее, оценим ^-z,)f"{z)dz. C2) Для этого сделаем в интеграле C2) замену переменной z = /Zo+(l—/)z. и перепишем его в виде F (г0) = (г„ - г.J ( ^ (/2о + A - ^)г.) ^- C3) о Имеем Z—Z. = t(Zd—2j, |Z—Z,|^|ZO—Z#|<r, т. e. z = /20+(l—/Jz^eL'rlz), и согласно B5) выполняется оценка |№o+(l-/)Z.)|<M, Отсюда и из C3) получаем оценку | F (г0) | -С М21 г0 - 2. \*\tdt = 0,5 Иа | г0 — г. |>. о Учитывая C1), получим неравенство которое совпадает с неравенством B7) при k=\. Предположим, что оценка B7) выполняется при k = l^], и до- докажем, что она выполняется и при k = l-\-\. Заметим прежде всего, 206
что из оценки B7) при k = l следует, что 2,е[/,(г,). Поэтому со- согласно условию B5) имеем \f'(z,) | 0 Далее, оценим Учитывая, что 2,е[/гB„), можно получить оценку этого интеграла гак же, как и оценку F(г0), а именно Тогда из B9) при k = l получим Л*.21 z, — г» 1 *' 2mt и, учитывая B7) при k = i, придем к неравенству B7) при k = l-\-\. Теорема 5 доказана. Заметим, что условие сходимости B6) означает близость на комплексной плоскости начального приближения 2„ к искомому корню гщ. В частности, это условие может не выполняться для ве- вещественных начальных приближений. При численной реализации метода Ньютона можно пользовать- пользоваться комплексной арифметикой, однако иногда бывает удобнее раз- разделить в формулах B4) действительные и мнимые части и прово- проводить вычисления только с вещественными числами. § 4. Итерационные методы для систем нелинейных уравнений 1. Общие понятия. Рассмотрим систему нелинейных уравнений f (у у у \ Л M*J» Х1, • • • . хт) = 0, (|) I т \xii Х^, . . . , Хт) — U, где fu i=\, 2, ..., m,— функции вещественных переменных х„ ... ..., хт. В дальнейшем систему A) будем рассматривать как опе- операторное уравнение в некотором линейном пространстве Н раз- размерности т. Обозначим х= (х„ х2, . . . , х„ F(x) = (fl(x),fi(x). ...,/,„(х))Т и запишем A) в виде операторного уравнения F(x)=0, B) где F: H-+H — отображение, нелинейное, вообще говоря, из И в Н. 207
Многие одношаговые итерационные методы для решения си- системы B) можно записать в виде Bk+1 **+1-** +F{xk) = 0, /г = 0, 1, .... х0задан, C) где k — номер итерации, X \Ли Х2, . . . , Лт) , Tft+1 — числовые параметры, Bk+i — матрица т'Хт, имеющая об- обратную. Если F — линейный оператор, то C) совпадает с канонической формой одношагового итерационного метода (см. § 1 гл. 2), т. е. в виде C) можно за- записать любой одношаговый метод для линейной системы уравнений. В случае нелинейной системы A) возможны методы, содержащие новую итерацию xh+l нелинейно, и тем самым не представимые в виде C). Однако мы по-прежнему будем называть канонической формой запись итерационного метода в виде C). Для нахождения xk+i по известному х" из уравнения C) необ- необходимо решить систему линейных алгебраических уравнений Bh+ix^ = g(xk), D) где g(xh) =Bh+ixk—Th+iF(xh). Метод C) называется явным, если Bh+i = E для всех k = Q, 1, .. ., и неявным — в противном случае. Ме- Метод C) называется стационарным, если В и т не зависят от номера итерации k. Систему линейных уравнений D) можно решать либо прямым, либо итерационным методом. В последнем случае итера- итерации, приводящие к решению системы D), называются внутренни- внутренними итерациями, а итерации C) — внешними итерациями. 2. Сходимость стационарного метода. Остановимся кратко на вопросе о сходимости метода C). Предположим, что метод C) — стационарный, т. е. В и т не зависят от k. Тогда уравнение C) мож- можно переписать в виде xk+l = S(xh), E) а исходное уравнение B) —в виде x=S(x), F) где S (*)=*—Tfi-'-F(x). Будем считать, что Н — конечномерное линейное нормирован- нормированное пространство, т. е. что определен функционал ||jc||, удовлетво- удовлетворяющий всем аксиомам нормы. Точка ^еЯ, для которой S (*,)=*., называется неподвижной точкой оператора S. Очевидно, что точка хт является решением опе- операторного уравнения B) тогда и только тогда, когда она является неподвижной точкой оператора S. Таким образом, отыскание кор- корней уравнения B) эквивалентно отысканию неподвижных точек оператора 5. Говорят, что S является сжимающим оператором на множестве К^И , :;¦:>.¦>ффи : , ,jit . ,-..v^w ^j а.? л и существует число <?e(Q 1) такое ;.'Д,1я ''--~_S чыпол но-тя неравенство 208
Теперь мы в состоянии сформулировать теорему, которая назы- называется принципом сжимающих отображений и содержит условия сходимости метода простой итерации xk+l = S(xh) G) в конечномерном линейном нормированном пространстве Н. Она является многомерным аналогом теоремы 1 из § 2. Теорема 1. Пусть оператор S определен на множестве и является сжимающим оператором на этом множестве с коэффи- коэффициентом сжатия q, причем ||S(a)-a|!<(l-<7)r, OL<«7<1. (8) Тогда в Ur(a) оператор S имеет единственную неподвижную точку я, и итерационный метод G) сходится к х. при любом х°е &UT(a). Для погрешности справедливы оценки I** —*. l-q (9) A0) Доказательство теоремы 1 можно найти в [42]. 3. Примеры итерационных методов. Пример 1. Метод релаксации представляет собой частный случай метода C), когда Bh+I = E, xft+i=T. Это стационарный ите- итерационный метод, который можно записать в виде xh+i = S(x*), где S(x)=x—-cF(x). Метод сходится, если ||S'(jO ||-<1. В данном случае S' (х) = = E—%F'{x) и (П) Пример 2. Метод Пикара. Пусть F(x) представляется в виде F(x)=Ax+G(x), где А — матрица m'Xtn. Тогда итерации можно определить следую- следующим образом: A З/i (х) дх, дх, <>fm M df-i (x) df- (x) дхг Sh (х) dh(x) dxm df..t (x) 209
Итерационный метод можно переписать в виде А(хк'1—xk)+F(xk)=Q, т. е. в канонической форме C) с Bk+l = A, xh+l=\. Можно и здесь ввести итерационный параметр и рассматривать более общий ме- метод А-——?- + F (хк) = 0. т Пример 3. Метод Ньютона для системы уравнений A) стро- строится следующим образом. Пусть приближение xk = (x\, xku ..., xkm)T уже известно. Выпи- Выпишем разложение функции Uixu х2, . . . , хт) по формуле Тейлора в точке А'*, - дх1 и отбросим величины второго порядка малости. Тогда система A) заменится системой уравнений "' df (xk) 2(а-7-4)-^— + /;(^) = 0, t = l,2 m, A2) линейной относительно приращений xs—х-,, /=1, 2, ..., т. Реше- Решение х={хи хг, ..., хт)Т системы A2) примем за следующее при- приближение и обозначим через Таким образом, итерационный метод Ньютона для A) опреде- определяется системой уравнений 2)(^"-^)-^—^- + Л-(^) = 0, t = l,2 /и, A3) из которой последовательно, начиная с заданного х° = (х[, .. . ,х%_) , находятся векторы хк, k=\, 2,... Систему A3) можно записать в векторном виде F'{xh) (xk+l—xk)+F(xk) =0, k = 0, 1, ... , х° задан, A4) где матрица F'(х) определена согласно A1). Таким образом, ме- метод Ньютона имеет канонический вид C), где Для реализации метода Ньютона необходимо существование матриц (F'(xk))~l, обратных F'(x"). По поводу сходимости метода Ньютона для систем уравнений можно сказать то же, что и в слу- 210
чае одного уравнения, а именно, метод имеет квадратичную сходи- сходимость, если начальное приближение выбрано достаточно хорошо. Приведем без доказательства одну из теорем о сходимости метода Нью- Ньютона. Пусть Ет — множество m-мерных вещественных векторов с нормой ||х|| = = ( 2j i I '" ''— норма матрицы Л, подчиненная данной норме вектора. Обозначим и предположим, что в шаре Ur(x°) функции fi(x), t=l, 2, ..., т, непрерывно дифференцируемы. Теорема 2. Предположим, что в UT(x°) матрица F''(х) удовлетворяет ус- условию Липшица с постоянной L, т. е. для любых х\ x?eUr(x°). Пусть в U,(xu) матрица (f (*))-' существует, причем элементы ее непрерывны и Ц Если начальное приближение х° таково, что причем оо k=<! то система уравнений B) имеет решение x,eJ/,(jd), к которому сходится метод Ньютона A4). Оценка погрешности дается неравенством k . 2 Доказательство теоремы 2 можно найти в [42]. Пример 4. Модифицированный метод Ньютона имеет вид F'(x°)(xk+i—xh)+F(xh)=0 A5) и обладает линейной сходимостью. Упрощение в численной реали- реализации по сравнению с обычным методом Ньютона состоит в том, что матрицу F'(x) надо обращать не на каждой итерации, а лишь один раз. Возможно циклическое применение модифицированного метода Ньютона, когда F'(x) обращается через определенное чис- число итераций. П р и м е р 5. Метод Ньютона с параметром имеет вид = о. A6) Рассмотренные до сих пор методы являлись линейными отно- относительно новой итерации я1. Возможны и нелинейные методы, ког- 211
да для вычисления xh+i приходится решать нелинейные системы уравнений. Приведем примеры таких методов. Пример 6. Нелинейный метод Якоба для системы A) имеет вид f irk vk vk r*+1 r* xk) — 0 П7) i=l,2,..., m. Здесь для отыскания xh+l необходимо решить m независимых скалярных уравнений. Для решения скалярного уравнения можно применить какой-либо из итерационных методов, рассмотренных в § 1, причем не обязательно применять один и тот же метод для всех уравнений. Пример 7. Нелинейный метод Зейделя состоит в последова- последовательном решении уравнений fi (jrfw, x\+1 хкГ, xlu ...,**) = 0 A8) относительно переменной Xi , i= 1, 2, . . . , m. Большое распространение получили гибридные методы, когда внешние итерации осуществляются одним методом, а внутренние — другим. При этом число внутренних итераций может быть фикси- фиксированным и не очень большим, так что внутренние итерации не до- доводятся до сходимости. В результате получается некоторый новый метод, сочетающий свойства исходных методов. Приведем приме- примеры таких методов. Пример 8. Внешние итерации — по Зейделю и внутренние — по Ньютону. Здесь в качестве основной (внешней) итерации выби- выбирается нелинейный метод Зейделя A8), а для нахождения **+l используется метод Ньютона. Обозначим у, = х^+1. Тогда итерации определяются следующим образом: (.-*-!, Хг , . . . , Л;-!, yi, XiJrl, . . . , Xm) Kyi — У I) -f- ~T / C^l , . . . , Xi-i, У1, X-l+i, . . . , Xnl) ==¦ 0, s = 0, 1, ...,/, У1 = х\, у'^ = х1+\ A9) i=l,2 m. Здесь индексом s обозначен номер внутренней итерации. Иногда в A9) делают всего одну внутреннюю итерацию, поля- гая / = 0, y\ = xl, у) = л?п. Тогда приходят к следующему итера- итерационному методу: — (Yk+l rk+l YkH Yk Yk Yk\lYHl Yk\ 4. \Xi , Хг , . . . , Л[_1, Xt, Л1И) . . . , Xm) {Xt —Xi) -f- °xi + ft (xi*-1, ..., xtl xi, xllt ... , xkm) = 0, k = 0,l, ... B0) 212
В частности, при т — 2 метод B0) принимает вид —— (*i — Xi) -+- ;x (xu x.2) — u, B1) = o. Пример 9. Внешние итерации—no Ньютону и внутренние — по Зейделю. Запишем метод Ньютона для системы B) в виде F (xk) (x*+1—xk) +F (хк) = 0, B2) где F'(x") = {a{j), ац = — , i, /= 1, 2, .. ., m. Для решения i системы линейных уравнений B2) воспользуемся методом Зейделя. Напомним (см. § 1 гл. 2), что для линейной системы Aw+F = 0 B3) метод Зейделя строится следующим образом. Матрица А представ- представляется в виде суммы A = A--\-D-\-A+, где матрицы Л_, А+, D соот- соответственно нижняя треугольная, верхняя треугольная и диагональ- диагональная. Итерации метода Зейделя строятся по правилу {A_+D)w'+l+A+wa+F = 0, s = 0, 1, ...,/, B4) и система B4) решается путем обращения нижней треугольной матрицы Л_+Ь. В случае системы B2) надо положить А = F'(хк), вычислить по- последовательно векторы ws согласно B4), начиная с wa — 0, и поло- положить wl+i = xh+l—xh, так что xh+i = xh-\-wl+l. Заметим, что итерации по Зейделю можно осуществлять и от- относительно вектора xh+l. Пусть в B4) совершается только одна итерация, т. е. / = 0. Тог- Тогда, учитывая, что ш° = 0, wi = xk+l—xk, получим метод (А_+Д) (xh+i-xh) +F (xh) = 0, B5) где Л_+О — «нижняя треугольная» часть матрицы Якоби A1), вычисленной при х=хк. В частности, при пг = 2 метод B5) принимает вид -^- (*i, 4) (*i+1 - **) + h D,4) = о, B6) ? 44 Я1 Ъ ^ k j) 4+1 4*;, xl) = o. Сопоставление B1) и B6) показывает, что методы, рассмот- рассмотренные в двух последних примерах, не совпадают. 213
ГЛАВА 6 ЧИСЛЕННЫЕ МЕТОДЫ РЕШЕНИЯ ЗАДАЧИ КОШИ ДЛЯ ОБЫКНОВЕННЫХ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ § 1. Исходная задача и примеры численных методов ее решения 1. Постановка исходной задачи. Будем рассматривать задачу Коши для системы обыкновенных дифференциальных уравнений ^ = /(',«), *> 0, U@) = uO A) at или, подробнее, А—=fc(t, Uy, иг, ..., ит), t>0, i = l, 2, . . . , т, B) at щ @) = uf\ l^=\,2, ... ,т. C) Хорошо известны условия, гарантирующие существование и единственность решения задачи Коши (см. [39, с. 49]). Предполо- Предположим, что функции /;, 1=\, 2, . . . , т, непрерывны по всем аргумен- аргументам в замкнутой области Из непрерывности функций ft следует их ограниченность, т. е. существование константы М>0 такой, что всюду в D выполняются неравенства |Д| ^М, 1= 1, 2, .. ., т. Предположим, кроме того, что в D функции ft удовлетворяют условию Липшица по аргументам и{, и2, ..., ит, т. е. fi (t, и'и "а, • • • , "m) — U У, «i- , • • • , Un) | S^ ^ L {| Щ — Щ I + I U2 — U., | + ... +| Um — Um |} для любых точек (/, ub . . . , um) и (t, uu u2, . . . , um) области D. Если выполнены сформулированные выше предположения, то существует единственное решение ui = ul(t), u2 = u2(t), . . . , um=um(t) системы B), определенное при |/| ^/0 = min(a, b[M) и принимаю- принимающее при ^ = 0 заданные начальные значения C). При исследовании численных методов для задачи Коши будем заранее предполагать, что ее решение существует, единственно и обладает необходимыми свойствами гладкости. 2. Примеры численных методов. Существуют две группы чис- численных методов решения задачи Коши: многошаговые разностные методы и методы Рунге — Кутта. Приведем примеры и поясним ос- основные понятия, возникающие при использовании численных мето- методов. Для простоты изложения будем рассматривать сейчас одно 214
уравнение ± = f(ttU), />0, u@) = uo. D) at Введем по переменному t равномерную сетку с шагом т>0, т. е. рассмотрим множество точек ar={tn = nx, п = 0, 1, 2, ...}. Будем обозначать через u(t) точное решение задачи D), а че- через yn = y(tn)—приближенное решение. Заметим, что приближен- приближенное решение является сеточной функцией, т. е. определено только в точках сетки шг. Пример 1. Метод Эйлера. Уравнение D) заменяется разност- разностным уравнением -/(/„,#,,) = 0, «-0,1,2,..., у9 = и,. E) Решение этого уравнения находится явным образом по рекур- рекуррентной формуле yn4.i = y,,+Tf(tn, уп), п = 0, 1, . . . , yL, = «o. При использовании приближенных методов основным является вопрос о сходимости. Понятие сходимости приближенного метода можно сформулировать по-разному. Применительно к разностным методам, к которым относится и метод Эйлера E), наибольшее рас- распространение получило понятие сходимости при т—>-0. Оно означает следующее. Фиксируем точку t и построим последовательность сеток шт таких, что т—-0 и tn = nx = t (тогда необходимо п—*-оо). Го- Говорят, что метод E) сходится в точке t, если \уп—u{tn)\-*-0 при т—0, tn = t. Метод сходится на отрезке @, Т], если он сходится в каждой точке г<=@, Т]. Говорят, что метод имеет р-й порядок точности, если существует число р>0 такое, что \уп—u(tn) \ =О(тр) при т-^0. Получггм уравнение, которому удовлетворяет погрешность ме- метода zn = yn—u(tn). Подставляя yn = zn-\-un в E), получим = / ('Л| "« + гп) — • (Ь) Правую часть уравнения F) можно представить в виде суммы где $)=f(tn,Un-\-Zn)—f(tn, Ua). Функция ^ называется невязкой или погрешностью аппрок- аппроксимации разностного уравнения E) на решении исходного урав- уравнения D). Видно, что невязка представляет собой результат подста- 215
новки точного решения u = u(t) в левую часть разностного уравне- уравнения E). Если бы приближенное решение уп совпадало с точным u{tn), то невязка равнялась бы нулю. Говорят, что разностный ме- метод аппроксимирует исходное дифференциальное уравнение, если iprt'-^-O при т->-0. Разностный метод имеет р-й порядок аппрокси- аппроксимации, если г|)?' =О(тр). В дальнейшем будет показано, что при очень общих предположениях порядок точности разностного мето- метода совпадает с порядком аппроксимации. Функция ^{n=f(tn, Un+Zn) — f(tn,Un) обращается в нуль, если правая часть f не зависит от решения и. В общем случае i^3' пропорциональна погрешности zn, так как по формуле конечных приращений имеем i|#)=A*nju24-a2n)zn, |9|<1. аи Порядок аппроксимации метода Эйлера E) нетрудно найти, используя разложение по формуле Тейлора. Поскольку то в силу уравнения D) 4#> = _ и' (/„) + / (/„, ип) + 0 (т) = 0 (т), т. е. метод Эйлера имеет первый порядок аппроксимации. При вы- выводе предполагалась ограниченность и"(t). Пример 2. Симметричная схема. Уравнение D) заменяется разностным уравнением Уп+\ Уп - \ if Vn, Уп) + / (Ь+х, Уп+1)) = 0, я = 0, 1, .... уо = ио. G) Данный метод более сложен в реализации, чем метод Эйлера E), так как новое значение уп+1 определяется по найденному ра- ранее уп путем решения уравнения Уп+1—0,5if{tn+l, yn+l) =Fn, где Fn = yn-\-O,brf{tn, yn). По этой причине метод называется неяв- неявным. Преимуществом метода G) по сравнению с E) является бо- более высокий порядок точности. Для невязки 1 (/ {tnt yn справедливо разложение 216
т. е.'г^1' =0(т2). Таким образом, метод G) имеет второй порядок аппроксимации. Из результатов § 3 будет следовать, что он имеет и второй порядок точности. Приведенные примеры представляют собой простейшие случаи разностных методов, или, как их еще называют, разностных схем. Методы Рунге — Кутта отличаются от разностных методов тем, что в них допускается вычисление правых частей f(t, и) не только в точках сетки, но и в некоторых промежуточных точках. Пример 3. Метод Рунге — Кутта второго порядка точности. Предположим, что приближенное значение уп решения исходной задачи в момент t = tn уже известно. Для нахождения yn+i = y(tn+i) поступим следующим образом. Сначала, используя схему Эйлера "-* = /(/,, Уя), (8) 0,5т вычислим промежуточное значение уп+ч„ а затем воспользуемся разностным уравнением "jOlZll = /(/„ + 0,5т, уа,%), (9) из которого явным образом найдем искомое значение yn+i. Для исследования невязки подставим промежуточное значение «/„+¦/, = «/„'+0,5т/„, где /„ = /(/„, «/„), в уравнение (9). Тогда получим разностное уравнение "--/(/„ +0,5т, г/„ + 0,5т/п) = 0, A0) невязка которого равна фи» = _ "ft+1~"ft + / (/„ + 0,5т, ип + 0,5т/ (tn, un)). A1) Имеем ""+!-"" =ц; +0>5тц;; + 0 (та), f (ta + 0,5т, ип + 0,5т/ (tn, ип)) = / (/„, ип) 4- о,5т Zilf^L + o,5t/ (tn, un) \ at f + o,5t/ (tn, un) at ou так как в силу D) справедливо равенство *и = df \ fdf Ы да ' \ f dt1 Ы да Таким образом, метод A0) имеет второй порядок погрешности аппроксимации, tjj^ =О(т2), и в отличие от G) является явным. Реализация метода A0) в виде двух этапов (8), (9) называется методом предиктор — корректор (предсказывающе-исправляю- щим), поскольку на первом этапе (8) приближенное значение пред- 217
сказывается с невысокой точностью О(х), а на втором этапе (9) это предсказанное значение исправляется, так что результирующая погрешность имеет второй порядок по т. Тот же самый метод A0) можно реализовать несколько иначе. А именно, сначала вычислим последовательно функции а затем найдем yn+i из уравнения (уп+1—yn)/x = k2. Такая форма реализации метода A0) называется методом Рун- Рунге— Кутта. Поскольку требуется вычислить две промежуточные функции, /г, и /г2, данный метод относится к двухэтапным методам. В следующем параграфе будут рассмотрены более общие т-этап- ные методы Рунге — Кутта, позволяющие получить большую точ- точность. § 2. Методы Рунге — Кутта 1. Общая формулировка методов. Семейство методов второго порядка. По-прежнему рассматриваем задачу Коши для одного уравнения ^- = f(t,u), О 0, «@) = ы0. A) at Явный ш-эгапный метод Рунге — Кутта состоит в следующем. Пусть решение yn = y{t1L) уже известно. Задаются числовые коэф- коэффициенты а„ Ь,., 1 = 2, 3, ..., пг, /=1, 2, ..., m—1, а„ i=l, 2, ... ..., m, и последовательно вычисляются функции К = / (t,u Уп), /?2 = / (in + агх, уп + b2lrkj), К = f (h + а^, Уч + Ь^тку + b.i2xk,), . . ., km — / (tn + a,nX, yn +b,r:lTk1 + Ь,плк2 + . . . + U,,,,m-j.T&,n_j). Затем из формулы находится новое значение yn+l = y(tn+1). Коэффициенты au bn, а, выбираются из соображений точности. Например, для того чтобы уравнение B) аппроксимировало исход- m ное уравнение A), необходимо потребовать Va;=l. Отметим, что методы Рунге — Кутта при т>5 не используются. Остановимся более подробно на отдельных методах. При пг = = 1 получаем схему Эйлера, рассмотренную в примере 1 из пре- предыдущего параграфа. При т = 2 получаем семейство методов ki = f{tn, ул), k, = f{tn+a2x, ijn+bi^kt), C) /Л.-м = 1/» + т(аА+Ог&г). Исследуем погрешность аппроксимации методов C) в зависи- зависимости от выбора параметров. Исключая из последнего уравнения 218
функции k, и k2, получаем Ум~Уп = CTl/ Ця, уя) + cj (tn + а2т, yn + buxf (tn, yn)). D) По определению погрешностью аппроксимации или невязкой метода C) называется выражение полученное заменой в D) приближенного решения уп точным ре- решением un = u{tn). Найдем порядок погрешности аппроксимации в предположении достаточной гладкости решения u(t) и функции f(t, и). Для этого разложим все величины, входящие в выражение E), по формуле Тейлора в точке tn. Имеем "n+1 "n .., = u'(tn) + ^u(tn) + O(^), / (/„ + агх, иа + butfa) =fn+a,r^ + b2lrfn ^ + О (т2), at аи где fn=f(tn, un), — = -L{tn, un). Далее, согласно уравнению A), ди ди получим dt ди dt ди Поэтому + т I(ctAi - 0,5) U3^- + (<т,а, - 0,5) %] + О (т2). F) L ди dt J Отсюда видно, что методы C) имеют первый порядок аппрок- аппроксимации, если Oi+cb= 1- Если же дополнительно потребовать а2аг = а-1Ь11 = а,Ъ, то полу- получим методы второго порядка аппроксимации. Таким образом, име- имеется однопараметрическое семейство двухэтаиных методов Рунге — Кутта второго порядка аппроксимации. Это семейство методов можно записать в виде • = A - о) f (tn, уа) + a/ {tn + ах, уа + axf (tn, yn)), G) где ста = 0,5. В частности, при о=1, а = 0,5 получаем метод, рассмотренный в примере 3 предыдущего параграфа. При о = 0,5, а=1 получаем другой метод второго порядка: 219
Двухэтапных методов третьего порядка аппроксимации не суще- существует. Чтобы убедиться в этом, достаточно рассмотреть уравне- уравнение и'= а. Для него двухэтапный метод Рунге —Кутта G) прини- принимает вид У Л+1 Уп ,. и погрешность аппроксимации равна гЬ'1' = — + A + тега) ип. т Разлагая i^1' по формуле Тейлора и учитывая, что и'" = и" = и' — = и, получим г|>и> = т (ста — 0,5) и — — и (/„ + 9т), 0 < 6 < 1. 6 Отсюда видно, что наивысший достижимый порядок аппроксима- аппроксимации равен двум. Приведем примеры методов Рунге — Кутта более высокого по- порядка аппроксимации. Метод третьего порядка: т 2 ' "" ' 2 К = /('»+ т> Уп - ^i + 2т?2), uJ2±Zl± = -^(k1+ 4k2 + k3). т 6 Метод третьего порядка: 3 3 Метод четвертого порядка: т 6 Метод четвертого порядка: К = /(/« + т, г/„ + т^ 220
Приведенные здесь методы являются частными случаями методов Рунге — Кутта третьего и четвертого порядков, рассмотренных по- подробнее в пп. 3 и 4. 2. Доказательство сходимости. Докажем, что методы Рунге — Кутта сходятся и порядок их точности совпадает с порядком ап- аппроксимации. Выпишем уравнение, которому удовлетворяет погрешность гп = = уп—u(tn). Основное уравнение метода Рунге—Кутта имеет вид Zsz^h^oM), (8) 1=1 где / i-i Ь {y) = fUn + act, yn + 2 rink, (у) I , i = 2,3, ..., т, (9) V Подставим в левую часть уравнения (8) вместо г/, выражения u,+z, при 1 = п, п+\, а в правой части этого уравнения добавим и вычтем сумму где / '-1 \ ki (u) = fltn + щх, ип + 2 rink-, (u)\, i = 2, 3, ..., т, kl(u) = f(tn,un). A0) Тогда уравнение (8) примет вид -fit! fl_ — фA) _(_ t(,B)( A1) где (и— "»«"""« v есть по определению погрешность аппроксимации метода (8), (9) на решении исходной задачи A) (невязка) и Будем рассматривать A1) как уравнение для погрешности ме- метода. Оно выполняется для п = 0, 1, ... Поскольку начальные зна- значения у0 задаются точно, уа = и@), величина zo равна нулю. Будем считать, что задача A) решается на ограниченном отрезке вре- времени 0<?^7\ и, следовательно, при любых /гит выполняется не- неравенство tn = m^.T. 221
Предположим, что в рассматриваемой области изменения пе- переменных (t, и) функция f(t, и) удовлетворяет условию Липшица по и с константой L, не зависящей от /. При этих предположениях оценим сначала функцию г(-<2), а затем и решение zn+, уравнения (Н). Из выражений (9), A0), используя условие Липшица, получим n-Un\ + ^x\bi,\ \k,(jy) — k,(u)\\ , i=2, 3,.... т, |^1(y)-fe1(«) | ^Цул-ил\. Обозначим П = I ki (у) — kL(u)\, i = 1, 2, ..., т, b= шах |bl7|, g = L\yn — un\. A4) Тогда согласно предыдущему неравенству будем иметь П < Lb^ xr,- + g, ? = 2, 3, .... /и, rx ^ g, или, что то же самое, r^^Lb^xrj + g, i = 0, ],...,m-1, ro=O. A5) Лемма 1. Из неравенств A5) при L6t>0 следуют оценки П<Р'-^, ' = 1,2, .... т, A6) р Доказательство. Оценка A6) при ?=1 совпадает с оцен- оценкой A5) для ? = 0. Пусть неравенство A6) выполнено для ? = = 1, 2, ..., k. Покажем, что оно выполнено и для i = k+\. Из A5) при i = k получим k Согласно предположению индукции имеем П^р'-'ё, /=1,2,..., А, следовательно, ] ( ^f ) g = р% что и требовалось. 222
Оценим теперь функцию i|'(;P. определенную согласно A3). Из A4), A6) следует неравенство 1Oi I \ri l ^og 2 р1' -< где а= max Итак, окончательно имеем следующую оценку для \\>"^: ?' 11 г„ |. A7) Таким образом, при возрастании погрешности |г„| величина life | растет не быстрее первой степени погрешности. Теперь уже несложно оценить погрешность zn — yn—u(tn). Из уравнения A1) имеем откуда, учитывая A7), получаем неравенство \гп»\^(\+ол)\гп\ + т\х^Ц, « = 0,1,..., A8) где -\ A9) Заметим, что я(т)-*-аЬт при т->0. Если т^та, то а(т)^ ?5ZoLtneLhim~l)x°, т. е. а(х) ограничена равномерно по т. В качест- качестве То с большим загрублением можно взять Т. Из неравенства A8) следует оценка I гя+11 ^ A + «x)'I+l | ?01 + У т A + ах)""' | Ц)'/) |, B0) которую легко доказать по индукции. Загрубляя оценку B0) и учитывая, что 20 = 0, получим | гл+11 ^ (я + 1) т A + aXf max | № \ < /n+1eat» max | f/' где ta=tiT^T. Таким образом,доказана Теорема 1. Пусть правая часть уравнения A) /(^, и) удо- удовлетворяет условию Липшица по второму аргументу с константой L. Пусть if1.1' — невязка метода Рунге — Кутта B), определенная согласно A2). Тогда для погрешности метода при пх^Т справед- справедлива оценка \ )\TT max Ш]\, B1) ст= max | о, |, fc= max \bu\. i 223
Следствие. Если метод Рунге — Кутта аппроксимирует ис- исходное уравнение, то он сходится при т-»-0, причем порядок точно- точности совпадает с порядком аппроксимации. Доказательство этого утверждения сразу следует из оценки B1) и замечания о равномерной ограниченности а(т). 3. Методы третьего порядка точности. При решении обыкновенных диффе- дифференциальных уравнений часто используются методы третьего и четвертого поряд- порядка точности. Приведем вывод таких методов. Сначала рассмотрим трехэтапный метод *i = /('„¦ Уп) • *а = /('„ + а2т, уп + b^tki). ka = f (tn + а3т, уп + &3itfci + baicki), B2) Выясним, каким условиям должны удовлетворять параметры аи Ьц, ст< для того, чтобы данный метод имел третий порядок аппроксимации. Погрешность аппроксимации метода B2) дается выражением a3k3, B3) где k,=f (tn, un), ko = f(tn + ал, ип + b^xki), B4) h = / (tn + a3x, un + 631tAj + 632tA;2) и «„ = «(/„) —решение исходного уравнения A). Применяя разложение по формуле Тейлора для функции двух переменных и учитывая, что kt = f(tn, un), получим ). B5) Здесь значения функции f(t, и) и ее частных производных берутся при t=tn, и=ип. Точно так же *3 = f + "у 1<&н + 2аз Fii*i + *32*2) Па Подставляя сюда kl=I, k2 получим *з = I + Т [^t + F31 + Ьш) ffj + у ^м (в + Fsi + Ь3оУ f%a + 2bafijtfu + 263262l/ (/„)»] + О (т»). B6) Далее, из разложений B4) — B6) следует a3k3 = (ох + аа + сг3) + т [(ff2a2 + [(^ + а2) -у [(о2^ + а3а32) /„ + 2 @А^а + а3а3 (b31 + b32)) fftu + 221 + а3 (Ь31 + 632J) f2/uu + 2а3Ь32а^и + 2a3b32621f (/uJ] + О (т3). B7) 224
Получим теперь разложение по степеням т разностного отношения (un+i— —ып)/г, входящего в выражение для погрешности аппроксимации B3). При этом учтем, что в силу уравнения A) справедливы следующие соотношения: u'=f, «"=,/,+//„, Тогда будем иметь т — "я 2 ип g ип — т т2 = / + "Т ^< + '/и) + ~g~ Mtt + 2/^и + f2fuu + ^и^ + / (/иJ] + ° (т3)- Отсюда и из B7) получаем следующее разложение выражения для погреш- погрешности аппроксимации B3): т — ([2 (O2«2 + о3вз) — U /* + [2 (О2&21+О3 Фп — {[3 (a&l + 03а2) - 1J ftt + [6 (ой»я + asa3 (ЙЭ1 + ft»)) - 2] //, [3 (о2&2\ + Оз Fз1 + M2) - И /7UU + 21 ~ !) / (/иJ} + О ("С3). Приравнивая нулю коэффициенты при т', /=0, I, 2, получаем условия треть- третьего порядка аппроксимации: Ol + О2 + О3 = 1, О;а2 + о3а3 = о2621 + о3 Fз1 + 632) = 0,5, = — . ~ ¦ о После проведения эквивалентных преобразований эту систему уравнений можно записать в более простом виде: а3а3 = — , с%а\ + а3а\ = — , а2 = b2i, а3 = Ь31 + &з2. аФ3Фъ — ~ , B9) о Oi=l—сг2—оз. Исключим с помощью B9) из выражений B2) коэффициенты Ьц. Тогда получим метод 2т, Уп т (fe, - h) C0) =l—а2 —оэ, т о А- А. Самарский, А. В. Гулин 225
который имеет третий порядок аппроксимации при условиях а2а2 + а3аз = — , а^ + a3al = у , аяф0, а2ф0. C1) Таким образом, в общем случае существует двухпараметрическое семейство трехэтапных методов Рунге—Кутта, имеющих третий порядок аппроксимации. Задавая а^ и а% в качестве свободных параметров, получим из C1) 11 11 а2 (аэ — а2) а3 (а3 — в2) Кроме того, система C1) имеет два однопараметрических семейства реше- решений, определяемых условиями 2 з <h = а3 = — . о2 + а3 = —¦, а3 Ф 0, C3) о 4 2 3 а2 = —, а3 = 0, о2 = —, а3=?0 любое. C4) 3 4 Например, полагая а2= —, а3=1, получим из C0), C2) следующий метод третьего порядка аппроксимации: уп - т*! + 2т*2), C5) 4. Методы четвертого порядка точности. Рассмотрим теперь четырехэтапный метод я п ! -f- C6) = / (<„ + 04^. У„ + Ь41^1 + Ь42Т^2 + bulk,,), Погрешность аппроксимации метода C6) равна по определению цЫ = _ n+1^ Un + Ol*j-+ a2fe2 + a3fe3 + о,*,, Е C7) где функции ki, i=l, 2, 3, 4, получаются из C6) путем замены уп на точное ре- решение un=u(tn). Чтобы построить схемы четвертого порядка аппроксимации, необходимо раз- разложить функции, входящие в C7), по формуле Тейлора до величин третьего по- порядка по х включительно и приравнять нулю коэффициенты при степенях тп, п = 0, 1, 2, 3. Необходимо при этом учесть соотношения B8) и аналогичное вы- выражение для ulv. Опуская выкладки, приведем систему уравнений, которой долж- должны удовлетворять коэффициенты метода C6) для того, чтобы данный метод 226
имел четвертый порядок аппроксимации: О + О + О"з + 0-4 = 1, C8) b-2i = а-2, Ь31 + 632 = оз. &« + &42 + bl3 = а4; <т2а2 + а3а3 -4- а4о4 = — , у , C9) а2 + a4&43«3 = "Г . 6 l l — , D0) а2а4 + 0464303124 = — ; о — . D1) 24 Система C8) — D1) состоит из одиннадцати уравнений и содержит тринад- тринадцать неизвестных. Выберем в качестве независимых параметров неизвестные а2 и а3 и выразим остальные величины через эти неизвестные. Для этого сначала разрешим группу уравнений C9) относительно перемен- переменных а, сг3. СГ4. Определитель б этой системы б = a2a3at (a3—a2) {at—ch) (at—a3). D2) Это означает, что мы не рассматриваем значения параметров а?, а3, а«, удовлет- удовлетворяющие хотя бы одному из условий а2=0, аз=О, а4=0, a2=ai, а2=а^ а3=аА, Заметим сразу же, что а^фО, (Т4=И=0 согласно D1). Предположим, что 6=^0. Случай 6 = 0 будет рассмотрен позже. При 8?=0 система C9) имеет следующее решение: 6а3а, — 4оз — 4а4 + 3 Oj = t D3) 12а2(а3 — а2) (at — a2) ^ ^_ 6а2а4— 402 — 4а4 + 3 12а3 (а3 — а2) (а4 — а3) ' _ 6a2a3 —4аа —4д3 + 3 а4~12а(аа)(Яа) * ( Точно так же, решая систему D0), получим 4а4—3 °A5—л (а4 — а3) 2A—2аа) (о, - а,) - C - 4а,) (а, - а,) _______ 1 — 2а2 D6) D7) ТТЛV • D8) 12 (а, — а,)а3 8* 227
Учтем теперь соотношение D1). Прежде всего заметим, что <г3?=0. Действи- Действительно, при о3=0 из D4) и D6) получаем 3 о* = — . а2 = 0. но в силу D1) имеем а2?=0. Таким образом, уравнение D1) эквивалентно урав- уравнению (озМ (оАз) а2= -^ • Подставляя сюда выражения для сгз&з2. 04&43, 0з из D4), D6), D8) и приводя подобные члены, получим уравнение а2A—а4)=0, из которого следует, что а4=1. Таким образом, при 6=5^0 система C8) — D1) имеет следующее двухпарамет- рическое семейство решений: 1, C2 = 2a2- 6a2a3 — 4ao — 4a3 -f- 3 o4 = 12 (l-o.) A-a,) Aa\— a2 — 5a3 -f- 2 240402 (O3 — O2) ( I — аз) 1 — 2а2 12с4а3(аз — а2) Ьщ=\ — fc42 — 643, bsi = a2 — Ьз-21 йа = а2, 01 = 1 — о2 — 0з — °4- Здесь, как уже отмечалось, сг^О, а4^=0, т. е. а2Ф0,5, 6а2<1з^-4а2—4а3+3#0. Приведенное выше решение справедливо при 6=5^0, т. е. когда параметры а%, а3, а4 удовлетворяют условиям Рассмотрим систему C8) — D1) при тех значениях параметров о2, аз. о4. когда 6 = 0. При а2=0 система не имеет решения вследствие D1). При о3=0 система D0) принимает вид ' " " " " • ' D9) откуда следует, что а2= ~ и Li 228 . (ОцЬк -}- о,Ь„) al = , 4642 = — , о 03^32 + 04*42 = Т ¦ E0)
1 Далее, система C9) при а2 = — , а3=0 принимает вид 4 °а ~Ь 2а4а4 = 1, Oj -f- 4о4а4 = -— , 02 + 8о4а4 = 2 и имеет единственное решение 2 1 а4 = 1. о2= — , а4 = —- . 3 6 Подставляя эти значения а4, 02, 0« и аг = — в уравнения D9), E0), получаем Кроме того, из D1) имеем Таким образом, система C8) имеет следующее семейство решений, завися- зависящее от параметра Oz?=Q: 1 2 2 ' 3 4 1 1 3 б 1 3 Ьз2 = ~~rz I Ьц1 = — , й4з — баз, 12о3 2 1 1 1 1 *« = ---6а3, ь* = --??-, Ь21 = -, а1= 6-03. Точно так же при условии а2=аз система C8) — D1) имеет решение а2 = Од = — i аг = 1, о2 = —¦ — Од, а, = — о Ь 2 ¦ йЭ2 = —.— , bi2 = 1 — Зо3, bi3 = За3, 6а3 11 1 1 Ьп = 0, Ьй = --—, ftfl = "J. ax = - зависящее от параметра СТз=йО. При а2=аА имеем решение 1 1 2 а2 = а4=1, а3=—, а2 = ~ — ^4. оз =-— 1 1 1 ^ Ь Ь 8 оа4 За4 1 — "^ 1 Ьц=-— , Ьц = 1, 6О4 О 1 зависящее от параметра 229
Определитель б обращается в нуль еще в двух случаях: при а4=0 и аз = а4. Оказывается, что в этих случаях система C8)—D1) не имеет решения. Пусть, например, а4 = 0. Тогда из первых двух уравнений системы C9) получим За* — 2 2 — За, а-> = , а3 = '-— . 6а2 (а3 — а2) ^ 6а3 (а3 — ^г) При этом последнее уравнение системы C9) приводит к условию 6а2а3—4а2—4а3+3 = 0. E1) Аналогично находим, что система D0), D1) разрешима относительно Ь32, &«. bia только при условии 6а2а3—6а2—4а3+3 = 0. E2) Из E1), E2) находим а2=0, что невозможно в силу D1). Точно так же до- доказывается, что не существует решений с a3=at. § 3. Многошаговые разностные методы 1. Формулировка методов. Для решения задачи Коши ^ = /М). <>0, и@) = ыо A) at введем сетку (iiz={tn=nx, п=0, 1, . . .} с постоянным шагом т>0. Обозначим через yn — y(tn), fn — = f(tn, yn) функции, определенные на сетке мт. Линейным т-шаго- вым разностным методом называется система разностных урав- уравнений a"* + a*~+-+W™ = bjn + bj^ +...+ bmfn-,n, B) n = m, m+\, ..., где а и, bft —числовые коэффициенты, не зависящие от п, k = 0, 1, ... ..., m, причем а„Ф0. Уравнение B) следует рассматривать как рекуррентное соот- соотношение, выражающее новое значение yn = y{tn) через найденные ранее значения #„_„ уп-2,..., г/„_т. Расчет начинается с п = т, т. е. с уравнения Отсюда видно, что для начала расчета необходимо задать т на- начальных значений у0, yit ..., ym-t- Значение у0 определяется исход- нон задачей A), а именно полагают уо = ио. Величины уи у2, ... ...,ym-i можно вычислить, например, с помощью метода Рунге — Кутта. В дальнейшем будем предполагать, что начальные значе- значения г/о, уи ..., f/m-i заданы. Из уравнения B) видно, что в отличие от методов Рунге— Кутта многошаговые разностные методы допускают вычисление правых частей только в точках основной сетки cot. 230
Метод B) называется явным, если Ьа = 0, и, следовательно, ис- искомое значение уп выражается явным образом через предыдущие значения уп-и Уп-г, ¦ ¦ ¦, уп-т. В противном случае (т. е. когда Ъ,Ф =^=0) метод называется неявным. Тогда для нахождения уп прихо- приходится решать нелинейное уравнение — Уп — bof (tn, yn) — F [«/„_!, уп-2, ..., у«-,„], где т ! ak F [Уя-U Уп-2 Уп-т] = ^ \bkfn-k - Обычно это уравнение решают методом Ньютона, выбирая на- начальное приближение y(rt0> равным г/„_(. Заметим, что коэффициенты уравнения B) определены с точ- точностью до множителя. Чтобы устранить этот произвол, будем счи- считать, что выполнено условие 2 означающее, что правая часть разностного уравнения B) аппрок- аппроксимирует правую часть дифференциального уравнения A). В практике вычислений наибольшее распространение получили методы Адамса, которые представляют собой частный случай мно- многошаговых методов B), когда производная u'{t) аппроксимиру- аппроксимируется только по двум точкам, tn и tn-lt т. е. йо = —ui=\, ah=0, k = 2, 3, т. Таким образом, методы Адамса имеют вид llZl!!=L- = 2 hU-n. D) В случае Ь0 = 0 методы Адамса называются явными, в случае Ь0=?0 — неявными. При изучении разностных методов B) мы рассмотрим прежде всего, как влияет выбор коэффициентов ah, bh на погрешность ап- аппроксимации, а затем исследуем тесно связанные между собой вопросы устойчивости и сходимости. 2. Погрешность аппроксимации многошаговых методов. По- Погрешностью аппроксимации на решении или невязкой разностного метода B) называется функция ^л = — 2 ""-* + 2 bkf (tn-k' """*)• ^5) *=0 .4=0 получающаяся в результате подстановки точного решения u(t) дифференциальной задачи A) в разностное уравнение B). 231
Выясним вопрос о порядке погрешности аппроксимации при т-»-0 в зависимости от выбора коэффициентов ak,bk,k = Q, 1, ..., т. Будем предполагать при этом, что все рассматриваемые функции обладают необходимой гладкостью. Разлагая функции un_ft=«(/n—kx) в точке t = tn по формуле Тейлора, получим р / kWi/l) (t \ f (tn-k, "rr-fe) = U' (tn — kx) = P-i / uT\l „U+i) it \ „ Подставляя эти разложения в выражение E) для погрешности ап- аппроксимации, будем иметь 4=0 \/=0 m После очевидных преобразований приходим к разложению Отсюда видно, что погрешность аппроксимации имеет порядок р, если выполнены условия т 2а* = о. G) /i=0 (8) k=0 Вместе с условием нормировки C) уравнения G), (8) образу- образуют систему из р+2 линейных алгебраических уравнений относи- 232
тельно2(т+1) неизвестных а0, аи ..., ат, Ьо, Ьи ..., Ът. Можно несколько упростить эту систему. А именно, рассмотрим уравнение (8) при /=1, 2 2 и учтем условие нормировки C). Тогда получим уравнение 2*0» = -!. Окончательно получаем систему уравнений | -!. (9) / = 2,3, ...,р, которая содержит р уравнений и 2т неизвестных аи а2, ..., а bi, Ьг, . . ., Ьт. Коэффициенты а„ и Ьо вычисляются по формулам т, k=i k=i Для того чтобы система (9) не была переопределена, необхо- необходимо потребовать, чтобы р^.2т. Это требование означает, что порядок аппроксимации линейных т-шаговых разностных мето- методов не может превосходить 2т. Итак, наивысший достижимый порядок аппроксимации неяв- неявных m-шаговых методов равен 2т, а явных — 2т—1. Заметим, что если в системе (8) отбросить последние п урав- уравнений, п=\, 2, ..., р—1, то получим условия, обеспечивающие по- порядок аппроксимации р—п. Для методов Адамса D) условия р-го порядка аппроксимации (9) принимают вид т т 1^к1-%=1, / = 2,3, .... р, bo = \-^h. A1) k=i fc=i Отсюда видно, что наивысший порядок аппроксимации т-ша- гового метода Адамса равен m+l, а наивысший порядок аппрок- аппроксимации явного метода Адамса (Ь„=0) равен т. 3. Устойчивость и сходимость разностных методов. Оказыва- Оказывается, что методы наивысшего порядка аппроксимации практиче- практически непригодны для расчетов, так как они неустойчивы. Подробно вопросы устойчивости и сходимости разностных методов будут 233
рассмотрены в следующем параграфе, а сейчас ограничимся изло- изложением самых необходимых сведений. Рассмотрим наряду с B) однородное разностное уравнение aovn+alvn-i+...+amvn.m = O, n = m, m+l, ..., A2) и будем искать решения уравнения A2), имеющие вид vn = qn, где q—число, подлежащее определению. Тогда для нахождения q получаем уравнение a0qm+alqm-i+...+am-lq+am^O, О3) которое называется характеристическим уравнением разностного метода B). Говорят, что метод B) удовлетворяет условию корней, если все корни qu q2, . ¦., qm характеристического уравнения A3) лежат внутри или на границе единичного круга комплексной плоскости, причем на границе единичного круга нет кратных корней. Разно- Разностный метод B), удовлетворяющий условию корней, называют устойчивым методом. Существует определенное ограничение на порядок аппроксимации устойчивого метода. Приведем без дока- доказательства следующее утверждение. Пусть метод B) удовлетворяет условию корней и имеет поря- порядок аппроксимации р. Тогда p^Ztn+l при пг нечетном и p^Zm+2 при m четном. Для явных пг-шаговых устойчивых методов порядок аппроксимации не превосходит пг. В § 4 будет доказана следующая теорема о связи между устой- устойчивостью и сходимостью разностного метода B) (см. теорему 2 из§ 4). Пусть метод B) удовлетворяет условию корней и \fu(t, и) \^L при O^t^T. Тогда при тт;^п=пт^7\ п^ш и всех достаточно малых т выполнена оценка \Уп-и((п)\^М( max \yi-u(t,)\+ max Ц>*|), Г A4) где ^-погрешность аппроксимации, yj-u(tj), /=0, 1, ..., пг— 1 — погрешности в задании начальных условий и М — константа, зави- зависящая от L, Т и не зависящая от п. Из оценки A4) следует, что если начальные погрешности уй—u(tj), / = 0, 1, ..., пг—1, и погрешность аппроксимации %, k = = 0, 1, ..., п—пг, являются величинами О(тр), р>0, то и уп—u(tn) = О(тр) при п^т, т. е. метод сходится и имеет р-й поря- порядок точности. Таким образом, исследование сходимости метода B) сводится к анализу погрешности аппроксимации и проверке условия корней. Заметим, что методы Адамса и —и т всегда удовлетворяют условию корней, так как для них ао = —а1 = = 1,т. е. q=ql=\. 234
Простым примером метода, не удовлетворяющего условию кор- корней, является явный двухшаговый метод У п. + 4Уп -1 — 5Уп-2 2fn-i + fn-i 6т 3 имеющий третий порядок аппроксимации. 4. Примеры многошаговых разностных методов. Наивысший порядок аппроксимации явных m-шаговых методов Адамса Ул~Уп~1 = V*-i + bJM + ... + Ц-я A5) равен т. Согласно A1) условия т-го порядка аппроксимации имеют вид jj A^fc^-J-, /=1,2 т. A6) Решая систему A6), можно найти коэффициенты метода наивыс- наивысшего порядка A5), A6) при каждом конкретном т. Так, при ш=1 получаем метод Эйлера Уп-Уп-i __f — /л-1. X При т = 2, 3, 4, 5 получаем соответственно следующие методы m-го порядка аппроксимации: Уп — Уп-л. J,\ f „ Т = 1 B3/п-! - 16/л_2 + 5/ч_а), /я = 3, = 1 E5/*.i - 59/„_2 + 3 7/„_з - 9/я-О, m = 4, 24 т 24 ~У" = ^ A901 /„_! - 2774/„_2 + 2616/„_3 — Для неявных m-шаговых методов Адамса jn + bjn-t + ... + bmfn-m A7) Уп — Уп-i наивысший порядок аппроксимации равен т+\. Коэффициенты метода A7) наивысшего порядка находятся из системы A1) с р = = т+1. При т=1 получаем метод второго порядка аппроксима- аппроксимации Уп Уп-1 1 ,f . f о = - (/ п + fn-i), р = 2, 235
называемый методом трапеций. При т = 2, 3, 4 получаем соответ- соответственно следующие методы (т+1)-го порядка аппроксимации: п-, = _L E/„ + 8/v,-, - /п_2), р = 3, + 19/^ _ 5/„_2 + /„_3), р = 4, т 12 ~г ~ 24 ¦ = -I- B51 /„ + 646/^! - 264/„.2 + 1Об/»-, — 19/я-О, р = 5. х 720 Выписанные выше неявные методы содержат искомое значение нелинейно, поэтому для их реализации необходимо применять ите- итерационные методы. Например, для неявного метода Адамса четвер- четвертого порядка используется итерационный метод + 19/ (/«-!, Уп-г) — 5/ (*„_, уп~г) + f (k-., Уп-3)), A8) где s —номер итерации, s = 0, 1, ... В качестве начального значе- значения */„0) можно взять решение, полученно тода Адамса третьего порядка, т. е. метода ния */„0) можно взять решение, полученное с помощью явного ме- ме(о) _ L "' ^ A9) и-' — и Уп Уп-i т 12 Записывая A8) в виде получаем, что если :М, то итерационный метод сходится при условии —-—< 1, которое выполнено при достаточно малом т. 8 Если в A8) ограничиться только одной итерацией s = 0, то по- получим метод, называемый методом предиктор — корректор (пред- сказывающе-исправляющий). § 4. Сходимость и оценка погрешности многошагового разностного метода*) 1. Уравнение для погрешности. Для задачи Коши ^ и@)=ио A) *) При первом чтении этот параграф можно опустить. 236
рассмотрим /n-шаговый разностный метод .... . , ' — °о/ </«• JW "г Jn-u Уп-i) + ••• +bmf (tn-m, Уп-т), B) где n=m, m+1,..., заданы начальные значения y0, уи . .., ym-i. В настоящем параграфе выясняются условия, при которых схо- сходится метод B) и даются оценки погрешности zn = yn—u(tn) в лю- любой момент времени tn = nx, n^m, через начальные погрешности г0, zt zm-t и через погрешность аппроксимации. Получим уравнение, которому удовлетворяет погрешность г„ = =yn—u(tn). Подставляя в левую часть уравнения B) вместо у, выражения u{tj)+Zj, j = n, n—1,..., п—т, получим д1"д-1 + • ¦ ¦ + атия-т ¦ т -i, Уп-i) + ... +bmf (tn-m, Уп^т). Далее, добавим к правой части этого уравнения и вычтем из нее выражение bof{tn, Un)+Ul/(?«-l, «n-l)+... +bmf(tn-m, Ы„-т). Тогда уравнение для погрешности примет вид ¦ = ^n-m + фп-я, C) т rt = m, ffl+1,.... где через г|)„_т обозначена погрешность аппроксимации _ ао"„ + ai"n_L + • • ¦ + атип_т Ц>п-гп — Г + bj (tn, Un) + bj (tn-lt Un-l) + ... +bmf (tn-m, Un-m) D) и через ф„_т — функция ffn-m = Ьо (f (/„, у„) — / (tn, Un)) + ^ (/,(^_ь Угг-0 — / ((?„_!, Un-0) + . . . . . . + bmjf (tn-m, Уп-т) — f (tn-m, «*-*.))• E) Погрешность аппроксимации i]3n_m оценивалась в п. 2 § 3, где были найдены условия р-го порядка аппроксимации. В частности, при выполнении этих условий г|зп_т-»-0 при т-»-0. Функция ф„-т, входящая в правую часть уравнения C), зави- зависит нелинейно от погрешности zh j=n, n—1, ..., п—т. Вид нели- нелинейности определяется функцией f(t, и). В дальнейшем будем предполагать, что f(t, и) удовлетворяет условию Липшица по вто- второму аргументу, т. е. \f(t, ux)-f(t, иг)\^Ци-иг\ F) для всех t, uu и2 из рассматриваемой области. Тогда из E) следует, 237
что для функции ф„-т выполнена оценка |Ф„_т| <6L(|zn| + |г„_1|+...+ |гп_т+1| + |zB_m|), G) где й = тах(|Ь„|, \bt\, ..., \bm\). В дальнейшем будет получена оценка решения гп уравнения C) через гй, ги ..., zm-i и -ф_,, / = 0, 1, .... п—т, из которой будет сле- следовать сходимость метода B). Предварительно нам потребуются некоторые сведения из теории разностных уравнений. 2. Однородное разностное уравнение с постоянными коэффи- коэффициентами. Частные решения. Рассмотрим разностное уравнение al)vn+alvn-1+...+amvn-m = 0, n = m, m+\, ..., (8) коэффициенты которого а0, а„ ..., ат не зависят от п. Будем искать частные решения уравнения (8), имеющие вид и„ = <7", где q— число, подлежащее определению. Подставляя уп_„=<7п-\ k = 0, 1, ..., т, в (8) и сокращая на qn~m, получим урав- уравнение a,qm+aiqm-1+....+am-lq+am=Q, (9) которое называется характеристическим уравнением, соответству- соответствующим разностному уравнению (8). Многочлен F (q) = ао<7п+а,<Г-1+ ... +am-tq+am A0) называется характеристическим многочленом разностного уравне- уравнения (8). Таким образом, разностное уравнение (8) имеет решение qn тогда и только тогда, когда q является корнем характеристическо- характеристического уравнения A0). Более того, если корень q имеет кратность г^ ^1, то разностное уравнение (8) имеет частные решения vn = riqnt / = 0, 1,..., г-1. Докажем последнее утверждение. Подставляя и„-\=(п—k))qn-h в (8) и сокращая на qn~m, получаем уравнение т 2 ад""* (л-*)' = 0, (И) которое при /=0 совпадает с характеристическим уравнением (9). Представим многочлен m 2 ад-* («-*)' A2) в виде линейной комбинации характеристического многочлена A0) и его произ- производных Я') (q), i= 1, 2, ..., /—1. Для этого воспользуемся сначала разложением по формуле бинома Ньютона, / (я - k)' = [(я - т) + (т - k)]' = 2 с/ (« - тУ (т - *)'"'' /=о 238
где С1! = /(/'~1} •" (/ 1-^~ , С) = 1. Тогда получим 2 С|- (" - «>' f M *=0 где m FM (q) = 2 <* - *)М V*- / = 0, 1....,/. причем Fa(qM=F(q). Далее, обозначим z=m—k, fj-i(z)=z>-1 и запишем многочлен в виде т Интерполируем функцию fj-i(z) алгебраическим многочленом степени /—/ по узлам Zi = i, (=0, 1, ..., /'—I. В данном случае погрешность интерполяции тождественно равна нулю, так как fi-i(z) =z>~' — многочлен степени /—/. Поэтому согласно интерполяционной формуле Ньютона имеем /-' fj-i (?) = /M_(ZO) + 2 ft-l (Z0- 21- • • • - 2i) B — Z0) ¦ • ¦ (Z — Z,-^), 1=1 где fj-i(za, .... Zi) —разделенная разность (-го порядка функции z'~l, построен- построенная по узлам 2а=а, а=0, 1, .... L При /</ имеем ft-i(za)=z{~1 =0 и 1-1 fi-l & = 2 fl-t (г° г'» (г - г„) ... (z - 2CJ. Подставляя сюда г=т—k, получим при К\ 2 (г« Zi)(m-k)(m-k-\) ... (m-k-{i- 1)). <=i Итак. F,-l(qY= 2 a*^~* 2 ^./-/(«-*)(«-*-») ••• (m-ft-(t-l)), 4=0 i—1 /=0. 1, /—1. A5) где обозначено di, j-i=fj~i(zo, zu .... zt). С другой стороны, для производных F('^(q) многочлена A0) имеем 7)= (m-k)(m-k-\) ... (m-k-(i- \))akqm-k, A6) (=1, 2 m. Сопоставляя A5) и A6), получим i-i F,.t(q) = 2^./-^f<" (?)• l = 0' ' '- L (=1 239
Поэтому тождество A3) можно переписать в виде m /-1 /-/ 2 а* (я - kI qm-k = (я - т)' F (?) + 2 С/ (n - тI2 d^F^ (q) = = {п — т)' F(q)-{- 2 Я? (?) 2 Cidi.H (n ~ " Итак, получено следующее представление многочлена A2) в виде линейной комбинации характеристического многочлена F(q) и его производных: т j 2 akqm~k (n - k)' =(п-т)> F (q) + 2 ^W (?). A7) k=o i-i где Ь; = 2 ^j (n~m)ldii j_;, a di, j-i — разделенная разность функции z-»-', по- строенная по узлам zo=O, Zj = I Zi=A Если ? — корень кратности г характеристического уравнения (9), тс F(q) = =-0,..., F(r-1)(9) =0 и правая часть уравнения A7) обращается в нуль при /=1, /=2, ..., /=/¦—1. Следовательно, функции q, nqn, .... nr-xqn являются реше- решениями разностного уравнения (8). 3. Однородное разностное уравнение с постоянными коэффи- коэффициентами. Устойчивость по начальным данным. Задача Кошм для уравнения (8) состоит в отыскании сеточной функции vn, удовле- удовлетворяющей при всех п~^-т уравнению (8) и принимающей при п = = 0, 1, ..., т—1 заданные начальные значения у„, и, и™-!. В дальнейшем будем считать, что ааф0. Тогда уравнение (8) можно разрешить относительно vn: а0 а0 "п—1. Отсюда следует, что при а0Ф0 решение задачи Коши сущест- существует и единственно. Говорят, что уравнение (8) устойчиво по начальным данным, если существует постоянная М,, не зависящая от п и такая, что при любых начальных данных v0, vu ..., um_, для его решения вы- выполняется оценка lunl^yVfj max \vj\, n = m, m+1, ... A8) Тем самым устойчивость означает равномерную по п ограни- ограниченность решения задачи Коши. Оказывается, что устойчивость или неустойчивость уравнения (8) по начальным данным целиком определяется расположением корней характеристического уравнения (9). Будем говорить, что выполнено условие корней, если все корни <7i, ..., qm характеристического уравнения (9) лежат внутри или 240
на границе единичного круга комплексной плоскости, причем на границе единичного круга нет кратных корней. Справедлива Теорема 1. Условие корней необходимо и достаточно для устойчивости уравнения (8) по начальным данным. Доказательство. Докажем сначала необходимость. Пусть уравнение (8) имеет корень q, для которого |^|>1. Задавая в качестве начальных данных функции Vj=q\ / = 0, 1, .... m—1, по- получим решение vn = qn, n^m, неограниченно возрастающее при п-+оо. Для такого решения невозможна оценка вида A8) с кон- константой Ми не зависящей от п. Следовательно, условие |<?*|^1. k= 1, 2, ..., m, необходимо для устойчивости. Пусть уравнение (9) имеет корень q кратности г>\, для кото- которого \q\ = 1. Тогда разностное уравнение (8) имеет решение n'~lqn, растущее при гс->-оо как пт~\ и, следовательно, в этом случае оцен- оценка A8) также невозможна. Прежде чем переходить к доказательству достаточности усло- условий теоремы 1, необходимо провести некоторые вспомогательные построения. Запишем (8) в виде эквивалентной системы уравнений — Vn- и представим эту систему в векторной форме Vn=SVn-u n=m, где Vn= (vn-m+i, vn-m+2, • • •, vn)T, с . . A9) 0 0 0 On 1 0 0 a,n-i a0 0 1 0 °m-a a0 0 0 I L B0) Начальный вектор Vm-i= (v0, vu ..., vm-t)T задан. Нетрудно проверить, что множество собственных чисел матри- матрицы S совпадает с множеством корней характеристического уравне- уравнения (9). Лемма 1. Если выполнено условие корней, то существует норма |||-1|. вектора такая, что для подчиненной нормы матрицы S справедливо неравенство |]S||.^1. Доказательство. Заметим, что данная лемма уточняет лемму 1 из § 3 гл. 2, поэтому их доказательства похожи (см. [2, с. 338]). С помощью преобразования подобия 5 = QSQ-1 B1) 241
приведем S к модифицированной жордановой форме "•Si О Si 5 = О -где Sk — либо число, либо жорданова клетка К 8 О О як .<7„ —собственное число матрицы S, е>0 —любое число. Оценим норму \\S\\C= max = max Sit Здесь Sh совпадает с одним из корней характеристического уравнения, а внедиагональный элемент О в случае простого корня s,,-, е в случае кратного корня s«. Если s(i+i = 0 для некоторого i, то по условию леммы |s,i|^l. Если же Su+1 = e, то Sa — кратный корень, и согласно условию кор- корней выполняется строгое неравенство |5«|<С1. Но тогда при доста- достаточно малом е имеем Таким образом, выбирая е достаточно малым, получим ^1. Введем норму вектора \\yh=\\Qy\\v, B2) где Q определено согласно B1). Тогда получим ||S||, = ||S[|cs^l. .Лемма 1 доказана. Завершим теперь доказательство теоремы 1. Покажем, что ус- условие корней достаточно для устойчивости уравнения (8) по на- начальным данным. Из уравнения A9), учитывая лемму 1, получим неравенство и, следовательно, n=m, B3) По определению B2) нормы Ц-||. имеем 242
С другой стороны, для любой невырожденной матрицы Q спра- справедливо тождество из которого следует оценка Таким образом, если норма Ц-||. определена равенством B2), то выполняются оценки B4) Из B3) и B4) получаем \\VJc^M,\\Vm^\\c, B5) где iVf, = ||Q~1]|cllQ|lc. Заметим, что константа Мг не зависит от п. Из B5) следует неравенство KlsS.'Vf, max |u/|, B6) означающее устойчивость уравнения (8) по начальным данным. Теорема 1 полностью доказана. 4. Оценка решения неоднородного уравнения. Рассмотрим за- задачу Коши для неоднородного разностного уравнения n-m=Tgn-m, B7) где п = т, т+ 1 величины ув, уи .. ., f/m_j заданы, правая часть gk, k = 0, I,... — заданная функция. Если ааФ0, то для каждой пра- правой части решение задачи Коши существует и единственно. Оно мо- может быть найдено по рекуррентной формуле Уп г= Уп-т Уп—т+1 — • • • ~ Уп-i | < а0 а0 па аа B8) исходя из заданных начальных условий у0, уи ¦ • •. Ут-i и известной правой части qk. В предыдущем пункте получена оценка решения однородного уравнения через начальные данные, означающая устойчивость по начальным данным. Получим теперь аналогичную оценку решения неоднородного уравнения B7) через начальные данные и правую часть. Основным результатом здесь будет доказательство того, что если однородное уравнение (8) устойчиво по начальным данным, то для неоднородного уравнения B7) справедлива оценка max \y,\ + M2\ T\gk\, B9) где Mi и М2 не зависят от п. Выполнение оценки B9) означает по определению устойчивость уравнения B7) по правой части. Таким образом, будет показано, 243
что из устойчивости по начальным данным следует устойчивость по правой части. Представим уравнение B7) в векторном виде i, n = m, т+\, .... C0) где Гп= (yn-m+i, уп-т+1, ...,уп)Т, Gn^ = @,0, .... 0, ^-f. C1) матрица S определена согласно B0). Пусть уравнение (8) устойчиво по начальным данным. Тогда согласно теореме 1 выполнено условие корней. При этом условии в соответствии с леммой 1 для некоторой нормы матрицы 5 спра- справедливо неравенство ||S||.^1. Таким образом, из C0) получаем не- неравенства lirjHIVll llG»-!!!., k = m, m+ 1, ... Суммируя эти неравенства по k от m до п, получим k=m-i Используем далее неравенство B4), устанавливающее эквива- эквивалентность норм I! • ||, и II • Не. Тогда из C2) получим (I! <Г И'11! Уп к ^ I! Q к f|| Ут-, \\с + 2 т ИGk V k=m-i Учитывая специальный вид C1) вектора Gh, имеем II с?* Ik = —-—— , |оо| и,следовательно, S 4G*llc = -f 2т|^|- Отсюда и из C3) получаем требуемое неравенство 1 Уп\с^ Мг max \У1\ + М2 V т \gk\, C4) где Al1=||Q-1i!cllQllc, М2=/И^о1. Напомним, что Q — матрица, пре- преобразующая S согласно B1) к модифицированной жордановой форме. 5. Оценки погрешности разностного метода. Вернемся к урав- уравнению для погрешности C), полученному в п. 1. Нам нужно оце- оценить погрешность метода гп через погрешность аппроксимации г|)Л, k = 0, 1, ... , п—т. Если бы функция <рд равнялась нулю, k = 0, 1, ... 244
..., n—m, то достаточно было бы воспользоваться оценкой C4). Однако наличие функции фА, зависящей от решения z и характери- характеризующей нелинейность задачи, усложняет получение требуемых оце- оценок. Следуя [2, с. 484], докажем, что справедлива Теорема 2. Пусть все корни характеристического уравнения (9) лежат внутри или на границе единичного круга, причем на гра- границе нет кратных корней. Пусть \fu(t, и) |s^L для /е@, Т]. Тогда при {& C5) для решения уравнения C) справедлива оценка п—т \zn\^M^T max \z,-\ + M2 V!т|ф*|, п = т, т + 1, ..., C6) Доказательство. Согласно формуле конечных приращений Лагранжа имеем f(tn-k, yn-h)—f(tn-h, Un-k) =/n_s2n_A, где 1, й = 0, 1,2,..., m. Представим функцию фп_т, определенную согласно E), в виде т Ф„_т = &о/ог„ + 2 brfn-kZn-k. C7) Подставляя C7) в уравнение C), получим m (а0— 60?0т) г„= ^ (— а* + тЫи-ь) г„_* + т\|5„_т. C8) Из условия C5) следует, что L1 y C9) поэтому уравнение C8) можно разрешить относительно zn: 2п= |j Z^t^L^ + г-%- . D0) Добавляя к правой части уравнения D0) и вычитая из нее выра- выражение 245
перепишем D0) в виде 4=1 ° где D1) D2) Представим уравнение D1) в векторной форме. Для этого вве- введем векторы Yn-1=f0, .... 0, —^тт-f и матрицы 0 ... О 0 ... 0 пт ¦ • ¦ г 0 а0 0 п 1 °1 а0 _1 Тогда получим, что уравнение D1) эквивалентно векторному урав- уравнению Zn = SZll_1 + TVn_1Zn_1 + T4rn-1. D3) Для оценки решения уравнения D3) используем лемму 1 из п. 3. Согласно этой лемме, ||S||.^1 в некоторой норме ||-Ц.. Поэтому из D3) получим 1||.. D4) Покажем, что HVn-JI, ограничена числом, не зависящигл от п и т. Согласно C9), D2) имеем | а0 11 Ьк\ + | ak | | Ьо | Vnk\<2- \ао\ -L, k = \,2, т. поэтому где Для любого вектора х имеем \bo\). D5) 246
где MiHIQIIcllQ-'llc. Следовательно, ||V.-1||.s?Afl||l',l_l| Подставляя эту оценку в D4), приходим к неравенству .II., D6) где k — m, т+ 1, ..., c, = MluL. Из D6) получим |2„|.^A +TC1)n-m|Zffl_1I. + т 2 ll^-i|.^ 2 ||^-i|., D7) k—m где tn-m=x(n—m)^ Далее, учитывая B4), C9), имеем 1c)1|Zn||c -X 1. ^ |i Q ||c 1Z^ ||c = || Q lie max 12/1, I a0 — т&0/0 | | aa | Подставляя эти неравенства в D7) и обозначая M1=||Q||CX о X||Q"'lic, ^2=^!-—- , получим оценку lal max совпадающую с C6). Теорема 2 доказана. Следствие. ?сли О^ит^Г, выполнено условие корней, |2,|->-0 при т-»-0, /=0, 1, ..., т—1, и разностное уравнение B) аппроксимирует исходное уравнение A), то решение разностной за- задачи B) сходится при т-vO к решению исходной задачи A). Доказательство следует немедленно из оценки C6), если учесть, что п—m V |фХТ max |фА|. § 5. Численное интегрирование жестких систем обыкновенных дифференциальных уравнений 1. Условно устойчивые и абсолютно устойчивые разностные ме- методы. Для задачи Коши ^ = f(t,u), t>0, u(Q) = uQ A) 247
будем рассматривать разностные методы вида т т 2 -^- Уп-k = 2 Ы (tn-k, Уп-k), п = т, т+1, ... B) В § 4 показано, что устойчивость и сходимость метода определя- определяются расположением корней характеристического уравнения 2 ад"г-* = о. C) ?=0 А именно, требуется, чтобы все корни удовлетворяли условию | q\ ^ =^1, причем корни q, для которых |^| = 1, не должны быть крат- кратными. Эти условия устойчивости являются очень общими и не могут учесть многие характерные свойства решений исходной дифферен- дифференциальной задачи A) и аппроксимирующего ее разностного метода B). Они означают лишь, что все решения однородного разностно- разностного уравнения, соответствующего B), остаются ограниченными при п-»-оо. В частности, при таком подходе коэффициенты bh, k = 0, I, . .. , m, входящие в правую часть уравнения B), никак не влияют на устой- устойчивость. Предположим, однако, что заранее известна та или иная харак- характерная особенность в поведении решения исходной дифференциаль- дифференциальной задачи. Тогда естественно требовать, чтобы эта особенность со- сохранялась и у решения разностного уравнения. Такое требование приведет к сужению класса допустимых разностных методов. В на- настоящем параграфе будут рассмотрены методы, предназначенные для расчета асимптотически устойчивых решений уравнения A). Рассмотрим сначала характерный пример. Уравнение ~ = U, />0, u@)=u0, D> at где Х<0, имеет решение u(t)=uoe'->, монотонно убывающее при /—»-оо. При любых т>0 для решения это- этого уравнения справедливо неравенство )К|ы@|, E) означающее устойчивость решения u(t). Естественно требовать, чтобы и для решения разностной задачи, аппроксимирующей D), выполнялось бы неравенство, аналогичное E). Рассмотрим с этой точки зрения метод Эйлера уу=цпг п = 0,1, ... F) -с Из уравнения F) получаем уп+1 248
Оценка вида E), i. e. неравенство |j/»+iK|2/»|, n=l, 2, ... G) для метода (Ь) будет выполнено тогда и только тогда, когда |^|^ ^1. В случае Я<0 это условие эквивалентно следующему ограни- ограничению на шаг т.: Таким образом, разностный метод F) устойчив в смысле выпол- выполнения оценки G), если шаг т удовлетворяет неравенству (8). Разностный метод B) называется абсолютно устойчивым, если он устойчив при любых т>0, и условно устойчивым, если он устой- устойчив при некоторых ограничениях на шаг т. Мы видели, что метод Эйлера F) условно устойчив при условии (8). Примером абсолютно устойчивого метода для уравнения D) с Я<0 является неявный ме- метод Эйлера для которого \q\ = | A—тЛ)~'| <1 при любых т>0. Приведенные здесь простые примеры характерны тем, что и для более общих асимптотически устойчивых систем дифференциаль- дифференциальных уравнений явные разностные методы являются условно устой- устойчивыми, а среди неявных методов существуют абсолютно устойчи- устойчивые методы. Условная устойчивость является недостатком явного метода, так как вынуждает брать слишком мелкий шаг т. Например, если % = = —200, то условие (8) выполнено при т^0,01, и для того чтобы вычислить решение «(/) при t= 1, надо сделать сто шагов по методу Эйлера. Неявный метод лишен этого недостатка, однако его приме- применение к задаче A) приводит к необходимости решения на каждом шаге системы алгебраических уравнений, в общем случае нелиней- нелинейной. 2. Понятие жесткой системы дифференциальных уравнений. Многие из рассмотренных в § 1—4 численных методов интегрирова- интегрирования обыкновенных дифференциальных уравнений переносятся без изменений на системы дифференциальных уравнений. Однако в случае численного решения систем уравнений могут появиться до- дополнительные трудности, связанные с разномасштабностью процес- процессов, описываемых данной системой. Поясним характер возникающих трудностей на примере систе- системы, состоящей из двух независимых уравнений ^ ^ 2u2 = 0, f>0, (9) + alUl 0, + g2u2 0, >0, dt dt где а± и аг — положительные постоянные. Система (9) имеет решение Ul (t) = «j @) е-""', и2 (/) = м2 @) е-<4 249
монотонно убывающее с ростом t. Предположим, что а2 гораздо больше, чем аи Тогда компонента u2(t) затухает гораздо быстрее, чем uy(t), и, начиная с некоторого t, поведение решения u(t) = = {ul(t), u2(t)} почти полностью определяется компонентой ut(t). Однако оказывается, что при решении системы (9) разностным ме- методом шаг интегрирования т определяется, как правило, компонен- компонентой и2 (t), не существенной с точки зрения поведения решения си- системы. Например, метод Эйлера f-fllUi« = 0, —? i- + flaU; = o, (Ю) где и!\ =Ui(tn), t=l, 2, будет устойчив, если шаг т. удовлетворяет одновременно двум неравенствам ха^2, та2^2. Поскольку а2» ^а(>0, условие устойчивости приводит к ограничению т==^2/я2- Приведенный пример может показаться искусственным, так как ясно, что каждое из уравнений системы (9) следует решать незави- независимо одно от другого со своим шагом интегрирования т, /=1, 2, Ti^2/ab т2^2/а2. Однако аналогичные трудности возникают и при решении любой системы обыкновенных дифференциальных урав- уравнений %-М, (II) если матрица этой системы имеет большой разброс собственных чи- чисел. Предположим, например, что матрицу А системы A1) можно привести пре- преобразованием подобия Q~'AQ к диагональному виду. Тогда замена u = Qv пре- преобразует систему A1) в систему независимых уравнений dv — = Q-MQo, at матрица которой имеет те же собственные числа, что и матрица А. Сформулируем теперь определение жесткой системы уравнений. Рассмотрим сначала систему A1) с постоянной, т. е. не зависящей от t матрицей А. Система дифференциальных уравнений A1) с по- постоянной матрицей А(тХт) называется жесткой, если 1) Re >„„<(), k=l,2,...,m (т. е. система асимптотически устойчива по Ляпунову), 2) отношение max | Re Xk \ min [ Re велико. Число s называется числом жесткости системы A1). Второе тре- требование не указывает границу для s, начиная с которой система ста- становится жесткой. 250
Если матрица А зависит от t, то }.k='Xk(t), k—l, 2, ..., т. При каждом t можно определить число жесткости max | ReXk (I) \ s (t) = ~ . min |ReXA(OI В этом случае свойство жесткости может зависеть от длины отрез- отрезка интегрирования. Система •называется жесткой на интервале @, Г), если ReXk(t) <0, k=\, 2,. . . , m, для всех /е @, Т) и число sup s (t) велико. ter w.) Так же, как и в случае системы A0), нетрудно прийти к следую- следующему выводу. Решение жесткой системы содержит как быстро убы- убывающие, так и медленно убывающие составляющие. Начиная с не- некоторого ^>0 решение системы почти полностью определяется мед- медленно убывающей составляющей. Однако при использовании яв- явных разностных методов быстро убывающая составляющая отрица- отрицательно влияет на устойчивость, что вынуждает брать шаг интегри- интегрирования т слишком мелким. Выход из этой парадоксальной ситуации был найден в примене- применении неявных абсолютно устойчивых разностных методов. Например, систему A0) можно решать с помощью неявного метода Эйлера который устойчив при всех т>0. Поэтому шаг интегрирования т здесь можно выбирать, руководствуясь лишь соображениями точ- точности, а не устойчивости. 3. Нелинейные системы дифференциальных уравнений. Обоб- Обобщим понятие жесткости на случай нелинейной системы % = f{t,u), />0, A2) где U@ = (Ui(/), ««@, ••¦> ««(Of. f(t,u)=(f1(t,U),fi (t.ll), ...,f,n(t,u)f. Зафиксируем какое-либо решение v(t) системы A2) и образуем разность z(t)=u(t)—v(t) между произвольным решением системы A2) и данным решением v{t). Эта разность удовлетворяет следую- следующей системе уравнений: — = fk(t,v{t) + 2(t)) — fk(t,v(t)), ft = l,2, ...,m. A3) dt 251
Будем рассматривать z(t) как малое возмущение, внесенное в основное решение v(t). Проведем разложение по формуле Тейлора в правой части си- системы A3). Так как имеем где через o(|z|) обозначены величины более высокого, чем первый, порядка малости по г. В результате разложения система A3) при- примет вид ^=A{t,v(t))z{t) + o{\z\), A4) где через A (t, v (t)) = -HjJLLIL обозначена матрица с элементами ди д}; (/, v и)) ац (t,v(f)) = ll\ , i, j= 1, 2, ..., т. ди, Отбрасывая в A4) величины о(|г|), получим так называемую си- систему уравнений первого приближения A(t,v(>))w(t). A5) Система A5) является системой линейных дифференциальных уравнений относительно w(t), так как функция v(t) задана. Определение жесткости системы нелинейных дифференциаль- дифференциальных уравнений связано как с данным фиксированным решением v(t), так и с длиной отрезка интегрирования. Пусть Xh(t), k=\, 2, ..., т,— собственные числа матрицы A (t, )). Число жесткости s(t) определяется как max I Re ),k (t) | s (Л = г<**т min | Re Xk(t)\ Система A2) называется жесткой на решении v(t) и на данном интервале 0<t<T, если 1) ReA*(f)<0, k=\,2,...,m, для всех fe(O, 7), 2) число s.ip s(t) велико. <7) 4. Специальные определения устойчивости. При исследовании разностных методов для жестких систем уравнений обычно рассма- рассматривают уравнение ^ Ы, A6) dl 252
где X — произвольное комплексное число. Свойства различных раз- разностных методов изучают и сопоставляют на примере модельного- уравнения A6). Для того чтобы уравнение A6) действительно мо- моделировало исходную систему A1), необходимо рассматривать его при всех таких X, которые являются собственными числами матри- матрицы А. Разностный метод B), примененный к уравнению A6), имеет вид 2 {o-k — \*,bk) yn-k = 0, n = m, tn + 1, ..., A7) *=o где р, = т1 — комплексный параметр. Если искать решения уравнения A7), имеющие вид yn = qn, то для q получим характеристическое уравнение т 2 (ак - \ibt) qm-k = 0, A8) отличающееся от уравнения C) тем, что его коэффициенты зависят от параметра \1 = т\. При малых ц корни уравнений C) и A8) близ- близки. Однако в дальнейшем мы не будем делать предположений отно- относительно малости ц. Кроме обычного определения устойчивости разностного метода (все корни характеристического уравнения A8) не превосходят по модулю единицу), в случае жестких систем используют и другие, более узкие определения устойчивости. Здесь мы рассмотрим два таких определения: Л-устойчийый метод и Л (а)-устойчивый метод. Предварительно введем следующее понятие. Областью устойчи- устойчивости разностного метода B) называется множество всех точек комплексной плоскости |х = тЛ, для которых данный метод, приме- примененный к уравнению A6), является устойчивым. Рассмотрим, например, явный метод Эйлера — =f(tn, Уп). т В применении к уравнению A6) этот метод принимает вид Условие устойчивости | l + fi| <:1 для комплексного |л=[хо + '(-11 озна- означает, что (|ло+1J+ (xj ^ 1. Тем самым область устойчивости дан- данного метода представляет собой круг единичного радиуса с центром в точке (—1, 0). Для неявного метода Эйлера Упг\ —Уп _f(f .. \ т областью устойчивости является внешность круга единичного ра- радиуса с центром в точке A, 0). 253
Разностный метод называется А-устойчивым, если область его устойчивости содержит левую полуплоскость Re |а,<0. Отметим, что уравнение A6) асимптотически устойчиво ири ReX<0. Поэтому сущность приведенного определения состоит в том, что Л-устойчи- вый разностный метод является абсолютно устойчивым (устойчи- (устойчивым при любых т>0), если устойчиво решение исходного диффе- дифференциального уравнения. Нетрудно видеть, что неявный метод Эйлера является Л-устой- чпвым, а явный метод Эйлера — не является. Рассмотрим еще одношаговый метод второго порядка точности y^Z± , «/„„) + /(/„, Уп)). A9) Для уравнения A6) метод принимает вид yn+i ЯУп, q . 1 — 0,5ц Отсюда видно, что \q\ ^ 1 тогда и только тогда, когда Re (i^O. Сле- Следовательно, метод A9) является Л-устойчивым. При решении жестких систем уравнений было бы желательно пользоваться именно Л-устойчивыми разностными методами, так как условия их устойчивости не накладывают ограничений на шаг т. Оказывается, однако, что класс Л-устойчивых методов весьма узок. В частности, среди методов вида B) не существует явных А-устойчивых методов. Для доказательства запишем характеристическое уравнение A8) в виде Если B) —явный m-шаговый метод, то Ь0 = 0, ааф0. Могут ока- оказаться равными нулю и другие коэффициенты Ьк, но не все, так как по условию bo + frj-K ¦ - + bm=l (см. C) из §3). Пусть ba = bi = ... . . . = bj-i = 0, ЬфЪ, 0</s^m. Тогда из B0) получим aogm + д^'*-1 +...+«,„ Отсюда видно, что ири больших q функция \i(q) ведет себя как t Следовательно, для любого достаточно большого по модулю чис- числа \х (в том числе и для ц, лежащих в левой полуплоскости) най- найдется корень q уравнения A8) с \q\^\. Доказано (см. [37] и указанную там литературу), что среди не- неявных линейных многошаговых методов нет А-устойчивых методов, имеющих порядок точности выше второго. Примером Л-устойчиво- сти метода второго порядка точности является симметричная схе- схема A9). 254
В связи с этим было введено еще несколько определений устой- устойчивости, которые являются менее ограничительными, чем определе- определение Л-устойчивости. Разностный метод называется А (а)-устойчивым, если область его устойчивости содержит угол | arg (—ц) \<а, ц = тХ В частности, А (— j-устойчивость совпадает с Л-устойчивостью. Доказано, что ни для какого а не существует явного А (^-устой- (^-устойчивого линейного многошагового метода. Построены Л (а)-устойчи- (а)-устойчивые неявные методы третьего и четвертого порядка точности. К ним относятся, в частности, чисто неявные многошаговые разностные схемы, у которых правая часть /(/, и) вычисляется только при t = = /„, а производная u'(t) аппроксимируется в точке tn по несколь- нескольким предыдущим точкам. Например, схема 12т B1) имеет четвертый порядок точности и Л (а)-устойчива при некотором а>0. 5. Чисто неявные разностные методы. В настоящее время при интегрировании жестких систем уравнений широко используется метод Гира [37], в основу которого положены чисто неявные много- многошаговые разностные методы высокого порядка точности. Разностный метод 2^ = 1/^?») B2) называется чисто неявным. Он является частным случаем метода B), когда bi = b2 = .. . = bm = 0, bo=h Для отыскания уп получаем из B2) нелинейное уравнение /п а0Уп — х/ (tn, Уп) = — ^ akyn-k, B3) А=1 которое можно решать тем или иным итерационным методом. Условия р-го порядка аппроксимации (9), A0) из § 3 в случае метода B2) принимают вид mm m ao = -^ak, ^ kak = -l, ^ klak = 0, 1 = 2,3, ...,p. B4) Отсюда видно, что наивысший достижимый порядок аппроксима- аппроксимации чисто неявного /n-шагового метода равен т. Упомянутый выше метод Гира использует чисто неявные схемы наивысшего поряд- порядка аппроксимации. Система уравнений B4) для определения 255
коэффициентов аи .. ., ат метода наивысшего порядка имеет вид а4 + 2а2 + . . . + тап= —1, al + 22a2-\-. . . + т2ат = а„, B5) Эта система однозначно разрешима, так как ее определитель отли- отличен от нуля. При /л=1 метод B3), B5) совпадает с неявным методом Эйле- Эйлера. При т = 2 и т = 3 получаем методы !"«/« — 2уп-1 + у Уп-i = т/ (*„, </„), B6) ^Уп — Ъуп-i. + ~ Уп-2 — y «/я-з = т/ (/„, г/„), B7) имеющие, соответственно, второй и третий порядок точности. При т=4 из B3), B5) получим схему B1). Для практических расчетов используются аналогичные методы вплоть до десятого порядка точ- точности. Важно отметить, что чисто неявные разностные методы обла- обладают хорошими свойствами устойчивости, позволяющими исполь- использовать их для решения жестких систем уравнений. Рассмотрим более подробно метод второго порядка B6) и най- найдем область его устойчивости. Для модельного уравнения D) ме- метод B6) принимает вид jyn — 2yn-i + - г/я-2 = руя, B8) где ц = гК. Ему соответствует характеристическое уравнение 2-2<7 +j = 0. B9) Нам нужно найти множество точек G комплексной плоскости p, = |i,,+i(Xi, для которых оба корня 91|2(fi) уравнения B9) не пре- превосходят по модулю единицу. Границей области G является множе- множество таких точек \i, для которых \q\ = 1. Выразим из уравнения B9) параметр jx через переменное q, т. е. запишем A = |_2<Г1+1 C0) Отсюда видно, что если \q\ = 1, т. е. q = e~i<f, то При изменении аргумента ср от 0 до 2я точка ц описывает замк- замкнутую кривую Г, симметричную относительно действительной оси 25G
(см. рис. 7). Для точек \i(q), расположенных снаружи от этой кри- кривой, выполнено условие |д|<1, поэтому область устойчивости G метода B8) представляет собой внешность кривой Г. Точки, рас- расположенные внутри Г, составляют область неустойчивости. Обозна- Обозначая x=cos cp, можно переписать C1) в виде ц=A—*J±tyi—*2B—*), откуда следует, что вся кривая Г расположена в правой полу- полуплоскости. Поэтому область устойчи- устойчивости метода B6) целиком содержит левую полуплоскость и тем самым ме- метод B6) является Л-устойчивым. Исследуем аналогичным образом область устойчивости метода четверто- четвертого порядка B1). Записывая характеристическое уравнение в виде ?#о =± B5 — 2—16<Г3+3<Г4) Рис. 7. Граница устойчивости метода B6) и полагая <7=е~'ф, находим уравнение границы, разделяющей об- области устойчивости и неустойчивости: 9 ]/' I у2 fJ. — — \l — X) \oX -\- 1J zt I (ил — 1 Ол -\- [OX — o), о 3 где л; = созф (см. рис. 8). В отличие от предыдущего примера, име- имеются точки границы, расположенные в левой полуплоскости. По- Поэтому метод B1) не является Л-устойчивым. Найдем теперь значение а, при котором метод B1) Л(а)- устойчив. Для этого достаточно найти угол а, который образует касательная ^ (см. рис. 8), про- проходящая через точку @, 0), с отрицательным направлением оси jj.o. Обозначим Рис. 8. Граница устойчивости мето- метода B1) C2) .^.(б*8— 16х2+1 Ъх—8). Условие касания y с границей определяется следующим уравнени- уравнением относительно параметра х: 9 А. А. Самарский, А. В. Гулин 257
Из C2) получим li'0(x) = 8x(l-xf, C4) ', , — 8л:4 + 16*3 — 4л:2 — 8л: + 5 ^^= VT=7* * Уравнение C3) после подстановки в него выражений для ц.о, И-oi Hi, l^i из C2), C4) и приведения подобных членов сводится к линейному уравнению х—0,2 = 0. При jc = 0,2 из C2) получим ____?_ _ /24 ¦ 699 Цо'~ 3-5* ' lh~ 3-5* ' так что |х |х0 512 Поэтому метод B1) А (а) -устойчив, где cc = arctg уб~68°. В заключение отметим, что подробное изложение численных ме- методов решения жестких систем дифференциальных уравнений со- содержится в книгах [26, 37].
ЧАСТЬ III РАЗНОСТНЫЕ МЕТОДЫ РЕШЕНИЯ ЗАДАЧ МАТЕМАТИЧЕСКОЙ ФИЗИКИ Здесь излагаются приближенные методы решения краевых за- задач для уравнений с частными производными. В основе этих мето- методов лежит сведение дифференциальной задачи к системе линейных алгебраических уравнений путем замены дифференциального опе- оператора разностным. ГЛАВА 1 ВВОДНЫЕ ПОНЯТИЯ § 1. Примеры разностных аппроксимаций Различные способы приближенной замены одномерных диффе- дифференциальных уравнений разностными изучались в § 4 ч. I. Напом- Напомним примеры разностных аппроксимаций и введем необходимые обозначения. Будем рассматривать равномерную сетку с шагом h, т. е. множество точек ah = {Xi = ih, i = 0, ±l, ±2, . ..}. Пусть и(х)—достаточно гладкая функция, заданная на отрезке [лг,_!, х{+1]. Обозначим «,= «(*<), uxj= —— -, и- =— ^ , h *• h И о = ¦¦¦¦ . Разностные отношения uxi, и- ., и о называются соответственно правой, левой и центральной разностными производными функции и(х) в точке Xi. Каждое из этих разностных отношений аппроксими- аппроксимирует и'(х) в точке xit т. е. при фиксированном х{ и при ft-vO (тем са- самым при г->оо) пределом этих отношений является и'(х{). Проводя разложение по формуле Тейлора, получим ux.i — и' (xi) = 0,5hu" (Xi) + О (/i2), и-. - и' (xt) = - 0,5hu" (xi) + О (ft2), «с,- u'(Xi) = Отсюда видно, что левая и правая разностные производные ап- аппроксимируют и (х) с первым порядком по h, а центральная раз- 9* 259
ностная производная — со вторым порядком. Нетрудно показать, что вторая разностная производная Uxx.i ' аппроксимирует и" {xt) со вторым порядком по h, причем справед- справедливо разложение Рассмотрим дифференциальное выражение Lu=±(k(x)f) A) dx \ dx ) с переменным коэффициентом k(x). Заменим выражение A) раз- разностным отношением Lhu = (au-)x.t = | (aUl u^~Uc _ щ "i~"'~1'j , B) x h \ h h I где a = a{x) —функция, определенная на сетке шЛ. Найдем условия, которым должна удовлетворять функция а{х) для того, чтобы от- отношение (au-)j-i аппроксимировало (ku')' в точке xt со вторым по- порядком по h. Подставляя в B) разложения ux,i =Щ + — и" + —- и- + О (h3), 2 о где u/ = u'(xt), получим u'i H — u'i -\ — — u"t + О (h2). 2 e v h 2 6 С другой стороны, т. е. C) 6 Отсюда видно, что LKu—Lu = O(h2), если выполнены условия h 2 ~ Условия (З) называются достаточными условиями второго по- порядка аппроксимации. При их выводе предполагалось, что функция и(х) имеет непрерывную четвертую производную и k(x) —диффе- 260
ренцируемая функция. Нетрудно показать, что условиям C) удо- удовлетворяют, например, следующие функции: Заметим, что если положить ai—k(xi), то получим только пер- первый порядок аппроксимации. В § 2 будет рассмотрен регулярный метод получения разностных аппроксимаций вида B). В качестве следующего примера рассмотрим разностную ап- аппроксимацию оператора Лапласа Lu = ~гт + -гг • D) Введем на плоскости (xlt хг) пря- прямоугольную сетку с шагом /i4 по на- направлению Xi и с шагом h% по направ- направлению х2, т. е. множество точек «й = {(*!, х'2) | х[ = ihu xi = jh2; I, j = 0, ±1,±2, ...} (см. рис. 9), и обозначим _ Mi+i./-4v +ui-uf Х21 4- в 6 ' A i с 9 ? с 1 i : , а: 1Л.Ч Рис. 9. Сетка <вл и пятиточеч- пятиточечный шаблон ние Из предыдущих рассуждений следует, что разностное выраже- LkUij=u- u + u- .. E) аппроксимирует дифференциальное выражение D) со вторым по- порядком, т. е. LhUij— Lu (x[, x{) = О (hi) + О (hi). Более того, для функ- функций u(xit x2), обладающих непрерывными шестыми производными, справедливо разложение д*и(х[,х{) + О (hi + hi). Разностное выражение E) называется пятиточечным разност- разностным оператором Лапласа, так как оно содержит значения функции и(хи х2) в пяти точках сетки, а именно в точках (х[, х{), (х^1, х'2), (х[, xi±l) (см. рис. 9). Указанное множество точек называется шаб- шаблоном разностного оператора. Возможны разностные аппроксима- аппроксимации оператора Лапласа и на шаблонах, содержащих большее число точек. 261
§ 2. Построение разностных схем интегро-интерполяционным методом 1. Построение разностной схемы. Задачи математической фи- физики формулируются в виде основного дифференциального уравне- уравнения и дополнительных (начальных, граничных) условий, обеспечи- обеспечивающих существование и единственность решения. Типичными при- примерами являются: задача Дирихле для уравнения Лапласа, задача Коши и смешанные задачи для уравнений параболического и гипер- гиперболического типов. Под разностной схемой понимают совокупность разностных уравнений, аппроксимирующих основное уравнение и дополнительные условия исходной дифференциальной задачи. Су- Существуют различные способы построения разностных схем. В этом параграфе будет рассмотрен один из способов, носящий название интегро-интерполяционного метода (или метода баланса) построе- построения разностных схем. В качестве примера рассмотрим применение интегро-интерполя- интегро-интерполяционного метода к построению разностной схемы следующей крае- краевой задачи для обыкновенного дифференциального уравнения вто- второго порядка: (k(x)u'(x))'-q(x)u(x)+f(x)=O, 0<х<1, A) @)=ц1, u(/)=ji8, B) где k(x), q(x), f(x) —заданные достаточно гладкие функции, удо- удовлетворяющие условиям k(x)^k.>0, q(x)^0, и Р^гО, ц,и \х,г — за- заданные числа. При сформулированных предположениях существует и единственно решение и(х) задачи A), B). Будем считать, что это решение является достаточно гладким. Уравнение A) можно трактовать как уравнение установившего- установившегося распределения температуры и(х) в стержне длины /, на одном конце которого (х = 1) поддерживается заданная температура ц2, а на другом (х = 0) происходит теплообмен с окружающей средой по закону Ньютона (см. [41]). При этом k(x)—коэффициент тепло- теплопроводности, —k(x)u'(x) — тепловой поток, коэффициенты q(x), f(x) характеризуют плотность тепловых источников. Для построения разностной схемы введем прежде всего на от- отрезке [0, /] равномерную сетку с шагом h, т. е. множество точек ah={Xi = ih, i = 0, \,...,N,hN = l). Обозначим xi±in = Xi±Q,bh, w(x) =k(x)u'(x), w{±l/2 = w(xi±l/1) и проинтегрируем уравнение A) на отрезке [х{-1/2, xi+U2]. Тогда по- получим уравнение *i+V, *'"+% ^ q(x)u(x)dx-\- |" f(x)dx = 0, C) которое представляет собой уравнение баланса тепла на отрезке 262
U,_)/2, xf+l/2]. Далее, заменим интеграл j q(x)u(x)dx Xt-V, Xi+V, его приближенным значением щ I q{x)dx и введем обозначения *?-•/, Ч-У, В результате вместо уравнения C) получим уравнение - № + ф; = . ( Выразим теперь wi±l/2 через значения функции и(х) в точках сетки. Для этого проинтегрируем соотношение и'(х) =w(x)jk(x) на отрез- отрезке [л:;_1, х{]. Тогда получим *i х i dx k(x) «1-1 *»-! Обозначая Hi I -ш) ¦ щ и1 — и»-1 получим гг){_1/2» а,- = щи- ., и'1+1/2 = а<+1ыа:<. Подставляя эти выражения в уравнение E), получим разност- разностное уравнение, содержащее значения искомой функции в точках хи -?¦ (ai+1uXti — a.u-.) — djUf + ф,- = О или в сокращенной записи (аи-)Хшс — diUL + Фг = 0. G) Это уравнение по своему построению является разностным ана- аналогом основного дифференциального уравнения A). Записывая уравнение G) во всех точках сетки, в которых оно определено, т. е. при /= 1, 2,..., N—1, получим систему из N—1 линейных алгебраи- алгебраических уравнений относительно N+ 1 неизвестных и0, и,, ..., uN. Два недостающих уравнения получаются путем аппроксимации гранич- граничных условий B). Одним из этих уравнений является условие uN= 263
= |а2, а второе может быть получено интегро-интериоляционным ме- методом. Для этого проинтегрируем основное уравнение A) на отрез ке [О, *.А], где >;,(, = 0,5*: wy,—w0— J q(x)u(x)dx+ j f(x)dx = 0. (8) о о Полагая, как и ранее, т{-1П^аси-., получим при i=\, что wux = = aiu-1. Выражение для w0 следует из граничного условия при х — = 0: wo= —jij + puo. Наконец, полагая *У, Х'Л ^ q (х) и (х) dx^u0^ q (x) dx, о о получим из тождества (8) разностное уравнение alU-xl - pu0 + ii, - и0 j q(x)dx+ J / (х) dx = 0. (9) о о Обозначая xv, перепишем уравнение (9) в виде Из этой записи видно, что полученное уравнение является разност- разностным аналогом граничного условия —k @) и' @) + $и @) = ji,. В дальнейшем решение разностной задачи в отличие от реше- решения дифференциальной задачи будем обозначать буквой у, так что yi = y(Xi), х;емл. Объединяя все уравнения G), (9), получаем сле- следующую разностную схему для задачи A), B): (ay^xj — diVji + ер,- = 0, i = 1, 2, . . . , N — 1, y При анализе разностной схемы A0), как впрочем и любой дру- другой разностной схемы, возникают следующие вопросы: а) существо- существование и единственность решения системы линейных алгебраических уравнений A0); б) каким методом надо отыскивать это решение; в) какое отношение имеет система разностных уравнений A0) к ис- исходной задаче A), B), иначе говоря, переходит ли разностное урав- уравнение A0) в уравнение A), если шаг сетки h стремится к нулю? Это вопрос об аппроксимации дифференциальной задачи A), B) разностной схемой A0); г) сходится ли решение у{х) разностной задачи к решению и(х) дифференциальной задачи при /i->-0? На первые два вопроса можно ответить немедленно. Разностная задача A0) является типичным примером задачи, которая решает- 264
ся методом прогонки, изложенным в п. 7 § 4 ч. I. Систему уравнений A0) можно записать в виде {+1 = —F{, i = 1, 2, .. . , N— 1, Уо = Hi. #w = где Из условий й(>0, p^O, cfi^O следует, что С.-^^+В.-Х), т. е. вы- выполнены условия устойчивости прогонки. Поэтому разностная зада- задача A0) однозначно разрешима и ее можно решать методом прогон- прогонки по формулам D4) — D6) из § 4 ч. 1. Вопросы аппроксимации и сходимости обсуждаются в следую- следующем параграфе. § 3. Исследование аппроксимации и сходимости 1. Аппроксимация дифференциального уравнения. В § 2 рассма- рассматривалась краевая задача (k(x)u'(x))'-q(x)u(x)+f(x)=O, 0<х<1, A) Ц., и@=И«, B) для которой интегро-интерполяционным методом была построена разностная схема Иг)*,( — dtyi + ч>{ = 0, i = 1, 2, ... , N — 1, C) где -^ dx (x) E) *>¦-¦/, p = p + 0,5Ad0, О.5/г i=l,2 N-l, F) + 0,5Лф0, 0,5/1 Обозначим через Lu(x) левую часть уравнения A) и через Lhy{ — левую часть уравнения C), т. е. 1и (х) = (k (х) и')' — q(x)u (х) + / (х), Lhtfi = (ayjx,i — &ф + <р,. 265
Пусть v(x) —достаточно гладкая функция и v(xt) —ее значение в точке Х{ сетки (ak={xt = ih, i = 0, 1,...,N, hN = l). G) Говорят, что разностный оператор Lh аппроксимирует дифферен- дифференциальный оператор L в точке х = хи если разность Lhv{—Lv(xt) стре- стремится к нулю при h-^Q. В этом случае говорят также, что разност- разностное уравнение C) аппроксимирует дифференциальное уравнение A). Чтобы установить наличие аппроксимации, достаточно разло- разложить по формуле Тейлора в точке х = х{ значения vi±i = v(Xi±h), входящие в разностное выражение Lhvt. Большая часть этой работы проделана в § 1, где показано, что при условиях ^^ ^±^ (8) выполняется соотношение Если кроме того, докажем, что 4 = <7(л:,) + О(/г2), <р4 = /(*,)+О(Л*), (9) то тем самым будет установлено, что оператор Lh аппроксимирует L со вторым порядком по п, т. е. Lkv{-Lv(x{)=O(h}), i=l,2,...,N-\. A0) Итак, доказательство второго порядка аппроксимации сводится к проверке условий (8), (9) для коэффициентов E), F). Проверим сначала выполнение условий (8). Обозначая p(x)=k~l(x), получим "С at h .} r w r " 12 следовательно, Л 12 p?_% ' ч ' " 12 P? Аналогично Отсюда получим h h т. е. условия (8) выполнены. Условия (9) выполнены в силу того, 266
что замена интегралов F) значениями qu /,• соответствует прибли- приближенному вычислению этих интегралов по формуле прямоугольни- прямоугольников с узлом в середине отрезка интегрирования. 2. Аппроксимация граничного условия. Исследуем погрешность аппроксимации разностного граничного условия D). Обозначим lhv{0) = —а^^о+^о- Если v(x) — произвольная достаточно глад- гладкая функция, то очевидно lhv(Q) = — т. е. имеет место аппроксимация первого порядка по h. Однако если v = u(x)—решение задачи A), B), то разностное граничное усло- условие D) имеет второй порядок аппроксимации, т. е. - flau,.o + Р«о - ?i = - k @) и' @) + ры @) — ^ + О Докажем последнее утверждение. Используя разложения получим щих.о = w% + О (/i2) == w0 + O,5hw'o + О (/i2) = = k @) u' @) + 0,5/i (Ли')' @) + О (h2). Отсюда имеем lhu @) = - k @) и' @) — 0,5ft (ku'Y @) + pu0 — ^ + О (/г2) = = [- Л @) и' @) + (to @) -ЦЛ+0.5А [- (to')' @) + rfo«o-9o] + О (/i2) Учитывая граничное условие B), получаем lhu@)=Q,5h[-(ku')'(Q)+dau0-4>a]+O(h2). Выражение, стоящее в квадратных скобках, преобразуем, учиты- учитывая уравнение A),к виду au0—Фо=— (ku')'@)+q@)u@)— f@) + Из соотношений получаем /*и @) = — ^^.о + {Ц, - й = О (/г2), что и требовалось доказать. Таким образом, при достаточной гладкости коэффициентов k(x), Q(x), f(x) и решения и(х) разностная схема A0) аппроксимирует исходную задачу B) со вторым порядком по h. 267
При практическом использовании разностной схемы для нахож- нахождения ее коэффициентов не обязательно вычислять интегралы D), F) точно. Можно воспользоваться коэффициентами, полученными путем замены этих интегралов квадратурными формулами, имею- имеющими точность О (/г2) и выше. Например, в результате применения формулы прямоугольников получим следующие коэффициенты: а{ = = k{x{—0,5/i), ^ = д{х{), (pt = f(Xi). Применяя формулу трапеций, получим „ _ 2*&-1 , _ ft-Ц + frf/, rn _ ft-<A + fiM Представление коэффициентов разностной схемы в виде интегра- интегралов D), F) оказывается полезным при исследовании сходимости в случае разрывных функций k(x), q{x), {(х) (см. [32]). 3. Уравнение для погрешности. Решение у1—у(х{) разностной задачи C), D) зависит от шага h сетки, y{Xi)=yh(Xi). По сущест- существу, мы имеем семейство решений {*/&(*¦)}. зависящее от параметра h. Говорят, что решение yh(x) разностной задачи сходится к реше- решению и(х) исходной дифференциальной задачи, если при /i->0 по- погрешность уь(Х{)—и(х{), i = 0, 1, ... , N, стремится к нулю в некото- некоторой норме. В настоящем параграфе в качестве такой нормы будем брать норму в сеточном пространстве С(шЛ), т. е. положим \\yk — «|L = max \yh{xt)—u(xt)\. Говорят, что разностная схема h ^iS(Oh имеет m-й порядок точности (или сходится с порядком т), если где пг>0, М>0 — константы, не зависящие от h. Выше было установлено, что схема C), D) имеет второй поря- порядок аппроксимации. Докажем теперь, что эта схема имеет и второй порядок точности. Для этого прежде всего выпишем уравнение, ко- которому удовлетворяет погрешность ?; = //*—u(xt). Подставим yt = = г{—и(х{) в уравнения C), D). Тогда получим уравнения {az-)x,i - dat = — if,-, i = 1, 2, ... , N - 1, A1) — a12XiO + pzo = v11 2Л'=0, A2) где обозначено i|)f = — (au-)Xii + diUi + ф(, \\ = а^хд — (k0 + ^х. Функция i]);, входящая в правую часть уравнения A1), называ- называется погрешностью аппроксимации дифференциального уравнения A) разностным уравнением C) на решении задачи A), B). В п. 1 было показано, что ^ = О(п2) при /i-M), i= 1,2,..., iV—1. Аналогич- Аналогично, величина v, является по определению погрешностью аппрокси- аппроксимации краевого условия B) разностным краевым условием D) на решении задачи A), B), причем Vi=O(/i2). Таким образом, струк- структура уравнений для погрешности A1), A2) та же, что и у разност- разностной схемы C), D), отличаются только правые части. 268
Чтобы доказать сходимость разностной схемы, оценим решение задачи A1), A2) через правые части г|),-, vb т. е. получим неравенст- неравенство вида КН + К!) A3) с константой Ми не зависящей от /г. Из этого неравенства и будет следовать, что ||z||C(ffl/i) = О(/г2). Отметим, что неравенства вида A3), называемые априорными оценками, нашли широкое применение в теории разностных схем. Поскольку структура уравнений для погрешности A1), A2) та же, что и у разностной схемы C), D), а отличаются только правые части, то оценка A3) выполняется одновременно с аналогичной оценкой для разностной схемы C), D) при (я2=0. Последняя оценка выра- выражает устойчивость решения разностной задачи по правым частям ф и (Г,. 4. Разностные тождества и неравенства. Для того чтобы дока- доказать неравенство A3), нам потребуются некоторые разностные тож- тождества и неравенства. Будем рассматривать сеточные функции, за- заданные на сетке G). Обозначим г/;=г/(х<), х^ак, yxi= (i/i+i—yi)lh, N-\ N у-*л = (yi—yi-i)ih, (y.v) — 2 y<Vih> &•y]= 2yg)th- Справедливо следующее разностное тождество: {у, vx) = — (v,y-] + yNvN — yavx. A4) Действительно, (У, vx) N-x — 2yo 1=1 N-l Vx.ih = 2 У1 (y<+i i=l 1 /V . — Wi) = 2 ^'-iy 1=2 N '(A — 2 ^'У' + У = -2*0 ЛЛ-1 i— 2 1=1 'Н — У i- что и требовалось доказать. Тождество A4) называется формулой суммирования по частям. Подставляя в A4) вместо v выражение az- и вместо у функцию z, получаем первую разностную формулу Грина (г, (аг-)х) = — (а, (г-J] + aNz-NzN — ajZxjiz0. A5) N Здесь (а, (г^J]= 2 a'B;,iJ/:- B частности, если zN=0 (как в !=i 269
задаче A1), A2)), то получим {г, (аг-)*) = — (a, z§] — fliz*.ozo. Обозначим и докажем, что для любой сеточной функции zu удовлетворяющей условию zN = Q, справедливо неравенство Для доказательства воспользуемся тождеством N N _ _ /=(+1 ' /W+1 и применим неравенство Коши — Буняковского /=1+1 Тогда получим откуда сразу следует неравенство A7). 5. Доказательство сходимости. Возвращаясь к доказательству сходимости схемы C), D), получим тождество, которому удовле- удовлетворяет погрешность г{ = у{—и{х{). Для этого умножим уравнение A1) на hZi и просуммируем по i от 1 до N—1. Тогда получим Отсюда, применяя разностную формулу Грина A6), получим (a, z\] + a^,020 -f (d, z2) = (ф, z). Далее, согласно A2) имеем следовательно, справедливо тол<дество (a, z|] + Ы + (d, г2) = (ф, 2) + vlZ,. A8) Из этого тождества и будет сейчас выведено требуемое неравенство вида A3). Заметим прежде всего, что если 270
то коэффициенты разностной схемы C), D) удовлетворяют нера- неравенствам A5гО, diSzQ. A9) Это утверждение сразу следует из явного представления коэффици- коэффициентов E), F). Воспользовавшись A9), оценим слагаемые, входящие в левую часть тождества A8), следующим образом: 1=1 1=1 pzo2>O, (d,z2)^0. Тогда придем к неравенству С11г;]|а^|(ф,2)|4-к||г0|. B0) Оценим сверху правую часть этого неравенства. Будем иметь Подставляя эту оценку в B0) и учитывая неравенство A7), полу- получим т. е. Окончательно Поскольку 1Ф||С(Ш , =O(h2), |Vl|=O(/i2), из неравенства B1) следует, что погрешность z,- = r/;—и(х{) также является величиной O(h2) при ft-^-О. Итак, справедливо следующее утверждение. Пусть k(x) —непрерывно дифференцируемая и q(x), f(x) —не- —непрерывные функции при х^[0,1], решение и(х) задачи A), B) об- обладает непрерывными четвертыми производными. Пусть коэффици- коэффициенты разностной схемы C), D) удовлетворяют условиям (8), (9), A9). Тогда решение разностной задачи C), D) сходится при h-yQ к решению исходной дифференциальной задачи A), B) со вторым 271
порядком по h, так что выполняется оценка где М — постоянная, не зависящая от h. Замечания. 1. Из доказательства видно, что конкретный вид коэффици- коэффициентов E), F) не влияет на справедливость высказанного утверждения, важно лишь выполнение условий (8), (9), A9). 2. Можно ослабить требования на глад- гладкость коэффициентов k(x), q(x), f{x) и решения и(х), однако при этом априор- априорные оценки вида B1) становятся бесполезными, так как норма ]| ija lc(M/i) может и не стремиться к нулю. Доказательство сходимости в классе разрывных коэф- коэффициентов и в случае неравномерных сеток, основанное на оценках погрешности Ух—u(xi) через слабые нормы погрешности аппроксимации \|)i, например нормы вида ||i|)||= 2j 4=1 , можно найти в [32]. § 4. Разностные схемы для уравнения теплопроводности 1. Исходная задача. Будем рассматривать следующую первую краевую задачу для уравнения теплопроводности с постоянными коэффициентами. В области {0<*<1, 0<^Г} требуется найти ре- решение уравнения удовлетворяющее начальному условию и(х, О)=ио{х) B) и граничным условиям u{o,t)=M*), ыA,0=1*»@- О) Здесь ио(х), \ii(t), n2(t)—заданные функции. Известно (см. 141]), что при определенных предположениях гладкости решение задачи A) — C) существует и единственно. В дальнейшем при ис- исследовании аппроксимации разностных схем будем предполагать, что решение и(х, t) обладает необходимым по ходу изложения чис- числом производных по х и по t. Решение задачи A) — C) удовлетво- удовлетворяет принципу максимума и тем самым непрерывно зависит от на- начальных и граничных данных. 2. Явная схема. Как всегда, для построения разностной схемы надо прежде всего ввести сетку в области изменения независимых переменных и задать шаблон, т. е. множество точек сетки, участ- участвующих в аппроксимации дифференциального выражения. Введем сетку по переменному х такую же, как и в § 3, т. е. и сетку по переменному t с шагом т, которую обозначим (ox = {tn = nx, n = 0, l,...,K, /Ст = Г}. 272
Точки (хи tn),i = 0, \, ... , N,n = Q, 1, ... , К, образуют узлы прост- пространственно-временной сетки соЛг = соЛХсот (см. рис. 10). Узлы (xit 1/ = 0},/1={х = 0, in), принадлежащие отрезкам /(,= ^.Т), /2={л;=1, O^tsiiT}, называются граничными узлами сетки (оЛТ) а осталь- остальные узлы — внутренними. На рис. 10 гра- граничные узлы обозначены крестиками, а внутренние — кружочками. Слоем называется множество всех уз- узлов сетки <oA|t, имеющих одну и ту же временную координату. Так, п-и слоем называется множество узлов (Xq, tn) , (Xlt ln) , . . . , \XN, tny. Для функции у (х, t), определенной на сетке @л,т, введем обозначения у^= = у(хь tn), ... уГ-у? ... 4„- Рис. 10. Пространственно- временная сетка сан, % D) т ' "хх-1 Л2 Иногда для упрощения записи индексы i и п будем опускать, обо- обозначая у,= У"мУ-хх-=У-ххЛ. (xhtn) a lxhtn) (x (xL,tn) Рис. П. Шаблоны разностных схем: а — явная схема; б — чисто неявная схема; в — симметричная схема; г—трехслойная схема Чтобы аппроксимировать уравнение (I) в точке (х;, /п), введем шаблон, изображенный на рис. П, а и состоящий из четырех узлов (xi±u tn), (xt, tn), (xit tn+l). Производную ди/dt заменим в точке (xit tn) разностным отношением y't.i, а производную дги\дхг —- второй разностной производной у\х {. Правую часть f(x, t) заменим при- 273
ближенно сеточной функцией cp"t в качестве ф? можно взять одно из следующих выражений: f(Xt,tn),j j f(X,tn)dX,-±- j dt j f{X,t)dx. *i-y, In *?-¦/, В результате получим разностное уравнение С1-у? y?+1 ft2 + ф", E) которое аппроксимирует исходное дифференциальное уравнение в точке (xt, tn) с первым порядком по т и вторым порядком по h при условии, что разность ф;"—f(x{, tn) имеет тот же порядок малости. Под разностной схемой понимается совокупность разностных уравнений, аппроксимирующих основное дифференциальное урав- уравнение во всех внутренних узлах сетки и дополнительные (началь- (начальные и граничные) условия — в граничных узлах сетки. Разностную схему по аналогии с дифференциальной задачей будем называть также разностной задачей. В данном случае разностная схема име- имеет вид +фГ, т h2 i=l, 2, ..., N— 1, п = 0, 1, ..., К— 1, hN=l, Kx = T, F) i? = M*«), 4& = М'П). « = 0,1,2, ..../С, y1 = uo(Xi), i = 0, \ N. Эта схема представляет собой систему линейных алгебраиче- алгебраических уравнений с числом уравнений, равным числу неизвестных. Находить решение такой системы следует по слоям. Решение на ну- нулевом слое задано начальными условиямиyi =ua(x{), t = 0, 1 N. Если решение у?, i = 0, 1, ... , N, на слое п уже найдено, то реше- решение у?+г на слое п+ 1 находится по явной формуле уГ1 = у! + т(у^[ + ^, »=1,2 ЛЛ— 1. G) а значения у1?Х = |ях (tn+1), ylNrX = \x2{tn+i) доопределяются из гранич- граничных условий. По этой причине схема F) называется явной разност- разностной схемой. Несколько позже мы познакомимся и с неявными схе- схемами, в которых для нахождения уТ1 при заданных у1 требуется решать систему уравнений. Погрешность разностной схемы F) определяется как разность •2i" = yi"—"(*., tn) между решением задачи F) и решением исход- исходной задачи A) — C). Подставляя в F) yi =Zin + u(xit tn), получим 274
уравнение для погрешности т А2 1=1,2 . .,Л/—1, /г = 0, 1, ... ,/С— 1, WV=1, /Ст=7, (8) где ф? = — u!t,i + ы^ ? + ф" — погрешность аппроксимации раз- разностной схемы F) на решении задачи A) — C), \|з" = О(т+/г2). Можно оценить решение г" уравнения (8) через правую часть \|з? и доказать тем самым сходимость разностной схемы F) с первым порядком по т и вторым — по h. Однако это исследование мы отло- отложим до § 3 гл. 3, а сейчас на примере схемы F) продемонстрируем один распространенный прием исследования разностных схем с по- постоянными коэффициентами, называемый методом гармоник. Хотя данный метод не является достаточно обоснованным, в частности не учитывает влияния граничных условий и правых частей, он по- позволяет легко найти необходимые условия устойчивости и сходимо- сходимости разностных схем. Покажем, например, что явную схему F) можно применять лишь при условии x^0,5/i2, означающем, что шаг по времени надо брать достаточно малым. Рассмотрим уравнение — yJ_=Ihl иЛ—у±2_ f (9) т. е. однородное уравнение, соответствующее E). Будем искать частные решения уравнения (9), имеющие вид yi (cp) = gV''1*, A0) где I — мнимая единица, ф — любое действительное число и q — чис- число, подлежащее определению. Подставляя A0) в уравнение (9) и сокращая на еи'щ, получим х А2 откуда найдем <7=l-4Vsin»*SL, 7 = -^-- (И) Начальные условия у) (<р) =eijl"t, соответствующие решениям вида A0) (их называют гармониками), ограничены. Если для не- некоторого ф множитель q станет по модулю больше единицы, то ре- решение вида A0) будет неограниченно возрастать при п-^оо. В этом случае разностное уравнение (9) называется неустойчивым, поскольку нарушается непрерывная зависимость его решения от начальных условий. Если же \q\ ^ 1 для всех действительных ф, то 275
все решения вида A0) ограничены при любом п и разностное урав- уравнение (9) называется устойчивым. В случае неустойчивости найти решение разностной задачи F) по формулам G) практически не- невозможно, так как погрешности (например погрешности округле- округления), внесенные в начальный момент времени, будут неограничен- неограниченно возрастать при увеличении п. Такие разностные схемы называ- называются неустойчивыми. Для уравнения (9) неравенство |<7|=^1 выполняется согласно A1) при всех ф тогда и только тогда, когда ^^0,5. Таким образом, использование схемы F) возможно лишь при выполнении условия т^0,5/г2. Разностные схемы, устойчивые лишь при некотором огра- ограничении на отношение шагов по пространству и по времени, назы- называются условно устойчивыми. Следовательно, схема F) условно устойчива, причем условие устойчивости имеет вид t//i2^0,5. Ус- Условно устойчивые схемы для уравнений параболического типа ис- используются редко, так как они накладывают слишком сильное ограничение на шаг по времени. Действительно, пусть, например, h=\0~2. Тогда шаг т не должен превосходить 0,5-10~\ и для того чтобы вычислить решение у1} при t=l, надо взять число шагов по времени я=т'1^2-104, т. е. провести не менее 2-Ю4 вычислений по формулам G). В следующем пункте будет показано, что многие неявные схемы лишены этого недостатка и являются устойчивыми при любых шагах ft и т. Такие схемы называются абсолютно ус- устойчивыми. 3. Неявные схемы. Чисто неявной разностной схемой для урав- уравнения теплопроводности (схемой с опережением) называется раз- разностная схема, использующая шаблон (*,-, tn), (xi±l,tn+l), (xutn+l) (см. рис. 11, б) и имеющая вид i=l,2,...,N-l, и=0, 1...../C-1, уТ = fii (Am), уТ = (х2 (*„«), п = 0, 1 ,...,*— 1, У°с=ио(хс), 1 = 0, 1 N. Здесь ц>" =f(Xi,tn+i)-\-O(r + h2). Схема имеет первый порядок аппроксимации по т и второй — по h. Решение системы A2) нахо- находится, как и в случае явной схемы, по слоям, начиная с п—\. Одна- Однако теперь, в отличие от явной схемы, для нахождения уТ1 по известным у1 требуется решить систему уравнений Vyul-(l+2y)yr + yy?! = -Fl 1 = 1,2 N-l, где i=t//i2, Fi = yl 4- тер?. Эту систему можно решать методом прогонки (см. п. 7 § 4 ч. I), так как условия устойчивости прогонки выполнены. 276
Для исследования устойчивости разностной схемы A2) будем искать частные решения уравнения у?1-у1} i_ . т А2 имеющие вид A0). Тогда получим следовательно, [<7|=^1 ПРИ любых <р, т, h. Таким образом, схема A2) абсолютно устойчива, т. е. устойчива при любых шагах т и п. Абсолютная устойчивость является основным преимуществом не- неявных схем. Теперь уже не надо брать шаг т слишком малым, можно взять, например, т=/г=10~2. Величина шагов сетки т, h определяется теперь необходимой точностью расчета, а не сообра- соображениями устойчивости. Шеститочечной симметричной схемой называется разностная схема для которой начальные и граничные условия задаются так же, как и в схеме A2). Эта схема использует шеститочечный шаблон, изо- изображенный на рис. 11, в. Предлагаем читателю самостоятельно доказать, что эта схема имеет второй порядок аппроксимации как по h, так и по т (если только ф" =f(xit tn + 0,5x)-\-O(x2-\-h2)), она абсолютно устойчива и ее можно решать методом прогонки. Обобщением трех рассмотренных схем является однопарамет- рическое семейство схем с весами. Зададим произвольный дейст- действительный параметр о и определим разностную схему ,Л+1 .А 1<ч?: + о A5) i=\,2,...,N-\, я=0, 1 /С—1, УТ1 = Hi (W. У™ = 1*2 (tn«), п = 0, 1, .. ., К - 1, У1 = ио(Х1), i = 0, I, .... N. При а=0 получим отсюда явную схему, при о=1 — чисто неяв- неявную схему и при о=0,5 — симметричную схему A4). Исследуем погрешность аппроксимации схемы A5) на решении исходной за- задачи A) — C). Представим решение задачи A5) в виде у1' = =u(Xi.tn)-\- г1}, где u(xutn) —точное решение дифференциальной задачи A) — C). Тогда для погрешности получим систему 277
уравнений i=l,2 Л/-1, я=0, 1...../С-1, zj«=z««=O, я = 0, 1, ..., К—1, z° = 0, t = 0, 1, .... #. Сеточная функция ф", входящая в правую часть уравнения A6) и равная tf=<Z + о -ст) «&.< - «?.< + <*• A7> называется погрешностью аппроксимации схемы A5) на решении задачи A) — C). Получим первые члены разложения функции г|з" по степеням h и т. Будем разлагать все функции, входящие в вы- выражение для \|)?, по формуле Тейлора в точке (хи /п+0,5т). Учитывая разложения w"; =u(xi,tn+in)-\-O{x'1), u-x t = и" (xt)-\- + 5J uIV (*,)+О (Л4), где и" = д2и/дх\ u=du/dt, tn+in=tn+0,5x, по- получим ф? = а (и" (Xi, /n+1) + ~ ulv (xi, /n+1)j + A - a) /u" (xt, tn) + + ^ u>v (xt-, Qj - и (л;,, /n+V4) + ф» + О (т2) + О (/i4). Отсюда, проводя разложение в точке (xt, tn+U2) и обозначая и== = и(хи tn+in), будем иметь и, перегруппировывая слагаемые, получим, что if? = (и" — и + Ф?) + (а — 0,5) то" + — uIV + О (т2 + h4). Учитывая уравнение A) u"—u=—f и следствие из него uIV—u" ——]", окончательно можем записать, что Ч>? = [(<т - 0,5) х + ^1] и" + ф" - / {Xi, tn+y,) - -?/"(*, *»+*) +О(т» + А«). Из формулы A8) можно сделать следующие выводы. Если то схема A5) имеет второй порядок аппроксимации по т и четвер- четвертый — по h. Такая схема называется схемой повышенного порядка 278
аппроксимации. Если а = 0,5, <р» = / (xt, tn+Vl) + О (т2 + /га), то схема A5) имеет второй порядок аппроксимации по т. и по Л. При остальных значениях о и при q>" =f(xu tn+i) + O(i + h2) схема A5) имеет первый порядок аппроксимации по т и второй — по h. Опуская выкладки, отметим, что если искать решение уравне- уравнения A5) с <р" = 0 в виде A0), то получим 1 _47A -a) sin2 -f q= Яш 1 + iya sin2 -f- и | q | ^ 1 при всех ср, если а^- —— . A9) 2 4т V ' Отсюда видно, в частности, что все схемы с о^0,5 абсолютно устойчивы. Схема повышенного порядка аппроксимации (а=а.) также абсолютно устойчива, что проверяется непосредственно. При офО разностная схема A5) является неявной схемой. Для нахождения решения г/у+1 по заданным у1} требуется решать си- систему уравнений - A + Эо^уГ1 + oyytl = - Fi, i = 1, 2 N - 1, B0) где V Гч/1 П I / * \ tl I It У = -гг • ff =^ + A — «т) тг/-^ . + тф,. Система B0) решается методом прогонки. Условия устойчивости прогонки (условия D7), D8) из § 4 ч. I) при афО сводятся к не- неравенству и выполнены при а^ —1/D^). Последнее неравенство следует из условия устойчивости A9) разностной схемы. 4. Уравнения с переменными коэффициентами и нелинейные уравнения. Рассмотрим первую краевую задачу для уравнения теплопроводности с переменными коэффициентами ^(k(xt)dA+f(x,t), 0<*<l, 0<*<7\B1) at ах \ ох) и(х,0) = и,(х), и@,0 = МО. «A,0=^@, где р(х, t), k(x,t), f(x,t) —достаточно гладкие функции, удовлет- удовлетворяющие условиям p(x, 0>с3>0. B2)
Дифференциальное выражение Lu=—\k(x,t)—\ при каждом JJ X \ OX J фиксированном / аппроксимируем в точке (хи t) так же, как и в стационарном случае (см. § 1), разностным отношением Л @ tji = (a (х;, t)y-)x,i = ^p ^4B3) где разностный коэффициент теплопроводности a(xitt) должен удовлетворять условиям второго порядка аппроксимации a (xl+u t) + a (xlt t) = 2k (xlt t) + О (/г2), Наиболее употребительны следующие выражения для a(xitt): а (хи 0 = 0,5 (k (xt, t)+k (Xi-U /)), a (x{, t) = k [xc - | ,\t k (xc_v t) + k (xt, i) Разностная схема с весами для задачи B1) имеет вид B4) У% = Иг (in), У\ = «о fa). Здесь в качестве t можно взять любое значение te[f», tn+t], например t=tnJr0,5r. Если в уравнении B4) t=tn-\-0,5т, о=0,5, то схема B4) имеет второй порядок аппроксимации по т и по h. При остальных значениях ant выполняется первый порядок аппрокси- аппроксимации по т и второй — по /г. При исследовании устойчивости разностных схем с переменны- переменными коэффициентами иногда применяется принцип замороженных коэффициентов, сводящий задачу к уравнению с постоянными коэф- коэффициентами. Рассмотрим явную схему, соответствующую уравне- уравнению B4) с а = 0 и f(xit t) =0, т. е. схему р (xlt t) У( ~Ус = (а {хи 0 yl)XJ. B5) Предположим, что коэффициенты р(хи t), a(xu t)—постоян- t)—постоянные, р(х;, O=p=const, а(х{,1) =a=const Тогда уравнение B5) можно записать в виде 280
или Из п. 2 известно, что последнее уравнение устойчиво при т' т. е. при -™<-*1. B6) Р 2 Принцип замороженных коэффициентов утверждает, что схема B5) устойчива, если условие B6) выполнено при всех допустимых значениях а(хи t), p(xt, t), т. е. если при всех х, t выполнены нера- неравенства ^UlJL . B7) 2 Р (х,, 0 2 Если известно, что 0<ici^Za(xi, t)^c2, p(xu ^)^=c3>0, то неравен- неравенство B7( будет выполнено при Строгое обоснование устойчивости схемы B5) будет дано в при- примере 2 из § 4 гл. 2. Если параметр о^0,5, то из принципа замороженных коэффи- коэффициентов следует абсолютная устойчивость схемы B4). Рассмотрим теперь первую краевую задачу для нелинейного уравнения теплопроводности В случае нелинейных уравнений, когда заранее неизвестны пре- пределы изменения функции k(u), избегают пользоваться явными схе- схемами. Чисто неявная схема, линейная относительно y1+t, i=l,2,... . . . , Лг— 1, имеет вид Liiflf y' t У- +/(yg), B9) где af= 0,5 (fe (t/") +й(г/Г-О). Эта схема абсолютно устойчива, имеет первый порядок аппроксимации по г и второй — по /г. Решение ifi+1, г=1, 2,. . . , N— 1, находится методом прогонки. Заметим, что схему B9) можно записать в виде где ki=k{yf). 281
Часто используется нелинейная схема ^=j [а ад)^^—а (уг1) h C0) Для реализации этой схемы необходимо применить тот или иной итерационный метод. Например такой: (s+l) я / (s+i) (s+i) (s+i) u\ ?ЦJLl^fj^zh*> /'1)/(^'), CD s = 0, I, .... Л1— 1, {# ^ Здесь s —номер итерации. Как видим, нелинейные коэффициенты берутся с предыдущей итерации, а в качестве начального прибли- приближения для г/"+1 выбирается у?. Это начальное приближение тем лучше, чем меньше шаг т. Число итераций М задается из сообра- соображений точности. В задачах с гладкими коэффициентами при &(ы)^с,>0 часто бывает достаточно провести две — три итерации. Значения #{s+1) на новой итерации находятся из системы C1) ме- методом прогонки. При М=\ итерационный метод C1) совпадает с разностной схемой B9). Для приближенного решения нелинейного уравнения B8) при- применяются также схемы предиктор — корректор второго порядка точности, аналогичные методу Рунге — Кутта для обыкновенных дифференциальных уравнений (см. п. 2 § 1 гл. 6 ч. II). Здесь пере- переход со слоя п на слой п+\ осуществляется в два этапа. Приведем пример такой схемы. На первом этапе решается неявная линейная система уравнений 0 5т (п<уЪ?%.с С'7' =Hi ('«+ °>5т). УТА = (*2 {tn + 0,5т), из которой находятся промежуточные значения </"+1/«, j'=0, I,... ... ,N. Затем на втором этапе используется симметричная шести- шеститочечная схема для уравнения B8), в которой нелинейные коэф- коэффициенты а(у), f(y) вычисляются при г/ = У"+1/', т. е. схема - = f i(a (уГ%) /=1,2, .... N-1, 282
§ 5. Трехслойные разностные схемы 1. Разностные схемы для уравнения колебаний. Рассмотрим первую краевую задачу для уравнения колебаний -^-=^-, o<,<i, о<«т, A) и@,0 = Ц.@, u(U) = M0, 0^<7\ B) u(xt0) = uo(x), -|-(х,О) = йо(*), 0<х<1. C) Известно (см., например, [41]), что эта задача поставлена кор- корректно, т. е. ее решение существует, оно единственно и непрерывно зависит от начальных и граничных данных. Будем использовать ту же сетку иЛт, что и в § 4, т. е. «Лт = = С0ЛХ<01, ан = {Х1==Ш, i = 0,l, ..., N,hN=\}, <вх = {/я = пт, п = 0, 1, .... К, Кх=Т}. Очевидно, минимальный шаблон, на котором можно аппрокси- аппроксимировать уравнение A), это пятиточечный шаблон, изображенный па рис 11, г. Таким образом, в отличие от схем для уравнения теп- теплопроводности, в которых использовалось только два временных слоя (слои п и л+1). здесь требуется использовать три слоя: п—\, п, и+1. Такие схемы называются трехслойными. Их применение предполагает, что при нахождении значений у"+г на верхнем слое значения на предыдущих слоях f/", г/"; i=Q,l,...,N хранятся в памяти ЭВМ. Видимо, простейшей разностной аппроксимацией уравнения A) и граничных условий B) является следующая система уравнений: i=l,2,...,iV-l, /г=1,2, ...,/С-1, У"о+1 = Hi (<««). УХ1 = ^ (*«Л п = 0, 1, . . ., К - 1. E) Разностное уравнение D) имеет второй порядок погрешности аппроксимации по т и по h. Решение #?+1 выражается явным об- образом через значения на предыдущих слоях: #« = 2у1 - #-i + у (#+1 - Щ + yl), i=l,2 ЛЛ—1, T=t2//i2, п=1, 2 /С—1. F) Для начала счета по формулам F) должны быть заданы зна- значения у°, У\, i=0,l,...,N—l,N. Из первого начального условия C) сразу получаем у° = ио(хс), i=l,2, .... JV—1. G) 283
Простейшая замена второго из начальных условий C) уравне- уравнением (у] — г/?)/т=йо(хО имеет лишь первый порядок аппроксима- аппроксимации по т. Поскольку уравнение B) аппроксимирует основное урав- уравнение A) со вторым порядком, желательно, чтобы и разностное начальное условие также имело второй порядок аппроксимации. Чтобы добиться этого, воспользуемся разложением и (х, т)—и (х, 0) _ ди (х, 0) . т_ д2и (х, 0) . q . 2, т dt 2 dt2 K и учтем, что в силу дифференциального уравнения A) выполняет- выполняется равенство дЧ (х, 0) = дм (х, 0) _ . (х) dt2 дх* ° Таким образом, ди(х.О) = u(x,t)~u(x,0)т_и. (х) + Q (т2) dt x 2 и, следовательно, разностное уравнение t = l,2 N-\, (8) аппроксимирует второе из условий C) со вторым порядком по х и по h. Совокупность уравнений D), E), G), (8) составляет разност- разностную схему, аппроксимирующую исходную задачу A) — C). Покажем еще один способ получения уравнения (8). Уравнение у]-у:1 - = «о (*,¦), ViX = V (*;. - т) (9) аппроксимирует уравнение u't @, х)=ио(х) со вторым порядком. Чтобы найти значения yl' запишем уравнение D) при л = 0: yj-W + sfT1 0 y и учтем, что yi =Uo(xt). Отсюда получим yj1 =—у) -f- 2u0 (xt) — х2и - .. Подставляя это выражение для у1 в уравнение (9), приходим к уравнению (8), Для исследования устойчивости будем так же, как и в § 4, ис- искать решение уравнения D) в виде yn = q*e>ih(t. A0) Подставляя это выражение в D) и сокращая на ем, получим для q квадратное уравнение 9*-2(l-2Ysin*^-),7+l=0, ?=¦?-. (И) 284
Будем считать разностное уравнение D) устойчивым, если оба корня уравнения A1) не превосходят по модулю единицу. Пусть ql и qi— корни этого уравнения. Если оба корня действительные, то поскольку qiqi=\, найдется ср, для которого один из корней меньше единицы по модулю, а второй — больше единицы. Если же корни комплексно сопряженные, то |^,| = |^2| = 1. Таким образом, разностное уравнение D) устойчиво, если при всех действительных Ф выполняется неравенство A—2vsin2—) ^1, т. е. ysin2-^-^ ^1. Последнее неравенство выполняется при всех ср, если A2) Строгое обоснование устойчивости схемы D) будет дано в § 3 гл. 4. 2. Трехслойные схемы для уравнения теплопроводности. Хотя трехслойные схемы для уравнения теплопроводности ди д*и применяются значительно реже двухслойных, их иногда используют для повышения порядка аппроксимации или для улучшения устой- устойчивости. Приведем несколько примеров трехслойных схем для уравнения A3). На первый взгляд кажется очень естественным заменить уравнение A3) явной симметричной схемой второго по- порядка аппроксимации 2т Л2 Однако эта схема совершенно непригодна для использования на быстродействующих ЭВМ, поскольку при любых шагах т и h она является неустойчивой. Если искать ее решение в виде A0), то получим уравнение h" один из корней которого по модулю всегда больше единицы. Если в уравнении A4) заменить значение у", на полусумму 0,5 (yf+% + г/^1), то получим схему уГ-уГ . . уи-уГ-уГ+yU ? которая интересна тем, что является абсолютно устойчивой, но об- обладает условной аппроксимацией. Обозначим уь= 285
Тогда уравнение A5) можно переписать в виде Отсюда легко получить, что уравнение A5) аппроксимирует исходное дифференциальное уравнение A3) лишь при условии, что T2/h2-+0 при т—>-0, h—*-0. Погрешность аппроксимации является ве- величиной O(t2+/i2 + t2//i2). Если же положить, например, x = h, то A5) будет аппроксимировать уравнение гиперболическо- гиперболического типа ди . д2и д2и § 6. Основные понятия теории разностных схем: аппроксимация, сходимость, устойчивость 1. Введение. Ранее мы уже встречались с перечисленными в за- заглавии понятиями в связи с самыми различными примерами раз- разностных схем для конкретных дифференциальных уравнений. В на- настоящем параграфе дается изложение основных понятий теории разностных схем и выясняется связь между ними для линейных разностных схем самого общего вида, безотносительно к конкрет- конкретной структуре исходного дифференциального уравнения и ап- аппроксимирующей его разностной схемы. Пусть дана исходная дифференциальная задача, которую мы запишем в виде Lu(x)=f{x), A) где xeG, G — область m-мерного пространства, f(x) —заданная функция, L — линейный дифференциальный оператор. Предпола- Предполагается, что дополнительные условия (типа начальных и граничных условий) учтены оператором L и правой частью /. В качестве простейшего примера задачи A) читатель может рассмотреть первую краевую задачу — u"(x)=f{x), 0<х<1, и@) = =«A)=0, хотя в общем случае уравнение A) может быть много- многомерным, в том числе и нестационарным уравнением. Существенно в дальнейшем лишь требование линейности оператора L. Для построения разностной схемы прежде всего вводится сетка Gh — конечное множество точек, принадлежащих G, плотность рас- распределения которых характеризуется параметром h — шагом сетки. В общем случае параметр h — вектор, причем определена \h\ — длина вектора h. Обычно сетка Gh выбирается так, что при |/г|—>-0 множество Gh стремится заполнить всю область G. Функ- Функция, определенная в точках сетки G, называется сеточной функ- функцией. Пример 1. На отрезке G=[a, b] введем произвольную неравномерную сетку Gh, т. е. множество точек Gh={x.i^[a, b]\xo=a<xl<.. ,<Хк = Ь 286
Обозначим hi=xi—Xi-1, i=\, 2, ..., N. Тогда h=(h] hn), \ h | =_max hL. Можно определить также | h | = Пример 2. На плоскости (х, t) рассматривается область G={0<x<l, ts^T). Сетка Gh состоит из точек (xt, tn), где Xi = ih, i = 0, 1, ..., N, hN=], tn = m, n = 0, 1,...,K, Kt=T. Эта сетка использовалась при аппроксима- аппроксимации уравнения теплопроводности в § 4. Здесь можно положить |7г| =у/г2+т2, либо |7г|=У/гЛ+т. После введения сетки Gh следует заменить в уравнении A) дифференциальный оператор L разностным оператором Lh, правую часть f(x) —сеточной функцией срДлс). В результате получим си- систему разностных уравнений Lhyh(x)=(fh(x), xeG», B) которая называется разностной схемой или разностной задачей. В отличие от дифференциального уравнения решение разностной задачи будем обозначать буквой у. 2. Погрешность аппроксимации и погрешность схемы. Перей- Перейдем к изложению основных понятий теории разностных схем: ап- аппроксимации, корректности (устойчивости) и сходимости. Прежде чем давать формальные определения, заметим, что свойство ап- аппроксимации означает близость разностного оператора к диффе- дифференциальному. Отсюда еще не следует, вообще говоря, близость решений дифференциального и разностного уравнений. Свойство устойчивости разностной схемы является ее внутренним свойством, не зависящим от того, аппроксимирует ли эта схема какое-либо дифференциальное уравнение (см. 130]). Оказывается, однако, что если разностная схема аппроксимирует корректно поставленную задачу и устойчива, то ее решение сходится при |/z|-vO к решению исходной дифференциальной задачи. Будем считать, что решение и(х) задачи A) принадлежит ли- линейному нормированному пространству 3&0, Ц - ||п — норма в &й. На- Например, $а=С[а, b], ||u||0— max |ц(л;)|. Аналогично считаем, [] что сеточные функции ун(х), срл(х) являются элементами линейного нормированного пространства <%h {пространства сеточных функ- функций) с нормой ||-||Л. По существу, имеем семейство линейных нор- нормированных пространств, зависящее от параметра h. Чтобы иметь возможность сравнивать функции из различных пространств, вводится оператор проектирования ph: $a-+@Sh. Это, по определению, линейный оператор, сопоставляющий каждой функции из 380 некоторую функцию из SSh. Для функции ue^D обозначим через uh ее проекцию на пространство JfA, т. е. uh(x) = =phu(x). Приведем примеры операторов проектирования. Пример 3. Пусть ?fio — пространство непрерывных функций на [0, 1] и Gfc — равномерная сетка с шагом h: Gh={Xi = ih, j=0, 1, .... N, hN=\). 287
Тогда в качестве оператора проектирования можно взять оператор вычисления значения функции в данной точке сетки. Этот оператор определяется следующим образом: (phu)(Xi)=u{Xi), i = Q, I N. Пример 4. Пусть Яй — пространство функций, интегрируемых на [0. 1 ], и Gh — та же сетка, что и в предыдущем примере. Тогда в качестве оператора проектирования можно взять оператор осреднения xi+o,bh (phu) (xj = j j u(x)dx, ( = 1,2 N-\, Xl-ufih 0,5h XN (Phu) Ы = — j u{x) dx, (phu) (xN) = — j u(x) dx. о xpj-o,bh В дальнейшем будем требовать, чтобы нормы в ^Л были согла- согласованы с нормой в исходном пространстве <%0. Это означает, что для любой «gJ, выполняется условие Ига i/ИкНК- О) Требование согласования норм обеспечивает единственность предела сеточных функций при |Л|-»-0. Действительно, если для и, v^$a имеем lim \\yh-PhU\\h=0, lim \\yh—PiiV\\h=Q, то согласно Ci ||и — u||0=lim \\ph(u — v)\\h = Q, т. е. u=v. Пример 5. Сеточная норма \I=0 / согласована с нормой в L2 \\У\\= М \у(х)\^х) . \а J Сеточная норма (N V' \l=0 / не согласована ни с одной из норм для функций непрерывного аргумента, так как ряд 2 \ytI2 может расходиться. Норма 1=0 согласована с нормой в С. 288
Пусть и(х) -решение исходной задачи A) и yh(x) —решение разностной задачи B). Определение 1. Сеточная функция zh(x)=yh(x)—phu{x), xeCi, называется погрешностью разностной схемы B). Подставим yh(x)—phu(x)-\-zh{x) в уравнение B). Тогда полу- получим, что погрешность zh(x) удовлетворяет уравнению Lhzh(x)=Hph(x)t x<=Gh, D) где \pk(x)=(fll{x)-Lk(p>lu{x))=(pll(x)-Lhuh(x). E) Определение 2. Сеточная функция tyh(x), определенная формулой E), называется погрешностью аппроксимации разност- разностной задачи B) на решении исходной дифференциальной задачи (О- Преобразуем выражение для tyh(x). Проектируя уравнение A) на сетку Gh, получим phLu(x)=phf(x) или, учитывая принятые обозначения, {Lu)h(x)=fh(x). F) Из E) и F) получаем г|)„ (х) = [ (Lu), (х) -Lhuh (х) ] + (фл (х) -fh (x)), т. е. ¦фл (х) =$h,i (x) + г|зл,2 (х), где , $K2=(ph(x)-fh(x). G) Определение 3. Функции tyh,i(x) и г^гМ называются, со- соответственно, погрешностью аппроксимации дифференциального оператора L разностным оператором Lh и погрешностью аппрокси- аппроксимации правой части. Определение 4. Говорят, что разностная задача B) ап- аппроксимирует исходную задачу A), если ||i|)J|;,—>-0 при |/i|—>-0. Раз- Разностная схема имеет k-й порядок аппроксимации, если существуют постоянные &>0, Л4,>0, не зависящие от ft и такие, что Аналогично определяются погрешность аппроксимации и поря- порядок погрешности аппроксимации правых частей и дифференциаль- дифференциального оператора. Замечание. Мы видели, что погрешность аппроксимации на решении представляется в виде суммы погрешностей аппроксимации дифференциального оператора и правой части. Однако порядок погрешности аппроксимации на реше- решении г|з может оказаться выше, чем порядок погрешности аппроксимации операто- оператора ijh и правой части t|72 B отдельности. Нетрудно, например, показать, что раз- разностное уравнение 10 А. А. Самарский, А. В. Гулил 289
имеет четвертый порядок аппроксимации на решении дифференциального урав- уравнения u"(x)=-f(x), хотя дифференциальный оператор и правая часть аппроксимируются лишь со вторым порядком. 3. Корректность разностной схемы. Сходимость. Связь между устойчивостью и сходимостью. По аналогии с дифференциальным случаем вводится понятие корректности разностной задачи. Определение 5. Разностная схема B) называется коррект- корректной, если 1) ее решение существует и единственно при любых пра- правых частях фке^л и 2) существует постоянная М2>0, не завися- зависящая от h и такая, что при любых фЛе^?Л справедлива оценка A^ML. (8) Свойство 2), означающее непрерывную зависимость, равномер- равномерную относительно h, решения разностной задачи от правой части, называется устойчивостью разностной схемы. Заметим, что требо- требование 1) эквивалентно существованию оператора Ц,1, обратного оператору Lh, а требование 2) эквивалентно равномерной по h ограниченности оператора Lh . Основным вопросом теории разностных схем, как впрочем и других приближенных методов, является вопрос о сходимости. Сформулируем строго понятие сходимости. Определение 6. Решение разностной задачи B) сходится к решению дифференциальной задачи A), если при |Л|—>-0 Разностная схема имеет k-й порядок точности, если существу- существуют постоянные k>0, М3>0, не зависящие от Л и такие, что \\У„— Часто для краткости просто говорят «разностная схема сходит- сходится», подразумевая сходимость решения разностной задачи к реше- решению дифференциальной задачи. Справедлива следующая теорема о связи устойчивости и схо- сходимости. Пусть дифференциальная задача A) поставлена корректно, разностная схема B) является корректной и аппроксимирует ис- исходную задачу A). Тогда решение разностной задачи B) сходится к решению исходной задачи A), причем порядок точности совпа- совпадает с порядком аппроксимации. Доказательство следует прямо из определений. Действи- Действительно, уравнение для погрешности D) имеет ту же структуру, что и разностная задача B). Поэтому из требования корректности сле- следует оценка llzJ^MJ^IL. (9) Поскольку константа М2 не зависит от h, получаем, что при \\^.h 1!Л-> 290
->0 норма погрешности zh также стремится к нулю, т. е. схема схо- сходится. Если H^IU^Afil/il*, то из (9) получим т. е. разностная схема имеет й-й порядок точности. Значение приведенной выше теоремы состоит в том, что она позволяет разделить изучение сходимости на два отдельных этапа: доказательство аппроксимации и доказательство устойчивости. Обычно более сложным этапом является исследование устойчиво- устойчивости, которое состоит в получении оценок вида (8), называемых априорными оценками. Замечание. Теорема доказана в предположении, что решение уь и пра- правая часть <рл измеряются в одной и той же норме. Однако, изменив соответствую- соответствующие определения, можно легко показать, что теорема остается справедливой и в том случае, когда решение измеряется в одной норме, а правая часть — в другой (см., например, [32]). ГЛАВА 2 ПРИНЦИП МАКСИМУМА ДЛЯ РАЗНОСТНЫХ СХЕМ В § 1, 3 изучается разностная схема для уравнения Пуассона в двумерной прямоугольной области. В § 1 формулируется раз- разностная краевая задача и вводится каноническая форма записи разностных схем, удобная для применения принципа максимума. Такая каноническая форма пригодна не только для разностного уравнения Пуассона, но и вообще для любого линейного разност- разностного уравнения. В § 2 излагаются основные теоремы принципа максимума для разностных схем, записанных в канонической фор- форме. В § 3 принцип максимума применяется к исследованию сходи- сходимости разностной аппроксимации задачи Дирихле. В § 4, 5 приво- приводятся примеры применения принципа максимума к другим стацио- стационарным и нестационарным разностным задачам. § 1. Разностная аппроксимация задачи Дирихле для уравнения Пуассона 1. Постановка разностной задачи. Рассмотрим задачу Дирихле для уравнения Пуассона: найти непрерывную в G = G\JY функцию и(хи хг), удовлетворяющую уравнению —Г-Н 7-= — f(Xl'X2), X=(XltX2)<^G, A) дх\ дх\ и граничному условию 10* 291
где G — прямоугольник, <Zi, 0<х2<12), Г —его граница, f(x), \l(x) — заданные функции. Предполагаем, что f(x), \i(x) таковы, что решение задачи A) существует, единст- единственно и является достаточно гладкой функцией. При /=0 получа- получаем задачу Дирихле для уравнения Лапласа дх\ дх\ B) Одним из основных свойств задачи B) является выполнение прин- принципа максимума: непрерывное в G и отличное от константы реше- решение и(хих2) может достигать своего максимального по модулю значения только на границе Г. Отсюда следует, что справедлива оценка max | и (хъ х2) | ^ max | \i (xlt х2) |, G=G (JF, ,х„х2)^а <*i.*»)er означающая устойчивость задачи B) по граничным данным. В сле- следующих параграфах аналогичные оценки будут получены и дл,я некоторых разностных схем, аппроксимирующих уравнение B). Эти оценки помогут установить сходимость разностной схемы для уравнения Пуассона A). Введем в G прямоугольную сетку Q с шагами h, по направле- направлению х, и h2 — по направлению х2, так что hi = l,/Ni, й2 = /2/^2, где Nl и N2 — целые числа. Обозначим xi1 = ih1, x'2=}h2. Сетка Q состоит из совокупности узлов xti= {х[, х0, i=0, 1, . . . , Л',, /= =0, 1,.. . , Ыг. Для функций у, определенных на Q, обозначим Ун = Уи-iVhl Задаче Дирихле A) сопоставим следующую разностную схему: yx*i.4+yx*,tt = — f<i> »=1.2, ....Л^! —1, /=1,2 N2-\, C) Уса = И (х[, 0), yiiN, = ц (х[, /2), 1 = 1,2, . . ., Ыг — \, D) г/о,/ = |i @, х>2), yNll = fi (/1? xj), /=1,2, ..., N2 — l. Точки Хц, в которых записываются уравнения C), принадлежат подмножеству со={^|/=1, 2,.... N,-1, /=1, 2 JV2-1} сетки Q, называемому множеством внутренних точек сетки Q. Со- Совокупность точек у = {x0j, X^jYJ^1 U {Xio, 292
в которых заданы разностные граничные условия D), называется границей сетки Q. На рис. 12 внутренние точки отмечены кружоч- кружочками, а граничные —крестиками. Отметим, что угловые точки @,0), Aи0), @, /2), (/lf 12) не участвуют в данной аппроксимации и поэтому не относятся ни к внутренним, ни к граничным точкам. По поводу разностной схемы х . C), D) можно задать обычные во- просы о существовании и единст- единственности ее решения, о сходимости при ht-+0, /г2—>-0, о способах реше- решения. Эти вопросы рассматриваются в следующих параграфах. Здесь мы ограничимся лишь очевидными за- замечаниями о том, что построенная разностная схема имеет второй по- порядок погрешности аппроксимации по hL и по /i2 и что она представляет собой систему линейных ал- алгебраических уравнений относительно yiU состоящую из (N{—1)X Х(Л^2—1) уравнений и стольких же неизвестных. 2. Канонический вид разностного уравнения. Для дальнейшего исследования удобно записать уравнение C) в виде, разрешенном относительно yti, а точнее в виде h 0 г 1 x Рис. 12. Прямоугольная сетка JL + JL) Уц = E) Обозначим через х точку Хц — центральную точку шаблона, на ко- котором аппроксимируется уравнение A), а через Ш(х) — весь этот шаблон, т. е. совокупность пяти точек Хц, xi±iJ, xiJ±l. Назовем окрестностью точки х и обозначим через Ш'(х) все точки шаблона Ш(х) за исключением точки х, т. е. Ш'(х) —это четыре точки xi±ij> Xij±i- Тогда уравнение E) можно записать в виде А(х)у(х)= F) где коэффициенты А(х), В{х,%) и правая часть F(x) определены следующим образом: A (x) = — + — , В (x, xt±u) = —, h\ h\ hi R(Y v. ¦ . — F lr\ f(r--\ ы \л> Л»,/±1) —¦ > l \л) — / \ЛЧ)' G) Обратим внимание на свойства этих коэффициентов: А(х)>0, В(х,?,)>0, А (х) = 2 В(х,%). Запись разностного уравнения в виде F) называется канонической формой разностного уравне- 293
ния. Она применима не только к уравнению E), но и к любому линейному разностному уравнению. Разумеется, в каждом кон- конкретном случае необходимо задать множества Ш'(х) и определить коэффициенты А(х), В(х, ?) и правою часть F(x). Уравнение F) определено при ^еш, т. е. только во внутренних точках сетки Q. Поэтому к нему требуется добавить еще гранич- граничные условия D). Заметим, однако, что если при яе^ считать Ш'(х) пустым множеством, то уравнение F) принимает вид A{x)y(x)=F{x), x<^*\' и представляет собой запись граничных ус- условий y{x) = [i(x) при л:е^, причем F{x)=A(x)\i{x). Итак, разностную схему C), D) можно записать в виде систе- системы уравнений F), где х пробегает все множество Q. Во всех внут- внутренних точках х^(й выполняются условия В{х,Ъ)>0 для всех |е=Ш'(*), (8) А(х)= 2 В(ХЛ)- В граничных точках х^у имеем Ш'(х) —пустое множество и А(х)>0. В следующем параграфе изучаются свойства общей разностной схемы F) безотносительно к конкретному виду ее коэффициентов, важно лишь, чтобы выполнялись условия, аналогичные (8). Полу- Полученные выводы окажется возможным применить не только к раз- разностной схеме C), D), но и к более широким классам разностных схем. § 2. Принцип максимума для разностных схем. Основные теоремы 1. Исходные предположения. В предыдущем параграфе на при- примере уравнения Пуассона была введена каноническая форма за- записи разностной схемы А(х)д(х) = 2 B(x,l)y(l) + F(x), хей. A) Поясним теперь, как следует понимать уравнение A) в общем случае. Пусть в л-мерном евклидовом пространстве задано конеч- конечное множество точек — сетка Q. Каждой точке xeQ сопоставим один и только один шаблон Ш(х) —любое подмножество Q, со- содержащее данную точку х. Окрестностью точки х назовем множе- множество Ш' (х) =Ш (х)\{х). Заметим, что Ш'(х) может быть и пустым множеством. Пусть заданы функции А(х), В(х, %), F(x), опреде- определенные при любых xgQ, ^ей и принимающие вещественные зна- значения. Далее, каждой точке xeQ соотносится одно и только одно уравнение вида A), в котором у{х) — искомая сеточная функция. В результате получаем систему линейных алгебраических уравне- уравнений с числом уравнений, равным числу неизвестных. Эту систему уравнений и будем называть разностной схемой. 294
Введем понятие связной сетки. Сетку Q будем называть связ- связной сеткой, если для любых двух ее узлов х0, х'д таких, что по край- крайней мере один из узлов имеет непустую окрестность, существует та- такое множество узлов ^eQ, J=l, 2, ... ..., т, что Xi^III'ixo), Xt^UI'ixi), ... ..., xmeZZ/'0cm_,), Хо'<^Ш'(хт), т. е. каждый последующий узел принадле- принадлежит окрестности предыдущего. Анало- Аналогичным образом определяется понятие связности любого подмножества из Q. Наглядный смысл требования связно- связности состоит в том, чтобы от любого узла х«ей можно было перейти к любому другому узлу x'^Q, пользуясь только заданными шаблонами. На рис. 13 изображен пример се- сеточной области, не являющейся связ- Рис 13- Несвязная сетка ной (шаблон предполагается пятито- пятиточечным, таким, как при аппроксимации уравнения Пуассона). Определим сеточный оператор L формулами Ly(x)=A(x)y(x)~ и обозначим = A(x)- 2 В(хЛ). 1<=Ш'(х) B) C) Тогда задачу A) можно записать в виде Ly(x)=F(x), xefi. D) Заметим, что выражение Ly(x) можно представить также в виде = D(x)y(x) + S B(x, Будем говорить, что в точке хей выполнены условия положи- положительности коэффициентов, если А(х)>0, В(х, для всех |?eZZT(jc), E) 2. Принцип максимума и его следствия. Сформулируем теперь основную теорему настоящего параграфа (см. [33]). Наряду с сет- сеткой Q будем рассматривать какое-либо ее подмножество со и обозначим «= и ш(х). Для наглядности читатель может представить себе, что Q — это сетка, введенная в § 1 при аппроксимации уравнения Пуассона в прямоугольнике, а со — множество ее внутренних узлов. Очевидно, 295
что при этом co=Q. В общем же случае требуемые свойства мно- множеств Q и со сформулированы в приведенной ниже теореме. Заме- Заметим, что в этой теореме функция у(х) не обязана являться реше- решением задачи D), используются только свойства оператора L. Теорема 1 (принцип максимума). Пусть сетка Q и ее подмножество со являются связными, причем ut^Q. Пусть в со выполнены условия положительности коэффициентов E). Тогда, если функция у(х), заданная на Q, не является постоянной на со и Ly(x) ^0 при всех х^ы F) (либо Ly(x)^0 при всех хеи), то у(х) не может принимать наи- наибольшего положительного (соответственно наименьшего отрица- отрицательного) значения на со среди всех ее значений на со. Доказательство. Пусть выполнено условие F). Будем до- доказывать теорему от противного. Допустим, что в точке х0еоз функция у(х) принимает наибольшее положительное значение, т. е. у (х0) = max у (х) > 0. G) В этой точке выражение Ly(xJ=D(xo)y(xQ)+ 2 В(х0Л)(У(х0)-у®) (8) неотрицательно. Действительно, согласно условиям E) и предпо- предположению G) имеем D(xo)^Q, у(хо)>О, В(х0,с,)>0, у(хо)^уA), так. что Ly(xo)^O. С другой стороны, из условия F) следует, что Ly(x0) ^0. Таким образом, если выполнено G) в точке хо^а, то Ly(xo)=Q. Но тогда, учитывая неотрицательность всех слагаемых правой части выражения (8), получим D(xo)y(xo)=O, B(xo,l)(y(x0)-y(l))=0, Ъ^Ш'(хо). Отсюда, в силу предположения у(хо)>О и условия В{х0, ?) >0 следует У(Ъ)=У(Хо) для всех \<=Ш'(ха). (9) Далее, поскольку у(х)фconst в со, найдется точка в которой у(х'аХу(х0). Из предположения о связности сетки <о вытекает существование системы узлов хи х2,..., хт, принадлежа- принадлежащих со и удовлетворяющих условиям х'а<=Ш'(хт). Из условия G) и доказанного свойства (9) получаем у{х{)=у(х0). Следовательно, относительно точки лг± можно повторить все пре- предыдущие рассуждения и доказать, что у(Ъ)=у(х1) для всех 296
Аналогично докажем, что У(х,)=у(х2) = .. .=у{хт)=у{ха). Оценим величину Ly (Х,„) = D (Х,п) У (Х,п) + 2 В (Хт, I) (У (Хт) — Из условий E), равенства у(хт)=у(х0) и предположения G) по- получаем строгое неравенство Ly (хт) ^ В (хт, х'о) {у (х0) — у (х'а)) > О, которое противоречит условию F). Таким образом, допущение G) неверно. Случай, когда Ly{x)^0, для всех х^а сводится к рас- рассмотренному случаю путем замены у на —у. Теорема 1 доказана. Замечание. Принцип максимума остается справедливым и в том случае, когда со=й. Предполагается при этом, что ш = U Ш(х)~?1. В дальнейшем, не оговаривая это особо, будем считать сетку Q связной. Следствие 1. Если при всех х^О, а) выполнены условия положительности коэффициентов E), б) Ly(x) ^.0(Ly(x) ^0), и найдется хотя бы один узел xo^Q, в котором ?>(*„)> 0, xoeQ, A0) то у{х) ^0(у(х) ^0) для всех Доказательство. Если у{х)фconst при jceQ, то утверж- утверждение следует из принципа максимума. Действительно, предпола- предполагая, что у(х)>0 хотя бы в одной точке хей, мы допускаем суще- существование в ?> положительного максимума функции у(х), что про- противоречит принципу максимума. Если #(.*:)=const при xeQ, то в точке х0, для которой D(x0) >0, имеем Ly (х0) = D (х0) у (х0) + 2 В (х0, I) (у (х0) - у ©) = D (х0) у (*„) < 0, откуда получим у(х) =у(Х(,) Точку x^Q назовем граничной точкой, если Ш'{х)—пустое множество, Ш'(х)=0. Если сетка Q содержит хотя бы одну гра- граничную точку х0, то D(xo) = A(xo)- 2 В(х,1)=А(х0)>0 и можно применять следствие 1. Теперь мы уже в состоянии сформулировать достаточные усло- условия однозначной разрешимости задачи A). Следствие 2. Пусть коэффициенты оператора L удовлетво- удовлетворяют условиям E) при каждом хей и условию A0). Тогда зада- задача A) имеет единственное решение. 297
Доказательство. Ранее отмечалось, что задача A) пред- представляет собой систему линейных алгебраических уравнений, в ко- которой число уравнений равно числу неизвестных. Поэтому доста- достаточно показать, что однородное уравнение Ly(x)=0, хеЙ, имеет только тривиальное решение г/(л;)=О. Поскольку условия Ly(x)^ ^0 и Ly{x)^0 в данном случае выполнены, из следствия 1 за- заключаем, что в каждой точке xsQ одновременно выполняются не- неравенства у{х)~^0 и у{х)^.О. Но это справедливо лишь тогда, когда у(х) =0 на Q. Предоставляем читателю возможность самостоятельно убе- убедиться в том, что разностная схема, аппроксимирующая задачу Дирихле для уравнения Пуассона (см. § 1), удовлетворяет всем условиям теоремы 1 и ее следствий и тем самым имеет единствен- единственное решение. Для того чтобы доказать непрерывную зависимость решения от правой части и от граничных условий, полученной тео- теоремы недостаточно. Докажем еще несколько утверждений, следую- следующих из принципа максимума. 3. Теорема сравнения. Устойчивость по граничным условиям. Наряду с задачей D) рассмотрим задачу LY(x)=zF(x), x^Q, A1) отличающуюся от D) правой частью. Теорема 2 (теорема сравнения). Пусть при всех хей выполнены условия положительности коэффициентов E) и выполнено условие A0). Тогда, если \F(x)\^F(x) для всех x<=Q, то \y(x)\^Y(x) для всех Доказательство. Для функций v(x) = Y(x)+ y(x) и w(x) = Y(x)—y(x) имеем Согласно следствию 1 имеем v(x)^Q, w(x)^0, т. е. -Y(x)^y(x)^Y(x), что и требовалось. Сформулируем первую краевую задачу для уравнения A). Пусть ^ — множество граничных точек сетки ?2, т. е. точек хей, для которых Ш'(х)=0. Множество точек сетки Q, не являющихся гра- граничными, назовем множеством внутренних узлов и обозначим через cj. Таким образом, Q=co[Jy- В граничном узле хе-у уравнение A) принимает вид A(x)y(x)=F(x) или, что то же самое, У(х)=\1(х), A2) где [i{x)=F(x)/A(x) —заданная функция. Первая краевая задача состоит в том, чтобы найти сеточную функцию у(х), удовлетво- удовлетворяющую уравнению A) при х<=со и условию A2) при хе-у. Уже 298
отмечалось, что при условиях теоремы 1 первая краевая задача имеет единственное решение. Переформулируем теорему сравнения на случай первой крае- краевой задачи. Рассмотрим две задачи: Ly(x)=F(x), хем; y(x) = \i{x), х^у, A3) LY(x) = F(x), xr=co; У(х)=|Г(х), х^у. A4) Если при jfGoi выполнены условия E) и то | у (х) 1 ^ Y (х) при всех Функция Y(x), фигурирующая в теореме сравнения, называется мажорантной функцией для решения у(х) задачи D). Для полу- получения оценки решения у{х) обычно строят вспомогательную зада- задачу A1) или A4) так, чтобы можно было легко найти ее решение Y(x) и затем применяют теорему сравнения. Теорема сравнения позволяет легко доказать устойчивость ре- решения первой краевой задачи по граничным условиям. Рассмотрим однородное уравнение A3) с неоднородным граничным условием Ly(x)=0, леш; у(х)=ц(х), хе-у. A5) Следствие 3 (устойчивость по граничным ус- условиям). Пусть при хеш выполнены условия E). Тогда для решения задачи A5) справедлива оценка max \у(х)\ -< max | ц (х) |. A6) Доказательство. Наряду с задачей A5) рассмотрим за- задачу LY{x)=0, лею; Y(x)=a, xe=f, A7) где а = max | ц {х) \. Все условия теоремы сравнения выполнены, v поэтому | у (х) | Далее, для функции v(x)=a—Y(x) имеем Lv (x) =La-LY (x) =La=Z) (x и v(x)—Q при jcew и, согласно следствию 1, получим v(x)^0, т. е. Y(x) ^.а. Но тогда при всех xeQ имеем \у{х) \ ^У(лг) ^Га, откуда и следует A6). 4. Примеры. Приведем несколько простых примеров. Пример 1. Рассмотрим задачу u"(x)=-f(x), 0<х<1, w'@)=0, u(l)=0. По аналогии с § 2 гл. 1 построим разностную схему второго 299
порядка аппроксимации y^xJ = ~f(xc), i= 1,2, ...,#—1, — ^.в = 0,5Л/0, yN=Q. A8) Запишем схему A8) в каноническом виде: Уо = Ух + 0,5Л2/о. У1 =0,5 (у^ + г/1+1) + ~ ft, i = 1, 2, . . . , N — 1, Сетка Q состоит из узлов xt=ih, i=0, I, . . . ,N, и имеет одну гра- граничную точку x—xN. Окрестность Ш'(х0) узла х0 состоит из одного узла x=Xl. Окрестность Ш'(х{) узла х^ при i=l, 2, . . . , iV— 1 состо- состоит из двух узлов Xi-U xi+i. Сетка, очевидно, является связной. Свой- Свойства положительности коэффициентов E) выполнены, причем D(Xi)=0 при 1=1, 2,.. ., N— 1, D(xN)=A{xN) = \. Таким образом, к разностной схеме A8) можно применять принцип максимума и его следствия. Пример 2. Для уравнения ы" (*) = -/(*), 0<*<1, и'@)=и'A)=0 A9) строится разностная схема y-xx,i = -f(xi), t = l,2, . .., N-\, B0) — Ух л = 0,5/i/0, y-N = 0,5/г/д/. Канонический вид этой схемы Окрестности узлов ха, xN сетки О, состоят каждая из одного узла, а окрестности точек хи i=l, 2,. . . , N— 1,— из двух узлов. Гранич- Граничных точек сетка не имеет. Условия Л(х)>0, В(х, |)>0, /)(л:)=0 выполнены в каждой точке сетки. Нет ни одной точки х0 сетки Q, в которой выполнялось бы строгое неравенство D(x0)>0. Поэтому нельзя применять следствия 1 и 2 и утверждать о существовании и единственности решения задачи B0). И действительно, решение задачи B0) (так же как и исходной дифференциальной задачи A9)) не единственно: наряду с у(х) решением является функция v (x) =y(x) -\-a, где а — любая постоянная. § 3. Доказательство устойчивости и сходимости разностной задачи Дирихле для уравнения Пуассона 1. Устойчивость по граничным условиям. В § 1 рассматривалась задача Дирихле для уравнения Пуассона дги , д2и с, ¦. _ , , р дх\ дх2 ' ' > 2 — > A) и(х)=ц(х), 300
в прямоугольнике G={Q<xl<li, 0<л:2</2} с границей Г. Была вве дена сетка п = {хц = (х[, х{), 1 = 0, 1, ... , Nlt / = 0, 1, .. . , Nu}, где x[ — ihlt x'3=jh2, h^lJNi, h2 = lJN2, и построена разностная схема второго порядка аппроксимации B) Здесь со — множество внутренних узлов сетки Q и у — множество граничных узлов: » = {хп = (х[, х'г), t=l,2, .... Л^х—1, /=1,2, ..., N2— 1}, ( VV2-1 Г 7= Хо/, xWl/ U j-fio, xtNl i. J/=i I Разностная схема B) приводится к каноническому виду 2 , C) D) где для х=Хц^а окрестность Ш'(х) состоит из четырех узлов 1 2 A(x)=^ + ^, B(x,xt±1./) = ^-, В(х,хи±1) = -±Г, E) Обозначая, как и ранее, запишем задачу C), D) в виде L{x)y(x)=F(x), xgeco, г/(л;)=|я(л;), ^Е|. F) В настоящем параграфе будет получена оценка решения зада- задачи B) через правую часть / и граничные условия (л, означающая устойчивость этой задачи, и будет показано, что при /it-»-0, Л2->-0 норма погрешности IIУ — и Нею) — ™* I ^ (х) — " (*) I стремится к нулю. Тем самым будет доказана сходимость разност- разностной схемы. Запишем задачу B) в виде F) и представим ее решение у(х) в виде суммы у(х)—у(х)+у(х), где у(х) —решение однородного 301
уравнения с неоднородным граничным условием: Ly(x) = 0, x==<a, у(х) = ц(х), х<=у, G) и у(х) — решение неоднородного уравнения с однородным гранич- граничным условием: Ly(x) = F(x), x^co, lj(x) = O, х^у. (8) Отметим, что для задачи F) выполняются все условия принци- принципа максимума, поэтому можно воспользоваться результатами § 2. В частности, к задаче G) можно применить следствие 3 из § 2, ко- которое приводит к оценке где \У IU) = ™* IУ М I. IIV- Над = ™vx I V (* 2. Устойчивость по правой части и сходимость. Оценить реше- решение неоднородного уравнения (8), пользуясь только результатами § 2, невозможно. Однако можно легко построить мажорантную функцию для решения задачи (8) и применить затем теорему сравнения. Рассмотрим функцию Y(x) = K(ll + ll~xl-xl), A0) где К — пока произвольная положительная постоянная, а /,, /, — длины сторон прямоугольника G. Ясно, что Y(x)^0 при всех хей. Обозначим D(x)=A(x)- 2 В{х,% и вычислим выражение LY(x) = D(x)Y(x)+ для функции A0) в любой точке хеш. Заметим, что по построению LY(x) = -Y- -Y-. *1*1 ХгХг Кроме того, для функции A0) справедливы равенства Таким образом, LY(x)=4K и можно считать, что функция Y(x) является решением краевой задачи LY(x)=F(x), х = п>, Y(x) = p(x), x = y, A1) где F(x)=4K и ц(л;)>0 - значение функции A0) при х^у. Если положить 302
то по отношению к задачам (8), A1) будут выполнены все условия теоремы сравнения (см. аналогичные задачи A3), A4) в § 2). Из теоремы сравнения следует оценка ||# ||С(Я) ^ max Y (х) < К (l\ + Q. Отсюда, учитывая выбор константы К, получим Из неравенства треугольника и оценок (9), A2) следует оцен- оценка решения задачи B) Поскольку константы, входящие в оценку A3), не зависят от шагов сетки h, и Л2> данная оценка выражает собой устойчивость разностной схемы по правой части f и по граничным условиям ц. Отметим геометрический смысл константы 1\ -\- ^ — это квадрат диаметра области G. Тем самым полностью доказана корректность (однозначная разрешимость и устойчивость) разностной схемы B). Перейдем те- теперь к исследованию сходимости разностной схемы и к оценкам погрешности. Обозначим 2ц=уу— и(х[,х{), где ^ — решение разностной за- задачи B) и u(xitx2) —решение исходной дифференциальной зада- задачи A). Подставляя уц=гц+и.ц в уравнение B), получим, что по- погрешность удовлетворяет уравнению *w/ + 23W/ = - 1"/, xi, S со, A4) z,-j=O, ^ек, где v|)f/ =UjtXul/ +и-л<{/ + /,/ —погрешность аппроксимации на решении задачи A). Если четвертые производные решения и(хих2) ограничены, то погрешность аппроксимации является величиной второго порядка малости относительно /i = (hi + hl)Vl, т. е. суще- существует постоянная Ми не зависящая от А, и кг и такая, что 1с«о) ' i (hi + hi). A5) Заметим, что задача A4) отличается от разностной схемы B) только правыми частями в основном уравнении и в граничных ус- условиях. Поэтому для решения задачи A4) справедлива оценка, аналогичная A3), а именно оценка 303
Отсюда и из A5) получаем неравенство 1ИС(О, ^ М2 (/?! + /4), A6) где M2=0,25Mi (/f+ /2) — постоянная, не зависящая от Л, и h2. Из оценки A6) и следует, что схема B) сходится и имеет второй по- порядок точности. § 4. Примеры применения принципа максимума В этом параграфе будем рассматривать разностные уравнения Ly(x)=F(x), igQ, A) где Ly(x)=--A(x)y{x)- 2 B(x,Qy(t), B) причем оператор L удовлетворяет условию положительности коэф- коэффициентов Л(*)>0, В(хЛ)>0, D(x)^A(x)~ 2 В(хЛ)>0. (З) Линейный оператор L называется монотонным оператором, если из условия Ly(x)^0 для всех xeQ следует, что у(х)^О для всех xeQ. Поэтому разностные схемы, удовлетворяющие при всех хей условиям C), называются монотонными разностными схема- схемами. Схемы, для которых условия C) не выполнены хотя бы в од- одной точке лей, называются немонотонными. В § 2 было показано, что условия C) обеспечивают монотон- монотонность оператора L, выполнение принципа максимума и коррект- корректность разностной задачи A) в сеточной норме С: Разумеется, отсюда не следует, что немонотонная схема обяза- обязательно некорректна. Подчеркнем, что выполнение условий C) (на- (наряду с другими условиями, сформулированными в теоремах из § 2) является достаточным условием корректности. Приведем несколько примеров монотонных разностных схем для нестационарных уравнений. Пример 1. Рассмотрим схемы с весами для уравнения тепло- теплопроводности Эти схемы подробно выписывались в § 4 из гл. 1 (см. схему A5) при ц>1 =0 из § 4 гл. 1), поэтому мы не будем формулировать разностную задачу в полной постановке, а приведем только одно 304
уравнение yW — У1} n+i n т XX>1 xx'1 Найдем, при каких значениях параметров т, h, о схема E) бу- будет монотонной. Чтобы записать уравнение E) в виде A), B), разрешим его относительно у"+1. Тогда получим уравнение г/Г = cry (yi:i — 2уТг + yl-l) + A — о) у (у?+1 — 2у1 + yU) + yl у = т//г2 или A+2оу)уГ = = A -2 A - a) y) У? + оу (г/ГЛ1 + ytl) + (l-a)y (y-+l + yU). F) Отсюда видно, что в каждом узле х=(х„/п+1) шаблон Ш(х) состоит из шести точек, а окрестность Ш (х) точки (xutn+i) со- состоит из пяти точек (xi±t, tn+1), (xutn), (xi±1,tn). Условия положи- положительности коэффициентов C) сводятся к неравенствам 0<о<1, о> 1 — 1/B^). Заметим, что схема останется монотонной и в том случае, если эти неравенства заменить на нестрогие, т. е. потре- потребовать Osga^l, o^l-l/BT). G) Действительно, выполнение одного из условий G) со знаком равенства означает лишь, что окрестность Ш'(х) состоит не из пяти, а из меньшего числа узлов. Например, при о=0 (явная схе- схема) окрестность Ш' (х) состоит из точек {хи tn), (xi±1,tn) и условие монотонности G) принимает вид — <1- (8) Л2 2 Если о=0, t//i2=0,5, to два из трех неравенств G) выполнены со знаком равенства. В этом случае надо считать, что окрестность Ш'(х) состоит из двух узлов (xi±l, tn). Итак, схема с весами E) является монотонной при условиях G), а чисто неявная схема (о=1) монотонна при любых т и h. Шести- Шеститочечная симметричная схема (а=0,5) монотонна при условии x^h2. В § 4 из гл. 1 отмечалось, что необходимым условием устой- устойчивости схемы E) является условие .11 ._. о>--~. (9) Сопоставляя с G), видим, что монотонность является, вообще говоря, более сильным требованием, чем просто устойчивость. В следующей главе будет показано, что условие (9) достаточно для устойчивости схемы E), однако не в сеточной норме С, а в среднеквадратичной норме. 305
С помощью принципа максимума можно исследовать также ус- устойчивость разностных схем с переменными коэффициентами. Пример 2. Рассмотрим схему B5) из § 4 гл. 1: где а = а1, О <С сх ^ а" ^ с2, р" ^с3>0. Переписывая это разно- разностное уравнение в виде Pi п+1 \ , п я , п п -, , / Pi i+i ' ai \,,n /i /ч\ ~У1 = -^- (a'+i^« + a,-«/«-i) + ( — -2 Yl ' ^ > получаем, что схема монотонна при условии т(^ + а,) ?=1,2 ЛЛ — 1, п = 0, 1, ...,/С-1, (И) (ср. с B7) из § 4 гл. 1), которое и является условием устойчивости данной схемы. Оно будет выполнено, если потребовать h2c3 -^ 2 Последнее неравенство совпадает с условием устойчивости, по- полученным в § 4 гл. 1 при помощи принципа замороженных коэф- коэффициентов. Получим априорную оценку решения задачи A0) через началь- начальные значения у] при условии A1). Предположим, что у" = у1/=0, л=0, 1,... , К, и обозначим ||i/n||c«oA)= max \у?\. lSiSNi Тогда в силу неотрицательности коэффициентов уравнения A0) получим о" о" и, следовательно, Рассмотрим теперь краевую задачу для уравнения первого по- порядка ди , ди п . „ , _ — + — = 0, х>0, t>0, dt дх A2) и(х,О)=ио(х), х>0, u{O,t)=nl{t), t>0. Известно, что решение и(х, t) этой задачи переносится по ха- характеристикам /=x+const с начальной прямой, т. е. и{х, t) = =uo(x—t), если x>t и и{х, t) = \jLl(t—x), если x<t. 306
Пример 3. В квадранте х>0, />0 введем сетку с шагом h по л; и шагом т по t и обозначим Xi=ih, i—0, I,. . ., tn—nx, n= =0,1,..., yi =y{xit tn). Одна из простейших схем для уравнения A2) имеет вид УТ1 — У" | Ус — У1-1 n /__i о „ п I о 1 = U, 1=1,2,..., rt = U,l,2,..., т / У1 = ио(хс), 1 = 0,1,..., ^on = Hi(^), п=1,2, ... Записывая уравнение A3) в виде, разрешенном относительно у}+1, получим Отсюда следует, что схема A3) монотонна при условии Пользуясь приемом, изложенным в § 4 гл. 1, можно показать, что условие т^А и необходимо для устойчивости схемы A3). Другая схема немонотонна при любых т и h. Более того, эта схема абсолютно неустойчива. Явная схема уГ1-у1 { y'L-yU ^Q имеющая второй порядок аппроксимации по h, также немонотонна и абсолютно неустойчива. Если в последней схеме заменить У1 на полусумму 0,5 (г/"+1 -\-У*_^, то получим разностную схему 1h которая монотонна при т^Л. Однако указанная замена ухудшает аппроксимацию, погрешность аппроксимации схемы A4) является величиной О(т+/г2) + O(k2/x). В этом легко убедиться, если запи- записать схему A4) в виде h где Пример 4. Рассмотрим еще одну схему для уравнения A2): tfi + y". =0,5Av0^ A5) Здесь vo>0 — постоянная, не зависящая от т и h. При vo=O по- получаем абсолютно неустойчивую схему. Введение искусственного 307
добавка 0,5/iv0 yl . в правую часть уравнения делает схему услов- условно устойчивой, понижая одновременно порядок аппроксимации по h до первого. Схемы, аналогичные A5) и аппроксимирующие урав- уравнения газовой динамики, называются схемами с искусственной вязкостью (см. [36]). Записывая уравнение A5) в виде 0»« = O,5y(vo— 1) у«?1 + A — vov)# + 0,5v(v0 + \)ynL_v ¦получаем, что условия монотонности C) выполнены при vo^l, 'Т^ v°1" Таким образом, чем больше коэффициент искусственной вязкости v0, тем слабее ограничение на шаги сетки, вызванное тре- требованием устойчивости. Надо помнить, однако, что введение искус- искусственной вязкости может существенно исказить поведение истин- истинного решения задачи A2). Поэтому при практических расчетах ко- коэффициент вязкости v0 берут не слишком большим. § 5. Монотонные разностные схемы для уравнений второго порядка, содержащих первые производные Рассмотрим обыкновенное дифференциальное уравнение вто- второго порядка u"(x)+r(x)u'(x)= — f{x), 0<*<1, и@)=иA)=0 A) и поставим задачу построить для него разностную схему, имею- имеющую второй порядок аппроксимации и монотонную при любых ша- шагах сетки h. Очевидная схема второго порядка аппроксимации, ко- которая получается заменой и'(х) центральной разностной производ- производной, является монотонной лишь при достаточно малых h. Дейст- Действительно, такая схема имеет вид УЪУ + У УУс-1 f = — U Ла 2Л лли Условия положительности коэффициентов сводятся к неравенст- неравенствам 0,5/г|г,|<1 и выполняются, если /г^2/( шах \гс\). Схема будет монотонной при любых h только в случае г{х) =0. Прежде чем построить требуемую схему для уравнения A), рассмотрим несколько частных случаев. Предположим, что г{х)~^> 2^0 для всех л,е@, 1) и рассмотрим схему с односторонней раз- разностью "«-У'**-' +««*=». = -ft. .308
Эта схема имеет первый порядок аппроксимации и монотонна лри любых h. Действительно, записывая ее в виде и учитывая неотрицательность г(х), убеждаемся в том, что усло- условия положительности коэффициентов выполнены при всех h. Точ- Точно так же, если г{х) ^0, то схема izL_+n^_^ = _A. я2 я монотонна при любых h и имеет первый порядок аппроксимации. В общем случае представим функцию г{х) в виде суммы г(х) = =г+{х)+г-(х), где r_W=0,5(r(^)-|r(jc)|)<0. B) Схема с «направленными разностями» '^-У^ + г+ (хд У-^р- + г_{хд ^=L = -/, C) я1 п п является, как нетрудно видеть, монотонной при любых h, но имеет первый порядок аппроксимации. Изучим подробнее асимптотику погрешности аппроксимации Ь = Uxx.i + Г+ (*') "*.'' + Г- (^ Ux.i + ^' W этой разностной схемы. Пользуясь разложением по формуле Тейло- Тейлора, получим u = и" (*) + ° № " =="' (*) + "" N + и-,( = и' (х,) - | и" («О + О (/i2). Подставляя эти разложения в выражение D) и приводя подобные члены, имеем Ь = (Ш + fty,+ (r+ (xt) + r_ {xi)) и' (хс) + 0,5ft (г+ - О «; + О (/i2), откуда, учитывая A) и B), получим Отсюда видно, что несколько измененная по сравнению с C) схема A - 0,5/г | г (хд |) ^-у^ + r+ (xi) *^L + Г- M ft = "" ' '' имеет второй порядок аппроксимации. Порядок аппроксимации не 309
уменьшится, если коэффициент! \r (x,) | заменим с точностью до O(h2) положительным коэффициентом 1 1+0,5А[г(*?)| Таким образом, разностная схема E) имеет второй порядок аппроксимации на решении уравнения A). Записывая схему F) в виде убеждаемся в том, что она монотонна при любых т и Л. Для параболического уравнения ди д2и . . . ди монотонной при любых т и h схемой является чисто неявная схема -L~^lL = *4GZ + r+ (xt) ytf + r_ <*,) fit, G) где х; определяется согласно E). Схема G) имеет аппроксимацию O( h) ГЛАВА 3 МЕТОД РАЗДЕЛЕНИЯ ПЕРЕМЕННЫХ Метод разделения переменных успешно применяется для по- построения решений разностных схем, главным образом с постоянны- постоянными коэффициентами, и для исследования сходимости. В основе ме- метода лежит разложение решения разностной задачи по системе ее собственных функций. Требование полноты системы собственных функций сильно сужает класс рассматриваемых задач, и мы огра- ограничиваемся в этой главе лишь задачами с самосопряженными опе- операторами типа разностного оператора Лапласа. В § J, 2 изучаются спектральные свойства разностных операторов, далее в § 3 мето- методом разделения переменных проводится исследование устойчивости и сходимости разностных схем для уравнения теплопроводности. В остальных параграфах рассматриваются экономичные методы нахождения решений разностных краевых задач с постоянными ко- коэффициентами, основанные на методе разделения переменных. 310
§ 1. Разностная задача на собственные значения 1. Оператор второй разностной производной. Каждую разност- разностную краевую задачу можно рассматривать как операторное урав- уравнение с операторами, действующими в некотором линейном конеч- конечномерном пространстве (пространстве сеточных функций). Рас- Рассмотрим, например,разностное уравнение С • 1 л ДГ 1 /1\ на сетке aii=={x.=Lh, j = o, I, ..., N, hN=l}. B) Исключая из системы уравнений A) с помощью граничных условий значения г/0 = щ и </w = |^2> придем к эквивалентной систе- системе уравнений Zltl±^LZlh± = fit i = 2,3, ...,#-2, C) где fl= n f Рассмотрим множество векторов у= (уи уг, ..., ух-1)т, у{ = и определим на этом множестве оператор А формулами (Ау)с = — y~xi, I = 2, 3, . .. , N - 2, D) Тогда систему C) можно записать в виде операторного уравнения Ay = U E) где /= (fb ft, . . . , fN-2, fjv-i)T- Отметим, что уравнение E) учиты- учитывает как правую часть разностной схемы A), так и ее граничные условия. Итак, разностная задача A) порождает разностный оператор D). Оператор D) определен на множестве функций, заданных только во внутренних точках сетки юл, т. е. при 1=1, 2, ..., N—1. Удобнее, однако, считать, что оператор А определен на подпрост- подпространстве Н функций, заданных на всей сетке coft и обращающихся в нуль на границе: уа=уя = 0. При этом оператор А задается едино- единообразными формулами =—y-Xit, i=],2, ..., N-l, yo = yN=O F) во всей области определения. Оператор А, определенный согласно F), будем называть опера- оператором второй разностной производной. Изучим свойства этого опе- оператора. 311
2. Задача на собственные значения. Задача на собственные зна- значения для оператора А состоит в том, чтобы найти числа X (собст- (собственные числа или собственные значения) такие, для которых урав- уравнение Ау=Ху G) имеет нетривиальные решения (собственные функции), и найти собственные функции. Заметим, что по существу уравнение G) для оператора F) представляет собой алгебраическую задачу па соб- собственные значения для матрицы A == — которая называется матрицей разностного оператора F). Матри- Матрица А является трехдиагональной симметричной матрицей порядка .V—1. Известно, что у такой матрицы существуют Л'—1 действи- действительных собственных чисел и столько же линейно независимых соб- собственных функций. В случае оператора F) можно выписать все собственные числа и отвечающие им собственные функции в явном виде. Эти вопросы уже рассматривались в § 4 ч. I. Напомним полученные там резуль- результаты. Запишем уравнение G) в виде 2 1 0 0 0 — 1 2 — 1 0 0 0 — 1 2 0 0 0 . 0 . -' ¦ 0 . 0 . . . 0 . . 0 . . 0 . . —1 . . 0 0 0 0 2 _1 0 0 0 —1 2 —1, yo=yN=O, = l, (8) или подробнее У1+1 + у{-,= B h2X)y{, t=l, 2, ..., N 1, wo = ww=O. (9) Разностная задача (8) представляет собой аппроксимацию диф- дифференциальной задачи (Ю) —и"(х)=Хи(х), 0<х<1, ы@)=м(/)=0, решением которой являются собственные числа a* = /=fV, ?=i,2, ... и отвечающие им собственные функции uk(x) = sin~^, ?=1,2, ... Попытаемся поэтому искать собственные функции задачи (8) в виде nkx, yk (Xi) = sin —— , xt = ih, k=],2,... A1) 312
Граничные условия уа=ух = 0 при этом выполнены. Подставляя A1) в уравнение (9), получим уравнение nk <Х; + К) nk <Х; — A) nkX; sin ' + sin — = B — №) sin - I I K I или nkx, „bh 2 sin - cos — = B — h2l) sin , „bh cos = B h2l Отсюда видно, что функция A1) является собственной функ- функцией оператора F), если 2 cos — = 2 — 1г2К т. е. Я, = Xk = —¦ sin2 . Л2 2/ При /г = 1, 2 jV—1 получаем УУ—1 различных действительных собственных чисел К,, и отвечающих им собственных функций. Итак, решение задачи (8) имеет вид , 4 . „nkh , , . nkxi Xi=t/i, i=0, 1, ..., N, Jfe=l, 2 ^V—1, ЛЛ/" = /. A2) 3. Свойства собственных значений и собственных функций. Спра- Справедливы неравенства Для минимального собственного числа A.t в п. 5 § 4 ч. I была получена оценка снизу ?.i^6i>0 константой б1 = 9//2, не завися- зависящей от к. Переходя к изучению свойств собственных функций, введем в пространстве Н (напомним, что Н — линейное пространство функ- функций, заданных на <оЛ и удовлетворяющих условию г/0 = г/Л. = О) ска- скалярное произведение N-1 {У, v) = ^ t=i и норму Оператор А второй разностной производной F) является само- самосопряженным в Н оператором, т. е. (Ay, v) = (y, Av) для всех у, 1'еЯ. Это сразу следует из тождеств, называемых разност- разностными формулами Грина (см. также A5) из § 3 гл. 1). Имеем по 313
определению N-l N-l N-l (Ay, v) = — V y-x pih = — 2 Ух,Ф1 -\- 2 ^* iy'== N-l N N 1=1 1=2 1=1 Последнее равенство получено с учетом условия v,s = vN = 0. Меняя у и v местами, получим Следствием самосопряженности оператора F) является ортого- ортогональность его собственных функций, отвечающих различным соб- собственным числам. Действительно, пусть Тогда (Аук, ут)=кк(ук, ут), (Аут, ук)=К(ут, Ук) и в силу самосопряженности имеем 0=(Аук, у,„) — (Аут, у„) = {Хк~~ Хт) (ут, ук). Отсюда и получим, что (ут,ук)=0, если Хкфкт. Таким образом, система собственных функций A2) образует ортогональный ба- базис в пространстве И. Замечание. Поскольку все собственные числа различны, то условие эквивалентно условию 1гфт. Таким образом доказано, что сумма "^_~1 nkxL nmxi 2 sin sin h, hN = /, i=i обращается в нуль при кфт. Это замечание потребуется в § 2 при изучении собственных функций пятпточечиого разностного оператора Лапласа. Вычислим квадрат нормы собственной функции yh(x). В случае дифференциальной задачи A0) имеем ч но С • о llkx , I и 2 = sin2 dx = — . !i .1 / 2 Покажем, что и в разностном случае собственная функция ук(х) имеет ту же самую норму У1/2. По определению имеем Преобразуем выражение, стоящее под знаком суммы nkX, | / inkX; \ sin2 = - 1 — cos , I 2 V I J 314
и учтем тождество . 2я?(^ + 0.5А) . 2лй (х^ -Ь 0.5А) . „а sm sin — = 2 sin cos / / i 2 sincos / il Тогда получим 111 2 4sin(nftA/0 \ / 1 Таким образом, система собственных функций k=\,2, .... ЛГ-1, jC=xi> t=l, 2, ..., N— 1, /iiV=Z, A4) образует ортонормированный базис в пространстве //. 4. Операторные неравенства. Любой элемент i/еЯ можно раз- разложить по базису, т. е. единственным образом представить в виде суммы N-1 y(x)=2ick[ik{x), хс^ын, A5) *=1 где ск= (у, |xj — коэффициенты Фурье. Из A5) и ортонормированности системы {ц,,} следует тож- тождество Используя разложение A5), получим N-i N-1 Ау (х) = ^ с''^(г* М = 2 и Из тождества A6) следуют важные неравенства А\у\\2, A7) справедливые для любого у^Н. Учитывая доказанные выше оцен- оценки для собственных чисел, получим из A7) неравенства ЧуГ^(Ау,у)<-^\\у\\\ 6 = -i-. A8) Из A8) следует в частности, что (Ау, у)>0 для всех у^Н, г/=И=О. Операторы, обладающие этим свойством, называются положитель- положительными операторами. Неравенство Л>0 будет означать, что А — по- положительный оператор. В дальнейшем мы будем часто использо- 315
вать и другие операторные неравенства. Неравенство Л^О озна- означает, что (Ау, г/)ГЗ=О для всех у^Н. Для двух операторов А я В неравенство А^В означает, что А—В^О. В этих обозначениях свойство A8) можно записать в виде операторных неравенств &Es^A^~E, где Е — единичный оператор. Рассмотрим теперь разностный оператор Л с переменными ко- коэффициентами, определяемый формулами )i = — (ay-)x,lt 1=1,2, ..., N—l, yo = yN=0, A9) где 0<c1^ai^c2. Покажем, что Л —самосопряженный и положи- положительный в Я оператор и получим оценки, аналогичные A8). Для любых у, оеЯ имеем N-i N-l N-i (Ay, v) = — ^ {ay-^x,i vih = — ^ aUlyx,iVi 4- ^ WJxfi = 1=1 i=i i=i Л'-l N N 1 = 1 1=2 1=1 Отсюда видно, что (Аг/, и) = (у, Аи) и {t\y,y) = 2aiy2-h. B0) i=i Из тождества B0) получаем неравенства 1--П 1=1 Согласно A3) имеем где Л — оператор, определенный согласно F). Поэтому последние неравенства можно переписать в виде с,{Ау, у) ^ (Ау, у) ^с2(Ау, у) или в виде операторных неравенств . B1) Два оператора, А и А, называются энергетически эквивалентны- эквивалентными операторами, если выполнены неравенства вида B1) с положи- положительными постоянными си сг. Название объясняется тем, что в приложениях выражение {Ау, у) представляет собой энергию само- самосопряженного положительного оператора А. Константы си сг на- 316
зываются константами эквивалентности операторов Л и Л. Норма \\у\\л—~]/(Ау, у) называется энергетической нормой, порожденной оператором А. Из B1) и A8) получаем неравенства из которых следует, что спектр оператора A9) принадлежит отрез- отрезку [сA 4cjh2]. Свойства матричных неравенств, доказанные в п. 3 § 4 гл. 2 ч. II, остаются справедливыми и для операторных неравенств в ко- конечномерном пространстве Н со скалярным произведением, если только заменить в соответствующих неравенствах транспонирован- транспонированные матрицы Ат, Вт на сопряженные операторы А*, В*. В частности, если Л*=Л>0, то существует квадратный корень А'1' из оператора Л, который является самосопряженным положи- положительным оператором. Если L — обратимый оператор, то оператор- операторные неравенства А L'AL^UBL эквивалентны. Если С* = С>0 и а, ? — любые вещественные числа, то эквивалентны неравенства § 2. Задача на собственные значения для пятиточечного разностного оператора Лапласа 1. Самосопряженность. В § 1 гл. 2 изучалась разностная задача Дирихле для уравнения Пуассона в прямоугольнике. Эта задача порождает оператор, который называется пятиточечным разност- разностным оператором Лапласа и определяется следующим образом: у(х^ =0, если Xij-ef. Прямоугольная сетка Q = co(j4 с шагами ht и Лг состоит из узлов хц = (*<°, *<'¦>), *<" = ihu xf = jh2, i = 0,l,...,Nlt /=0, 1, ...,N2, haNa = L, a=l,2, о — множество внутренних узлов сетки fl и| — граница Q. Предположение о том, что г/(;=0 на у, не является дополнитель- дополнительным ограничением в случае задачи Дирихле, поскольку можно считать, что неоднородные граничные условия учтены правой частью операторного уравнения Ay = f. Введем линейное пространство Н функций, определенных на сетке Q и обращающихся в нуль на у. Это конечномерное про- пространство размерности (JV4—1)(W2—1). Определим в Н скалярное 317
произведение и норму Л',-1 Л'.-1 In 7У\ ^О /i ^Ч.' \l 1/--71-- till — Будем считать, что оператор А действует в пространстве Н. Покажем, что оператор А, определенный согласно A), является самосопряженным и положительным в Н оператором. Пусть у, v^lH. Так же как и в § 1, можно доказать, что при каждом / = = 1,2,..., N2—1 справедливо тождество Л',-1 Ni и при каждом i=l, 2, ..., N\—1 — тождество где ^л = (^/ — УыУЪ, У;,л = (Ун — Уи-iVhf Из B) и C) получим - 2 а2 2 ^л.^'/ - 2 /г1 2 л^л.|Л/ = /=i i=i i=i /=i Л'.-i Л", Л',-1 N, = 2 A«S Mf1iV+ 2 /г12 /=i i=i i=i /=i т. е. (Ay, v) = 2 Лх 21 h2y-^uii + ^2 Ai 2 А«^.л°г..У D) 1=1 /=i i=i /=1 Поскольку функции г/ и и входят в правую часть тождества D) равноправно, получаем, что (Ay, v) = (г/, Лу) для любых г/, оей. Итак, оператор А — самосопряженный. 2. Оценка собственных чисел. Положительность оператора. Рас- Рассмотрим теперь для этого оператора задачу на собственные зна- значения Ау=Ху или, более подробно, Так как А — самосопряженный в Я оператор, существуют (Nt—1) X X (vV2—1) действительных собственных чисел, а система собствен- собственных функций образует в Н ортогональный базис. 31S
Выпишем в явном виде решение задачи E). Рассмотрим два набора чисел h\ 4 <-;п2 Sln hi и образуем всевозможные суммы вида Къ = К + К, *«=1, 2, .... #„—1, a=l, 2. F) Далее, рассмотрим системы функций -f sin —*- , *! = 1, 2, ..., Nx - 1, x<') = i/t1, t = 0, 1, .... Nu hlNl = ll *,Л = IK / = 0,1, • • ¦, Л^2) h2N2 = /2 и образуем всевозможные произведения вида М**/) = 1Ч Ю^Ю, G) k={kuk2), к,= \,2,...,М,~\, kt=l,2,...,Nt—l, Учитывая результаты § 1, относящиеся к одномерной задаче на собственные значения, можно простой подстановкой чисел F) и функций G) в уравнение E) убедиться в том, что при каждом k= (k,, k2) число ^e^e_s,n-—+_8,п«-^-- (8) является собственным числом пятиточечного разностного операто- оператора Лапласа A), которому отвечает собственная функция 2 я*!* nkdp V* (хи) = V-kj^ (хц) = —=- sin —— sin —— . (9) У nh h '2 Индексы k={ku k2) и т= (mi, m2) назовем совпадающими, и обозначим k = m, если й,^т,, й2=т2 и несовпадающими {к)—в противном случае. Покажем, что при кфт функции и цт являются ортогональными, т. е. (\ih, \xm) = 0 при кфт. По 319
определению имеем ) f /=1 Согласно замечанию на стр. 314 в § 1, по крайней мере одна из сумм, стоящих в круглых скобках, равна нулю при кфт. Ана- Аналогично доказывается, что норма функции (9) равна единице. Та- Таким образом, система функций {nk1ka{Xij)}k11^=^~1 образует ортонор- мированный базис в пространстве Н и числа Xhlhl, определенные со- согласно (8), составляют при &;= 1, 2, ..., Nt—1, кг= 1,2, . .., N2—1 весь спектр оператора А. Пользуясь результатами § 1, относящимися к оценкам собствен- собственных чисел одномерной задачи, получаем, что все собственные чис- числа (8) удовлетворяют неравенствам Ч Ч Наименьшее и наибольшее собственные числа iih.> я/г, (Ю) --cos.5r. (И, Так же, как и в § 1, получаем оценки для энергии оператора Заметим, что согласно D), , у)=2 ^ 21 sfti S § 3. Исследование устойчивости и сходимости схемы с весами для уравнения теплопроводности 1. Исходная задача и разностная схема. Схема с весами для уравнения теплопроводности рассматривалась в § 4 гл. 1, где была исследована ее погрешность аппроксимации и найдены необходи- необходимые условия устойчивости. В настоящем параграфе дано полное исследование устойчивости и сходимости схемы с весами и получе- получены оценки погрешности. Будем рассматривать первую краевую задачу для уравнения теплопроводности u@,/)=u(/,0 u(x,0)=uQ(x), 320
Введем сетку солт=(й/1Хсог, где ak = {Xi = ih, t = 0, I, ..., N, hN = l), сох = {^ = пт, n = 0, 1, ..., K, Kr = T}, и обозначим у" = y(xu tn), Дифференциальную задачу A) заменим на сетке шьт разностной задачей + {\-а)уп-хЛ+^1, B) t=l,2 N—l, /z = 0, 1 К— 1, где а — число и <р™ — сеточная функция, заменяющая функцию /(jc, ^). К уравнениям B) следует добавить разностные начальные и граничные условия # = 4ft = 0, я= 1, 2 /С— 1, C) # = uo(*f), i = 0, I, ..., N. Разностная задача B), C) называется схемой с весами для уравнения теплопроводности. Точность этой разностной схемы ха- характеризуется погрешностью г? = у?—u(xit /„). Для погрешности получаем задачу i=l,2,...,tf-l, n = 0, 1 /С—1, D) где гр™ = — u"ti + ouj^1, + A — a) u^x . + <p? — погрешность аппро- аппроксимации схемы B), C) на решении задачи A). В § 4 гл. 1 было показано, что при надлежащем выборе Ф? справедливы соотно- соотношения ф? = О (т2 + Л4) при a- = a, = - — — , т v -г ; у * 2 12т i|j? = О (тг + Л2) при a = 0,5, ipi = О (т + /г2) при a =7^= a», a =^=0,5. В настоящем параграфе мы получим оценки решения разност- разностной задачи B), C) через начальные данные У° и правую часть <р", выражающие устойчивость схемы по начальным данным и по пра- правой части. Из этих оценок будут сразу следовать оценки погреш- погрешности z} через погрешность аппроксимации ф", характеризующие сходимость и точность схемы B), C). 11 А. А. Самарский, А. В. Гулин 321
Для того чтобы схемой B), C) можно было пользоваться, не- необходимо, чтобы уравнение B) было разрешимо относительно у"+1. Введем оператор, уже рассмотренный в § 1, а именно оператор второй разностной производной = -y-xx,i> 1"=1.2, .... N-l, yo = yN=0. E) Тогда схему B), C) можно записать в операторном виде ^^ = q>n, у°=-и°, F) где у" = (у?, уп2, ..., ynN-,)T, <р» = (Ф?, .... ф^O", Ы"= (Ыо (Xl), ио(хг), ..., uo(xN-i))T, или, что то же самое, в виде "+1= (?— A— о где Е — единичный оператор. Разрешимость уравнения F) относи- относительно yn+i эквивалентна обратимости оператора В — Е + огА. Опе- Оператор В будет иметь обратный, если потребовать 1 + охкк>0, k=\, 2, ..., N— 1, G) где Xk>Q — собственные числа оператора E). В дальнейшем всегда будем предполагать, что неравенство G) выполнено. Заметим, впро- впрочем, что условие разрешимости G) следует из полученного далее условия устойчивости схемы B), C). 2. Устойчивость схемы по начальным данным. Переходя к иссле- исследованию устойчивости схемы B), C), будем искать ее решение в виде разложения по ортонормированному базису {ji*}feii собствен- собственных функций оператора E). Явный вид собственных чисел и соб- собственных функций (гй дается формулами A2), A4) из § 1. При каждом п решение yi =y(xu tn) можно представить в виде [ik(Xi). (8) Правая часть ср? уравнения B) также допускает разложение N-l ^ Ф {xt, tn) = 2 Ф* (*л) И* (*<)• (9) k=l Здесь ch(tn), yh(tn) —коэффициенты Фурье функций y(xb tn), у(хи tn) соответственно. Подставляя (8) и (9) в уравнение B) и учитывая, что (\ih(x)OZ,i=—кк\1к(х{), получим k=i + (l-a)lkck(tn)-yk(tn)l = O. В силу линейной независимости функций цк(х) отсюда следует ра- 322
венство нулю выражений, стоящих в квадратных скобках, т. е. « = 0, 1,..., К— 1, ?=1,2, ...,N—1. Уравнение A0) при каждом й представляет собой разностное уравнение первого порядка относительно c{n) = ch{tn). Чтобы выде- выделить единственное решение, надо задать начальное условие cft@) = Из уравнения A0) получаем где tn+i) = qkCk (tn) + l *x <{>k (tn), (И) Выражение, стоящее в знаменателе, положительно согласно G). Учитывая (8) и A1), представим решение r/"+1 задачи B), C) в виде Обозначая N-1 ?+l = 2 4kCk ^ + тзг-г ^ (/ге) ^& (^- A3) получим, что^+1 = ^?+1+уГ. Оценим по отдельности нормы функций г/"+| и yn+i. Из A4) в силу ортонормированности базиса {цк} получаем и, следовательно, l (с* (<„))•) max | <7*l= I^|| max \qk\. Потребуем, чтобы выполнялось условие |<7*I<1. k=\, 2, ...,N-\. A6) Нетрудно видеть, что A6) эквивалентно условию 11* 323
где tav-i=— cos2- наибольшее собственное значение операто- оператора E). Условие A7) будет выполнено, если потребовать о 3s-!—*-. A8) 2 4т Заметим, что из A7) при любом k=\, 2, ..., N—1 следует не- неравенство т. е. неравенство G). Итак, если выполнено A8), то справедлива оценка ИГ+11К№1. A9) По существу, эта оценка означает устойчивость схемы B), C) по начальным данным. Действительно, если в уравнении B) Ф? = 0, то у1+1 = у1+\ и из A9) получаем что означает устойчивость схемы B), C) по начальным данным в норме Таким образом, приходим к следующему выводу. Если пара- параметры схемы B), C) связаны неравенством A8), то схема устой- устойчива по начальным данным и при любых у°^Н для решения зада- задачи B), C) с ф?=0 справедлива оценка \\уп+1\\^\\у°\\, я = 0, 1 К—1, где норма \\y\\ определена согласно B0). Заметим, что неравенство A8) совпадает с полученным в § 4 гл. 1 необходимым условием устойчивости схемы B), C). 3. Устойчивость по правой части и сходимость. Чтобы оценить функцию yn+i (см. A5)), усилим условие A8) и потребуем выпол- выполнения неравенства с постоянной ее@, 1). Тогда ст^ 1—S , и при любом k= = 1,2,..., N— 1 получим , , Th О ~Е)Ч A-е) Яд, . Z KN-i %-i 324
т. е. 1+от.Аь^еХ). Из разложения A5) получаем « уп+1 р = 2 tttW" (ч* ('rt)J < i- S( 4=1 следовательно, Если о^О, то условие B1) становится лишним, так как и оценка B2) выполняется с е=1. Из неравенства треугольника и оценок A9), B2) получаем неравенство ' \\уп"Ш\уп\\+j\\r\\, B3) справедливое при п=0, 1, ..., 7(—1. Суммирование B3) по п при- приводит к оценке которая означает устойчивость задачи B), C) по начальным дан- данным и по правой части. Из оценки B4), учитывая условие тя^Т, получим тахЦср'Ц. B5) Итак, если выполнено условие B1) с ее@, 1), то схема B), C) устойчива по начальным данным и по правой части, причем для ее решения справедлива оценка B5). Если аГ^О и выполнено условие A8), то справедлива оценка B5) с е=1. Из оценки B5) и требования аппроксимации следует сходи- сходимость схемы B), C). Для задачи D) оценка B5) принимает вид ll^i ||s?- max || ф'Ц. B6) 6 ^/^ Следовательно, ||2'1+1|1 имеет тот же порядок малости, что и по- погрешность аппроксимации. В частности, при а=о.= , Ф« =/(*, /в+и) + ^Г(Х1, *„+-/,)+О (т2+М) имеем а условие устойчивости B1) выполнено с е = 2/3, поэтому ||2п+1|| = = О(т2 + Л4), т. е. схема имеет второй порядок точности по т и чет- четвертый— по п. Если а=0,5, ф? =f{xu tn+i/2) +O(x2 + h2), то условие устойчивости выполнено при любых тиЛи ||2"+1|| = О(т2 + Л2). При остальных значениях о имеем |!271+1|| = 0(т + /г2), если выполнено B1) с ее@, 1), или если а^О и выполнено A8). 325
4. Схема с весами для двумерного уравнения теплопроводности. Пусть область G — прямоугольник {0<ха</а, а=1, 2} с границей Г. В области Q = Gx@, T] рассмотрим первую краевую задачу для двумерного уравнения теплопроводности ? = -^ + ?!L (xlt*,.0<=<2, Ы дх\ дх\ и (хи Х2, 0) = «„'(*!. *г)> (*ь хг) ^ G, B7) u (*lt х„ 0 = 0, (*ь хг, t) <= Г х @, Т]. Оператор Лапласа аппроксимируем так же, как и в § 2, пятиточеч- пятиточечным разностным оператором. Для этого введем сетку Qh по про- пространственным переменным следующим образом: а* = {хц = «», *<'>) | xf = i/ij, х</)=jh2, г = 0, 1, ..., /Vb / = 0, 1, .... Л^2> haNa = la, a=l,2}. Множество точек сетки Qh, принадлежащих Г, будем обозначать через fh, а множество внутренних точек — через ah, так что fift= = соЛиЧл- Определим на Qh разностный оператор АУЧ = — УцлМ - У-Х1ХгЛГ хч е со,, г 1- B8) По переменной t введем равномерную сетку <ot={<n = rtT, л = 0, 1 /С. /Ст = 7} и обозначим yr}j = y(x'^, x'<J\ tn). Дифференциальную задачу B7) аппроксимируем разностной схемой с весами - о) А\ГЦ =0, (=1,2, ....Л^-1, / = 1,2, .... ЛГа— 1, п = 0, 1, . - -. /С— 1, B9) {/^ = 0, «ySYfc. «=1,2, .... /С. j При а=0 получаем явную схему, для которой решение y}fl вы- выражается явным образом через значения г/",. Если 0=^0, то схема неявная и для нахождения у1}х требуется решить систему двумер- двумерных разностных уравнений. Методы решения таких систем будут изложены в гл. 5, а один из методов рассматривается в § 6 настоя- настоящей главы. Схема имеет второй порядок аппроксимации по h и первый по т (за исключением случая о = 0,5, когда по т также вто- второй порядок аппроксимации). Рассмотрим вопрос об устойчивости схемы B9) по начальным данным. Исследование устойчивости проводится точно так же, как 326
и в одномерном случае с помощью метода разделения переменных. На самом деле даже нет необходимости повторять проделанные ра- ранее выкладки. Достаточно заметить, что основные результаты об устойчивости схемы F) не зависели от конкретного вида операто- оператора А, а использовали только следующие его свойства: 1) существование полной ортонормированной системы собствен- собственных функций, 2) положительность всех собственных чисел и знание верхней границы Xmaz спектра. При этих условиях было доказано, что схема F) устойчива по начальным данным, если весовой множитель о удовлетворяет нера- неравенству aSs- — . C0) 2 тЛтах Обратим внимание на то, что схема B9) имеет тот же вид, что и схема F) с ф" = 0, однако оператор А определяется теперь по-ино- по-иному, а именно в соответствии с формулами B8). Как было показа- показано в § 2, оператор B8) обладает перечисленными выше свойствами 1) и 2), причем для него maxCOS + cos< + _ h\ 2k ^ А» 2k Aj A» Условие устойчивости C0) будет выполнено, если 2 та h\ h\ Таким образом, схема B9) устойчива по начальным данным при условии C1). Устойчивость здесь понимается как выполнение при любых начальных данных оценки \\уп\К\\у°1 л=0, 1,.,.,/С—1, где 1=1 ;=1 Аналогично исследуются устойчивость схемы B9) по правой части и ее сходимость. Если о=0,5, то схема B9) имеет второй порядок точности по г и по п, при остальных о — первый порядок точности по т и второй — по h. Условие C1) становится более наглядным, если сетка Qh — квадратная, т. е. hi = h2 = h. Тогда неравенство C1) принимает вид В частности, явная схема (о=0) устойчива при условии -—^ —, А2 4 которое является еще более жестким, чем в одномерном случае. 327
Неявные схемы с о^0,5 абсолютно устойчивы, однако в отличие от одномерного случая решение неявных двумерных разностных уравнений представляет значительные трудности. 5. Асимптотическая устойчивость. Проведение расчетов на со- современных быстродействующих ЭВМ предъявляет к разностным схемам наряду с обычными требованиями аппроксимации, устойчи- устойчивости и сходимости ряд дополнительных требований. Эти требова- требования сводятся к тому, что разностная схема должна хорошо модели- моделировать характерные свойства исходного дифференциального урав- уравнения в условиях, когда шаги сетки остаются конечными. Так, при решении уравнений параболического типа на больших отрезках времени существенное значение имеет свойство асимптотической устойчивости разностной схемы. Поясним понятие асимптотической устойчивости на примере разностных схем для уравнения тепло- теплопроводности ди д2и C3) и@,/)=и(/,0 = 0, и(х, О) = ио(х), O Как известно, решение этой задачи можно записать в виде ряда > = l/4^,s*sin-^<f4 C4) !==~~~i собственные значения оператора второй произ- производной и 1С , . . nkx , у u0 (x) sin —-— dx о — коэффициенты Фурье функции иа(х). С ростом t гармоники nkx Uk = Скв Sin при k>\ затухают быстрее, чем первая гармоника, так что при больших значениях t имеем и(х, t) ~сл[-{ e~ht sin~ . C5) Для среднеквадратичной нормы решения задачи C3) из C4) следует оценка 528
Далеко не всякая разностная схема, устойчивая и аппроксими- аппроксимирующая задачу C3), обладает свойствами, аналогичными C5), C6). Рассмотрим семейство схем с весами ynti = ay^\+{\-a)yl ., 1 = 1,2, ...,#—1, « = 1,2 ' XXtl XX,I C7) #'о=^ = °. # = ««(*). аппроксимирующее задачу C3). Потребуем, чтобы для решения разностной задачи C7) выполнялась оценка '"|k||, C8) / N-i у/, где tn = m, ||г/[| = ( ^h{y1) и 8 = 6(т, h)-+\{ при т^О, /г->0. Свойство, выраженное неравенством C8), будем называть асимптотической устойчивостью разностной схемы. Заметим, что устойчивость в обычном смысле определяется как выполнение оцен- оценки C8) с 6 = 0. Получим условия асимптотической устойчивости схемы с веса- весами C7). Как было показано ранее, из представления A4) для ре- решения задачи C7) следует оценка max M№1. C9) lfe/V где и Х^1'—собственные значения оператора второй разностной произ- производной, 0<Я«Л)<С< ...<*,}&. D1) Устойчивость по начальным данным в обычном смысле обеспе- обеспечивается условием |<7*-.|<1, D2) которое можно записать в виде ^^- D3) Исследование асимптотической устойчивости схемы с весами C7) основано на следующей лемме. Лемма 1. Пусть величины qk определены согласно D0), D1) и параметр о удовлетворяет условию D4) Если выполнено неравенство D5) 329-
то ^е@, 1) и Ы k = 2,3,...,N-l. D6) Доказательство. Из D1), D4) следует, что т. е. " 1 + atlf > 0, *= 1,2, ...,#-1. Неравенство D6) эквивалентно выполнению двух неравенств: <7i—#л>0 и ^! + <7А>0. Согласно D0) имеем Ц* >0 6 = 2,3, ..., N—1. Далее, <7i+<7*= (<7i + <7*-i) + (?»—tfw-i), откуда, учитывая условие D5), получим следовательно, Тем самым неравенство D6) выполнено. Из него следует, что <7)>0. Неравенство <7i<l следует из D0), D1), D4). Лемма 1 до- доказана. Заметим, что для неотрицательных о условия D4) всегда выпол- выполнены. Следствие 1. Если выполнены условия леммы 1, то для ре- решения разностной задачи C7) справедлива оценка №Кр"№°11, D7) где Доказательство следует немедленно из оценок C9), D5). Следствие 2. Если выполнены условия леммы 1 и параметр а не вависит от т и h, то схема с весами C7) асимптотически устой- устойчива. Доказательство. Согласно C8) достаточно показать, что р" = е~аЧ D9) где 6=6 (/i, т)->-я2//2 при Т-+-0, /г-»-0. Переписывая равенство D9) в виде 6 = — 1п - , E0) т р 330
получим из D8), что 6 = — 1п — т 1-. отЯ<"> где ц,= xX[h). Заметим, что 1 ~ h2 21 при h-+0 и xX[h)->~0 при т-Я), h-+0. Поэтому из E1) получим и lim 5{h, х)=л2//2, что и требовалось. Х.Л->0 Не представляет труда более подробно выписать асимптотику величины 6 (ft, т) при т-»-0. Имеем б (ft, х) = -i- In - = Я<">- (а2- A - а)«) ^-j + (о»+ A - оK) ^—j _ (о* _ A _ ОL) ^^ + (о5 + A - оM) —-j + О(т*)ш откуда видно, в частности, что б (ft, т)= Х[ '+О(т2) при а=0,5. Таким образом, неравенство D5) представляет собой условие асимптотической устойчивости схемы с весами C7). Его можно переписать в виде неравенства + Т-Г^Ж-<2. E2) 1 + атЯ«'г) Заметим, что из E2) и D4) следует неравенство t5i (ft) "-1 <2 совпадающее с A7) и обеспечивающее устойчивость схемы C7) в обычном смысле. Из E2) получаем, что явная схема (а=0) асимптотически устойчива при условии т<0,5/г2. Чисто неявная схема (а=1) асимптотически устойчива при любых т и h. Симметричная схема- (о=0,5) асимптотически устойчива при условии А//я. E3> ззс
Таким образом, симметричная схема, будучи абсолютно устойчи- устойчивой в обычном смысле, является условно асимптотически устойчи- устойчивой при условии E3). Асимптотическая устойчивость разностной схемы тесно связана с ее точностью. Нарушение асимптотической устойчивости приво- приводит к потере точности схемы на больших временах. Так, в [32] по- показано, что если положить 2 то при больших t решение y(tn, x{) симметричной разностной схе- схемы имеет асимптотику у (/„, х<) « cN-xe*M»» (-1I'-1 sin -^ . Сопоставляя с асимптотикой C5) решения исходной задачи, видим, что решение полностью искажается. Отметим, что в [32] предложена разностная схема для уравне- уравнения теплопроводности, обладающая безусловной асимптотической устойчивостью и имеющая второй порядок точности, однако данная схема не принадлежит семейству схем с весами C7). § 4. Решение разностного уравнения второго порядка методом Фурье Рассмотрим разностную схему У-хх.1=*-и> 1=1,2, ...,N-1, уо = у„=О A) и построим ее решение в виде разложения по базису собственных функций оператора = -y-XXii, i = l,2, ...,N-1, hN = t, yo = yN=0. B) Оператор B) подробно изучался в § 1, где было показано, что он имеет полную ортонормированную систему собственных функций = l/ysin^p, k=l,2, ...,N-\, t = l,2, .... N-l. Соответствующие собственные числа оператора А имеют вид 4 . о — — sin2 nkk Поэтому можно искать решение задачи A) в виде ЛГ-1 У1 = У(х/)= 2 С*М*/). /=1,2, ... , ЛГ— 1, C) k=i где ск— неизвестные пока коэффициенты. 332
Разложим правую часть уравнения A) в сумму Фурье, т. е. представим ее в виде N-l ^ fi= 2 /*М*/). где ?)h, k= I, 2, ... , N-l. D) Подставляя разложения C), D) в уравнение A) при i = j, получим N-l N-l ^ 2 с* О** (*)Ь*./— — S /*И* (*/)• откуда, учитывая соотношение (fi* (x))-xi =— Xk\ik (x,) и линейную независимость функций цк(д;), приходим к уравнениям ck%k=fk, k=l,2, ...,N-l. Отсюда находим значения коэффициентов Фурье функции y(Xj): ] k=l,2, ... ,N-l. E) Таким образом, приходим к следующему алгоритму решения разностной краевой задачи A). Сначала по заданной правой части fi и известным собственным функциям \ik(Xj) вычисляем по форму- формулам D) коэффициенты Фурье правой части. Затем по формулам E), пользуясь тем, что собственные числа известны в явном виде, находим коэффициенты Фурье ch искомого решения у(х^). И, нако- наконец, вычисляя суммы C), находим решение */(*,). Подсчитаем число умножений и делений, необходимое для на- нахождения указанным способом решения задачи A). Для вычисле- вычисления % при каждом k требуется N—1 умножений, а вычисление всех fh, k=l, 2, ..., N—1, требует (N—IJ умножений. Следует под- подчеркнуть, что здесь и далее мы предполагаем все функции nh(Xj) и числа Jife уже вычисленными и хранящимися в памяти машины. Вычисление коэффициентов ch по формулам E) требует N—1 де- делений. Вычисление yt при фиксированном / по формулам C) тре- требует N—1 умножений, а вычисление всех у}, у = 1, 2, ..., N—1 тре- требует (N—IJ умножений. Таким образом, весь алгоритм осуществ- осуществляется за 2(N—IJ умножений и N—1 делений. Вспомним, что уравнение A) можно решить методом прогонки (см. п. 7 § 4 ч. I) по формулам i=l,2, ..., N-l, 0^ = 0, = N— I, N—2,..., 1, yN=0 всего за 2(N—1) умножений и N—1 деление. 333
Следовательно, предложенный здесь метод Фурье неэкономичен, он требует O(N2) действий вместо O(N) действий в методе прогон- прогонки. Пользоваться таким методом для решения одномерных разност- разностных краевых задач нецелесообразно. Однако данный метод в соче- сочетании с методом быстрого вычисления сумм вида C) нашел применение при решении двумерных разностных уравнений с посто- постоянными коэффициентами. Эти вопросы рассматриваются в следую- следующих параграфах. § 5. Быстрое дискретное преобразование Фурье Наибольшее число действий в методе Фурье требуется для вы- вычисления сумм C), D). Эти суммы имеют вид S/=22*sinlT' i=U2,...,N-\, A) k=l где zh— заданные числа. Для непосредственного вычисления всех sh /=1, 2, ..., Л/—1, требуется, как уже отмечалось, (iV—IJ умножений. Сейчас мы, следуя [21], изложим метод вычисления сумм вида A), требую- требующий 0{N\nN) действий умножения. Такое ускоренное вычисление сумм основано на том, что среди чисел sin—- , /;= 1,2,..., N—1, N /=1, 2, ..., N—1, есть много одинаковых. Поэтому можно пере- перегруппировать слагаемые и уменьшить тем самым число умножений. Для дальнейшего удобно преобразовать сумму A) к виду N-l iN-i где полагаем za = zN=zN+i = .. .=22N_, = 0. Обозначим M = 2N и рассмотрим более общую задачу о вычислении суммы М-1 . 2Zlkj М-1 v; =^zke M =2 ад»**7, где .271 w — е м B) и i — мнимая единица. Итак, будем вычислять суммы М-1 0/=2ад«>у, /=о, 1,.... м-1. C) Ясно, что Imwj=Sj для действительных zk. Для дальнейшего суще- существенным является условие Л4 = 2т, т>0, означающее, что число точек сетки N=2m~l является степенью двойки. Представим число k в формуле C) в двоичной системе k = = ko + 2ki + 22k2 + .. . + 2m~'^m_,, где ki либо нуль, либо единица. 334
Обозначим k—(km-u km-2, ..., ka), zh—z(ka, ku ..., km-i). Тогда сумму (З) можно записать в виде *oA ftm_! = S ^"' Г 2 ^2tl/ • • • S V^4™'* (*0, Al, • ¦ • , ^m-x)] . D) L J Преобразуем внутреннюю сумму E) Представим число / в двоичной системе / Тогда получим В этом произведении все сомножители начиная со второго рав- ны единице. Действительно, w m-l'le=w т-1" = ш и, вспо- вспоминая выражение B) для до, получим w"=\,w* *vn-i2/l— I, по- поскольку &m-i/i равно либо нулю, либо единице. Точно так же равны единице и последующие сомножители в произведении F). Таким образом, шг к'п-1' =ш2 *m-i'° и сумму E) можно записать в виде Обозначая эту сумму через z1(/0, fei, ..., km-2), запишем пред- предпоследнюю сумму в выражении D) в виде 2 w^~4^1z1 (/„, К k2 fem_2). G) Представим число 2т-2/гт_2/ в виде 2m-2fem-2(/0 + 2/,)+2т/гт_2(/2 + ... .. . + 2т-3/т_!), откуда получим шат~2*'«-2/= йуат~1'*'п-2<''«+2'''- Следова- Следовательно, сумма G) равна fcm-2=° Далее, аналогичный процесс последовательного вычисления сумм 335
продолжается до тех пор, пока в D) не исчерпаются все суммы. 1 Последняя сумма имеет вид и,= 2 ^*"'2m-i (/о« Л> • • • » /"«-a» ^o)- Итак, можно предложить следующий алгоритм вычисления сумм вида C), называемый алгоритмом быстрого дискретного преобразования Фурье. Числа k и / представляются в двоичной системе где ku j,—либо нуль, либо единица. Далее обозначается zh= = z(k0, ku ..., km-i) и последовательно вычисляются суммы, состоя- состоящие каждая из двух слагаемых: h (/о. *li m—3/ == Яь . . . , Km-2), / / Ь Ч_ VI .^,(/0+2/1+...+2'" 2/m_2) . . . , /m-2i ^o> -1 0"o. A. • • • • /<«-2. feo)- Подсчитаем число умножений, необходимое для нахождения всех сумм Vj, /=0, 1 М—1, при указанном способе вычислений. Функция Zi(/o, k0, ki km-z) используется только при вычисле- вычислении функции 22(/о, /i, k0, ku ..., km-s). При этом необходимо вычис- вычислить значения z^/o, k0, ..., km-z) дважды: при &m_2=0 и йт_2=1. Вычисление z^/o, ka, ..., йт_2) при каждом значении &т_2 требует двух умножений. Следовательно, общее число умножений, требуе- требуемое для вычисления г1(/'о, ka, ..., кт-г), равно четырем. Такое же число умножений требуется для вычисления каждой из сумм zi (/о. /i, • • •» /i-ь ^о, ^i, • ¦ •, &m-i-i). Всего имеется /п таких сумм. По- Поэтому число умножений, необходимое для вычисления у,- при каж- каждом фиксированном /, равно 4т, а для вычисления всех v!t /= = 0, 1, ..., М, это число равно 4тМ = 4М log2M. При больших N=2m~l это приводит к значительному сокращению числа умноже- умножений по сравнению с числом умножений (N—IJ, требуемому при непосредственном вычислении сумм вида A). Так, при jV=128 чис- число умножений будет почти в два раза меньше. 336
§ 6. Решение разностного уравнения Пуассона с использованием быстрого преобразования Фурье В § 1 гл. 2 рассматривалась разностная аппроксимация задачи Дирихле для уравнения Пуассона Ут^.ц + Ут^.ц = - /'/. хч е <оЛ, A) Здесь ah— множество внутренних и yh— множество граничных уз- узлов сетки Qh = {Хц = (хг , х2 ) \х1 = ihlt хг = jh2, i = 0, 1, .... Nlt / = 0, 1, ..., N2, h*Na = la, a=l, 2}. Разностная схема A) представляет собой систему большого числа линейных алгебраических уравнений, матрица которой явля- является сильно разреженной, т. е. содержит значительно больше нуле- нулевых элементов, чем ненулевых (в данном случае в каждой строке матрицы не более пяти ненулевых элементов). Решать такие систе- системы уравнений с помощью численных методов, предназначенных для систем общего вида, нецелесообразно, а часто даже и невозможно из-за большого размера матрицы. Поэтому развиты специальные методы, прямые и итерационные, пригодные для решения двумер- двумерных разностных уравнений. Они подробно рассматриваются в гл. 5, а сейчас мы познакомимся с одним способом решения задачи A), сочетающим одномерную прогонку с методом Фурье. Заметим, что предположение об однородности граничных условий не ограничи- ограничивает общности, так как неоднородные условия Дирихле можно включить в правую часть подобно тому, как это было сделано в начале § 1 для одномерного случая. Рассмотрим одномерную задачу на собственные значения B) /z2W2 = /2, ^0 = ^=0, ц (/) = ц (х?>). В § 1 было показано, что задача B) имеет следующее решение: , C) 2 k=l, 2, ...,#,—1. Зафиксируем какое-либо значение индекса /, 0<?<Л^, и будем рас- рассматривать yiU fij как функции, зависящие только от /, /=1, 2, ... ..., N2—l. Тогда можно разложить yiU fi} по Собственным фуНКЦИЯМ задачи B), т. е. представить их в виде У И = 2 с* (О И* (!) - h = % Ь @ и* (Л. D) 337
Подставляя разложения D) в уравнение A), получим % Н И) (С (i))JiXiii + 2 ск (О {н (/))-w = - 2 h (О I** О"). k=l k=l ?=1 откуда, учитывая уравнение B) и линейную независимость цк, при- приходим к уравнениям (Cft(t))^bi—?wA@ +/Л0 =0. Таким образом, для нахождения коэффициента ск, k=\, 2, ..., N2—1, в разложе- разложении D) получаем систему разностных уравнений второго порядка ck а + и - 2с, (о + ck a - и — hck @ + fk @ = О, E) i=l, 2, ..., Nt—1, ск(О) = ck(Nx) = 0. Здесь числа кк заданы согласно C), а значения fh(i) вычисляются по правилу N,-1 h @ = 2 hJwk (/), t = 1, 2, ... , Wx — 1. F) Уравнение E) решается методом прогонки f + A?f*(O). Таким образом, рассматриваемый алгоритм решения задачи A) состоит в следующем. Сначала по формулам F) вычисляются ко- коэффициенты Фурье правой части }Ф При каждом фиксированном i суммы вида F) можно вычислить для k=l, 2, ..., N2—1 с по- помощью быстрого дискретного преобразования Фурье за число дей- действий 0{N2\nN2), а вычисление этих сумм для всех i=\, 2, ... ..., Nt—1 потребует О(NiJV2InN2) действий. Затем надо решить методом прогонки уравнения E) для k—\, 2, ..., N2—1, что по- потребует O(NiN2) действий. Наконец, зная коэффициенты Фурье ch(i), можно восстановить решение г/„ по формулам yii=%Ck(i)iik(j), i=l,2, ...,#!-1, /=1,2, ...,N2-1, которые аналогичны формулам F) и требуют того же числа дей- действий О(А/,Л/21п^2). Следовательно, изложенный здесь алгоритм может быть реали- реализован за число действий О^Л/^пЛ^). Для сравнения отметим, что обычный метод исключения Гаусса потребовал бы О(№) действий и, кроме того, громадной машинной памяти. Недостатком данного метода является необходимость построе- построения в явном виде собственных чисел и собственных функций одно- 338
мерной задачи. В случае, когда решение задачи на собственные значения в явном виде выписать невозможно (например, для крае- краевых условий третьего рода или в случае переменных неразделяю- щихся коэффициентов), данный метод неприменим. Заметим еще, что рассмотренный метод можно применять и для решения неявных разностных уравнений, возникающих при аппро- аппроксимации двумерных нестационарных задач, подобных тем, кото- которые рассматривались в п. 4 § 3. В этом случае уравнения, анало- аналогичные A), приходится решать многократно (на каждом времен- временном слое), поэтому особенно важной становится экономия числа действий, которую обеспечивает данный метод. ГЛАВА 4 ТЕОРИЯ УСТОЙЧИВОСТИ РАЗНОСТНЫХ СХЕМ В главе 3 уже изучалась устойчивость разностных схем, аппро- аппроксимирующих уравнение теплопроводности. В настоящей главе изучается устойчивость двуслойных и трехслойных линейных раз- разностных схем общего вида. Разностные схемы рассматриваются независимо от тех или иных исходных уравнений и определяются как операторные уравнения с операторами, действующими в евкли- евклидовом пространстве. Условия устойчивости формулируются в виде операторных неравенств. Применение теории к исследованию устой- устойчивости конкретных разностных схем состоит в приведении этих схем к каноническому виду и проверке выполнения операторных неравенств. Параграф 1 носит вспомогательный характер, в нем на приме- примерах поясняется, что разностную схему можно рассматривать как операторное уравнение; при этом корректность схемы определяется не структурой разностного оператора, а его общими свойствами, такими, как самосопряженность и положительная определенность. В § 2, 3 излагаются элементы теории устойчивости двуслойных и трехслойных разностных схем, а в § 4 теория устойчивости приме- применяется к исследованию экономичных разностных схем для много- многомерных задач математической физики. § 1. Разностные схемы как операторные уравнения 1. Представление разностных схем в виде операторных уравне- уравнений. Разностные схемы возникают в результате аппроксимаций той или иной задачи математической физики и предназначены для ее приближенного решения. Поэтому в теории разностных схем важ- важное место занимают вопросы аппроксимации дифференциальных уравнений разностными и сходимости решений разностных задач к решениям исходных дифференциальных задач. Однако будучи построенной, разностная схема превращается в самостоятельный математический объект и может изучаться вне связи с породившей ее дифференциальной задачей. При этом отпадают проблемы 339
аппроксимации и сходимости и остается лишь проблема кор- корректности разностной схемы, т. е. ее разрешимости и устой- устойчивости. Разностная схема представляет собой систему линейных алге- алгебраических уравнений. Ее всегда можно записать в векторной форме Лу = <г, A) где А — матрица системы, у — искомый вектор и ср — заданный век- вектор, определяемый правыми частями разностных уравнений и до- дополнительными (начальными и граничными) условиями. Такая за- запись наиболее удобна для стационарных разностных задач, в слу- случае же двуслойных и трехслойных разностных схем будем исполь- использовать другую форму записи (см. § 2, 3). Уравнение A) можно рассматривать также как операторное уравнение, где А — линейный оператор, действующий в конечно- конечномерном пространстве Н, у — искомый элемент этого пространства и феЯ — заданный элемент. Для разностных схем характерно, что каждая схема определяет не одно уравнение A), а целое семейство уравнений Ahyh=q>h, B) зависящее от шага сетки h. При каждом допустимом значении h оператор Ah действует в конечномерном пространстве Hh. Размер- Размерность пространства Hh зависит от шага сетки h и, как правило, не- неограниченно возрастает при /г—>-0. Приведем несколько примеров записи разностной схемы в виде операторного уравнения B). Чтобы записать конкретную схему в виде B), надо ввести соответствующим образом пространства Hh, определить операторы Ah и задать правые части ср,,. Следующий пример уже рассматривался в § 1 гл. 3. Пример 1. На сетке Qh= {Xi=ih, t = 0, 1, ...,N, hN=l} рассматривается разностная схема УхХ,1 = — /<• '=1,2 N—l, уо = ци yN=ii2. C) Перепишем систему C) в виде ^=^=fi- -УЬ.1 = Ы f-2,3, ...,N-2, D) —»—=fN-1' где fi = fi + \ii/h2, fN-l=fN_i + \xJh2. Введем пространства Я№_, раз- размерности N—1, состоящие из функций у(х), заданных для (oh={xt=ih, i=l, 2 N—l,hN=l}. 340 Недостатком данного метода является необходимость построе- построения в явном виде собственных чисел и собственных функций одно- 338
Определим в HN-l оператор А и вектор ф следующим образом: = -у-ххЛ, i = 2,3,...,N-2, E) л2 ф1 = /1, ф1=/1, i = 2, 3, ..., N—2, фж_1 = ^_1. F) Тогда разностную схему D) (или, что то же самое, разностную схе- схему C)) можно записать в операторной форме A). Матрица этого оператора является симметричной и трехдиагональной. Например, для случая jV = 6 она имеет вид 2 1 0 0 0 J 2 — 1 0 0 0 —1 2 — 1 0 0 0 —1 2 — 1 0 0 0 — 1 2 Возможно и несколько иное определение оператора А, позво- позволяющее записать выражения для его компонент единообразно во всех точках сетки со,,. Пусть #!v-i—подпространство функций, за- заданных на сетке Qh и обращающихся в нуль при t = 0, i=N. Вве- Введем оператор А, действующий из tf^-i в HN-l и определенный фор- формулами = — y-Xii, t=lf2, .... N—l, */„ = */„ =0, G) и зададим вектор ф согласно F). Тогда по-прежнему разностную схему C) можно записать в виде Л</=ф, где у^Н%-и феЯ»-!. Такое определение оператора А мы уже использовали в § 1 гл. 3. Подчеркнем, что формулы E) и G) определяют, по существу, один и тот же оператор. Разностные схемы для многомерных задач также можно пред- представить в операторной форме A). Пример 2. В области G@<;ta</a, a=l, 2) введем сетку i = 0, 1, ... , Nlt / = 0, 1, ... , Nt, hlN1 = l1, h2N2^l2}. Пусть yh — множество узлов сетки Qh, принадлежащих границе об- области G и сол — множество внутренних узлов сетки Qh. Рассмотрим разностную схему, аппроксимирующую уравнение Пуассона Уы.Ч + УЪьм = - f<l* если х" е ^ (8) Уи =0, если хц^ун. Пусть tf(Qft) и Я(сол) —линейные пространства функций, задан- заданных соответственно на сетках Qk и coft. Введем также подпростран- подпространство H°(Qh) функций, заданных на Qh и равных нулю на yh. Размер- 341
ность этого подпространства совпадает с числом внутренних узлов сетки fih и равна (jV4—1)(jV2—1). Задаче (8) соответствует опера- оператор А, действующий из H°(Qh) в Я(озЛ) и определенный формулами {Лу)ц = — y-Xiij — у-Хг1/, если хц := cuft; у I, = О, если xtf S Va. (9) Разностную схему (8) можно записать в виде A), где оператор А определен согласно (9), а компоненты вектора cpe//(cuh) задают- задаются формулами ф« = ф(*ц) =/ц, если ^еак. Свойства оператора (9) подробно изучались в § 2 гл. 3. Можно было бы, так же как и в примере Ч, определить оператор А как опе- оператор, действующий из Я(сол) в #(шл). Однако в данном случае это привело бы к громоздким формулам. Например, только на одной части границы при t=l надо было бы задать значения оператора А формулами -2- - *w,' У = 2. 3, .... iV, - 2, (Ау)и = к к _ ^ Поэтому удобнее использовать определение (9) оператора А. Если краевые условия (8) неоднородные, то, по аналогии с примером 1, ме- меняем правую часть в приграничных узлах. 2. Корректность операторных уравнений. Рассмотрим семейство операторных уравнений B), где Ah — линейный оператор, дейст- действующий в конечномерном линейном пространстве Hh. Предположим, что в пространстве Hh заданы нормы ll-ll(ih) и II-Над, в которых измеряются, соответственно, решение уравнения B) и его правая часть. В соответствии с определениями, введенными в § 6 гл. 1, бу- будем называть уравнение B) корректным, если 1) решение уравнения B) существует и единственно при любых // 2) существует константа А^Х), не зависящая от Л и такая, что при любых фЛеЯЛ выполняется оценка МЦ^м.ыи,. (Ю) Как уже отмечалось, условие 1) эквивалентно существованию оператора А'й.1, а условие 2) — равномерной по h ограниченно- ограниченности А1\ Замечание. Свойство 2), выраженное оценкой A0), называется устой- устойчивостью разностной схемы B). Вообще, устойчивость какой-либо задачи озна- означает, что при небольшом изменении входных данных решение изменяется мало. Таким образом, для исследования устойчивости необходимо рассматривать урав- уравнение, которому удовлетворяет погрешность, возникающая в результате возму- 342
щения входных данных. Однако в случае линейного оператора Аь. структура урав- уравнения для погрешности та же, что и основного уравнения B). Поэтому при ис- исследовании устойчивости достаточно ограничиться оценкой A0). Действительно, рассмотрим наряду с B) уравнение отличающееся от B) правой частью. Для погрешности 2h=yh—Vh получим уравнение где 6фл = фл—ф',1' — возмущение правой части. Если выполнена оценка A0), то следовательно, |[2ft|A/]) -> 0 при ||бфй||Bл) -+0 и задача B) устойчива. Нетрудно получить некоторые достаточные условия корректно- корректности. Предположим, что Hh — вещественное конечномерное про- пространство, в котором введены скалярное произведение (у, y)fc и норма || у \\h—У (у, у)к- Справедливо следующее утверждение. Если существует постоянная б>0, не зависящая от h и такая, что при любом оЛеЯЛ выполнено неравенство 8||t/h||J!, A1) то уравнение B) корректно и для его решения выполняется оценка ML A2) Чтобы доказать существование и единственность решения уравнения B), достаточно убедиться в том, что однородное урав- уравнение Ahzh = 0 A3) имеет только тривиальное решение zh = 0. Пусть zh — решение уравнения A3). Тогда согласно A1) имеем откуда получаем ||zfc|U=0 и, следовательно, zh=0. Докажем оценку A2). Согласно условию A1) для решения уравнения B) справедливо неравенство Применяя неравенство Коши — Буняковского, получаем, что Отсюда немедленно следует оценка A2). Отметим связь условия A1) с оценками собственных значений оператора ЛЛ. Если выполнено условие A1), то все собственные зна- значения оператора Ah — действительные числа, причем для минималь- минимального собственного числа выполняется оценка ^!. A4) 343
Действительно, пусть X — любое собственное число оператора Ah и \i — отвечающая ему собственная функция, Ah\i — X[i. Тогда со- согласно A1) имеем и, следовательно, ^ Для самосопряженного оператора Ah верно и обратное: из усло- условия A4) следует выполнение неравенства A1) при любых оьеЯЛ. В данном случае любой элемент vh^Hh можно разложить по орто- нормированной системе {цй} собственных векторов оператора Ah: и получить, что (Akvh, vh) = k Таким образом, можно сформулировать еще один признак коррект- корректности. Пусть Ah — самосопряженный оператор и ^mln — его минималь- минимальное собственное число. Если выполнена оценка A4) с постоянной 6>0, не зависящей от h, то уравнение B) корректно и для его ре- решения справедлива оценка A2). Вернемся к примерам, рассмотренным в п. 1. Введем в простран- пространстве Я^ (см. пример 1) скалярное произведение {У, v) = 2 yVih и норму Тогда, как было показано в § 1 гл. 3, оператор G) является само- самосопряженным в #л/-1 и для его минимального собственного числа справедливо неравенство A4) с константой 6 = 9//2. Таким образом, разностная задача C) корректна и для ее решения выполняется оценка A2), где функция <р определена согласно F). В случае схемы из примера B) скалярное произведение и нор- норма в #°(Qft) определяются как Л/,-1 Nr-i (у, v) = 2 к 2 hj/tpi,, \\y\\ = Via, у). Оператор (9) является самосопряженным и для его минимального собственного числа выполнена оценка A4) с константой б= 9//J-f- -4- 9//а (см. § 2 гл. 3). Следовательно, разностная схема (8) кор- 344
ректна и для ее решения справедлива оценка Иногда оценок вида A2), в которых решение и правая часть вы- вычисляются в одной и той же норме, бывает недостаточно для до- доказательства сходимости и выяснения порядка точности разностной схемы. В то же время оценки вида A0) со специально подобранной нормой правой части|фл|Bл) позволяют получить правильное пред- представление о порядке точности разностной схемы. Приведем соответствующий пример. Пример 3. В § 3 гл. 1 изучалась разностная схема для задачи (k(x)u')'—q(x)u(x) +/(x)=0, 0<х</, —k @) и' @)+ аи @)=р.ь u(/)=ji2, Было показано, что разностная схема C), D) из § 3 гл. 1 имеет второй порядок точности. Выпишем уравнение, которому удовлетворяет погрешность Zi = t/i—u(xi) (сетка ОЛ — та же, что и в примере 1): (аг-х)х, i—diZi = — \|)i, —OiZi, o + 02o=Vi, ZN=0. A5) Здесь 4>i = O(A»), v, = O(A'), i=l,2 N-l, fli>c,>0, i=l, 2 N, ^=ff+0,5 hda, di^O, i = 0, 1, ..., N—\. Попытаемся применить условие A1) к оценке решения задачи A5). Запишем схему A5) в операторном виде Лг=ф. Для того чтобы матрица оператора А была симметричной, перепишем разностное граничное условие в виде г _^_ — 2а = —— . Тогда оператор А и правая часть ty определяются следующим образом: (Аг) ¦ = - (аг-)Хг[ + dczit I = 1, 2, ... , Л' - 1, Введем линейное пространство Hffl функций, заданных на Qn и равных нулю при i=JV, и зададим скалярное произведение и норму (У, о) =2%% 1*1= Вычислим для оператора A6) и произвольного u e Я^' скалярное произведение (Av, v). По определению имеем N-l N-1 (Av, v) = - o^i-o + т>1 - ^ Л (ay-)*,»wi + 2 М'-и<- i=i t==i 345
Ранее было показано, что при ая = 0 справедливо тождество (см. A6) из § 3 гл. 1) jV-1 N «iy,,oyo+ 2 hiavi>x,fli = - 2 <M°j/A- i=l t'=l Поэтому M N-\ N (Аи, v) = 2 м°г/л+й;+ 2 *^>otj+ 2 4(^/- i=l ' i=l i=l Отсюда при a$sO, ai^Ci>0, i=l, 2, ..., N, получим оценку (Av, a)>Cl ^ Му- р2. A8) i=i Оценим снизу правую часть неравенства A8) через среднеквадратичную норму / N-1 \1/2 о к ц= 2 hvn \i=o Напомним, что согласно оценке A7) из § 3 гл. 1 при любых обЯ'у' справедливо неравенство N где Иг,о , = max \vt\. С другой стороны, для среднеквадратичной нормы A9) имеем 1u'|2) S Л ='«uiW Отсюда и из неравенства B0) получим N 2 h(v- i=i и, учитывая A8), приходим к оценке (Av. v Следовательно, для оператора A6) справедливо неравенство A1) с константой 6=Ci/~2, а для разностной схемы A5) выполняется оценка A2): B2) Для сеточной функции A7), учитывая, что vl = O(hi), имеем N-1 Ж2= 2 ^i + vJ/A = O(A»), 1=1 так что ||i|)|| = O(A3/2) и неравенство B2) приводит к оценке \\z\\ = O(h3'*). Такое понижение порядка точности по сравнению с доказанной в § 3 гл. 1 точностью O(h2) вызвано неудачным выбором нормы правой части i|). Если в качестве нор- 346
мы взять, например, Л'-1 uHiA)= 2Аи>'|. B3) то для функции A7) получим Л/-1 B4) Однако оценка A2) не позволяет использовать норму B3). Поэтому можно поступить следующим образом. Умножая уравнение Az=ty скалярно на г, полу- получим тождество (Az, z) = (i|), г). B5) Оценим правую часть этого тождества следующим образом: Л-1 1=0 Левая часть тождества B5) оценивается снизу согласно неравенствам A8), B0): (Аг, г)>с1ГМ| Таким образом, для схемы A5) справедлива оценка Из оценки B6), учитывая B4), получаем, что|2||С(й) =O(h2). Кроме того, из B6) и B1) получаем, что \\z\\ = O(h2). 3. Операторы первой разностной производной. На сетке ЙА= {Xi = ih, i = 0, I, ..., N, hN = l) рассмотрим разностное уравнение первого порядка yi~h~l =ф'' i=l'2' ¦¦¦'N' ^o = Hi- B7) Введем пространство Н„ функций, заданных на сетке <ah={x{ = ih,i=l, 2, ...,N,hN = l}, и определим в HN скалярное произведение N (У, v) = ^ У&Ь- 1=1 Зададим оператор А формулами ^ = У'~и'-1 , t = 2,3, ...,N. B8) ft 347
Тогда уравнение B7) можно записать в виде Ау = ср, где q>= (и *\г Ф! + —, <р2, ... , фд,) . Оператор Л, определенный формулами B8), называется оператором левой разностной производной. Мат- Матрица этого оператора имеет вид (для определенности полагаем здесь jV = 5) о 0 о 0~ —1 10 0 0 0—1 1 0 0 0 0—1 10 .0 0 0 —1 1_ Найдем оператор А*, сопряженный оператору B8). По определению имеем N N (Ay, v) = 2 (Ay)i Vih = r/i^j + 2 (Уi — yi-i) vc = 1=1 1=2 N JV-i jV-i v v 0 ¦ — У, l/^i+i = — У, У1 -tj±-, ~h +Ум -7Л. Следовательно, оператор А' задается формулами (A*v)i = ———, i = 1, 2, ... , N — 1, (A'v)N = — . B9) \ ii h v in h \ i Оператор B9) называется оператором правой разностной произ- производной. Матрица оператора B9) является транспонированной по отношению к матрице оператора B8). Вычислим скалярное произведение (Ау, у) для оператора B8). Обозначим </i,j = ((/i—yi-,)/h и заметим, что справедливо тожде- тождество Тождество C0) доказывается непосредственной проверкой. Из B8) и C0) получаем (Ay, j,) = d + 1 2 О/;.;J А = Полагая формально о = О, получим . у)={ 2 (^. | 2 1=2 = о. 348
Из неравенства C1) следует, в частности, что оператор B8) поло- положительный: (Ау, </)>0 для всех y<=HN, уфО. Действительно, {Ау, у)^0 для всех y^.HN. Если {Ау, у)=0 для некоторого г/ = = (г/!г/2. ¦ -УпУ, то yl = yN = 0,y-i = 0, т. е. yt = 0, i=\, 2, . .., N. § 2. Канонический вид и условия устойчивости двуслойных разностных схем 1. Канонический вид двуслойных разностных схем. Общая за- запись разностных схем в виде операторных уравнений Ahyh=*ph, удоб- удобная для стационарных задач, оказывается недостаточно детальной при переходе к нестационарным разностным схемам. Поэтому при исследовании двуслойных и трехслойных разностных схем исполь- используются другие канонические формы записи. Пусть, как и прежде, задано семейство конечномерных линей- линейных пространств Hh, размерность которых зависит от параметра h. Параметр h считаем вектором с нормой \h\. В приложениях к кон- конкретным разностным схемам пространство Hh состоит из функций, заданных на пространственной сетке Q,,, характеризующейся ша- шагом h. На отрезке [0, 7] введем сетку по времени @т= {tn = nr, п = 0, 1, . .., К, Кх = Т} с шагом т>0 и будем рассматривать функции y(tn)^Hh дискретно- дискретного аргумента („еа, со значениями из пространства Hh. Функции y{tn)^Hh могут зависеть параметрически от h и т, y{tn)=yh,x{tn). В дальнейшем будем обозначать уп = Уи,хУп) ¦ Пусть заданы линейные операторы Ви В2, действующие в Hh, и функция ф„еЯЛ. Двуслойной разностной схемой называется се- семейство операторно-разностных уравнений первого порядка Btyn+i+B2yn = (pn, га = 0, 1, .. .,/С—1, уй^Нк задан. A) Учитывая тождество Уп+i — Уп "Г " получаем, что любую двуслойную разностную схему можно запи- записать на сетке мт в виде В Уп+1~Уп +Ауп = ч>п, л = 0, 1, ...,/С—1, yo^Hh задан, C) где А и В — линейные операторы, А = f^+Ba, В = тВ^ Каноническим видом (или канонической формой) двуслойной разностной схемы называется ее запись в виде C). Поскольку одну и ту же разностную схему можно записать мно- многими способами, введение единообразной канонической формы за- записи облегчает анализ и сравнение различных схем. По форме записи схема C) напоминает абстрактную задачу Коши для 349
дифференциальных уравнений ^- at В случае конкретных разностных схем оператор А обычно пред- представляет собой аппроксимацию пространственного дифференциаль- дифференциального оператора «я?, а оператор В задает ту или иную разностную схему. Поэтому запись схемы в виде C) часто упрощает проверку аппроксимации. В дальнейшем мы убедимся в том, что условия устойчивости двуслойной разностной схемы удобно формулировать в терминах свойств операторов А и В. Приведем несколько примеров. Пример 1. Рассмотрим схему с весами для одномерного урав- уравнения теплопроводности (см. § 4 гл.1) »=1, 2 N—\, n = 0, 1, ...,/C-l, i,on+1 = i&+l = 0, y°t=Uo(Xi). Приведем схему D) к каноническому виду A). В качестве про- пространства Hh возьмем множество Н^ действительных функций, заданных на сетке Qh= {Xi = ih, t = 0, 1, ..., N, hN = l) и обращающихся в нуль при t' = 0, i=N (операции сложения и ум- умножения на число задаются обычным образом, т. е. покоординат- покоординатно). Определим оператор А (оператор второй разностной производ- производной) формулами = — y-xxJ, » = 1, 2, ... , N—l, yo=yN=0. E) Обозначим через </ne H^U вектор yn = {yl, yl, .. . , t/li-xf, где yf =у(х{, tn). Тогда разностную схему D) можно записать в опера- операторном виде р) Ауп = который еще не является ее каноническим видом. Для того чтобы перейти к каноническому виду C), достаточно воспользоваться тождеством B), откуда получим, что В — Е-\-охА. Таким образом, разностная схема D) записывается в канониче- каноническом виде C), где ср„ = О, оператор А определен согласно E) и В = Е+отА. Пример 2. На той же сетке, что и в примере 1, задана раз- разностная схема 0Г+1 = ОЖ« + Ум), G) i=l,2, .... JV-1, п = 0, 1, ..., K—l, у? = ио(х1). 350
Приведем схему G) к каноническому виду C). Прежде всего пе- перепишем ее в виде или Поделив последнее уравнение на 0,5/г2, убеждаемся в том, что схе- схема G) представляет собой частный случай схемы с весами D), когда о=1, х = 0,5/г2. Следовательно, схема G) имеет канонический вид C), где оператор А определен согласно E), В = Е и т = 0,5й2. Замечание 1. Операторы А, В в схеме C) могут зависеть от т, ft и tn, так что A=Ah, т((п), В = Вл,г('п)- Функция срп зависит, вообще говоря, от т и А, ф„ = фл, т(^). Замечание 2. Если сетка шт неравномерная, u>%={tn, я = 0, 1, ¦.., К, to=O, tK = T) с шагами in+i = tn + {—tn, и=0, 1, ..., К—1, то в качестве канонической формы двуслойной схемы можно взять уравнение в———+ ^„ = ф„, я = о, 1, ... , к-1. Замечание 3. Канонический вид двуслойной разностной схемы по фор- форме записи аналогичен одношаговому итерационному методу решения системы ли- линейных алгебраических уравнений Ау = <р (8) (см. § 1 гл. 2 ч. II). Такая аналогия не является формальной, поскольку переход от уравнения (8) к итерационному методу В можно трактовать как замену стационарного уравнения (8) нестационарным уравнением (9). Отличие итерационного метода (9) от разностной схемы C) со- состоит в том, что в уравнении (9) а) А и ф не зависят от п, б) итерационный па- параметр т не обязан стремиться к нулю. 2. Устойчивость разностных схем. Как и в случае стационарных задач, разностная схема C) называется корректной, если ее реше- решение yn = yh,*(tn): а) существует, б) единственно, в) непрерывно (при- (причем равномерно относительно т и h) зависит от входных данных ф(/„) и у0. В дальнейшем всегда будет предполагаться, что опера- оператор В существует (если B = Bhx{tn), то предполагается существо- существование В при всех допустимых значениях /г, т, tn). Тем самым га- гарантируется существование и единственность решения задачи C). Дадим строгие определения устойчивости. Будем считать, что в Hh заданы две нормы: || • |1д, в которой измеряется решение y(tn)^ e#h и | • ||2/i, в которой измеряется правая часть ф(^„). Определение 1. Разностная схема C) называется устойчи- устойчивой, если существуют постоянные Л1,>0, Л12>0, не зависящие от h, I, n и такие, что при любых правых частях фм(^п)е#Л и любых начальных данных ya^Hh для решения уравнения C) выполняется 351
оценка max |Ф/||2,. A0) Устойчивость, выраженную оценкой A0), называют устойчи- устойчивостью по начальным данным и по правой части. Используются также понятия устойчивости по начальным данным и устойчивости по правой части. Рассмотрим однородное уравнение В Уп+1~Уп +Ауп = 0, п = 0, 1, .... К— 1, yo&Hh задан. A1) Определение 2. Разностная схема C) называется устойчи- устойчивой по начальным данным, если существует постоянная Mi>0, не зависящая от h, т, п и такая, что при любых г/оеЯЛ для решения однородного уравнения A1) справедлива оценка l0»bft<Millyollih. /1 = 0,1, .... /f. A2) Рассмотрим теперь неоднородное уравнение C) с нулевыми на- начальными данными вУп+1-Уп +Ауп = Ц)п1 я = 0, I /С— 1, уо = 0. A3) Определение 3. Разностная схема C) называется устойчи- устойчивой по правой части, если существует постоянная Ж2>0, не зави- зависящая от п, т, п и такая, что при любых фЛт(^„)еЯЛ для решения уравнения A3) справедлива оценка max |Ф/||2Л. A4) Заметим, что в силу линейности разностной схемы из одновре- одновременной устойчивости по начальным данным и по правой части сле- следует устойчивость в смысле определения 1. Более того, покажем, что устойчивость по правой части является в определенном смыс- смысле следствием устойчивости по начальным данным. Определение 4. Разностная схема C) называется равно- равномерно устойчивой по начальным данным, если существуют постоян- постоянная р>0 и постоянная М1} не зависящая от h, т, п, такие, что при любых п = 0, 1, ..., К—1, К>\, и при всех i/neft для решения yn+i однородного уравнения A1) справедлива оценка 1А, A5) причем В теории разностных схем в качестве константы р выбирается обычно одна из величин р = 1, р = 1+сот или р= ес°%, где со^О не за- висит от h, т, п. Если, например, р= ес"х, то pn=ec«m=zec°t'l^:ec<>T, т. е. М = ес»г. где Т = Кх. Перепишем однородное уравнение A1) в виде yn+i = Syn, п = 0, 1, .... К-1, A6) 352
где оператор S = E-rB~lA A7) называется оператором перехода схемы C). Нетрудно видеть, что в силу произвольности (/„еЯ/, требование A5) равномерной устойч