Текст
                    КЛАССИЧЕСКАЯ УЧЕБНАЯ ЛИТЕРАТУРА
ПО МАТЕМАТИКЕ
Б. П. ДЕМИДОВИЧ,
И. А. МАРОН,
Э. 3. ШУВАЛОВА
ЧИСЛЕННЫЕ
МЕТОДЫ
АНАЛИЗА
ПРИБЛИЖЕНИЕ
ФУНКЦИЙ,
ДИФФЕРЕНЦИАЛЬНЫЕ
И ИНТЕГРАЛЬНЫЕ
УРАВНЕНИЯ
Под редакцией
Б. П. ДЕМИДОВИЧ А
Издание пятое,
стереотипное
РЕКОМЕНДОВАНО
Научно-методическим советом по математике
Министерства образования и науки РФ
в качестве учебного пособия для студентов вузов,
обучающихся по направлениям
S10000 — «Естественные науки и математика»,
550000 — «Технические науки»,
540000 — «Педагогические науки»
САНКТ-ПЕТЕРБУРГ · МОСКВА · КРАСНОДАР
2010


ББК 22.193я73 дзо Демидович Б. П., Марон И. Α., Шувалова Э. 3. Д 30 Численные методы анализа. Приближение функций, дифференциальные и интегральные уравнения: Учебное пособие. 5-е изд., стер. / Под ред. Б. П. Демидовича. — СПб.: Издательство «Лань», 2010. — 400 с: ил. — (Учебники для вузов. Специальная литература). ISBN 978-5-8114-0799-6 Книга является учебным пособием по различным разделам курса приближенных вычислений. Излагаются избранные вопросы вычислительной математики применительно к программе технических вузов. По содержанию книга является продолжением учебного пособия для вузов Б. П. Демидовича и И. А. Марона «Основы вычислительной математики», выпущенного издательством «Лань» в 2006 г. Учебное пособие предназначено для студентов технических, экономических и педагогических высших учебных заведений, может быть полезно инженерам и специалистам, работающим в области прикладной математики. ББК 22.193я73 Рецензенты: Я. С. ЧЕКАЛКИН — зав. кафедрой высшей математики МИР9А, кандидат физ.-мат. наук, профессор; В. Ю. ПРИХОДЬКО — доктор физ.-мат. наук, профессор кафедры высшей математики МИР9А. ПРИ* 066466 от 21.10.07 Гигиенический сертификат 78.01.07.953.П.007216.04.10 от 21.04.2010 г., выдан ЦГСЭН в СПб Издательство «ЛАНЬ» lan@lpbl.epb.ru; www.lanbook.com; 192029, Санкт-Петербург, Общественный пер., 5. Тел./факс: (812)412-29-35,412-05-97,412-92-72. Бесплатный звонок поРоссии: 8-800-700-40-71 ГДЕКУПИТЬ ДЛЯ ОРГАНИЗАЦИЙ: Для того, чтобы заказать необходимые Вам книги, достаточно обратиться в любую из торговых компаний Издательского Дома «ЛАНЬ»: по России и зарубежью. «ЛАНЬ-ТРЕЙД». 192029, Санкт-Петербург, ул. Крупской, 13 тел.: (812)412-85-78,412-14-45,412-85-82;тел./факс: (812)412-54-93 е- mail: trad e@lanpbl.spb.ru; ICQ: 446-869-967 www.lanpbi.epb.ru/price.htm вМоскве и вМосковской области. «ЛАНЬ-ПРЕСС». 109263,Москва, 7-аяул. Текстильщиков,д. 6/19;тел.: (499) 178-65-85; e-mail: lanprese@ultimanet.ru в Краснодаре и в Краснодарском крае. «ЛАНЬ-ЮГ». 350072, Краснодар, ул. Жлобы, д. 1/1;тел.: (861) 274-10-35; e-mail:lankrd98@mail.ru Подписано в печать 20.04.10. Бумага офсетная. Гарнитура Литературная. Формат 84x108 '/т. Печать офсетная. Усл. п. л. 21. Тираж 1500 экз. Заказ № Отпечатано в полном соответствии с ка- © Издательство «Лань», 2010 чеством предоставленных диапозитивов © Коллектив авторов, 2010 в ОАО «Издательско-полиграфическое © Издательство «Лань», предприятие «Правда Севера». 163002, художественное г. Архангельск, пр. Новгородский, д. 32. оформление, 2010 Тел./факс (8182) 64-14-54; www.ippps.ru
ОГЛАВЛЕНИЕ Из предисловия к первому изданию 6 Предисловие ко второму изданию 8 Введение 9 Глава I. Приближение функций 15 § 1. Постановка задачи о приближении функций 15 § 2. Интерполирование функций 16 § 3. Точечное квадратичное аппроксимирование функций 18 § 4. Метод ортогональных полиномов 21 § 5. Построение ортогональных полиномов Чебышева для случая равноотстоящих точек 24 § 6. Интегральное квадратичное аппроксимирование функций на отрезке 30 § 7. Ортогональные системы функций 33 § 8. Понятие о гармоническом анализе 38 § 9. Полиномы Лежандра 46 § 10. Ортогональность с весом 54 § 11. Полиномы Чебышева 55 § 12. Понятие о равномерном приближении функций 60 § 13. Понятие о приближенном построении полинома наилучшего равномерного приближения 67 Литература к первой главе 77 Глава II. Эмпирические формулы 78 § 1. Вводные замечания 78 § 2. Линейная зависимость 81 § 3. Метод выравнивания 83 § 4. Квадратичная (параболическая) зависимость 88 § 5. Определение параметров эмпирической формулы 91 § 6. Метод выбранных точек 92 § 7. Метод средних 94 § 8. Метод наименьших квадратов 96 § 9. Некоторые соображения о выборе вида эмпирической формулы с двумя параметрами 102 § 10. Эмпирические формулы, содержащие три параметра 109 § II. Уточнение полученной эмпирической формулы 115 § 12. Общий метод определения параметров эмпирической формулы. 118 Литература ко второй главе 124
4 ОГЛАВЛЕНИЕ Глава III. Приближенное решение обыкновенных дифференциальных уравнений 125 § 1. Общие замечания 125 § 2. Интегрирование дифференциальных уравнений с помощью степенных рядов 133 § 3. Метод последовательных приближений 140 § 4. Метод численного интегрирования 146 § 5. Метод Эйлера 152 § 6. Модификации метода Эйлера 154 § 7. Метод Рунге—Кутта 160 § 8. Метод Адамса 168 § 9. Метод А. Н. Крылова последовательных сближений 176 § 10. Метод Милна 182 § 11. Методы, основанные на применении производных высших порядков 197 § 12. Численное интегрирование дифференциальных уравнений второго порядка 204 § 13. Метод Чаплыгина 209 § 14. Некоторые замечания об оценке погрешностей решений дифференциальных уравнений 221 Литература к третьей главе 226. Глава IV. Краевые задачи дли обыкновенных дифференциальных уравнений 228 § 1. Общая постановка краевой задачи 228 § 2. Линейная краевая задача 232 § 3. Редукция к задаче Коши двухточечной краевой задачи для линейного уравнения 2-го порядка 237 § 4. Метод конечных разностей 239 § 5. Метод прогонки 244 § 6. Метод коллокации 255 § 7. Метод наименьших квадратов 257 § 8. Метод Галеркина 261 § 9. Понятие о приближенных методах решения общей краевой задачи 264 Литература к четвертой главе 267 Глава V. Приближенные методы решения краевых задач для дифференциальных уравнений с частными производными . 268 § I. Классификация дифференциальных уравнений с частными производными 268 § 2. Начальные и краевые условия. Задача Коши. Смешанная задача. Корректность постановки смешанной задачи 272 § 3. Краевые задачи для уравнений эллиптического типа 279 § 4. Некоторые сведения о гармонических функциях. Единственность решения задачи Дирихле 280 § 5. Уравнение Лапласа в конечных разностях 283 § 6. Решение задачи Дирихле методом сеток 287 § 7. Процесс Либмана 291 § 8. Понятие о решении задачи Дирихле методом моделировании . . 297 § 9. Понятие о решении задачи Дирихле методом Монте-Карло. . .299 § 10. Метод сеток для уравнения параболического типа 305 § II. Устойчизость конечно-разностной схемы для решения уравнения теплопроводности 310 § 12. Метод прогонки для уравнения теплопроводности 314
ОГЛАВЛЕНИЕ 5 § 13. Метод сеток для уравнений гиперболического типа 320 § 14. Понятие о методе прямых 324 § 15. Метод прямых для уравнения Пуассона 328 Литература к пятой главе 334 Глава VI. Вариационные методы решения краевых задач 336 § 1. Понятие о функционале и операторе 336 § 2. Вариационная задача 340 § 3. Основные теоремы вариационного метода решения краевых задач 341 § 4. Сведение линейной краевой задачи для обыкновенного дифференциального уравнения второго порядка к вариационной задаче 345 § 5. Краевые задачи для уравнения Пуассона и Лапласа ...... .351 § 6. Идея метода Ритца 355 § 7. Метод Ритца для простейшей краевой задачи 356 § 8. Приложение метода Ритца к решению краевой задачи Штурма— Лиувилля 359 § 9. Метод Ритца для задачи Дирихле 364 Литература к шестой главе 367 Глава VII. Интегральные уравнения 368 § 1. Основные виды линейных интегральных уравнений 368 § 2. Связь между дифференциальными уравнениями и уравнениями Вольтерра 371 § 3. Связь линейной краевой задачи с интегральным уравнением Фредгольма 373 § 4. Метод последовательных приближений 375 § 5. Решение интегрального уравнения методом конечных сумм . . 378 § 6. Метод вырожденных ядер 382 § 7. Метод коллокации 391 § 8. Метод наименьших квадратов 394 § 9. Метод моментов 397 Литература к седьмой главе 400
ИЗ ПРЕДИСЛОВИЯ К ПЕРВОМУ ИЗДАНИЮ В связи с потребностями новой техники инженерная практика наших дней все чаще и чаще встречается с математическими задачами, точное решение которых весьма сложно или неизвестно. В этих случаях обычно прибегают к тем или иным приближенным вычислениям. Вот почему приближенные и численные методы математического анализа получили за последние годы широкое развитие и приобрели исключительно важное значение. Рост производительных сил в XX столетии обусловил решительный прогресс в области вычислительной техники, приведший к созданию современных электронных счетных машин с программным управлением. Это неограниченно расширило вычислительные возможности математики: задачи, для решения которых при ручном счете требовались годы, сейчас сплошь и рядом решаются за несколько часов, причем непосредственный счет занимает минуты. В свою очередь, новые вычислительные средства вызвали переоценку известных методов решения задач с точки зрения целесообразности их реализации на современных вычислительных машинах и стимулировали создание более эффективных приемов. Так, например, применение быстродействующих вычислительных машин позволило широко использовать «метод сеток» (см. гл. V, § 6) для решения краевых задач математической физики. При ручном счете этод метод лишен практического значения ввиду колоссального объема работы при сколько-нибудь высокой точности результата. В то же время приспособление метода сеток для работы на счетной машине выдвинуло специфическую проблему «устойчивости вычислительной схемы» (см., например, гл. V, § 11). Умелое применение вычислительной техники немыслимо без знания вычислительной математики. В настоящее время трудно себе представить творчески работающего инженера-исследователя или специалиста по экономическому планированию, не владеющего методами приближенного анализа. Массовое появление вычислительных центров, как самостоятельных, так и при ряде учебных и научно-исследовательских институтов, также неизбежно ставит вопрос о необходимости повышения математической подготовки инженеров, в первую очередь в области приближенных вычислений,
ИЗ ПРЕДИСЛОВИЯ К ПЕРВОМУ ИЗДАНИЮ 7 Указанные выше обстоятельства делают актуальным написание учебных пособий по вычислительной математике для инженеров, экономистов и т. д. Настоящая книга посвящена избранным вопросам численного анализа: приближению функций и приближенному решению дифференциальных уравнений (обыкновенных и с частными производными). Такой выбор материала обусловлен тем, что вопросы, связанные с решением алгебраических уравнений и численными методами линейной алгебры и др., имеются в вышедшей в 1960 г. книге авторов «Основы вычислительной математики». Цель этой книги, как и указанной выше, дать систематическое и современное изложение важнейших приемов приближенного и численного анализа (в пределах рассматриваемых тем) на базе общего втузовского курса высшей математики. Книга содержит: интерполирование и аппроксимирование функций, составление эмпирических формул, приближенное и численное решение дифференциальных уравнений обыкновенных и с частными производными, понятие о прямых методах решения краевых задач. Для расширения математического кругозора инженера дается понятие о нетрадиционных методах вычислений: методе Монте-Карло и методе моделирования. Как и в первой книге, основные методы доведены до численных приложений: даны расчетные схемы и приведены числовые примеры с подробным ходом решения. В целях доходчивости большинство примеров рассматривается в упрощенной трактовке и носит иллюстративный характер. Для понимания основного текста книги достаточно знания курса высшей математики в объеме двух первых курсов втузов машиностроительных специальностей. Необходимые сведения по математике, не входящие в общую программу втузов, излагаются в соответствующих главах. Использованная и дополнительная литература указана после каждой главы. Книга предназначена для студентов втузов с повышенной программой по высшей математике и инженеров, занимающихся прикладными вопросами, а также для работников вычислительных бюро и центров. Кроме того, книга окажется полезной студентам физико-математических факультетов педагогических институтов и студентам экономических вузов. Двухтомник авторов охватывает, в основном, все сложившиеся в настоящее время методы численного решения важнейших математических задач. Его содержание несколько превышает рамки действующей программы курса приближенных вычислений для втузов. На такое расширение авторы шли сознательно. Дело в том, что в настоящее время курс приближенных вычислений для втузов еще не установился, отрабатывается и имеет тенденцию к неизменному расширению. Кроме того, в технических и экономических институтах нашей страны все в
8 предисловие ко второму изданию большем количестве возникают факультеты и специальности, готовящие работников для вычислительных бюро и центров. Для таких специальностей курс вычислительной математики является профилирующим. Разумно было поэтому изложить курс приближенных и численных методов в более полном объеме, введя ряд дополнительных глав. Это. обстоятельство не затруднит пользование книгами: читатель без ущерба для понимания выберет нужные ему разделы и опустит лишние. В задачу авторов не входило изложение сведений по технике решения инженерных задач на электронных счетных машинах и программированию. По этим вопросам следует обратиться к специальным руководствам. В частности, можно рекомендовать книгу А. И. Китова и Н. А. Криницкого «Электронные цифровые машины и программирование» (Физматгиз, М., 1959). Авторы приносят благодарность коллективу кафедры высшей математики Артиллерийской инженерной академии им. Ф. Э. Дзержинского, принимавшему участие в обсуждении рукописи. Авторы выражают также искреннюю признательность проф. Б. М. Левитану и проф. X. Л. Смолицкому за обстоятельные рецензии о книге, критические замечания которых были учтены при окончательном редактировании текста. Авторы Москва, 1961 г. ПРЕДИСЛОВИЕ КО ВТОРОМУ ИЗДАНИЮ Во втором издании исправлены замеченные ошибки и добавлена VII глава «Интегральные уравнения». Кроме того, в конце Введения и глав IV и V сделаны некоторые замечания. Авторы Москва, 1963 г.
ВВЕДЕНИЕ Значение вычислительных машин и, главным образом, электронных вычислительных машин в деле технического прогресса нашей страны исключительно велико. Современные электронные цифровые вычислительные машины производят десятки тысяч арифметических и логических операций в секунду и способны в исключительно короткие сроки давать решения сложнейших математических и технических задач, немыслимые при ручном счете. Такая скорость вычислений позволяет, например, рассчитать траекторию полета снаряда быстрее, чем летит сам снаряд! Огромное быстродействие вычислительных машин открывает новые широкие возможности для применения общих математических методов исследования в проблемах физики, механики, химии, астрономии, техники, экономики и многих других областей. Принципиальное отличие от прежнего положения вещей состоит в том, что сложнейшие технические и экономические вопросы могут решаться в точной постановке, недоступной для малых вычислительных машин из-за чрезмерного объема работы. В частности, например, представляется возможным по-новому организовать процесс технического проектирования, отказавшись от грубо ориентировочных расчетов. Машина, по соответствующей программе, быстро и точно рассчитывает различные варианты конструкции, сравнивает их и выбирает оптимальный вариант. При высокой стоимости сооружения это дает огромный экономический эффект. Исключительное значение имеют электронные счетные машины для автоматического управления быстро движущимися объектами, например межпланетными ракетными снарядами. Велика также роль электронных вычислительных машин для развития самой математики. Машины используются для подсчета математических постоянных; для решений
10 ВВЕДЕНИЕ алгебраических, трансцендентных и дифференциальных уравнений; для решения сложнейших функциональных неравенств и т. п. Появились новые статистические методы машинного решения задач математической физики, стало возможным экспериментальное решение логических задач и многое другое. Таким образом, создание электронных счетных машин знаменует решительный скачок по пути прогресса точных и технических наук нашего времени. Широкое внедрение вычислительных машин в практику нашего строительства сделало весьма актуальным усовершенствование и развитие численных и приближенных методов решения задач. Дело в том, что машина способна выполнять очень большое, но конечное число операций. Поэтому точные предельные процессы решения задач, связанные с бесконечным числом операций, при работе на машине, по необходимости, должны быть заменены приближенными алгорифмами, содержащими лишь конечное число действий. Например, при машинном вычислении определенного интеграла последний обычно заменяется конечной интегральной суммой, вместо дифференциального уравнения рассматривается конечная система уравнений в конечных разностях и т. п. Кроме того, машина обладает конечной памятью и может оперировать с числами лишь конечной длины. Поэтому промежуточные результаты округляются, в результате чего даже точный метод с конечным числом действий становится приближенным. В настоящее время разработка численных и приближенных методов решения задач, в основном, протекает в двух направлениях: с одной стороны, создаются более эффективные детерминированные способы решения задач, учитывающие специфические особенности счетных машин; с другой стороны, в практику успешно внедряются статистические недетерминированные методы, основанные на случайных испытаниях (метод Монте-Карло и другие) [1], [2]. Высокая производительность электронных машин существенным образом изменила подход к оценке того или иного вычислительного метода. Ценным оказывается тот метод, который является наиболее универсальным и который допускает простую реализацию на машинах. Напротив, метод, основанный на частных особенностях задачи или на искусстве вычислителя, оказывается теперь мало пригодным. В связи с этим произошла своеобразная переоценка ценностей:
ВВЕДЕНИЕ 11 многие вычислительные методы, приводившие к громоздкому счету и считавшиеся раньше, при ручном счете, непрактичными, оказались сейчас вполне рабочими. В то же время чисто аналитические конструкции, ведущие к неудобным вычислительным алгорифмам, потеряли свою былую ценность. Вот почему сейчас большое распространение получили итеративные, разностные, вариационные, вероятностные и т. п. методы решения задач, допускающие удобные схемы счета и применимые к широкому кругу проблем. При приближенном решении задач необходима оценка погрешности полученного результата. Здесь при вычислениях с большим числом шагов мы сталкиваемся с новой весьма важной проблемой: вопросом устойчивости вычислительной схемы. Может случиться, что неизбежные погрешности округлений быстро накапливаются (например, имеют показательный рост). Такая вычислительная схема неустойчива и непригодна для практики. Допустимо пользоваться устойчивыми вычислительными схемами, когда погрешности округлений взаимно компенсируются и вызываемая ими ошибка результата остается малой для всего процесса вычислений. * * * Выбирая численный метод среди известных методов или разрабатывая новый, мы должны, естественно, учитывать специфику машины, на которой предполагается решать задачу. Поэтому дадим весьма общую характеристику различных вычислительных машин, не ставя своей целью техническое описание их и отсылая за подробностями к специальной литературе [3], [4], [5], [6], [7]. Вычислительные машины и приборы в соответствии с их принципом работы делятся на два класса: 1) машины дискретного счета, или цифровые машины; 2) машины непрерывного действия. Машины первого класса производят математические операции с числами, принимающими дискретные значения и имеющими цифровое представление в некоторой позиционной системе — десятичной, двоичной и др. В машинах второго класса числа выражаются посредством физических величин, имеющих непрерывный характер, например посредством длин, напряжений и т. п. В этот класс входят различного рода
12 ВВЕДЕНИЕ счетно-решающие устройства: механический интегратор, суммирующие, множительные, дифференцирующие и интегрирующие устройства и т. п. а также различные модели и моделирующие устройства — электрическая ванна, электрические сетки, электронно-ламповые анализаторы и интеграторы, интегрирующие звезды и т. п. Машины непрерывного действия обычно приспособлены для узкого класса задач и имеют небольшую точность (примерно 2 — 3 верных значащих цифры). Первый класс — цифровые машины — может быть разбит на три подкласса: а) малые клавишные машины; б) счетно-аналитические машины; в) быстродействующие машины. По принципу действия: подкласс а) — это механические машины с ручным или электрическим приводом; подкласс б) — электромеханические машины и подкласс в) — электронные машины. К первому подклассу относятся арифмометры типа ВК-2, «Мерседес», «Рейн-металл» и др. Достоинства и недостатки этих простейших цифровых машин хорошо известны. Счетно-аналитические машины предназначены для производства большого числа однотипных несложных вычислений. Наиболее важным представителем вычислительных машин подкласса в) являются электронные цифровые вычислительные машины (ЭЦВМ) с программным управлением. Технически такая машина представляет собой сложный комплекс элементов электронной автоматики и служит мощным универсальным средством для производства вычислений. Машины этого подкласса характеризуются следующей примерной скелетной схемой: Схема ЭЦВМ Устройство управления I I Ввод данных Запоминающее устройство Арифметическое устройство Вывод результатов В нашей стране построен ряд электронных и цифровых машин универсального и специального назначений. Укажем на универсальную быстродействующую электронную счетную машину «БЭСМ», на машину «Стрела», на малую электронно-
ВВЕДЕНИЕ 13 цифровую вычислительную машину «Урал», на машины М-2 (средняя машина) и М-3 (малая машина) и др. Семилетний план развития народного хозяйства СССР предусматривает значительное расширение производства и применения электронных цифровых вычислительных машин. Принципы работы на электронных счетных машинах излагаются в соответствующих инструкциях. Вводимая в машину информация должна быть запрограммирована, т. е., образно выражаясь, «переведена на язык машины» [2], [8], [9]. В общих чертах процесс решения на ЭЦВМ стандартных математических задач состоит в следующем. Для решения задачи составляется алгорифм, который программируется и вместе с начальными данными вводится в запоминающее устройство. Затем, следуя программе, машина шаг за шагом выбирает нужные данные из запоминающего устройства и подает их в арифметическое устройство, где производятся необходимые вычисления. Результаты вычислений направляются либо снова в запоминающее устройство, либо на вывод из машины для печатания. Что касается техники решения больших математических и инженерных задач на электронных вычислительных машинах, то для ознакомления с ней следует обратиться к специальным руководствам [10], [11], [12]. В настоящей книге изложены основные методы решения математических задач из области теории приближений и дифференциальных уравнений. Попутно дается теоретическое обоснование этих методов доступное для лиц с втузовским математическим образованием. Схемы вычислений приспособлены для работы на малых вычислительных машинах. Однако большинство сообщаемых способов решения задач пригодно также для работы на электронных цифровых вычислительных машинах. В отдельных местах книги даются соответствующие указания по этому поводу. В заключение отметим, что к числу типовых задач, эффективно решаемых на электронных цифровых машинах, относятся: 1. Составление таблиц различных функций. 2. Вычисление корней алгебраических уравнений высоких порядков. Здесь применяются методы хорд, Ньютона, Лобачевского, Вернул ли и др. [13],
14 ЛИТЕРАТУРА К ВВЕДЕНИЮ 3. Решение систем линейных алгебраических уравнений. Применяются итерационные методы и методы исключения [13]. 4. Решение систем обыкновенных дифференциальных уравнений. Используются методы Адамса—Штермера, Милна, Рунге—Кутта и др. (см. гл. III). 5. Решение уравнений в частных производных. В основном, используются методы конечнык разностей и различные итерационные методы (см. гл. V). 6. Вычисление значений кратных интегралов. Применяются метод непосредственного суммирования и метод статистических испытаний [13]. Литература к введению [I] Математика, ее содержание, методы и значение. Изд. АН СССР, М. (1956), т. 2, гл. XIV. [2] А. И. Китов, Η. Α. Κ ρ и н и ц к и й, Электронные цифровые машины и программирование, Физматгиз (1961). [3] Л. С. Χ ρ е н о в, Малые вычислительные машины, Гостехиздат, М. (1957). [4] И. Я. Акушский, Краткий очерк счетно-адалитических машин, Изв. АН СССР, отд. гехн. наук 8, 1946, 1081 — 1120. [5] С. А. Лебедев, Электронные вычислительные машины, Изд. АН СССР, М. (1956). [6] Ф. Б. Майоров, Электронные вычислительные машины и их применение, Воениздат, М. (1959). [7] А. И. Китов, Электронные цифровые машины, Изд. «Советское радио», М. (1956). [8] А. Л. Л у н ц, Начальные сведения по программированию для цифровой вычислительной машины «Стрела», Изд. Арт. академии им. Дзержинского, М. (1959). [9] В. Н. Б о н д а р е н к о, И. Т. Плотников, П. П. Π о л о з о в, Программирование для цифровой вычислительной машины «Урал», Изд. Арт. академии им. Дзержинского, М, (1957). [10] Л. А. Л ю с τ е ρ н и к, А. А. Абрамов, В. И. Ш е с τ а к о в, М. Р. Шура-Бура, Решение математических задач на автоматических машинах, Изд. АН СССР (1952). [II] Б. М. Каган и Т. Μ. Τ е р-М и к а э л я н, Решение инженерных задач на автоматических цифровых вычислительных машинах, Госэнерго- издат, М.—Л. (1958). [12] Е. А. Жоголев, Г. С. Росляков, Н. П. Трифонов, М. Р. Шура-Бура, Система стандартных подпрограмм, Физматгиз, М. (1958). [13] Б. П. Демидович, И. А. Марон, Основы вычислительной математики, Физматгиз, I960; изд. 2, 1963.
ГЛАВА I ПРИБЛИЖЕНИЕ ФУНКЦИЙ § 1. Постановка задачи о приближении функций Пусть дана основная система функций {φ0 (χ), φ, (χ), . . . .. . ,<fm(x), ...}, которые в дальнейшем будем считать достаточно гладкими (например, непрерывно дифференцируемыми функциями). Функции вида Q(x) = ctfe (χ) + «,φ, (*)+...+ стут (χ), (1) где е0, с,, ... , ст—постоянные коэффициенты, называются обобщенными многочленами или обобщенными полиномами. Рассмотрим некоторую функцию f(x). Задача о приближении ставится следующим образом: данную функцию f(x) требуется приближенно заменить (аппроксимировать) обобщенным полиномом Q(x) (1) так, чтобы отклонение, в некотором смысле, функции f(x) от Q(x) на заданном множестве Х= {χ} было наименьшим. Этого можно достичь, вообще говоря, за счет надлежащего подбора коэффициентов с, (/=0, 1, 2 т). При этом полином Q{x) называется аппроксимирующим. Что касается смысла термина «отклонение двух функций», то в зависимости от обстоятельств его можно понимать по-разному. В дальнейших параграфах это понятие будет уточнено. Если множество X состоит из отдельных точек jc0, xv . .., χ , то приближение называется точечным; если же X есть отрезок а^х^Ь, то приближение называется интегральным. Для практики весьма важен случай, когда основная система функций {tf{ (x) ) представляет собой последовательность целых неотрицательных степеней переменной х, т. е. φ0(χ)=1, Ь(х) = х, ... , ут(х) = хт, ... В этом случае функции Q(x) являются обычными полипомами: Q(х) = а0-}-а,х-\-... -f-amxm, (2) где а{ — постоянные. Таким образом, приходим к задаче аппроксимирования функции /(х) полиномом Q(x) (2).
16 ПРИБЛИЖЕНИЕ ФУНКЦИЙ [гл. ι § 2. Интерполирование функций Будем считать данную функцию f(x) и полином Q(x) = = α0 -\- ахх -4-...-)- атхт близкими (т. е. имеющими малое «отклонение»), если они совпадают на заданной системе точек л;0, хи ■ ■· > хп (узлы интерполирования). Таким образом, мы приходим к следующей задаче интерполирования: для данной функции f(x) найти полином Q (х), возможно низшей степени т, принимающий в заданных точках дгг(г = 0, 1, ... , п; Xjjixj при i—j) те лее значения, что и функция f(x), т. е. такой, что Q(Xi)=f(xt) 0 = 0, 1, 2 η). Полином Q (χ) называется интерполяционным. Если п^т, то можно положить т = п и определить коэффициенты в( из системы уравнений «0 + «1*0 + · · · + апХ" = JO. а^ахххАг...-\-аяхЧ=уь _ яо+ал+...+«„■*;; =.v,>. . где yt=f (■£,)(Ζ — 0, 1 я). Определитель этой системы Δ есть определитель Вандермонда [1] Δ== Π (■*, —*р)*° и, следовательно, система (1) имеет единственное решение. Полином Q (х) = Ln (χ), коэффициенты которого определяются из системы (1), называется интерполяционным полиномом Лагранжа для функции f(x) и может быть записан в явном виде [1], [2]: η , ίν-ϊ— V (Х — Хр)...(Х — Xt-j) (X — Χι+ι) ...(Χ —X п) ,„, L"^>— Δ (χι~χ.)...(χί-χ1-Λ)(χι~χ^)-Λχι~Χη)γί' Κ} Для случая равноотстоящих узлов xt полином Ln (x) обычно записывается в виде интерполяционного полинома Ньютона (см. [1], [2]). Пример. Построить интерполяционный полином L (х), совпадающий с функцией /(jf) = 3Jf(—lsSJrsSl) в точках: х^ = —1, Ху = 0, Χι^^^Ι. Решение. Полагаем L (х) = а„ -f- a^x -j- агх\
§ 2J ИНТЕРПОЛИРОВАНИЕ ФУНКЦИЙ 17 Для определения коэффициентов а0, о, и аг имеем систему 3 а„ =1, Отсюда а0=\, at = ^-, а2 — ^г и, следовательно, Например, 4 2 1 -|- -о- х + — ^г при — 1 < χ < 1. 32=/3^1 +4 + ^^=1,8 Если п^> т, т. е. число узлов интерполирования превосходит степень полинома больше, чем на единицу, то задача интерполирования становится, вообще говоря, невозможной. В этом случае обычно прибегают «точечному квадратичному аппроксимированию функции (см. дальше). Если в качестве Q(x) выбрать обобщенный полином, то получаем Рис. 2. более общую задачу интерполирования. Важным случаем является тригонометрическое интерполирование (см. [\]). Заметим, что интерполирование не всегда дает удовлетворительное решение задачи о приближении функции с заданной точностью, так как совпадение функции /(х) с полиномом Q[x) даже в близких точках х; и x;+i не гарантирует малость величины отклонения \/(х) — Q(x)\ на отрезке 1*ί- *,-+,) (рис 2).
18 ПРИБЛИЖЕНИЕ ФУНКЦИЙ [ГЛ. 1 § 3. Точечное квадратичное аппроксимирование функций При точечном квадратичном аппроксимировании за меру отклонения полинома <?„(*)=*.+ «.*+···-г-0**" (П от данной функции у=/(х) на множестве точек ха, xlt ... , хп принимают величину S=2lQm(x,) — f(x,)i: (2) 1=0 называемую квадратичным отклонением (способ наименьших квадратов). Для построении аппроксимирующего полинома требуется подобрать коэффициенты а0, а,, ... , ат так, чтобы величина S была наименьшей. Предполагаем, что т < п. В случае т = п коэффициенты в/(у'=0, 1 т) можно определить из системы уравнений Q„ (*()=/(*/) при i = 0, 1, 2, .... т, (3) причем S=0, и приходим к разобранной выше проблеме интерполирования функций. При т<С.п система (3), вообще говоря, несовместна. Кроме того, следует иметь в виду, что во многих случаях значения функции /(х) определяются экспериментально и содержат ошибки, поэтому сама постановка вопроса о точном решении системы (3) теряет смысл. Для решения нашей задачи аппроксимирования воспользуемся общим приемом дифференциального исчисления. А именно, найдем частные производные от величины η S=^i [а0-\- αλΧ;-{- а%х) -\- ... -\- amxf — у()г, ι = 0 где yi=.f(xi)t по всем переменным а0, а,, ... , ат. Приравнивая эти частные производные нулю, получим для определения неизвестных а0, а,, ... , ат систему т-\-\ уравнений с т~\-\ неизвестными: η 2 ~Ш~ = Σ К + αΛ + агх) + · · · + a,nxf—Уд ■' Ι17=ΣΚ + αΛ + αιχ] + · · ■ + W? —Уд xi ' i=0 m 1=0 = 0, = 0, (4)
§ 3| ТОЧЕЧНОЕ КВАДРАТИЧНОЕ АППРОКСИМИРОВАНИЕ ФУНКЦИЙ 19 Введем обозначения: h=\*л + *ίν, +... + **.y« (а = о, ι, 2, ...)■ Преобразуя систему (4) и используя введенные обозначения, будем иметь а<А + аЛ + аА + ■ · · + «А = '„> v. + v. + Vil ■·· + ал+>=4. а<Л+аЛ + аА + ··■ + аА + 2 = ^. ^ (5) «<Ап + а1!?и+1 + аЛ + 2+··· +a«s2m = ^. . где s0 = η -j- 1. Можно доказать, что если среди точек х0, л:,, .. . , хп нет совпадающих и /я«йя, то определитель системы (5) отличен от нуля, и, следовательно, эта система имеет единственное решение α0 = α*', «,=«*, ... , am=-d'm |3J. Полином (1) с такими коэффициентами будет обладать минимальным квадратичным отклонением Smm. Если т==п, то аппроксимирующий полипом Qm(x) совпадает с полиномом Лагранжа для системы точек х0, xlt ... , хт, причем 5Шщ = 0. На практике обычно бывает, что степень полинома Qm (x) значительно меньше числа точек xi(i = Ql 1, ... , η), и поэтому построение точного интерполяционного полинома, вообще говоря, невозможно. Таким образом, аппроксимирование функций представляет собой более общий процесс, чем интерполирование. При работе на счетно-электронных машинах для решения линейной системы (5) выгодно использовать итерационные методы [2]. В частности, так как матрица системы (5) положительно определенная, то для этой системы будет сходящимся процесс Зейделя [2]. Пример. Подобрать аппроксимирующий полином второй степени у = α0-|-β1Λ;-{-β2Λ;2 для Данных [3]: X У 0,78 1,56 2,50 1,20 2,34 1,12 3,12 2,25 3,81 4,28 Решение. Вычисления, которые нам нужно произвести, расположим по схеме (для т —2, я —4), приведенной в таблице 1. Для данного примера получаем таблицу 2 (вычисления проводятся с тремя десятичными знаками).
20 ПРИБЛИЖЕНИЕ ФУНКЦИЙ [ГЛ. I Таблица 1 Схема способа наименьших квадратов ! χ" Ι χ *а X, S, X* *■' X' < *г < < < < < S, < < < < < ^ У Уо У1 У. У. Уд <о ху *оУо хгуг *»У» Х,У4 Ί лт2_у *!|Уо *!у. **у» h Таблица 2 Вычисления по способу наименьших квадратов х° 5 X 0,78 1,56 2,34 3,12 3,81 11,61 х« 0,608 2,434 5,476 9,734 14,516 32,768 Xs 0,475 3,796 12,813 30,371 55,306 102,761 X4 0,370 5,922 29,982 94,759 210,717 341,750 У 2,50 1,20 1,12 2,25 4,28 11,35 ху 1,950 1,872 2,621 7,020 16,307 29,770 хгу 1,520 2,921 6,133 21,902 62,128 94,604 Отсюда, система для определения коэффициентов «0, а,, а, имеет вид 5a0-f 11,61 а,-|- 32,768 a2= 11,350, \ 11,61 а0 Η- 32,768 a,-J-102,761 as = 29,770, > (6) 32,768 a0-f 102,761 a, -j- 341,750 аг = 94,604. J Решив систему (6), будем иметь: а0 = 5,045; а, =—4,043; а2= 1,009. Следовательно, искомый полином есть .у = 5,045 — 4,043x-f'.О09*'· (7)
§ 4) метод ортогональных полиномов 21 Сравним исходные значения для у с соответствующими значениями у, полученными· из приближенной формулы (7). Соответствующие результаты приведены в таблице 3. Таблица 3 Погрешности вычисления по способу наименьших квадратов X 0,78 1,56 2,34 3,12 3,81 У 2,50 1,20 1,12 2,25 4,28 У 2,505 1,194 1,110 2,252 4,288 у-у + 0,005 - 0,006 -0,010 + 0,002 + 0,008 § 4. Метод ортогональных полиномов Если степень аппроксимирующего полинома больше трех, то вычисление по способу наименьших квадратов становится очень громоздким. Поэтому был создан новый метод построения аппроксимирующего полинома. В основе этого нового метода лежит понятие об ортогональных функциях. Определение. Функции φ (χ) и ψ (χ) называются ортогональными на множестве точек Х={ха, χλ, ... , хп\, если Σ<Ρ(*ί)ψ(*/)=0. / — о Система функций {<fA(A;)} называется ортогональной на данном множестве X, если функции системы попарно ортогональны между собой на множестве X. Очевидно, функция <?(х), обращающаяся в нуль в точках х0, xv ...,xn, ортогональна на этом множестве точек к любой другой функции. В дальнейшем предположим, что не все точки х{ (г = 0,1 л) являются нулями рассматриваемых функций φΑ (л;), т. е. J] φ* (*,■)> о. /3=0 Пусть Р.М, Рг(х) />«(*) (Π — заданная система ортогональных на множестве \х0, *,, ...,хп\ полиномов, т. е. 2 Pl[xl)Pk{xl) = Q при у ^ А, (2) 1 = 0
22 ПРИБЛИЖЕНИЕ ФУНКЦИЙ [гл. ι причем индексы полиномов соответствуют их степеням. Предположим, что s/=2',/W>0. (3) /—О Так как полиномы P,(x)(j=0, l,2,...,m) линейно независимы, то произвольный полином Qm (χ) степени т можно представить в виде линейной комбинации полиномов из системы (1), т. е. Qm W = Ь,Р. {х) + ft,P, (*)+... + ЬтРт (χ). (4) Это представление называется разложением полинома Qm (χ) по системе (1). Очевидно, что коэффициенты разложения Ь0, b1,...,bm могут быть найдены путем последовательного деления: Qm(x) h ι ff»-'W . . PmW ' """Τ" Pm{x) ' Λ»_ι(*) и-,_ГРт-, (*)' Р.-*{*)~~ т-г'1~ Λ,-.W R, (χ) _ A ι /?«<*). P, (x) "« "Τ" Ρ, (x) · PoW P.W = *. Однако можно дать явные формулы для коэффициентов b0,bv..., bm. Умножим тождество (4) на полином Pk(x)(k^m) и просуммируем полученное равенство по системе точек xt, xlt ... ,хп. Тогда .Σ Qm (*/)^(*,) = *оΣ П W ^ К) + *,Σ Pi to) Рн W + · · · 1 = 0 /=:0 ί'=0 i as: 0 ι = © Отсюда, учитывая условия ортогональности (2), находим £Q.lxt)pk(*i) = bk£pi(xt) ί=0 1=0 и, следовательно, η ** = '■— ■ (* = 0, 1, 2, ...,/я). Σ П w
§ 4) МЕТОД ОРТОГОНАЛЬНЫХ ПОЛИНОМОВ 23 Вернемся к задаче аппроксимирования заданной функции у=/(х) на множестве точек хй, xv . ..,хп полиномом данной степени т (т<п). Искомый полином Qm(x), для которого квадратичное отклонение s= Σ [0-.W—/(*/)]' = mm, будем искать в форме (4), Отсюда 5 =» Σ 1дЛ W + ЬА (*;) + · · · + ЬтРт (х,) - у,]\ (5) 1 = 0 Преобразуем выражение (5). Возводя в квадрат выражение, стоящее в квадратных скобках, получим η г т т k—1 5=Σ[Σ ь)р){Х1)-\-2 Σ % ι>Μ(χ{)Ρ*(χ,)- - 2 2 *,/>, (xt)yt +y}1 = 2 *' Σ ^ W -Ь /n fc — ι η m η η +2 Σ Σ V* Σ />/ ι**) ^ w -2 Σ */ Σ pi (*,■) λ + Σ *ϊ· 16) fc = 0; = 0 ί = 0 / = 0 (=0 isSO Но в силу условий ортогональности (2) т k — ι η Σ Σ *д Σ/>/U,)/>*(*,)=о. Поэтому, вводя обозначение iytp/{*i) = e, (/=0,1,...,я) и используй обозначение (3), будем иметь s= Σ (*'*/ —2V/)+ Σ?'· /=о / = ύ Выражение, стоящее в круглых скобках под знаком первой суммы, дополним до полного квадрата: Тогда т χ т % п
24 ПРИБЛИЖЕНИЕ ФУНКЦИЙ [ГЛ. I В выражении (7) коэффициенты b0, bt, ... ,bm нужно подобрать так, чтобы квадратичное отклонение S было минимальным. Заметим, что последние две суммы в формуле (7) не зависят от выбора коэффициентов b0, bit ... , bm. Поэтому минимальное значение S достигается для тех коэффициентов Ь,, для которых является минимальной сумма т что, очевидно, будет при Ь, = т (7=0, 1,2, ... ,«). (8) Отсюда искомый аппроксимирующий полином имеет вид т причем квадратичное отклонение S этого полинома от данной функции y='f(x) на множестве точек А"—{л:0, л;,, ... ,хп), как вытекает из формулы (7), дается формулой η т г § 5. Построение ортогональных полиномов Чебышева для случая равноотстоящих точек Пусть дана система я-j-1 равноотстоящих точек χ = χ0, χλ χη с шагом h. С помощью линейного преобразования t: h переведем эти точки соответственно в t-=0, 1,2, ... , п. Следуя Чебышеву (см. [3)), построим систему полиномов />.,„('), PUn(t) P,»,n(t) (i) степеней соответственно 0,1,..., т при /я <; я, ортогональных на множестве точек ^ = 0, 1, 2, ... , л, т. е. таких, что 2P,,n(i)Pk.n(i) = 0 приучи. (2) 1 = 0 Для определенности полиномы (1) нормируем так, чтобы ^,„(0)=1 (£ = 0,1 т). (3)
§ 5] ПОСТРОЕНИЕ ОРТОГОНАЛЬНЫХ ПОЛИНОМОВ ЧЕБЫШЕВА 25 Будем искать полином Pk<n(t)(k = 0, 1, 2, ... , от) в виде ^.nW=i+^^4-V[2J + ...+Vl*J. (4) где № = t(t— !)...(<—/4-1) — обобщенные степени. Так как любой полином Pjn (t) может быть представлен в виде где ds — постоянные, то для обеспечения условий ортогональности (2) достаточно, чтобы были выполнены соотношения ЗС'+У^.Л'^О (/ = 0,1,2 £-1). (5) Полагая t = i в формуле (4) и умножая Рк п (i) на (t -\-J)u\ будем иметь Суммируя эти равенства по всем t от ί' = 0 до i = n и учитывая условие (5), получим + *2 i ('+y)v+2)+ · · · +ьк 2 (/+/Г+*'=о. (6) / = Ο ί = О Как известно (см. [2]), i(/+y^(>,+y+!f;+'1,-/"" = 1=0 так как, очевидно, /,+ ,J = 0 при s2=/. Поэтому формула (6) приобретает вид —грТ г- 2+7 °.-τ···-ι * + ι+/ -** —υ для /=0, 1, 2, . .. ,k— 1. Сократив обе части предыдущего равенства на l»+y+l)I, + 1J.
26 ПРИБЛИЖЕНИЕ ФУНКЦИЙ [ГЛ. I получим „1*1 Т47+2Т7*· + · · · + /иЛТ7*А==:0 для /=0, 1,2,..., k— 1. Полагая ri'lb.=*a„ окончательно имеем Ч 1+/'п 2+У I 3+УП '--^ A + 1-W' (/=0, 1 ft—1). (7) Таким образом, получена система k линейных уравнений с k неизвестными а,, аг, ... , ак. Для решения системы (7) применим искусственный прием. Сложив дроби, стоящие в левых частях уравнений (7), получим _J ι «ι ι ι а* __ 01/) г_ ,8\ 1+/-Γ2 + /"1"···~Ι"* + 1+/—"(* + /+ »),ΤΠΪ' V' где числитель Q(y') является полиномом степени не выше А, обращающимся в нуль, в силу (7), для k значений у'=0, 1, 2, ... ,k — 1. Следовательно, QU)^JU- ι) · · · (/—*+ ΐ)£* = <ν*'. Для определения константы С4 умножим обе части равенства (8) на (1 -[-/) и тогда получим ,,1+У , ι '+/ Ei^U 1-1-2 + /Й1_1"--'"+"*+1+/й* —(2 + /)(3 + /)... (ft + 1+/) · Полагая /' = —1, будем иметь , „Cftt—1)(—2)...(-*)_ Отсюда и, следовательно, 1 , α, , а, 1 _. ι "ι ι "з ι 1-|-/~Г2 + У"Т~3+У "Г" 1-2... k ск = {-\)к \ а* 1 ■···+,+ !+/ + ·· " ι Ч • 1 *+ι+,— (— 1)*/!*' <* + 1+/)'*+" (9) Для нахождения коэффициента as(s= I, 2, ... , k) умножим обе части формулы (9) на (s -j- l -j-y) и в полученном тождестве положим у = —(s-f-Ι). Находим „ _ Г (-!)*/(/-»)·■■(/-* + ») 1 ^ s l.(* + 1 + /Χ* +Λ ... (* + 2 +/) (ί + /)... (1 4-/) J/=-(.t + i. (— !)*(—s — 1)(—л —2) ... (■—a —fe) (— !)'*(&-fa)1*1 (ft —4)(A —-s — 1)... 1(—1)(— 2)...(—«) """ (A —a)! (—!)*«! "
§ 5] ПОСТРОЕНИЕ ОРТОГОНАЛЬНЫХ ПОЛИНОМОВ ЧЕВЫШЕВА 27 Таким образом, коэффициенты as определяются по следующей формуле: Формулу (10) можно привести к другому, более симметричному виду. Так как * k+s s\{k — s)l' s\k[ «! ί! (k — s)\ ~~ si (k — s)\' то можно записать a, = (-l)'qci+1. (11) Возвращаясь к коэффициентам bs (s — 0, 1, 2, ...,k), получим Подставляя найденные значения коэффициентов а формулу (4) для полинома Pk n(t), будем иметь ^,nW = i-qq+1|+qq+25-...+(-i)*qc*+4^(i3) или короче к ^.«(^Е^-^'ВД+'Й (* = 0, 1, 2 т). (14) Формула (13) дает выражение для полиномов Чебышева степеней £ = 0, 1, 2, ..., т при л-j- 1 узлах интерполяции: t = 0, 1, 2, ..., л. Запишем несколько первых полиномов Чебышева (13): ^.-W-l-e^ + ei^ при „>2; ί(ί-Ι) on Щ - 1) (ί - 2) Ρ (Λ —ι_ΐ2- + 30-^ί fj —20 (л - 1) η (ιι — 1) (η - 2» при я > 3 и т. д. Покажем, что полиномы (13) образуют ортогональную систему. Пусть Q(t) — произвольный полином степени q<C,k. Представим его в виде i=0
28 ПРИБЛИЖЕНИЕ ФУНКЦИЙ [ГЛ. I где As—постоянные коэффициенты. Из формулы (5) очевидно, что β частности, приняв Q(t) = P/tJf) при j<k, получаем а это и есть условие ортогональности (2). Для подсчета выражения η используем формулы (4), (5), (12) и (9) при J=k. Получаем blgcicit.(l,+t + 1);*+,i. (-"**'*' ^f+^ + iy*;-, „i*J * «* x ' ' ' (2Λ 4-1 )i*+ ч (2ft+1) я1*' "~L· *'"(0_ (2*+ 1)я'« ' ' ' Окончательно аппроксимационная формула Чебышева имеет вид *=о * ν ' где Из формул (15), (16) и (17) видно, что каждый полином Чебышева можно умножать на любой постоянный множитель, отличный от нуля. При этом величина Qm (x) не изменится. Это свойство используют для того, чтобы путем умножения на подходящее число получать целые значения полиномов Чебышева в узлах аппроксимации.
§ 5] ПОСТРОЕНИЕ ОРТОГОНАЛЬНЫХ ПОЛИНОМОВ ЧР.БЫШЕВА 29 Пример. Получить по способу наименьших квадратов полином пятой степени, приближенно представляющий табличную функцию [3|: X У 0 1,300 0,3 1,245 0,6 1,095 0,9 0,855 1,2 0,514 1,5 0,037 ',8 —0,600 2,1 — 1,295 2,4 —1,767 2,7 — 1,914 Решение. Здесь т=5, η — 9. Полагаем 1 о,г Для удобства выкладок воспользуемся полиномами отличающимися от полиномов Чебышева Рк п (ί) лишь числовыми множителями р4 п = Рк п (0), подобранными так, чтобы для целочис- ленных значений аргумента t значения Pk n (t) были бы также целочисленными. Вычисления расположим в таблицу 4. Таблица 4 Построение аппроксимирующего полинома методом Чебышева t 0 1 2 3 4 5 6 7 8 9 X 0 0,3 0,6 0,9 1,2 1,5 !,8 2,1 2,4 2,7 1 U У ро«) р|,. О 1,300 1,245 1,095 0,855 0,514 0,037 —0,600 —1,295 —1,767 —1,914 —у ΐ bi —0,530 10 —0,053 9 7 5 3 1 —1 —3 —5 —7 —9 66,802 330 0,202 К> № 6 2 —1 —3 —4 —4 —3 —1 2 6 —7,497 (32 —0,057 К,,т 42 — 14 —35 —31 — 12 12 34 35 14 —42 — 14,659 8850 —0,005 К< о 18 —22 — 17 3 18 18 3 — 17 —22 18 14,515 2560 0,005 Р5,9 <Й 1 У \ 6 —14 1 11 6 — 6 —11 — 1 14 — 6 —1,627 780 —0,002 1,310 1,236 1,098 0,868 0,514 0,017 —0,002 —1,263 —1,793 —1,908 •=У-У —0,010 +0,009 —0,003 —0,013 0 +0,020 +0,002 —0,1032 +0,026 —0,006 Отсюда аппроксимирующий полином имеет вид Q ю = _ 0,053 +0,202 Pl>t (t)-0,057 Р2^ (ή —0,005 Я,,, (t) + + 0,005 P4it(0 — 0,002 Pi>t(t)
30 ПРИБЛИЖЕНИЕ ФУНКЦИЙ <?(ί) = —0,053+1,818/^.(ή —0,342/>,,,(*) —0,210 Ρ,ι§ (г) + + 0,090P4if(0— Q,012Ptit(t). Точность аппроксимации характеризуется последним столбцом таблицы. § 6. Интегральное квадратичное аппроксимирование функций на отрезке Предположим, что данную непрерывную функцию f(x) нужно аппроксимировать на конечном отрезке [а, Ь\ с помощью обобщенных полиномов (1) Q (х) = c0tp„ (χ) + ε,φ, (*)+...+ с„<?„ (x), где {φ(- (λ;)} — заданная система непрерывных функций и с(· — постоянные коэффициенты. Согласно способу наименьших квадратов коэффициенты c,-(i = 0, 1, 2,...,я) подбираются так, чтобы квадратичное отклонение полинома Q[x) от функции / (х), равное 1п = S [Q (*) — /' Wl2 dx = I [ .Σ ci? i W — / Wl* d*. (2) имело наименьшее значение. Для нахождения минимума функции /я = /п(с0, с,,...,^), как известно, нужно составить все частные производные д1а дс/ (i = 0, 1, 2, ...,я) и приравнять их нулю. Это дает систему для определения коэффициентов с0, с„ . ..,св: α ί = ι> Γ = j [Χ c,¥/ (χ) — /(*)] φ, (*) d* = 0, 2 ас τ £=J [ Σс'*'w -^w] ϋ- wrf*=°· (3)
§ 6] ИНТЕГРАЛЬНОЕ КВАДРАТИЧНОЕ АППРОКСИМИРОВАНИЕ 31 Вводя сокращенные обозначения ь (φ, ψ) = J tp (л;) ψ (л;) dx, а систему (3) можно записать в следующем виде: со (<?„> fo) + ci (¥ι. То) + ■ · · + с™ ^«. <Р„) = (/- ¥о). со (т\>. ίΡι) + с, ("Ρ,, f>.) + · · ■ +cn (¥»· Ψ ι) = (/. <?,)■ с. (т\»?л) + с, (<?„ φ„) + . · · +с„ (tf>„, φ„) = (/, φ„). (4) Доказывается [2], что если функции φ0 (χ), ψι(χ), ..., ψη(χ) линейно независимы на [a, b\, то система (4) имеет единственное решение, которое соответствует наименьшему квадратичному отклонению /п. Пример 1. Найти наилучшую квадратичную аппроксимацию функции f{x)=Vx на отрезке [0, 1| посредством полинома первой степени QW = «, + V· Решение. Здесь <Р„ Μ = ' и Ψ ι W = *■ Имеем > > («P., <p0) = jl'rf* = l; (/, p0) = J^rfJf = -J-; О О 1 1 о о 1 Следовательно, система (4) имеет вид J_ _2 Тс' "3 2 Отсюда _1_± — 1 со_Г 2 Ci — 3 ' ■> со "Τ ч ci — к ·
32 ПРИБЛИЖЕНИЕ ФУНКЦИЙ [ГЛ. 1 и, следовательно, Q(x) = TE + Tx- Пример 2. Функцию f(x) = 3x квадратично аппроксимировать на отрезке [—1, Ij полиномом второй степени. Решение. Положим Q(x) = c<t-\-clx-\-c1xt, где коэффициенты с0, с, и с, подберем так, чтобы имел наименьшее значение интеграл У= j(c0-Kx4-c2x'-3*)2rfx. Используя необходимые условия экстремума функции, получаем систему I — 1 1 "2^= §x(c0-\-clx-\-c,xt — 3*)dx = 0, - 1 1 Отсюда О _1_Л — 8 Л«+зе!_3 In 3 ' 2_ ___1£_ 8_ 3 С'~~31пЗ ЗЫ'З' 2_ ,2_ __8 20 . 16 3 С° "ι 5 С» 3 hi 3 3 In2 3 ~"~ 3 In' 3 ' 1 , 4 Г5 = 0,8013; Следовательно, "°~~ 31η3 ' 31η· 3 с'==ПГз 'й1!^ !>5344: 65 170 , 40 _ с» —9ta3-~9fi?3 + 3h?3 * °'9806· QU) = 0,8013 4- 1,5344л; + 0,9806л:1
§ 7J ОРТОГОНАЛЬНЫЕ СИСТЕМЫ ФУНКЦИЙ 33 Заметим, что неудобством интегральной квадратичной аппроксимации является необходимость вычисления определенных интегралов, которые могут быть весьма сложными и даже не выражаться через элементарные функции. В этом смысле способ точечной квадратичной аппроксимации предпочтительнее. § 7. Ортогональные системы функций В случае, когда степень аппроксимирующего полинома велика, метод отыскания такого полинома, указанный в § 6, становится громоздким и его заменяют другим методом, основанным на идее ортогональных функций. Определение. Система интегрируемых функций <?,(■*;). ψΛχ) Ψ,,(χ) U) называется ортогональной на [а, д], если ь (fm> <Рв) =$«>„,(*)'fn Μ*** = ° при тфп. Число и», ми=Vet,. ψ,)=ν \ ψ; w <<* γ и называется нормой функции ψιη (χ) на отрезке [а, Ь\. Если нормы всех функций системы (1) равны единице, то эта система называется ортонормированной (ортогональной и нормированной). Для ортонормированной системы выполняется следующее условие: ь а где Ьтп — символ Кронекера, т. е. ^лп^0 "Ри тфп; Ьтп=\ при т = п. Очевидно, всякую систему, не содержащую функций с нулевой нормой, можно нормировать. Для этого достаточно каждую функцию разделить на ее норму. Система функций %(х] II т. (χ) II' 4,,w_||<p,WH φ»1*' ЦТ-МП·"· нормирована, так как
34 ПРИБЛИЖЕНИЕ ФУНКЦИЙ [ГЛ. 1 Пример. Пронормировать систему функций 1, X, X , . · ·, X , , · ., \2) заданную на отрезке [0,1]. Решение. Имеем Ф.М = После нормирования система (2) имеет вид 1, УЪх, УЪх\ .... V2m-\-\xm, ... Если система функций {tp,-(x)} ортогональна на отрезке [а, Ь\, то задача о квадратичной аппроксимации данной непрерывной функции f{x) на заданном отрезке [а, Ь\ с помощью обобщенного полинома Qm (*) = с.<Р. (x) + <\<Р, (*) + ...+ cm<fm (x) получает простое решение. В самом деле, из необходимого условия минимума интеграла ь [Σ£/?Λ*)—/WN* (3) а ' = » для определения коэффициентов с,- (' = 0, 1,2, . . ., от) имеем систему т -f-1 уравнений b /л ΤΛϊ==ί [Zc/?/W— /Wh,W^ = 0 (У=0, 1,2, ...,я). (4) После несложных упрощений система (4) принимает вид ί> ι. Σ сЛ ?,■ W у, (л;) dx = f / (χ) ^ (λ) Ле. (5) '-о а а В силу ортогональности системы {φ,·(χ)} выполнено равенство ь ^ Ψι {χ) еру (х) dx = 0 при г =^=у.
§ 7J ОРТОГОНАЛЬНЫЕ СИСТЕМЫ ФУНКЦИЙ 35 Поэтому все слагаемые левой части уравнений (5), за исключением /-го, обращаются в нуль. Следовательно, ь ь С/ \ ψ) (х) dx = $ / (х) ψ,- (х) dx. а а Предполагая, что среди функций φ,- {χ) (/ = 0,1,2,...,/») нет функции с нулевой нормой, т. е. ь получим окончательно ь J } (χ) φj {X) dx >—b (7 = 0,1,2 m). (6) Tj (x) dx В знаменателе формулы (6) стоит квадрат нормы функции Ψ/(χ), τ. е. b \f(x)^f(x)dx (7) '~~ ιΐτ/wir · В случае ортонормированной системы коэффициенты вычисляются особенно просто: ь C/=S/(*)<?/(*)** (У^0· !- 2 «)· i8) Коэффициенты с,, определяемые формулой (7), называются коэффициентами Фурье функции f(x) относительно заданной ортогональной системы {<?,·(.*;)}. Для доказательства того, что значения cf дают минкмум интегралу /т, составим второй дифференциал d%Im. Из формулы (4) имеем = \ φ^, (χ) <fk (x) dx = 0 при J^= k. 1 d'Jm 2 dCjdck Следовательно, m m ^=Σ%^/+2 Σ &:*λ=2Σ ιι»/*>ιΐ!<^>° при 2 ^с} 7^ 0·
36 ПРИБЛИЖЕНИЕ ФУНКЦИЙ [ГЛ. I На основании известной теоремы математического анализа получаем, что при значениях с,, определяемых формулой (7), интеграл 1т имеет минимум. Более того, так как /я имеет единственный минимум, то легко убедиться, что значение 1т, соответствующее коэффициентам Фурье с,, является наименьшим в пространстве коэффициентов с0, с,, ..., ст. Таким образом, можно сформулировать следующий вывод: обобщенный полином с коэффициентами Фурье данной функции обладает наименьшим квадратичным отклонением от этой функции по сравнению со всеми другими обобщенными полиномами того же порядка т. Дадим оценку отклонения (3) для случая, когда ct являются коэффициентами Фурье. Имеем b m α ι ί=ο Ь τη т = 5 \f W - 2/ (χ) Σ чъ Μ + Σ с<- ϋ? Μ + m + 2 Σ cickfι (*) Ϋ* (*)1 dx. ί<* J Переходя от интеграла суммы к сумме интегралов, получим Ь т b /n b l = S f wdx—2 Σ °t 5 /м ъ мdx+Σ c'? S υ? w ^+ α / = o a i' = oa /n b + 2 Σ cicЛ Ϋί Μ f* Μ <*·*· (9) ί < * α Так как ь ь <\jf(x)4t(x)dx = ci[y\(x)dx (1 = 0, 1, 2, ..., /и) а а И ь \ φ4 (λ;) φ(. (χ) dx = 0 при ij^k, а то после приведения подобных членов в формуле (9) имеем b m b L = J f [χ) dx - Σ c< S <p? I*)rf*' U o)
§ 7) ОРТОГОНАЛЬНЫЕ СИСТЕМЫ ФУНКЦИЙ 37 или в терминах нормы функций т /*ΗΙ/Μ||'-Σ',?|Ι<Μ*)|Ι'· 01) i —О Так как !т^0, то из формулы (11) получается так называемое неравенство Бесселя т Σ'?ΙΙφ,·ΜΙΙ'<ΙΙ/(*)ΙΙ'· 02) В частности, при т—► оо получаем iU'll<P/(*)ll'<ll/WII'- 1=0 Если система ψΛ(χ), <ρ, (■*:), ..., ут(х), ... ортонормироваиа, то формулы (11) и (12) упрощаются. В этом случае т /« = ll/WI!'-Sc' (13) и Σ с? < II/МП'. (14) 1 = 0 Отметим, что обобщенный полином Qm (x) с коэффициентами Фурье обладает важными свойствами: 1) при увеличении числа слагаемых т младшие коэффициенты с,, как следует из формулы (7), остаются неизменными, т. е. при добавлении новых членов проделанная прежде работа сохраняется полностью; 2) при увеличении т квадратичная погрешность /. = $ [(?«(*)-/(*)!'<** в силу формулы (10) монотонно убывает в широком смысле, т. е. in + \ '■ Таким образом, присоединение новых слагаемых увеличивает точность аппроксимации. Если система ортогональных функций {и,- (х)} такова, что для любой непрерывной функции /(х) справедливо соотношение lira /β = 0,
38 ПРИБЛИЖЕНИЕ ФУНКЦИЙ [ГЛ. 1 то эта система называется полной. В противном случае система называется неполной. Предполагая, что система {φ; (χ)} полная, и переходя к пределу в равенстве (11), будем иметь 00 ο = 1Ι/(*)||,-Σί'11φί(*)ΙΓ. т. е. 2^1Ы*)1Г = 11/(*)1!'· (15) β частности, если полная система ортонормирована, то 00 Σ с] =||Λ*)ΙΓ· (16) Равенство (15) называется равенством Парсеваля или условием полноты. Если с,-рассматривать как компоненты функции /(х) относительно ортонормированной системы {ψι(χ)}, то можно сказать, что равенство Парсеваля (16) является аналогом теоремы Пифагора в функциональном пространстве. § 8. Понятие о гармоническом анализе В качестве примера ортогональной системы рассмотрим тригонометрическую систему 1, sinx, cos л:, sin 2x, cos 2x, ..., sin nx, cosnx, ... (1) Покажем, что эта система ортогональна на любом отрезке длины 2π, например на отрезке [—π, π]. Для этого проверим обращение в нуль интегралов·. тс 1. \ sin mx sin nx dx, если т и η — целые и тфп\ — π 1С 11. \ cos mx cos nx dx> если т и η — целые и тфп\ — 1Ϊ π 111. \ cos mxsianxdx для всех целых т и п. — π Действительно, . С . , 1 Г sin (m — η) к sin {т -\- η) χ] * п 1. \ s\n tnx s\a nx άχ=ζ-ΓΓ \—* г =0. — к если man целые и т ψ- η;
§ 8) ПОНЯТИЕ О ГАРМОНИЧЕСКОМ АНАЛИЗЕ 39 1С ,, С j 1 Гsin (т 4- π) χ , sin (m — η) χ]« „ 1. cos дал: cos ял; dx=-^ —' 7^ ' 4- ■—5 — = О J 2 у т-\-п ' га — л J _π при /я=£я. Интеграл III обращается в нуль на отрезке [—π, π| в силу нечетности подынтегральной функции. Полагая в первом и третьем интегралах т = 0, получаем π π j 1 ■ cos пх dx — 0; \ 1 -sinnx dx = 0. Итак, тригонометрическая система (1) ортогональна на отрезке I—π, π], а следовательно, и на любом отрезке [а, 2тг-|-й]. Вычислим нормы функций, входящих в систему (1). Имеем 1 smnx cos пх ] = ]/ J \Чх =\ί2ϋ, — π I—I/ \ sin1 пх dx = y-Kt — г l = l/$cos* dx = j/π. (2) Пусть дана непрерывная периодическая функция с периодом 2тт. Составим тригонометрический по лино м Qn (χ) = -γ- + 2 (ak cos ** + bk sin **)! (3) слагаемые u0= ~, uk — ak cos kx -j- 6t sin kx (&=1, 2, ...) обычно называются гармониками. Для того чтобы квадратичное отклонение полинома Qn (x) от функции f(x) было минимальным, коэффициенты а0, а^, д4 должны быть коэффициентами Фурье функции f(x) относительно тригонометрической системы. Отсюда, на основании § 7 (формула (7)), учитывая
40 ПРИБЛИЖЕНИЕ ФУНКЦИЙ [ГЛ. I соотношения (2), получаем π ak=— \ f(x) coskxdx, ± $/(*)■■ bk=— \f(x) sin kxdx (4) U = 0, 1, 2, ..., n). Коэффициенты ак, bk называются тригонометрическими коэффициентами Фурье функции f(x), а соответствующий тригонометрический полином (3)—тригонометрическим полиномом Фурье. Свободный член записывают в виде ~- для того, чтобы коэффициент я0 получался из первой формулы (4) при А=0. Из формул (4) следует: если функция f(x) четная, то коэффициенты причем bk=0 (*=1,2, .... п), ТС аА —— J f(x) cos kxdx (k = 0, 1, 2, ..,, η), о η QnW = -T+ Σ akcoskx. (5) Если же /(χ) — нечетная функция, то ak = 0 (k = 0, 1, 2 η), \ 2 (" £>Λ = — J /(λ:) sin Axrfx (fe=l, 2, ..., я), причем Q„ (x) = Σ bk sin kx- Подставляя в формулу (3) коэффициенты (4), при η—► оо получаем для функции f{x) ее тригонометрический ряд Фурье со -ψ-\-Σ (ak cos kx -\- bk sin kx). A=l Представление функции тригонометрическим полиномом Фурье или тригонометрическим рядом Фурье называется гармоническим анализом. Если функция задана несложным аналитическим выражением, то
§ 8] ПОНЯТИЕ О ГАРМОНИЧЕСКОМ АНАЛИЗЕ 41 коэффициенты ее тригонометрического полинома Фурье вычисляются по формулам (4). Если же вычисление интегралов (4) громоздко или функция f(x) задана таблично, то для вычисления коэффициентов Фурье имеются различные приближенные способы. Один из этих способов состоит в том, что интегралы (4) вычисляются приближенно по формуле трапеций (см. [2)). Рассмотрим отдельно три случая. Случай 1. Функция f(x) — четная. Применяя формулу трапеций б \f(x)dx^b-=^ (^yt -f у, -|-Λ +...-!- У*-, +4 Ум) к интегралам (4), получаем й*= 1 ' ~Έ В"^ W cos kx« +/W cos bx, -\-... Xi = ~i (i = 0, 1, 2, ...,/я). где Введя обозначения >O=2-/W; у.=/(*,); y«-, =/(*«-.); ^/(хт). получим а* = -^ (Уо cos ^о + У. cos **, -f-... +у„ cos kxm) (k = 0, 1,2, ...,/»). (7) Пример 1. Построить тригонометрический полином Фурье для четной функции, заданной следующими данными: X,- /(*;) и Ι π Ι π Ι π ! Π Ι 5π Ι 12 Ι 6 4 Ι 3 [ 12 9,55 9,46 | 9,25 8,96 8,58 8,10 π 2 7π 2π 3π 12 J 3 J 4 7,59 7,00 6,34 5,56 5π 6 4,80 11π 12" 4,21 π 4,00 Решение. В формуле (7) берем m=12, иными словами, отрезок I—π, π] делим на 24 части. Ограничимся шестью гармониками,
42 ПРИБЛИЖЕНИЕ ФУНКЦИЙ [ГЛ. I не считая нулевой, т. е. примем η = 6. Все вычисления для отыскания коэффициентов ak располагаем по схеме А (табл. 5). η В строке 2 записываем сумму £ yt cos kx = sk для k — О, 1, 2, ..., 6. Разделив sk на -j- = 6, получаем приближенные значения коэффициентов ак, приведенные в последней строке схемы А. Таблица 5 Схема А, Вычисление коэффициентов Фурье для случая четной функции / 0 1 2 3 4 5 6 7 8 9 10 11 12 л* У1 4,78 9,46 9,25 8,96 8,58 8,10 7,59 7,00 6,34 5,56 4,80 4,21 2,00 86,63 14,44 COS JCj 1 0,96593 0,86603 0,70711 0.5 0,25882 0 —0,25882 -0.5 —0,70711 —0,86603 —0,96593 — 1 15,52 2,59 COS 2Xi 1 0,86603 0.5 0 -0,5 —0,86603 —1 —0,86603 -0,5 0 0,5 0,86603 1 —2,48 —0,41 cos 2χι cos 4*ϊ 1 0,70711 0 —0,70711 — 1 —0,70711 0 +0,70711 1 0,70711 0 —0,70711 —1 1,06 0,18 1 0,5 -0,5 —1 —0,5 +0,5 1 0,5 —0,5 — 1 —0,5 0,5 1 —0,25 —0,04 cos 5*, cos 6*t 1 0,25882 —0,86603 —0,70711 0,5 0,96593 0 —0,96593 -0,5 0,70711 0,86603 —0,25882 — 1 0 0 1 0 —1 0 1 0 — 1 0 1 0 -1 0 1 0,06 0,01 Искомый полином имеет вид Qe (χ) = 7,22-1- 2·59 cos x — °'41 cos 2x -\~ -}- 0,18 cos 2>χ — 0,04 cos \x -f 0,01 cos 6x. Для проверки вычислим Q. (0) = 7,22 -}-2,59 — 0,41 +0,18 — 0,04 -f 0,01 =9,55. Полученный результат хорошо согласуется с заданной таблицей. Случай 2. Функция f(x) — нечетная. В этом случае задача нахождения тригонометрического полинома сводится к определению коэффициентов bk (формула (6)): π bk = — \ / (χ) sin kx dx*
§ 8] ПОНЯТИЕ О ГАРМОНИЧЕСКОМ АНАЛИЗЕ 43 Применяя к этому интегралу формулу трапеций, получим 2 и Г1 bk=~--ir Ι τ/ Wsi nkx, + + /(>;,) sin Αχ,+ ... 4-/(Jcn_,) sin *«„,_, +-^-/(λ;,,) sin fcxm] , где x,=—i (i = 0, 1, m). Введя обозначения yi=/(xi) (/ = 0, 1, . . ., m) и замечая, что sin kx0 = sin kxm~ 0, получаем ** = -^-l)\sin**,+.y,sin **!+·■· +^«-isin**«-i) = 2 "W = — Σ У ι unkxt. '" 1 = 1 Пример 2. Построить тригонометрический полином Фурье Q,(x) для нечетной функции f(x), заданной табличными данными: х, 0 / (Χι) 0 π 12 —0,07 тс 6 —0,10 тс 4 —0,11 π 3 0,16 5* 12 0,65 7С 2 1,19 7π 2тс 12 3 1,55 1,49 3π 4 5π 6 11π 12 1,11 0,58 0,13 π 0 Решение. Все вычисления располагаем по схеме Б (табл. 6), аналогичной схеме А для четной функции. В последней строке схемы Б записаны приближенные значения коэффициентов Ьк. Искомый полином имеет вид Qt (*) = 0,952 sin χ — 0,030 sin Чх— 0,252 sin Ъх -\ 0,194 sin 4x~ — 0,056 sin Ъх 4- 0,020 sin 6*. Для проверки вычислим Q 6 V 2 Имеем Qb (±\ = 0,952 -j- 0,252 — 0,056 = 1,148 вместо / ( -=-) = 1,19 (согласие удовлетворительное!). Случай 3. Функция f(x) не обладает четностью. Очевидно,
44 ПРИБЛИЖЕНИЕ ФУНКЦИЙ [ГЛ. I Таблица 6 Схема Б. Вычисление коэффициентов Фурье для случая нечетной функции i 1 2 3 4 5 6 7 8 9 10 И Σ Ьк Vi —0,07 —0,10 —0,11 0,16 0,65 1,19 1,55 1,49 1,11 0,58 0,13 _ sfn xt 0,25882 0,50000 0,70711 0,86603 0,96593 1 0,96593 0,86603 0,70711 0,50000 0,25882 5,7066 0,952 >ln 2x, 0,00000 0,86603 1 0,86603 0,50000 0 —0,50000 —0,86603 —1 —0,86603 —0,50000 —0,178 —0,030 sin ΖΧι 0,70711 I 0,70711 0 —0,70711 — 1 —0,70711 0 0,70711 1 0,70711 — 1,5161 —0,252 »ln ix, 0,86603 0,86603 0 —0,86603 —0,86603 0 0,86603 0,86603 0 —0,86603 —0,86603 1,1691 0,194 sin 5дг, 0,96593 0,50000 —0,70711 —0,86603 0,25882 1 0,25882 —0,86603 —0,70711 0,50000 0,96593 —0,338 -0,056 Sill 6дГ( 1 0 --1 0 1 0 —1 0 1 0 — 1 0,120 0,020 причем первый член правой части четен, а второй—нечетен. Обозначая где F(x)— четная, а О(х)— нечетная функции, представим всякую функцию f(x) в виде суммы четной и нечетной функций: f(x) = F(x)-\-0(x). Тригонометрический полином Фурье функции f(x) складывается из тригонометрических полиномов Фурье функций F{x) и G{x). Но тригонометрический полином функции F(x), содержащий лишь косинусы кратных дуг, находится по схеме А, а для функции О(х) — по схеме IS. Таким образом, общий случай сводится к разобранным выше. Пример 3. Построить тригонометрический полином Фурье функции f(x), заданной следующими табличными данными: xi /(*/) π 0,04328 11π 12 0,05613 5it 6 0,07353 3π 4 0,09536 2г. 3 0,1237 7π Ι π 12 2 0,1604 0,2080 5π 12 0,2698
§ 8] ПОНЯТИЕ О ГАРМОНИЧЕСКОМ АНАЛИЗЕ 45 К; /(*/) π π π -у I-τ J -β 0,3535 0,4584 0,5945 π ~Ϊ2 0,7711 0 π π 12 У 1,0000 1,2969 1,6820 Τ 2,1815 У 2,8292 Χ; /W 5π 12 3,7062 π У 4,8066 7π 12 6,2399 2π 8,0849 3π 4 10,4860 5π 6 13,5993 11π | ТУ | π 17,8142 23,1040 Решение. Определяем значения функций /^ (χ) = -»■ [/(χ) -j- -{-/(—*)] и 0(jc) = -=- [/(jc) — /(—л;)] и результаты записываем в таблицах 7 и 8 соответственно. Таблица 7 Значения функции F(x) К( 0 У i 0,6000 π Ϊ2 1,0340 π Ι, 13825 π Τ 1,31095 7ΐ У 1,59135 5r. 12 1,9880 π Τ 2,5073 χ,- У, 7π 12 3,20015 2π У 3π 4 4,1043 Ι 5,29068 5π 6 6,83642 11π 12 π 8,93516 5,78682 3Ό = -2-/(χο): Уп = "2-/(*л) Таблица 8 Значения функции G (χ) χ, У1 0 0,0000 π Ϊ3 0,2629 π У 0,54735 π Τ 0,86155 τ; Ι ,23785 5π Ϊ2 1,7182 π У 2,2993 xt V/ 7π 12 3,03975 2π 3 3,9806 3π 4 5,19532 5π 6 6,76288 11π 12 8,87904 π 11,53036
46 ПРИБЛИЖЕНИЕ ФУНКЦИЙ [ГЛ. I Вычисление коэффициентов функции F(x) по схеме А дает -^-α„ = 3,686; β,= —3,705; а, = 1,510; а, = — 0,776; а, = 0,488; а5= —0,366; а, = 0,250. Таким образом, F, (х) = 3,686 — 3,705 cos χ -f 1,510 cos 2x — 0,776 cos Зл; -\- -\- 0,488 cos 4л; — 0,366 cos 5x -\- 0,250 cos 6x. (8) Для функции G(x) используем схему Б и получаем: *, = 3,475; 62 = —2,699; *э = 2,066; *4 = — 1,698; *5 = 1,347; 66 = —0,934. Следовательно, G, (х) = 3,475 sin χ — 2,699 sin Чх -\- 2,066 sin Ъх — 1,698 sin 4x -f + 1,347 sin 5x — 0,934 sin 6x. (9) Складывая полиномы (8) и (9), получаем искомый тригонометрический полином Qt (χ) = 3,686 — 3,705 cos χ -\- 3,475 sin χ + 1,510 cos 2x — — 2,699 sin 2x — 0,776 cos Ъх -f 2,066 sin 3x -f 0,488 cos 4x — — 1,698 sin 4x — 0,366 cos Ъх -j- 1,347 sin Ъх -f 0,250 cos 6л: — — 0,934 sin 6л:. Для проверки вычислим Qt(-^j. Имеем ρ f |Λ = 3,686 + 3,475 — 1,510 — 2,066 -f 0,488 -f 1,347 — — 0,250 = 5,170 вместо /(у) = 4,8066. Относительная погрешность приближения =5%. § 9. Полиномы Лежаидра Полиномы Лежандра определяются следующей формулой Родрига: (я = 0, 1, 2, ...).
§ 9] ПОЛИНОМЫ ЛЕЖАНДРА 47 В частности, имеем РАх)=1, Р, (*) = *, р1(*) = -(3*1 — 1), />, (дс) = т (5*· — Зле), Р4 (*) = 1(35** —30*'-|-3) (2) и т. д. Графики этих полиномов для η = О, 1, 2, 3 и 4 приведены на рис. 3. Рис. 3. Из формулы (1) видно, что Р„(х) являются четными функциями при /1 = 2/«н нечетными — при п = 2т-\- 1. Теорема 1. Полиномы Лежандра образуют ортогональную систему на отрезке [—1, 1], т. е. 1 \ Р„Йр..М^ = 0 при тфп (т, л=0, 1, 2,. ..)·
48 ПРИБЛИЖЕНИЕ ФУНКЦИЙ [ГЛ. I Доказательство. Имеем 1 — 1 ~'lm*"m\n\ J rfxm,X ' dx' -„W-\)"dx. (3) Пусть m<in. Применяя к интегралу, стоящему в правой части равенства (3), формулу интегрирования по частям и учитывая, что dk (χ2 - 1)" dx* ■ О при k <^п (4) (так как значения x=z.-+-\ являются нулями кратности η для функции (х1—1)"), получим Jmn — 2m + "n\m\\dxmK ' rfx"-,kX ' |_, — ι ' — ' Г - (хг IV — (x2 ]\"/1x После л-кратного интегрирования но частям формулы (3), в силу соотношения (4), будем иметь / —_J il 1 ϋ (ν2 η™ (ν2 \\п dx 'тп 2m + "n\m\ J dxm + n Ч \л Ч ил· (5) Но так как m<in, то, очевидно, dm+" и, следовательно, 1 Lu = $ pm (*) р« (*) dJc = 0 при т φ п. — 1 Замечание 1. Подсчитаем норму полинома Рп (х). Полагая /я = л в формуле (5) и принимая во внимание, что dx
§ 91 ПОЛИНОМЫ ЛКЖАИДРА 49 получим I PnMdx = ^?\ ^(χι-\)η[χ*-\)η<ΐχ-- — > — 1 ϋ2" («!)■ — 1 1 = 2^3? S 0-*)"(1+*)"*£. (6) — 1 Последний интеграл вычисляется при помощи /г-кратного интегрирования по частям: \ (\-x)"(\+x)"dx = (\-x)n{l+^"{+'\ + — 1 1 — 1 ] + тгфт $ 0-*)"-'(1-τ-*)"*'** = — 1 -(»+1|(/1 + 2)...2л) 11т^ (2и)! 2л + 1* К> Подставляя полученный результат (7) в формулу (6), будем иметь S^W^ = ^--lS-2^ = 2TTT l«==0. 1.2 >. (8) - 1 Таким образом, 11 ^ (*> IP = эгтт или '^wih/sttt· Нормированные полиномы Лежандра Ра(*)= У^Г-РпМ (л = 0, 1, 2, ...) образуют на отрезке [—1, 1] ортонормированную систему полиномов, для которых с /\ /\ (Г) 5 PnWP.W*x = {i О при тФп, при т~п.
50 ПРИБЛИЖЕНИЕ ФУНКЦИЙ \ΓΆ. Ι Замечание 2. Полиномы Лежандра обладают усиленным свойством ортогональности 1 J Pm(x)Rk(x)dx = 0 (*<m), (9) — 1 где Rk(x)— любой полином степени к, меньшей т. В самом деле, очевидно, справедливо соотношение Rk (*)=* с, Рк (х) -f- с, Рк_, (х) + ... + скР6 (х), коэффициенты которого с0, с,, ..., сА могут быть определены с помощью последовательных делений. Отсюда 1 1 * $ рт w к* (*) л* = Sя-w Σс<р*- .· мdx= — 1 —Ι ί=0 к ι i—о - ι Замечание 3. С помощью линейного преобразования b — а , Ь 4-а где —1<л;£й1, можно получить полиномы Г ь + а\ Ъ-а ' \ "Г" / ортогональные на отрезке [а, о], т. е. такие, что ъ \Pm(z) Pn(z)dz = 0 при тфп. а Используя формулу (8), легко показать, что ъ ^P'n(z)dz=±=^ (л = 0, 1, 2, ...). а Теорема 2. Полином Лежандра Рп (х) при η ^ 1 имеет η различных действительных корней, которые расположены на интервале (—1, 1). Доказательство. Обозначим через л,, л,, ..., rk (г%<^гг<^ <С ... <>А) действительные корни полинома Рп (х), имеющие нечет-
§ 9] ПОЛИНОМЫ ЛЕЖАНДРА 51 ную кратность и лежащие на интервале (—1, 1). Очевидно, что k^n. Произведение (x — ri)(x — r1)...(x — rk)P„(x) не меняет знака на интервале (—1, 1), так как все его действительные корни на этом интервале имеют четную кратность. Поэтому 1 J (x — rl)(x — rt)...(x — rk)Pa(x)dx^O. — ι Отсюда, согласно замечанию 2 (см. формулу (9) ), следует, что степень полинома Rk (χ) — (χ — г,) (χ — rt)...(x — rk) не может быть ниже я, т. е. k^sn. Но так как koi, то получаем, что k—n, т. е. все я корней полинома Р„(х) действительные, простые и лежат на интервале (—1, 1). Замечание. Полиномы Лежандра можно определить также при помощи так называемой производящей функции [1] Н(х, г)= ! 1 = Ро(х)-[-Р1(х)г + (1 -2хг + гг)г + РАх)г'-\-... + Рп(х)гп + ... (|г|<1). (10) Формула (10) играет важную роль в теории потенциала. В частности, полагая х=\ в формуле (10), получим т4Г7 = Р,(1) + Р1(1)г + ... + Рв(1)гя + ... Но так как то Рп{\)=\ (я = 0, 1, 2, ...). Аналогично, положив х = —1, получаем Рв(-1) = (-1)" (п = 0, 1, 2, ...). Из разложения (10) легко получить рекуррентную формулу, связывающую три последовательных полинома Лежандра. Действительно, дифференцируя Н{х, г) по г, имеем дН х, — г χ — г „ _ . _ j _ 2xr , г, п. (1 — 2лт-+г!)2 Отсюда, учитывая, что ^ = Я,(*) + 2Я2(л:)г + ... + «Р„ Μ'""+ ■·■,
52 ПРИБЛИЖЕНИЕ ФУНКЦИЙ [ГЛ. I имеем U_2xr + /-5)[P,W + 2P2W + --- + ^nW'-'!", + ···]- — (х — г)\Р0(х) + Рг(х)г+... + Рп(х)гп + ...]=вО. Собирая все члены, содержащие г", и приравнивая нулю полученный коэффициент при гп, находим нужный результат \п+\)Рп + ,(х) — х(2п-\-\)Рп(х)-\-пРп_^х) = Ь (11) (л=1,2, ...)· С помощью формулы (11) удобно находить последовательные полиномы Лежандра. Например, полагая η = 4, будем иметь Pt(x) = \[9x Pl(x) — APt(x)\ = О = j \j (35х5 — ЗОх' 4-Зд;) — (IOjc* — 6х) 1 = = ~ (315х* — 350х' -f Т5х) = -| (63х' — ТОх" + 15х). Сводка формул для полиномов Лежандра и их обобщений, а также таблицы и графики имеются в книге Янке и Эмде [4]. Пусть на отрезке [—1, 1J задана функция /(х). Приблизим эту функцию линейной комбинацией из полиномов Лежандра /(*) = ί0Ρ0 {χ) + С.Р, (*)+... + с,Л Μ. причем коэффициенты с0, с,, ...,сп подберем так, чтобы величина отклонения 1 П S= J I/(X)— V CftP4 (x)]« d* была минимальная. В § 7 доказано, что в этом случае ck являются коэффициентами Фурье относительно полиномов Pk (χ), т. е. 1 1 ^р j / {х) Ρн {χ) dx = Щ1 Ι /(χ) Pk [χ) dx. (12) *— IIЯ» ι — 1 —1 Из § 7 (формула (10)) следует также — 1 ft —0 Пример. Функцию f(x) = \x\
§ 9] ПОЛИНОМЫ ЛЕЖАНДРА 53 на отрезке [—1, 1] квадратично аппроксимировать полиномом 5-й степени. Решение. Полином Qs(x) ищем в следующем виде: Q* Μ = с0Я0 (х) + схРх (х) + сгРг (х) + с,Р, (х) + где Pk(x) (fe = 0, 1, . ..)— полиномы Лежандра. Так как функция 9 0\ Рис. 4. f(x)=z\x\—четная и Pk (χ) четны при k четном и нечетны при k. нечетном, то из формулы (12) получаем ! Отсюда, используя формулы (2), находим 1 1 1 с4 = |· f ^ (35λ:4 — ЗОх2 + 3) rfje = — Подставляя эти значения коэффициентов в формулу (14), получим = й(-7*4 + 14*' + ; Следовательно, 15 х| ^~(1_|-14хг — 7л;1) при|л;|<1 (рис. 4).
54 ПРИБЛИЖЕНИЕ ФУНКЦИЙ [ГЛ. I § 10. Ортогональность с весом Пусть на отрезке [а, Ь\ задана положительная непрерывная функция ρ (χ). Определение. Система функций {уп(х)}, заданная на отрезке [а, Ь], называется ортогональной на этом отрезке с весом ρ (χ), если ь \ Ρ (*) f* M <f>m (x) dx = 0 при кф т. (]) а Из ортогональности системы {ψη (χ)} с весом ρ (л;) следует обычная ортогональность системы Ψ„Μ=ΚρΜ<Ρ„Μ (л = 0, 1,2, ...)■ Действительно, ь ь J Φ* Μ Фи Μ d* = ϋ Ρ (*) "Ρα (χ) Ψω (*) dx = 0 при к ф т, a a а это и есть условие ортогональности. Пусть на отрезке [а, Ь] задана непрерывная функция f(x) и система функций tpc (χ), φ, (χ), . .., tpn (χ), .. . ортогональна на этом отрезке с весом ρ (χ). Составим обобщенный полином Рп Μ = Со<Ро Μ + ειτΊ (*) + ■ · · + сп9п Μ и подберем коэффициенты с0, с,, ..., сп так, чтобы отклонение, определяемое формулой ь I„=l?(x)[f(x) — Pn(x)i'dx, (2) а было минимально при фиксированном п. Формулу (2) можно записать в следующем виде: Ь л /„=$[/ (х) VfM— Σ ck V'W) Ψ» Ml" dx. a k = o Отсюда вытекает, что наша задача сводится к разобранной выше задаче (§ 7) о наилучшей непрерывной квадратичной аппроксимации функции f(x) J/ρ (λ;) с помощью линейной комбинации ортогональных на отрезке [а, Ь] функций VJ(x)yk{x) (* = 0, 1,2 я). На основании результатов § 7 получаем, что коэффициенты ch, дающие минимум интегралу Iп, представляют собой коэффициенты Фурье
§ 11] ПОЛИНОМЫ ЧЕБЫШЕВА 55 функции f(x) У ρ (χ) относительно системы функций {Y~pjx)ipk(x)} [см. § 7, (6)): ь ь \ iVW / (х) VfTx) fk (х) dx $ Ρ (*)/(*) ?* W dx ck = °- __ _ ='— (k=0, 1.2 n). J \VpJx) ?* (х)]г dx \ ? Μ tl W dx a a Величина минимального отклонения ln определяется но формуле (10) из § 7 и будет равна в нашем случае ft η Ь К = \ Ρ Μ f (х) dx — Χ el J ρ (χ) ψΐ (χ) dx. a k=zo a Эти формулы можно получить также непосредственно, решая соответствующую задачу на нахождение минимума функции 'п ' η \со> С1> сг> · · ■ > сп)· В частности, если вес р(я)=1, то приходим к прежним формулам. § 11. Полиномы Чебышева В качестве примера системы функций, ортогональной с весом, приведем полиномы Чебышева, которые известны еще и тем, что являются полиномами, наименее уклоняющимися от нуля. Полиномы Чебышева Тп (х) определяются формулами: r.u^+^-'r+fr-v·*-1)" (я==1>2,...). (1) Функция (1) действительно является полиномом. В самом деле, при возведении в степень первой и второй скобок радикалы сохраняются во всех четных членах, причем в первой скобке с плюсом, а во второй с минусом. Поэтому при сложении они уничтожаются и останутся лишь члены, содержащие χ в целых степенях, причем старшая степень равна п. Запишем три первых полинома Чебышева в развернутом виде: г, (х)=-i [(χ + ΚΡ^ϊ) 4- (χ — V** -1)) = *; Тг (х) = ψ l(x + VxT~Zrl )*+(*-У^^=Л)г] = хг —\ . Покажем, что коэффициент при старшем члене х" в полиноме Тп [х) равен единице.
56 ПРИБЛИЖЕНИЕ ФУНКЦИЙ |ГЛ. I Действительно, старший коэффициент ап всякого полинома Rn (χ) = = о0 -)- atx -j- ■. . -\- а„хп степени η можно определить с помощью предельного перехода ,. /?„(*) a„ = lim -JLyr1. В нашем случае тЛх) ('+/^5)я+('-]/^5)п хп — 2" откуда ,. Т„ (χ) , lim -ϋ-s- = 1. Приведем другую формулу для полиномов Чебышева. Обычно полиномы Чебышева рассматриваются на отрезке [—1, 1]. Поэтому можно положить χ — cos t, (2) т. е. /=arccosji, где t—новая переменная (O^/sSir). Тогда sin ί = 1/^1—χ* и формула (1) преобразуется к виду _ , „ (cos I 4- i sin t)" -f- (cos t — I sin t)" .. Λ T„(x) = K- -С i-ip *· при л>0. Так как (cos t + г sin ί)" = cos яг + ί sin nt, то окончательно имеем Τ п(х) = ^ cos nt (л=1,2,...) (3) или Тя (л;) = ^^ cos /г (arccos x). (4) Заметим, что формулы (3) и (4) неверны при /г==0. Из формулы (3) легко получаются рекуррентные формулы для вычисления полиномов Чебышева при больших п. Так как cos (η -j- 1) t -\- cos (n — 1) t = 2 cos nt cos t, а согласно (3) cosnt = 2"~% Tn(x), то
§ 11] ПОЛИНОМЫ ЧЕБЫШЕВА 57 Тп + >{х) = хТп(х)-±Тп_,(х). (5) Полагая, например, в формуле (5) η = 2 и η = 3, последовательно получаем Т, (х) = хТг (х) — -j 7, (х) = χ [х2 — j J — j χ — χ' — j x; Тем же способом можно вычислить 7S (x), Tt (χ) и т. д. На рис. 5 приведены графики полиномов Чебышева для я = 0, 1, 2, 3. · Докажем некоторые свойства полиномов Чебышева. Теорема 1. (Свойство ортогональности полиномов Чебышева.) Полиномы Чебышева Тл(х) образуют на отрезке [—1, 1] ортого-
58 ПРИБЛИЖЕНИЕ ФУНКЦИЙ [ГЛ. I нальную систему с весом р(Х): т. е. 1 $ Тк(х)Та(х)у^= = 0 при m^k. — 1 Доказательство. При £^>0, от^>0 и k^=m, полагая х== =-cosi и используя формулу (3), имеем 1 О — 1 π it = 5*^7-5 I cos kt cos mt dt = 0, (6) так как тригонометрические функции {cos kt) ортогональны на отрезке |—π, π). Легко проверить, что равенство (6) остается справедливым и при k = 0, m =7^=0. Замечание. При m — k=^0 имеем 1 π Г Т2 I \ _*!__ 1 (* 2 . j. 1 к_ π I ' m (X) г- 2 — 22m_s I ml at—.χ™-* ' 2 —2"n~1' - 1 0 При m — k = 0 получаем J η V\-x' ) V ί -x* Теорема 2. (Нули полинома Чебышева.) Все корни полинома Чебышева ненулевой степени действительны, различны и лежат на интервале (— 1, 1). Доказательство. Пусть xk — действительные корни полинома Тп(х), расположенные на отрезке [—1, 1). Полагая xA = cos^(0< =£Ξ/Α<π), в силу формулы (3) получим Тп (xk) = ^rlcosntk^0. Отсюда соэ/ггл=0 и, следовательно, 26-1 π. 2/г
§ πι ПОЛИНОМЫ ЧЕБЫШЕВА 59 Таким образом, полином Тп (х) имеет корн и 2k ι ;C*==C0S_2^— π (Л=1, 2, ...,/ζ), (7) которые действительны, различны и лежат на интервале (—1, 1). Так как число этих корней равно степени полинома, то других корней, как действительных, так и комплексных, полином Тп (х) не имеет, т. е. формула (7) дает совокупность всех корней полинома Тп (х). Теорема 3. (Экстремальное свойство полиномов Чебышева.) Полином Чебышева Тп(х) (я > 0) на отрезке [—1, \\ имеет п-\-\ экстремальных значений, равных между собой по абсолютной величине. Доказательство. Имеем Τ η (χ) = ψ=ϊ cos nt> (8) где x = cos/ (0sg^<Tt). Отсюда заключаем, что Тп (х) достигает экстремума в тех точках, где | cos/if | = 1. (9) Корни уравнения (9), лежащие на отрезке [0, π), суть τΑ = 7Γ (Α = 0, 1, . ... л). Им соответствуют точки экстремума i,= cos^ (A = 0, 1, ...,«) (10) полинома Чебышева Тп(х), причем на основании формулы (8) имеем тη (ч) = 2^=т cos k-n = {-=Д-. Следовательно, I 7"» (£*) I = 2^=1 (* = 0. 1 «). 00 где £4 при k четном суть точки максимума, а при k нечетном — точки минимума полинома Тп (х). Следствие. Максимальное значение модуля полинома Чебышева Тп(х) (л>-0) на отрезке [—1, 1) равно трлл, т- е ■■2! Тя(х)\^!ш=1 ПРИ — КЖ1. (12)
60 ПРИБЛИЖЕНИЕ ФУНКЦИЙ [ГЛ. I Замечание. В силу формул (7) и (10), нули и точки экстремума полинома Τη (х) можно построить следующим образом: разделив полуокружность, опирающуюся на отрезок [—1, 1) как на диаметр, на 2л частей, спроектируем все полученные точки на диаметр (рис. 6, где /1 = 4). Нумеруя проекции справа налево, получим, что все проекции с нечетными индексами являются нулями полинома Тп (х) (на рис. 6 отмечены кружочками), а с четными номерами—его точками экстремума (на рис. 6 отмечены крестиками). Из геометрических соображений вытекает, что как нули, так и точки экстремума полинома Тп (х) сгущаются к концам отрезка [— 1,1). § 12. Понятие о равномерном приближении функций Квадратичная аппроксимация функций основывалась на способе наименьших квадратов. Уточняя понятие квадратичного отклонения, введем соответствующее расстояние Δ между данной непрерывной функцией / (х) и непрерывным аппроксимирующим обобщенным полиномом Q{x) (вообще говоря, более "простой природы), так называемое среднее квадратичное отклонение. Определение 1. Под средним квадратичным отклонением функций f(x) и Q(x) на множестве точек Х=^{хх, х2, ..., хп} понимается число ^=]/Чх 1/W-<?(*,)]2- (1) ί = 1 Если аппроксимация интегральная, то среднее квадратичное отклонение на отрезке [а, Ь\ определяется формулой 1 = У ъ~а J l/W- QИ2 dx- (2) а Формулу (2) можно рассматривать как предельный случай формулы (1) при η—>оо. Действительно, выбирая на отрезке [а, Ь\ систему равноотстоящих точек а = х1, хг, ..., хп = Ь, где
§ 12| ПОНЯТИЕ О РАВНОМЕРНОМ ПРИБЛИЖЕНИИ ФУНКЦИЙ 61 будем иметь η η 1 = 1 i'=l Отсюда при П—+0О получим ь Δ2 = !im Δ„2 = ~ J [/ (χ) - Q (*)]г Лс. Если среднее квадратичное отклонение Δ мало, то для «подавляющего большинства» значений аргумента χ из отрезка [а, Ь\ (т. е. в «среднем» на [а, Ь\) абсолютная величина \f(x) — Q(x)| также мала при a s£ x s£ b. Более точно, пусть \f(x)—Q(x)\ имеет на [а, Ь\ конечное число экстремумов и а — заданное положительное число. Обозначим через σ = σ, -{-σ,-}-...-}-σΛ максимальную систему непересекающихся отрезков из [а, Ь\ таких, что \/(х)— Q(x)\>* при χ ζ σ; (1=1, 2, ..., k) (рис. 7), и пусть ω — сумма длин этих отрезков. Если Δ<ε, то имеем ь ?(b-a)>\\/(x) — Q(x)\ldx^ \ [/(*) — Я(х)\г dx^a2u>.
62 ПРИБЛИЖЕНИЕ ФУНКЦИЙ (ГЛ. I Отсюда ω<(/> — a) -L и, следовательно, ω — сколь_ угодно малое число, если г достаточно мало. Таким образом, если Δ<ε, где ε достаточно мало, то на отрезке [а, Ь\, за исключением, быть может, множества точек σ, сколь угодно малой линейной меры ω, выполнено неравенство ΙΛ*) —Q(*)|<<x, где α — произвольное заранее заданное положительное число. Во многих случаях, например при обработке результатов наблюдений, квадратичное приближение является приемлемым, так как оно !/-ffx) Рис. 8. сглаживает отдельные локальные неправильности функции /(х) (возникшие, возможно, от ошибок наблюдений) и дает достаточно точное общее представление о протекании соответствующего процесса. Однако иногда для приближения ставят более жесткие условия, а именно требуется гарантировать, чтобы на всем отрезке [а, Ь] отклонение функций f(x) и Q(x) было меньше заданной величины. Поэтому введем другое расстояние между функциями, так называемое абсолютное отклонение. Определение 2. Абсолютным отклонением на [а, д] обобщенного полинома Qm(x) от данной непрерывной функции /(х) называется число Δ(/, QJ = A„ = max \/(x) — Qm(x)\. (3) Если ΔΜ<ε, то из формулы (3) следует \f(x) — Qm(x)\^s для всех точек χ на отрезке [а, Ь\ (рис. 8).
§ 12| ПОНЯТИЕ О РАВНОМЕРНОМ ПРИБЛИЖЕНИИ ФУНКЦИЙ 63 В этом случае говорят, что обобщенный полином Qm(x) на отрезке [а, Ь\ равномерно приближает функцию f{x) с точностью до ε. Для случая обычных полиномов т Qm (*) = Σ akX" k — 0 справедлива важная аппроксимационная теорема Вейерштрасса, которую мы приводим без доказательства (см. [1]). Теорема Вейерштрасса. Если функция f(л;) непрерывна на отрезке \а,Ь], то, как бы мало ни было положительное число =, найдется полином Qm (x) достаточно высокой степени т, абсолютное отклонение которого от данной, функции /(х) на отрезке \а, Ь\ меньше, нем ε, т. е. для всех точек χ ξ, [а, Ь\ имеет место неравенство \/(x)-Qm(x)\<B. В частном случае, если функция /(х) аналитическая на отрезке [а, Ь\, т. е. разлагается на этом отрезке в равномерно сходящийся степенной ряд (ряд Тейлора) 00 /(χ)=Σα* t*—а)*· А = 0 где «.=-!/*(«) (* = 0, 1,2,...), то за полином Qm (x) можно взять отрезок ряда Тейлора т ft=sO причем степень т подбирается в зависимости от заданной точности е. Пусть степень т полинома Qm(x) фиксирована и задача состоит в том, чтобы приблизить данную непрерывную функцию f(x) полиномом фиксированной степени т наилучшим образом на заданном множестве /. Это значит, что коэффициенты о0> αλ am полинома Q„ Μ = *.+<*,*+...+*«** 14) следует подобрать так, чтобы величина Дт= max \/{x) — Qm{x)\ {β) χ <= I была минимальной.
64 ПРИБЛИЖЕНИЕ ФУНКЦИЙ |ГЛ. 1 Такой полином Qm (χ), дающий минимум величине Дт, называется полиномом наилучшего равномерного приближения, или полиномом, наименее уклоняющимся от функции f{x) на множестве I. При этом минимальное отклонение £„[/. 1 = «4πΔ„ (6) называется наименьшим отклонением функции f(x) на множестве /. В теории приближения функций доказывается существование и единственность полинома наилучшего приближения для любой непрерывной функции [5], [6], [7], [8]. Теорема. Для любой функции f(x), непрерывной на замкнутом ограниченном множестве I *), и любого натурального числа т существует полином Qm (x) степени не выше т, обладающий минимальным отклонением М/, QJ = £,„[/, 1, m причем такой полином единственный. В некоторых случаях на полином Qm (x) накладывают дополнительные ограничения, например, полагают старший коэффициент em=l. Тогда В частности, пусть f(x) = 0; тогда полином Qm(x), дающий минимум величине ря= max \Qm{x)\, называется полиномом, наименее уклоняющимся от нуля**) на данном отрезке [а, Ь\. Покажем, что этим свойством обладает полином Чебышева. Теорема. Полином Чебышева степени т (т^>1) наименее отклоняется от нуля на отрезке \—1, 1] по сравнению с другим полиномом степени т и со старшим коэффициентом, равным единице. Доказательство. Допустим, что существует полином Qm(x) со старшим коэффициентом, равным единице, и такой, что max | Qm (χ) | ^ max | Тт (х) | = рв. (9) *) Б дальнейшем / будет представлять собой или отрезок, или конечную систему точек дс„ х2, ..., х„. ·*) Задача о разыскании полинома вида (4), наименее уклоняющегося от нуля, имеет тривиальное решение
§ 1 2| ПОНЯТИЕ О РАВНОМЕРНОМ ПРИБЛИЖЕНИИ ФУНКЦИЙ 65 В силу § 11, теоремы 3 и следствия к ней имеем 1 Ρ я — 2m ~' ' причем на отрезке [—1, 1] существует m-f-Ι точек ι = ε0, ε„ ..., εβ=-ι таких, что 7"» (St) = 1-1)* Р. (Ю) (рис. 9). Рассмотрим разность R(x)=Tm(x) — Qa(x). Так как старшие коэффишшнты полиномов Тт(х)п Qm{x) одинаковы, то R{x) есть полином степени не выше т—1. Из условия (9) и формулы (10) вытекает, что: /?(g^0; /?(S,)^0 /?(U(-l)m>0 (11) (рис. 9). На основании неравенств (И) заключаем, что полином R(x) имеет по меньшей мере один нуль на каждом из отрезков [£,, £0], Рис. 9. |£„ 2,1, ..., [£,„, Еи.,1 (на рис. 9 эти нули суть абсциссы точек пересечения кривых у—Тт(х) и y=Qm(x)), причем общее количество нулей с учетом их кратностей будет не меньше от. Так как степень полинома R (х) не превышает т—1, то это возможно лишь в случае, если R (х) = 0, т. е. Qm {χ) ;ξ 7и (χ). Теорема доказана.
66 ПРИБЛИЖЕНИЕ ФУНКЦИЙ [ГЛ. I Следствие 1. Для любого полинома Qm (χ) степени т со старшим коэффициентом, равным единице, имеет место неравенство max | Qm (χ) | 2э ψη=ι (—K*<1). Следствие 2. Для функции f{x)=xm (mssl) полиномом наилучшего приближения степени т—1 на отрезке [—1, 1] является Q.. ,(*) = *»-Г. (х), (12) где Тт (х) — полином Чебышева. Действительно, согласно смыслу задачи разность f(x) — Qm.t(x) = xm — am_ixm-l — ...—alx — at есть полином, наименее уклоняющийся от нуля на отрезке [—1, 1], т. е. представляет собой полином Чебышева Тт(х). Отсюда непосредственно вытекает формула (12). Замечание. Пользуясь теоремой, легко построить наименее уклоняющийся от нуля на данном отрезке [а, Ь\ полином Тт (х) степени т со старшим коэффициентом, равным единице [7]. Действительно, подстановка преобразует отрезок a^xs^b в отрезок —1 ^,t^ 1, причем старей _ п\ "I ший коэффициент (при tm) будет равен I —Т—) . Отсюда т, и = (Ц-«)" т. м _ (·-)- т. i^JZJ. „з, Из формулы (13) следует, что отклонение полинома Тт(х) от нуля равно Пример. С помощью полинома первой степени Ql(x) = Ax-\-B наилучшим образом равномерно приблизить функцию /{х)=х1 на Отрезке [0, lj.
§13) О ПОСТРОЕНИИ ПОЛИНОМА НАИЛУЧШЕГО ПРИБЛИЖЕНИЯ 67 Решение. Требуется определить коэффициенты А и В так, чтобы величина £,= max \хг — Ах — В\ (14) была наименьшей. Следовательно, полином Q2{x) = xi — Ax — В наименее отклоняется от нуля на отрезке [0, 1]. Полагая а = 0и Ь=\, в силу формулы (13) получаем / 1 \ <г.м=(тУг. (см. § 11). Отсюда Q1(X)==X — —1 причем = -гТш{Ъс-1) = = 1[(2*-1)2-1 = *·_* + 1Γ Заметим, что отклонение Е, реализуется в трех точках: 3 1 в ι "s у-α,(χ) / / у ' Л/У / J'/ ^<у // / / 4 / J η— 7 // У 1 / /// ι /// , 1 I -4 i X Это явление характерно для полиномов наилучшего приближения (см. § 13). Рис. 10. Геометрически график функции y = Q^[x) представляет собой среднюю параллель между секущей, проходящей через крайние точки О(0, 0) и Л(1, 1), и касательной, параллельной этой секущей (рис. 10, где кривая — график функции § 13. Понятие о приближенном построении полинома наилучшего равномерного приближения Пусть функция f(x) непрерывна на ограниченном замкнутом множестве /, содержащем не менее т -f- 2 точек, и Qm (χ) — полином степени не выше т наилучшего равномерного приближения функции/(х) на множестве /. Полином Qm (x) обладает указанным ниже замечательным свойством [5j, [6].
68 ПРИБЛИЖЕНИЕ ФУНКЦИЙ [ГЛ. I Теорема Чебышева об альтернансе. Среди полиномов степени не выше т полином Qm (χ) является полиномом наилучшего равномерного приближения непрерывной функции f(x) на данном множестве I тогда и только тогда, когда на I существует система (т -\- 2)-х точек: £„<£,< ··· <Ея+1 (чебышевский альтернанс) таких, что разность принимает поочередно значения L и —L, где £ = шах|/(*) — <?„(*) I- (1) / Пример. Для функции / (х) = cos 2х (0 ==S χ < 2π) полиномом третьей степени (в широком смысле) наилучшего равномерного приближений является Действительно, здесь Z. = max | cos 2л: — 0|=1 и разность χ е [0, 2=| f(x) — Q3 (л:) — cos 2x принимает последовательно значения -\-\ и — 1 в пяти точках О, γ, π, γ, 2π. Пусть число т фиксировано и известен чебышевский альтернанс Ξ=:::{£ο· Si> ···> SM+,} для функции /(χ) на отрезке 1—[а, Ь], расположенный в порядке возрастании. Покажем, как в этом случае можно определить минимальное отклонение £,„[/- /]· (2) Если Qm (χ) — полином наилучшего приближения степени т для функции /(х) на отрезке /, то на основании теоремы Чебышева имеем /(S,-)-Qm(£,■) = 1-1)'*£„[/- /]. (3) где κ = 4-1, и I/ft)-Qffl(S,)| = £«[/./] С = о. ·. 2· ···· »+!)· Отсюда
§ 13] О ПОСТРОЕНИИ ПОЛИНОМА НАИЛУЧШЕГО ПРИБЛИЖЕНИЯ 69 Рассмотрим определитель β.(Ξ,/) = /(5.) 1 So /(6.) IS, ... 6Г (5) Используя формулу (4) и раскладывай определитель (5) на сумму двух определителей, получим <?»(S.) IS. ·■· So" Q-(Si) · ε, ... ε» Dmfr f) = V/b(s« + i) ' Sn+l ··· Si + 1 + (-i)° ι ε. (-i)1 ι ε, C-i) ι ε.+Ι 'm + l (6) Так как Qm (x) — полином степени не выше т, то первый из определителей в формуле (6) равен нулю. Действительно, если т 4 = 0 то на основании известного свойства определителей будем иметь «.(ε.) ι ε. ... io с?„&) ι ε, ... sr Σ«»εί Σ β*ε* • ε0 ι ε, εΓ Σ α*ε* tS"! + 1 ι ε. = Σ«( ίο* εί • ε0 • ε, εΓ εΜ+ι ι sOT+1 ... ε»+ι = 0
70 ПРИБЛИЖЕНИЕ ФУНКЦИЙ [ГЛ. I (ввиду того, что каждое слагаемое последней суммы имеет два совпадающих между собой столбца). Раскладывая по элементам первого столбца оставшийся определитель в формуле (6) и учитывая правило знаков, находим т-\-\ Dm(f, E) = *Em[f, /] Σ Оя,/(3), ί' = 0 где *Vi© = (ί'=0, 1,2 m-j-1)— определители Вандермонда, равные (см. [1]) Dm,,ip)= Π' (S,-S„), ISf < q iS m + 1 где штрих означает, что число 4i пропускается. Так как числа ξ, (» = 0, 1, 2, ..., /я-j-l) монотонно возрастают, то все определители Dmi (Ξ) положительны: D«,i(3)>0 ('" = 0, 1, 2, ..., я+1). (8) Из формулы (7), учитывая, что |κ] = 1, получаем ΕΛ/·1] = ϊ + ?{ί'Ξ)] ■ I9) Д] β»,/(3) причем в силу неравенства (8) имеем sgn * = sgn (- 1 )'■ [/ (ζ,.) - Q,„ (ξ,)] = sgn Ои (/, Ξ) (10) (ι = 0, 1, 2, ..., «4-1). Из соотношения (10) определяем знак х, если только £>„(/, Ξ)=^=0. Замечание. Если известен алыернанс Ξ, то, определив по формулам (9) и (10) £,„(/, /) и κ, легко построить для функции f(x) полином наилучшего равномерного приближения Qm(x) на отрезке 1 = [а, Ь]. Действительно, из формулы (4) мы определяем значения искомого полинома в точках альтернанса: СА^/бЖ-М'4'*^!/. П 1' = 0. 1. 2, .... *» + !). ι So ·■ ι 6,., ■■ ι S,4l .. 1 f . 50 Si-И iffl+J (7)
§13] О ПОСТРОЕНИИ ПОЛИНОМА НАИЛУЧШЕГО ПРИБЛИЖЕНИЯ 71 Затем по любым т -\- 1 этим значениям строим интерполяционный полином, который в силу свойства единственности совпадет с С?и(л;). Оставшееся лишнее значение можно использовать для контроля. Задача построения точного альтернанса весьма трудна. Поэтому мы рассмотрим приближенное построение альтернанса и связанное с ним построение полинома наилучшего приближения, предложенное Ремезом [7], [5]. Рассмотрим произвольную систему точек ■λ = {λ:0, xlt ■. ■, хт + 1 ; из отрезка [а, Ь\, расположенных в порядке возрастания: *„<*ι <■■·<>«. + !· (И) Пользуясь правой частью формул (9) и (10), можно определить неотрицательное число е,ЛА Х)=^^- (12) и значение х: sgnX = sgnDm(f,X). (12') Далее построим полином qm (χ) степени не выше т, такой, что ?«(*/)=/(*<) + (-1 )'+Ι *<„[/, х\, (13) (i = 0, 1, 2, ..., /я+1). На основании формулы (13) система точек (11) представляет собой альтернанс для разности f(x) — qm(x); поэтому, в силу георемы Чебышева, qm (χ) есть полином наилучшего равномерного приближения функции f(x) на множестве X. Так как X составляет лишь часть отрезка /, то, очевидно, имеем ет(/, Х)^Еа(/, /). (14) Действительно, последовательно выводим «/»(/. *) = max|/(jc) — ?m(*)|< <max \/(x) — Qm (χ) | sS max | /(χ) — Qm (χ) | = Em(/, /). xeX «si В силу формулы (13) и единственности полинома qm (x), равенство в формуле (14) имеет место тогда и только тогда, когда X представляет собой альтернанс на всем отрезке /, причем а этом случае ?«,(*) = £*(*)· В самом деле, если '»(/. Х) = ЕЯ{/, /),
72 ПРИБЛИЖЕНИЕ ФУНКЦИЙ |гл. ι то из формулы (13) получаем ?·(*/) = С (*<) (' = о, ι, 2, ..., т + ц. А так как степени полиномов qm(x) и Qm(x) не выше от, то <7т Μ = Qm Μ и. следовательно, X есть альтернанс на отрезке /. Следовательно, наиболее выигрышным расположением точек #,, л:2, ..., хт+г будет такое, при котором ет(/, X) имеет максимальное значение. Число систем X бесконечно. Поэтому практически берут на данном отрезке \а, Ь] достаточно густую систему точек Хп = {х0, хх, ..., хп) (п^т-\-\) и среди них выделяют подсистему X={x„ot χ„ хПт+1), обладающую наибольшим отклонением ет(/, Χ). Чтобы упорядочить выбор точек хл, хи хг хп, обычно делят отрезок на η равных частей (я ^ т-j- 1) и за xt (i = 0, 1, ..., η) принимают точки деления */=в+Цг' (г'=°. ].2 «)■ Из точек Х; составляют N=C™^,' различных систем Х^ (/= — 1, 2,..., Ν), каждая из которых содержит по /я-|— 2 точки. Для каждой из этих систем, используя формулу (13), определяем наименьшее абсолютное отклонение №[/. #») U=U 2 Л/) и среди них берем наибольшее ет{/, X) = maxe(»(f, X«\ ι Система точек Л"'*', реализующая наибольшее отклонение ет(/, Х'к)), является альтернансом на множестве точек Хп={х0, х, хп }, и поэтому полином ?»,,(*) (п7з>т-\-\), построенный описанным выше способом, есть полином наилучшего равномерного приближения данной функции f(x) на множестве Хп. Естественно ожидать, что при я—► оо полином qm n(x) неограниченно приближается к полиному Qm (x) наилучшего приближения функции /(х) на отрезке \а, Ь]. Действительно, это так (см. [5]). /\ Теорема. Пусть / (х) непрерывна на отрезке \а, Ь], Хп — система равноотстоящих точек χ. = α+-~ι (i = 0, 1 /г; n^sm-\-\)
§ 131 о построении полинома наилучшего приближения 73 и qm,„(x) — полином наилучшего приближения функции f(x\ на множестве Хп. Тогда равномерно на [о, Ь\ имеет место соотношение η ·* ϊχ> где Qm(x)—полином наилучшего приближения функции f(x) на отрезке [а, Ь\. Следовательно, при η достаточно большом имеем 9ra,„W=QmW ПРИ *€[«- Ъ]. (15) Близость приближенного равенства (15) на отрезке 1=[а, Ь\ характеризуется величиной где Так как ТО Ьт.п^Мт,п — β.Ι/. -V»)· (17) Разработаны также другие методы для приближенного построения полинома наилучшего равномерного приближения (см., например, [5]). Пример. Для функции приближенно найти полином ζ>8 (λ;) наилучшего равномерного приближения на отрезке |— 1, 1 ]. Решение. Здесь т = 2. Положим сначала п = т-\-\=Ъ и построим полином qiti(x) наилучшего приближения на множестве X, состоящем из четырех точек: — ι — ' —· ' —ι хо — ' ι х\ — з ' Х' з"' Х г — Примем эту систему за альтернанс функции f(x) на X . Применяя формулы (12), (12') и (13), а также (5) и (7), найдем е,(/, XL) и gt t(X[) (i = 0, I, 2, 3). Так как /Uc.) = 7. /l*,)=/Ug = ffi, /(*,) = },
74 ПРИБЛИЖЕНИЕ ФУНКЦИЙ [ГЛ. I то имеем я,(/. х.) = Τ" ' Го ' 1 1 ι ι ι ι ι ι = 0. Поэтому и, следовательно, «,(/. *.) = 0 ?,,,(—!) = 1 2 ' ■М = -; ЗУ 10' 9 ίο; 2 ■ Используя первые три равенства, строим интерполяционный полином Лагранжа ?l,lW = 7' (■+ϊ)(-τ) -1 + . — 1 9_ 10 (х+1)(х_1) ч+ок-з п + мо (х + 1) х + - + ')(W) 1 \ — 20 "I 20' Для контроля проверяем выполнение неиспользованного четвертого равенства <?2,э(')= 20"Т"20=="2'· Для оценки приближенного равенства 9 20 Q.W^-Jo^' + S 20 (18) используем формулу (17). Так как М. а М/> *,) = 0, то 1-1,4 1 4-х! "Τ" 20 2П 20'
§ 13] О ПОСТРОЕНИИ ПОЛИНОМА НАИЛУЧШЕГО ПРИБЛИЖЕНИЯ 75 Уточним приближение (18). Возьмем теперь п = т-]-2=4 и рас смотрим точечное множество Хл, состоящее из пяти точек: *„ = —'Ι χι — — — : Х- = 0· х. = — '> х. = 1 Рассмотрим всевозможные комбинации из четырех точек: 1 (19) I. — 1, П. -1, 111. —1, iv. —1, V. — 1, 2 ' о, 1 о, 1 "2 ' 0 1 "2 ! 1 2 0 0, о-; Для каждой из этих систем ΛΎ'(/'=1, 2, 3, 4, 5) вычисляем отклонение Все вычисления сведены в таблицу 9, где применены сокращенные обозначения £>,,, (/, Х*) = &11} (ί = 0, 1, 2, 3) и Из таблицы 9 видно, что максимальное значение е2;) на множествах Х^ равно 57; и достигается для систем точек I и IV. оО з Следовательно, е2 (/, ^Л = gn > и множество имеет два альтер- нанса. Возьмем, например, систему точек 1: —1, —-^ , 0, у. Так как D(^^>0, то х=1. Используя формулу ?,,.(*() = /(*/) + *(—М' + Ч(/, *Λ (' = 0, 1, 2, 3), определяем значения , n__J £_37. 1г,Л ') 2 80 80' ?·.»^ 2 J 5 "τ-80 80 * m, , 3 77. ?,,4(0)= 1— 80=80· 9«.« V 2 У ' 5 "T"80 —80"
76 ПРИБЛИЖЕНИЕ ФУНКЦИЙ [ГЛ. I Таблица 9 Приближенное построение полинома наилучшего равномерного приближения ) 1 II HI IV V Системы точек X X,- f (Χι) Χ; /(*ί) χί /(*.■) Η /(*ί) χ,- /(*;) -..-i.»i 14 4 2 ' 5 ' ' "5 -..α|.. ±ι i Ι 2' · 5 ' 2 -ι,-Ι 1ι ' 2 ' 2' 14 4 1 2 ' 5 ' Τ ' 2 -f»f. 4 4 1 5 ' ' 5 ' 2 -.,-4,0,. Ι 1 ι 1 2 ' 5' ' 2 *# 1 4 1 "4 3 4 1 4 3 *$ 3 4 3 2 3 2 3 4 2 2,2 3 4 9 3 2 3 4 1 Τ «$ 1 Τ 3 4 3 4 1 Τ 3 Υ 2 9 2 9 2 2 9 σω 3 40 3 20 0 3 "40 3 20 eU) 3 80 I 30 0 3 80 1 30 Отсюда [х+2)х ι 67 (x + l)x ι 77 (χ+1)^χ + "2 ) J ?7 + »·(ο + η(ο+>.)==~»χ,+δδ- (20)
§ 13] ЛИТЕРАТУРА К ПЕРВОЙ ГЛАВЕ 77 Для контроля проверяем четвертое условие д*·* \ 2 j— 2 ' 4 + 80~~80' Для оценки погрешности полученного полинома (20) находим ^^,^Ιττ^+τ^-δΗέ- Следовательно, д. ~Мл — ег{/, Х4) = 0, т. е. ΔΙι1==0, а это значит, что полином q2 t (x) совпадает с полиномом Qt (x) наилучшего равномерного приближения функции у= г на [—1, 1] (рис. 11). Литература к первой главе II] В. Л. Гончаров, Теория приближения π интерполирования функций. ГТТИ (1934), гл. Г—Ш. [2] Б. П. Д ем и до вич, И. А. Марон, Основы вычислительной математики, Фнзматгиз, М. (1960), гл. VI11, IX, XIV. [3] В. Э. Мили, Численный анализ, ИЛ (1951), гл. IX—X. [4] Е. Я и к е и Ф. Э ы л е, Таблицы функций с формулами и кривыми, Гостех- издат, М.—-Л. (1948), ч. II, гл. VII. [5] И. С. Б ере зин, Н. П. Жидков, Методы вычислений, Физматгиз, М. (1959), т. 1, гл. IV. [6] И. П. Натансон, Конструктивная теория функций, Гостехиздат (1949), гл. И. [7] Е. Я. Реме з, Общие вычислительные методы чебышевского приближения, АН УССР (1957), гл. 1. [8] Н. 11. Ахиезер, Лекции по теории аппроксимации, Гостехиздат ^1947).
ГЛАВА II ЭМПИРИЧЕСКИЕ ФОРМУЛЫ § 1. Вводные замечания Пусть, изучая функциональную зависимость У=/(х), 0) мы произвели ряд измерений величин χ и у η в результате получили таблицу значений X У X, хг Ух Уг I Хп Уп Если аналитическое выражение функции f(x) неизвестно или весьма сложно, то возникает практически важная задача: найти эмпирическую формулу У=/(х), (2) значения которой при х = х( возможно мало отличались бы от опытных данных у ι (г=1, 2, ... , я). В такой постановке наша задача весьма неопределенна; поэтому обычно, по ряду соображений, указывают достаточно узкий класс функций К (например, множество функций линейных, степенных, показательных и т. п.), которому должна принадлежать искомая функция f(x), и дело, таким образом, сводится к нахождению лишь наилучших значений параметров. Во многих случаях класс К определяется требованием простоты эмпирической формулы; иногда этот класс подсказывается самой природой явления. Геометрически задача построения эмпирической формулы состоит в проведении кривой Г вида (2) из некоторого класса К,
§ И ВВОДНЫЕ ЗАМЕЧАНИЯ 79 «возможно ближе» примыкающей к системе точек Μι(χί> Уд ('=1. 2 п) (рис. 12). Разумеется, при этом должен быть выяснен точный математический смысл понятия «близости» кривой Г к конфигурации точек М. Заметим, что задача построения эмпирической формулы отлична от задачи интерполирования (гл. I, § 2). Как правило, исходный материал весьма обширен и ищется сравнительно простая аналитическая зависимость между данными переменными χ и у. Эта зависимость обычно не сводится к интерполяционным формулам (которые дают значения, совпадающие в заданных точках с заданными значениями), так как график эмпирической функции у=/(х), вообще говоря, не проходит точно через соответствующую систему точек М,(х„у,) (/=1,2, ...,л). Кроме того, сами исходные эмпирические данные х( и У[, как правило, являются приближенными и содержат ошибки. Поэтому интерполяционная формула, повторяющая эти ошибки, не говоря даже об ее сложности, не является идеальным решением поставленной задачи; возможно простая эмпирическая формула, сглаживающая местные неправильности, лучше отобразит действительность. Построение эмпирической формулы слагается из двух этапов: 1) выяснение общего вида этой формулы и 2) определение наилучших параметров ее. Если неизвестен характер зависимости между данными величинами χ и у, то вид эмпирической формулы является произвольным. Предпочтение отдается простым формулам, обладающим хорошей точностью. Если отсутствуют сведения о промежуточных данных, то обычно предполагается, что эмпирическая функция аналитическая, без точек разрыва, и график ее — плавная кривая. Удачный подбор эмпирической формулы в значительной мере зависит от опыта и искусства составителя. Большое значение имеет геометрическое изображение полученных данных в декартовых координатах или в специальных системах координат (полулогарифмической, логарифмической и т. д.). При известном навыке по положению точек, определяющих некоторую гладкую кривую, можно
80 ЭМПИРИЧЕСКИЕ ФОРМУЛЫ [ГЛ. II примерно угадать общий вид зависимости путем установлении сходства между построенным графиком и образцами известных кривых (отдельные неправильности при этом игнорируются). Тут весьма полезны альбомы кривых. Во многих случаях можно ограничиться полиномом т 4 = 0 Нередко употребляются другие элементарные функции (дробно-линейная, степенная, показательная, логарифмическая и т. п.). В дальнейшем будут указаны приемы, облегчающие выбор вида эмпирической формулы. Что касается определения наилучших значений параметров, входящих в эмпирическую формулу, то эта задача более легкая и решается регулярными методами. Эмпирические формулы не претендуют на роль законов природы, а являются лишь гипотезами, более или менее удовлетворительно согласующимися с наблюденными опытными данными. Однако значение их весьма велико; в истории науки известны многочисленные примеры того, как получение удачной эмпирической формулы приводило к большим научным открытиям. Замечание. При построении эмпирической формулы можно предполагать, что исходные данные (xt, yt) (ί'=1, 2, ... , η) положительны. Действительно, если бы, например, все х; <^ 0 (или все у,-<С0), то достаточно рассмотреть таблицу значений (—хь yt) (или соответственно (xt, —у ι)). Аналогично, при χ,-<С 0 и у,-<^0 достаточно построить эмпирическую формулу для таблицы (—х(, —yt). Пусть теперь имеем общий случай, когда знаки значений х{ и у1 переменные. Так как таблица значений (л;,-, у/) конечна, то всегда можно подобрать положительные числа тип такие, что и Ч* = л + Л>0. Отсюда получаем, что решение поставленной задачи сводится к нахождению эмпирической формулы для системы положительных значений (£,·, ty). Поэтому в дальнейшем мы, как правило, будем рассматривать таблицы с положительными элементами. Заметим, что мы в дальнейшем не будем касаться вопросов, связанных с оценкой доброкачественности исходных данных, в частности, не будем учитывать ошибки этих данных.
§ 2] ЛИНЕЙНАЯ ЗАВИСИМОСТЬ 81 § 2. Линейная зависимость Пусть для переменных χ и у известны их значения х: и yt (/=1, 2, ... , я), расположенные в порядке возрастания первой переменной: *,<■*,< ··· <*„· На координатной плоскости Оху построим систему точек Alt (xt, у:) (для удобства масштабы на осях Ох и Оу могут быть выбраны разными). Если окажется, что эти точки располагаются примерно на некоторой прямой линии L, то естественно предположить, что зависимость между χ и у есть линейная: у = ах-{-Ь, (1) где а и Ъ — постоянные. Прикладывая прозрачную лннейку (или натягивая нить) так, чтобы положение ее было возможно близким к каждой из точек, опытным путем можно найти наилучшее положение прямой L. Построение прямой L обычно производится на бумаге с миллиметровой сеткой, причем результат не является однозначно определенным. Для нахождения параметров а \\ b измеряют координаты двух точек (не обязательно из данных) Nl(xi,yl) и N2 (хг,уг), лежащих на прямой /- (например, находят точки пересечения ее с осями координат) и но возможности далеко удаленных друг от друга. Тогда a a b могут быть определены из системы уравнений (способ выбранных точек): У г =**_>+»· \ (2) Результат исключения коэффициентов а и b из уравнений (2) может быть записан в виде определителя у χ 1 У ι χι ' У, ~х2 1 -0. (3) Геометрически уравнение (3) представляет собой уравнение прямой, проходящей через точки Ν1 и Ν2. Метод выбранных точек весьма нагляден, но обладает малой точностью. В дальнейшем (см. §§ 5—8) будут указаны более точные аналитические методы определения коэффициентов а и Ь.
82 ЭМПИРИЧЕСКИЕ ФОРМУЛЫ [гл. и Пример 1. Подобрать эмпирическую формулу для табличных данных: X 2 4 у 0,350 0,573 G 0,725 8 0,947 Решение. Построив соответствующие точки Mt (х^У;) (/= 1, 2, 3, 4) в подходящем масштабе, убеждаемся, что они располагаются примерно на прямой линии у = ах-\-Ь (рис. 13). Из графика находим отрезок, отсекаемый прямой на оси ординат: * = 0,147. Кроме того, при χ = 10 имеем у = 1,138. Поэтому 1,138-0,147 1 ΰ,ί / Υ с— / / у / ; / / / \ / 1 ■— Q а= ■ 10 ■■ 0,099. Рис. 13. Можно принять у — 0,099л: + 0,147. (4) Для сравнения в таблице 10 приведены значения, полученные по формуле (4), и разности Δ=^—у. Таблица 10 Значения эмпирической функции у _— X У Ь=у-у 2 0,345 0,005 4 6 0,543 0,050 0,741 — 0,016 8 0,939 0,008 Легко дать аналитический критерий для прямолинейности ряда точек Μ ι (Χ/, yt). Положим
§ 3] МЕТОД ВЫРАВНИВАНИЯ 83 и к'=Ш, (t"=l·2'···'я_1)· (6) Если £,-== const, то точки Λί(· (jc;, у,-), очевидно, лежат точно на одной прямой линии. Если Α,^Α,*...^,,.,. (7) то точки Mt (χ,, _у;) приблизительно расположены на прямой. В зависимости от точности выполнения соотношений (7) решается вопрос: следует или не следует искать эмпирическую зависимость между величинами χ и у в виде линейной функции. В частности, если значения xt равноотстоящие, т. е. Δλ:;- = const, то достаточно убедиться, что значения Д_у,- являются также постоянными (или почти постоянными). Пример 2. Проверить на прямолинейность следующий ряд точек: / X; Vl 1 0,5 0,62 2 1,0 1,64 3 1,5 2,58 4 2,0 3,70 5 2,5 5,02 6 3,0 6,04 Решение. Так как значения xt — равноотстоящие, то составляем таблицу разностей Ду, (таблица 11). Таблица 11 Проверка на прямолинейность / ДЛ 1 1,02 2 3 0,94 1,12 4 1,32 5 1,02 Мы видим, что значении \yt близки друг к другу (за исключением Ду4). Поэтому в качестве грубой эмпирической формулы можно выбрать линейную. § 3. Метод выравнивания Пусть для переменных χ и у их соответствующие значения xt и у ι {i=\, 2, ., ., η) таковы, что точки /И, (г,, yt) не располагаются на прямой линии. Тогда, во многих случаях, ввоця новые переменные Х = у(х, у); У=^(х, у), (1)
84 ЭМПИРИЧЕСКИЕ ФОРМУЛЫ [ГЛ. II можно добиться того, чтобы преобразованные точки Nt (X!t Y;), где Xi = y (χ,-, уj) и Κ/ = ώ(Λ:;, _)/,■), лежали на некоторой прямой линии плоскости ΟΧΥ (метод выравнивания). Обязательным требованием при этом является взаимная однозначность преобразования (1). Рассмотрим, например, нелинейную зависимость вида фО>) = а<р (*) + *, (2) где а и b—постоянные, ψ(χ) и ф(_у) — строго монотонные функции. На плоскости Оху функция (2) изображается некоторой кривой. Вводя новые переменные Х = у (х) и К=ф(_у), будем иметь Y=aX-\-b (3) и, следовательно, при наличии зависимости (2) точки Ν( (φ (х(), ψ (у()) (г—1, 2, . . . , п) на новой координатной плоскости ΟΧΥ располагаются на прямой линии. Обратно, если при построении на плоскости ΟΧΥ обнаружится, что точки Ν; практически лежат на прямой линии, то между переменными χ и у имеет место зависимость (2). Функции φ (χ) и ψ (у) обычно находятся методом проб, на основании обнаружения сходства линии (2) с известными кривыми, или проверкой выполнения соответствующих аналитических критериев (см. § 4). К виду (2) сводится, например, степенная зависимость У = сха, (4) где а и с — постоянные, причем χ ^> 0 и у ^> 0. Логарифмируя формулу (4), будем иметь \gy = a\gx-{-\gc. Отсюда, полагая X=\gx; Y=\gy, получим Y=aX-\-b, (5) где b=\gc. Таким образом, степенная зависимость (4) между переменными χ и у обнаруживается, если точки yv,-(lgx;, \gyt) (i=l, 2 η) лежат на одной прямой в плоскости ΟΧΥ. Для построения прямой (5) выгодно использовать логарифмическую бумагу, представляющую собой неравномерную сетку, построенную на горизонтальной и вертикальной логарифмических шкалах. Поэтому, откладывая на осях численные значения х{ и уь мы получаем точку Ni с координатами \gXi и \gyi (в известном масштабе), т. е. избавляемся от необходимости вычислять значения логарифмов исходных координат. Заметим, что в логарифмической координатной сетке OXY началом координат служит точка х=\ и _у=1. Поэтому исходные дан-
§ 31 МЕТОД ВЫРАВНИВАНИЯ 85 ные χί и _у; (которые должны быть положительными) выгодно преобразовать так, чтобы имело место соотношение xt Зз 1 и .у,-> 1 (например, умножить их на подходящий положительный множитель). Полагая х=\ в соотношении (4), будем иметь у = с; таким образом, постоянная с представляет собой ординату точки пересечения с осью OY соответствующего прямолинейного графика в плоскости OXY. Пример 3. Табличные данные X У 10 1,06 20 1,33 | 30 40 1,52 1,68 50 1,81 60 1,91 70 2,01 80 2,11 отвечают формуле вида у = сха. (6) Найти параметры а и с. Решение. Нанося данные точки на логарифмическую бумагу, замечаем, что эти точки с достаточной точностью располагаются на Рис. 14. прямой линии (рис. 14). Тем самым подтверждается наше предположение (6) о характере зависимости между χ и у. Для определения параметров а и с воспользуемся крайними точками А(10; 1,06) и В (80; 2,11). Логарифмируя соотношение (6), получим \gy = \gc-\-a\gx. Отсюда, подставляя координаты точек А и В, находим ]g\,06 = \gc + a\g\0, lg2,ll = lgc-f alg80
86 ЭМПИРИЧЕСКИЕ ФОРМУЛЫ [гл. и или следовательно, lgi-{-α = 0,0253, ]g с _|- 1,9031 а = 0,3243; 0,3243-0,0253 0,2990 „001, й= , гч„„, i = 7Γί^Ύ = 0,331 1 1,9031 - 1 0,9031' lgс = 0,0253 — 0,3311 =—0,3058 = 1,6942; с — 0,4945. Таким образом, у = 0,4945 х».331·. (7) В таблице 12 приведены значения у=.у(х)у вычисленные по формуле (7), и их отклонения Δ=^—у от табличных данных. Таблица 12 X 'у ь=у-у Значения эмпирической функции (7) 10 1,060 0 20 1,320 30 1,525 0,010 -0,005 40 1,677 0,003 50 1,806 0,004 60 1,919 — 0,009 70 2,012 — 0,002 80 2,110 0 Другой важный случай представляет показательная зависимость у=сеа\ (8) где с ]> 0. Логарифмируя, будем иметь \gy = ax-\-\gc. Отсюда, полагая получим линейную зависимость Y=aX-\-b, где b = \gc. Если имеется подозрение на показательную зависимость (8), то для построения в плоскости ΟΧ Υ удобно использовать полулогарифмическую бумагу с равномерной шкалой по оси ОХ и логарифмической шкалой по оси ОУ.
§ 3] МЕТОД ВЫРАВНИВАНИЯ 87 Начало координат в полулогарифмической сетке соответствует точке #=0 и у=\\ поэтому удобно брать _у(^1. Для прямолинейного графика в плоскости OXY, соответствующего формуле (8), постоянная с представляет собой ординату точки пересечения этого графика с осью OY (х = 0, у— с). В общем случае выбор вида эмпирической формулы облегчается знакомством с графиками элементарных функций. Пример 4. Результаты измерений выражаются таблицей [9J: X У 0 1 0,2 0,833 0,5 0,667 1 0,540 1,5 0,400 2 0,333 2,5 0,286 3 0,250 3,5 0,222 4 0,200 4,5 0,182 5 0,167 Составить подходящую эмпирическую формулу. Решение. Нанося точки Mi{xi, yt) на координатную сетку Оху, обнаруживаем, что они располагаются примерно на кривой, похожей на ветвь гиперболы, асимптотически приближающую ся к оси Ох (рис. 15). По этому полагаем 1 У ах-\-Ь ' (9) Отсюда — = ах-\-Ь, т. е. имеем зависимость вида (2). Введя новые переменные Х = х; Y =—, получим линейную зависимость Si- — 2 3 4 Рис, 15. J _ Y = aX-\-b. (10) Соответствующие данные приведены в таблице 13. Таблица 13 Подбор эмпирической формулы методом выравнивания X Υ 0 1 0,2 1,2 0,5 1,5 1 2,0 1,5 2,5 2 3.0 2,5 3,5 3 4,0 3,5 4.5 4 5,0 4,5 5,5 5 6
88 ЭМПИРИЧЕСКИЕ ФОРМУЛЫ ГЛ. II Построив в плоскости OXY точки /V,- (А",·, К;), убеждаемся, что они лежат приблизительно на прямой линии L (рис. 16). Следовательно, наша гипотеза о характере зависимости оправдалась, и вид формулы (9) выбран правильно. По рис. 16 определяем параметры прямой L 6-1 ^ — — ZS ^ 1 Μ ^ ^ -^ -—, г~ О 0.5 I 1.5 2 2.5 3 3.5 Ί Ί.5 5 λ Рис. 16. ■О" Таким образом, искомая эмпирическая формула есть у ·. "х + 1 У § 4. Квадратичная (параболическаи) зависимость Если для данных значений (xh у{) (г' = 1, 2, . .. , η) не оправдывается линейная зависимость, то можно испробовать более общую квадратичную зависимость у = ах' -\- Ъх -j- с (1) \ (афО). Формула (1) имеет место, когда точки Λί; (xh у{) располагаются на отрезке параболы с вертикальной осью (рис. 17). Для обнаружения этого факта с надлежащей тщательностью проводим плавную кривую Г, ' вблизи которой группируются данные точки /И,- (xjt _y;), и выбираем на ней точку N(xt,y0), по возможности совпадающую с одной из точек Mk{xkyyk) (1 <fe<n). Предполагая, что кривая Г есть парабола (1), будем иметь х, Рис. 17. у0=.ах1-]-Ьх0^гс. (2)
§ 4] КВАДРАТИЧНАЯ (ПАРАБОЛИЧЕСКАЯ) ЗАВИСИМОСТЬ 89 Вычитая из уравнения (1) равенство (2), находим У — Уо = а (*' — х1) "И (* — хо) или У— У0 = а(х — хо)! 4Λ (* — хо)> (3) где £, = &-|-2ах0. Если теперь ввести новые переменные Х=х — χ У=У-П1° (4) то из уравнения (3) получим линейную зависимость Y = aX-\-bx. (5) Таким образом, параболе (1) на плоскости Оху соответствует прямая (5) на плоскости OXY (см. § 2). Обратно, если будет обнаружено (см. § 2), что точки N,(Xt, У,) (/=1,2, .... л), где X, = xt — x., У,=й^1У1 лежат на прямой (5), то точки Mt (xh _y;) расположены на параболе (1), причем b = bt — 2ax0, с=Уо + ах1 — Ь,> \ (6) Выведем аналитический критерий для квадратичной зависимости (1). Пусть Λί{ (х;, у ι) — данная таблица значений, причем Hx—Xi+t — x^O (i=l, 2 η—]). При наличии зависимости (1) последовательность уг, уг, ..., уп — или монотонная, т. е. ΔΛ'=>'ί+.— У ι ('=1.2, ..., л—1) сохраняет постоянный знак; или же эта последовательность имеет единственный экстремум, т. е. разность Ду,- лишь один раз меняет знак.
90 ЭМПИРИЧЕСКИЕ ФОРМУЛЫ [гл. π Введем разделенные разности первого и второго порядков (см., например, [15]): ιχ. х. ] = АУ£ Iхк -S + iJ дх. г„ v „ 1 Ιχί+ν χ!+ι\ — Iх» χί+ι\ Ι·*;, Λί + ), Λ; + 2] — jr. —χ. Λ1+2 -""Ι 4?0 г -ι уДх,·/ (7) где ^xl = x!+,—xi = ^xl-{-^xi + l. Доказывается [15], что точки Λί; (xh yt) расположены на параболе (1) тогда и только тогда, когда сохраняют постоянное значение все разделенные разности второго порядка. В частности, если значения х0хг, ...,хп равноотстоящие, т. е. Δχ. = h — const, то для существования эмпирической квадратичной зависимости (1) необходимо и достаточно, чтобы была постоянной вторая разность Ь*У1*=У1+* — 2у/ + 1+л = с (t=l, 2 я —2), причем тогда tfyl = 2h*a. Заметим, что вторые разности весьма чувствительны к отклонениям от параболического закона. Пример. Данную систему значений X У 0 0 0,5 — 1,76 1 — 3,00 2 — 3,96 4 0,24 5 5,40 6 . 13,34 исследовать на квадратичную зависимость. Решение. Составляем по формуле (7) таблицу разделенных разностей (таблица 14). Так как вторая разделенная разность примерно постоянна, то можно считать, что между переменными χ и у имеет место приближенная квадратичная зависимость.
§ 5) ОПРЕДЕЛЕНИЕ ПАРАМЕТРОВ ЭМПИРИЧЕСКОЙ ФОРМУЛЫ 91 Таблица 14 Проверка на квадратичную зависимость X 0 0,5 1 2 4 5 6 АХ 0,5 0,5 1 У 0 — 1,76 — 3,00 1 — 3,96 2 1 — 0,24 1 1 5,40 13,34 iy - 1,76 — 1,24 — 0,96 4у д* '(£) — 3,52 — 2,48 — 0,96 | 3,72 1,86 I 5,64 7,94 5,64 7,94 1,04 1,52 2,92 3,78 2,30 | Μ 1 1,5 3 3 \(Й) Δ1* 1,04 1,01 0,97 1,26 1 2 1,15 § 5. Определение параметров эмпирической формулы Если вид эмпирической формулы выбран, то возникает задача определения наилучших коэффициентов (параметров), входящих в эту формулу. В общем виде эта задача ставится следующим образом: пусть данная система значений Mi (xit yt) (г'= 1, 2, . .., η) приближенно описывается формулой вида y=f(x; α,, αν .... am), (1)
92 ЭМПИРИЧЕСКИЕ ФОРМУЛЫ [ГЛ. II где /—известная функция и а,, а2, . .. , ат — неизвестные постоянные, число которых т обычно меньше числа точек Mit т. е. т <С п. Требуется определить эти постоянные. Если значения (хг, yt) точно связаны зависимостью (1), то параметры а,, а2 ат могут быть найдены из системы уравнений У;=/(х/, β„ β2 а,п) (2) (7=1,2, ...,«). Однако на практике значения [xL, yt) содержат неизбежные ошибки и число уравнений системы (2) значительно больше числа неизвестных; поэтому система (2), как правило, является несовместной. Приходится отыскивать наилучшие значения а,, а2, ... , ат, приближенно удовлетворяющие системе (2), т. е. такие, что невязки (уклонения) У/—/(х/> «ι. а,. ■ ■ ·. α J =s/ (3) (У'=1,2 я) являются возможно малыми по абсолютной величине. Геометрически задача сводится к проведению кривой вида (1), наиболее тесно примыкающей к данной системе точек. Наиболее распространенными являются эмпирические формулы, линейно зависящие от параметров, т. е. формулы вида У = «Р.М + М>, (*)+<М>« (*)+··· +β»Ϋ« (*)· (4) В этом случае система (2) линейная и исследование ее сравнительно просто. При нелинейной зависимости в (1) от параметров а„ at, . . ., ат система (2) также нелинейная и нахождение точных или приближенных решений ее представляет трудную задачу; обычно такую систему приближенно заменяют линейной (см. § 12). В следующих параграфах мы рассмотрим три наиболее употребительных метода определения параметров эмпирической формулы: 1) метод выбранных точек; 2) метод среднихиЗ) метод наименьших квадратов. § 6. Метод выбранных точек Пусть для системы опытных данных Mi (*,·, yt) (/=1,2, . . ., η) построена эмпирическая формула у=/ (χ; α„ α„ ...,aj, (1) содержащая т(т<С,п) свободных параметров av α2, ..., аш, где /— известная функция.
§ 6] МЕТОД ВЫБРАННЫХ ТОЧЕК 93 На координатной плоскости Оху с возможной аккуратностью проводим плавную кривую Г, наиболее близко примыкающую к точкам Л4(-. На кривой Г выбираем систему т (по числу параметров) точек Nj (Xj, у J) (j'= 1, 2, . . ., т), не обязательно совпадающих с точками Λί;. При этом желательно [3], чтобы выбранные точки ЛЛ были по возможности равномерно распределены по всей рабочей части кривой Г и возможно дальше отстояли друг от друга, а в то же время не лежали бы слишком близко к мало надежным концевым точкам /И, и Мп. Для удобства обычно берут абсциссы х, этих точек совпадающими с крупными делениями оси Ох координатной сетки. После этого со всей тщательностью замеряют координаты х-, у. (у'=1, 2, ..., «). Тогда параметры а,, в2, ...,ат, в общем случае, могут быть определены из системы т уравнений У/=?,(х/, а„ <*„ · ... О (2) (/'=1, 2, ..., т). Применение этого метода для линейной зависимости у = ах -\- Ь рассмотрено выше (§ 2). Для случая квадратичной зависимости у = ах" -\- Ьх -\- с коэффициенты а, Ь и с определяются из системы трех уравнений у, = ах\ -j- Ьхх -j- с, \ уг = ах\-\-Ьхг\с, > yi=ax\-\-bx,-\-c. ) Заметим, что метод выбранных точек содержит геометрические построения, допускающие известный произвол, и поэтому является грубым. К нему следует прибегать в тех случаях, когда точность исходных данных относительно невелика. Для увеличения точности метода рекомендуется пользоваться сеткой с мелкими делениями. Достоинство метода — простота применения и наглядность. В дальнейших параграфах (§ 7 и 8) укажем более точные аналитические методы определения коэффициентов эмпирической формулы (1).
94 ЭМПИРИЧЕСКИЕ ФОРМУЛЫ [ГЛ. II § 7. Метод средних Если в эмпирическую формулу у=/(х; я„ аг, . .., ат) (1) подставить исходные данные Mi (х;, yt), то левая часть формулы, вообще говоря, не будет равна правой. Разности (невязки) /(*,■;«! а,п)—У1 = е1 («=1, 2, ..., л) (2) называются уклонениями и представляют собой расстояния по вертикали точек ML от графика эмпирической функции (1), взятые со знаком плюс (-}-) или со знаком У* - минус (—) (рис. 18). Согласно методу средних за наилучшее положение эмпирической кривой К принимается то, для которого равна нулю алгебраическая сумма Ε всех уклонений е;, т. е. должно иметь место равенство £=2В/=о. (3) 1 — 1 Для определения по Рис. 18. методу средних постоянных а,, а2, . . ., ат, где т <Сп: все уклонения ε,- разбивают на т групп, содержащих примерно одинаковые количества уклонений. Приравнивая нулю алгебраическую сумму £?у(/=1,2, ...,т) уклонений, входящих в каждую из этих групп, получаем систему, содержащую столько уравнений, сколько имеется неизвестных коэффициентов а,, «2, . . ., ат. Решив эту сие ι ему, мы найдем коэффициенты а; (/=1,2, ..., т). Заметим, что так как сумма Е, уклонений для каждой группы равна нулю, то равна нулю также и сумма Ε всех уклонений, т. е. для нашей системы равенство (3) будет выполнено. Пример. Количество Q вещества в %, оставшегося в системе через t минут от начала химической реакции, дается таблицей [13]: t Q 7 83,7 12 72,9 17 63,2 22 54,7 27 47,5 32 41,4 37 36,3
§ 7] метод средних 95 Составить эмпирическую формулу для зависимости величины Q от времени t. Решение. На плоскости OtQ данная система точек (tt, Q{) примерно располагается на параболе с вертикальной осью. Поэтому будем искать эмпирическую формулу в виде Q=af-}-bt-\-c. (4) Для определения коэффициентов а, 6 и с применим метод средних. Подставляя табличные данные в формулу (4), получаем выражения для соответствующих уклонений: г, = 49а + 76 + с — 83,7; ε2= 144α+126 +с—-72,9; 8, = 289а+176 + с — 63,2; е4 = 484а + 226 + с — 54,7; ε4 = 729а + 276 + с — 47,5; ε, = 1024а + 326 + с — 41,4; ε, = 1369а + 376 + с — 36,3. Для определения коэффициентов а, 6 и с по методу средних уклонения S,- нужно разбить на три группы. Объединим, например, в группу I уклонения Sj, ε„ ε,, в группу II—ε4, es ив группу 111—ε„, ε7. Тогда получим систему е,+е,=0, \ (5) или 482а + 366 + 3с = 219,8; ] 1213а+ 496 +2с =102,2; J- (6) 2393а + 696 + 2с = 77,7. j Решая систему (6), находим α = 0,0235; 6 = —2,6115; с= 100,8295. Следовательно, искомая эмпирическая формула имеет вид Q=0,0235*2 — 2,6115* + 100,8295. (7) Для сравнения в таблице 15 приведены результаты расчетов по формуле (7). Заметим, что результаты метода средних существенно зависят от способа группировки уклонений. Практика показывает, что наиболее
96 ЭМПИРИЧЕСКИЕ ФОРМУЛЫ [гл. π удачные эмпирические формулы получаются, если уклонения группируются в порядке последовательности их номеров (предполагая, что Таблица 15 Оценка точности эмпирической формулы (7) / 1 2 3 4 5 6 7 <?,■ 83,7 72,9 63,2 54,7 47,5 41,4 36,3 Q., вычисл. по эмпирической формуле (7) 83,70 72,88 63,23 54,75 47.45 41.33 36,38 Уклонения .,. = <?,-$, 0,00 + 0,02 -0,03 — 0,05 μο,οδ -0,07 -0,08 исходные данные упорядочены по одной из переменных) и каждая группа уклонений содержит, по возможности, одинаковое число членов. § 8. Метод наименьших квадратов Пусть известен вид эмпирической формулы ε,-=/(*,■; α„ аг, ..., an)—yi (/=1, 2 η) (1) (2) — уклонения эмпирической формулы (1) от исходных данных (хр у;). Согласно методу наименьших квадратов (см. гл. I, § 3) наилучшими коэффициентами а1, а2, ..., ат считаются те, для которых сумма квадратов уклонений 5 (а,, а2, ..., ат)= Σ [Λ*/! αι> <*,. · · ■. О — У,]2 (3) будет минимальной. Отсюда, используя необходимые условия экстремума функции нескольких переменных, получаем так называемую нормальную систему для определения коэффициентов «,(('= 1, 2 т) dS *1=0 ^ = 0 «За, ' даг ' да, - = 0. (4) Если система (4) имеет единственное решение, то оно будет искомым.
§ 8] МЕТОД НАИМЕНЬШИХ КВАДРАТОВ 97 Система (4) упрощается, если эмпирическая функция /(χ; а,, α2, ..., ат) линейная относительно параметров а,, а2, ...,ат. Действительно, полагая f(x; а^аг, ..., ат) ^ φ0 (χ) -j- αιψι (χ) + . .. -f <Vf„» (x), будем иметь S(ava2 am) = 2 K<?, (*/) + · · · + α A (*;) — ΥίΥ> 1 = 1 где ^· = Λ· — <Ро (*;)■ Отсюда Τ t = Σ ?ι (*.■) Kf. W + · ■ · + β-f»(*/) — У г] = о, τ fe;=Σ ν» to) h<p. to) + · · · + ад. to) — κί] = °· Введя сокращенные обозначения π η (φ/, φ») = Σ φ, to) φ* to) и (φ γ) = Σ φ,- to) υ ι, систему (5) можно записать в виде нормальной системы β.(<Ρι· <Ρ,) + β,(?.. Ϋ,)+···+β*(<Ρι. <pJ = (<Pn 10. ] ai (φ*, φ,) + fl2 (<pm, φ.) + ■ ■ ■ + a™ (φ„. <ρ„) = (φ*. Π· Ι (R) (5') В частном случае, если эмпирическая функция представляет полином *) то Отсюда имеем У = «„ + «,*+■··+V"'. ψ/(χ) = χ1 (/=0,1,2,...,/»). (φ/. η = (φ/,^=Σ^Ι- = ί*/ν]. *) Для удобства обозначений мы изменяем нумерацию коэффициентов α(·.
98 ЭМПИРИЧЕСКИЕ ФОРМУЛЫ [гл. и Следовательно, нормальная система (5') будет иметь вид ν+«. Μ +«* И + ■■·+««. [*"] = Μ. ".М+в.М+«,И + ..-+«»1*"+,]==Ы I (6) α0 И + α, [*"■"] + α2 [*'»+'] + ... +am [χ""} = [x»y\. j Метод наименьших квадратов обладает тем преимуществом, что если сумма 5 квадратов уклонений ε,- мала, то сами эти уклонения также малы но абсолютной величине. Для метода средних, где составляется алгебраическая сумма уклонений, такого вывода сделать нельзя. Недостатком метода наименьших квадратов является громоздкость вычислений. Поэтому к нему прибегают обычно при обработке наблюдений высокой точности, когда нужно получить также весьма точные значения параметров. Заметим, что в этом случае промежуточные вычисления нужно проводить с надлежащим количеством десятичных знаков, так как в противном случае при неблагоприятных условиях искомые коэффициенты будут иметь мало верных знаков. Но грубые значения этих коэффициентов могут быть получены значительно проще, т. е. применение метода не будет оправдано. В частности, если происходит потеря цифр при вычитании, то вычисления должны быть проведены с достаточным количеством запасных верных значащих цифр. Здесь следует руководствоваться следующим правилом: если численные значения коэффициентов желательно иметь с т верными значащими цифрами и если предварительные вычисления показывают, что первые ρ цифр исчезнут при вычитании, то вычисления должны быть произведены с т -\~р -\-1 верными значащими цифрами на всех стадиях работы [5]. Пример 1. Используя метод наименьших квадратов, вывести эмпирическую формулу для табличной функции Q=f(i) примера из § 7. Решение. Полагаем у=ахг-\-Ьх-\-с. (7) Для вычисления коэффициентов нормальной системы составляем таблицу 16. Тогда имеем следующую систему нормальных уравнений: 4088а-f 154*4- 7с = 399·7: Ϊ 120736а-f 4088^-f 154с= 7688,9; ' 3795092а -{- 120736* -{- 4088с = 186054,3. J Решив эту систему, получим а = 0,023381; * = —2,6066; с— 100,791.
§ 8] МЕТОД НАИМЕНЬШИХ КВАДРАТОВ 99 Таблица 16 Определение параметров эмпирической формулы (7) методом наименьших квадратов (° 7 I 7 12 17 22 27 32 37 154 V 49 144 289 484 729 1024 1369 4088 /J 343 1728 4913 10648 19683 32768 50653 120736 1' 2401 20736 83521 234256 531441 1048576 1874161 3795092 <? 83,7 72,9 63,2 54,7 47,5 41,4 36,3 399,7 (Q 585,9 874,8 1074,4 1203,4 1282,5 1324,8 1343,1 7688,9 PQ 4101,3 10497,6 18264,8 26474,8 34627,5 42393,6 49694,7 186054,3 Следовательно, искомая эмпирическая формула запишется так: Q=0,02338/2 — 2,6066^-j-100,79. (8) Таблица 17 показывает согласованность полученной эмпирической формулы с опытными данными. Таблица 17 Оценка точности эмпирической формулы (8) 1 2 3 4 5 6 7 Q 83,7 72,9 63,2 54,7 47,5 41,4 36,3 Q, вычисл. по формуле (S) 83,69 72,88 63,24 54,76 47,46 41,32 36,36 iклонение e==Q-Q +0,01 +0,02 —0,04 —0,06 +0,04 +0,08 —0,06 Имеем 7 Σ β; = 0,0173. Мы видим, что формула (8) согласуется с экспериментальными данными несколько лучше, чем формула (7) из § 7, вычисленная методом средних.
100 ЭМПИРИЧЕСКИЕ ФОРМУЛЫ Пример 2. Следующая таблица [1] t k 14,5 0 30,0 0,004 64,5 74,5 0,018 0,029 86,7 0,051 94,5 0,073 98,9 0,090 дает значения удельной электропроводимости k стекла в зависимости от температуры t в градусах С. Подобрать эмпирическую формулу для функции k ==/(/). Решение. Точки * * Λ^,.,18Λ-)('·=1,2, ...,7), л0,8 за исключением первой, при- \l β мерно расположены на пря- , мой линии (рис. 19). 1 ' Поэтому выбираем эмпирическую формулу в виде показательной функции О 10 20 30 40 50 ВО 70 60 S0 100 Рис. 19. где /W=]ge Преобразованные данные помещены в таблице 18. k = be' Для удобства положим I000k = ceai, (9) где с = 1000b. Логарифмируя (9), будем иметь y=\g 1000/г=. = \gc + aMt, (10) 0,43429. Таблица 18 ί 14,5 30,0 64,5 74,5 86,7 94,5 98,9 1000А 0 4 18 29 51 73 90 Значения переменных t и y = lg 1000A 0,6021 1,2553 1,4624 1,7076 1,8633 1,9542 *ι 0,0019 0,0039 0,0185 0,0293 0,0512 0,0731 0,0893 i,=A-*l —0,0019 —0,0001 —0,0005 —0,0003 —0,0002 —0,0001 —0,0007 У hi 0,0025 0,0048 0,0200 0,0302 0,0499 0,0688 0,0825 Λ11 = * - * 11 —0,0025 —0.0008 —0,0020 —0,0012 -0,0011 -0,0042 ЬО,0075
§ 8J МЕТОД НАИМЕНЬШИХ КВАДРАТОВ 101 Коэффициенты \g с и аМ в формуле (10) определим двумя способами, игнорируя первую точку. I. Метод средних. Определяем уклонения: S, = 0,6021 — (lg с -f 30αΛί); ε2 = 1,2553 — (lgc- ε, = 1,4624 — (lg с ε4 = 1,7076 — (lgc + 86,7αΜ); ■ 64,5αΛ/); ε5 = 1,8633 — (lg с -\- 94,5αΛΓ); ■ 74,5οΛί); ε, = 1,9542 — (lg c -f 98,9αΛί). Отсюда, полагая ε, —j— ε2 —j— s3 = 0, ε4 -j- s5 -\- εβ = 0, получим систему 31gc-|-169aM= 3,3198; 3 lgc -f- 280, \aM— 5,5251 Решая систему (11), находим .} О·) aM = 2-f^f =0,01985; а = ^-0,01985 = 2,30258-0,01985 =0,0457 1 lgc = у (3,3198 — 169-0,01985) = — 0,0116 = 1,9884; Следовательно, с = 0,9737. А = 0,9737-lCT'-eM*"'. (12) П. Метод наименьших квадратов. Промежуточные вычисления приведены в таблице 19. Таблица 19 Определение параметров формулы (10) методом наименьших квадратов V θ ί 30,0 64,5 74,5 86,7 94,5 98,9 4491 Ρ- 900 4160,25 5550,25 7516,89 8930,25 9781,21 36838,85 У 0,6021 1,2553 1,4624 1,7076 1,8633 1,9542 8,8449 ty 18,063 80,967 108,949 148,049 176,082 193,70 725,380 Отсюда получаем нормальную систему 61gc + 449,laM=8,8449; \ 449,1 lgc4-36 839аЛ4 = 725,380 J
102 ЭМПИРИЧЕСКИЕ ФОРМУЛЫ [гл. и или lgc-f 74,183αΛί= 1,4742; ι lgc-\-82,026aM= 1,6145. J Решая последнюю систему, находим аМ = 0,01789; д = 0,0412 и lgc = 0,1471; с = 1,403. Таким образом, А = 1,403 · 10 ~ * ■ е0·04"'. (13) Результаты вычислений по формулам (12) и (13) приведены в таблице 18. § 9. Некоторые соображения о выборе вида эмпирической формулы с двумя параметрами Пусть для данной системы значений xh yt (i == 1, 2, . . ., η), где η > 3 и χ, <С^2 Ό · •<Сл;п' требуется найти эмпирическую формулу вида y=f(x;a,b), (1) содержащую лишь два параметра а п Ь. Если окажется, что 2§ = const, (2) то искомая зависимость линейная: у = ах-\-Ь (3) и задача, таким образом, легко решается. Другим простым случаем является наличие квадратичной зависимости y—y1 = a(x—xiY-\-d(x — xl), (4) которая обнаруживается известными приемами (см. § 3). Рассмотрим общий случай, когда соотношение (1), вообще говоря, не сводится к формулам (3) и (4). Достаточным условием существования эмпирической формулы вида (1), где/—известная функция, является совместность (с заданной точностью) системы уравнений У ι =/(χί< a>b) ('—1.2 ")■ Исключая отсюда неизвестные α и b, получаем систему условий для точек (#t·, У{), обеспечивающую существование зависимости (1). Но такой подход является весьма сложным.
§ 9J ВЫБОР ФОРМУЛЫ С ДВУМЯ ПАРАМЕТРАМИ 103 Выведем необходимое условие существования эмпирической зависимости вида (1) для заданной системы точек (х;, у{). Пусть Mt{xb у(), M,(x,,yj), Mk(xk, yk)—три системы значений из нашей совокупности. Предполагая, что кривая (1) проходит через точки Mt, М-, Mk, будем иметь yi=hxC>a,b), y/=/(xJ;a,b), ук=/(хк; a, b). (5) Исключая из системы (5) параметры а и Ь, получим соотношение вида 0(xl,xJ,xk,yl,yJ,yk) = O. (6) Выполнение равенства (6) для любых значений /, у, k{\ <^ί <^у <^k^n) необходимо для существования зависимости (1). Так как проверка соотношения (6) связана с трудоемкими вычислениями, то на практике обычно ограничиваются одной тройкой точек: начальной (xlt yt), промежуточной (xs, ys) и конечной (χ у ) (с целью достижения наибольшего диапазона), т. е. полагают 1=1, J=s(\ <0<л)> k = n. Точку Ms выбирают так, чтобы соотношение (6) было по возможности простым. Заметим, что иногда вместо промежуточной точки Μ выгодно брать точку Ms(xs,y,), не принадлежащую нашему ряду точек /И(·; тогда координаты xs и ys определяются интерполированием. Пример 1. Получить необходимое условие для существования степенной зависимости у — ахь, (7) предполагая, что *ί>0; л>0 (/=1,2 η). Решение. Выберем Из формулы (7) имеем *. = <"?; У, = ах\ = ах} х*; уп = ах*а. (8) Исключая из соотношений (8) параметры а и Ь, получим т. е, У* = У~уУп> (9)
104 ЭМПИРИЧЕСКИЕ ФОРМУЛЫ [гл. ι Таким образом, для существования степенной зависимости (7) необходимо, чтобы среднему геометрическому xs значений хх и хп соответствовало среднее геометрическое у s значений yt и уп. Вообще, если имеет место степенная зависимость (7) и значения xt образуют геометрическую прогрессию, то значения yt также образуют геометрическую прогрессию. Если значение xs=yxlxn не является табличным, то соответствующее значение ys определяется с помощью интерполирования. В дальнейшем в этом параграфе мы будем рассматривать наиболее часто встречающиеся зависимости: \.у = ах + Ь; ν·-ν=^ρ; 11. у —ах"; VI. у = —~; S J ax-\-b III. у= abx; VII. y = a\nx-\-b. IV. y = a-\- — ; ' ' χ Аналогично тому, как это сделано в примере 1, для существования зависимостей I — VII легко вывести простые необходимые условия вида х« = хг> У,—У^ где χ, = ψ (я,, хп) и УУ = ^{у1, У„), причем предполагается, что х,>0 и у,->0 (г =1,2,..., п). Выражения для xs и ys приведены в таблице 20. Таблица 20 облегчает выбор вида эмпирической формулы среди указанных. Рекомендуется поступать следующим образом: для проверки пригодности определенной эмпирической формулы, пользуясь исходными данными, находим значения xs = xt и ys и сравниваем последнее со значением ψ (у,, >»„) —)^> помещенным в таблице. Предпочтительнее та эмпирическая формула, для которой расхождение \ys — ys\ возможно мало. Для окончательного выбора следует учесть также промежуточные данные. Если величина \ys — ys \ большая, то соответствующая эмпирическая формула не пригодна. Если значение ψ(χΛ, хп) = хч не находится среди исходных данных х;, то отвечающее ей значение можно определить посредством линейной интерполяции .. _., ι У1+\ - Vt И — Х1 [Xs — Xt), где xi и xi+l—промежуточные значения, между которыми содержится
§ 9] ВЫБОР ФОРМУЛЫ С ДВУМЯ ПАРАМЕТРАМИ 105 Таблица 20 Простейшие необходимые условия для наличия эмпирических зависимостей I — VII № I II 111 IV V VI VII *i х\ ~Т хп 2 (среднее арифметическое) у Х^Хп (среднее геометрическое) хл ~Т хп ■2 (среднее арифметическое) lx<jcn х\ ~Г хп (среднее гармоническое) Х( -\- Хп 2 (среднее арифметическое) ΔΧ±Χη х\ ~Г хп (среднее гармоническое) 1/"х,хи (среднее геометрическое) Vs У1+Уп 2 (среднее арифметическое) УьУп (среднее геометрическое) У"у\У~п (среднее геометрическое) yt+y„ 2 (среднее арифметическое) 2,ViV„ Уг+Уп (среднее гармоническое) '2У1Уп У^+Уп (среднее гармоническое) У1 + Уп 2 (среднее арифметическое) Мид эмпирической формулы у = ах-\-Ь у^=ах" y=zabx. или у = ае$х, где \ = In b . ь y = a-\ X 1 ax-j-b X ' ax -f- b у — a lg χ -f- b Способ выравнивания У = а + ЬХ, где У = lg_y, α = lg a K=a -f-jix, где χ— Iga, К = ax -f- δ, где У = ху У=ах + й. где К = - У где г = — У у = /rJ^-f- ft, где X=Igx Следует иметь в виду, что такой подход в целом является грубо ориентировочным, так как мы не учитываем поведение всех промежуточных данных (xit yL). Кроме того, таблица 20 охватывает
106 ЭМПИРИЧЕСКИЕ ФОРМУЛЫ [гл. и небольшое количество зависимостей и может случиться, что переменные χ и у подчиняются некоторой закономерности, не вошедшей в наш список. Заметим, что все зависимости, приведенные в таблице 20, методом выравнивания могут быть просто преобразованы в линейные (ср. § 2). Поэтому здесь можно использовать также критерий прямолинейности (§ 2, формула (6)) для преобразованных исходных данных (х;, у ι). Функции I — VII монотонные, и, следовательно, отвечающие им упорядоченные данные (х1, _у,), при \xi = xi + l — xi^>0 (/=1, 2, ..., я—1), должны обладать постоянным знаком приращения АУ(=Л + .— У ι (/=1- 2, ..., η — 1). Если это обстоятельство не имеет места, то зависимости I—VII противопоказаны. Пример 2. Определить вид эмпирической формулы, отвечающей следующей таблице: X У 273 29,4 283 33,3 288 293 35,2 37,2 313 333 45,8 55,2 353 65,6 373 77,3 Решение. Будем искать эмпирическую формулу среди зависимостей I — VII, имеющихся в таблице 20, согласно указанному рецепту. Результаты вычислений приведены в таблице 21, причем в необходимых случаях применена линейная интерполяция. Таблица 21 показывает, что согласно необходимому критерию следует остановиться на степенной зависимости у = ахь. Пример 3. Следующая таблица дает давление ρ насыщенного пара в кГ\см%, соответствующее удельному объему ν в m'JkF. V Ρ 3,334 0,482 1,630 1,034 0,8657 0,4323 2,027 4,247 0,2646 7,164 0,1699 11,48 0,1146 17,60 Найти эмпирическую формулу для зависимости F(v, ρ)—0 [1].
§ 91 ВЫБОР ФОРМУЛЫ С ДВУМЯ ПАРАМЕТРАМИ 107 ч хо > I и о S о. о S α а s S в я а о в я в 3 ч >> ε α о •β- sS О s (!) α о хо ч о с улы Ε о. о •е- К ю 1 ^ к 1 1 и **' 1 ^ ]* >" 1 ^ и я 0 ПОДХОДИ га S I + β II >ν ю 00 οί ю о" ю ю СО со" 1 СО 4- сгГ 1 с ■Si + А Μ CN СО οι со 1 | ГО со + см 1 с к + ч ΟΙ ΟΙ 1 Ё - ПОДХОД формул II §· Ps о_ ~~ Γόο" ■■* 1— г—" II го 4J1 СП СМ ||_ 1 ?*\ V σΓ со II <го го го 1^- X II 1 с 1н~ V ""■ 1 ~ 1 § X ч о с о га S 1 ч II >s 00 CM IT^ о" ю II ν со οι СО I I ч ч К :n 1 ~ 1 ПОДХОДИТ 1 -о |ц -г- β II >S ю Tf to* σι со Τ ю го со" ю 1 + CM со ! |ГО со г*- Ι-' ГО со ' t~- го CM с CM ι Η + χ" > —, подходит I - + 1 a II P-> σι t^* iO о ιΛ tO с-Г II (СО <*>. к сгГ|Ч СМ СГ1 1см см II со см со 1 с К + н" см > подходит Η -с; + ^ СО^ ■tf ел <г>" т <Г> of II 1 с 1+ СО СО с см Ч К + >г > F- К не подход 1 + II >s ιΟ tD TF I-' со ^ ю со со" 1ГЭ JI + :\ сч -г σ-Γ со II 1 £ 1«" V Ξ3 >
108 ЭМПИРИЧЕСКИЕ ФОРМУЛЫ [гл. и Решение. Подберем вид формулы, пользуясь таблицей 20. Остановившись на формуле II, имеем "^ = ]/^Г = ]/3,334·0,1146 = 0,618; Ρ^ = 1/ΡΛ = 1/0,482· 17,60 = 2,92. Значение ps, соответствующее vs = 0,618, найдем линейной интерполяцией: ρ =2,027 -f^jg ~ g'gg7 ■ (0,618 - 0,8657) = 3,295. Так как отклонение |Р,- :0,375 сравнительно незначительное, то можно выбрать эмпирическую формулу вида p — avb. (10) OS -0А ~0.2 0 0.2 0А 0.6 Это согласуется также с природой газовых законов. Логарифмируя формулу (10), будем иметь \gp = \ga-\-b\gv. Отсюда, полагая X=\gv, Y=\gp, получим линейную зависимость Y=bX-{-lga. (11) О 0,5 1,0 1,5 2,0 25 3,0 3.5 i.O υ Рис. 20 Значения Х{ = \gvt- и Y;=\gpl (г = 1, 2, ..., 7) приведены в таблице 22. Построив точки М[ {\gvh lgp,-)*). убеждаемся,, что они расположены на прямой линии (рис. 20); следовательно, выбор эмпирической формулы произведен правильно. Коэффициенты формулы (11) вычисляем методом средних. Составляя уклонения &i = ]ga-\-b\gV; — \gp, (г=1, 2, ..., 7) и разбивая их на две группы: *) При построении рекомендуется пользоваться логарифмической бумагой.
§10] ЭМПИРИЧЕСКИЕ ФОРМУЛЫ, СОДЕРЖАЩИЕ ТРИ ПАРАМЕТРА 109 получим систему откуда 3 lg·a -f0,6725/!) = 0,0043; \ 4 lg а —2,6522^=3,7886, / b = — 1,066; \ga = 0,2402 и α= 1,740. Следовательно, окончательно имеем pf1 (12) В таблице 22 даны расхождения значений ра, полученных по формуле (12), с табличными данными р. Таблица 22 Оценка точности эмиирической формулы (12) * 3,334 1,630 0,8657 0,4323 0,2646 0,1699 0,1146 Ρ 0,482 1,034 2,027 4,247 7,164 11,48 17,60 ig v 0,5229 0,2122 —0,0626 —0,3642 —0,5774 —0,7698 —0,9408 ЧР -0,3170 0,0145 0,3068 0,6281 0,8551 1,0599 1,2455 Рэ, вычислен, по ф-ле (12) 0,482 1,033 2-028 4,241 7,176 11,48 17,51 ь=р-рэ 0,000 0 001 —0,001 0,006 —0,012 0,00 0,090 Δ* 0 ыо-· ыо_« 36-10-· 144-Ю-5 0 8100-Ю-8 2 = 0,084 2 = 0,0083 § 10. Эмпирические формулы, содержащие три параметра В этом параграфе мы рассмотрим, для заданной системы значений (χί> .У/)(г'=='> 2, ··■, п) табличных данных, важнейшие представители эмпирических формул вида у=/(х; a, b, с), (1) где а, Ь и с — некоторые постоянные. 1°. Квадратичная зависимость. Пусть у = ахг-\-Ьх-\-с. (2) Критерии для квадратичной зависимости были указаны в § 4. 2°. Степенная зависимость. Положим у = ах"-\-с. (3)
110 ЭМПИРИЧЕСКИЕ ФОРМУЛЫ [ГЛ. II Отсюда у — с = ахь. Логарифмируя это выражение, будем иметь \g[y — c) = \ga-\-b\gx. Отсюда, полагая lg(j — c)=Y и \gx = X, получим линейную зависимость Y=bX-\-\ga. (4) Определение параметров формулы (3) следует начать с нахождения значения с. Для этого составим среднее геометрическое xs = = Yx1xn, где хл и хп — крайние значения переменной х, и, пользуясь чертежом или методом линейной интерполяции для xs, найдем соответствующее значение ys. Предполагая, что точки Λί, (jc„ >>,), Ms{xs, yt), Mn(xn, ^„^расположены на кривой (3), будем иметь три равенства: 3Ί = с + α*ι> ι ь ys — c-f- axs, уп=.с-\-ахъп. Возводя xs = Y xtxn в степень Ь и умножая на а, получим axbs = Vax\axbn или У, — С = У(Уг~ С)(Уи — С)· Решая последнее равенство относительно с, находим _ УлУп-у\ . Ух + У η - 2У* Когда с определено, строим точки /V,- (Λ",., К;), где Λ",· = lg х(., Yi = \g{yi—с) (г=1, 2, ..., п). Если эти точки располагаются прямолинейно (или почти прямолинейно), то оправдана зависимость (3), причем постоянные а и b находятся обычным способом. Пример 1. Для переменных хну дана таблица значений: X У 250 0,10 500 0,28 900 0,80 1200 1,38 1600 2,56 2000 4,10
§ Ю] ЭМПИРИЧЕСКИЕ ФОРМУЛЫ, СОДЕРЖАЩИЕ ТРИ ПАРАМЕТРА 111 Найти эмпирическую формулу, связывающую эти переменные [12]. Решение. Построим эмпирическую формулу вида --ах"-{-t Находим xs = Vxxxn = /250 ■ 2000 = 707. На графике этому значению xs соответствует _у*== 0,507; отсюда :0,048. 0,10-4,10 — (0,507)z "—Ό,ΙΟ + 4,10 — 2-0,507' Остальные параметры а и b найдем методом средних. Составляем начальные уравнения 1{?СУ,· — 0,048)= Iga + Mg*, (f=l, 2, .. Будем иметь 6). — 1,2840 = \g a + 2,3979 Ъ: — 0,6345 = \ga + 2,6990 b — 0,1238 = lg α _|- 2,9542 * 0,1245 = lg α+ 3,0792 6; 0,4000— lga + 3,2041 b; 0,6077 = lg a + 3,3010 b. Группируя эти уравнения по три, получим — 2,0423 = 31g β+ 8,0511 6; 1 1,1322 = 3 lga-j-9-5843*· ' Решая систему (5), находим а=5,789-10-' и 0 = 2,071. Следовательно, искомая эмпирическая формула будет иметь вид у = 5,789 ■ 10" V·0" + 0,048. (5) (6) Сравнение значений у, полученных по формуле (6), с табличными данными у показано в таблице 23. 3°. Показательная зависимость. Пусть у = аеЬх + с. (7) Перенося слагаемое с влево и логарифмируя, получим kiy — c) = \ga-\-{bM)x, где Af = 0,43429. Таким образом, Y=\ga-\-bMx, (8) Таблица 23 Оценка точности эмпирической формулы (6) X 250 500 900 1200 1600 2000 У 0,10 0,28 0,80 1,38 2,56 4,10 У 0,102 0,273 0,808 1,426 2,552 4,020 •=у-у — 0,002 + 0,007 — 0,008 — 0,046 + 0,008 + 0,080
112 ЭМПИРИЧЕСКИЕ ФОРМУЛЫ [гл. и где Y=\g(y~c). Сначала определим параметр с. Для этого, как и в предыдущем случае, выберем крайние точки Мх (xv ух) и Л1п(хп, уп) и составим среднее арифметическое xs— 2 * Для значения xs найдем соответствующее значение ys (или из чертежа, или линейной интерполяцией). Подставляя эти значения в эмпирическую формулу (7), будем иметь у1=аеЬх--]-с; уп = оеЬхп -[-с; ь , , У* = аег > -\-с. Отсюда yl — c = aebx', уп — с = аеЬх" и, следовательно, {у, —с) (у η —с)=a2eb (х'+х">< т. е. {У, — с)(Уп — c) = {ys— с)2. Решив последнее уравнение относительно с, получим ~ y>+yn-bs' Если обнаружена линейная зависимость (8), то остальные параметры α и & находятся обычными приемами. Выведем аналитический критерий для показательной зависимости (7), предполагая, что значения х{ равноотстоящие, т. е. Дл;; = h = const (/—1, 2, .. ., η—1). Из формулы (7) имеем У1 = аеЬх>-\-с и yi + l=aeb^+^-\-c. Отсюда
§ 10] ЭМПИРИЧЕСКИЕ ФОРМУЛЫ, СОДЕРЖАЩИЕ ТРИ ПАРАМЕТРА 113 где а, = а(е*л—1). Логарифмируя равенство (9), получим \g^yi = \ga,-\-bMxl. Таким образом, при наличии зависимости (7) точки Nt (х;, ]g Ду,·) (г=1, 2, ..., η—1) расположены на прямой линии. Следовательно, учитывая, что Δλ;,· постоянны, получаем искомый критерий A(lgAj(.) = const (10) (*=1, 2 л —2). Пример 2. Для переменных χ и у дана таблица значений: X У 0 1,30 0,1 1,44 0,2 1,59 0,3 1,78 0,4 1,97 0,5 2,19 0,6 2,46 0,7 2,74 0,8 3,06 0,9 3,42 1,0 3,84 . Найти эмпирическую формулу для зависимости между хну. Решение. Составим таблицу разностей Д_у; (таблица 24). Таблица 24 Проверка на показательную зависимость X 0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 У 1,30 1,44 1,59 1,78 1,97 2,19 2,46 2,74 3,06 3,42 3,84 ау 0,14 0,15 0,19 0,19 0,22 0,27 0,28 0,32 0,36 0,42 lg (ay) —0,854 —0,824 —0,721 —0,721 —0,658 —0,569 —0,553 —0,495 —0,444 —0,377 & (lg &у) 0,030 0,103 0.000 0,137 0,089 0,016 0,058 0,051 0,067 Так как разность ку монотонно растет, то зависимость между χ и у не является линейной. Проверяем критерий (10) для показательной зависимости (7). Из таблицы 24 видно, что имеется значительный разброс для Δ (lg by). Поэтому формулу у = аеЬх-\-с можно принять лишь в качестве грубого приближения.
114 ЭМПИРИЧЕСКИЕ ФОРМУЛЫ [гл. и Найдем отсюда *s = ^(*,+*n)=4(0+l,0) = 0,5; Λ=2,19; 3,84-1,30-(2,19)' _or,go 1,30 + 3,84- 2-2,19 — υ-'ί00· Параметры а и Ь определим по методу средних. Имеем lgCy, — 0,258) = lg а + (6Λ1) jc, (f = 0,l, ..., 10). Составим два уравнения: Д lg (Λ — 0,258) = 6 lg a -+ ЪМ % xt и 2 lg (У, — 0,258) = 5 lg α + ЬМ jg *,. Подставив значения л;, и _yf, получим систему 0,9169 = 6 lg β -\-\,ЬЬМ; \ 2,2392 = 51ga-j-4,06AJ, I откуда α =1,044; 6=1,234. Следовательно, искомая эмпирическая формула имеет вид .у =1,044 «^""Н-0,258. (И) Согласованность полученной формулы с исходными данными показана в таблице 25. Таблица 25 Уклонения эмпирической формулы (11) от табличных данных X 0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 У 1,30 1,44 1,59 1,78 1,97 2,19 2,46 2,74 3,06 3,42 3,84 у, вычисл. по формуле (11) 1,302 1,439 1,594 1,770 1,968 2,193 2,447 2,735 3,048 3,428 3,844 4=у-у — 0,002 + 0,001 — 0,004 + 0,010 + 0,002 — О.ООЗ -0,013 -0,005 -0,012 — 0,008 — 0.004
§ 11) УТОЧНЕНИЕ ЭМПИРИЧЕСКОЙ ФОРМУЛЫ 115 Замечание. Что касается эмпирических формул, содержащих свыше трех параметров, то они редко встречаются на практике, и мы детально рассматривать их не будем. § 11. Уточнение полученной эмпирической формулы Укажем простой прием уточнения полученной эмпирической формулы в случае, если она дает сумму квадратов уклонений более значительную, чем это желательно. Пусть для заданной системы значений (л;,·, _у:) (г —1,2, ...,я) найдена эмпирическая формула У=/(х). (1) Требуется уменьшить сумму квадратов уклонений *=ί «^ibi-zw. (2) 1=1 1 = 1 где е(=у(·—/(#,·) (г'= 1, 2, . ..,«)*). Рассмотрим функцию У=/(х)+с, где с — некоторая постоянная величина. Подберем число с так, чтобы сумма квадратов новых уклонений * = 2 л = 2 [л. _/(Χί) _ с\г (3) 1 = 1 ι'=ι была минимальной. Очевидно, имеем г=2(с—в£)\ Для минимума функции s ^=s(c) необходимо, чтобы 1 = 1 Отсюда « лс = 2 ε, и, следовательно, η с = 7 Σ8/· (4) *) Для упрощения дальнейших формул мы изменяем знак уклонения.
116 ЭМПИРИЧЕСКИЕ ФОРМУЛЫ [ГЛ. 1[ Так как Й = 2л>0, то значение (4) дает наименьшее значение для суммы квадратов s. Итак, наилучшей постоянной с является среднее арифметическое уклонений е(-. Таким образом, если с=^=0, то прибавление к правой части эмпирической формулы (1) постоянного числа с, определяемого формулой (4), приводит к уточнению этой формулы в смысле суммы квадратов уклонений, так как s<^s. Если с = 0 или близко к нулю, то указанный прием не дает нужного эффекта. В этом случае можно положить где φ (χ) — известная функция, не обращающаяся в нуль во всех точках xlt т. е. такая, что 2φΚ·)2>ο. t = ι Отсюда ί = 1 1=1 Необходимое условие для минимума функции 5 дает X <Р (*;) [С(? Μ — ε,-J = 0; 2 дс следовательно, 2 Ei'fU,·) J2 ι?(*ί)ΐ* ο = ψ± (5) Так как №=X^W>o, то наилучшей постоянной для нашей цели является «среднее взвешенное* уклонений ε,·, определяемое формулой (5). В частности, если ψ(χ) = χ, то имеем η Σι 4χ;
§ 11) УТОЧНЕНИЕ ЭМПИРИЧЕСКОЙ ФОРМУЛЫ Пример. Для табличных данных 117 X 8 ν 1,30 10 15 14,0 15,4 20 16,3 30 17,2 40 17,8 60 18,5 80 18,8 получена эмпирическая формула 0,051л: + 0,209" (6) Путем прибавления постоянной уточнить эту формулу. Решение. Полагаем где 0,051л;+ 0,209 8 q + C- 0,47 (см. таблицу 26). Поэтому χ У· •0,06 = = 0,06 1,0031* + 0,0125 0,051л; + 0,209 ^ ' 0,051л:+ 0,209 Результаты уточнения приведены в таблице 26. (7) X 8 10 15 20 30 40 60 80 Σ У 13,0 14,0 15,4 16,3 17,2 17,8 18,5 18,8 Сравнение у по формуле (6) 12,97 13,91 15,40 16,27 17,25 17,79 18,39 18,65 эмпирических формул (6) и у по уточн. ф-ле (7) 13,02 13,96 15,45 16,32 17,30 17,84 18,44 18,70 *=у-у + 0,03 + 0,09 0,00 + 0,03 —0,05 -0,01 |-0,П μο,ΐ5 0,47 е* 9-10— 81· Ю-4 0 9·Ю-" 25· Ю-4 МО-4 121·Ю-4 225. Ю-4 0,0471 Таб (7) ё=у-у —0,02 + 0,04 —0,05 —0,02 —0,10 —0,04 + 0,06 + 0,10 —0,03 лица 26 *-2 е 4-10-* 16-10-* 25· 10— 4-10 — 100· 10 — 16-10—* .36-10-* 100-Ю-4 0,0301
118 ЭМПИРИЧЕСКИЕ ФОРМУЛЫ [гл. и § 12. Общий метод определения параметров эмпирической формулы До сих пор мы рассматривали, в основном, эмпирические формулы, линейно зависящие от параметров (или приводимые к такому виду), и для этого частного случая давались эффективные методы определения параметров. Сейчас мы укажем общий метод определения параметров эмпирической формулы, не предполагая ее линейности относительно параметров. Пусть для совокупности упорядоченных значений (x[t yt){i=\, 2 η) построена эмпирическая формула у=/(х; а,, а2, .... ат), (1) содержащая т параметров (т<^п), причем функция f имеет непрерывные частные производные по всем своим аргументам. Требуется определить параметры β,, а2, ..., ат так, чтобы формула (1) оказалась согласованной с исходными данными, т. е. невязки (уклонения) ε«=Λ— /(*/'> а,- «2 О (1=1,2, .... п) должны быть возможно малыми по абсолютной величине. Если бы исходные данные (л:,-, yt) не содержали ошибок и зависимость / была бы точной, то задача отыскания параметров а,-(г— 1, 2, ...,т) свелась бы к решению т уравнений (т<^п) из следующей системы η уравнений: Λ =/(*.; а„ аг, ..., ат), Λ =/(*.: «.. аг aJ> Уп=/(хп:«,. й,. ··.·.««)■ Однако на практике, ввиду отсутствия указанных обстоятельств, система (2) обычно является несовместной, т. е. значения at (i=l, 2, ..., т), найденные из некоторых т уравнений системы (2), не удовлетворяют остальным η — т уравнениям. Для приближенного решения системы (2) поступают следующим образом: каким-либо способом (например, графически или путем решения выбранных т уравнений системы (2)) находят грубые значения параметров а[0>, а^ а£?. Пусть «,· = «ί0) + α< (*=1.2, ....да), (3) (2)
§ 12] ОБЩИЙ МЕТОД ОПРЕДЕЛЕНИЯ ПАРАМЕТРОВ 119 где а,-—поправки, которые считаются «малыми», и $>= у,-}[*,; яГ, 40) & (/=1, 2, ..., п) — соответствующие невязки. Подставляя значения (3) в уравнения системы (2) и разлагая правые части полученных уравнений по степеням поправок а;, удерживая лишь члены первого порядка относительно этих поправок, будем иметь у,=/(х,; аУ, а?, ..., в<?) + (/'=1,2 η). Вводя сокращенные обозначения /" {χ,; а<°>, aW, ..., α''Ά = &,,, (у'=1, 2, ..., л; 6 = 1,2, ..., от), находим к —ι (у=1, 2, ...,л). Система (4) линейна относительно неизвестных поправок <j.k(k= 1, 2, ..., т) и является, вообще говоря, несовместной, так как число уравнений ее больше числа неизвестных. Уравнения системы (4) называются условными, а сама система — системой условных уравнений. Система условных уравнений (4) может быть «решена», в известном смысле, описанным выше методом средних (§ 7) или методом наименьших квадратов (§ 8). Подставляя в нелинейную систему (2) найденные значения ai,) = aW + ai ('=1, 2, ..., от), можно определить новые невязки s(l) и в случае необходимости повторить процесс. Пример 1. Результаты эксперимента характеризуются следующей таблицей [11]: X V 0 2,01 1 1,21 2 0,74 .5 0,4.=)
120 ЭМПИРИЧЕСКИЕ ФОРМУЛЫ Предполагая, что переменные χ и у подчиняются показательной зависимости у=.ае'ь\ (5) определить наилучшие значения параметров а к Ь. Решение. Подставляя табличные данные в формулу (5), получим систему я = 2,01; а<?-*=1,21; ае-2*=:0,74 ае~"ь=0,АЪ. (6) Решая,,, например, первые два уравнения этой системы, будем иметь грубые значения параметров а<0>=:2,01; 6(0)=0,51. Для нахождения поправок α = α— (Г ■Ьт составим систему условных уравнений (4). Соответствующие значения производных db L (0) ■ Ь X и невязок (0) £<°'=_у — ате-ь * помещены в таблице 27. Таблица 27 Коэффициенты условных уравнений X 0 1 2 3 т. 1 0,600 0,361 0,216 (*). 0 — 1,206 —1,451 —1,302 *<»> 0 0,004 0,014 0,016 Отсюда получаем систему условных уравнений 0,600α—1,206β = 0,004; 0,361а— 1,45ΐβ = 0,014; 0,216а— 1,302р = 0,016. (7)
§12] ОБЩИЙ МЕТОД ОПРЕДЕЛЕНИЯ ПАРАМЕТРОВ 121 Для решения системы (7) применим метод наименьших квадратов. Промежуточные вычисления приведены в таблице 28, где с„ и с8 обозначают коэффициенты при α и β в системе (7) и с0— соответствующие свободные члены. Таблица 28 Решение системы (7) методом наименьших квадратов с« 1 0,600 0,361 0,216 Σ <Р 0 —1,206 —1,451 — 1,302 ίο 0 0,004 0,014 0,016 Ί 1 0,3600 0,1303 0,0467 1,5370 « Ρ 0 —0,7236 —0,5238 —0,2812 —1,5286 '? 0 1,4544 2,1054 1,6952 5,2550 V° 0 0,00240 0,00505 0,00345 0,01090 Υ' 0 —0,00482 —0,02031 —0,02083 —0,04596 Следовательно, нормальная система уравнений имеет вид 1,5370α —1,5286β = 0,01090; I — 1,5286а+ 5,25500 = — 0,04596. / Решив эту систему, найдем α = — 0,004; β =—0,009. Отсюда получаем исправленные значения параметров а = 2,01—0,004 = 2,006; 6 = 0,51—0,009 = 0,501. Таким образом, искомая эмпирическая формула есть _у = 2,006<Г°.50Ч (8) В таблице 29 приведено сравнение результатов, даваемых эмпирической формулой (8), с табличными данными. Таблица 29 Сравнение значений эмпирической формулы (8) с табличными данными X 0 1 2 3 У 2,01 1,21 0,74 0,45 У 2,006 1.215 0,736 0,446 • ==у-у 0,004 —0,005 0,004 0,004 ε' 1,6-10~5 2,5-Ю"5 1.6-10~5 1,6-Ю-5 2ε/ = 7,3·10-5
122 ЭМПИРИЧЕСКИЕ ФОРМУЛЫ [гл. и Заметим, что с помощью логарифмирования формулы (5) легко получить эквивалентную формулу, линейно зависящую от подходящих параметров. Пример 2. Для переменных χ и у, значения которых заданы следующей таблицей: χ 0 У 2,05 0,2 1,944 0,6 1,638 1,2 0,907 1,6 0,423 2 0,028 (9) (10) установлена эмпирическая зависимость у = есх (a sin χ -\- Ь cos x). Определить значения параметров a, b и с в формуле (9). Решение. Подставив в эмпирическую формулу (9) данные значения [xit _у;), получим следующую систему уравнений: 2,05 = Ь; 1,944 = е"'гс (0,1987а -f 0,9801 b); 1,638 = е0·"'(0,5646а -f 0,82536); 0,907 =е1·2'(0,9320а -\-0,ЗШЬ); 0,423 = е1 'вс(0,9996а — 0,02926); 0,028 = егс (0,9090а —0,41696). Решая приближенно, например, первые три уравнения системы (10), найдем а„=1; 60 = 2,05; с0 = —0,495. я = а04-а, *=*.+?. с = со + Y- Для определения поправок α, ρ и γ составим линейную систему условных уравнений (4). Значения производных Положим = ес°* sin x; ή+) =eVcos*; ду дЬ дс J „ = хес<>х (а0 sin χ -\-Ь0 cos x) и невязок е(0) =у — есох (а0 sin χ -j- b0 cos x) помещены в таблице 30.
§ 12) ОБЩИЙ МЕТОД ОПРЕДЕЛЕНИЯ ПАРАМЕТРОВ 123 Таблица 30 Коэффициенты условных уравнений X 0 0,2 0,6 1,2 1,6 2 (Ч 0 0,1795 0,4183 0,5167 0,4536 0,3378 (S). 1 0,0886 0,6114 0,2009 —0,0132 —0,1549 («). 0 0,3992 1,0030 1,1141 0,6832 0,0404 £<0) 0 —0,0540 —0,0336 —0,0214 —0,0034 —0,0072 Отсюда система уравнений для поправок имеет вид 0,1795а -f 0,0886β -\- 0,3992γ = — 0,0540 0,4183а-j-0,61 Ηβ-j- 1,0030γ = —0,0336 0,5167а-f 0,2009(3 4-1Л141у=—0,0214; 0,4536а— 0,0132β -4- 0,6823γ = — 0,0034 0,3378а — 0,1549β -j- 0,0404γ = — 0,0072 (Π) Решение системы (11) будем искать методом средних.. Группируя по два уравнения системы, получим 0,1795а -f 1,0886β -j- 0,3992γ = — 0,0540; \ 0,9350α-|-0,8123β4-2,Π71γ = —0,0550; Ι ^ 0,7914α — 0,1681^ -j- 0,7227γ = — 0,0106. j Решая обычным методом систему (12), находим α = —0,0266; β == — 0,0466; γ = 0,0036. Следовательно, а=\ —0,0266 = 0,9734; Ь = 2,05 — 0,0466 = 2,0034; с = —0,495 4-0,0036 = —0,4914. Таким образом, искомая эмпирическая формула имеет вид у = е-».*·"* (0,9734 sin χ -\- 2,0034 cos x). (13) В таблице 31 даны расхождения между значениями функции у, найденными по эмпирической формуле (13), и табличными значениями у.
124 ЭМПИРИЧЕСКИЕ ФОРМУЛЫ [гл. и Замечание. Если значения yt в системе (2) получены в результате измерений, то следует позаботиться, чтобы эти значения были Таблица 31 Характеристика точности эмпирической формулы (13) X 0 0,2 0,6 1,2 1,6 2 У 2,050 1,944 1,638 0,907 0,423 0,028 У 2,003 1,960 1,640 0,906 0,417 0,019 &—У— у 0,047 —0,016 —0,002 0,001 0,006 0,007 равноточными. В противном случае необходимо ввести соответствующие веса [11]. Литература ко второй главе [1] К. А. Семендяев, Эмпирические формулы, ГТТИ, М. (1933). [2] А. К. Успенский, Выбор вида и нахождение параметров эмпирической формулы, М. (I960). [3] А. Уорсинг и Дж. Геффенер, Методы обработки экспериментальных данных, ИЛ, М. (1949). [4] Э. Уиттекер и Г. Робинсон, Математическая обработка результатов наблюдений, ГТТИ, Л.—М. (1933). [5] Дж. С к а р б о ρ о, Численные методы математического анализа, ГТТИ, М.—Л. (1934), гл. XVI. [6] Л. С. Блох, Основные графические методы обработки опытных данных, Машгиз (1951). [7] М. Л. Ц у к ерм а н, Эмпирические формулы, М. (1932). [8] С. Α. Τ у м а р к и н, Об опенке ошибок в методе средних, Труды ЦАГИ, вып. 198 (1935). [9) М. П. К ρ ы ж а н о в с к а я, Эмпирические формулы и основы номографии, Л. (1949), § 8. [10] С. В. Фролов, Приближенные вычисления, М. (1948), изд. МВТУ, гл. 111. [11] И. С. Б ере зин, Н. П. Жидков, Методы вычислений, Физматгиз, М. (1959), т. I, гл. V. [12) Л. М. Б а т у н е ρ, Μ. Ε. Π о з и и, Математические методы в химической технике, Госхимиздат (1953), гл. XII. [13) К. П. Яковлев, Математическая обработка результатов измерений, ГТТИ (1933). [14] А. Виньерон, Обработка результатов физико-химических наблюдений, ОНТИ (1936). [15] Б. П. Д е м и д о в и ч, И. А. Марон, Основы вычислительной математики, Физматгиз, М. (I960), гл. XIV, § 18.
ГЛАВА ili ПРИБЛИЖЕННОЕ РЕШЕНИЕ ОБЫКНОВЕННЫХ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ § 1. Общие замечания Простейшим обыкновенным дифференциальным уравнением [1], [2], [3], [4], [5] является уравнение 1-го порядка у'=/(х,у)· (1) Основная задача, относящаяся к этому уравнению, есть задача Коши: найти решение уравнения (1) у=:у(х), (2) -у0; иными словами, удовлетворяющее начальному условию у (х0 требуется найти интегральную кривую у=у(х), проходящую через заданную точку М0{х0, у0) (рис. 21). Если правая часть f(x,y) непрерывна в некоторой области R, определяемый неравенствами \χ—χο\<α· \y—y„\<b, то существует по меньшей мере одно решение (2), определенное в окрестности |χ — x0\<^h, где h — положительное число. Это решение единственно, если в R выполнено условие Липшица \/(x,y)—f(x,y)\^N\y—y\, (3) где N—некоторая постоянная (константа Липшица), зависящая, в общем случае, от a и£. Если /(х, у) имеет ограниченную производную Рис. ϋΐ.
126 РЕШЕНИЕ ОБЫКНОВЕННЫХ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ [ГЛ. 1ц /у (Х> У) В Я, Т0 МОЖНО ПОЛОЖИТЬ yv=max|/y(x, у)\ при (x,y)£R. Для дифференциального уравнения я-го порядка /"=/(*. у,/ /""") задача Коши состоит в нахождении решения у =у (х), удовлетворяющего начальным условиям У{хо)=У·'· У'(хо)=У'0, ..с-ч (\)=/: (»- о. где хс, _у0, _у^, ... , у(0"-1>— заданные числа. Пример 1. Дифференциальные уравнения свободных колебаний маятника в сопротивляющейся среде [6], [7). Пусть θ—угол отклонения (рис. 22), t — время. Предполагая, что сопротивление среды R пропорционально скорости, получаем для θ = β(ί) нелинейное дифференциальное уравнение второго порядка ds@ . d& , , . α = 0, (4) где β и Ь—положительные постоянные. Начальные условия имеют вид θ(ί,) = θ0; θ(ί0) = θ„ где Рис. 22. θ = d%_ dt т. е. в начальный момент t = ta задаются: 1) начальное отклонение θ0; 2) начальная угловая скорость θ0. В приложениях часто встречаются системы обыкновенных дифференциальных уравнений. Ограничимся рассмотрением нормальной системы я-го порядка обыкновенных дифференциальных уравнений: 4&-ΛΙ*.* 4уг dx 3Ί. Λ (χ> Ул' Уг> . Уп). - у»). dy ■У η dx -■/η(χ, У ν Λ. - Уп)> Уп (5) ■ искомые функции. где χ — независимая переменная, ylt уг, . Систему, содержащую производные высших порядков и разрешенную относительно старших производных искомых функций, путем
§ и ОБЩИЕ ЗАМЕЧАНИЯ 127 введения новых неизвестных функций можно привести к виду (5). В частности, для дифференциального уравнения /z-го порядка /"'=/(*, у, у', „(Ι" Μ ), полагая, У>=У > У*=У , ■■· > Уп-х^У будем иметь эквивалентную нормальную систему dy_ = dx -У" dx y" с-ч fyn-* dx dx Ув-i. Л*. У, yv ·· . Уп-ι)· Воспользовавшись векторными обозначениями - ауГ\ Ух dx У Ljn 1У = lie dy„ L_ dx _| =/(*. У), (8) систему уравнений (5) можно записать более просто: dy__ dx Г Л где /— . — заданная век- Uη тор-функция. Под решением системы (5) понимается любая совокупность функций "Уг ί-Уп (9) Рис. 23. (6) (7) где ^1=φ,(χ) уп = ψη (χ), которая, будучи подставлена в уравнения (5), обращает их в тождества. Геометрически каждое решение (9) представляет собой некоторую линию L (интегральная кривая в пространстве Еп + 1 — {х, у,, ... , уп\ (рис. 23), а совокупность всех решений образует поле интегральных кривых.
128 РЕШЕНИЕ ОБЫКНОВЕННЫХ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ [ГЛ. [II Так как система дифференциальных уравнений имеет бесчисленное множество решений, то для выделения одного конкретного решения у=у(х), кроме уравнения, нужны дополнительные условия. В простейшем случае задаются начальные условия У(х<,)=У(°\ (Ю) что приводит к задаче Коши. Задача Коши. Найти решение У =У (х) системы (5), или соответствующего векторного уравнения (8), удовлетворяющее заданным начальным условиям (10), где ха— фиксированное значение независимой переменной и у°> — : — данная система чисел. Геометрически это значит, что требуется отыскать интегральную кривую L, проходящую через заданную точку /И0 (хй, у<-°\ ... , у^~>) пространства Еп+1 (рис. 23). Если χ интерпретировать как время, а у,, ... , уп — как обобщенные координаты некоторой механической системы, то получим следующий аспект задачи Коши: зная дифференциальные уравнения, управляющие механической системой, а также состояние ее в начальный момент времени х0, определить состояние системы в любой момент времени х. Гарантия однозначной разрешимости задачи Коши дается приведенными ниже достаточными условиями. Теорема существования и единственности решения. Пусть в некоторой окрестности начальных значений, U{\x-x0\<a; j^-^K^, .... \ya-jft>\<b„\ система (5) обладает следующими свойствами: 1) правые части /,, /„...,/„ определены и непрерывны в U; 2) функции /ι (i= 1, 2, ... , η) в окрестности U удовлетворяют условиям Липшица по зависимым переменным у%, у2, ... , уп, т. е. \h (*. λ. · · ■ - У η) — ft (*. Уг У») К η ^ΝΣ \yj — yj\ («=1, 2, ... , η). (Π) /=1
§ Π ОБЩИЕ ЗАМЕЧАНИЯ 129 где (х, у„ . . . , уп) ζ U, (х, yv ... , ~уп) ζ U и N—некоторая постоянная (константа Липшица). В этом случае существует единственное решение системы (5) yl =yt (χ), ... , уп —уп (χ), определенное в некоторой окрестности \х— x„\<^h и удовлетворяющее заданным начальным условиям: Иными словами, при выполнении условий 1), 2) задача Коши разрешима и решение единственно, т. е. через точку М0 (ха, _у№, ... , yW) проходит единственная интегральная кривая системы (5). Заметим, что вместо условий Липшица достаточно потребовать наличия ограниченных производных Ml ду/ ('. У=1, 2, ... , п) в окрестности U, тогда за константу Липшица можно принять ./V—max Рассмотрим примеры некоторых систем дифференциальных уравнений. Пример 2. (Основная задача внешней баллистики). Приведем дифференциальные уравнения движения материальной точки (снаряда) в сопротивляющейся среде [8] (рис. 24). Пусть т—масса точки; х, у — текущие координаты точки в вертикальной плоскости Оху; t—время; <о — вектор скорости; θ — угол, образованный вектором-ско- рости с горизонтальной осью Ox; R — вектор сопротивления среды (направлен по касательной к траектории); g—ускорение силы тяжести. На основании второго закона Ньютона получаем дифференциальные уравнения движения d2x Рис. 24. т dt2 = — R cos θ, «sin β. d'y (12)
130 РЕШЕНИЕ ОБЫКНОВЕННЫХ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ [ГЛ. III Обычно предполагают [8], что величина силы сопротивления среды R=.mF{v)H(y), (13) где множитель F(v) зависит только от величины скорости г/ = |г>], а второй Η (у)— от высоты поднятия у. Функции F(v) и Η (у) задаются таблично, с учетом реальной обстановки. Подставляя выражение (13) в систему (12), после сокращения на т будем иметь d'x d(t=—H{y)F(ν) соа θ, d^-=-g-H(y)F[v)sme. (14) dt2 Чтобы привести систему (14) к нормальному виду (5), введем новые переменные u = v cos θ, ν cos θ, "Ι : V Sin θ, J которые представляют собой соответственно горизонтальную (u = vx) и вертикальную (w = vy) проекции скорости Ό. ■Вводя обозначение Q(V): F{v) и учитывая, что dx w=. dy_ dt вместо системы (14) получим нормальную систему четвертого порядка [8]: dx ■ = и, dt dy ~dT du dt dw ~dT ■■ w, = — H(y)G(v)u, = — g—H(y)Q(v)w, (15) где ν ==■ уиг -j- w . Если предположить, что снаряд был брошен в момент времени <=0 из точки О (0, 0) со скоростью, по величине равной г», и на-
§ И ОБЩИЕ ЗАМЕЧАНИЯ 131 (16) правленной под углом θ„ к горизонту, то начальные условия будут иметь вид χ (0) = 0, ^ ΐί(0)=νοζο$θ0, w(0) = v0 sin Θ0. Считая, что функции Н(у) и G(v) непрерывно дифференцируемы, легко убедиться, что задача Коши (15), (16) имеет единственное решение, т. е. начальные условия (16) однозначно определяют траекторию снаряда. В общем случае система (15) элементарно не интегрируется, тем более, что функции Η (у) и О (ν) носят эмпирический характер и задаются таблично. Поэтому систему (15) приходится решать численно. Обычно интересуются еще максимальной высотой поднятия снаряда и дальностью полета *» = *('.)■ Для нахождения этих величин нужно соответственно решить краевые задачи (см. гл. IV) т,(хг.уг.гг) y(t2) = 0. Пример 3. (Задача трех тел). Речь идет о дифференциальных уравнениях движения трех материальных тел, взаимодействующих между собой по закону всемирного тяготения Ньютона [9]. Пусть в пространстве Oxyz имеются три тела с массами т,, тг и тг (рис. 25) занимающие в момент времени *;> Λ·. ζί ('=1- 2, 3). Конкретной моделью нашей задачи система Земля — Луна — спутник. В механике доказывается [9], что для системы существует потенциальная функция т3(Хз,Уз'гз) m,(x,.yi.z,) Рис. 25. t соответственно положения может служить, mt\iz например, = 1, 2, 3) U- г. Отсюда, дифференциальные уравнения движения системы трех тел
132 РЕШЕНИЕ ОБЫКНОВЕННЫХ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ [ГЛ. Ш будут d'x/ dt2- d2yi dt2 d2zi dt* dU — dx,-' — дуГ __dU dt; (/=1, 2, 3). (17) ' ; Полагая dt —""<' dt —vi> ίΞΐ dt dt "'' dt будем иметь нормальную систему 18-го порядка: dx. dt '' dyi -*г- = v,. dt l' dZ; __ dt wi' m- 1 m- ι m, t dii,- dt duj ~dT dwj dt dU \ ~~ OX; ' dU — дуГ dU — dzt (i=l, 2, 3). (18) Начальные условия сводятся к заданию системы восемнадцати чисел *('. '■У! (0) vi(tu)=vf\ (/=1, 2, 3) (19) г,{Ц=гГ, w,(tt) ,Р — начальных положений тел и проекций их начальных скоростей. Решив задачу Коши (18), (19), получим законы движения тел в конечной форме: *, = ?,(*)■ >/ = Ф.-^. *( = &(*) (i= 1,2,3) и дополнительно законы изменения их скоростей: щ — UKt); г», = фаО; wi==y{t) (f=i, 2, 3). Даже для простейшего дифференциального уравнения 1-го порядка (1) нахождение решения, отвечающего заданным условиям, вообще невыполнимо с помощью конечного числа математических операций. Тем более это неосуществимо для системы дифференциальных уравнений. Указанное обстоятельство привело к созданию большого числа методов приближенного решения дифференциальных уравнений, основанных на самых различных идеях. Все эти методы в зависимости от формы, в которой они представляют решение, в основном можно разделить на три группы:
§ 2] РЕШЕНИЕ С ПОМОЩЬЮ СТЕПЕННЫХ РЯДОВ 133 1. Аналитические методы, дающие приближенное решение дифференциального уравнения в виде аналитического выражения. 2. Графические методы, дающие приближенное решение в виде графика. 3. Численные методы, дающие приближенное решение в виде таблицы. Следует отметить, что приведенная классификация методов приближенного интегрирования является в известной мере условной. Так, например, графический метод ломаных Эйлера дает одновременно способ численного решения дифференциального уравнения. При дальнейшем изложении будем предполагать, не оговаривая этого каждый раз, что для рассматриваемых дифференциальных уравнений выполнены обычные условия существования и единственности решений. Для применимости некоторых методов потребуются более жесткие условия, которые будут указаны в соответствующих местах. § 2. Интегрирование дифференциальных уравнений с помощью степенных рядов Рассмотрим сначала дифференциальное уравнение л-го порядка /">=/(*, у, /, ..., У"-1) (1) при начальных условиях: У(*.)=Л. /(*.)=>ά. ...,У""Ч*.)=3'?"4· (2) Предположим, что правая часть уравнения (1) является аналитической функцией в начальной точке ' (в - ·) *о> У о' Уо У о . т. е. в некоторой окрестности этой точки разлагается в степенной ряд вида /(*■ У, У, ...,/—>) = = Σ ^.....„(jc —*0)-(y-ya)" ■••О'1""1' —yi"~4)4 где а0, а,, ..., ап — целые неотрицательные числа и dotll ... „„— некоторые постоянные коэффициенты. Тогда, как известно [2], интеграл у = у(х) уравнения (1), отвечающий начальным условиям (2), является аналитическим в точке χ и, пользуясь рядом Тейлора, можно положить 00 k —О при \х — х01< h.
134 РЕШЕНИЕ ОБЫКНОВЕННЫХ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ [ГЛ. III Первые л-[-1 коэффициентов ряда (3) определяются непосредственно из начальных условий (2) и дифференциального уравнения (1). Для нахождения следующего (п-\-2)-го коэффициента -— " продифференцируем уравнение (1) по правилу дифференцирования сложной функции. В результате получим п-\ у дх "Г" L· ау<*> ' dx ' где для удобства принято у(0)=у· Отсюда * = 0 V где значок «О» означает, что значения соответствующих производных берутся в точке (х0, у0, уа, ..., У"~ ''). Повторяя этот прием таг за шагом, можно найти и дальнейшие производныеy{n+i) (х0), yn+S| (χ ), . .. [10], [11]. Что касается оценки радиуса сходимости h ряда (3), то этот вопрос более сложен [2], [11], поэтому рассматривать его здесь не будем. Заметим лишь, что если уравнение (1) линейное: УВ) = р,М + М*)>+М*)/+· ■■ + ?»(*)/""". где pk (χ) (6 = 0, 1, ..., η) — целые относительно х аналитические функции*), то можно положить /г—оо, т. е. в этом случае степенной ряд (3) сходится для любого значения [12], [13]. Пример 1. Написать несколько членов разложения в степенной ряд решения у=у{х) уравнения / + */+* = 0, (4) удовлетворяющего начальным условиям У(0) = 0; /(0)=1. Решение. Полагаем у (х)=у (O)-f-y' (0)* + £p** + . . ., где у(0) = 0 и /(0)=1. Из уравнения (4) получаем У" = -*У'-У- (5) *) Иначе говоря, эти функции разлагаются в степенные ряды с бесконечным радиусом сходимости; таковы, например, функции х2, ех, sinx, cos x и т. п.
§ 2) РЕШЕНИЕ С ПОМОЩЬЮ СТЕПЕННЫХ РЯДОВ 135 Отсюда /'(0)=— у(0) = 0. Дифференцируя последовательно уравнение (5), будем иметь у'" = — ху" — 2у'; _yV=__Jcyv_43('"; Из этих равенств вытекает, что у"'(0) = — 2.1==— 2; _yiv(0)=: —3-0 = 0; yV(0) = — 4- —2 = 8. Следовательно, у(*)=*-4+4+··· <б> Написать общий член ряда (6) и исследовать его сходимость не представляет больших затруднений. Пример 2. Зная дифференциальное уравнение движения точки [10]: g + (l-l-0>H)x + 0,l(-5-)1 = 0, (7) с помощью разложения решения в степенной ряд найти скорость х' и ускорение х" точки для моментов времени t, равных 0,1; 0,2; 0,3; 0,4; 0,5, если х(0)=1, *'(<)) = 2. Решение. Из уравнения (7) будем иметь х' = — х— 0,ltx — 0,\x'\ (8) Отсюда с помощью последовательного дифференцирования получим х"'= — х' — 0,\ [tx -\-х)—0,2х'х"; χιν = — χ" — 0,1 (tx"-\-2x') — 0,2(х'х'"-\-х"); χ" = — x"' — 0,l (tx'"-\-3x") — 0,2(x'x[V-\-3x"x'"); χνί = — χιν — 0,1 (txK -\- 4л;'") — 0,2 {x'x™ -f 4xVv-f Зх'"') и т. д. Полагая в этих равенствах ^ = 0 и используя начальные условия хо=1, х'0 = 2, находим /,==—1,4; *;" = —1,54; д;^ = 1,224; xgv = 0,1768; χ*1 = — 0,7308.
136 РЕШЕНИЕ ОБЫКНОВЕННЫХ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ [ГЛ. III Так как на основании ряда Тейлора / t* χ" t* + -ΐι-+-3Γ + Λτ + ·-- ^ то для искомого решения, с точностью до /°, получаем такое выражение: х = 1 -f 2/ — 0,7/2 — 0,2567** -\-0,05И4 + + 0,00147/' — 0,00101/". (10) Следовательно, jc' = 2 — 1,4ί — 0,77/2 +0,204/' + 0.00735/1 — 0,00606/' (Π) и χ" = — 1,4— 1,54/ + 0,612/2 + 0,00294/' — 0,0303/*. (12) В таблице 32 помещены значения х, х' и х" для /, равного 0; 0,1; 0,2; 0,3; 0,4; 0,5, подсчитанные соответственно по формулам (10), (11) и (12). Для контроля приведены значения х", полученные непосредственно из точного уравнения (8). Таблица 32 Вычисление значений решения χ дифференциального уравнения (7) и его производных х" и х" при помощи разложения в степенной ряд t 0 ОД 0,2 0,3 0,4 0,5 X 1,000 1,193 1,370 1,530 1,673 1,796 X' 2,000 1,852 1,692 1,517 1,330 1,137 X" —1,400 — 1,548 —1,683 — 1,806 -1,917 —2,015 -η Χ — 1,400 — 1,549 — 1,684 —1,806 —1,917 —2,015 χ»-χ" 0,000 +0,001 +0,001 0,000 0,000 0,000 Таким образом, видно, что при 0 < / s£| -=- формулы (10), (11) и (12) дают решение задачи, точное до третьего десятичного знака. При увеличении / точность этих формул будет, вообще говоря, убывать, и при больших / придется учитывать дополнительные члены ряда Тейлора [10]. Заметим, что формула (10) совершенно не пригодна для анализа устойчивости движения при /—► оо; для этой цели используют ряды иного вида.
§ 2] РЕШЕНИЕ С ПОМОЩЬЮ СТЕПЕННЫХ РЯДОВ 137 Вернемся к системам дифференциальных уравнений. Пусть искомая система функций УпЛ удовлетворяет системе дифференциальных уравнений dx =/(*, У) и начальным условиям где j»W-=y". (о) я /n0)j (13) (14) Предположим, что компоненты /, (г=1, 2, ... , я) правой части f(x, у) уравнения (13) являются аналитическими функциями в точке (ха, у?\ . .. , уп), т. е. в некоторой окрестности этой точки разлагаются в степенные ряды вида /t(*. Ух Ун) = 2 С&,...„(х-*,)«·(у,-y[°Y. ..(yn-/„V, где постоянные коэффициенты СЦ,... „„ могут быть определены по формуле 1 α0! α,Ι... ап\ Lax-d^...dy?/i(JC' У' Уп). (/=1, 2, ...,«). В таком случае решение уравнения (13), удовлетворяющее условиям (14), является аналитическим по χ и, следовательно, имеет вид ь (15) А=о *) Векторное равенство (15) означает, что каждая компонента вектора у(х) разлагается в соответствующий ряд Тейлора У Μ = Σ^^^-Χ^ ('=1,2 в). к—»
138 РЕШЕНИЕ ОБЫКНОВЕННЫХ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ [ГЛ. III где У(х,)=Ум и У (*„)=/(*„ У°>). (16) Для нахождения остальных коэффициентов разложения можно использовать последовательное дифференцирование уравнения (13) по правилу дифференцирования сложной функции йхг ϋχ~τ~ ду dx όχ~ι~Λ«' κ ' yh ду' где дЛдА . <3у, 0уг дАдЛ . ду, дуг <Эу, дуг ..дА. ду„ Of, " дуп Отсюда ду- У" (*.)=£(*"". y0))+/ii*., у-0))/к, У01)· Аналогично находятся дальнейшие производные У (я0) (&=3, 4, ...). Таким образом, получаем формальное построение ряда. Вопрос о сходимости этого ряда здесь оставим без рассмотрения. Заметим только, что в одном важном частном случае, если система (13) линейная % = Р(х)у + д(х). причем матрица Р(х) и вектор-функция q{x) состоят из целых функций относительно х, то соответствующий ряд (15) сходится для любого значения х. Пример 3. Для системы dx It — χ cos i — у sin (, -f- = χ sin t -i- у cos t (17) построить решение в форме степенного ряда, удовлетворяющее начальным условиям х(0)=1; у(0) = 0. Решение. Положим ;(0 = МО)+*ЧО) + ф*2· *"'(0) 31 ί·+. (18)
§ 2] РЕШЕНИЕ С ПОМОЩЬЮ СТЕПЕННЫХ РЯДОВ 139 и y(0==_v(o)+/(0)<V-¥i', + T<, + ·-· (19) Из начальных условий имеем х(0) = \; у(0) = 0. Полагая t = 0 в системе (17), получим *'(0)=1, /(0)=0. Дифференцируя по t систему (17), будем иметь -пг = —xsmf— у cos r 4-— cos г -£sini; dt2 ' ' dt dt —j = x cost — у sin t -J- -χ sin i -\- -~t cos t. (20) Отсюда x"(0)=l, /(0) = 1. Дифференцируя систему (20), получим at' : d'y ■ χ cos / —|— д; sin ^ —[— 2 f — sin < — ■£ cos t) -f- i rf2* ^ d'y . . J = _*sIn*-jrcosf + 2(gcosf-!S!sin*) + +^s,ni+^cos'· Следовательно, x'"(0) = — 1-f 1=0, /"(0) = 3. Аналогичным путем могут быть найдены и дальнейшие производные. Используя формулы (18) и (19), окончательно имеем *(/) = ι+*+-!-*· + ... , 1 ι', ι . ^ Из формул (21) можно в окрестности начальной точки < = 0 приближенно найти численные значений искомого решения. Например: л: (0,1)= 1+0,1 +-j· 0,01 = 1,105; y{0,l) = j- 0,01 -4-^-0,001 =0,0055 и т. д.
140 РЕШЕНИЕ ОБЫКНОВЕННЫХ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ [ГЛ. III Метод разложения решения дифференциального уравнения в степенные ряды часто используется как элемент более практичных методов приближенного интегрирования дифференциальных уравнений. В частности, для некоторых численных методов интегрирования дифференциальных уравнений требуется определить значение искомых функций в нескольких точках. Эти значения при соблюдении известных условий гладкости данного уравнения могут быть с любой степенью точности подсчитаны с помощью степенных рядов. § 3. Метод последовательных приближений Сначала изложим этот метод применительно к дифференциальному уравнению первого порядка у'=/{х,у) 0) с начальным условием У(*.)=У.· (2) Предполагается, что в некоторой окрестности точки М0(х0, у0) уравнение (1) удовлетворяет условиям теоремы существования и единственности решения. Будем строить искомое решение у=у(х) для значений x>x0. Случай χ sg хь вполне аналогичен. Интегрируя правую и левую части уравнения (1) в пределах от х0 до х, получим χ У(х)~ У(х„)=^/{х, y)dx Χα или, в силу начального условия (2), будем иметь X У(х)=У. + ^/(х, У)а*· (3) Х0 Так как искомая функция у=у(х) находится под знаком интеграла, то уравнение (3) является интегральным. Очевидно, решение интегрального уравнения (3) удовлетворяет дифференциальному уравнению (1) и начальному условию (2). Для нахождения этого решения применим метод последовательных приближений. Заменяя в равенстве (3) неизвестную функцию у данным значением у0, получим первое приближение А Λ = Λ+ $/(*. y»)dx. х„
§ 3] МЕТОД ПОСЛЕДОВАТЕЛЬНЫХ ПРИБЛИЖЕНИЙ 141 Далее, подставив в равенстве (3) вместо неизвестной функции у найденную функцию yIt будем иметь второе приближение X Вообще, все дальнейшие приближения строятся по формуле χ Уп = Уо + $А*. Уп-г) dx (П=\,2,...). (4) Хо Геометрически последовательные приближения представляют собой кривые уп = уа(х) (и=1, 2, .. .)ι проходящие через общую точку К (*.. У о) (Рис 26). У 0 .. у Уо л Ό J УУ<х с а -~~-~~ -— ·— о+Ь i—■— Уп II- У/ У'Уо X Рис. 26. В учебниках по дифференциальным уравнениям [1], f2], [4] доказывается, что при выполнении условия Липшица \/(х,У)—/{х, y)\*ZN\y—y\ (5) последовательные приближения уп=уп(х) на некотором достаточно малом отрезке [х0, x0-\-h] имеют смысл и равномерно сходятся, причем предельная функция у (х) = lira yn (х) (6) п-юэ удовлетворяет дифференциальному уравнению (1) и начальному условию (2). Если правая часть f(x, у) дифференциального уравнения ^1) определена и непрерывна в области #{0<х — x,^a, Ijf — 3Ό
142 РЕШЕНИЕ ОБЫКНОВЕННЫХ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ [ГЛ. Ill М^тах\/(х, у)\ при (х, у) ζ R, то за величину h можно принять [1] A = mln(a, ^ j , (7) причем интегральная кривая у = у (х) при ха ^ χ <: ха -j- h будет содержаться в угле между прямыми (рис. 27): и У=Уо — М(х — х0). Для оценки погрешности в„ (*)=!>(*) — Уп(х)\ из формулы (3) вычтем формулу (4), тогда будем иметь X у (χ) — y„W=Sr/(*.y)— Рис· 27· —/(*, Уп-,)]· Отсюда, при х0 ==£ χ ^ л:0 -j- h, получим X Χα В силу условия Липшица (5), находим |/(*. У)—/(х, У»-,)1<^|у(дс)— ^„М^Л/е^Д*). Следовательно, ев(*)< J Λ&Β_,(*)*/* (я=1, 2, ...), (8) где введено обозначение в.МНуМ— 3Ό|· Применяя формулу Лагранжа при х0 ==£ χ < χα -\- h, будем иметь в, W = \У (*) — J» (*.) 1 = (* — *,) | У' (S) |, где x0<S<x.
§ 31 МЕТОД ПОСЛЕДОВАТЕЛЬНЫХ ПРИБЛИЖЕНИЙ 143 Отсюда, так как \у' (ζ)) ^ (/(£, у (ζ)) | < М, получим s0(jc)</W(jc — *„)■ Далее, используя формулу (8), последовательно находим ε, (*)< Ν С ε0 (л)dx < NM С (χ — x0) rfx = ΛίΛ/(χ ~*o)' ; Xo xo X X s2 (jc) < /V С ε, (λ;) dx < ΛίΛ/* Г(х ~*ο)8 rfx = MN*(x ~Χο)' и т. д. В итоге окончательно получим Β,^Χ^ΛΓ^"^1 (я = 0, 1, 2, ...)· (9) Из формулы (9) вытекает, что вп(х)—>·0 при η—>-оо равномерно на отрезке [ха, x0-\-h\. Замечание. При методе последовательных приближений в качестве начального приближения у0, вообще говоря, можно выбирать любую функцию, достаточно близкую к точному решению у. Например, иногда выгодно в качестве у0 брать конечный отрезок ряда Тейлора искомого решения. Заметим, что при пользовании методом последовательных приближений аналитичность правой части дифференциального уравнения не обязательна, поэтому метод этот можно применять и в тех случаях, когда разложение решения дифференциального уравнения в степенной ряд невозможно. Пример 1. Методом последовательных приближений найти приближенное решение дифференциального уравнения у'=Х— у, (10) удовлетворяющее начальному условию у(0)=1. Решение. В качестве начального приближения возьмем у0 (х) = 1. Так как О то будем иметь X
144 РЕШЕНИЕ ОБЫКНОВЕННЫХ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ [ГЛ. III Аналогично л=1 + J (jc-1-fx-^dx = !—*+*■-£ 6 Подобным же образом получим X3 Х^ Х^ и т. д. Оценим погрешность, например, четвертого приближения yt = yl (х)· Рассмотрим некоторую область #{0<х<а, \у\^Ь\, где правая часть дифференциального уравнения (10) f(x,y) = x—y (11) определена и непрерывна. Так как функция (11) непрерывна во всей плоскости Оху, то за а и Ъ могут быть взяты любые положительные числа. При (х, y)£R имеем \/(х, jr) I *£ | * — j> | < | * | -Η jr | < α + &== Λί. Поэтому, предполагая α 2= 1, из формулы (7) получаем /, = min (α,£) = min („,-*_) = _*_. Выбрав для определенности а=. 1 и &= 1, будем иметь Константа Липшица для области R в данном случае будет N = max | /у (л, у) | = 1. Используя формулу (9) при 0 <: χ sg -=- , окончательно получим е4(*) = Ь(*)-л(*)1<2"14-^=ё и, следовательно, 8«=тахе.^<та==шо·
§ 3) ' МЕТОД ПОСЛЕДОВАТЕЛЬНЫХ ПРИБЛИЖЕНИЙ 145 Заметим, что дифференциальное уравнение (10) — линейное, с постоянными коэффициентами, и поэтому точное решение, удовлетворяющее заданному начальному условию, может быть найдено элементарно. В частности, для этого можно использовать метод последовательных приближений. Нетрудно видеть, что (« = 3,4,5,...) и, следовательно, y= lim уп=\ — χΑΓΊ[ε-χ — (1 — χ)] = 2е~х — (1 —χ), причем сходимость равномерна на любом отрезке [0, а]. Нетрудно также развить метод последовательных приближений для системы дифференциальных уравнений "£ = /{*. У)> (12) где У(*.)=У,- (13) Записывая векторное уравнение (12) в интегральной форме, будем иметь ^=Λ+$/(*. Ж*. (14) где под интегралом от вектор-функции понимается вектор Гх -] J/, dx Xq \fdx = l_*o If*** Последовательные приближения у(Р' (p= 1, 2, ...) определяются по формуле ?»=y, + lf&'?p~l,)dx' (15)
146 РЕШЕНИЕ ОБЫКНОВЕННЫХ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ [ГЛ. III причем обычно полагают Этот метод годится также для дифференциального уравнения «-го порядка, если его записать в виде системы. Пример 2. Построить несколько последовательных приближений для решения системы £1=*+j',)'.. I Ό* — хг — υ2 [ dx~X Уи J удовлетворяющего начальным условиям yl(0)=ii л(0) = о: Решение. Имеем: Отсюда, полагая получаем yi=iJrUx+yiyJdx'· о X У2=^ (x*—yl)dx. -,(«) _ I v(») _ О о χ уУ= Γ (λ;*— \)dx = — x-\-^\ 0 ^ = i+J[* + (i + i)(-*+i)]^=i-a + s·· о X y™=l[x'-(x*x%+i;)]dx=-x-i> 0 и т. д. § 4. Метод численного интегрирования Последовательные приближения находятся при помощи квадратур. Может случиться, что эти квадратуры не выражаются в элементарных функциях. В таком случае приходится прибегать к приближенным методам интегрирования.
§ 4) МЕТОД ЧИСЛЕННОГО ИНТЕГРИРОВАНИЯ 147 Приведем один из приемов (14) численного нахождения последовательных приближений для решения уравнения /=/(*. J) (1) при начальном условии у (х0) =у0. Пусть Xi = х0 -(- ih (г = 0, 1, 2, ..., т) — равноотстоящие значения аргумента χ с некоторым шагом h и У; = У(*;). y'i=f{Xi,yi)· Из уравнения (1) имеем У; — Уь=\у' dx = h\y'dq, (2) где Отсюда, применяя одну из квадратурных формул, приближенно получим /л yt-y.=^A<Pyj· w /=» Коэффициенты Д'' обычно определяются из того условия, чтобы формула (3) являлась точной для всех целых полиномов степени не выше /я-j-l. Для этого необходимо и достаточно, чтобы эта формула была справедливой для функций у = х, х\ ...,хт, хт+1 при выборе точек xt = 0, h, 2/г, . .., /и/г. Подставляя эти значения в формулу (3), получим для определения т-\-\ неизвестных Αψ (у=0, 1, 2, ..., т), при каждом фиксированном ί (г = 1, 2, .. .), систему т-]-\ уравнений т ik = kYiAf/k-,) (6 = 1,2 /и-Η)! (4) причем
148 РЕШЕНИЕ ОБЫКНОВЕННЫХ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ [ГЛ. III Например, при т=4, используя указанный прием, получаем следующие формулы: у> — у-=т(25 ху'· + 646у> — 264^« +1 06у'> — 19А '720 л - у.=ε (27у·+! 02/«+72^+42^ -3 А У. - Уо = S (7* + 32* + 12* + 32у'3 + 7у[). (5) '90 Если у ς С<7> [х0, jcJ, то соответствующие остаточные члены будут равны [14]; _3_ 160' -8 945 Я.-шАУЧЕ,), *4 = WAV'4E4), ^=4ау'(6,). 160 _1_ "90' ^. = ffiAV,4Si), где *(€(*.,*.) (/=1,2,3,4).' Для вычисления значений последовательных приближений у<р*(р = = 1,2, ...) положим т , #t0-л=AΣ■/^УV^ (6) где (/5=1,2, ...), Λ''1— коэффициенты, определяемые из системы (4), причем ут — известное начальное приближение; в частности, можно принять Ут = У«- Пример 1. Численно найти несколько приближений решения уравнения [14] у = sin л;-|-cos у, У(0) = 0. (7) Решение. Точное вычисление последовательных приближений у'"' (я= 1,2, ...) приводит к неберущимся квадратурам. Поэтому для нахождения приближений применим численный метод.
§ 41 МЕТОД ЧИСЛЕННОГО ИНТЕГРИРОВАНИЯ 149 Выберем шаг А = 0,2 и, пользуясь формулой (6), определим значения последовательных приближений у(т (л= 1, 2, 3, 4, 5), например, в пяти точках (от = 4): х = 0; 0,2; 0,4; 0,6; 0,8. За начальное приближение примем ут=у(0)+ху'(0) = х. Отсюда _у/( = sin χ(· -\- cos x-t. Используя этот результат, по формулам (6), где коэффициенты Доберутся из формул (5), находим значения у^ первого приближения и, следовательно, получаем yt = sin χ,--)-cos .у} . Этот процесс повторяем нужное число раз. Результаты вычислений приведены в таблице 33. Можно принять ν (х) = ys (х) с точностью до 10~5 (за исключением χ = 0,8). В случае необходимости таблицу можно продолжить, приняв последнюю строку приближения ys (x) за первую строку новой таблицы и так далее. Следует отметить, что лучшую сходимость процесса численных приближений получим, если вместо формул (3) будем пользоваться центральными симметричными формулами, которые определяют значения последовательных приближений в точках, лежащих симметрично по обе стороны от начальной точки. Для системы пяти равноотстоящих точек эти формулы имеют вид [14]: У-,-Л = -4(-19/_,+ 346/_1 + + 456/.-74,; + ВД + 11^: (8) >''->'^4(11>''-2-74>''-.+454' + 346>,;-19^ + ^J^; Λ-Λ = έ(-/-, + 4/_, + 24χ+124/1 + 29^) + 1^ϋ»1
150 РЕШЕНИЕ ОБЫКНОВЕННЫХ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ [ГЛ. III Таблица 33 Численное нахождение последовательных приближений интеграла дифференциального уравнения (7) X 0 0,2 0,4 0,6 0,8 0 0,2 0,4 0,6 0,8 0 0,2 0,4 0,6 0,8 0 0,2 0,4 0,6 0,8 0 0,2 0,4 0,6 0,8 0 0,2 0,4 0,6 0,8 У 0 0,2 0,4 0,6 0,8 0 0,21860 0,46836 0,73931 1,02065 0 0,21839 0,46538 0,72538 0,98108 0 0,21840 0,46547 0,72636 0,98596 0 0,21840 0,46547 0,72631 0,98552 0 0,21840 0,46547 0,72631 0,98555 Sill X 0 0,19867 0,38942 0,56464 0,71736 0 0,19867 0,38942 0,56464 0,71736 0 0,19867 0,38942 0,56464 0,71736 0 0,19867 0,38942 0,56464 0,71736 0 0,19867 0,38942 0,56464 0,71736 cos ;/ 1 0,98007 0,92106 0,82534 0,69671 1 0,97620 0,89231 0,73893 0,52281 1 0,97625 0,89365 0,74825 0,55612 1 0,97625 0,89361 0,74760 0,55206 1 0,97625 0,89361 0,74763 0,55243 у' 1 1,17874 1,31048 1,38998 1,41407 1 1,17487 1,28173 1,30357 1,24017 1 1,17492 1,28307 1,31289 1,27348 1 1,17492 1,28303 1,31224 1,26942 1 1,17492 1,28303 1,31227 1,26979 1 1,17492 1,28303 1,31227 1,26976 Приближение Уо(х) ΛΜ УгМ У>(х) У*{х) Уй(х) где h = xi+l — Xj π значения производных yw берутся в некоторых промежуточных точках, причем предполагается, что у ζ О" [x_s, хг]. Пример 2. Проинтегрировать на отрезке [—1,2; —0,8] уравнение [14] у' = хг — f при начальном условии Я—i) = o.
§ 4) МЕТОД ЧИСЛЕННОГО ИНТЕГРИРОВАНИЯ 151 Решение. Используем метод последовательных приближений. Положим _у0 = 0, тогда — I X Λ= J [ί·—!■(<■ +2ί'+1)] Λ = — 1 ==у^(33 —14λ; + 42λ·3— 7λ:4 —2α-7); Χ *·= Ι [''-15^(33 - 14< + 42<·-7ί«-»')«] Λ = ~ 1 = 261g540 (724780 — 179685л; -f- 76230л:2 -f- 862400ла — — 114345л:4 -f 54054х5 — 5390xc — 41580л:' — 14850л;8 — — 1925л:9+ 2520Х11 — ЗЗол:'2 — 44л:'3). Отсюда видно, к каким громоздким вычислениям может привести метод последовательных приближений. Заметим кстати, что четвертое приближение ух выразится полиномом 31-й степени, а уъ — полиномом 63-й степени. Для упрощения вычислений применим процесс численного нахождения приближений, вполне аналогичный разобранному выше, используя для этого формулы (8). За начальное приближение примем у°'=л; + 1. Результаты вычислений приведены в таблице 34. Таблица 34 Численное нахождение последовательных приближений интеграла дифференциального уравнения с помощью центральных формул χ у — 1,2 —0,2 — 1,1 —0,1 — 1,0 0 —0,9 0,1 —0,8 0,2 У 1,40 1,20 1,00 0,80 0,60 Приближение 1-е приближение 2-е приближение X V I У Приближение 3-е приближение 4-е приближение -1,2 —1.1 — 1,0 -0,9 -0,8 —0,240 —0,110 0 0,090 0,160 1,3824 1,1979 1,0000 0,8019 0,6144 !-1,2 —1,1 '—1,0 ;—0,9 —0,8 — 1,2 !-1,1 -1,0 '—0,9 1—0,8 —0,23914 —0,10995 0 0,09005 0,16074 —0,23916 —0,10995 0 0,09005 0,16073 1,38281 1,19791 1,00000 0,80189 0,61416 1,38280 1,19791 1,00000 0,80189 0,61417
152 РЕШЕНИЕ ОБЫКНОВЕННЫХ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ [ГЛ. ill Мы видим, что 3-е и 4-е приближения совпадают между собой с точностью до 4-го десятичного знака. Указанный способ численного нахождения последовательных приближений решения дифференциального уравнения с использованием квадратурных формул является весьма эффективным для получения нескольких начальных значений искомого решения, необходимых для начала вычислений в ряде методов приближенного интегрирования (см. ниже). § 5. Метод Эйлера Пусть дано дифференциальное уравнение У=/(х,У) (П с начальным условием yi*.)=y.· Выбрав достаточно малый шаг h, построим систему равноотстоящих точек х, = х, + Ш (/ = 0,1,2,...)· (2) Искомую интегральную кривую у=у(х), проходящую через точку ^о (■*«> У о)' приближенно заменим (рис.28) ломаной MMlMt... [3], [4] с вершинами Mt(x{, ус) (/=0, 1,2,...), звенья которой Л11М1 t прямолинейны между прямыми x = xt, x = xi+l и имеют подъем *ί±χ:* =/(*/, Λ) (3) (так называемая ломаная Эйлера). Таким образом, звенья ΜίΜί+Λ ломаной Эйлера в каждой вершине М( имеют направление, совпадающее с направлением
§ 5] МЕТОД ЭЙЛЕРА 153 у\ = f (хι, Уi) интегральной кривой уравнения (1), проходящей через точку М;. Из формулы (3) вытекает, что значения yt могут быть определены {метод Эйлера) по формулам ^yί = hf(xί<yi) (/ = 0,1,2,...)· (4) Для геометрического построения ломаной Эйлера выберем полюс Р(— 1,0) и на оси ординат отложим отрезок ОА0 =/(xo, ус) (рис. 28). Очевидно, угловой коэффициент луча РА0 будет равен f(x0, y0)', поэтому, чтобы получить первое звено ломаной Эйлера, достаточно из точки Λί0 провести прямую Λί0Λί,, параллельную лучу РД0, до пересечения с прямой х=хг в некоторой точке Мл (xt, _y,). Приняв точку Λί, (xt, у,) за исходную, откладываем на оси ординат отрезок ОД, =/(л;1, у,) и через точку Μί проводим прямую Λί,Λί^ΙΟ/Ι, до пересечения в точке Мг с прямой х = хг и т. д. Метод Эйлера является простейшим численным методом интегрирования дифференциального уравнения. Недостатки его: 1) малая точность; 2) систематическое накопление ошибок. Можно доказать [1], что если правая часть /{х, у) уравнения (1) непрерывна, то последовательность ломаных Эйлера при h—>-0 на достаточно малом отрезке [х0, х0 -\- Н\ равномерно стремится к искомой интегральной кривой у=у(х). Метод Эйлера легко распространяется на системы дифференциальных уравнений. Пример. Применяя метод Эйлера, составить на отрезке [0,1] таблицу значений интеграла дифференциального уравнения /=f. (5) удовлетворяющего начальному условию у (0)== 1, выбрав mar h = 0,1. Решение. Результаты вычислений приведены в таблице 35. Для сравнения в последнем столбце помещены значения точного решения
154 РЕШЕНИЕ ОБЫКНОВЕННЫХ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ [ГЛ. Ill Из приведенной таблицы видно, что абсолютная погрешность значения _у10 составляет ε10 = 0,0361. Отсюда относительная погрешность примерно равна 3°/0. Для сравнения приводим график точного решения (выделенный жирной линией) и соответствующую ломаную Эйлера М0М1Мг. . . (рис. 29). Метод Эйлера, вообще говоря, обладает малой точностью и дает сравнительно удовлетворительные результаты (в смысле погрешности) лишь при малых значениях h. Это обстоятельство понятно, так как по существу метод Эйлера заключается в том, что интеграл дифференциального уравнения (1) на каждом частичном отрезке \xit ■£, + ,] представляется двумя членами ряда Тейлора y(xi-\-h) = y(xi)+hy,(xi) (/ = 0, 1,2,...), т. е. для этого отрезка имеется погрешность порядка /гг. Таблица 35 Интегрирование дифференциального уравнения (5) методом Эйлера i 0 1 2 3 4 5 6 7 8 9 10 X 0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 У 1 1 1,005 1,0151 1,0303 1,0509 1,0772 1,1095 1,1483 1,1942 1,2479 /(*,y) = f 0 0,05 0,1005 0,1523 0,2067 0,2627 0,3232 0,3883 0,4593 0,5374 iy — 0,1/1.x, У) 0 0,005 0,0101 0,0152 0,0206 0,0263 0,0323 0,0388 0,0459 0,0537 Точное значение у — е 4 1 1,0025 1,0100 1,0227 1,0408 1,0645 1,0942 1,1303 1,1735 1,2244 1,2840 Кроме того, при вычислении значений на следующем отрезке исходные данные не являются точными и содержат погрешности, зависящие от неточности предшествующих вычислений. В следующем параграфе будут рассмотрены некоторые приемы уточнения метода Эйлера. § 6. Модификации метода Эйлера Рассмотрим снова дифференциальное уравнение с начальным условием У(х,)=У,- (2)
§ 6] модификлции мнтодл Эйлера 155 Выбрав таг h, положим *, = *, +/А (/ = 0,1.2,...)· Согласно методу Эйлера последовательные значения искомого решения вычисляются по приближенной формуле У1 + 1=Л + АЛ. (3) где Более точным является усовершенствованный метод л о м а- Рис. 30. ных [18], при котором сначала вычисляют промежуточные значения _ , Λ '2 и находят значение направления поля интегральных кривых в средней точке //+i.=/K+-L· У,+±>· а затем полагают Уи-1=У1+л/1+1_ (4) (рис. 30).
156 РЕШЕНИЕ ОБЫКНОВЕННЫХ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ [ГЛ. III Другой модификацией метода Эйлера является усовершенствованный метод Эйлера—Коши [18], при котором сначала определяется «грубое приближение» решения У и- 1=.У,- + A/i> исходя из которого находится направление поля интегральных кривых Λ·+. =/(*; + .> У их)· i 0 Si xt /~~S -* h ^ У Χι s Λ •ι <ι χ Затем приближенно полагают =Λ + Α" (5) Рис. 31. (рис. 31). Пример 1. Первым и вторым усовершенствованными методами Эйлера проинтегрировать уравнение у'=у —т· Я<» = 1 I6) на отрезке [0,1]. Решение. Примем шаг /г = 0,2 и f (х, у)=у — 2ху~1. Приближенные значения искомого решения y=zy(x)t определенные с помощью усовершенствованного метода ломаных (4), помещены в таблице 36. Таблица 36 Интегрирование дифференциального уравнения (6) усовершенствованным методом ломаных i 0 1 2 3 4 5 xi 0 0,2 0,4 0,6 0,8 1,0 h 1 1,1836 1,3426 1,4850 1,6152 1,7362 А/. 2 ' ο,ι 0,0846 0,0747 0,0677 0,0625 Х. 1 < + Т 0,1 0,3 0,5 0,7 0,9 У. ι 1+ — 2 1,1 1,2682 1,4173 1,5527 1,6777 f+ — 2 0,1836 0,1590 0,1424 0,1302 0,1210 В таблице 37 приведены результаты вычислений интеграла уравнения (6) усовершенствованным методом Эйлера — Коши, причем шаг сохранен прежний Л=0,2. Для сравнения приводим точное решение у = ]/2χ -]- 1, откуда у П)= 1/3=1,73205...
§ 6| МОДИФИКАЦИИ МЕТОДА ЭЙЛЕРА 157 Таблица 37 Интегрирование дифференциального уравнения (6) усовершенствованным методом Эйлера — Коши ί 0 1 2 3 4 5 xi 0 0,2 0,4 0,6 0,8 1,0 "ί 1 1,1867 1,3484 1,4938 1,6279 1,7542 h f τ7; 0,1 0,0850 0,0755 0,0690 0,0645 */+l 0,2 0,4 0,6 0,8 1,0 ''i + l 1,2 1,3566 1,4993 1,618 1,7569 A/. 2 l+l 0,0867 0,0767 0,0699 0,0651 0,0618 *, = γ </,+/, + ,> 0,1867 0,1617 0,1454 0,1341 0,1263 Усовершенствованный метод Эйлера — Коши можно еще более уточнить, применяя итерационную обработку |19J каждого значения yt. А именно, исходя из грубого приближения yi%l=y,+h/{,xl,yl), построим итерационный процесс ^.=Λ + 4ΐ/(*/,Λ)+/(*/ + Ι, У*-0)] (* = 1,2, ...)· (7) Итерацию продолжаем до тех пор, пока некоторые два последовательных приближения _yi"f ι и _у}^."1 не совпадут между собой в соответствующих десятичных знаках. После этого полагаем -<т) Λ+i ^yi+t' где _уГ+1 — общая часть приближений у^1 и _yi+f')· Если алгорифм уточнения численного значения y-t искомого решения после трех — четырех итераций не приводит к совпадению требуемого числа десятичных знаков, то следует уменьшить шаг вычисления h. Отметим в заключение, что метод Эйлера с итерационной обработкой ординат дает на каждом шаге погрешность порядка h' и нередко применяется в вычислительной практике. Пример 2. Применяя метод итерационной обработки, с точностью до четырех совпадающих десятичных знаков найти значение У (0,1) интеграла дифференциального уравнения у'=х-\-у> ^(0)==ь
158 РЕШЕНИЕ ОБЫКНОВЕННЫХ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ [ГЛ. III Решение. Примем шаг й = 0,05. Применяя итерационный процесс (7) и учитывая, что /(х„у) = 0,05+у, последовательно будем иметь у[')= Ι-)-0,05· 1 = 1,05; у[г) = 1 _j- 0,05 · 1+2'-10 = 1,0525; /,'>= 1+0,05 .' + '2·1025.= 1,05256; _у('> = 1 + 0,05 · ' + ' ·тХ- = 1,05256. Следовательно, удержав запасной знак, можно положить .у, = 1,0526. Аналогично, приняв х, = 0,05 и _у, = 1,0526 за исходные данные и принимая во внимание, что /(*,. У) = 0,1+.У, с помощью того же итерационного процесса (7) получим Уг0) = 1,0526 + 0,05 -1,1026= 1,1077; Уг" = 1,0526 + 0,05· 1^26+1^77 = , _„Q4; У>>>=1,0526 + 0,05.Ь1026+1-2-^= 1,1104. Отсюда JV2= 1,1Ю4. Для сравнения приводим точное значение _у (0,1) = ге0·1 — 1,1 = 1,1102. Пример 3. С помощью итерационной обработки уточнить значения у; (t = 0, 1, ..., 10) интеграла уравнения / = -f-, до)=1 (§ 5, пример). Решение. После трех— четырех пересчетов по формулам (7) при h = 0,1 мы приходим к совпадению четвертого знака после запятой в значениях ордчнат _у(*> и у(к+1К Результаты этих вычислений помещены в таблице 38.
§ 6] МОДИФИКАЦИИ МЕТОДА ЭЙЛЕРА 159 Таблица 38 Интегрирование дифференциального уравнения методом Эйлера с последующей итерацией значений i 0 1 2 3 4 5 6 7 8 9 10 X 0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 У 1 1,0025 1,0100 1,0227 1,0408 1,0646 1,0943 1,1305 1,1738 1,2248 1,2812 H*.y)=f 0 0,0501 0,1010 0,1534 0,2082 0,2661 0,3283 0,3957 0,4695 0,5512 hf(x,y) 0 0,0050 0,0101 0,0153 0,0208 0,0266 0,0328 0,0396 0,0470 0,0551 Точное решение 1 1,0025 1,0100 1,0227 1,0408 1,0645 1,0942 1,1303 1,1735 1,2244 1,2840 Из таблицы видно, что предельная абсолютная погрешность приближенного решения на отрезке [0,1] меньше 3-10_>, т.е. предельная относительная погрешность составляет примерно 0,2°/0. Метод Эйлера и его модификации являются простейшими представителями конечно-разностных методов (шаговых методов) для приближенного решения обыкновенных дифференциальных уравнений вида y'k=fk(x, У„ Уг, ·■■> Уп) (*=!> 2, .... п) (8) при заданных начальных условиях Ук(х») = У? (*=1. 2, . .·, п). (9) При применении конечно-разностного метода искомое решение ук = ук(х) (£== 1, 2, .. ., л) последовательно строится на системе точек (узлов) xi = xt-\-lh (/ = 0, 1, 2, ...), где h — выбранный шаг. Процесс вычислений расчленяется на однообразно повторяющиеся циклы, каждый из которых обеспечивает переход от значения yk(xt) к значению yk(xi+l), начиная с начального у^>. Поэтому схема вычислений, вообще говоря, легко программируется и удобна для реализации на электронно-счетных машинах. Если правые части /к системы (8) сложны, то требуются специальные подпрограммы для подсчета у^х^.
(2) 160 РЕШЕНИЕ ОБЫКНОВЕННЫХ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ [ГЛ. III § 7. Метод Руиге — Кутта Пусть дано дифференциальное уравнение первого порядка у'=/(х,у) (1) с начальным условием У(Х,) = У0- Выберем шаг h и для краткости введем обозначения xi = х0 -\- ih и у, = у(х{) (/ = 0, 1, 2, ...). Рассмотрим числа: #0 =*/(*,., yi), ( h Φ *«=*/(*,+4, *+4')· ί Согласно обычному методу Рунге—Кутта [18], [19], [20], последовательные значения yt искомой функции у определяются по формуле где Δ^, = -g" ί*1!0 Ч- 2*i° + 2AS.° + *1°) (*=0, 1,2, ...)■ (3) Докажем, что погрешность этого метода на каждом шаге есть величина порядка hb [18], в предположении, что f(x, у) ζ С<5). Пусть Ьу = У(х + Ь)—уМ- (4) Для текущей точки χ приращение \у представим в виде некоторого среднего взвешенного величин £,, kt, k3 и kit определяемых формулами (2) (значок «г» естественно опускается): Δ^ = αΑ1 + βΑ, + γΑ, + ίΑ4. (5) Постоянные α, β, γ и δ определим из условия, чтобы приращение Ду, вычисленное по формуле Тейлора: Aj = A/(*) + y/(*) + £/" М + й/7 (*)+·... (6) совпадало, до членов порядка /г4 включительно, с величиной ку, вычисляемой по формуле (5). Наша задача — показать, что коэффициенты в формуле (3) в этом смысле являются наилучшими.
§ 7] МЕТОД РУНГЕ—КУТТА 161 Последовательные производные у' =у' {х), у" = у"(х), ... определяются из уравнения (1). Для удобства выкладок введем операторы г)2 г)г г)г л8 — _ 4- If — \-f2-— дх2* J dxi)y~J df ' ~ дх* "τ" ^f дх~Чу "τ" 3/ aidp "τ"^ c»73 ' где f=f(x, у) — правая часть уравнения (1). Заметим, что D(n-{-v) = Du-{-Dv, D (цг,)=die w +-^ 'цг,)=vDu + uDv< "T-7 dy ^хг_Г У dxety-'-' df)~~ __d'u , <?'« ■ 2 <?'« , ,ά'ίΐ ■ ~~"dx·"1" ' <Эх2<Эу_г y dxd^'T-·7 dys_t~ + «^(g+/g)+^(g+/g) = Z)-e + 2D/.0(g). Применяя правило дифференцирования сложной функции, из уравнения (1) последовательно находим y'" = D(D/)=:D2/4-|/.0/, = ^+|D7+(|)2D/-,-3D/.D(g).
162 РЕШЕНИЕ ОБЫКНОВЕННЫХ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ [ГЛ. III Следовательно, +я [D3f+d4D°f+{d4)'Df+3Df-D{d4)] ■ (7) Далее, используя разложение Тейлора для функции двух переменных: /(x + k, y^-k)=/(x,y)+^h^x-{-k^/(x,y) + + 2ίΙ*δ-χ+*έ;/(*·^+ с точностью до А4 находим :А/, ι 48 ^dx ^ / o>y <5χ dy /г' '/ + = А/+£0/ + £0'/ + йО'/, A. = A/(* + £, ^ + ^-/+?D/+^D2/) = + 4[ί ^/ + [4έ+(ί/+^/ + ^7)|]/ + *£ + (£/+* 4°/Jry],/+- 2 dx dy. ==А/+£о/+?(о'/+2^0/) + Λ (3 , h , д "Ή ^ + S[D'/+30DS/+6D/-D(|)] A4 = A/(* + A, > + A/+^D/+fDI/+2gD/) = =*{/+[*έ+(ν+?Ζ)/+ΐΖ),/+2^ζν)έ]/+ +^[*έ+(ν+»έ]ν+^(*έ+^)ν}- = a/+a*d/+^(d«/+|d/) + +5L8D,/+6f D'/+12 D/+24D/.D(g)]
§ 7] МЕТОД РУШЬ ■- КУТТА 163 Подставляя эти выражения в формулу (5), получим + τ D*f- (Ρ+υ+4δ> +4" § D/· (ν+23> + 8 w Приравнивая явно выписанные коэффициенты этого разложения соответствующим коэффициентам в формуле (7), для определения постоянных α, β, γ и δ получим систему восьми уравнений: α + β+Υ+ δ=1. β + γ + 8ο = 2, _2_ 3 1 з ■ °=τ 3 Ρ4-γ + 28 = ι, γ _j- 25 = -2 γ + 2ί = |, γ + 48 = (8) Легко проверить, что система (8) совместна и имеет единственное решение а==6~> Р=з"- Ϊ = Τ· δ=="6 · Таким образом, i>={(', + 241 + 241 + y + 0(/!s) (9) и, следовательно, наше утверждение доказано. Формула (9) имеет четвертый порядок точности. Получены также формулы типа Рунге — Кутта с иными порядками точности |18], [24]. Для вычисления, по формуле (3) удобно пользоваться схемой, приведенной в таблице 39. Эффективная оценка погрешности метода Рунге — Кутта затруднительна (см. [18]). Поэтому для определения правильности выбора шага h на практике обычно на каждом этапе из двух шагов применяют двойной пересчет [26]. А именно, исходя из текущего верного значения y(Xi), вычисляют величину y(xi-\-2h) двумя способами: один раз с шагом h, а другой раз с двойным шагом H—2h. Если расхождение полученных значений не превышает допустимой погрешности, то шаг h для данного этапа выбран правильно и полученное с его помощью значение можно принять за y(xt-\-2k). В противном случае шаг уменьшают в два раза. Такого рода вычислительную схему
164 РЕШЕНИЕ ОБЫКНОВЕННЫХ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ [ГЛ. III Таблица 39 Схема метода Рунге — Кутта ι 0 — 1 X *0 x,t2 ι h — χ, У Уо Уо + ^f Λ + -ΪΓ — Vl * = */(*, у) ft<0) — ... iy 2*<°> 2*W > ^ = АУо легко запрограммировать для работы на электронно-счетных машинах [26]. Употребляется также приближенная оценка погрешности (см. § 13). Метод Рунге — Кутта обладает значительной точностью и, несмотря на свою трудоемкость, широко используется при численном решении дифференциальных уравнений с помощью электронных вычислительных машин. Кроме того, важным преимуществом этого метода является возможность применения «переменного тага». Пример 1. Методом Рунге—Кутта вычислить на отрезке [0; 0,5]· интеграл дифференциального уравнения приняв шаг h = 0,1. Решение. Покажем начало процесса. Вычисление у1. Последовательно имеем Α(·> = (0+1).0,1=0,1; £W = 0,05 4- (1 + °.°5) · 0,1 = 0,11; fc(°) == 0,05 + (1 +0,055)· 0,1 =0,1105; ftW = 0,l + (1+0,1105)■ 0,1 =0,12105. Отсюда Д.уа = 1(0,1+2-0,11+2-0,1105+ 0,12105) = 0,1103
§ 7) МЕТОД РУНГЕ - КУТТА 165 и, следовательно, л=л + дл = Ч-0.поз = 1,поз. Аналогично вычисляются дальнейшие приближении. Результаты вычислений приведены в таблице 40. Таким образом, у (0,5) = 1,7974. Для сравнения приводим точное решение: у = Чех — х— 1, откуда у (0,5) = 2 У 7— 1,5=1,79744. . . Метод Рунге — Кутта применим также для приближенного решения систем обыкновенных дифференциальных уравнений. Пусть дана система дифференциальных уравнений §=/(*.» (И) и начальные условия Задавшись некоторым шагом h и введя стандартные обозначения *,■ = *„-+-'* и j; = j)(- (χ,·), byi=yi+l—yi при j=0, 1, 2 положим: *.(0> = */(*., Л). 1: Ϊ ^2> 2 > J-o I 2 Согласно методу Рунге — Кутта Aj»0 приближенно определяют по формуле А*. = I <*(.0> + ш? + 2кУ + *10)>· I13) отсюда Далее, приняв (хг, у J за исходные данные и повторяя тот же процесс, находим уг. Аналогично вычисляются yt (t = 3, 4, 5, ...)■ Пример 2. Методом Рунге — Кутта проинтегрировать уравнение колебаний маятника в сопротивляющейся среде (см. § 1, пример 1) ^ + 0,2f +103«πθ = 0 (14)
166 РЕШЕНИЕ ОБЫКНОВЕННЫХ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ [ГЛ. [II Таблица 40 Интегрирование дифференциального уравнения (10) методом Рунге — Кутта i 0 1 2 3 4 5 X 0 0,05 0,05 0,1 0,1 0,15 0,15 0,2 0,2 0,25 0,25 0,3 0,3 0,35 0,35 0,4 0,4 0,45 0,45 0,5 0,5 У 1 1,05 1,055 1,1105 1,1103 1,1708 1,1763 1,2429 I,2427 1,3149 0,3209 1,3998 1,3996 1,4846 1,4904 1,5836 1,5836 1,6828 1,6902 1,7976 1,7974 к = 0,Цх+у) 0,1 0,11 0,1105 0,1210 0,1210 0,1321 0,1326 0,1443 0,1443 0,1565 0,1571 0,1700 0,1700 0,1835 0,1840 0,1984 0,1984 0,2133 0,2140 0,2298 Ly 0,1000 0,2200 0,2210 0,1210 , 4-· 0,6620 = 0,1103 О 0,1210 0,2642 1 0,2652 ( 0,1443 4--0,7947 = 0,1324 О 0,1443 0,3130 0,3142 0,1700 . -|-. 0,9415 = 0,1569 0,1700 I 0,3670 1 0,3680 Г 0,1984 -г- · 1,1034 = 0,1840 6 0,1984 0,4266 0,4280 0,2298 4- · 1,2828 = 0,2138 6
§ 7] МЕТОД РУНГЕ — КУТТА 167 при начальных условиях: θ(0) = 0,3; θ(0) = 0; (θ = ^τ) · Решение. Полагая запишем уравнение (14) в виде системы дифференциальных уравнений ? = ω' 1 (154 ω = — 0,2ω — lOsin θ, J ' Таблица 41 Интегрирование системы дифференциальных уравнений (15) методом Рунге — Кутта i 0 1 2 3 i 0 0,05 0 05 0,1 0,1 0,15 0,15 0,2 0,2 0,25 0,25 0,3 0,3 Θ 0,3 0,3000 0,2926 0,2854 0,2854 0,2710 0,2641 0,2436 0,2434 0,2162 0,2105 0,1790 0,1786 О) 0 —0,1478 —0,1463 —0,2855 —0,2888 —0,4267 —0,4184 —0,5415 —0,5438 —0,6589 —0,6445 —0,7398 —0,7418 km= ο,ιβ 0 —0,0148 —0,0146 —0,0286 —0,0289 —0,0427 —0,0418 —0,0541 —0,0544 —0,0659 —0,0644 —0,0740 —0,0742 *(2)=0,1ω —0,2955 —0,2926 —0.2855 —0,2810 —0,2759 —0,2592 —0,25'27 —0,2304 —0,2301 —0,2013 —0,1960 —0,1633 —0,1647 i« 0, —0,0296 —0,0292 —0,0286 — 0,0874-4· = 0 = -0,0146 —0,0289 —0,0854 —0,0836 —0,0541 — 0,2520- -ί = 6 = -0,0420 —0,0544 —0,1318 —0,1288 —0,0740 — 0,3889.4· = 0 = — 0,0648 Δω —0,2955 Ι —0,5852 Ι —0,5710 ( —0,2810 — 1,327 · 4· = 0 = — 0,2888 —0,2759 —0,5184 —0,5054 —0,2304 — 1,5301 -4- = b = - 0,2550 —0,2301 Ι —0,4026 Ι —0,3920 / —0,1633 — 1,1895 · Jr = b = —0,1980
168 РЕШЕНИЕ ОБЫКНОВЕННЫХ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ [ГЛ. III причем Выберем шаг и положим где θ, = 0,3, », = 0. f= θ = ω: * = 0,2ω— 10 sin θ и компоненты k°\ km определяются из формул (12). Результаты вычислений по формулам (12) и (13) помещены в таблице 41. Ход дальнейших вычислений понятен из приведенного образца. § 8. Метод Адамса Этот метод численного интегрирования разработан Адамсом в 1855 г. по просьбе известного английского артиллериста Башфорта, занимавшегося внешней баллистикой. Впоследствии этот метод был забыт и вновь открыт в начале века норвежским математиком Штермером. Популяризация метода Адамса и дальнейшее его усовершенствование связано с именем А. Н. Крылова [10]. Изложим метод Адамса применительно к уравнению первого порядка [10], [19], [20] /=/(*. У) (1) с начальным условием У(х,)=У,· (2) Пусть х: (г' = 0, 1, 2, ...) — система равноотстоящих значений с шагом h и yi=y (Xi)· Очевидно, имеем «Г Т I Ду,-= (j y'dx. (3) В силу второй интерполяционной формулы Ньютона с точностью до разностей четвертого порядка получаем (см., например, [13]): где
§ 8] МЕТОД АДАМСА 169 Подставляя выражение (4') в формулу (3) и учитывая, что dx=h dq, будем иметь Отсюда получаем экстраполяционную формулу Адамса Для начала процесса нужны четыре начальных значения: Л> У ν Уг> У,>- так называемый начальный отрезок, который определяется, исходя из начального условия (2), каким-нибудь численным методом. Можно, например, использовать метод Рунге — Кутта или разложение в ряд Тейлора у/=у к+'*)=у,+у'· w+\ кт%+■ ■ ■. где /=1, 2, 3 (или i ——1, 1, 2 с соответствующим изменением нумерации). Зная эти значения, из уравнения (1) можно найти значения производных У* У\> Уг> У, и составить таблицу разностей: Δ(Α>0. ЦЬУ\), МЭД. Δ'(4)· Δ* (*/,)· A'W №) Дальнейшие значения yi (г = 4,5, ...) искомого решения можно шаг за шагом вычислять по формуле Адамса, пополняя по мере необходимости таблицу разностей (6). Для контроля рекомендуется [8], [9J, вычислив первое приближение для Ду,- по формуле Ч' = hy\ + \ (АД/_,) +1 Δ» (Ay; _ 2) + 4 Δ3 (Ay)_,), определить _yi+1 = у;- —f— Д_у'' подсчитать конечные разности Δ(ΛΛ), Δ·(Α^_,), Δ3(/^_2) (7)
170 РЕШЕНИЕ ОБЫКНОВЕННЫХ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ [ГЛ. III и затем найти второе приближение по более точной формуле (см. § 9) Д^п = Ну' + ~ Δ (hyt) -1 У Щ_ ,) -1 У (hy\ _,). (8) Если Д_у'. и Δ^(!' отличаются лишь на несколько единиц последнего сохраняемого десятичного разряда, то можно положить а затем, найдя перевычислить конечные разности (7). После этого, строго говоря, следует снова найти Δ^!1 но формуле (8). Поэтому шаг h должен быть таким, чтобы этот пересчет был излишним. На практике шаг к. выбирают столь малым, чтобы можно было пренебречь членом — Δ3 (йу|-_г) в формуле (8). Если же расхождение величин Ду! и Ду1.1 значительно, то следует уменьшить шаг h. Обычно шаг h уменьшают ровно в два раза. Покажем, как в этом случае, имея до некоторого значения / таблицу величин х,, у л Y/ = hy, (j*£,i) с шагом Δχ/ = А, можно просто построить таблицу величин x.Jf-k-γ, y^x^k-YJ, гк = - У' (*; + *· -|j (* = 0, 1, 2, ...), с шагом -j [28]. Для краткости введем сокращенные обозначения ι и h (/ = 0, 1, 2, ...; k = 0, ±1, ±2, ...). На основании формулы (4) будем иметь где Y = hy'. Отсюда, полагая j=i—2 и я=^ и учитывая, что , h X — */_, -Г "о" — xi — — > находим Y,- l = γι-> +i Δ»Ί-.+4 Μι- + йд'к'-· (10)
§ 8] МЕТОД АДАМСА 171 Аналогично, при j=i—1, ? = γ из формулы (9) получаем, что аргументу соответствует значение ^ι=^-.44ΔΚ<--*+ίΔ2κ<-° + Γ6Δ°κ<-*· (11) 2 Что касается значений К,-_, и К,-, то они имеются в старой таблице. После этого составляем начальный отрезок для новой таблицы: 2 "2 и находим начальные разности δη*=η*+,-η* (* = — з, —2, —ΐ); *,η* = 8η*+,-8η* (* = -з,-2); *'4* = 3'rjA+1—в-г1Л (ft = -3). Дальше таблица продолжается обычным путем, посредством соответствующей модификации формулы (5): 3У;., L = т>/ + Τ Ч - - + ϊ2 δ4' -2 + ¥ гЧ - ·' 2 >,+'+' = >,+ i + 4+ ' (У=0, 1, 2. ...). 1 2 2 '2 Для работы на электронных счетных машинах формулу Адамса (5) выгодно применять в раскрытом виде. Учитывая, что после приведения подобных членов имеем h Л- + .=>/ + й(55>;.-59^_1 + 37^_1-9у;_1)1 причем xUi=xi+h- Пример 1. Методом Адамса найти на отрезке [0,1] интеграл уравнении у=хЛ-у> Я°)=1·
172 РЕШЕНИЕ ОБЫКНОВЕННЫХ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ [ГЛ. III Решение. Примем шаг h = 0,1. Для начала процесса используем значения, найденные методом Рунге — Кутта (см. § 7, пример 1), т. е. у,= \; у, = 1,1103; у2= 1,2427; у, = 1,3996. Дальнейшие вычисления располагаем в двух бланках: основном (таблица 42) и вспомогательном (таблица 43). Если правая часть дифференциального уравнения сложна, то в основном бланке приходится вводить промежуточные графы [10]. При заполнении вспомогательного бланка используются согласно формуле (5) наклонные строки. Таблица 42 Основной бланк для интегрирования дифференциального уравнения методом Адамса / 0 1 ?. 3 4 5 6 7 8 9 10 X 0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 У 1 1,1103 1,2427 1,3996 1,5834 1,7971 2,0440 2,3273 2,6508 3,0190 3,4362 ау 0,1838 * 0,2137 0,2469 0,2833 0,3235 0,3682 0,4172 лу 0,1000 0,1210 0,1443 0,1700 0,1983 0,2297 0,2644 0,3027 0,3451 0,3919 д (Л.ю 210 333 257 283 314 347 383 424 468 а* ФУ) 23 24 26 31 33 36 41 44 А' (Лу') 1 2 5 2 3 5 3 У* 1 1,1103 1,2428 1,3997 1,5836 1,7974 2,0442 2,3275 2,6511 3,0192 3,4366 Таблица 43 Вспомогательный бланк для интегрирования дифференциального уравнения методом Адамса '■ hy; 4 Δ'(*ί-,) ЛУ/ = 2 3 0,1700 128 10 0 0,1838 ■1 0,1983 142 11 1 0,2137 г, 0,2297 157 13 2 0,2469 6 0,2644 174 14 1 0,2833 7 0,3027 192 15 1 0,3235 8 0,3451 212 17 2 0,3682 9 0,3919 234 18 1 0,4172
§ 8] МЕТОЛ АДАМСА 173 В последнем столбце приведены для сравнения точные значения решения у* — 2ех:— χ — 1. Отсюда видно, что максимальная ошибка приближенного решения у не превосходит четырех единиц последнего десятичного разряда. Можно было бы уменьшить эту ошибку, применив двойной пересчет по контрольной формуле и введя соответствующие поправки [18]. Метод Адамса легко распространяется на систему дифференциальных уравнений [10], [19], [20] £=/(*. у) при начальных условиях А именно, имея векторный начальный отрезок JO- Ук У*> У,. дальнейшие значения координат искомой вектор-функции у=у(х) определяем, используя формулу ьу^ну^ ί^.^ + π^Μι.ύ + Ιν &У1_г) (/==4l5,...). Для численного нахождения решения можно использовать бланки, аналогичные приведенным выше. Пример 2. Уравнение колебаний маятника имеет вид (см. § 7, пример 2) 5 + 0,2 g + 10sine = 0, (12) причем θ(0) = 0,3, θ(0)=0. Методом Адамса определить угловую скорость маятника при первом прохождении положения равновесия θ = 0. Решение. Записываем уравнение (12) в виде системы θ = ω; <й = — 0,2(0— 10sin9. Начальный отрезок для шага Λ = Δί == 0,1, подсчитанный методом Рунге — Кутта, заимствуем из § 7 (пример 2), причем ограничиваемся тремя десятичными знаками: t=0; θ0 = 0,300; о>0 = 0; / = 0,1 /=0,2 / = 0,3 β,=:0,285; ωι== — 0,389; вг = 0,243; ω2 = —0,544; θ, = 0,179; ω,= — 0,742.
174 РЕШЕНИЕ ОБЫКНОВЕННЫХ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ [ГЛ. III Пользуясь этими данными, заполняем основной бланк (таблица 44) и вспомогательный бланк (таблица 45). Таблица 44 Основной бланк для решения системы дифференциальных уравнений методом Адамса ; 0 1 2 3 4 5 6 t 0 0,1 0,2 0,3 0,4 0,5 0,6 β 0,300 0,285 0,243 0,181 0,099 0,11 —0,078 д« —0,082 —0,088 —0,089 ΛΘ 0 —0,029 —0,054 —0,074 —0,086 —0,090 Δ (ΛΘ) —29 -25 —20 -12 — 4 &' (Щ 4 5 8 8 Δ» (ΛΘ) 1 3 0 ω 0 —0,289 —0,544 —0,742 —0,864 —0,897 —0,846 Δω —0,122 -0,033 +0,051 Λω —0,296 —0,276 0,230 —0,163 —0,080 +0,009 Δ (Λω) 20 46 67 83 89 Δ» (ftuj) 26 21 16 6 Δ> (Αω) -5 -5 —10 Таблица 45 Вспомогательный бланк для решения системы дифференциальных уравнений методом Адамса i ΛΘ,· γΜΛΘ,-,) *β,=2, 3 —0,074 — 10 + 2 0 —0,082 4 —0,086 — 6 + 3 + ι —0,088 5 —0,090 — 2 + 3 0 —0,089
§ 8] МЕТОД АДАМСА 175 Продолжение табл. 45 / Λω,- *»'=Σ. 3 —0,163 + 34 + 9 — 12 —0,122 4 —0,080 + 42 + 7 — 2 —0,033 5 +0,009 + 44 + 2 — 4 +0,051 Таким образом, интересующий нас момент времени, для которого отклонение θ (<) = о, удовлетворяет неравенству 0,5<^<0,6. Для уточнения составим таблицу разностей (таблица 46). Таблица 46 Конечные разности величии Θ и <о 1 0,3 0,4 0,5 и 0,181 0,099 0,011 ΔΘ —82 -88 &■>& —6 ω —0,742 -0,864 —0,897 Δω — 122 —33 Д2Ш 89 Пусть t -0,5 Применяя вторую интерполяционную формулу Ньютона, будем иметь 0 = θ = 0,01 l-\-q(— 0,088) + Ч (<?2+ '' (— 0,006). Отсюда ^=uS"oS9(9+i)=o'i25-o'o34^?+1)·
176 РЕШЕНИЕ ОБЫКНОВЕННЫХ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ [ГЛ. 111 Применяя метод последовательных приближений, будем иметь 9,0> = 0,125; 9(1> = 0,125 — 0,034 - 0,102 · 1,102 = 0,125 — 0,004 = 0,121; 9,2) =0,125 — 0,034 · 0,098 · 1,098 = 0,125 — 0,004 = 0,121. Следовательно, можно принять 9 = 0,121 и t = 0,5 + 0,1? = 0,512. Снова пользуясь второй интерполяционной формулой Ньютона, находим ω = — 0,897 -\-q(— 0,033) -f U2+IL 0,089 = = — 0,897 — 0,004 -f 0,006 = — 0,895. Таким образом, окончательно имеем ω = θ = —0,895. § 9. Метод А. Н. Крылова последовательных сближений Как видно из предыдущих параграфов, многие методы численного интегрирования дифференциальных уравнений, включая метод Адамса, распадаются на два этапа: 1) нахождение начального отрезка искомого решения, т.е. начало решения или вход в таблицу; 2) вычисление дальнейших значений на основе найденных величин, т. е. продолжение таблицы. Здесь мы изложим принадлежащий А. Н. Крылову [10], [8], [22] способ построения начального отрезка методом последовательных сближений. Этот метод особенно удобен, когда правая часть дифференциального уравнения задана таблично, что, например, имеет место в задачах внешней баллистики. Для простоты записи ограничимся рассмотрением дифференциального уравнения первого порядка У'=/(х,У) (1) с начальным условием у{Хо)=У<,· Выведем сначала ряд вспомогательных формул, полагая У( = У{хо-\-'к) и У'=/(х1'Уд U=0, 1, 2, ...).
§ 9] МЕТОД А. Н. КРЫЛОВА ПОСЛЕДОВАТЕЛЬНЫХ СБЛИЖЕНИЙ 177 В силу формулы Адамса (см. § 8, (5)) имеем где ради краткости введено обозначение Tii=hy't=h/(xi,yi). Формула (2) обычно называется формулой наклонной строки, так как в ней используются разности, стоящие на диагонали таблицы разностей. Учитывая, что Δη,--. = Δΐί — Δ4->. Δ2*- =Уг,- — Δν -* Ίι-2 Ίι-1 '|! - 2' и полагая постоянными конечные разности третьего порядка Δ'η,-.,^Δν.. из формулы (2) будем иметь tyi = Αι + \ (Δϊ1.·-- AV.) + Υ2 <A2ri'--> — Δ'4/-.) + 4 Λ4-.· Отсюда получаем первую вспомогательную формулу — гак называемую первую формулу ломаной строки hi = rn + -j Ч- — ^ Δ4-. - й Δ'Γ"-»· (3) Далее, учитывая, что и Δν 5rdV из формулы (3) выводим вторую вспомогательную формулу— так называемую вторую формулу ломаной строки Ьу, = Ч; + Τ Ч — А Л!у"" + й А'Ч/-,· И) Наконец, полагая получаем формулу горизонтальной строки hi^^i + Y^i — ^Δ4· + ^Δ4- (5) Заметим, что формулу (5) можно получить непосредственно с помощью интегрирования, в пределах от xL до JCi+1, разложения j»' no
178 РЕШЕНИЕ ОБЫКНОВЕННЫХ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ [ГЛ. Ш первой интерполяционной формуле Ньютона: у =у\+ίΔ,;+£=* δ ν;-+<^ω δ·,;. Переходим к описанию метода Крылова последовательных сближений. Первое сближение состоит в вычислении приближенного значения Δ_ν0 (для ясности это значение и аналогичные ему подчеркнуты одной линией) по одночленной формуле ΔΛ = ν (6) После этого находим и составляем разность Δη0 = η, — η0, где rb = h/(x1,y}). Найденные значения заносим в раздел 1 основного бланка таблицы 47. Таблица 47 Схема вычисления начального отрезка методом последовательных сближений № сближения I 11 III / 0 1 0 1 2 0 1 2 3 X χ0 χ. *0 χ, хг Х3 Ay ν, ϊι v. Ду ^o 577 Δ^ Ίο 2l Ίο III· По US ί5 Дт, Ч, ^1 Δ=η ^ Δ»η *Ч Далее переходим ко второму сближению. Для этого, используя данные первого раздела, вычисляем приближенные значения А_у0 и Ау,
§ 9] МЕТОД А. Н. КРЫЛОВА ПОСЛЕДОВАТЕЛЬНЫХ СБЛИЖЕНИЙ 1 79 (эти значения, как и значения, связанные с ними, подчеркиваем двумя чертами) по двухчленным формулам: ^ = Ч. + Т-*3·· (7) ί£ι = 4ι+ !_*!.·' (8) Двухчленные формулы получаются соответственно из формулы (5) при г = 0 и из формулы (2) при /==1, в результате откидывания разностей порядка выше первого. Таким образом, получаем возможность найти У^=У0-\-^У± и У±=Ь+^ в результате чего можно вычислить r^=/if(xv ^); /j, = A/(jc„ yj и составить разности ^\=%— Ίο. ^к=гк — %> Δ'Ίο = Δηι— Ч,· Полученные результаты вписываем в раздел II основного бланка таблицы 47. Для нахождения третьего сближения применяем трехчленные формулы, которые получаются из формулы (5) при / = 0, из формулы (3) при i=\ и формулы (2) при i = 2, после откидывания разностей 3-го порядка. А именно, используя данные раздела II, вычисляем приближенные значения ^ya, Ду,, t\y2 (подчеркнуты гремя линиями) но грех- членным формулам: ^ = Ίο+4^_ б£1»; (9) Отсюда можно найти и вычислить η,, η2, η,. После этого можно заполнить раздел III основного блата таблицы 47, найдя нужные разности обычным порядком.
180 РЕШЕНИЕ ОБЫКНОВЕННЫХ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ [ГЛ. III Для контроля персвымнсляем Л_у0, Ду, и \уг по полным четырехчленным формулам (5)—при г'=0, (4) — при г'=1 и (3)—при/=2 ΔΛ=η.+τ^ί —ά^ + έ£ΐ·: (12) д3»а = 2| + ^·^ — Τ2^ι—24^Да." П4) Обычно перевычисление Д_у0 и Д_у, по формулам (12) и (13) в пределах заданной точности не дает ничего нового по сравнению с Ду и Ду,. Что касается значения Ду2, то, как правило, оно отлично отДу2. В этом случае следует исправить Д_у2 па Д_уг. Практически чаще всего приходится менять последний десятичный знак,, и процедура сводится к тому, что этот знак берется в скобки и дописывается новый десятичный знак. Затем вносятся соответствующие исправления в значения ys, η3, Δη2, Δ2η, и Δ!η0. После этого можно перейти к нормальному ходу вычислений по формулам Адамса. Если Ду0 и Д_у, отличны соответственно от ку0 и Ду; в заданных десятичных знаках, то процесс сближений не может считаться законченным. В таком случае следует или найти четвертое сближение, полностью перевычислив с помощью формул (12) — (14) раздела III основного бланка и затем для контроля проверить по тем же формулам устойчивость величин Д_у0, Ду,, Ь.уг; или же повторить весь ход вычислений с меньшим шагом. Заметим, что при выборе шага h для метода сближений лучше ошибаться в меньшую сторону, чем в болыи} ю. Дело в том, что при малом шаге можно быстро закончить сближении, а затем, удвоив шаг, определить недостающие значения одним из регулярных методов, в то время как при завышенном шаге всю работу приходится переделывать заново. Замечание. Можно указать более точный вариант метода последовательных сближений. А именно, найдя ку0 по формуле (7), мы имеем возможность вычислить _у,, η, π Δη0. После чего Ау, определяется по более точной формуле , ^Ι^ϋι + Υ^· Аналогичным образом можно поступить при вычислении Ду2. А именно, вычислив Ду0 и Д_у, по формулам (9) и (10), находим _у, иу2ивычис-
§ 9) МЕТОД А. Н. КРЫЛОВА ПОСЛЕДОВАТЕЛЬНЫХ СБЛИЖЕНИЙ 181 ляем η,, η,, Δη0, Δη,, Δ2η0. Затем Δ_ν2 определяется по формуле Пример. Методом последовательных сближений для интеграла дифференциального уравнения у'=х-1гу, у(0) = 1 (15) найти три значения: ^=>'(0,1); УЖ=У (0,2); _У, = у(0,3), приняв шаг h = 0,1. Решение. Вычисление будем вести с тремя десятичными знаками после запятой. Полагая η =0,1 {χ + у) и применяя формулу (6), получаем ДЛ = 0,100; _у,= 1,000 4-0,100= 1,100. После этого заполняем раздел I основного , бланка (таблица 48); далее, с помощью двухчленных формул (7) и (8) находим ΔΛ = 0,100-1--· 0,020 = 0,110; Ду,= 0,120-|—^ -0,020 = 0,130, что дает возможность заполнить раздел II основного бланка (таблица 48). Наконец, используя трехчленные формулы (9) — (II), будем иметь: Δ^ = 0,100-1-γ · 0,021 —~. 0,002 = 0,110; Ду,=0,121 -f \ ■ 0,023— ~- 0,002 = 0,132; Δ^ = 0,144 +у -0,023+-^-0,002=* 0,156. С помощью полученных данных заполняем раздел 111 основного бланка (таблица 48).
182 РЕШЕНИЕ ОБЫКНОВЕННЫХ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ [ГЛ. Ill Таблица 48 Вычисление начального отрезка интеграла дифференциального уравнения (15) методом последовательных сближений £ 1 II 111 0 1 0 1 2 0 1 2 3 А 0 0,1 0 0,1 0,2 0 0,1 0,2 0,3 У 1,000 1,100 1,000 1,110 1,240 1,000 1,110 1,242 1,39(8)9 аг/ 0,100 0,110 0,130 0,110 0,132 0,15(6)7 1) 0,100 0,120 0,100 0,121 0,144 0,100 0,121 0,144 0,170 Δη 20 21 23 21 23 26 Λ'η 2 о 3 Δ'η 1 Для контроля производим пересчет Syg, Ду, и куг по четырехчленным формулам (12)—(14). В результате приходится исправлять на единицу последнего разряда лишь значение Лу2, помещая неточную цифру в скобки. Аналогичным способом в случае необходимости исправляются и значения yv η3, Δη2, Α2η, и Δ3η0. В данном случае с точностью до третьего десятичного знака эти величины остаются неизменными. Таким образом, окончательно имеем у (0,1) = 1,110; у(0, 2)== = 1,242; у(0, 3)= 1,399. Для сравнения приводим точные значения (см. § 7): у (0,1)= 1,1103...; у(0,2)= 1,2428...; у (0,3)= 1,3997... § 10. Метод Милна Одним из наиболее простых и практически удобных методов численного интегрирования дифференциальных уравнений является метод Милна (W. Е. Milne) [19J, [21]. Дадим сначала описание этого метода, а затем остановимся на выводе необходимых формул, применяемых в методе Милна. Пусть дано дифференциальное уравнение /=/(*. У) 0) с начальным условием yW=A· (2)
§ 10J метод милна 183 Выбрав шаг /г, положим, как обычно, У; =/(*/. У,) (»' = 0, 1, 2, ...). Первые четыре значения искомого решения Уо> Ун У». Уз («начальный отрезок*) находим, используя начальное условие (2) и применяя какой-либо метод, описанный выше, например, метод последовательных приближений или метод Рунге — Кутта. Тем самым будут известны у\ {1 = 0, 1, 2, 3). Дальнейшие значения yi = y{Xi) (I = 4, 5, ...) последовательно определяются по следующей схеме: предполагая, что У.-·. У;-*· У;-·. У/-4 известны, !) вычисляем первое приближение _у^'> для ближайшего следующего значения у; по формуле yl,,=y,--1+f(2y;_3-y;_2+2y,_l) (/ = 4, 5, ...); (3) 2) значение у\ подставляем в дифференциальное уравнение (1) и определяем соответствующее значение У;0) =/(*;, У^У, 3) находим второе приближение у{%) по формуле (/ = ♦, 5, ...). (4) Милн показал, что абсолютная погрешность значения у*·*) приближенно равна Поэтому, если ε,- ==S ε, где ε — заданная предельная погрешность решения, то можно положить у^у?> и у,-=/(*,-, ур>).
184 РЕШЕНИЕ ОБЫКНОВЕННЫХ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ [ГЛ. III В частности, это имеет место, если _у<Л> и _у'.2> совпадают в интересующих нас десятичных знаках. Далее, переходим к вычислению ближайшего следующего значения у,-+1, повторяя указанный выше процесс. В противном случае, если точность ε не обеспечена, следует уменьшить шаг h (начиная с известного места). При этом мы встретимся с неприятной необходимостью пересчета соответствующего «начального отрезка». Таким образом, мы видим, что метод Милна выгодно отличается от других методов (например, от метода Рунге—Кутта) тем, что в нем производится корректирование каждого вновь полученного частного значения интеграла уравнения, без пересчета с измененным шагом. Приступим теперь к выводу формул Милна (3)—(5). Для этого воспользуемся первой интерполяционной формулой Ньютона [23], написанной для производной у', в подходяще выбранной точке xk, причем ограничимся разностями 3-го порядка, что равносильно тому, что интеграл у=у(х) дифференциального уравнения (1) аппроксимируется полиномом 4-й степени. Имеем у'=у'к-\-яЬу\ <?(? — ') 2! *2Л + q (9-1) (9 -2) 3! Д'Л или где /=Λ + ^Λ + Τ^-^Δ^+1Γ^ X — Xk ■3q! + 2q)\>yk, (6) (7) Полагая k=i—4 в формуле (6) и почленно интегрируя получен- ХН ную формулу по χ в пределах от л:;_4 до xt (рис. 32), будем иметь S y'dx= J [л-. + ^ДХ-.+^ДУ.-.Ч- ci-4 xi-i 9'-398 + 29д8 ду- dx. Отсюда, учитывая, что ц =_ ^zJ^Lz* и dx— hdq,
§ 10| МЕТОД МИЛНЛ 185 находим 4 4 У ι— У1-к — ^\у\-х \^-\-\у]_^дад-\- о о Так как by'i-K=y'i-t—y't-j ^y'i-l=y'i-, — b'i-s+y'e-j Ь*У'с _ 4 =/,_,— 3/, _, + Ь] _, — У, _ 4, то, подставляя эти значении в формулу (8), после обычных упрощений получим первую формулу Милна У, --= У1-<+ у ВД _,-/,_,+ Чу ι - ,)■ О) Для вывода второй формулы Мпчна положим k = i—2 в формуле (6) и проинтегрируем обе части получившегося выражении по χ в пределах от лг(-_2 до х(. Тогда, учитывая, что будем иметь *< - а ° + ~(?' — 3?г 4- 2?)А^; ^. 2] rfg. Отсюда, выполняя квадратуры, получим >,—^-, = A(^_, + 2^-, + yA'yi_,)- (10> Подставляя в формулу (10) известные выражения У ί — 2 /i-1 У ί — 2 II д,л-,=.у;—2л-.+л-,. придем ко второй формуле Милна Л = >/-. + т(Л + 4Л-1+/*_,)■ 01)
186 РЕШЕНИЕ ОБЫКНОВЕННЫХ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ [ГЛ. 111 Заметим, что для дифференциального уравнений /=/(*). .У(*о)=Л. правая часть которого не зависит от искомой функции у, формула (11) идентична с формулой Симпсона для интеграла: χι xi-2 Для вывода контрольной формулы (5) для погрешности ε,- второго приближения у[?) оценим главные члены погрешностей εγ> и s(2> первой и второй формул Милна. Учитывая отброшенные в интерполяционной формуле Ньютона (6) разности четвертого порядка, с точностью до разностей пятого порядка будем иметь 4 ε(»^ а$ 1 (?*-6?' +1 w- б?) ду,_4^ = | му,_4 о и г & *=h \ k{ql - 6g,Jr' ^ -6<?) Δν< - а= о =-#οΔ4>-;·-2· ^ Отсюда, считая, что четвертая разность ду постоянна на интервале длины 4/г, получим ^=—28е?>. Так как, очевидно, )>i~yt "Г 2/ —У' —·*°εί и „ _ „« 4- ε(·2) то Следовательно, имеем контрольную формулу Милна
§ Ю) МЕТОД МИЛНА 187 Заметим, что если шаг h достаточно мал, то приближенно можно положить Пусть α<χ^ίι — интересующий нас отрезок, на котором строится решение дифференциального уравнения (1), и Ь — а h = . η Тогда из формулы (12) следует, что предельная абсолютная погрешность на отрезке [а, Ь] приближенного решения yi=y(xi) выражается следующим образом: Ε — — Μ η = b ~а Μ hl — 90 5 — 90 5 ' где Ms = max\yv(x)\ при a^x^b. Таким образом, суммарная ошибка метода Милна есть величина порядка А4. Пример 1. Дано дифференциальное уравнение у'=х-\-у (14) с начальным условием >(0)=1. Методом Милна вычислить у (0,5) с точностью до 0,001. Решение. Задаемся h = 0,1; так как погрешность результата получается порядка /г4 = 0,0001, то заданная точность практически достигается. Вычисления ведем с одним запасным знаком. Значения у0 и у'0 нам известны непосредственно из начального условия и уравнения (14): Остальные первые три значения у{ = у{х,) (1=1, 2, 3) находим каким-либо другим способом численного интегрирования дифференциального уравнения. Из уравнения (14) получаем соответствующие значения *;=/(*/) с=1.2, з). В таблице 49 приведены эти значения, найденные методом Рунге — Кутта (см. § 7, табл. 40).
188 РЕШЕНИЕ ОБЫКНОВЕННЫХ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ [ГЛ. III Таблица 49 Начальный отрезок для метода Милна /' 0 1 <> 3 χι 0 ο,ι 0,2 0,3 у. 1 1,1103 1,2427 1,3996 у\ 1 1,2103 1,4427 1,0996 Займемся вычислением значений yt и у$ по формулам Милна. 1) Вычисление yt. Применяя первую формулу Милна (3), получим уо) = 1 + ^р (2 · 1,2103 -f 2 · 1,6996 — 1,4427) = 1,5836. Отсюда, подставив в дифференциальное уравнение, будем иметь у^= 1,9836. Далее, применяя вторую формулу Милна (4), находим у00 — 1,2427 -\-Ц- (1,4427 + 1,9836 + 4-1,6996) = 1,5835. Таким образом, найденные значения yW и у{*> совпадают в сохраняемых нами трех десятичных знаках, поэтому считаем Λ =У[г)= 1-5835. Отсюда Λ = Λ(,)= 1,9835. 2) Вычисление уъ. По первой формуле Милна имеем yW= 1,1103+^(2-1,4427 + 2-1,9835 — 1,6996)= 1,7973; соответственно уУ> = 0,5+1,7973 = 2,2973. По второй формуле Милна будем иметь у?) = 1,3996 + ^ (1,6996 + 2,2973 +4-1,9835) = 1,7973. Так как у[{> и у№ совпадают, то можно положить yt = 1,7973.
§ Ю] МЕТОД МИЛНА 189 Следовательно, у (0,5) = 1,797. Отметим, что благодари малости шага h здесь нет необходимости оценивать погрешность приближенных значений искомого решения. Интегрирование дифференциального уравнения по методу Милна удобно производить по следующей схеме (таблицы 50, 51). Таблица 50 Основная таблица для метода Милна i 0 1 2 3 4 5 ι 0 ο,ι 0,2 0,3 0.4 0,5 у(0 1,5836 1,7973 „(«> = „, 1 1,1103 1,2427 1,3996 1,5835 1,7973 s/ 0 0 >r 1,9836 2,2973 '(2) 1 1,2103 1,4427 1,6996 1,9835 2,2973 Метод Милна может бить применен также к интегрированию систем дифференциальных уравнений. Пусть дана система дифференциальных уравнений dx =/(*, У) (15) (16) ■), с начальными условиями У{*Л)=У,· Выберем шаг h и положим JC,- = jc0 + ί/г, yi=J>(xi) (i = 0, 1, 2, где у=у(х)— искомая вектор-функция. Каким-либо методом определим дополнительные начальные значения ул, уг, у,. Из уравнения (15) найдем соответствующие значения производной #=/(*«■■ у<) ('' = о. ·- 2> 3)· Тогда дальнейшие значения _у; (г = 4, 5, 6, .. .) искомой вектор- функции приближенно шаг за шагом могут быть вычислены по следующим формулам: ι- уР=у,-< + j (Щ_,-у\-,+Ч_,); ^■ур=У1-г+^:-,+щ-,+у?%
190 РЕШЕНИЕ ОБЫКНОВЕННЫХ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ [ГЛ. 111 Таблица 51 Вспомогательная таблица для метода Милна / 2/. ■Ί-г 2К-, ΣΓ ί*Σί" V/-1 у'·" 4/ 71. - 1 г 2* ЗА Vi-г # А 2,4206 — 1,4427 3,3992 4,3771 0,5836 1 1,5836 1,4427 6,7984 1,9836 10,2247 0,3408 1,2427 1,5835 5 2,8854 —1,6996 3,9670 5,1528 0,6870 1,1103 1,7973 1,6996 7,9340 2,2973 11,9309 0,3977 1,3996 1,7973 y'fm=f(xi,y'pY. )Ы.)-^),| ε' 29 =s=s )' где s — заданная предельная погрешность, то полагаем *) Под нормой вектора у = (у„ у„ . . . , у„) здесь понимается число ||j»|J = rnax|^|. где 111. если
§ Ю] МЕТОД МИЛНЛ 191 >> ч я а £=== Ч 5 о о. МП §Й 3 в η а £t 2е· И ч л 3" я о ■*-, И 11 и ■< >ч Η - „ - ооо о о см OOCri -З4 ^J· со ооо о оо о I I 1 . - ооо ооо о -«*■ см CD CD CD о оо о I 1 СМ СМ ГО ооо о о оо I I 1 ооо О СМ сМ ооо о о о о I 1 ооо ооо ОО 'JD о ^о о I I 1 о о оо о о о о о о о о I 1 ,01000 ,02000 о о о о I 1 о СП о ооо О 1 II „ 4··° а о о сп ° — 1 о м 1 ' II о -|«=§ § о о J τ » , *_. OOC-1N CD Г- t— OD CO ·—< ·—' t~- o —< — о о о о о I I I 1 , - h-COO^ СО ОС h- ΟΙ CD СО НО CD —нООЛ оооо о о оо I I I 1 о о -- г— СО ОО СО tO СП ОО СО '.О Л Ю Ό ^ о о о о о оо о ι ι ι ι г- ^г ю ^ СО -^ СО СМ CD 'Χ) CM CD — СМ ГО СО о о о о о о о о 1111 О С4) ГО УЭ О О) О СО СО Tf ГО СМ СП CD CD СО — см см со О О О О I I I 1 го см со о со см <м см CD СМ -«*■ СО CD СО ОЭ CD о ^ -- — О О) ОО I I I 1 h-ь- г— со 00 (-D СМ *Ч- CD CD CD ОС —' СО ^ Г- о о> о о оооо 1111 О V— СО 1С О О СО Г-. CD CO t~~ ιΟ CD CD CD, .Γι Ο Ό Ο Ο СМ Г-^СО -rf о"" о" о" о' ~" 1 1! -|*> CD CD о ГО о 1 II -μ —и о 1 о ю о 1 li СМ 1 II - ГО \0 О СО 00 —' ^ СМ •X) 00 Г- CD t— со со о о — —. — оооо I I I 1 . - оо тг от -~а ел го о 1-го cd о Ό О 0> —ι О оооо I I I 1 СО СО О СО 00 О t-^ СМ ••О ■* со CD f- CD CD О О О О —- оооо I I I 1 СМ (СО -.О СО ]■— ~< го — -х> о ι- о*; "3* ι с ίο мооо ооос I I I 1 СО О CM t — -Π- ι.Ο ~ч ■^f О СО СО СО Ι"— 'JO "^ ГО *Т ^Г Ю оооо I 1 I I •м оо см оо спюооь irteoocD СП СО ιΟ ОО т-| СМ СМ СМ оооо I I I 1 07837 ,11679 ,12541 17207 оооо I I I 1 со о со h- СО 00 О СМ q2 ^ СО -"< CD CD С·. CD оооо ■«ТОЮ %0 о'о"оГо" Μ 1 !| -|"-° см ■JD ю о 1 II -|,о о см о 1 о CD о о 1 11 со о 1 li — , см о 1 о 1 CD ι— о 1 σι о С£> о" со
192 РЕШЕНИЕ ОБЫКНОВЕННЫХ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ [ГЛ. III Пример 2. Методом Милна найти на отрезке [0,1] интеграл системы дифференциальных уравнений [20] dy ζ dz , . ν. удовлетворяющий начальным условиям j)(0)=l; z(0) = 0. Решение. Для удобства записи положим "/, где /= ζ Заметим, что система (17) обладает особенностью при х = 0. Вследствие этого у (0) имеет форму неопределенности, которую раскрываем по правилу Лопиталя: /(0)= Urn -== lim ζτ=.ζ'(0) = 0. Выберем шаг // = 0,2. Начальный отрезок для метода Милна вычисляем методом Рунге — Кутта с пятью десятичными знаками после запятой. Схема вычислений дается в таблице 52. Имея начальные значения Yi = (y!l zt) (г'=0, 1, 2, 3), дальнейшие вычисления проводим методом Милна, используя формулы I, II, 111. Результаты вычислений даны в таблицах 53 и 54. Таким образом, мы получаем у(\) = 0,76520; z(l) = -— 0,44000. По вычислениям методом Адамса (см. [20]) имеем _у(1) = 0,76520; ζ (1) = — 0,44005. Заметим, что в нашем случае известно точное решение системы (17). А именно y = Ja(x); z = — xJl(x), где 70 π Jl — функции Бесселя пулевого и первого индекса соответственно. По таблицам имеем [17] у (1) = У0(1) = 0,765198.. . , 2(1)=—7,(1) = — 0,440051 ...
§ Ю] МЕТОЛ МИЛНА 193 S3 о я P. >> ■β- ■β- к S ■-. \"- ^ ii Ε χ хГ il ST x~ д- хГ х~ Ν i""" ω- νΓ II ί> ει Μ Ξ^ Β ^ Γ> ε.1,... ν ?? ο-_ ^ Ν ->7 с.ч Μ "~>С Χ* - Ο ο οο сп ο ο ι Ι со со СП СП о о о 1 ΓΟΟ СП о о о 1 о о о СП СП —< о <м о о о —< ЕЛ *=f со со о j ι CM СП LO СП о 1 г- его оо ΙΟ о 1 со со о ЕЛ сп о ^ о см сч г- т1 •О о | 1 <М (Л ЕЛ □0 (М о 1 1 г- СП г- о 1 о о (М СП о (Л о « | о 1—1 -|™ W 1 о "З4 о Г-- |-- (Л о 1 1 ΓΟΟ со (Л со о" 1 1 о о СП Μ о 1 о со ЕЛ *=f со о о СП г- г- ЕЛ о | оо ЕЛ о" 1 о о LO СП <м О 1 1 г- со t— CO о CO о -3- « о -|М л 1 CD _3 о (О ■*г тН о 1 о см LO ЕЛ г- о сМ см ю ЕЛ Γ- Ο | ΓΟΟ СП со о" 1 ΓΟΟ СП со ^ О 1 1 см ЕМ ю ЕЛ г- о ■ о ^- ю
194 РЕШЕНИЕ ОБЫКНОВЕННЫХ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ [ГЛ. III Таблица 54 Вспомогательная таблица для метода Милна в случае системы дифференциальных уравнений /' -у,-, 2^-, ΣΙ" тА2Г y(i) Л-г г'о ι Si4 3 Α ^(2) 4 У* —0,19866 0,19592 —0,57324 —0,57238 —0,15263 1,00000 0,84737 —0,19592 —1,14648 —0,36875 — 1,71115 —0,11408 0,96038 0,84630 zl —0,39600 0,38416 —0,09442 — 1,10626 —0,29500 0,00000 —0,29500 —0,38416 —2,18884 —0,67790 —3,25090 —0,21673 —0,07837 —0,29510 5 У1 —0,39184 0,28862 —0,73774 —0,84296 —0,22478 0,99000 —0,76522 —0,28662 — 1,47548 —0,43987 —2,20197 —0,14680 0,91200 0,76520 г\ —0,76832 0,54721 — 1,35408 —1,57519 —0,42000 —0,01987 —0,43987 —0,54721 —2,70808 —0,76522 —4,02051 —0,26803 —0,17197 —0,44000 Пример 3. Методом Милна найти на отрезке (Х^^0,5 частное решение системы х' = — 2х -j- 5z, "I y'=—{\—sint)x—y-\-3z, I (18) ζ = — χ-\-2ζ, Ι удовлетворяющее начальным условиям: x{0) = xt = 2, y{0)=yt=l, e(0) = zo = \. Шаг й —Λζ принять равным 0,1,
§ Ю] метод Милна 193 Таблица 55 Нахождение начального отрезка решения X методом Рунге—Кутта i 0 1 2 t 0 0,05 0,05 0,1 0,1 0,15 0,15 0,2 0,2 Χ 2 1 1 2,05 1 1 2,045 1,00262' 0,99750 2,08975 1,00471 0,99500 2,08984 1,00497 0,99500 2,12960 1,00991 0,99001 2,12438 1,01237 0,98752 2,15872 1,01930 0,98007 2,15880 1,01953 0,98006 ft = 0,1-*" 0,1 0 0 0,09 0,00525 —0,005 - 0,08975 0,00471 — 0,00500 0,07955 0,00992 — 0,00998 0,07953 0,00988 — 0,00998 0,06908 0,01480 — 0,01496 0,06888 0,01433 — 0,01493 0,05829 0,01911 — 0,01986 0,05827 0,01907 — 0,01987 qk 0,1 0 0 0,18 0,01050 —0,010 0,17950 0,00942 — 0,01000 0,07955 0,00992 — 0,00998 0,07953 0,00988 — 0,00998 0,13816 0,02960 — 0,02992 0,13777 0,02866 — 0,02986 0,05829 0,01911 — 0,01986 0,05827 0,01907 — 0,01987 Δ*=τΣ 0,08984 0,00497 —0,00500 0,06896 0,01456 — 0,01494 0,04739 0,02313 — 0,02473
196 РЕШЕНИЕ ОБЫКНОВЕННЫХ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ [ГЛ. Ш Продолжение табл. 55 ί / 0,25 0,25 0,3 X ft=0,lA-' qk 2,18794 1,02907 0,97012 2,18254 1,03126 0,96758 2,20613 1,04245 0,95534 0,04747 0,02346 — 0,02477 0,04733 0,02292 — 0,02472 0,03644 0,02694 0,02954 0,09494 0,04692 — 0,04954 0,09466 0,04584 — 0,04944 0,03644 0,02694 0,02954 **=τΣ Решение. Начальный отрезок для искомого решения вычисляем методом Рунге—Кутта. Для краткости положим Х= Результаты вычислений приведены в таблице 55. Дальнейшие вычисления произведены по формулам I, 11 и III. Полученные результаты помещены в таблице 56, причем промежуточные выкладки опущены. Для сравнения в последней графе таблицы 56 приведены компоненты точного решения X с пятью верными десятичными знаками после запитой. Таблица 56 Вычисление решения X методом Милна (' 0 t 0 0,1 х=хМ 2 1 1 2,03984 1,00497 0,99500 Χ'=Χί*)> 1 0 0 0,79532 0,09882 — 0,09984 Х(<) Ж1)' '- 29 X 2 1 1 2,08983 1,00497 0,99500 k = hX' = 0,\
§ 11] ПРИМЕНЕНИЕ ПРОИЗВОДНЫХ ВЫСШИХ ПОРЯДКОВ 197 Продолжение табл. 56 i 2 3 4 5 ί Χ=№) 0,2 0,3 0,4 0,5 2,15880 1,01953 0,98006 2,20619 1,04266 0,95533 2,23153 1,07270 0,92106 2,23459 1,10742 0,87758 Х'=Х(')' 0,58270 0,19074 — 0,19868 0,36427 0,26911 — 0,29553 0,14224 0,32795 0,38941 Л"(>) 2,23152 1,07268 0,92106 2,23458 1,10740 0,87758 Х(')' 0,36427 0,32798 0,38940 — 0,08126 0,36209 — 0,47942 ιλΌ)-λ-(5)ι Ε ~ ί 29 0 0 0 0 0 0 χ 2,15881 1,01954 0,98007 2,20620 1,04267 0,95534 2,23154 1,07271 0,92106 2,23459 1,10743 0,87758 § П. Методы, основанные на применении производных высших порядков До сих пор для численного интегрирования дифференциального уравнения первого порядка /=/(*. У) U') с начальным условием У(*,)=Уо (2) мы применяли формулы, в которых явно используется лишь первая производная y't=y'i(xi) искомого решения. Однако, если использовать формулы, явно содержащие производные высших порядков от искомого решения, то можно указать методы, дающие более точный результат на данном промежутке, без увеличения числа шагов. Выведем соответствующие формулы, предполагая, что правая часть уравнения (1) дифференцируема достаточное число раз. Пусть yh y'ii y"i — значения искомого решения у=у(х) и, соответственно, значения его производных первого и второго порядков
198 РЕШЕНИЕ ОБЫКНОВЕННЫХ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ [ГЛ. III в точках Xi = x0-\-ih (t = 0, 1, 2,...). Разлагая величины Уι+ι= У (*,- + *)· y'1+i=y'(xi + b). y'i+i=y"(Xi-{-k) в ряды по степеням h, находим: " '" ГУ V ^.^i+^+l-A' + irA' + ^r^ + irAM-.... ьу'^ = у?Л-у'Р+Чг*+~ h'+4h5 + --·' hy;+l=y?4-y';'h'+4-h,+ihS+-·· Из полученных формул исключим члены, содержащие у'" и у1У. Для этого вторую формулу умножим на —у, а третью — на т= и сложим с первой. Будем иметь: >■/+. — 4 ^+. +fe tf+. =л +λ· (! — i) А+ + ^(я-Г2+я)*1+>1'(15о-а+й*, + ··. Таким образом, с точностью до /г5 имеем приближенную формулу [14]: Можно показать, что остаточный член формулы (3) равен η — /вм "»""" 720 ' где Λ-,<ί<χ,·+Ι.
§ 11] ПРИМЕНЕНИЕ ПРОИЗВОДНЫХ ВЫСШИХ ПОРЯДКОВ 199 Аналогично имеем У; + . —У(-г = У (xi + >i) — y(Xi — Щ = , -. , , 4Λ2 „ 8Λ' „, , 16Α* 1V 32AS ν , - (Л-2А^+-у У,--ТУ1 +-2ТУ)-'"Ж tf+ ■ ■ ■) = о, , ЗА2 „ , ЗА3 „, 5Λ4 ,ν , ΠΑ5 υ . = uyi--2-yi + -ryi --s-y'v + ^o-y"+·-· и У; —У|-,=У/ —У (*,·—Α) = / , , , Λ2 „ Λ' ,„ , Λ4 .„ Λ5 ν , \ = yi-(yi-hyi + 1ryi-Tyi +_>.v__;rv+...j== ι. ' Λ2 „ , Λ» „, Λ4 ,„ , Λ5 υ' Отсюда л+. -У1-. - з (у, -*-,) = а"уГ - ? yiv+τ Λν + · ■ · С другой стороны, У,- — Л-. = У ι — У ι (*; — А) = У,· — (^ У/ — ЙУ, + "2 У} — Поэтому Λ + ,-Λ-,-30'/-3'ί-,) = Α,0';'-^,)+ΏΛν+··· Таким образом, с точностью до А5 имеем приближенную формулу yi+,-y,- = *lyt-yi->) + b'(y"i-yU- W Можно доказать, что остаточный член формулы (4) есть Я, = Ϊ2" У (6'), где *<-,<£'<*/+,· К формулам (3) и (4) присоединим выражения для производных у' и у", а именно: /=/(*. У) 15) и /=/л*. у)-К(*. у)/· (б)
200 РЕШЕНИЕ ОБЫКНОВЕННЫХ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ [ГЛ. III Процесс численного интегрирования дифференциального уравнения (1) при наличии начального условия (2), использующий формулы (3) и (4), происходит следующим образом. Каким-либо методом вычисляем три начальные строки (начальная таблица): х«, У», У'о' У1'· *ι, У,- У[> У",· Хг, У» У'г> У",- Из формулы (4) при ΐ=2 получаем первое приближение для у3: Л = Л+3(у,— y,) + h2(yl— У") [7) и, пользуюсь формулами (5) и (6), находим для соответствующих производных у, и у, их первые приближения: Уг=/(х„ У г) и y",=f'x{xt, У~,) +y'ify(x3, У,)- Второе приближение для у, определяем при г' = 2 из формулы (3): *=.у.+т(>;+>;)+5 (А-% ι») После этого исправляем значения производных у' и у'1, подсчитывая их вторые приближения: Уг =/(*,> У,) II y",=f'x(x„ У,) + у'»/у(х„ У,)· Для контроля еще раз вычисляем по формуле (3) третье приближение у, значения ys, используя найденные значения у3 и у',. Если шаг h выбран подходящим, то пересчет не дает нового результата, и в этом случае можно положить У,=У,> У>=У» /·=/»■ В противном случае следует уменьшить шаг. Аналогично находятся дальнейшие значения yit у'., у" при i^>3. Для получения начальных значений у1 и у2 обычно используют метод последовательных приближений или метод Рунге — Кутта, после чего нужные производные y't и _у?(/ —О, 1, 2) определяются по формулам (о) и (6).
§11] ПРИМЕНЕНИЕ ПРОИЗВОДНЫХ ВЫСШИХ ПОРЯДКОВ 201 Можно также применить следующий прием: сначала, используя данное начальное значение у (х0)~у0, непосредственно вычисляем X =/(*.. 3Ό) и y"o = fx(x°< л) 4-Х/у К. у,)· Тем самым будет заполнена 1-я строка начальной таблицы. Далее на основании формулы Тейлора приближенно получаем yi=yo + hy'a+-2h*yl и, следовательно, можно будет найти X =/(*!. У>) И ?:=/>.. у,)+//;(*,. >-.)· Пользуясь этими данными, уточняем значение yt по формуле (3): Ух =У» + ~г (Л 4- У[) + \2 № ~ ft и затем перевычисляем значения у и у". Тем самым заполняем 2-ю строку начальной таблицы. Аналогично, исходя из 2-й строки, находим элементы уг, у'г и у" последней 3-й строки начальной таблицы. Отметим, что если пересчеты элементов строк дают значительные расхождения, то этот прием не является надежным. В таком случае следует или уменьшить шаг h вычислений, или же обратиться к более точным методам. Пример 1. Для дифференциального уравнения '22 у =Х2 — уг найти несколько значений интеграла у (х), удовлетворяющего начальному условию у (0) = 1. Решение. Примем шаг равным h = 0,1. Из начального условия имеем У. = 1- Методом Рунге — Кутта находим у, =>> (0,1) = 0,909410, у, = у (0,2) = 0,835786.
202 РЕШЕНИЕ ОБЫКНОВКННЫХ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ [)'.Ч. 111 Отсюда, пользуясь формулами У'1=хЖ1 — У) (9) II у' = 2(Х1 — У1у{) (i = 0, 1, 2, 3,...), (Ю) вычисляем: /о = —1,000000, /о'=2,0000; у[ = — 0,817026, /; =1,6860; у'г = — 0,658538, y"t— 1,5008. Дальнейшие значения у,- (г 5г 3) находим, используя описанный выше регулярный процесс. Например, для / = 3 из формулы (7) получаем >.= у. + з (у, -у,) + о.ι8 (у>- у") = = 1,000 -|- 3 (0,835786 — 0,909410) -f -j-0,01 (1,5008—1,6860) = 0,777276. Подставив это значение в формулы (9) и (10), где положено i = 3, будем иметь: у', = 0,3г —0,777276s = —0,514158, у"3 = 2 10,3 — 0,777276 ·( — 0,514158)] = 1,3994. Значение уг уточняем, пользуясь формулой (8): , 0,1 ,-' . .. 0,01 .-» », = 0,835786 + 0,05 (— 0,514158 — 0,658538) — — ^jy (1,3994— 1,5008) = 0,777236. Из формул (9) и (10) находим соответственно у3 = — 0,514096 /, = 1,3991.
§ 11] ПРИМЕНЕНИЕ ПРОИЗВОДНЫХ ВЫСШИХ ПОРЯДКОВ 203 Полученное приближение уг подвергаем для уточнения итерационной обработке, подставля'я его снова в формулу (8): - , 0,1 ,=< , \ 0,01 ,=» У, =Уг + -γ (У> "Г У>) й~-(У>—у>) = = 0,835786 -f-0,05 (— 0,514096 — 0,658538) — — ^(1,3991 — 1,5008) = 0,777239. Пользуясь формулами (9) и (10), получим соответственно 71=0,514100 и у,'= 1,3992. Так как расхождение второго и третьего приближений незначительно, то принимаем: Уг = 0,777239, у'з = 0,514100, 3»;= 1,3992, причем последние десятичные знаки приведенных значений сомнительны. Аналогично вычисляются дальнейшие значения yt, ys,... Результаты окончательных вычислений помещены в таблице 57. Таблица 57 Интегрирование дифференциального уравнения методом производных высших порядков X 0 0,1 0,2 0,3 0,4 0,5 0,6 У 1,000000 0,909410 0,835786 0,777239 0,732728 0,701769 0,684230 У' — 1,000000 — 0,817026 — 0,658538 — 0,514100 — 0,376890 — 0,242480 — 0,108169 У" 2,00000 1,6860 1,5008 1,3992 1,3523 1,3403 1,3480 В заключение приведем формулы, обеспечивающие более высокую степень точности, но требующие вычисления, кроме второй, еще и
204 РЕШЕНИЕ ОБЫКНОВЕННЫХ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ [ГЛ. III третьей производной искомого решения. А именно, используя формулу Тейлора и употребляя прием, аналогичный указанному выше, получаем формулы где и _ 420дуР|(61) Kl 100800 ' .Vi + . =У1 + у (Х+1 +>-;■) — "Й" W+i —/ί) + + 1ΐ0ί+1+^ + «.. U2) где Λ, АУЧЕ.) 100800 ' Формула (11) употребляется дли нахождения первого приближения у, + 1; формула (12) дает уточненное значение yi+l. Само собою ра*умеется, что к последним двум формулам целесообразно прибегать тогда, когда форма дифференциального уравнения позволяет сравнительно просто находить вторую и третью производные от искомой функции у. § 12. Численное интегрирование дифференциальных уравнений второго порядка Задача Коши для дифференциального уравнения л-го порядка У">=/(*, у, у', .... У""1') (1) при начальных условиях У*1 (xQ) = у№ (k = 0, 1, 2, ..., я—1), как было показано в § 1, сводится к задаче Коши для системы у':=у» > (2) /„_,=/(*, у, у„ ·■■> у,,-,), j где y*(*.) = y„4 (* = 0, 1, 2, .... л—1; Л=У· Поэтому изложенные выше методы приближенного интегрирования систем дифференциальных уравнений применимы также к уравнению (1). 1
§ 12] РЕШЕНИЕ УРАВНЕНИЙ ВТОРОГО ПОРЯДКА 2С5 Однако общие схемы для приближенного решения дифференциальных систем, не учитывающие специфических особенностей системы (2), оказываются излишне сложными. Поэтому целесообразно вывести формулы, специально приспособленные для численного интегрирования дифференциального уравнения вида (1). Мы ограничимся рассмотрением дифференциального уравнения второго порядка: /=/(*, У, У) (3) при начальных условиях: у (х0) =_у0, у' (х0)=у'0. Выведем формулы для приближенного вычисления интеграла у=у{х) дифференциального уравнения (3) с помощью метода Адамса. Для этого выберем шаг Δλ: = Α и введем стандартные обозначения: χι = *о + г'А- У(=у (хд> y'i=y' (■*",·). y"i=y"(xi)=/(ii, У ι, У'д (;' = °> ]> 2· ···)· Допустим, что известны значения Л' Л. ■■■> УС> у'* у[< ■··. у\· /ό> y'v ■■■> у\ (i^3). Тогда можно вычислить разности Лу"__ , Аг_у'.'__ ,, Д'_у''_ · Применяя вторую интерполяционную формулу Ньютона, с точностью до разностей 4-го порядка будем иметь (см. § 8) где Так как в силу формулы (5) dx = hdq, то, очевидно, имеем χ η /=/,·+$ y"dx = /, + h \ y"dci (6)
206 РЕШЕНИЕ ОБЫКНОВЕННЫХ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ [ГЛ. III Интегрируя последовательно на отрезке [0, q] два раза по q формулу (4), на основании формул (6) и (7) получим + (-£+-£+■£) ^-.] №'> и + (■£ + £) »'Λ-, + (£+£+£) 4W-,] · en Отсюда, полагая <7=1 в формулах (6') и (7'), находим где положено -т^- ч= -г^. Можно принять Более точный вариант счета следующий [14]: найдя у'(,г, по формулам (8) и (10) вычисляют b.y', ^%y'i_l, Д*^-_,> после чего определяют kyt по более точной формуле (см. § 8): Затем, приняв У1+1=У1 + ЬУ?' y't+1 = y'i + Ly'!. О») из дифференциального уравнения можно найти и, пополнив таблицу, вычислить у;'+1 по формуле y'i+l=y'i+^y'tH> где В случае необходимости повторяют аналогичный пересчет величин у1,1 и y'i + l до тех нор, пока не прекратятся изменения.
§ 12] РЕШЕНИИ УРАВНЕНИЙ ВТОРОГО ПОРЯДКА 207 Рекомендуется шаг h выбирать столь малым, чтобы формулы (10) и (111 давали одинаковые результаты, в пределах заданной точности. Что касается начального отрезка Л. >Ί- У2> Уг> Л* У[> Л' X· то он предварительно определяется каким-нибудь подходящим методом. Разработаны также другие приемы для приближенного интегрирования дифференциального уравнения (3) (см. [14], [18], [27]). В частности, для дифференциального уравнения вида /=/(*, у) имеется весьма точный метод Б. В. Нумерова [27]. Пример. На отрезке [0,1] найти интеграл у=у(х) уравнения у"-}-усЬх = 0, (13) удовлетворяющий начальным условиям: 3»(0) = 0, /(0)=1. (14) Решение. Примем шаг h = 0,2. Для подсчета начального отрезка применим метод степенных рядов. Имеем у' =: —у ch χ; отсюда у"' =— {у sh x-\-y' ch x), yw = — (yd\x-\-2y'shx -\-у" chx), yv = —(у shx-\-3y' ch*-\- Зу'1 shx-\-y'" chx) и т. д. Следовательно, в силу начальных условий (14), получаем: Уо = 0, y't=l, yl = 0, у"в'=—\, У? = 0,у* = -2 поэтому У = Х --w + ... И^'=1 2" — -Ϊ2-Η··· *15^ Полагая χ, = 0,2/ (/ =—1, 0, 1, 2), из формул (15) с точностью до 10~* находим: у,— — у_, = 0,200 — 0,001 =0,199, у'1^=у'_л = 1— 0,020 = 0,980, у2 = 0,400 — 0,011= 0,389, у\ — 1 — 0,080 — 0,002 = 0,918. Дальнейшие вычисления производим по формулам (g^ jg^ (jq^ без пересчета. Результаты вычислений приведены в таблицах 58 и 59.
208 РЕШЕНИИ ОБЫКНОВЕННЫХ ДИФФКРЕШШАЛЬНЫХ УРАВНЕНИЙ [ГЛ. Ill Таблица 58 Основной бланк для решения задачи Коши (13) — (14) / — 1 0 1 2 3 4 5 X —0,2 0 0,2 0,4 0,6 0,8 1,0 У —0,199 0 0,199 0,389 0,563 0,710 0,819 ьу 0,174 0,147 0,109 У' 0,980 1 0,980 0,918 0,810 0,649 if —0,108 —0,161 ch χ 1,020 1 1,020 1,081 1,185 1,337 У" 0,203 0 —0,203 —0,421 —0,667 —0,949 ay" —203 —203 —218 —246 —282 \~-ytt ь?у" 0 — 15 —28 —36 — 15 — 13 — 8 Таблица 59 Вспомогательный бланк для решения задачи Коши (13) — (14) / У!0 4-^-, V — 1 Δν;-=/ώ\ 1 „ 1 ΤΑ*-! 1 Λ2 " — Δ2ν· 8 у'-2 — Δ'ν'- 10 y'-s ν "2 />2V " -2 hVi Ду,- 2 -0,421 109 6 6 -0,542 " -0,108 — 0,210 36 2 2 -0,250 — 0,010 + 0,184 0,174 3 -0,667 123 12 5 — 0,807 -0,161 -0,334 41 4 1 -0,380 -0,015 + 0,162 0,147 4 -0,474 47 4 1 -0,526 -0,021 + 0,130 0,109
§ 13] МЕТОД ЧАПЛЫГИНА 209 § 13. Метод Чаплыгина Рассмотренные выше приближенные методы интегрирования дифференциальных уравнений были преимущественно численными. В этом параграфе мы изложим аналитический метод приближенного интегрирования дифференциальных уравнений, принадлежащий Чаплыгину и основанный на совершенно новой идее. Метод Чаплыгина [15], [16], [5], [2] является одним из наиболее точных аналитических методов приближенного интегрирования дифференциальных уравнений и в то же время допускающим простую оценку погрешности решения. Сущность его состоит в том, что искомое решение у=у(х) (χ,^χ^Χ) аппроксимируется двумя последовательностями функций и„=.ип(х) и ν„==ν„(χ) (л=1, 2, 3, ...), удовлетворяющими двойному неравенству ип (χ) <■ У (*)< νη Μ ПРИ х € К. х\ и начальному условию причем такими, что νη(χ)—ап (х) =t 0 на [jc0, Λ'] при η—κ». Геометрически это значит, что искомая интегральная кривая у=.у[х) зажимается в сколь угодно узкий криволинейный сектор А0ВпСп (рис. 33). Таким образом, для решения у (х) строится «вилка» \ип {χ), νη (х)\ и указывается регулярный процесс, с помощью которого можно сузить эту «вилку» до желаемых размеров. В этом смысле метод Чаплыгина напоминает комбинированный метод решения обычных уравнений (см. [23], гл. IV). Если положить У η = «„ (х), то предельная абсолютная погрешность приближенного решения и (х) будет равна ε„ {χ) = νη (χ) — ип (х), т. е. эта погрешность на каждом шаге определяется непосредственно. Для простоты изложим идею метода Чаплыгина применительно к дифференциальному уравнению 1-го порядка /=/(,*> У) (1)
210 РЕШЕНИИ ОБЫКНОВЕННЫХ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ [ГЛ. [II с начальным условием ^W=>.. (2) причем будем предполагать, что правая часть f(x, у) непрерывна и имеет непрерывные производные /' (х, у) и f'L(x, у) в некоторой окрестности начальной точки М0(х0, у0). Метод основан на одной лемме, представляющей так- у= о„ (х) У y=vfx) 8» у,и„(х) же самостоятельный математический интерес. Лемма Чаплыгина об интегральных неравенствах. Пусть /[*] = *'—/(*, ζ) Рис 33. (1). — дифференциальный оператор, соответствующий дифференциальному уравнению у (х)— интеграл уравнения (1), т. е. удовлетворяющий начальному условию .у(я0) = >>0 При Х0 < Χ ϊζ X. Если функция и = и(х) удовлетворяет условиям: J [и] ==£ 0 при χΰ < χ ==£ Χ и и{х„)=у0, то на отрезке [х0, X] выполнено неравенство (3) и определенный (4) (S) т. е. функция и является нижним приближением решения у. Аналогично, если для функции ν=ν(χ) выполнены условия: 1 [v\ ss 0 при хй < χ ==£ Χ (6) и то на отрезке {д;0, X] имеет место неравенство y<v, (7) т. е. функция ν является верхним приближением решения у.
§ 13] МЕТОД ЧАПЛЫГИНА 211 Доказательство. Очевидно достаточно доказать лишь одно из неравенств (5) или (7). Докажем, например, неравенство (5). Из формул (3) и (4) имеем у'—/(х,у) = 0 и и' —/{χ, κ)<0. Отсюда (у — и)'—р(х)(у — и)з?0, (8) где р ( .а —- f(x> У W) — /(*■ » (*» ,ол " \ ' у —и ' к ' функция р(х) теряет смысл при х, для которого у = и. В этом случае полагают , \ ι- /(*. V) — f(x, и) м . . ,s ρ (α;) = hm y'_Jy — =/ (х, у (х)). и -► у У ,ι В силу приведенных выше условий функция p(x) определена и непрерывна на отрезке [х0, X]. Умножим обе части дифференциального неравенства (3) на положительный интегрирующий множитель к J* ρ (χ) dx μ(χ) = βχο ; будем иметь £{Р-М\у(х)-и(х)]}^0. (10) Отсюда, интегрируя неравенство (10) в пределах от х0 до х, где ха <Ξ х ^ X, получим μ (χ) \у (х) — и (х)] — μ (х0) \у (х„) — и (х0)\ Ss 0 или, так как у (ха) = и (ха) и μ(χ)>0, то окончательно находим и(х)^у(х) при х0^х^Х, что и требовалось доказать. Следствие. Пусть функции у=у(х), и — и(х) и ν = ν{χ) при ха <Ξ χ < X удовлетворяют соответственно дифференциальным уравнениям " у'==/(х,у); (Ч) и'=/,(*, и); о'=/,(х, о), (12) где /,(*. *)</(*. *)</,(*. г), (13)
212 РЕШЕНИЕ ОБЫКНОВЕННЫХ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ [ГЛ. III и общему начальному условию у (ха) = и (дг0) = г» (jc0) = j;„. Тогда справедливо неравенство u(x)^y(x)^v (χ) при х0==£л:==£Х (14) Действительно, полагая I\z]=z'—f(x, ζ), из условий (12) и (13) имеем J[u]=u'—/(x, «)=/,(*, и)—/(х, κχО и I[v) = v'—f(x, «)=/,(*. «)—/(*, »)>0. Отсюда на основании предыдущей леммы следует неравенство (14). Нетрудно выяснить геометрический смысл неравенства (13). Рис. 34. Рассмотрим семейство интегральных кривых ... , С_8, С_,, С0, С,, СЖ,...(К) уравнения (11), где С0 — интегральная кривая, проходящая через точку Ai0(x0, _у0), т. е. график решения у = у(х) (рис. 34). Из первой части неравенства (13) вытекает, что интегральная кривая первого из уравнений (12) у = «(.*:), проходящая через точку Ж0, пересекая последовательные кривые С семейства (К), опускается по отношению к этим кривым и, следовательно, лежит ниже кривой С0 (рис. 34). Наоборот, из второй части неравенства (13) усматриваем, что интегральная кривая второго из уравнений (12) y~v(x), проходящая
§ 13] метод чаплыгина 213 через точку Ма, пересекая последовательно кривые С семейства (А"), поднимается по отношению к этим кривым и поэтому расположена выше' кривой С0 (рис. 34). Таким образом, имеет место неравенство (14). Покажем теперь метод построения последовательностей функций Un, vn (и = 0, 1, 2, ...), аппроксимирующих решение у дифференциального уравнения (1). дЧ Предположим сначала, что ~% сохраняет постоянный знак в рассматриваемой области, например, Методом проб подберем две функции "„ = «.(*) и Ό0=νΑχ) («„<*ό)> для которых выполняются соответственно неравенства /[«.]=—φ„(*)< 0 и /К]=фо(х)>0, где φ0 (χ) и ψ0 (χ) — соответствующие невязки. В случае затруднений при нахождении функций и0 и ν0 можно применить следующий прием: пусть правая часть дифференциального уравнения (1) f(x, у) определена и непрерывна в некоторой прямоугольной области где а и b — положительные числа. Положим: т = т'т/(х, у) при (х, у) ζ/?; A/ = max/(x, у) при (x,y)£R (16) и h = m\nla,-.—γ,ττγγϊ- <17) Тогда на отрезке [л;, X], где А"== x0 -f- Л, в качестве начальных приближений можно выбрать следующие функции: ио = У,,-\-т(х— х0); Vo^yo + Mix — xJ (рис. 35). Действительно, из формул (16) и (17) вытекает, что J[u0] = m—/{x, и0)==£0 и /[«.] =/И — /(х, ^0)^0 при л:0^л;<л;0-}-Л.
214 РЕШЕНИЕ ОБЫКНОВЕННЫХ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ [ГЛ. III Для уточнения приближений к0 и и0 полагаем где р0 = р0 (*) и σ0 = σ0 (χ) — функции, определяемые из линейных дифференциальных уравнений -Sf = P.(*) Р.+ ¥.(*). Р.(*.) = 0 и где φ,(*) = —/[и,], ф.1*) = 'К]. (18') (18") />.(*) = /;(*. "о) и ?.(*) = ϋο_„ο (19) J (x, v„)—f(x, щ) % — и« Так как свободные, члены φ0 (λ;) и ф0(х) линейных уравнений (18') Рис. 35. и (18") неотрицательны, то из известных общих формул для решений этих уравнений следует, что р0(л;)5г0 и σβ(χ)Χ) при лг0<лг<Л'. Покажем, что /[«,]< 0 и /К]>0 на [х0, *].
МЕТОД ЧАПЛЫГИНА 215 § 13] Действительно, имеем 1[ui\=u'» + ?'t — /(«. «о + Ро) = =/(х, и0) — φ0(·*)+Μ*)Ρο+<ΡηΜ — — /(X, И. + р.) = р,/;(Х, "о)-[/^. "о + Ро)— /(*.".)]■ Применяя формулу Тейлора, получим где 0<^0<М. Отсюда, учитывая неравенство (15), находим /kl=-4/L(«.+Op.)<0. (20) Аналогично, предполагая, что χ— фиксировано и σ0 (χ) — σ0 =£= 0, имеем = /(*. *0 + Фо(·*) — i,?,W- ФоМ — /(X. ve — °a) = = о„ /(X, t)„) —/(X, t)0 — o0) /(X. Va)—f{x, »o) σ0 Уо — "о (21) Заметим, что К — и«)' = К — «; = /(*. ».) + Ф(*.) — -[/(х, ц.) - φ (л:,)] = /U' ^ ~ '(*' "»> (p. - и.) + У (x0) + Φ (*.)■ т. е. Κ — Ό'=ίο (■«) Κ — "ο) + φ (*.)+Φ» (*). причем ν0(χα)— и0(хо) — 0. Таким образом, функция ν0 — ия удовлетворяет дифференциальному уравнению (18") с измененным свободным членом и нулевым начальным условием, а так как T.W<T.W+t.(*)· ТО σ„ (*)==£ и0 (х) — и„ (х) при *„<.*<*. Рассмотрим угловой коэффициент (22) где χ фиксировано. На основании условия (15) /'и{х, и) — неубываю-
216 РЕШЕНИЕ ОБЫКНОВЕННЫХ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ [ГЛ. [II щая функция переменной и. Поэтому при «<^u0 имеем 7ή(*.Ό ι fix, v0)-f(x, »)_ -о ~ гд "7 f.. (χ. и\ — λ., Ix. it\ _ ■О (И <И<1»0). «о —и ' («о —«)2 Следовательно, k (и)—также неубывающая функция переменной и и, приняв во внимание неравенство (22), получим fix, va)—f{x, ν„ — °о) fix, ν»)— fix, "о) >0 σ0 I'd — «о ~"~ Отсюда из формулы (21) находим /K]SsO. (23) Если же а0(л;) —0, то неравенство (23) очевидно. Из формул (20) и (23) следует, что к, и г/, являются соответственно нижним и верхним приближениями для точного решения у, образующими более узкую «вилку», чем начальные функции к0 и ν0. Вообще, если то можно положить U« + i = uB + Pn И ^ + 1 = ^ —ffn. причем функции р„ и ση неотрицательны и определяются из линейных дифференциальных уравнений з£ = Р„(*)Р» + <РЛ*). Р»(*.) = 0 ί24') II e = ?»W <*„ + ¥,». <*„(*.) = 0 (я=1,2, 3, ...), (24") PnW=fAx, "») (25) где Аналогично тому, как было сделано выше (см. [19]), доказывается, ч1о /[«в + 1]<0 и /К+1]>0. Отсюда получаем (рис. 36) н„ si и, sj к, < ..
§ 13] МЕТОД ЧАПЛЫГИНА 217 Заметим, что если зафиксировать χ и построить график функции г = /(х, у), (27) то для каждого значения χ получим, что представляет собой угловой коэффициент касательной к кривой (27) в точке у = ип, а есть угловой коэффициент секущей к кривой (27), проходящей через точки у = ип и y~vn (рис. 37). Поэтому получение ип условно может быть названо методом касательных, а получение vn — методом хорд. Из уравнений (24') и (24") будем иметь Г р„ (х) dx х - J рп (χ) dx р„ = ех" С шп (х) е Ха dx (28) J" 01 (X) dx χ — I 7л (*) dx an = ex> ϊώα(χ)β 'x° dx (я = 0, 1, 2, ...). (29) x„ H. H. Лузин [16] доказал, что при η —- оо разность оя — и„ весьма быстро стремится к нулю. Если для некоторого η имеем
218 РЕШЕНИЕ ОБЫКНОВЕННЫХ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ [ГЛ. Ill где ε—заданная предельная погрешность, то приближенно можно положить Заметим, что если не требуется оценки погрешности приближенного решения, то нет необходимости строить две последовательности г Рис. 37. г, я с, (»=1, 2,.,,, л). В этом случае достаточно ограничиться последовательностью ип (или vn), так как y = Um un. и->ао Если вместо неравенства (15) выполнено обратное неравенство df ^ υ' то функции ип и νη меняются своими местами. Случай, когда π- на отрезке [х0, Х\ меняет знак, более сложен, поэтому здесь его рассматривать не будем [15], [16J. Пример. Методом Чаплыгина построить на отрезке 0, ■=- несколько приближений для интеграла уравнения Рикатти у'=х-\-2уг; j,(0) = 0. Решение. Пусть /(х, у) = х-\-2уг и I[z]=z' — x- ■2гг
§ 13] Так как МЕТОД ЧАПЛЫГИНА Гуу(х, У) = 4>0, 219 то можно применить изложенную выше теорию. Для пробы положим "„ = 0 и v0=x. Имеем 1 К! = ~ х = — <Ро Μ < ° и / [ио] = ι — χ — 2хг — ώ0 (χ) Ss О при 0 sS л; ==S у . Следовательно, 1 при (ХЖ-^ (рис. 38). Согласно общей теории полагаем Р„ Μ =/;(*- и,) = Ч = 0 Рис. 38. *«W ST=^ _ SP^ -2 (*, + «,) = 2*. Пусть "« == "о + Ро и ^. = ^0 —σο· В силу формулы (28) находим J" Ро (*) <** * - J Ра (*) dx х J ψ0(■«)е ° dX = ^o(x)dx = ^xdx=~ Поэтому и, = -к-. На основании формулы (29) получаем а„ = е" J" ?о (*) <ί* χ - J ίο (х) ' dx = f 2x dx χ - Γ 2χ dx χ :e° ^(\—x~2xl)e ° dx == <?*' ^] _ * _ 2*») e- *J dx. ο ο
220 РЕШЕНИЕ ОБЫКНОВЕННЫХ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ [ГЛ. Ill Интеграл χ Ф(х) = ^е~х'ах о явгается неэлементарной функцией, которая только числовым множителем отличается от интеграла вероятностей [17]. Очевидно, X XXX \ [\—х — 2хг) е-*1 dx=\ е~хг dx — \ хе-*1 dx -\-\ xd(e-x*) = о ооо = φ (χ) _(- 1 (е~х' — 1) + хе-х1 — Φ (χ) = — -j- (1 — е~х') -\- хе~х\ Поэтому «. = —2 «* + Т+* и, следовательно, Для контроля произведем проверку знака оператора I[z\ при 2 = а, и ζ = υν Имеем 1[и1] = х — х — 2х2 = — 2х2^0. Далее / К] = хе*° — χ — 1 (е"а — 2ех' + 1) = = (1+*)(^-1)-|(^-1) = При OsSx^y на основании формулы Тейлора получаем поэтому 1Ы>(ех1-\)(х-х*)^0. Оценим разность Так как (vl — uj=x[iex-—l)&u
§ 14] НЕКОТОРЫЕ ЗАМЕЧАНИЯ ОБ ОЦЕНКЕ ПОГРЕШНОСТЕЙ 221 при ТО 1 -±- 11 тах(«, —Ul) = -i (е4 — 1) — у = -1 (1,2840— 1) — 0,125 = 0,017. Итак, y = ~j(exi—1 + x2) с точностью до 0,01. Аналогично в случае необходимости можно получить и дальнейшие приближения искомого решения. Замечание. Большим неудобством метода Чаплыгина является возможность появления неберущихся квадратур. В этом случае интегралы приходится вычислять приближенно. § 14. Некоторые замечания об оценке погрешностей решений дифференциальных уравнений Основная цель приближенных вычислений заключается в нахождении нужного результата с заданной степенью точности. Для этого прежде всего необходимо, чтобы все произведенные выкладки не содержали принципиальных и арифметических ошибок. Последнее обстоятельство особенно важно подчеркнуть для численных методов решения дифференциальных уравнений, где схемы вычислений достаточно сложны, и малейшая ошибка безнадежно портит всю дальнейшую работу. Если вычислитель по косвенным признакам заподозрит наличие такой ошибки, то для поисков и устранения ее требуется много времени. Поэтому разумно проводить превентивную политику, т. е. не допускать появления таких ошибок и продолжать счет лишь в том случае, если имеется абсолютная уверенность в правильности всех предшествующих вычислений. Практика показывает, что в счете следует избегать поспешности и придерживаться золотого правила: «лучше меньше, да лучше». Опытный вычислитель знает, что нельзя верить своим однократно проведенным выкладкам. Необходим действенный текущий контроль над процессом вычислений, позволяющий немедленно обнаружить и предотвратить возникшие ошибки. Для этой цели служат различного рода контрольные формулы и вспомогательные соображения. Начинающий вычислитель часто считает контроль излишним и применение контрольных формул неприятной дополнительной нагрузкой. Однако на своем печальном опыте он скоро убеждается, что поиски допущенной ошибки требуют большей затраты времени, значительно превосходящей время, потраченное на контроль.
222 РЕШЕНИЕ ОБЫКНОВЕННЫХ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ [ГЛ. III Гарантией правильности решения может служить: 1) проверка выполнения условий задачи (например, для дифференциального уравнении найденное приближенное решение можно подставить в это уравнение, или эквивалентное ему, и проверить расхождение правой и левой частей); 2) двойной пересчет по возможности другим методом или другим вычислителем; 3) применение более грубой схемы и качественный анализ задачи. Если известен алгорифм нахождения точного решения задачи, то других ошибок, кроме вычислительных, не имеется. Положение усложняется, если для нахождения решения приходится пользоваться приближенным методом. Здесь наряду со случайными вычислительными ошибками появляются неизбежные погрешности приближенного решения вообще. Отметим, что оценка погрешности приближенного решения или общие соображения об его характере существенно необходимы, так как в противном случае полученный формально правильный результат может иметь чисто иллюзорное значение. Для иллюстрации приведем пример [18]. Пусть требуется численно найти решение задачи Коши: /=ioy+iij/, у(0)=\; у'(0)=~ 1 (1) на отрезке [0; 3]. Общее решение дифференциального уравнения (1) имеет вид , = с1в-» + с,в"*, где с, и с, — произвольные постоянные. Для искомого решения эти постоянные имеют значения с, = 1 и сг = 0, поэтому у = е'х и, следовательно, у (3) = е~' = 0,0498. (2) Применение обычных приближенных методов, в силу неизбежных погрешностей округления, даст приближенное решение вида где ε, и ε8— малые по абсолютной величине постоянные. Пусть, например, точность метода такова, что е,==± ΙΟ"10' и ε2=± ΙΟ"10. Тогда J43)=(.l ± 10-10)е-г± 10-'V3= ± 2-10\ (3)
§ 14] НЕКОТОРЫЕ ЗАМЕЧАНИЯ OB ОЦЕНКЕ ПОГРЕШНОСТЕЙ 223 т. е. даже при применении приближенного метода высокой точности полученное значение (3) может не иметь ничего общего с точным значением (2). На практике примеры такого рода встречаются сравнительно редко, однако с возможностью их приходится считаться. В сомнительных случаях рекомендуется составлять общее представление о поведении интегральных кривых, в зависимости от чего и выбирать подходящий способ вычисления. При дальнейших рассуждениях будем предполагать, что вычислительные ошибки тем или иным способом устранены полностью. Займемся сейчас анализом ошибок, источником которых является приближенность вычислений. Общая схема применения приближенных методов такова. Пусть у (х)— искомая функция, значения у (х() которой обычно определяются для системы равноотстоящих тачек xi = xt -\- ih (/=0, 1, 2, .,.). Обозначим через yi=y{xit уа, ух, ... , у,-_,) последовательные значения приближенного решения. Тогда предельная абсолютная погрешность приближенного решения у выразится следующим образом: £(>|Л-Л|- (4) Пусть yi есть результат применения приближенного метода к точному решению, т. е. У* = У{Х1, У„, У,, ....Л-.). Тогда можно принять £·,· = £? -f-s,., где £? = |У?-Л| (5) — так называемая погрешность метода, а ег = 1й— ~У*Л (6) — так называемая текущая погрешность. Погрешность метода Е,- представляет собой ошибку, происходящую от замены точного алгорифма решения приближенным. Эта погрешность неустранима. Поэтому метод вычислений должен быть выбран так, чтобы погрешность его на последнем шаге вычислений не превышала заданной величины. Что касается текущей погрешности метода ε(-, то источником ее является расхождение между результатами применения данного метода к точному и приближенному решениям. Значительную роль здесь играет округление промежуточных данных. Обычно порядок точности приближенного метода бывает известен. Под этим понимается следующее; пусть известны значения точного
224 РЕШЕНИЕ ОБЫКНОВЕННЫХ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ [ГЛ. III решения _у0, ух, у2, ..., у ι и очередное значение у1 + 1 разложено по степеням шага h в ряд Тейлора, т. е. У1+1 = аУ+ <№* + <$**+.... где °(р=^/? (Р=0, 1, 2, ...)· Напишем разложение в ряд Тейлора по степеням h значения y*+i=y(Xi + h, JO- У ν ···. Λ). найденное в результате применения данного приближенного метода к точным значениям уа, ул, ..., yt. Будем иметь JVH = ftS,> + *i°A + *21>*,+ ··· Если для всех ι выполнены равенства Ь(р = af при ρ = 0, 1, ..., от, причем Ьтл.х^=а„г+\ для некоторых /', то число т называется порядком точности приближенного метода. При этом погрешность метода на каждом шаге имеет порядок О (h"!+1). Если число от определено, то для грубой опенки погрешности метода можно применить так называемый принцип Рунге [18]. Пусть, например, на каждом шаге h допущена погрешность, приблизительно пропорциональная /гт+1 (т^з 1), и 2я представляет собой общее число шагов вычисления. В таком случае, предполагая, что погрешность на каждом шаге одна и та же, приближенно получаем yl-ytn^A.2nhm+\ ■ (7) где А—неизвестный числовой множитель. Согласно Рунге производим тем же методом вторичный пересчет искомого решения у с двойным шагом H—2h. Тогда в силу нашего предположения будет допущена погрешность Vn — yln=An(2h)m+\ (8) где Y, (/'=0, 1, 2, ..., я) — соответствующие значения в точках ζ,· = х0 -{- Hi результата, полученного применением данного приближенного метода с шагом Н=- 2/г. Из формул (7) и (8) выводим у1п — 2nAtim+' = ΫΙ — 2m+1Anhm+\
§ 14] НЕКОТОРЫЕ ЗАМЕЧАНИЯ ОБ ОЦЕНКЕ ПОГРЕШНОСТЕЙ 225 Отсюда находим неизвестную постоянную У η - У In Л =7 '2n(2m - l)Am + ' и, следовательно, У2« = Ут — 2т-\ ■ [ ' Таким образом, приближенно можно положить j· \К~Угп\ ~2п- 1 (10) Заметим, что формулу (9), пренебрегая текущей погрешностью, иногда используют для оценки полной погрешности решения, приближенно полагая „ — ό "п — Угп ΠΙ) Угп—Угп 2т — 1 ' ' где й„ = }(*„, к., Л й„_,)· Применим принцип Рунге для опенки погрешности методов Рун- ге—Кутта и Адамса, причем ограничимся лишь рассмотрением дифференциального уравнения 1-го порядка У'=Ах,У) (12) при начальном условии у{х.)=у.· 03) 1. Метод Рунге — Кутта Порядок точности метода Рунге — Кутта для уравнения (1) есть т=4 [20], [18] (см. § 7). Поэтому из формулы (11), при сохранении введенных выше обозначений, имеем У1п = У*п — 1ь(Уп — Угп)> (14> 2. Метод Адамса Применяя вторую интерполяционную формулу Ньютона с остаточным членом (см. [23]), получим формулу погрешности метода XI ^тах|/геи)|^4+0?"+11^+6?)й«, = |1А*тм|/№(*)|. (15)
226 РЕШЕНИЕ ОБЫКНОВЕННЫХ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ [ГЛ. III Приближенно можно положить g^l и Α'/'4*) = Δ*(Λ/). Следовательно, £*=утах|Д4(/г.у')|. (16) Из формулы (15) вытекает, что порядок точности метода Адамса /и = 4. Кроме того, если Д4(/гу')—почти постоянны, то можно пользоваться формулой (9). Более точная оценка погрешности метода Адамса имеется у Коллатца [18]. Что касается текущей погрешности метода г,·, то оценка ее в общем случае затруднительна и этим вопросом здесь заниматься не будем. Заметим, однако, что различают устойчивые схемы вычислений, когда небольшие начальные отклонения затухают в процессе решения, и неустойчивые схемы вычислений, при которых даже ничтожно малые начальные отклонения неограниченно возрастают с увеличением числа шагов. Для дифференциального уравнения (12) можно указать еще один способ заключительной проверки. Имеем Д*»)=.У.+ $Л*. y(x)\dx. (17) Используя найденные приближенные значения y(xk) (й = 0, 1, 2, ..., п) и применяя к правой части равенства (17) одну из квадратурных формул, получим η где Ak — некоторые постоянные коэффициенты. За предельную абсолютную погрешность приближенного решения у(х) при xQ^x ^хп можно принять величину £«= \у{хп)— уЫ- Литература к третьей главе (1] В. В. Степанов, Курс дифференциальных уравнений, изд.· 2-е, ГТТИ, 1938. [2J И. Г. Петровский, Лекции по теории обыкновенных дифференциальных уравнений, Изд. 4-е, Гостехиздат, 1952. |3) Б. П. Демидова'!, Дифференциальные уравнения, Арт. инж, акад., 1955.
ЛИТЕРАТУРА К ТРЕТЬЕЙ ГЛАВЕ 227 [4] Г. П. Τ о л с τ о в, Курс математического анализа, т. I Гостехиздат, 1954, т. II, 1957. [5] Л. Э. Эльсгольц, Обыкновенные дифференциальные уравнения, Гостехиздат, 1950. [6] Дж. Стокер, Нелинейные колебания в механических и электрических системах, ИЛ, 1952, гл. III. |7j Ю. С. Сикорский, Обыкновенные дифференциальные уравнения, Гостехиздат, 1940, гл. III. [8] Д. А. Вентцель и Я. М. Шапиро, Внешняя баллистика, Оборон- гиз, 1939, гл. III и VI. [9] Дж. Д. Биркгоф, Динамические системы, Гостехиздат, 1941, гл. ГХ. [10 А. Н. Крылов, Лекции о приближенных вычислениях, изд. АН СССР, 1933, гл. VII. [11] Э. Гурса, Курс математического анализа, т. II, ч. 2, ГТТИ, 1933, гл. XIX. |12] Г. Гогейзе л ь, Обыкновенные дифференциальные уравнения, ГТТИ, 1937, гл. II. [13] Г. Π и ад ж и о, Интегрирование дифференциальных уравнений, ГТТИ, 1933, гл. IX. [14] В. Э. Милн, Численное решение дифференциальных уравнений, ИЛ, 1955, гл. III. [15] С. А. Чаплыгин, Новый метод приближенного интегрирования дифференциальных уравнений, Гостехиздат, 1950. [16] Η. Η. Л узи н, О методе приближенного интегрирования акад. С. А. Чаплыгина, Труды ЦАГИ, 1932. [17] Е. Я н к е и Ф. Э м д е, Таблицы функций с формулами и кривыми, Гостехиздат, 1948. [18] Л. К о л л а т ц, Численные методы решения дифференциальных уравнений, ИЛ, 1953, гл. I. [19] Дж. С к а р б о ρ о, Численные методы математического анализа, ГТТИ, 1934, гл. XI, XIII. |20] Я. С. Безикович, Приближенные вычисления, ГТТИ, 1931, гл. X. [21] СВ. Фролов, Приближенные вычисления, МВТУ, 1948. [22] Г. М. Фихтенгольц, Математика для инженеров, ч. II, вып. 2, ГТТИ, 1933, гл. XVII. [23] Б. П. Демндовлч, И. А. Марон, Основы вычислительной математики, Физматгиз, 1960, гл. XIV. [24] И. С. Б е ρ е з и и, Н. П. Жидко в, Методы вычислений, Физматгиз, 1959, ч. II, гл. IX. [25] Г. Н. Положий и др. Математический практикум, Физматгиз, 1960, гл. V. [26] Система стандартных подпрограмм, под ред. М. Р. Шура-Бура, Физматгиз, 1958, гл. VII. [27] Д. А. Вентцель, Е. С. Вентцель, Элементы теории приближенных вычислений, изд. ВИА им. Жуковского (1949), гл. VIII. [28] Г. В. Оппоков, Численное интегрирование дифференциальных уравнений, ГТТИ, 1932, гл. II.
ГЛАВА IV КРАЕВЫЕ ЗАДАЧИ ДЛЯ ОБЫКНОВЕННЫХ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ § 1. Общая постановка краевой задачи Рассмотрим дифференциальное уравнение я-го порядка (я 2з 2) F(x,y, У\ .... У'") = 0. (1) Краевая задача для уравнения (1) заключается в следующем: найти решение у=у(х) уравнения (1), для которого значения его производных y<*=yto{xt) (s = 0, 1 а,) в заданной системе точек х^=-х1 (/=1, 2, ..., k; k^2) удовлетворяют η независимым между собой краевым условиям, в общем случае нелинейным: V,О»,. X, · · ·- У{^} Ун. У'„. ■■■> У<У = ° Ι2) (v=l, 2, ..., η), где σ,- = т™ σ/ν. Так как в силу уравнения (1) производные y{S> порядка я и выше могут быть в общем случае-выражены через искомую функцию у и ее младшие производные у', у", ..., у1"'1', то можно считать, что σ,·,</ζ—1 (/=1, 2, ..., k; v=l,2, ..., я). (3) Краевая задача (1) — (2) часто встречается в приложениях. Приведем примеры конкретных краевых задач. Пример 1. Простейшая двухточечная краевая задача. Найти функцию у =у(х), удовлетворяющую дифференциальному уравнению второго порядка у"=/[х,у,у') (4)
§ И ОБЩАЯ ПОСТАНОВКА КРАЕВОЙ ЗАДАЧИ 229 у- Рис. 39. и принимающую при х = а и x = b (a<^b) заданные значения у(а)=А; у(Ь)=В. Геометрически это означает, что требуется найти интегральную кривую дифференциального уравнения {4), проходящую через данные точки Μ (а, А) и N(b, В) (рис. 39). Пример 2. Видоизменением задачи, приведенной в примере 1, будет: найти такое решение у =у (х) дифференциального уравнения (4), чтобы У (а) = Л,; у (ft) = В,. Геометрически это сводится к отысканию интегральной кривой уравнения (4), пересекающей прямые х=-а и х = Ь под заданными соответственно углами аир та- У\ \ 1 кими, что \g* = Al и tgp=£, (рис. 40). Пример 3. Можно рассмотреть также смешанную краевую задачу: найти решение у=у(х) дифференциального уравнения (4), рис 4υ удовлетворяющее условиям у(а)=А; У (*)=£»,. Иными словами, требуется найти интегральную кривую уравнения (4), проходящую через заданную точку Μ (а, А) и пересекающую прямую х=.Ь под данным углом β, где tgj3— β, (рис. 41). Заметим, что общая краевая задача (1) — (2) может а) не иметь решений; б) иметь единственное решение; в) иметь несколько и даже бесконечно много решений. Пример 4. Краевая задача имеет бесконечно много решений вида y = csiax, (5) где с — произвольная постоянная.
230 КРАЕВЫЕ ЗАДАЧИ ДЛЯ ОБЫКНОВЕННЫХ ДИФФ. УРАВНЕНИЙ [ГЛ. IV Краевая задача у"-\-у = имеет единственное решение :0, у(0) = 0, y(b) = \ при 0<6<π JV sin £» а при 6 = π совсем не имеет решений (рис. 42). В дальнейшем, как правило, будем предполагать, что решение краевой задачи существует и оно единственно. Наша цель будет заключаться в нахождении этого решения. Специфическую особенность имеют краевые задачи (1) — (2), где одна или две из абсцисс xt принимают значения ^ со. С такими задачами приходится сталкиваться, например, в квантовой механике. Приведем типичную постановку одной из таких задач. Пример 5. Найти решение x = x(t) нелинейного дифференциального уравнения Рис. 41. х-\-х/(х, χ) + φ(χ) = 0 (*=$), (6) удовлетворяющее краевым условиям х(0) = л;0; х(-]-оо) = А, где A = A{xt). Таким образом, речь идет о разыскании интегральной кривой дифференциального уравнения (6), проходящей через данную точку Λί(0, χ0), ограниченной на бесконечном интервале (0, -{- со) и имеющей при t—>-|-со некоторую горизонтальную асимптоту х = А, причем величина А также должна быть определена по заданному значению х0 (рис. 43). Аналогично ставятся краевые задачи для систем дифференциальных уравнений. Заметим, что краевые условия вида (2) не исчерпывают всех краевых задач. В некоторых случаях отдельные значения абсцисс хь в которых задаются значения искомой функции у или ее производ- Рис. 42.
§ И ОБЩАЯ ПОСТАНОВКА КРАЕВОЙ ЗАДАЧИ 231 x-x(t) ных, также остаются неизвестными и должны быть найдены из условий задачи. К числу таких задач относится, например, задача о поражении цели баллистическим снарядом. Пример 6. Как известно, дифференциальные уравнения движения снаряда с учетом сопротивления воздуха имеют вид х=~ £cosB, I у = — Esine— gj \'ι (точки обозначают дифференцирование по времени t), где Ε — Ε (у, ν) — известная функция высоты у и скорости * v = Vx2+y*{ g = g(y) — ускорение силы тяжести; Рис. 43. у-ум θ = arctg 4 χ угол на- S 0 1/ rfe \jM 1 Xj Рис. 44. клона к горизонту касательной к траектории снаряда. Предполагая, что в момент ί=ία снаряд был брошен в точке О (О, 0) с начальной скоростью ν0, направленной под углом θ0 к горизонту, и в момент времени / = ί, поразил неподвижную цель /И с координатами х = хх и y=.yi (рис. 44), получаем следующую систему краевых условий: х = 0; у = 0, \ χ = α0 cos У0, j/ = u0 sine, при t = t0, S t = t.. I x — x, при t = t,, (8) У=У1 где угол бросания θ0 (параметр) и момент поражения цели t, также являются неизвестными. Решив краевую задачу (7) — (8), получаем возможность найти начальный угол бросания θ0 = arctg ^, χ« где х0 = л:(<0) иу0=у (t0), при котором достигается поражение цели. Задача усложняется, если цель подвижна.
232 КРАЕВЫЕ ЗАДАЧИ ДЛЯ ОБЫКНОВЕННЫХ ДИФФ. УРАВНЕНИЙ [ГЛ. IV § 2. Линейная краевая задача Рассмотрим более подробно важный частный случай, когда дифференциальное уравнение и краевые условия линейны. Такая краевая задача называется линейной краевой задачей. Линейное дифференциальное уравнение я-го порядка сокращенно можно записать 'в виде где ф]=Ро МУ'+р, (*)У"-ЧЧ- · · · +p«i*)y, причем обычно предполагается, что pt(x) (* = 0, 1 η) и f(x)— известные непрерывные функции на данном отрезке \а, Ь]. Для простоты будем предполагать, что в краевые условия входят две абсциссы хЛ=а и хг = Ь (а<^Ь) — концы отрезка [а, Ь]. Такие краевые условия называются двухточечными. Краевые условия называются линейными, если они имеют вид Ъ.[У] = Ъ (v=l, 2, ..,,л), (2) где #v b] = Σ Κν) у™ w+ΡΓ-ν^ (*)] 4 = 0 и α<ν>, β(ν), γ,— заданные постоянные, причем 2^la*V)l + IPiv)l)=^0 при v==l, 2,...,л. Например, краевые условия, приведенные в § 1 (примеры 1, 2,3), линейны, так как их можно записать в виде а.у (а) -\- ау (а) = γ,; $у (b) -f $у (b) = γ,, где α, α,, β, β,, γ,, γ2 — заданные постоянные. Действительно, для задачи примера 1 имеем а=1; а,=0; γ, = /4; β=1; β, = 0; γ2 = β и т. д. Линейными краевыми условиями являются также условия периодичности, которые в случае дифференциального уравнения второго порядка имеют вид у(а) = у(Ь), у'(а) = у'ф). Линейная краевая задача состоит в нахождении функции у=у{х), удовлетворяющей дифференциальному уравнению (1) и краевым условиям (2), причем последние предполагаются линейно независимыми. Линейная краевая задача называется однородной, если: во-первых, /(λ;)=ξ0 при a^xz^b, т. е. дифференциальное уравнение (1) однородно, и, во-вторых, γ, = 0 (у=1,2 я), т. е. имеют место
§ 2] ЛИНЕЙНАЯ КРАЕВАЯ ЗАДАЧА 233 однородные краевые условия; в противном случае краевая задача (1)—(2) называется неоднородной. Пример 1. Рассмотрим задачу об изгибе горизонтальной балки длиной /, лежащей на двух 'опорах х = 0 и х = /, под действием распределенной поперечной нагрузки с линейной плотностью q = q(x) (рис. 45). Из курса сопротивления материалов известно, что вертикальный прогиб однородной балки приближенно удовлетворяет линейному дифференциальному уравнению [EJ(x)f\" = q(x), (3) где Е1(х) — жесткость балки при изгибе, причем изгибающий момент Μ и поперечная сила Q определяются из соотношений М = Е1(х)у" и Q = M' = [EI(x)y"]'. Краевые условия зависят от способа заделки концов балки. Приведем основные случаи. 2> «- 7л " Рис. 45. 1. Конец свободен. Нулю равны изгибающий момент Μ и поперечная сила Q. Поэтому краевые условия для свободного конца балки есть / = 0 и /" = 0. (4) 2. Конец шарнирно оперт. Нулю равны прогиб у и изгибающий момент М. Поэтому краевые условия для шарнирно опертого конца есть у = 0 и у" = 0. (4') 3. Конец жестко заделан. Нулю равны прогиб у и угол поворота !f = arctgy. Поэтому краевые условия жестко заделанного конца есть у = 0 пу' = 0. (4") Возможны также другие более сложные случаи краевых условий.
234 КРАЕВЫЕ ЗАЛАМИ ДЛЯ ОБЫКНОВЕННЫХ ДИФФ. УРАВНЕНИЙ fГЛ. IV Задача (3)—(4), очевидно, является линейной краевой задачей. Пример 2. Пусть жесткость балки EI постоянна, тогда уравнение (3) для прогиба у заменяется следующим уравнением: EIy™ = q(x). (5) Предположим, что балка шарнирно закреплена на конце х = 0 и жестко заделана на конце х = 1. В таком случае для прогиба у выполнены краевые (граничные) условия: у{0) = 0, /(0) = .у (0 = о, /(/) = 1} Краевые условия (6) являются линейными однородными, так как их можно записать в виде Гу (0) -f- 0/ (0) + Оу (/) + 0/ (/) = О, Оу (0) + 1/ (0) + Оу (/) + Оу' (/) = О, 0У (0) -|_ Оу" (0) + \у (I) + Оу' (I) = О, Оу (0) -f Оу" (0) + Оу (I) + 1/ (/) = 0. Краевую задачу (5)—(6) решить нетрудно. Предполагая для простоты, что плотность нагрузки постоянна: д(х)=р, будем иметь Е}У=Р^ + сгх' + Vs + сгх + с4. Из граничных условий (6) вытекает с = — £■ с =0· с =р—· с =0 Таким образом, искомое решение есть y = ^F/(2xl-3lx'Jrl'x). Этот пример показывает, что в случае, когда можно найти общее решение дифференциального уравнения, двухточечная краевая задача не более трудна, чем задача с начальными условиями. Однако, если общее решение уравнения не может быть найдено регулярным путем, то решение краевой задачи приводит к новым трудностям, так как не имеется начальной точки, исходя из которой, можно было бы построить решение одним из рассмотренных выше методов. Однородная краевая задача (1)—(2) всегда имеет тривиальное решение у(х)^^0. Однако во многих случаях представляют интерес нетривиальные решения этой задачи, которые существуют не всегда. Поэтому в дифференциальное уравнение (1) или в краевые
§ 2] ЛИНЕЙНАЯ КРАЕВАЯ ЗАДАЧА 235 условия (2) вводят параметр λ, варьируя который, можно добиться, чтобы при некоторых его значениях соответствующая краевая задача имела нетривиальные решения. Эти исключительные значения параметра называются собственными значениями или характеристическими числами задачи, а отвечающие им нетривиальные решения — собственными функциями задачи. Таким образом, приходим к так называемой задаче о собственных значениях — важнейшей задаче современного математического анализа. Пример 3. Рассмотрим задачу о продольном изгибе стержня постоянной жесткости £7 под действием сжимающей силы Р, направ- Рис. 46. ленной вдоль оси стержня (задача Эйлера). Предположим, что левый конец стержня х = 0 заделан, а правый х — 1 оперт (рис. 46). Как известно, величина у =_у (х) — отклонение стержня от его оси удовлетворяет дифференциальному уравнению у™+шу" = о, (7) где Ρ играет роль параметра. Кроме того, согласно способу заделки стержня на его концах должны быть выполнены краевые условия: y{i)=y"(i) = o- \ (8) Требуется найти минимальное значение силы Ρ — так называемую критическую силу, при которой возможен продольный изгиб. Математически этот вопрос сводится к определению наименьшего положительного значения параметра Р, при котором краевая задача (7) — (8) имеет нетривиальное решение. Общее решение дифференциального уравнения (7) имеет вид у = cl-\- ctx-\-с, cosolx-J-с4sinэ.х, где и с,, с2, с3, с4 — произвольные постоянные.
236 КРАЕВЫЕ ЗАДАЧИ ДЛЯ ОБЫКНОВЕННЫХ ДИФФ. УРАВНЕНИЙ [ГЛ. IV На основании первых двух краевых условий (8) получаем Отсюда и, следовательно, /ι \ \ f sin ах\ у = сх (1 — cos ах) -\- сг ( χ 1. Два вторых краевых условия (8) в связи с тем, что α =έ= О, дают 0 = с,(1— zos αϊ)-\-cJl „ , , sin al О == с, cos 0.1 -4- с, . l_al\ а )' (10) Таким образом, для определения постоянных с, и с2 получена однородная линейная система. Согласно смыслу задачи представляют интерес лишь решения, отличные от нуля; поэтому определитель системы (10) должен быть равен нулю, т. е. 1 — cos α/ I - sin Л cos α/ sin αί = 0 (Π) sin α/ — α/ cos α/ = 0. Отсюда будем иметь tg'a = α/ и, следовательно, α/ = μ, (12) где μ = 4,493 ... —■ наименьший положительный корень трансцендентного уравнения tgμ = μ. Из формул (9) и (12) выводим V?E! Εί Точное решение краевой задачи возможно в редких случаях. Поэтому в дальнейшем будут рассмотрены приближенные методы решения краевых задач, причем для простоты в основном ограничимся линейным дифференциальным уравнением второго порядка и линейными краевыми условиями простейшего вида — точечно разделенными *). *) Каждое из этих условий будет содержать лишь одну из абсцисс.
§ 3] РЕДУКЦИЯ К ЗАДАЧЕ КОШИ ДВУХТОЧЕЧНОЙ КРАЕВОЙ ЗАДАЧИ 237 § 3. Редукция к задаче Коши двухточечной краевой задачи для линейного уравнения 2-го порядка Дано линейное дифференциальное уравнение У" + Р(х)у' + 9(х)У=/(х), 0) где функции р(х), д(х), f(x)— непрерывны, и требуется найти его решение, удовлетворяющее краевым условиям: ,.У0) + Р,/(*) =ί} (αο' αι> βο> Pi» А В—заданные постоянные, причем |а01 -\-\ а, | фО " 1Р.1 + 1Р,|¥=о)· Решение будем искать в виде линейной комбинации y = cu-{-v, (3) где и = и(х) — ненулевое решение соответствующего однородного уравнения u4-\-p(x)u'-\-q(x)u = 0, (4) a v — v(x) — некоторое решение данного неоднородного уравнения (1) v"-\-p(x)v' -\-q(x)v=f(x). (5) Очевидно, функция j/, определяемая формулой (3), где с — произвольно, есть решение уравнения (1). Потребуем, чтобы первое краевое условие (2) выполнялось для функции у при любом с. Используя это краевое условие, будем иметь са0и (а) -\- o.0v (a) -\- са.у (а) -\- а,г>' (а) = А или с [ааи (а) -{- л У (а)] -\- a0v (а) -\- а. у (а) — А. (6) Для того чтобы равенство (6) было справедливо при любом с, необходимо и достаточно, чтобы коэффициент при с обращался в нуль, т. е. должны быть выполнены равенства а0и(а)-{-а.у (а) = 0; (7) a0v(a)-\-ay (а) = А. (8) Для обеспечения равенств (7), (8) достаточно, например, положить u{a) = o.xk, и'(а) = —а0&, (9) где постоянная k отлична от нуля; ν(α) = ^-, υ'(α)ζ=0, (10)
238 КРАЕВЫЕ ЗАДАЧИ ДЛЯ ОБЫКНОВЕННЫХ ДИФФ. УРАВНЕНИЙ [ГЛ. IV если а0^0, и v(a)=0, v'(a) = At (П) а, если а, =т^=0. Отсюда видно, что и есть решение задачи Коши для однородного уравнения (4), удовлетворяющее начальным условиям (9), а υ есть решение задачи Коши для неоднородного уравнения (5), удовлетворяющее начальным условиям (10) или (11). При этом для любого с функция у = си -\- ν удовлетворяет краевому условию на конце х = а. Подберем теперь постоянную с так, чтобы функция у удовлетворяла краевому условию (2) на конце х = Ь. Это дает с [р.« (Ь) + Р."' I*)] + [р.* (*) + РУ (Ό] = в> откуда Ро« (*) -Ь Pi"' (*) " При этом предполагается, что знаменатель р,и(*)+Р,и'(*)=^0. (12) Таким образом, краевая задача (1)—(2) сведена к двум задачам Коши для функций и(х) и v(x). Заметим, что если обеспечено условие (13), то краевая задача (1) — (2) имеет единственное решение. В противном случае она или совсем не имеет решений, или их бесчисленное множество. Замечание. Если исходное уравнение (1) однородное, т. е. /(.*) = 0 и, кроме того, /4 = 0, то в силу условий (10) или (11) имеем ν(α) = 0 и ν'(α) = 0 и, следовательно, г» = 0. Поэтому у — си(х), где и(х) есть решение уравнения (4), удовлетворяющее начальным условиям (9). В этом случае _ В с "~Ро» (») + М' ФУ Пример 1. Найти решение однородного уравнения y"-\-yd\x = Q, (13) удовлетворяющее краевым условиям: Я0) = 0; у(\) = 1. (14) Решение. Сравнивая условия (14) с общими краевыми условиями (2), видим, что а, = 1, а, = 0, Л = 0; р, = 1, р, = 0, В=\.
§ 41 метод конечных разностей 239 В силу приведенного выше замечания решение ищем в виде у = си(х), где и(х)— решение однородного уравнения и" -\-uchx-0, (15) удовлетворяющее начальным условиям (9), где принято k = —1,т. е. и(0) = 0; и'(0)=1. (16) Из второго краевого условия (14) получаем ск(1)=1, отсюда с=—γ-~. Решая любым численным методом задачу Коши (15)—(16), находим и(х), а следовательно, и постоянную с, после чего определяем у. Таблица 60 Решение краевой задачи для однородного уравнения (13) X 0 0,2 0,4 0,6 0,8 1 и{х) 0 0,199 0,389 0,563 0,710 0,819 у(х) 0 0,243 0,475 0,687 0,867 1 В данном случае соответствующая задача Коши решена в гл. III, § 12. Необходимые данные находятся в таблице 58. Так как и (1) == 0,819, то с= 1,221 и у— 1,22\и(х). Окончательные результаты вычислений приведены в таблице 60. § 4. Метод конечных разностей Рассмотрим линейное дифференциальное уравнение у"+р{х)у'+д(х)у=/(х) (1) с двухточечными линейными краевыми условиями <*j(a)-\-ay(a) = A, \ %У{Ь)+$У{Ь)=В J (ΚΙ + ΚΙ^ο, ΙΡ,Ι + ΙΡ,Ι^Ο), где ρ (χ), q(x) и J (χ) — непрерывны на отрезке [а, Ь\.
240 КРАЕВЫЕ ЗАДАЧИ ДЛЯ ОБЫКНОВЕННЫХ ДИФФ. УРАВНЕНИЙ [ГЛ. IV Одним из наиболее простых методов решения этой краеной задачи является сведение ее к системе конечно-разностных уравнений. Для этого разобьем основной отрезок [а, Ь] на η равных частей длины h (шаг), где , b — а η Точки разбиения имеют абсциссы: xi=x0~\-ih (i = 0, 1, 2, ..., η); χ0 — a; xn = b. ι Уо .Α, У> J > У ι J_^ ^ >Α> ^ Jt Уп ■ 0 χ0-α χ, Рис. 47 χ,-ь Значения в точках деления xt искомой функции у=у(х) (рис. 47) и ее производных у'=у'(х), у"=у" (х) обозначим соответственно через У1—У(хд, У\=У'{хд, У'1=У"(хд- Введем также обозначения: Pi=p{Xi), Яг = Я(хд, fi=f{Xi)- Заменяя производные правыми односторонними конечно-разностными отношениями, для внутренних точек xt отрезка [а, Ь] приближенно будем иметь У1 __ Уi+i. —У; ,,» _У1+2 — tyi+i + yj (3) Для концевых точек хп = а и χ -b полагаем У»- _у>—у» и ν· ^Уп^-ln И У" ~1г (4) Используя формулы (3), дифференциальное уравнение (1) при x = xt (i=l, 2, ..., я — 1) приближенно можно заменить линейной системой уравнений Уш - Ъш +yijrPi ll±^yj + qiyi = fi 0 = 0,1,2,..., й-2). (5) Кроме того, в силу формул (4) краевые условия (2) дополнительно дают еще два уравнения: В. (6). Таким образом, получена линейная система я —|— 1 уравнений с «4-1 неизвестными у0, у·, уп, представляющими собой значе-
§ 4] МЕТОД КОНЕЧНЫХ РАЗНОСТЕЙ 241 ния. искомой функции у=у(х) в точках х0, х1,...,хп. Решив эту систему, если это возможно, получим таблицу значений искомой функции у. Более точные формулы получаются, если воспользоваться симметричными конечно-разностными отношениями: (7) (/==1,2, ...,«—1). Для производных в концевых точках х0 = а и хп — Ь в общем случае по необходимости приходится пользоваться формулами (4). Отсюда получаем систему. Л2 \ρί 2Л ΊΤ4ύΊ J ι (/=1, 2, ...,«—1), У/ л у,+, V/ + i -У,- 2Л -2у, Л2 t 1 -Ьу/_, Ы + ^Ь-Г^^А, (8) Пример. Методом конечных разностей найти решение краевой задачи y(-i)=jO) = o. О) Механически уравнения (9) представляют собой дифференциальные уравнения для изгибающего момента некоторого бруса с переменным поперечным сечением и шарнирно закрепленными концами. Для грубого решения выберем шаг й = —. Полагая χ =—1, χ = — -L —η —J. —1 — 2 ' Χο — > -"ч — ο ' Χζ — ' ввиду симметрии уравнения и краевых условий, будем иметь: У-г=Уг = Ъ У-,=У, (рис. 48). Таким образом, нужно определить лишь две ординаты Уо " Уг Уг/ -ι ■ У-, 1 2 У Уо 0 Ϊ 'ис ^N 1 г 48. \& / I
242 КРАЕВЫЕ ЗАДАЧИ ДЛЯ ОБЫКНОВЕННЫХ ДИФФ. УРАВНЕНИЙ [ГЛ. IV Полагая χ=0 и пользуясь симметричными формулами для производных, будем иметь У"-|>+*+* = -!, 4 . 1 где У-, =У1· Аналогично при х = -^ получаем 4 Следовательно, используя краевое условие у2 = 0, имеем систему -7y. + 8j\=-l, \ 4Уо — 6-5-у1 = 1, J откуда у, = 0,967; j,1== 0,721. При большом η непосредственное решение системы (5), (6) или соответственно системы (8) становится затруднительным. В этом случае решение краевой задачи целесообразно заменить, используя результаты предыдущего параграфа, решением двух задач Коши. Например, предполагая, что а0=^0, имеем y = Cu-{-v, (10) где и находится как решение задачи Коши и" -\- ρ (χ) и' -\- (/ (х) и = 0, и(а)= а„ и'(а) = — а„, (И) a v—как решение задачи Коши (12) υ"-\-ρ(χ)υ' -{-<] (χ)ν=/(χ), \ ν[α) = -4-, Ό'(α) = 0. ] Постоянная С в силу краевых условий (2) имеет значение г_ в- |М(Я + М'(»)1 (П, М(») + М'(*) ' у ' Заменяя дифференциальное уравнение (11) соответствующим конечно-разностным уравнением, получим ¥ rPt 2Λ г ЯЛ — ϋ (/=1,2, ..., η—Ι)
§ 4] МЕТОД КОНЕЧНЫХ РАЗНОСТЕЙ 243 «0= *,. "ο=αι. "ι=α.—Ляо> Отсюда будем иметь (2_?,л»)в,·- I -Ц-h )„,_, «ί+ι = ~ ■ (i=l, 2, ..., л—1). С помощью этого процесса находим (14) и'(*> - *·π "η—ι Аналогично, заменяя дифференциальное уравнение (12) конечно-разностным уравнением, будем иметь д2 — -f- Pi Yh -Y 4ίνι —h (/=1,2, ..., /i—l) 11 β„ ' h Отсюда получаем _ А_ __ _А_ (2-?/A',W(-fl-£iA)t./_,+*'// 14-4'Λ (15) (/=1,2, ...,«— 1). Таким образом, последовательным процессом можно вычислить ν (Л) = ип и σ'(Λ)=ί^»-. Тем самым мы получаем возможность из формулы (13) найти постоянную С, а затем определить значения yt (i = 0, 1,2, , η) по формуле yi = Cul-\-vi ^16) (ί = 0, 1, 2, ..., β).
244 КРАЕВЫЕ ЗАДАЧИ ДЛЯ ОБЫКНОВЕННЫХ ДИФФ. УРАВНЕНИЙ [ГЛ. IV Формулы для расчета упрощаются, если краевые условия имеют вид у(а) = А; у[Ь) = В. В этом случае α, = β0=1, ^ = ^ = 0 и мы получим к0 = 0, и, = /г, νιί = Α, νι = Α, причем Замечание. Приближенные значения у можно уточнить, производя вычисления с двумя различными тагами. Пусть yh и ун — приближенные значения у при шаге h и соответственно шаге //. Предполагая, что ошибка пропорциональна квадрату шага, будем иметь у — yh*=c*h\ у-ун^С*Н\ Отсюда, считая, что постоянная С* не зависит от шага, получим У~Уп_У~Ун и, следовательно, ffy/i — h*yH fis § 5. Метод прогонки При применении метода конечных разностей к краевым задачам для дифференциальных уравнений второго порядка получается «трехчленная система* линейных алгебраических уравнений, каждое из которых содержит три соседних неизвестных. Для решения такой системы разработан специальный метод, получивший название метода прогонки.. Рассмотрим линейное дифференциальное уравнение у"+р(х)/Л-я(х)у=/(х) (1) с двухточечными линейными краевыми условиями *оУ{а) + *У{а) = А, Р^(*) + РУ(*) = Я (2) (ΚΙ+ΚΙ^Ο; Ιβ.Ι+ΙΡ,Ι^Ο) в предположении, что функции ρ (χ), q (χ), /(χ) непрерывны на [a,b].
§ 5] метод прогонки 245 От дифференциального уравнения (1) обычным приемом перейдем к конечно-разностному уравнению. Для этого разобьем отрезок [а, Ь\ , Ь — а на п. равных частей с шагом п = . η Полагая х[ = х0-\-Ш; х0 = а; хп — Ь (« = 0, 1, 2, ..., я) и вводя обозначения P(Xi)=Pt, q(Xi)=qi, /(*,·)=//. Ж-)=.Уг. получаем при x = xt вместо дифференциального уравнения (1) следующее конечно-разностное уравнение: 7? 1 Pi —й г Я σι —ft · Отсюда после упрощения будем иметь У иг + (- 2 + hPi) У и, + (1 - ΑΡί + *'«*) У/ =Л*', (3) или, введя сокращенные обозначения — 2-\-hpl = mi, 1 — йрг -f hiqi = я,·, окончательно получим У!+г + »/У/+, + «Л =ffi* (i = 0, 1, 2, .. ., л — 2), (4) причем из краевых условий (2) имеем (5) Линейная система (4), (5) состоит из я-|-1 уравнений относительно п-\-\ неизвестных уо, ylt у2, ...,уп. Эту систему можно решить обычным способом. Однако укажем другой, более короткий путь. Разрешая уравнение (4) относительно У;+,, находим Предположим, что с помощью полной системы (4) из уравнения исключен член, содержащий yt. Тогда уравнение (6) может быть записано в виде yt + l = Ci(di—yi+i)· СО
246 КРАЕВЫЕ ЗАДАЧИ ДЛЯ ОБЫКНОВЕННЫХ ДИФФ. УРАВНЕНИЙ [ГЛ. IV где коэффициенты с;, di подлежат определению. Найдем формулы для этих коэффициентов. При / = 0 из формулы (6) и краевых условий (5) следует, что _ tf_ , _ щ 1_ У* та '* таУо т0 Уг' <*,>>, — Ah У" "а, — а0Л ' Исключая из этих двух уравнений yQ, получим:. _ /о кг "о а<У\ ~ М L., Разрешая последнее уравнение относительно _у,, находим т„ o[j — α0/ζ ' т„ гпа У ι — " ~ 1 + -^ ш„ а, — α„Λ ""ЛЙ +/.*,-зО- (8) га0 (or, - a0h) -f n„ai Vai ~ αοΛ Но согласно формуле (7) имеем У. = '.(</„—.У,)· (9) Отсюда, сравнивая формулы (8) и (9), находим с — "' ~ "»л ) 0 '»,.(αι -«ол) + »оа1 ' I Пусть теперь i> 0 (ί=1,2, . ..,я — 2). Выражая у,-по формуле (7), получим Подставляя это выражение в формулу (6), будем иметь Разрешая полученное уравнение относительно _у,-+1, находим Л ι 2 "i j I /г ~ Ci-llli I У/+2 τη, '-1 или
§ 5] МЕТОД ПРОГОНКИ 247 Отсюда, сравнивая формулы (7) и (II), получаем для коэффициентов С[ и dt рекуррентные формулы: I mt — И/с, _, /,/г2 — niCi ('=1, 2 я —2). </, = /,*' — «,ί,.,ί,., Г (12) На основании формул (12), используя формулы (10) для с0 и rf0, можно последовательно определить коэффициенты с,- и dt (/=1,2, ..., я— 2) до сп_2 и ап_г включительно (прямой ход). Из формулы (7) при i — n — 2 и второго краевого условия (5) получаем Уп-, = с„.г(й?„_2 — у„), ϊ Решая эту систему двух уравнений относительно у„, будем иметь y"-p,(i+-C„-2) + M· Ud) Теперь, используя формулу (7) и первое краевое условие (5), мы можем последовательно найти уя_,, у„_2, ..., у0 (обратный ход): уя-2 = сп-,(<*„-,— у«-Л V, = co(rfo— У,). Вычисления удобно расположить в виде таблицы 61. Схема метода прогонки (14) Таблица 61 ί Ci «Г/ */ У, 0 с.(10) d„(10) χ„ = α V0U4) I «1 <*, X, Vl 2 «J d2 K2 v2 ... ..· ... ... ... n—2 С П-2 ап-г ^П —2 V'rt-2 π—1 ■^n — l Vn-1 η χη = ι> ν„Π3,
248 КРАЕВЫЕ ЗАДАЧИ ДЛЯ ОБЫКНОВЕННЫХ ДИФФ. УРАВНЕНИЙ [ГЛ. IV Для простейших краевых условий: у(а) = А, у(Ь) = В формулы для с0, da, уа и уп упрощаются. А именно, полагая «.= ·. «,=0 и β.= 1, Р, = 0, из формул (10), (13) и (14) будем иметь со = ^. <O = -V4~/„*2 (15) j» = *. л = л· (16) Заметим, что метод прогонки обладает устойчивым вычислительным алгорифмом [6], [7], т. е. ошибки округления не вызывают неограниченного возрастания погрешности решения. Метод прогонки применим к широкому кругу задач (см., например, гл. V, § 10) и допускает простую реализацию на электронных счетных машинах. Пример 1. Методом прогонки найти приближенное решение уравнения у"-\-у=\, (17) удовлетворяющее краевым условиям: /(0) = 0, /(°)=°. ι (20) Решение. Примем й = у= и от уравнения (1 7) и краевых условий (18) перейдем к соответствующим конечно-разностным уравнениям Λ+,-2Λ+Ι-Ηΐ+Λ·)Λ=1 (19) (< = 0, 1, 2, 3), Уравнение (19) приводим к виду (7): у1+1=с,(с1,— yUl). Пользуясь введенными выше обозначениями, имеем: », = — 2, ас = 0, р0=1, /ι,.= 1 +Λ% α, = 1, р, = -1, /(.= 1, А = 0, β=2.
§ 5] МЕТОД ПРОГОНКИ 249 Поэтому из формул (10) и (12) получаем: 1 , </, = *·-(!+AVi-.d/-. "ι— 2 + (l+A')C/_, ('=1,2,3). По этим формулам определяем с,- и <ί(· (/ = 0, 1, 2, 3) и записываем результаты в первых двух строках таблицы 62. Затем, используя формулу (13), находим последнее значение -(1+с,) + А Далее по формулам (14) вычисляем у1? у„ уг, у, и у0. Для сравнения в последней строке таблицы 62 даны значения точного решения у= 1 -\- cos χ в точках х( (i = 0, 1,2,3, 4, 5). Таблица 62 Решение краевой задачи (17)—(18) методом прогонки /' с1 di X; У; У/ 0 — 1,110 0,099 0 1,849 2 I - 1,282 0,220 π ТО 1,843 1,9511 2 — 1,692 0,409 π ΊΓ 1,759 1,8090 3 -7,143 0,860 3π 10 1,592 1,5878 4 2π 5 1,350 1,3090 5 π "2~ 1,049 1,000 Из приведенных данных видно, что расхождение решений точного yi и приближенного у,- довольно значительно, что объясняется выбором сравнительно крупного тага h. Пример 2. Методом прогонки найти приближенное решение уравнения у" — 2ху' — 2у= — 4х, (21) удовлетворяющее краевым условиям: У(0)-/(0) = 0, ι д>(1)=1+е = 3,718./ (22)
250 КРАЕВЫЕ ЗАДАЧИ ДЛЯ ОБЫКНОВЕННЫХ ДИФФ. УРАВНЕНИЙ [ГЛ. IV 1 Ρ е ш е н и е. Примем Л=:-гтг и от уравнения (21) и краевых условий (22) перейдем к соответствующим конечно-разностным уравнениям У и* - (2 + 0,2*,) yi+i + (0,98 + 0,2*,.) yt = - 4h\ (23) l' = 0, 1, 2, 3 8), где уо 0,1 ' > Λ. = 3,718. > Уравнения (23) приводим к виду (7) Л+|=с/(й« — У;+2)· Пользуясь введенными выше обозначениями, имеем: и,. = —2 — 0,2*,., α„ = 1, ββ = 1, (24) = 0,98+0,2x,·, α,=—1, β, =0, = — 4*,., /1 = 0, β = 3,7Η Составляем таблицу значений от,·, я,- и /,■ для /=0,1, ... ,10. Таблица 63 Значения коэффициентов уравнения (23) i га,- "i ft 0 —2 0,98 0 ι —2,02 1,00 —0,4 2 —2,04 1,02 —0,8 3 —2,06 1,04 — I,2 4 -2,08 1,06 — 1,6 5 —2,10 1,08 -2,0 ь —2,12 1,10 —2,4 7 —2,14 1,12 —2,8 8 -2,16 1,14 9 -2,18 1,16 -3,6 10 —2,20 1,18 —4,0 Пользуясь этой таблицей, по формулам (10) и (12) находим с,- и </,. (г' = 0, 1, 2, ... , 8). Полученные результаты записываем в первых двух строках таблицы 64. Таблица 64 Решевие краевой задачи (21) — (22) методом прогонки ί С/ а, X; V/ II —0,899 0 0 0,992 1 I —0,899 —0,004 0,1 1,091 1,110 2 —0,885 —0,012 0,2 1,214 1,241 3 —0,878 —0,0223 0,3 ' 1,513 1,394 4 —0,871 —0,0371 0,4 1,698 1,574 5 —0,863 —0,052 0,5 1,911 1,784
§ 5] МЕТОД ПРОГОНКИ 251 Продолжение табл. 64 i ci di Xl У1 J'i 6 —0,854 —0,073 0,6 2,157 2,033 7 —0,845 —0,094 0,7 2,447 2,332 s —0,836 —0,122 0,8 2,792 2,696 ;ι 0,9 3,210 3,148 10 1,0 3,718 3,718 Затем по формуле (7) начинаем обратную прогонку и находим У9> JV ··· ·>Ί (значение _у10 известно). Значение у0 определяем согласно первому краевому условию (24). Полученные значения yt записываем в четвертой строке таблицы 64. Для сравнения в последней строке таблицы даны значения точного решения у =х -\-е" . Из последних двух строк таблицы видно, что расхождение точного решения yi и приближенного _у(· довольно значительно. Вообще с помощью конечно-разностных методов трудно получить решение с большой степенью точности. Эти методы в основном предназначены для быстрой ориентировки в характере искомого решения. При требовании повышенной точности приходится применять значительно более громоздкие приемы пли вводить соответствующие поправки [1]. В частности, можно ожидать, что метод прогонки дает более точные приближения, если при переходе от дифференциального уравнения y"-{-p(x)y' + q(x)y=f(x) (25) и краевых условий (26) к конечно-разностным уравнениям воспользоваться центральными формулами для производных: „" — >V+i —2-У--+.У/-1 й2 У' У, _>Ί· + ι -Уи ~~ 2Л ('=1,2 я). После соответствующих преобразований мы будем иметь следующую систему: У их -YmiyiJrniyi-^ = 2^hf.fi (/=1,2,..., л), (27) ΜΌ+*,^°=Α | ( (28) iU, + P/"+'2/"-1 = 4 J
252 КРАЕВЫЕ ЗАДАЧИ ДЛЯ ОБЫКНОВЕННЫХ ДИФФ. УРАВНЕНИЙ [ГЛ. IV где __ 2д//гг — 4 ' 2 + ΛΛ ' Точно тем же способом, что и раньше, исключим из системы (27), (28) член, содержащий );,·_,. После исключения система может быть записана в виде yi = e,(di—yi+t) l'=1.2, ..·,«). (29) Найдем формулы для коэффициентов с,·, dt. Полагая /=1 в формуле (27), получим Исключая _уд из этого равенства и первого краевого условия (28), будем иметь __ а, — а0Л -Vl от, (а, — а„Л)-+-н,а, но из (29) при г'= 1 следует Г/ 2/,Α» ЛЛ .]. (зо) (31) Сравнивая равенства (30) и (31) между собой, находим следующие формулы: — "' — aoh λ ОТ, (а, — а0А) + я,а, ' I 2/,А« , ЛЛ [ (*2) С,== **' 2-ί-ρ,Λ ^"'а,-а0Л- ; Рекуррентные формулы для определения коэффициентов с,- и fif,- при значениях /> 1 остаются без всякого изменения (не считая свободного члена): 1 \ 1 ОТ/ — tljCi , ' I . 2/,Л2 . ( (33) На основании формул (32), (33) мы находим последовательно коэффициенты с,-, di (i= 1, 2, ... , η) до сп \\dn включительно (прямой ход). Обратный ход начинаем с определения значения уп. Используя второе краевое условие ^28) и формулу (29) при г' = я и i=-n—1,
§ 5) МЕТОД ПРОГОНКИ получим систему трех уравнений Уп = с»Уп—Уп+1)' | Уп-,=с„-,К-.— У„)· > Решая эту систему уравнений относительно уп, будем иметь Уп = 2Bh-il(dn-cn_t α„_λ) 2М ■ '■(<-■-£) 253 (34) (35) Далее, используя формулу (29) и первое краевое условие (28), последовательно определяем Уп-i' Уп-1> · · ■ 'Уа' Пример 3. Используя центральные формулы для производных, методом прогонки найти приближенное решение уравнения ■ 2ху' — 2у -— — 4х, удовлетворяющее краевым условиям: _у(0)-/(0) = 0, 2у(\)-у' /(0) = 0, I /(1) = 1. I (36) (37) Решение. Примем /г —0, 1 и заменим уравнение (36) и краевые условия (37) системой конечно-разностных уравнений 2 -f- 2/<г *'' + » 1 — х,й Уг 1 + х,Л 4й2 1 - х,Л Л'' (./=1,2 10), 2У,„- У1 — JO _ 0, (38) Уп — У» 2Л — 1. Введем обозначения: т. 2-f-2/z2 1 - χ,Λ ' 1 -f *;Л 1 - х^ · 4Лг -: -Л! (39) и составим таблицу значений mlt nt, φ; для 1 = 0, 1, 2, ... , 10.
254 КРАЕВЫЕ ЗАДАЧИ ДЛЯ ОБЫКНОВЕННЫХ ДИФФ. УРАВНЕНИЙ [ГЛ. IV Таблица 65 Значения коэффициентов уравнения (38) 1 1П/ Ή τ/ 0 —2,02 1 0 I —2,040 1,020 —0,004 2 —2,060 1,040 —0,008 3 —2,083 1.062 —0,012 -1 —2,105 1,084 —0.017 5 —2,127 1,105 —0,021 ί "Ч 11 i 4i t> —2,140 1,128 —0,025 7 —2,172 1,150 —0,030 s —2,196 1,174 —0,035 о —2,220 1,198 —0,040 Id —2,244 1,222 —0,044 Используя таблицу и формулы (32) и (33), находим значения ch d/ для/= 1, 2, . . ., 9 (прямой ход). Полученные результаты записываем в первых двух строках таблицы 66. Принимая В=\, β0 = 2, β, =—1, определяем но формуле (35) значение у10, а затем по формуле (29) последовательно находим _у8, у8, . . . ,_у, (обратный ход). Значение _у0 определяем с помощью первого краевого условия (38). В четвертой строке таблицы 66 приведены значения точного решения у—х-^-е*2. Таблица 66 Решение краевой задачи (36)—(37) методом прогонки с использованием центральных формул для производных ι С! d, V'i Λ 0 1,070 1 ι ■ —0,899 —0,004 1,178 1,110 - —0,889 —0,012 1,307 1,241 3 —0,878 —0,023 1,458 1,394 4 —0,868 —0,039 1,638 1,574 5 —0,856 —0,058 1,848 1,784 ' с; di Vi у,- (i —0,845 —0,081 2,101 2.033 -, —0,833 —0,109 2,405 2,332 8 —0,822 —0,142 2,778 2,696 a —0,810 —0,180 3,238 3,148 ίο —0,798 —0,222 3,818 3,718
§ 6] МЕТОД КОЛЛОКАЦИИ 255 § 6. Метод коллокации Изложенный выше метод конечных разностей для решения краевых задач носит численный характер и позволяет получить таблицу значений искомой функции. Мы сейчас ознакомимся с методом, дающим возможность найти приближенное значение краевой задачи в виде аналитического выражения. Пусть требуется определить функцию у=у(х), удовлетворяющую линейному дифференциальному уравнению L\y]=-y"+p(x)y'-\-q(x)y=f{x) (1) и линейным краевым условиям 1\1у] = *ау(а)-1га1У'{а) = А, ) где ki+ki^o, ipj+im^o- Выберем некоторую совокупность линейно независимых функций «о И. М*). ··■> ип(х) (3) (базисные функции), из которых функция и0 (х) удовлетворяет неоднородным краевым условиям: Г„ [«„] = /*, Гй[ва]=5, (4) а остальные функции «,·(■*) (/ = 1, 2, . .., я) удовлетворяют соответствующим однородным краевым условиям: Г„М = 0. Гй[И/] = 0 (*=1, 2, ..., я). (5) Если краевые условия (2) однородны (Д=В = 0), то можно положить н0 (.*)== О и рассматривать лишь систему функций щ(х) (г=1, 2 я). Будем искать приближенное решение краевой задачи (1) — (2) в виде линейной комбинации базисных функций η У=Uo(x)+Σciui(x). (6) 1 = 1 Тогда функция у, очевидно, удовлетворяет краевым условиям (2). В самом деле, в силу линейности краевых условий имеем Г, \У J = Γα Κ! + Σ С J a M = Λ + Σ С, -0=А 1 = 1 1 = 1 и аналогично
256 КРАЕВЫЕ ЗАДАЧИ ДЛЯ ОБЫКНОВЕННЫХ ДИФФ. УРАВНЕНИЙ [ГЛ. IV Подставляя выражение (6) в уравнение (1), будем иметь и R(x, С„ Сг, .... Cn)=L \y]-f(x) = L [aj-/(*) + Σ CtL [«,·]. (7) 1 = 1 Если при некотором выборе коэффициентов С\ (/=1, 2, ..., п) выполнено равенство R(x, С,, С2, ..., Сп) = 0 при а^х^Ь, то функция у является точным решением краевой задачи (1) — (2). Однако подобрать так удачно коэффициенты С;, вообще говоря, невозможно. Поэтому ограничиваются тем, что требуют, чтобы функция R(x, С,, С2, ..., Сп) обращалась в нуль в заданной, достаточно густой системе точек л;,, х2, ..., хп из [а, Ь\ (точки коллокации), в которых, таким образом дифференциальное уравнение (1) будет удовлетворено точно; в качестве точек коллокации, например, можно выбрать точки, делящие отрезок [а, /;] на равные части. В результате получаем систему линейных уравнений: /?(*,, С„ С2, ..., Св) = 0, ') (8) R(xn, С„ С„ ..., С„) = 0. ) Из системы (8) в случае ее совместности обычным способом можно определить коэффициенты С,, С2, ..., Сл, после чего приближенное решение нашей краевой задачи дается формулой (6). Пример. Методом коллокации решить краевую задачу [1] У' + (1-4-д:2)у+1=0; у(±\) = 0 (9) (см. § 4, пример). Решение. В качестве базисных функций выберем полиномы ип (х) — хг"~2 (1—х2) (/2=1, 2, ...), очевидно, удовлетворяющие краевым условиям: я„ (+1) = 0. За точки коллокации возьмем ха == "> х±\ ^^ i ~2 · Ограничиваясь двумя базисными функциями, положим ^ = с,(1-хНс2(^-Д Подстановка в дифференциальное уравнение (9) дает /? (х) == - 2С, + С2 (2 - 12*2)-И Ч-*2) [С, (! ~ *2) + + С2(*2-л:4)] + 1 = 1-С;(Ч~*1) + С2(2-Ш-г-х°). (Ю) В точках коллокации х0 = 0 их^+г имеем R(xt) = 0, R(x±i) = 0.
§ 7] МЕТОД НАИМЕНЬШИХ КВАДРАТОВ 257 Отсюда, используя формулу (10), получаем для определения коэффициентов С, и С2 линейную систему уравнений 1-С,+2С2 = 0, ) i_iZc _l?c (П) 1 16 ' 64 2 / Решив систему (11), находим С, = 0,957; С2^^ 0,022. Следовательно, имеем приближенное решение: у^ 0,957(1 —х2) — 0,022 (jc2 — x1). В частности, получаем у(0) = 0,957. Для сравнения приводим соответствующее значение _у (0), полученное методом конечных разностей (см. § 4): ДО) =^ = 0,967. § 7. Метод наименьших квадратов Снова рассмотрим краевую задачу. £[y]=/W. ) Г«!>]=А (1) где смысл сокращенных обозначений был установлен в предыдущем параграфе. Придерживаясь обозначений § 6, полагаем η у = и0(х)-\~ 2 Q«iW. (2) 1 = 1 где функции ui — ui(x) таковы, что ( А при ί'=0, 1аЫ = \ Q пр„ />0 и ( β при /=0, Г*М = \ 0 при t>0. Подставляя выражение (2) в дифференциальное уравнение (1), получаем невязку R (х, С„ С2, ..., Q = L [г/0] -/(*) 4- 2 ^ [",]. (3)
258 КРАЕВЫЕ ЗАДАЧИ ДЛЯ ОБЫКНОВЕННЫХ ДИФФ. УРАВНЕНИЙ [ГЛ. IV которая должна быть при а^х^Ь как можно малой по абсолютной величине. Поэтому выдвигаем требование, чтобы ь J=fjjR1(x, C„ С„ .... C„)dx = min (4) а (интегральный метод наименьших квадратов). Для минимума интеграла / необходимо выполнение условий: '"(*!£ ,, = <>, а ^дС,~о Щ ' Ϊ (5) а Id/ DSU. i дС„ J dC„ а ' В результате получается система линейных уравнений относительно коэффициентов С,, Сг, ..., Сп, из которой и определяются эти последние. Пример 1. Интегральным методом наименьших квадратов решить краевую задачу /' + (1+*2)У + 1=0, ^(+1) —о, (6) разобранную в § 6. Решение. Полагая и, = 1—*2, и2 = хг — х*, будем иметь у = С,(1—x^+C.tx1—**). Подставляя это выражение в уравнение (6), получаем невязку (см. § 6, формула (10)) R(x)=\ — (1 -)_Jc')C1+(2— llx· — х')Сг. (7) Ввиду симметрии задачи в качестве основного отрезка достаточно рассматривать отрезок [0,1]. Согласно приведенному выше способу наименьших квадратов составляем выражение I 1 i= J R2 {х) dx = J [ 1 — (1 -j-л;1) С, + (2 — 1 \х2 — χ') Сг]2 dx О U
§ 7] МЕТОД НАИМЕНЬШИХ КВАДРАТОВ 259 и подбираем коэффициенты С, и С2 так, чтобы интеграл / имел наименьшее значение. Это дает нам систему уравнений 1 ^ = -J(l+x1)[l-(l+x1)C1-l-(2-llx2-xi)C2]^ = 0) О + (2— Их2 — х')Сг\с1х = 0 J или 68г ,3548г __5_ 45 ' + 1155 4"— 4 3548г , 63404 с _38 1155 1 "Г 4095 2 2Г Отсюда Следовательно, С, = 0,985; С„ = — 0,078. у =0,985(1 — jc2) — 0,078 (х2 —х4). (8) В частности, J/(0) = 0,985 (ср. § 6). Вместо минимума интеграла (7) можно искать минимум конечной суммы (точечный метод наименьших квадратов) N ^n== 2-i R*(xt> cv сг, ..., сп), 1 — 1 где xv хг, ..., xN—некоторая достаточно густая система точек отрезка [а, Ь\ (для простоты обычно выбираются равноотстоящие точки). При применении точечного метода наименьших квадратов следует полагать N^>n, т. е. число точек xt (/=1, 2, ..., Ν) должно быть больше числа параметров С,- (у'= 1, 2, ..., я). В случае, если Ν=η, параметры Cj можно определить из системы уравнений /?(*„ С„ С„ ..., Св) = 0 (/=1, 2, .... п), т. е. мы приходим к методу коллокации (§ 6). Пример 2. Точечным методом наименьших квадратов найти решение краевой задачи (6), выбирая узлы 1 1 3 -£0 = 0, JC=bi= + -j-, Х± 2 = zfc ~2 ι х± а =^ Η—7" · Решение. Ввиду симметрии задачи за основной промежуток примем отрезок [0,1]. Положим у = 0,(1 — х2)+С\(х*—Ху,
260 КРАЕВЫЕ ЗАДАЧИ ДЛЯ ОБЫКНОВЕННЫХ ДИФФ. УРАВНЕНИЙ [ГЛ. IV тогда невязка R (х) выражается формулой (7). Пусть /?(*,)= 1+«А + Р/С, ιί==ο, 1, 2, 3), где а,— — (1 -\-х*), β,-= 2 — 1 \χ* — х°, тогда /= Σ *'(*,)= Σ 0 4-«А-НА)*· ί =r 0 ί = О Используя необходимые условия для минимума функции /, получим нормальную систему L1L 2 дС, =Σ«ι+ci Σ«?+с. Σ «iP/=о. τ й-=Σ &+с. Σ */Ρ/+с* Σ ρ;=°· Ο) Соответствующие числовые данные, вычисленные с точностью до 10~4, приведены в таблице 67. Таблица 67 Коэффициенты нормальной системы (9) X 0 1 4 1 2 3 4 2 α — 1 — 1,0039 — 1,0625 — 1,3164 —4,3828 β 2 1,3123 —0,7656 —4,3655 —1,8188 а? -1 1,0078 1,1289 1,7329 4,8696 α? -2 — 1,3174 0,8134 5,7465 3,2425 ?' 4 1,7222 0,5861 19,0576 25,3659 (10) Отсюда для определения коэффициентов С, и Сг получаем систему 4,8696с,-}- 3,2425С, = 4,3828, Ϊ 3,24250,4-25,36596',= 1,8188. ) Решив систему (10), будем иметь С, = 0,9317; С2 = — 0,0474 и, следовательно, -у = 0,9317(1 — х2) — 0,0474 (χ'—χ').
§ 8] МЕТОД ГАЛЕРКИНА 261 § 8. Метод Галеркина Метод Галеркина основан на одной теореме из теории общих рядов Фурье. Теорема. Пусть {ип(х)\ — полная система функций с ненулевой нормой, ортогональных на отрезке [а, Ь]. Если непрерывная функция f(x) ортогональна на отрезке [а, Ь\ ко всем функциям ип{х), т. е. ь $/(*)«„(*)<** = 0 («=1. 2- ···), (1) а то f(x) = 0 при а^х^Ь. Доказательство. Рассмотрим ряд Фурье функции /{χ) относительно заданной системы ортогональных функций: 00 /[χ)^Σ с„и„[х). (2) Как известно [5], коэффициенты Фурье сп определяются по формуле ь °η=1^ψ j /Wun (x)dx> a где b \\un\\* = \u(x)dx>0. a В силу условия (1) имеем с„ = 0 (я=1, 2, ...). (3) Для полной системы {"п(х)}, по отношению к любой непрерывной функции /(х), выполнено равенство полноты [4] b оо $/2(*)<**=Σικιΐ4· w α η = \ Отсюда, учитывая равенство (3), имеем ь <\jf(x)dx = 0 а и, следовательно, f[x)=Q при as^x^b.
262 КРАЕВЫЕ ЗАДАЧИ ДЛЯ ОБЫКНОВЕННЫХ ДИФФ. УРАВНЕНИЙ (гл. IV Замечание. Из формулы (4) вытекает, что если непрерывная функция f(x) ортогональна к конечной системе функций «,(*), иг(х), ..., uN(x) (т. е. с, = с, = . .. = cN= 0), то Ъ со S/· (*)<**= Σ 1К1Гс»<8 a 7V+1 при N достаточно большом. В этом случае функция /(х) в среднем на отрезке \а, Ь\ будет сколь угодно мала. При дополнительных ограничениях отсюда следует, что |/(х)| также мал на отрезке «< xsg^b. Перейдем теперь к изложению метода Галеркина. Пусть имеем линейную краевую задачу (см. § 2) L\y]=f(x), (5) где 1 Ы =/' +Р (х)У'+Я(х)У, при наличии линейных краевых условий: Га[у\^*оУ(а)-\-с11у'(а) = А; ) Г4 [у] = Р„.У (*) + ?,/(*) = * ί (ΚΙ + ΚΙ^ο, ΐρ.ι + ΙΡ.Ι^0)· Выберем конечную систему базисных функций {«,·(*)} (« = 0,1,..., п), составляющих часть некоторой полной системы, причем позаботимся, чтобы функция и0(х) удовлетворяла неоднородным краевым условиям: гвК1 = л. ГЛ»,]=Д а функции щ(х) (/^=1, 2, . . ., и) удовлетворяли бы однородным краевым условиям: гвЫ = Г*М = 0 С'=1. 2 л). Решение краевой задачи (5) — (6) будем, как обычно, искать в виде η j>=«„(*)+Σ w)· (7) При нашем подборе базисных функций «,· (х) функция у, определяемая формулой (7), очевидно, удовлетворяет краевым условиям (6) при любом выборе коэффициентов С;. Выражение (7) подставим в дифференциальное уравнение (5), что дает невязку η R(x, С„ С„ ..., Q =£[".]+Σ С«М"/1-/(*)■ 1 = 1
§ 8] МЕТОД ГАЛЕРКИНА 263 Для точного решения у нашей краевой задачи функция /? = 0; поэтому для получения приближенного решения, близкого к точному, нам выгодно подобрать коэффициенты С,- так, чтобы функция R была в каком-то смысле мала. Согласно методу Галеркина требуем, чтобы невязка R была ортогональна к базисным функциям Ut(x) (/=1, 2, ..., я), что при достаточно большом числе этих функций, в силу приведенного выше замечания, обеспечивает малость невязки в среднем. Насколько это приближенное решение близко к точному, в общем случае вопрос остается открытым. Таким образом, для определения коэффициентов С,- (/=1, 2, ..., п) приходим к системе линейных уравнений ь ]ul(x)R(x, С„ C„ .... Cn)dx = Q, а Ь [ul(x)R(x, С„ С„ ..., Cn)dx = 0, > а Ь lu„(x)R(x, С„ С„ ..., Cn)dx = 0 а или более подробно η Ь h X С,. J щ (х) L \щ\ dx = J и, (х) {/(х) - L [в,]} dx i = ι α α (ί'=1, 2, ..., η). Достаточные условия сходимости метода Галеркина приведены в книге Михлина [4]. Пример. Методом Галеркина найти приближенное решение уравнения [2] у'+ху'+у = 2х, (8) удовлетворяющее краевым условиям у (0) = 1, у(\) = 0. (9) Решение. В качестве системы базисных функций ut(x) (i = 0, 1, 2, 3) выбираем следующие функции: • Ua (х) = 1 — х; Ux(x) = x(\ —χ); и2(х) = хг(\ —х); иг(х) = х'(\ —х).
264 КРАЕВЫЕ ЗАДАЧИ ДЛЯ ОБЫКНОВЕННЫХ ДИФФ. УРАВНЕНИЙ [ГЛ. IV Приближенное решение задачи ищем в виде полипома y=(l—x) + ClX(l— x) + C\x>{\— Х) + С,х>(\— х). Подставляя у в левую часть заданного дифференциального уравнения (8), получаем невязку R(x, C„ Сг, Q = (l—4*)-|-CI(—2 + 2л: —3*2) + -f С2 (2 — 6л; + Зхг — 4л:') -f С, (6х — 12хг + 4л;3 — 5л:1). (10) Условия ортогональности функции R к функциям и1 (х), и2 (х), иа (х) приводят к системе ι ^х — х") R(x, С„ С2, C,)dx = 0, 0 1 I (x2 — **)/?(*, C„ C2, C,)rfx = 0, > υ 1 \(x3—xl)R(x, C\, C„ C3)u?jc = 0. о Подставляя вместо /?(лг) его значение (10), после соответствующего интегрирования получаем систему 1336',+ 63С2 + 36С8 = —70, "J 140С, + 108Сг+ 79С3=—98, I 264C1+252Ci-]-211C, = —210. J Отсюда находим С, =—0,2090; С2 = —0,7894; С, = 0,2090 и, следовательно, у — (\—х)(\— 0,2090* — 0,7894л:2 + 0,2090л·'). § 9. Понятие о приближенных методах решения общей краевой задачи Рассмотрим общее дифференциальное уравнение я-ro порядка F(x,y,y',...,ym) = o (1) с заданными, вообще говоря, нелинейными краевыми условиями: УЛУи У\, ■■-,УЫ-' ····. Λ. У*. ·■·· Ук^) = Ау (2) (v=l, 2 η),
§9] О РЕШЕНИИ ОБЩЕЙ КРАЕВОЙ ЗАДАЧИ 265 где _у^ =/'>(*,) (s = 0, 1, 2, ..., а,) и система точек л;,, х2, . .., хк задана (см. § 1). Для приближенного решения краевой задачи (1) — (2) выбирают функцию Y=Y(x, С„ С„ ..., Ср), (3) содержащую независимые параметры С,, С,, ..., С и такую, что при "любом выборе этих параметров функция Υ удовлетворяет краевым условиям (2). Подставляя выражение Υ в левую часть данного дифференциального уравнения (1), получаем невязку /?(*, С„ С\, ..., С,) = /4*. К, Г К'"»). (4) Наша цель состоит в том, чтобы сделать функцию R наименее уклоняющейся от нуля в каком-то смысле для интересующей нас области. Различная реализация этого требования приводит к различным методам решения краевой задачи. Мы здесь рассмотрим наиболее употребительные из этих методов [1]. 1. Метод коллокаиии. Выбираем систему точек £,, £2, ζ,, ...,;_ (точки коллокации), по возможности учитывая при этом особенности уравнения (1), и требуем, чтобы в этих точках дифференциальное уравнение (1) удовлетворялось точно. Это дает систему /?(£„ С„ Ct, .... C„) = 0, ) я (ε,. cv сг c,)=o, I (5) из которой, вообще говоря, можно определить параметры С,, С,, . .. ..·, Ср (ср. § 6). II. Метод наименьших квадратов. Отыскиваются значения С,, С,, ..., С, дающие минимум интегралу (интегральный метод наименьших квадратов) ь /=$/?*(*, С„ С„ .... С,)Ле, α где отрезок \а, Ь\ содержит заданные точки х( (/=1, 2 k). Этот метод приводит к системе уравнений ϋ = 0 ^- = 0 -^-==0 ас, и' ас2 аср υ (ср. § 7).
266 КРАЕВЫЕ ЗАДАЧИ ДЛЯ ОБЫКНОВЕННЫХ ДИФФ. УРАВНЕНИЙ [ГЛ. IV Вместо интеграла / можно брать конечную сумму (точечный метод наименьших квадратов) N 1ν=Σκ2&. с„ с„ .... ср), 1 — 1 где ζ; (i=\, 2, ..., Ν)—выбранная система точек. III. Метод Галеркииа. Если краевые условия (2) линейные (дифференциальное уравнение (1) при этом может быть нелинейным), то можно положить η К=и.М+2СЛ(х), причем функция Υ должна удовлетворять краевым условиям (2) при любом выборе коэффициентов Ct(i=l, 2, ..., я). Согласно методу Галеркина коэффициенты Ct определяются из условия ортогональности невязки R к функциям к, (х), иг (х), ..., ип (х), т. е. из системы линейных уравнений ь J и, U) Я(х, С„ Ct, .... Св)Ле = 0, ΰ & J и, (х) R (х, С„ С„ .... С„)</х = 0, . 5«„W/?(x, С,. С2 С„)Лс = 0. IV. Обобщенный метод Галеркина (метод ортогональных проекций). Выбираем ρ линейно независимых функций φ, (χ), <рг (χ), ..., ψ (χ) (по числу параметров) и определяем параметры С,, С2, ·. С„ Hd условия ортогональности функции R ко всем этим функциям, т. е. постоянные С(- определяются из системы ь J (p,(jc)/?(x, С,, С,, .... Ср)</л: = 0, α 6 $ φ, (·*)#(*. c„ c2 с„)лс=о, ^ J ?,(*)/?(*. C„ C„ .... Cp)dx = 0.
ЛИТЕРАТУРА К ЧЕТВЕРТОЙ ГЛАВЕ 267 В качестве функций φ; (χ) обычно берут первые /; функций из какой- нибудь полной системы, например системы степеней χ или системы тригонометрических полипомов и т. п. V. Метод подобластей. Разбиваем отрезок [а, Ь], содержащий данные точки х-, (ί=1, 2, ..., k), на/; частичных отрезков |ξ0, ly], [Si, У, · .. , [?р-ь %р], гДе ξ0 = α и "чр = Ь. Постоянные С,- (г= 1, 2,... , р) определяются из системы уравнений \ R(x, С„ С2, ..., Cp)dx = 0 (./=1, 2, ..., ρ). Кроме того, применяют также вариационные методы решения краевых задач (см. гл. VI). Сопоставление этих методов см. [1J. В заключение отметим, что имеются и другие методы решения краевых задач для обыкновенных дифференциальных уравнений. Некоторые из них: метод возмущений, метод разностной факторизации и другие хорошо описаны в книге [6|. Там лее рассмотрен вопрос и об оценке погрешности конечно-разностных методов при решении краевых задач. Можно также порекомендовать переведенную на русский язык книгу Дж. Н. Ланса [8]. Литература к четвертой главе [1] Л. К о л л а т ц, Численные методы решении дифференциальных уравнений, ИЛ, 1953, гл. II. [2] В. Э. Μ и л н, Численное решение дифференциальных уравнений, ИЛ, 1955, гл. VII. [3] Л. Э. Э л ь с г о л til, Вариационное исчисление, Гостехиздат, 1952. [4] С. Г. Μ и χ л н и, Вариационные методы в математической физике, Гостехиздат, 1957, гл. Ill, V, IX. [51 Г. П. Толстое, Ряды Фурье, Гостехиздат, 1951, гл. П. [6] Г. И. II о лож и и и др., Математический практикум, Физматгиз, М., I960. [7] О. В. Л о к ν ц и с в с к и й, Успехи математических наук, т. II, вып. 3(69), 1956, стр. 224. [8] Дж. Н. Лапе, Численные методы для быстродействующих вычислительных машин, ИЛ, 1962.
ГЛАВА V ПРИБЛИЖЕННЫЕ МЕТОДЫ РЕШЕНИЯ КРАЕВЫХ ЗАДАЧ ДЛЯ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ С ЧАСТНЫМИ ПРОИЗВОДНЫМИ § 1. Классификация дифференциальных уравнений с частными производными В этой главе будут рассмотрены приближенные методы решения некоторых задач для дифференциальных уравнений с частными производными второго порядка с двумя независимыми переменными. В общем случае такое уравнение имеет вид F(x, у, и, их, иу, ихх, иху, иуу) = 0, (1) где х, у— независимые переменные, и—искомая функция, их, «„, ιιχχ, и , к —ее первые и вторые частные производные по аргументам х и у (для более удобной записи производных «штрихи» опускаются). Решением уравнения (1) называется функция и = и(х, у), обращающая это уравнение в тождество. График решения представляет собой поверхность в пространстве Охуи (интегральная поверхность) (рис. 49). Пример 1. Решить уравнение Рис. 49. Интегрируя это уравнение по у два раза, будем иметь к = _уш {х) -j- -j-'!>(.«), где ψ (χ) и ψ (χ) — произвольные функции. Интегральные поверхности представляют собой линейчатые поверхности, образующие которых параллельны координатной плоскости Оуи. Уравнение (1) называется линейным, точнее, вполне линейным, если оно первой степени относительно искомой функции и всех ее
§ 1] КЛАССИФИКАЦИЯ УРАВНЕНИЙ С ЧАСТНЫМИ ПРОИЗВОДНЫМИ 269 производных и не содержит их произведений, т. е. если это уравнение может быть записано в виде л д2и . .,„ дги , „д2и , ди , ,ди . _, '4a^ + 2fi'o^ + c17+a^ + ^ + CK = F(x'-v)' (2) причем коэффициенты А, В, С, а, Ь, с могут зависеть лишь от χ и у. В частности, если эти коэффициенты не зависят от χ и у, то уравнение (2) представляет собой линейное дифференциальное уравнение с постоянными коэффициентами. Остановимся подробнее на случае линейного уравнения (2). Пусть D=AC—B' — дискриминант уравнения. В зависимости от знака функции D линейное дифференциальное уравнение (2) относится в данной области к одному из следующих типов: D > О — эллиптический тип; D = 0 — параболический тип; D <[ О — гиперболический тип; D не сохраняет постоянного знака — смешанный тип. Тип линейного уравнения (2) является его важной особенностью и сохраняется при любом невырожденном преобразовании £ = φ(χ, у), η= ψ (■*:,>>), (3) т. е. если якобиан а (Т. ^0 д(х, vy ' Пример 2. Температура и = и(х, у) точки (х, у) пластинки при стационарном распределении (т. е. при распределении, не зависящем от времени) и отсутствии источников тепла удовлетворяет уравнению Лапласа [1] — [5] д"и , дги п dx-'+df^0- <4) Здесь А=\, В=0, С—1 и D = AC— £2>0, т. е. уравнение (4) эллиптического типа. Пример 3. Температура и—и(х, t) точки однородного тонкого стержня с абсциссой χ для каждого момента времени t удовлетворяет одномерному уравнению теплопроводности [4], [5] где а — постоянная, зависящая от физических свойств стержня, и F(x, f)— функция, связанная с плотностью источников распределения тепла. Если в стержне отсутствуют источники тепла, то уравнение
270 РЕШЕНИЕ УРАВНЕНИЙ С ЧАСТНЫМИ ПРОИЗВОДНЫМИ [ГЛ. V теплопроводности имеет вид ди j д2и Введя новое время получаем приведенное уравнение теплопроводности ди ~дх* (6) Уравнения теплопроводности (5) и (6), очевидно, параболического типа. Пример 4. Смещение и = и(х, t) точки однородной струны с абсциссой χ (рис. 50), в случае наличия внешней силы, для каждого момента t удовлетворяет неоднородному одномерному волновому уравнению [1] — [5], а именно dt2 ■a^2 = F{x, t), (7) Рис. 50. где а — постоянная и F (x, t) — функция, зависящая от внешней силы. Уравнение (7) носит название уравнения колебаний струны. Если внешняя сила отсутствует (свободные колебания), то уравнение колебаний струны имеет вид д*и dtz' дхг' (8) Уравнения колебаний струны (7) и (8) относятся к гиперболическому типу. С линейным дифференциальным уравнением — _1_9Д -д'11 дх А^, -f 2B ' „д'и , ди , . ди . г., (9) 'дхду > " дуг > "" дх > " ду связано обыкновенное дифференциальное уравнение A(dy)* — 2Bdxdy-{-C(dx)2 = 0, (10) называемое характеристическим; решения уравнения (10) называются характеристиками уравнения (9). Для уравнения (9) гиперболического типа существует два семейства характеристик φ (χ, y) = ct и ψ {χ, у) = сг
§ 1] КЛАССИФИКАЦИЯ УРАВНЕНИЙ С ЧАСТНЫМИ ПРОИЗВОДНЫМИ 271 (рис. 51). Производя в уравнении (9) преобразование Z = f(x, у), rj = *(jc, у), т. е. принимая параметры этих семейств за новые криволинейные координаты, будем иметь канонический вид уравнения V гиперболического типа -Ηΐε, 1))и = /(£, η). Уравнение (9) параболического типа имеет одно семейство характеристик ψ(χ, у) = С. Рис. 51. В результате преобразования ζ = φ(χ, у), η = j! уравнение параболического типа приводится к каноническому виду и,,+ «(5. η) «е + β (6, η)«τ+γ(5, η) «=/(£, η). Наконец, уравнение (9) эллиптического типа допускав! два семейства комплексных характеристик ψ{χ, y)-\-ity(x, y) = C\ и ψ(χ, у) — ίψ (a;, y)=Cs. Производя преобразования £ = ?(*, У), η = φ (jc, у), получим канонический вид уравнения эллиптического типа где Дв = и^-|-ц—оператор Лапласа Простейшее уравнение эллиптического тина Δ« = 0 носит название уравнения Лапласа. Неоднородное уравнение Лапласа называется уравнением Пуассона.
272 РЕШЕНИЕ УРАВНЕНИЙ С ЧАСТНЫМИ ПРОИЗВОДНЫМИ [ГЛ. V § 2. Начальные и краевые условия. Задача Коши. Смешанная задача. Корректность постановки смешанной задачи Дифференциальное уравнение с частными производными имеет в общем случае бесчисленное множество решений. Поэтому, если физический процесс описывается с помощью уравнения в частных производных, то для однозначной характеристики этого процесса нужно к уравнению присоединить какие-то дополнительные условия. Эти дополнительные данные в простейшем случае состоят из начальных и краевых (граничных) условий. В сущности, различить эти условия можно лишь в том случае, если одна из независимых переменных дифференциального уравнения играет роль времени, а другая — пространственной координаты (для случая двух независимых переменных). При этом условия, от- I ι ' I ^ носящиеся к начальному моменту О ί времени, называются начальными, а Рис. 52. условия, относящиеся к фиксированным значениям координат (обычно это координаты граничных точек рассматриваемого линейного континуума),— красными. Пример 1. Пусть имеется теплоизолированный (кроме, может быть, концов) однородный нагретый стержень 0 s£ x s£ /, где /—длина стержня (рис. 52). Температура стержня и = и(х, t) в точке χ (0<^х<С1) для любого момента времени t удовлетворяет уравнению теплопроводности (см. § 1, пример 3) дп , д2и .,. где а—-постоянная. В начальный момент t=ta для внутренних точек стержня обычно задается начальное распределение температуры. Это приводит к начальному условию и(х, *„)=/(*) (2) при 0<^х<^1, где f(x) — известная функция. Условие (2) не обеспечивает однозначности решения дифференциального уравнения (1), так как физически ясно, что распределение температуры и (х, t) в стержне для последующих моментов времени t^>t0 существенно зависит от того, в каком состоянии находятся концы стержня х=0 и х = 1 (есть ли там утечка тепла, каков тепловой режим и т. п.). В зависимости от состояния конца jc = 0 имеем следующие о с н о в- ные краевые условия. 1. Конец стержня х = 0 поддерживается при заданной температуре и ψ, /)==φ(ί), (3)
§ 2] ЗАДАЧА КОШИ. СМЕШАННАЯ ЗАДАЧА 273 где φ(ί)—известная функция. В частности, если эта температура равна нулю, то краевое условие имеет вид к (0, 0 = 0· (4) 2. Конец стержня л; = 0 теплоизолирован, т. е. утечка тепла в окружающую среду отсутствует: МО, *) = 0. (5) 3. На конце стержня χ = 0 происходит лучеиспускание тепла в окружающую среду, температура которой меняется по заданному закону «(О, /) + «М0. 0 = ϋ(0, (6) где α — постоянная и ψ(ί) — известная функция. В частности, если температура внешней среды равна нулю, то получим в(0, *) + «М°. 0 = 0. (7) Смешанное краевое условие (6) в некотором смысле можно считать общим, а именно, полагая а — 0, получим краевое условие (3), а при а = оо будем иметь краевое условие (5). Возможны и другие типы краевых условий. Аналогичные краевые условия могут быть также для конца х = 1. Комбинируя краевые условия для концов χ = 0 и х = 1, будем иметь краевые задачи для стержня, которые при наличии начального условия (2), вообще говоря, имеют единственные решения. Пример 2. Рассмотрим свободные колебания однородной ограниченной струны длины /(0<л;</). Поперечное смещение и — и(х, t) при 0<С_х<С.1 Для любого момента времени t удовлетворяет волновому уравнению (см. § 1, пример 4) W— а д*' (8> где о — постоянная. В начальный момент t = tl) обычно задаются форма струны и распределение скоростей ее точек. Это дает начальные условия: к (*. <.) = ?(*), \ М*. '.) = ?.(·*). ) где ψ (χ) и φ, (χ) — известные функции, определенные в интервале 0<х</. В зависимости от способов заделки концов струны х = 0 и х = 1 будем иметь при t„^t<^oo следующие основные краевые условия. 1. Конец жестко закреплен: и (0, ί) = 0 (или u(l, t) = 0). (10')
274 РЕШЕНИЕ УРАВНЕНИЙ С ЧАСТНЫМИ ПРОИЗВОДНЫМИ [ГЛ. V 2. Конец упруго закреплен: их(0, t)—ktu(0, t)~0 (или ux(l, f)-\-ktu(l, 0 = 0), (10") где fe, и кг—положительные постоянные. 3. Конец свободен: их(0, t) = 0 (или их(1, /) = 0). (10'") При достаточной гладкости функций ψ (χ) и φ, (χ) задача (9), (10) имеет единственное решение. Рассмотрим общую постановку задачи с начальными условиями. Пусть дано линейное дифференциальное уравнение L[u] = F(x,y), (11) где L[u\ = A(X, У)д^ + 2В{Х, J)Д + Cl*. У)д~ + + α(χ, У)£+Ь(х, у)^~\-с(х, у)и. (12) Отыскание решения и=и(х, у) уравнения (11), удовлетворяющего начальным условиям: и(х, у„)=у(х), \ Μ*. Λ) = Ϋι(*). / (13) называется задачей Коши, а сами условия носят название начальных данных Коши. Задача Коши допускает простую геометрическую интерпретацию (рис. 53): требуется найти интегральную поверхность и = и(х, у) уравнения (11), проходящую через данную пространственную кривую У = Л- ν (Г) ιι = φ(χ) и касающуюся в точках М(х, у0, и) этой кривой заданной системы векторов а, расположенных в плоскостях χ = const и составляющих с осью Оу угол β, определяемый равенством tg β = ?,(*). Если рассматривать у как время, то задача Коши имеет следующую механическую трактовку: в начальный момент времени у = у0 заданы форма плоской линии ιι = ψ(χ, у0) и распределение скоростей ее точек ~ = ψι(χ, у0). Предполагая, что каждая точка Μ(.«, и) линии движется параллельно оси Ои, причем дифференциальный закон
§ 2] ЗАДАЧА КОШИ. СМЕШАННАЯ ЗАДАЧА 275 движения дается уравнением (11), требуется определить форму линии для последующих моментов времени у ^>yQ (рис. 54). Условия (13) задают начальные данные Коши на прямой у— у . Однако это не является обязательным: можно задавать начальные данные на любой гладкой кривой Ф(х,у) = 0. (γ) (14) Таким образом, приходим к общей задаче Коша — найти решение и = и(х, у)
276 РЕШЕНИЕ УРАВНЕНИЙ С ЧАСТНЫМИ ПРОИЗВОДНЫМИ [ГЛ. V дифференциального уравнения (11), удовлетворяющее начальным условиям: «Ь =φ{χ, у), dT=M*. у)· (15) г> « да ди Вместо производной -г- можно задавать производную ^- , так как на кривой γ имеем *,(*, у)ах-\-щау =άψ(χ, у), \ дФ . , дФ . п ( ~dx+-dy = 0. j Можно также задавать нормальную производную (16) ди дп~~ ди . . , ди , = ^cos(/i, x) 4-^, cos (л, у). Л Задача Коши обычно ставится для линейного уравнения (11) гиперболического и параболического типов. Если уравнение (11) гиперболического типа, то для единственности решения задачи Коши необходимо, чтобы начальная кривая γ не являлась характеристикой [1]. Если это последнее условие выполнено и начальные данные заданы на конечной дуге PQ кривой γ, то решение задачи Коши, вообще говоря, определено и однозначно в криволинейном треугольнике PQR (область распространения), образованном дугой PQ и дугами характеристик PR и QR различных семейств, проходящих через концы Ρ и Q (рис. 55). Предполагается, конечно, что коэффициенты дифференциального уравнения определены и непрерывны в соответствующей области. Пусть начальные данные Коши для уравнения (11) заданы на отрезке а^х^Ь, а решение и=и(х, у) этого уравнения надо определить в полуполосе K{a^x^b; CKjxC00} (рис. 56). Тогда для однозначности этого решения дополнительно нужно задать условия на прямых х = а и х-=Ь, что приводит к смешанной задаче. Достаточно общей задачей этого типа является нахождение в полуполосе К решения и — и{х, у) дифференциального уравнения (11), Рис. 55.
§ 2] ЗАДАЧА КОШИ. СМЕШАННАЯ ЗАДАЧА 277 удовлетворяющего начальным и граничным условиям: и(х, 0) = <р(л;); иу{х, 0) = φ, (х) (а^х^Ь, у = 0) «о" (е. J»)+<*,Ma· У) = ψ CV)· \ Р.«(*. у)+Р.««(*. у)=Ф.О0. I ΚΙ+ΚΜΌ; |β0ι+|β,|#ο7 0<>»<оо. (17) (18) Особого внимания заслуживает предельный случай, когда а — —во или 6 = со. Здесь краевые условия (18) или совсем отпадают, или заменяются некоторыми условиями «на бесконечности». У I Ь////////ш/////шЛ Рис. 56. Рис. 57. Смешанная задача для уравнения (11) в общем аспекте может быть сформулирована следующим образом: дана конечная или бесконечная область G в плоскости Оху, имеющая кусочно-гладкую границу Г (рис. 57). Требуется найти в области G решение дифференциального уравнения L[u] = F(x, у), если на некоторых частях границы Г,, Г„ шения Lu[u\ = ft/(x, у), (х, У)€Ъ (ί=1, 2, (19) выполнены соотно- ι (х, У), 1 , л; /=1. 2 р,), / (20) где JL,y — или дифференциальные операторы по переменным χ и у порядка не выше первого, или конечные соотношения, а ^ (х, .у) — заданные функции. Задачу Коши, очевидно, можно рассматривать как частный случай этой общей смешанной задачи. При рассмотрении физических проблем функции <fy(x, у) обычно определяются приближенно из оиыта. Поэтому решение такой
278 РЕШЕНИЕ УРАВНЕНИЙ С ЧАСТНЫМИ ПРОИЗВОДНЫМИ [ГЛ. V смешанной задачи имеет практическую ценность лишь в том случае, если небольшие ошибки в начальных и краевых условиях не могут привести к большим отклонениям соответствующего решения. В этом случае говорят, что смешанная задача поставлена корректно, или, иначе говоря, непрерывно зависит от начальных и краевых условий. Определение. Смешанная задача (19), (20) называется корректно поставленной в области О, если для любого s ]> 0 можно указать число i] = ij(5j>0 такое, что при изменении функций <?if(x, у) на величины, модуль которых меньше, чем η, решение и = и{х, у) изменяется во всей области О меньше, чем на ε. В противном случае считается, что задача поставлена некорректно. у>о ^/////////У^////ЛУ//////лу///////АУ//^^^ О Рис. 58. Для уравнений эллиптического типа задача Коши обычно не рассматривается. Это объясняется тем, что, как правило, задача Коши для уравнений эллиптического типа поставлена некорректно, т. е. ничтожно малые изменения начальных данных могут повлечь существенное изменение решения. Покажем это на примере, идея которого принадлежит французскому математику Адамару. Пример. Пусть требуется найти в верхней полуплоскости у^>0 (рис. 58) решение уравнения Лапласа -4-—= 0 удовлетворяющее при у = 0 начальным условиям Коши: и(х, 0) = 0, | uv(x, 0) — — cos ля, ( (21) (22) гле я — натуральное число. Легко проверить, что решение этой задачи есть и (х, y) = ~i cos пх sh пу. (23)
§ 3] КРАЕВЫЕ ЗАДАЧИ ДЛЯ УРАВНЕНИЙ ЭЛЛИПТИЧЕСКОГО ТИПА 279 Хотя при достаточно большом я начальные данные (22) могут быть сделаны сколь угодно малыми: \и(х, 0)|<η, \иу(х, 0)|<η, тем не менее решение (23) для любого )]^>0 не ограничено при η—ι-оо в каждой полосе 0<^y<^h. Действительно, если у > 0, то, например, имеем и (О, y)=—tshny—► оо при л—► оо. Если же взять чисто нулевые начальные условия и{х, 0) = 0, иу(х, 0) = 0, то решение и0 (х, у) этой последней задачи Коши, очевидно, будет "„(■«. У) = 0. Таким образом, здесь сколь угодно малое изменение начальных условий приводит к неограниченно большому расхождению решений. § 3. Краевые задачи для уравнений эллиптического типа Исследования стационарных процессов различной физической природы (колебания, теплопроводность и др.) часто приводят к уравнениям эллиптического типа L[u]~bu-\-aux-\-buy-\-cu=F(x, у), (1) где а = а{х, у), b = b{x, у), с = с(х, у) и F(x, у) — непрерывные функции. Для этих уравнений обычно ставятся лишь краевые задачи, так как задача Коши, как было показано в предыдущем пара- у графе, для уравнений эллиптического типа может быть некорректной. Наиболее часто встречаются следующие краевые задачи. Первая краевая задача. На контуре Г, ограничивающем область G (рис. 59), задана непрерывная функция ψ (Р) = φ {х, у)- Требуется найти функцию и(Р) = и(х, у), удовлетворяющую внутри G уравнению (1) и принимающую на границе заданные значения ψ(Ρ), т. е. должны быть выполнены условия: L[u(P)] = F{P) при Ρ ζ О; ιι(Ρ) = ψ{Ρ) при ΡζΓ.
280 РЕШЕНИЕ УРАВНЕНИЙ С ЧАСТНЫМИ ПРОИЗВОДНЫМИ (ГЛ. V Вторая краевая задача. На контуре Г, ограничивающем область G, задана непрерывная функция φ, (Ρ). Требуется найти функцяю и{Р) = и(х, у), удовлетворяющую внутри G уравнению (1), нормальная производная которой на Г принимает заданные значения φ, (Р), т. е. требуется, чтобы L[u(P)] = F(P) при P£G\ ди(Р) /0. „_ п Третья краевая задача. На контуре Г, ограничивающем область О (рис. 59), задана непрерывная функция ф(Р) = ф(л;| у). Требуется найти функцию и(Р) = и{х, у) такую, чтобы L\u(P)]=;F(P) при ΡζΟ; ава(Я)4-«,^Р=ф(Я) при Ρ ζ Г, где К1+К1^о· Третью краевую задачу можно рассматривать как общую. Действительно, при а0=1 и а,=0 получаем первую краевую задачу, а при а„ = 0 и а, = 1—вторую краевую задачу. Заметим, что если область О ограниченная, то соответствующая краевая задача назы вается внутренней, в противном случае — внешней. Для уравнения Лапласа Ди = 0 первая краевая задача называется задачей Дирихле, вторая—задачей Неймана и третья — смешанной краевой задачей. § 4. Некоторые сведения о гармонических функциях. Единственность решения задачи Дирихле Определение. Функция и{х, у), имеющая непрерывные частные производные второго порядка в области О и удовлетворяющая внутри О уравнению Лапласа, называется гармонической функцией. Простейшими гармоническими функциями двух переменных χ и у являются: линейная функция и — ах-\-1>у-\-с; функция вида « = 1п/·, где г=у{х — xaY-\-(y—.y0f (основное решение уравнения Лапласа). Задача Дирихле в иных терминах может быть сформулирована следующим образом: найти функцию, гармоническую внутри данной области О и принимающую на ее границе Г непрерывные заданные значения.
§ 4] НЕКОТОРЫЕ СВЕДЕНИЯ О ГАРМОНИЧЕСКИХ ФУНКЦИЯХ 281 Единственность решения задачи Дирихле и непрерывная зависимость ее от краевых условий (корректность краевой задачи) вытекает из следующих свойств гармонических функций. Свойство 1 (принцип максимума). Гармоническая в ограниченной области функция, непрерывная в замкнутой области ϋ=0-\-Γ, не может принимать внутри этой области значений больших, чем максимум ее значений на границе Г, и меньших, чем минимум ее значений на Г. Доказательство. Пусть Μ—максимум значений и(х, у) на границе Г. Допустим, что функция и(х, у) в некоторой точке Р0(х0, уа) внутри О принимает значение р.=:и(ха, у0), причем μ.^>Μ. Составим вспомогательную функцию v(x, y) = u(x, y)Jrt^l[(x-x<iy+(y-yt)4 где d — диаметр области G. Очевидно, имеем причем при (х, у) ζ Γ выполнено неравенство Следовательно, функция v(x, у) достигает своего наибольшего значения внутри области О в некоторой точке {х, у), причем в этой точке будут выполнены необходимые условия для максимума функции: £ = £ = 0; ^г<0, ^<0. дх ду ' дхг ' ду1 Из соотношения д'у ■ 0Ч>. _d*U ■ d*U ■ 2fr-M)_ft ■ 2(μ-Μ) дхг~Т~ дуг~' дх*^ дуг~Т~ аг — "~Г dz ^ υ вытекает, что по меньшей мере одна из производных d2v d2v 33? ИЛИ ψ положительна внутри О. Поэтому функция ν(χ, у) ни в какой внутренней точке области О не может иметь максимума, и, следовательно, приходим к противоречию. Таким образом, и(х, у)^М. Аналогично доказывается, что и(х, у)^т, где т — наименьшее значение функции и(х, у) на границе Г. Следствие. Пусть функция и — и(х, у) — гармоническая в ограниченной области G и непрерывная в замкнутой области G=G-J-/\ В таком случае справедливо неравенство
282 РЕШЕНИЕ УРАВНЕНИЙ С ЧАСТНЫМИ ПРОИЗВОДНЫМИ [ГЛ, V где и=т'ти(х, у) на Г н и = тах. и(х, у) на Г. Замечание. Можно доказать более сильное утверждение, что гармоническая в ограниченной и замкнутой области G функция, отличная от константы, не принимает внутри О наибольшего и наименьшего значений. Свойство 11 (единственность задачи Дирихле). Задача Дирихле для замкнутой и ограниченной области может иметь лишь единственное решение, т. е. не существует двух непрерывных гармонических функций в замкнутой ограниченной области G, принимающих на границе одни и те же значения. Доказательство. Допустим, что две функции ",(*> У) и М*. У)> гармонические в области G, совпадают всюду на ее границе. Рассмотрим функцию и(х, y) = Ul(x, y) — u2(x, у). Очевидно, что и (х, у) — гармоническая функция, обращающаяся в нуль на границе. По свойству 1 эта функция не может принимать внутри G значений больше или меньше нуля, следовательно, и(х)^0 внутри О и «, (х)=иг (х). Замечание. Из свойства 11 не следует, что задача Дирихле для ограниченной замкнутой области G имеет решение; это свойство лишь утверждает, что если существует решение задачи Дирихле для области О, то оно единственно. Можно доказать [20J, что если область G выпуклая, т. е. вместе с двумя своими точками содержит соединяющий их отрезок, и граница ее Г кусочно гладкая, то задача Дирихле для такой области с непрерывными данными на ее границе Г действительно имеет решение (теорема Неймана). Свойство 111 (корректность задачи Дирихле). Решение задачи Дирихле для замкнутой и ограниченной области непрерывно зависит от граничных данных. Доказательство. Допустим, что и, [х, у) и иг (х, у) — решения задачи Дирихле, соответственно принимающие на границе значения τΊ (*. У) и <Р» (*> У)-
§ 5] УРАВНЕНИЕ ЛАПЛАСА В КОНЕЧНЫХ РАЗНОСТЯХ 283 Пусть всюду на границе Г выполнено неравенство I ¥>,(*■ У) — <Р. (■»->') К ε. где s — произвольно малое положительное число. Рассмотрим гармоническую функцию " (*, У) = ", (х, У) — и2 {х, У)· На границе Г эта функция принимает значение ψ(χ, y) = <fi{x, у)—уг(х, у). Так как —ε<φ(Λ;, y)<s на Г, то по свойству ] имеем — ε <и(х, у)<ε при (*, у) ζ G, т. е. — г<и,(х, у)—иг(х, y)<s или |и,(х, у) — a,U, y|<s. Таким образом, для задачи Дирихле требование корректности выполнено при η = s (см. § 3). § 5. Уравнение Лапласа в конечных разностях Для получения конечно-разностного уравнения, соответствующего уравнению Лапласа <52и д2и достаточно заменить производные -τ-γ и -^-j- отношениями конечных разностей по формулам: дги » (х -f- /', V) — 2ц (х, у) + и (х — h, у). дх' ^ й2 д'н и {х, y-\-h)~ 2u (х, у) -+- и (х, у - /г) дуг ^ Λ2 Тогда будем иметь u(x-\-h, у) — 2к (х, у) + и (х — h, у) ι _ j. , ц (х, у + Λ) — 2и (х, у) + »(х, ν — /г) п "1 Α5 υ и, следовательно, а (*■ J') = Τ I" I* + h, у) + « (х — А, у) + + и(х, y-\-h)-\-u(x, у —А)]. (2)
284 РЕШЕНИЕ УРАВНЕНИЙ С ЧАСТНЫМИ ПРОИЗВОДНЫМИ [ГЛ. V Однако, чтобы иметь возможность оценить точность такой замены, следует идти по несколько иному пути, используя для получения коиечно-разностного уравнения формулу Тейлора /(* + *. * + *) = -/(*. ^)+(έΑ+ι*)^·^+ΐ(έΛ+^),/(χ·у)+··· где 0<θ<1. При этом пользуются различными схемами. Рассмотрим две основные схемы. Первая основная схема. Рассмотрим точки во D -о- л(х.у) <ое ε Рис. 60. А(х, у), B(x — h, у), C(x^-h,y),' D(x, У+h), Е{х, у —А), лежащие в центре квадрата и на серединах его сторон (рис. 60), и выразим значения функции к в точках В, С, D, Ε через значения этой функции и ее производных в центральной точке А (х, у). Согласно формуле (3), полагая в ней я = 4, имеем: u(x — h, y) = u(x, J>) —Лия+2ГАЧ* — зГ ^χχχ ~Т~ ^Г ^χχχχ' и (χ, у — й) = и(х, у) — Аку + 2Г А'Иуу — — "ЗГ й "ууу + "J" ^"ууУУ' и (χ, y-\-h) = a (χ, у) -}- kuy -}- 5rAsayy + (4)
§ 5] УРАВНЕНИЕ ЛАПЛАСА В КОНЕЧНЫХ РАЗНОСТЯХ 285 ■χχχι кууу—значения производных в точке "хххх> уууу' уууу ' ■ производные в некоторых где их, иу, ихх, uJy, u: А(х, у), аИхххх, ~и промежуточных точках Складывая равенства (4), получаем и(х — А, у)-\-и(х-\-/г, у)-{-и{х, y — h)-\- + и (х, у + А) = 4и (х, у) + А* (ихх + иуу) -f Rh (x, у), (5) где остаточный член #*l*. у)=-$- [в«««+"****+иууУуЛ-иууУУ\ при agC(4) имеет порядок О (А*). Отсюда будем иметь u(x — h, y)-{-u(x~{-h, y)-\-u(x, y — h)-\-u{x, y-\-h) = = 4и(х, y)-Jrh^u-JrO(ht) и, следовательно, fat = -p[u{x— A, y)-\-u(x-\-h, y)~\-u(x, y — h)-\- + и (χ, у + A) - 4к (x, jM 4- О (Аг). (6) Формула (6) выражает оператор Лапласа Да через конечные разности и называется первой основной конечно-разностной формой оператора Лапласа. Откидывая в уравнении (6) член О(А'), получим, что уравнению Лапласа Δα = 0 приближенно соответствует следующее уравнение в конечных разностях: и(*.)') = -4-1"(■*+*. У)+а(х — h*y)-\- 8 + в(ж, y + h)+u{x, у — А)], (7) что совпадает с уравнением (2). Вторая основная схема. Рассмотрим точки А(х,у), В(х— h,y + h),C(.x + h,y + h), D(x-\-h, y — h), E(x — h, y — h), лежащие в центре и вершинах квадрата рис g[ (рис. 61). Как и в первой схеме, выразим значения функции и в точках В, С, D, Ε через значения этой функции и ее производных в точке А.
286 РЕШЕНИЕ УРАВНЕНИЙ С ЧАСТНЫМИ ПРОИЗВОДНЫМИ [ГЛ. V Полагая л=4 в формуле (3), получим: и (х + А, у — h) = и (х, у) -\- А (их — иу) 4~ + 4" I"» ~~ 2κ*ν + Kvy) + ΐ (И*« "" — Зи*х, + Зн*„у —«vyy) + + ir(s~3?) и^-ч.)· и (λ; — A, у — A) — и (х, у) + h (— их — uy) -f + "f («« + Чу + "„„) + ΐ (— "*** - — Зихху — Зихуу — Uyyy) + U(X — h,y+h) = u(X, y) + h(— It,+ «!„)+ | (8) 4- χ(M**—2,v + "w)+lr (~ "*** + и (х + Λ, j/ + h] = и (х, у) -j- А (их -f uy) + +4" (u«+2к*у+ν+4" (α«*+ + 3««, + 3a»vy + itm) + Складывая равенства (8), будем иметь и (х -\- А, у — h)-\-u(x — h, у — h)-\-u(x — h, у -\- h) -\- -{-u(x-\-h,y-\-h)=4u (χ, у) -f 2Λ2Δκ + Ο (Λ4), откуда А" = -^г [и (χ -{- Λ, у — А) + и (λ; — Λ, у — Λ) -f + κ (λ; -J- Λ, у + Λ) + " (χ — h< У 4" h) — 4κ (*. У)1 + ° №)■ Откидывая остаточный член О (А2), получаем, что уравнение Лапласа Δ« = 0 приближенно можно заменить конечно-разностным уравнением "(*. y)=:j\u(x-\-h,y—h)-\-u(x~h,y — h)->r 4-«u-A,y4-A)4-"U4-A.3'4-/')J- (9)
§ 6J РЕШЕНИЕ ЗАДАЧИ ДИРИХЛЕ МЕТОДОМ СЕТОК 287 § 6. Решение задачи Дирихле методом сеток Идея метода сеток (или, иначе, метода конечных разностей) для приближенного решения краевых задач для двумерных дифференциальных уравнений заключается в следующем: 1) в плоской области G, в которой разыскивается решение, строится сеточная область Ол, состоящая из одинаковых ячеек (рис. 62) н приближающая данную область G; 2) заданное дифференциальное уравнение заменяется в узлах построенной сетки соответствующим конечно-разностным уравнением; Рис. 62. 3) на основании граничных условий устанавливаются значения искомого решения в граничных узлах области Ол. Найдя решение конечно-разностного уравнения, для чего, вообще говоря, нужно решить алгебраическую систему с большим числом неизвестных, мы получим значения искомой функции в узлах сетки, т. е. будем иметь численное решение нашей задачи. Выбор сеточной области производится в зависимости от конкретной задачи, но во всех случаях контур ГА сеточной области 0Л следует выбирать так, чтобы он возможно лучше аппроксимировал контур Г заданной области G. Сеточная область может состоять из квадратных, прямоугольных, треугольных и других клеток. От выбора основного размера клетки h зависит величина остаточного члена Rh при замене дифференциального уравнения конечно-разностным. Следовательно, размер h теоретически должен определяться требованием, чтобы этот остаточный член был меньше погрешности, допустимой при решении. Однако такой путь не всегда целесообразен, так как получаемый при этом размер h настолько мал и, следовательно, число клеток настолько велико, что решение оказывается практически невыполнимым. Обычно задача решается сначала при большом значении h, т. е. при малом числе клеток, и лишь после того, как задача грубо приближенно решена для згой крупной сетки, переходят к более мелкой
288 решение уравнений с частными производными [гл. ν сетке или во всей рассматриваемой области, или в какой-нибудь ее части. Идея метода сеток известна давно и восходит еще к Эйлеру. Однако практическое использование этого метода наталкивалось на серьезные трудности, так как получение с его помощью достаточно точного решения краевой задачи обычно приводило к колоссальным системам алгебраических уравнений, на решение которых при ручном счете требовались годы вычислительного труда. Положение резко изменилось с появлением быстродействующих электронных вычислительных машин. Метод сеток допускает удобную реализацию на электронных счетных машинах, так как применение его обычно сводится к массовой повторяемости однородных циклов. В настоящее время метод сеток является одним из наиболее эффективных методов решения линейных, а также отчасти нелинейных задач математической физики [15]. Покажем применение метода сеток для построения решения задачи Дирихле ■S- + -gS" = 0 пРи (*.JO€0 и ο(Ρ) = φ(Ρ) при Р£Г, (1) где у(Р) = у(х, у) — заданная непрерывная функция; причем для простоты рассмотрим лишь случай квадратной сетки. Будем предполагать, что область О ограничена прос- а все четыре соседних С ним узла — множеству 5Л; в противном случае он называется граничным (например, узлы Bh и Сн сетки 5А) (иа рис. 63 внутренние узлы обозначены светлыми кружками, а граничные — темными кружками и темными треугольниками).
§ 6J РЕШЕНИЕ ЗАДАЧИ ДИРИХЛЕ МЕТОДОМ СЕТОК 289 Граничный узел сетки Sh называется узлом первого рода, если он имеет соседний внутренний узел этой сетки (например, узел Вн на рис. 63); в противном случае граничный узел называется узлом второго рода (узел Сн на рис. 63). Внутренние узлы и граничные узлы первого рода сетки Sh называются расчетными точками. Граничные узлы второго рода не входят в вычисление и могут быть изъяты из сетки Sh (на рис. 63 граничные узлы второго рода обозначены темными треугольниками). Относительно сетки Sh предположим, что множество ее расчетных точек «связное», т. е. любые две расчетные точки можно соединить цепочкой узлов, каждые два смежных элемента которой являются соседними узлами. Кроме того, будем считать многоугольную сеточную область GA выбранной так, чтобы ее геометрическая граница Гн возможно ближе примыкала к границе Г области О. Заметим, что узловые точки контура Гл могут лежать как внутри, так и вне области О. Значение искомой функции к=и(х, у) в точках (х{, yt) обозначим через ui/ = u(xi, у/). Следуя общей схеме (см. § 5, (2)), для каждой внутренней точки (χ., у.) сетки Sh заменяем дифференциальное уравнение (1) конечно-разностным уравнением К(/ = Т(К'·-'./ + "'■+'. / + "../-. + ",·, jr+i). (2) где (л;;±,( уу±,) — расчетные точки. В граничных узлах 1-го рода Bh сетки Sh полагаем «(βΛ) = α(β) = φ(β), (3) где В— ближайшая к Вн точка границы Г. Система (2) является неоднородной линейной системой, причем число неизвестных (т. е. число внутренних узлов сетки) равно числу уравнений. Система (2) всегда совместна и имеет единственное решение. Чтобы доказать это, достаточно убедиться в том, что соответствующая однородная система имеет лишь нулевое решение. Однородная система, очевидно, формально может быть записана в виде системы (2) с той лишь разницей, что значение функции ψ(Ρ) на границе Г следует положить тождественно равным нулю φ(Ρ) = 0. Однородная система (2) всегда совместна, так как эта система имеет тривиальное решение
290 РЕШЕНИЕ УРАВНЕНИЙ С ЧАСТНЫМИ ПРОИЗВОДНЫМИ [ГЛ. V Покажем, что 'однородная система (2) не может иметь решений щ. φ 0. Пусть, например, для некоторого решения одно из ее неизвестных и =£=0. Для определенности будем считать "„><>. Обозначим через uPQ наибольшую компоненту рассматриваемого решения, т. е. положим uPQ Ss uif (4) для всех узлов сетки Sh. В силу неравенства (4) будем иметь "/><?>",>?> °- (5) На основании системы (2) получаем UPQ=T(UP-*, Q+ "/> + !, <? + "/>, Q-,+KP,Q+i)· ι6) Учитывая неравенство (4), заключаем, что UP-1, Q ^ UPQi UP+l, Q ^ UPQ> UP, Q-l ^ UPQ UP, Q+l ^UPQ· Ни одно из последних четырех неравенств не является строгим, так как если бы это имело место, то, складывая все четыре неравенства и учитывая формулу (6), мы получили бы Поэтому ир-\, qz= ир+\, ρ~ ир, с-· :==ир, ς>+ι = upq· (') Проводя аналогичные рассуждения для точек up+lt Q, ир+г 0, ..,, на конечном шаге достигнем некоторого граничного узла ир+т 0 сетки Sh с ближайшей точкой Μ ξ Γ, где положено иР+т, ρ=φ(Λί)=0· Таким образом, из цепи равенств (7) имеем uPQ = 0, что противоречит неравенству (5). Итак, однородная система (2) не может иметь положительных решений. Аналогично доказывается, что эта система не может иметь отрицательных решений. Следовательно, itiy==0
§ 7] ПРОЦЕСС ЛИБМАНА 291 для каждого решения и, значит, неоднородная система (2) совместна и имеет единственное решение. Решив систему (2), получим приближенные функции и = и(х, у) в узлах сеточной области Gh, найдено приближенное численное решение задачи ласти Gh. Можно показать, что в общем случае ближенного решения имеет порядок 0(h). значения искомой Тем самым будет Дирихле для об- погрешность при- § 7. Процесс Либмаиа Если число узлов сетки Sh велико, то непосредственное решение системы (2) из § 6 становится затруднительным. Кроме того, для криволинейной области О значения функции и в граничных узлах сетки Sh выбраны слишком грубо. Эти обстоятельства заставляют для решения указанной системы прибегать к итерационным методам с одновременным исправлением граничных значений. Согласно процессу усреднения Либмана, выбрав начальные приближения и^.\ последовательные приближения ιιψ для внутренних узлов (xit у,) сетки 5Л определяем по формуле «ί?=τ И*_-Л+ ^+..1)/+"%7ΐ\ + иЫ\] (ft=l, 2, ...)· (1) Что касается граничных узлов Ah сетки Sh, то значения функции и(Ан) в этих узлах последовательно исправляем по формулам линейной интерполяции: "т(А,) = и(А), „<А- 1Г в'*>Ий) = иИ)- ■"(В)-и{А)ь (Л=1, 2, л-и ■ ). (2) / / / 1 I 1 \ \ \ \ г ί ^ U * г У^ ^^ где А — ближайшая к Ah точка границы Г {и (Α) = ψ(Α)), В — ближайший к Ah внутренний узел сетки Sh fl~-~_ ^"" Ah (рис. 64) и Ь — удаление узла Ah ti от точки /4, причем $>0, если рис_ £4 Ah—внутренняя точка области G, и Ь <^ 0, если Ан — внешняя точка области О. В частном случае, узел Ah лежит на границе Г (Ah=.A, 8 = 0), то имеем точно „<*) Ий) = иИ) = ?И)·
292 решение уравнений с частными производными [гл. ν На практике после некоторого шага k можно считать u(k)(Ah) неизменными (например, если эти значения установятся с заданной степенью точности). За начальные значения и[°) теоретически можно взять любую систему чисел. Однако следует иметь в виду, что в силу принципа максимума (см. § 4, свойство I) для значений искомой функции и(х, у) должны быть выполнены неравенства т s£ Uij ^ Μ, где m = m\n<f(P) и М — тах<р(Р). г г Поэтому разумно полагать Щ: uif М. Практически для выбора uW грубо решают задачу Дирихле в области О с помощью крупной сетки, а затем найденные значения используют для решения задачи Дирихле на данной мелкой сетке. Для начала процесса обычно применяют линейную интерполяцию. Доказывается [1], \3], [6], что для любого шага сетки h процесс Либмана независимо от выбора начальных значений сходится, т. е. существует 1Ш1И(*> = И;,, А-юо ' причем погрешность приближенного решения имеет порядок 0(h'). Для практического проведения вычислений по методу итерации полезно приготовить достаточное число специальных вычислительных шаблонов [9]. Способ заготовления этих шаблонов, для случая неизменных граничных значений, следующий. Пусть область О, в которой должно быть найдено решение задачи Дирихле, покрыта сеткой (рис. 65). Внутренние узлы этой сетки отмечены белыми кружками; граничные узлы, в которых известны значения искомой функции, отмечены черными кружками. Для построения вычислительного шаблона строим вторую сетку, линии которой проходят посредине, между линиями первой, причем так, что узлы первой сетки (внутренние и граничные) попадают в центры клеток второй сетки (рис. 66). f + # | J> л>—9—9—9—9—♦ Рис. 65.
§ 7J ПРОЦЕСС ЛИБМАНА 293 Клетки второй сетки, в центрах которых лежат граничные узлы первой сетки, обведем жирной чертой. Готовый вычислительный шаблон № 1 приведен на рис. 67. В обведенные жирной чертой клетки шаблона № 1 вписываются неизменные граничные значения, определенные на контуре ГА. Внутренние клетки будут заполняться последовательно итерационным процессом. Поэтому нужно заготовить достаточное число одинаковых шаблонов № 2,3, ..., состоящих из одних внутренних клеток*) такого же размера, как клетки шаблона № 1 (рис. 68). Внутренние клетки шаблона № 1 заполняем начальными значениями процесса итерации (произвольными числами или решениями задачи Дирихле, полученными для более крупной» сетки). Когда шаблон № 1 заполнен, начинает- Λ*? ся заполнение шаблона № 2 таким образом, чтобы в каждой его клетке было записано • • • • -ό- -ό- -ό- -6- • -о- -ό- 1 -ό- 1 -Οι -ο- • -ό- I -ό- I I -o- -ό- -ό- • -ό- -ό- -ό- 1 -ο- ι -ό- • -ό- -ό- -ό- -ό- 1 -ό- • • -ό- • • • • Рис. 66. № Рис. 67. Рис. 68. среднее арифметическое четырех чисел, стоящих в соответствующих клетках шаблона № 1. Очевидно, что при заполнении шаблона № 2 также участвуют и значения, стоящие в граничных клетках шаблона № 1. *) Понятно, что если граничные значения подлежат исправлению, то в шаблонах следует сохранить также и граничные клетки.
294 РЕШЕНИЕ УРАВНЕНИЙ С ЧАСТНЫМИ ПРОИЗВОДНЫМИ [ГЛ. V После заполнения шаблона № 2 его накладывают на шаблон № 1, оставляя при этом открытыми граничные точки последнего, и аналогичным способом заполняют шаблон № 3, используя шаблон № 2. Процесс продолжается до тех пор, пока в пределах заданной точности не совпадут два последних шаблона. Пример. Найти приближенное решение уравнения дги , дги Л удовлетворяющее на окружности х2 -\-у2 =]Q (Г) условию и{х, У)\г = х*Уг. Решение. В силу симметричности решения рассмотрим четверть круга. 1-й этап. Берем крупную сетку с шагом /г = 2 (рис. 69). Ближайшая к узлу /1(4,2) сетки точка границы Г есть Μ(γ\2,2), поэтому полагаем и (А)^и (М) = 12.22 = 48. Аналогично, для узла сетки А' (2,4) ближайшая точка границы Г есть М'(2,у 12), поэтому и(А)=&и(М')= 48. В узлах С (4,0) и С (0,4) сетки, очевидно, имеем и(С) = и(С) = 0. Обозначая через a, b и с значения функции и во внутренних узлах сетки (рис. 69) и учитывая симметрию задачи, составляем систему конечно-разностных уравнений а = т-4Ь, ft = j(2c+e +0), с = ^-(48+ 48-}-26). Из этой системы находим а = 24; £=24; с = 36. 2-й этап. Берем более мелкую сетку (рис. 70) с шагом h = \ при неуточненных граничных значениях. Полагаем «И) = и(/1')=15; и. (В) = и (В') = 48; и (С) = 63.
§ 7] ПРОЦЕСС ЛИБМАНА 295 Используя значения функции и(х, у) в узлах крупной сетки с шагом Λ —2 и в граничных узлах и учитывая симметрию задачи, составляем конечно-разностные уравнения по первой и второй схеме для значений а, Ь, с, d, e, / искомой функции и в узлах сетки с шагом h— 1 (рис. 70). Имеем 1 ._4-(0 + 36 + 48+24), & = |(e-f*+0 + 24), rf = T^ + C + 24 + 36^' /=i.(48 + e+63 + 36), c = |(24 + 24 + 24 + 36), fl=4(24 + 24+c+c). Отсюда приближенно находим α = 26; 6 = 20; с = 27; rf = 28; е = 27; /=44. 3-й этап. Уточняем значения и(х, у) в граничных узлах. Используя формулы (2) и полученные значения во внутренних узлах сетки, находим и(А) — и(А') = \3; и(Я) = и(Я') = 49; ц(С) = 73. 4-й этап. На основе полученных данных строим систему шаблонов (№ 1—7) и последовательно уточняем (с точностью до единицы) значения искомой функции и (х, у) во внутренних узлах. Шаблоны № 6 и 7 совпадают с точностью до единицы. Отметим, что точным решением этой задачи является функция B = xy+i. [256-1*'+/)']. 0 b 2il а< IS И' е Г w с в' f 36 \к 6Г а \б5 f \ е ι5 ~в •А Для сравнения приводим значения точного решения в узлах сетки (шаблон № 7а). 2Ί α 2Ί b 0 Для оценки точности решения, по- рис. 70. лученного по методу сеток, существуют теоретические оценки. Как правило, эти оценки весьма сложны и применение их затруднительно. Поэтому на практике используют двойной пересчет решения с шагами h и 2/г. Если соответствующие результаты совпадают с заданной точностью, то считают, что искомое решение задачи найдено правильно. В противном случае Λ применяют пересчет с шагом -у и сравнивают полученный результат с прежним результатом, соответствующим шагу h, и т. д.
296 РЕШЕНИЕ УРАВНЕНИЙ С ЧАСТНЫМИ ПРОИЗВОДНЫМИ [ГЛ. V № 1 0 20 24 26 24 13 27 28 27 26 49 44 36 28 24 73 44 27 20 49 13 0 20 26 26 26 27 46 29 27 26 37 29 26 46 27 20 № 3 № 4 20 26 26 26 27 30 28 26 46 38 30 26 46 27 20 20 26 27 27 28 30 28 27 47 38 30 26 47 28 20 № 5 20 27 28 28 28 30 28 28 47 38 30 27 47 28 W
§8) О РЕШЕНИИ ЗАДАЧИ ДИРИХЛЕ МЕТОДОМ МОДЕЛИРОВАНИЯ 297 № 6 № 7 21 27 28 28 28 30 29 28 47 38 30 27 47 28 21 21 27 28 28 28 30 29 28 47 38 30 27 47 28 21 № 7а 0 22 30 32 32 12 28 33 32 32 46 47 40 33 30 73 47 28 22 46 12 0 Отдельно следует проанализировать влияние ошибок округления. Схема вычислений должна быть устойчивой, т. е. ошибки решения, связанные с округлением, не должны возрастать неограниченно. § 8. Понятие о решении задачи Дирихле методом моделирования Приближенное решение задачи Дирихле может быть получено также с помощью моделирующих устройств. Под моделированием, с общей точки зрения, понимается использование аналогий между физическими явлениями и соответствующими дифференциальными уравнениями. Задача Дирихле Ди [х, y) = Q при (х, у) £ О
298 РЕШЕНИЕ УРАВНЕНИЙ С ЧАСТНЫМИ ПРОИЗВОДНЫМИ [ГЛ. V и и(х,У) = Ч>{х,У) при (х,у)£Г, где контур Г ограничивает область О, приближенно решается с помощью сеточного электроинтегратора [16], [17], [18]. Принцип последнего следующий: в дайной области О построим две системы равноотстоящих прямолинейных проводников, параллельных соответственно осям Ох и Оу. Пусть точки пересечения x, = ih, y,=jh (I, /=0, -j-1, ±2, ...) (h — расстояние между соседними проводниками) этих проводников являются внутренними узлами сетки, а концы проводников соответствуют граничным узлам. Предположим, что в построенной системе проводников протекает постоянный электрический ток. Тогда значение и,; = а (Xi,yj) можно интерпретировать как потенциал тока в узле (xt, у ) при условии, что в граничных узлах (xp,yq) потенциал тока имеет заданную величину ψ (χρ, yq). Действительно, в силу закона Кирхгофа суммарное количество электричества, протекающего через каждый внутренний узел (Х[, уЛ, равно нулю. Поэтому, обозначая через R омическое сопротивление единицы длины проводника (R= const), на основании закона Ома будем иметь: и (Xj — fi, yj) - и (χι, yj) . η (%,· -f h, у J) — и (xh yj , Rh "T" tf/j Τ ι »(Xj, Уj —h) — n (Xj, yj) , a (xb yj + h) — и (χ,·, yj) - > ~Rh "I R~h — "· Отсюда BV = T<B'->. / + ",-+!, / + «.■,/-·+«i.y+i)> i1) если [xh yf) £ О, причем upq=f (■*> Уд)< еСЛИ (χρ> Уд) £ Γ· (2) Из формул (1) и (2) вытекает, что и:, являются значениями решения нашей задачи Дирихле, полученного методом сеток по первой основной конечно-разностной схеме (§ 5, (7); § 6, (2)). Величины Uy определяются путем непосредственного измерения потенциалов установившегося тока в узлах (xt, _уу.). Для повышения точности метода Применяют специальные приемы ввода граничных условий (см. [16]).
§ 9) О РЕШЕНИИ ЗАДАЧИ ДИРИХЛЕ МЕТОДОМ МОНТЕ-КАРЛО 299 § 9. Понятие о решении задачи Дирихле методом Монте-Карло Пусть на плоскости Оху дана область G с кусочно-гладкой границей Г. В области G построим квадратную сетку Sh с шагом А: Xi = xa + ih, y/ = ya-\-jh (1) (/,/=0, ±1, ±2, ...). где b.xi = xi+^—xi = h, Aj// = y/+1—y/ = A. Мы предполагаем, что сетка Sh состоит из внутренних узлов и граничных узлов 1-го рода (см. § 6). Граничные узлы сетки Sh образуют ее границу Гн. Грубо говоря, граница Гн представляет собой линейный ряд точек Μ (χ , у), аппроксимирующий криволинейную границу Г области G с точностью до А. Представим себе частицу М, которая совершает равномерное случайное блуждание по узлам сетки (1). А именно, находясь во внутреннем узле М;/ (х-, у/) сетки Sk, эта частица за один переход, с одной и той же вероятностью, равной —, может переместиться в один из соседних узлов: или в Mi_y^j(xi — А, у,) (шаг влево), или в Mi + ui(Xi-\-h, yj) (шаг вправо), или в Mt ,_х(х{, уу — А) (шаг вниз), или в М-1щ / + 1 (xt, yj -\- А) (шаг вверх); причем каждый такой единичный переход совершенно случаен и не зависит от положения частицы и ее прошлой истории. Будем считать, что блуждание частицы Μ заканчивается, как только эта частица попадает на границу Гн; в этом смысле граница Гн представляет собой «поглощающий экран». Можно доказать [11], что с вероятностью, равной 1, блуждание точки Μ через конечное число шагов заканчивается на границе. Если частица Μ начала свое блуждание с фиксированной внутренней точки /И,- , сетки Sh, то конечная совокупность последовательных положений этой частицы: Мш MixJ, Mt,u где Λί.ν>?Γ* l* = 0, 1 s—l) и Μί,ι,ζ,Γ/,, называется траекторией частицы (с s шагами) или историей блуждания. Равномерное случайное блуждание частицы на плоскости можно организовать с помощью равномерно распределенной последовательности одноразрядных случайных чисел [11], [12], принимающих значения 0, 1, 2, 3, 4, 5, 6, 7, 8, 9. Для этого, например, достаточно производить розыгрыш, т. е. случайную выборку из чисел 0—9, придерживаясь инструкции, указанной в таблице 65.
300 РЕШЕНИЕ УРАВНЕНИЙ С ЧАСТНЫМИ ПРОИЗВОДНЫМИ [ГЛ. V Случайные числа берутся из готовых таблиц или вырабатываются электронной машиной [19]. Последний способ при работе на счетной машине предпочтительнее, так Таблица 65 Определение шага частицы в зависимости от выпавшего случайного числа как он позволяет не загружать сильно память машины. Пусть в точках границы Г области О определена некоторая функция φ(χ, у). Перенесем эти значения на границу ГЛ сетки Sh. Например (см. § 6), для каждого граничного узла Mpq (хр, уд) ζ Гк определим ближайшую по горизонтали (или вертикали) точку Ν ξ Γη положим ?(Λί„) = φ(Λ0· Для краткости введем обозначения Ψρς — ψ(Χρ> Уд)- Пусть P(i, j; p, q)—-вероятность того, что траектория частицы, вышедшей из узла Λί,-y сетки Sh, закончится в граничном узле Мря ζ Гк. Так как блуждание точки неизбежно заканчивается на границе Гн в первой же точке выхода ее на границу, то Σρ(ι, л ρ, ?)=i, (2) Р. Я где суммирование распространяется на все точки Мря границы ГЛ, причем ( 1 при р'=р, q' = q\ Р(р',ч';р, ς)=\ ft ,_,_,, , :,„,_.л С3) Случайное число 0 или 4 1 » 5 2 » 6 3 » 7 Характер перемещения Δχ; = Λ (шаг вправо) Д_у^=Л (шаг вверх) Δ.\'; = —Л (шаг влево) ^Уj = — Л (шаг вниз) о » ΐρ'-^ι + ι^-^ο, где Mp'qi — граничный узел. Составим сумму »у= Σ P(i, Л Р. д)9рд. Р. Я (4) где точка Мрд(хр, yq) пробегает всю границу Гн. Если функцию φ (χ, у) рассматривать как случайную величину, принимающую значения φ„? на границе Гн, то сумма (4) представляет собой математическое ожидание (среднее значение) функции φ (χ, у) на границе Гк для траекторий, начинающихся в точке Mi} (xit yj) («премия за рыход на границу» из начальной точки My).
§9] О РЕШЕНИИ ЗАДАЧИ ДИРИХЛЕ МЕТОДОМ МОНТЕ-КАРЛО 301 Частица, начавшая свое случайное блуждание из внутреннего узла Mfj, после первого шага с вероятностью, равной -j-, попадает в один из четырех соседних узлов. Поэтому случайные блуждания, начинающиеся в узле Λί;/·, в зависимости от вида траекторий распадаются на четыре категории новых случайных блужданий: I. Ми, Mt_hJ, ... ; II. Mip Mi+1J, ... ; III. Mu, MltJ^, IV. MtJ, MiJ+b ... По формуле полной вероятности имеем: P(i, Л Ρ, 9,) = "4 р(' — 1· Л Р, 9)-r"TP(i + 1' J' Ρ' Ч) + + jP(i,j-i-,P, ?)+|р(«,У + 1;р, я). (5) Отсюда, умножая обе части равенства (5) на граничные значения φρ? и суммируя по всем возможным значениям ρ и q, на основании формулы (4) получим [11]: VV = Τ (ν'-ι. J "г *ί+ι, i + υ<> /-ι + νι, /+ι)· (6) Кроме того, в силу формулы (3) имеем Vpq=9pq> (7) если точка Мрг ζ Γή. Рассмотрим теперь задачу Дирихле об отыскании функции и — и(х, у), гармонической в области О и принимающей иа ее границе Г заданные непрерывные значения φ (л:, у). Согласно методу сеток (§ 6) эта задача сводится к нахождению значений и^ = и (xh yj) искомой функции и(х, у) во внутренних узлах Mtj (хь yj) некоторой сетки Sh при условии, что значения в граничных узлах Мм (хр, у ) ζ Ph известны и равны φρ? — φ (χρ, yq). Неизвестные и/у· определяются из системы линейных уравнений (см. § 6, формула (2)): "(/ = -ζ ("ι -ι, / + "i+i, / + "i, /-ι + % /+ι). Сравнивая формулы (8) с формулами (6), (7), мы усматриваем, что они совпадают с точностью до обозначений. Следовательно, искомые неизвестные иу можно рассматривать как математические ожидания v4j. (8)
302 РЕШЕНИЕ УРАВНЕНИЙ С ЧАСТНЫМИ ПРОИЗВОДНЫМИ [ГЛ. V Величины vif допускают экспериментальное определение. Рассмотрим достаточно большое число N равномерных случайных блужданий частицы по узлам сетки 5Л, исходящих из фиксированного узла /И,·, и заканчивающихся на границе Гн. Пусть (хр (A), yq (k)) (fe = = 1, 2, ... , Ν)—соответствующие точки выхода частицы на границу rh. Заменяя математическое ожидание vif эмпирическим математическим ожиданием, будем иметь N иц = vu = 7/ Σ №р №- У я №)■ (9) Формула (9) дает статистическую оценку величины u{j и может быть применена для приближенного решения задачи Дирихле. Метод решения задач, основанный на использовании случайных величин, получил общее название метода Монте-Карло (см. [13]). Заметим, что с помощью формулы (9) можно непосредственно найти приближенное значение u;j решения задачи Дирихле в единственной фиксированной точке Ж,·, сетки Sh, не зная решения задачи для остальных точек сетки. Этим обстоятельством метод Монте-Карло для задачи Дирихле резко отличается от обычных стандартных способов решения этой задачи. Интересно отметить, что вероятность P(i, у; р, q), в силу формулы (4), представляет собой аналог функции Грина для задачи Дирихле в области Sh. Эта величина может быть найдена экспериментально на основании формулы (9), если задать следующие граничные условия: ?(■*> V?)=l π φ(ν- jy) = ° при !/>' — p\ + W — <ι\Φ®- Построив такую функцию Грина, мы получаем возможность, применяя формулу (9), просто находить приближенное решение задачи Дирихле для области О с данной границей Г при любых граничных значениях φ(χ, у). Недостатком рассмотренного варианта метода Монте-Карло для задачи Дирихле является слабая сходимость по вероятности при N—>■ оо эмпирического математического ожидания N А = 1 к математическому ожиданию vtj. Чтобы устранить это неблагоприятное обстоятельство, используют различные модификации случайных блужданий (см. [И]). Кроме того, при решении задачи полезно учитывать также, что блуждание частицы М, начинающееся в точке Mt,,
§9) О РЕШЕНИИ ЗАДАЧИ ДИРИХЛЕ МЕТОДОМ МОНТЕ-КАРЛО 303 автоматически является случайным блужданием частицы, начинающимся в любой промежуточной точке траектории этой частицы. Пример. Методом Монте-Карло найти и(2, 2), если Ды (х, у) = 0 в области G{ 0sg xs£ 4; 0s^y^4\ (10) Решение. Для ную сетку Sh с шагом Л=1 (рис. 71). Рассматриваем серию равномерных блужданий частицы по узлам нашей сетки Sft, исходящих из начального положения (2,2) (на рис. 71 эта точка отмечена двойным кружком) и заканчивающихся на границе Г в граничных узлах сетки Gh (на рисунке эти узлы отмечены квадратиками). Для организации случайных блужданий используем равномерно распределенную последовательность случайных чисел [14] (см. таблицу 66). Перемещение частицы определялось согласно указанной выше инструкции (таблица 65), причем валось как стояние частицы на и(х, 0) = 0, "(4, У) = У, и(х, 4) = х, и(0, у) = 0, квадрата G 0 ==£.*;==£ 4; \ 0й£_у<4; 1 0s=Sjc<4; Г 0<у<4. J с границей Г построим (И) квадрат- выпадение чисел месте. Например, 5 и 9 рассматри- последовательно Таблица 66 57705 26275 64003 93045 Последовательность случайных чисел 71618 05926 20514 93011 73710 66289 00188 70131 16961 35483 09393 55709 42844 52906 86977 09461 53324 30304 31303 99602 43166 55186 11578 69962
304 РЕШЕНИЕ УРАВНЕНИЙ С ЧАСТНЫМИ ПРОИЗВОДНЫМИ [ГЛ. V Таблиц а 67 Решение задачи Дирихле (10), (11) методом Монте-Карло J* блуждания 1 2 3 4 5 6 7 8 9 10 Π 12 13 14 15 16 17 18 19 20 (2,2) - -(3,1) - -(2,2) - -(2,1) -* (2,2) - -(4,2); (2,2) - -(2,4); (2,2) - (2,2) - (2,2) - (2,2) - -(3,1) - -+(0,2); (2.2) - (2,2) - -(3,3) - -(0,3); (2,2) -* (2,2) - -(2,2) - -(4,1); (2,2) - - (2,0); (2.2) - (2,2) ч (2,2) - (2,2) ч -(0,3); (2,2) - (2,2) - -(3,1) - (2,2) ч (2,2) - -(2,4); Траектори (2,3) (3,2) (2,3) (2,0); (2,3) (2.3) (1,2) (2,3) (2,1) (1,2) (3,2) (1.2) (2,1) (3,3) (1,2) (2.2) (3,2) (2,2) (2,1) (3,2) (2,3) (2,3) (3,2) (3,2) (3,2) (3,2) (2,3) —► -+ -»■ -+· -- — — — -* -* -* -» -* -» -* -» -* —*■ -* -+ -*" -* -► -* -+· -+· ι блуждан (2,2) (3,1) (2,3) (3,3) (2,2) (1,2) (2,4); (2,0); (2.2) (2,2) (0,2); (2.2) (2.3) (0,2); (2.2) (3.2) (2,1) (3.1) (4.2); (2.4); (2.3) (4,2); (3,1) (3,3) (4,2); (2,3) ия —*■ -» -*■ —*■ -*■ -> -* ' -> -* -► -+■ -** —*■ - -+ -► -ч> (2,1) - (3,2) - (2,2) - (3,2) - (2,3) - (0.2); (3,2) - (1,2) - (3,2) - (1,3) - (2,1) - (3,1) - (2,1) - (3,0); (1,3) - (2,1) - (4,3); (2,3) - Σ . Значение функции и (х, у) в точке выхода на границу 0 2 2 0 2 0 0 0 0 0 1 0 0 2 2 0 2 3 2 2 20
§ 10] МЕТОД СЕТОК ДЛЯ УРАВНЕНИЯ ПАРАБОЛИЧЕСКОГО ТИПА 305 разыгрывая числа таблицы 66, начиная с первого, имеем: случайное число 5 — шаг вверх (2,2)—>-(2,3); случайное число 7— шаг вниз (2,3)—^(2,2); случайное число 7—шаг вниз (2,2)—*(2,1); случайное число 0 — шаг вправо (2,1)—>-(3,1); случайное число 5—шаг вверх (3,1)—>-(3,2); случайное число 7 — шаг вниз (3,2)—>-(3,1); случайное число 1—шаг вверх (3,1)—>-(3,2) случайное число 6 — шаг влево (3,2)—»-(2,2) случайное число 1—шаг вверх (2,2)—^(2,3) случайное число 8 — на месте (2,3)—>-(2,3); случайное число 7—шаг вниз (2,3)—► (2,2); случайное число 3 — шаг вниз (2,2)—>-(2,1); случайное число 7—-шаг вниз (2,1)—"-(2,0). В узле (2,0) блуждание прекращается, так как частица вышла на границу. Далее переходим ко второму блужданию частицы, снова отправляясь из той же начальной точки (2,2), и т. д. Траектории iV = 20 случайных блужданий приведены в таблице 67. На основании формулы (9) имеем »(2,2)^.^=го-20=1· Заметим, что в данном случае для задачи Дирихле известно точное решение Поэтому "(*> У) = т- «(2,2)= ^=1. Таким образом, мы случайно получили точное значение к (2,2). § 10. Метод сеток для уравнения параболического типа В качестве примера уравнения параболического типа остановимся на уравнении теплопроводности для однородного стержня O^x^i да „г<^ m где u = u(jc, i) — температура и t — время (см. § 1, пример 3). В дальнейшем для простоты будем полагать с=1
306 РЕШЕНИЕ УРАВНЕНИЙ С ЧАСТНЫМИ ПРОИЗВОДНЫМИ [ГЛ. V (к такому случаю всегда можно прийти путем введения нового времени τ = α'ί). Итак, рассмотрим уравнение ди dt~~ дх* (2) Пусть, кроме того, задано распределение температуры в начальный момент времени ί = 0: и (χ, 0) = f(x) и законы изменения температуры в зависимости от времени (тепловые режимы) на концах К стержня х = 0 и х = 1: И (0, *) = φ(0, \ «(/, ί) = ψ(0· J Требуется найти распределение температуры и= = и (х, t) вдоль стержня в любой момент времени t. Решим эту смешанную задачу методом сеток [6], J7J. Для этого рассмотрим пространственно - временную систему координат {х, t} (рис. 72). В полуполосе />0, 0<лг</ построим прямоугольную сетку x=ih (1=0, 1, 2, ... , я) и t — Jk (У=0, 1, 2, ...), где шаг вдоль оси Ох /г=— (п—целое) h Рас. 72. и шаг вдоль оси Ot k==uh2 (σ—постоянная), вообще говоря, различны. Величина а будет выбрана ниже. Введя обозначения xi=^ih\ t/ = Jk; ии = и(хп t,) н заменяя уравнение (2) конечно-разностным уравнением, будем иметь 0/(2 "//— »1 + 1,У Л2 ', / (3)
§ 10] МЕТОД СЕТОК ДЛЯ УРАВНЕНИЯ ПАРАБОЛИЧЕСКОГО ТИПА 307 Отсюда «ί,/+1=0Η,_1ι/+(1— 2в)н,у+ ob/+1i/. (4) Из рассмотрения формулы (4) ясно, что, зная значения функции и (х, 1) в точках /'-го слоя t=jk, с помощью этой формулы можно вычислить значения и (х, t) в точках следующего (/-}-1)-го слоя t=(/-\-\)k (рис. 73) Схема J .--Λ' .--Λ При вычислении пользуются четырьмя соседними узлами— явная схема вида * *** (схема I). Таким образом, исходя из начального слоя t — 0, значения и(х, ί) для кото- о^1.__ ~"--А- рого определяются из началь- (i-l,J) d,j) ('*'J) ного условия и (х:, 0) =/(*,) (i = 0, Рис. 73. 1, 2, ... , η), и используя значения функции и(х, t) в крайних узлах (0, /■); (/, tj) (у = 0, 1, ...), определяемые граничными условиями и(0, fy) = ?(/,); и(/, <*,)=<&(<,), последовательно вычисляем: «(*,., ί,); u(jc,., /2); «(.v,., g; . .. (/ = 0, 1, .. . , я), т. е. находим значения искомой функции и(х, t) во всех узлах полуполосы. Остается разумно выбрать величину а. При этом будем исходить из требования, чтобы ошибка при замене дифференциального уравнения (2) конечно-разностным уравнением (3) была наименьшей. Введем обозначения 1 ["]=!?■ да _ 'Έ ' н И = tf ί (ui +' · / ~ 2"<7 + "'-«,/)""Τ ("' · / + i «i/)l. где /_Λ [и] — конечно-разностный оператор, соответствующий дифференциальному оператору L[u\. Разность называемая ошибкой аппроксимации, есть та погрешность, которая получается при замене оператора L\u] оператором Lh [и]. Вычислим
308 РЕШЕНИЕ УРАВНЕНИЙ С ЧАСТНЫМИ ПРОИЗВОДНЫМИ [ГЛ. V эту погрешность в узлах [xh t,) сетки для функции и (х, у), являющейся решением уравнения (2). При этом Учитывая, что L[u}=0 (5) "/,/ + . = u(xi> */-{-°к'), и разлагая Lh [и] по формуле Тейлора в окрестности точки (х(·, t), ограничиваясь членами порядка /г", находим й2 дгии Л· д'аи л* а4гг,7 2! а*2 31 ОХ3 даи h2 дгии Ы όχ" 2и//+ "//-* 1^ + 21 4! ах4 л' й'в,7 ~ ST dxs h1 д'ии t d-^il ι 'ί. aS"'V '5ΐ а*5 "т~ б! а*8 ах2 да/ Ά дх3 4! ах1 (σΛ2)2 <5!«,у 2! а/2 (σΛ2)'ο_4/ aia " }+0(Й°) Отсюда после приведения подобных членов будем иметь /Лг,у dit, Л / ι а'к,7 σ а2к,· Л _ι_ * (— д-^И — — — ч "> Ugo ax» 6 dt + 0(Α· (6) Так как u (jc, ί) есть решение уравнения (2), то дхг όιΐι/ а4к,7 d'lit/ deii;j d'lijj dl ' дх* of ' дх" dt' ' Заменяя в (6) частные производные по t равными им частными производными по х, получаем 1 σ\όιΙΙ,Ί } hl(_{ .„» Д d'llij 12 LhW: 2 360 дх" ■0(h'). (7) Выберем число σ так, чтобы первая скобка формулы (7) обратилась в нуль, т. е. положим Л __L 2 "~!2 и, следовательно, а = - 1
§ 10] МЕТОД СЕТОК ДЛЯ УРАВНЕНИЯ ПАРАБОЛИЧЕСКОГО ТИПА 309 При этом значении а будем иметь ^П«1 = А*(ш-ш)а|Г+0(*')=-5Я--д^ + 0(А'). В силу (5) выполнено равенство Rh[u\ = Lh\u\. Поэтому при таком выборе σ для погрешности #л[«] получаем оценку /?ft[aJ = О (h1); тогда как при другом выборе числа а имеем #„[«] = О (Л2). В этом смысле значение σ = -*- является для расчетной схемы I наилучшим. Соответствующая расчетная формула (4) при таком выборе а окончательно принимает вид "ί,/+ι = т("<--ь/ + 4";/ + И/+«.Л (8> Отметим, что оценка ошибки аппроксимации /?ft[u] в общем случае для граничных узлов (х!г tj) не годится. Пример. Найти решение уравнения теплопроводности ди Λι dt дх2 при следующих начальных и краевых условиях [7]: и(х, 0) = 4х(1 — х) (0<х<1); и (0,0 = 0 и ц(1,/)=0 (0й£<<оо). Решение. Заметим, что прямая χ = -»- является осью симметрии для графиков функций, определяющих начальные и краевые условия. Поэтому и решение и(х, t) будет симметрично относительно этой оси. Для расчетов полагаем /г = тп и, следовательно, £ = σΛ2=^ и строим систему узлов (xit tf), где jc/ = 0,1 i, ί/ = ~·. Результаты вычислений удобно расположить в прямоугольной таблице 68. Начальная строка этой таблицы (у' = 0) заполняется на основании заданных начальных условий u{xl,0) = ixi[\—xi) = 0,4i[\—0,\i) (/ = 0,1,2,..., 10).
310 РЕШЕНИЕ УРАВНЕНИЙ С ЧАСТНЫМИ ПРОИЗВОДНЫМИ [ГЛ. V Таблица 68 Решение уравнения теплопроводности методом сеток ί \ /=о /=1 1 = 2 ί'=3 / = 4 / = 5 / = 6 О .11 0 0 0 0 0 0 0 |'=1 0,360 0,347 0,336 0,326 0,317 0,309 0,302 1 = 2 0,040 0,627 0,613 0,600 0,588 0,576 0,564 1 = 3 0,840 0,827 0,813 0,800 0,787 0,774 0,761 1=4 0,960 0,947 0,933 0,920 0,907 0,894 0,881 /=5 1,000 0,987 0,973 0,960 0,947 0,934 0,921 1 = 6 0,960 0,947 0,933 0,920 0,907 0,894 0,881 ; = 7 0,840 0,827 0,813 0,800 0,787 0,774 0,761 i=s 0,640 0,627 0,613 0,600 0,588 0,576 0,564 ι'=9 0,360 0,347 0,336 0,326 0,317 0,309 0,302 О 1 0 0 0 0 0 0 0 В первый (/=0) и последний (/=10) столбцы вписываются данные граничных условий и(<иу) = и(Му) = 0 (/=0, 1,2, ...)· Остальные строки у'= 1, 2, 3, ... таблицы последовательно заполняются с помощью применения расчетной формулы (8). При этом, конечно, следует учитывать симметрию искомой функции и. §11. Устойчивость конечно-разностиой схемы для решения уравнения теплопроводности При использовании конечно-разностной схемы для решения краевой задачи возникает важный вопрос об устойчивости такой схемы. Под этим понимается следующее: конечно-разностная схема называется устойчивой, если малые погрешности, допущенные в процессе решения, затухают или во всяком случае остаются малыми при неограниченном увеличении номера текущего слоя (строгое определение понятия устойчивости см. [8]). В противном случае схема называется неустойчивой. Ясно, что неустойчивая конечно-разностная схема противопоказана для вычислений, так как неизбежные незначительные ошибки, например, погрешности округлений, могут создать большие отклонения от точного решения краевой задачи и привести к результатам, не имеющим ничего общего с действительностью. Выясним условия устойчивости приведенной выше конечно-разностной схемы (§ 10, (4)) для уравнения теплопроводности да <Ри . dt дх2 ^' с заданными граничными и начальными условиями (смешанная крае-
§ 111 УСТОЙЧИВОСТЬ РЕШЕНИЯ УРАВНЕНИЯ ТЕПЛОПРОВОДНОСТИ 311 вал задача): и{х,0)=/(х), \ и (О, t) = y{t), I (2) и(1, ι) = ψ (0- Пусть где Дл;,- = h и M; = k, h=-, k = ah\ η Переходя к конечным разностям в уравнении (1) (см. § 10), будем иметь: а и (х(. -\-h,t/)-{-(l— 2α) и (л;,·, tj) + аи {х, — h, tj) — — и(хс, i, + ft) = 0. (3) В граничных узлах сетки х(-, t, £ Γ выполнены следующие условия: и(х„ 0) = /(*,). 1 «(О, i,) = <f(tj), I (4) it (/,<,) = φ (/,). ) Предположим, что в точках начального слоя t = 0 допущена ошибка ε/,ο. τ. е. u{xiO)=f(xi)-{-eUo, и пусть v(xlt tj)— решение уравнения (3): αν (Χι -f h, t,) + (1 — 2α) υ (x[t tj) -{- αν (xt — h, tj) — — v{xi,ti^k)-^Q, (5) удовлетворяющее граничным условиям, содержащим ошибку: v(xl,0) = f{xl)-\-elta, ) O(0,i,)=<t(i,), I (6) ν (Ι, /,) = <]>(*,). ) Нас интересует, как изменяется погрешность w (х;, tj) = v (x„ t^ — α (Χι, tj) при неограниченном возрастании номера у. Вычитая из уравнения (5) уравнение (3), для погрешности w(xit tj) получим конечно-разностное уравнение aw (*; ^.h,i,)-\-(\— 2α) w [xit tj) -f aw (x, — h, tj) — -w{x(, /;+fc) = o. (7)
312 РЕШЕНИЕ УРАВНЕНИЙ С ЧАСТНЫМИ ПРОИЗВОДНЫМИ [ГЛ. V На границе Г области имеем ю (xt, 0) = υ {х„ 0) — и (xh 0) = ε(>, ] w (0, tj) = ν (0, tj) — и (О, t,) = О, I (8) w{l, i/) = v(l,t/) — u(l,t,) = 0. J Частное решение уравнения (7) будем искать в виде w (xlt t;) = Vj sin pXf, (9) где числа λ и р(р^>0) подберем так, чтобы выражение (9) удовлетворяло уравнению (7) и однородным краевым условиям w{p,t,) = 0, w(l, i,) = 0. На основании этих условий имеем Vj sin p 0 = 0, Vj sin ρ 1=0; откуда вытекает, что ρΙ = ηπ и P = -r- (m = 1, 2, .. .)· Следовательно, w (л;,·, tf) = \h sm ——-. Подставляя это выражение в уравнение (7), будем иметь o\h sin ^(χ(. + Λ) + (1— 2σ)λθ8ίπ2ϊχ/ + тп (10) 4- <Л'> sin 'ψ [Χ( — A) — λ'>+* sin ~ χ, = 0 или sin — (χ,- -\- η) — 2 sin — χ,- -\- sm — (χ( — h) -\- тк + 11—λ*)8ΐΠ2ρ*( = 0. (11) Выражение, стоящее в квадратных скобках равенства (11), приведем к виду, удобному для логарифмирования. Имеем sm — (χ,- + h) — 2sin — χ,· -f- sin — (χ, — h) = 2sm — χ,- cos ^- Λ — — 2sm — х( = 2sm — х( [ cos — h — 1 J = — 4sin — χί sin2 ^ h.
§11] УСТОЙЧИВОСТЬ РЕШЕНИЯ УРАВНЕНИЯ ТЕПЛОПРОВОДНОСТИ 313 Подставляя этот результат в равенство (11) и сокращая обе части его на общий множитель sin-г—χ,·, получим — 4аз1пг^й + (1— λ*) = 0. 21 Отсюда ■4а sin -g-A У=( 1— 4asins^-ft)*. (12) Заметим, что λ не зависит от точки (х(-, tf). Таким образом, получается бесконечное множество частных решений однородного уравнения (7) вида , (л:,,^) == ^ I — 4σ sm ~2Г Λ ) sin—*/ (m=l, 2, ...), w причем каждое решение удовлетворяет однородным краевым условиям (10). Линейная комбинация этих решений Ν-ι mrzi Xcm(l-4asin2^ysin^*,. (13) также является решением уравнения (7), удовлетворяющим при любых значениях коэффициентов ст условиям (10). Эти коэффициенты подбираются так, чтобы выполнялось первое условие (8), т. е. чтобы w(xt, 0) = s,i0. Для устойчивости рассматриваемой конечно-разностной схемы (3) необходимо, чтобы при любых значениях постоянных с,, с2, . ...cyy-i функция w{xhij), определяемая равенством (13), оставалась ограниченной при tj—>-оо. Для 'Этого достаточно, чтобы для всех т было выполнено неравенство 1 —4asm ~2j- < 1· Отсюда
314 РЕШЕНИЕ УРАВНЕНИЙ С ЧАСТНЫМИ ПРОИЗВОДНЫМИ [ГЛ. V и О *s σ sin2 ^ ££ γ (от = 1,2, ...). (14) Неравенство (14) заведомо будет выполнено, если величина а удовлетворяет условию: 0<σ^|. (15) Полученные неравенства дают достаточные условия устойчивости рассмотренной ранее конечно-разностной схемы (3) для решения смешанной задачи в случае уравнения теплопроводности. Заметим, что выбранное в предыдущем параграфе (см. § 10) значение а = -г- удовлетворяет неравенству (15). Замечание. Взяв α = γ, мы получаем очень удобное конечно- разностное уравнение 2И/./+, =«/-,,/+1,4,,/· (16) Схема устойчива, однако в этом случае порядок отклонения уравнения (16) от уравнения теплопроводности равен 0(Л2), в то время как при <7 = -тт- этот порядок равен О (/г4). § 12. Метод прогонки для уравнения теплопроводности В предыдущих параграфах мы видели, что для устойчивости конечно-разностной схемы для уравнения теплопроводности шаги Λ = Δχ(· и k=M/ должны быть неодинаковы, причем выбор шага h для пространственной координаты χ накладывает определенные ограничения на величину шага k для временной координаты t. Важность этого обстоятельства была отмечена Курантом, Фридрихсом и Леви. Так как при устойчивой схеме шаг k имеет порядок О (/г2), причем отношение а — —$ ограничено сверху, то при малом я продвижение решения и(х, t) no t весьма незначительно и объем работы чрезвычайно велик. Например, приняв Λ = 0,1 и полагая k =а/г2 = ^, получим, что для описания процесса распространения тепла за единичный промежуток времени 0 < t =^Ξ 1 требуется таблица, содержащая 600 строк! Мы сейчас укажем другую устойчивую вычислительную схему, для которой отношение rj не является ограниченным сверху, и поэтому шаг k = M временной координаты может быть выбран сравнительно крупным.
§ 12] МЕТОД ПРОГОНКИ ДЛЯ УРАВНЕНИЯ ТЕПЛОПР01ЮД1ЮСТИ 315 Рассмотрим по-прежнему в области G{(X .*:</, 0 s^; ί <ζ-]-°° ^ приведенное уравнение теплопроводности ди д2и ¥t~~ ~дх* (1) с граничными и начальными условиями: и (О, ή = ψ(ί), ) u(i, *) = <!>('). \ I2) и(х, 0)=/(х). } Построим в области G прямоугольную сетку Xt — ih, t/=jk{ti=0, 1,2 я; / — О, 1,2, . . .), где h = — (η — целое) я и k — некоторая положительная величина. Пусть ии = и(xlt tj). Используя приближенную симметричную формулу для второй производной по χ и применяя формулу численного дифференцирования Схема η (i-!. И) fl.J>J) (h'J't) Q_J ___ —о- ^> -- I) ' \ —- ι Рис. 74. по t «назад», для {/-\- 1)-го слоя сетки вместо дифференциального уравнения (1) будем иметь следующее конечно-разностное уравнение [10]: "/-ι, J+1 — '2ui,J+t +«/ + 1, j+\ ";,/+! ~ "fj IT2 '~~ k (/=1,2, ...,« — 1; /=0, 1, 2, . . .), или «ί-ι./ + ι — (2 + s) «;,/+, + "/ + 1.у + .=— s"i/' (3) где Λ* Таким образом, здесь используется схема 11 вида *** {неявная схема) (рис. 74). Из граничных условий (2) получаем
316 РЕШЕНИЕ УРАВНЕНИЙ С ЧАСТНЫМИ ПРОИЗВОДНЫМИ [ГЛ. V Систему (3), (4) будем решать методом прогонки. Пусть «,·,/+! =β«,/+ι (*/,/+, +κί+ι./ + ι) (5) и, следовательно, ",--!,/+, — <*,_,, /+1 (*ί-,,/+ι +";, /+ι)· (6) Подставляя выражение (6) в формулу (3), будем иметь отсюда Д;-1, y+i fy-i, y+1 "f~ Jn//"f-ui + i,/+i Сравнивая это выражение с формулой (5), получим fl'./+i==2 + s-fl7:',^.' } (7) (i = 2, 3 /ι). При /==1 из формул (3) и (5) имеем "ο,/+ι — (2 + 5)".,/ + 1+"2,/+1 = — *",/ И «!,/+! = «!,/ + , (61,/+.+"г,У + ,)· (8) Отсюда, используя граничные условия, получаем "'./+> 2 + s · ' ' Так как формулы (8) и (9) должны быть тождественны, то, сравнивая их, выводим 1 ) Пользуясь формулами (7) и (10), производя «прогонку» в прямом направлении (прямой ход), определяем две последовательности чисел: αΐ,/+]> β8,/+1> •••>Cln-l, / + 1 И "li/'+l' 2./+1, * · ·' Л-1, /+Г Отсюда, применяя формулы (4) и (5), с помощью «обратного хода·» находим значения искомой функции: «η,/+Ι=Φ(*/ + ΐ). "η-ι,/ + ι ==(Κη,/ + ιΊ"^η-ι,/ + ι)αη-ι, / + ι Κη-2,/+, = ("„-,,/+ΐ+6η-2,/+,)β«-2,/+1' I" (И) α«,/+ι — 2 + ί' [ (10) "i,y + i = ("2,/ + , + 6i,y+i)a1,/ + i·
§ 12] МЕТОД ПРОГОНКИ ДЛЯ УРАВНЕНИЯ ТЕПЛОПРОВОДНОСТИ 317 Таким образом, указан способ перехода от /'-го слоя к (/'-(- 1)-му слою. Следовательно, отправляясь от известного начального (нулевого) слоя, можно шаг за шагом построить искомое решение и(х, t) во всех точках сетки (xh tj). Выясним устойчивость при j—v-j-oo конечно-разностной схемы (3). Пусть v;, = v{xi,tj) — решение уравнения (3), удовлетворяющее «возмущенным» условиям: «(*/. 0) =/(*,·)+S;o, 1 о(0, *,) = ?(*,), о (Λ <,) = *('/)· \ где εί0 — начальные ошибки. Погрешность wlj = v{xi, t,) — u(x„ if) удовлетворяет уравнению wi-i,/+i —(2 +^«ί^+ι+«»/+../ + i+s«'i/= 0. (12) и граничным условиям: (13) Положим ^f = V;sin^p. (14) При любом целом т (/»= 1, 2, 3, ...) функция w'.'f удовлетворяет вторым условиям (13). Подставляя выражение (14) в уравнение (12), получим Vj+k sin ткЪ-Н) __(2 + s) Vj+k sin 4ψ + + y.-+*sln^t(x; + *)+gVJ sin-^p = 0 или sin —!-j - — 2 sin -y-' -j- sin-— '~ ' Так как — s(\k~ l)sin^!' = 0. (15) . mit(x,· —Λ) . mix; , . mnlx;4-h) Sin ——, - 2 sin—H+sm М-1—- — — 4 sin —~ smz —- , то, производя сокращение в формуле (15) на sin^^, будем иметь 4λ*5ίπ2^ + 5(λ*-1) = 0.
318 РЕШЕНИЕ УРАВНЕНИЙ С ЧАСТНЫМИ ПРОИЗВОДНЫМИ [ГЛ. V Отсюда ik= —-„^1, (16) s -f- 4 sin2 2ί если только s^>0, и, следовательно, \\\^\. (17) Таким образом, все решения «;<?) асимптотически стремятся к нулю при j—>--j-oo или в крайнем случае, когда sin-^τ- = 0, ограничены и при фиксированном л;,· не возрастают по модулю. Так как решение wlf представляет собой линейную комбинацию функций w(p\ то из неравенства (17) следует, что схема (3) устойчива при любом s ^> 0. Что касается ошибки аппроксимации дли схемы (3), то эта ошибка, вообще говоря, есть 0{h*-\-k) (ср. § 10). Пример. Рассмотрим разобранную выше (§ 10) смешанную задачу для уравнения теплопроводности при начальных и и Примем следовательно, краев ди Tt dhi ~~ дхг ых условиях: и(х и(0, А = , 0) = t) = 0, 1; s = = 4jc(1 :U(\,t) k — ?->· -X) = 0. 0,01; Полагая "/,/+! = a;,/ + . (*/,y + i +ui+i, / + .)' в силу формул (10) и (7) будем иметь _ 1 . __ αι,/+ι — γ- °i,y+i — "ι/ 1 '■/+1 3-β,_1ι/+1· *i,/+l =αί-1,/ + ,*/->,/ + ! +Ui/ (t>l).
§ 12| МЕТОД ПРОГОНКИ ДЛЯ УРАВНЕНИЯ ТЕПЛОПРОВОДНОСТИ 319 В частности, при /=0 получаем формулы для первого слоя: ai,l=Y> *!,.=«„ (18) 1 (19) (20) '·' 3-е,-.,,,· I *ί,>=βί-ι,Λ-.,.-|-"<ο Г Кроме того, на основании формул (11) имеем "π-.,,=Κ, +6»-,,.)αη-,,ι' "л-,,I=(UB-.,1 +*„-.,,)<*„-,,,. f "η = («.., + *., .)«.,,· J По формулам (18), (19) и (20) можно вычислить значения к(·, искомой функции для первого слоя (у'=1). Полученные результаты приведены в таблице 69. Таблица 69 Решение уравнения теплопроводности методом прогонки 1 "io βί1 "а * 0 0 0 0 1 0,36 0,333 0,360 0,310 0,302 2 0,64 0,375 0,760 0,572 0,564 3 0,84 0,381 1,125 0,764 0,761 4 0,96 0,382 1,389 0,882 0,881 5 1,00 0,382 1,530 0,921 0,921 6 0,96 0,382 1,544 0,882 0,881 7 0,84 0,382 1,430 0,764 0,76! s 0,64 0,382 1,185 0,571 0,564 !) 0,36 0,382 0,813 0,310 0,302 10 0 0 0 В последней строке таблицы 69 для сравнения приведены значения и* искомой функции, полученные обычным методом сеток при ίι = Δχ = γ~ и й = Д*= — (см. таблицу 68). Обращает на себя внимание значительное расхождение значений и-п и и* вблизи границы области (/=1 и / = 9). Это объясняется тем, что для таких точек примененные формулы численного дифференцирования обладают пониженной точностью. Для устранения этого неблагоприятного обстоятельства рекомендуется для точек, близких к границе области, использовать более точные формулы численного дифференцирования.
320 РЕШЕНИЕ УРАВНЕНИЙ С ЧАСТНЫМИ ПРОИЗВОДНЫМИ [ГЛ. V § 13. Метод сеток для уравнений гиперболического типа Остановимся на простейшем уравнении гиперболического типа, а именно: уравнении свободных колебаний однородной ограниченной струны (см. § 1) π = *& θ) и будем искать решение уравнения (1) при заданных начальных и краевых условиях и(х,0)=/(х), ut{x,0)=F(x) (OsSxsS/) (2) и и (о, <) = ?(<). «(/,<) = <!>(') (0<*<оо). (3) Решим эту смешанную задачу методом сеток [7], [8]. Как и в случае параболического уравнения, покроем полуполосу 0 ^ х^ I, Огй^<С°° прямоугольной сеткой xi-=ih, t,=jk (г'=:0, 1,2, ...,я; у = 0, 1,2, ...), где Δ*,·—л:_ + 1— х; = /г = — (я —целое) и 4==^+i — '/ = *■ На сетке jc,, ^ приближенно заменим дифференциальное уравнение (1) соответствующим конечно-разностным уравнением. Пользуясь симметричными формулами для производных, будем иметь "/.y+i — 2".;+ "/,/-1 __ , ui+ij — 2"ij + u,--i,/ ... При k = — уравнение (4) упрощается и принимает вид г, f/ 1*1) "/,;+!+"/,/-» = = "/ + .,/ + »/-.,>' откуда ui,/+i—:иг+1,у"Г •yV //чЛ +tti-,j —"л/-.· (5) Из уравнения (5) видно, °(l,J-l) что для получения значений Рис_ 75. к (■«. О в (/'+ !)-м слое используются значения и (x,t) в двух предыдущих слоях _/-м и (у—1)-м (см. рис. 75). Для начала вычисления по формуле (5) также необходимо знать значения и(х, i) на двух слоях, в то время как начальные условия (2) задают нам значения и(х, t) лишь на нулевом слое У—0. Однако, используя начальные условия, -А - к (HJ) к .-- h -.. Ш -_3
§ 13] МЕТОД СЕТОК ДЛЯ УРАВНЕНИЙ ГИПЕРБОЛИЧЕСКОГО ТИПА 321 можно определить значения и(х, t) на фиктивном слое с номером /'=—-1. Для этого заменим производную во втором начальном условии конечно-разностным отношением. Тогда будем иметь "/, -1 ~ "ίο где Fi=F{xi). Отсюда "г,-, = ";» — kFi- (6) Теперь, зная значения и(х, t) на слое /'=—1, определяемые с помощью формулы (6), можно начать вычисления. Краевые условия (3) используются для получения значений «0, и « .. Вместо определения значений и(х, I) на слое /'=—1 можно вычислить значения и(х, t) на слое /=1. Это достигается, например, с помощью формулы Тейлора Учитывая, что согласно уравнению (1) имеем д'"л> _ „2 дЧо dt* ~ дх? ' перепишем формулу (7) в другом виде, а именно u^u^k^ + ψ-^. (8) Из начальных условий (2), предполагая, что f{x) £ Ст [О, /], получаем f)i '■' d2'lh __ /' to2 — •/'· Подставляя эти значения в формулу (8), окончательно находим Ц/,^/(.+/^,.+^У;. (ю) Очевидно, формулу (10) целесообразно применять в том случае, когда функция f(x) задана аналитическим выражением. Пример. Методом сеток найти приближенное решение уравнения [6] д'и _ Л( д? ~ дх?' (9)
322 РЕШЕНИЕ УРАВНЕНИЙ С ЧАСТНЫМИ ПРОИЗВОДНЫМИ [ГЛ. V удовлетворяющее граничным и начальным условиям: и (О, t) = u(n, t) = 0 (0=£Ξ*<οο); и (χ, 0) = л;(тг— χ); ut(x, 0) — О (0 ==£ χ ==£ π). Решение. В нашем случае а —1, поэтому k = h. Выбираем С помощью формулы (10) определим значения uh. Так как ^. = 0, /' = -2, то. uh = uia— й2 = к,.0 — 0,03048. Дальше решение проводится по формуле (5). Полученные значения приведены в таблице 70. В таблице приведены лишь данные для OsgxsS-^-, так как график решения и = и(х, t) симметричен относительно плоскости х = тг . Таблица 70 Решение уравнения колебаний струны методом сеток ^S\ x ί = 0 t = 1h t — Zh t — bh χ =0 0 0 0 0 0 0 χ = h 0,518 0,487 0,426 0,366 0,305 0,244 χ = -lh 0,975 0,944 0,853 0,731 0,609 0,487 χ = ЗА 1,371 1,340 1,249 1,097 0,914 0,731 χ — Μι 1,706 1,675 1,584 1,432 1,218 0,975 a: = 5h 1,980 1,950 1,858 !,706 1,493 1,218 X = 6/1 2,193 2,163 2,071 1,919 1,706 1,432 χ = 7 Л 2,346 2,315 2,224 2,071 1,858 1,584 χ = 8й 2,437 2,406 2,315 2,163 1,950 1,675 χ = 9Л 2,467 2,437 2,346 2,193 1,980 1,706 Замечание 1. Отметим одну особенность уравнения колебаний струны. При решении задачи Коши для уравнения колебаний струны дифференциальный оператор
§ 13] МЕТОД СЕТОК ДЛЯ УРАВНЕНИЙ ГИПЕРБОЛИЧЕСКОГО ТИПА 323 заменяется на сетке при условии, что h = ak, конечно-разностным оператором М"] = ^"<'./ + > — "i+i. /~"/-!,/ + ", >,/-!' (И) Покажем, что в этом случае функция, являющаяся решением уравнения колебания струны, т. е. удовлетворяющая уравнению L [«]=0, (12) является также решением уравнения £д[«]=0. В самом деле, как известно [1]—-[5], любое решение дифференциального уравнения (12) может быть представлено в виде и(х, ί) = ψ(χ— at) -\-tb(x-\-at), где φ и ψ — дважды дифференцируемые функции. Полагая Рис. /6. будем иметь ии = и (х„ t,) = ш [(/ - J) h\ + ф [(ί -j-y) h\. Подставляя это выражение в формулу (11), получим М"]=тр№-У-1)А1+ф[С+/-Н)л]- _?[(ί_;+1)Α]-φ[(/ + ;+>)*]- _?[(1_у_1)Л]—ф[(/ + у —1)А] + + ί [(''-/+ 1)А] +ФКЧ-7- 1) А]}=0. Замечание 2. Если для уравнения колебаний струны (1) краевые условия (3) отсутствуют, то с помощью формулы (5) можно построить решение и(х, t) соответствующей задачи Коши лишь в сеточной области плоскости Oxt, имеющей форму треугольника ОАВ (рис. 76), где ОВ и АВ — характеристики t=- а ' проходящие соответственно через точки О(0, 0) и А (1,0) (см. § 2).
324 РЕШЕНИЕ УРАВНЕНИЙ С ЧАСТНЫМИ ПРОИЗВОДНЫМИ [ГЛ. V § 14. Понятие о методе прямых Метод прямых [21], [22] можно рассматривать как предельный случай метода сеток, когда при применении прямоугольной сетки один из линейных размеров ее стремится к нулю, а множество узлов в пределе заполняет некоторую систему прямолинейных параллельных отрезков. Идею этого метода мы изложим на примере линейного дифференциального уравнения эллиптического типа с двумя независимыми переменными и аналитическими коэффициентами. Рис. 77. Пусть в плоскости Оху задана трапецевидная область О (рис. 77), основания которой лежат на прямых у = а и у = $ (α <[ β), а с боков эта область ограничена аналитическими кривыми * = £оСУ) (l) " x = gl СУ) (Л («<^<β; ga(y)<gAy)l причем область О целиком помещается в минимальном прямоугольнике R{a^x^b; α<^==£β}. В области О требуется, например, найти решение и = и(х, у) линейного эллиптического дифференциального уравнения L[u]=A(x, y)d^ + 2B(x,y)£iLv+C(x, ,v)£ + дхду 'ду* + а(х, у)£-\-Ь{х, у)^ + с(х, у)и=/(х, у), (1)
§ Η] ПОНЯТИЕ О МЕТОДЕ ПРЯМЫХ 325 удовлетворяющее на границе области G краевым условиям и(х, α)=(β0(χ), и (χ, $) = шг(х), и (g0 (У), У) = ψ„ (У), и (£, (У), У) — ψ, Ы· (2) Будем предполагать, что коэффициенты и правая часть уравнения (1) определены и аналитичны в замкнутом прямоугольнике R, причем выполнено условие эллиптичности: D(x, у) = А(х, у)С{х, у) — Вг(х, д>)>0 при (х, у) ζ R; отсюда, в частности, следует, что А(х, у)^=0, С(х, у)^0 при (х, y)£R. (3) (4) Допустим также, что функции φ0 (χ) и φ, (χ) являются аналитическими на всем отрезке [а, Ь], а функции ώ0 (у) и ф, (у) — аналитическими на отрезке [α, β] и, сверх того, выполнены условия согласованности: <?о (gj («)) = ψ/ (α), ?,(й>(Р)) = Фу(Р). l/=0, 1). Для получения по методу прямых приближенного решения краевой задачи (1) — (2), разделим отрезок [α, β] на я равных частей с помощью точек }'j=yo+Jh (У„ = а- >Ή=Ρ). А=Ц^ (/=0, 1, 2, ..., п) и через внутренние точки деления проведем семейство параллелей _у=_Уу (У= 1,2, ..., л—1). На каждой такой прямой дифференциальное уравнение (1) приближенно заменим обыкновенным дифференциальным уравнением для искомых функций и(х, yj). Для этого в уравнении (1) избавимся от частного дифференцирования по у с помощью формул численного дифференцирования: ф\у=„ — 7?1и^ У/ + ^ — 2"(х' У/) + и(х> У/-.)] Шу{=уГά [и'х(х' У/+,)~"'*(х' y'-l)]'- %[=у=тЛи^ y/+*)-u(x' У/-Я (/=1, 2, ..., я—1). (5) Введем сокращенные обозначения: ди{х, yj) и{х, у,) = и/(х); дх , д*и(х, у) -•Uj(x); дх2 -L = u-j(x),
326 РЕШЕНИЕ УРАВНЕНИЙ С ЧАСТНЫМИ ПРОИЗВОДНЫМИ [ГЛ. V а также А(х, yj) — Ai (х) я т- д· Тогда, подставляя выражения (5) в уравнение (1), получим следующую систему обыкновенных дифференциальных уравнений: Aj (χ) uj (χ) + 2ψ! [u',+, {χ) — и) _, (χ)] -f CAx) r + ~jr f"/+. Μ - 2u/ (χ) + "/-. Ml + + «у (х) UJ Μ + 1д- ["■/ +, Μ — «/ -, Μ] + + C/W«/W=//W t/=i, 2 «—l). (6) Кроме того, в'силу краевых условий (2) имеем иа{х) — Чо(х)' "η(χ) = ψΛχ) (7) и, следовательно, u"(x) = yl(x), ul(x) = if"(x). Таким образом, от линейного дифференциального уравнения (1) с частными производными мы перешли к системе (6) из η—1 обыкновенных дифференциальных уравнений с я—1 неизвестными функциями к, (х), иг(х), ..., (/„_,(*), где и0(х) и ип(х) известны и определяются формулами (7). Система (6) называется системой уравнений метода прямых. Так как коэффициенты и правые части линейной системы (6) аиалитичны, а следовательно, непрерывны на отрезке [а, Ь\ и старшие коэффициенты Ау(х)=£0 при a sg χ < b, то в силу известной теоремы из теории дифференциальных уравнений общее решение «/(*) = ¥!/(*; Q. с, £,„.,) (/=1. 2 л—1) системы (6) определено на отрезке [а, Ь\ и содержит 2я— 2 произвольных постоянных С,, С,, ..., С'2П_2, входящих в функции ψ{ линейно. Для определения этих постоянных на основании краевых условий (2) получаем такое же число линейных алгебраических уравнений. А именно, пусть xj = gii(y.) и x. = g1(y.) — проекции на ось Ох концов отрезка MjNj, лежащего на параллели y=yj (см· Рис· 77). Тогда на основании формул (2) имеем граничные условия: где a<xJ<i7l<b (у"=1, 2, ..., /г —1).
§ 14] ПОНЯТИЕ О МЕТОДЕ ПРЯМЫХ 327 Итак, наша задача (1)—(2) сводится к решению краевой задачи (6) — (8) для системы обыкновенных дифференциальных уравнений. Если краевая задача (6) — (8) имеет решение, то оно может быть найдено или обычным методом, когда система (6) допускает точное решение, или с помощью приближенных методов, описанных в гл. IV, причем функции ц. (х) должны определяться на всем отрезке [а, Ь\. После этого мы будем знать приближенные значения искомой функции и(х, у) на семействе параллелей у=У/ (у'=0, 1, 2, .. ., п). Значения функции и(х, у) в промежуточных точках области О могу г быть найдены интерполированием. У\ y-ih 4*1 Рис. 78. J-j-, Отметим специфическую особенность краевой задачи (6^—(8): каждую из искомых функций Uj(x) нужно определить на всем отрезке [а, Ь\, зная ее значения в двух, вообще говоря, внутренних точках х, и Xj этого отрезка. Если мы найдем некоторую функцию иЛх) лишь при χ JL1- ; χ.-, то это может оказаться недостаточным для решения задачи. Дело в том, что проекция на ось Ох параллели у — yf (Xj =й χ < xj) в общем случае не покрывает проекций на эту ось соседних параллелей и У=У/ + 1 if,- */+») (рис. 78) и, значит, при этих неблагоприятных обстоятельствах для нахождения из системы (6) функций и^_1(х) или и/+1(х) нужно знать значения функции и, (х) вне отрезка \Xj, xf\. Мы рассмотрели простейший случай метода прямых, когда исходные данные аналитичны и, следовательно, допускают однозначное аналитическое продолжение. В случае лишь непрерывных коэффн-
328 РЕШЕНИЕ УРАВНЕНИЙ С ЧАСТНЫМИ ПРОИЗВОДНЫМИ [ГЛ. V циентов уравнения (1) и непрерывных граничных условий (2) при применении метода прямых возникают дополнительные трудности, так как решение системы (6) уравнений метода прямых существенным образом зависит от значений ее коэффициентов и функций и0 (х) и ип(х) в R вне области G, причем здесь это продолжение неоднозначно. Эти трудности отпадают, если область О представляет собой прямоугольник, стороны которого параллельны осям координат. Если коэффициенты уравнения (1) зависят от х, то метод прямых приводит к системе линейных уравнений (6) с переменными коэффициентами, решение которой затруднительно. Поэтому здесь, вообще' говоря, выгоднее использовать обычный метод сеток. Если коэффициенты уравнения (1) не зависят от переменной х, то система (6) метода прямых состоит из линейных дифференциальных уравнений с постоянными коэффициентами. Способы решения таких систем хорошо разработаны и метод прямых может оказаться тут сравнительно выгодным. § 15. Метод прямых для уравнения Пуассона При замене линейного дифференциального уравнения второго порядка системой уравнений метода прямых (§ 14), вообще говоря, получается ошибка порядка /г', где h — расстояние между прямыми. Эту ошибку можно уменьшить, если воспользоваться более точными формулами численного дифференцирования. Покажем это на примере уравнения Пуассона. Пусть в прямоугольной области R{a^x^b; a=Sy=g:j3} задано уравнение Пуассона и требуется найти решение и=и(х, у) этого уравнения, удовлетворяющее краевым условиям: и{х, а) = <оа(х), и{х, β) = φ,(χ); 1 и(а, » = ψ,Ο0, и(Ь, у) = Ь(у); ] W где функции / и фА (ft = 0, 1) непрерывны и <pft ζ С{2> \а, b] (k = 0,\). Будем решать краевую задачу (1) — (2) методом прямых. Для этого выберем шаг й = - и через точки деления у, = уа -J- hj (/=0, 1, 2, ..., η; у0==а, уп=:р) проведем параллели у = у/ш Пусть и/(х) = и(х, yj). Предполагая, что решение и(х, у) имеет непрерывные частные производные по у до 6-го порядка включительно, разложим функции uJ+l(x) = u(x, У)-\-К) и u/_l(x) — u(x, yj—h)
§ 15] МЕТОД ПРЯМЫХ ДЛЯ УРАВНЕНИЯ ПУАССОНА 329 по формуле Тейлора с точностью до 0(h°). Имеем daix.yjt дги(х,у]) Л2 д'и{х, yjf /^ И/ + |М=И/М +-^у— Л-Ь ^ 2Г-1 df~ '3! "Г , Ув(х,^ А4 , Ув(х,у/ А» , а°»(*, Уу + М) *а (О<0 <1) (3) (5/ 4! д/ 5! ^β д" (*, yj) u , д8» (*■ У/) Л2 с|у 3*и (х, yj) h' ( <54« (χ, ^/ Λ4 «/ -,W = «/ (>-') - —^' ^ + " -ду " 2 л,(*.^ *· λ*^*.ι=}£.* '(0<β.<ΐ). (4) ду* 3! ау5 '51' ду° Сложив равенства (3) и (4), получим «/+.(*) —2"/Μ+ цу-1 Μ: _ д2к (х, у,) ь2 , д*и(х, у β Λ4 ΰ + 0(Λ«). (5) дуг ""■ "Г" ду4~ '12 Заменяя в формуле (5) функции uk(x) = u(x, yk) (k=J-\-\, J, 7—1) dhi (χ, ν/,) соответствующими вторыми производными ■—^^— и ограничиваясь дуг бЫ(х,ь^ 2 а_м^ + ув (*, ,,_ ύ = а4» (х, у,) а, + о (П (б) членами порядка /г2, будем иметь ду ду2 дуг ау4 <54« (х, у,) Исключая из формул (5) и (6) производную —^-j и отбрасывая члены порядка h\ получим приближенную формулу «/+,(*) — 2и/(х)-\-и/.1(х) = = й' <52и(*, >>,) t A! ау2 12 а2»(х, у/+1) а2н(х, уу) а2«(х, ^.р· ау2 дуг + ау2 которая после приведения подобных членов принимает вид UJ + AX) — 2uJ W + "/mW = Л2 Га2ц(х, у/+1) д2Ц(х, У/) . дги(х, jfy_,V ■~"Ϊ2Ι. а/ + dys + ay (7)
330 РЕШЕНИЕ УРАВНЕНИЙ С ЧАСТНЫМИ ПРОИЗВОДНЫМИ [ГЛ. V Формула (7), имеющая точность 0(/гв), может быть использована для решения краевой задачи (1) — (2). Действительно, из уравнения (1) при у=ук имеем д"п (х, yk) , , . » 0 ду* = Λ (*) — и* (*)> (8) где fk(x)=f(x, yk) (к=1, 2,..., л—1). Отсюда, заменяя в формуле (7) вторые частные производные по у их значениями из формулы (8), для определения функций и Ах) (/=1, 2, ..., я—1) получим следующую систему обыкновенных дифференциальных уравнений: и ']+, (х) + 10и* (х) + И;_., (*) + ^ \uj+, [х) — 2и, (χ) + iij _, (χ)] = = //+.(*)+10//(*) +/,·_, Μ (/=1.2 «—1). (9) Усовершенствованная система (9) метода прямых была предложена М. Г. Слободянским [23] и аппроксимирует уравнение Пуассона с точностью до tj О (Λ6) = 0 (Λ4). На основании краевых условий (2) дополнительно получаем «о Μ = <?» М> «„ (*) = f, W; 1 «/(")== Φ. СУу). И/(*) = Ф,(^) | (Ю) (/=1, 2, ..., л—1). J Отсюда ио (х) = ?С (х), «n(Jc) = (f>iM· Общее решение системы (9), как известно, складывается из частного решения этой системы и общего решения соответствующей однородной системы v'j+, (χ) + 10v"f {χ) -f- и; _, (jc) + + X.K- + 1 Μ-20/W+ «/-,(*)] = <). (11) Очевидно, что общее решение системы (11) не зависит от области R и краевых условий (2) и для данного уравнения (1) может быть получено раз и навсегда. Приведем без доказательства (см. [22]) формулы общего решения системы (11): η— ι VJ (х) = Σ sin *к(У\~Уа) {A,eV* -f Bke-b") (/=1. 2 я—1),
§ 151 метод прямых для уравнения пуассона 331 где /=β — α, Ak и Вк — произвольные постоянные и , π {уj - у„) Si — 24 8Ш 2/ 7 Л2 б + соз*^-^' Частное решение неоднородной системы (9) находится обычным путем, в крайнем случае можно применить метод вариации произвольных постоянных. Для отыскания постоянных Ak и Bk на основании условий (10) получается алгебраическая система In—2 уравнений. Пример. В области й{0^х<3; О^у^З} задано уравнение Пуассона ^ + df = x+y- 42) Методом прямых найти решение этого уравнения, удовлетворяющее однородным краевым условиям: и (О, у) = и(3, у) = и(х, 0) = и(х, 3) = 0. (13) Решение. Примем /г=1 и проведем прямые у = 1 и у -.- 2. Используя метод прямых, будем искать приближенное решение «У (х) = и (х, yj) (/'=1, 2) задачи (12) — (13) на прямых y=yt и у = уг, где у, = 1 и _уг = 2. Выписывая систему (9), получим следующие два уравнения: и, (х) + 1 Ой! (х) -f- во (*) + 12 [и, (х) — 2и, (χ) + и. (х)} = = x42+10ix + i) + ^ + °) U, (X) 4 ЮИг (λ") 4 "■' (χ) + 12 К Μ — 2«2 И + "ι (*)] = =x43410^ + 2) + (x+i)J В силу краевых условий (13) имеем "о И = "з И = О и, следовательно, и0 (χ) = и3 (χ) = 0. Система (14) принимает следующий вид: 1 Ой-" (х) 4 «2 (х) — 24к, (.«) 4 12и2 (х) = 12.V: -j- 12, Ί и[ (х) 4- 10и"2 (х) 412", Μ — 24 иг (х) = 12х 4 24, j (14) (15) причем ϋ,(0) = «,(3) = 0; и1(0) = и1(3) = 0. (16)
332 РЕШЕНИЕ УРАВНЕНИЙ С ЧАСТНЫМИ ПРОИЗВОДНЫМИ [ГЛ. V Соответствующая однородная система имеет вид 1 ΟυΙ (χ) + vl (χ) — 24г/, (χ) -\-12w2 (χ) = О, ν[ {χ) -f 1 Ου", (χ) -\- 12v, (x) — 24u2 (д Полагая vt (χ) = Ae)x, v2(x)=BeXx (x) = 0. f (17) (18) и подставляя эти выражения в систему (17), после сокращения на е1х получаем Λ(10λ2 — 24)-f B(V-\- 12)= О, Α (λ2 -|- 12) + В (1 Ολ2 — 24) = 0. (19) Так как мы предполагаем, что решение (18) ненулевое, то определитель линейной системы (19) должен быть равен нулю. Отсюда получаем характеристическое уравнение 1(Л2 — 24 λ2+ 12 λ2 + 12 10λ2 — 24 = 0 или т. е. (10!2 — 24)г — (λ2 -f 12)2 = О, (20) (9λ2 — 36)(11λ2— 12) = 0. Следовательно, характеристические корни будут λ, =2, λ,: 2. λ,- γψ{, \ = - ]/^. Соответствующие постоянные А и В определяются из системы (19). Имеем 8 С; отсюда l2-f-12' d*, —_ 16 Ш Π ЮР —24' EL· 16 ж η (ft=l, 2) (ft = 3, 4). Можно принять Ak = ~Bk = Ck (k=l, 2) \ = в„ = ск (& = 3, 4).
§ 15] МЕТОД ПРЯМЫХ ДЛЯ УРАВНЕНИЯ ПУАССОНА Таким образом, ν, (х) = Qe» + Сге ~ " + с/ У * + С^ ". _ ν, (х) = - С,,- - С2е - " + С,е* V Π + Cte-* У ΪΓ. Частное решение системы (15) ищем в виде ut (х) = Ах-\-В, иг(х) — Сх-\-й. 333 (21) !:} Подставляя эти выражения в систему (15), для определения иостоян ных А, В, С, D получаем систему — 2A-\-C*=l, — 2B-\-D=\, А — 2С=\, B—2D = 2 Отсюда находим Л==с=-1, β___±, D=_| и, значит, 5 ' (22) На основании формул (21) и (22) общее решение системы (15) имеет вид ul(x) = Cle»^-Cte-"^-Cte У "+ к2 (я) = - С1в» - С2е " » + С/ У " +_ + с4Г"/п-(х+| (23) Для определения постоянных С,, С2, С3, С'4 используем граничные условия (16). В силу этих условий и формул (23) получаем систему ■c.-c.-t-c. + c^l-, /12 /"Ϊ2 13 3 ' (24)
331 РЕШЕНИЕ УРАВНЕНИЙ С ЧАСТНЫМИ ПРОИЗВОДНЫМИ [гл. V Отсюда С, = - С.= -4 е6 -4- 1 6 е'Ч-1 1 е-3 . 12 ' ch3 > 1 _е;-_ ' 12 ' ch 3' с3 = - Cl=- г'У sh ^3 У 12 sh 3 У Подставляя эти значения в формулы (23), после несложных упрощений окончательно находим и(х, 1)=- 1 (Г 3 sh ch (2x — 3) ch 3 sVnl-^-vV sh (з j/;;) i)· 11 (Χ, 2): ch(2x—3) ch.3 3sh *VT? sh (a· — 3) sh »/!?) (25) Мы рассмотрели некоторые методы численного решения различных типов дифференциальных уравнений в частных производных. Кроме рассмотренных разработаны также и другие методы, па- пример, метод Ричардсона [24], который, хотя и уступает процессу Либ.мана по скорости сходимости, но в меньшей степени загружает память машины. Литература к пятой главе [1] А. Н. Тихонов и А. А. Самарский, Уравнения математической физики, Гостехнздат, 1951, гл. 1, IV. [2] С. Л. Соболев, Уравнения математической физики, Гостехнздат, 1954, лекции 1—IV. [3] И. Г. Π е τ ρ ο υ с к и п, Лекции об уравнениях с частыми производными, Гостехнздат, 1950, 1.1. Ι π 111.
ЛИТЕРАТУРА К ПЯТОЙ ГЛАВЕ 335 [4] Н. С. К о ш л я к о в, Основные дифференциальные уравнения математической физики, Изд. 4-е, ОНТИ, 1936, гл. I. [5] В. И. Смирнов, Курс высшей математики, Изд. 18-е, т. II; Физматгиз, 1962, гл. VII. [6] Л. К о л л а т ιι, Численные методы решения дифференциальных уравнений, ИЛ, 1953, гл. 111 и IV. [7] В. Э. Милн, Численное решение дифференциальных уравнений, ИЛ, 1955, гл. V1U. [8] В. С. Рябенький и Α. Φ. Φ и л и π π о в, Об устойчивости разностных уравнений, Гостехиздат, 1956, гл. I, 11. [9] Д. Ю. Π а и о в, Справочник по численному интегрированию дифференциальных уравнений в частных производных, Изд. АН СССР, 1938. [10) В. К. С а у л ь е в, Интегрирование уравнений параболического типа методом сеток, Физматгиз, М, I960. [11] Современная математика для инженеров, Под ред. Э. Ф. Беккенбаха, гл. И, Дж. В. Браун, «Методы Монте-Карло>, ИЛ, М., 1958. [12] Б. П. Демидович и И. А. Марон, Основы вычислительной математики, Изд. 2, Физманиз, М., 1963, гл. XVII. [13] А. С. Хаусхолдер, Основы численного анализа, ИЛ, М., 1956, гл. V111. [14] Ф. М. Морз и Дж. Е. К и м б е л л, Методы исследования операций, Приложения. Изд. «Советское радио», М., 1956. [15] Математика в СССР за сорок лет, т. 1, Физматгиз, М., 1959, Μ. Κ. Γ а- в у ρ и и, Л. В. Канторович, Приближенные и численные методы. [16] Г. Н. Но ложи It и др., Математический практикум, Физматгиз, М., I960, гл. VI!. [17] Л. И. Г у τ е π м а х е р, Электрические модели, Изд. АН СССР, 1940. [18] Н. Е. К о б ρ и и с к и И, Математические машины непрерывного действия, Гостехиздат, 1954. [19] А. И. Китов, Η. Α. Κ ρ и н и ц к и й, Электронные цифровые машины И программирование, Изд. 2, Физматгиз, 1961, гл. V1U. [20] Э. Г у ρ с а, Курс математического анализа, т. 3, ГТТИ, М.—Л., 1933, 1.4. XXV11. [21] С. Г. Μ их л и и, Вариационные методы в математической физике, Гостехиздат, М., 1957, гл. XI. [22] И. С. Б е ρ е з и н, Н. П. Жидков, Методы вычислений, Изд. 2, Физматгиз, М., 1962, т. II, гл. X. [23] М. Г. С л о б од я н с к и й, Способ приближенного интегрирования уравнений с частными производными и его применение к задачам теории упругости, Прикл. матем. и мех., т. 3, вып. I, 1939. [24] Дж. Н. Л а н с, Численные методы для быстродействующих вычислитель- пых машин, ИЛ, 1962.
ГЛАВА VI ВАРИАЦИОННЫЕ МЕТОДЫ РЕШЕНИЯ КРАЕВЫХ ЗАДАЧ § 1. Понятие о функционале и операторе Введем сначала некоторые понятия функционального анализа, которые нам понадобятся в дальнейшем. Определение 1. Пусть дан некоторый класс (множество) функций К^={у (х)\, где χ— независимая переменная или совокупность нескольких независимых переменных χ = (χν х2, ..., хп). Говорят, что переменная величина I=J[y(x)\ есть функционал от функции у (х) (функция от функции), если каждой функции у {χ) ζ К по задан- , , , ному закону ставится в соответ- ~~ΰ α Ι) χ ствие определенное число /. Класс функций К= {у(х)\, Р|1С- 79. для которых определен данный функционал, называется областью определения или областью задания функционала, а сами функции называются допустимыми. Пример 1. Пусть К={у(х)\ — совокупность функций, дифференцируемых в точке jt = 0. Число ft = y'(0) можно рассматривать как функционал от у (х), определенный в области К. Пример 2. Рассмотрим множество К функций у (х), непрерывно дифференцируемых на отрезке [а, Ь\, т. е. у (χ) ζ С(1) [а, Ь]. Длина дуги s кривой у=у[х) между точками х — а и х = Ь (рис. 79)
§ И ПОНЯТИЕ О ФУНКЦИОНАЛЕ И ОПЕРАТОРЕ 337 честь функционал οτ у(х) в области К, который может быть выражен формулой s= j^l-fy* dx. Пример 3. Пусть К—множество неотрицательных функций z=^f(x, у), непрерывных в замкнутой области G и обращающихся в нуль на ее границе Г (рис. 80). Объем х/= ^ /{х, y)dxdy Рис. 80. есть функционал от /(х, у). Определение 2. Множество функций К называется линейным (или, короче, линеалом), если для каждых функций и ζ К и ν ξ Κ сумма их и -)- ν £ К, а также ο,ιιζΚ (α — любая постоянная). Например: а) множество полиномов, б) множество всех непрерывных функций, в) множество функций, обращающихся в нуль на границе области и т. п. есть линеалы. Определение 3. Функционал 1 = [\у\ называется линейным, если он определен на линейном множестве функций К, и для любой пары допустимых функций и и υ справедливо соотношение /[ακ-f β"] = α/Μ+β/Μ. где α и β — произвольные постоянные. Например, функционал k — y'(0), рассмотренный в примере 1, является линейным. Определение 4. Говорят, что на множестве К={у(х)\ определен оператор L, если каждой функции у (χ) ζ К по некоторому закону соответствует одна и только одна функция z^=z(x)*). Это соответствие между функциями символически записывается следующим образом: z=^Ly или z = L(y). Множество К функций у = у(х), на котором определен данный оператор L, называется областью задания этого оператора, а функции у ζ. К называются допустимыми. *) Возможно также.чгофункция г зависит от другой иеременной^=(^, ...,1т).
338 ВАРИАЦИОННЫЕ МЕТОДЫ РЕШЕНИЯ КРАЕВЫХ ЗАДАЧ [ГЛ. VI Пример 4. Пусть К= { у (х)} есть множество дифференцируемых функций. Тогда операцию —- взятия производной можно рассматривать как оператор (так называемый оператор дифференцирования) В более общем случае, если pt(x)£C\a, b\ (i = 0, 1, 2, ..., я) и у = у[х)£С(п)[а, Ь], то z=Ly=pe(x)yM+pl(x)yl»-»+...+p„(x)y (1) есть оператор (линейный дифференциальный оператор), определенный на К=С^\а, Ь\ со значениями z£C[a, b]. Действительно, для каждой допустимой функции у результат выполнения операций (1) есть некоторая непрерывная функция ζ. Например, если то 1(1)= 1; L(x) = x; L (хг) = 2 -\-хг\ L(ex) = 2ex; L(sinx) = 0 и т. д. С помощью линейного дифференциального оператора Ly общее линейное дифференциальное уравнение с неизвестной функцией у можно коротко записать как Ly = /(x), (2) где L — оператор вида (1) и f(x) — известная непрерывная функция. Пример 5. Рассмотрим множество функций К={и(х, у)} таких, что и(х, у) ξ CW (G), где О—заданная область. Функция, определяемая формулой . д'и , дга дх* ' оуг является оператором от и на множестве К (оператор Лапласа). Приравнивая этот оператор известной функции f(x, у), получим уравнение Пуассона Аи = /(х, у). (3) В частном случае, если /(х, у) = 0, будем иметь уравнение Лапласа Ди = 0. (4) Таким образом, дифференциальные уравнения, обыкновенные и с частными производными, с более общей точки зрения можно рассматривать как операторные уравнения. Определение 5. Оператор L называется линейным, если он определен на линейном множестве и для любой пары допустимых функций и к ν линейная комбинация их au-\-$v (α и β— произволь-
§ 1] ПОНЯТИЕ О ФУНКЦИОНАЛЕ И ОПЕРАТОРЕ 339 ные постоянные) является также допустимой функцией, причем выполнены условия: 1) L (ни) — ctLa; 2) L(u-\-v) = Lu-\-Lv. Отсюда вытекает, что L (alt -\- βυ) = ctLa-\- $Lv при любых постоянных аир. Легко видеть, что операторы -ζ—у, Ly и Δ«, рассмотренные в примерах 4 и 5, являются линейными. Пример 6. Оператор Ly=y* является нелинейным. Действительно, L (и -\- ν) = (и -\- ν)" и Lu -\- Lv = иг -\- ν2. Следовательно, L (и -\-v)y^Lu-\- Lv, если только uv φ 0. Пусть К есть множество функций { и}, определенных, действительных и непрерывных в области ω. Если и ζ К и ν ζ К, то число (и, ν) — j uv da *) называется скалярным произведением функций и и v. Очевидно, (и, ν) = (υ, и). Определение 6. Пусть линейный оператор L определен на линейном множестве функций и, заданных и непрерывных в области ω, и его значения Lu представляют собой функции, также определенные и непрерывные в ω. Тогда линейный оператор L называется симметричным {самосопряженным), если для любых допустимых функций и и ν справедливо соотношение \ vLu d<& = \ uLv fife), (Lu, v) = (u, Lv). (5) *) Если и и ν — функции нескольких переменных, то интеграл \ является ω кратным.
340 ВАРИАЦИОННЫЕ МЕТОДЫ РЕШЕНИЯ КРАЕВЫХ ЗАДАЧ [ГЛ. VI Если, сверх того, для любой допустимой функции и имеет место неравенство (Lu, и) Ss 0, причем (Lu, ц) = 0 тогда и только тогда, когда и=0, то оператор L называется положительным. Пример 7. Рассмотрим оператор £у=-/, определенный на множестве функций у £ № [0, 1] таких, 4TOjf(0) = 0 и /(1) = 0. Если и и ν — допустимые функции, то получаем 1 1 I \ (vLu — uLv) dx ==■ j (— vu" -J- uv") dx = (uv — vu') = 0, о о о поэтому 1 1 \ vLu dx = \ aLu Лс, о о т. e. (Lu, v) = (и, Lv) и, таким образом, оператор L является симметричным. Кроме того, учитывая, что «ξ0 есть в силу граничных условий единственная допустимая функция такая, что κ'ξΟ, при и =έ 0 имеем 1 1 1 .1 (Lu, u)=.\uLudx=: — j uu"dx =— uu' -\- \ u" dx^> U, О 0 0 0 причем (Lu, u) = 0, если и = 0. Следовательно, оператор L положителен. § 2. Вариационная задача Пусть дан функционал / = /[у(*)]. (!) определенный на некотором множестве А'={ ^ (х)}. Задача об отыскании экстремумов функционала (1) называется вариационной задачей. Более точно вариационная задача ставится следующим образом;
§ 3] ' ОСНОВНЫЕ ТЕОРЕМЫ ВАРИАЦИОННОГО МЕТОДА 341 требуется найти функцию у = у (χ) ζ К такую, что для всех допустимых функций у—у(х), достаточно близких к функции у(х), имеет место неравенство /[у]3г/[_у| в случае минимума или /[у]^/[у] в случае максимума. Заметим, что расстояние между функциями у и у можно понимать по-разному. Пример. Рассмотрим задачу: среди гладких кривых у=у(х), проходящих через точки Μ (а, А) и N{b, В), найти линию с наименьшей длиной дуги (рис. 81). Задача сводится к нахождению минимума функционала ь s = J ]Л +У" dx Рис. 81. для кривых у =у(х), принадлежащих классу С(1) [а, Ь] и таких, что у(а) = А и у(Ь) = В. Из геометрических соображений очевидно, что искомым решением будет прямая В-А причем «.и = V Ф — а)*-\- (В — А)'. § 3. Основные теоремы вариационного метода решения краевых задач Пусть в области О с границей Г дано линейное дифференциальное уравнение с непрерывными коэффициентами (обыкновенное нли с частными производными) и требуется найти решение у этого уравнения, удовлетворяющее на границе Г заданным линейным однородным (краевым) условиям. Левую часть этого уравнения можно рассматривать как линейный оператор L, определенный на множестве К функций, обладающих непрерывными производными нужного порядка в О -\-Г и удовлетворяющих данным краевым условиям на Г. Таким образом, наша краевая задача сводится к решению операторного уравнения
342 ВАРИАЦИОННЫЕ МЕТОДЫ РЕШЕНИЯ КРАЕВЫХ ЗАДАЧ [ГЛ. VI где Ρ обозначает совокупность независимых переменных, f(P)— известная функция (которую мы будем считать непрерывной) и у ζ К, и значит, функция у на границе Г удовлетворяет краевым условиям КЫ=0, (2) где R — известный линейный функционал или оператор более низкого порядка. Заметим, что неоднородная краевая задача Ly=f(P) (3) и Я Μ = φ (Я) при Ρ ζ Г, (4) где φ (Я)— известная функция, сводится к однородной, если положить y = z-\-yit где z — новая неизвестная функция и ул— достаточно гладкая функция, удовлетворяющая краевому условию (4): Действительно, из формул (3) и (4) получаем Lz = f(P) — Lyi и R [z] = 0. Функцию у, обычно нетрудно найти подбором. Идея вариационного метода применительно к нашему случаю состоит в том, что краевая задача (1), (2) заменяется равносильной задачей об отыскании функции, дающей экстремум (обычно минимум) некоторому функционалу. Вариационный метод решения краевых задач получил широкое распространение после того, как немецкий математик Ритц в 1908 г. предложил удобный прием для построения приближенного решения вариационной задачи. Метод Ритца будет изложен в § 7. Приведем две важные для дальнейшего теоремы. Теорема 1. Пусть L — симметричный линейный оператор, определенный и положительный в классе К. Тогда операторное уравнение (1) при наличии краевого условия (2) в классе К не может иметь двух решений, т. е. если существует решение краевой задачи (1)—(2), то оно единственно. Доказательство. Предположим, что краевая задача (1), (2) имеет два решения _у, и уг, т. е.
§ 3] ОСНОВНЫЕ ТЕОРЕМЫ ВАРИАЦИОННОГО МЕТОДА 343 Lyt=/(P), ВД = о. (6) Вычитая из уравнений (5) соответствующие уравнения (6), в силу линейности оператора L и функционала R получим £(у.—jO = °. я[у,—j\1=o. (7) т. е. Умножая первое из полученных равенств скалярио на разность у, —уг, будем иметь (L{yt—yJ, (yt—yt)) = 0. (8) Так как по условию оператор L положительный в классе К и функция (у,—Уг)€.К> то из формулы (8) следует у,— уг = 0, т. е. уг^уг, что и требовалось доказать. Теорема 2. Пусть L — симметричный оператор, определен' ный и положительный в классе К, a F\y\—функционал вида F[y\ = (Ly,y) — 2 (/, у) = J [Ly — If)у dm, (9) ω где f=/(P) — правая часть уравнения (1). Если краевая задача (1) — (2) с однородными граничными условиями имеет решение у, то это решение дает минимум функционалу F\y\. Обратно, если в классе К существует функция "у, дающая минимум функционалу (9), то эта функция является решением уравнения (1). Доказательство. 1°. Пусть у есть решение краевой задачи (1) —(2), т. е. Ly—/(P) и Я|3»] = 0. Заменяя f(P) через Ly в формуле (9), получим F[y]=(Ly, y) — 2(Ly, у). (10) Пользуясь симметричностью оператора L, будем иметь (Ly, у) = (J, Ly) = (Ly, у). Поэтому F[y\ = [Ly,y) — (Ly,-y)_— (Ly, y) = = (;- У. У — У) — \{Ly, у) — (Ly, у)} —j,LJ, у) = — (Ly, у —у) — (Ly, y—y) — (Ly,y) = = (L(y—y), (У —У)) — (Ly, у). (И)
344 вариационные методы решения краевых задач [гл. vi В правой части формулы (11) только первое слагаемое является переменным. Очевидно, (у—у) ζ К, поэтому в силу положительности оператора L имеем (L(y-y), [у—у)) 5*0. Следовательно, функционал F[y\ достигает своего наименьшего значения для тех и только тех допустимых функций у, для которых имеет место равенство [Ну—у), (у — у)) = 0. Отсюда на основании определения положительного оператора получаем у— у = 0, т. е. у==у. Заметим, что из формулы (11) следует, что наименьшее значение функционала F\y\ равно 2°. Пусть существует функция у из класса К, дающая минимум функционалу (9). Это значит, что для любой функции у1 ξ К и достаточно близкой к у справедливо неравенство Положим и рассмотрим семейство функций у=у + щ> (12) где α — числовой параметр. Очевидно, при любом α функции у являются допустимыми и при достаточно малом |а[ выполнено неравенство ^F=F\y] — F[y]^0. На основании формулы (9), выполняя тождественные преобразования, имеем Δ^= (Ly, у) - 2 (/, у) — (Ly, у) + 2 (/, у) = (Ly, у) - 2 (Ly, у) + + 2 (Ly - /, у) — 2 (Ly — /, у) + (Ly, y) = (Ly,y) — 2(Ly,y) + Jr2(Ly—f,y — y)-)r(Ly,y)^0. (13) Отсюда, используя преобразование (11) и формулу (12), находим bF=(Hy—y), (y-y))-(Ly,y)-\-2(Ly~/,y-y)-{-(Ly,y)=: = α2 (LVr() + 2α (Ly —f, η) ^ 0. (14) Левая часть неравенства (14) представляет собой квадратный трехчлен относительно параметра а, причем этот трехчлен не может
§ 4] СВЕДЕНИЕ ЛИНЕЙНОЙ КРАЕВОЙ ЗАДАЧИ К ВАРИАЦИОННОЙ 345 менять знака. Следовательно, соответствующее квадратное уравнение заведомо не имеет действительных различных корней и, значит, обладает неположительным дискриминантом, т. е. (Ly—f, η)* —(Ζ.η, η)·0<0, отсюда {Ly—f, η) = 0. Таким образом, S(iy— /)ηΛ» = 0 (15) для любой функции η ζ ΑΓ. В силу произвольности функции η отсюда следует (см. [3]), что Ly—f==0, т. е. Ly=f. Таким образом, у есть решение нашей краевой задачи. § 4. Сведение линейной краевой задачи для обыкновенного дифференциального уравнения второго порядка к вариационной задаче Рассмотрим обыкновенное дифференциальное уравнение / + Р(х)у' + Я(х)у = Ф(х) (1) с линейными краевыми условиями: а.у(а)-\-ау(а) = А, λ РУ(6) + РД*)=Д ί [) где функции Р(х), Q(x) и Φ (χ) непрерывны на отрезке \а, Ь\ и Ια,Ι + ΙαΙ^Ο, |р,| + |р|^0. Приведем уравнение (1) к специальному так называемому самосопряженному виду. Для этого умножим все его члены на положительный множитель X $P(x)dx р(х) = е" после чего получим р(х)у'(х) + р(х)Р(х)у'+р(х)СЦх)у=р(х)Ф{х). (3) Так как χ $P(x)dx p'W = e Ρ(χ)—ρ(χ)Ρ(χ),
346 ВАРИАЦИОННЫЕ МЕТОДЫ РЕШЕНИЯ КРАЕВЫХ ЗАДАЧ [ГЛ. VI то уравнение (3) можно записать в виде dx 1;И*)/] + «МУ=/М. (4) где р(х)>0; q(x)=p(x)Q(x); /(х)=р(х)Ф(х). Дифференциальное уравнение ьторого порядка вида (4) называется самосопряженным. Вводя линейный оператор Ly= — £[p{x)y'] — q(x)y, (5) получим Ly = — /(χ), (6) где ρ (χ), ρ'(х), q(x) и /(х) непрерывны на отрезке \а, Ь]. Предположим сначала, что краевые условия (2) являются однородными, т. е. РУ(*)+Р* (*) = <>, J (Ί) где 1«,| + |α1^0 и Ιβ,Ι-ΗΡΙ^Ο, причем без нарушения общности рассуждений можно предполагать, что а, S3 0 и β, 2з0. Покажем, что в этом случае оператор L является самосопряженным (симметричным) в классе функций Д"=: {у}, непрерывных на отрезке \а, Ь\ вместе со своими первыми и вторыми производными {у £С|2) [а, Ь]) и удовлетворяющих на концах отрезка ]а, Ь\ однородным краевым условиям (7). Пусть и ξ К и νζΚ. На основании формулы (5) имеем (Lu, v) — (Lv, и) = & ί {-v[£{pwu')+q{x)u} + а ь [ρ (χ) (uv" — vu") ~\-p' (χ) (μν' — vu')[ dx = ■I -I [p (#) (κυ' — w«')] rfjc = dx = ρ (a:) (ич/ — «a ) =p φ) w [b) — ρ (a) w (a), (8)
§ 4] СВЕДЕНИЕ ЛИНЕЙНОЙ КРАЕВОЙ ЗАДАЧИ К ВАРИАЦИОННОЙ 347 где w(x) = (9) и (χ) ν (х) и' (χ) ν' (χ) Функции и—и (χ) и ν = ν(χ) удовлетворяют однородным краевым условиям: а,«' (a) -J- аи (а) — О, α,υ' (α) -\- α.ν (а) = О, где α,=^0 или а ф- 0. Следовательно, «» = — -ρ κ (α), о'(а)=_ ^-и(а) или и(а) = —-^-ц'(а), ф(а)=—^-г/(а). Поэтому w (а) ■=■ 0. Аналогично доказывается, что w (Ь) — 0. Следовательно, из формулы (8) вытекает (Lu, ν) — (Lv, и) = О и, значит, (Lu, ν) — (Lv, и), т. е. оператор L симметричен. Выясним, при каких условиях оператор L является положительным. Для функции у ζ К имеем ь (Ly, у) = — ^-^\p(x)y']-\-g(x)y^ydx. (Ю) а Интегрируя по частям первый член формулы (10), будем иметь ь (Ly, y)= — p(x)yy'\"a-{-^\p(x)y" — q{x)y1\dx. (11) а Так как р(х)^>0, то из формулы (11) вытекает, что оператор L положителен, если д(х)^0 при a^xs^b (12) я y(a)y'(a)S?0, y(b)y'(b)^0. (13)
348 вариашюннык методы решения краевых задач [гл. vi Так как а, 2== О и β,^=0, то в силу краевых условий (7) неравенства (13) эквивалентны неравенствам α<0, β Ss 0. (14) Таким образом, краевая задача (6)—(7) при наличии неравенств (12) и (14) согласно теореме 2 из § 3 равносильна задаче о минимуме функционала F\y] = (Ly,y) + 2(f,y) (15) в классе функций К. Используя формулу (11), имеем F\y\=p{a)y(a)y'{a) — p{b)y{b)y{b)^- ь + $[Р(*)У —?(*)/ +2/(*Ы<**· (16) α В частности, если а, ^> 0 и β, > 0, то получим F Ы =- ~ Ρ И/ (а) + J-ρ (Ь)уг (Ь) + + l[p(x)y"—q(x)y' + 2/(x)y]dx. (17) а Аналогичные выражения получаем для других случаев. Рассмотрим теперь краевую задачу (6) с неоднородными краевыми условиями (2) в предположении, что выполнены неравенства (12) и (14). Оператор L в классе функций Kv удовлетворяющих условиям (2), вообще говоря, не является симметричным и положительным, поэтому нельзя непосредственно использовать теорему 2 предыдущего параграфа. Пусть ζ — ζ(χ) ζ С" \а, Ь] и удовлетворяет условиям (2), т. е. α,ζ»-Τ-αζ(α) = Λ, \ Обозначая через у решение краевой задачи (6), (2), введем функцию и=-и(х), определяемую равенством и = у — г. (19) Функция и удовлетворяет однородным краевым условиям: α,κ' (а)~\-ш(а) = 0, \ β,«'(&) + № = 0 / (20) и является решением уравнения Lu = Ly — Lz,
§ 4] СВЕДЕНИЕ ЛИНЕЙНОЙ КРАЕВОЙ ЗАДАЧИ К ВАРИАЦИОННОЙ 349 т. е. Lu = —f(x) — Lz. (21) Таким образом, и ζ К. Оператор Lu в классе функций К является симметричным и положительным, и, следовательно, решение и краевой задачи (20), (21) в силу теоремы 2 из § 3 дает минимум функционалу F.[u\ = (Lu, и) + 2(/(χ) + Lz, и). Отсюда на основании формулы (11) имеем F[u]=p(a)u(a)u'(a) — p(b)u(b)u'(b)-\- ь + \ [р (х)и" — q{x)uz-\-2 (f(x) + Lz) и] dx. (22) а Из равенства (19) получаем, что решение у краевой задачи (6), (2) дает минимум функционалу ^ Ы =Р И \У (а) - z (а)] [/ (а) -z' (а)] - - Ρ Φ) \у (b) - ζ Φ)} \y'(b)- ζ' (b)} + ь +1 [Ρ W (/ - *')' - Я {χ) (У - *)' + 2 (/(χ) +Lz)(y- ζ)} dx = α = Ρ (а) Ь Φ) — ζ (α)\ \/{fl)—z' (a)} — - Ρ (*) Ь (*) - «■ (*)] [/ (&) — «' (6)] + + $H*)/2-?M/ + 2/(x)y]tfx+$[p(*)*'s-(?(x)z2 — α α — 2f(x)z\dz + 2l\—pWy'z'+q{x)yz-\- a -{-(у —ζ) Lz] dx. (23) Используя интегрирование по частям, будем иметь ь ь §(У — z)Lzdx = — j(_y — z) \-j£(p(x)z')-{-q(x)z dx = a a b = — [y — z)p\x)z' \ba-\-l\p(x)z'(y'—z') — q(x)z(y—z)]dx = a = p[a)[y (a) - ζ (a)] z' (a) — p(b)]y (b) - ζ (b)] z' (b) + ь + S \P (x) *'(y' — z') — q(x)z(y- z)\ dx.
350 ВАРИАЦИОННЫЕ МЕТОДЫ РЕШЕНИЯ КРАЕВЫХ ЗАДАЧ [ГЛ. VI Внося это выражение в формулу (23), после несложных упрощений получим ^ [у] =р(а)\у (а) - ζ (а)} \у' (а) + z' (a)] - — Р Ф) [у (Ь) - ζ Щ [/ (Ь) + г1 Щ + ь Jr][p{x)y'i-q^)fJr'2f(,x)y\dx — а ь — \\р (χ) ζ" — q (χ) ζ2 + 2/(χ) ζ] dx. (24) α Пусть α, ^> 0 и β, ^> 0. Из краевых условий (2) имеем ,, А — а ν (а) ,. . А — аг(а) У W = ^. « (a) = - j-i-i Pi Pi Тогда Л Μ=ψ № («) -«/ И] - ψ [2Яу (6) - β/ № + - <j ^ [2 Α ζ (а) - а*2 (а)} - ψ [2Bz (b) - β*' φ)\ + ь + j [ρ (χ) ζ"- q (x) z1 + 2f(x)z]dxy (25) a Так как стоящие в фигурной скобке члены формулы (25) фиксированы и не меняются при изменении функции у, то вместо функционала Z7, [у] можно рассмотреть функционал Ф\у]=^[2Ау(а)-^(а)}- "1 -Р-£1[2Ву(Ь)-№(Ь)] + ь + J [P (*)/' — ί (*) / + 2/Wy] </*. (26) Таким образом, краевая задача (6), (2) с неоднородными краевыми условиями в предположении, что имеют место неравенства (12) и (14),
§ 5) КРАЕВЫЕ ЗАДАЧИ ДЛЯ УРАВНЕНИЙ ПУАССОНА И ЛАПЛАСА 351 эквивалентна вариационной задаче для функционала (26) в классе функций Kv удовлетворяющих заданным краевым условиям. Замечание. 1°. Если а1 = 0 и β,^Ο. το д у(а) = г(а) = —. Из формулы (24) вытекает, что за Φ [у] можно принять функционал ь а 2°. Аналогично доказывается, что если αλ = 0 и pt = 0, то ь * Ы = S [Р (х) У" — Я (х)уг + Шх)у] dx. а § 5. Краевые задачи для уравнений Пуассона и Лапласа Пусть дано уравнение Пуассона — Ди=/(х, у), (1) где . дги ■ дги /(χ, y)£C(G). Требуется найти решение уравнения (1), непрерывное в замкнутой области G—G-\-r и удовлетворяющее на границе Г этой области краевому условию и\Г = ч(Р), (2) где Р=(х, у) и ψ(Ρ) — заданная непрерывная функция. Предположим вначале, что φ (Ρ) = 0, т. е. и|г = 0, (3) и будем решать однородную краевую задачу (1), (3). Покажем, что в классе функций /С={и(л;)}, непрерывных в G вместе со своими первыми и вторыми производными и обращающихся на контуре Г в нуль, оператор £и — — Л« симметричен и положителен.
352 ВАРИАЦИОННЫЕ МЕТОДЫ РЕШЕНИЯ КРАЕВЫХ ЗАДАЧ [ГЛ. VI Пусть и £ К и ν ζ Κ· Составим выражение {Lu, v) — (Lv, u) = =ij [-4B+S)+"(S+0)]dxdy== J J дх\ дх дх)~*ду\ ду ду a Применяя известную формулу Грина и используя нулевые граничные условия: и|г=0, «|г = 0, получим (Lu, ν) — (Lv, и) = dxdy. = 0; (4) следовательно, (Z.«, г>) = (£г>, u) и, значит, оператор L симметричен. Далее установим положительность оператора L. Имеем +И [(ЙУ+(1Л **■ о Применяя к первому интегралу формулу Грина, в силу краевых условий для функции и получим (Lu, u) = -^(-ud£dx + ud£dy^ +Ш(Ё)'+(Й)>*-
§ 5] КРАЕВЫЕ ЗАДАЧИ ДЛЯ УРАВНЕНИЙ ПУАССОНА И ЛАПЛАСА 353 т. е. (Lu, «) = ( — Lu, и)~^0. Если (Lu, «) = 0, то из формулы (5) следует, что ди ди ,. дх ду Отсюда и (х, у) = с и на основании краевого условия (3) имеем и(х, у) = 0. Следовательно, оператор L положителен. Таким образом, для краевой задачи (1) с однородными краевыми условиями (3) выполнены условия теоремы 2 из § 3. Следовательно, эта задача эквивалентна вариационной задаче для функционала F\u] = (Lu, и) —2 (и, /) (6) в классе функций и, принадлежащих множеству К. В силу формулы (5) получаем 'и-ргу+ой'-Н4·*· <* Рассмотрим теперь краевую задачу (1) с неоднородными краевыми условиями (2), и пусть К, = {и (х, у)}— класс функций и £ Ог>(0-\-Г), удовлетворяющих условиям (2). Следуя идее предыдущего параграфа, построим функцию ζ = ζ(χ, у) £ Ст (ϋ-\-Γ), для которой выполнены краевые условия (2). Введем функцию v(x, у) = и(х, y)—z(x, у), (8) где и(х, у) — решение нашей неоднородной краевой задачи. Тогда функция υ = ν(χ, у) удовлетворяет на контуре Г однородному краевому условию v\r = 0 (9) и является решением уравнения Lv=Lu—Lz = f(P)—Lz, (10) где Lz ——(л7г4"Х~2) —известная функция. Функция v = v{x, у), являясь решением однородной краевой задачи (10), (9), на основании формулы (6) дает наименьшее значение функционалу F[υ] = (Lv, ν) —2 (υ, /(Ρ) — Lz). (11)
354 ВАРИАЦИОННЫЕ МЕТОДЫ РЕШЕНИЯ КРАЕВЫХ ЗАДАЧ [ГЛ. VI Возвращаясь в последнем равенстве к функции и (см. (8)) и используя свойства скалярного произведения и линейного оператора L, получим F [и — z] = Fx [u\ — {L(u — ζ), и — ζ) — — 2(и — ζ, f(P) — Lz) = (Lu, в) —2(и, f)-\- + («, Lz) — (z, Lu)-\-2(z, f) — (Lz, ζ). (12) Так как последние два члена формулы (12) не зависят от искомой функции и = и(х, у), то функция и = а (х, у), дающая наименьшее значение функционалу (12), будет минимизировать функционал Ft [и] = (Lu, и) — 2 (и, f) + [(Lz, и) — (Lu, z)\. (13) Покажем, что функционал (13) можно заменить функционалом, не содержащим функцию ζ. Используя преобразование, примененное в формуле (4), имеем (Lz, и) — (Lu, ζ) = ] ] (ζΔκ — u\z) dz = -J[-(«*-s)"+(«e-£H- К da dz\ . zih-uTa)ds> г где η — внешняя нормаль к Г и да ди dy да dx dz dz dy dz dx dn dx ds dy ds' dn dx ds dy ds ' Отсюда, так как г\г = и\г = ч{х, у), получаем (Lz, и) — (Lu, *) = J φ(χ, у) (j^ — £j ds. г С другой стороны, на основании формулы (5) находим (14) (15)
§ 6] ИДЕЯ МЕТОДА РИТЦА 355 Подставляя (14) и (15) в формулу (13), будем иметь '.м=ш(£),+®)"-*: dxdy — ' дг Так как последнее слагаемое в формуле (16) не зависит от функции и, то краевая задача (1) — (2) эквивалентна вариационной задаче для функционала •м-ij [Ш)"+(в)'-Н Л* (17> в классе функций /С,. В частном случае, если /=/(х, у) = 0, то получаем уравнение Лапласа Дц = 0, причем краевая задача (1)—(2) есть известная задача Дирихле. Решением этой задачи, как вытекает из формулы (17), является функция и из класса А-,, минимизирующая интеграл Дирихле •w-ttKS'+d)"]**· § 6. Идея метода Ритца Метод Ритца служит для приближенного решения вариационной задачи. Для простоты рассмотрим этот метод для функционала вида F[u] = {Lu, и)—2(/, и), (1) определенного на некотором линейном множестве К=-{и], где L — положительный линейный оператор и /—заданная непрерывная функция. Предполагается, что функции класса К удовлетворяют линейным краевым условиям: R[u] = V(P), (2) где R—известный линейный функционал и φ — заданная постоянная величина или функция. Построим последовательность достаточно гладких линейно независимых функций "ЛР)> "ЛР) и„(Р), где uQ(P) удовлетворяет неоднородным краевым условиям: Λ К] = <?(/>). (3)
356 ВАРИАЦИОННЫЕ МЕТОДЫ РЕШЕНИЯ КРАЕВЫХ ЗАДАЧ [ГЛ. VI a ui(Ρ) ({=1, 2, ..., η)—однородным краевым условиям Я [«,-] = О (/=1, 2 я). (4) Составим линейную комбинацию и (Р; cv ct, ..., сп) = иа (Ρ) -f 2 e/B/ (P). (5) Так как το «£/( при любых постоянных cv сг, ...,cn. Приближенное решение вариационной задачи (1)— (2) будем искать в виде (5). Для этого подставим и(Р; с,, са, ..., сп) в функционал (1). Тогда получим />] = Ф(с„ с„ ..., О. (6) где Φ — известная функция, зависящая от я переменных с,, с„ ... ..., с„. Подберем коэффициенты с,, с,, . .., с„ таким образом, чтобы /^[и] было минимальным. Это дает систему уравнений ос, '' дс2 ' · ·-' ас„ и' из которой определяются постоянные ci (ί — 1, 2, . . ., я) в формуле (5). Таким образом, вариационная задача (1) — (2) приближенно сводится к задаче об отыскании экстремума функции Φ (с,, сг, ..., сп) многих переменных. Точность решения, вообще говоря, возрастает при увеличении числа переменных функции Ф. В следующих параграфах мы рассмотрим применение метода Ритца к конкретным краевым задачам. § 7. Метод Ритца для простейшей краевой задачи Пусть дано линейное дифференциальное уравнение Si[p(x)y']-\-4(x)y=f(x) (ί) с простейшими краевыми условиями: у(а)=А, у(Ь) = В, (2) где р(х), q{x), f(x)€.C[a, b], причем р(х)^>0 при а^х^Ь. Согласно результатам § 4 (замечание 2°) краевая задача (1)—(2) эквивалентна вариационной задаче для функционала ь Р\у\=\\Р{х)у'1-Я^)уг + 2/ (х) у] dx 13)
§ 7] МЕТОД РИТЦА ДЛЯ ПРОСТЕЙШЕЙ КРАЕВОЙ ЗАДАЧИ 357 на множестве функций у £ C(t) [a, b], удовлетворяющих краевым условиям (2). Для решения вариационной задачи (3), (2) применим метод Ритца. Выберем систему линейно независимых функций (координатные функции) иа (х), и, (*), и, (*), ..., ип(х) таких, что и0(а) = А, иа(Ь) = В, а остальные функции щ (х) (i >0) удовлетворяют однородным краевым условиям, т. е. ui(a)=ul(b) = 0 (/=1, 2, .... я). Решение вариационной задачи будем искать в виде линейной комбинации Я*) = М*) + 2 '/«Л*). (4) /'—1 где с,- (ί= 1, 2, . . ., η) — некоторые постоянные. Очевидно, функция, определенная равенством (4), удовлетворяет заданным краевым условиям, т. е. у(а) = А, у(Ь) = В. Коэффициенты с,, сг, . . ., сп подберем так, чтобы функция у(х) давала экстремум функционалу (3). Подставляя выражение (4) в формулу (3), получаем ь - q (χ) [и, (X) + 2 ctUt (х)\% + 2/(х) [и, (*) + η + 2 с<"<· И}d*=Ψ (ci. ci. · · ·. о. где φ (с,, с,,.. ., ■ сп) — квадратичная функция переменных е,, с,, ...,с . Как известно, для того чтобы дифференцируемая функция ψ (с,, сж,..., си) при некоторых значениях с,, c2, ..., сп имела экстремум, необходимо соблюдение для этих значений следующих условий: !ϋ = 0 (5)
358 ВАРИАЦИОННЫЕ МЕТОДЫ РЕШЕНИЯ КРАЕВЫХ ЗАДАЧ [ГЛ. VI Система (5) является линейной относительно искомых коэффициентов с,, сг, ..., сп, причем число уравнений равно числу неизвестных. Составив систему (5) и решив ее, если это возможно, найдем коэффициенты сг(г'=1,2, ...,я); после чего решение вариационной задачи, а следовательно, и решение исходной краевой задачи дается формулой (4). В этом и состоит формальный аспект метода Ритца для краевой задачи (1)—(2). Оценка погрешности этого метода представляет собой относительно трудную задачу [3] и разбирать ее здесь не будем. Заметим только, что точность решения в большой степени зависит от удачного подбора координатных функций и, вообще говоря, возрастает с увеличением их числа. Пример. Найти решение уравнения [1] удовлетворяющее краевым условиям У(—1)=.У(1) = 0. Решение. За систему координатных функций {ut{x)\ принимаем полиномы, расположенные по степеням хг, удовлетворяющие однородным краевым условиям: и,(*) = 0; к, (х) = 1 — х\ ". Μ = ι — *4; ип(х)=\—х2п. Для простоты выкладок возьмем лишь три координатных функции, Т. е. будем искать функцию У=у(х) в виде суммы у = с1(\-х*) + сг{\-х'). (6) Данное уравнение, где р{х)=1, q{x) = l+x\ /(*)=—!, очевидно, является самосопряженным. Составляем для него соответствующий функционал 1 ^М= Jb"-(4-*,)j't-2y]</*. — 1 Заменяя у его выражением (6), получаем 1 р\У\=1 №ιχ + 4^Τ- (1 + х*) [с, (1 - А + + ct(i-xt)]l — 2[c,(\-x1)+c,(i—xt)]}dx.
§ 8] МЕТОД РИТЦА ДЛЯ КРАЕВОЙ ЗАДАЧИ ШТУРМА ЛИУВИЛЛЯ 359 II dF dF Частные производные -г—, -г- можно найти дифференцированием интеграла F[y] по параметрам с, и с2: 1 — 1 — (1+^)-2(1-хгЖ(1-хг) + с2(1-^)]-2(1-х')}^ = 1 Г {вдс^гс^+^.х*)- _2(1+**)(1—^[с.О—*') + С1(1—х4)]—2(1—х*)}</* = — 8 ( 4 _L_248S 2 —"°\.9 С'"Т"3645^—¥ Приравнивая эти производные нулю, получаем систему уравнений: 105 > > 9 L* з ' I "9 C) ' 3645 Сг ~~ ΊΓ ' J откуда находим, что с, = 0,988, с2 = —0,054. Подставляя найденные значения с, и с2 в формулу (6),' получаем приближенное выражение для искомого решения у = 0,934 — 0,988 *г+ 0,054 л;4. (7) § 8. Приложение метода Ритца к решению краевой задачи Штурма — Лиувилля Рассмотрим однородное самосопряженное дифференциальное уравнение 1р (*)/]'+Ιϊ(*)+λρ Mb = о (i) с однородными краевыми условиями: где р(х)>0, ΚΙ + ΚΙτ^Ο. ΙΡ,Ι + ΙΡ,Ι^Ο; р(х\ q(x), p(x)- непрерывные функции и λ — параметр. Очевидно, функция у = 0 есть решение дифференциального уравнении (1), удовлетворяющее краевым условиям (2). Однако обычно
360 ВАРИАЦИОННЫЕ МЕТОДЫ РЕШЕНИЯ КРАЕВЫХ ЗАДАЧ [ГЛ. V! представляют интерес нетривиальные решения краевой задачи (1) — (2). Отыскание нетривиальных решений дифференциального уравнения (1), удовлетворяющих однородным краевым условиям (2), называется задачей Штурма — Лиувилля. С этой задачей часто приходится иметь дело в уравнениях математической физики. Те значения параметра λ, при которых существуют нетривиальные значения задачи (1) — (2), называются собственными значениями или собственными числами задачи Штурма — Лиувилля, а соответствующие им нетривиальные решения— собственными функциями или собственными решениями этой задачи. Ограничимся рассмотрением уравнения (1) при простейших однородных краевых условиях у(а) = 0, у(Ь) = 0. (3) Покажем, как, используя метод Ритца, можно приближенно решить соответствующую задачу Штурма —Лиувилля. Для этого, как указано в § 6, для уравнения (1) построим соответствующий функционал ίι Р\у] = ^{р(х)у'г-[д(х)-{-1?(х)}уг}ах. (4) а Будем искать функцию у=у{х, λ), дающую экстремум этому функционалу и такую, что у (а, \) = 0, у(Ь,\) = 0- Те значения параметра )., при которых наша вариационная задача имеет нетривиальные решения, в силу результатов § 3 являются искомыми собственными значениями рассматриваемой задачи Штурма — Лиувилля. Искомую функцию у приближенно представим в виде линейной комбинации координатных функций где и,, (а) = «,.(£) = 0 (/==1, 2, ..., л). Ввиду однородности задачи полагаем «„ (л:) = 0. Подставив выражение (5) в интеграл (4) и произведя соответствующие выкладки, будем иметь ^!.У1=Ф(С1. £г> ···- спЛ), где ψ—квадратичная форма (линейная однородная функция второй степени) от переменных с,, сг, ..., сп.
§ 8] МЕТОД РИТЦА ДЛЯ КРАЕВОЙ ЗАДАЧИ ШТУРМА—- ЛИУВИЛЛЯ 361 Коэффициенты с,, с2, ..., сп находим, используя необходимые условия для экстремума функции ψ. Это дает нам линейную однородную систему ас, · £- = 0.' (6) Как известно, для того чтобы однородная система (6) имела нетривиальное решение, необходимо и достаточно, чтобы определитель ее Δ (λ), очевидно, зависящий от параметра X, был равен нулю. Таким образом, для определения собственных значений получаем алгебраическое уравнение л-й степени Δ(λ) = 0, (7) которое называется характеристическим уравнением или уравнением частот задачи Штурма — Лиувилля. Решив характеристическое уравнение (7), находим первые я собственных значений λ,, λ,, ..., λ„. Для определения коэффициентов cv ct, ..., сп следует каждое из полученных собственных значений X,- подставить в систему (6) и найти соответствующие нетривиальные решения этой системы. Собственные функции У=у{х, V (7=1. 2, .... я) определяются из формулы (5), где коэффициенты ci (i = 1, 2, .. ., η) имеют найденные выше значения. Заметим, что методом Ритца можно отыскать, разумеется приближенно, лишь конечное число собственных значений задачи Штурма — Лиувилля (как правило, такие задачи имеют бесконечное множество собственных значений), причем, чем больше используется координатных функций, тем больше, вообще говоря, находим собственных значений и выше точность вычислений. Пример. Методом Ритца определить первые два собственных значения и первые две собственные функции задачи Штурма — Лиувилля для уравнения /4-^ = 0 (8) при краевых условиях У№)=У(1) = 0. (9) Решение. Функционал (4) для данного уравнения (8) имеет вид 1
362 ВАРИАЦИОННЫЕ МЕТОДЫ РЕШЕНИЯ КРАЕВЫХ ЗАДАЧ [ГЛ. VI Учитывая краевые условия (9), выбираем, например, следующие координатные функции: и1(х)^=х(1—х); и2(х) = хг(\—х) и соответственно полагаем у = с,(х — х*)+сг{х1 — х\ (11) где с, и с —постоянные коэффициенты, не равные нулю одновременно (c2-fc2>0). Подставляя выражение (11) в формулу (10), будем иметь F[y}=i{\c1(l-2x)-lrc1(2x-3x*)Y- О — 1\с1 (х — xz) -\- сг{х* — х')]г} dx. Отсюда, дифференцируя по параметрам с, и сг под знаком интеграла, получим 1 ±^==:§{{\-2х)[сл(\-2х) + сг(2х-Зх*)\- 1 О — λ (χ — хг) \сл (х — х2) -}- с, (хг — х')} dx = ι lg=J{(2x-3*'HCT(l-2*) + О + сг (2х — Зх2)\ — λ (χ2 — л:') [с, (χ — хг) + сг (хг — xs)}} dx = п dF dF Приравнивая нулю производные ^— и j-, приходим к системе тс (2e, + i,)(l-;ш) = 0· (12) 5ε-(1-ΐί))+^(1-Γ4) = 0· I Система (12) имеет ненулевое решение с,, ct тогда и только тогда,
§ 8] МЕТОД РИТЦА ДЛЯ КРАЕВОЙ ЗАДАЧИ ШТУРМА — ЛИУВИЛЛЯ 363 когда определитель ее равен нулю. Приравнивая нулю определитель системы (12), получим характеристическое уравнение >('-и) ("Ч ■O-ά) Ч'-р = 0 или после упрощений (<-έ)('-ά)-* Отсюда находим приближенные собственные значения задачи λ,= 10, λ2 = 42. (13) (14) = 10 Коэффициенты с, и с2 определяем из системы (12). При λ = λ, имеем ct = c, ca = 0. Следовательно, первая собственная функция нашей краевой задачи в силу формулы (11) есть у^с{х-х*) (ефО). Полагая λ = λ, = 42 в системе (12), будем иметь 2ci-\-c2 = 0, 16с, — 8с, = 0, отсюда с1 = с, с2 = — 2с. Подставляя последние выражения в формулу (11), получаем вторую собственную функцию у^с(х — Зхг-\-2хг) (с=£0). В данном случае известно точное решение краевой задачи (8) — (9). А именно, собственные значения имеют вид λ„ = /ιν («=1,2,...), а соответствующие собственные функции определяются формулой yn = cs\nnnx (я=1, 2,...), где сфО. В частности, получаем ^ = 1Г! = 9,87 и λ2 = 4π2 = 39,48.
364 ВАРИАЦИОННЫЕ МЕТОДЫ РЕШЕНИЯ КРАЕВЫХ ЗАДАЧ [ГЛ. VI Таким образом, из приближенных собственных значений (14) первое определено примерно с относительной погрешностью 1,3°/0, а второе— с относительной погрешностью 6,4°/0. § 9. Метод Ритца для задачи Дирихле Будем искать решение уравнения Лапласа ^u^=0 при (х, у) £ G (1) и и\г=/(х,у), (2) где Г—простой замкнутый контур, ограничивающий конечную область G, а функция f(x, у) непрерывна на Г. Согласно § 6 эта краевая задача эквивалентна вариационной задаче для функционала о в классе функций, имеющих непрерывные частные производные до второго порядка включительно в замкнутой области G-\-T и удовлетворяющих на границе Г краевому условию (2). Построим конечную систему линейно независимых функции (координатные функции) "о (х, У), и, (*, У) и„ (*. У) ζ С(,> (G + Г), таких, что Чо(х>У)\г=/(х,у), М*. У)\г = 0 (1=1,2, ...,п). Тогда линейная комбинация η φ (χ, у) = u0 (χ, у) -f £ с А. (х, у) (4) ί = 1 принадлежит классу допустимых функций при любых постоянных cv c8» •••>£V ФормулУ (4) можно записать короче: п. <р ί*. у) = Σ с1иЛх< у)' и') где е„ = 1. Подставляя выражение (4') в функционал (3), получим
§ 91 МЕТОД РИТЦА ДЛЯ ЗАДАЧИ ДИРИХЛЕ 365 Подберем коэффициенты с,, сг, ...,сп так, чтобы функция F\y\ имела минимум. Для этого необходимо выполнение условий = 0 (6) или где причем α ί=ο 4ί=ο ' ' J J (7=1,2, .... я), ["ο- ",] + ci К. «iH Η„ [«„,«,] =о, ι К. «J +с. К. в.1 + —Нс» к.»,] =0. [ (6') К ип\ + с. К. ««Л Ь сп [«„.«„]=о, J о [н(, «,] = [«,, и,]. (7) Из линейной системы (6') определяются коэффициенты с,, с,, ...,сп. Функция φ(χ, _у) с коэффициентами, определенными из системы (6'), представляет собой приближенное решение задачи Дирихле. Точность приближения зависит от выбора координатных функций uk (x, у) и от числа этих функций [3]. Для ознакомления с применением метода Ритца к более общим краевым задачам для уравнений с частными производными следует обратиться к более подробным руководствам [1], [3]. Рис. 82. Пример. Найти функцию и=и(х, у), гармоническую в области О: χ ;> 0, у > 0, χ -\-у < 1 (рис. 82) и удовлетворяющую на границе Г;
366 ВАРИАЦИОННЫЕ МЕТОДЫ РЕШЕНИЯ КРАЕВЫХ ЗАДАЧ [ГЛ. VI х = 0; у = 0; х-\-у — ] условию и\г = х2+у\ (8) Решение. Выберем следующую систему координатных функций: и1(х,у) = ху(\-~х — у), иЛх'У)=х2у(1 — χ—у), и, (х> у) = хуг{\ — х —у), и составим линейную комбинацию φ (*, у) = х2 +/ + с,хУ (1 — х—у) + + c/ji(l-x-iy) + cIi/(l-x-j)). (9) Легко проверить, что функция ψ(χ, у) удовлетворяет краевому условию (8) при любых значениях постоянных ct, c2, с,. Для составления системы (6') подсчитываем коэффициенты при неизвестных с,, с2, с, и свободные члены. Результаты вычислений приведены в таблице 71. Таблица 71 Значения коэффициентов при неизвестных j 1 2 3 ["о, "β 1 30 1 90 1 90 Ι "ι, "β ι 90 1 252 1 252 1«1,'«β 1 252 3 1120 1 70 [На, η β 1 252 1 70 3 1120 Отсюда линейная система для определения коэффициентов запишется в виде -1 _i_-L _i_-L — -1 90 Cl "+" 252 С* "τ" 252 С> ~~ 30 ' ±_ , 3_ , _1_ _J_ 252 Cl ~Г 1120 С* "+" 70 С» — 90 ' J- J_JL !_ 3 _ ' 252С»_Г70С2'1 1120 С» — < 90' (10)
ЛИТЕРАТУРА К ШЕСТОЙ ГЛАВЕ 367 Решив систему (10), находим с, = ^^3,0401; Cl = c,=-^ = - 0,0562. Подставляя найденные значения величин с,, се, с, в формулу (9), получаем приближенное решение пашей задачи: φ (χ, у) = хг -\-у* + ху (1 — χ —у) [3,0401 — 0,0562 (х -\-у)]. Литература к шестой главе [1] Л. Коллатц, Численные методы решения дифференциальных уравнений, ИЛ, М., 1953, гл. 111 и IV. [2] И. А. Березин и Н. П. Жидков, Методы вычислений, т. 2, Физматгиз, М., 1959, гл. X. [3) С. Г. Ми χ ли и, Вариационные методы в математической физике, Гостехиздат, М., 1957, гл. III.
ГЛАВА VII ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ § 1. Основные виды линейных интегральных уравнений Под интегральным уравнением понимается уравнение, содержащее неизвестную функцию у (х) под знаком определенного интеграла [1 —15]. В дальнейшем мы ограничимся рассмотрением линейных интегральных уравнений, в которые неизвестная функция входит лишь в первой степени (линейно). Приведем некоторые наиболее часто встречающиеся типы интегральных уравнений. Уравнение вида ь \{<{x,s)y(s)ds=f(x), (1) а где К{х, s) (ядро) и f(x) — известные функции, называется интегральным уравнением Фредгольма первого рода. Уравнение вида ь у{х)--К \К{х, s)y{s) ds=f(x), (2) α где λ — числовой параметр, носит название интегрального уравнения Фредгольма второго рода. Параметр λ вводится по следующим соображениям: при данном значении λ интегральное уравнение (2) не всегда имеет решения. Варьируя параметр λ, можно добиться того, чтобы решение уравнения (2) существовало. Параметр λ можно также ввести в левую часть уравнения Фредгольма первого рода (1). Если в (2) /(χ)ξ0, то получается однородное уравнение ь y{x) = l\K(x,s)y(s)ds, (3) а допускающее нулевое (тривиальное) решение у = 0. Те значения параметра λ, при коюрых однородное интегральное уравнение (3) имеет
§ 1] ОСНОВНЫЕ ВИДЫ ЛИНЕЙНЫХ ИНТЕГРАЛЬНЫХ УРАВНЕНИЙ 369 нетривиальные решения, называются собственными значениями (собственными числами) ядра К(х, s) или соответствующего уравнения (2), а отвечающие им ненулевые решения—-собственными функциями. Основной результат теории следующий (теорема Фред- гольма) [10], [И]: 1) если λ не есть собственное значение ядра К{х, s), то соответствующее неоднородное интегральное уравнение Фредгольма (2) с регулярным ядром К(х, s) и непрерывным свободным членом f(x) имеет единственное непрерывное решение у(х) (as^x^b); 2) если же λ есть собственное значение, то неоднородное уравнение (2) ил» не имеет решений, или же допускает бесчисленное множество их. В приложениях важную роль играют уравнения Фредгольма второго рода с симметрическим ядром К(х, s), т. е. таким, что К(х, s) = AT(s, х). Симметрическое ядро обладает следующими свойствами (см. например [5], [11]): 1) для всякого симметрического ядра существует по меньшей мере одно собственное значение; 2) все собственные значения симметрического ядра действительны; 3) собственные функции φ (χ) и ψ(χ) симметрического ядра, соответствующие различным собственным значениям λ и μ (λ уЬ μ), ортогональны между собой на основном промежутке (а, Ь), т. е. ь \ о (χ) ψ (χ) dx = 0. а Пример. Пусть простой замкнутый кусочно-гладкий контур x = 4(t), y = y\(t) (O^t^T) (Г) ограничивает конечную область G. Тогда функция и(х, у), дающая решение соответствующей задачи Дирихле (гл. V, § 4), т. е. такая, что ΔίίΞΞΞ^ + ^ = ° "Ри (Х>У)€° и u=f(t) при (х,у)£Т (f(t) — известная функция), может быть представлена в виде [И], [16] U (X, у) = (j) μ (t) ^ dt, где θ (t, χ, у) = arctg }
370 ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ [ГЛ. VII и функция μ,(ί) удовлетворяет интегральному уравнению о ядро которого есть K{s, 0 —di«>retg6(()_6(s). В частности, например для эллипса χ-= a cos /, y = b sin tf (/» ^ α) будем иметь K(S' ^ = (α2 + b1) — (a2 — ft2) cos (s + i) ' В приложениях встречаются также интегральные уравнения вида X \K{x,s)y{s)ds=f{x) (4) a И ь у(х) — \\К (х, s) у (s) ds =/ (χ), (5) а которые носят названия интегральных уравнений Вольтерра соответственно первого и второго рода. Вводя функцию \К{х, s) при asgssSJc, О при s^>x, уравнения Вольтерра (4) и (5) можно записать в виде соответствующих уравнений Фредгольма с ядром /С* (х, s). Таким образом, теория уравнений Вольтерра сводится к теории уравнений Фредгольма; однако в некоторых случаях уравнения Вольтерра полезно изучать независимо. Примером уравнения Вольтерра первого рода является обобщенное уравнение Абеля JJ^ = /M (0 <«<!), (6) где f(x) — известная непрерывно дифференцируемая функция. Решение уравнения (6) дается формулой [2], [11]: „(Г!— 5{"аЧ/(°) | f /'(S)rfS 1 ϋ в чем можно убедиться непосредственно.
§2] СВЯЗЬ МЕЖДУ ДИФФ. УРАВНЕНИЯМИ И УРАВНЕНИЯМИ ВОЛЬТЕРРА 371 Заметим, что если ядро К(х, s) и f(x) — непрерывно дифференцируемые функции, причем К(х, х) φ 0 при as^x^b, то уравнение Вольтерра первого рода (4) сводится к уравнению Вольтерра второго рода (5). Действительно, дифференцируя уравнение (4) по х, будем иметь X К{Х, Х)У(х) + \К'х(Х. s)y(S)ds=:f'(X), отсюда где y(x)-\-\Ki(x, s)y(s)ds=fl(x) (a^x^b), Kx(x,s) f , . f(x) K\ (x, s) = -r-~. r. /ι(χ) — у/у y^ · Поэтому в дальнейшем мы не будем отдельно заниматься интегральными уравнениями Вольтерра первого рода. К линейным интегральным уравнениям может быть приведено большое количество задач математической физики. В основном, мы будем заниматься интегральным уравнением Фред- гольма второго рода, и частично, уравнением Вольтерра второго рода (для краткости в дальнейшем мы их будем именовать просто уравнениями Фредгольма и Вольтерра). Основными проблемами здесь являются следующие: 1) нахождение приближенного или точного решения неоднородного интегрального уравнения при заданном значении параметра λ; 2) нахождение собственных значений и соответствующих собственных функций однородного интегрального уравнения. § 2. Связь между дифференциальными уравнениями и уравнениями Вольтерра Рассмотрим линейное дифференциальное уравнение S + ρ W % + ч Wа =f Μ («<*<*). (υ при начальных условиях: и (а) = Α, ι{ (а) = В. (2) Полагая S*=yix)> (3)
372 ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ [ГЛ. VII после двукратного интегрирования получим χ α И χ s u=\ds\y (t)dt-f С, {х — a) -|~ C2. a a Изменяя порядок интегрирования в двойном интеграле, будем иметь χ ΐ λ; jc λ χ \ds\y {t)dt=\di\y{t)ds — \(x — f)y(t)dt=\(x — s)y(s)ds. a a at a a Кроме того, из начальных условий (2) при л; —α находим d = B, С* = А. Поэтому χ dJL^y{s)ds + B (4) а И χ и (х) = 5 (х — s)y (s) ds -f- В (χ — a) 4- Л. (5) α Подставляя выражения (3), (4) и (5) в дифференциальное уравнение (1), будем иметь интегральное уравнение Вольтерра X y{x) + lK(x, s)y(s)ds = F(x), (6) а где К(х, s)=p(x)^rq(x)(x — s) и F (х) =/(*) — β/7 (ж) — [β (ж — а) 4- Л] ^ М- Зная функцию _у (д;), можно найти по формуле (5) решение и(х) и ее производную к'(дг); таким образом, интегральное уравнение (6) включает в себя всю информацию, связанную с начальной задачей (задачей Коши) для дифференциального уравнения (1). Аналогичный результат получается для линейного дифференциального уравнения rt-го порядка [5J.
§ 3] СВЯЗЬ ЛИНЕЙНОЙ КРАЕВОЙ ЗАДАЧИ С УРАВНЕНИЕМ ФРЕДГОЛЬМА 373 Обратно, если ядро К(х, s) есть целый полином относительно s степени я, т. е. К(х, *) = j±am{x)sm, m = 0 то путем последовательного дифференцирования интегрального уравнения (6) мы придем к задаче Коши для некоторого линейного дифференциального уравнения. Пример. Решить интегральное уравнение X у {х) -f- \ (2 + χ — s)у (s) ds — 'х%. (7) о Последовательно продифференцировав два раза, будем иметь X У Μ + 2j> (х) + \у (s) ds = 2x (8) о и У(х) + 2У(*)+^(*) = 2. (9) Из уравнений (7) и (8) при л; = 0 получаем начальные условия: ^(0) = о, У(0) = о. Решая обычны:,! приемом дифференциальное уравнение (9), находим у (х) = 2 — 2е~х (1 + х). § 3. Связь линейной краевой задачи с интегральным уравнением Фредгольма Рассмотрим для самосопряженного дифференциального уравнения второго порядка L [у] =р (х)У' +р' (х)у' + q (х)у=/{х), (1) гце р(х), р'(х), q (χ), /(χ) непрерывны на [а, Ь] и р(х)^>0 при а^х£ζΰ, однородную краевую задачу (гл. IV, § 3) Г„ Ы Ξ α0 у (а) + α,/ (β) = 0, | rb[>] = p,j/(fc) + pIy(ft) = 0, | U (Kl + Kl^o. IPol + IPil^o). Определение. Функция Ο (χ, s) называется функцией Грина (функцией влияния) [4j, [11] краевой задачи (1) — (2), если выполнены следующие условия: 1) О(х, s) определена и непрерывна в области a^xs^b, as^ss^b; 2) Lx[G{x, s)] = 0 при x φ s\
374 ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ [ГЛ. VII 3) Γβ[0(α, s)] = 0, Tb[G(b, s)} = 0; 4) ОИя + O, s)-o;(s-0, s) = _-L. Если функция Грина G (χ, s) найдена, то решение краевой задачи (1)—(2) дается формулой ь y(x) = —\G{x, s)f(s)ds, (3) α что нетрудно проверить непосредственно. Можно доказать, что функция Грина О (х, s) симметрическая: О (х, s)=Q(s, χ). Рассмотрим теперь краевую задачу Штурма — Лиувилля (гл. VI, § 8) H*)y]'+to(*) + bp(*)].V = 0, (4) Γ„Ι/] = Γ6[),] = 0 (Р(х)>0, р(*)>0). (5) Интерпретируя Хр(х)у как свободный член, на основании формулы (3) непосредственно приходим к однородному интегральному уравнению Фредгольма ь у(х) = 1\К(х, s)y(s)ds, (6) а где К{х, s) = G(x, s)p(s). (7) Собственные значения λ задачи Штурма — Лиувилля, очевидно, будут являться собственными значениями интегрального уравнения (6). Уравнение (6) можно свести к интегральному уравнению с симметрическим ядром. Действительно, полагая ζ (χ) =j/ (х) ]/|T(F) в силу формул (6) и (7), будем иметь ь ζ (χ) = \\Κ* {х, s) z (s) ds, а где ядро **(*, s) = Q(x, s)Vi(x)VpW) симметрично. Следовательно, все собственные значения λ действительны.
§ 4] МЕТОД ПОСЛЕДОВАТЕЛЬНЫХ ПРИБЛИЖЕНИЙ 375 § 4. Метод последовательных приближений Рассмотрим уравнение Фредгольма ь у (х) =/(*) + λ \К(х, s)f(s) ds, (l) а где f(x) и К(х, s) непрерывны. Будем искать решение в форме степенного ряда 00 У(Х)= Σλ«φ„(χ). (2) Подставляя выражение (2) в интегральное уравнение (1) и приравнивая коэффициенты при одинаковых степенях параметра λ, будем иметь b Угг (X) = \К(Х, S) φ„_, (S) ds (Я = 1, 2, . . .)· (3) Пусть \K{x,s)\^Myi \f{x) I «S .V η области R {a^x^ b, as^ss^b]. Из формул (З) по индукции получаем <?n{x)\^M"N{b — a)n. (2) бу Поэтому сходимость ряда (2) будет обеспечена, если 1 ■М{Ь — а)' Приняв η у(х)^уп(х)= Σ λ*<Ρ*(*). * = о мы получим приближенное решение интегрального уравнения (1) с погрешностью ε„ =\У(Х)— уя(х)\<, СО < Σ U|*l<P*(*)l*s *=л+1 v " ' Формула (2) дает аналитическое относительно λ решение уравнения Фредгольма (1) в окрестности точки λ = 0. Из формул (3) вытекает,
376 ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ [гл. νπ что решение (2) можно записать в виде оо у (х) =/(*) + λ £ λ"-' I Kn (x, s)f(s) ds, n=\ a b y{x)=f{x)-\-\\R{x, s, \)f(s)ds, где R(X, s, λ)=2 λ-1 ЛГ„ (*, s). (5) (6) Коэффициенты К„ (х, s), так называемые итерированные ядра, могут быть последовательно найдены по формулам [11]: Κι(χ, s) = K(x, s), ь Кп (х, s) = \K (x, t) Kn^ (t, s) dt (я = 2, 3, ...). a Функция R(x, s, λ) называется резольвентой уравнения (1) и при малых |λ| определяется степенным рядом (6). Пользуясь аналитическим продолжением [17], резольвенту R (x, s, λ) можно продолжить на всю комплексную плоскость параметра λ, за исключением собственных значений λ,, λ2, ... (особые точки), которые являются полюсами резольвенты. Тогда формула (5) дает решение интегрального уравнения (1) при любом \~^z\h (А=1, 2, ...). Рассмотрим теперь соответствующее уравнение Вольтерра y(x)=f(x)+X\K{x, s)f(s)ds, а где a^x-^b. Полагая со аналогично предыдущему получим X %(х) = \К(х, s) ψ„_, (s)ds (я= 1, 2, ...). (7) (8) Отсюда Ιψ-Wl· MnN(b — a)n (я = 0, 1, 2, ...), Р)
§ 4] МЕТОД ПОСЛЕДОВАТЕЛЬНЫХ ПРИБЛИЖЕНИЙ 377 где \К{х, s)\*£.M при a^xs^b, asgss£& и ]/(*) |«SiV при as^xs^b. Следовательно, ряд (8) сходится при любом λ и дает единственное решение уравнения (7). Погрешность приближенного решения на основании оценок (9), дается формулой ι / \ ν t м^ νπ \l\kMkN(b — a)k '.=bw-^.wi< Σ ——м = Пример. Методом последовательных приближений найти приближенное решение уравнения о Полагая имеем <р0 (*)=.*, *(*)=Ьо + '* + . *=i-(io + *)in{i*f. о азом, в качестве первого приближения можно взят j/,(*)=* + x|'i-(io + *)in(i + -roT^)]· Здесь Ai=maxr7r-;——j— =0,1 10+ χ -f- s N= max x=\. Следовательно, ряд (10) сходится при I 0,1.(1-0) М< eu-a-c- -10·
378 ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ [гл. vn В частности, при λ=1 точность решения на основании (4) есть \у(х)-у, {х) К }1У}'^0,01. Заметим, что неудобством метода последовательных приближений является необходимость вычисления квадратур. Если интегралы не вычисляются точно, то приходится прибегать к численным квадратурным формулам. § б. Решение интегрального уравнения методом конечных сумм Метод основывается на приближенном вычислении определенного интеграла с помощью некоторой квадратурной формулы b η \F(x)dx = ^AlF{xi)-^R[F\, (1) α ί=Ι где x,(i=\, 2, ... , я)— абсциссы точек отрезка [а, b], Дг(1 = = 1, 2, ... , я) числовые коэффициенты, не зависящие от выбора функции F(х), и R[F\ — остаточный член (ошибка) формулы (1). η Обычно Ai^O и ^ А; — Ь — а. Например, в случае равноотстоящих точек xi = a-ir(i— 1)й (i=l, 2, ... , я), где h— г, п.— 1' будем иметь [18]: 1) для формулы прямоугольников: Ί/ = £Ξτ (i=l, 2, ... ,«—1), Д,=0; 2) для общей формулы трапеций: Л, = Л„ = у, Ai — A3 = ...= An_i — h; 3) для общей формулы Сим пеона при я = '2т -J- 1: Δ — Δ — Λ_ ^1 — ^2m+l — з ■ . . . _Ah Αϊ /1{ ... Л2И "J , . . _ . 2Λ Ά9 Α5 ■ · · Aim^ "g- . Другие квадратурные формулы см. в [16], [18], [19].
§ 5] РЕШЕНИЕ ИНТЕГРАЛЬНОГО УРАВНЕНИЯ МЕТОДОМ КОНЕЧНЫХ СУММ 379 Пусть теперь дано интегральное уравнение Фредгольма второго рода ь у(х) — Х\К{х, s)y(s)ds=f(x) (a^x^b). (2) α Выбирая точки xt ζ [α, b] и вводя обозначения: у (Х{) =yit χ (χ., xj) = Klh /(*«)=// ('. /='. 2 n\ на основании формулы (1) будем иметь п. У1-λ Σ А/КиУ/ =fi + Ri, (J = 1, 2, ... , η), (3) 7=1 где R; — соответствующие ошибки. Отбрасывая в системе (3) величины Ri для приближенных значений У,- решения у(х) в узлах Χι (1—1, 2, ... , η), получим линейную алгебраическую систему η У ι - λ Σ AjKtJ Yi=fi (1=1.2 «). (4) Вводя символ Кронекера: f 0, если г ^ Л 1' \ 1, если i—j\ и учитывая, что систему (4) можем записать в виде Σ (δ ι7 - ЩКи) Уj =h 0=1,2,..., «). (4') Если Δ (λ) = det (b:j — lAjKu) Φ 0, (5) то система (4') имеет единственное решение У',·, которое может быть найдено методом Гаусса или другими методами, разработанными для решения систем алгебраических линейных уравнений [18]. Найдя У;(г=1, 2, ... , ή), для решения у (х) получаем из уравнения (2) приближенное аналитическое выражение у с*) =/(*)+λ ς Α* (χ· xj) yj · (6)
380 Интегральные уравнения [гл. νιι Различные между собой корни \, Х2, ... ,1т (т^п) алгебраического уравнения Δ(λ)=Ό представляют собой, вообще говоря, приближения собственных значений ядра К(х, s). Если К,-' (ί — 1, 2, ...,«; k— 1, 2,..., т) — соответствующие ненулевые решения однородной системы Σ (8'V - KA,K,j) Yf = 0 (i = 1, 2, ... , л), (7) то собственные функции ядра приближенно определяются формулами η П (х) =** Σ AjK (χ> *)) ^ (A = 1, 2, ... , я). Оценка погрешности метода конечных сумм приведена в [16] и [19]. Заметим, что этот метод дает хорошие результаты, если ядро К(х, s) и правая часть f{x) достаточно гладкие функции. В противном случае полезно предварительно преобразовать соответствующим образом интегральное уравнение [19]. Метод конечных сумм может быть применен также к интегральному уравнению Фредгольма первого рода ь \\К{х, s)y(s)ds=f{x). а В этом случае приближенные значения У; решения у (х) (a =sg x «S Ь) в узлах д;,(г=1, 2, ... , и) будут определяться из системы η X^AjKtjYj^ft (i=l, 2, ...,я). (8) Особенно просто применение метода конечных сумм для решения интегрального уравнения Вольтерра второго рода. X у (х) — λ^Κ(χ, s)y(s)ds=f(x) (a^x^b), а которое можно рассматривать как уравнение Фредгольма второго рода (см. § 1). Здесь Ки = 0 при y>i, и, следовательно, соответствующая система (4) имеет вид i *Ί — λ Σ AiK4 YJ=fi 0=1,2,..., я). (9)
§ 5] РЕШЕНИЕ ИНТЕГРАЛЬНОГО УРАВНЕНИЯ МЕТОДОМ КОНЕЧНЫХ СУММ 381 Получилась линейная система с треугольной матрицей. Если 1—λΛ,.#„:£ О (i=l, 2, ... , я), (10) то из системы (9) последовательно находим: >Ί=/ι(ΐ —Х^/СмГ1, У„ = (/„ + λΛ,/Τ,ι П) (1 - λ<4,#„)Λ л—I У- = (Λ + λ Σ Λ-^ν ^) Ο - λΑ,*»»)-1· /=' Условие (10) при данном λ заведомо выполнено, если коэффициенты А] достаточно малы, чего всегда можно добиться. Пример. Методом конечных сумм найти приближенное решение интегрального уравнения ι y{x)^r\xe"y(s)ds = ex. (11) и Выберем узлы xl = 0l х*=-п-, -^з^^· Значения ядра К(х, s) — xexs и правой части f(x) = ex в соответствующих точках приведены в следующих таблицах: Таблица значений Кц W χ S ^\^ 0 1 у 1 0 0 0 0 I Τ 0,5000 0,6420 1,3592 I 1 1,6487 2,7183 Таблица значений /,· Xi ft 0 1 1 2 1,6487 1 2,7183 Используя квадратурную формулу Симпсона [18]: ι J F (х) dx ъ I [F (0) + 4F (1) + F (1)] , и
382 ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ [гл. νιι для определения приближенных значений Yi (i = l, 2, 3) решения у (х) в узлах xt получаем систему: у2_|_ 1 (0,5000Y, + 2,5680Г2+ i.3592 ^) = 1-6487; К3 +-jl (У, + 6,5948 К2 + 2,7183 Г3) = 2,7183; или после упрощений У' = 1; 1 1,4280 У2 +0,2265 У9= 1,5654; (12) 1,0991 Г2+1,4531 К3= 2,5516. J Решая систе.му (12), находим: Г,= 1; Уг = 0,930; У3 = 1,053. Приближенное решение можно выразить формулой χ У(х) = е* — ~ (1 +3,720^+1,053^). Заметим, что точное решение уравнения (11) есть как легко проверить непосредственно. § 6. Метод вырожденных ядер Определение. Ядро К(х, s) называется вырожденным, если оно может быть представлено в виде конечной суммы парных произведений: #(*.*)= Σ α<(*) β/00, (1) 1 = 1 где функции а,-(ж), так же как и функции (3; (s), (г=1, 2, ..., я), можно считать линейно независимыми. Для таких ядер интегральное уравнение Фредгольма второго рода ь y{x)^f{x)-\-\\K{x,s)f{s)ds (2) а решается весьма просто. Действительно, подставляя выражение (1) в уравнение (2), будем иметь j> (*)=/(*)+ *-£'<«,-(*). (3) (=1
§ 6] МЕТОД ВЫРОЖДЕННЫХ ЯДЕР 383 где ci = %(s)y(s)ds (i=l, 2, ..., η) (4) — некоторые постоянные коэффициенты. Если в выражение (4) подставить формулу (3), то для определения коэффициентов ci (i—1, 2, ..., я) получим алгебраическую систему линейных уравнений ь ь η ci = \^i{s)f{s)ds-{-l\^i{S) £ cj4.,{s)ds (i=l, 2 η), a a j=\ ИЛИ где b b α α Систему (5) можно записать в виде Σ(»ο—ЫС/=Л (i=l, 2, .... я), У=! где 8,-у — символ Кронекера. Обозначим через Δ (λ) определитель системы (5'): 1—λγπ — λγ21 ... — λγ„, — λγ12 1 — λγΜ ... — λγ„2 (5) (6) (5') A(X) = det(8v —λ7;/) = — λΤΐη ■ λΤ'2: 1 - λγ„„ и через Δ,-y (λ) (;,/'= 1, 2, ..., π)—· алгебраические дополнения соответствующих элементов δ,-, — λγ^,- определителя Δ (λ). Если Δ(λ)^0, то на основании правила Крамера [18] находим " Δ (λ) (i=l, 2 я). Следовательно, в силу (3) интегральное уравнение (2) имеет единственное решение j (*)=/(*>+* j; t^-fM^ (?) ί = ι у*-1
384 ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ [гл. vii Отсюда, подставляя вместо /· соответствующее выражение (6) и заменяя сумму интегралов интегралом суммы, получим ь У (х) = fix) + λ J -(jt^T f W ds> (8) a где η η Из формулы (8) вытекает, что функция 1 = 1 y=I есть резольвента интегрального уравнения (2). Собственные значения ядра К(х, s) определяются из уравнения Δ(λ) = 0. (10) Если \k (А==1, 2, ..., т\ т^п) есть корень уравнения (10) (очевидно, λΑ ^ 0), то соответствующие собственные функции ук (χ) ядра Λ" (ж, s), т. е. нетривиальные решения однородного уравнения ь y{x)—K\K{x,s)y (s) ds, а будут иметь вид ?*(*)=λ* Σ ^*W), где сЦ' — ненулевые решения линейной однородной системы Σ(8ν-λ*Τ>ί)^*,==0 0=1, 2, .... л). /=ι Если λ = Хй есть собственное значение ядра К(х, s), то неоднородное уравнение (2) или не имеет решений, или имеет бесконечно много решений. Пример 1. Решить уравнение ι у(х) = х* + Х $ (x + s)y(s)ds. (11) — I Ядро К{х, s) = X -f- s здесь, очевидно, вырожденное. Из уравнения (11) получаем y(x) = x't + Hclx-{-ct), (12)
§ 6] МЕТОД ВЫРОЖДЕННЫХ ЯДЕР 385 где с\ = \ У (s) ds, c2 = \ sy (s) ds. (13) Подставляя выражение (12) в формулы (13), будем иметь систему Сл = у -(- 2с2Х; — 2 С3 -д- ЛСц, (14) "3 Λ6ι- отсюда -т» ·. сй—' ^ '~τλΐ Следовательно, из формулы (12), если λ2 φ -j-, получаем решение у (х) = хг 2\х + -=- λ2 ~~ 3 — 4λ2 ~ (16) При λ'2= -j уравнение (11) решений не имеет. Пример 2. Найти собственные значения, собственные функции и резольвенту ядра К(х, s)=x-\-s в области: —l^x^l, —lsSss^l. На основании однородного уравнения ι у(х) = к \ (x-{-s)y(s)ds, имеем y(x)=X(clx-\-ci), .(16) где коэффициенты С] и с,2 определяются из системы (ср. (14)) си —2Хс,= 0; (17) (1ί 2 Приравнивая нулю определитель системы 1 — 2λ ^=-L· ι о
386 ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ [ГЛ. VII получим уравнение 1-ί-λ· = 0, ^ V5 Уз из которого находим собственные значения: λ1 = --^— и λ2= Чг-. Так как ядро К(х, s) симметрическое: K{x,s) = K(s,x), то собственные значения λα и λ2 действительны. Из системы (17) имеем с(*> — 2Х„ с(*> == О (А =1,2), откуда "2Х7 = -Т-==с()· Следовательно, на основании (16) собственные функции суть φι(*) = "ι0/'3*+ΐ) и φ4(ΑΓ) = ΙίΒ(—l/T-fH-1). где a4 = XftcW?tO (k =1,2). Собственные функции обычно нормируют, полагая й ^ ср! (ж) rfx = 1 (А = 1,2). α В нашем случае имеем ι и% \ (±хУ'3 + If dx = n%- 4 = 1. — I Отсюда можно принять и* = у (А =1.2), и следовательно, нормированные собственные функции суть е, (*) = 1 (1 + *}/~з), φα(л-)= ,j (i -хУъ). Из определителя (18) получаем соотнетствующие алгебраические дополнения: 2 , Δ„(λ)=1, Δ„(λ)=_ Δ„(λ) = 2λ, ΔΜ(λ)=1,
§ 6] мктод вырожденных ядер 387 причем Δ(λ)=1-4λ«. Поэтому, учитывая, что К(*, s) = α, (Χ) β, (.?) + а, (х) 8.г (я), где а1(х)=х, β,(5)=1, а3(л;)=1, |32(s) = s, на основании формулы (9) находим резольвенту ядра: , , 2 \ l-^ + (x + s) + 2\xs R(x, s, λ) = — (д;-(-2Хд;5 + -5- λ-)-s = -. . 1 - 4 λ2 V ' 1-5 I* о о Решение любого неоднородного уравнения I .V (■*)=/(*) +λ 5 (^ + s)j/(s)ats з при λ3 φ -j выражается формулой ι ί~ λ + (χ + s) + 2Xxs f(s)ds. Для приближенного решения общего интегрального уравнения ь y(x)=f{x)^X\K(x,s)y(s)ds, (19) а где функции f(x) и Λ"(λ:, s) для простоты будем считать непрерывными, ядро К (х, s) заменяют близким к нему вырожденным ядром *(Β,(*.*)=Σ««(*)Μ*)· Укажем несколько способов такой замены. Если ядро К (х, s) аналитическое по χ на отрезке [а, Ь], то в качестве вырожденного ядра Kw {x, s) можно нзять конечный отрезок ряда Тейлора: к" {*,*)= Σ<Δ^Γ^κ*™(χ°>8)>
388 ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ [гл. νπ где хй— некоторая точка отрезка [а, Ь]. Аналогичный прием можно применить также, если К (х, s) аналогична по s иа отрезке [а, Ь]. Для построения вырожденного ядра можно также использовать конечный отрезок двойного ряда Тейлора [20J: η η Kw (x, s) = Σ Σ аРЯ (χ — χ·)" (У -JO)', где 1 др+9 аря =ρ^ς щг^г κ(χ»> у ο) С*о, JO E К b})- Пусть l=b — а. Непрерывное ядро К (х, s) допускает аппроксимацию тригонометрическим полиномом периода 2/ [20]. Например, можно положить η К{п) (х, з) = ~а, (s) + ^ % (s) cosP~ , (20) где ap(s) (/7 = 0, 1, 2,...) — коэффициенты Фурье: ap (s) = j f К (x, s) cos p~- dx. (21) a Аналогичное разложение получается, если поменять ролями переменные χ и s. Можно также использовать конечный отрезок двойного ряда Фурье [20]. Полагая, например, η аР (s) ^ ~2 ар о + 2- аР9 cos~f' 0> = °> *, 2, ..., я) из формул (20) и (21) имеем η η к[п) (χ, s)={«оо+12 >cos -ψ-+ΐ 2 β°'cos Ψ+ η η + Ζ 2 αρ«cos ι cos г · где » ft apq — ~p 1 1 ^^' ^ cos^7^ C0S ^7~ ^ ^s· о а
§ 6} МЕТОД ВЫРОЖДЕННЫХ ЯДЕР 389 Наконец, полагая h= ~ , xi = aArih (i = 0, 1, 2, ..., я), можно воспользоваться первым интерполяционным полипомом Ньютона [18] по х: η К[п) (х, s) = K(xu, s) + 2 {Х~Хо) {Х~*1\т (х~Хт-1] ЬтК(х„, s). Аналогично можно взять первый интерполяционный полином Ньютона по s. Иногда целесообразно использовать интерполяционный полином Ньютона для функции двух переменных [18]: '+iT«Ap + 2 *(*„,.*:,) K^(x,s) = Kw(Xo,x0)+ 2 -"p\q\k^ С*-*»)- ... (χ — χρΛ) (у —уо) ... О —JVi)· где х0 ζ [а, Ь]. Употребляются и другие приемы интерполирования и аппроксимирования ядра К(х, s). Если К^ (х, s) есть приближенное вырожденное ядро для точного ядра K(x,s) и функция f^{x) также близка к / (х), то решение zn (х) интегрального уравнения ь гп (х) =Л (х) + ^\К{п) (х, s) zn (s) ds (я = 1, 2,...) (22) α можно рассматривать как приближение решения у (х) уравнения (19). Как показали Л. В. Канторович и В. И. Крылов, справедлива следующая оценка погрешности [16]: пусть ь \ \ К{Х, s) - К(п) (X, s)\ds^ г, !/(*)—/„(*) I < § a и резольвента Rn (x, s, λ) для уравнения (22) такова, что ь \\Rn(x, s,X)\ds*£Mn(X) а при а^х^Ь'у причем выполнено неравенство: ? = |λ|β[ΐ + |λ|Λΐ„(λ)]<ΐ;
390 ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ [гл. vu тогда уравнение (19) имеет единственное решение у (х) и (23) где Λ/Ξ2= max \f(x) | па [а, Ь]. ζ (χ) = 1 + Ц! + Λ2+ ^γ- * (s) <**· Следовательно, где г (ж) = 1 + с1 + сгх* + сз·^4, 2 с, = ^ 2· (ж) dx, о 2 с2 = — 5 λγ2·2: (·*) dx, о сг = j^ xiz (x) dx. (24) Из оценки (23) вытекает, что если Kw (x, s)zz;K(x, s) и /„ (χ)zz: f(x) при я — со, причем Λί„ (λ) ^M(k)<^-\- со, то 2η (χ)~ zz:y(x) на [α, b]. Пример 3. Приближенно решить уравнение ι_ 2 j/ (ж) — \е~ x2s2 у (s) ds = 1. о Пользуясь известным разложением, ядро К(х, s) = e-xSsS1 приближенно заменяем вырожденным ядром Kw(.*,s)=l— xV + ^f-. Отсюда вместо уравнения (24) получаем уравнение ι (25) (26) (27)
§ 7] МЕТОД КОЛЛОКАЦИИ 391 _ 1 , 1 . 1 1 с1 — ^ "+" у с1 "Г -од" С'2 "Г "Тип сз, На основании формул (26) и (27) имеем систему 1 2 24 "320" С' ~Ь 1792 с3 = 24 г^ 160 1 24 Ci 160 1 1 С2 — 896" Ч' 320 ;<V 9216 с8- (28) Решив систему (28), получим с,= 0,9930; cs = —0,0833; с8= 0,0007. Следовательно, j/ (л:) ъ* ζ (χ) = 1,9930 — 0,0833л:- + 0,0007ж4 (0 s£ χ = 2У (29) Оценку погрешности приближенного решения (29) можно произвести по формуле (23), но это связано с громоздкими вычислениями. § 7. Метод коллокации Рассмотрим интегральное уравнение ь R \у] =у (χ) — λ\Κ(χ, s)y (s) ds —fix) = 0. (1) Будем искать приближенное решение уравнения (1) в виде функции определенного вида Уп = ®(х,сьсь...,сп) (2) со свободными параметрами с1: сп (неопределенные коэффициенты). Подставляя выражение (2) в уравнение (1), получим невязку R[V«]= Уп С*) - λ \К{х, s) Yn (s) ds-f{x). (3) Если у является точным решением, то, очевидно, невязка Щу~\ = 0. Поэтому стараются подобрать параметры сь съ ..., сп так, чтобы невязка ^[Уп1 была бы в определенном смысле возможно малой. Минимизировать невязку /?[К„] можно различными способами. Например, используют приемы, аналогичные тем, что применяются для решения краевых задач дифференциальных уравнений (гл. IV, §§ 6—8). Здесь и в дальнейших параграфах мы рассмотрим некоторые методы минимизации невязки /?[У'Л], применяемые на практике. Обычно для простоты выкладок берут функцию Yn, линейно завися-
392 ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ [ГЛ. VII щую от параметров сь съ ..., сп. Найдя параметры сь съ ..., сщ получают приближенное решение (2). Отметим одно обстоятельство. Если невязка R [ Уп] получилась малой, то она близка к невязке R \у] = 0, даваемой точным решением у. Но если два оператора R[Yn] и R\y] имеют близкие значения, то отсюда, вообще говоря, не следует, что функции Уп и у близки между собой в обычном смысле (например, в смысле равномерного приближения (гл. 1, § 12)). Поэтому возникает математическая задача: по известной невязке R [ Уп] оценить погрешность \у — Yn\ приближенного решения Υη. Эта трудная проблема связана с глубокими теоремами функционального анализа [16], [22], и мы ее оставим без рассмотрения, ограничившись лишь некоторыми указаниями частного характера. Другой математический вопрос, который здесь также не затрагивается, — это вопрос сходимости Υη к точному решению^ при я —-> оо, т. е. выяснение условий, при которых имеет место предельное равенство lim Yn =у. (4) я-юэ Если справедливо равенство (4), то данным методом решение у можно найти с любой степенью точности, взяв достаточно большое число параметров си са, ..., сп. Перейдем теперь к изложению одного из конкретных методов построения приближенного решения Υη. Положим η ΪΉ (*) = ?»(*)+Σ СЫ*). (5) где φ0 (χ), Φ[ (χ), ..., φ„ (χ) — известные функции (координатные функции) и с1; с2, ..., сп — неопределенные коэффициенты; причем функции φ,- (х) (/=1, 2, ..., η) линейно независимы. Заметим, что в частности, можно полагать ψ0(χ) = 0. Подставляя выражение (5) в левую часть уравнения (1), получим невязку η R[yB] = ъ (*) + Σ ст (*) —/(*) — b η — \\k(x,s) [φ0 (s) + 2 cm (s)] ds> a 1=1 ИЛИ η R [ у η (*)] — ψ. С*, λ) + Σ etii (χ·λ)· (6) i-1
§ 7] МЕТОД КОЛЛОКАЦИИ 393 где ь φ0 (χ, λ) = φ0 (Χ) — / (χ) — λ \ Κ (Χ, S) φ0 (S) ds, b a \ (7) ψ, (Χ, λ) = φ( (*) — λ \Κ (Χ, S)<?i(s)ds 0=1,2,..., /Ι). Согласно методу коллокацпа [23] (ср. гл. IV, § 6) требуем, чтобы невязка R[Y„(x)] обращалась в нуль в заданной системе точек Xj(j=\, 2, ..., я) из отрезка [д, Ь] (точки коллокащш), т. е. полагаем, что Я[Уп(*,)] = 0 (/=1.2,...,я), где α ==Ξ *ι 02 <.. .<χ„..| 0„ < b. Отсюда, па основании формулы (6) для определения коэффициентов с1; съ ..., сп получаем алгебраическую линейную систему уравнений η Σ cib (XJ· λ) = — ψβ [Xj, λ) (7=1,2,..., «). (8) Если определитель системы (8): £> (λ) = det [.(>,(*,, λ)]^0, то из системы (8) можно однозначно определить величины сь е2,... ..., с„ и, следовательно, найти приближенное решение Υη (χ) по формуле (б). Приравнивая нулю определитель D (λ), получим уравнение £>(λ) = 0, из которого, вообще говоря, можно найти приближенные значения λΑ (ft=l, 2, ..., я) первых собственных чисел ядра К(х, *')· Если положить /(*)== о, ftM = o, x=Xto то вместо системы (8) будем иметь однородную систему η Σ ~cl'\ (■»/■ Χ*) == 0 (/=1,2 η). (9) Найдя ненулевые решения с^ (1=1, 2, ..., п) системы (9), получим для ядра К(х, s) приближенные собственные функции y£V)= Σ 2ί*> *,(*), /= I отвечающие его собственному значению λΛ еы kk.
394 ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ [ГЛ. VII Пример. Методом коллокации решить уравнение ι yW—$P+hds=xaicigi;· (10) о Положим У(х) = с1-\~с1х. Подставляя это выражение в уравнение (10), получим невязку R[Y{x)]=—clx arctg l- + с21 x — у + ~ In (1 -f- ^ή\ — x arctg -. Выбирая точки коллокации х1 = 0, х.2 = 1. и учитывая, что lim χ arctg— = 0, lira χ1 In j 1 -f- -2) = 0, для определения коэффициентов С[ и с2 будем иметь систему: О · с, 2~ с-2 = °> ) Отсюда получаем е2 = 0, Ci =—1. Таким образом, У = —1. (И) Найденное приближенное решение (11), как легко проверить является точным. § 8. Метод наименьших квадратов Для уравнения ь R\y]=y(x) — X\K(x, s)y(.s)ds—/{x) = 0 (1) а аналогично методу коллокации (§ 7), полагаем гл*)=?.(*) +Σ <№(*), (2) ι= Ι где <р0(лт), ?i W. ···> fiiW — известные функции и сь съ ..., с„ — неопределенные коэффициенты, причем φ; (л;) (г=1, 2, ..., п) линейно независимы. Подставляя (2) в левую часть уравнения (1), получим невязку R[yB] = b(x, λ)+Σ<νΜ*. λ)> (3)
§ 8] МЕТОД НАИМЕНЬШИХ КВАДРАТОВ 395 где ψ0(χ, λ) и ψ; (χ, λ) (ί=\, 2, ..., η) определяются формулами (7) § 7. Согласно методу наименьших квадратов [16], [19], [24] (ср. гл. IV, § 7), коэффициенты с,- (i=l, 2, ..., я) отыскиваются из условия минимума интеграла i==\\R\Yn\Ydx=\[%(x, Х) + |>гЫ*> *)]·<**■ (4) Это требование приводит к алгебраической системе уравнений ^■=0 (/=1,2 я); (5) отсюда на основании (4), дифференцируя по параметрам сь ct,...,cn под знаком интеграла, будем иметь ь η a i= I C/=l, 2, ..., л). (6) С помощью сокращенных обозначений ь (ψ„ «!>,·) = $ «Μ*, λ) «!>,-(*, λ) А* (7) α систему (6) можно записать в виде нормальной системы способа наименьших квадратов (гл. 1, § 6): Cl (ψΐ, ψΐ) + СЯ (ψ,, ψϋ) + . . . + cn (ψΐ> ψη) = — (tl. to)'> Μψϊ. φι) + C„ (ψβ, ψ,)+... + «»(ψ* ψ„) = — (ψ* to)'- ΜΨ«, ψι) + ^(ψ«, Ψ*) + ... +*„(ψ„. ψ„) = —(ψ„, to). ] (8) Заметим, что если <р0(л;) = 0, то ψ0(χ) = —/(х), и следовательно, — (ψί. Ψο) = (Ψί· /) (i=l. 2, ..., η). Так как (Φ(. Фу) = (Фу. Ψ<). то матрица системы (8) симметрическая. Вместо интегрального метода наименьших квадратов можно воспользоваться точечным способом наименьших квадратов (гл. I, § 3). Метод наименьших квадратов применяется также для приближенного нахождения собственных значений и собственных функций ядра К{х, s), аналогично тому, как это делается для метода коллока- ции (§ 7). А именно, полагая /(л;) = 0и φ0(Λτ) = 0, откуда ф„(л;) = 0, определяем приближенные значения собственных чисел из алгебраического уравнения <И(Ф;. Ф/)]=0. (9)
396 ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ [ГЛ. VII После этого приближенные собственные функции находятся из однородной системы (8), где вместо λ подставлено соответствующее приближенное значение. Пример. Методом наименьших квадратов найти приближенное решение уравнения ι у(х) = хг^- (J sh (χ -f- s)y (s) ds. (10) —Ί Для первого приближения полагаем Υ — сх -\- с.2х -|- х%. Отсюда <Pi(*) = l, <fi(x) = x, ψ0(χ) — χ*· Учитывая, что \ sh (x -\-s)ds = a sh x, \. s sh (x -)- s) ds = b sh x, — ι — ι ι { s1 sh (x -\- s)ds — c sh x, — I где α = 2 sh 1 = 2,3504; b = 2e"1 = 0,7358; с = 6 sh 1 — 4 ch 1 == 0,8788, иа основании формул (4) и (7) из § 7 имеем ψι=1—ash χ; <^ = х — b ch χ; ψ0 =—-cshjc. Далее находим (ψ„ ψ,)-- = 2 +α* (5^-1) = 6,4935; (ψ* Ψ*) = |"1-^(^ +l) = 2,1896; (ψι, ψ.2) = —4(ae~I + ^shl) = —8e-'shl =—3,4586; (ψ„ ψ„) = ас (^—l) = 1,6800; (ψ,, ф0) = — 2се-, = —0,6466. Получаем систему для определения коэффициентов с, и с2 6,4935ci —3,4586еа = — 1,6800; \ — 3,4586^ + 2,1896с2 = 0,6466. J Отсюда получаем «! = — 0,5423; с3 = —0,5613. Таким образом, Υ — χ'1 — 0,561Ъх — 0,5423. (11)
§ 9] МЕТОД МОМЕНТОВ 397 Так как для уравнения (10) ядро К(х, s) = sh (a -j- s) = sh χ ch s -|- сli Л" sh 9 вырожденное, то легко получить точное решение у (а) = χ2 -j- α sh a- -j- p ch x, (12) где 6 sh 1 — 4 ch i^L = — 0,6821; β = α(^—l] = —0,i>548. - ,_(*,). ■ - · . ■ I. /■ Из сравнения формул (11) и (12) заключаем, что приближенное решение Υ близко к точному у, если |л*| — малая величина. На копнах а= ± 1 расхождение \у—Υ\ довольно значительно. § 9. Метод моментов Пусть ь R[y]==y(x) — \\K(x, s)y(s)ds—f(x) = 0. (1) О Аналогично предыдущему (§ 8), будем искать приближенное решение уравнения (1) в виде конечной суммы η Υη (а) =/(*) + Σ c#i (*) («= 1, ^ ... «), (2) где у ι (χ) 0 = 1, 2, ..., я)— некоторые известные линейно независимые функции (координатные функции) и clt с2 с„ — неопределенные коэффициенты. Подставляя выражение (2) в левую часть уравнения (1), получим невязку η Ь Ь R [ У Δ = Σ CJ [b (*) - λ \κ (χ> s) fj (s) tfs] — λ 5 *(*, s)/(s) tfs. (3) Согласно методу моментов [16], [19], [24], коэффициенты сг (i== 1, 2, ..., я) определяются из условия ортогональности невязки ко всем координатным функциям φ, (α), φ4 (а), ..., ср„ (а). Это дает систему уравнений б $fl[rn]<Pi(*)d* = 0 0 = 1. 2 «),
398 ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ [ГЛ. VII или в силу (3) η Σ CJ К" -λΜ = λϊ<- ((=1,2,..., η), (4) /=ι где 6 ь ь *tj = $ «Pi (*) «Py (*) dx, $υ — \dx\K{x, s) φ,- (χ) <fj (s) ds, a a a Ь b Ь = \dx \K(■*> s) 9i (*)/(s)ds- a a Если определитель системы (4) D(X) = det(a/y-Xpv) отличен от нуля, то из этой системы можно однозначно определить коэффициенты с,, съ ..., сп. Тогда формула (2) даст приближенное решение интегрального ураинепия (1). Из уравнения Ζ3(λ) = 0 приближенно находятся собственные значения Хь λ.2, ..., λη ядра К(х, s). Найдя ненулевые решения однородной линейной системы η Σ ~cj («U - λ*Ρν) = ° (t = 1, 2, ..., я), j=l легко построить (см. § 6) приближенные собственные функции yw х, отвечающие данному собственному значению λΛ. Заметим, что метод моментов по идее совпадает с методом Галеркина (гл. IV, § 8). Можно показать [16], [19], что метод моментов равносилен замене ядра К(х, s) некоторым вырожденным ядром AT1"' (x, s). Поэтому для приближенного решения Υη (χ) имеется оценка погрешности, аналогичная приведенной выше (§ 6) [16], [19]. Пример. Найти первые два собственных значения интегрального уравнения ι R\y]=y(x) — k\K{x, s)y(s)ds=0, о где < s, если s^x; К(х, s) = \ . (5) [л:, если s^> χ. ν ' На основании (5) имеем χ ι К \У\ =У (x) — ^{\sy (s) ds-\-\xy (s)ds].
§ 9] МЕТОД МОМЕНТОВ 399 Положим K=CiX-)-c2x'2. Тогда Ортогонализируя непязку R[Y\, будем иметь систему ι \R[Y]xdx=0; \R[Y]x4x = 0; [( "з ι - ΑΛ . I 2 4 6 ΰ 1 1 ' 6 ■ 6 3" ' 4 12 " 6 Γ2 ij = o. После упрощения получим систему С!(120 —48Х)4-са(90 —35λ) = 0; ^ с{ (630 — 245λ) -f е2 (504 — Ι80λ) = 0. J (6) Приравнивая нулю определитель системы (6), получим уравнение для определения собственных значений: D (λ) ξ = 0. 120 — 48λ 90 —35λ 630 —245λ 504—180λ Отсюда 65λ2—1692Χ + 3780 = 0, или λ'2 —26,03λ + 58,Ι5 = 0. Из уравнения (7) будем иметь λ, = 2,462; λ3 = 23,568. Для сравнения укажем точные собственные значения λ, = ^ = 2,467 и λ2 = ^ = 22,206, полученные из решения соответствующей краевой задачи у + Ху = 0, j/(0) = 0, У(1) = 0. (Ό
400 ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ [гл. vii Таким образом, погрешность λ, равна примерно 0,2%, а λ3 — 6%. В заключение заметим, что рассмотренные методы минимизации невязки (§§ 7—9) применимы также к решению нелинейных интегральных уравнений. Имеются также другие методы решения интегральных уравнений, например метод Монте-Карло [25]. Литература к седьмой главе [1] Г. Виарда, Интегральные уравнения, ГТТИ, 19ЭЗ. [2] Э. Г у ρ с а, Курс математического анализа, т. III, ч. 2, ГТТИ, 1934, гл. XXX—ΧΧΧΙΠ. - [3J Н. М. Г ю н τ е р, Основы математической физики, ч. 1, Интегральные уравнения, Кубуч, 1931. [4] Р. Курант, Д. Гильберт Методы математической физики, т. 1, ГТТИ, 1933, гл. III. 5] У. В. Л о в и τ τ, Линейные интегральные уравнения, ГТТИ, 1933. 6] С. Г. Μ их л ни, Интегральные уравнения, изд. 2, Гостехиздат, 1949. [7] Φ. Μ. Μ ο ρ с, Г. Фешбах, Методы математической физики, т. I, ИЛ, 1958, гл. 8. [8] Н. И. Μ у с χ е л и ш в и л и, Сингулярные интегральные уравнения, Гостехиздат, 1946. [91 Г. М. Мюнц, Интегральные уравнения, т. I, ГТТИ, 1934. [10] И. Г. Петровский, Лекции по теории интегральных уравнений, Гостехиздат, 1951. [11] И. И. Привалов, Интегральные уравнения, ОНТИ, 1935. [12] В. И. Смирнов, Курс высшей математики, т. 4, Гостехиздат, 1941, гл. II. [13] Н. С. Смирно в, Введение в теорию нелинейных интегральных уравнений, ОНТИ, 1936. [14] Φ. Τ ρ и к о м и, Интегральные уравнения, ИЛ, I960. [15J Е. Т. У и τ τ е к е р, Г. Н. Ват с он, Курс современного анализа, ГТТИ, 1933, ч. I, гл. П. [16] Л. В. К а н τ ο ρ о в и ч, В. И. Крылов, Приближенные методы высшего анализа, изд. 3, Гостехиздат, 1949, гл. II. [17] А. И. Марку шевич, Краткий курс теории аналитических функций, Гостехиздат, 1957, гл. IX. [18] Б. П. Демидов и ч, И. Α. Μ а р о н, Основы вычислительной математики, Физматгиз, 1960, гл. XVI, VIII, XIV. [19] И. С. Б е ρ е з и н, Н. П. Жидков, Методы вычислений, т. I, т. II, Физматгиз, гл. 10, 1959. [20] Г. М. Фихтенгольц, Курс дифференциального и интегрального исчислений, Гостехиздат, 1948—1949, т. II, гл. II; т. III, гл. XIX. [21] Э. У и τ τ е к е р, Г. Робинсон, Математическая обработка результатов наблюдений, ГТТИ, 1933, гл. X, XV. [22] С. Г. Μ их лин, Вариационные методы в математической физике, Гостехиздат, 1957. [23] Л. К о л л а т ц, Численные методы решения дифференциальных уравнений, ИЛ, 1958, гл. V. [24] Г. Н. Положив и др., Математический практикум, Физматгиз, I960, гл. 7. 25] Э. Д. Бут, Численные методы, Физматгиз, 1959, гл. XI!.