Текст
                    JL оnij л я рны е лекции
ПО МАТЕМАТИКЕ
Н.Я. В ИЛЕНКИН
МЕТОД
ПОСЛЕДОВАТЕЛЬНЫХ
ПРИБЛИЖЕНИЙ

ПОПУЛЯРНЫЕ ЛЕКЦИИ ПО МАТЕМАТИКЕ В Ы П У С К 35 Н. я. ВИЛЕНКИН МЕТОД ПОСЛЕДОВАТЕЛЬНЫХ ПРИБЛИЖЕНИЙ ИЗДАНИЕ ВТОРОЕ, ПЕРЕРАБОТАННОЕ И ДОПОЛНЕННОЕ ИЗДАТЕЛЬСТВО «НАУКА» ГЛАВНАЯ РЕДАКЦИЯ ФИЗИКО-МАТЕМАТИЧЕСКОЙ ЛИТЕРАТУРЫ моек В А 1 9 в S
518 В 44 УДК 512737 АННОТАЦИЯ В этой книге в популярной форме рассказы- вается о методах приближенного решения алгеб- раических, тригонометрических, показательных и других уравнений. Книга рассчитана на учеников старших классов, учащихся техникумов, учителей математики и лиц, сталкивающихся в практиче- ской деятельности с решением уравнений. По ходу изложения в книге вводятся некоторые элементар- ные понятия высшей математики. К книге прило- жено 27 упражнений и их решения. Наум Яковлевич Виленкин Метод последовательных приближений (Серия «Популярные лекции по математике») М., 1968 г., 108 стр. с илл. Редактор В. М. Гринберг Техн, редактор Л. А. Пыжова Корректор С. Д. Кайсер Сдано в набор 27/Х 1967 г. Подписано к печати 26/1 1968 г. Бумага 84x108732. Физ. печ. л. 3,375. Условн. печ. л. 5,67. Уч.-изд. л. 4,63. Тираж 100 000 экз. Т-00023. Цена книги 15 коп. Заказ № 3569 Издательство «Наука» Главная редакция физико-математической литературы Москва, В-71, Ленинский проспект, 15. 2-2-2 146-68 Москва, Г-99, Шубвнскжй пер., If
СОДЕРЖАНИЕ Предисловие ко второму изданию .............................. 5 Предисловие к первому изданию................................ 5 § 1. Введение............................................... 7 § 2. Последовательные приближения......................... 10 § 3. Ахиллес и черепаха.................................... 13 § 4. Деление на электронных вычислительных машинах ... 16 § 5. Извлечение квадратных корней методом последовательных приближений................................................ 18 § 6. Извлечение корней с натуральным показателем по методу последовательных приближений. ............................. 25 § 7. Метод итераций........................................ 28 § 8. Геометрический смысл метода итераций.................. 31 § 9. Сжимающие отображения................................ .33 § 10. Сжимающие отображения и метод итераций................ 37 § 11. Способ хорд........................................... 43 § 12. Усовершенствованный способ хор:;...................... 48 § 13. Производная от многочлена . 49 § 14. Метод Ньютона приближенного решения алгебраических уравнений.................................................. 51 § 15. Геометрический смысл производной...................... 55 § 16. Геометрический смысл метода Ньютона................... 57 § 17. Производные любых функций............................. 59 § 18. Вычисление производных................................ 61 § 19. Нахождение первых приближений......................... 64 § 20. Комбинированный метод решения уравнений............... 66 § 21. Признак сходимости процесса итераций.................. 68 § 22. Быстрота сходимости процесса итераций ................ 72 § 23. Решение систем линейных уравнений методом последова- тельных приближений ....................................... 74 •| * 3
§ 24. Решение систем нелинейных уравнений методом последо- вательных приближений..................................... 80 § 25. Видоизмененное расстояние................... 82 § 26. Признаки сходимости процесса последовательных прибли- жений для систем линейных уравнений..................... 85 § 27. Последовательные приближения в геометрии. 91 § 28. Заключение........................................................ 94 Упражнения................................................................ 96 Решения .................................................................. 98
ПРЕДИСЛОВИЕ КО ВТОРОМУ ИЗДАНИЮ Во втором издании книга подверглась переработке. Метод итераций изложен теперь на основе понятия сжима- ющего отображения, что позволило рассказать о нем до введения понятия производной. Значительно расширена часть книги, касающаяся приближенного решения систем уравнений. Наконец, все задачи снабжены решениями. ПРЕДИСЛОВИЕ К ПЕРВОМУ ИЗДАНИЮ Основной целью этой книги является изложение различ- ных методов приближенного решения уравнений. Их прак- тическая ценность неоспорима, однако им уделяют мало внимания как в средней, так и в высшей школе. Поэтому часто бывает так, что человек, прослушавший курс выс- шей математики во втузе, испытывает затруднения при не- обходимости решить простейшее трансцендентное урав- нение. С решением уравнений сталкиваются не только инженеры, но и техники, рабочие-рационализаторы и пред- ставители многих других специальностей. Знакомство с методами приближенного решения уравнений полезно и для школьников старших классов. Поскольку большинство методов приближенного реше- ния уравнений связано с понятием производной, нам пришлось ввести это понятие. При этом в основу были по- ложены наглядные геометрические соображения. Таким образом, для чтения этой книги достаточно знаний по ма- тематике в объеме девяти классов средней школы. 5
При составлении книги была использована лекция, прочитанная автором для школьников 9—10-х классов, занимавшихся в школьном математическом кружке при Московском государственном университете им. М. В. Ло- моносова. Материал этой лекции был применен учителем средней школы г. Москвы № 425 С. И. Шварцбурдом для внеклас- сной работы с учениками 9-х классов. Автор выражает бла- годарность С. И. Шварцбурду за предоставление разрабо- танных им заданий на решение уравнений методом ите- раций, использованных при написании этой книги. Автор выражает глубокую благодарность В. Г. Бол- тянскому, замечания которого существенно способствова- ли улучшению первоначального варианта рукописи.
§ 1. ВВЕДЕНИЕ При изучении математики в школе очень много времени затрачивается на решение уравнений и систем уравнений. Сначала это уравнения первой степени и системы таких уравнений. Потом появляются квадратные, биквадратные и иррациональные уравнения. Наконец, школьник зна- комится с показательными, логарифмическими и триго- нометрическими уравнениями. Такое внимание к уравнениям не случайно. Оно объяс- няется важностью уравнений для приложений математи- ки к практике. Какую бы область приложений ни взять, чаще всего для получения окончательного ответа прихо- дится решать уравнения или системы уравнений. При обучении в школе к уравнениям часто прибегают для решения физических задач. Рассмотрим, например, такую задачу. В колодец брошен камень. Найти глубину колодца, если звук от падения камня услышан через Т секунд после па- дения. Если обозначить глубину колодца через х, то для опре- деления х получаем уравнение 1/^+* Г g ' V ’ _ где v — скорость распространения звука в воздухе ( — время падения камня и — — время, за которое до нас дой- дет_звук падения). Это иррациональное уравнение. Полагая Vх — у, сведем его к квадратному уравнению 4-+К|»-г=о, которое решается по известной формуле. 7
Уравнения применяют и для решения геометрических задач. Например, задача о делении отрезка АВ длины I в среднем и крайнем отношении (то есть на такие отрезки АС и СВ, что АВ: АС = АС : СВ) приводит к решению квадратного уравнения х2 + lx — I2 = О, где через х обозначена длина отрезка АС. К более сложному уравнению сводится задача о деле- нии угла а на три части. Это уравнение имеет вид 4х3 — Зх — cos а = О, где х = cos Такие уравнения, называемые кубически- ми, в школе не изучают, но в курсе высшей алгебры дока- зывают, что и для кубических уравнений есть формула ре- шения (см. ниже формулу (3)). Часто, однако, в физике возникают задачи, приводя- щие к более сложным уравнениям, для которых не только в средней школе, но и в университете не дают формул ре- шения. Возьмем, например, железный стержень (или, как говорят техники, балку) и наглухо заделаем его концы. Если ударить по такому стержню, он будет совершать по- перечные колебания. Как доказывают в математической фи- зике, чтобы найти частоту этих колебаний, надо решить уравнение (1) COS X 1 v 1 где г — 2,71828... В школе никаких правил для решения такого уравне- ния не дают. Не следует думать, что это объясняется крат- костью школьной программы по математике. Формулы для решения уравнения (1) в том смысле, как это понимают в школе, вообще не существует. Уточним это утверж- дение. Говорят, что для некоторого уравнения существует формула решения, если его корни можно выразить через входящие в уравнение величины при помощи арифметиче- ских операций, извлечения корней, показательной, лога- рифмической, тригонометрических и обратных тригономет- рических функций. В этом смысле у квадратного уравнения 8
х2 + рх + q = 0 есть формула решения, имеющая вид х=—-у± ]/ (2) Есть формула и для решения кубического уравнения*) х3 + рх + q = 0. Она имеет вид х - +i/qz/FTg. (3) Однако практическое применение формулы (3) наталки- вается на ряд трудностей и требует использования комплек- сных чисел. Существует формула и для решения уравнений четвер- той степени, но настолько сложная, что мы ее не будем при- водить. Для уравнений пятой и высших степеней дело обстоит хуже. В 1826 г. норвежский математик Абель доказал**), что при п>5 не существует формулы, выражающей ре- шение алгебраического уравнения ОоХ" + а^х11-1 + ... + ап = 0 при помощи арифметических операций и извлечений кор- ней. Лишь для некоторых частных случаев алгебраиче- ских уравнений, степень которых больше четырех, могут существовать формулы решения***). Если бы математики ограничивались изучением урав- нений, допускающих точное решение, то есть решение по *) К такому виду сводится любое кубическое уравнение аох3 + apt2 + а2х + а3 = 0 подстановкой х + = у. **) Относительно)? жизни и творчества Абеля см. книгу О. Оре «Замечательный математик Нильс Хеирик Абель». Работы Абеля были продолжены французским математиком Э. Галуа, о котором напи- сана книга Л. Инфельда «Любимец богов». ***) Об алгебраических ^уравнениях можно читать книги этой серии: Кур ош А. Г., «Алгебраические уравнения произвольных сте- пеней», Гостехиздат, 1951; Шафаревич И. Р., «О решении уравнений высших степеней», Гостехиздат, 1954. 9
какой-то формуле, то разговоры инженеров с математика- ми имели бы примерно такой вид: Инженер: При расчете сооружения я пришел к такому урав- нению (показывает уравнение). Мне его надо срочно решить — через ме- сяц я должен закончить проект сооружения. Математик: Был бы рад помочь Вам, но для уравнений такого типа нет формулы решения. Инженер: Не сможете ли Вы вывести эту формулу? Математик: И пытаться не буду. Давно уже доказано, что для таких уравнений формулы решения не существует. Надо думать, что в результате подобного разговора мне- ние инженера о математике и ее возможностях значитель- но ухудшилось бы. К счастью, такого разговора не про- исходит. Дело в том, что инженеру обычно и не нужна фор- мула для решения того или иного уравнения. Ему надо получить ответ с определенной степенью точности, а будет ли ответ получен по формуле или иным путем, его не столь уже интересует. Ведь и формула нужна ему обычно лишь для того, чтобы с ее помощью вычислить ответ с необходи- мой степенью точности. Представьте себе, например, что формула найдена, но по ней получился ответ в виде х = 3 + ]Л13. Ясно, что этот ответ нельзя непосредственно использовать (вряд ли мож- । но заказать слесарю деталь длиной 3 4- У* 13 см). Для прак- тических целей надо выразить ]/13 в десятичной системе счисления, беря такое число десятичных знаков, какое тре- буется для данной практической задачи. Таким образом, инженер будет вполне удовлетворен, если математик укажет ему тот или иной способ вычисле- ния корня уравнения с необходимой степенью точности. В математике разработан целый ряд способов приближенно- го решения уравнений. Описанию некоторых из них и пос- вящена эта книга. § 2. ПОСЛЕДОВАТЕЛЬНЫЕ ПРИБЛИЖЕНИЯ Большая часть способов приближенного решения ура- внений основана на идее последовательных приближений. Эта идея применяется не только при решении уравнений, но и для решения ряда практических задач. Пользуются методом последовательных приближений артиллеристы. Если они хотят поразить какую-нибудь ю
цель, то устанавливают соответствующим образом угломер и прицел орудия и производят выстрел. В случае про- маха на основании наблюдения точки разрыва снаряда вносятся поправки в установку угломера и прицела и производится следующий выстрел. После нескольких при- ближений угломер и прицел устанавливаются так, что цель оказывается пораженной. Иногда последовательные приближения нужны и для определения точки прицела. Пусть, например, ведется стрельба из зенитного орудия, находящегося в точке О, по летящему самолету (рис. 1). Если направить орудие на точ- ку Л 0, где самолет находится в данный момент, то получит- ся промах: за время движе- ния снаряда самолет передви- , А а а нется в другую точку Лг Зная------------------------- скорости снаряда и самолета, 3 эту точку сравнительно легко найти. Однако, если напра- вить снаряд в точку Л1; все еще может получиться про- мах. Ведь в результате изме- нения наклона ствола орудия -----------g------------- меняется закон движения сна- ряда, поэтому время, которое Рис. 1. снаряд затратит для преодоле- ния пути О А о, отличается от времени, которое он тратит на преодоление пути ОАХ, и в результате попадания снаряда в самолет не произойдет. Но теперь промах будет меньше, чем при прицеливании в точку Ло. Чтобы сделать его еще меньше, надо найти время, затрачиваемое снарядом для движения по пути ЛОХ, и найти, в какой точке окажется через это время самолет. Эта точка Л2 и будет следующим приближением для иско- мой точки прицеливания. После этого надо найти время, за которое снаряд окажется в точке А2, и вычислить, в какую точку А3 попадет за это время самолет. После не- скольких приближений мы найдем с нужной степенью точ- ности точку прицела. Пользуются методом последовательных приближений и для решения многих других задач. Пусть, например, надо перевозить песок из нескольких песчаных карьеров Лх,...,Лл на несколько строек Blt...,Bm. Пусть производительность карьера А,- равна а, тонн в 11
день, а потребность стройки Bk в песке равна bk тонн в день. Наконец, пусть стоимость перевозки одной тонны песца с карьера А, на стройку Bk равна Cjk (эта величина зависит от расстояния между А,- и Bk, состояния дорог и т. д.). Для составления плана перевозок составим табл. 1. Через х;к в этой таблице обозначено количество песка, которое перевозится с карьера А, на стройку Вк- Таблица 1 Вг в2 А1 Х11 Х12 % 1т д. »21 х22 Х2т Ап хгл хга Хпт Ясно, что числа xik должны удовлетворять следующим соотношениям: xZi + x-2+ ... +хм<а. (с карьера А, нельзя вывезти больше, чем а,- тонн песка в день), х^ + x2k + ... + xnk = bk (на стройку Bk надо завезти bk тонн песка в день). При плане, даваемом табл. 1, стоимость перевозок пес- ка равна С Сц-41 -f- Д... Н- C^nX^rt + + С21Х21 + С22Х22 + ... + + (4) + г "T" •••‘'г План надо составить так, чтобы значение С было наимень- шим. Для этого сначала задаются каким-то ориентировоч- ным планом. Например, поступают следующим образом: К карьеру прикрепляют стройку, расположенную ближе всего к нему. Если этот карьер производит больше песка, чем нужно данной стройке, прикрепляют к нему еще 12
одну стройку, которая наименее удалена от него среди всех оставшихся строек. После нескольких шагов производи- тельность карьера At окажется исчерпанной. После этого прикрепляют к карьеру Л2 ту из оставшихся строек, которая ближе всего расположена к нему, и т. д. В конце концов каждая стройка окажется прикрепленной к некоторому карьеру. Однако составленный таким образом план не является наилучшим, так как под конец останется совсем немного строек и они могут быть очень удалены от оставшихся ка- рьеров. Поэтому придется изменить составленный план. Некоторые из строек, прикрепленных к карьерам с малы- ми номерами, придется от них открепить и прикрепить к карьерам с большими номерами. Методы изменения плана, приводящие к уменьшению стоимости перевозок, рассматриваются в разделе матема- тики, называемом линейным программированием *). После нескольких приближений, выполненных по этим методам, получится план, при котором сумма (4) является наименьшей или мало отличается от наименьшей. Вообще, при составлении любого плана, расписания и т. д. сначала берут некоторое грубое приближение, кото- рое потом последовательно улучшают, получая в конце концов требуемый результат. Обработку детали в цехах завода также можно рассмат- ривать как последовательное приближение к нужной фор- ме. Сначала берут грубое приближение — отливку или какую-нибудь другую заготовку. Эту заготовку обраба- тывают на станке, придавая ей форму, близкую к изготав- ливаемой детали. После этого ее передают на станок, рабо- тающий с большей точностью. После нескольких этапов об- работки, то есть нескольких приближений, и возникает требуемая деталь. § 3. АХИЛЛЕС И ЧЕРЕПАХА Впервые последовательные приближения встречаются у греческого философа Зенона Элейского, жившего за 500 лет до нашей эры. Этот философ пытался доказать, что в *) О линейном программировании см. А. С. С о л о д о в н и- к о в, Введение в линейную алгебру и линейное программирование, «Просвещение», М., 1966. 13
природе не существует движения (помните, у Пушкина есть стихотворение «Движенья нет, сказал мудрец брадатый...»). Доказывал отсутствие движения Зенон таким образом: если самый быстроногий из греков — Ахиллес — попро- бует догнать черепаху, то он никогда этого не сможет сде- лать. В самом деле, пусть расстояние между Ахиллесом и черепахой 1000 шагов и пусть Ахиллес пробегает за 1 сек 10 шагов, а черепаха проползает 1 шаг. Через 100 сек Ахил- лес пробежит 1000 шагов, отделявших его от черепахи. Но за это время черепаха отползет на 100 шагов. Еще че- рез 10 сек Ахиллес пробежит эти 100 шагов, но черепаха уползет еще на 10 шагов вперед. Чтобы преодолеть эти 10 шагов, Ахиллес затратит еще 1 сек, за которую черепаха продвинется вперед на 1 шаг. Итак, черепаха все время бу- дет впереди Ахиллеса, и он никогда не догонит черепаху. Значит, движения не существует. Разумеется, это рассуждение Зенона — остроумный па- радокс, но не более того. Движение есть неотъемлемое свой- ство материи. Ведь и у Пушкина стихотворение про Зено- на продолжается так: «Другой смолчал и стал пред ним ходить. Сильнее бы не мог он возразить. Хвалили все ответ замысловатый...» Любой школьник без труда сосчитает, когда Ахиллес догонит черепаху. Для этого достаточно составить уравне- ние 10х — % = 1000, (5) где через х обозначено искомое время. Из этого уравнения получается х = —д— сек = 111 у сек. Рассуждения Зенона можно, однако, рассматривать как своеобразный метод приближенного решения уравнения (5). Именно, перенесем в уравнении (5) х в правую часть и разделим обе части уравнения на 10. Мы получим урав- нение х = 100 + . (6) Если пренебречь в правой части слагаемым (оно мало по сравнению с х), то получим для х приближенное значение 14
Х1 = 100. Теперь мы можем уточнить ответ, подставив в правую часть вместо х найденное приближение xt = 100. Мы получим более точное значение для х, а именно, х2 = = 100 + Ю = НО. Подставляя это значение в правую часть уравнения, найдем следующее приближение х3 = 100 + 4-1^ = 111. Таким путем мы получаем приближения %! = 100, х2 = НО, х3 = 111, Xi = 111,1, ... то есть те же самые числа, которые получались в рассуж- дении Зенона. Эти числа связаны друг с другом соотноше- нием Xn+i = ЮО 4~ -jq- , (7) которое позволяет вычислить их одно за другим. С уве- личением п они приближаются к точному решению х = = 111 у уравнения (5). Описанный сейчас метод решения уравнения привел к успеху из-за того, что слагаемое было мало по сравне- нию с х. Иначе мы получили бы числа, не приближающие- ся к искомому решению. Предположим, например, что Ахиллес состязался не с медленной черепахой, а с легко- ногой антилопой, пробегающей за 1 сек 20 шагов. Чтобы найти, через сколько времени Ахиллес догонит антилопу, надо решить уравнение 10% — 20х = 1000. (8) Его решением является х = —100. Это означает, что Ахил- лес и антилопа были рядом 100 сек тому назад, а теперь ан- тилопа обогнала Ахиллеса и расстояние между ними в даль- нейшем будет только увеличиваться. Попробуем решить уравнение (8) так же, как мы реша- ли уравнение (5). Для этого перенесем слагаемое 20х в пра- вую часть уравнения и разделим обе части уравнения на 10. Мы получим уравнение х = 100 + 2х. (9) Положим в правой части х0 — 0. Мы найдем, что лу = 100. Подставляя это значение в правую часть уравнения (9), получим следующее приближение х2 = 300. Продолжая 15
этот процесс, получим числа х0 = 0, хх = 100, х2 = 300, х3 = 700,... Мы видим, что эти числа не стремятся к точному решению х = — 100 уравнения (8). § 4. ДЕЛЕНИЕ НА ЭЛЕКТРОННЫХ ВЫЧИСЛИТЕЛЬНЫХ МАШИНАХ Возможно, что читатель этой книги удивится — зачем было решать уравнение (5) методом последовательных приближений, когда его можно было совсем просто решить точно. Но, конечно, нас интересовало не уравнение (5), а сам метод последовательных приближений, который мы потом приложим к более сложным уравнениям. Впрочем, надо сказать, что решение методом последо- вательных приближений уравнений, похожих на уравнение (5), понадобилось совсем недавно в связи с появлением быст- родействующих электронных вычислительных машин. Есть некоторые модели таких машин, которые могут выполнять лишь три арифметических действия — сложение, вычи- тание и умножение. Кроме того, они могут делить на числа вида 2'1. Как же эти машины делят на любые числа? Разделить число b на число а — это значит решить урав- нение ах = Ь. Так как машина может умножать и делить на 2", то можно считать, что 1/2 а < 1 (в противном слу- чае мы умножим или разделим обе части уравнения ах = b на соответствующую степень числа 2). Перепишем уравне- ние ах = b в виде х = (1 — а) х 4- Ь. (10) Примем за первое приближение для числа х значение хх = = Ь. Обозначим ошибку этого приближения через alt то есть предположим, что 4- = b/а. Тогда из уравне- ния (10) получим хл 4- c/-i — (1 — а) (л'1 ~г ai) 4" b = = (1 — a) xj. 4- b 4- (1 — a) av (11) Поскольку 1/2 а < 1, то 0< 1 — 1/2. !б
Так как коэффициент 1 — а сравнительно мал, отбросим в правой части уравнения (11) слагаемое (1 — а) а1( кото- рое по крайней мере вдвое меньше, чем ах. Мы получим Xx+aj (1 — a) xt + b. Число х2 = (1 — a) + b мы и примем за следующее приближение для х. Обозначим через а2 погрешность приближения х2, то есть положим х2 4~ «2 = b/а. Тогда из уравнения (10) получим х2 + a2 = (1 — а) х2 + b + (1 — а) а2. Отбрасывая в правой части этого равенства слагаемое (1 — а) а2, получим приближенное равенство х2 <х2 ~ (1 — а) х2 . Таким образом, в качестве следующего приближения мож- но взять х3 = (1 — Я) Х2 4 ft. Рассуждая точно так же, найдем, что следующее прибли- жение имеет вид х4 = (1 — a)xs + b и т. д. Числа Xj, х2,...,хп,..., вычисляемые последовательно по формуле хп+1 = (1 — а) хп + Ь, (12) приближаются к числу b/а. Но в этой формуле использу- ются лишь действия сложения, вычитания и умножения, а значит, машина может по ней считать. Описанный метод деления основан, по существу, на фор- муле для суммы бесконечной убывающей геометрической прогрессии. Именно, мы записываем дробь b/а в виде &_ _ Ъ а ~ 1 — (1 — а) ‘ Но по упомянутой формуле имеем Г - ft 4 ft (1 - а) 4 ft (1 - ay -Ь • • 4 + &(1 — а)11-1 + . .. (13) 17
Обозначим через хп сумму первых п членов этой прогрессии: хп = b + b (1 — й) + ••• + & (1 — а)'1-1. Очевидно, что хп+1 = b + ь (1 - а) + ... + ь (1 - ау = — b + (1— «) [6 + b (1 — а) + ••• + b (1 — а)'1-1] = = b + (1 — а) хп. Эта формула совпадает с формулой (12). Таким образом, заменяя дробь Ыа приближенным значением хп, мы за- меняем бесконечную сумму в формуле (13) суммой первых п членов. При возрастании числа слагаемых п эта сумма приближается к сумме всей прогрессии (убывание прогрес- сии (13) вытекает из того, что 1/2 <4 а < 1, и потому О < 1 — а < 1/2). § 5. ИЗВЛЕЧЕНИЕ КВАДРАТНЫХ КОРНЕЙ МЕТОДОМ ПОСЛЕДОВАТЕЛЬНЫХ ПРИБЛИЖЕНИЙ Покажем теперь, как применяют метод последователь- ных приближений для извлечения квадратных корней. В школе изучают способ извлечения квадратных корней, поз- воляющий определять один за другим знаки искомого кор- ня. Его тоже можно рассматривать как один из способов последовательного приближения к ответу. Однако этот спо- соб довольно сложен и зачастую школьники механически применяют его, не вполне понимая сущность дела. Мы опишем другой способ извлечения квадратных корней, употреблявшийся уже в древнем Вавилоне задолго до на- шей эры. Его применял и александрийский математик Ге- рои. Потом этот способ был заброшен, но сейчас к нему прибегают иногда для извлечения квадратных корней на электронных вычислительных машинах. Пусть, например, надо извлечь квадратный корень из числа 28. Выберем сначала какое-то приближенное значе- ние этого корня, например, положим лу = 5. Погрешность этого приближенного значения обозначим через то есть положим /28 = 5 4- оу. Чтобы найти значение оу, воз- ведем обе части этого равенства в квадрат. Получим 28 = 25 4- 10оу 4- оу, 18
то есть а? + 10а4 — 3 = 0. (14) Таким образом, для аг получилось квадратное уравнение. Если попробовать точно решить это уравнение, то получим значение а4 = — 5 + У 28. Таким образом, точное опреде- ление а4 требует вычисления У28. Казалось бы, мы нахо- димся в заколдованном круге: чтобы найти У28, надо со- считать аг, а чтобы найти ах, надо вычислить У28. На помощь приходит следующее соображение. Погреш- ность аг приближенного значения хг = 5 невелика, она за- ведомо меньше единицы. Еще меньше число а4. Поэтому попробуем найти приближенное значение alt отбросив в равенстве (14) малое слагаемое а4. При этом для аг полу- чается приближенное уравнение 10<х4 — 3^0. Из него вытекает, что а4^0,3. Итак, приближенное значение поправки а4 найдено. Так как У 28 = 5 + а1; то второе приближение х2 для У 28 имеет вид х2 = 5 + 0,3 = 5,3. Чтобы найти еще более точное приближение для У28, повторим описанный процесс. Именно, обозначим через а2 погрешность значения х2 = 5,3, то есть положим У28 = = х2 + а2. Возведем обе части этого равенства в квадрат и отбросим малое слагаемое at Мы получим, что 28дйХг + + 2х2а2, и потому 28 Это означает, что третье приближение для ]/”28 выражает- ся формулой Хз = х2 + 28 — х% 28 4- х* 2х3 2х> Так как х2 = 5,3, то отсюда получаем, что х3 = 5,2915... Точно так же, исходя из приближенного значения х3 = =5,2915, находим следующее приближение х4, выражаемое формулой 28 х£ х4 = ——- = 5,2915 .. . 2-Л’з 19
Вообще, если уже найдено приближенное значение хп для У28, то следующее приближение выражается формулой При этом каждый следующий шаг процесса приводит ко все более точным приближениям для У28. Процесс приближе- ний останавливают, когда разность между хп+1 и хп станет меньше, чем заданная точность вычисления. Например, если надо вычислить У28 с точностью до 0,0001, то достаточно взять четыре приближения и положить У28 = 5,2915 (в са- мом деле, xs = 5,2915... их4 = 5,2915...). Совершенно так же извлекают квадратный корень из любого положительного числа. Именно, при вычислении У а мы выбираем некоторое начальное приближение хг, а потом определяем следующие приближения по формуле _ а 4- х*п Хп+1-------2х~~ (16) Формулу (16) можно вывести и из несколько иных рас- суждений, чем рассуждения, примененные при извлечении У 28. Пусть мы уже нашли n-е приближение хп для У а. Так как У а = хп- , то У а является средним геомет- а рическим чисел хп и —. В качестве приближенного значения для этого среднего геометрического возьмем среднее арифме- а тическое чисел хп и — , то есть положим лп _ 1 / [ а \ _х2п^а Хп+1 - 2 (Хп + —) -- Это и есть формула (16). Таким образом, описанный выше способ приближенного извлечения квадратных корней заключается в том, что мы на каждом шагу приближений заменяем среднее геометри- а ческое чисел хпи~^~~их средним арифметическим. 20
Выясним теперь, всегда ли процесс последовательных приближений при извлечении квадратных корней ведет к цели, то есть будет ли всегда обстоять дело так, как при по- гоне Ахиллеса за черепахой, или иногда дело обстоит так, как при его погоне за антилопой (в первом случае математики говорят, что процесс приближений сходится, а во втором — что он расходится). Мы докажем, что при извлечении квад- ратных корней никогда не бывает осложнений — процесс приближений всегда сходится, всегда ведет^к цели. Для этого сравним погрешности а„ = У а — хп и ап+1 = = У а— хп+1 двух следующих друг за другом приближений. По формуле (16) погрешность ап+1 можно записать в сле- дующем виде: _ _ г- х\ ф а _ х2 - 2хп У а + а Лл+1 — У й. Хп+-у У Я „ 2у “хп ^хп Но 4 — 2хп Уа + а= (хп — У а )2 = 4, и потому ct^ а«+1 = U?) Мы рассматриваем лишь положительные приближения хп для У а. Поэтому из равенства (17) можно сделать вывод, что все погрешности а2, а3,..., ап, •••• отрицательны. Иными словами, вег приближения хп, начиная со второго, являются приближениями с избытком*)-, первое приближение может быть как приближением с избытком, так и прибли- жением с недостатком. С помощью формулы (17) легко доказать, что абсолют- ная величина погрешности приближенного значения хп умень- шается с каждым шагом по крайней мере вдвое. В самом деле, равенство (17) можно записать так: *) Это объясняется тем, что среднее арифметическое всегда больше, чем среднее геометрическое. 21
Но так как хп 0, то 1 Va^i 2 2хп 2 * С другой стороны, как было показано выше, при м 2 имеем хп^>У а и потому 2 2хп Отсюда вытекает неравенство 1 Уа 2 2хп 1 У (19) Рассматривая соотношения (18) и (19), убеждаемся, что I < уу | Это и доказывает справедливость нашего утверждения: с каждым шагом приближений абсолютная величина погреш- ности уменьшается по крайней мере вдвое. Отсюда следует, что после второго шага приближений абсолютная величина погрешности уменьшится по крайней мере вчетверо, после третьего — по крайней мере в восемь раз и т. д. Ясно, что с возрастанием п абсолютная величина погрешности ап = = У а— хп уменьшается и стремится к нулю. Но это и озна- чает, что числа хп при возрастании п стремятся к У а. Разберем теперь, как влияет на ход процесса при- ближений выбор начального приближения хг. В первую очередь отметим, что этот выбор никак не влияет на окончательный результат. Ведь мы уже доказали, что, как бы ни было выбрано начальное приближение х1; погрешности аа, ...,ап, ... дальнейших приближений при п -- оо стремятся к нулю. Таким образом, если задана необходимая точность вычислений, то при любом начальном приближении хг получится одно и то же значение для У а с указанной точностью. Даже при очень неудачном выборе начального приближения мы в конце концов придем к пра- вильному результату. После десяти шагов приближения абсолютная величина погрешности уменьшится более чем в тысячу раз (210 = 1024 т 1000), а после сорока шагов — 22
по крайней мере в биллион (1012) раз. Так, если при вычис- лении положить хг = 106, то 10е, а потому |а40|< < 1СГ6. Иными словами, в начале процесса погрешность была около миллиона, а в конце ее абсолютная величина стала меньше одной миллионной. Тем не менее выбор начального приближения влияет на длительность процесса приближений. Если выбрать на- чальное приближение неудачно, то придется долго ждать, пока разность между хп+1 и хп станет меньше, чем заданная точность вычислений. Хороший выбор начального прибли- жения значительно ускоряет дело. Поэтому часто поступа- ют так: начальное приближение xt берут из таблиц квадрат- ных корней, а формулой а х? Х2 = -2^Г (20) пользуются лишь для уточнения полученного значения. Такой путь особенно удобен потому, что скорость убы- вания погрешности значительно возрастает, когда хп приближается к У а. Ведь при выводе неравенства I a,!+i | < у | ап | 1 ЧИСЛОМ у мы заменили в формуле (18) множитель у — Но если хп близко к У а, то дробь у— очень мала, 1 1 г у—уу |ап| значительно меньше, чем а потому | an+i | = 1 । । 2 I | • Уточним сделанное утверждение. Для этого рассмотрим наряду с абсолютной погрешностью |ал|=|]Ла — хп\ относительную погрешность приближенного значения хп, то есть отношение абсолютной погрешности |ап[ к точно- му значению корня У а. Эта погрешность выражается фор- мулой 23
Из равенства (17) получается такая формула для величины Рп+1: R _ | ЛП+1 | _ К |2 Va 2хп У~а 1 Так как хп > ]/"а, то отсюда вытекает, что в < М2 ^+1<2(/Н)2 Итак, для относительных погрешностей приближен- ных значений выполняется неравенство Зл+1 (21) Например, если относительная погрешность приближения хп равна 0,01, то для приближения х„+1 она не превосхо- дит 0,00005, а для х„+2 она не превосходит 0,00000000013. Мы видим, что точность приближений возрастает все бы- стрее и быстрее. Можно показать, что, когда мы уже доста- точно приблизились к У а, каждое следующее приближе- ние примерно удваивает число верных знаков. Пример. Вычислить ]/"238 с точностью до 0,00001. По таблицам И. Н. Бронштейна и К. А. Семендяева*) находим ]Л238 = 15,43. Примем число 15,43 за хг и най- дем х2 по формуле х, = -154д1б238 = 15,42725 ... 01),OU Оценим точность полученного ответа. Так как погрешность значения 15,43 не превосходит 0,01, то = 0,01 и потому Но тогда Л ОСИ 2 = 0,0000005. Это означает, что абсолютная погрешность приближения х2 не превосходит значения 15,43-0,0000005 < 0,00001. Ины- •) И. Н. Бронштейн и К. А.Семендяев, «Справочник по математике», «Наука», 1965. 24
ми словами, в значении ^238 = 15,42725... верны все семь знаков. Если бы мы хотели получить четырнадцать верных зна- ков, то уже третье приближение дало бы нужный ответ. Однако такая точность почти никогда не бывает нужна. Остановимся в заключение на следующей особенности метода последовательных приближений. При применении обычного метода извлечения квадратных корней любая ошибка, допущенная в каком-то месте, полностью обесце- нивает дальнейшие вычисления. Иначе обстоит дело при применении метода последовательных приближений. Пусть, например, в результате сделанной ошибки мы вместо пра- вильного значения n-го приближения хп получили непра- вильное значение уп. Тогда все дальнейшие расчеты можно рассматривать как вычисление У а при начальном прибли- жении уп. Но мы видели выше, что при любом выборе на- чального приближения метод последовательных приближе- ний приводит в конце концов к значению У а с нужной степенью точности. Таким образом, сделанная ошибка в даль- нейшем будет стремиться к нулю. Единственное влияние, которое она окажет, состоит в том, что придется взять не- сколько лишних приближений. Благодаря отмеченной особенности процесса приближе- ний в начале расчета можно вычислять приближения с меньшей точностью и лишь для последних приближений брать заданную точность. Это сокращает время, затрачива- емое на расчет. § 6. ИЗВЛЕЧЕНИЕ КОРНЕЙ С НАТУРАЛЬНЫМ ПОКАЗАТЕЛЕМ ПО МЕТОДУ ПОСЛЕДОВАТЕЛЬНЫХ приближений Описанный выше метод извлечения квадратных корней можно применять и для извлечения корней с любым нату- ральным показателем. Для этого нам понадобится следую- щая формула*): (х + «)‘=?-|-Л-|-...1 (22) *) Эта формула вытекает из бинома Ньютона, но мы не предполага- ем знакомства читателя с формулой бинома. 25
где точками обозначены члены, содержащие а2, а3 и т. д. Докажем эту формулу. Из школьного курса известно, что (х + а)2 = X2 + 2ха щ а2, (х + а)3 = Xs + Зх2а + Зха? ф- а3. Эти равенства можно переписать следующим образом: (х + а)2 = х2 + 2ха + ............. (23) (х + а)3 = х3 + Зх2а + . . . (24) Таким образом, формула (22) доказана при k = 2 и k = 3. Умножим теперь обе части формулы (24) на х + а. Мы получим, что (х + а)4 = (х3 + Зх2а + ...) (х + а). Если раскрыть в этом выражении скобки, то получится одно слагаемое х4, не содержащее а, и два слагаемых Зх3а и х3а, содержащих а в первой степени; что же касается ос- тальных слагаемых, то они содержат а во второй и высших степенях. Поэтому можно написать, что (х + а)4 = х4 -ф- Зх3а + х3а + . . . = х4 + 4х8а + . . . (25) (как и выше, точками обозначены члены, содержащие а2, а3 и т. д.) Итак, формула (22) доказана и при k = 4. Точно так же из формулы (25) выводится, что (х + а)5 = х5 + 5х4а + ... (26) Очевидно, что таким путем можно доказать формулу (22) для любого целого положительного показателя k. Вернемся теперь к извлечению корня любой натураль- ной степени k. Предположим, что уже найдено какое-то k_____________________________________ приближение хх для искомого корня у а. Обозначим через погрешность этого приближения, то есть предположим, ь_________________ что хх + аг = у а. Тогда (xt + ajk — а. Но по формуле (22) это равенство можно записать в следующем виде: Xj -f- kxi -|~ ... = а, где точками обозначены члены, содержащие а2, а® и т. д. 26
Если выбранное приближение Ху было достаточно к,— близко к у а, то погрешность этого приближения мала, и потому можно пренебречь членами, содержащими высшие степени погрешности. Мы получаем, таким образом, приб- лиженное равенство х* ~Е /г.Ц: 1 а ж а. Из этого равенства вытекает, что h а — х* и потому в качестве следующего приближения для у'"а можно принять число х2 — Ху -р а — х& kx*"1 a-y(k— 1) Ху Точно так же, исходя из приближения х2, находим сле- дующее приближение: а4-(й-1)х* Л'з = ---. йх* 1 Вообще, если найдено приближение хп для у/~а, то следую щее приближение определяется формулой _ а 4 (6 — 1)х* Хп+1~ FF (27) Как и при извлечении квадратных корней, можно пока- зать, что указанный процесс сходится при любом выборе начального приближения Ху (лишь бы это приближение бы- ло положительным числом). Иными словами, числа хг, х2,... ь_ , хп, ... при любом выборе Ху приближаются к уа. Процесс приближений ведется до тех пор, пока числа хп и хп+у не совпадут в пределах заданной точности. Пример. Найти значение F970 с точностью до 0,001. При k = 3 формула приближений (27) принимает вид Хп+1 — (28) 27
В нашем случае а = 970. Положим хг = 10. Из формулы (28) следует, что = 970 4»2.10s 2970 2 3-102 300 _ 970 4- 2.9,9s 2910,60 _ „ Хз ~ 3-9,93 — 294,03 — у>°уу- Мы видим, что в пределах заданной точности значения х2 и х3 совпадают. Поэтому с точностью до 0,001 имеем ^970 = 9,899. § 7. МЕТОД ИТЕРАЦИЙ Все разобранные выше примеры являются частными случаями применения одного общего способа решения урав- нений. Этот способ называют методом итераций или ме- тодом последовательных приближений. Сущность этого способа состоит в следующем. Уравнение /(х) = 0, которое хотят решить, переписы- вают в виде х = ф(х). (29) После, этого выбирают начальное приближение хг и под- ставляют в правую часть уравнения (29). Полученное зна- чение х2 ~ ф(х^ принимают за второе приближение для корня. Вообще, если найдено приближение хп, то следую- щее приближение х„+1 определяют по формуле Хп+1 = ф(х„). Пусть после нескольких приближений мы получим, что с заданной степенью точности выполняется равенство хп ~ ^хп+1. Так как хп+1 = ф(хп), то это значит, что с заданной точностью выполняется равенство хп ~ ф(хп), то есть что хп — приближенное значение корня уравнения х — ф(х). Например, решая задачу об Ахиллесе и черепахе, мы записали уравнение в виде 10 х — х = 1000 х= 100 + -^- 28
и искали приближения по формуле xn+i = ЮО + . В задаче о делении на электронной вычислительной машине мы записали уравнение ах = b в виде х = (1 — а) х + b и искали приближения по формуле Хп+1 = (1 — а)хп 4- ь. Наконец, при извлечении корня й-й степени мы преоб- разовали уравнение xk = а к виду __ а •$> (k — 1) xh Х ' после чего искали приближения по формуле a^(k — 1)х* %П+1 - , ь_, • kxn 1 Приведем пример более сложного уравнения, решаемого методом итераций. Пример. Решить уравнение 10х — 1 — cos х = 0 (30) с точностью до 0,001. Перепишем уравнение х = Выберем некоторое начальное приближение, например — 0, и подставим его в правую часть равенства (31). По- лученное значение _ 1 Ф cos 0 „ (30) в следующем виде: 1 4- cos х 29
примем за второе приближение искомого корня. Подстав- ляя значение х2 в правую часть равенства (31), получим третье приближение 1-ф cos о, 2 1 -ф 0,98 . 1ПО хз = ---1^- = °’198’ Далее, находим х4 = 1 ^СУ198~О>198. Мы видим, что с точностью до 0,001 выполняется равен- гр 1 -ф COS Хз ство х3 = х4. Так как х4 = —, то это означает, что с точностью до 0,001 число х3 = 0,198 является корнем 1 -ф cos х уравнения х = —. В связи с описанным способом итерации возникает ряд вопросов: 1. Всегда ли последовательность х1г ...,хп, ..., получа- емая по способу итераций, сходится к некоторому числу §? 2. Если имеет место равенство lim хп — то является п-*-оо ли число решением уравнения х = ф(х)? 3. Как быстро приближаются числа хь..., хп, ... к кор- ню g уравнения х — ф(х)? Легче всего ответить на второй вопрос. Пусть числа xlt хп, ... приближаются к числу Рассмотрим равен- ство хп+1 = ф(х„), дающее выражение следующего прибли- жения через предыдущее. С увеличением п его левая часть приближается к £, а правая часть — к ф(|) *). Поэтому в пределе мы и получим £ = ф (£), то есть £ является кор- нем уравнения х = ф(х). На первый вопрос ответ отрицательный. В самом деле, рассмотрим, например, уравнение х = 10* — 2. Если положить %! = 1, то мы получим х2 = 8, х2 = 108 — 2, ... С увеличением п числа хп увеличиваются и не стремятся ни к какому пределу. В то же время, если переписать уравне- *) Мы предполагаем, что ср (х) непрерывная функция. 30
ние в виде х = lg(x + 2), то процесс приближений будет сходиться, и мы получим после трех приближений, что х = 2,38. Таким образом, надо заменить первый вопрос таким: Какой должна быть функция <р(х), чтобы последователь- ность чисел хг, х2,..., хп,--- сходилась? Выяснению этого вопроса предпошлем геометрическое истолкование способа итераций. § 8. ГЕОМЕТРИЧЕСКИЙ СМЫСЛ МЕТОДА ИТЕРАЦИЙ Очевидно, что разыскание корня £ уравнения х = <р(х) есть не что иное, как нахождение абсциссы точки М пере- сечения кривой у = <р(х) с прямой у = х. Предположим, что задано некоторое начальное значение хх (рис. 2). Тогда точка Мх с координатами АЦхх, q^xj ) лежит на кривой у = <р(х). Проведем через эту точку горизонтальную пря- мую. Она пересечет прямую у = х в точке A^1(q>(x1), ф(Х1)). Обозначим ф(%!) через х2. Тогда координаты точки будут иметь вид N^x^, х2). Далее, проведем через точку вертикальную прямую. Она пересечет кривую у — <р(х) в точке Мг с координатами М2(х2, <р(х2) ). Повторяя этот процесс, мы получаем точку Nt на прямой у = х с координатами N2(xs, х3), где х3 = <р(х2), а потом точку Mt на кривой у = <р(х) с координатами А13(х3, <р(х3)) и т. д. Если процесс приближений сходится, то точки М1г М2,..., Мп,... приближаются к искомой точке пересечения. 31
Таким образом, геометрический смысл способа последо- вательных приближений заключается в том, что мы двига- емся к искомой точке пересечения кривой и прямой по лома- ной линии, вершины которой попеременно лежат на кривой и на прямой, а стороны попеременно имеют горизонтальное и вертикальное направления (рис. 2, а). Если кривая и прямая расположены так, как на рис. 2, а, то эта ломаная напоминает лестницу. Если же кривая и пря- мая расположены так, как на рис. 2, б, то ломаная напоми- нает спираль. Описанный процесс приближений может и расходиться, не приводить ни к какому результату (как и было, когда мы решали задачу про Ахиллеса и антилопу). Графически это означает, что ступени лестницы (или звенья спирали) становятся все больше и больше, а потому точки Мг,... Мп, ... не приближаются к точке М, а удаляются от нее (рис. 3). Различие между рис. 2 и 3 состоит в следующем. Прове- дем через точку М пересечения прямой у = х и кривой у = <р(х) прямую под углом 135° к оси абсцисс. Эта прямая вместе с прямой у = х делит плоскость на четыре части. Если кривая в некоторой окрестности точки М располо- жена в левой и правой четвертях плоскости и начальное приближение берется в этой окрестности, то процесс итера- ций сходится. Если же кривая расположена в верхней и нижней четвертях плоскости, то процесс приближений рас- ходится. 32
Однако чтобы применить это правило, надо сначала сде- лать набросок графика функции у = ф(х), а это не всегда целесообразно. Поэтому надо установить другой признак сходимости процесса итераций, позволяющий решать во- прос о сходимости или расходимости аналитически, при по- мощи вычислений, а не геометрических построений. Это условие будет дано в § 10. Сначала нам нужно будет позна- комиться с понятием сжимающего отображения. § 9. СЖИМАЮЩИЕ ОТОБРАЖЕНИЯ Возьмем функцию у -- ф(х), заданную на отрезке 1а, Ь]. Каждой точке х0 этого отрезка соответствует точка у0 на оси ординат, а именно, точка у0 <р(х0)- Чтобы построить эту точку, надо провести через точку х0 оси абсцисс верти- кальную прямую до пересечения с графиком функции у = = ф(х), а потом через точку пересечения провести горизон- тальную прямую до пересечения с осью ординат (рис. 4). Таким образом, функция у = <р(х) задает отображение от- резка 1а, Ь] в ось ординат. Множество всех точек оси орди- нат, соответствующих точкам отрезка [а, 6], называют образом этого отрезка. Например, образом отрезка [2, 5] при ото- бражении у — х2 является отрезок [4, 25], а образом от- резка [—1, 6] при том же отображении — отрезок [0,36] (нарисуйте график функции у = х2). Можно доказать, что если функция у — <р (х) непрерывна на отрезке [а, Ь], то образом этого отрезка является отрезок оси ординат. В случае, когда функция у = ф(х), кроме того, монотонно возрастает, образом отрезка [а, Ь] является отрезок 2 Н. Я- Виленкин 33
1<р(а), <р (&)], а в случае, когда она монотонно убывает,— отрезок [<р(Ь), ф(а)1 (рис. 5). Вместо отображения отрезка [а, Ь] в ось ординат можно рассматривать его отображение в ось абсцисс. Для этого после отображения в ось ординат повернем ось ординат на 90° по часовой стрелке. В результате точки отрезка [а, Ы сначала отобразятся в какие-то точки оси ординат, а по- том — в точки оси абсцисв. Таким образом, функция <р(л') задает отображение отрезка [а, Ь] в ось абсцисс. Это отоб- ражение мы будем записывать так: х <р(х). Если функция <р(х) непрерывна, то в результате получим какой-то отре- зок оси абсцисс. Может случиться, что образ [«j, 6J отрезка [а, Ы яв- ляется частью [а, Ь]. Например, при отображении у = = У~х + 1 отрезок [0, 4] переходит в свою часть [1, 3]. Мы будем говорить в таком случае, что отображение <р(х) перево- дит отрезок [а, 6] в свою часть. Если <р(х) переводит отре- зок [а, Ь] в свою часть [а1э &J, то любая часть отрезка [а, 6] переходит в часть отрезка [«i, bt]. В частности, сам отрезок [«!, переходит при отображении <р(х) в свою часть [а2, bs], Точно так же отрезок [а2, Ь2] переходит при этом отображении в свою часть [а3, 63] и т. д. В результате мы получим систему отрезков [а, Ь], [ах, &!,], [ап, Ьп],..., каждый из которых является частью предыдущего и та- ких, что [а„+1, &„+1] является образом [ап, при отображе- нии <р(х). 34
Например, отображение х -> 1 —переводит отре- зок [0, 4] в его часть [Va, 6/в]. Применяя это отображение к отрезку [Va, 5/в1, получим отрезок [3/6, Wi?] и т. д. Каждый следующий отрезок является частью предыдущего. Возможны два случая: либо существует отрезок [с, d], принадлежащий всем отрезкам [ап, Ь„1, либо эти отрезки имеют лишь одну общую точку £. В последнем случае гово- рят, что система отрезков [ап, Ь„] стягивается к точке Ниже мы сформулируем условие стягивания системы отрезков [а, 6], [alt &J, ..., [ап, Ьп],... Для этого введем важ- ное понятие сжимающего отображения. Отображение <р(х), переводящее отрезок [а, Ь} в свою часть [«j, &ж1, называет- ся сжимающим, если оно уменьшает расстояние между любыми двумя точками этого отрезка по крайней мере в М раз, где М )> 1. Так как расстояние между точками хг и х2 равно |х2 — Xj |, то условие сжимания можно сформули- ровать так: Существует число q такое, что 0 <Zq 1 и для любых двух точек хь х2 отрезка [а, Ь] выполняется неравенство I <Р(*2) ~ <P(^i) | < q | -Ь — *11 (32) (здесь q — 1/Л1). Длина произвольной части [с, d] отрезка [а, Ь] при сжи- мающем отображении <р(х) уменьшается по крайней мере в М = \lq раз. В самом деле, пусть [сь dj — образ от- резка [с, d]. Тогда с, и dr — образы некоторых точек хг и х3 отрезка [с, d], q = <p(Xi), dt = <p(x2). Но тогда I — q I = I <рW — <p(q) i < q I x2 — xi |. Так как точки Xx и x2 лежат на отрезке [с, d], то их расстоя- ние |х2 — Xi | меньше длины \d — с| отрезка [с, d]. Значит, \d-i — q К q | d — с|. Наше утверждение доказано. Теперь мы можем сформулировать условие того, что си- стема отрезков [а1; bj,..., [пп, Ьп], получающихся из отрезка (а, Ы последовательным применением отображения <р(х), етягиваетея. 2» 35
Если отображение <р(х), переводящее отрезок [а, Ь] в свою часть {щ, Ьг\, сжимает этот отрезок, то система от- резков [«х, £>х!.[сп, стягивается к некоторой точ- ке £ отрезка [а, &]. В самом деле, так как отображение ф (х) стягивающее, то для любого п \bn — an\^q\bn-i — an_1\. Точно так же Но тогда | bn-i ап 1q | bn-2 ап-21. | bn ап I I Ьп -2 ап-21 • Повторяя это рассуждение, получаем \Ьп — ап[ < qn\ b — а|. Поскольку О <6 q <Z 1, то последовательность чисел q, q2,..., qn,-.. стремится к нулю, а потому длины \Ьп — ап\ отрезков [ап, Ьп] стремятся к нулю, когда п стремится к бесконечности. Но тогда не может быть отрезка [с, d], при- надлежащего всем отрезкам [ап, Ь„1. Следовательно, система отрезков [а, Ь], [«х, У, ..., [ап, Ьп], ... стягивается. В заключение рассмотрим отображения ф(х), для кото- рых неравенство (32) |ф(х2) — ф(.Гх)| < д|х2 — Хх|, где 0 < q < 1, выполняется для любой пары чисел Xi и х2- Эти отображения являются сжимающими на всей чис- ловой оси. Покажем, что в таком случае есть отрезок, кото- рый сжимается отображением ф(х). Поскольку для любых двух точек хх и х2 условие (32) выполнено, достаточно пока- зать, что есть отрезок, который переводится в себя отобра- жением ф(х). Возьмем любое число а и положим b = ф(а). Выберем число < 1 такое, что q < qr. Положим р_____I а I Л 1 - <71 и покажем, что отрезок [а — R, а + R] переходит при ото- бражении ф(х) в свою часть. В самом деле, пусть х — точ- 36
ка этого отрезка. Тогда |х — а| < R. В силу неравенства (32) выводим, что 1ф(х) — 6| = | ф(х) — <р(а)| < q\x — а\ < qR. Но тогда | ф (х) — а| = |<р (х) — Ь + b — а\ < < |ф(х) — &|+ |& — а| < 4% + \b — а\ = qR + (1 —q^R = = (1 + q-(h) r<r. Это и показывает, что любая точка отрезка [а — R,a-\- /?] переходит при отображении ф(х) в точку того же отрезка, а потому отображение ф(х) сжимает отрезок [а — R, а -|- /?1- § 10. СЖИМАЮЩИЕ ОТОБРАЖЕНИЯ И МЕТОД ИТЕРАЦИЙ Вернемся теперь к методу итераций. Этот метод приме- няется для решения уравнений вида х = ф(х). Если £ — корень этого уравнения, £ == ф(|), то при отображении х —> ф(х) точка £ остается на месте. Таким образом, зада- ча о решении уравнения х =ф(х) равно- сильна задаче об отыскании непод- вижных точек отображения ф(х). Если отображение ф(х) является сжимающим на от- резке [а, Ь], то на этом отрезке всегда есть неподвижная точка. Чтобы убедиться в этом, возьмем последовательность отрезков [«!, fej, [а2, &2], ..., [ап, . получающихся из [а, Ь] последовательным применением отображения ф(х). Так как ф(х) — сжимающее отобра- жение отрезка [а, Ь], то существует единственная точка общая всем отрезкам [ап, Ьп]. Она и является неподвиж- ной точкой отображения ф(х). В самом деле, отображение ф(х) переводит каждый от- резок [ап, Ьп] в свою часть [art+1, Ьп+Г]. Поэтому образ ф(х) любой точки с отрезка [ап, &„] лежит на его части [ап+1, 6п+1], а тем более на самом отрезке \ап, Ьп]. Поскольку точка £ принадлежит всем отрезкам [ап, Ьп], то и ее образ ф(£) должен принадлежать всем этим отрезкам. Но единствен- ной точкой, принадлежащей всем отрезкам [ап, Ьп], является точка |. Значит, ф (|) = |, то есть В — неподвижная точка отображения ф(х). Итак, для отображений, сжимающих отрезок [а, &], всегда существует неподвижная точка, лежащая на том же 37
отрезке. Эта точка единственная. В самом деле, если бы на- шлась другая неподвижная точка л, Л = ф(л), то должно было бы выполняться неравенство И — ^ | = | ф(л) — ф(Ю | < Я I Л — £ |. Поскольку 0 < q < 1, это неравенство может выполняться лишь, если | л — £ | — 0, то есть если л = £• Теперь мы можем сформулировать достаточное условие сходимости процесса итераций. Пусть функция ср(х) задает сжимающее отображение отрезка [а, Ь}. Тогда для любой точки х0 этого отрезка по- следовательность чисел х0, х1( х2,..., хп, ...,где хп+1 = ф(х,(), сходится к корню ^уравнениях = <р(х), лежащему на этом отрезке. В самом деле, пусть [ап, Ьп], п = 1,2,..., — последова- тельность отрезков, получающихся из [а, 6] последователь- ным применением отображения ф(х). Так как точка х0 лежит на отрезке [а, Ь], то ее образ хТ = ф(х0) лежит на от- резке [о^, &J, образ х2 = тСч) точки xt лежит на отрезке [а2, Ь2] и т. д. Таким образом, для любого п точка х„ лежит на отрезке [ап, Ьп]. Так как длины отрезков [ап, Ьп] стремят- ся к нулю при возрастании п, то последовательность точек хь ..., хп, ... стремится к общей точке g этих отрезков. Проведенное рассуждение показывает, что за началь- ную точку х0 можно брать любую точку отрезка [а, Ь\. Выясним, с какой скоростью стремятся точки х0, хъ... ..., хп, ... к точке g. Так как g = <р(£), то для любой точки с отрезка [а, 6] имеем I Ф (с) — £ I = I Ф (с) — Ф (£) | < Я | с — g |. (33) Применим неравенство (33) к точкам х0,..., хп, ... Так как хп = Ф(х„_1), то | Хп — g I = | ф(х„-!) — g I < q Ixn-i — g |. Но тогда для любого п имеем I Хп— g | < q\xn-! — g | < q2\ Xn-2— I | < ... < qn | x0 — g|. Таким образом, погрешность | хп — ^убывает с ростом п по крайней мере со скоростью геометрической прогрессии, имеющей знаменатель q. Приведем примеры на применение доказанного условия. 38
Пример 1. Можно ли применять метод итераций для решения уравнения * = 4Д? (34) В данном случае Ф W — 4 Х2 • Для любых xt и хг имеем Но по неравенству между средними арифметическим и гео- метрическим 1 f 1Г л ч |х| - 2 }/4х2< \ Поэтому 1 1 Ч 1 L- 1 (4 + я2)->(4 + х22) X1 4~ Х2 | | Ху | + | Xt | 21 ' 4 2 Ч 8 - “1(4 4-4) (4 + 4)- Мы доказали, что для любых хг и xs выполняется неравен- ство Xi -р 1 (4 + 4)(4+х22) Ч“8~’ а потому |ф(х2) —ф(Х1)К^-|Ха —Xi|. Это означает, что отображение ф (х) является сжимающим на всей оси. Мы уже знаем, что в этом случае есть отрезок, перехо- дящий в себя при этом отображении. Чтобы найти его, по- ложим а — 0. При отображении <р(х) точка а = 0 перехо- дит в точку b = 1/4. Далее, в нашем случае q = V8. По- if IЬ — all _ ложим = /4 и обозначим число-у——- = у через R. [1 1 т — 3" ’ "з пеРех°Дит ПРИ отображении <р(х) в себя. 39
Значит, на этом отрезке есть одна неподвижная точка, то есть корень уравнения (34). Чтобы найти эту точку, возь- мем любую точку отрезка £— |, у] > например точку хл =0. Применяя метод итераций, получаем = 1 = 0,25, 4 ’ ’ = 4,0625 0,2461 ’ V., -- ___L_____-- 1 -- о рлдч 3 - 4 4-0,24612 ~~ 4,0605 ~~ Х4 ~~ ;—;; Л/Т.Да" =: "7 7|pnF — 0,2463. 4-Р 0,24b32 4,0605 ’ С точностью до 0,0001 имеем х3 = хл. Значит, с точностью [1 1 "I -Q- ,-П- , О О J равен 0,2463. Поскольку отображение <р(х) сжимающее на всей оси, уравнение (34) не имеет других корней. Пример 2. Можно ли применить метод последова- тельных приближений для решения уравнения х = 1 + у^х на отрезке [— 1, 8]? Здесь <р (х) = 1 + }/~х. Так как ср (—1) = 0, ф(8) = 3, то отображение <р(х) переводит отрезок [—1,81 в себя. Од- нако оно не является на этом отрезке сжимающим, так как, например, при хг = — 0,008, х2 = 0,008 | Ф (х2) — <р (Xi) 1 = 1^0,008 — — 0,0081 = 0,4>|х2—xi|. При доказательстве того, что отображение в примере 1 было сжи- f •— а -|- Ъ мающим, мы использовали неравенство у аЬ <—2~~ ’ Сейчас мы выведем некоторые неравенства, которые часто приходится исполь- зовать для доказательства того, что данное отображение сжимающее. Докажем, что при х > 0 имеет место неравенство sin х < х < tg х. (35) Для этого заметим, что на рис. 6 площадь S0AB сектора ОАВ с централь- ным углом х заключена между площадями треугольников ОАВ и ОАТ: S&OAB < Sсект. ОАВ < ^дОЛГ. 40
Но _ R2sinx о _ R2tgx доля------2— ’ ддОЛ!’--------2— A K‘X (R — радиус круга). Площадь же сектора ОАВ равна (угол мы измеряем в радианной мере). Поэтому R2 sin х R2x R2 tg х 2 < ~2~ < 2 ' Сокращая на , приходим к неравенству (35). Из неравенства (35) вытекает, что при 0 < х < 1 имеем х < arcsin х, а при х > 0 имеем х > arctg х. Отметим еще неравенства ех > 1 + х, In (1 + х) < х, 0 < х < 1, доказательство которых несколько сложнее. ПримерЗ. Выяснить, можно ли решить методом ите- раций уравнение х = 1 + у arctg х. (36) Так как при всех значениях х имеем 1 + yarctgx)>0, то уравнение может иметь лишь положительные корни. Мы имеем Ф(х) = 1 +у arctg х. (37) Поэтому | Ф (х2) — ф (Xi) | = | (1 + у arctg Х2) - (1 + У arctg | = = у | arctg х2 — arctg хг |. Но при х1^ 0, х2 > О arctg х2 — arctg Xi = arctg и потому | Ф (Х2) - ф (Xi) I = 4 [arctg 1<т|т^|< i I ^2 - Х11. 41
Значит, отображение (37) является сжимающим на полуоси [О, ос). Это отображение переводит отрезок [0, ]У31 в свою часть [1, 1 + Л./61. Поэтому существует единственный ко- рень уравнения (36), лежащий на отрезке [1, 1 4~ л/61. Чтобы найти этот корень, положим xr = 1. Тогда х2 — 1 4~ у arctg 1 — 1 4- -х- ~ 1,39, х3 = 1 4- у arctg 1,39 = 1,474, х4 = 1 4- j arctg 1,474 = 1,487, х5 = 1 4- у arctg 1,487 = 1,489, хе = 1 4- у arctg 1,489 — 1,490, х7 = 1 4- у arctg 1,490 = 1,490. Мы видим, что с точностью до 0,001 выполняется равен- ство х6 = х7 = 1,490. Значит, с этой точностью корень на- шего уравнения равен 1,490. Так как отображение ср (х) является сжимающим на всей полуоси, 0 х <. оо, то урав- нение (36) не имеет других корней. Часто бывает, что уравнение х = <р(х), которое нельзя решить методом итераций, можно преобразовать к виду, до- пускающему применение этого метода. Возьмем, например, уравнение х = Xs — 2. (38) Так как здесь <р(1) = — 1 < 1, <р(2) = 6 >2, то это уравнение имеет корень на отрезке [1, 2]. Но отобра- жение х3 — 2 не является сжимающим на этом отрезке, так как не отображает его в свою часть. Перепишем уравне- ние (38) в виде х = yGc 4- 2. Здесь (х) = /х 4~ 2 и потому | (^2) — (xi) | — | х2 4- 2 — j/"Xi 4" 21 = I Xi — Х1 У (хз + 2)2 4" у (xi -р 2) (%•> + 2) + У (Xi + 2)2 42
На отрезке [1,2] имеем xY > 1, х2 > 1. Значит, на этом от- резке |lp(X2)—1р(Х1)|< —| х2— X! |. Мы доказали, что отображение ф(х) — сжимающее на от- резке [1, 2]. Положим xr = 1 и применим метод итераций. Мы получим х2 = ^3 = 1,442, х3 = у%442 = 1,510, х4- /з/Ю - 1,520, х5 -/3.520- 1,521, хв = ^521 = 1,521. Итак, с точностью до 0,001 корнем уравнения (38), лежа- щим на отрезке [1, 2], является 1,521. Других корней это уравнение не имеет. Мы видим, что удачное преобразование исходного урав- нения привело его к виду, допускающему применение мето- да итераций. Описанный здесь признак сходимости метода итераций не очень удобен для использования, так как требует доказа- тельства довольно сложных неравенств. Ниже (в § 21) мы познакомимся с одним следствием этого признака, кото- рое значительно облегчает доказательство сходимости про- цесса итераций. § 11. СПОСОБ ХОРД Метод итераций является одним из самых общих мето- дов приближенного решения уравнений. Многие другие способы приближенного решения уравнений — это част- ные случаи метода итераций. Сейчас мы опишем один из таких способов, называемый способом хорд. Пусть нам надо решить уравнение /(х) = 0. Эта задача равносильна задаче об отыскании точек, в которых график функции у = /(х) пересекает ось абсцисс. Предположим, что функция /(х) непрерывна и имеет в точках а и b значения 43
различных знаков. Тогда по крайней мере в одной точке отрезка [а, Ь] эта функция обращается в пуль. Иными сло- вами, хотя бы в одной точке | отрезка [а, Ь] график функции У — Кх) пересекается с осью абсцисс. Вообще таких точек может сколько (рис. 7). если функция у = нотонна на [а, Ь] и имеет на его кон- цах значения различных знаков, то график функции пересекается на этом отрез- точке Чтобы найти на отрезке [а, Ь] дугу ке с осью абсцисс лишь приближенно эту точку, в одной заменим кривой у = Дх) соответству- ющей хордой MN и найдем точку пересечения Т этой хор- ды с осью Ох (рис. 8). Для этого рассмотрим по- добные треугольники ММГТ и NNrT. Из подобия этих треугольников вытекает, что М1Т TNi и о Т7ТГ = ТГкг Но из рис. 8 MMi NiN г видно, что ЛД71 = аг — а, TNx=b — alt MMr — —/(а) и NrN = f(b), где через ах обозначена абсцисса точки пересечения Ох. Поэтому говоря, быть не- Однако /(%) мо- отрезке Рис. 8. хорды MN с осью а} — а _Ь — аг -Г (a) f(b) • Решая это уравнение, находим, что af(b) — Ь[ (а) Это равенство можно записать также в 01 = виде <39> или / («) f ^ау (40) 44
(проверьте, приведя правые части формул (39) и (40) к одно- му знаменателю). Число а2 и является приближенным значением корня уравнения f(x) = 0, лежащего между точками а и Ь. Так как знаки чисел f (а) и /(&) различны, то либо знак f(a), либо знак f(b) отличаются от знака f{a^. Если в точках а и Й! функция/(л) имеет различные знаки, то применяют формулу (39) к отрезку [а, ах1 и получают следующее приближение: а-2 = ^ — 1 («i) f (41) для искомого корня. Если же функция /(х) принимает зна- чения разных знаков в точках ах и Ь, то применяют форму- лу (40) к отрезку [ах, Ь] и полагают <«) Найдя значение а2, применяют формулу (39) к отрезку [а, а2] (или соответственно формулу (40) к отрезку 1а2, &]) и находят следующее приближение а3. Вообще, если уже найдено приближение ап, то ищут следующее приближение по формуле an+i =an — f (ап) ^а) (43) или по формуле «п+1 = an — f (ап) • (44) Мы получили две формулы (43) и (44). Посмотрим теперь, в каком случае надо применять ту или иную формулу. Пусть кривая обращена вогнутостью вверх. В этом случае надо соединять точки кривой с тем концом М или N, в ко- тором функция положительна. Если же кривая обращена вогнутостью вниз, то надо соединять точки кривой с тем концом, в котором функция отрицательна. Различные возникающие при этом случаи изображены на рис. 9. Эти рисунки делают геометрически очевидным следующее утвер- ждение: Пусть на отрезке [а, Ь] функция f(x) непрерывна, моно- тонна, имеет постоянное направление вогнутости и прини- мает на концах отрезка значения различных знаков. Тогда при правильном выборе формулы приближений метод хорд 45
дает последовательность точек, сходящуюся к корню урав- нения f(x) — 0. Если же выбрать формулу неправильно, то способ хорд может привести к тому, что точка «3 попадет за пределы от- резка 1а, Ы. Это изображено на рис. 10. Рис. 9. Описанный сейчас способ хорд является частным случа- ем метода итераций. Пусть функция f(x) не обращается в нуль при х = а. Тогда уравнение /(х) = 0 равносильно уравнению x^-x-fW (45) 46
В самом деле, если /(£) = 0, то (46) Обратно, если & =/=а и выполняется равенство (46), то/ (£)=0. Но уравнение (45) имеет вид х = ф(х), где ф^Х-^)^^ af (X) — xf (а) f(x)—f(a) ’ Положим х0 = b и применим метод итераций. Мы получим ту же последовательность чисел alt а2, ап, которая получается при способе хорд: ап — а an+i =- ап f (ап) ца • Для примера решим способом хорд уравнение л8 + Зх — I - 0. (47) Здесь f(x) = № + Зх — 1. Так как /(0) — — 1, /(1) = 3, то уравнение (47) имеет хотя бы один корень на отрезке [О, 1]. Если нарисовать график функции у —Xs + Зх—1, то мы увидим, что на отрезке [0, 11 он обращен вогнутостью вверх. Поэтому применяем формулу (39). По формуле (39) первым приближением для этого корня является число л-! = b — / (Ь) -гД-Д- = 1 — 3 • Дт = 0,25. ' v ’ f (b) — f (a) 3 —(—1) Второе приближение находим по формуле =6 - f <4) “1 -3 = °'31 • Далее, 1_______________________о 31 1~3тгй= °’319’ у __ 1 _о ~0.319 __ ,, I 6 3 4- 0,010 ~ ^'-з-зДтав’0-322- Таким образом, с точностью до 0,001 корень уравнения, лежащий на отрезке [0, 11, равен 0,322. 47
§ 12. УСОВЕРШЕНСТВОВАННЫЙ СПОСОБ ХОРД Если способ хорд сходится, то скорость сходимости бу- дет такой же, как и у способа итераций,— погрешность значения корня убывает, как геометрическая прогрессия. Существует усовершенствование способа хорд, дающее гораздо более быструю сходимость. В обычном способе хорд мы на каждом шагу используем один из концов отрез- ка [а, Ь] и последнее получившееся приближение. Вместо этого можно использовать два последних приближения — ведь они обычно ближе к искомому корню, чем концы от- резка [а, Ь]. Формула, при которой мы используем два последних приближения, имеет следующий вид (рис. 11, а): йп+1 = ап — f (ап) ап - ап-1 f Ю - f (an-l) (48) При этом вычисляется по формуле (39), а а2 — по форму- ле (41) или (42), в зависимости от знаков/(а), /(&), / (ад): если f(a)< 0, / (&) > 0, то при f (ai) <Z 0 выбирается формула (42), а при 0— формула (41). Если случайно окажется, что точка а3, вычисленная по формуле (48), лежит за пределами отрезка [а, &], то на сле- дующем шаге надо вместо этой точки взять ближайший к ней конец этого отрезка (рис. 11, б). Оказывается, что сходимость усовершенствованного метода хорд гораздо быстрее, чем у обычного. Именно, если ? — корень уравнения f(x) == 0, то I an+i — £ I <1 С | ап £ р, (49) 48
где 1,618. Для примера решим этим методом то же уравнение х3 + Зх — 1 = О, которое мы ранее решили методом хорд. Первые приближе- ния а± = 0,25 и а2 = 0,31 те же, что и в обычном методе хорд. Следующее приближение вычисляем по формуле с , , «2 — ах = 0,31 + 0,040 = 0,3223. Мы имеем / (0,3223) = 0,0004. Ясно, что х = 0,3223 дает искомый корень с точностью до 0,0001. § 13. ПРОИЗВОДНАЯ ОТ МНОГОЧЛЕНА При решении уравнения /(х) = 0 методом итераций мно- гое зависит от того, каким способом мы привели уравнение к виду х = ср(х). Одним из лучших способов является во многих случаях способ, предложенный Ньютоном. Этот способ основан на понятии производной. В этом параграфе мы расскажем о том, что такое производная многочлена. Это позволит нам применить метод Ньютона к решению ал- гебраических уравнений, то есть уравнений вида -ф а^-1 Я- йй = 0. (50) Пусть f (х) ==- aoxk 4- arxk^ + ... Я- ak — некоторый многочлен. Рассмотрим многочлен f(x Я~ а), то есть выражение а0(х Я- a)k Я- аг(х Я- + ... + ah. (51) Если раскрыть в выражении (51) скобки, то в некоторых слагаемых а будет отсутствовать, в других — входить в первой степени, в третьих — во второй и т. д. Сгруппи- руем члены, содержащие одну и ту же степень а. Тогда 49
многочлен /(х + а) примет такой вид: f(x + а) = f0(x) + Ы*)а2 + + fk (x)ak (52) (так как степень многочлена f (х) равна k, то наивысшая степень а в разложении (52) тоже равна k). При этом оче- видно, что /'о(х),..., fk (х) также являются многочленами от х. Пример. Пусть / (х) = 2х8 — Зх2 + 6х — 1. Тогда /(х + а) = 2 (х + а)3 — 3 (х + а)2 + 6 (х + а) — 1 = = 2 (х» + Зх2а + Зха2 + а8) — 3(х2 + 2 ха + а2) + 4* 6(х + а)—1 = (2х3 — Зх2 + 6х — 1)4- (6х2 — 6х 4~6)а4- 4- (6х — 3) а2 + 2а8 Значит, в этом случае /0(х) — 2х3 — Зх2 + 6х — 1, /у(х) — 6х2 — 6х + 6, /2(х) — 6х — 3, /3(х) = 2. Мы видим, что слагаемое f0(x) совпадает с/(х). Это не случайно. Если положить в равенстве (52) а — 0, то полу- чится, что /(х) = /0(х). Остановимся теперь на следующем слагаемом ^(х)а. Коэффициент при а, то есть многочлен Д(х), называется производной многочлена ffx). Например, производная много- члена 2х3 — Зх2 4- 6х — 1 равна 6х2 — 6х 4- 6. Производ- ную многочлена /(х) принято обозначать f'(x). Итак, производной f\x) многочлена f(x) называют коэф- фициент при а в разложении многочлена f(x + а) по сте- пеням а. Пользуясь введенными обозначениями, можно перепи- сать формулу (52) в следующем виде: Дх + а) = /(х) 4- f (х)а + ... (53) Точками в этой формуле обозначены члены, содержащие а2, а3, ..., afe. Например, 2(х 4* а)8 — 3(х 4- а)2 4- 6(х 4' а) — 1 = 2х3 — Зх2 + 6х — — 1 4- (6х2 — 6х + 6)а 4- ... 50
Мы ввели понятие производной многочлена Дх). Покажем, как вычислять эту производную. Для этого рас- смотрим многочлен f(x + а) = aQ (х + а)4 + (х + а)*-1 4~ ... • • • + otk-i (.х + сс) + а*. Заменяя каждое слагаемое по формуле (х + а)т = хт + + тхт~г а + ... (см. § 6), мы получим / (х 4- а) = а0 (хк 4- Д-Д 4- • • •) 4- + [ xft~T 4- (k — 1) xft~2a2 4- . .. ] 4- ... Яь-i (х а) 4“ Qfe = = аохь 4- а^-14-. .. 4- ah + 4- а 4- (k— 1) агхк-2^г ... 4" Ял-i] + • • • Сравним это равенство с равенством (53): Дх 4- а) = К*) 4- аД(х) 4- Получаем следующее утверждение: Производная многочлена f (х) = aoxk 4- а^14- ... 4- а^х 4- ah (54) имеет вид Д (х) = кайхк^-\- (k — l)a1xft-24-... 4~ Oa-i- (55) Например, производная многочлена Дх) - 6х7 + 8х» — Зх2 — 1 есть Д(х) == 42х8 4- 24х2 — 6х. § 14. МЕТОД НЬЮТОНА ПРИБЛИЖЕННОГО РЕШЕНИЯ АЛГЕБРАИЧЕСКИХ УРАВНЕНИЙ Вернемся к приближенному решению алгебраических уравнений. Пусть дано уравнение аохк + а^-1 4- 4- ak =- 0. (56) Предположим, что тем или иным путем найдено приближен- ное значение хг корня этого уравнения, и покажем, как 51
найти более точное значение этого корня. Обозначим через aj погрешность значения хь то есть предположим, что х1 + ai является корнем уравнения (56). Тогда имеет место равенство М-Н + «1)А + «1(^1 + “i)A-1 + ••• + ak = 0. (57) Иными словами, /(%1 + aj = 0, где через /(х) обозначен многочлен aoxk + а^-1 + ... + ak. Но по формуле (31) имеем Л-П + «1) = f(Xl) + «1/'(^1) + •••> где точками обозначены члены, содержащие at ..., a*. Таким образом, для определения 04 мы имеем уравнение Длу + 04) = f(%i) + aj'fe) + ... =0. (58) Если начальное приближение х\ было достаточно хоро- шим, то погрешность ах этого приближения мала. Тогда в равенстве (58) члены, обозначенные точками, будут малы по сравнению с av Отбрасывая эти члены, получим для определения а, приближенное равенство Ж) 4“ <*№ 0. (59) Из этого равенства вытекает, что — (б°) Поэтому улучшенное значение хг корня нашего уравнения дается формулой <61’ После этого можно снова улучшить найденное прибли- жение. Третье приближение для корня дается формулой '-3 х" Г 52
Вообще, если найдено /z-е приближение хп искомого корпя, то следующее приближение дается формулой хл+1-х„-2^. (62) / \ЛП' В развернутом виде эта формула записывается так: _ + • • • + ah-lXn + /fiox Xn ka^1 + (fe — 1) aix^2 4- • • • + Если в пределах заданной точности приближенные зна- чения хп и х„+1 совпадут, то наш процесс (в пределах задан- ной точности) закончен и искомое значение корня найдено. Описанный метод решения уравнений принадлежит зна- менитому английскому математику Ньютону. Метод Ньютона тесно связан с методом итераций. Имен- но, если функции у = /(х) и у = /'(х) не имеют общих кор- ней, то уравнение /(х) = 0 равносильно уравнению (64) Применяя к этому уравнению метод итераций, мы получим последовательность чисел хь х2, ..., х„, связанных с тем же соотношением что и в методе Ньютона. Иными словами, метод Ньютона заключается в том, что уравнение f (х) — 0 записывают в виде (64) и применяют к нему метод итераций. Пример. Решить по методу Ньютона уравнение X3 — Зх — 5 — О с точностью до 0,001, приняв за первое приближение Xj =3. Так как производной многочлена f(x) — х3 — Зх — 5 является многочлен Г(х) - Зл® - 3, 53
то формула (62) примет в данном случае вид Поэтому ^ = 3-22я^г = 3-Й-2-«’ х3 = 2,46-14’^S~5 = 2,46 — 0,165 = 2,295, xt - 2,295 — -2’O]|7oi’-3~^ = 2’295“ °’016 2>279’ х. = 2,279 - = 2,279. Мы видим, что с точностью до 0,001 выполняется равенство = хъ. Поэтому корень уравнения х3 — Зх — 5 = 0 с точностью до 0,001 равен 2,279. Изложенный в § 6 метод приближенного вычисления корней является частным случаем метода Ньютона. В самом деле, нахождение у а является не чем иным, как решением уравнения xk — а — 0. Но производная многочлена xk — а равна /гх/г1 и потому для уравнения xk — а - 0 формула (62) примет вид _ v *п — а _ а + (k — 1) х* ^П+1 ~П "7 ьл ь < • kxRn kx* 1 Это и есть формула, по которой вычисляются приближения для у а. Отметим следующую существенную разницу между ре- шением уравнения xk — а = 0 и решением общего алгеб- раического уравнения aQxk аус'1 ak ~ 0. Для уравнения xk — а = 0 выбор начального приближе- ния %! был несуществен. Как бы ни выбрать .значение хь 54
kr- после некоторого числа шагов мы получим значение у а с заданной точностью. Иначе обстоит дело при решении урав- нения (56). Здесь одни начальные значения приводят к одним корням уравнения, другие начальные значения — к другим корням, а некоторые начальные значения не приво- дят ни к какому определенному значению корня — после- довательность чисел ха, ..., хп, ..., вычисляемая по фор- муле (62), не стремится ни к какому определенному пределу, то есть расходится. § 15. ГЕОМЕТРИЧЕСКИЙ СМЫСЛ ПРОИЗВОДНОЙ Метод Ньютона изложен нами пока только для алгебраи- ческих уравнений. Чтобы обобщить его на уравнения про- извольного вида, надо обобщить понятие производной, введя его для любых функций. Для этого выясним геомет- рический смысл понятия производной. Рассмотрим график многочлена у = aoXk 4- аус*-1 + ... + ak и возьмем на этом графике две точки М. и N (рис. 12). Пусть в точке М абсцисса равна х, а в точке N абсцисса равна х + а. Тогда ординаты в точках М и /V даются соот- ветственно выражениями f{x) = aoxk + аускЛ + ... + ah
и f (х + а) = а0 (х + а)й + (х + а)4-1 ф- ... + ak. Проведем через точки М и N секущую и вычислим угловой коэффициент Асек*) этой секущей. Из чертежа видно, что ь ТЫ 1^ = МТ‘ Но отрезок МТ равен разности абсцисс точек М и N, и по- тому МТ = (х + а) — х =-- а. Отрезок же TN равен разности ординат этих точек, и по- тому TN = fix а) — /(х). Значит, = TN _ f (х 4- «) — f (х) g МТ а Но по формуле (53) f (х + а) - f (х) + af (х) + ..., где точками обозначены члены, содержащие а2, а3,... Поэтому где на этот раз точками обозначены слагаемые, содержа- щие а, а2,... Итак, угловой коэффициент секущей MN выражается формулой Асек = tg Ф = f' (х) + ... (66) Будем теперь уменьшать значение а. Секущая MN бу- дет при этом поворачиваться вокруг точки М. В пределе, при а = 0, секущая превратится в касательную к кривой у = /(х) в точке М. На рис. 13 изображены положения 1 1 секущей при а = 1; . Но при а — 0 все члены, обозначенные в формуле (66) точками, обращаются в нуль. Поэтому угловой коэффици- *) Угловым коэффициентом прямой называют тангенс угла наклона этой прямой к положительному направлению оси Ох. Например, если прямая наклонена к оси Ох под углом 60°, то ее угловой коэффициент равен У 3. 56
ент касательной к графику многочлена у = f(x) в точке с абсциссой х выражается формулой kK3C = f(x). (67) Итак, производная многочлена f (х) равна угловому коэф- фициенту касательной к графику этого многочлена, прове- денной в точке с абсциссой х. Пример. Найти, под каким углом наклонена к оси Ох касательная к графику многочлена / (х) = X3 — 4х2 + 5х + 1, проведенная в точке с абсциссой х = 2. Так как f (х) = Зх2 — 8х + 5, то /'(2) = 1. Значит, tgcp = 1, и потому угол наклона ср равен 45°. § 16. ГЕОМЕТРИЧЕСКИЙ СМЫСЛ МЕТОДА НЬЮТОНА Мы можем теперь выяснить геометрический смысл ме- тода Ньютона для приближенного решения алгебраических уравнений. Пусть надо решить уравнение Дх) = 0, где f (х) — некоторый многочлен. Геометрически эта задача яв- ляется задачей о нахождении точек пересечения графика функции у = /(х) с осью Ох, то есть точек, в которых У = 0. 57
Предположим, что уже найдено приближенное значение %! корня этого уравнения. Проведем в точке N с абсциссой х.г касательную к кривой у = f(x). При удачном выборе зна- чения Xi точка Т пересечения касательной с осью Ох будет ближе к точке пересечения кривой у = f(x) с осью Ох, чем точка М (рис. 14). Чтобы найти абсциссу ха точки Т, рассмотрим треуголь- ник TMN. Катет MN этого иное, как значение функции Рис. 14. треугольника есть не что у — f (х) в точке х1г то есть MN — / (xj. Катет же ТМ равен Xj — ха. Отсюда сле- дует, что тангенс угла qy наклона касательной к оси Ох выражается формулой tg<Pi = (68) Из равенства (68) следует, что (69> Но tg qy есть угловой коэффициент касательной к кривой У ~ f (*), проведенной в точке с абсциссой хР Поэтому, в силу геометрического смысла производной, tg qy = f (xj. Значит, формулу (69) можно переписать так: Х2 = Xi f (*i) Г (*i) ’ Тем самым второе приближение для искомого корня найдено. Проведем теперь касательную к кривой у = f (х) в точке с абсциссой х2. Абсцисса точки пересечения этой касательной с осью Ох дается формулой х3 = х2 Цх2) f (хг) Вообще, если уже найдено приближение х„, то, чтобы получить следующее приближение х„+1, надо провести ка- сательную к кривой у = / (х) в точке с абсциссой х„. Абс- цисса точки пересечения этой касательной с осью Ох даст нам хл+1. 58
Формула для вычисления хп+1 такова: = —(70) или, что то же самое, xn+i = хп 1 -- । (70 ) где <р„ — угол наклона касательной к кривой у = / (х) в точке с абсциссой хп. Эта формула совпадает с формулой (62) способа Ньютона. Мы выяснили, таким образом, геометрический смысл способа Нью она. Он заключается в том, что дуга кривой у = f (х) заменяется касательной к этой кривой. Поэтому способ Ньютона называют также способом касательных. На рис. 15 изображено, как точки хь х2, ..., х„,..., по- лучаемые по способу Ньютона, приближаются к точке | пересечения кривой у = f (х) с осью Ох. § 17. ПРОИЗВОДНЫЕ ЛЮБЫХ ФУНКЦИЙ Данное нами геометрическое истолкование способа Ньютона позволяет без труда обобщить его на любые урав- нения вида / (х) = 0, где f (х) может уже не быть много- членом. Именно, чтобы найти решение этого уравнения, возьмем некоторое приближенное значение корня хР В точке с абсциссой Xi проведем касательную к кривой У — f (х) и обозначим через х2 точку ее пересечения с осью Ох. 59
В точке с абсциссой х2 вновь проведем касательную к кри- вой у = /(х) и т. д. Так же как и в случае, когда f (х) яв- ляется многочленом, легко установить, что х„+г = х„-^, (71) где tg ф„ — угловой коэффициент касательной к кривой У — f W в точке с абсциссой хп. Формула (71) пока непригодна для вычислений, так как мы еще не умеем вычислять tg <р„. Итак, нам надо на- учиться вычислять угловые коэффициенты касательных к графикам любых функций у = f (х) (а не только к графи- кам многочленов). Найдем сначала угловой коэффициент секущей. Пусть М — точка на графике функции у — f (х) и MN — секущая, проходящая через эту точку. Рассуждая точно так же, как и для многочленов, мы получим, что уг- ловой коэффициент секущей выражается формулой ^сек = tg ф = . (72) где х — абсцисса точки М, а х + а — абсцисса точки N. Если уменьшать а, то секущая будет поворачиваться во- круг точки М и стремиться занять положение касательной к кривой у = f (х) в этой точке (см. рис. 12). Поэтому мож- но написать, что ^кас = tg Ф = lim + (%) . (73) ос—>-0 а Назовем предел, стоящий в правой части этого равенства, производной функции f (х) и обозначим его через /' (х), то есть положим m = (74) Равенство (73) теперь можно записать в виде йкас = tgcp = f (х). (75) Таким образом, и для любых функций (а не только много- членов) производная функция /(х) в некоторой точке рав- на угловому коэффициенту касательной к кривой у = f (х) в этой точке *). Если в точке с абсциссой х к графику функции у=- f (х) нельзя провести касательную (например, если в этой точке график имеет из- лом), то в этой точке у функции f (л) отсутствует производная. 60
Так как tg <р„ = f' (х„), то формулу (71) можно перепи- сать в виде х -х f(Xn) (7R\ %п+1— %п f (х ) ' \*®) Эта формула совпадает с формулой (62). Таким образом, способ Ньютона перенесен на все уравнения вида f (х) = 0. § 18. ВЫЧИСЛЕНИЕ ПРОИЗВОДНЫХ Мы видели в предыдущем пункте, что для нахождения углового коэффициента касательной к кривой у = f (х) на- до сосчитать предел Л(х)==НтН£±2к1Ш. «-»о а Это вычисление, вообще говоря, довольно затрудни- тельно. Но во многих важных случаях этот предел вычис- лен. Иными словами, для наиболее часто встречающихся функций известны их производные. Приведем список наи- более употребительных производных: 1. (а)' = 0. 2. (xs)' — kx^1. 3. (аж)' = аж1па. 4. (sin ах)' = a cos ах. 5. (cosax)' =—asinax. 7. (ctg ах)' = а sin2 ах 8. (logox)' = -J— . \ ьа / xlna 9. (arcsin ах)' = -..- . /1—а2х2 6- ахУ = • 1 °- (arctg ахУ = • (Через 1п а в формулах 3 и 8 обозначен логарифм по осно- ванию е = 2,71828...— так называемый натуральный ло- гарифм.') Отметим, что в формуле 2 показатель k может быть не только натуральным числом, но и любым веще- ственным числом. Например, (К^) — ) — 2 х 2 /х ’ Ш' = (х^)' = — 2х’8 = — ~ . \Х2/ ' X3 4 5 61
Формул 1—10 еще недостаточно для вычисления про- изводных любых функций. Однако, если функция f (х) составляется с помощью арифметических действий из функ- ций, для которых мы умеем считать производные, то легко найти ее производную. Для этого применяются следующие правила, доказываемые (как и формулы 1—10) в курсах высшей математики. 1. Производная суммы двух функций равна сумме их производных, то есть tfi (х) + К (х)Г = £ (х) + А (х). 2. Постоянный множитель можно вынести за знак производной [af (х)Г = af (х). 3. Производная произведения двух функций вычисляет- ся по формуле (*) А( *)]' = fi (*) A W + fi (х) f2 (х). 4. Производная дроби вычисляется по формуле [71 001' А (х) А (х) — Л (х) А (х) La (x)J ~ [Awi2 Данное в § 13 правило вычисления производной от мно- гочлена является следствием правил 1 и 2 и формулы 2 из списка. Пример 1. Найти производную дроби ' W 2х» + 5 Пользуясь правилом 4, находим f(Y\ _(3ха-х+ 1)'(2х8 + 5) — (Эх* — х + 1) (2x3 -Н 5)' ' — (2х8 7- 5)а Далее, по правилу дифференцирования многочлена (Зх2 — х + 1)' = 6х — 1 и (2х® 4- 5)' = 6х2, 62
а потому f ( (2x® 4 5) (6x—1) — (3xa—x 4 1) 6xa _ ' W ” (2x8 4 5)a — _ — 6x4 4- 4x8 4- 6xa 4- 30x — 5 (2x8 4 5)a Пример 2. Найти производную функции f (х) =- Д (arcsin Зх — ДД . ' ' ' 10 \ xi! Решение. По формулам 2 и 9 и правилам 1 и 2 имеем ' Vе' 10 /1 _ 9>;2 ю\ х8 / ю УТЗТсц? ‘ 5№ ' Пример 3. Найти производную функции f (х) = 10х sin 2х. По правилу 3 и формулам 3 и 4 имеем /' (х) — (10х)' sin 2х + 10х (sin 2х)' = = 10х sin2x in 10+10x«2cos2x= -~= 10х (sin2xln 10 + 2 cos2x). Указанные правила позволяют находить производ- ные во многих случаях. Есть еще одно очень важное пра- вило — правило о вычислении производной сложной функ- ции. Оно формулируется так: Если функцию у = f (х) можно записать в виде у — = F (г), где z — <р (х), то ее производная дается формулой (х) = F' (г)ф'(х), (77) где z = <р(х). Пример. Найти производную функции у = sin (х3). Эту функцию можно записать в виде у = sin z, где z = х3. Производная функции F (?) = sin z равна F' (г) = cos ?, а производная функции <р (х) = Xs равна <р' (х) = Зх2. Применяя формулу (77), получаем [sin (х3)]' = F' (?) <р' (х) = cosz-Зх2. Подставляя вместо г значение г = х3, получаем [sin (х3)!' = Зх2 cos(x3). 63
Более подробное изложение понятия производной чи- татель может найти, например, в книге: Я- Б. Зельдо- в и ч, «Высшая математика для начинающих», Физматгиз, 1960. § 19. НАХОЖДЕНИЕ ПЕРВЫХ ПРИБЛИЖЕНИЙ Остановимся теперь на выборе начальных приближе- ний. Разыскание первого приближения при решении урав- нения /'( х) — 0 можно сделать графически. Для этого на- до начертить график функции у ~ f (х) и найти точки пе- ресечения этого графика с осью Ох (в этих точках у -= 0, и потому / (х) == 0). Если по каким-либо соображениям чертить график функ- ции неудобно (скажем, если уравнение решается на элек- тронной вычислительной машине), прибегают к другому Рис. 16. способу определения первого приближения. Для этого вы- числяют значение функции для некоторых значений аргу- мента (например, для целых значений аргумента, лежащих в известных пределах). Если функция у = f (х) непрерыв- на (то есть ее график не имеет разрывов), то между значе- ниями а и Ь, в которых функция имеет различные знаки (рис. 16, а), лежит корень уравнения f (х) = 0 (если у гра- фика функции есть разрывы, то может случиться, что она скачком переходит от отрицательных значений к положи- тельным, не обращаясь по пути в нуль (рис. 16, б)). Зна- чения а или Ь можно принять за первые приближения для корня уравнения f (х) = 0. Отметим, что при этом можно пропустить некоторые корни уравнения. Так, на рис. 16, в изображен случай, когда функция у — f (х) имеет в двух точках значения од- 64
ного и того же знака, но между этими значениями обраща- ется в нуль. Мы получили, таким образом, две точки: а и Ь. Чтобы выяснить, какую из них лучше выбрать за начальное при- ближение х в методе Ньютона, рассмотрим рис. 17. Рис. 17, а и 17, б показывают, что если кривая обращена вогнуто- стью вверх, то за начальное приближение надо выбирать ту Рис. 17. из точек а и Ь, в которой функция f (х) положительна. Другой выбор начального приближения может даже приве- сти к тому, что точка х2 окажется вне отрезка [a, &J. Точ- но так же, если кривая обращена вогнутост м вниз, то за начальное приближение надо брать точку, в которой функ- ция f (х) отрицательна (рис. 17, в, г). Это правило удобно применять, если известен график функции у = f (х). Если же график этой функции не на- рисован, то определение направления вогнутости требует дополнительных расчетов. Для этого надо найти вторую про- изводную функцию f (х). Второй производной функции f (х) называется производная от ее первой производной. Ей 3 н. я. Виленкин
Например, если дана функция / (х) = Xs — 4х2 + Зх — 1, то ее первая производная равна f (х) = Зх2 — 8х + 3, а вторая производная есть f" (х) = 6х — 8. В курсах высшей математики доказывают, что если на отрезке 1а, Ь] вторая производная положительна, то кривая обращена вогнутостью вверх на этом отрезке. Если же вто- рая производная на отрезке la, Ь] отрицательна, то кривая на нем обращена вогнутостью вниз. Пользуясь этим, полу- чаем такое правило для применения способа Ньютона: Пусть в точках а и b функция f (х) имеет различные зна- ки, причем на отрезке [а, Ь] вторая производная функции f (х) положительна. Тогда за начальное приближение хт надо выбирать ту из точек а или Ь, в которой функция f (х) принимает положительное значение. Если же на отрезке [а, &] вторая производная отрицательна, то за начальное приближение Xj надо выбирать ту точку, в которой функ- ция f (х) принимает отрицательное значение. § 20. КОМБИНИРОВАННЫЙ МЕТОД РЕШЕНИЯ УРАВНЕНИЙ При решении уравнений часто комбинируют методы хорд и Ньютона. Если график функции у — f (х) обращен вог- нутостью вверх, то находят точки а1 и х± по формулам «1 = а — / («) да _ (й) • (78) x'~b~7W- <7Э» Если же график функции у = f (х) обращен вогнутостью вниз, то точку находят по формуле (78), а точку х± — по формуле Х1==а~~Г&)’ (8°) 66
Как видно из рис. 18, а и 18, б, корень Е, уравнения f (х) = = 0 лежит обычно между полученными точками и хА. Применяя снова к этим точкам формулы способа хорд и способа Ньютона, получают новую пару точек а2 и х3 и т. д. Таким путем получают две последовательности точек ах, а2,..., ап,... и х1( х2,..., хп,---, приближающиеся с разных сторон к искомому корню Преимущество описанного способа состоит в том, что при нем получаются приближен- ные значения как с избытком, так и с недостатком. Рис. 18. Пример. Решить комбинированным способом урав' нение х — sin х — 0,5 — 0 с точностью до 0,001. Составим таблицу значений непрерывной функции / (х) = х — sin х — 0,5. X —1 0 1 2 —0,659 -0,5 -0,341 0,591 Из этой таблицы видно, что корень уравнения лежит между 1 и 2. По формулам 2 и 4 из § 18 имеем f (х) == 1 — cos х. Поэтому формула Ньютона принимает в нашем случае вид i/i 4 Н. Я. Виленкин 67
Чтобы узнать, какое из значений 1 или 2 надо принять за х0, найдем вторую производную от функции / (х). По форму- ле 5 § 18 она имеет вид f" (х) = sinx. Но на отрезке [1, 21 функция sinx положительна*). Значит, пользуясь при- веденным выше правилом, за х0 надо взять значение 2, при котором положительна и функция / (х). Имеем по формуле (81) С другой стороны, по формуле (78) имеем = 1— (—0,341) одиД(-О,3< =1'366- Применяя далее формулы (81) и (78) к отрезку [а1; xj, находим 1 гоо 1,533 — 1,030 — 0,5 , х2 = 1,583-----рдрщд—— = 1,501 и а2 = 1,366 + 0,113-Ь||^|-= 1,491. Далее находим xs - 1,498, = 1,498. Итак, корень нашего уравнения с точностью до 0,001 есть 1,498. § 21. ПРИЗНАК СХОДИМОСТИ ПРОЦЕССА ИТЕРАЦИЙ Применим теперь понятие производной для вывода но- вого признака сходимости процесса итераций. Нам по- надобится для этого одна формула, называемая формулой Лагранжа (Лагранж — математик XVIII века, живший во Франции). Рассмотрим на отрезке [а, Ь\ кривую у = f (х). Обозна- чим через М начальную точку этой кривой, а через N — *) sin х положителен на отрезке [0; л] = [0; 3,141...] Значит, sin х положителен и на части [1,2] этого отрезка. 68
ее конечную точку и проведем хорду MN. Угловой коэф- фициент этой хорды имеет вид «хорды — tg Ф — мр PN = f (&) — f (а), и потому (b)-f(a) b— а (рис. 19). Но MP = b — а, а k -1- кхорды ------------------- Обозначим теперь через Т удаленную от хорды MN. Ес- ли провести через эту точку прямую, параллельную хорде, то она будет касаться кривой: в случае пересечения на кри- вой были бы точки, более уда- ленные от хорды MN, чем точка Т. Иными словами, ка- сательная к кривой, проведен- ная в точке Т, параллельна хорде MN, и потому имеет тот же угловой коэффициент, что и хорда. Но угловой ко- эффициент касательной равен f (с), где с— абсцисса точки Т. Поэтому имеет место формула f'(c) = f^Zfa(al- (82) Эта формула и называется формулой Лагранжа. Заме- тим, что точка с в формуле Лагранжа всегда лежит между точками а и Ь. Формулу Лагранжа можно также записать в следующем виде: / (Р) — f (а) = f (с) (Ь — а). (83) Вернемся теперь к решению уравнения х = ср (х) по спо- собу итераций. Пусть отображение у = ср (х) переводит отрезок [а, Ь] в себя, причем на этом отрезке выполняется неравенство | ср' (х) | < q, где q — некоторое число, меньшее единицы, q < 1. Возьмем на отрезке [а, Ь] любые две точки xt и х2. Тогда точки ср (xj и ср (х2) также принадлежат от- резку [«, Ь\. При этом по формуле Лагранжа имеем ср (х3) — <р (х3) = <р' (с) (х3 — хх), 4* 69
где с — некоторая точка, лежащая между и х2, а потому принадлежащая отрезку [а, Ь]. Справедливо неравенство | ср' (с) | < q < 1, а потому I Ф (х2) — <Р (*1) | < q | х2 — Xj |. (84) Неравенство (84) показывает, что <р (х) задает сжимающее отображение. Но мы знаем, что если х ->• <р (х) — сжима- ющее отображение отрезка [а, Н в себя, то для любой точ- ки х0 этого отрезка последовательность х0, Xj,..., х„. где хПг1 = Ф (х„), сходится к корню уравнения х = ф (х). Таким образом, мы доказали следующую теорему: Теорема. Пусть функция у = <р (х) задает отобра- жение отрезка {а, Ь] в себя и пусть на этом отрезке выпол- няется неравенство | ф' (х) | < q, где q <_ 1. Тогда, какова бы ни была точка х0 отрезка [а, Ь], последовательность точек х0, хх,..., хп,..., где хп+1 = <р (х„), сходится к корню уравнения X — ф (х). Грубо говоря, смысл доказанной теоремы заключает- ся в том, что процесс последовательных приближений поз- воляет найти те корни £ уравнения х = ф (х), в которых выполняется неравенство | ф' (В) | < 1. Можно сказать, что эти точки притягивают к себе ломаную, геометрически изображающую процесс итераций (см. § 8), а точки, где | ф' (£)| > 1, отталкивают от себя эту ломаную. Если неравенство | ф' (х) | < q < 1 выполняется на всей числовой оси, то процесс итераций сходится при лю- бом выборе начального приближения х0 (см. § 10). Пример 1. Можно ли применить процесс итераций для решения уравнения cos х -4- sin х r, х =------1----- ? В данном случае Поэтому , , , — sin х 4- cos х ф (х) = -------. Но । sin х | 1, | cos х I О 1, поэтому I , , х , I — sin X + COS X I I sin X I + I COS X I 1 k W! = | --------4---------------- 4------ <2-’ и процесс итерации применим. 70
Пример 2. Применим ли процесс итераций для ре- шения уравнения х = 4 _ 2*? (85) Искомый корень лежит на отрезке [1, 2], так как непре- рывная функция у = х — 4 + 2х меняет знак на этом от- резке: 1 — 4 + 21 < 0, а 2 — 4 + 22 > 0. Но в данном случае имеем <р'(х) = — 2х 1п 2. Оцепим выражение 2х In 2 на отрезке [1, 21. Если и потому 1 х 2, то 2 < 2х «С 4, 2 In 2 < 2х In 2 < 4 In 2. По таблицам натуральных логарифмов (основанием кото- рых является число е 2,78...) имеем 1п 2 = 0,69... Зна- чит, на отрезке [1,2] выполняется неравенство 1,38... < 2х 1п 2 < 2,76... и процесс итераций неприменим. Чтобы применить процесс итераций, преобразуем урав- нение (85). Перепишем его в виде 2х = 4 — х и прологарифмируем обе части по основанию 2. Тогда по- лучим х = log 2 (4 — х). В этом случае ф W = (4-х) 1П 2 и на отрезке [1,2] выполнено неравенство |ф (*)К 2 In 2 1,38 < ’• (Вывод этого неравенства читатель легко сделает сам.) Поэтому при такой записи уравнения процесс итераций сходится. 71
§ 22. БЫСТРОТА СХОДИМОСТИ ПРОЦЕССА ИТЕРАЦИЙ*) Используем теперь производную функции ср (х) для оцен- ки скорости сходимости итераций при решении уравнения х = ср (х). Мы хотим оценить скорость, с которой убывают погрешности | — хп приближенных значений хх, .... хп,... корня s- —।----------;--1—।----------1— и i с, х, - Ъ Рис. 20 Заметим, что справедливы равенства £ = <р (!•) и x„+t = ==> ср (хп). Из них вытекает Яп+1 = g — хп+1 = ф (£) — ф (хп). Но по формуле Лагранжа имеем ф (ё) — ф (лд) = ф' (tn) (£ — хп) ф' (с„) ап, где сп — точка, лежащая между точками хп и £. Поэтому ап+1 = ф' (с„) ап. (86) Из равенства (86) вытекает следующий вывод: Пусть £ — корень уравнения х = ф (х) — лежит на отрезке [a, М. Если на этом отрезке выполняется неравен- ство | ф' (х) | < q < 1, а начальное приближение %! также выбрано на отрезке [а, Ь], то при любом п выполняется со- отношение K+i| < KI- (87) В самом деле, из равенства (86) имеем |^2| = | Ф' (сО || aj. Но точка q лежит на отрезке [а, 6] (рис. 20), и потому I ф'(С1) I < 7- Отсюда следует, что _______________ k> I < < I м I *) Этот параграф при первом чтении можно опустить. 72
Точно так же мы | «3 | = и вообще получаем, что I ф' (^2> || 0С21 <q |а2| < Л а11 I ^/i+i | < qn |^i |- Тем самым наше утверждение доказано. Так как при 0 < q < 1 последовательность чисел q, q2,..., qn,... стремится к нулю, то и погрешность а,1+1 стре- мится к нулю с возрастанием п. Иными словами, при ука- занных выше предположениях числа х1;..., хп,... приближа- ются к числу £, причем разность |£ — хП411 убывает бы- стрее, чем | Xj | qn. Точно так же можно доказать, что если на отрезке la, i>] выполнено неравенство Iф' Wl > 1. то процесс итераций расходится. Особенно быстро сходится процесс последовательных приближений, если в точке £ производная функция q; (х) обращается в нуль. В этом случае по мере приближения к £ значение <р' (х) стремится к нулю. Так как |&/г+1 | | ф Фи) | | ®п|, то сходимость процесса ускоряется по мере приближения к точке £. Мы уже столкнулись с этим обстоятельством при извле- чении квадратных корней по способу итераций. На- помним, что при этом мы заменили уравнение х2 — а урав- нением х = х . Но производная функции ф (х) — -х Т а ил ил равна выражению , , , _ (х- + а)' 2х — (х2 + а) (2х)' _ ~ ix- _ 2х-2х — (х2 + а) 2 _ х2 —а — 4х2 2х2 (см. правило 4 из § 18 и формулу (55) из § 13), поэтому Ф'(/а) = (Уа)--а 2С/а)2 73
Таким образом, в точке х~У а производная функции ф (х) обращается в нуль, а это вызывает ускорение сходимости процесса по мере приближения к точке х = У а. Явление ускорения процесса по мере приближения к корню уравнения наблюдаемся и для способа Ньютона (част- ным случаем которого является указанный способ извле- чения корней). В самом деле, мы уже отмечали, что способ Ньютона связан с заменой уравнения/ (х) = 0 уравнением и последующим решением этого уравнения последователь- ными приближениями. В этом случаем мы имеем ф (х) = X----[Я , ’ Пх) ’ но 1 Г Нх) Т _ , Г(хШ(х)]' —((х)[Пх)]' — Ф “ 1 L Г(Х) J ~ [Г (Х)]2 = 1 — И' (Х)Р—/ (Х)Г (X) f (X) f" (X) lf'(x)]2 [/' (X)]2 • Так как в точке | выполнено равенство / (£) = 0, то ф' (£) = = 0. А это, как было показано, обеспечивает ускорение сходимости процесса приближений по мере стремления к точке § 23. РЕШЕНИЕ СИСТЕМ ЛИНЕЙНЫХ УРАВНЕНИЙ МЕТОДОМ ПОСЛЕДОВАТЕЛЬНЫХ ПРИБЛИЖЕНИЙ Мы решали до сих пор уравнения с одним неизвестным. Перейдем теперь к решению систем уравнений. При этом мы начнем с рассмотрения систем первой степени. Пусть даны т уравнений первой степени с т неизвест- ными *) ЙцХ1 ПДэХг UimXm = bl, CliiXi -|- а22Х2 "Г . . . -Т ClimXm = Ь2, (gg) Я/ni-Xl "I- &т Хз -ф . . -Т ЧттХт = Ьт. *) Мы обозначаем в этих уравнениях неизвестные буквами х1( х2, . . . ..., хт, а коэффициенты — буквами а;;-. Здесь Первый значок обо- значает номер уравнения, а второй — номер неизвестного. Например, а47 —это коэффициент в четвертом уравнении при седьмом неизвестном. 74
Такие системы встречаются в различных приложениях. Например, когда геодезисты уравнивают результаты из- мерений больших частей земной поверхности, им приходит- ся иногда решать системы, состоящие из многих сотен уравнений. Приходится решать такие системы уравнений и инженерам при расчете стержневых конструкций и мно- гим другим специалистам. Решать такие системы обычными методами (например, методом исключения неизвестных) часто бывает чрезвы- чайно затруднительно. Более удобным оказывается метод последовательных гоиближений. Покажем сначала на при- мере, как это делается. Пусть дана система уравнений 10хг — 2х2 + х3 — 9, + + 5х2 — х3 = 8, 4хх + 2х2 + 8X3 = 39. Требуется найти неизвестные х1( х2, х3 с точностью до 0,01. Выразим из первого уравнения х1( из второго уравне- ния х2 и из третьего уравнения х3. Тогда система примет такой вид: Xi = 0,9 4- 0,2 х2 — 0,1 х3, х2=1,6 — 0,2xi+ 0,2 х3, х3 = 4 — 0,5X1 —0,25 х2. (89) Возьмем любые значения хх, х2, х3 в качестве начальных приближений, например, положим Xi0) = 0, х20) = 0, Хз0) = 0. Подставим эти значения в правые части равенства (89) и примем получающиеся значения xv х2, х3 за следующие приближенные значения. Мы получаем х?’ = 0,9; х2п = 1,6; х(3п = 4. Найденные значения снова подставим в правые части урав- нений (89). Получаем приближения 42> = 0,9 + 0,2-1,6 — 0,1-4 = 0,82, х® = 1,6 — 0,2-0,9 + 0,2-4 = 2,22, = 4 — 0,5-0,9 — 0,25-1,6 = 3,15. 75
Вообще, если найдены значения х^, х(2п), х3п), то сле- дующие приближения вычисляются по формулам х<л+1> = 0,9 + 0,2хГ’ — 0,14п), хГ+1) = 1,6 — 0,2хГ’ + 0,2хГ\ х(3п+1) = 4 — 0,5х(л) — 0,25хГ- (90) Результаты вычислений приведены в табл. 2. Таблица 2 п 1 2 3 4 5 6 xf 0,9 0,82 1,03 1,01 1,00 1,00 г(п) х2 1,6 2,22 2,07 2,00 1,99 2,00 4,0 3,15 3,03 2,97 3,00 3,00 Мы видим, что в пределах заданной точности выполняются равенства х? = х«\ х<в) = х<У, 46) = Х<6). (91) Полагая в равенствах (90) п = 5 и принимая во внимание равенства (91), получаем, что в пределах заданной точности х*6)«0,9+ 0.2Х® — 0,1Хз6), х(5)~1,6— 0,2xi6) + 0,2х(36), xf ~ 4 — 0,5xi6) — 0,254й (на самом деле, эти равенства выполняются точно, но это несущественно). Отсюда следует, что числа х(й = 1,00; х!,6’ = 2,00; хГ = 3,00 являются (в пределах заданной точ- ности) решениями заданной системы уравнений. Точно так же поступают в общем случае *). Пусть дана система уравнений (88). Выразим из первого уравнения хр •) Дальнейший текст до конца этого napai рафа может быть опущен при первом чтении. 76
из второго — х2 и т. д. Тогда система (88) примет такой вид: апи тт тт y ami y ат,т-1 Л1 • • • "" п итт итт (92) ПустьхР х(п—некоторые начальные приближения для неизвестных х1,...,хт. Подставляя эти приближенные значения в правые части равенств (92), мы получим вторые приближения х^,... .... х'т для искомых неизвестных: х<? = Ьг аи 012 Ы1) • Ло • Оц • • х<2) = Ьг а21 (1) - . - <-^22 <2‘22 __ °lfrl г(1) Лт ’ <2ц а2т „(1) Xnt ’ (2) Ьп aml (1) atn.m~l (1) хт — д----••• а т~1’ итт тт тт Точно так же если уже найдены n-е приближения х("> х(2Л) х(т для неизвестных, то следующий шаг вы полня ется по формулам aJ2 ап а1т у(п) п л т ап „(л) лт „(п+1) Ьп aml (п) Лт —--------------------~~---Л1 tft 11 (1 А итт итт .(п '1П-1 (93) Рассмотрим теперь задачу, в которой речь будет идти не о решении системы линейных уравнений методом после- довательных приближений а, наоборот, о нахождении 5 Н. Я- Виленкин 77
предельного состояния некоторого процесса приближений путем решения системы уравнений. Имеется три ведра. В первом из них 12 л воды, а второе и третье ведра пустые. Из первого ведра переливают поло- вину воды во второе, потом из второго ведра — половину воды в третье и, наконец, из третьего ведра — половину воды в первое ведро. Этот цикл повторяют 20 раз. Требуется оп- ределить (с точностью до OjOOOl л), сколько воды окажется после smoeo в каждом ведре. Ясно, что здесь речь идет о последовательных прибли- жениях к некоторому предельному распределению воды. Это предельное распределение характеризуется тем, что оно не меняется после проведения одного описанного выше цик- ла переливаний. Если в начале цикла в первом ведре х литров воды, во втором у, а в третьем 12 — х — у литров (общее количество воды не меняется в процессе перели- вания), то описанный выше цикл задается следующей таб- лицей: 1-8 ЙС.ЦрО 2-е ведро 3-е ведро Начальное состояние X У 12—х—у X После 1-го переливания V ~2~+У 12—х—у X X у 3 у После 2-го переливания 12--4-х-у , X у .V . у г 3 и После 3-го переливания С’ Т 8 — 4 “Г+1Г Для того чтобы этот цикл переливаний не изменял коли- чества воды в каждом ведре, должны выполняться следую- щие уравнения: , х у Х = 6+ Решая их, находим, что х — 6, у = 3. Значит, предель- ное распределение характеризуется тем, что в первом вед- ре 6 л воды, во втором 3 л, а тогда и в третьем будет 3 л воды. Выясним, с какой скоростью приближается заданное распределение воды к предельному. Пусть первое ведро еодержит а литров, а второе b литров. После одного цикла 78
в первом ведре окажется 01 = 6 + b 4 а К (94) литров, а во втором , а b 2 (95) литров. Обозначим а — 6 через а, b — 3 через р, аг — 6 через и b-L — 3 через pt. Тогда из равенств (94) и (95) следует, что и R ь о а— 6 &— 3 аВ т т После второго цикла погрешности будут выражаться фор- мулами „ _ _“t_______Pi _ J_ la_ 1 /л, JJ \ _ 3 8 4 ~ 8 к 8 4 / 4 \ 4 ‘ 2/ ~ 1. (л. _ lb ' 1 г 4 \ 8 4 / ”4" 2 \ 4 ' 2 / 32 Поэтому если | а | < е и I р | < а, то I ^2 ! 13 о 4 е~0,2е, | Рг | дт 8 — 0>34 е. Это означает, что два цикла переливаний уменьшают по- грешности а и р не менее чем в три раза. Поэтому после 20 циклов она уменьшится по крайней мере в З16 ~ 70 000 раз. Значит, с точностью до 0,0001 л после 20 циклов пере- ливаний в первом ведре будет 6 л воды, во втором — 3 л и в третьем 3 л. 5*
§ 24. РЕШЕНИЕ СИСТЕМ НЕЛИНЕЙНЫХ УРАВНЕНИЙ МЕТОДОМ ПОСЛЕДОВАТЕЛЬНЫХ ПРИБЛИЖЕНИЙ Методом последовательных приближений (итераций) можно решать и некоторые системы нелинейных уравнений. Рассмотрим, например, систему уравнений Выберем в качестве первых приближений х0 = 0, у0 = 0. Подставляя эти приближения вместо х и у в правые части уравнений, получим следующие приближения: хг = , Уу = 1. Подставляя эти приближения в правые части урав- нений (96), получаем = 2 + 2^-1 = 2,25, й=1 + -^=1,15. Продолжая этот процесс, мы получим V „ 2 4 2’25М 145 -2 31 л3 — Z -f- 1» Уз=1 +А25..+..14£^1,18, Xi = 2 + ^ = 2,33, У4 = 1 + ^31+^.. = 1,18, v = 2 + = 2,33, Лу . , 2,.33 + 1,185 . 1Q у5 = 1 н :~ = 1,18. s । 20 Мы видим, что с точностью до 0,01 выполняются равенст- ва х4 = х3 = 2,33 и уц = у5 = 1,18. Поэтому с указанной точностью имеем х = 2,33 и у = 1,18. Вообще, если задана система уравнений х = ф(Х, у), ' у = ^(x, у), . (97) 80
где ср (х, у) и ф (х, у} — какие-то функции, то мы выбираем начальные приближения х0 и у0, подставляем их в правые части уравнений (97) и далее ведем расчеты по формулам х„+1 = ф (х„, | г/п+1 = Ф (x„, уп). J (98) Если при некотором номере п с заданной степенью точности выполняются равенства хл+1 хп, ум ~ хп, то с этой сте- пенью точности имеем х^ахп, У ~ Уп- Точно так же решаются системы уравнений с тремя и большим числом неизвестных. Выясним теперь, при ка- ких условиях можно гаранти- ровать сходимость процесса последовательных приближе- ний при решении систем. Мы будем считать, что функции ср (х, у} иф (х, у) в си- стеме уравнений (97) заданы в некоторой ограниченной замкнутой области D на плоскости х, у. Иными словами, мы будем считать, что область D целиком лежит внутри какого-то квадрата и что ей принадлежат все ее граничные точки. Примерами таких областей могут служить круг, многоугольник (взятый вместе с граничной ломаной), эллипс и т. д. Мы будем считать, кроме того, что функции Ф (х, у) и ф (х, у) непрерывны в области D. Функции ф (х, у) и ф (х, у) задают отображение области D на какую-то область, лежащую в той же плоскости. Чтобы найти, в какую точку переходит точка Л10 (х0, г/0) области D, надо подставить ее координаты вместо х и у в ф (х, у) и ф (х, у). Результаты подстановки и дадут координаты образа точки УИ0. Например, если ф (х, у) = х2 + г/2, Ф (-4 У) ~ %ХУ> то точка Мо (1, 3) переходит в точку No (10, 6). В дальнейшем мы будем обозначать отображение, за- данное функциями ф (х, у) и ф (х, у) одной буквой Ф, а об- раз точки М при этом отображении обозначим Ф (Л4). Через Ф (D) обозначим образ всей области D, 81
Пусть отображение Ф переводит область й в ее часть Dj = Ф (D). Тогда можно повторно применить то же са- мое отображение. При этом область перейдет в свою часть Z)2== Ф (DJ, которая, конечно, тоже лежит в области D. Продолжая этот процесс, мы получим систему вложенных друг в друга областей D, Dr, Dn,... (рис. 21). Назовем отображение Ф сжимающим, если существует такое число q, что 0 < q <с 1, и для любых двух точек и Л12 из области D выполняется неравенство г (Ф (Л^), Ф (Л12)) < qr (Л11; М2). Здесь через г (Л1, Л') обозначено расстояние между точками М и N. Точно так же как и в случае одного переменного, до- казывается следующее утверждение: Пусть отображение Ф переводит область D в свою часть и является сжимающим. Тогда в области D есть единст- венная точка N такая, что N — Ф (jV). Эта точка принад- лежит всем областям Dn. Координаты "П точки N удов- летворяют системе уравнений (97), то есть ъ = ф (i, 11), П = Ч1 (L 10- Как и в случае одного переменного, значения Вир приближенно вычисляются методом итераций. Если Мо (х0, Уо) — любая точка области D и Мп^ = Ф (Al„) (то есть = ср (хл, уп), yn^i — ф (хп, хм)), то последова- тельность точек Мо, Мп>... сходится к неподвиж- ной точке N отображения Ф. § 25. ВИДОИЗМЕНЕННОЕ РАССТОЯНИЕ Условие, что отображение Ф является сжимающим, дает достаточный признак сходимости процесса итераций. Но этот признак не является необходимым. Отображение Ф может не быть сжимающим, а процесс итераций все-таки сходится. Например, отображение Ф, заданное функци- ями ф (х, у) =14-2г/, ф(х, у) = 3 4- не сжимающее. Если взять А (8, 0), В (8, 4), то г (А, В) = 4, Ф (А) = (1, 4), Ф (В) = (9, 4) 82
и г (Ф (Л), Ф (В)) -= 8 > г (А, в). Однако, какую бы точку Л1о мы ни взяли, последователь ность точек Мо, Мп,... сходится к точке В некоторых случаях удается установить сходимость процесса итераций, видоизменив определение расстояния между точками на плоскости. Дело в том, что расстояние между точками можно определять по-разному. Для путе- шественника естественно измерять расстояние временем, ко- торое надо потратить, чтобы добраться из точки Л в точ- ку В. А тогда расстояние между точками Л и В на рис. 22, а определится суммой длин отрезков Л С, CD и DB (что- бы попасть из точки А в точку В, надо дойти до моста CD, перейти этот мост и из точки D попасть в точку В). А если движение на плоскости может происходить только в двух взаимно перпендикулярных направлениях, то за рассто- яние между точками Л и В на рис. 22, б надо принять вум- му отрезков АС и СВ. В других случаях удобнее считать «расстоянием» между точками Л и В длину большего из от- резков АС и СВ. Можно придумать и другие определения «расстояний» между точками плоскости. (Подробнее о раз- ных определениях расстояний можно узнать из книги Ю. А. Шрейдера «Что такое расстояние?».) 83
Обычно требуют, чтобы расстояние г (Л, В) между точ- ками обладало следующими свойствами: 1) Расстояние г (А, В) между любыми двумя точками А и В неотрицательно, причем оно равно нулю лишь в случае, когда точки А и В совпадают. 2) Для любых двух точек А и В выполняется условие симметрии г (Л, В) =- г (В, .4). 3) Для любых трех точек А, В, С выполняется неравен- ство треугольника г (А, В) < г (Л, С) + г (С, В). Если в каком-нибудь множестве объектов определено расстояние, обладающее этими свойствами, то это множе- ство называют метрическим пространством, а элементы множества — точками этого пространства. Точками мет- рического пространства могут быть даже функции. Для непрерывных функций q> (х) и ф (у) на отрезке [а, Ь] рас- стояние определяют как наибольшее значение функции | ср (х) — ф (х) | на этом отрезке: г(ф, ф)= max | ф (х) — ф(х) |. Мы уже видели выше, что плоскость можно различными способами превратить в метрическое пространство: для всех указанных выше способов определения расстояния вы- полняются условия 1) — 3). Укажем интересный пример, когда условия 1) и 3) выполнены, а условие симметрии 2) не выполняется. Будем измерять расстояние между точками А и В в горной местности временем, нужным, чтобы по- пасть из А в В. Так как время подъема на вершину горы отличается от времени спуска с нее, тог (Л, В) =р г (В, Л). Оказывается, что для сходимости процесса последова- тельных приближений при решении системы уравнений ' (99) У--- ф(х. у) J достаточно выполнения следующего условия: Отображение Ф, задаваемое функциями <$(х,у) и ф (х, у), переводит область D в себя и является сжимающим от- 84
носительно хотя бы одного «расстояния» г (А, В). Иными словами, должно существовать число q такое, что Q<iq<Z <; 1, и для любых двух точек и М2 из D выполняется не- равенство г( Ф (MJ, Ф (М2)) < qr (Л1Н М2). Возьмем, например, функции ср (х, у) = 1 ф- 2у и ф(х,?/) 3 + —. Оказывается, что определяемое ими ото- бражение Ф является сжимающим с коэффициентом 1/2, если определить расстояние г (А, В) между точками А (лу, уА и В(х2, уА формулой г (Л, В) = I — (х2 — x'i) + 2 (у2 — у А | + 4-1 -2_ (х2 — хА — 2 (z/2 — уА | . Например, для точек А (8,0) и В (8,4) имеем г (А, В) = = 16, а для их образов Ф (Л) и Ф (В) имеем г (Ф (Л), Ф (В)) = 8. После отображения Ф «расстояние» вдвое уменьшилось. Именно этим объясняется, что процесс итераций для реше- ния системы уравнений х = 1 + 2у, сходится, хотя отображение Ф и не является сжимающим относительно обычного расстояния (см. стр. 82). § 26. ПРИЗНАКИ СХОДИМОСТИ ПРОЦЕССА ПОСЛЕДОВАТЕЛЬНЫХ ПРИБЛИЖЕНИЙ ДЛЯ СИСТЕМ ЛИНЕЙНЫХ УРАВНЕНИЙ Применим получений выше признак сходимости к си- стемам линейных урагнений. Выбирая различным образом «расстояния», мы получим признаки сходимости для этих систем, выраженные через свойства их коэффициентов. 85
Рассмотрим сначала систему двух линейных уравнений с двумя неизвестными ЯцГ + а12у - 6Ъ | ацХ 4- а22у — &2- ; (100) Пусть ап =^= 0 и я22 4= 0. Решим первое уравнение отно- сительно х, а второе — относительно у. Получим систему уравнений С?22 ^22 ГТ Q #12 О Для краткости положим — = рь----------------------— аг, — = В2 а1Х а13 - = а3. 0-22 Тогда система примет вид х ~ Л1У "Г Рь | (100' В данном случае функции, задающие отображение Ф, имеют вид ф (х, у) = aty 4 Ръ ф( х, у) = а2х 4- Р2- Выясним, какими должны быть коэффициенты а1 и а2 для того, чтобы это отображение было сжимающим. Как известно, расстояние г (А, В) между точками A(xi, yr) и В (х2, у2) выражается формулой г (Д, В) — (Л'2 — Xi)2 4 (Уъ — J/i)2- Преобразование Ф переводит точку А в точку А1(а1у1 4- 4 Pi, а2%! 4 Р2), а точку В — в точку В} (oq^g 4 4- Pi,«2x2 + Рг)- Расстояние между этими точками выража- ется формулой г (Д1, Bi) = |4(311/2 — <xij/i)2 4 (<хг-'.2 — a2%i)2 — = У^у^У1)2 4 а2 (ад - xi)2. (101) Обозначим большее из чисел | ctx | и | а, | через q: q = max (| cq i, j a,, I). 86
Тогда из формулы (101) вытекает неравенство г (А, < q (х2 — %!)2 4- (г/а — У1У‘ = qr (Л. В). Значит, если q <_ 1, то отображение Ф является сжи- мающим на всей плоскости. Тогда, как мы знаем, процесс последовательных приближений сходится. Итак, мы доказали, что если max (jail, |a2|)< 1, (102) то процесс последовательных приближений при решении системы уравнений (100') всегда сходится. Выразим полученный признак сходимости непосредст- венно через коэффициенты системы уравнений (100). Для этого вспомним, что Подставляя эти выражения в условие (102), получаем следую щий вывод: Для сходимости процесса последовательных приближе- ний при решении системы линейных уравнений апх ЩлУ = ^i> a2ix + а22у = Ь2 достаточно, чтобы выполнялось условие Это условие выражает, что диагональные коэффициент ты должны быть больше, чем недиагональные коэффици- енты, стоящие в той же строке. Поэтому, например, при решении системы х — Зу = — П, 6х -4- у — 10 первое уравнение надо решить относительно у, а второе — 87
относительно х: У 5______у_ 3 6 • Иногда полезно предварительно преобразовать систе- му уравнений, заменив неизвестные хну пропорциональ- ными им неизвестными. Возьмем, например, систему урав- нений } с®) ол ~У ~~~ * • Для нее max i Д_ ,12 ’ и поэтому не выполняется достаточный признак сходимо- сти процесса приближений. Но если положить х = ~ г, то О получим систему 4г + У ~ 14, | г —2у = — 1, J (Ю4) для которой max ! Got &22 I 1 max -7- \ 4 1 \ 1 Значит, систему (104) можно решать последовательными приближениями. Разумеется, никому не придет в голову решать столь простые системы, как (104), методом последовательных приближений. Но для систем с большим числом неизвест- ных этот метод бывает очень полезен. Достаточные призна- ки сходимости для решения системы аих1 яггЛ'а 4~ • • • Д- ainxn — bi. а21х1 Д' Й22х2 -(-••• ~|- а^цХц, — bi, (105) O-nlXl Д' Д- • • • 4“ 0-п.цХп — Ьп . устанавливаются примерно так же, как и для системы урав- нений с двумя неизвестными. Однако здесь разные опре- деления расстояния между точками приводят к разным ре- зультатам. Именно, справедливо следующее утверждение: Процесс последовательных приближений для систе- мы (105) сходится, если выполнено одно из следующих 88
условий: (106) (107) (ЮЗ) В суммах (106) и (107) штрих обозначает, что опущено слагаемое, для которого i = /. В сумме (108) значок (k) означает, что опущены не только слагаемые, для которых i — /, но и слагаемые, для которых i = k. Отметим, что ус- ловие 3) заведомо выполняется, если 1, (109) где штрих означает пропуск слагаемых, для которых i — j. В большинстве книг по вычислительной математике это ус- ловие приводится именно в форме (109). Как мы уже говорили, условия (106) — (108) получа- ются, если потребовать, чтобы отображение Хп * 61 Чц й|2 г ___ 411 2 ап хп ап1 „ ап2 „ ----Л1 - Л2 а---а ипп пп а1, п-1 %п-1 было сжимающим относительно некоторого расстояния. Именно, условие (106) соответствует расстоянию г (А, В) = max (|.ху — г/j|..... |х„—r/„|), условие (107) соответствует расстоянию г (Д, В)= х,— у£\ i=i /п 2 — У‘У между точками Л(зу,..., х,;) и В (zy,..., уп). 89
Как и в случае двух переменных, иногда бывает полезно заменить неизвестные ,гт, . . хп пропорциональными им неизвестными У1 = • •, Уп ” Рпхп> гае Pi > 0. Рп > °- В этом случае условия (106), (107), (108) примут вид 1') max i п 2' /"=i а а а Г 2') шах i п 2' Z=1 п я ! ! а Pl Р: С 1 3') max к п i, 7=1 аи aii 2 Р21 о Р1 4 1 (106') (107') (108') В час гное го, при I аи | эти условия принимают вид 1") max V 3/ /Z;; <1, (106") n i 2") max 2' <1, (107") ‘ Z=1 3") max V k /-1 i, — tk) 4 c jl 2 < 1. ii (108") Для примера рассмотрим систему уравнений х — 0,6// — 0,5г ~ — 2,6, — 0,2х 4- р — 0,4z — 3, — 0,1% 4~ 0,5г/ 4- г = 3,9. Условия 1), 2), а также Г), 2') для этой системы не вы- полняются. Точно так же для нее не имеет места неравен- ство (109) — сумма квадратов недиагональных элементов равна 1,07. Но и., max 2 = шах (0,62 4~ 0.52 4~ 0,22 0-0,42; 0,62 + 4- 0,52 4- 0,12 Д-0,52 ; 0,22 + 0.42 4~ 0,12 + 0,52) = = 0,87 < 1, и поэтому систему можно решить методом последовательных приближений. 90
Заметим, что все сформулированные выше условия до- статочны для сходимости процесса последовательных при- ближений, но они никоим образом не являются необходи- мыми. Выбирая другие определения расстояния между точками и записывая условие сжимаемости, мы получаем иные условия сходимости. Однако этот вопрос мы не бу- дем сейчас рассматривать. Для систем линейных уравнений верны те же замеча- ния, какие были сделаны в § 5. Например, результат при- ближений не зависит от выбора начального приближения. Поэтому если в ходе вычислений была допущена ошибка, то она не обесценивает дальнейших вычислений, а лишь замедляет достижение окончательного результата. Существует ряд разновидностей способа последователь- ных приближений для решения систем линейных урав- нений. Так, в некоторых способах, найдя приближенное значение xln+1), подставляют для нахождения x(2n'rl) значе- ния x-L”+l), х(з\ х(4* ,..., х{т', потом для нахождения х(3п+1> подставляют значения Xin+1), хУ*х\ хУ, ..., х(£! и т. д. Опи- сание всевозможных способов приближений для систем ли. нейных уравнений могло бы стать темой другой книжки- § 27. ПОСЛЕДОВАТЕЛЬНЫЕ ПРИБЛИЖЕНИЯ В ГЕОМЕТРИИ Мы описали применения способа последовательных приближений для решения уравнений и систем уравнений. Этот метод находит приложения и в некоторых вопросах геометрии, например, при вычислении длины окружности. Как известно, чтобы вычислить длину окружности, снача- ла находят периметр вписанного в нее квадрата, потом пе- риметр вписанного правильного восьмиугольника, пра- вильного шестнадцатиугольника и т. д. Предел этих пе- риметров и равен длине окружности. При этом каждый по- следующий периметр вычисляется с помощью предыдуще- го. Это делается следующим образом: Обозначим сторону правильного 2л-угольника через Ап, а его периметр через Рп- Например, А2 является стороной квадрата, и потому А2 - R У 2, Р4 — 4R У2. Предположим,
что мы уже нашли Рп. Тогда, очевидно, Ап 2" В геометрии доказывается, что сторона а2п правильного вписанного 2л-угольника выражается через сторону ап правильного вписанного и-угольника и радиус R окруж- ности по формуле*) (ИО) Значит, сторона Апц правильного З^-угольника вы- ражается через сторону Ап правильного 2п-угольника по формуле Ап+1 — R ^^2—]/4~—. р р Поскольку Ап = ~ и Ап+1 = , то *) Эту формулу легче всего вывести с помощью тригонометрии. Оче- (И0-) видно, если ап — сторона правильного вписанного n-угольиика, а а2п — сторона правильного вписанного 2п-уголь- ника, то СТ Tt ап = 2R sin — и а2п — 2R sin (см. рисунок). Так как
Последовательность чисел Рг, Р3,..., Рп--- стремится к дли- не окружности, то есть к значению 2л7?. Поэтому формулу (ПО) можно рассматривать как формулу для вычисления значения 2л7? по способу последовательных приближений. Пользуясь этим способом, можно найти значение л с лю- бым числом десятичных знаков. Существует другой способ приближенного вычисления л, называемый способом равных периметров. При этом спо- собе правильный 2Г!-угольник заменяется правильным 2Л+1- угольником, имеющим тот же периметр. Обозначим апо- фему правильного 2л-угольника через 1п, а радиус описан- ной окружности через гп. Апофему же правильного 2n+1- Рис. 23. угольника, имеющего тот же периметр, что и 2'г-угольник, обозначим через /n+i, а радиус описанной окружности — через /д+1. Пусть АВ (рис. 23) — сторона 2'г-угольника, вписанного в окружность радиуса гп. Соединим середину С дуги АВ с точками А и В и проведем среднюю линию DE треуголь- ника АСВ. Очевидно, что угол DOE равен половине угла АОВ. Поэтому DE является стороной правильного 2'г+1-уголь- ника, вписанного в окружность с радиусом OD. Так как DE = у АВ, то периметр 2Г!+1-угольника равен пери- метру 2л-угольника. Это означает, что r„+i = OD, = ок. 93
Легко сосчитать, что /л+1 = ОК = ^4^ • (1И) Далее, из прямоугольного треугольника ODC находим гп+1 = V гп1п+1. (112) Формулы (111) и (112) выражают гп+1 и 1п+1 через гп и 1п. При возрастании п периметры многоугольников не ме- няются, а числа гп и 1п приближаются к одному и тому же пределу. Этот предел равен радиусу окружности, длина ко- торой равна периметру наших многоугольников. Если выбрать начальный многоугольник так, чтобы его периметр равнялся двум, то как г„, так и 1п стремятся к числу —; 1 - <1/1 11 гп гп = — ; 1; m I п = — . тг L -ГТ п--*оо л—>сс Например, если выбрать за первый многоугольник квад- рат со стороной 1/2, то г2 = , /2 = 4” • Поэтому имеет /2 место следующее утверждение: если положить г2 = , 1 1.2 = — и вычислять значения г„+1, 1п+1, п = 2, 3,... по формулам (111) и (112), то lim rn = lim /„ = П-*ОО п—>00 л По этим формулам можно приближенно найти значе- ние — . Для этого надо вести расчет до тех пор, пока значе- ния гп и 1п не совпадут в пределах выбранной точности. Это общее значение гп и 1п и будет значением — с заданной точностью. § 28. ЗАКЛЮЧЕНИЕ Мы познакомились в этой книге с применениями способа последовательных приближений к различным вопросам: к составлению планов, к извлечению корней, к решению уравнений, к вычислению длины окружности. Этим неис- 94
черпывается многообразие применений этого способа. Очень многие задачи приводят к дифференциальным уравнениям (в которые входят производные искомых функций), к ин- тегральным уравнениям и уравнениям еще более сложного вида. Одним из самых сильных методов приближенного решения таких уравнений также является способ последо- вательных приближений. Разумеется, его применение в этих случаях значительно сложнее, чем в случае решения алгебраических уравнений. Но можно смело сказать, что без применения способа последовательных приближений нельзя было бы решить ни одной из грандиозных физичес- ких и технических задач, которые решаются в настоящее время. И при расчете движения спутника, и при расчете атомного реактора, и при исследовании строения атома применяют этот метод. Однако рассказ о применениях метода последовательных приближений за пределами эле- ментарной математики выходит за рамки этой книги.
УПРАЖНЕНИЯ Для того чтобы читатель мог проверить, насколько он овладел изло- женными в этой книге методами приближенного решения уравнений, мы приводим несколько примеров на приближенное решение уравнений. Решить по способу итераций урав 1. 1 1 ' 1 ’ х cos х ’ (х+ I)2 • 2. х = (х4- 1/. 1 12. х = 1 + "iQ'sin х. 3. х = 4 + т7 Т х+ 1 13. х = iV 1g (х 4-2). 4. 4 х--=2+ Ух. 14. х2 = In (х 4 1). 3 15. In x = 4 — x2. 5. X = Уь — X. 16. In x = 2 —x. 6. 4 — х — tg х. 17. x- = ex 4-2. 7. х2 = sin X. 18. 1g x = 0,1 x. 8. х3 = sin X. 19. tgx = lgx. 9. . X + 1 1 _r X —— ЯГСо1П / • 4 20. x = -уд- e x. 10. X = COS X. Ньютона уравнения У нения*) Решить по способ 21. х3 — 5х + 1 = 0. 22. х3 — 9х2 4- 20х — 11 = 0. 23. х® — Зх2— Зх + 11 = 0. 24. х6 + 5х + 1 = 0. 25. sin х + х = 1. 26. х2—10 1gx —3= 0. *) В некоторых из приведенных здесь примеров надо сначала пре- образовать уравнение к виду х = ср (х). %
27. Решить с точностью До 0,001 методом последовательных приб- лижений системы уравнений: а) б) в) х = 0,2 </— 0,1 г + 0,898, г/ = 0,Зх + 0,15г + 1,383, г =0,25х —0,4 г/ + 3,677; 1 х = —sin(x + y) + 0,336, 1 У =----sin (х— у) + 0.362; х = /х + 2у— 0,710, t/= Vy^x-i- 1.
РЕШЕНИЯ 1. Положим ф (х) = ——. Тогда ср' (.г) . Имеем Ф (0) - ~ 1 > 0, ф (1) 1. Поэтому отрезок [0, 1] содержит корень данного уравнения. Однако мы не можем применить метод последова- тельных приближений к этому отрезку, так как |ф' (0)| = 2> 1. Чтобы сузить отрезок, заметим, что ф (0,4) =-j Qg\> 0,4. Поэтому уравне- 2 ние имеет корень на отрезке [0,4, 1]. При этом | ф' (х)| <1 Е если 0,4 < х У 1, и, значит, можно применить метод последовательных приближений. Полагая Xj = 0,4, получаем после 11 шагов приближе- ния, что хц я?ф (хи) ~ 0,4655. Значит, с точностью до 0,0001 имеем х — 0,4655. 2. Положим ф (х) = (х+ I)3. Тогда ф' (х) = 3 (х + I)3. Имеем ф (— 2) = — 1 > — 2, ф (— 3) = — 8 < — 3. Поэтому отрезок [— 3, — 2] содержит корень данного уравнения. Однако мы не можем применить метод последовательных приближений, так как на отрезке [— 3, — 2] имеем |ф' (х)| > 1. Перепишем заданное уравнение в виде з __ х == Ух — 1. 1 Тогда ф (х) = У х — 1 и ф' (х) = —г— . На отрезке [-3,-2] име- 3 Ух2 1 ем | ф' (х) I -"С-з— < 1, и поэтому можно использовать метод после- 3 Ух довагельиых приближений. Полагая Xj =—2, получаем хв~ф(х8) ~ х — 2,325. Значит, с точностью до 0,001 имеем х— — 2,325. 3 / Y _ 1 3. Положим ф (х) — i + у Д__—. Мы имеем 2 Ф'(х) = —------------------- 3 /(х-1)-(х+ 1р 98
Рис. 24 показывает, что прямая у “ х пересекается с кривой у = двух точках, лежащих соответственно на отрезках [— 1,0] и [4, 5]. На отрезке [4, 5] имеем | ф' (х) I -% 2 < 1 Полагая х1=4, 15 /45 имеем ха ж® (х3) х 4,870. Зна- чит, с точностью до 0,001 по- лучаем х3 “ 4,870. На отрезке [— 1,0] метод по- следовательных приближений не- посредственно не применим. Пе- репишем иа этом отрезке урав- х1 иение в виде (х — 4)3 — , х-1 откуда = х + 1 и х —I — 4)« х —1 , _ 2х — 1 Здесь i|> (х) =-j—— 1 и t (х) = "(7^4/ ' Ясио, что 1 при —1 <х < 0 имеем | г|>' (х) | < 1, и теперь можно применить Рис. 25. Теперь решим уравнение х — ‘ Итак, корни уравнения равны 1 и I метод последовательных приб- лижений. Полагая xt = 0, имеем х2 xty (xs) х — 0,9840. Значит, с точностью до 0,0001 имеем х = — 0,9840. Мы нашли два корня: х =• = — 0,9840, х = 4,870 . 4 4. Здесь фх (х) = 2 + /х и 4 у— ф2 (х) = 2 — у х. Из рис. 25 вид- но, что уравнение х = 2 4' У х имеет корень иа отрезке [3, 4]. На этом отрезке |<р' (х) |=—— <1- 4 /х3 Применяем метод последова- тельных приближений. Полагая хх*= 4, имеем х4«ф (х4) ж3,353. Значит, с точностью до 0,001 име- ем х“ 3,353. — угх. Оно имеет кооень х =* 1. ,353. 99
1 5. Здесь ф (х) = /'5 — х и q> (х) = —5-. Имеем 3 /(5^хр 3 — Ф(1)=У4 <2, Ф(2)=/3>1. Поэтому существует корень уравнения иа отрезке [1, 2]. На этом отрезке |ф'(х)|<—-—<1. Полагая х1=1, имеем х6 «ф (х6) х 1,516. Рис. 26. Значит, с точностью до 0,001 имеем х = 1,516. 6. Запишем уравнение в виде х = arctg (4 — х). Здесь ф (х) = arctg (4 — х). Мы имеем ф (1) = arctg 3 » 1,25, Ф (2) = arctg 2 ss 1,10 Отсюда следует, что существует корень этого уравнения, лежащий иа отрезке [1, 2]. На этом отрезке имеем । ф' 1 = 1 + (4 —X)2 < ~ * Поэтому можно применить метод последовательных приближений. х 1,225. Значит, с точностью Полагая хг = 1, имеем х4 «ф (х4) до 0,001 имеем х= 1,225. 7. Заданное уравнение имеет корень х = 0. Из рис. 26 видно, что второй корень уравнения положителен. Поэтому он удовлетворяет урав- нению х =/sin х. Здесь ф (х) = /sin х и ф' (х) = COS X 2 /sin х . Так как <Р /0,4794 >_1_ И ф (1) — jAsin 1 ж /0,8414 < 1, то уравнение имеет корень на отрезке Р/а; !]• На этом отрезке имеем 1 cos — I ф' W I 0,8703 1,3846 <’ и потому метод последовательных приближений сходится. Полагая Xj — 1, имеем х7 «ф (х7) ж 0,8768. Значит, с точностью до 0,0001 второй корень уравнения равен 0,8768. 100
8. Решается аналогично предыдущему, в виде я______ х — У sin х, Переписываем уравнение полагаем хх = 1 и получаем хвяф (х6) х 0,9286. Поэтому с точностью до 0,001 один из корней уравнения равен 0,9286. Так как обе части уравнения — нечетные функ- ции, то имеем еще корень —0,9286. Третьим корнем яв- ляется 0. 9. Уравнение можно пе- х -{- 1 реписать в виде —— = — sin х, — л/2 х 4 л/2. Из рис. 27 видно, что это урав- нение имеет единственный ко- рень, лежащий между 0 и л/2. В данном случае у _.! m (х) = aresm —‘— 4 , ч 1 Рис. 27. ф — /16—(x-flj* ’ На отрезке [0, л/2] имеем | <р' (х) | </—</1. Полагая xL = 0, находим xs ~ <р (х8) ж 0,3422. Значит, с точностью до 0,0001 имеем х = 0,3422. Рис. 28. 10. Так как cos 0=1, cos 1 > 0, то уравнение х = cos х имеет корень на отрезке [0, 1]. Поскольку |ф' (х) | < sin 1 < 1, то можно применить метод после- довательных приближений. По- лагая X] = 1, получаем, что с точностью до 0,0001 х = 0,7391. 11. На рис. 28 видно, что положительные корни уравне- ния близки к точкам пересече- ния графика функции у = cos х с осью абсцисс и расположены справа от точек пересечения ви- зг Да у]- (26 4-1) л и слева от точек пересечения вида 4~ 2Z?n. Чтобы найти решение, расположенное около точки х = -г,—р пл, положим х — пл — ~ у. Уравнение примет вид л 1 п"+! у ] пл 4 у =-----------------— = — cosly! пл |-у) Slili' 101
fl “ - Ji> При этом — — ’ч У "Ч у » и потому уравнение можно записать так: 1 у = (— l)n+1 arcsin--------------у у + пя 4- -тг Здесь 1 Ф (У) = (~ 0n+1 arcsin---------------- у пл 4~ у и (- !)п ф (У! = — -------------у— • |/ Iу + пя 4- -у i — 1 (У + + -тг] Г \' & I X / Ясно, что вблизи точки у ~ 0 имеем I фЛ (у) | <С ? <С 1 > и потому можно применить метод последовательных приближений. Найдем решение при п = 1 с точностью до 0,001. Пусть ув = 0. Тогда у3 жф (у2) ~ 0,204. Поэтому у » 0,204; л+ »к 4,917. Чтобы найти первый отрицательный корень, положим п ”» — 1. Мы получим уравнение и = arcsin--—— • я л у--у Положим у» = 0. Тогда У& »ф (у&) ~ — 0,503. Таким образом, у ~ — 0,503, а потому х » — 2,074. При больших значениях | п | метод последовательных приближений дает приближенную формулу для у. 1 (— 1)п+1-2 у « <р (уо) = (- 1)’l+! arcsin-— « -(2«+1)л * пя 4- Поэтому л (—1)п+з-2 хж—(2n-h 1)4-(2;г + 1)-. 12. Полагая хх =- 0, находим, что л3~ф (х3) » 1,088. Значит, с точностью до 0,001 х ss 1,088. 13. Сначала решим уравнение х = }'1g (х 4-2). Мы имеем ф 1.x ) — У1ё (х 4-2), и потому 1g е ш (х) —--------- —. 2 (х + 2) VW+2) Так как <р (0) = ]Alg 2 > 0, <р (1) == У 1g 3 <( 1, то уравнение имеет корень на отрезке [0, 1J. На этом отрезке выполняется неравенство 102
|ф (х) I <1Я <11 • Значит, можно применить метод последовательных при- ближений. Полагая хх = 1, имеем х6 ~ <р (У5) ~ 0,6507. Значит, ко- рень уравнения х = 1g (х + 2) с точностью до 0,0001 равен х = 0,6507. Рассмотрим уравнение х = - yig(x + 2). Здесь <р(л)=— /igTT+iy. Так как ф (0) = — /lg2 = —0,55, ф (---== — /lgT;5=—0,42, \ ^7 то данное уравнение имеет корень на отрезке [— 72, 0]. Полагая х± = 0, находим, что х8 ~ф (х8) ж — 0,4397. Итак, с точностью до- 0,0001 имеем х = — 0,4397. 14. Одним из корней уравнения является х = 0. Чтобы найти вто- рой корень, запишем уравнение в виде х — ]Л1п (х + I). Для урав- нения х *= У In (х + 1) имеем ф (4) ~ J/4 4- >4. Ф(1) = /йГ2<1. Значит, уравнение имеет корень на отрезке р/2, 1]. Так как ф'(х) = = о'/.З м > то иа 0ТРезке Wi, П имеем |ф' (х) | < q < 1. 2 (Л 1) у In (X —f- 1) Положим хх “ 1, тогда xt sap (xj) ss 0,7469. Итак, с точностью до 0,0001 имеем х ™ 0,7469. Уравнение х «=> — У"1п(х+ 1) ие имеет корней, кроме х =» 0. Итак, х = 0 или х •" 0,7469. 15. Перепишем уравнение в виде х ~ У 4— In х. Здесь ______ । Ф (1) -= 2, <₽ (2) = | 4 — in 2, ф' (х) -—-====== . 2х у 4 — In х Так какф (1) »= 2, ф (2) У 4 — 1п 2 < 2, то уравнение имеет корень на отрезке [1, 2]. Из рис. 29 видно, что других корней уравнение не имеет. Полагая хх = 2, получаем х4 «ф (х4) ж 1,841. Итак, с точностью до 0,001 х = 1,841. 16. Запишем уравнение в виде /=2 — in х. Здесь ф (х) “ 2 — In х,ф? (х) — — — . Из рис. 30 видно, что корень, х уравнения лежит иа отрезке [1, 21. На этом отрезке |<р' (х)|<1. 103
Полагая xr — 1,5, находим '13гф (х13) ~ 1,557. Итак, х =- 1.557 с точностью до 0,001, 17. Из рис. 31 видно, что уравнение имеет лишь один отрицатель- ный корень. Запишем уравнение в виде х = — /^+~2. Тогда Ф W = - V <^+2? <₽' (х) = 2 У ех + 2 и ф(— 1)=— /2 4-е’1 ж — 1,54; ф (— 2) = — У2+е^х — 1,46 Значит, корень лежит на отрезке [— 1, — 2]. Полагая хх = — 1, нахо- дим х4«ф(х1)ж— 1,492. Значит, с точностью до 0,001 имеем каждом из отрезков х = — 1,492. 18. Ясно, что одним из корней уравнения является хх = 10. Чтобы найти второй корень, запишем урав- нение в виде х = 10°'1ж. Здесь ф(х)= 10°’1ж,ф'(х)= 0,1 • 10°>1ж In 10. Кроме того, ср (1) ~ 10”’1 > 1, ср (2) = = 10е-2 < 2. Поэтому уравнение имеет корень на отрезке [I, 2]. На этом от- рез ке |ф' (х) | < 0,1 • 10°>2 -In 10 х 0,37 < 1. Теперь можно применить метод после- довательных приближений. Полагая X] — 2, находим, что х7 (х7) ж ях 1,372. Итак, с точностью до 0,001 имеем х — 1,372. 19. Из рис. 32 видно, что уравнение имеет по одному корню на ~ + пл, ~ Ч- (n-4-l) л1, п =0,1, ..., . ~ J 104
. Чтобы найти Зя у— у. Урав- причем эти корпи лежат в правых половинах отрезков первый положительный корень, сделаем подстановку х = некие примет вид На отрезке [0, л] есть корень нашего уравнения, причем наэтом отрезке|<р' (у)| < 1. Применим метод после- довательных приближений. Полагая у± = 0, имеему4 ~ф (у4)~1,059. Значит, с точностью до 0,001 имеем у = 1,059, а потому х = 3,654. 5 Чтобы найти второй положительный корень, полагаем х— л—у. Уравнение принимает вид и = л жений. ностью 21. Полагая х4 = 0, до 0,0001 имеем Пусть находим г = 0,091. Полагая уг — 0, получаем yi ~ ^<р(у4) ж 0,876. Значит, с точно- стью до 0,001 у — 0,870 и х — 6,984. 20. Из рис. 33 видно, что урав- нение имеет один корень, лежащий между 0 и 1. Мы имеем <р (х) = = Jq с х> Ф' (*) = — е~х • на отрезке [0, 1] выполняется нера- 1 венство | ф' (х) | < -Jq- , обеспечи- вающее возможность применения метода последовательных прибли- х4 »ф (х4) 0,091. Значит, с точ- f (х) = Xs — 5х + 1. f' (х) = Зх2 — 5, /" (х) = 6х. Тогда 105
По формуле Ньютона имеем Зга+1 = Зп — Зп-5^ + 1 <~5 Составим таблиц^' значений функции: X —3 —2 — 1 0 1 2 3 —11 3 5 1 -3 — 1 13 Из этой таблицы видно, что уравнение № — 5х + 1 = 0 имеет корни на отрезках [—3, —2], [0, 1], [2,3]. Найдем сначала корень, лежащий на отрезке [— 3, — 2]. Так как на этом отрезке f” (х) <[ 0, то в качестве начального значения берем £о = — 3 (так как f (,+) = — 11 — отрицательное число). Мы имеем (_ 3)8 _ 5 3) 4. ! = - з - з^Гз)ГГ5---------= - 2,5. Продолжая вычисления, находим, что Р8 = ж — 2,331. Получаем, что с точностью до 0,001 корень уравнения на отрезке [— 3, —2] равен — 2,331. Теперь найдем корень, лежащий на отрезке [0, 1]. Здесь мы имеем f” (х) 0. Поэтому полагаем [Jo = 0. Отсюда получаем 0s —5-0 + 1 Pi = 0 — —34+ГГ5— = 0.2. Зз = 31 = 0,202. С точностью до 0,001 имеем х = 0,202. Наконец, для нахождения корпя на отрезке [2, 3] полагаем Ре “ 3 и имеем Продолжая вычисления, находим, что [>4 ~ р5 = 2,128. Поэтому с точ- ностью до 0,001 корень равен 2,128. Мы нашли три корня: хх = — 2,331; х2 = 0,202; х3 = 2,128. Решим это же уравнение усовершенствованным методом хорд. На отрезке [— 3, — 2] находим — 3—(—2)' (—3) = _ 3-f(— 3) f(_3)_f (_% = - 3 4 11 -Z+1T « - 2,214. Так как на этом отрезке f (х) <[ 0, то кривая вогнута вниз и мы опреде- ляем аа по формуле — 3—(— 2,214) = 3 [ ( 3) _с,__2,214) — -,203. 106
Далее находим а3 = 13)_____________________ fl -2,293) -/(—2,214) Это совпадает с точностью до 0,001 с ранее найденным значе- нием х. Точно так же решаем уравнение иа отрезках [0, 1] и [2, 3]. 22. Здесь мы имеем f (х) = Xs — 9х2 ~Т 20х — 11, f (х) == Зх2 — 18х + 20, I" (х) 6х — 18 “ 6 (х—3). Составим таблицу функции f (х): X 0 1 2 3 4 5 6 1(х) — 11 1 1 —5 —11 —и 1 Корни уравнения лежат на отрезках [0, 1], [2, 3], [5, 6]. На отрезке [0,1] полагаем !3о = 0 и находим, что [34 »|36 ~ 0,834. На отрезке [2, 3] полагаем [Зо == 3 и находим, что f>2 ss |33 ж 2,216. На отрезке [5, 6] полагаем |3, = 0 и находим, что р4 st р6 ж 5,249. Мы на- шли (с точностью до 0,001) три корня уравнения хх -= 0,834; ха = 2,216; х3 = 5,249. 23. Здесь f (х) = х3 — Зх2 — Зх + 11, [' (х) = Зх2 — 6х — 3, [" (х) = 6х — 6 = 6 (х — 1). Составим таблицу значений для f (х): 1 х —2 —1 0 1 2 3 1 fl*) -3 10 11 6 1 2 Уравнение имеет один действительный корень, лежащий на отрезке [—2, —1]. Чтобы найти этот корень, полагаем |30 = — 2. Мы получаем, что [32 ss— 1,847. Поэтому с точностью до 0,001 имеем х = = — 1,847. 24. Здесь / (х) == х5 + 5х + 1, f' (х) = 5х4 + 5, /" (х) = 20 х3. Таблица значений функции f (х): X —1 0 1 f(x) —5 1 107
Поэтому уравнение имеет один корень на отрезке [— 1, 0]. Полагаем ро — 1. Имеем с точностью до 0,0001 р3 ~ р4 ж — 0,1999. Поэтому с указанной точностью х — 0,1999. 25. Здесь / (x)-=sin x-px—l, f' (х) «= cos x-[ 1, /" (x) “ — sin x. Таблица значений функции: Корень лежит на отрезке [0, 1]. Полагаем Ро 0 и находим, что Ра = 6S = 0,5110, Поэтому с точностью до 0,0001 имеем х = 0,5110. 10 26. Здесь f (х) = х2 — 10 1g х — 3, f' (х) = 2х — 1п 10' , f ’ (х) = 10 =24- -д.2 jn jQ - Таблица значений функции f (х): X 0,5 1 2 3 fW 0,26 —2 —2,01 1,23 Корни уравнения лежат на отрезках [0,5, 1] и [2, 3]. На отрезке [0,5, 1J полагаем ро = 0,5 и получаем, что р2 = рз» 0,535. Поэтому со- ответствующий корень с точностью до 0,001 равен 0,535. На отрезке [2, 3] полагаем ро = 3 и находим р2 ж рз » 2,705. Уравнение имеет два корня: xL = 0,535; х2 = 2,705. 27. В системе а) полагаем хо = 0, у о => 0, zo = 0 и после несколь- ких приближений находим, что с точностью до 0,001 х= 1,021, у = 2,150, z = 3,072. В системе б) полагаем хо = 0, уо = 0 и после нескольких прибли- жений получаем (с точностью до 0,001) х = 0,520, у = 0,310. В системе в) полагаем хо = 0, уо = 0 и находим, что х= 1,000, у = 2,000.