/
Текст
JL оnij л я рны е лекции
ПО МАТЕМАТИКЕ
Н.Я. В ИЛЕНКИН
МЕТОД
ПОСЛЕДОВАТЕЛЬНЫХ
ПРИБЛИЖЕНИЙ
ПОПУЛЯРНЫЕ ЛЕКЦИИ ПО МАТЕМАТИКЕ
В Ы П У С К 35
Н. я. ВИЛЕНКИН
МЕТОД
ПОСЛЕДОВАТЕЛЬНЫХ
ПРИБЛИЖЕНИЙ
ИЗДАНИЕ ВТОРОЕ,
ПЕРЕРАБОТАННОЕ И ДОПОЛНЕННОЕ
ИЗДАТЕЛЬСТВО «НАУКА»
ГЛАВНАЯ РЕДАКЦИЯ
ФИЗИКО-МАТЕМАТИЧЕСКОЙ ЛИТЕРАТУРЫ
моек В А 1 9 в S
518
В 44
УДК 512737
АННОТАЦИЯ
В этой книге в популярной форме рассказы-
вается о методах приближенного решения алгеб-
раических, тригонометрических, показательных и
других уравнений. Книга рассчитана на учеников
старших классов, учащихся техникумов, учителей
математики и лиц, сталкивающихся в практиче-
ской деятельности с решением уравнений. По ходу
изложения в книге вводятся некоторые элементар-
ные понятия высшей математики. К книге прило-
жено 27 упражнений и их решения.
Наум Яковлевич Виленкин
Метод последовательных приближений
(Серия «Популярные лекции по математике»)
М., 1968 г., 108 стр. с илл.
Редактор В. М. Гринберг
Техн, редактор Л. А. Пыжова Корректор С. Д. Кайсер
Сдано в набор 27/Х 1967 г. Подписано к печати 26/1 1968 г. Бумага
84x108732. Физ. печ. л. 3,375. Условн. печ. л. 5,67. Уч.-изд. л. 4,63.
Тираж 100 000 экз. Т-00023. Цена книги 15 коп. Заказ № 3569
Издательство «Наука»
Главная редакция физико-математической литературы
Москва, В-71, Ленинский проспект, 15.
2-2-2
146-68
Москва, Г-99, Шубвнскжй пер., If
СОДЕРЖАНИЕ
Предисловие ко второму изданию .............................. 5
Предисловие к первому изданию................................ 5
§ 1. Введение............................................... 7
§ 2. Последовательные приближения......................... 10
§ 3. Ахиллес и черепаха.................................... 13
§ 4. Деление на электронных вычислительных машинах ... 16
§ 5. Извлечение квадратных корней методом последовательных
приближений................................................ 18
§ 6. Извлечение корней с натуральным показателем по методу
последовательных приближений. ............................. 25
§ 7. Метод итераций........................................ 28
§ 8. Геометрический смысл метода итераций.................. 31
§ 9. Сжимающие отображения................................ .33
§ 10. Сжимающие отображения и метод итераций................ 37
§ 11. Способ хорд........................................... 43
§ 12. Усовершенствованный способ хор:;...................... 48
§ 13. Производная от многочлена . 49
§ 14. Метод Ньютона приближенного решения алгебраических
уравнений.................................................. 51
§ 15. Геометрический смысл производной...................... 55
§ 16. Геометрический смысл метода Ньютона................... 57
§ 17. Производные любых функций............................. 59
§ 18. Вычисление производных................................ 61
§ 19. Нахождение первых приближений......................... 64
§ 20. Комбинированный метод решения уравнений............... 66
§ 21. Признак сходимости процесса итераций.................. 68
§ 22. Быстрота сходимости процесса итераций ................ 72
§ 23. Решение систем линейных уравнений методом последова-
тельных приближений ....................................... 74
•| * 3
§ 24. Решение систем нелинейных уравнений методом последо-
вательных приближений..................................... 80
§ 25. Видоизмененное расстояние................... 82
§ 26. Признаки сходимости процесса последовательных прибли-
жений для систем линейных уравнений..................... 85
§ 27. Последовательные приближения в геометрии. 91
§ 28. Заключение........................................................ 94
Упражнения................................................................ 96
Решения .................................................................. 98
ПРЕДИСЛОВИЕ КО ВТОРОМУ ИЗДАНИЮ
Во втором издании книга подверглась переработке.
Метод итераций изложен теперь на основе понятия сжима-
ющего отображения, что позволило рассказать о нем до
введения понятия производной. Значительно расширена
часть книги, касающаяся приближенного решения систем
уравнений. Наконец, все задачи снабжены решениями.
ПРЕДИСЛОВИЕ К ПЕРВОМУ ИЗДАНИЮ
Основной целью этой книги является изложение различ-
ных методов приближенного решения уравнений. Их прак-
тическая ценность неоспорима, однако им уделяют мало
внимания как в средней, так и в высшей школе. Поэтому
часто бывает так, что человек, прослушавший курс выс-
шей математики во втузе, испытывает затруднения при не-
обходимости решить простейшее трансцендентное урав-
нение. С решением уравнений сталкиваются не только
инженеры, но и техники, рабочие-рационализаторы и пред-
ставители многих других специальностей. Знакомство с
методами приближенного решения уравнений полезно и
для школьников старших классов.
Поскольку большинство методов приближенного реше-
ния уравнений связано с понятием производной, нам
пришлось ввести это понятие. При этом в основу были по-
ложены наглядные геометрические соображения. Таким
образом, для чтения этой книги достаточно знаний по ма-
тематике в объеме девяти классов средней школы.
5
При составлении книги была использована лекция,
прочитанная автором для школьников 9—10-х классов,
занимавшихся в школьном математическом кружке при
Московском государственном университете им. М. В. Ло-
моносова.
Материал этой лекции был применен учителем средней
школы г. Москвы № 425 С. И. Шварцбурдом для внеклас-
сной работы с учениками 9-х классов. Автор выражает бла-
годарность С. И. Шварцбурду за предоставление разрабо-
танных им заданий на решение уравнений методом ите-
раций, использованных при написании этой книги.
Автор выражает глубокую благодарность В. Г. Бол-
тянскому, замечания которого существенно способствова-
ли улучшению первоначального варианта рукописи.
§ 1. ВВЕДЕНИЕ
При изучении математики в школе очень много времени
затрачивается на решение уравнений и систем уравнений.
Сначала это уравнения первой степени и системы таких
уравнений. Потом появляются квадратные, биквадратные
и иррациональные уравнения. Наконец, школьник зна-
комится с показательными, логарифмическими и триго-
нометрическими уравнениями.
Такое внимание к уравнениям не случайно. Оно объяс-
няется важностью уравнений для приложений математи-
ки к практике. Какую бы область приложений ни взять,
чаще всего для получения окончательного ответа прихо-
дится решать уравнения или системы уравнений.
При обучении в школе к уравнениям часто прибегают
для решения физических задач. Рассмотрим, например,
такую задачу.
В колодец брошен камень. Найти глубину колодца,
если звук от падения камня услышан через Т секунд после па-
дения.
Если обозначить глубину колодца через х, то для опре-
деления х получаем уравнение
1/^+*
Г g ' V ’ _
где v — скорость распространения звука в воздухе ( —
время падения камня и — — время, за которое до нас дой-
дет_звук падения). Это иррациональное уравнение. Полагая
Vх — у, сведем его к квадратному уравнению
4-+К|»-г=о,
которое решается по известной формуле.
7
Уравнения применяют и для решения геометрических
задач. Например, задача о делении отрезка АВ длины I
в среднем и крайнем отношении (то есть на такие отрезки
АС и СВ, что АВ: АС = АС : СВ) приводит к решению
квадратного уравнения
х2 + lx — I2 = О,
где через х обозначена длина отрезка АС.
К более сложному уравнению сводится задача о деле-
нии угла а на три части. Это уравнение имеет вид
4х3 — Зх — cos а = О,
где х = cos Такие уравнения, называемые кубически-
ми, в школе не изучают, но в курсе высшей алгебры дока-
зывают, что и для кубических уравнений есть формула ре-
шения (см. ниже формулу (3)).
Часто, однако, в физике возникают задачи, приводя-
щие к более сложным уравнениям, для которых не только
в средней школе, но и в университете не дают формул ре-
шения. Возьмем, например, железный стержень (или, как
говорят техники, балку) и наглухо заделаем его концы.
Если ударить по такому стержню, он будет совершать по-
перечные колебания. Как доказывают в математической фи-
зике, чтобы найти частоту этих колебаний, надо решить
уравнение
(1)
COS X 1 v 1
где г — 2,71828...
В школе никаких правил для решения такого уравне-
ния не дают. Не следует думать, что это объясняется крат-
костью школьной программы по математике. Формулы для
решения уравнения (1) в том смысле, как это понимают в
школе, вообще не существует. Уточним это утверж-
дение.
Говорят, что для некоторого уравнения существует
формула решения, если его корни можно выразить через
входящие в уравнение величины при помощи арифметиче-
ских операций, извлечения корней, показательной, лога-
рифмической, тригонометрических и обратных тригономет-
рических функций. В этом смысле у квадратного уравнения
8
х2 + рх + q = 0 есть формула решения, имеющая вид
х=—-у± ]/ (2)
Есть формула и для решения кубического уравнения*)
х3 + рх + q = 0.
Она имеет вид
х - +i/qz/FTg. (3)
Однако практическое применение формулы (3) наталки-
вается на ряд трудностей и требует использования комплек-
сных чисел.
Существует формула и для решения уравнений четвер-
той степени, но настолько сложная, что мы ее не будем при-
водить.
Для уравнений пятой и высших степеней дело обстоит
хуже. В 1826 г. норвежский математик Абель доказал**),
что при п>5 не существует формулы, выражающей ре-
шение алгебраического уравнения
ОоХ" + а^х11-1 + ... + ап = 0
при помощи арифметических операций и извлечений кор-
ней. Лишь для некоторых частных случаев алгебраиче-
ских уравнений, степень которых больше четырех, могут
существовать формулы решения***).
Если бы математики ограничивались изучением урав-
нений, допускающих точное решение, то есть решение по
*) К такому виду сводится любое кубическое уравнение
аох3 + apt2 + а2х + а3 = 0
подстановкой х + = у.
**) Относительно)? жизни и творчества Абеля см. книгу О. Оре
«Замечательный математик Нильс Хеирик Абель». Работы Абеля
были продолжены французским математиком Э. Галуа, о котором напи-
сана книга Л. Инфельда «Любимец богов».
***) Об алгебраических ^уравнениях можно читать книги этой
серии:
Кур ош А. Г., «Алгебраические уравнения произвольных сте-
пеней», Гостехиздат, 1951;
Шафаревич И. Р., «О решении уравнений высших степеней»,
Гостехиздат, 1954.
9
какой-то формуле, то разговоры инженеров с математика-
ми имели бы примерно такой вид:
Инженер: При расчете сооружения я пришел к такому урав-
нению (показывает уравнение). Мне его надо срочно решить — через ме-
сяц я должен закончить проект сооружения.
Математик: Был бы рад помочь Вам, но для уравнений такого
типа нет формулы решения.
Инженер: Не сможете ли Вы вывести эту формулу?
Математик: И пытаться не буду. Давно уже доказано, что для
таких уравнений формулы решения не существует.
Надо думать, что в результате подобного разговора мне-
ние инженера о математике и ее возможностях значитель-
но ухудшилось бы. К счастью, такого разговора не про-
исходит. Дело в том, что инженеру обычно и не нужна фор-
мула для решения того или иного уравнения. Ему надо
получить ответ с определенной степенью точности, а будет
ли ответ получен по формуле или иным путем, его не столь
уже интересует. Ведь и формула нужна ему обычно лишь
для того, чтобы с ее помощью вычислить ответ с необходи-
мой степенью точности.
Представьте себе, например, что формула найдена, но
по ней получился ответ в виде х = 3 + ]Л13. Ясно, что этот
ответ нельзя непосредственно использовать (вряд ли мож- ।
но заказать слесарю деталь длиной 3 4- У* 13 см). Для прак-
тических целей надо выразить ]/13 в десятичной системе
счисления, беря такое число десятичных знаков, какое тре-
буется для данной практической задачи.
Таким образом, инженер будет вполне удовлетворен,
если математик укажет ему тот или иной способ вычисле-
ния корня уравнения с необходимой степенью точности.
В математике разработан целый ряд способов приближенно-
го решения уравнений. Описанию некоторых из них и пос-
вящена эта книга.
§ 2. ПОСЛЕДОВАТЕЛЬНЫЕ ПРИБЛИЖЕНИЯ
Большая часть способов приближенного решения ура-
внений основана на идее последовательных приближений.
Эта идея применяется не только при решении уравнений,
но и для решения ряда практических задач.
Пользуются методом последовательных приближений
артиллеристы. Если они хотят поразить какую-нибудь
ю
цель, то устанавливают соответствующим образом угломер
и прицел орудия и производят выстрел. В случае про-
маха на основании наблюдения точки разрыва снаряда
вносятся поправки в установку угломера и прицела и
производится следующий выстрел. После нескольких при-
ближений угломер и прицел устанавливаются так, что
цель оказывается пораженной.
Иногда последовательные приближения нужны и для
определения точки прицела. Пусть, например, ведется
стрельба из зенитного орудия, находящегося в точке О, по
летящему самолету (рис. 1). Если направить орудие на точ-
ку Л 0, где самолет находится в данный момент, то получит-
ся промах: за время движе-
ния снаряда самолет передви- , А а а
нется в другую точку Лг Зная-------------------------
скорости снаряда и самолета, 3
эту точку сравнительно легко
найти. Однако, если напра-
вить снаряд в точку Л1; все
еще может получиться про-
мах. Ведь в результате изме-
нения наклона ствола орудия -----------g-------------
меняется закон движения сна-
ряда, поэтому время, которое Рис. 1.
снаряд затратит для преодоле-
ния пути О А о, отличается от
времени, которое он тратит на преодоление пути ОАХ, и
в результате попадания снаряда в самолет не произойдет.
Но теперь промах будет меньше, чем при прицеливании
в точку Ло. Чтобы сделать его еще меньше, надо найти
время, затрачиваемое снарядом для движения по пути ЛОХ,
и найти, в какой точке окажется через это время самолет.
Эта точка Л2 и будет следующим приближением для иско-
мой точки прицеливания. После этого надо найти время,
за которое снаряд окажется в точке А2, и вычислить, в
какую точку А3 попадет за это время самолет. После не-
скольких приближений мы найдем с нужной степенью точ-
ности точку прицела.
Пользуются методом последовательных приближений
и для решения многих других задач.
Пусть, например, надо перевозить песок из нескольких
песчаных карьеров Лх,...,Лл на несколько строек Blt...,Bm.
Пусть производительность карьера А,- равна а, тонн в
11
день, а потребность стройки Bk в песке равна bk тонн в день.
Наконец, пусть стоимость перевозки одной тонны песца
с карьера А, на стройку Bk равна Cjk (эта величина зависит
от расстояния между А,- и Bk, состояния дорог и т. д.).
Для составления плана перевозок составим табл. 1.
Через х;к в этой таблице обозначено количество песка,
которое перевозится с карьера А, на стройку Вк-
Таблица 1
Вг в2
А1 Х11 Х12 % 1т
д. »21 х22 Х2т
Ап хгл хга Хпт
Ясно, что числа xik должны удовлетворять следующим
соотношениям:
xZi + x-2+ ... +хм<а.
(с карьера А, нельзя вывезти больше, чем а,- тонн песка
в день),
х^ + x2k + ... + xnk = bk
(на стройку Bk надо завезти bk тонн песка в день).
При плане, даваемом табл. 1, стоимость перевозок пес-
ка равна
С Сц-41 -f- Д... Н- C^nX^rt +
+ С21Х21 + С22Х22 + ... + + (4)
+ г "T" •••‘'г
План надо составить так, чтобы значение С было наимень-
шим. Для этого сначала задаются каким-то ориентировоч-
ным планом. Например, поступают следующим образом:
К карьеру прикрепляют стройку, расположенную
ближе всего к нему. Если этот карьер производит больше
песка, чем нужно данной стройке, прикрепляют к нему еще
12
одну стройку, которая наименее удалена от него среди всех
оставшихся строек. После нескольких шагов производи-
тельность карьера At окажется исчерпанной. После этого
прикрепляют к карьеру Л2 ту из оставшихся строек, которая
ближе всего расположена к нему, и т. д. В конце концов
каждая стройка окажется прикрепленной к некоторому
карьеру.
Однако составленный таким образом план не является
наилучшим, так как под конец останется совсем немного
строек и они могут быть очень удалены от оставшихся ка-
рьеров. Поэтому придется изменить составленный план.
Некоторые из строек, прикрепленных к карьерам с малы-
ми номерами, придется от них открепить и прикрепить к
карьерам с большими номерами.
Методы изменения плана, приводящие к уменьшению
стоимости перевозок, рассматриваются в разделе матема-
тики, называемом линейным программированием *).
После нескольких приближений, выполненных по этим
методам, получится план, при котором сумма (4) является
наименьшей или мало отличается от наименьшей.
Вообще, при составлении любого плана, расписания и
т. д. сначала берут некоторое грубое приближение, кото-
рое потом последовательно улучшают, получая в конце
концов требуемый результат.
Обработку детали в цехах завода также можно рассмат-
ривать как последовательное приближение к нужной фор-
ме. Сначала берут грубое приближение — отливку или
какую-нибудь другую заготовку. Эту заготовку обраба-
тывают на станке, придавая ей форму, близкую к изготав-
ливаемой детали. После этого ее передают на станок, рабо-
тающий с большей точностью. После нескольких этапов об-
работки, то есть нескольких приближений, и возникает
требуемая деталь.
§ 3. АХИЛЛЕС И ЧЕРЕПАХА
Впервые последовательные приближения встречаются
у греческого философа Зенона Элейского, жившего за 500
лет до нашей эры. Этот философ пытался доказать, что в
*) О линейном программировании см. А. С. С о л о д о в н и-
к о в, Введение в линейную алгебру и линейное программирование,
«Просвещение», М., 1966.
13
природе не существует движения (помните, у Пушкина есть
стихотворение «Движенья нет, сказал мудрец брадатый...»).
Доказывал отсутствие движения Зенон таким образом:
если самый быстроногий из греков — Ахиллес — попро-
бует догнать черепаху, то он никогда этого не сможет сде-
лать. В самом деле, пусть расстояние между Ахиллесом и
черепахой 1000 шагов и пусть Ахиллес пробегает за 1 сек
10 шагов, а черепаха проползает 1 шаг. Через 100 сек Ахил-
лес пробежит 1000 шагов, отделявших его от черепахи.
Но за это время черепаха отползет на 100 шагов. Еще че-
рез 10 сек Ахиллес пробежит эти 100 шагов, но черепаха
уползет еще на 10 шагов вперед. Чтобы преодолеть эти 10
шагов, Ахиллес затратит еще 1 сек, за которую черепаха
продвинется вперед на 1 шаг. Итак, черепаха все время бу-
дет впереди Ахиллеса, и он никогда не догонит черепаху.
Значит, движения не существует.
Разумеется, это рассуждение Зенона — остроумный па-
радокс, но не более того. Движение есть неотъемлемое свой-
ство материи. Ведь и у Пушкина стихотворение про Зено-
на продолжается так:
«Другой смолчал и стал пред ним ходить.
Сильнее бы не мог он возразить.
Хвалили все ответ замысловатый...»
Любой школьник без труда сосчитает, когда Ахиллес
догонит черепаху. Для этого достаточно составить уравне-
ние
10х — % = 1000, (5)
где через х обозначено искомое время. Из этого уравнения
получается
х = —д— сек = 111 у сек.
Рассуждения Зенона можно, однако, рассматривать как
своеобразный метод приближенного решения уравнения (5).
Именно, перенесем в уравнении (5) х в правую часть
и разделим обе части уравнения на 10. Мы получим урав-
нение
х = 100 + . (6)
Если пренебречь в правой части слагаемым (оно мало по
сравнению с х), то получим для х приближенное значение
14
Х1 = 100. Теперь мы можем уточнить ответ, подставив в
правую часть вместо х найденное приближение xt = 100.
Мы получим более точное значение для х, а именно, х2 =
= 100 + Ю = НО. Подставляя это значение в правую часть
уравнения, найдем следующее приближение х3 = 100 +
4-1^ = 111. Таким путем мы получаем приближения
%! = 100, х2 = НО, х3 = 111, Xi = 111,1, ...
то есть те же самые числа, которые получались в рассуж-
дении Зенона. Эти числа связаны друг с другом соотноше-
нием
Xn+i = ЮО 4~ -jq- , (7)
которое позволяет вычислить их одно за другим. С уве-
личением п они приближаются к точному решению х =
= 111 у уравнения (5).
Описанный сейчас метод решения уравнения привел
к успеху из-за того, что слагаемое было мало по сравне-
нию с х. Иначе мы получили бы числа, не приближающие-
ся к искомому решению. Предположим, например, что
Ахиллес состязался не с медленной черепахой, а с легко-
ногой антилопой, пробегающей за 1 сек 20 шагов. Чтобы
найти, через сколько времени Ахиллес догонит антилопу,
надо решить уравнение
10% — 20х = 1000. (8)
Его решением является х = —100. Это означает, что Ахил-
лес и антилопа были рядом 100 сек тому назад, а теперь ан-
тилопа обогнала Ахиллеса и расстояние между ними в даль-
нейшем будет только увеличиваться.
Попробуем решить уравнение (8) так же, как мы реша-
ли уравнение (5). Для этого перенесем слагаемое 20х в пра-
вую часть уравнения и разделим обе части уравнения на
10. Мы получим уравнение
х = 100 + 2х. (9)
Положим в правой части х0 — 0. Мы найдем, что лу = 100.
Подставляя это значение в правую часть уравнения (9),
получим следующее приближение х2 = 300. Продолжая
15
этот процесс, получим числа
х0 = 0, хх = 100, х2 = 300, х3 = 700,...
Мы видим, что эти числа не стремятся к точному решению
х = — 100 уравнения (8).
§ 4. ДЕЛЕНИЕ НА ЭЛЕКТРОННЫХ
ВЫЧИСЛИТЕЛЬНЫХ МАШИНАХ
Возможно, что читатель этой книги удивится — зачем
было решать уравнение (5) методом последовательных
приближений, когда его можно было совсем просто решить
точно. Но, конечно, нас интересовало не уравнение (5),
а сам метод последовательных приближений, который мы
потом приложим к более сложным уравнениям.
Впрочем, надо сказать, что решение методом последо-
вательных приближений уравнений, похожих на уравнение
(5), понадобилось совсем недавно в связи с появлением быст-
родействующих электронных вычислительных машин. Есть
некоторые модели таких машин, которые могут выполнять
лишь три арифметических действия — сложение, вычи-
тание и умножение. Кроме того, они могут делить на числа
вида 2'1. Как же эти машины делят на любые числа?
Разделить число b на число а — это значит решить урав-
нение ах = Ь. Так как машина может умножать и делить
на 2", то можно считать, что 1/2 а < 1 (в противном слу-
чае мы умножим или разделим обе части уравнения ах = b
на соответствующую степень числа 2). Перепишем уравне-
ние ах = b в виде
х = (1 — а) х 4- Ь. (10)
Примем за первое приближение для числа х значение хх =
= Ь. Обозначим ошибку этого приближения через alt
то есть предположим, что 4- = b/а. Тогда из уравне-
ния (10) получим
хл 4- c/-i — (1 — а) (л'1 ~г ai) 4" b =
= (1 — a) xj. 4- b 4- (1 — a) av (11)
Поскольку 1/2 а
< 1, то
0< 1 — 1/2.
!б
Так как коэффициент 1 — а сравнительно мал, отбросим
в правой части уравнения (11) слагаемое (1 — а) а1( кото-
рое по крайней мере вдвое меньше, чем ах. Мы получим
Xx+aj (1 — a) xt + b.
Число
х2 = (1 — a) + b
мы и примем за следующее приближение для х.
Обозначим через а2 погрешность приближения х2, то
есть положим х2 4~ «2 = b/а. Тогда из уравнения (10)
получим
х2 + a2 = (1 — а) х2 + b + (1 — а) а2.
Отбрасывая в правой части этого равенства слагаемое
(1 — а) а2, получим приближенное равенство
х2 <х2 ~ (1 — а) х2 .
Таким образом, в качестве следующего приближения мож-
но взять
х3 = (1 — Я) Х2 4 ft.
Рассуждая точно так же, найдем, что следующее прибли-
жение имеет вид
х4 = (1 — a)xs + b
и т. д. Числа Xj, х2,...,хп,..., вычисляемые последовательно
по формуле
хп+1 = (1 — а) хп + Ь, (12)
приближаются к числу b/а. Но в этой формуле использу-
ются лишь действия сложения, вычитания и умножения,
а значит, машина может по ней считать.
Описанный метод деления основан, по существу, на фор-
муле для суммы бесконечной убывающей геометрической
прогрессии. Именно, мы записываем дробь b/а в виде
&_ _ Ъ
а ~ 1 — (1 — а) ‘
Но по упомянутой формуле имеем
Г - ft 4 ft (1 - а) 4 ft (1 - ay -Ь • • 4
+ &(1 — а)11-1 + . .. (13)
17
Обозначим через хп сумму первых п членов этой прогрессии:
хп = b + b (1 — й) + ••• + & (1 — а)'1-1.
Очевидно, что
хп+1 = b + ь (1 - а) + ... + ь (1 - ау =
— b + (1— «) [6 + b (1 — а) + ••• + b (1 — а)'1-1] =
= b + (1 — а) хп.
Эта формула совпадает с формулой (12). Таким образом,
заменяя дробь Ыа приближенным значением хп, мы за-
меняем бесконечную сумму в формуле (13) суммой первых
п членов. При возрастании числа слагаемых п эта сумма
приближается к сумме всей прогрессии (убывание прогрес-
сии (13) вытекает из того, что 1/2 <4 а < 1, и потому
О < 1 — а < 1/2).
§ 5. ИЗВЛЕЧЕНИЕ КВАДРАТНЫХ КОРНЕЙ
МЕТОДОМ ПОСЛЕДОВАТЕЛЬНЫХ ПРИБЛИЖЕНИЙ
Покажем теперь, как применяют метод последователь-
ных приближений для извлечения квадратных корней.
В школе изучают способ извлечения квадратных корней, поз-
воляющий определять один за другим знаки искомого кор-
ня. Его тоже можно рассматривать как один из способов
последовательного приближения к ответу. Однако этот спо-
соб довольно сложен и зачастую школьники механически
применяют его, не вполне понимая сущность дела. Мы
опишем другой способ извлечения квадратных корней,
употреблявшийся уже в древнем Вавилоне задолго до на-
шей эры. Его применял и александрийский математик Ге-
рои. Потом этот способ был заброшен, но сейчас к нему
прибегают иногда для извлечения квадратных корней на
электронных вычислительных машинах.
Пусть, например, надо извлечь квадратный корень из
числа 28. Выберем сначала какое-то приближенное значе-
ние этого корня, например, положим лу = 5. Погрешность
этого приближенного значения обозначим через то есть
положим /28 = 5 4- оу. Чтобы найти значение оу, воз-
ведем обе части этого равенства в квадрат. Получим
28 = 25 4- 10оу 4- оу,
18
то есть
а? + 10а4 — 3 = 0. (14)
Таким образом, для аг получилось квадратное уравнение.
Если попробовать точно решить это уравнение, то получим
значение а4 = — 5 + У 28. Таким образом, точное опреде-
ление а4 требует вычисления У28. Казалось бы, мы нахо-
димся в заколдованном круге: чтобы найти У28, надо со-
считать аг, а чтобы найти ах, надо вычислить У28.
На помощь приходит следующее соображение. Погреш-
ность аг приближенного значения хг = 5 невелика, она за-
ведомо меньше единицы. Еще меньше число а4. Поэтому
попробуем найти приближенное значение alt отбросив
в равенстве (14) малое слагаемое а4. При этом для аг полу-
чается приближенное уравнение 10<х4 — 3^0. Из него
вытекает, что а4^0,3.
Итак, приближенное значение поправки а4 найдено.
Так как У 28 = 5 + а1; то второе приближение х2 для
У 28 имеет вид
х2 = 5 + 0,3 = 5,3.
Чтобы найти еще более точное приближение для У28,
повторим описанный процесс. Именно, обозначим через
а2 погрешность значения х2 = 5,3, то есть положим У28 =
= х2 + а2. Возведем обе части этого равенства в квадрат и
отбросим малое слагаемое at Мы получим, что 28дйХг +
+ 2х2а2, и потому
28
Это означает, что третье приближение для ]/”28 выражает-
ся формулой
Хз = х2 +
28 — х% 28 4- х*
2х3 2х>
Так как х2 = 5,3, то отсюда получаем, что х3 = 5,2915...
Точно так же, исходя из приближенного значения х3 =
=5,2915, находим следующее приближение х4, выражаемое
формулой
28 х£
х4 = ——- = 5,2915 .. .
2-Л’з
19
Вообще, если уже найдено приближенное значение хп для
У28, то следующее приближение выражается формулой
При этом каждый следующий шаг процесса приводит ко все
более точным приближениям для У28. Процесс приближе-
ний останавливают, когда разность между хп+1 и хп станет
меньше, чем заданная точность вычисления. Например, если
надо вычислить У28 с точностью до 0,0001, то достаточно
взять четыре приближения и положить У28 = 5,2915 (в са-
мом деле, xs = 5,2915... их4 = 5,2915...).
Совершенно так же извлекают квадратный корень из
любого положительного числа. Именно, при вычислении
У а мы выбираем некоторое начальное приближение хг,
а потом определяем следующие приближения по формуле
_ а 4- х*п
Хп+1-------2х~~
(16)
Формулу (16) можно вывести и из несколько иных рас-
суждений, чем рассуждения, примененные при извлечении
У 28. Пусть мы уже нашли n-е приближение хп для У а.
Так как У а = хп- , то У а является средним геомет-
а
рическим чисел хп и —. В качестве приближенного значения
для этого среднего геометрического возьмем среднее арифме-
а
тическое чисел хп и — , то есть положим
лп
_ 1 / [ а \ _х2п^а
Хп+1 - 2 (Хп + —) --
Это и есть формула (16).
Таким образом, описанный выше способ приближенного
извлечения квадратных корней заключается в том, что мы
на каждом шагу приближений заменяем среднее геометри-
а
ческое чисел хпи~^~~их средним арифметическим.
20
Выясним теперь, всегда ли процесс последовательных
приближений при извлечении квадратных корней ведет к
цели, то есть будет ли всегда обстоять дело так, как при по-
гоне Ахиллеса за черепахой, или иногда дело обстоит так,
как при его погоне за антилопой (в первом случае математики
говорят, что процесс приближений сходится, а во втором —
что он расходится). Мы докажем, что при извлечении квад-
ратных корней никогда не бывает осложнений — процесс
приближений всегда сходится, всегда ведет^к цели.
Для этого сравним погрешности а„ = У а — хп и ап+1 =
= У а— хп+1 двух следующих друг за другом приближений.
По формуле (16) погрешность ап+1 можно записать в сле-
дующем виде:
_ _ г- х\ ф а _ х2 - 2хп У а + а
Лл+1 — У й. Хп+-у У Я „ 2у
“хп ^хп
Но
4 — 2хп Уа + а= (хп — У а )2 = 4,
и потому
ct^
а«+1 = U?)
Мы рассматриваем лишь положительные приближения хп
для У а. Поэтому из равенства (17) можно сделать вывод,
что все погрешности а2, а3,..., ап, •••• отрицательны. Иными
словами, вег приближения хп, начиная со второго, являются
приближениями с избытком*)-, первое приближение
может быть как приближением с избытком, так и прибли-
жением с недостатком.
С помощью формулы (17) легко доказать, что абсолют-
ная величина погрешности приближенного значения хп умень-
шается с каждым шагом по крайней мере вдвое. В самом деле,
равенство (17) можно записать так:
*) Это объясняется тем, что среднее арифметическое всегда больше,
чем среднее геометрическое.
21
Но так как хп 0, то
1 Va^i
2 2хп 2 *
С другой стороны, как было показано выше, при м 2
имеем хп^>У а и потому
2 2хп
Отсюда вытекает неравенство
1 Уа
2 2хп
1
У
(19)
Рассматривая соотношения (18) и (19), убеждаемся, что
I < уу |
Это и доказывает справедливость нашего утверждения:
с каждым шагом приближений абсолютная величина погреш-
ности уменьшается по крайней мере вдвое. Отсюда следует,
что после второго шага приближений абсолютная величина
погрешности уменьшится по крайней мере вчетверо, после
третьего — по крайней мере в восемь раз и т. д. Ясно, что
с возрастанием п абсолютная величина погрешности ап =
= У а— хп уменьшается и стремится к нулю. Но это и озна-
чает, что числа хп при возрастании п стремятся к У а.
Разберем теперь, как влияет на ход процесса при-
ближений выбор начального приближения хг. В первую
очередь отметим, что этот выбор никак не влияет на
окончательный результат. Ведь мы уже доказали, что,
как бы ни было выбрано начальное приближение х1;
погрешности аа, ...,ап, ... дальнейших приближений при
п -- оо стремятся к нулю. Таким образом, если задана
необходимая точность вычислений, то при любом начальном
приближении хг получится одно и то же значение для У а
с указанной точностью. Даже при очень неудачном выборе
начального приближения мы в конце концов придем к пра-
вильному результату. После десяти шагов приближения
абсолютная величина погрешности уменьшится более чем в
тысячу раз (210 = 1024 т 1000), а после сорока шагов —
22
по крайней мере в биллион (1012) раз. Так, если при вычис-
лении положить хг = 106, то 10е, а потому |а40|<
< 1СГ6. Иными словами, в начале процесса погрешность
была около миллиона, а в конце ее абсолютная величина
стала меньше одной миллионной.
Тем не менее выбор начального приближения влияет
на длительность процесса приближений. Если выбрать на-
чальное приближение неудачно, то придется долго ждать,
пока разность между хп+1 и хп станет меньше, чем заданная
точность вычислений. Хороший выбор начального прибли-
жения значительно ускоряет дело. Поэтому часто поступа-
ют так: начальное приближение xt берут из таблиц квадрат-
ных корней, а формулой
а х?
Х2 = -2^Г
(20)
пользуются лишь для уточнения полученного значения.
Такой путь особенно удобен потому, что скорость убы-
вания погрешности значительно возрастает, когда хп
приближается к У а. Ведь при выводе неравенства
I a,!+i | < у | ап |
1
ЧИСЛОМ у
мы заменили в формуле (18) множитель у —
Но если хп близко к У а, то дробь у— очень мала,
1 1 г
у—уу |ап| значительно меньше, чем
а потому | an+i | =
1 । ।
2 I | •
Уточним сделанное утверждение. Для этого рассмотрим
наряду с абсолютной погрешностью |ал|=|]Ла — хп\
относительную погрешность приближенного значения хп,
то есть отношение абсолютной погрешности |ап[ к точно-
му значению корня У а. Эта погрешность выражается фор-
мулой
23
Из равенства (17) получается такая формула для величины
Рп+1:
R _ | ЛП+1 | _ К |2
Va 2хп У~а 1
Так как хп > ]/"а, то отсюда вытекает, что
в < М2
^+1<2(/Н)2
Итак, для относительных погрешностей приближен-
ных значений выполняется неравенство
Зл+1
(21)
Например, если относительная погрешность приближения
хп равна 0,01, то для приближения х„+1 она не превосхо-
дит 0,00005, а для х„+2 она не превосходит 0,00000000013.
Мы видим, что точность приближений возрастает все бы-
стрее и быстрее. Можно показать, что, когда мы уже доста-
точно приблизились к У а, каждое следующее приближе-
ние примерно удваивает число верных знаков.
Пример. Вычислить ]/"238 с точностью до 0,00001.
По таблицам И. Н. Бронштейна и К. А. Семендяева*)
находим ]Л238 = 15,43. Примем число 15,43 за хг и най-
дем х2 по формуле
х, = -154д1б238 = 15,42725 ...
01),OU
Оценим точность полученного ответа. Так как погрешность
значения 15,43 не превосходит 0,01, то = 0,01 и потому
Но тогда
Л ОСИ 2
= 0,0000005.
Это означает, что абсолютная погрешность приближения х2
не превосходит значения 15,43-0,0000005 < 0,00001. Ины-
•) И. Н. Бронштейн и К. А.Семендяев, «Справочник
по математике», «Наука», 1965.
24
ми словами, в значении ^238 = 15,42725... верны все семь
знаков.
Если бы мы хотели получить четырнадцать верных зна-
ков, то уже третье приближение дало бы нужный ответ.
Однако такая точность почти никогда не бывает нужна.
Остановимся в заключение на следующей особенности
метода последовательных приближений. При применении
обычного метода извлечения квадратных корней любая
ошибка, допущенная в каком-то месте, полностью обесце-
нивает дальнейшие вычисления. Иначе обстоит дело при
применении метода последовательных приближений. Пусть,
например, в результате сделанной ошибки мы вместо пра-
вильного значения n-го приближения хп получили непра-
вильное значение уп. Тогда все дальнейшие расчеты можно
рассматривать как вычисление У а при начальном прибли-
жении уп. Но мы видели выше, что при любом выборе на-
чального приближения метод последовательных приближе-
ний приводит в конце концов к значению У а с нужной
степенью точности. Таким образом, сделанная ошибка в даль-
нейшем будет стремиться к нулю. Единственное влияние,
которое она окажет, состоит в том, что придется взять не-
сколько лишних приближений.
Благодаря отмеченной особенности процесса приближе-
ний в начале расчета можно вычислять приближения с
меньшей точностью и лишь для последних приближений
брать заданную точность. Это сокращает время, затрачива-
емое на расчет.
§ 6. ИЗВЛЕЧЕНИЕ КОРНЕЙ С НАТУРАЛЬНЫМ
ПОКАЗАТЕЛЕМ ПО МЕТОДУ ПОСЛЕДОВАТЕЛЬНЫХ
приближений
Описанный выше метод извлечения квадратных корней
можно применять и для извлечения корней с любым нату-
ральным показателем. Для этого нам понадобится следую-
щая формула*):
(х + «)‘=?-|-Л-|-...1 (22)
*) Эта формула вытекает из бинома Ньютона, но мы не предполага-
ем знакомства читателя с формулой бинома.
25
где точками обозначены члены, содержащие а2, а3
и т. д.
Докажем эту формулу. Из школьного курса известно,
что
(х + а)2 = X2 + 2ха щ а2,
(х + а)3 = Xs + Зх2а + Зха? ф- а3.
Эти равенства можно переписать следующим образом:
(х + а)2 = х2 + 2ха + ............. (23)
(х + а)3 = х3 + Зх2а + . . . (24)
Таким образом, формула (22) доказана при k = 2 и k = 3.
Умножим теперь обе части формулы (24) на х + а. Мы
получим, что
(х + а)4 = (х3 + Зх2а + ...) (х + а).
Если раскрыть в этом выражении скобки, то получится одно
слагаемое х4, не содержащее а, и два слагаемых Зх3а и
х3а, содержащих а в первой степени; что же касается ос-
тальных слагаемых, то они содержат а во второй и высших
степенях. Поэтому можно написать, что
(х + а)4 = х4 -ф- Зх3а + х3а + . . . = х4 + 4х8а + . . . (25)
(как и выше, точками обозначены члены, содержащие а2,
а3 и т. д.)
Итак, формула (22) доказана и при k = 4. Точно так же
из формулы (25) выводится, что
(х + а)5 = х5 + 5х4а + ... (26)
Очевидно, что таким путем можно доказать формулу (22)
для любого целого положительного показателя k.
Вернемся теперь к извлечению корня любой натураль-
ной степени k. Предположим, что уже найдено какое-то
k_____________________________________
приближение хх для искомого корня у а. Обозначим через
погрешность этого приближения, то есть предположим,
ь_________________
что хх + аг = у а. Тогда (xt + ajk — а. Но по формуле
(22) это равенство можно записать в следующем виде:
Xj -f- kxi -|~ ... = а,
где точками обозначены члены, содержащие а2, а® и т. д.
26
Если выбранное приближение Ху было достаточно
к,—
близко к у а, то погрешность этого приближения мала,
и потому можно пренебречь членами, содержащими высшие
степени погрешности. Мы получаем, таким образом, приб-
лиженное равенство
х* ~Е /г.Ц: 1 а ж а.
Из этого равенства вытекает, что
h
а — х*
и потому в качестве следующего приближения для у'"а
можно принять число
х2 — Ху -р
а — х&
kx*"1
a-y(k— 1) Ху
Точно так же, исходя из приближения х2, находим сле-
дующее приближение:
а4-(й-1)х*
Л'з = ---.
йх* 1
Вообще, если найдено приближение хп для у/~а, то следую
щее приближение определяется формулой
_ а 4 (6 — 1)х*
Хп+1~ FF
(27)
Как и при извлечении квадратных корней, можно пока-
зать, что указанный процесс сходится при любом выборе
начального приближения Ху (лишь бы это приближение бы-
ло положительным числом). Иными словами, числа хг, х2,...
ь_
, хп, ... при любом выборе Ху приближаются к уа.
Процесс приближений ведется до тех пор, пока числа хп и
хп+у не совпадут в пределах заданной точности.
Пример. Найти значение F970 с точностью до 0,001.
При k = 3 формула приближений (27) принимает вид
Хп+1 —
(28)
27
В нашем случае а = 970. Положим хг = 10. Из формулы
(28) следует, что
= 970 4»2.10s 2970
2 3-102 300
_ 970 4- 2.9,9s 2910,60 _ „
Хз ~ 3-9,93 — 294,03 — у>°уу-
Мы видим, что в пределах заданной точности значения х2
и х3 совпадают. Поэтому с точностью до 0,001 имеем
^970 = 9,899.
§ 7. МЕТОД ИТЕРАЦИЙ
Все разобранные выше примеры являются частными
случаями применения одного общего способа решения урав-
нений. Этот способ называют методом итераций или ме-
тодом последовательных приближений. Сущность этого
способа состоит в следующем.
Уравнение /(х) = 0, которое хотят решить, переписы-
вают в виде
х = ф(х). (29)
После, этого выбирают начальное приближение хг и под-
ставляют в правую часть уравнения (29). Полученное зна-
чение х2 ~ ф(х^ принимают за второе приближение для
корня. Вообще, если найдено приближение хп, то следую-
щее приближение х„+1 определяют по формуле
Хп+1 = ф(х„).
Пусть после нескольких приближений мы получим, что с
заданной степенью точности выполняется равенство хп ~
^хп+1. Так как хп+1 = ф(хп), то это значит, что с заданной
точностью выполняется равенство хп ~ ф(хп), то есть что
хп — приближенное значение корня уравнения х — ф(х).
Например, решая задачу об Ахиллесе и черепахе, мы
записали уравнение
в виде
10 х — х = 1000
х= 100 + -^-
28
и искали приближения по формуле
xn+i = ЮО + .
В задаче о делении на электронной вычислительной машине
мы записали уравнение
ах = b
в виде
х = (1 — а) х + b
и искали приближения по формуле
Хп+1 = (1 — а)хп 4- ь.
Наконец, при извлечении корня й-й степени мы преоб-
разовали уравнение
xk = а
к виду
__ а •$> (k — 1) xh
Х '
после чего искали приближения по формуле
a^(k — 1)х*
%П+1 - , ь_, •
kxn 1
Приведем пример более сложного уравнения, решаемого
методом итераций.
Пример. Решить уравнение
10х — 1 — cos х = 0 (30)
с точностью до 0,001.
Перепишем уравнение
х =
Выберем некоторое начальное приближение, например
— 0, и подставим его в правую часть равенства (31). По-
лученное значение
_ 1 Ф cos 0 „
(30) в следующем виде:
1 4- cos х
29
примем за второе приближение искомого корня. Подстав-
ляя значение х2 в правую часть равенства (31), получим
третье приближение
1-ф cos о, 2 1 -ф 0,98 . 1ПО
хз = ---1^- = °’198’
Далее, находим
х4 = 1 ^СУ198~О>198.
Мы видим, что с точностью до 0,001 выполняется равен-
гр 1 -ф COS Хз
ство х3 = х4. Так как х4 = —, то это означает, что
с точностью до 0,001 число х3 = 0,198 является корнем
1 -ф cos х
уравнения х = —.
В связи с описанным способом итерации возникает ряд
вопросов:
1. Всегда ли последовательность х1г ...,хп, ..., получа-
емая по способу итераций, сходится к некоторому числу §?
2. Если имеет место равенство lim хп — то является
п-*-оо
ли число решением уравнения х = ф(х)?
3. Как быстро приближаются числа хь..., хп, ... к кор-
ню g уравнения х — ф(х)?
Легче всего ответить на второй вопрос. Пусть числа
xlt хп, ... приближаются к числу Рассмотрим равен-
ство хп+1 = ф(х„), дающее выражение следующего прибли-
жения через предыдущее. С увеличением п его левая часть
приближается к £, а правая часть — к ф(|) *). Поэтому в
пределе мы и получим £ = ф (£), то есть £ является кор-
нем уравнения х = ф(х).
На первый вопрос ответ отрицательный. В самом деле,
рассмотрим, например, уравнение
х = 10* — 2.
Если положить %! = 1, то мы получим
х2 = 8, х2 = 108 — 2, ...
С увеличением п числа хп увеличиваются и не стремятся ни
к какому пределу. В то же время, если переписать уравне-
*) Мы предполагаем, что ср (х) непрерывная функция.
30
ние в виде х = lg(x + 2), то процесс приближений будет
сходиться, и мы получим после трех приближений, что х =
2,38.
Таким образом, надо заменить первый вопрос таким:
Какой должна быть функция <р(х), чтобы последователь-
ность чисел хг, х2,..., хп,--- сходилась?
Выяснению этого вопроса предпошлем геометрическое
истолкование способа итераций.
§ 8. ГЕОМЕТРИЧЕСКИЙ СМЫСЛ
МЕТОДА ИТЕРАЦИЙ
Очевидно, что разыскание корня £ уравнения х = <р(х)
есть не что иное, как нахождение абсциссы точки М пере-
сечения кривой у = <р(х) с прямой у = х. Предположим, что
задано некоторое начальное значение хх (рис. 2). Тогда
точка Мх с координатами АЦхх, q^xj ) лежит на кривой
у = <р(х). Проведем через эту точку горизонтальную пря-
мую. Она пересечет прямую у = х в точке A^1(q>(x1),
ф(Х1)). Обозначим ф(%!) через х2. Тогда координаты точки
будут иметь вид N^x^, х2). Далее, проведем через точку
вертикальную прямую. Она пересечет кривую у — <р(х)
в точке Мг с координатами М2(х2, <р(х2) ). Повторяя
этот процесс, мы получаем точку Nt на прямой у = х с
координатами N2(xs, х3), где х3 = <р(х2), а потом точку
Mt на кривой у = <р(х) с координатами А13(х3, <р(х3)) и т. д.
Если процесс приближений сходится, то точки М1г
М2,..., Мп,... приближаются к искомой точке пересечения.
31
Таким образом, геометрический смысл способа последо-
вательных приближений заключается в том, что мы двига-
емся к искомой точке пересечения кривой и прямой по лома-
ной линии, вершины которой попеременно лежат на кривой
и на прямой, а стороны попеременно имеют горизонтальное
и вертикальное направления (рис. 2, а).
Если кривая и прямая расположены так, как на рис. 2, а,
то эта ломаная напоминает лестницу. Если же кривая и пря-
мая расположены так, как на рис. 2, б, то ломаная напоми-
нает спираль.
Описанный процесс приближений может и расходиться,
не приводить ни к какому результату (как и было, когда
мы решали задачу про Ахиллеса и антилопу). Графически
это означает, что ступени лестницы (или звенья спирали)
становятся все больше и больше, а потому точки Мг,...
Мп, ... не приближаются к точке М, а удаляются от нее
(рис. 3).
Различие между рис. 2 и 3 состоит в следующем. Прове-
дем через точку М пересечения прямой у = х и кривой
у = <р(х) прямую под углом 135° к оси абсцисс. Эта прямая
вместе с прямой у = х делит плоскость на четыре части.
Если кривая в некоторой окрестности точки М располо-
жена в левой и правой четвертях плоскости и начальное
приближение берется в этой окрестности, то процесс итера-
ций сходится. Если же кривая расположена в верхней и
нижней четвертях плоскости, то процесс приближений рас-
ходится.
32
Однако чтобы применить это правило, надо сначала сде-
лать набросок графика функции у = ф(х), а это не всегда
целесообразно. Поэтому надо установить другой признак
сходимости процесса итераций, позволяющий решать во-
прос о сходимости или расходимости аналитически, при по-
мощи вычислений, а не геометрических построений. Это
условие будет дано в § 10. Сначала нам нужно будет позна-
комиться с понятием сжимающего отображения.
§ 9. СЖИМАЮЩИЕ ОТОБРАЖЕНИЯ
Возьмем функцию у -- ф(х), заданную на отрезке 1а, Ь].
Каждой точке х0 этого отрезка соответствует точка у0 на
оси ординат, а именно, точка у0 <р(х0)- Чтобы построить
эту точку, надо провести через точку х0 оси абсцисс верти-
кальную прямую до пересечения с графиком функции у =
= ф(х), а потом через точку пересечения провести горизон-
тальную прямую до пересечения с осью ординат (рис. 4).
Таким образом, функция у = <р(х) задает отображение от-
резка 1а, Ь] в ось ординат. Множество всех точек оси орди-
нат, соответствующих точкам отрезка [а, 6], называют образом
этого отрезка. Например, образом отрезка [2, 5] при ото-
бражении у — х2 является отрезок [4, 25], а образом от-
резка [—1, 6] при том же отображении — отрезок [0,36]
(нарисуйте график функции у = х2). Можно доказать, что
если функция у — <р (х) непрерывна на отрезке [а, Ь], то
образом этого отрезка является отрезок оси ординат.
В случае, когда функция у = ф(х), кроме того, монотонно
возрастает, образом отрезка [а, Ь] является отрезок
2 Н. Я- Виленкин 33
1<р(а), <р (&)], а в случае, когда она монотонно убывает,—
отрезок [<р(Ь), ф(а)1 (рис. 5).
Вместо отображения отрезка [а, Ь] в ось ординат можно
рассматривать его отображение в ось абсцисс. Для этого
после отображения в ось ординат повернем ось ординат на
90° по часовой стрелке. В результате точки отрезка [а, Ы
сначала отобразятся в какие-то точки оси ординат, а по-
том — в точки оси абсцисв. Таким образом, функция <р(л')
задает отображение отрезка [а, Ь] в ось абсцисс. Это отоб-
ражение мы будем записывать так: х <р(х). Если функция
<р(х) непрерывна, то в результате получим какой-то отре-
зок оси абсцисс.
Может случиться, что образ [«j, 6J отрезка [а, Ы яв-
ляется частью [а, Ь]. Например, при отображении у =
= У~х + 1 отрезок [0, 4] переходит в свою часть [1, 3]. Мы
будем говорить в таком случае, что отображение <р(х) перево-
дит отрезок [а, 6] в свою часть. Если <р(х) переводит отре-
зок [а, Ь] в свою часть [а1э &J, то любая часть отрезка
[а, 6] переходит в часть отрезка [«i, bt]. В частности, сам
отрезок [«!, переходит при отображении <р(х) в свою
часть [а2, bs], Точно так же отрезок [а2, Ь2] переходит при
этом отображении в свою часть [а3, 63] и т. д. В результате
мы получим систему отрезков
[а, Ь], [ах, &!,], [ап, Ьп],...,
каждый из которых является частью предыдущего и та-
ких, что [а„+1, &„+1] является образом [ап, при отображе-
нии <р(х).
34
Например, отображение х -> 1 —переводит отре-
зок [0, 4] в его часть [Va, 6/в]. Применяя это отображение
к отрезку [Va, 5/в1, получим отрезок [3/6, Wi?] и т. д.
Каждый следующий отрезок является частью предыдущего.
Возможны два случая: либо существует отрезок [с, d],
принадлежащий всем отрезкам [ап, Ь„1, либо эти отрезки
имеют лишь одну общую точку £. В последнем случае гово-
рят, что система отрезков [ап, Ь„] стягивается к точке
Ниже мы сформулируем условие стягивания системы
отрезков [а, 6], [alt &J, ..., [ап, Ьп],... Для этого введем важ-
ное понятие сжимающего отображения. Отображение <р(х),
переводящее отрезок [а, Ь} в свою часть [«j, &ж1, называет-
ся сжимающим, если оно уменьшает расстояние между
любыми двумя точками этого отрезка по крайней мере в М
раз, где М )> 1. Так как расстояние между точками хг и
х2 равно |х2 — Xj |, то условие сжимания можно сформули-
ровать так:
Существует число q такое, что 0 <Zq 1 и для любых
двух точек хь х2 отрезка [а, Ь] выполняется неравенство
I <Р(*2) ~ <P(^i) | < q | -Ь — *11 (32)
(здесь q — 1/Л1).
Длина произвольной части [с, d] отрезка [а, Ь] при сжи-
мающем отображении <р(х) уменьшается по крайней мере
в М = \lq раз. В самом деле, пусть [сь dj — образ от-
резка [с, d]. Тогда с, и dr — образы некоторых точек хг и
х3 отрезка [с, d],
q = <p(Xi), dt = <p(x2).
Но тогда
I — q I = I <рW — <p(q) i < q I x2 — xi |.
Так как точки Xx и x2 лежат на отрезке [с, d], то их расстоя-
ние |х2 — Xi | меньше длины \d — с| отрезка [с, d]. Значит,
\d-i — q К q | d — с|.
Наше утверждение доказано.
Теперь мы можем сформулировать условие того, что си-
стема отрезков [а1; bj,..., [пп, Ьп], получающихся из отрезка
(а, Ы последовательным применением отображения <р(х),
етягиваетея.
2»
35
Если отображение <р(х), переводящее отрезок [а, Ь] в
свою часть {щ, Ьг\, сжимает этот отрезок, то система от-
резков [«х, £>х!.[сп, стягивается к некоторой точ-
ке £ отрезка [а, &].
В самом деле, так как отображение ф (х) стягивающее,
то для любого п
\bn — an\^q\bn-i — an_1\.
Точно так же
Но тогда
| bn-i ап 1q | bn-2 ап-21.
| bn ап I I Ьп -2 ап-21 •
Повторяя это рассуждение, получаем
\Ьп — ап[ < qn\ b — а|.
Поскольку О <6 q <Z 1, то последовательность чисел q,
q2,..., qn,-.. стремится к нулю, а потому длины \Ьп — ап\
отрезков [ап, Ьп] стремятся к нулю, когда п стремится к
бесконечности. Но тогда не может быть отрезка [с, d], при-
надлежащего всем отрезкам [ап, Ь„1. Следовательно, система
отрезков
[а, Ь], [«х, У, ..., [ап, Ьп], ...
стягивается.
В заключение рассмотрим отображения ф(х), для кото-
рых неравенство (32)
|ф(х2) — ф(.Гх)| < д|х2 — Хх|,
где 0 < q < 1, выполняется для любой пары чисел Xi
и х2- Эти отображения являются сжимающими на всей чис-
ловой оси. Покажем, что в таком случае есть отрезок, кото-
рый сжимается отображением ф(х). Поскольку для любых
двух точек хх и х2 условие (32) выполнено, достаточно пока-
зать, что есть отрезок, который переводится в себя отобра-
жением ф(х). Возьмем любое число а и положим b = ф(а).
Выберем число < 1 такое, что q < qr.
Положим
р_____I а I
Л 1 - <71
и покажем, что отрезок [а — R, а + R] переходит при ото-
бражении ф(х) в свою часть. В самом деле, пусть х — точ-
36
ка этого отрезка. Тогда |х — а| < R. В силу неравенства
(32) выводим, что
1ф(х) — 6| = | ф(х) — <р(а)| < q\x — а\ < qR.
Но тогда
| ф (х) — а| = |<р (х) — Ь + b — а\ <
< |ф(х) — &|+ |& — а| < 4% + \b — а\ = qR + (1 —q^R =
= (1 + q-(h) r<r.
Это и показывает, что любая точка отрезка [а — R,a-\- /?]
переходит при отображении ф(х) в точку того же отрезка,
а потому отображение ф(х) сжимает отрезок [а — R, а -|- /?1-
§ 10. СЖИМАЮЩИЕ ОТОБРАЖЕНИЯ И МЕТОД
ИТЕРАЦИЙ
Вернемся теперь к методу итераций. Этот метод приме-
няется для решения уравнений вида х = ф(х). Если £ —
корень этого уравнения, £ == ф(|), то при отображении
х —> ф(х) точка £ остается на месте. Таким образом, зада-
ча о решении уравнения х =ф(х) равно-
сильна задаче об отыскании непод-
вижных точек отображения ф(х).
Если отображение ф(х) является сжимающим на от-
резке [а, Ь], то на этом отрезке всегда есть неподвижная
точка. Чтобы убедиться в этом, возьмем последовательность
отрезков
[«!, fej, [а2, &2], ..., [ап, .
получающихся из [а, Ь] последовательным применением
отображения ф(х). Так как ф(х) — сжимающее отобра-
жение отрезка [а, Ь], то существует единственная точка
общая всем отрезкам [ап, Ьп]. Она и является неподвиж-
ной точкой отображения ф(х).
В самом деле, отображение ф(х) переводит каждый от-
резок [ап, Ьп] в свою часть [art+1, Ьп+Г]. Поэтому образ ф(х)
любой точки с отрезка [ап, &„] лежит на его части [ап+1, 6п+1],
а тем более на самом отрезке \ап, Ьп]. Поскольку точка £
принадлежит всем отрезкам [ап, Ьп], то и ее образ ф(£)
должен принадлежать всем этим отрезкам. Но единствен-
ной точкой, принадлежащей всем отрезкам [ап, Ьп], является
точка |. Значит, ф (|) = |, то есть В — неподвижная точка
отображения ф(х).
Итак, для отображений, сжимающих отрезок [а, &],
всегда существует неподвижная точка, лежащая на том же
37
отрезке. Эта точка единственная. В самом деле, если бы на-
шлась другая неподвижная точка л, Л = ф(л), то должно
было бы выполняться неравенство
И — ^ | = | ф(л) — ф(Ю | < Я I Л — £ |.
Поскольку 0 < q < 1, это неравенство может выполняться
лишь, если | л — £ | — 0, то есть если л = £•
Теперь мы можем сформулировать достаточное условие
сходимости процесса итераций.
Пусть функция ср(х) задает сжимающее отображение
отрезка [а, Ь}. Тогда для любой точки х0 этого отрезка по-
следовательность чисел х0, х1( х2,..., хп, ...,где хп+1 = ф(х,(),
сходится к корню ^уравнениях = <р(х), лежащему на этом
отрезке.
В самом деле, пусть [ап, Ьп], п = 1,2,..., — последова-
тельность отрезков, получающихся из [а, 6] последователь-
ным применением отображения ф(х). Так как точка х0
лежит на отрезке [а, Ь], то ее образ хТ = ф(х0) лежит на от-
резке [о^, &J, образ х2 = тСч) точки xt лежит на отрезке
[а2, Ь2] и т. д. Таким образом, для любого п точка х„ лежит
на отрезке [ап, Ьп]. Так как длины отрезков [ап, Ьп] стремят-
ся к нулю при возрастании п, то последовательность точек
хь ..., хп, ... стремится к общей точке g этих отрезков.
Проведенное рассуждение показывает, что за началь-
ную точку х0 можно брать любую точку отрезка [а, Ь\.
Выясним, с какой скоростью стремятся точки х0, хъ...
..., хп, ... к точке g. Так как g = <р(£), то для любой точки с
отрезка [а, 6] имеем
I Ф (с) — £ I = I Ф (с) — Ф (£) | < Я | с — g |. (33)
Применим неравенство (33) к точкам х0,..., хп, ... Так как
хп = Ф(х„_1), то
| Хп — g I = | ф(х„-!) — g I < q Ixn-i — g |.
Но тогда для любого п имеем
I Хп— g | < q\xn-! — g | < q2\ Xn-2— I | < ... < qn | x0 — g|.
Таким образом, погрешность | хп — ^убывает с ростом п
по крайней мере со скоростью геометрической прогрессии,
имеющей знаменатель q.
Приведем примеры на применение доказанного условия.
38
Пример 1. Можно ли применять метод итераций для
решения уравнения * = 4Д? (34)
В данном случае Ф W — 4 Х2 •
Для любых xt и хг имеем
Но по неравенству между средними арифметическим и гео-
метрическим 1 f 1Г л ч |х| - 2 }/4х2< \
Поэтому 1 1 Ч 1 L- 1 (4 + я2)->(4 + х22)
X1 4~ Х2 | | Ху | + | Xt |
21 ' 4 2 Ч 8 -
“1(4 4-4) (4 + 4)-
Мы доказали, что для любых хг и xs выполняется неравен-
ство
Xi -р 1
(4 + 4)(4+х22) Ч“8~’
а потому
|ф(х2) —ф(Х1)К^-|Ха —Xi|.
Это означает, что отображение ф (х) является сжимающим
на всей оси.
Мы уже знаем, что в этом случае есть отрезок, перехо-
дящий в себя при этом отображении. Чтобы найти его, по-
ложим а — 0. При отображении <р(х) точка а = 0 перехо-
дит в точку b = 1/4. Далее, в нашем случае q = V8. По-
if IЬ — all _
ложим = /4 и обозначим число-у——- = у через R.
[1 1 т
— 3" ’ "з пеРех°Дит ПРИ отображении <р(х) в себя.
39
Значит, на этом отрезке есть одна неподвижная точка, то
есть корень уравнения (34). Чтобы найти эту точку, возь-
мем любую точку отрезка £— |, у] > например точку хл =0.
Применяя метод итераций, получаем
= 1 = 0,25,
4 ’ ’
= 4,0625 0,2461 ’
V., -- ___L_____-- 1 -- о рлдч
3 - 4 4-0,24612 ~~ 4,0605 ~~
Х4 ~~ ;—;; Л/Т.Да" =: "7 7|pnF — 0,2463.
4-Р 0,24b32 4,0605 ’
С точностью до 0,0001 имеем х3 = хл. Значит, с точностью
[1 1 "I
-Q- ,-П- ,
О О J
равен 0,2463. Поскольку отображение <р(х) сжимающее на
всей оси, уравнение (34) не имеет других корней.
Пример 2. Можно ли применить метод последова-
тельных приближений для решения уравнения
х = 1 + у^х
на отрезке [— 1, 8]?
Здесь <р (х) = 1 + }/~х. Так как ср (—1) = 0, ф(8) = 3,
то отображение <р(х) переводит отрезок [—1,81 в себя. Од-
нако оно не является на этом отрезке сжимающим, так как,
например, при хг = — 0,008, х2 = 0,008
| Ф (х2) — <р (Xi) 1 = 1^0,008 — — 0,0081 = 0,4>|х2—xi|.
При доказательстве того, что отображение в примере 1 было сжи-
f •— а -|- Ъ
мающим, мы использовали неравенство у аЬ <—2~~ ’ Сейчас мы
выведем некоторые неравенства, которые часто приходится исполь-
зовать для доказательства того, что данное отображение сжимающее.
Докажем, что при х > 0 имеет место неравенство
sin х < х < tg х. (35)
Для этого заметим, что на рис. 6 площадь S0AB сектора ОАВ с централь-
ным углом х заключена между площадями треугольников ОАВ и ОАТ:
S&OAB < Sсект. ОАВ < ^дОЛГ.
40
Но
_ R2sinx о _ R2tgx
доля------2— ’ ддОЛ!’--------2—
A K‘X
(R — радиус круга). Площадь же сектора ОАВ равна (угол мы
измеряем в радианной мере). Поэтому
R2 sin х R2x R2 tg х
2 < ~2~ < 2 '
Сокращая на , приходим к неравенству (35). Из неравенства (35)
вытекает, что при 0 < х < 1 имеем
х < arcsin х,
а при х > 0 имеем
х > arctg х.
Отметим еще неравенства
ех > 1 + х,
In (1 + х) < х, 0 < х < 1,
доказательство которых несколько сложнее.
ПримерЗ. Выяснить, можно ли решить методом ите-
раций уравнение
х = 1 + у arctg х. (36)
Так как при всех значениях х имеем 1 + yarctgx)>0, то
уравнение может иметь лишь положительные корни. Мы
имеем
Ф(х) = 1 +у arctg х. (37)
Поэтому
| Ф (х2) — ф (Xi) | = | (1 + у arctg Х2) - (1 + У arctg | =
= у | arctg х2 — arctg хг |.
Но при х1^ 0, х2 > О
arctg х2 — arctg Xi = arctg
и потому
| Ф (Х2) - ф (Xi) I = 4 [arctg 1<т|т^|< i I ^2 - Х11.
41
Значит, отображение (37) является сжимающим на полуоси
[О, ос). Это отображение переводит отрезок [0, ]У31 в свою
часть [1, 1 + Л./61. Поэтому существует единственный ко-
рень уравнения (36), лежащий на отрезке [1, 1 4~ л/61.
Чтобы найти этот корень, положим xr = 1. Тогда
х2 — 1 4~ у arctg 1 — 1 4- -х- ~ 1,39,
х3 = 1 4- у arctg 1,39 = 1,474,
х4 = 1 4- j arctg 1,474 = 1,487,
х5 = 1 4- у arctg 1,487 = 1,489,
хе = 1 4- у arctg 1,489 — 1,490,
х7 = 1 4- у arctg 1,490 = 1,490.
Мы видим, что с точностью до 0,001 выполняется равен-
ство х6 = х7 = 1,490. Значит, с этой точностью корень на-
шего уравнения равен 1,490. Так как отображение ср (х)
является сжимающим на всей полуоси, 0 х <. оо, то урав-
нение (36) не имеет других корней.
Часто бывает, что уравнение х = <р(х), которое нельзя
решить методом итераций, можно преобразовать к виду, до-
пускающему применение этого метода. Возьмем, например,
уравнение
х = Xs — 2. (38)
Так как здесь
<р(1) = — 1 < 1, <р(2) = 6 >2,
то это уравнение имеет корень на отрезке [1, 2]. Но отобра-
жение х3 — 2 не является сжимающим на этом отрезке,
так как не отображает его в свою часть. Перепишем уравне-
ние (38) в виде
х = yGc 4- 2.
Здесь (х) = /х 4~ 2 и потому
| (^2) — (xi) | — | х2 4- 2 — j/"Xi 4" 21 =
I Xi — Х1
У (хз + 2)2 4" у (xi -р 2) (%•> + 2) + У (Xi + 2)2
42
На отрезке [1,2] имеем xY > 1, х2 > 1. Значит, на этом от-
резке
|lp(X2)—1р(Х1)|< —| х2— X! |.
Мы доказали, что отображение ф(х) — сжимающее на от-
резке [1, 2]. Положим xr = 1 и применим метод итераций.
Мы получим
х2 = ^3 = 1,442,
х3 = у%442 = 1,510,
х4- /з/Ю - 1,520,
х5 -/3.520- 1,521,
хв = ^521 = 1,521.
Итак, с точностью до 0,001 корнем уравнения (38), лежа-
щим на отрезке [1, 2], является 1,521. Других корней это
уравнение не имеет.
Мы видим, что удачное преобразование исходного урав-
нения привело его к виду, допускающему применение мето-
да итераций.
Описанный здесь признак сходимости метода итераций
не очень удобен для использования, так как требует доказа-
тельства довольно сложных неравенств. Ниже (в § 21)
мы познакомимся с одним следствием этого признака, кото-
рое значительно облегчает доказательство сходимости про-
цесса итераций.
§ 11. СПОСОБ ХОРД
Метод итераций является одним из самых общих мето-
дов приближенного решения уравнений. Многие другие
способы приближенного решения уравнений — это част-
ные случаи метода итераций. Сейчас мы опишем один из
таких способов, называемый способом хорд.
Пусть нам надо решить уравнение /(х) = 0. Эта задача
равносильна задаче об отыскании точек, в которых график
функции у = /(х) пересекает ось абсцисс. Предположим,
что функция /(х) непрерывна и имеет в точках а и b значения
43
различных знаков. Тогда по крайней мере в одной точке
отрезка [а, Ь] эта функция обращается в пуль. Иными сло-
вами, хотя бы в одной точке | отрезка [а, Ь] график функции
У — Кх) пересекается с осью
абсцисс. Вообще
таких точек может
сколько (рис. 7).
если функция у =
нотонна на
[а, Ь] и имеет на его кон-
цах значения различных
знаков, то график функции
пересекается на этом отрез-
точке Чтобы найти
на отрезке [а, Ь] дугу
ке с осью абсцисс лишь
приближенно эту точку,
в одной
заменим
кривой у = Дх) соответству-
ющей хордой MN и найдем
точку пересечения Т этой хор-
ды с осью Ох (рис. 8).
Для этого рассмотрим по-
добные треугольники ММГТ
и NNrT. Из подобия этих
треугольников вытекает, что
М1Т TNi и о
Т7ТГ = ТГкг Но из рис. 8
MMi NiN г
видно, что ЛД71 = аг — а,
TNx=b — alt MMr — —/(а)
и NrN = f(b), где через ах
обозначена абсцисса точки пересечения
Ох. Поэтому
говоря,
быть не-
Однако
/(%) мо-
отрезке
Рис. 8.
хорды MN
с осью
а} — а _Ь — аг
-Г (a) f(b) •
Решая это уравнение, находим, что
af(b) — Ь[ (а)
Это равенство можно записать также в
01 =
виде
<39>
или
/ («) f ^ау (40)
44
(проверьте, приведя правые части формул (39) и (40) к одно-
му знаменателю).
Число а2 и является приближенным значением корня
уравнения f(x) = 0, лежащего между точками а и Ь.
Так как знаки чисел f (а) и /(&) различны, то либо
знак f(a), либо знак f(b) отличаются от знака f{a^. Если
в точках а и Й! функция/(л) имеет различные знаки, то
применяют формулу (39) к отрезку [а, ах1 и получают
следующее приближение:
а-2 = ^ — 1 («i) f (41)
для искомого корня. Если же функция /(х) принимает зна-
чения разных знаков в точках ах и Ь, то применяют форму-
лу (40) к отрезку [ах, Ь] и полагают
<«)
Найдя значение а2, применяют формулу (39) к отрезку
[а, а2] (или соответственно формулу (40) к отрезку 1а2, &])
и находят следующее приближение а3. Вообще, если уже
найдено приближение ап, то ищут следующее приближение
по формуле
an+i =an — f (ап) ^а) (43)
или по формуле
«п+1 = an — f (ап) • (44)
Мы получили две формулы (43) и (44). Посмотрим теперь,
в каком случае надо применять ту или иную формулу.
Пусть кривая обращена вогнутостью вверх. В этом случае
надо соединять точки кривой с тем концом М или N, в ко-
тором функция положительна. Если же кривая обращена
вогнутостью вниз, то надо соединять точки кривой с тем
концом, в котором функция отрицательна. Различные
возникающие при этом случаи изображены на рис. 9. Эти
рисунки делают геометрически очевидным следующее утвер-
ждение:
Пусть на отрезке [а, Ь] функция f(x) непрерывна, моно-
тонна, имеет постоянное направление вогнутости и прини-
мает на концах отрезка значения различных знаков. Тогда
при правильном выборе формулы приближений метод хорд
45
дает последовательность точек, сходящуюся к корню урав-
нения f(x) — 0.
Если же выбрать формулу неправильно, то способ хорд
может привести к тому, что точка «3 попадет за пределы от-
резка 1а, Ы. Это изображено на рис. 10.
Рис. 9.
Описанный сейчас способ хорд является частным случа-
ем метода итераций. Пусть функция f(x) не обращается в
нуль при х = а. Тогда уравнение /(х) = 0 равносильно
уравнению
x^-x-fW (45)
46
В самом деле, если /(£) = 0, то
(46)
Обратно, если & =/=а и выполняется равенство (46), то/ (£)=0.
Но уравнение (45) имеет вид х = ф(х), где
ф^Х-^)^^
af (X) — xf (а)
f(x)—f(a) ’
Положим х0 = b и применим метод итераций. Мы получим
ту же последовательность чисел alt а2, ап, которая
получается при способе хорд:
ап — а
an+i =- ап f (ап) ца •
Для примера решим способом хорд уравнение
л8 + Зх — I - 0. (47)
Здесь f(x) = № + Зх — 1. Так как /(0) — — 1, /(1) = 3,
то уравнение (47) имеет хотя бы один корень на отрезке
[О, 1]. Если нарисовать график функции у —Xs + Зх—1,
то мы увидим, что на отрезке [0, 11 он обращен вогнутостью
вверх. Поэтому применяем формулу (39). По формуле (39)
первым приближением для этого корня является число
л-! = b — / (Ь) -гД-Д- = 1 — 3 • Дт = 0,25.
' v ’ f (b) — f (a) 3 —(—1)
Второе приближение находим по формуле
=6 - f <4) “1 -3 = °'31 •
Далее,
1_______________________о 31
1~3тгй= °’319’
у __ 1 _о ~0.319 __ ,,
I 6 3 4- 0,010 ~
^'-з-зДтав’0-322-
Таким образом, с точностью до 0,001 корень уравнения,
лежащий на отрезке [0, 11, равен 0,322.
47
§ 12. УСОВЕРШЕНСТВОВАННЫЙ СПОСОБ ХОРД
Если способ хорд сходится, то скорость сходимости бу-
дет такой же, как и у способа итераций,— погрешность
значения корня убывает, как геометрическая прогрессия.
Существует усовершенствование способа хорд, дающее
гораздо более быструю сходимость. В обычном способе
хорд мы на каждом шагу используем один из концов отрез-
ка [а, Ь] и последнее получившееся приближение. Вместо
этого можно использовать два последних приближения —
ведь они обычно ближе к искомому корню, чем концы от-
резка [а, Ь].
Формула, при которой мы используем два последних
приближения, имеет следующий вид (рис. 11, а):
йп+1 = ап — f (ап)
ап - ап-1
f Ю - f (an-l)
(48)
При этом вычисляется по формуле (39), а а2 — по форму-
ле (41) или (42), в зависимости от знаков/(а), /(&), / (ад):
если f(a)< 0, / (&) > 0, то при f (ai) <Z 0 выбирается формула
(42), а при 0— формула (41).
Если случайно окажется, что точка а3, вычисленная по
формуле (48), лежит за пределами отрезка [а, &], то на сле-
дующем шаге надо вместо этой точки взять ближайший
к ней конец этого отрезка (рис. 11, б).
Оказывается, что сходимость усовершенствованного
метода хорд гораздо быстрее, чем у обычного. Именно, если
? — корень уравнения f(x) == 0, то
I an+i — £ I <1 С | ап £ р,
(49)
48
где
1,618.
Для примера решим этим методом то же уравнение
х3 + Зх — 1 = О,
которое мы ранее решили методом хорд. Первые приближе-
ния а± = 0,25 и а2 = 0,31 те же, что и в обычном методе
хорд.
Следующее приближение вычисляем по формуле
с , , «2 — ах
= 0,31 + 0,040 = 0,3223.
Мы имеем / (0,3223) = 0,0004. Ясно, что х = 0,3223
дает искомый корень с точностью до 0,0001.
§ 13. ПРОИЗВОДНАЯ ОТ МНОГОЧЛЕНА
При решении уравнения /(х) = 0 методом итераций мно-
гое зависит от того, каким способом мы привели уравнение
к виду х = ср(х). Одним из лучших способов является во
многих случаях способ, предложенный Ньютоном. Этот
способ основан на понятии производной. В этом параграфе
мы расскажем о том, что такое производная многочлена.
Это позволит нам применить метод Ньютона к решению ал-
гебраических уравнений, то есть уравнений вида
-ф а^-1 Я- йй = 0. (50)
Пусть
f (х) ==- aoxk 4- arxk^ + ... Я- ak
— некоторый многочлен. Рассмотрим многочлен f(x Я~ а),
то есть выражение
а0(х Я- a)k Я- аг(х Я- + ... + ah. (51)
Если раскрыть в выражении (51) скобки, то в некоторых
слагаемых а будет отсутствовать, в других — входить в
первой степени, в третьих — во второй и т. д. Сгруппи-
руем члены, содержащие одну и ту же степень а. Тогда
49
многочлен /(х + а) примет такой вид:
f(x + а) = f0(x) + Ы*)а2 + + fk (x)ak (52)
(так как степень многочлена f (х) равна k, то наивысшая
степень а в разложении (52) тоже равна k). При этом оче-
видно, что /'о(х),..., fk (х) также являются многочленами от х.
Пример. Пусть
/ (х) = 2х8 — Зх2 + 6х — 1.
Тогда
/(х + а) = 2 (х + а)3 — 3 (х + а)2 + 6 (х + а) — 1 =
= 2 (х» + Зх2а + Зха2 + а8) — 3(х2 + 2 ха + а2) +
4* 6(х + а)—1 = (2х3 — Зх2 + 6х — 1)4- (6х2 — 6х 4~6)а4-
4- (6х — 3) а2 + 2а8
Значит, в этом случае
/0(х) — 2х3 — Зх2 + 6х — 1,
/у(х) — 6х2 — 6х + 6,
/2(х) — 6х — 3,
/3(х) = 2.
Мы видим, что слагаемое f0(x) совпадает с/(х). Это не
случайно. Если положить в равенстве (52) а — 0, то полу-
чится, что /(х) = /0(х).
Остановимся теперь на следующем слагаемом ^(х)а.
Коэффициент при а, то есть многочлен Д(х), называется
производной многочлена ffx). Например, производная много-
члена 2х3 — Зх2 4- 6х — 1 равна 6х2 — 6х 4- 6. Производ-
ную многочлена /(х) принято обозначать f'(x).
Итак, производной f\x) многочлена f(x) называют коэф-
фициент при а в разложении многочлена f(x + а) по сте-
пеням а.
Пользуясь введенными обозначениями, можно перепи-
сать формулу (52) в следующем виде:
Дх + а) = /(х) 4- f (х)а + ... (53)
Точками в этой формуле обозначены члены, содержащие а2,
а3, ..., afe. Например,
2(х 4* а)8 — 3(х 4- а)2 4- 6(х 4' а) — 1 = 2х3 — Зх2 + 6х —
— 1 4- (6х2 — 6х + 6)а 4- ...
50
Мы ввели понятие производной многочлена Дх).
Покажем, как вычислять эту производную. Для этого рас-
смотрим многочлен
f(x + а) = aQ (х + а)4 + (х + а)*-1 4~ ...
• • • + otk-i (.х + сс) + а*.
Заменяя каждое слагаемое по формуле (х + а)т = хт +
+ тхт~г а + ... (см. § 6), мы получим
/ (х 4- а) = а0 (хк 4- Д-Д 4- • • •) 4-
+ [ xft~T 4- (k — 1) xft~2a2 4- . .. ] 4- ...
Яь-i (х а) 4“ Qfe =
= аохь 4- а^-14-. .. 4- ah +
4- а 4- (k— 1) агхк-2^г ... 4" Ял-i] + • • •
Сравним это равенство с равенством (53):
Дх 4- а) = К*) 4- аД(х) 4-
Получаем следующее утверждение:
Производная многочлена
f (х) = aoxk 4- а^14- ... 4- а^х 4- ah (54)
имеет вид
Д (х) = кайхк^-\- (k — l)a1xft-24-... 4~ Oa-i- (55)
Например, производная многочлена
Дх) - 6х7 + 8х» — Зх2 — 1
есть
Д(х) == 42х8 4- 24х2 — 6х.
§ 14. МЕТОД НЬЮТОНА ПРИБЛИЖЕННОГО РЕШЕНИЯ
АЛГЕБРАИЧЕСКИХ УРАВНЕНИЙ
Вернемся к приближенному решению алгебраических
уравнений. Пусть дано уравнение
аохк + а^-1 4- 4- ak =- 0. (56)
Предположим, что тем или иным путем найдено приближен-
ное значение хг корня этого уравнения, и покажем, как
51
найти более точное значение этого корня. Обозначим через
aj погрешность значения хь то есть предположим, что
х1 + ai является корнем уравнения (56). Тогда имеет
место равенство
М-Н + «1)А + «1(^1 + “i)A-1 + ••• + ak = 0. (57)
Иными словами,
/(%1 + aj = 0,
где через /(х) обозначен многочлен
aoxk + а^-1 + ... + ak.
Но по формуле (31) имеем
Л-П + «1) = f(Xl) + «1/'(^1) + •••>
где точками обозначены члены, содержащие at ..., a*.
Таким образом, для определения 04 мы имеем уравнение
Длу + 04) = f(%i) + aj'fe) + ... =0. (58)
Если начальное приближение х\ было достаточно хоро-
шим, то погрешность ах этого приближения мала. Тогда
в равенстве (58) члены, обозначенные точками, будут малы
по сравнению с av Отбрасывая эти члены, получим для
определения а, приближенное равенство
Ж) 4“ <*№ 0. (59)
Из этого равенства вытекает, что
— (б°)
Поэтому улучшенное значение хг корня нашего уравнения
дается формулой
<61’
После этого можно снова улучшить найденное прибли-
жение. Третье приближение для корня дается формулой
'-3 х" Г
52
Вообще, если найдено /z-е приближение хп искомого корпя,
то следующее приближение дается формулой
хл+1-х„-2^. (62)
/ \ЛП'
В развернутом виде эта формула записывается так:
_ + • • • + ah-lXn + /fiox
Xn ka^1 + (fe — 1) aix^2 4- • • • +
Если в пределах заданной точности приближенные зна-
чения хп и х„+1 совпадут, то наш процесс (в пределах задан-
ной точности) закончен и искомое значение корня найдено.
Описанный метод решения уравнений принадлежит зна-
менитому английскому математику Ньютону.
Метод Ньютона тесно связан с методом итераций. Имен-
но, если функции у = /(х) и у = /'(х) не имеют общих кор-
ней, то уравнение /(х) = 0 равносильно уравнению
(64)
Применяя к этому уравнению метод итераций, мы получим
последовательность чисел хь х2, ..., х„, связанных с тем же
соотношением
что и в методе Ньютона. Иными словами, метод Ньютона
заключается в том, что уравнение f (х) — 0 записывают в
виде (64) и применяют к нему метод итераций.
Пример. Решить по методу Ньютона уравнение
X3 — Зх — 5 — О
с точностью до 0,001, приняв за первое приближение Xj =3.
Так как производной многочлена
f(x) — х3 — Зх — 5
является многочлен
Г(х) - Зл® - 3,
53
то формула (62) примет в данном случае вид
Поэтому
^ = 3-22я^г = 3-Й-2-«’
х3 = 2,46-14’^S~5 = 2,46 — 0,165 = 2,295,
xt - 2,295 — -2’O]|7oi’-3~^ = 2’295“ °’016 2>279’
х. = 2,279 - = 2,279.
Мы видим, что с точностью до 0,001 выполняется равенство
= хъ.
Поэтому корень уравнения х3 — Зх — 5 = 0 с точностью
до 0,001 равен 2,279.
Изложенный в § 6 метод приближенного вычисления
корней является частным случаем метода Ньютона. В самом
деле, нахождение у а является не чем иным, как решением
уравнения
xk — а — 0.
Но производная многочлена xk — а равна /гх/г1 и потому
для уравнения
xk — а - 0
формула (62) примет вид
_ v *п — а _ а + (k — 1) х*
^П+1 ~П "7 ьл ь < •
kxRn kx* 1
Это и есть формула, по которой вычисляются приближения
для у а.
Отметим следующую существенную разницу между ре-
шением уравнения xk — а = 0 и решением общего алгеб-
раического уравнения
aQxk аус'1 ak ~ 0.
Для уравнения xk — а = 0 выбор начального приближе-
ния %! был несуществен. Как бы ни выбрать .значение хь
54
kr-
после некоторого числа шагов мы получим значение у а с
заданной точностью. Иначе обстоит дело при решении урав-
нения (56). Здесь одни начальные значения приводят к
одним корням уравнения, другие начальные значения — к
другим корням, а некоторые начальные значения не приво-
дят ни к какому определенному значению корня — после-
довательность чисел ха, ..., хп, ..., вычисляемая по фор-
муле (62), не стремится ни к какому определенному пределу,
то есть расходится.
§ 15. ГЕОМЕТРИЧЕСКИЙ СМЫСЛ ПРОИЗВОДНОЙ
Метод Ньютона изложен нами пока только для алгебраи-
ческих уравнений. Чтобы обобщить его на уравнения про-
извольного вида, надо обобщить понятие производной,
введя его для любых функций. Для этого выясним геомет-
рический смысл понятия производной.
Рассмотрим график многочлена
у = aoXk 4- аус*-1 + ... + ak
и возьмем на этом графике две точки М. и N (рис. 12).
Пусть в точке М абсцисса равна х, а в точке N абсцисса
равна х + а. Тогда ординаты в точках М и /V даются соот-
ветственно выражениями
f{x) = aoxk + аускЛ + ... + ah
и
f (х + а) = а0 (х + а)й + (х + а)4-1 ф- ... + ak.
Проведем через точки М и N секущую и вычислим угловой
коэффициент Асек*) этой секущей. Из чертежа видно, что
ь ТЫ
1^ = МТ‘
Но отрезок МТ равен разности абсцисс точек М и N, и по-
тому
МТ = (х + а) — х =-- а.
Отрезок же TN равен разности ординат этих точек, и по-
тому
TN = fix а) — /(х).
Значит,
= TN _ f (х 4- «) — f (х)
g МТ а
Но по формуле (53)
f (х + а) - f (х) + af (х) + ...,
где точками обозначены члены, содержащие а2, а3,...
Поэтому
где на этот раз точками обозначены слагаемые, содержа-
щие а, а2,...
Итак, угловой коэффициент секущей MN выражается
формулой
Асек = tg Ф = f' (х) + ... (66)
Будем теперь уменьшать значение а. Секущая MN бу-
дет при этом поворачиваться вокруг точки М. В пределе,
при а = 0, секущая превратится в касательную к кривой
у = /(х) в точке М. На рис. 13 изображены положения
1 1
секущей при а = 1; .
Но при а — 0 все члены, обозначенные в формуле (66)
точками, обращаются в нуль. Поэтому угловой коэффици-
*) Угловым коэффициентом прямой называют тангенс угла наклона
этой прямой к положительному направлению оси Ох. Например, если
прямая наклонена к оси Ох под углом 60°, то ее угловой коэффициент
равен У 3.
56
ент касательной к графику многочлена у = f(x) в точке
с абсциссой х выражается формулой
kK3C = f(x). (67)
Итак, производная многочлена f (х) равна угловому коэф-
фициенту касательной к графику этого многочлена, прове-
денной в точке с абсциссой х.
Пример. Найти, под каким углом наклонена к оси
Ох касательная к графику многочлена
/ (х) = X3 — 4х2 + 5х + 1,
проведенная в точке с абсциссой х = 2.
Так как
f (х) = Зх2 — 8х + 5,
то /'(2) = 1. Значит, tgcp = 1, и потому угол наклона ср
равен 45°.
§ 16. ГЕОМЕТРИЧЕСКИЙ СМЫСЛ МЕТОДА НЬЮТОНА
Мы можем теперь выяснить геометрический смысл ме-
тода Ньютона для приближенного решения алгебраических
уравнений. Пусть надо решить уравнение Дх) = 0, где
f (х) — некоторый многочлен. Геометрически эта задача яв-
ляется задачей о нахождении точек пересечения графика
функции у = /(х) с осью Ох, то есть точек, в которых
У = 0.
57
Предположим, что уже найдено приближенное значение
%! корня этого уравнения. Проведем в точке N с абсциссой
х.г касательную к кривой у = f(x). При удачном выборе зна-
чения Xi точка Т пересечения касательной с осью Ох будет
ближе к точке пересечения кривой у = f(x) с осью Ох, чем
точка М (рис. 14).
Чтобы найти абсциссу ха точки Т, рассмотрим треуголь-
ник TMN. Катет MN этого
иное, как значение функции
Рис. 14.
треугольника есть не что
у — f (х) в точке х1г то есть
MN — / (xj. Катет же ТМ
равен Xj — ха. Отсюда сле-
дует, что тангенс угла qy
наклона касательной к оси
Ох выражается формулой
tg<Pi = (68)
Из равенства (68) следует,
что
(69>
Но tg qy есть угловой коэффициент касательной к кривой
У ~ f (*), проведенной в точке с абсциссой хР Поэтому,
в силу геометрического смысла производной, tg qy = f (xj.
Значит, формулу (69) можно переписать так:
Х2 = Xi
f (*i)
Г (*i) ’
Тем самым второе приближение для искомого корня
найдено. Проведем теперь касательную к кривой у = f (х)
в точке с абсциссой х2. Абсцисса точки пересечения этой
касательной с осью Ох дается формулой
х3 = х2
Цх2)
f (хг)
Вообще, если уже найдено приближение х„, то, чтобы
получить следующее приближение х„+1, надо провести ка-
сательную к кривой у = / (х) в точке с абсциссой х„. Абс-
цисса точки пересечения этой касательной с осью Ох даст
нам хл+1.
58
Формула для вычисления хп+1 такова:
= —(70)
или, что то же самое,
xn+i = хп 1 -- । (70 )
где <р„ — угол наклона касательной к кривой у = / (х)
в точке с абсциссой хп. Эта формула совпадает с формулой
(62) способа Ньютона. Мы выяснили, таким образом,
геометрический смысл способа Нью она. Он заключается в
том, что дуга кривой у = f (х) заменяется касательной к
этой кривой. Поэтому способ Ньютона называют также
способом касательных.
На рис. 15 изображено, как точки хь х2, ..., х„,..., по-
лучаемые по способу Ньютона, приближаются к точке |
пересечения кривой у = f (х) с осью Ох.
§ 17. ПРОИЗВОДНЫЕ ЛЮБЫХ ФУНКЦИЙ
Данное нами геометрическое истолкование способа
Ньютона позволяет без труда обобщить его на любые урав-
нения вида / (х) = 0, где f (х) может уже не быть много-
членом. Именно, чтобы найти решение этого уравнения,
возьмем некоторое приближенное значение корня хР
В точке с абсциссой Xi проведем касательную к кривой
У — f (х) и обозначим через х2 точку ее пересечения с осью Ох.
59
В точке с абсциссой х2 вновь проведем касательную к кри-
вой у = /(х) и т. д. Так же как и в случае, когда f (х) яв-
ляется многочленом, легко установить, что
х„+г = х„-^, (71)
где tg ф„ — угловой коэффициент касательной к кривой
У — f W в точке с абсциссой хп.
Формула (71) пока непригодна для вычислений, так
как мы еще не умеем вычислять tg <р„. Итак, нам надо на-
учиться вычислять угловые коэффициенты касательных
к графикам любых функций у = f (х) (а не только к графи-
кам многочленов). Найдем сначала угловой коэффициент
секущей. Пусть М — точка на графике функции у — f (х)
и MN — секущая, проходящая через эту точку. Рассуждая
точно так же, как и для многочленов, мы получим, что уг-
ловой коэффициент секущей выражается формулой
^сек = tg ф = . (72)
где х — абсцисса точки М, а х + а — абсцисса точки N.
Если уменьшать а, то секущая будет поворачиваться во-
круг точки М и стремиться занять положение касательной
к кривой у = f (х) в этой точке (см. рис. 12). Поэтому мож-
но написать, что
^кас = tg Ф = lim + (%) . (73)
ос—>-0 а
Назовем предел, стоящий в правой части этого равенства,
производной функции f (х) и обозначим его через /' (х),
то есть положим
m = (74)
Равенство (73) теперь можно записать в виде
йкас = tgcp = f (х). (75)
Таким образом, и для любых функций (а не только много-
членов) производная функция /(х) в некоторой точке рав-
на угловому коэффициенту касательной к кривой у = f (х)
в этой точке *).
Если в точке с абсциссой х к графику функции у=- f (х) нельзя
провести касательную (например, если в этой точке график имеет из-
лом), то в этой точке у функции f (л) отсутствует производная.
60
Так как tg <р„ = f' (х„), то формулу (71) можно перепи-
сать в виде
х -х f(Xn) (7R\
%п+1— %п f (х ) ' \*®)
Эта формула совпадает с формулой (62). Таким образом,
способ Ньютона перенесен на все уравнения вида f (х) = 0.
§ 18. ВЫЧИСЛЕНИЕ ПРОИЗВОДНЫХ
Мы видели в предыдущем пункте, что для нахождения
углового коэффициента касательной к кривой у = f (х) на-
до сосчитать предел
Л(х)==НтН£±2к1Ш.
«-»о а
Это вычисление, вообще говоря, довольно затрудни-
тельно. Но во многих важных случаях этот предел вычис-
лен. Иными словами, для наиболее часто встречающихся
функций известны их производные. Приведем список наи-
более употребительных производных:
1. (а)' = 0.
2. (xs)' — kx^1.
3. (аж)' = аж1па.
4. (sin ах)' = a cos ах.
5. (cosax)' =—asinax.
7. (ctg ах)' =
а
sin2 ах
8. (logox)' = -J— .
\ ьа / xlna
9. (arcsin ах)' = -..- .
/1—а2х2
6- ахУ = • 1 °- (arctg ахУ = •
(Через 1п а в формулах 3 и 8 обозначен логарифм по осно-
ванию е = 2,71828...— так называемый натуральный ло-
гарифм.') Отметим, что в формуле 2 показатель k может
быть не только натуральным числом, но и любым веще-
ственным числом. Например,
(К^) — ) — 2 х 2 /х ’
Ш' = (х^)' = — 2х’8 = — ~ .
\Х2/ ' X3 4 5
61
Формул 1—10 еще недостаточно для вычисления про-
изводных любых функций. Однако, если функция f (х)
составляется с помощью арифметических действий из функ-
ций, для которых мы умеем считать производные, то легко
найти ее производную. Для этого применяются следующие
правила, доказываемые (как и формулы 1—10) в курсах
высшей математики.
1. Производная суммы двух функций равна сумме их
производных, то есть
tfi (х) + К (х)Г = £ (х) + А (х).
2. Постоянный множитель можно вынести за знак
производной
[af (х)Г = af (х).
3. Производная произведения двух функций вычисляет-
ся по формуле
(*) А( *)]' = fi (*) A W + fi (х) f2 (х).
4. Производная дроби вычисляется по формуле
[71 001' А (х) А (х) — Л (х) А (х)
La (x)J ~ [Awi2
Данное в § 13 правило вычисления производной от мно-
гочлена является следствием правил 1 и 2 и формулы 2
из списка.
Пример 1. Найти производную дроби
' W 2х» + 5
Пользуясь правилом 4, находим
f(Y\ _(3ха-х+ 1)'(2х8 + 5) — (Эх* — х + 1) (2x3 -Н 5)'
' — (2х8 7- 5)а
Далее, по правилу дифференцирования многочлена
(Зх2 — х + 1)' = 6х — 1
и
(2х® 4- 5)' = 6х2,
62
а потому
f ( (2x® 4 5) (6x—1) — (3xa—x 4 1) 6xa _
' W ” (2x8 4 5)a —
_ — 6x4 4- 4x8 4- 6xa 4- 30x — 5
(2x8 4 5)a
Пример 2. Найти производную функции
f (х) =- Д (arcsin Зх — ДД .
' ' ' 10 \ xi!
Решение. По формулам 2 и 9 и правилам 1 и 2 имеем
' Vе' 10 /1 _ 9>;2 ю\ х8 / ю УТЗТсц? ‘ 5№ '
Пример 3. Найти производную функции
f (х) = 10х sin 2х.
По правилу 3 и формулам 3 и 4 имеем
/' (х) — (10х)' sin 2х + 10х (sin 2х)' =
= 10х sin2x in 10+10x«2cos2x=
-~= 10х (sin2xln 10 + 2 cos2x).
Указанные правила позволяют находить производ-
ные во многих случаях. Есть еще одно очень важное пра-
вило — правило о вычислении производной сложной функ-
ции. Оно формулируется так:
Если функцию у = f (х) можно записать в виде у —
= F (г), где z — <р (х), то ее производная дается формулой
(х) = F' (г)ф'(х), (77)
где z = <р(х).
Пример. Найти производную функции у = sin (х3).
Эту функцию можно записать в виде у = sin z, где z = х3.
Производная функции F (?) = sin z равна F' (г) = cos ?,
а производная функции <р (х) = Xs равна <р' (х) = Зх2.
Применяя формулу (77), получаем
[sin (х3)]' = F' (?) <р' (х) = cosz-Зх2.
Подставляя вместо г значение г = х3, получаем
[sin (х3)!' = Зх2 cos(x3).
63
Более подробное изложение понятия производной чи-
татель может найти, например, в книге: Я- Б. Зельдо-
в и ч, «Высшая математика для начинающих», Физматгиз,
1960.
§ 19. НАХОЖДЕНИЕ ПЕРВЫХ ПРИБЛИЖЕНИЙ
Остановимся теперь на выборе начальных приближе-
ний. Разыскание первого приближения при решении урав-
нения /'( х) — 0 можно сделать графически. Для этого на-
до начертить график функции у ~ f (х) и найти точки пе-
ресечения этого графика с осью Ох (в этих точках у -= 0,
и потому / (х) == 0).
Если по каким-либо соображениям чертить график функ-
ции неудобно (скажем, если уравнение решается на элек-
тронной вычислительной машине), прибегают к другому
Рис. 16.
способу определения первого приближения. Для этого вы-
числяют значение функции для некоторых значений аргу-
мента (например, для целых значений аргумента, лежащих
в известных пределах). Если функция у = f (х) непрерыв-
на (то есть ее график не имеет разрывов), то между значе-
ниями а и Ь, в которых функция имеет различные знаки
(рис. 16, а), лежит корень уравнения f (х) = 0 (если у гра-
фика функции есть разрывы, то может случиться, что она
скачком переходит от отрицательных значений к положи-
тельным, не обращаясь по пути в нуль (рис. 16, б)). Зна-
чения а или Ь можно принять за первые приближения для
корня уравнения f (х) = 0.
Отметим, что при этом можно пропустить некоторые
корни уравнения. Так, на рис. 16, в изображен случай,
когда функция у — f (х) имеет в двух точках значения од-
64
ного и того же знака, но между этими значениями обраща-
ется в нуль.
Мы получили, таким образом, две точки: а и Ь. Чтобы
выяснить, какую из них лучше выбрать за начальное при-
ближение х в методе Ньютона, рассмотрим рис. 17. Рис. 17, а
и 17, б показывают, что если кривая обращена вогнуто-
стью вверх, то за начальное приближение надо выбирать ту
Рис. 17.
из точек а и Ь, в которой функция f (х) положительна.
Другой выбор начального приближения может даже приве-
сти к тому, что точка х2 окажется вне отрезка [a, &J. Точ-
но так же, если кривая обращена вогнутост м вниз, то за
начальное приближение надо брать точку, в которой функ-
ция f (х) отрицательна (рис. 17, в, г).
Это правило удобно применять, если известен график
функции у = f (х). Если же график этой функции не на-
рисован, то определение направления вогнутости требует
дополнительных расчетов. Для этого надо найти вторую про-
изводную функцию f (х). Второй производной функции
f (х) называется производная от ее первой производной.
Ей 3 н. я. Виленкин
Например, если дана функция
/ (х) = Xs — 4х2 + Зх — 1,
то ее первая производная равна
f (х) = Зх2 — 8х + 3,
а вторая производная есть
f" (х) = 6х — 8.
В курсах высшей математики доказывают, что если на
отрезке 1а, Ь] вторая производная положительна, то кривая
обращена вогнутостью вверх на этом отрезке. Если же вто-
рая производная на отрезке la, Ь] отрицательна, то кривая
на нем обращена вогнутостью вниз. Пользуясь этим, полу-
чаем такое правило для применения способа Ньютона:
Пусть в точках а и b функция f (х) имеет различные зна-
ки, причем на отрезке [а, Ь] вторая производная функции
f (х) положительна. Тогда за начальное приближение хт
надо выбирать ту из точек а или Ь, в которой функция f (х)
принимает положительное значение. Если же на отрезке
[а, &] вторая производная отрицательна, то за начальное
приближение Xj надо выбирать ту точку, в которой функ-
ция f (х) принимает отрицательное значение.
§ 20. КОМБИНИРОВАННЫЙ МЕТОД РЕШЕНИЯ
УРАВНЕНИЙ
При решении уравнений часто комбинируют методы хорд
и Ньютона. Если график функции у — f (х) обращен вог-
нутостью вверх, то находят точки а1 и х± по формулам
«1 = а — / («) да _ (й) • (78)
x'~b~7W- <7Э»
Если же график функции у = f (х) обращен вогнутостью
вниз, то точку находят по формуле (78), а точку х± — по
формуле
Х1==а~~Г&)’ (8°)
66
Как видно из рис. 18, а и 18, б, корень Е, уравнения f (х) =
= 0 лежит обычно между полученными точками и хА.
Применяя снова к этим точкам формулы способа хорд и
способа Ньютона, получают новую пару точек а2 и х3
и т. д.
Таким путем получают две последовательности точек
ах, а2,..., ап,... и х1( х2,..., хп,---, приближающиеся с разных
сторон к искомому корню Преимущество описанного
способа состоит в том, что при нем получаются приближен-
ные значения как с избытком, так и с недостатком.
Рис. 18.
Пример. Решить комбинированным способом урав'
нение
х — sin х — 0,5 — 0
с точностью до 0,001.
Составим таблицу значений непрерывной функции
/ (х) = х — sin х — 0,5.
X —1 0 1 2
—0,659 -0,5 -0,341 0,591
Из этой таблицы видно, что корень уравнения лежит
между 1 и 2. По формулам 2 и 4 из § 18 имеем
f (х) == 1 — cos х.
Поэтому формула Ньютона принимает в нашем случае вид
i/i 4 Н. Я. Виленкин
67
Чтобы узнать, какое из значений 1 или 2 надо принять за
х0, найдем вторую производную от функции / (х). По форму-
ле 5 § 18 она имеет вид f" (х) = sinx. Но на отрезке [1, 21
функция sinx положительна*). Значит, пользуясь при-
веденным выше правилом, за х0 надо взять значение 2, при
котором положительна и функция / (х).
Имеем по формуле (81)
С другой стороны, по формуле (78) имеем
= 1— (—0,341) одиД(-О,3< =1'366-
Применяя далее формулы (81) и (78) к отрезку [а1; xj,
находим
1 гоо 1,533 — 1,030 — 0,5 ,
х2 = 1,583-----рдрщд—— = 1,501
и
а2 = 1,366 + 0,113-Ь||^|-= 1,491.
Далее находим
xs - 1,498,
= 1,498.
Итак, корень нашего уравнения с точностью до 0,001 есть
1,498.
§ 21. ПРИЗНАК СХОДИМОСТИ ПРОЦЕССА ИТЕРАЦИЙ
Применим теперь понятие производной для вывода но-
вого признака сходимости процесса итераций. Нам по-
надобится для этого одна формула, называемая формулой
Лагранжа (Лагранж — математик XVIII века, живший
во Франции).
Рассмотрим на отрезке [а, Ь\ кривую у = f (х). Обозна-
чим через М начальную точку этой кривой, а через N —
*) sin х положителен на отрезке [0; л] = [0; 3,141...] Значит, sin х
положителен и на части [1,2] этого отрезка.
68
ее конечную точку и проведем хорду MN. Угловой коэф-
фициент этой хорды имеет вид
«хорды — tg Ф — мр
PN = f (&) — f (а), и потому
(b)-f(a)
b— а
(рис. 19). Но MP = b — а, а
k -1-
кхорды -------------------
Обозначим теперь через Т
удаленную от хорды MN. Ес-
ли провести через эту точку
прямую, параллельную хорде,
то она будет касаться кривой:
в случае пересечения на кри-
вой были бы точки, более уда-
ленные от хорды MN, чем
точка Т. Иными словами, ка-
сательная к кривой, проведен-
ная в точке Т, параллельна
хорде MN, и потому имеет
тот же угловой коэффициент,
что и хорда. Но угловой ко-
эффициент касательной равен
f (с), где с— абсцисса точки Т. Поэтому имеет место формула
f'(c) = f^Zfa(al- (82)
Эта формула и называется формулой Лагранжа. Заме-
тим, что точка с в формуле Лагранжа всегда лежит между
точками а и Ь. Формулу Лагранжа можно также записать
в следующем виде:
/ (Р) — f (а) = f (с) (Ь — а). (83)
Вернемся теперь к решению уравнения х = ср (х) по спо-
собу итераций. Пусть отображение у = ср (х) переводит
отрезок [а, Ь] в себя, причем на этом отрезке выполняется
неравенство | ср' (х) | < q, где q — некоторое число, меньшее
единицы, q < 1. Возьмем на отрезке [а, Ь] любые две точки
xt и х2. Тогда точки ср (xj и ср (х2) также принадлежат от-
резку [«, Ь\. При этом по формуле Лагранжа имеем
ср (х3) — <р (х3) = <р' (с) (х3 — хх),
4* 69
где с — некоторая точка, лежащая между и х2, а потому
принадлежащая отрезку [а, Ь]. Справедливо неравенство
| ср' (с) | < q < 1, а потому
I Ф (х2) — <Р (*1) | < q | х2 — Xj |. (84)
Неравенство (84) показывает, что <р (х) задает сжимающее
отображение. Но мы знаем, что если х ->• <р (х) — сжима-
ющее отображение отрезка [а, Н в себя, то для любой точ-
ки х0 этого отрезка последовательность х0, Xj,..., х„. где
хПг1 = Ф (х„), сходится к корню уравнения х = ф (х).
Таким образом, мы доказали следующую теорему:
Теорема. Пусть функция у = <р (х) задает отобра-
жение отрезка {а, Ь] в себя и пусть на этом отрезке выпол-
няется неравенство | ф' (х) | < q, где q <_ 1. Тогда, какова
бы ни была точка х0 отрезка [а, Ь], последовательность точек
х0, хх,..., хп,..., где хп+1 = <р (х„), сходится к корню уравнения
X — ф (х).
Грубо говоря, смысл доказанной теоремы заключает-
ся в том, что процесс последовательных приближений поз-
воляет найти те корни £ уравнения х = ф (х), в которых
выполняется неравенство | ф' (В) | < 1. Можно сказать, что
эти точки притягивают к себе ломаную, геометрически
изображающую процесс итераций (см. § 8), а точки, где
| ф' (£)| > 1, отталкивают от себя эту ломаную.
Если неравенство | ф' (х) | < q < 1 выполняется на
всей числовой оси, то процесс итераций сходится при лю-
бом выборе начального приближения х0 (см. § 10).
Пример 1. Можно ли применить процесс итераций
для решения уравнения
cos х -4- sin х r,
х =------1----- ?
В данном случае
Поэтому
, , , — sin х 4- cos х
ф (х) = -------.
Но । sin х | 1, | cos х I О 1, поэтому
I , , х , I — sin X + COS X I I sin X I + I COS X I 1
k W! = | --------4---------------- 4------ <2-’
и процесс итерации применим.
70
Пример 2. Применим ли процесс итераций для ре-
шения уравнения
х = 4 _ 2*? (85)
Искомый корень лежит на отрезке [1, 2], так как непре-
рывная функция у = х — 4 + 2х меняет знак на этом от-
резке:
1 — 4 + 21 < 0, а 2 — 4 + 22 > 0.
Но в данном случае имеем
<р'(х) = — 2х 1п 2.
Оцепим выражение 2х In 2 на отрезке [1, 21. Если
и потому
1 х 2, то 2 < 2х «С 4,
2 In 2 < 2х In 2 < 4 In 2.
По таблицам натуральных логарифмов (основанием кото-
рых является число е 2,78...) имеем 1п 2 = 0,69... Зна-
чит, на отрезке [1,2] выполняется неравенство
1,38... < 2х 1п 2 < 2,76...
и процесс итераций неприменим.
Чтобы применить процесс итераций, преобразуем урав-
нение (85). Перепишем его в виде
2х = 4 — х
и прологарифмируем обе части по основанию 2. Тогда по-
лучим
х = log 2 (4 — х).
В этом случае
ф W = (4-х) 1П 2
и на отрезке [1,2] выполнено неравенство
|ф (*)К 2 In 2 1,38 < ’•
(Вывод этого неравенства читатель легко сделает сам.)
Поэтому при такой записи уравнения процесс итераций
сходится.
71
§ 22. БЫСТРОТА СХОДИМОСТИ ПРОЦЕССА
ИТЕРАЦИЙ*)
Используем теперь производную функции ср (х) для оцен-
ки скорости сходимости итераций при решении уравнения
х = ср (х). Мы хотим оценить скорость, с которой убывают
погрешности | — хп приближенных значений хх,
.... хп,... корня s-
—।----------;--1—।----------1—
и i с, х, - Ъ
Рис. 20
Заметим, что справедливы равенства £ = <р (!•) и x„+t =
==> ср (хп). Из них вытекает
Яп+1 = g — хп+1 = ф (£) — ф (хп).
Но по формуле Лагранжа имеем
ф (ё) — ф (лд) = ф' (tn) (£ — хп) ф' (с„) ап,
где сп — точка, лежащая между точками хп и £. Поэтому
ап+1 = ф' (с„) ап. (86)
Из равенства (86) вытекает следующий вывод:
Пусть £ — корень уравнения х = ф (х) — лежит на
отрезке [a, М. Если на этом отрезке выполняется неравен-
ство | ф' (х) | < q < 1, а начальное приближение %! также
выбрано на отрезке [а, Ь], то при любом п выполняется со-
отношение
K+i| < KI- (87)
В самом деле, из равенства (86) имеем
|^2| = | Ф' (сО || aj.
Но точка q лежит на отрезке [а, 6] (рис. 20), и потому
I ф'(С1) I < 7-
Отсюда следует, что
_______________ k> I < < I м I
*) Этот параграф при первом чтении можно опустить.
72
Точно так же мы
| «3 | =
и вообще
получаем, что
I ф' (^2> || 0С21 <q |а2|
< Л а11
I ^/i+i | < qn |^i |-
Тем самым наше утверждение доказано.
Так как при 0 < q < 1 последовательность чисел q,
q2,..., qn,... стремится к нулю, то и погрешность а,1+1 стре-
мится к нулю с возрастанием п. Иными словами, при ука-
занных выше предположениях числа х1;..., хп,... приближа-
ются к числу £, причем разность |£ — хП411 убывает бы-
стрее, чем | Xj | qn.
Точно так же можно доказать, что если на отрезке
la, i>] выполнено неравенство
Iф' Wl > 1.
то процесс итераций расходится.
Особенно быстро сходится процесс последовательных
приближений, если в точке £ производная функция q; (х)
обращается в нуль. В этом случае по мере приближения к
£ значение <р' (х) стремится к нулю. Так как
|&/г+1 | | ф Фи) | | ®п|,
то сходимость процесса ускоряется по мере приближения
к точке £.
Мы уже столкнулись с этим обстоятельством при извле-
чении квадратных корней по способу итераций. На-
помним, что при этом мы заменили уравнение х2 — а урав-
нением х = х . Но производная функции ф (х) — -х Т а
ил ил
равна выражению
, , , _ (х- + а)' 2х — (х2 + а) (2х)' _
~ ix-
_ 2х-2х — (х2 + а) 2 _ х2 —а
— 4х2 2х2
(см. правило 4 из § 18 и формулу (55) из § 13), поэтому
Ф'(/а) =
(Уа)--а
2С/а)2
73
Таким образом, в точке х~У а производная функции ф (х)
обращается в нуль, а это вызывает ускорение сходимости
процесса по мере приближения к точке х = У а.
Явление ускорения процесса по мере приближения к
корню уравнения наблюдаемся и для способа Ньютона (част-
ным случаем которого является указанный способ извле-
чения корней). В самом деле, мы уже отмечали, что способ
Ньютона связан с заменой уравнения/ (х) = 0 уравнением
и последующим решением этого уравнения последователь-
ными приближениями. В этом случаем мы имеем
ф (х) = X----[Я ,
’ Пх) ’
но
1 Г Нх) Т _ , Г(хШ(х)]' —((х)[Пх)]' —
Ф “ 1 L Г(Х) J ~ [Г (Х)]2
= 1 — И' (Х)Р—/ (Х)Г (X) f (X) f" (X)
lf'(x)]2 [/' (X)]2 •
Так как в точке | выполнено равенство / (£) = 0, то ф' (£) =
= 0. А это, как было показано, обеспечивает ускорение
сходимости процесса приближений по мере стремления к
точке
§ 23. РЕШЕНИЕ СИСТЕМ ЛИНЕЙНЫХ УРАВНЕНИЙ
МЕТОДОМ ПОСЛЕДОВАТЕЛЬНЫХ ПРИБЛИЖЕНИЙ
Мы решали до сих пор уравнения с одним неизвестным.
Перейдем теперь к решению систем уравнений. При этом
мы начнем с рассмотрения систем первой степени.
Пусть даны т уравнений первой степени с т неизвест-
ными *)
ЙцХ1 ПДэХг UimXm = bl,
CliiXi -|- а22Х2 "Г . . . -Т ClimXm = Ь2, (gg)
Я/ni-Xl "I- &т Хз -ф . . -Т ЧттХт = Ьт.
*) Мы обозначаем в этих уравнениях неизвестные буквами х1( х2, . . .
..., хт, а коэффициенты — буквами а;;-. Здесь Первый значок обо-
значает номер уравнения, а второй — номер неизвестного. Например,
а47 —это коэффициент в четвертом уравнении при седьмом неизвестном.
74
Такие системы встречаются в различных приложениях.
Например, когда геодезисты уравнивают результаты из-
мерений больших частей земной поверхности, им приходит-
ся иногда решать системы, состоящие из многих сотен
уравнений. Приходится решать такие системы уравнений
и инженерам при расчете стержневых конструкций и мно-
гим другим специалистам.
Решать такие системы обычными методами (например,
методом исключения неизвестных) часто бывает чрезвы-
чайно затруднительно. Более удобным оказывается метод
последовательных гоиближений. Покажем сначала на при-
мере, как это делается.
Пусть дана система уравнений
10хг — 2х2 + х3 — 9,
+ + 5х2 — х3 = 8,
4хх + 2х2 + 8X3 = 39.
Требуется найти неизвестные х1( х2, х3 с точностью до 0,01.
Выразим из первого уравнения х1( из второго уравне-
ния х2 и из третьего уравнения х3. Тогда система примет
такой вид:
Xi = 0,9 4- 0,2 х2 — 0,1 х3,
х2=1,6 — 0,2xi+ 0,2 х3,
х3 = 4 — 0,5X1 —0,25 х2.
(89)
Возьмем любые значения хх, х2, х3 в качестве начальных
приближений, например, положим Xi0) = 0, х20) = 0, Хз0) = 0.
Подставим эти значения в правые части равенства (89) и
примем получающиеся значения xv х2, х3 за следующие
приближенные значения. Мы получаем
х?’ = 0,9;
х2п = 1,6;
х(3п = 4.
Найденные значения снова подставим в правые части урав-
нений (89). Получаем приближения
42> = 0,9 + 0,2-1,6 — 0,1-4 = 0,82,
х® = 1,6 — 0,2-0,9 + 0,2-4 = 2,22,
= 4 — 0,5-0,9 — 0,25-1,6 = 3,15.
75
Вообще, если найдены значения х^, х(2п), х3п), то сле-
дующие приближения вычисляются по формулам
х<л+1> = 0,9 + 0,2хГ’ — 0,14п),
хГ+1) = 1,6 — 0,2хГ’ + 0,2хГ\
х(3п+1) = 4 — 0,5х(л) — 0,25хГ-
(90)
Результаты вычислений приведены в табл. 2.
Таблица 2
п 1 2 3 4 5 6
xf 0,9 0,82 1,03 1,01 1,00 1,00
г(п) х2 1,6 2,22 2,07 2,00 1,99 2,00
4,0 3,15 3,03 2,97 3,00 3,00
Мы видим, что в пределах заданной точности выполняются
равенства
х? = х«\ х<в) = х<У, 46) = Х<6). (91)
Полагая в равенствах (90) п = 5 и принимая во внимание
равенства (91), получаем, что в пределах заданной точности
х*6)«0,9+ 0.2Х® — 0,1Хз6),
х(5)~1,6— 0,2xi6) + 0,2х(36),
xf ~ 4 — 0,5xi6) — 0,254й
(на самом деле, эти равенства выполняются точно, но это
несущественно). Отсюда следует, что числа х(й = 1,00;
х!,6’ = 2,00; хГ = 3,00 являются (в пределах заданной точ-
ности) решениями заданной системы уравнений.
Точно так же поступают в общем случае *). Пусть дана
система уравнений (88). Выразим из первого уравнения хр
•) Дальнейший текст до конца этого napai рафа может быть опущен
при первом чтении.
76
из второго — х2 и т. д. Тогда система (88) примет такой
вид:
апи тт тт y ami y ат,т-1 Л1 • • • "" п итт итт (92)
ПустьхР х(п—некоторые начальные приближения
для неизвестных х1,...,хт.
Подставляя эти приближенные значения в правые части
равенств (92), мы получим вторые приближения х^,...
.... х'т для искомых неизвестных:
х<? = Ьг аи 012 Ы1) • Ло • Оц • •
х<2) = Ьг а21 (1) - . -
<-^22 <2‘22
__ °lfrl г(1)
Лт ’
<2ц
а2т „(1)
Xnt ’
(2) Ьп aml (1) atn.m~l (1)
хт — д----••• а т~1’
итт тт тт
Точно так же если уже найдены n-е приближения х(">
х(2Л) х(т для неизвестных, то следующий шаг вы полня
ется по формулам
aJ2
ап
а1т у(п)
п л т
ап
„(л)
лт
„(п+1) Ьп aml (п)
Лт —--------------------~~---Л1
tft 11 (1 А
итт итт
.(п
'1П-1
(93)
Рассмотрим теперь задачу, в которой речь будет идти
не о решении системы линейных уравнений методом после-
довательных приближений а, наоборот, о нахождении
5 Н. Я- Виленкин
77
предельного состояния некоторого процесса приближений
путем решения системы уравнений.
Имеется три ведра. В первом из них 12 л воды, а второе
и третье ведра пустые. Из первого ведра переливают поло-
вину воды во второе, потом из второго ведра — половину воды
в третье и, наконец, из третьего ведра — половину воды в
первое ведро. Этот цикл повторяют 20 раз. Требуется оп-
ределить (с точностью до OjOOOl л), сколько воды окажется
после smoeo в каждом ведре.
Ясно, что здесь речь идет о последовательных прибли-
жениях к некоторому предельному распределению воды.
Это предельное распределение характеризуется тем, что оно
не меняется после проведения одного описанного выше цик-
ла переливаний. Если в начале цикла в первом ведре х
литров воды, во втором у, а в третьем 12 — х — у литров
(общее количество воды не меняется в процессе перели-
вания), то описанный выше цикл задается следующей таб-
лицей:
1-8 ЙС.ЦрО 2-е ведро 3-е ведро
Начальное состояние X У 12—х—у
X
После 1-го переливания V ~2~+У 12—х—у
X X у 3 у
После 2-го переливания 12--4-х-у
, X у .V . у г 3 и
После 3-го переливания С’ Т 8 — 4 “Г+1Г
Для того чтобы этот цикл переливаний не изменял коли-
чества воды в каждом ведре, должны выполняться следую-
щие уравнения:
, х у
Х = 6+
Решая их, находим, что х — 6, у = 3. Значит, предель-
ное распределение характеризуется тем, что в первом вед-
ре 6 л воды, во втором 3 л, а тогда и в третьем будет 3 л
воды.
Выясним, с какой скоростью приближается заданное
распределение воды к предельному. Пусть первое ведро
еодержит а литров, а второе b литров. После одного цикла
78
в первом ведре окажется
01 = 6 +
b
4
а
К
(94)
литров, а во втором
, а b
2
(95)
литров.
Обозначим а — 6 через а, b — 3 через р, аг — 6 через
и b-L — 3 через pt. Тогда из равенств (94) и (95) следует,
что
и
R ь о а— 6 &— 3
аВ
т т
После второго цикла погрешности будут выражаться фор-
мулами
„ _ _“t_______Pi _ J_ la_ 1 /л, JJ \ _
3 8 4 ~ 8 к 8 4 / 4 \ 4 ‘ 2/ ~
1. (л. _ lb ' 1 г
4 \ 8 4 / ”4" 2 \ 4 ' 2 /
32
Поэтому если | а | < е и I р | < а, то
I ^2 !
13
о 4
е~0,2е,
| Рг | дт 8 — 0>34 е.
Это означает, что два цикла переливаний уменьшают по-
грешности а и р не менее чем в три раза. Поэтому после 20
циклов она уменьшится по крайней мере в З16 ~ 70 000
раз. Значит, с точностью до 0,0001 л после 20 циклов пере-
ливаний в первом ведре будет 6 л воды, во втором — 3 л
и в третьем 3 л.
5*
§ 24. РЕШЕНИЕ СИСТЕМ
НЕЛИНЕЙНЫХ УРАВНЕНИЙ
МЕТОДОМ ПОСЛЕДОВАТЕЛЬНЫХ ПРИБЛИЖЕНИЙ
Методом последовательных приближений (итераций)
можно решать и некоторые системы нелинейных уравнений.
Рассмотрим, например, систему уравнений
Выберем в качестве первых приближений х0 = 0, у0 = 0.
Подставляя эти приближения вместо х и у в правые части
уравнений, получим следующие приближения: хг = ,
Уу = 1. Подставляя эти приближения в правые части урав-
нений (96), получаем = 2 + 2^-1 = 2,25, й=1 + -^=1,15.
Продолжая этот процесс, мы получим V „ 2 4 2’25М 145 -2 31 л3 — Z -f- 1» Уз=1 +А25..+..14£^1,18, Xi = 2 + ^ = 2,33, У4 = 1 + ^31+^.. = 1,18, v = 2 + = 2,33, Лу . , 2,.33 + 1,185 . 1Q у5 = 1 н :~ = 1,18. s । 20
Мы видим, что с точностью до 0,01 выполняются равенст-
ва х4 = х3 = 2,33 и уц = у5 = 1,18. Поэтому с указанной
точностью имеем х = 2,33 и у = 1,18.
Вообще, если задана система уравнений
х = ф(Х, у), '
у = ^(x, у), .
(97)
80
где ср (х, у) и ф (х, у} — какие-то функции, то мы выбираем
начальные приближения х0 и у0, подставляем их в правые
части уравнений (97) и далее ведем расчеты по формулам
х„+1 = ф (х„, |
г/п+1 = Ф (x„, уп). J
(98)
Если при некотором номере п с заданной степенью точности
выполняются равенства хл+1 хп, ум ~ хп, то с этой сте-
пенью точности имеем х^ахп,
У ~ Уп-
Точно так же решаются
системы уравнений с тремя и
большим числом неизвестных.
Выясним теперь, при ка-
ких условиях можно гаранти-
ровать сходимость процесса
последовательных приближе-
ний при решении систем.
Мы будем считать, что функции ср (х, у} иф (х, у) в си-
стеме уравнений (97) заданы в некоторой ограниченной
замкнутой области D на плоскости х, у. Иными словами,
мы будем считать, что область D целиком лежит внутри
какого-то квадрата и что ей принадлежат все ее граничные
точки. Примерами таких областей могут служить круг,
многоугольник (взятый вместе с граничной ломаной),
эллипс и т. д. Мы будем считать, кроме того, что функции
Ф (х, у) и ф (х, у) непрерывны в области D. Функции ф (х, у)
и ф (х, у) задают отображение области D на какую-то
область, лежащую в той же плоскости. Чтобы найти, в
какую точку переходит точка Л10 (х0, г/0) области D, надо
подставить ее координаты вместо х и у в ф (х, у) и ф (х, у).
Результаты подстановки и дадут координаты образа точки
УИ0. Например, если
ф (х, у) = х2 + г/2,
Ф (-4 У) ~ %ХУ>
то точка Мо (1, 3) переходит в точку No (10, 6).
В дальнейшем мы будем обозначать отображение, за-
данное функциями ф (х, у) и ф (х, у) одной буквой Ф, а об-
раз точки М при этом отображении обозначим Ф (Л4).
Через Ф (D) обозначим образ всей области D,
81
Пусть отображение Ф переводит область й в ее часть
Dj = Ф (D). Тогда можно повторно применить то же са-
мое отображение. При этом область перейдет в свою
часть Z)2== Ф (DJ, которая, конечно, тоже лежит в области D.
Продолжая этот процесс, мы получим систему вложенных
друг в друга областей D, Dr, Dn,... (рис. 21).
Назовем отображение Ф сжимающим, если существует
такое число q, что 0 < q <с 1, и для любых двух точек
и Л12 из области D выполняется неравенство
г (Ф (Л^), Ф (Л12)) < qr (Л11; М2).
Здесь через г (Л1, Л') обозначено расстояние между
точками М и N.
Точно так же как и в случае одного переменного, до-
казывается следующее утверждение:
Пусть отображение Ф переводит область D в свою
часть и является сжимающим. Тогда в области D есть единст-
венная точка N такая, что N — Ф (jV). Эта точка принад-
лежит всем областям Dn. Координаты "П точки N удов-
летворяют системе уравнений (97), то есть
ъ = ф (i, 11),
П = Ч1 (L 10-
Как и в случае одного переменного, значения Вир
приближенно вычисляются методом итераций. Если
Мо (х0, Уо) — любая точка области D и Мп^ = Ф (Al„)
(то есть = ср (хл, уп), yn^i — ф (хп, хм)), то последова-
тельность точек Мо, Мп>... сходится к неподвиж-
ной точке N отображения Ф.
§ 25. ВИДОИЗМЕНЕННОЕ РАССТОЯНИЕ
Условие, что отображение Ф является сжимающим, дает
достаточный признак сходимости процесса итераций. Но
этот признак не является необходимым. Отображение Ф
может не быть сжимающим, а процесс итераций все-таки
сходится. Например, отображение Ф, заданное функци-
ями ф (х, у) =14-2г/, ф(х, у) = 3 4- не сжимающее.
Если взять А (8, 0), В (8, 4), то
г (А, В) = 4, Ф (А) = (1, 4), Ф (В) = (9, 4)
82
и
г (Ф (Л), Ф (В)) -= 8 > г (А, в).
Однако, какую бы точку Л1о мы ни взяли, последователь
ность точек Мо, Мп,... сходится к точке
В некоторых случаях удается установить сходимость
процесса итераций, видоизменив определение расстояния
между точками на плоскости. Дело в том, что расстояние
между точками можно определять по-разному. Для путе-
шественника естественно измерять расстояние временем, ко-
торое надо потратить, чтобы добраться из точки Л в точ-
ку В. А тогда расстояние между точками Л и В на рис. 22, а
определится суммой длин отрезков Л С, CD и DB (что-
бы попасть из точки А в точку В, надо дойти до моста CD,
перейти этот мост и из точки D попасть в точку В). А если
движение на плоскости может происходить только в двух
взаимно перпендикулярных направлениях, то за рассто-
яние между точками Л и В на рис. 22, б надо принять вум-
му отрезков АС и СВ. В других случаях удобнее считать
«расстоянием» между точками Л и В длину большего из от-
резков АС и СВ. Можно придумать и другие определения
«расстояний» между точками плоскости. (Подробнее о раз-
ных определениях расстояний можно узнать из книги
Ю. А. Шрейдера «Что такое расстояние?».)
83
Обычно требуют, чтобы расстояние г (Л, В) между точ-
ками обладало следующими свойствами:
1) Расстояние г (А, В) между любыми двумя точками
А и В неотрицательно, причем оно равно нулю лишь в
случае, когда точки А и В совпадают.
2) Для любых двух точек А и В выполняется условие
симметрии
г (Л, В) =- г (В, .4).
3) Для любых трех точек А, В, С выполняется неравен-
ство треугольника
г (А, В) < г (Л, С) + г (С, В).
Если в каком-нибудь множестве объектов определено
расстояние, обладающее этими свойствами, то это множе-
ство называют метрическим пространством, а элементы
множества — точками этого пространства. Точками мет-
рического пространства могут быть даже функции. Для
непрерывных функций q> (х) и ф (у) на отрезке [а, Ь] рас-
стояние определяют как наибольшее значение функции
| ср (х) — ф (х) | на этом отрезке:
г(ф, ф)= max | ф (х) — ф(х) |.
Мы уже видели выше, что плоскость можно различными
способами превратить в метрическое пространство: для
всех указанных выше способов определения расстояния вы-
полняются условия 1) — 3).
Укажем интересный пример, когда условия 1) и 3) выполнены, а
условие симметрии 2) не выполняется. Будем измерять расстояние
между точками А и В в горной местности временем, нужным, чтобы по-
пасть из А в В. Так как время подъема на вершину горы отличается
от времени спуска с нее, тог (Л, В) =р г (В, Л).
Оказывается, что для сходимости процесса последова-
тельных приближений при решении системы уравнений
' (99)
У--- ф(х. у) J
достаточно выполнения следующего условия:
Отображение Ф, задаваемое функциями <$(х,у) и ф (х, у),
переводит область D в себя и является сжимающим от-
84
носительно хотя бы одного «расстояния» г (А, В). Иными
словами, должно существовать число q такое, что Q<iq<Z
<; 1, и для любых двух точек и М2 из D выполняется не-
равенство
г( Ф (MJ, Ф (М2)) < qr (Л1Н М2).
Возьмем, например, функции ср (х, у) = 1 ф- 2у и
ф(х,?/) 3 + —. Оказывается, что определяемое ими ото-
бражение Ф является сжимающим с коэффициентом 1/2,
если определить расстояние г (А, В) между точками А (лу, уА
и В(х2, уА формулой
г (Л, В) = I — (х2 — x'i) + 2 (у2 — у А | +
4-1 -2_ (х2 — хА — 2 (z/2 — уА | .
Например, для точек А (8,0) и В (8,4) имеем г (А, В) =
= 16, а для их образов Ф (Л) и Ф (В) имеем
г (Ф (Л), Ф (В)) = 8.
После отображения Ф «расстояние» вдвое уменьшилось.
Именно этим объясняется, что процесс итераций для реше-
ния системы уравнений
х = 1 + 2у,
сходится, хотя отображение Ф и не является сжимающим
относительно обычного расстояния (см. стр. 82).
§ 26. ПРИЗНАКИ СХОДИМОСТИ ПРОЦЕССА
ПОСЛЕДОВАТЕЛЬНЫХ ПРИБЛИЖЕНИЙ
ДЛЯ СИСТЕМ ЛИНЕЙНЫХ УРАВНЕНИЙ
Применим получений выше признак сходимости к си-
стемам линейных урагнений. Выбирая различным образом
«расстояния», мы получим признаки сходимости для этих
систем, выраженные через свойства их коэффициентов.
85
Рассмотрим сначала систему двух линейных уравнений
с двумя неизвестными
ЯцГ + а12у - 6Ъ |
ацХ 4- а22у — &2- ;
(100)
Пусть ап =^= 0 и я22 4= 0. Решим первое уравнение отно-
сительно х, а второе — относительно у. Получим систему
уравнений
С?22 ^22
ГТ Q #12 О
Для краткости положим — = рь----------------------— аг, — = В2
а1Х а13
- = а3.
0-22
Тогда система примет вид
х ~ Л1У "Г Рь | (100'
В данном случае функции, задающие отображение Ф,
имеют вид
ф (х, у) = aty 4 Ръ ф( х, у) = а2х 4- Р2-
Выясним, какими должны быть коэффициенты а1 и а2
для того, чтобы это отображение было сжимающим.
Как известно, расстояние г (А, В) между точками
A(xi, yr) и В (х2, у2) выражается формулой
г (Д, В) — (Л'2 — Xi)2 4 (Уъ — J/i)2-
Преобразование Ф переводит точку А в точку А1(а1у1 4-
4 Pi, а2%! 4 Р2), а точку В — в точку В} (oq^g 4
4- Pi,«2x2 + Рг)- Расстояние между этими точками выража-
ется формулой
г (Д1, Bi) = |4(311/2 — <xij/i)2 4 (<хг-'.2 — a2%i)2 —
= У^у^У1)2 4 а2 (ад - xi)2. (101)
Обозначим большее из чисел | ctx | и | а, | через q:
q = max (| cq i, j a,, I).
86
Тогда из формулы (101) вытекает неравенство
г (А, < q (х2 — %!)2 4- (г/а — У1У‘ = qr (Л. В).
Значит, если q <_ 1, то отображение Ф является сжи-
мающим на всей плоскости. Тогда, как мы знаем, процесс
последовательных приближений сходится.
Итак, мы доказали, что если
max (jail, |a2|)< 1, (102)
то процесс последовательных приближений при решении
системы уравнений (100') всегда сходится.
Выразим полученный признак сходимости непосредст-
венно через коэффициенты системы уравнений (100). Для
этого вспомним, что
Подставляя эти выражения в условие (102), получаем следую
щий вывод:
Для сходимости процесса последовательных приближе-
ний при решении системы линейных уравнений
апх ЩлУ = ^i>
a2ix + а22у = Ь2
достаточно, чтобы выполнялось условие
Это условие выражает, что диагональные коэффициент
ты должны быть больше, чем недиагональные коэффици-
енты, стоящие в той же строке. Поэтому, например, при
решении системы
х — Зу = — П,
6х -4- у — 10
первое уравнение надо решить относительно у, а второе —
87
относительно х:
У
5______у_
3 6 •
Иногда полезно предварительно преобразовать систе-
му уравнений, заменив неизвестные хну пропорциональ-
ными им неизвестными. Возьмем, например, систему урав-
нений
} с®)
ол ~У ~~~ * •
Для нее
max i
Д_
,12 ’
и поэтому не выполняется достаточный признак сходимо-
сти процесса приближений. Но если положить х = ~ г, то
О
получим систему
4г + У ~ 14, |
г —2у = — 1, J
(Ю4)
для которой
max !
Got
&22
I 1
max -7-
\ 4
1 \ 1
Значит, систему (104) можно решать последовательными
приближениями.
Разумеется, никому не придет в голову решать столь
простые системы, как (104), методом последовательных
приближений. Но для систем с большим числом неизвест-
ных этот метод бывает очень полезен. Достаточные призна-
ки сходимости для решения системы
аих1 яггЛ'а 4~ • • • Д- ainxn — bi.
а21х1 Д' Й22х2 -(-••• ~|- а^цХц, — bi,
(105)
O-nlXl Д' Д- • • • 4“ 0-п.цХп — Ьп .
устанавливаются примерно так же, как и для системы урав-
нений с двумя неизвестными. Однако здесь разные опре-
деления расстояния между точками приводят к разным ре-
зультатам. Именно, справедливо следующее утверждение:
Процесс последовательных приближений для систе-
мы (105) сходится, если выполнено одно из следующих
88
условий:
(106)
(107)
(ЮЗ)
В суммах (106) и (107) штрих обозначает, что опущено
слагаемое, для которого i = /. В сумме (108) значок (k)
означает, что опущены не только слагаемые, для которых
i — /, но и слагаемые, для которых i = k. Отметим, что ус-
ловие 3) заведомо выполняется, если
1,
(109)
где штрих означает пропуск слагаемых, для которых i — j.
В большинстве книг по вычислительной математике это ус-
ловие приводится именно в форме (109).
Как мы уже говорили, условия (106) — (108) получа-
ются, если потребовать, чтобы отображение
Хп *
61
Чц
й|2 г ___
411 2
ап
хп
ап1 „ ап2 „
----Л1 - Л2
а---а
ипп пп
а1, п-1
%п-1
было сжимающим относительно некоторого расстояния.
Именно, условие (106) соответствует расстоянию
г (А, В) = max (|.ху — г/j|..... |х„—r/„|),
условие (107) соответствует расстоянию г (Д, В)= х,— у£\
i=i
/п
2 — У‘У
между точками Л(зу,..., х,;) и В (zy,..., уп).
89
Как и в случае двух переменных, иногда бывает полезно заменить
неизвестные ,гт, . . хп пропорциональными им неизвестными
У1 = • •, Уп ” Рпхп> гае Pi > 0. Рп > °-
В этом случае условия (106), (107), (108) примут вид
1') max i п 2' /"=i а а а Г
2') шах i п 2' Z=1 п я ! ! а Pl Р: С 1
3') max к п i, 7=1 аи aii 2 Р21 о Р1 4 1
(106')
(107')
(108')
В час гное го, при I аи | эти условия принимают вид
1") max V 3/ /Z;; <1, (106")
n
i
2") max 2' <1, (107")
‘ Z=1
3") max V k /-1 i, — tk) 4 c jl 2 < 1. ii (108")
Для примера рассмотрим систему уравнений
х — 0,6// — 0,5г ~ — 2,6,
— 0,2х 4- р — 0,4z — 3,
— 0,1% 4~ 0,5г/ 4- г = 3,9.
Условия 1), 2), а также Г), 2') для этой системы не вы-
полняются. Точно так же для нее не имеет места неравен-
ство (109) — сумма квадратов недиагональных элементов
равна 1,07. Но
и.,
max 2 = шах (0,62 4~ 0.52 4~ 0,22 0-0,42; 0,62 +
4- 0,52 4- 0,12 Д-0,52 ; 0,22 + 0.42 4~ 0,12 + 0,52) =
= 0,87 < 1,
и поэтому систему можно решить методом последовательных
приближений.
90
Заметим, что все сформулированные выше условия до-
статочны для сходимости процесса последовательных при-
ближений, но они никоим образом не являются необходи-
мыми. Выбирая другие определения расстояния между
точками и записывая условие сжимаемости, мы получаем
иные условия сходимости. Однако этот вопрос мы не бу-
дем сейчас рассматривать.
Для систем линейных уравнений верны те же замеча-
ния, какие были сделаны в § 5. Например, результат при-
ближений не зависит от выбора начального приближения.
Поэтому если в ходе вычислений была допущена ошибка,
то она не обесценивает дальнейших вычислений, а лишь
замедляет достижение окончательного результата.
Существует ряд разновидностей способа последователь-
ных приближений для решения систем линейных урав-
нений. Так, в некоторых способах, найдя приближенное
значение xln+1), подставляют для нахождения x(2n'rl) значе-
ния x-L”+l), х(з\ х(4* ,..., х{т', потом для нахождения х(3п+1>
подставляют значения Xin+1), хУ*х\ хУ, ..., х(£! и т. д. Опи-
сание всевозможных способов приближений для систем ли.
нейных уравнений могло бы стать темой другой книжки-
§ 27. ПОСЛЕДОВАТЕЛЬНЫЕ ПРИБЛИЖЕНИЯ
В ГЕОМЕТРИИ
Мы описали применения способа последовательных
приближений для решения уравнений и систем уравнений.
Этот метод находит приложения и в некоторых вопросах
геометрии, например, при вычислении длины окружности.
Как известно, чтобы вычислить длину окружности, снача-
ла находят периметр вписанного в нее квадрата, потом пе-
риметр вписанного правильного восьмиугольника, пра-
вильного шестнадцатиугольника и т. д. Предел этих пе-
риметров и равен длине окружности. При этом каждый по-
следующий периметр вычисляется с помощью предыдуще-
го. Это делается следующим образом:
Обозначим сторону правильного 2л-угольника через Ап,
а его периметр через Рп- Например, А2 является стороной
квадрата, и потому А2 - R У 2, Р4 — 4R У2. Предположим,
что мы уже нашли Рп. Тогда, очевидно,
Ап
2"
В геометрии доказывается, что сторона а2п правильного
вписанного 2л-угольника выражается через сторону ап
правильного вписанного и-угольника и радиус R окруж-
ности по формуле*)
(ИО)
Значит, сторона Апц правильного З^-угольника вы-
ражается через сторону Ап правильного 2п-угольника
по формуле
Ап+1 — R ^^2—]/4~—.
р р
Поскольку Ап = ~ и Ап+1 = , то
*) Эту формулу легче всего вывести с помощью тригонометрии. Оче-
(И0-)
видно, если ап — сторона правильного вписанного n-угольиика, а
а2п — сторона правильного вписанного 2п-уголь-
ника, то
СТ Tt
ап = 2R sin — и а2п — 2R sin
(см. рисунок). Так как
Последовательность чисел Рг, Р3,..., Рп--- стремится к дли-
не окружности, то есть к значению 2л7?. Поэтому формулу
(ПО) можно рассматривать как формулу для вычисления
значения 2л7? по способу последовательных приближений.
Пользуясь этим способом, можно найти значение л с лю-
бым числом десятичных знаков.
Существует другой способ приближенного вычисления
л, называемый способом равных периметров. При этом спо-
собе правильный 2Г!-угольник заменяется правильным 2Л+1-
угольником, имеющим тот же периметр. Обозначим апо-
фему правильного 2л-угольника через 1п, а радиус описан-
ной окружности через гп. Апофему же правильного 2n+1-
Рис. 23.
угольника, имеющего тот же периметр, что и 2'г-угольник,
обозначим через /n+i, а радиус описанной окружности —
через /д+1.
Пусть АВ (рис. 23) — сторона 2'г-угольника, вписанного
в окружность радиуса гп. Соединим середину С дуги АВ
с точками А и В и проведем среднюю линию DE треуголь-
ника АСВ. Очевидно, что угол DOE равен половине угла
АОВ. Поэтому DE является стороной правильного 2'г+1-уголь-
ника, вписанного в окружность с радиусом OD. Так как
DE = у АВ, то периметр 2Г!+1-угольника равен пери-
метру 2л-угольника. Это означает, что r„+i = OD,
= ок.
93
Легко сосчитать, что
/л+1 = ОК = ^4^ • (1И)
Далее, из прямоугольного треугольника ODC находим
гп+1 = V гп1п+1. (112)
Формулы (111) и (112) выражают гп+1 и 1п+1 через гп и 1п.
При возрастании п периметры многоугольников не ме-
няются, а числа гп и 1п приближаются к одному и тому же
пределу. Этот предел равен радиусу окружности, длина ко-
торой равна периметру наших многоугольников. Если
выбрать начальный многоугольник так, чтобы его периметр
равнялся двум, то как г„, так и 1п стремятся к числу —;
1 - <1/1
11 гп гп = — ; 1; m I п = — .
тг L -ГТ
п--*оо л—>сс
Например, если выбрать за первый многоугольник квад-
рат со стороной 1/2, то г2 = , /2 = 4” • Поэтому имеет
/2
место следующее утверждение: если положить г2 = ,
1
1.2 = — и вычислять значения г„+1, 1п+1, п = 2, 3,... по
формулам (111) и (112), то
lim rn = lim /„ =
П-*ОО п—>00 л
По этим формулам можно приближенно найти значе-
ние — . Для этого надо вести расчет до тех пор, пока значе-
ния гп и 1п не совпадут в пределах выбранной точности.
Это общее значение гп и 1п и будет значением — с заданной
точностью.
§ 28. ЗАКЛЮЧЕНИЕ
Мы познакомились в этой книге с применениями способа
последовательных приближений к различным вопросам:
к составлению планов, к извлечению корней, к решению
уравнений, к вычислению длины окружности. Этим неис-
94
черпывается многообразие применений этого способа. Очень
многие задачи приводят к дифференциальным уравнениям
(в которые входят производные искомых функций), к ин-
тегральным уравнениям и уравнениям еще более сложного
вида. Одним из самых сильных методов приближенного
решения таких уравнений также является способ последо-
вательных приближений. Разумеется, его применение в
этих случаях значительно сложнее, чем в случае решения
алгебраических уравнений. Но можно смело сказать, что
без применения способа последовательных приближений
нельзя было бы решить ни одной из грандиозных физичес-
ких и технических задач, которые решаются в настоящее
время. И при расчете движения спутника, и при расчете
атомного реактора, и при исследовании строения атома
применяют этот метод. Однако рассказ о применениях
метода последовательных приближений за пределами эле-
ментарной математики выходит за рамки этой книги.
УПРАЖНЕНИЯ
Для того чтобы читатель мог проверить, насколько он овладел изло-
женными в этой книге методами приближенного решения уравнений, мы
приводим несколько примеров на приближенное решение уравнений.
Решить по способу итераций урав
1. 1 1 ' 1 ’ х cos х ’
(х+ I)2 •
2. х = (х4- 1/. 1 12. х = 1 + "iQ'sin х.
3. х = 4 + т7
Т х+ 1 13. х = iV 1g (х 4-2).
4. 4 х--=2+ Ух. 14. х2 = In (х 4 1).
3 15. In x = 4 — x2.
5. X = Уь — X. 16. In x = 2 —x.
6. 4 — х — tg х. 17. x- = ex 4-2.
7. х2 = sin X. 18. 1g x = 0,1 x.
8. х3 = sin X. 19. tgx = lgx.
9. . X + 1 1 _r
X —— ЯГСо1П / • 4 20. x = -уд- e x.
10. X = COS X.
Ньютона уравнения
У
нения*)
Решить по способ
21. х3 — 5х + 1 = 0.
22. х3 — 9х2 4- 20х — 11 = 0.
23. х® — Зх2— Зх + 11 = 0.
24. х6 + 5х + 1 = 0.
25. sin х + х = 1.
26. х2—10 1gx —3= 0.
*) В некоторых из приведенных здесь примеров надо сначала пре-
образовать уравнение к виду х = ср (х).
%
27. Решить с точностью До 0,001 методом последовательных приб-
лижений системы уравнений:
а)
б)
в)
х = 0,2 </— 0,1 г + 0,898,
г/ = 0,Зх + 0,15г + 1,383,
г =0,25х —0,4 г/ + 3,677;
1
х = —sin(x + y) + 0,336,
1
У =----sin (х— у) + 0.362;
х = /х + 2у— 0,710,
t/= Vy^x-i- 1.
РЕШЕНИЯ
1. Положим ф (х) = ——. Тогда ср' (.г) . Имеем
Ф (0) - ~ 1 > 0, ф (1) 1. Поэтому отрезок [0, 1] содержит корень
данного уравнения. Однако мы не можем применить метод последова-
тельных приближений к этому отрезку, так как |ф' (0)| = 2> 1. Чтобы
сузить отрезок, заметим, что ф (0,4) =-j Qg\> 0,4. Поэтому уравне-
2
ние имеет корень на отрезке [0,4, 1]. При этом | ф' (х)| <1 Е если
0,4 < х У 1, и, значит, можно применить метод последовательных
приближений. Полагая Xj = 0,4, получаем после 11 шагов приближе-
ния, что хц я?ф (хи) ~ 0,4655.
Значит, с точностью до 0,0001 имеем х — 0,4655.
2. Положим ф (х) = (х+ I)3. Тогда ф' (х) = 3 (х + I)3. Имеем
ф (— 2) = — 1 > — 2, ф (— 3) = — 8 < — 3. Поэтому отрезок
[— 3, — 2] содержит корень данного уравнения. Однако мы не можем
применить метод последовательных приближений, так как на отрезке
[— 3, — 2] имеем |ф' (х)| > 1. Перепишем заданное уравнение в виде
з __
х == Ух — 1.
1
Тогда ф (х) = У х — 1 и ф' (х) = —г— . На отрезке [-3,-2] име-
3 Ух2
1
ем | ф' (х) I -"С-з— < 1, и поэтому можно использовать метод после-
3 Ух
довагельиых приближений. Полагая Xj =—2, получаем хв~ф(х8) ~
х — 2,325. Значит, с точностью до 0,001 имеем х— — 2,325.
3 / Y _ 1
3. Положим ф (х) — i + у Д__—. Мы имеем
2
Ф'(х) = —-------------------
3 /(х-1)-(х+ 1р
98
Рис. 24 показывает, что прямая у “ х пересекается с кривой у =
двух точках, лежащих соответственно на
отрезках [— 1,0] и [4, 5]. На
отрезке [4, 5] имеем | ф' (х) I -%
2
< 1 Полагая х1=4,
15 /45
имеем ха ж® (х3) х 4,870. Зна-
чит, с точностью до 0,001 по-
лучаем х3 “ 4,870.
На отрезке [— 1,0] метод по-
следовательных приближений не-
посредственно не применим. Пе-
репишем иа этом отрезке урав-
х1
иение в виде (х — 4)3 — ,
х-1
откуда = х + 1 и
х —I
— 4)«
х —1 , _ 2х — 1
Здесь i|> (х) =-j—— 1 и t (х) = "(7^4/ ' Ясио, что
1
при —1 <х < 0 имеем | г|>' (х) | < 1, и теперь можно применить
Рис. 25.
Теперь решим уравнение х — ‘
Итак, корни уравнения равны 1 и I
метод последовательных приб-
лижений. Полагая xt = 0,
имеем х2 xty (xs) х — 0,9840.
Значит, с точностью до 0,0001
имеем х = — 0,9840.
Мы нашли два корня: х =•
= — 0,9840, х = 4,870 . 4
4. Здесь фх (х) = 2 + /х и
4 у—
ф2 (х) = 2 — у х. Из рис. 25 вид-
но, что уравнение х = 2 4' У х
имеет корень иа отрезке [3, 4].
На этом отрезке
|<р' (х) |=—— <1-
4 /х3
Применяем метод последова-
тельных приближений. Полагая
хх*= 4, имеем х4«ф (х4) ж3,353.
Значит, с точностью до 0,001 име-
ем х“ 3,353.
— угх. Оно имеет кооень х =* 1.
,353.
99
1
5. Здесь ф (х) = /'5 — х и q> (х) = —5-. Имеем
3 /(5^хр
3 —
Ф(1)=У4 <2,
Ф(2)=/3>1.
Поэтому существует корень уравнения иа отрезке [1, 2]. На этом отрезке
|ф'(х)|<—-—<1. Полагая х1=1, имеем х6 «ф (х6) х 1,516.
Рис. 26.
Значит, с точностью до 0,001
имеем х = 1,516.
6. Запишем уравнение в виде
х = arctg (4 — х).
Здесь ф (х) = arctg (4 — х).
Мы имеем ф (1) = arctg 3 » 1,25,
Ф (2) = arctg 2 ss 1,10 Отсюда
следует, что существует корень
этого уравнения, лежащий иа
отрезке [1, 2]. На этом отрезке
имеем
। ф' 1 = 1 + (4 —X)2 < ~ *
Поэтому можно применить метод
последовательных приближений.
х 1,225. Значит, с точностью
Полагая хг = 1, имеем х4 «ф (х4)
до 0,001 имеем х= 1,225.
7. Заданное уравнение имеет корень х = 0. Из рис. 26 видно, что
второй корень уравнения положителен. Поэтому он удовлетворяет урав-
нению х =/sin х. Здесь ф (х) = /sin х и ф' (х) =
COS X
2 /sin х
. Так как
<Р
/0,4794 >_1_
И
ф (1) — jAsin 1 ж /0,8414 < 1,
то уравнение имеет корень на отрезке
Р/а; !]• На этом отрезке имеем
1
cos —
I ф' W I
0,8703
1,3846 <’
и потому метод последовательных приближений сходится. Полагая
Xj — 1, имеем х7 «ф (х7) ж 0,8768. Значит, с точностью до 0,0001
второй корень уравнения равен 0,8768.
100
8. Решается аналогично предыдущему,
в виде
я______
х — У sin х,
Переписываем уравнение
полагаем хх = 1 и получаем хвяф (х6) х 0,9286. Поэтому с точностью
до 0,001 один из корней уравнения равен 0,9286. Так как обе части
уравнения — нечетные функ-
ции, то имеем еще корень
—0,9286. Третьим корнем яв-
ляется 0.
9. Уравнение можно пе-
х -{- 1
реписать в виде —— =
— sin х, — л/2 х 4 л/2. Из
рис. 27 видно, что это урав-
нение имеет единственный ко-
рень, лежащий между 0 и
л/2. В данном случае
у _.!
m (х) = aresm —‘—
4
, ч 1 Рис. 27.
ф — /16—(x-flj* ’
На отрезке [0, л/2] имеем | <р' (х) | </—</1. Полагая xL = 0, находим
xs ~ <р (х8) ж 0,3422. Значит, с точностью до 0,0001 имеем х = 0,3422.
Рис. 28.
10. Так как cos 0=1,
cos 1 > 0, то уравнение х = cos х
имеет корень на отрезке [0, 1].
Поскольку |ф' (х) | < sin 1 < 1,
то можно применить метод после-
довательных приближений. По-
лагая X] = 1, получаем, что с
точностью до 0,0001 х = 0,7391.
11. На рис. 28 видно, что
положительные корни уравне-
ния близки к точкам пересече-
ния графика функции у = cos х
с осью абсцисс и расположены
справа от точек пересечения ви-
зг
Да у]- (26 4-1) л и слева от
точек пересечения вида 4~ 2Z?n. Чтобы найти решение, расположенное
около точки х = -г,—р пл, положим х — пл — ~ у. Уравнение
примет вид
л 1 п"+!
у ] пл 4 у =-----------------— = —
cosly! пл |-у) Slili'
101
fl “ - Ji>
При этом — — ’ч У "Ч у » и потому уравнение можно записать так:
1
у = (— l)n+1 arcsin--------------у
у + пя 4- -тг
Здесь
1
Ф (У) = (~ 0n+1 arcsin----------------
у пл 4~ у
и
(- !)п
ф (У! = — -------------у— •
|/ Iу + пя 4- -у i — 1 (У + + -тг]
Г \' & I X /
Ясно, что вблизи точки у ~ 0 имеем I фЛ (у) | <С ? <С 1 > и потому можно
применить метод последовательных приближений. Найдем решение при
п = 1 с точностью до 0,001. Пусть ув = 0. Тогда у3 жф (у2) ~ 0,204.
Поэтому у » 0,204; л+ »к 4,917.
Чтобы найти первый отрицательный корень, положим п ”» — 1.
Мы получим уравнение
и = arcsin--—— •
я л
у--у
Положим у» = 0. Тогда
У& »ф (у&) ~ — 0,503.
Таким образом, у ~ — 0,503, а потому х » — 2,074.
При больших значениях | п | метод последовательных приближений
дает приближенную формулу для у.
1 (— 1)п+1-2
у « <р (уо) = (- 1)’l+! arcsin-— « -(2«+1)л *
пя 4-
Поэтому
л (—1)п+з-2
хж—(2n-h 1)4-(2;г + 1)-.
12. Полагая хх =- 0, находим, что л3~ф (х3) » 1,088. Значит, с
точностью до 0,001 х ss 1,088.
13. Сначала решим уравнение х = }'1g (х 4-2). Мы имеем
ф 1.x ) — У1ё (х 4-2), и потому
1g е
ш (х) —--------- —.
2 (х + 2) VW+2)
Так как <р (0) = ]Alg 2 > 0, <р (1) == У 1g 3 <( 1, то уравнение имеет
корень на отрезке [0, 1J. На этом отрезке выполняется неравенство
102
|ф (х) I <1Я <11 • Значит, можно применить метод последовательных при-
ближений. Полагая хх = 1, имеем х6 ~ <р (У5) ~ 0,6507. Значит, ко-
рень уравнения х = 1g (х + 2) с точностью до 0,0001 равен
х = 0,6507.
Рассмотрим уравнение
х = - yig(x + 2).
Здесь
<р(л)=— /igTT+iy.
Так как ф (0) = — /lg2 = —0,55, ф (---== — /lgT;5=—0,42,
\ ^7
то данное уравнение имеет корень на отрезке [— 72, 0]. Полагая
х± = 0, находим, что х8 ~ф (х8) ж — 0,4397. Итак, с точностью до-
0,0001 имеем х = — 0,4397.
14. Одним из корней уравнения является х = 0. Чтобы найти вто-
рой корень, запишем уравнение в виде х — ]Л1п (х + I). Для урав-
нения х *= У In (х + 1) имеем
ф (4) ~ J/4 4- >4.
Ф(1) = /йГ2<1.
Значит, уравнение имеет корень на отрезке р/2, 1]. Так как ф'(х) =
= о'/.З м > то иа 0ТРезке Wi, П имеем |ф' (х) | < q < 1.
2 (Л 1) у In (X —f- 1)
Положим хх “ 1, тогда xt sap (xj) ss 0,7469. Итак, с точностью до 0,0001
имеем х ™ 0,7469. Уравнение х «=> — У"1п(х+ 1) ие имеет корней,
кроме х =» 0. Итак, х = 0 или х •" 0,7469.
15. Перепишем уравнение в виде
х ~ У 4— In х.
Здесь
______ ।
Ф (1) -= 2, <₽ (2) = | 4 — in 2, ф' (х) -—-====== .
2х у 4 — In х
Так какф (1) »= 2, ф (2) У 4 — 1п 2 < 2, то уравнение имеет корень
на отрезке [1, 2]. Из рис. 29 видно, что других корней уравнение не
имеет. Полагая хх = 2, получаем
х4 «ф (х4) ж 1,841.
Итак, с точностью до 0,001 х = 1,841.
16. Запишем уравнение в виде
/=2 — in х.
Здесь ф (х) “ 2 — In х,ф? (х) — — — . Из рис. 30 видно, что корень,
х
уравнения лежит иа отрезке [1, 21. На этом отрезке |<р' (х)|<1.
103
Полагая xr — 1,5, находим '13гф (х13) ~ 1,557. Итак, х =- 1.557 с
точностью до 0,001,
17. Из рис. 31 видно, что уравнение имеет лишь один отрицатель-
ный корень. Запишем уравнение в виде
х = — /^+~2.
Тогда
Ф W = - V <^+2? <₽' (х) =
2 У ех + 2
и
ф(— 1)=— /2 4-е’1 ж — 1,54; ф (— 2) = — У2+е^х — 1,46
Значит, корень лежит на отрезке [— 1, — 2]. Полагая хх = — 1, нахо-
дим х4«ф(х1)ж— 1,492. Значит, с точностью до 0,001 имеем
каждом из отрезков
х = — 1,492.
18. Ясно, что одним из корней
уравнения является хх = 10. Чтобы
найти второй корень, запишем урав-
нение в виде х = 10°'1ж. Здесь
ф(х)= 10°’1ж,ф'(х)= 0,1 • 10°>1ж In 10.
Кроме того, ср (1) ~ 10”’1 > 1, ср (2) =
= 10е-2 < 2. Поэтому уравнение имеет
корень на отрезке [I, 2]. На этом от-
рез ке
|ф' (х) | < 0,1 • 10°>2 -In 10 х 0,37 < 1.
Теперь можно применить метод после-
довательных приближений. Полагая
X] — 2, находим, что х7 (х7) ж
ях 1,372. Итак, с точностью до 0,001
имеем х — 1,372.
19. Из рис. 32 видно, что уравнение имеет по одному корню на
~ + пл, ~ Ч- (n-4-l) л1, п =0,1, ...,
. ~ J
104
. Чтобы найти
Зя
у— у. Урав-
причем эти корпи лежат в правых половинах отрезков
первый положительный корень, сделаем подстановку х =
некие примет вид
На отрезке [0, л] есть корень нашего
уравнения, причем наэтом отрезке|<р' (у)| < 1. Применим метод после-
довательных приближений. Полагая у± = 0, имеему4 ~ф (у4)~1,059.
Значит, с точностью до 0,001 имеем у = 1,059, а потому х = 3,654.
5
Чтобы найти второй положительный корень, полагаем х— л—у.
Уравнение принимает вид
и =
л
жений.
ностью
21.
Полагая х4 = 0,
до 0,0001 имеем
Пусть
находим
г = 0,091.
Полагая уг — 0, получаем yi ~
^<р(у4) ж 0,876. Значит, с точно-
стью до 0,001 у — 0,870 и х — 6,984.
20. Из рис. 33 видно, что урав-
нение имеет один корень, лежащий
между 0 и 1. Мы имеем <р (х) =
= Jq с х> Ф' (*) = — е~х • на
отрезке [0, 1] выполняется нера-
1
венство | ф' (х) | < -Jq- , обеспечи-
вающее возможность применения
метода последовательных прибли-
х4 »ф (х4) 0,091. Значит, с точ-
f (х) = Xs — 5х + 1.
f' (х) = Зх2 — 5, /" (х) = 6х.
Тогда
105
По формуле Ньютона имеем
Зга+1 = Зп —
Зп-5^ + 1
<~5
Составим таблиц^' значений функции:
X —3 —2 — 1 0 1 2 3
—11 3 5 1 -3 — 1 13
Из этой таблицы видно, что уравнение № — 5х + 1 = 0 имеет корни на
отрезках [—3, —2], [0, 1], [2,3].
Найдем сначала корень, лежащий на отрезке [— 3, — 2]. Так как
на этом отрезке f” (х) <[ 0, то в качестве начального значения берем
£о = — 3 (так как f (,+) = — 11 — отрицательное число). Мы имеем
(_ 3)8 _ 5 3) 4. !
= - з - з^Гз)ГГ5---------= - 2,5.
Продолжая вычисления, находим, что Р8 = ж — 2,331. Получаем,
что с точностью до 0,001 корень уравнения на отрезке [— 3, —2] равен
— 2,331.
Теперь найдем корень, лежащий на отрезке [0, 1]. Здесь мы имеем
f” (х) 0. Поэтому полагаем [Jo = 0. Отсюда получаем
0s —5-0 + 1
Pi = 0 — —34+ГГ5— = 0.2. Зз = 31 = 0,202.
С точностью до 0,001 имеем х = 0,202.
Наконец, для нахождения корпя на отрезке [2, 3] полагаем Ре “ 3
и имеем
Продолжая вычисления, находим, что [>4 ~ р5 = 2,128. Поэтому с точ-
ностью до 0,001 корень равен 2,128. Мы нашли три корня: хх = — 2,331;
х2 = 0,202; х3 = 2,128.
Решим это же уравнение усовершенствованным методом хорд.
На отрезке [— 3, — 2] находим
— 3—(—2)' (—3)
= _ 3-f(— 3) f(_3)_f (_% = - 3 4 11 -Z+1T « - 2,214.
Так как на этом отрезке f (х) <[ 0, то кривая вогнута вниз и мы опреде-
ляем аа по формуле
— 3—(— 2,214)
= 3 [ ( 3) _с,__2,214) — -,203.
106
Далее находим
а3 =
13)_____________________
fl -2,293) -/(—2,214)
Это совпадает с точностью до 0,001 с ранее найденным значе-
нием х.
Точно так же решаем уравнение иа отрезках [0, 1] и [2, 3].
22. Здесь мы имеем
f (х) = Xs — 9х2 ~Т 20х — 11,
f (х) == Зх2 — 18х + 20,
I" (х) 6х — 18 “ 6 (х—3).
Составим таблицу функции f (х):
X 0 1 2 3 4 5 6
1(х) — 11 1 1 —5 —11 —и 1
Корни уравнения лежат на отрезках [0, 1], [2, 3], [5, 6].
На отрезке [0,1] полагаем !3о = 0 и находим, что [34 »|36 ~ 0,834.
На отрезке [2, 3] полагаем [Зо == 3 и находим, что f>2 ss |33 ж 2,216. На
отрезке [5, 6] полагаем |3, = 0 и находим, что р4 st р6 ж 5,249. Мы на-
шли (с точностью до 0,001) три корня уравнения
хх -= 0,834; ха = 2,216; х3 = 5,249.
23. Здесь f (х) = х3 — Зх2 — Зх + 11, [' (х) = Зх2 — 6х — 3,
[" (х) = 6х — 6 = 6 (х — 1). Составим таблицу значений для f (х):
1 х —2 —1 0 1 2 3
1 fl*) -3 10 11 6 1 2
Уравнение имеет один действительный корень, лежащий на отрезке
[—2, —1]. Чтобы найти этот корень, полагаем |30 = — 2. Мы получаем,
что [32 ss— 1,847. Поэтому с точностью до 0,001 имеем х =
= — 1,847.
24. Здесь / (х) == х5 + 5х + 1, f' (х) = 5х4 + 5, /" (х) = 20 х3.
Таблица значений функции f (х):
X —1 0 1
f(x) —5 1
107
Поэтому уравнение имеет один корень на отрезке [— 1, 0]. Полагаем
ро — 1. Имеем с точностью до 0,0001 р3 ~ р4 ж — 0,1999. Поэтому с
указанной точностью х — 0,1999.
25. Здесь / (x)-=sin x-px—l, f' (х) «= cos x-[ 1, /" (x) “ — sin x.
Таблица значений функции:
Корень лежит на отрезке [0, 1]. Полагаем Ро 0 и находим, что
Ра = 6S = 0,5110, Поэтому с точностью до 0,0001 имеем х = 0,5110.
10
26. Здесь f (х) = х2 — 10 1g х — 3, f' (х) = 2х — 1п 10' , f ’ (х) =
10
=24- -д.2 jn jQ - Таблица значений функции f (х):
X 0,5 1 2 3
fW 0,26 —2 —2,01 1,23
Корни уравнения лежат на отрезках [0,5, 1] и [2, 3]. На отрезке
[0,5, 1J полагаем ро = 0,5 и получаем, что р2 = рз» 0,535. Поэтому со-
ответствующий корень с точностью до 0,001 равен 0,535. На отрезке
[2, 3] полагаем ро = 3 и находим р2 ж рз » 2,705.
Уравнение имеет два корня: xL = 0,535; х2 = 2,705.
27. В системе а) полагаем хо = 0, у о => 0, zo = 0 и после несколь-
ких приближений находим, что с точностью до 0,001 х= 1,021,
у = 2,150, z = 3,072.
В системе б) полагаем хо = 0, уо = 0 и после нескольких прибли-
жений получаем (с точностью до 0,001) х = 0,520, у = 0,310.
В системе в) полагаем хо = 0, уо = 0 и находим, что х= 1,000,
у = 2,000.