/
Автор: Бакушинский А.Б. Власов В.К.
Теги: математика высшая математика численные методы учебное пособие 9 класс 10 класс
Год: 1968
Текст
А-Б-БАКУШШШ-В-КВААСОВ
ЭЛЕМЕНТЫ
ВЫСШЕЙ
1 ЧИСЛЕННЫХ
МЕТОДОВ
А. Б. БАКУШИНСКИЙ, В. К. ВЛАСОВ
ЭЛЕМЕНТЫ
ВЫСШЕЙ МАТЕМАТИКИ
и
ЧИСЛЕННЫХ МЕТОДОВ
Учебное пособие для учащихся
9—10 классов
математических школ
Под редакцией
профессора И. С. Березина
ИЗДАТЕЛои I ВО «ПРОСВЕЩЕНИЕ»
Москва 1968
Бакушинский А. Б., Власов В. К.
Б19 Элементы высшей математики и численных мето-
методов. Учебное пособие для учащихся 9—10 классов
математических школ. Под ред. проф. И. С. Бере-
Березина. М., „Просвещение", 1968.
336 с. с илл. 50 коп.
Книга представляет собой учебное пособие для учащихся IX—X клас-
классов специальных школ и курсов лаборантов-программнстов н посвящена
теоретическим обоснованиям различных методов, применяемых програм-
программистами в своей работе. Пособие содержит элементы математического ана-
анализа, элементы теории погрешностей, решение систем линейных алгебраи-
алгебраических уравнений методами итераций, Эйлера, Рунге-Кутта. Теоретические
положения иллюстрированы практическими примерами.
6-6
344-67 517
ОГЛАВЛЕНИЕ
Предисловие 7
Глава I. Элементарная теория погрешностей
§ 1. Множества. Вещественные числа 9
§ 2. Источники ошибок. Абсолютная и относительная по-
погрешность числа 11
§ 3. Правила округления 14
§ 4. Действия над приближенными числами 15
Глава II. Понятие о функции одной переменной
§ 1. Определение функциональной зависимости 21
§ 2. Способы задания функциональной зависимости 22
§ 3. Ограниченность, периодичность, четность, монотон-
монотонность функции .¦..". '. 26
Глава III. Числовые последовательности и пределы.
Числовые ряды
§ 1. Числовые последовательности 34
§ 2. Предел последовательности 35
§ 3. Некоторые теоремы о пределах последовательностей 40
§ 4. Числовые ряды 45
§ 5. Некоторые признаки сходимости рядов с положитель-
положительными членами 49
§ 6. Знакочередующиеся ряды. Абсолютно сходящиеся ряды 54
Глава IV. Непрерывность функции
§ 1. Предел функции. Бесконечно малые и бесконечно
большие величины 57
1* 3
§ 2. Непрерывные функции •. . . 68
§ 3. Простейшие свойства непрерывных функций 71
§ 4. Некоторые свойства функций, непрерывных на отрезке 73
Глава V. Линейные алгебраические уравнения и методы
их решения
§ 1. Системы линейных алгебраических уравнений 76
§ 2. Действия над матрицами 78
§ 3. Определители матриц 84
§ 4. Свойства определителей 86
§ 5. Теорема Крамера 104
§ 6. Ранг матрицы. Теорема Кронекера-Капелли 108
§ 7. Метод- исключения для- решения систем- линейных
алгебраических уравнений (метод Гаусса) 115
§ 8. Итерационные методы решения систем линейных
алгебраических уравнений 122
Глава VI. Теория интерполирования
§ 1. Понятие об интерполировании. Основная теорема об
интерполировании многочленами 135
§ 2. Интерполяционный многочлен Лагранжа 139
§ 3. Интерполяционные многочлены для равноотстоящих
узлов ; 142
Глава VII. Производная функции одной переменной
§ 1. Задачи, приводящие к понятию производной 154
§ 2. Производная суммы, произведения, частного 158
§ 3. Производные элементарных функций 161
§ 4. Замечательные пределы 167
§ 5. Производные показательной функции, логарифма и
гиперболических функций 174
§ 6. Производные сложных функций 176
§ 7. Производные обратных функций 179
§ 8. Производные высших порядков. Фор1мула Лейбница. . 185
§ 9. Дифференциал функции 191
Глава VIII. Основные теоремы дифференциального исчисления
§ 1. Теорема Ферма 195
§ 2. Теорема Ролля 197
§ 3. Теорема Лагранжа 198
4
Глава IX. Исследование функций при помощи производных.
Формула Тейлора. Функциональные ряды
§ 1. Возрастание и убывание функции. Точки максимума
и минимума 203
§ 2. Аналитические признаки максимума и минимума. Вы-
Выпуклость и вогнутость кривой, точки перегиба 205
§ 3. Формула Тейлора для многочленов и произвольных
функций .- 209
§ 4. Остаточный член формулы Тейлора 212
§ 5. Функциональные ряды. Ряды Тейлора 218
Глава X. Функции многих переменных
§ 1. Определение функции нескольких переменных 223
§ 2. Непрерывные функции нескольких переменных .... 226
§ 3. Частные производные 230
Глава XI. Приближенное решение алгебраических
и трансцендентных уравнений
§ 1. Введение 233
§ 2. Метод последовательного деления отрезка пополам . • 234
§ 3. Итерационные методы приближенного решения урав-
уравнений 235
Глава XII. Неопределенный интеграл
§ 1. Первообразная функция и неопределенный интеграл. . 245
§ 2. Простейшие приемы интегрирования^ 247
§ 3. Интегрирование рациональных функций 251
Глава XIII. Определенный интеграл
§ 1. Понятие определенного интеграла. Простейшие свой-
свойства определенного интеграла 262
§ 2. Интегрируемость кусочно-монотонной функции 272
§ 3. Интеграл с переменным верхним пределом. Существо-
Существование неопределенного интеграла 276
§ 4. Некоторые геометрические и физические приложения
определенного интеграла 279
Глава XIV. Приближенное вычисление определенных
интегралов
§ 1. Приближенные формулы для вычисления определенных
интегралов , 286
§ 2. Остаточные члены квадратурных формул , . 292
5
Глава XV. Дифференциальные уравнения
§ 1. Основные понятия 296
§ 2. Теорема существования и единственности решения
задачи Коши для уравнения у'—/(х, у) 300
§ 3. Уравнения первого порядка, интегрируемые в квадра-
квадратурах 301
§ 4. Дифференциальные уравнения в физике 309
§ 5. Линейные дифференциальные уравнения второго по-
порядка с постоянными коэффициентами 312
§ 6. Численные методы решения дифференциальных урав-
уравнений 326
Приложение. Метод полной математической индукции 332
ПРЕДИСЛОВИЕ
В этой книге сделана попытка отобрать и доступно
изложить те разделы математики (в том числе и вычис-
вычислительной), которые не входят в обычные программы
общеобразовательных средних школ, но которые, по мне-
мнению авторов, необходимо знать лаборанту-программисту..
Поэтому книгу можно рассматривать как учебное пособие
для учащихся школ и различных курсов, готовящих про-
программистов. Кроме того, лица со средним образованием
могут ее использовать для самостоятельного ознакомле-
ознакомления с элементами высшей математики и методов вычис-
вычислений.
Особенностью книги является тесное переплетение
вопросов вычислительной математики и математического
анализа. Разделы вычислительной математики помещены
обычно после необходимых для их изучения разделов
анализа.
В конце параграфов приведены иллюстрирующие
материал упражнения, которых, однако, недостаточно
для глубокого усвоения курса. Большое количество под-
подходящих упражнений можно найти, например, в следу-
следующих задачниках:
В. П. Ми норе кий. Сборник задач по высшей мате?
матике. М, «Наука», 1964.
Г. Н. Берман. Сборник задач по курсу математи-
математического анализа. М., «Наука», 1965.
Последовательное изучение предлагаемого курса мож-
можно начинать с 9-го класса при условии параллельного
прохождения обычной программы по математике для
средних школ.
Авторы приносят глубокую благодарность доценту
В. М. Алексееву, преподавателю физико-математической
школы-интерната А. А. Шершевскому и доценту Н. П.
Жидкову, прочитавшим книгу в рукописи и сделавшим
ряд очень полезных замечаний.
Особую признательность авторы выражают профессору
И. С. Березину, советы которого по содержанию и мето-
методике изложения существенно способствовали улучшению
качества книги.
А. Бакушинский
В. Власов
Глава I
ЭЛЕМЕНТАРНАЯ ТЕОРИЯ
ПОГРЕШНОСТЕЙ
§ 1. МНОЖЕСТВА. ВЕЩЕСТВЕННЫЕ ЧИСЛА
Одним из наиболее важных понятий в современ-
современной математике является понятие множества. Это понятие
настолько общее, что ему нельзя дать какого-либо опре-
определения. Следует только иметь в виду, что слово «мно-
«множество» эквивалентно словам: «совокупность», «собрание
элементов», «семейство»,' «класс элементов» и т. п. Можно
говорить, например, о множестве целых положительных
чисел, множестве людей в комнате, множестве всех ви-
видимых звезд и т. д.
Множество может содержать как конечное число эле-
элементов (множество людей в комнате), так и бесконечное
их число (множество всех целых чисел).
Множество, содержащее конечное число элементов,
называется конечным множеством. Множество, состоящее
из бесконечного числа элементов, называется бесконечным
множеством.
Большой интерес для нас будут иметь множества,
элементы которых — вещественные (или действительные)
числа.
Напомним некоторые определения и факты, относящиеся
к понятию вещественного числа, нужные нам в дальнейшем.
Как известно, вещественным числом называется любое
целое, рациональное или иррациональное число. Рацио-
Рациональные числа — это числа вида —, где р и q целые.
Они могут быть представлены в виде конечной или бес-
бесконечной периодической десятичной дроби. Однако одних
рациональных чисел недостаточно для решения даже очень
простых алгебраических задач. Например, уравнение
л:'2 — 2 = 0 неразрешимо в множестве рациональных чисел
(не существует двух таких целых чисел р и q, что
()"
i)
Назовем иррациональным числом всякую непериодиче-
непериодическую бесконечную десятичную дробь.
После введения иррациональных чисел уравнение
х3 — 2 = 0 становится разрешимым (его решения: ±|/2~ =
= ±1,4142...). С введением иррациональных чисел по-
получают свое решение и другие математические задачи,
в частности задача определения длины отрезка, не соиз-
соизмеримого с выбранной единицей масштаба, и т. п.
Очень полезно для дальнейшего представление вещест-
вещественных чисел в виде точек на некоторой прямой. Эта
прямая называется числовой и строится следующим об-
образом: на прямой выбирают произвольную точку О и на-
называют ее началом отсчета. Затем задают на прямой
положительное направление и единицу масштаба. Тогда
для каждой точки М на прямой можно измерить расстоя-
расстояние от этой точки до начала отсчета с помощью заданного
масштаба. Таким образом, каждой точке на прямой можно
поставить в соответствие некоторое вещественное число,
и притом только одно, характеризующее расстояние от
этой точки до начала отсчета. И наоборот, каждому ве-
вещественному числу можно поставить в соответствие не-
некоторую точку на данной прямой, и притом только одну,
расстояние от которой до начала отсчета выражается этим
числом.
Итак, мы установили соответствие между всеми ве- .
щественными числами и всеми точками числовой прямой.
Поэтому очень часто различные вещественные числа назы-
называют просто точками.
Интервалом с концами в точках а и b называется множе-
множество точек, удовлетворяющих неравенству а<^х<^Ь. Сам
интервал обозначают (а, Ь), принадлежность числа х этому
интервалу обозначают х? (а, Ь) (? — знак принадлеж-
принадлежности). На числовой прямой интервал изображают так,
как указано на рисунке 1а. Стрелки в точках а и b
указывают, что эти точки не входят в множество, кото-
которое мы назвали интервалом.
Интервал называется полуоткрытым, если в него вхо-
входит один из его концов. Полуоткрытый интервал (а, Ь] —
множество точек х, которые удовлетворяют неравенству
(рис. 16): а<^Ь
10
Полуоткрытый интервал [а, Ь) — множество точек х,
удовлетворяющих неравенству (рис. 1в): а^х<^_Ь.
И, наконец, замкнутым интервалом или отрезком
[а, Ь], называется множество точек х, которые удовлет-
удовлетворяют неравенству (рис. \г); а^х^Ь.
Объединением интервалов называется совокупность
точек, принадлежащих хотя бы одному из интервалов,
например, в объединение интервалов (а1, Ь{) и (аа, 63)
(рис. Id) входят все точки обоих интервалов.
а) б) 6)
b a, b, a,
г) д)
Рис. 1
Определение. Абсолютной величиной (модулем) чис-
числа х (обозначается \х\) называется само число х, если
), и (— х), если X'
х, если
— х, если
Например, |1|=1, а | — 5| = 5.
Очевидное свойство абсолютных величин:
§ 2. ИСТОЧНИКИ ОШИБОК. АБСОЛЮТНАЯ
И ОТНОСИТЕЛЬНАЯ ПОГРЕШНОСТЬ ЧИСЛА
Если решением некоторой задачи является число,
то практически далеко не всегда мы можем получить это
число совершенно точно. Причины этого следующие.
Во-первых, числа, которые участвуют в операциях,
обычно записываются в виде десятичных дробей. Если
исходные числа были иррациональными, то точно записать
их в виде десятичных дробей мы, конечно, не сможем
(так как такая запись содержит бесконечное число цифр).
Поэтому приходится вместо исходных иррациональных
чисел оперировать с рациональными числами, полученными
из данного иррационального числа, если в его записи
И
оставить только первые несколько десятичных знаков
(например, столько, сколько входит в разрядную сетку
вычислительной машины).
Так, вместо числа У приходится использовать рацио-
рациональные числа 1,4 или 1,41 или 1,4142 и т. д. Естествен-
Естественно, что результат действий будет содержать- некоторую
ошибку (погрешность) тем большую, чем меньше десятич-
десятичных знаков содержат рациональные приближения к исход-
исходным иррациональным числам. Возникают подобные погреш-
погрешности и тогда, когда исходные данные были рациональ-
рациональным^ числами. При их.записи в виде десятичной дроби
может получиться бесконечная периодическая дробь или
конечная дробь, число знаков которой настолько велико,
что имеющиеся в нашем распоряжении вычислительные
средства не могут их учесть целиком и некоторое число
знаков приходится отбрасывать.
Итак, исходные данные, промежуточные результаты
и окончательные результаты мы обычно не можем запи-
записать совершенно точно, а округляем их. Это одна из
причин неточности ответа.
Во-вторых, очень часто задачи в их непосредственной
формулировке либо не поддаются решению,, либо решение
чрезвычайно сложное. Тогда заменяют эту задачу другой,
более простой, которая дает решение, достаточно близкое
к требуемому, и решают 5ту более простую задачу.
Естественно, и в этом случае результат получится с ка-
какой-то погрешностью, даже если все исходные данные
и промежуточные результаты будут точными. Говорят,
что возникает погрешность метода.
Наконец, одним из самых важных источников погреш-
погрешности результата является неточность самих исходных
данных. Как правило, исходные данные для задачи полу-
получают из какого-либо физического эксперимента. Любой
эксперимент связан с измерениями, а измерения всегда
производятся с той или иной погрешностью. Например,
если нам нужно определить площадь прямоугольной
комнаты, мы берем линейку и измеряем длину и ширину
комнаты. Как бы мы ни старались, а на несколько санти-
сантиметров ошибемся, хотя бы из-за того, что сама линейка
может быть не абсолютно точной. Естественно, и площадь
комнаты как результат умножения длины на ширину по-
получится не совсем точно. Подобных примеров можно при-
привести сколь угодно много.
12
Количественной характеристикой погрешностей величин
служит их абсолютная и относительная погрешность.
Пусть для величины, точное значение которой есть х, мы
каким-либо образом получили приближенное значение**.
Определение. Абсолютная величина разности между
точным значением х и его приближенным значением х*
называется абсолютной погрешностью приближенного чис-
числа х* и обозначается A.v«, т. е. | х — х* | = А*..
Как правило, точное значение х нам неизвестно, а сле-
следовательно, неизвестна и абсолютная погрешность А**.
Но зато обычно можно определить число, которое эта
абсолютная погрешность заведомо не превосходит (границу
абсолютной погрешности, определяемую самим способом
нахождения числа). Так, взвешивая какой-либо предмет
на аптекарских весах, мы не сможем определить точного
веса предмета, но гарантируем, что ошибка взвешивания
не более, чем 0,01 грамма, т. е. абсолютная погрешность
веса не будет превышать 0,01 грамма.
Однако абсолютная погрешность не всегда достаточно
полно характеризует погрешность вычислений. В самом
деле, пусть ошибка при измерении длины радиоволны
равна одному метру. Если при этом измерялась длина
волны в диапазоне длинных волн, то точность хорошая;
такая же ошибка при измерении длины волны в диапа-
диапазоне УКВ (ультракоротких вол») слишком велика. Поэтому
вводят еще одно важное понятие — относительную погреш-
погрешность.
Определение. Относительной погрешностью прибли-
приближенного значения х* называется отношение абсолютной
погрешности Ах* к абсолютному значению приближенной
величины: Ьх* ==j-~-
Нетрудно видеть, что если абсолютная погрешность
всегда имеет ту же размерность, что и сами величины,
то относительная погрешность есть величина безразмерная.
Разумеется, говорить об относительной погрешности
можно только в том случае, когда х* ^ 0. В дальнейшем мы
будем там, где это необходимо, предполагать это условие
выполненным и не будем делать специальной оговорки.
В примере с измерением длин радиоволн абсолютная
погрешность равна одному метру. Если после измерения
получим, что длина волны в диапазоне длинных волн
1000 л, а в диапазоне УКВ 4 м, то в первом случае
13
относительная погрешность равна -гщг = 0,001, а во втором
1 = 0,25.
Мы будем вполне удовлетворены, если наши часы бу-
будут убегать в сутки на 10 секунд, но вряд ли будем
довольны, если они будут убегать на 10 секунд каждую
минуту. В первом случае относительная погрешность равна
24-60.б0 = Шб<0'00012' а во ВТ°Р°М Ш = Т-0'17'
абсолютная же погрешность и в том и в другом случае
одинакова —10 секунд.
Упражнения
1) Записать число п лишь с двумя знаками после запятой и
оценить абсолютную и относительную погрешность полученного
приближенного значения.
2) Комнатный термометр дает отклонения не больше, чем
0,5 градуса. С его помощью измерили температуру и получили 20°.
Требуется оценить абсолютную и относительную погрешности
полученной величины температуры.
§ 3. ПРАВИЛА ОКРУГЛЕНИЯ
В предыдущем параграфе мы уже говорили о том,
что на практике часто приходится иметь дело с числами,
запись которых в виде десятичной дроби требует бесконеч-
бесконечно много знаков, и с числами, число знаков у которых
в такой записи конечно, но может быть очень большим.
Любая вычислительная машина имеет лишь вполне опре-
определенное количество разрядов. Поэтому, чтобы ввести
такие числа в машину, нужно их каким-то образом за-
записать так, чтобы количество 'цифровых знаков не превы-
превышало количества цифровых разрядов, имеющихся в машине
(округлить число). Очевидно, что это необходимо делать
и тогда, когда мы считаем на бумаге без помощи машин.
Обычно округление производят по следующему правилу
(иногда, правда, пользуются и другими правилами). Пусть
какое-то число имеет в своей записи более," чем к, цифро-
цифровых знаков и мы хотим округлить его, оставив ровно k
знаков. Тогда если (&-|-1)-я цифра в записи числа мень-
меньше или равна 4, то все цифры, начиная с (к-\-1)-й,
просто отбрасывают.
Например, если в числе 3,14159265358... мы хотим
оставить два знака после запятой, то округленное число
14
будет: 3,14; если мы хотим оставить пять знаков после
запятой, то получим: 3,14159.
Пусть теперь (й+1)-я цифра больше, чем 5. Тогда
мы тоже.отбрасываем цифры, начиная с (k-\-\)-vi, но в
оставшемся числе k-ю цифру увеличиваем на единицу.
Так, если в вышенаписанном числе мы хотим оставить
шесть цифр после запятой, то получим: 3,141593.
Если (k-\-\)-n цифра есть 5, а за ней найдется хоть
одна отличная-, от нуля цифра, то поступают, как в пре-
предыдущем случае, т. е. отбрасывают все цифры, начиная
с (&-}-1)-й, а k-ю увеличивают на единицу.
. В нашем примере, оставив четыре цифры после запя-
запятой, получим: 3,1416.
Наконец, последний случай, когда {k-\-\)-n цифра есть
5, а все последующие за ней цифры — нули. Тогда посту-
поступают так: отбрасывают «хвост», начиная с (^ —j— 1)-й циф-
цифры, и если k-я цифра четная, то оставляют ее без изме-
изменения, если же k-я цифра нечетная, то увеличивают ее
на единицу.
Например, в числе 5,3865 оставим три знака после
запятой: 5,386; если же округлим число 7,4235, то полу-
получим 7,424.
Все, что было сказано выше, можно сформулировать
так: для того чтобы округлить число до k десятичных
знаков, нужно отбросить все знаки, начиная с (Jfe —|— 1)-го;
если при этом отброшенная часть меньше половины еди-
единицы fe-ro разряда, то оставшуюся часть числа оставляют
без изменения; если отброшенная часть больше половины
единицы &-го разряда, то к k-uy разряду прибавляют
единицу; наконец, если отброшенная часть в точности
равна половине единицы &-го разряда и k-я цифра четная,
то оставляют эту цифру без изменения, если же нечетная,
то увеличивают ее на единицу.
Легко проверить, что абсолютная погрешность числа,
полученного округлением по этому правилу, не превосхо-
превосходит пяти единиц первого отброшенного разряда.
§ 4. ДЕЙСТВИЯ НАД ПРИБЛИЖЕННЫМИ ЧИСЛАМИ
Производя различные арифметические операции
над приближенными числами, мы получаем и приближен-
приближенный ответ. Возникает вопрос: какова погрешность резуль-
результата, если известны погрешности исходных данных?
15
Погрешность суммы
Теорема 1. Абсолютная погрешность суммы прибли-
приближенных величин не превосходит суммы абсолютных погреш-
погрешностей этих величин.
Доказательство. Пусть x=xi-\-xi-\-...-\-xn (ве-
(величины xt могут быть любого знака). Сумма приближен-
приближенных значений дает: х* = х* -f-*f + ••• + **•
Вычитая из точного значения суммы приближенное ее
значение, получим:
X — X* = (*1 —
Отсюда
\х — х*\^\х1 — х*\ + \х2 — х1
(Это свойство абсолютных величин легко доказывается с
помощью метода математической индукции (см. Прило-
Приложение). Следовательно,
+•... + Дд:*. A)
Теорема 2. Относительная погрешность суммы при-
приближенных величин (все слагаемые одного знака) не пре-
превосходит наибольшей относительной погрешности слагае-
слагаемых.
Доказательство. Пусть x = xl-\-xi-\-...-\-xn и
соответственно х*—х*-\~х%-\-...-\-х% Из теоремы 1 сле-
следует:
Д** =S2 Д*? + Д^ +•. • + Дд:*-
Предположим для определенности, что все х*^>0. Тог-
Тогда, используя определение относительной погрешности,
имеем:
4,.*
Следовательно,
Д „* -f- Д «* -f~ • •. -\~ ДЛ*
8д.* ^ —^ i-j- ^-. B)
Но
16
Подставляя C) в B), получаем:
Ьх* ==s ——'*,?*! Т **п—"• D)
Пусть теперь 8"= max {8**, 8^* S**},
(т. е. 8 — наибольшее из чисел Ъх*, Ъх*, ..,, 8^*).
Тогда неравенство D) можно усилить:
Итак,
ЪХ*^Ъ. E)
Совершенно аналогично доказывается теорема в случае,
когда все х*<^0. Оценка E), конечно, более грубая, чем
оценка относительной погрешности, даваемая неравен-
неравенством D).
Погрешность разности
Теорема 3. Пусть *,]>jc3]>0 " х?>#1]>0. Обра-
Образуем разности х = Х\ — хг и х* = х* — л$. Тогда утверж-
утверждается, что
Д** < &xf + Д4 Ф)
и
+ х*-Ъх*
G)
Доказательство. Соотношение F) для абсолютных
погрешностей следует из теоремы 1.
д *
Очевидно, что х* ]> 0. Поэтому S** = —^-. Подставля-
Подставляем сюда неравенство F):
ЬХ^Щ^. (8)
Но **]>0 и л$]>0. Следовательно, kxf = xf-bx* и
Д*2* = х$ ¦ Ьх*. Таким образом, неравенство (8) примет окон-
окончательный вид:
*'"г+/;-Ч (Г)
17
Замечание. Из соотношения G) видно, что оценка относи-
относительной погрешности разности приближенных величин резко ухуд-
ухудшается в том случае, когда приближенные величины близки друг
к другу. В этом случае знаменатель дроби в G) становится очень
мал,- а сама дробь, следовательно, весьма велика.
Пример. Пусть нам нужно вычислить разность J/5,02 —
—/5,01 и пусть абсолютные, погрешности уменьшаемого и вычи-
вычитаемого не превосходят 0,005.
Относительная- погрешность уменьшаемого тогда не превышает
¦ ' «в 0,0022, и относительная погрешность вычитаемого не пре-
0 005
восходит '_и _s» 0,0022. В то же время относительная погреш-
„ 0,005 + 0,005
ность разности оценивается величиной '—==^3,3.
/5,02 — /5,01
Погрешность произведения
Теорема 4. Пусть к — х^-х^ и x*=xf-x*. Абсолют-
Абсолютная погрешность произведения приближенных величин оце-
оценивается по формуле:
Д,* ^ |х$ | • Д** + |xf | • Д,у + ДЛ* • Д,*, (9)
а относительная погрешность будет:
V<8*f + 8*J + 8*f-&,?- (Ю)
Доказательство. Так как x=xt ¦xiHx* — xf-x*,To
\Х — X* | = |JC! • Х2 — *f • Х%\.
Прибавим и вычтем под знаком модуля величину xf ¦ л:2.
Будем иметь:
\х — л;* | = |лг! • х2 — xf ¦ х2 + xf ¦ х2 — *f • *f | <
Из определения абсолютной погрешности и свойств
абсолютных величин вытекает, что |лг2| — |*!|=sS
|х2 — лЦ^Дд;*, отсюда
Д*?. A2)
Из неравенств A1) и A2) получаем:
18
д *
Далее, так как Ьх* = г-Г то
Таким образом, соотношение A0) тоже доказано.
Погрешность частного
Теорема 5. Пусть х — — , х* = -± и Ьх»<
A7g Xg
Тогда абсолютная погрешность частного двух приближен-
приближенных величин оценивается по формуле:
а относительная погрешность по формуле:
Доказательство. Имеем: ,
|г г*| — I*» ХЦ_\Х1-Х*—Х3-Х*
Теперь в числителе прибавим и вычтем величину х* ¦ х*:
Д ^__|^ ,.* I __ l-^l ' Х* Х* • Х* 4" Х1 • Х* -^2 • Х*\ ^-
Но, как легко видеть, |л:2| ^ \х%\ —ДЛ*. Поэтому, про-
продолжая цепочку неравенств, будем иметь:
"* I i-*s I ,•* I , Д 4 I „*8 |yt|. A.*
Далее, деля на \х*\, получим:
_ V ^ ьх*+\х?\-ъх*
6T^< |*}|-A*. '
19
Разделив числитель и знаменатель дроби на |аг*|, по-
получим оценку A4).
Мы уже замечали раньше, что точные значения абсо-
абсолютных (следовательно, и относительных) погрешностей
исходных данных мы обычно не знаем, а .знаем лишь гра-
границы, которые эти погрешности не превосходят.
Доказанные нами теоремы об оценках погрешностей
арифметических действий остаются в силе, если в соответ-
соответствующие формулы подставить не сами абсолютные по-
погрешности исходных данных, а величины их границ. При
этом для применимости формул A3) и A4) необходимо,
чтобы граница абсолютной погрешности для xt была бы
строго меньше | |
Г лав а 11
ПОНЯТИЕ О ФУНКЦИИ
ОДНОЙ ПЕРЕМЕННОЙ
§ 1. ОПРЕДЕЛЕНИЕ ФУНКЦИОНАЛЬНОЙ
ЗАВИСИМОСТИ
Нетрудно привести много примеров, когда изме-
изменение одних величин влечет за собой изменения некото-
некоторых других величин, каким-либо образом зависящих от
первых. Так, уровень ртутного столба в термометре тем
выше, чем выше температура окружающей среды. Или
длина металлического стержня тем больше, чем выше его
температура, т. е. уровень ртутного столба в первом
случае и длина стержня во втором зависят от темпе-
температуры.
Площадь S треугольника определяется по формуле:
S = у а'га, где ha — высота, опущенная из вершины тре-
треугольника на сторону а. Если менять ha, оставляя а не-
неизменным, то площадь S тоже будет меняться, т. е. мож-
можно сказать, что S зависит от ha.
Подставляя в формулу у = 2х-\-\ различные значе-
значения х, будем получать соответствующие различные значе-
значения у. Следовательно, и здесь есть зависимость: у зави-
зависит от х. Подобных примеров можно приводить сколько
угодно.
Определение. Если каждому элементу х из числового
множества X поставлено в соответствие действительное
число у, то говорят, что на множестве X задана функ-
функция y = f(x). Множество X называется областью опреде-
определения функции, а множество Y чисел у — областью значе-
значений функции; х называется независимой переменной или
аргументом, а у называется функцией этой независимой
переменной.
Запись y = f(x) указывает на тот закон, по которо-
которому некоторому значению х ставится в соответствие значе-
значение у.
21
§ 2. СПОСОБЫ ЗАДАНИЯ ФУНКЦИОНАЛЬНОЙ
ЗАВИСИМОСТИ
Функциональную зависимость можно задавать
самыми различными способами.
Аналитический способ задания функции
Чаще всего функциональная зависимость задается в
виде некоторой комбинации математических символов
(формулы). В этом случае, для того чтобы найти у, над
заданным значением х необходимо выполнить все опера-
операции, указанные в формуле, например: у = 2х-{-1, у = х*,
У = Ух.
Можно определять функцию и с помощью нескольких
формул, например:
x -j- 1, если
О, если д: = О,
х — 1, если
Здесь каждому значению х соответствует определенное
значение у, т. е. мы имеем функциональную зависи-
зависимость.
Еще пример функции: у=[х] — «целая часть от х»
(ограничимся случаем х^О). Определяется она' следую-
следующим образом: у = п на полуоткрытом интервале [п, п+1)
(л=0, 1, 2, 3, ...).
Областью определения функциональной зависимости,
заданной в виде формулы, мы будем в дальнейшем считать
то множество аргументов, для которого действия, пред-
предписываемые формулой, можно выполнить, и притом одно-
однозначно.
Задание функциональной зависимости в виде формулы
называется аналитическим способом задания функции.
Упражнения
Найти область определения следующих функций:
х
22
Графическое задание функциональной
зависимости
Теперь опишем геометрический способ задания функ-
функциональной зависимости. Для этого нам придется вспом-
вспомнить об изучаемом в элементарной математике понятии
системы координат. Возьмем на плоскости две взаимно
перпендикулярные прямые — горизонтальную и вертикаль-
вертикальную. На каждой из них зададим положительное направ-
направление. Первая называется осью абсцисс или осью х, вто-
вторая"— осью ординат или осью у. Точка О их пересечения
называется началом координат. Для измерения длин от-
отрезков вводим единицу масштаба и откладываем ее на
осях. Возьмем в плоскости произвольную точку М и
опустим из нее перпендикуляры на оси координат. Отрез-
Отрезки ON и ОР (рис. 2) измерим с помощью выбранной
единицы масштаба. Полученные числа хну однозначно
определяют положение точки М на плоскости, т. е. с
введением осей координат и масштаба произвольная точка
на плоскости однозначно определяется парой значений
х и у, которые и называются координатами этой точки.
У
7
6
S
«
3
г
i
-3 -2 -1 0
•г
•3
р
/
к/
/
V 5 6 7 Q X
Рис. 2
Точка со своими координатами обычно обозначается так:
М(х, у). Расстояние г от начала координат до точки М,
очевидно, определяется по теореме Пифагора:
23
Если угол, который ОМ составляет с осью абсцисс,
равен а, то, очевидно (рис. 2), х = г cos а, у==т sin а.
Пусть теперь в плоскости даны две произвольные
точки М (х}, yt) и N (#2, 1/а) (рис. 3). Расстояние г между
ними определим опять-таки по теореме Пифагора: г =
=УМР*-\-Р№. Но МР = х% — хи а NP = yi — y1. Сле-
Следовательно,
Эта формула для вычисления расстояния между дву-
двумя точками справедлива независимо от того, в каких чет-
четвертях расположены точки М и N. Возможность убедить-
убедиться в этом мы представляем читателю.
Примеры. 1) Найти расстояние or начала координат до точ-
точки М E,12).
г = Ух2+у2 =|/г52 + 122= 13.
2) Найти расстояние между точками М(—1,2) и NB,6).
Если нам известны координаты двух точек М и N, то,
кроме определения расстояния между ними, мы можем
еще найти тангенс угла, который составляет прямая, про-
проходящая через эти точки с осью абсцисс. Как видно из
рисунка 3,
6 л:2 — лг.
Из всего сказанного можно сделать один основной вы-
вывод: каждой точке на плоскости соответствует в выбран-
выбранной системе координат
определенная пара чисел,
называемых координата-
I ми этой точки, и на-
наоборот — каждой паре
чисел соответствует в
этой системе координат
одна и только одна точ-
точка, имеющая эти числа
своими координатами.
Пусть нам задана
функциональная зависи-
зависимость вида
y = f{x).
Рис. 3
24
Рассмотрим мно-
множество пар (х, f (*)),
где х пробегает об-
область определения
функции. На плоско-
плоскости с введенной коор-
координатной системой
каждой паре (х, / (х))
соответствует точка.
Всему множеству пар
соответствует некото-
некотоРис. 4
рое множество точек
плоскости (например,
некоторая линия). Это множество точек плоскости на-
называется графиком функциональной зависимости.
Например, график функции y = kx-\-b, где k и Ъ —
постоянные величины, есть прямая линия (поэтому дан-
данную функцию называют линейной); k здесь означает тан-
тангенс угла наклона прямой к оси абсцисс, а Ъ — величина
отрезка на оси у, заключенного между данной прямой и
началом координат (рис. 4).
С помощью графика можно получить некоторую ин-
информацию о данной функции. Так, из графика функции
на рисунке 5 видно, что функция y = f(x) на отрицатель-
отрицательной полуоси абсцисс отрицательна, а на положительной,
полуоси положительна, /@) = 0, на отрезках [1,2] и [4,51
функция постоянна и т. д.
Задание функциональной зависимости с помощью гра-
графика называется графическим способом задания функции,
У
«
3
г
i
¦ч -з ¦? -1 У
¦г
¦3
0 1 г -з ч 5 в, х
Рис. 5
25
Этот способ является весьма удобным и очень часто
применяется (сейсмограммы, барограммы, кардиограммы
и т. п.).
Упражнения
1) Нанести точки на координатную плоскость и найти расстоя-
расстояние между ними:
а) A,2), B,1); в) (-2,1), B, -1);
б) (-3,1), B,4); г) (-3,3), (-2, -4).
2} Построить графики функции;
в! v = — х 4- ri v=ljt: II
Табличное задание функциональной
зависимости
Функция может быть задана таблицей своих значений,
т. е. набору значений аргумента х поставлен в соответ-
соответствие набор значений функции f(x). Первый набор здесь
является областью определения функций, а второй —
областью ее значений. Приведем в качестве примера таб-
таблицу значений длины стального стержня при различных
температурах:
t°\\
1м
0
1
300
1,0033
600
1,0060
900
1,0099
1200
1,0132
Здесь областью определения функции является набор
значений температуры, а областью значений функции —
набор значений длины стержня.
§ 3. ОГРАНИЧЕННОСТЬ, ПЕРИОДИЧНОСТЬ,
ЧЕТНОСТЬ, МОНОТОННОСТЬ ФУНКЦИИ
Определение. Функция y = f(x) называется огра-
ограниченной на множестве х"', принадлежащем области опре-
определения* X, если найдутся такие числа А и В, что
* Говорят, что множество X' принадлежит множеству X, если
каждый элемент множества А" является одновременно элементом
множества X. Обозначают это так: X'dX.
26 '
Функцию, ограниченную на всем множестве определе-
определения, будем называть ограниченной функцией.
Следствие (читатель легко его докажет самостоя-
самостоятельно). Для того чтобы функция y = f(x) была ограни-
ограничена на множестве X, необходимо и достаточно, чтобы
существовало такое число Л1^>0, что |/(*)|<^Л1 для
всех х ? X.
Примеры. 1) Функция y = srnx—ограниченная функция,
так как на всем множестве ее определения—со<д;<оо (рис. 7):
sin х\
Л
2) Функция у=х3 ограничена на отрезке [0,2]. Действительно,
х2 < 4 при х ? [0,2]. Но эта функция не ограничена на всей об-
области определения — со<лг<со, так как, какое бы число М>0
мы ни взяли, будет х1 > М при | х | > У М.
Определение. Функция называется периодической с
периодом Т, если для любого х из области определения
выполнено следующее условие: f (х) = f (x -j- T) (х-\-Т также
должно принадлежать области определения функции).
Вместе с Т периодами являются и числа вида Тп = пТ
(п — любое целое число). Поэтому обычно периодом на-
называют наименьшее положительное число Т (если такое
существует), которое удовлетворяет этому условию (рис. 6).
Рис. 6
Приведем два простых примера периодических функций:
a)^ = sin;t (рис. 7). Как известно, sin х = sin (х + 2k%) (ft —
любое целое число), причем для Г<2я всегда sin x ф sin (x -\- Г).
Поэтому период синуса равен 2п.
27
б) у = {х} (дробная часть числа л:), т.е. у = х—п при
^х <:n-f-l и п — любое целое. График этой функции пред-
представлен на рисунке 8. Из графика видно, что функция является
периодической с периодом, равным единице.
'271 X
Рис. 7
-2
-1
Рис. 8
Для того чтобы полностью представить себе поведе-
поведение периодической функции, достаточно ее исследовать
на любом отрезке, длина которого равна периоду Т этой
функции. В частности, достаточно рассмотреть отрезок
[О, Т], а затем использовать соотношение / (лг) = /(л: —f- 7").
Определение. Если область определения функции
f (х) есть множество, симметричное относительно нуля
(интервал, отрезок, вся прямая), и при замене любого х
из области определения на число (— х) значение функции
не меняется (/ (л:) = /( — *)), то функция f (х) называется
четной; если же при замене х на (— х) функция меняет
знак на противоположный (f(x) = — f( — x)), то функция
называется нечетной.
Из определения следует, что, зная график четной
функции лишь на положительной полуоси абсцисс, мы
можем получить график этой функции на всей оси абс-
абсцисс, если зеркально отобразим известный нам график
относительно оси ординат (см., например, график функции
28
у=\х\ на рис. 9). Если же нам задан на положитель-
положительной полуоси абсцисс график нечетной функции, то для
того, чтобы получить его на всей оси абсцисс, нужно
сначала зеркально отобразить его относительно оси у,
Рис. 9
Рис. 10
как мы это делали для четной функции, а затем ту часть
графика, которая соответствует отрицательной полуоси
абсцисс, зеркально отобразить еще относительно оси х.
Иначе говоря, график функции с положительной полуоси
абсцисс отображается симметрично относительно начала
координат на отрицательную полуось абсцисс. В резуль-
результате получим полный график нечетной функции (см.,
например, график функции у=х на рисунке 10).
Примеры. 1) Функция у = cosх — четная функция (рис. 11),
так как cos х — cos (— л:).
2) Функция з» = л:2 — четная функция (рис. 12), так как лг2 =
(J
-;
Рис. 11
29
о
Рис. 12
3) Любой многочлен, содержащий
лишь четные степени аргумента х,
есть четная функция (читатель мо-
может это легко доказать). Например,
у — х*-\-2х*—л:2-)-7—четная функ-
функция.
4) у = sin л: (рис. 6) — нечетная
функция, ибо sin х = — sin (—х).
5) Легко убедиться в том, что
любой многочлен, содержащий лишь
нечетные степени аргумента х, пред-
представляет собой нечетную функцию,
например: у = 2х*—х8-(-х.
Не следует, однако, думать,
что каждая функция является
либо четной, либо нечетной.
Наоборот, существует сколько
угодно функций, которые не
являются ни четными, ни не-
нечетными. Например: у = х—1,
и т. д.
y=sinx-j-cosx, y = (xy
Определение. Функция y = f(x) называется неубыва-
неубывающей на множестве, принадлежащем области определения
функции, если для любых точек xv и х% из этого множе-
множества, удовлетворяющих соотношению хх<^х%, выполнено
неравенство f(xi)^f(x2).
Неубывающей, например, является функция, график
которой изображен на рисунке 13.
Рис. 13
Если для хх <^ х% выполнено строгое неравенство
f(xi)<^f(x2), то функция y = f(x) называется возрастаю-
возрастающей.
30
Так, функция y = tgx —
возрастающая на интервале
)
Определение. Функция
yz=f(x) называется невозрас-
тающей на множестве, при-
принадлежащем области определе-
определения функции, если для любых
двух точек xt и х% из этого
множества, удовлетворяющих
условию Xi<^Xi, выполнено не-
неравенство f (*i) ^ / (Xj) • ~
Если же неравенство
строгое, f {xy)^>f (x^), то функ-
функция называется убывающей.
Пример убывающей функ-
функции: У = — на положитель-
положительной части оси абсцисс
(рис. 15).
Функции неубывающие или
невозрастающие на каком-либо
множестве объединяются об-
общим названием монотон-
монотонные, а убывающие или возрастающие называются стро-
го монотонными.
Если область монотонности функции специально не
указывается, то это означает, что она монотонна на всей
У I
рис. 14
Рис. 15
31
области определения. Само собой разумеется, что функ-
функция может быть монотонной на некотором множестве и
не монотонной на более широком множестве, включаю-
включающем в себя "первоначальное. Так, функция y—s\nx
(рис. 7) монотонна (возрастает) на отрезке 0, у], но на
отрезке [0, «] не монотонна, так как на ^-, « функ-
функция убывает. L J
Если рассматривать у = sin х (черт. 7) на отрезке [0, 2п],
то участки монотонности следующие: 0, -5- и -^, 2и , где
функция возрастает, и ^-, -^- , где функция убывает.
Функция у~х* (рис. 12) на отрицательной полуоси
абсцисс монотонно убывает, а на положительной — возрас-
возрастает.
В заключение параграфа исследуем какую-либо конк-
конкретную функцию с использованием всех введенных поня-
понятий. Рассмотрим, например, функцию у = \ sin x \ (рис. 16).
-Zu
Область определения этой функции — вся ось х. Функ-
Функция ограниченная, так как |sinx|==Sl для любого х;
периодическая с периодом, равным я; четная, ибо
| sin (— х) | = | — sinx | = | sin x |.
На интервалах (лд, "j~ ft) (n — любое целое число,
включая нуль) функция | sin x\ возрастает, а на интервалах
( nJ~ тс, (п-\~ 1)л) убывает.
Упражнения
1. Построить графики функций, исследовать их ограниченность,
четность и выделить интервалы монотонности функций: а) у — '
1 \
1+х '
+дг21
32
1 х 1 3
д) у =± Xs — 5х + 6; е) 0=р-; ж) У = х-щ-
и) у = х*; к) у= '
Л 1
2. Доказать, что любая функция / (*), определениая при
— со<л:<оо, может быть представлена в виде суммы четной и
нечетной функции.
f (x)-4-f ( л:)
Указание. Рассмотреть функции ft (х) = о
Глава III
ЧИСЛОВЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ
И ПРЕДЕЛЫ. ЧИСЛОВЫЕ РЯДЫ
§ 1. ЧИСЛОВЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ
В этой главе мы более подробно изучим один
частный, но очень важный вид функциональной зависи-
зависимости: функции, область определения которых лежит во
множестве, состоящем из натуральных чисел и нуля, или
совпадает с этим множеством.
Определение. Числовой последовательностью назы-
называется функция, определенная на множестве, принадлежа-
принадлежащем множеству натуральных чисел, т. е. каждому нату-
натуральному числу п из области определения функции
ставится в соответствие число хп — член последователь-
последовательности.
Обычно такую функциональную зависимость записы-
записывают в виде {*„}, или {хи хъ..., ха,...}, или xn = f(n),
где число п, называемое номером или индексом числа хп,
пробегает часть множества натуральных чисел, являю-
являющуюся областью определения последовательности. Эле-
Элементы области значений называются членами последова-
последовательности. Если т^>п, то говорят, что член хт следует
за хп (хп предшествует хт) независимо от того, каковы
по величине сами числа хп и хт.
Задавать последовательность, как и вообще функцио-
функциональную зависимость, можно разными способами. Для
математического изучения наиболее удобно задавать по-
последовательность в виде комбинации математических сим-
символов (формулы), показывающей, какие действия нужно
совершить над числом п из области определения, чтобы
получить член последовательности.
Областью определения такой последовательности (если
специально не оговорено противное) будем считать все
те натуральные числа (включая 0), для которых действия,
предписываемые формулой, имеют смысл. _i_
я
34
Общие определения ограниченности и монотонности
функции, конечно, справедливы и для последовательности.
Примеры. 1) Функция _у„ = 2п (п== 1, 2,...) есть последова-
последовательность; ее первые члены такие: 2, 4, 6 и т. д.
Эта последовательность монотонна (возрастает), ибо если
«! > ras> то и 2n.i > 2га8. Кроме того, она не ограничена. Действи-
Действительно, какое бы число А мы ин взяли, всегда найдется натураль-
А
ное число п > =-, для которого 2я> А.
2) Функция уп = ап-}-Ь (п=1, 2, 3 а и Ь — некоторые
числа) есть последовательность, называемая арифметической прог-
прогрессией. При а > 0 она возрастает и также не ограничена. Это
доказывается так же, как и в предыдущем примере.
3) у„ = aq"*1 (л = 1, 2,3,...) — последовательность, называемая
геометрической прогрессией. При q > 1 и а > 0 она возрастает,
так как aqni>.aqni. при любых-П!>- га2.
4) .уя = (—1)я-п (п=1, 2, 3,...). Эта последовательность, оче-
очевидно, неограничена и не является монотонной. Действительно,
но
Иногда приходится рассматривать последовательности
{хп}, где п принимает все натуральные значения, начи-
начиная с некоторого заданного числа N. В этом случае сле-
следует указать область определения функции, т. е. ука-
указать, что n^N, например хп = --===- (п = 3, 4,
уп — 2
5,...).
§ 2. ПРЕДЕЛ ПОСЛЕДОВАТЕЛЬНОСТИ
Переходим к понятию, играющему центральную
роль во всей математике, — понятию предела, кон-
конкретно — к понятию предела последовательности. Будем
считать, что рассматриваемые ниже последовательности
определены или на всем множестве натуральных чисел,
или по крайней мере для всех натуральных чисел, боль-
больших некоторого числа.
Рассмотрим, например, последовательность!—|. Чле-
Члены этой последовательности ' при возрастании п прибли-
приближаются к нулю, т. е., какое бы положительное сколь
угодно малое число е мы ни задали, всегда найдется та-
такое число N, что для всех членов последовательности с
номерами большими, чем N, будет выполнено неравенство
— — 0 = — <^е. В самом деле, для этого достаточно
2* . 35
в качестве N взять любое натуральное число, большее
1 „ ¦ .,.. 1 1 . ,
числа —. 1огда N^> —, следовательно, тг<Се и тем бо-
лее — <Се при «S^iV. В этом случае говорят, что после-
последовательность |—| стремится к нулю ил,и имеет своим
пределом число 0. Причем если положить е = 0,1, то все
члены последовательности с п^>./у= 10, будут отличаться
от нуля меньше, чем на е = 0,1, если же е = 0,01, то
только при «>>iV = 100 все члены последовательности
будут отличаться от нуля меньше, чем на е = 0,01. Таким
образом, в нашем примере с уменьшением е значение N
возрастает, т. е. ./V зависит от е. Дадим теперь общее
определение предела последовательности.
Определение. Число А называется пределом последо-
последовательности {хП}, если выполнено следующее условие: ка-
какое бы малое е^>0 мы ни взяли, всегда найдется такое
натуральное число N, зависящее от е, что для всех чле-
членов последовательности с номерами n~^N (n — N, #-j- 1,
N-\-2,...) будет выполнено неравенство \х„ — А \<^е.
В этом случае также говорят, что последовательность
{хп} сходится (или стремится) к числу А, или имеет пре-
пределом число А, и пишут: limxn = А.
п-*со
Обозначим \х„ — А\—уа. Очевидно, для того чтобы
последовательность {хп\ стремилась к числу А, необходимо
и достаточно, чтобы последовательность {уП) стремилась к 0.
В самом деле, если \imxn = A, то, начиная с неко-
некоторого n^N, будет О^г/„<^е, где е — любое положи-
положительное число. Отсюда по определению предела: Нтг/„ =
= 0. Наоборот, если \imyn = 0, то для любого
я-»со
найдется такой номер N, что уа<^& при n^N, т.е.
\хп — ^Ks Для всех n^sN. Другими словами, limxn =
л-»оо
Пользуясь определением и следствием из него, можно
находить пределы простейших последовательностей.
Примеры. 1) Рассмотрим последовательность I—~? L
I П -f- 2, \
Докажем, что lira 1\п = 1.
36
¦Действительно, \х„ — /4 1 =
га+2
= -' ¦ о <-е ПРИ всех п>N, если за N примем любое натураль-
натуральное число, большее ——2. Еще раз подчеркнем зависимость
числа N от величины е. Пусть, например, е = 0,1, тогда' неравеи-
га+1
ство
п+2
взять е = 0,001, то неравенство
<0,1 будет выполнено при n>N = 8. Если
п+2
- 1
< 0,001 будет выпол-
выполняться только для n>N==998. Для е = 10 5 соответствующее
7V = 99 998 и т. д.
2) Пусть хп = Я~Г9 . Тогда lira х„ = 2. В этом случае
п ~т~ * л-юо
—-[—г, и lim ул = 0, так как для любого е > 0
можно найти такой номер N, что уп < с при n^N (-за Л/ можно,
3
например, принять любое натуральное число, большее 2).
3) Рассмотрим еще числовую последовательность
A)
Проведем преобразование:
хп — -
.+ У7Г) __
\
Кя+1
Покажем, что Нтлг„=0. Для этого найдем такое N, начиная
Я-+ОЭ
1
с которого будет выполнено неравенство
з= <е, или
B)
Для выполнения неравенства B) достаточно, чтобы Уп ^ —. Это
будет при всех натуральных га, больших или равных—, т. е. за
N, участвующее в определении, можно принять любое такое нату-
натуральное число ./V, для которого имеет место неравенство
4
4) Пусть дг„ = q" @ < q < 1).
Тогда
Пгал-я = 0.
я->оо
C)
37
Для того чтобы убедиться в справедливости этого утверждения,
предварительно докажем следующее неравенство:
A+»)">1+>п D)
0*>О, п — натуральное). Докажем его по индукции (см. приложе-
приложение в конце книги). При га=1 неравенство D), очевидно, справед-
справедливо, так как 1-(-8 :>= 1-|-8. Предположим, что оно выполняется
при n = k, т. е. A rf-5)*^ 1 -|-bk, и покажем, что при « = й—(— I
будет иметь место неравенство:
Действительно, по предположению индукции
A +8)*+i = A +8)* A +») 3» A + 8Й) A +8),
т. е.
1).
Тем самым мы доказали утверждение D).
Неравенство D) можно записать и в ином виде:
1+Ьп •
E)
Теперь легко доказать основное утверждение настоящего пункта.
В самом деле, так как 0<^<1| то q можно представить в виде
где
8 = ^?->0. G)
Из F), G) и E) заключаем:
(8)
Чтобы доказать C), нужно убедиться в том, что для любого
е> 0 существует такое N, что при всех n^sN будем иметь
Для этого в силу неравенства {8) достаточно показать, что
найдется такое ./V, что при всех п ;з= N будет выполнено
неравенство -. <е, какое бы е>0 мы ни взяли. В ка-
честве такого N, очевидно, можно взять любое натуральное число,
для которого имеет место неравенство
38
Итак, для произвольного е > 0 существует такое N (удовлетво-
(удовлетворяющее неравенству (9)), что для всех n^N выполняется нера-
неравенство qn <е @ <q < 1), что и означает, что Jim g-n = 0.
я-*оо
5) Покажем, что при любом положительном а
lim -^j- = 0 (га! = 1 -2-3- ... • п).
„ ,
Действительно, для любого положительного числа а можно
а
найти такое натуральное число т, что —ЦЛ""^" Тогда для всех
членов нашей последовательности с номерами большими, чем т,
будем иметь:
i м га — ю
а" а- а- ... ¦ а- а- а- ... -а а а а
~nF~l-2-...-m-(m-\-l)-...4i~a т + 1 ' т ' '
а ¦¦ fa
п
где
о
___
т+\
Докажем теперь, что для любого е > 0 найдется такое число N, что
при всех га 5= N будем иметь $qn <e.
В самом деле, из примера 4) следует, что lim<7" = 0, т. е. для
л-юо
любого ?i>0, в частности 6! = —( существует такое натуральное
число N, что при n^N будет
qn < Ч — '-j, т. е. р9я<е.
а11' а"
Следовательно, и —-г- < е, т. е. lim —г- = 0.
ral „^оо га!
Дадим теперь геометрическое истолкование понятия
предела последовательности. Члены последовательности
будем изображать точками на числовой оси. Пусть
А = lim хп. Возьмем произвольное е ^> 0 и построим отре-
л-*оо
зок длины 2s с серединой в точке А (рис. 17). Тогда
утверждение «начиная с некоторого n = N, выполнено
неравенство \хп — А\<^& при n^Nt> равносильно сле-
следующему: «начиная с некоторого n = N, члены последо-
последовательности {хп} (п 5г N) будут изображаться точками
числовой оси, лежащими на интервале длины 2е с сере-
39
диной в точке Л». Такой интервал длины 2s с центром
в точке А называется ^-окрестностью точки А.
Поэтому можно дать следующее «геометрическое»
определение понятия предела последовательности: «.Число А
*v.; й-? *» <«.г A xNt3 х„„, 4+? х„., Хы_}
Рис. 17
называется пределом последовательности {хп\, если выпол-
выполнено следующее условие: какое бы е ^> О мы ни взяли, всегда
найдется такое натуральное число N, что все члены по-
последовательности с номерами n = N, N -f~ I, ... будут
лежать в ^-окрестности точки Л».
Упражнения , ,
1. Доказать, что lim xn = A для последовательности хл = А
я-»-со
2. Доказать, что lim =—т-т- = -о-.
Зя + о 3
3. Доказать, что lim . ."Т— = 0, если
я-*оо on -\- a
п
4. Доказать, что последовательность 0,3; 0,33; ...; 0,333...3; ...
стремится к пределу. А = -^.-
5. Доказать, что Hm (V2n -f 3 — У 2я.
л->оа
/ ]\л
^-=0
6. Доказать, что lira
§ 3. НЕКОТОРЫЕ ТЕОРЕМЫ О ПРЕДЕЛАХ
ПОСЛЕДОВАТЕЛЬНОСТЕЙ
В этом параграфе мы рассмотрим некоторые тео-
теоремы о пределах последовательностей.
Теорема 1. Каждая сходящаяся последовательность
может иметь только один предел.
Доказательство. Пусть lim хп = А и \imxn = B.
я-»- со я-> со
Предположим, что А Ф В. Возьмем е = —j— (рис. 18).
Согласно определению предела найдется такой номер Nlt
40
что все члены последовательности \хп] с номерами п ^ Nt
будут находиться в е-окрестности точки А, а вне этой е-
окрестности будет лишь конечное число членов последо-
последовательности, в частности в s-окрестности точки В их тоже
лишь конечное число.
А-е А А+е в-е В В+е
Рис. 18
Но точка В тоже является пределом последователь-
последовательности \хп) и, следовательно, для достаточно большого
номера Nt все члены последовательности {хп\ с номерами
п ^з Ni должны находиться в s-окрестности точки В.
Следовательно, для n^>N = max \NU N^} в е-окрестности
точки В должно быть, с одной стороны, лишь конечное
число членов последовательности {хп\, а с другой стороны,
все члены последовательности с номерами n^N.
Из полученного противоречия делаем вывод, что вы-
высказанное в начале доказательства предположение оказалось
неверным, т. е. А = В, и утверждение теоремы доказано.
Теорема 2. Если последовательность {хп} имеет пре-
предел, то она ограничена.
Доказательство. Пусть Нтлг„ = Л. Возьмем,
л—* со
например, е = 1. Тогда найдется такое число N, что при
всех n^N будем иметь: \хп — Л|<^1, т. е. —1<^хп —
¦—А<^\, или А '<— 1 <] лг„ <^А -}- 1 при всех n^N.
Остается не более чем N членов последовательности {лг„}^
которые могут не удовлетворять этому неравенству. Вве-
Введем в рассмотрение число Mi = max{|Xj |, .... |.%_j|} и
число УИ —max{Afj, |/t|-j-l}. Тогда уже при всех я=1,
2, ... будет \xn\<dM, т. е. последовательность {х„} огра-
ограничена.
Теорема 3. Пусть {хп} и {уп} — две последователь-
последовательности и \imxn=±=A, \imyn = В. Тогда существует предел
я—*со л-*оо
последовательности {хп~\-уп) и \im (хп-\-у„) = А-\-В.
л-» оо
Доказательство. Чтобы доказать, что последо-
последовательность {хп-\-уп\ сходится к пределу А-{-В, нужно
для любого е^>0 найти такое N, что для членов после-
последовательности {хп-\-уп} с номерами n^N будет выпол-
41
нено неравенство: \хп-\-уп — (А-\-В)\<^&. Но, очевидно,
+ \уп-в\.
Так как последовательность {лг„} сходится к пределу А,
то в силу определения предела по заданному числу -у
можно найти такое натуральное число Nt, что | хп — А\<^_
<у при n^sNi.
Аналогично для последовательности {уп\, сходящейся
к числу В, по 4- можно найти такое натуральное N$, что
\уп-~ В\<^~ при n^Nq. Пусть N = max{Nt, Л^}-
Тогда
при всех n^N. Таким образом, теорема доказана (по
данному е найдено N).
Теорема 4. Пусть {хп\ и {уп\ — две последовательности
ыПтлгл = Л, \\туп = В. Тогда существует предел последо-
п — оо л-»оо
вательности {ха-уп} и Мтхп-уп = А В.
л-»со
Доказательство. Рассмотрим выражение \хп-уп —
— А • В |. Под знаком абсолютной величины прибавим и
вычтем величину хп-В. Получим:
\хп-уп-А-В\=\(хп-уп-хп-В)-{- (хп-В-А-В)\^
^\хп\.\уП-В\-{-\В\-\хп-А\^М-\уп-В\-{-
\В\-\хя-А\,
где М — такое число, что \х„\^М при всех п. В силу
теоремы 2 такое число существует. Обозначим через
К {М, \В\]. Тогда М-\уя — В\ + \В\-\хя — А\*?
п — В\-}-\хп — ЛD» т. е. при каждом п будет
Но \\туп = В. Следовательно, какое бы е^>0 мы ни
га-»оо
взяли, найдется такой номер Nu что для всех n^Ni
получим \у„ — В | *\2F • Аналогично существует такое Nit
42
что для всех n^N^ имеем \хп — А\^^т. Пусть N =
r=max{N1, Ni). Тогда для любого n^N имеем цепочку
неравенств:
т. е. мы доказали, что limхп*уп = А-В.
я—* оо
Теорема 5. Пусть {хп} и {уп} — две Последователь-
Последовательности и \imxn = A, \imyn = B(B^0). Тогда существует
п п
число N такое, что последовательность \—\ определена
при всех n^N и lim—= -d-.
Доказательство. Сначала докажем, что последо-
последовательность |—| определена при всех п, больших неко-
некоторого натурального числа No, т. е. t/n^0 при п^Ый.
Действительно, найдется такое натуральное число No, что
при всех n=2:We будет \уп — В\<1~?-, т. е. — ^^<С
in |
_L . Если В^> 0, то неравенство примет вид:
откуда г/я>у>0; если же В<0, то y<t/n— fl < —
— у, откуда «/„<-2<0. Итак, мы получили, что |«/„|>
для всех n^No, что и доказывает первую
часть утверждения теоремы.
Далее мы будем рассматривать только члены последо-
последовательности с номерами большими, чем jV0.
Мы должны доказать, что для любого е^>0 сущест-
существует такое натуральное число N, зависящее от е, что для
п^ N будет выполнено неравенство
43
Рассмотрим выражение
Уп В
Вуп
Прибавим и вычтем в числителе А-В. Тогда
Вхп — АВ+ АВ — Ауп
Вуп
вуп
I
\В\-\УЯ\
Пусть Af = max {| А |, \В\}. По условию теоремы Нтлгл= А.
Я-.00
Следовательно, для любого s,^>0 существует такое Л^ь
> уу u
что для всех я^Л^ имеем \хп— A\<^st. Точно так же
существует такое Nt, что для всех п ^ iVa выполнено
неравенство \уп — В ^
Итак,
\B\-\B\
D2
0, Nu
Теперь по заданному е подбираем е, и соответствующие
Nt и iV9 так, чтобы правая часть неравенства стала мень-
мень9
ше s: Е'
Тогда при
г. Для этого достаточно положить
\Г0, Л^ь Ni} получим:
х А
~?~в~
-ттг-.
Теорема 6. Пусть
Птх„ = С, \\хауп =
A0)
Кроме того, пусть для всех п^ N9 (No — заданное на-
натуральное число) имеют место неравенства xn^zn^.yn.
Тогда Нтг„ = С.
л-» оо
Доказательство. В силу A0) существует такой
номер Nt, что для .любого е^>0 и всех n^Nt выполнено
неравенство \хп — С|<О- Аналогично найдется такой
номер Nt, что для n^Nt будет \уп — С К е.
Выберем N = max{N0,Nu NJ. Tor да С — е <- «/„ ^ С -f
-|-s при всех п^Н и С — е^х„^С-|-е- Так как
44
— е, а гп^2Хп, то и г„5гС — е. Кроме того, у„^
f а гп^уп, следовательно, и zn*^C-\-s. Итак,
для всех я^#имеем:С— s ^. гп ^С-\-&, т. е. lim zn=C.
П-* оо
Теорема 7 (теорема Вейерштрасса). Всякая моно-
монотонная ограниченная последовательность имеет предел.
Мы примем эту теорему без доказательства, ибо стро-
строгое доказательство довольно сложно и требует дополни-
дополнительных знаний, хотя эта теорема и кажется очевидной.
Пусть, например, лгл^О и {лг„} монотонно возрастает,
оставаясь ограниченной числом М (рис. 19). Тогда самое
левое из чисел М (на чертеже это число А), которыми
можно ограничить последовательность {лг„}, и будет ее
пределом.
П*2 ХП*3 *п*Ч А М
Рис. 19
§ 4. ЧИСЛОВЫЕ РЯДЫ
Пусть дана бесконечная последовательность \ап\:
в\, Яз> Яз. •••, ая> ••• Тогда формально написанное выра-
выражение
ах + 0, + аз + ... + 0. + ... A1)
называется рядом, а слагаемые alt ait a3, ..., ап — чле-
членами ряда. Обычно вместо записи A1) пишут сокращенно
00
2]а„, где ап называется общим членом ряда.
Пусть теперь
S
1 + h
at-j- а^-\-а3 = S
Рассмотрим последовательность {Sn\. Эта последова-
последовательность называется последовательностью частичных сумм
ряда.
45
Определение. Ряд A1) называется сходящимся, если
существует предел последовательности его частичных сумм,
т. е. Пт5л==5, а число S называется суммой ряда. К,о-
00
ротко это обозначают: ^ an = S. В противном случае
я = 1
ряд называется расходящимся.
Таким образом, исследование сходимости рядов сво-
сводится к исследованию сходимости последовательностей
частичных сумм. Наоборот, исследование сходимости по-
последовательностей можно свести к исследованию сходи-
сходимости некоторых рядов.
Так, если дана последовательность ии щ, ..., ип ...,
00
то рассмотрим ряд ^ («„ — ы„_,), где ыо = О. Тогда 5„ =
= («1 — «о) + («* — «О + (и. ¦— и,) -f • • • -f (и. — и. j) = ип,
т. е. частичные суммы его совпадают с соответствующими
членами последовательности и, значит, вместо исследова-
исследования сходимости последовательности можно исследовать
сходимость соответствующего ряда.
С важным примером ряда мы встречаемся при сумми-
суммировании бесконечной убывающей геометрической прогрес-
прогрессии a-fa<74-a9a + ---4-a?" + --- @<?<1). Найдем,
исходя из определения, сумму этого ряда.
Известно (см. Приложение), что сумма п членов про-
прогрессии выражается формулой
с — П .1 Ч
Воспользуемся тем, что в нашем случае lim<7" =
Л—» 00
(см. § 2 этой главы). Поэтому
— q \—q
Следовательно,
со
л==0
Сформулируем и докажем некоторые простейшие свой-
свойства рядов.
46
1) Необход имый, признак сходимости ряда.
со
Если ряд ^ ап сходится, то liman = 0 (общий член
я=1 я —со
сходящегося ряда стремится к 0).
Доказательство. Рассмотрим (п—1)-ю и п-ю
частичные суммы ряда
Sn = afa+ + a + a ( '
По определению суммы ряда имеем:
5 = Нт5„_, и 5 = Нт5я. ^ A3)
я-»со я-юо
Из A2) и A3) вытекает, что
lim ап = Нт E„ — 5„_,) = Нт 5„ — Нт 5„_, = 5 — 5 = 0.
Я~*О0 Я—»СО Я—f СО Я—»СО
Указанный признак является необходимым, но не до-
достаточным для сходимости ряда, т. е. из того, что lim а„ = 0,
я-юо
оэ
еще не следует, что ряд ^ ап сходится. Убедимся в этом
я=1
на примере ряда 1 +У + -3-+ .-..-f-—+ ... (этот ряд на-
называется „гармоническим"). Общий член этого ряда, оче-
очевидно, стремится к 0. Покажем, что этот ряд расходится.
Разобьем слагаемые ряда на группы:
Если мы заменим каждую скобку на меньшее число, то
каждая частичная сумма ряда (*-) от этого может только
уменьшиться. Рассмотрим ряд, каждая частичная сумма
которого не превышает частичной суммы ряда (*):
8 слагаемых
47
Нетрудно видеть, что сумма слагаемых в каждой скобке
равна у, т. е. получили ряд 1 -\- у -\-. у -f ~ -f-... -\-,
—]—^—[—... , частичные суммы которого неограниченно воз-
возрастают, поэтому тем более неограниченно возрастают
частичные суммы ряда (*), а следовательно, и частичные
суммы гармонического ряда. Следовательно, этот ряд рас-
расходится, так как если бы он сходился, то последова-
последовательность его частичных сумм имела бы предел и, значит,
была бы ограниченной (см. теорему 2 из § 3).
2) Если
то ряд
(k — некоторое число) сходится и его сумма равна k-S.
Доказательство. Пусть я-я частичная сумма ряда
A4) есть 5„, а я-я частичная сумма ряда A5) есть S'n.
Тогда 5; = /га,4-^а + ••• -\-kan = k(а,-f а4-J---- + ««) =
= k-Sn. Следовательно, lim Sn = Hm &Sn = fe lim Sn = kS.
я-»оо п-»оо п-»оэ
¦ 3) Если
|]ап = 5' A6)
то ряд
A8)
сходится и его сумма равна S'-\-S".
Доказательство. Пусть я-е частичные суммы ря-
рядов A6), A7) и A8) есть соответственно S'n, S'a и Sn.
48
Тогда Se = a,-f ft,-fa,-f &» + •.•• + ?»* + *« = Si-fS». От-
Отсюда
4) Если ряд ^ ап сходится, то будет сходиться и
ряд, полученный из данного ряда отбрасыванием некото-
некоторого числа первых членов.
ОО
Доказательство. По условию ряд 2 а„
я=1
дится. Пусть его N-я частичная сумма есть SN. Тогда
существует предел lim 3„=8. Нам нужно доказать, что
00
сходится ряд 2 ап- Но его частичная сумма есть
J
Следовательно,
) )
lim S' = lim SN— У a.=S— У a..
Упражнения
CO
1) Доказать, что сходится ряд ^ (в„ — #„), если сходятся
со со
ряды ^ вл и '2 *"'
2) Доказать утверждение: «если ряд сходится, то сходится и
ряд, полученный из данного отбрасыванием и приписыванием ко-
конечного числа членов>.
со
3) Доказать, что ряд Л . . расходится. '
§ 5. НЕКОТОРЫЕ ПРИЗНАКИ СХОДИМОСТИ РЯДОВ
С ПОЛОЖИТЕЛЬНЫМИ ЧЛЕНАМИ
В этом параграфе будут рассматриваться ряды
со
У ап, где все ап ^ 0 (п = 1, 2, ...).
49
Теорема 1. Для того чтобы ряд ^ ап(а„^0) схо-
я = 1
дился, необходимо и достаточно, чтобы последователь-
последовательность его частичных сумм была ограничена.
Доказательство. Сначала докажем достаточность.
Рассмотрим частичную сумму Sn+J = at -j- а% -j-... -f- an+1 =
= Sn-j-an+i- Так как an+I^0, то Sn+i^Sn. Таким обра-
образом, мы имеем монотонно возрастающую последователь-
последовательность, ограниченную по условию теоремы, т. е. Sn^M.
Следовательно, по теореме Вейерштрасса существует
V ОО
lim Sn = S^M и ряд ^ ап сходится.
Необходимость условий теоремы очевидна, так как
неограниченная последовательность не может иметь пре-
предела.
Теорема 2 (признаки сравнения). Пусть даны два
ряда
2>„ A9)
л=1
Е К B0)
я=1
и пусть
a»<*» (k=l, 2, 3, ...). B1)
Тогда: а) если ряд B0) сходится, то сходится и ряд A9);
б) если ряд A9) расходится, то расходится и ряд B0).
Доказательство, а) Пусть ряд B0) сходится,
ОО
т. е. 2 bn — S'. Так как все Ь*ЗгО, то S'^>S'm, где
я=1
S'm — т-я — частичная сумма ряда B0). В силу B1)
S'm^Sm (Sm — т-я — частичная сумма ряда A9)), а зна-
значит, S'~^>Sm для любого т. Согласно предыдущей тео-
теореме ряд A9) сходится.
б) Пусть ряд A9) расходится. Это значит, что его
частичные суммы неограничены. Но тогда неограничены
и суммы Sm, так как.ЬА^й?. Снова используя теорему 1,
получаем, что ряд B0) расходится.
50
00
Пример. Исследовать сходимость ряда У, „я , ..
оэ
Рассмотрим ряд Л =„-. Он Сходится, так как представляет бесконеч-
бесконечную убывающую геометрическую прогрессню,нОдд>^п . ¦¦ Следова-
оо
тельно, ряд 2, од ¦ . тоже сходится. Здесь мы использовали
пункт а) теоремы 2.
Теорема 3 (признак Даламбера). Пусть дан ряд
оо
2 ап. Если существует предел отношения последующего
я=1
члена ряда к предыдущему lim -sa=zq, то при q<dl
ряд сходится, а при q ^> 1 ряд расходится.
Доказательство. Пусть </<^1. По определению
предела для любого е>0 существует такой номер N,
что для всех n^N выполнено неравенство:
«Я+1
Но </<^1, и мы можем выбрать столь малое е, что qi =
= q-\-e тоже будет меньше 1, т. е.
^<<1 для n^N.
Итак,'-^!i<<7i, или aN+l<qtaN.
Аналогично
jv и т- Д-
Отсюда получаем:
61
Обозначим величину ^ ап = Ь- Тогда любая частичная
л = 1
сумма ряда Sm ограничена:
Следовательно, по теореме 1 ряд ^ ап сходится. Пусть
-теперь q> 1. Тогда возьмем столь _малое е и выберем
такое N, что при n^N будет:
_e и
Т; е. ¦^5*i><7i">l при n^sN. Отсюда
и т. д., т. е. каждый следующий за aN член ряда больше,
чем предыдущий, и, значит, общий член ряда не стре-
00
мится к нулю. Следовательно, ряд ^ ап расходится.
В том случае, когда q—l, требуется дополнительное
исследование для проверки сходимости ряда.
Примеры. 1) Рассмотрим ряд
со
vjl^j, 1 , 1 , , 1 .
л = 1
Здесь —?±i_._.
1.2-3-....(п + 1) Ч-2-.З.....л
lim ?5±i = 0, т. е. по признаку Даламбера ряд сходится.
л-юо ап
оо
2) 2 я= 1+2-+-3 + --- + я + "- Этот ряд, очевидно, рас-
л=1
холится. Посмотрим, что нам даст признак Даламбера: -^±1 =" —1С—
52
и lim -5±i= Hm ———=1, т. е. признак Даламбера нам ответа
«->со ап я-.оо П.
на вопрос о сходимости ряда не дает.
оо
Теорема 4 (признак Коши). Пусть дан ряр 2 а«-
я=1
Если существует lim yra~n = q, то при q<^\ ряд схо-
дится, а при q^>\ расходится.
Доказательство. Пусть q<^l. По определению
предела для любого е ^> 0 существует такое Л/, что для
всех n^N будет Уan<^q-\-г. Выберем s столько малым,
что <7i = <7 +г"О• Тогда для всех n^N имеем: j/a,, <^
<1, ал<?;. Отсюда
Складывая соответственно левые и правые части нера-
неравенств, получим:
Рассуждая так же, как при доказательстве теоремы 3,
получаем, что исходный ряд сходится.
Пусть теперь <7^>1. Подбираем г и N так, чтобы для
всех n^N было выполнено неравенство: у^ап^><7i = q-f-
-j-s^>l. По определению предела это всегда можно сде-
сделать. Из неравенства получаем an^>q?^>\ для всех
п>5 N, т. е. а„ не стремится к нулю, и, следовательно,
ряд 2 ап расходится.
я=1
53
Упражнения
Исследовать сходимость следующих рядов:
ОЭ
А2
ОЭ
л = 1
я
Я-Р .
I
Ся+1) '
3)
4)
оо
2
л =
100"
я! '
я2
3"'
1
ОЭ
' Zi Я"
л=1
§ 6. ЗНАКОЧЕРЕДУЮЩИЕСЯ РЯДЫ.
АБСОЛЮТНО СХОДЯЩИЕСЯ РЯДЫ
В предыдущем параграфе мы рассматривали ряды
только с положительными членами. Сейчас предметом
нашего рассмотрения снова становятся произвольные ряды.
Сначала рассмотрим так называемые знакочередующиеся
ряды, т. е. ряды вида
«1 — аа + «з — а4 + ав — •••, B2)
где все а;>0 (t = l, 2, ...).
Докажем следующую теорему.
Теорема Лейбница (достаточный признак сходи-
сходимости знакочередующихся рядов). Если члены знакоче-
знакочередующегося ряда убывают, т. е. ai>aa>a3> ••• "
общий член ряда стремится к нулю («„->• 0), то ряд
сходится.
Доказательство. Пусть п — 2т~четное число.
Рассмотрим частичную сумму ряда B2): Sim — ai — а^-\-.
-\-а3 — ¦¦•-\-<hm-i — ^Jm- Ее можно записать двояко:
S3m = (a1 — а3)-К«з — aiJ + .-H-Kn-i — а*») B3)
и
Sim — а\ — ((к — а3) — (а4 — а8) —... — аш. B4)
Все величины, стоящие в скобках, по условию положи-
положительны. Поэтому согласно B3) Sim>0 и с ростом т воз-
возрастает, а из B4) следует, что Sim<^ai. По теореме Вейер-
штрасса получаем, что последовательность {Sim} имеет
предел, т. е. lim Sim = S (и S=^ai).
т-юо
Докажем, что сумма нечетного числа членов Sim^
имеет предел, причем тот же самый, что и SJm. ^
54
очевидно, теорема будет полностью доказана. Возьмем
5 Перейдем к пределу прн /и->оо:
lim S2m+1 = li
По только что доказанному lim Sim = S. Кроме того, по
т-»оэ
условию lim Озт+1 = 0- Следовательно, Пт 8^+1 = S.
тсо тоэ
Итак, заданный ряд сходится.
Переходим теперь к общему случаю. Для рядов с чле-
членами произвольных знаков можно сформулировать сле-
следующий признак сходимости.
Теорема. Если сходится ряд, составленный из абсо-
абсолютных величин членов данного ряда, то сходится и сам
данный ряд.
Доказательство. Пусть дан ряд
а1 + аа + а3 + ... + а„ + ... B5)
Среди его членов есть как положительные,' так и отрица-
отрицательные. Составим ряд из их абсолютных величин
|oil + |eiH-|a.|.+ - + |e»l + -- B6)
к
Рассмотрим первые п членов ряда B5). Выберем из
них только положительные члены и их сумму обозначим
через. S^. Затем берем все отрицательные члены из пер-
первых п членов ряда B5) и сумму их абсолютных величин
обозначим через S"n. Обозначив я-е частичные суммы
рядов B5) и B6) соответственно через Sn и а„, будем
иметь:
Sn = Sn — SJ и on=
По условию ряд B6) сходится. Следовательно, о„ имеет
предел (обозначим его через о). Последовательности {S'n\
и {S?} возрастают и ограничены (величиной о), а значит,
по теореме Вейерштрасса {S'n} и {S^} имеют пределы.
Следовательно, и {Sn\ имеет предел, т. е. ряд B5) сходится.
Определение. Ряд, абсолютные величины которого
образуют сходящийся ряд, называется абсолютно сходяг
щимся. Если ряд, составленный из абсолютных величин
данного ряда, расходится, а сам данный ряд сходится,
то данный ряд называется условно сходящимся.
65
Приведем пример условно сходящегося ряда:
. " 1 ~" + 3"~4 + 5~~ •••
По теореме Лейбница он сходится" а ряд, составленный
из его абсолютных величин, есть гармонический ряд,
который, как мы уже показывали, расходится.
Упражнение
Исследовать сходимость рядов:
l) Z ' 2) 2 - 2п-\ ' 3) Z
Глава IV
НЕПРЕРЫВНОСТЬ ФУНКЦИИ
§ 1. ПРЕДЕЛ ФУНКЦИИ. БЕСКОНЕЧНО МАЛЫЕ
И БЕСКОНЕЧНО БОЛЬШИЕ ВЕЛИЧИНЫ
В главе III мы уже ввели понятие предела чис-
числовой последовательности {*„}, или предела функции на-
натурального аргумента. Теперь введем, понятие предела
для более общей функциональной зависимости. Во всей
этой главе будем предполагать, что функция f(x) опре-
определена на некотором отрезке, интервале или их' объе-
объединении.
Определение. Число А называется пределом функ-
функции 1{х) при х, стремящемся к х0 (х-+х9), если для лю-
любого положительного числа г существует такое положи-
положительное 8, что, как только выполнено условие О <^ ] х — хй | <^
<8, так для всех х, удовлетворяющих этому условию,
имеет место неравенство:
В этом случае пишут: lim f(x) = A.
При х = ха функция f (x) может и te принимать зна-
значение А. Более того, она может быть вообще не опреде-
определена в этой точке (это возможно лишь в случае, когда
точка х9 совпадает с концом интервала, на котором опре-
определена функция f(x)). Наше определение фактически озна-
означает, что / (х) имеет своим пределом число А при х->х0,
если при приближении х к х9 функция f(x) попадает
в г-полосу числа А, т. е. в полосу, ограниченную пря-
прямыми у = А-\-г и </ = Л — е (рис.20). Из чертежа видно:
чтобы функция г/ = /(х) не выходила за пределы г-полосы,
нужно взять достаточно малое 8. Тогда на отрезке [х0 — о,
*о~М] функция y = f(x) будет отличаться по абсолют-
абсолютной величине от числа А меньше, чем на е. Очевидно,
в нашем случае с уменьшением е должно уменьшаться
и 8, т. е. можно сказать, что 8 зависит от е.
57
Рис. 20
П р и м е р. Докажем, что lim 2лг = 4. Для этого надо дока-
х^-2
зать, что для любого сколь угодно малого положительного числа е
существует такое 8, что, как только будет выполнено неравенство
\х — 2J <8, A)
так получим
\2х —
B)
Иначе говоря, по заданному е нужно подобрать такое 5, чтобы
при выполнении неравенства A) одновременно выполнилось нера-
неравенство B), т. е. требуется удовлетворить условие
— е<2дг — 4<е, или 4 —
при
2 —8<лг<2+8.
Переписав неравенство C) в виде
2—2-
C)
D)
E)
и сравнив E) с D), убеждаемся, что достаточно положить & = —
и тогда из неравенства D) будет вытекать неравенство E), из E)
последует C) и из C), в свою очередь, получим B).
Таким образом, по заданному ? мы натли такое Ь, что при
\х—2|<8 выполняется неравенство \2х — 4|<е. Это и означает,
что lim 2д?т=4. Зависимость Ь от е выражается здесь очень просто:
'х->2
8==-. Например, если мы хотим, чтобы выполнялось неравенство
\2х — 4|<0,01, достаточно положить 5 = 0,005 и тогда, если будет
58
\х—2]<0,005, получим \2х— 4|<;0,01. Если же мы хотим, чтобы
было|2х— 4 |< 0,001, то придется положить S = 0,0005, и тогда
при I* — 2| <0,0005 будет \2х — 4| <0,001.
Определение. Число А называется пределом слева
функции f(x) при х-*-х0, если для любого положительного
числа г существует такое положительное 8, что для всех
х, удовлетворяющих условию 0<^х9— х<^Ь, имеет место
неравенство \ f (х) — А\ <]-е.
Записывают это следующим образом:
lim f(x) = A.
О
х-* жо-О
Определение. Число В называется пределом справа
функции f (х) при х->х„, если для любого положитель-
положительного числа г существует такое положительное 8, что для
всех х, удовлетворяющих условию 0<^х — хо<[8, имеет
место неравенство: | f (х) — В | <^е.
В этом случае пишут: lim f(x) = B.
Читатель может в качестве упражнения доказать сле-
следующую теорему.
Теорема. Для того чтобы число k было пределом
функции f(x) при х->ха, необходимо и достаточно, чтобы
существовали и равнялись k предел слева и предел справа
функции f (x) в точке хй.
Пределы слева и справа могут существовать, но не сов-
I XI
падать между собой. Например, пусть /(х)=-—'(рис. 21).
Рис. 21
Здесь lim f(x) = l, lim f(x) = —I, т. е. в точке 0
ж —0+0 ж —0-0
пределы слева и справа существуют, но не равны между
собой. В самой точке 0 функция не определена.
Можно привести примеры таких функций, у которых
есть предел только с одной стороны.
59
Возьмем, например, функцию (рис. 22):
— 1 при х^О,
sinl при *>0.
Эта функция определена различными формулами на
различных участках оси абсцисс. В этом случае
lim f(x) = —1, а предела справа при *-»-0 у функции
не существует. ,_
Рис. 22
Действительно, положим е = 2". Тогда, какое бы
1
мы ни взяли, всегда найдутся точки x2n+) =
x*n~i =
такие, что
— 0 < 8 и
(для этого нужно выбрать такое п, чтобы
V
0<8
т. е. п ^> =- A -f- -Л), и кроме того sin sin
2 ф
= 2, т. е. разность значений функции в двух этих точ-
точках превышает ширину е-полосы и, следовательно, хотя
бы одно из них выходит за пределы е-полосы. А это и
означает, что предел функции / (х) = sin - при х-> 0-|-О
не существует.
Рассмотрим теперь функцию / (х), определенную при
всех х^а.
Определение. Число А называется пределом функ-
функции f (х) при х->-\- оо, если для любого числа г ^> О най~
по
60
дется такое положительное число М, что при всех зна-
значениях х, удовлетворяющих условию х^>М, будет выпол-
выполнено неравенство: \f{x)-—Л|<^е.
Короче пишут: . lim f(x) = A, или f(x) -*- А
(черт. 23). Из определений и чертежа видно, что для
любого s нужно подобрать такое число М, чтобы для
всех значений х, удовлетворяющих неравенству х^>М,
функция y = f(x) попала в е-полосу числа А и уже
оттуда не выходила.
Рис. 23
/1 \*
Пример. Рассмотрим функцию у=1~-) (рис. 24), которая
определена при всех х. Для этой функции lim /(д:) = 0. Дейст-
*-> + «>
вительно, если мы зададимся любым числом е>0, то можно найти
такое число М, что при всех х, удовлетворяющих условию х > М,
будет выполнено неравенство
/ 1 \ X
=&)¦=•¦ "
В самом деле, прологарифми-
прологарифмируем неравенство:
, т. е. — х < log3
или х> — log2 е.
Таким образом, если взять
М = —log3 с, то при всех х>М
будем иметь l-^-j < Е> т- е-
lim f(x) = 0.
х->--{-оо
Пусть теперь функция / (х)
определена при всех
Рис. 24
61
Определение. Число А называется пределом функ-
функции f (х) при х-*- — оо , если для любого е^>О найдется
такое положительное число М, что при всех значениях х,
удовлетворяющих условию х<^ — М, будет выполнено не-
неравенство \f(x) — А | < е.
Иначе пишут: lim f(x) = A, или f(x)-*A (рис. 25).
*-» —ОО Л-» —ОО
Например, для функции у = 2* (она определена для
У ¦
А .
А-е
~м
Рис. 25
всех х) легко показать, пользуясь определением предела
функции при х-*- — оо, что lim f(x) = O (рис. 26).
Л-» —ОО
Сформулируем без доказательства некоторые теоремы
о пределах функций. Доказательства их аналогичны тем,
что были приведены в теоремах о пределах числовых
последовательностей, и чита-
читатель без труда докажет их
самостоятельно. Будем счи-
считать, что все рассматриваемые
функции определены на мно-
множестве точек х, удовлетво-
удовлетворяющих неравенству
О ¦
Рис. 26
где а—некоторое положитель-
положительное число (возможно свое для
каждой конкретной пары
функций).
Тесрема 1. Пусть
62
<р (х) = / (х)¦ -f- g (х). Тогда предел <р (х) яры * -*- х9 суще-
существует и равен А~\-В, т. е. lim <р (х) = А ~\-В; другими
х-*х0
словами, предел суммы двух функций равен сумме преде-
пределов этих функций.
Теорема 2. Пусть lirri f(x) = A, \\mg{x) = B и
X —*¦ Xq X —v #0
<Р (*)==/(¦*)•?(*)• Тогда предел <?(х) при х-+х0 суще-
существует и равен А-В:
lim f(x) = A -В,
х-*х0
т. е. предел произведения функций равен произведению
пределов этих функций.
Теорема 3. Пусть lim f(x) = A, lim g(x) = B и
x-*xa x-*xq
f (x)
tf(x)=J-~. Тогда предел <f(x) при х-+ха существует,
если lim g (x) Ф 0 и равен -s-:
lim<p(x)=-4,
т. е. предел частного двух функций равен частному пре-
пределов этих функций, если предел знаменателя не равен
нулю.
Теорема 4. Пусть \\mf{x) = A, Umg(x) = A и
JC-»JC0 Х-*Х0
f(x)^<?(x)^g(x). Тогда предел <?{х) при х-+х0 суще-
существует и равен А, т. е. Нт<р(х) = Л.
X-tXo
Определение. Функция y = f(x) называется беско-
бесконечно большой при х-*-Х(, (или х-*¦-{-со или х->— оо),
если для любого сколь угодно большого числа М найдется
такое положительное число Ь (или положительное число N),
что для всех х, удовлетворяющих условию 0<^|х — ха|^8
(или x^>N, или х<^ — W), выполнено неравенство \f(x) |^
~^>М. Причем хй может как принадлежать, так и не при-
принадлежать области определения функции. Последнее воз-
возможно лишь в том случае, когда точка хй совпадает
с одним из концов области определения функции.
Так, функция у = 2* (рис. 26) является бесконечно
большой при х-*--\-оо. Чтобы убедиться в этом, возьмем
любое М>0 и докажем, что существует такое положи-
положительное N, что при всех x~^>N будет у^>М. В самом
$еле, для выполнения неравенства^ 2х^> М нужно, чтобы
63
лг^> logjTW, т. е. достаточно взять "W = log.2yM. Тогда при
всех x^>N будет 2х ^>М.
Функция y = tgx бесконечно большая (рис. 14) при
Читатель легко докажет следующую теорему:
Теорема. Величина бесконечно большая при х^-ха
не может иметь предела при х^-х0.
По аналогии с бесконечно большой величиной опреде-
определяется и бесконечно малая величина.
Определение. Функция y = f(x) называется беско:
нечно малой величиной при х->~Хо (или при х-*--\-оо, или
при х-*— оэ), если для любого положительного числа е
найдется такое положительное Ь (или положительное
число N), что для всех х, удовлетворяющих условию О <^
<С|х —*о|<С8 (или x^>N, или х<^ — N), будет выпол-
выполнено неравенство |/(х)|<л Используя определение пре-
предела функции, можно сказать, что функция y = f(x) на-
называется бесконечно малой величиной, если
lim / (х) = О, или / (х) -*¦ 0.
х-*Хо х-*'х0
(или jc-»+oo) (или jc-»-)-oo)
(ИЛИ JC-» —ОО) (ИЛИ Х-* — ОТ)
Для иллюстрации воспользуемся примером функции
D = [~^ (рис. 24). При л:-».-(-со функция y = (~Y
стремится к нулю и, следовательно, является бесконечно
малой величиной. Функция у —2х (рис. 26) — бесконечно
малая величина при х-> — со. '
Функция у=х% (рис. 12) — бесконечно малая вели-
величина при х-+0 и бесконечно большая при л:^- + °° и
х -»— со/ Между бесконечно большими и бесконечно ма-
малыми величинами существует взаимосвязь, которая харак-
характеризуется следующей теоремой.
Теорема. Если при х->хй (или при х-»-оо, или при
х->— оо) функция f (x) является бесконечно большой ве-
величиной и f(x)^O при х 9^ х0, то функция jj—, является
бесконечно малой; если же f(x) — бесконечно малая вели-
величина и f(x)^ 0 при х Ф х0, то JT-.— бесконечно большая.
Доказательство. Пусть f(x) — функция беско-
бесконечно большая при х-*-х0. Для того чтобы доказать, что
64
JF7-r:—бесконечно малая величина при х-*-х0, надо пока-
показать, что'для любого е^>0 можно найти такое 8, что, как
только | х — х01 <С 8. так будет выполнено неравенство
. Пусть М = — . -Тогда так как f(x) — функция
1
бесконечно большая, то можно найти такое 8, что при
I х — х91 <^ 8 будем иметь: | / (х) | > М = —. Отсюда
Доказательство совершенно не меняется в случае,
когда х ->¦ ~р оо или х ->— оо. Аналогично доказывается
вторая часть теоремы.
Пример. Функция у — х* при х —*-f-co, очевидно, беско-
бесконечно большая, а функция у =—j- при х~*-J-oo есть величина
бесконечно малая. Та же функция у = хг при х—*0 есть величина
бесконечно малая, а функция у = —j—бесконечно большая.
Порядок малости и порядок роста функ-
функции. Пусть имеются две функции f(x) и g(x), относи-
относительно которых известно, что Нт/(х) = 0и lim g(x) = O,
х-*а х-*а ^
т. е. обе функции есть бесконечно малые величины при
х->а. Пусть g(x)^?0 при х^а. Составим новую функ-
функцию F(х) = ~^- и исследуем ее поведение при х-*а.
Если Vim F(x) = k, где k — любое конечное действи-
X—* а
тельное число, не равное нулю, то говорят, что функции
f(x) и g(x) имеют одинаковый порядок малости. Можно
написать приближенное равенство f{x)^^kg(x), разу-
разумеется, в окрестности той же точки а.
f(X)
Примеры. 1) /(х)=лг, g(x) — 2x. Тогда Пт ¦¦ ; ( =
x0g \х)
х 1
= lim -к— = -ту, т. е. функции у — х и _у = 2* при х~~ 0 имеют
одинаковый порядок малости.
2) Можно доказать (и в дальнейшем мы это сделаем), что
lim = 1, т. е. функции y = srnx и у — х при х-*0 имеют
Х-+0 X
одинаковый порядок малости.
3 А. В. Вакушинский 65
f (x\
Если же \\xnJ—j-{=Q (т. е. 6 = 0), то говорят, что
функция y = f(x) имеет более высокий порядок малости,
чем функция y = g(x) при
Пример. / (х) = х*, g (х) = х. Тогда lim — = 0, т. е. у = х3
х-*0 X
есть функция более высокого порядка малости при х—«-О, чем
У = х.
Пусть 'теперь функции f(x) и g(x) бесконечно боль-
f (х)
шие при х-* а. Если \im—-~ = k(k^0), то говорят,
?(х>
что функции f(x) и g(x) имеют одинаковый, порядок
роста. Если же \\т^~~ = 0, то функция g(x) имеет
больший порядок роста, чем функция f(x).
Примеры. 1) f(x) = xa-}-x+l, g(x) = 2x*. Здесь
fi) *4\\ 1
рр ) f() }
,• fix) ,. х*4-х-\-\ 1 .
llm Тгк~ llm ^И — = т, т.е. функции
f
имеют одинаковый порядок роста при х — -\-<х>.
2) /С*) = -з, «W = i- ТогДа 1}тШ= НтАг = 0, т.е.
¦*
функция/(х) имеет меньший порядок роста, чем функция g(x).
Определение. Асимптотой кривой y = f(x) мы на-
назовем прямую y = kx~\-b, если выполнено соотношение
[/(*)-(** + &)] -+ 0 F)
или
[f{x)-(kx + b)\ -v 0.
JC -> — СО
Соотношение F) геометрически означает, что с ростом
(или убыванием) х функция f(x) неограниченно сбли-
сближается с прямой y = kx-\-b,. причем она может как под-
подходить к асимптоте с одной стороны, так и пересекать
ее бесчисленное множество раз. Зная функцию y = f(x),
можно легко найти уравнение асимптоты. Действительно,
из соотношения F) имеем:
f(x) — b — kx -v 0,
(
х (
или
JC-» — 00
66
отсюда
?i*kzL -*• к, т. е. к = lim /(^~S =
.AT Jf
.V—> -f-CO, Jf > I 00, Jf—^-|-OO,
Jt-» —CO Jt-»—CO Jt-> —CO
Теперь, зная k, определим b:
№.
b= lim [f(x)~kx].
x-*-\-a>,
JC-»—OO
Пример. Найдем асимптоту кривой y = j
x '
x x*4-1
t= lim == lim j— = lim
X—*-CO X Y—*.rr> X
Jt-»0O
x-*oa
6= lim (jk-j x] =0 (равенства справедливы как при
*->оо\ ¦* У.
^__f_oo, так и при х—»—оо). Итак, асимптотой кривой j) = х -\
является прямая у = х (рис. 27).
У
Рис. 27
Однако далеко не каждая кривая имеет асимптоту. По-
Попытаемся, например, воспользовавшись нашими форму-
67
лами, найти асимптоту к параболе у = х* (черт. 12).
Имеем: 2
k= lim — = iimx.
Предел здесь, очевидно, не существует, а значит, не су-
существует и асимптота к кривой y = xi.
Упражнения
1) Исследовать порядок малости функций: а) у = х'— Зх* отно-
V~x — V^ + Vx— a
¦¦ '
сительно х при х~*0; б) у—:— ' ¦ - ' ' — относительно
у х2 — а*
х-^-а при х~*а.
2) Исследовать порядок роста функций: а) у=——- относи-
1 _.. . ,. х. _ х + 2
тельно
х->2.
х—1
при х—»1; б)
1
~~о\1 относительно -,
при
§ 2. НЕПРЕРЫВНЫЕ ФУНКЦИИ
Определение. Функция y = f(x) (рис. 28) назы-
называется непрерывной в точке х0, принадлежащей области
определения функции, если для любого положительного
числа е существует такое положительное 8, что для
Рис. 28
всех х, удовлетворяющих условию \х — Хо|<\8, будет вы-
выполнено неравенство \f(x) — /(#о)|<Се< Вспоминая опре-
определение предела функции, мы видим, что только что
сформулированное определение эквивалентно следующему:
68
Функция y=f(x) называется непрерывной в точке
х0, если lim f(x) существует и равен f(xa):
lim
= /(*„).
G)
Это означает, что предел, к которому стремится функ-
функция f(x) при приближении х к хй слева, совпадает с пре-
предельным значением функции f(x) при приближении х
к х0 справа, т. е.
lim f(x)= lim f(x) = f(x0).
л-»л„+0 *-»*„ — О
Введем обозначения: х — хй = Дх — приращение аргу-
аргумента, f(x) — f(xo) = kf(x) — приращение функции. Тогда
равенство G) можно переписать следующим образом:
Нт
Равенство (8) можно в свою очередь переписать:
--/(*б)] = О, или
(8)
&х-*0
Таким образом, получили еще одно определение не-
непрерывности функции в точке.
Функция y = f(x) называется непрерывной в точке х0,
если бесконечно малому приращению Дх аргумента х
соответствует беско-
бесконечно малое прира- '
щение Д/ (х) функ-
функции f(x) (рис. 29).
Определение.
Функция y = f(x) на-
называется непрерывной
на интервале (а, Ь)
{или отрезке [а, Ь],
или их объединении),
если она непрерывна
в каждой точке этого ^
интервала (отрезка
или их объединения).
Функция, не яв-
являющаяся непрерыв- Рис. 29
69
f(X0+&X)
ной в точке х0, принадлежащей области определения,
й й
называется разрывной в этой точке.
Примеры. 1) y=f(x)=— при хф<д, j;@) =
Эта функ-
функ= 0, так как/@) = 0, a f(x) при х-*0
б
ция разрывна в точке , /() , f() р
есть функция бесконечно большая и, следовательно, по соответ-
соответствующей теореме предыдущего параграфа не имеет предела при
х-*0 (рис. 30).
Рис. 30
Но на любом отрезке [а, Ь], принадлежащем области опреде-
определения и лежащем справа или слева от* точки х = 0, функция
у=— непрерывна. В самом деле, какое бы е>0 мы ни взяли,
всегда можно найти такое 8>0, что при \х — хо\<Ъ для любой
точки х0 ? [а, Ь\ и любого х, удовлетворяющего этому условию,
Для этого достаточно поло-
положить 5 = бо3,
где а = min (| а |, \Ь\
У
0
-7
X
будем иметь
<
2)
\, \ |)
1 при х > 0,
Рис. 31
у\ 0 при х = 0,
—1 при x<zO
V (рис. 31).
Эта функция непрерыв-
непрерывна всюду слева и справа от
начала координат,а в начале
координат терпит разрыв.
70
Упражнения
Исследовать непрерывность функций:
1) у = х; 2) у = х*; 3) У=^^ при хф\ и г/A)=0.
§ 3. ПРОСТЕЙШИЕ СВОЙСТВА НЕПРЕРЫВНЫХ
ФУНКЦИЙ
Теорема 1. Сумма двух функций, непрерывных
в некоторой точке, есть функция, непрерывная в той же
точке.
Доказательство. Пусть даны две функции f(x) и
g(x), непрерывные в точке хй. Требуется доказать, что их
сумма со (х) = / (х) -\- g (x) тоже непрерывна в этой точке.
Действительно, из определения непрерывности функ-
функции вытекает:
\imf(x) = f(x0), hmg(x)=g(x0).
х-*х0 х^х„
Следовательно, используя теорему о пределе суммы
функций (см. теорему 1 из § 1), получим:
lim cp(x)=lim [
Х->Хц Х-*Ха
= \imf(x)
Итак, lim cp (x) = cp (x0), что и означает, что функция
<р (х) непрерывна в точке х0.
Теорема 2. Произведение двух функций, непрерывных
в некоторой точке, есть функция, непрерывная в той
же точке.
Доказательство. Пусть функции f(x) и g(x) не-
непрерывны в точке хй. Требуется доказать, что функция
<р (х) = / (х) • g (x) непрерывна в точке хй. Так как функ-
функции f(x) и g(x) непрерывны в точке х0, то Пт/(л:) =
х-*х„
= f(x0) и Ymg(x) = g(x0). Поэтому, воспользовавшись
теоремой о пределе произведения функций, получим:
limcp(*)= hm[f(x)-g(x)] =
X-fX0 X^-Xf,
= lim f{x)- \img(x) = f(xo)-g(x(>) = <?(x(>),
х->х„ х-*х0
что и доказывает непрерывность функции ср (х) в точке хп.
71
Теорема 3. Частное двух функций, непрерывных
в точке хОу есть функция, непрерывная в той же точке,
если только знаменатель не обращается в ней в нуль.
Доказательство. Пусть функции f(x) и g(x) не-
непрерывны в точке Хо и (H
р g()
f (х\
Покажем сначала, что функция -j-г определена в не-
которой окрестности точки хй, т. е. найдется такая
окрестность точки х0, в которой g (x) не обращается в нуль.
По условию теоремы функция g(x) непрерывна
в точке Хъ, т. е. для любого е^>0 найдется такое §>0,
что при |jc — *0!<8 будет \g(x)~— g(xo)|<e, или
?W-KgW<gW + «. И если е выбрать так, чтобы
удовлетворялось условие ?<^\g(xo)\, то при )^0
получим g(*)>0, а при g (*,>)< О будет
(|* — л:0|<^8), т. е. в достаточно малой окрестности точки
f (х)
х0 функция g(x)^0. Это и означает, что функция ¦ \'-
определена в этой окрестности.
Докажем теперь, что она. непрерывна в точке х0.
По теореме о пределе частного двух функций и из
определения непрерывности имеем:
lim f{x) f(xt)
«•--«о —-
~\img(x) g(x0)'
X —у Xq
т. е. есть функция, непрерывная в точке х0.
Замечание. Пусть функция /(х) непрерывна в точке х0
и пусть f(x), стремясь к своему пределу /(л). остается все время
неотрицательной. Тогда и/(л-0)^0. Если же/(дг) все время не-
неположительна, то и/(.*¦„) =ё 0.
Доказательство. Пусть / (х) ^ 0 и lim / (х) =/ (йг0).
Предположим, что/(л-0)<0. Тогда из рассуждений теоремы 3
следует, что в достаточно малой окрестности точки ха будет и
/(л:)< 0, что противоречит условию теоремы.
Итак, /(*0Jэ0.
Аналогично если f(x)^0, то, предположив, что /(*О)>9>
получим противоречие, так как из рассуждений теоремы 3 сле-
следует, что в этом случае должно быть и / (х) > 0 в достаточно ма-
малой окрестности точки х0. Таким образом, f (х0) =ё0. Утверждение
полностью доказано.
Иногда функциональная зависимость между величи-
величинами у и х образуется с использованием третьей величины г
по следующему правилу:
y = f(z), z=g{x).
72
Прямая зависимость у от х бу;ет y=f[g(x)). Для того
чтобы эта запись имела смысл, необходимо, чтобы область
значений функции g(x) входила в область определения
функции f(z).
Функции такого вида условно называются слсжными
функциями.
Можно рассматривать как сложные следующие функции:
y=s'mx'i, y=sinz, z — x2, y=logsinx, y—logz,
z=sinx (здесь мы ограничиваемся рассмотрением таких
значений х, для которых sinx^>0); z/=j/^ -|_]/"jtf
У = V] 1 + г, z = Vx (здесь рассматриваются x^sO).
Теорема 4. Если функция z = g(x) непрерывна
в точке хй, а функция у—f (z) непрерывна в точке zo==g(x6),
то функция y — f[g(x)] тоже непрерывна в точке хе.
Доказательство. Так как функция / (г) непрерывна
в точке zu = g(x0), то для произвольного е^>0 найдется
такое 8,, что, как только будет иысолнено условие
\g (х)—?(*o)l<C^ii так удовлетворится неравенство
Но g(x) — функция, непрерывная в точке л:0. Поэтому для
любого §i найдется такое 8, что при \х — хй\<^Ъ будем
иметь \g(x) — g(Xo)\<^bu а следовательно, в силу непре-
непрерывности функции f(z) будет выполнено и условие (9).
Итак, по заданному е, используя непрерывность функ-
функции g(x), находим §ь а по 8,, используя непрерывность
функции g (х), находим 8 такое, что при \х — л:0 ] <<^ 8 выпол-
выполняется неравенство (9), что и означает, что функция f [g (x)]
непрерывна в точке ха.
Упражнения
1) Доказать, что сумма любого конечного числа непрерывных
функций есть функция непрерывная.
2) Доказать, что произведение любого конечного числа непре-
непрерывных функций есть функция непрерывная.
§ 4. НЕКОТОРЫЕ СВОЙСТВА ФУНКЦИЙ,
НЕПРЕРЫВНЫХ НА ОТРЕЗКЕ
В настоящем параграфе мы приведем без дока-
доказательства несколько основных теорем о функциях, непре-
непрерывных на отрезке.
73
Теорема 1. Если функция f (x) непрерывна на отрезке
[а, Ь], то существует по крайней мере одна точка х = с,
в которой функция f {x) достигает своего наибольшего зна-
значения на отрезке [а, Ь], т.е. длявсех х Ф с будет f(x)^f (с),
и существует по крайней мере одна точка x = d, в кото-
которой функция f(x) достигает своего наименьшего значения
на отрезке [а, Ь], т. е. для всех x^d будет f(x)d
(рис. 32).
У
0
1
/
ч /
1 i
i i
i i
a d
/Г4
1
1
1
1
1
1
с
1
1
1
1
1
1 т
Ь х
Рис. 32
Рис. 33
Замечание. Для функций, непрерывных на интервале, тео-
теорема несправедлива. Например, среди значений непрерывной на
интервале @,1) функции у = х (рис. 33) нет ни наибольшего, ни
наименьшего.
Теорема 2 (теорема Коши). Если функция f {x) не-
непрерывна на отрезке [а, Ь] и принимает на его концах
различные по знаку значения, т. е. f{a)-f (b) <^ 0, то суще-
существует по крайней мере одна точка с^[а, Ь], в которой
функция f(x) обращается в 0, т. е. /(с) = (^^Ь
(рис. 34).
У
b х
Рис. 34
74
Геометрически это означает, что непрерывная кривая,
расположенная в одном конце отрезка [а, Ь] над осью
абсцисс, а в другом конце под ней, обязательно пересечет
ось абсцисс внутри отрезка [а, Ь].
Следствие. Пусть функция ^(л:) непрерывна на [а, Ь]
и f(a) = A, f(b) = B. He ограничивая общности, предпо-
предположим, что А < В. Тогда какое бы число С, удовлетво-
удовлетворяющее условию А<^С<^В, мы ни взяли, всегда найдется
точка с?[а, Ь] такая, что f(c) = C (рис. 35). Действи-
Действительно, рассмотрим функцию g(x) = f(x) — С. Она непре-
непрерывна на [a, b], g(a)<^0 и g(b)^>0. Следовательно, по
теореме 2 найдется такая точка с?[а, Ь], что g(c) = O,
т. е. g(c) = f(c) — С=0, или/(с) = С. Геометрически это
утверждение означает, что если функция, непрерывная на
отрезке, принимает в каких-либо двух точках различные
значения, то эта функция принимает и любое промежу-
промежуточное между ними значение.
ч
в
с
0
А
/
to
ь
¦иы
X
Рис. 35
Так, на рисунке 35 функция f(x) принимает в точках а и
Ь соответственно различные значения f (а) = А и f (b) = B
и для произвольного значения С(А<^С<^В) находится
такая точка с ? (а, Ь), что / (с) = С.
Глава V
ЛИНЕЙНЫЕ АЛГЕБРАИЧЕСКИЕ
УРАВНЕНИЯ И МЕТОДЫ ИХ РЕШЕНИЯ
§ 1. СИСТЕМЫ ЛИНЕЙНЫХ АЛГЕБРАИЧЕСКИХ
УРАВНЕНИЙ
В элементарной алгебре изучаются системы одного,
двух и трех уравнений 1-й степени. Мы тоже будем здесь
исследовать системы уравнений^ 1-й степени (их принято
называть линейными уравнениями), но для нас число
уравнений системы не будет играть существенной роли.
Мы будем применять общепринятые обозначения для
коэффициентов системы линейных алгебраических" уравне-
уравнений. Например, система трех уравнений будет иметь сле-
следующий вид:
- anxt -f- ЯцХ3 = bi
- а^х% -j- ai3x3 = 04
1 + a3iXi -j- a33x3 = b3
Неизвестными в системе являются xlt xit x3, коэффи-
коэффициенты системы — ai}(i = 1, 2, 3,/=1, 2, 3); ЬиЬъЬ3 —
правые части системы уравнений. Каждый коэффициент atj
имеет два индекса; 1-й указывает номер уравнения или
номер строки системы, а 2-й — номер неизвестного. Реше-
Решением такой системы мы будем называть набор чисел
Си Съ, с3, который при подстановке их в систему уравнений
соответственно вместо Хи хг, х3 обращает эти уравнения
в числовые тождества. Следует помнить, что числа сь съ с3
представляют одно решение системы уравнений, а не три.
Другое дело, что такой набор чисел, который обращал бы
уравнения в тождества, может быть не единственным.
Вопрос о том, существует ли вообще решение системы
уравнений и если существует, то сколько таких решений,
мы рассмотрим позже.
76
Все сказанное выше можно распространить на системы
произвольного числа линейных алгебраических уравнений.
Система из п уравнений с п неизвестными будет иметь
вид:
[ an*i + апхг + апх3 -{-... -\~аыхп = Ьг
а.пх! + а^м + ai3x3 + ... + ainxn = 6a
A)
aniXi -f- апгх3 + . • • + аппх„ — Ьп
В этом случае набор чисел си с2, с3, ¦¦-, с„, обращаю-
обращающий в тождества все уравнения, называется решением
системы. Вопрос о существовании таких решений и обях
количестве, если они существуют, оставим пока открытым.
Скажем только, что система называется совместной, если
она имеет хотя бы одно решение (т. е. хотя бы один набор
чисел d, Ci, ..., с„, удовлетворяющий системе), и система
называется несовместной, если она совсем не имеет реше-
решений. Выпишем таблицу коэффициентов при неизвестных
в системе A):
/ап ап а13 ... ain\
1 ап аш ... а
ani ani an3 ... а„п/
Любая такая таблица (даже не обязательно связанная
с какой-либо системой уравнений) носит название квад-
квадратной матрицы п-го порядка и содержит п2 элементов.
Матрица называется квадратной потому, что количество
строк в таблице совпадает с количеством столбцов. Строкой
мы назовем совокупность элементов таблицы вида а,у, где i
фиксировано, а / пробегает все значения от 1 до п, напри-
например: aiu а<ц, ai3, ..., ain.
Столбец — это набор элементов а-^, записанных сверху
вниз, где / фиксировано, a i пробегает все значения от 1
до п, например:
77
Если число строк в таблице равно т, а число столбцов
п), то таблицу называют прямоугольной матрицей:
ап ап ... а
i ami...a
Эта матрица, очевидно, содержит т-п элементов.
Матрицу, содержащую одну строку или один столбец
из п элементов, мы будем называть п-мерным вектором.
Решение (с,, съ ..., с„) системы A) также является
«-мерным вектором. -Наконец, столбец правой части Ь
тоже n-мерный вектор. "'
Пусть теперь, кроме системы A), имеется еще и дру-
другая система п линейных алгебраических уравнений с п
неизвестными:
-j- апх^ -| + a'lnxn = b[,
n = b'it
B)
CLnnX/t = Ь'п.
Системы A) и B) называются эквивалентными, если любое
решение системы A) является решением системы B), и,
наоборот, любое решение системы B) является решением
системы A).
Пример. Рассмотрим две системы уравнений:
II
Нетрудно видеть, что решением обеих систем будет набор
@; 1). Других решений системы не имеют.
В том случае, когда вектор правой части нулевой, т. е.
все bi = 0(i = I, 2, ..., «), система A) называется одно-
однородной.
§ 2. ДЕЙСТВИЯ НАД МАТРИЦАМИ
В предыдущем параграфе мы ввели понятие мат-
матрицы. Здесь мы определим различные алгебраические опе-
операции над матрицами. Пусть даны дв,е матрицы А и В,
имеющие т строк и п столбцов (обычно элементы матриц
78
обозначаются строчными буквами, а сами матрицы — про-
прописными):
[ап ап ... aln\ /bn bn ... bln
.... ...J---On
Определение. Две матрицы А и В называются рав-
равными, если их соответственные элементы равны: aij = bij.
Определение. Матрица С называется суммой матриц
А и В, если каждый ее элемент равен сумме соответст-
соответствующих элементов матриц А и В, т. е. ci] = aij-\-bij, или
(ап ап ... аы\ /Ьп Ьп ... Ьы*
ад ... й2л I 1 I Ь<ц Ь<ц . . . bin
та • • • птп1
ami-\-bmi ... атп
.. С1п
или
Пример.
л _1 0\ - /—1 0 2\_ /0 —1 2
\2 1 —2/ + \ 1 —1 1/ \3 0 —1
Из самого определения следует, что сумма .н.е изме-
изменится, если мы поменяем слагаемые местами.
Определение. Операции, в которых результат от
перемены мест членов не меняется, называются коммута-
коммутативными операциями.
Операция сложения матриц обладает свойством ком-
коммутативности.
Определение. Матрица, все элементы которой равны
нулю1 называется нулевой матрицей.
79
Очевидно, А-\-0 — А @ здесь обозначает нулевую мат-
матрицу того же порядка, что и А).
Введем правило умножения матрицы на число.
Определение. Произведением матрицы А на число k
называется матрица С, каждый элемент с'ц которой равен
произведению соответствующего элемента а^ на число k,
т. е. Cij — kaij.
Матрицы иногда можно умножать и друг на друга.
Рассмотрим сначала правило умножения квадратных
матриц п-го порядка — А и В.
Определение. Произведением квадратных матриц п-го
порядка А и В называется -матрица С, элементы которой
определяются следующим образом: элемент ctJ (т. е. эле-
элемент, стоящий на пересечении i-й строки и j-го столбца)
равен сумме произведений соответствующих элементов 1-й
строки матрицы А и j-го столбца матрицы В:
ain bnj
bkj.
Пример. Даны матрицы:
(\ —1\ E 3
\б 7
Найдем их произведение: С=' u 12
cu = en bn+alt *,, =
cn = an 6ia + ela bS2 = \ • 3 4- (—1) • 7 = —4,
Нетрудно убедиться в том, что, вообще говоря, операция
умножения матриц в отличие от операции умножения чисел
не является коммутативной, т. е. А • В Ф В • А.
Поменяем, например, местами матрицы Л и В в последнем при-
примере. Тогда
А-[б 7/12 3/-U 15/~а
Очевидно, СфС, т. е. В-
80
Однако для матриц, как и для чисел, имеет место
свойство ассоциативности умножения, т. е. А-(В-С)=
= (А¦• В)-С, в чем легко убедиться непосредственной про-
проверкой.
По аналогии с умножением квадратных матриц можно
производить умножение и прямоугольных матриц. Только
в этом случае необходимо, чтобы число столбцов матрицы А
было равно числу строк матрицы В. Тогда в произведе-
произведении А ¦В получится число строк, равное числу строк
в матрице А, и число столбцов, равное числу столбцов
матрицы В.
/1 2 -1\ /2 ! 3 ~2\
Примеры. 1) Л = I п \ В= 0 -1 1 О
\ 0
= А-В.
с%1 = 3 • 2 + 0 •О + Ы = 7,
с22 = 3.1+0.(-1)+1-2=5,
с„ = 3.3 + 0-14-1-2=11,
Итак,
Н 1 :;
2 —I I
-С I -!)¦
) = 3, i.e. С = А-В—
/• 2 —2
3) Л=(—1 2 3), В= —1 0
\ 3 -1
сХ1 = (-1).2 + 2-(-
Второй из приведенных примеров показывает, как произ-
производят умножение матрицы А на матрицу-столбец В (век-
(вектор В). В результате получается также вектор-столбец С,
число элементов которого равно числу строк матрицы А.
81
Третий пример, в свою очередь, иллюстрирует, как произ-
производят умножение матрицы-строки А на матрицу В. В резуль-
результате получается тоже матрица-строка с числом элементов,
равным числу столбцов матрицы В.
Если теперь обозначить
д=
то из вышесказанного непосредственно следует, что систему
линейных алгебраических уравнений A) можно записать
в виде „матричного" уравнения А -Х = В. Мы часто будем
использовать эту сокращенную запись системы линейных
алгебраических уравнений.
Возникает вопрос, на какую матрицу X нужно умно-
умножить матрицу А, чтобы последняя осталась неизменной,
т. е. А-Х — А (как здесь, так и в дальнейшем, если не
будет специально оговорено, речь идет о квадратных мат-
матрицах). Оказывается, такая матрица существует и ее
естественно назвать единичной матрицей. Она обозначается
буквой Е:
1 0 0... О \
?==| 0 1 0... 0
',0 0 0 ... 1
Умножив А на Е, мы убедимся, что произведением будет
матрица А, причем и А-Е = А, и Е-А = А.
Определение. Диагональ матрицы, на которой рас-
расположены элементы ан (i=l, 2 л), называется глав-
главной диагональю.
Матрица, в которой все элементы, кроме диагональных,
равны нулю, называется диагональной матрицей.
Таким образом, единичная матрица — пример диаго-
диагональной матрицы с главной диагональю, состоящей из
единиц.
Числом, обратным числу а, называют число х такое,
что а-х=1, т. е. х = —.
Аналогично вводится понятие матрицы, обратной к дан?
ной матрице.
82
Определение. Матрица А'1 называется правой обрат-
обратной к матрице А, если выполняется следующее равенство:
А ¦ А"* = Е. Матрица А'1 называется левой обратной к мат-
матрице А, если выполняется следующее равенство: Л • А = Е.
Нам пришлось ввести правую и левую обратные мат-
матрицы из-за того, что произведение матриц некоммутативно.
Однако в дальнейшем мы покажем, что на самом деле
А~* = А~\
Из определения обратной матрицы отнюдь не вытека-
вытекает, что она всегда существует. Для ее существования
необходимо выполнение некоторого условия, о котором мы
также расскажем несколько позже. Не будем мы пока зани-
заниматься и вопросом о том, как находить обратную матрицу.
Наконец, последнее понятиеи которое мы введем в на-
настоящем параграфе, — понятие транспонированной мат-
матрицы.
Определение. Матрица А' называется транспони-
транспонированной по отношению к матрице А, если строки мат-
матрицы А являются столбцами матрицы А' с теми же но-
номерами, а столбцы матрицы А — строками матрицы А'
также с соответствующими номерами.
Так, если
ап ап аш ... aln\
аа, ап ап... а,
то
\ап1 ап% апг... апп\
lan ait
... a
\aln <hn аЗп • • • annl
Отсюда видно, что матрица Аг есть матрица А, зер-
зеркально отображенная относительно главной диагонали.
/1 2 3\
П .р и м е р. Транспонировать матрицу А ~ \ 4 5 61
\7 8 9/
/1 4 7\
Транспонированная матрица А' будет иметь вид: Л'= 12 5 81
\3 6 9/
83
§ 3. ОПРЕДЕЛИТЕЛИ МАТРИЦ
Каждой квадратной матрице А можно поставить
в соответствие некоторое число |Л|, которое называется
определителем матрицы А. Введем понятие определителя]
матрицы при помощи математической индукции. -?
Каждой матрице 2-го порядка (flu ai2j.поставим в со-
\«21 «И/
ответствие число ац-ао2 — «i2-#2i- Это число называется
определителем матрицы А 2-го порядка и обозначается
так:
011 -» =an-aii~an-au
(в отличие от матрицы определитель заключается не в
круглые скобки, а в прямые черточки).
Пусть теперь имеется квадратная матрица порядка п:
ап ап
(
ain
ап1 ani ... ап
Предположим, что мы знаем, что такое определитель лю-
любой квадратной матрицы (п — 1)-го порядка. Тогда можно *
дать следующее
Определение. Определителем матрицы А п-го поряд-
порядка назовем число, которое получается следующим образом: -
~ап
#11 «12
«21 #23
«Л1 «л2
Oil «23
«31 #33
#л1 «лЗ
«13 •••
«23 •••
-«ЛЗ-.-
••• 0*л
--• а3п
¦¦• «лл
(_Пп+1
1 /
f
«1я
<hn
1л
g
13
а
И
«93
«32
ап*
¦21 «23
«31 «32
й
Chi
«31
«Л1
«1#Л2
Оаа ..
#32 ••
«л2 ••
«23 •••
«зз ...
«ЛЗ •••
Chi •••
#3i •••
• «2, я-1
• «З.л-1
• «л.л-1
а
¦2л
«Зл
«ля
«2л
ЙЗл
«лл
C)
84
Мы получили алгебраическую сумму произведений эле-
элементов 1-й строки на соответствующие определители уже
(п — 1)-го порядка, которые в свою очередь точно так же
разлагаются в сумму определителей (п — 2)-го порядка
и т. д. до тех пор, пока получится сумма определителей
2-го порядка, взятых с коэффициентами, образовавшимися
в процессе разложения.
Представление определителя я-го порядка в виде сум-
суммы C) называют еще разложением определителя по 1-й
строке. Например, определитель матрицы 3-го порядка
по определению есть число
ап
(hi
==«11-
«32 «33
— flu-
«21 «93
«31 «33
+• fljj •
«21 «22
«31 «32
=ап (ап а33—агз ап)—ап (пц «зз~-«23«3i)+«i3 (а^азг—«22«3i)=
=flii ai% a33—an Оаз «32—пц пц йзз+Ои «зз o3i+Oi3 а21 аЭ2—
—«13 «22 «31=«11 «22 «33+«12 Cj!3 «31+«13 °И «32~«13 «22 «31~
— UJ3 Й39 «И —«13 «31 «33.
Последний раз мы переписали равенство только для того,
чтобы запомнить, как сразу вычислить определитель 3-го
порядка, не разлагая его на определители 2-го порядка.
Со знаком «плюс» будут произведения тех элементов, ко-
которые стоят^на главной диагонали (аца22«зз)> и те произ-
произведения, в которых два сомножителя находятся на линии,
параллельной главной диагонали (а1з«л«за и а^ОззйзО-
Остальные произведения, входящие в сумму, берутся со
знаком «минус».
Определитель 4-го порядка по определению равен:
«11
Oil
«31
«41
«19
«22
«32
«42
«13
ааз
«33
«43
flu
«34
a3i
«44
— иц
«22 «23 «24
«32 «33 «34
«49 «43 «44
Oil «23 «84
«31 «33 «34
«41 «43 «44-
Oil
«31
«41
«32
«32
«42
«2<r
«34
«44
— flu •
«21 «23 «23
«31 «32 «33
«41 «49 «43
Мы свели вычисления к определителям 3-го порядка, ко-
которые вычисляли только что.
85
Если матрица состоит только из одного числа (аи), то
ее определитель (определитель 1-го порядка) равен этому
числу.
Примеры. Вычислить определители:
1)
2)
1 1 1
—1 0 1
—1 —1 О
0 1 1
1 0 1
1 1 О
= 1-
е 1
1 О
О 1
—1 О
— 1.
—11
—1 О
+ 1
1 1
1 О
+ 1
1 О
1 1
1 01
1 —11 — :
= 1—1+1=1.
§ 4. СВОЙСТВА ОПРЕДЕЛИТЕЛЕЙ
Мы здесь исследуем основные свойства определи-
определителей я-го порядка. При их доказательстве мы постоянно
будем использовать метод математической индукции.
Строкой или столбцом определителя будем называть
соответствующую строку или столбец матрицы, для кото-
которой образован этот определитель.
Свойство 1. Если в определителе любого порядка
хотя бы одна из его строк состоит из нулей, то опреде-
определитель равен нулю.
Доказательство. Действительно, свойство очевид-
очевидно для п = 2, т. е. для определителя 2-го порядка
ап а
О О
= 0 и
О О
= 0.
Предположим, что оновернои для определителя (п—1)-го
порядка. Докажем его справедливость для определителя
п-го порядка.
Если первая строка составлена из -нулей, то свойство
очевидно, так как по определению:
О О ...О
ап1 апг... апп
= 0
... а
1п
(h,n-i
= 0.
86
Пусть теперь нулевая строка стоит на i-м месте (i Ф 1),
тогда
an an ... aln
#21 «23 • • • «2л
««-I, i «i-i.a ••• «<-i
0 0 0
«1+1,1 «(+1,9 ••
flirt
a29 ... Oj
0 ... 0
а„ч... а„
a.n ... Oj
0 ... 0
... ann
4-..,+ (_
'«1Л
ал ... a3 „_i
0 ... 0
an\... аЛ| n_i
Каждый из полученных определителей (я — 1)-го по-
порядка содержит строку из нулей и, следовательно (по
предположению индукции), равен нулю. Отсюда вытекает,
что и сам определитель п-го порядка равен нулю.
Определение. Матрица, у которой все элементы,
расположенные по одну сторону от главной диагонали,
равны нулю, называется треугольной.
Свойство 2. Определитель треугольной матрицы
равен произведению элементов, стоящих на главной диаго-
диагонали, т. е.
ап 0 0 ... 0
«31 «23 0 ... 0
«31 «32 «33 • • • 0
- а33 -
Доказательство. Действительно,
0 =а„
87
Предположим, что это свойство имеет место для опреде-
определителей- треугольных матриц (п~- 1)-го порядка. Тогда
по определению определителя п-го порядка:
а
am
0
ап
0
. 0
... 0
• апп
= ап.
Chi
азч
ani
0 ..
аа
Ояа..
. 0
. 0
• апп
Но по предположению индукции:
(hi 0 ... О
a3i «зз 0 ... О
а„г ап3 ani ... апп
= am ¦ ам • ¦ ¦ ¦ • апп.
Поэтому
аи 0 ... О
ац а.ц ... О
ani ani ... апп
— ап •
¦ • • ¦ • ап
Замечание. Очевидно, так же доказывается это свойство
для треугольной матрицы с нулями снизу от главной диагонали.
Следствие. Определитель единичной матрицы равен
единице:
1 о о... а
о 1 о... о
о о ...о 1
Свойство 3. Пусть А — матрица, в которой все
элементы i-й строки равны нулю, кроме элемента аи-.
88
Тогда
1 —
а„
аи
а<+1.
аи <
021
0 ..
«a
...
...
atia ••• ау ..
зм ... ai} ..
. 0 а,7 0 ..
Л* nj
CL\ i i tZi
ам.у-1 aw,
1л
. 0
¦ а™
7+1 • • • а1л
7+i • • • а<2л
7+1 ¦•• а1-л,л
7+i • ¦ • ai+i, л
an,
D)
Доказательство. В самом деле, для определите-
определителей 2-го порядка это свойство, очевидно, справедливо.
Предположим, что оно справедливо для определителей
(п—1)-го порядка. Докажем, что тогда выполняется ра-
равенство D). Разложим |Л| по 1-й строке:
\А | = flu
О... О ay 0 ... О
(hi
din
О ... О ау 0 ... О
ая1 ал3 ... а„„
-f.
х n_i
О...ОауО...О
(здесь ау умножали на определитель, равный нулю, так
как он имеет нулевую строку).
89
Разлагаем определители дальше, используя предполо-
предположение индукции:
\А\ =
з •
fli-l, 1 ¦ • • ai-1,7-1 ai-I, /+1 • ¦ • ai-l, n-1
^n. /-1 (In, J+i •¦•an, n-1
Если теперь вынесем за скобки (—1)(' 1)+(У 1} -ац =
= (—1)'+/а,/, то в скобках получится разложенный по
1-й строке определитель
Тем самым равенство ($} доказано.
90
Определение.'Определитель, полученный из данного
определителя вычеркиванием i-й строки и j-го столбца,
обозначается Mtj и называется минором элемента а,у-.
Произведение (—1)мМц называется алгебраическим допол-
дополнением элемента ац и обозначается Atj.
Сформулируем теперь важное свойство определите-
определителей.
Свойство 4 (разложение определителя по i-й стро-
строке). Произвольный определитель п-го порядка можно пред-
представить в виде суммы произведений элементов i-й строки
на соответствующие им алгебраические дополнения^ т. е.
ап
ац
...а
ln
ati ац
aia
ani
п
=2'
3=1
Доказательство. Проверяем утверждение для
определителя 2-го порядка. Пусть i = 2. Тогда Аи =
= — Яц, Л^ = ап и
& (а„) = апап — а^л =
(hi.
т. е. разложение справедливо.
Предположим, что утверждение справедливо для опре-
определителей (п—1)-го порядка. Проверим, что оно выпол-
выполняется и в случае определителей п-го порядка.
Разложим определитель я-го порядка по 1-й строке:
0ц
ап ап ... ain
ani ani ... апп
•¦• аы
¦ ¦ ¦ апп
91
«SI
#22
«и
«13
an
an
-Н-1Г1 ei»-
an aH ... at, n_x
Воспользуемся предположением индукции и разложим
каждый из определителей (п— 1)-го порядка по t-н стро-
строке (мы ее по-прежнему называем i-й, хотя в определи-
определителях (п—1)-го порядка она уже становится (/ — 1)-й):
(~ II'
ai+l> 3 й1+1> 4 •
- I/"
«23
ai-U i ai-l< 3 • • • ai-l> я-1
92
1)
f-l+n-lr
3 • • ' a/-t) я-1
> 3 • • • a/+l> я-t
• • • an, я_1
au
• ai-Un
anl
anl
-ХЛ" -ai-U n
i+l>i ¦ ¦ • fli+l> n
ni ...с„„
+ (-1)
,1-1+3
i-Lf ••<*!-!, п
+-¦ +
...ая
+ (-!)'-
(- 1)M+1 at
«-Ь 3 •
• ап> п-\
1)'
,t-l+2
al-U I Oj-li 3 •
°/+l, 1 a(+l, 3 •
n-l
Если мы теперь раскроем скобки и соберем слагаемые
при всех atj (j=\, 2,..., п), то обнаружим, что сомно-
сомножителем atj является разложенное по первой строке
алгебраическое дополнение Atj, т. е.
7=1
Покажем, например, что определитель 3-го порядка
можно разложить по любой строке. Это видно и из
только что доказанного свойства, но мы убедимся в этом
непосредственно.
Пусть, например, < = 3.
\А\==
«и «12 «13
«21 «22 «23
Й31 #32 «33
=ап
«32
«23
«33
— «12
(hi
«31
Ска
«зз
«21 «22
«31 «за
• «зз —
— «зз • «3i)+ «13 («21 • «за — «га • «зО = «3i («ia • «аз — «а • «22) —
— «32 («И • «аЗ—«13 • «2l) + «33 («11 • «2-2—«14 ' «аО^^З! '
«И «13
+ Й331
«11 «1a
«21 «22
т. е. определитель разложен по третьей строке.
Прежде чем сформулировать следующее свойство
определителей, докажем лемму.
Лемма. Если поменять местами любые две соседние
строки определителя, то/ его абсолютная величина оста-
останется неизменной, а знак изменится на противоположный.
Доказательство. Воспользуемся свойством 4 и
разложим определитель n-го порядка по i-й строке:
\А\ =
«11
«1л
ап
р 2- ¦ • «(+1) я
... а„
Теперь поменяем местами t-ю строку с (/ —{— 1)-й и р
ложим преобразованный определитель по той же строке,
но стоящей уже на месте (t-f-l)-u строки:
\А*\ =
ап ап
ап
ain
Отсюда видно, что второй определитель равен первому,
умноженному на (— 1).
С помощью леммы можно доказать
Свойство 5. При перестановке любых двух строк
определителя его абсолютная величина остается неизмен-
неизменной, а знак меняется на противоположный.
Доказательство. Пусть в определителе \А\ /г-го
порядка мы меняем местами t-ю и ;-ю строки
(пусть />/):
ап ап ... а1п
\А\ =
f
А
Мы хотим доказать, что в этом случае знак определителя
изменится на противоположный, а абсолютная величина
останется неизменной.
Для того чтобы поменять местами t-ю и /-ю строки,
поступим следующим образом.
Сначала поменяем местами t-ю и (г-)-1)-ю строки. По
утверждению леммы от этого определитель лишь поме-
поменяет знак на противоположный. Далее ?-ю строку, кото-
которая теперь уже стоит на месте (t-j-l)-u, меняем местами
с (i -f- 2)-й строкой. Так как /-я строка уже оказалась
соседней с (t-j-2)-fl, то от этой перемены опять-таки
лишь изменится знак определителя. Затем меняем местами
t-ю строку с («" —{- 3)-й и т. д. до тех Пор, пока t-я стро-
96
ка не встанет на место /-й. Очевидно, что абсолютная
величина определителя при этом не изменилась, так как
мы каждый раз меняли местами соседние строки, а знак
определителя изменялся (/' — i) раз.
Теперь точно так же последовательно передвинем /-ю
строку на место <-й. Но для этого нам придется сделать
на один шаг меньше, потому что, когда мы последний
раз передвигали t-ю строку на место /-й, мы /-ю сдви-
сдвинули на место (/'—1)-й. Теперь /-ю строку мы постепен-
постепенно, каждый раз меняя местами с соседней строкой, пере-
перетаскиваем на место t-й строки. Опять-таки абсолютная
величина определителя не меняется, а знак каждый раз
меняется на противоположный. За время перехода /-й
строки на место i-й определитель сменит знак еще
(/ — i—1) раз (на один раз меньше, чем при переходе
i-я строки на место /-й). Итак, мы получили в резуль-
результате определитель, отличающийся от исходного тем, что
i-я строка поменялась местами с /-й, с той же абсолютной
величиной, что и у исходного определителя, но знак ме-
менялся (/ —») -}-(/ — i—1) = 2(/ — i) — 1 раз, т. е. знак
меняется нечетное число раз. Следовательно, знак опре-
определителя сменился на противоположный.
Свойство 6. Определитель, содержащий хотя бы
две одинаковые строки, равен нулю.
Доказательство. Действительно, пусть данный
определитель равен некоторому числу Д. Если мы поме-
поменяем местами две одинаковые строки, то согласно свой-
свойству 5 знак определителя изменится на противоположный,
т. е. получим (— Д). Но мы меняли местами одинаковые
строки, так что фактически значение определителя не ме-
менялось, т. е. оставалось равным Д. Итак, мы получили,
что Д = — Д. Это возможно лишь в случае, когда Д = C.
Свойство 7. Если все элементы i-й строки опреде-
определителя п-го порядка разлагаются в сумму a^-j-fr;,-, то
данный определитель можно представить в виде суммы
определителей:
\А\ =
ап ап
an-\-bn aH-\-bH ... aln-\-
in
anl ani ... ann
4 А. Б, Бакушииский 97
«11
а«ч.
«12
а,
... aln
••• ain
••¦ana
&и bn
axa.
... a,.
... ann
Доказательство. Воспользовавшись свойством 4,
разлагаем |Л | по t-й строке:
\А\ =
ап
...a.
=2 (%
1
... а„„
n n
Из того же свойства 4 вытекает, что суммы, полученные
в правой части, как раз дают нужные нам определители.
Замечание. Очевидно, это свойство имеет место и
в том случае, когда элементы строки разлагаются на
сумму S элементов. Тогда и сам определитель равен
сумме S соответствующих определителей.
Свойство 8. Значение определителя не изменится,
если к элементам i-й строки прибавить элементы \-й
строки.
Доказательство. Пусть t-я строка нового опре-
определителя представляет собой сумму i*u и ;-й строк. Тогда
по свойству 7 можно разложить этот определитель в
сумму двух определителей:
ап
ап-f i
fl/i
ani
*fl an + UJ
ап
ч • • • a-in -j- C/n
... ajn
... а„„
98
ССц (til
a», a*
... aln
••• Clin
•¦¦ a/n
... ппп
aH
fl/i
a»i
an .
ay, .
afl.
• «in
-ay.
•a/n
• ann
Но второй определитель равен нулю, так как он имеет
две одинаковые строки (свойство 6). Таким образом, от
прибавления к с'-й строке соответствующих элементов
/-й строки определитель не изменился.
Свойство 9. Если все элементы i-й строки опреде-
определителя умножить на число k, то и сам определитель
умножится на это число k.
Доказательство. Умножим в определителе | А \
все элементы <-й строки на число k и разложим получен-
полученный определитель по с'-й строке (свойство 4).
an an
aM a23
ka
H'
... Ckn
... kain
=2 kaaА и=k 2 аиА и
1 1
И если исходный определитель \А\ равнялся Д = 2 а»7 ^<7>т0
3=1
определитель \А*\ равен й-А.
Свойство 10. Если к i-й строке определителя при-
прибавить j-ю, умноженную на число k, то значение опреде-
определителя не изменится.
99
Доказательство. Действительно, по свойству 7
ап ап ... а1п
пХ
ani
ап ап...аы
ап йц...а1п
ап ал... ajn
anl ani... ann
ann
ait flia ... ain
kaji kan...kajn
&fl &ji • • • &jn
anl ani ...ann
Первое слагаемое равно исходному определителю, а вто-
второе равно нулю, так как после вынесения числа k за
знак определителя (по свойству 9) мы получим определи-
определитель с двумя одинаковыми строками.
Свойство 11. Если i-я строка определителя равна
сумме остальных его строк, взятых с некоторыми коэф- \
фициентами, то определитель равен нулю.
Сумму понимают в том смысле, что каждый элемент
г-й- строки равен сумме элементов того же столбца других
строк, взятых с данными коэффициентами. Обычно в этом
случае говорят, что i-я строка есть линейная комбинация.
остальных строк.
Доказательство. Разложим полученный определи-
определитель на сумму определителей (свойство 7), каждый из ко-
которых будет иметь г-ю строку, совпадающую с какой-либо
другой, умноженной на некоторый коэффициент. Тогда
по свойствам 9 и б каждый из этих определителей, а зна:
чит, и их сумма равны нулю.
Свойство 12. Сумма произведений элементов г'-й
строки на соответствующие алгебраические дополнения эле-
элементов j-й строки (/ Ф i) равна нулю.
Доказательство. Алгебраические дополнения эле-
элементов любой строки не зависят от элементов этой строки.
100
Возьмем в качестве ;-й строки опредегеля элементы i-й
строки. Тогда, с одной стороны, по аству 6 этот опре-
определитель равен нулю, а, с другой ооны, по свойству
4 его можно разложить по элементами строки.
/-я строка
ап
•а1п
ап ац...а1п
пц а^... ain
ап\ ига-'-апп
Свойство 13. Определитель п порядка можно
представить в виде алгебраической сыы элементов 1-го
столбца определителя, умноженных соответствующие
алгебраические дополнения:
ап ап...а,
fljj GjJ . . . fl;
,...а„
Доказательство. Рассмотрим «чала определитель
2-го порядка:
ацап
Так как Ап — а.п, Аи=—ап, тсформулйрованное
утверждение справедливо. Предполо:м, что оно верно
и для любого определителя (п—1)-гаорядка. Докажем
его справедливость для определителя-го порядка.
По определению определитель п- порядка разлага-
разлагается в сумму:
Й9! <h3 • • - atn
аи
ап
«и-
ап-
а„г-
..ain
-•О-пп
=«„
П
..atn
(tit- •!. п—1
ап1
- п,п—\
10)
В полученной сумме первое слагаемое оставим без изме-
изменения, а остальные разложим по 1-му столбцу (это мож-
можно сделать на основании предположения индукции). Каж-
Каждый из этих определителей будет представлен алгебраи-
алгебраической суммой элементов ап (i = 2, 3, ..., п), .умножен-
.умноженных, на соответствующие миноры (п — 2)-го порядка.
Далее поступим точно так же, как при доказательстве
свойства 4 о разложении определителя по строке, т. е.
сгруппируем слагаемые при коэффициентах ац (i = 2, 3,...
..., п). Получим разложенные по элементам первых строк
алгебраические дополнения An(i = 2, 3, ..., п) и, сле-
следовательно,
Следствие 1. При транспонировании* матрицы
ее определитель не меняется.
Доказательство. Для определителей 2-го поряд-.
ка это свойство очевидно:
ап
— аи а.23 —
a it
Предположим, что оно имеет место и в случае определи-
определителей (п—1)-го порядка. Докажем его справедливость
для определителей п-го порядка.
Пусть
ап ап...а1п
и \АГ\ =
[А\ =
aniani...ann
ап an...ani
аы ап...ап1
Ы • • • 0-п
Разложим определитель |.4| по 1-й строке, а |Л'| по 1-му
столбцу. 1-я строка определителя \А\ совпадает с 1-м столб-
столбцом |Л'|, а алгебраические дополнения элементов 1-го столб-
столбца определителя \А'\ есть просто транспонированные ал-
алгебраические дополнения элементов 1-й строки определи-
определителя \А\, которые, следовательно, равны по предположе-
предположению индукции, так как являются определителями (п— 1)-го
порядка. Таким образом, разложение определителя |Л|
* Понятие транспонированной матрицы см. на стр. 83.
102
по 1-й строке совпадает с разложением определителя \А'\
по 1-му столбцу, т. е. |Л| = |Л'|.
Следствие 2. Все доказанные ранее свойства, каса-
касающиеся строк определителей, справедливы и в отношении
столбцов. .
Покажем на примере, как свойства определителей мож-
можно использовать при их вычислении.
Примеры: 1) Вычислить определитель
1 2 3 ... i
-1 О
I 2
3 ...п
О 4 ... п
— 1 _2 —3 ...О
Складываем каждую строку с 1-й. От этого значение опреде-
определителя не меняется (свойство 7).
1 23...и
026. ..2п
003. ..In
= 1.2-3.
--п\
(по свойству 2)
0 0 ... п
2) Вычислить определитель
1 а,
...а„
\ а, а, ... а„ -+-1
Определитель не изменится, если мы из каждой строки вычтем
1-ю (свойство 10).
Д =
1 at аг ... ап
00 Ь3...О
00 0 ...Ь„
(по свойству 2)
Упражнения
Вычислить определители:
1)
5
1
0
0
0
6
5
1
0
0
0
6
5
1
0
0
0
6
5
1
0
0
0
6.
5
2)
— 1 0
л; —1
О х
... —1
х
103
§ б. ТЕОРЕМА КРАМЕРА
Рассмотрим теперь произвольную квадратную
матрицу п-го порядка:
Определение. Матрица А называется вырожденной,
если |Л|=0.
Дадим без доказательства следующую теорему.
Теорема. Определитель произведения нескольких ма-
матриц равен произведению определителей этих матриц.
Из этой теоремы непосредственно вытекает, что если
одна из матриц сомножителей вырожденная, то и матрица-
произведение тоже вырожденная. Легко отсюда показать,
что вырожденная матрица не имеет обратной.
Действительно, если бы вырожденная матрица А имела
обратную матрицу Л, то по определению обратной ма-
матрицы
И так как А — вырожденная матрица, то и Е должна
быть вырожденной, а мы знаем, что |i?| = l. Получили
противоречие. Следовательно, матрицы А'1 не существует.
Теорема. Если матрица А невырожденная, то су-
существует единственная обратная матрица
E)
Аи
Д
Ait
Д
Ат
Д
Аи
Д
Агг
Д
Аап
Д
... д
Ann
•¦• А
Ann
¦-¦¦ д /
гдг ^гу — алгебраическое дополнение элемента а,7 матрицы
А, а Д — определитель матрицы А.
104
Доказательство. Чтобы убедиться в справедли-
справедливости утверждения, достаточно умножить матрицу А, на-
например, справа на матрицу E):
/ап ап... а,п\
.,.an
А
¦2
д
Д
д
Ап1
• Д
\
Д
п о ...(Л
О 1 0...0 \ = Е.
V0...0 L
I
Получили матрицу, в которой все недиагональные эле-
элементы будут равны нулю, ибо они представляют собой
суммы произведений элементов одной строки на алгебра-
алгебраические дополнения элементов другой строки (свойство 12
из § 4), все же диагональные элементы будут равны еди-
единице, так как они получаются как суммы вида
^ = 4=1 (*•=!, 2,...п).
Таким образом, матрица E) есть А '.
Тот же результат мы получим, если умножим матрицу
E) слева на матрицу А, т. е. матрица E) является одно-
одновременно и обратной правой матрицей А1 и обратной
левой А'1 для невырожденной матрицы А. Итак, обрат-
обратная матрица для невырожденной матрицы существует.
Докажем, что она единственная, т. е. любая правая
или левая обратная матрица к А обязательно совпадает
с E).
Пусть С — некоторая, отличная от А ', правая обрат-
обратная матрица к матрице Л, т. е. АС — Е. Умножим это
равенство слева на А'1 = А~1 и воспользуемся ассоциатив-
ассоциативным свойством умножения матриц: Л (АС) = А 1Е = А'1
и одновременно (А~1А)С — С. Следовательно, C = A~i.
Аналогично можно доказать, что если
СА = Ё, то
ft-^ 1-1—~ Л-1 .
Итак, мы доказали и единственность обратной мат-
матрицы. ,
105
Пример. Пусть
/3 1 2\
А= О 1 3 .Тогда Д =
1 2
1 О
\21 о;
3 1 2
О 1 3
2 1 О
= - 7, Аи = (—
\3+1
1 2
О 3
2 О
= 6, Л22 = (-
. g ^| _. / ]
Таким образом,
3 1
О 1
01
2 1
3 2
2 О
= 3.
/
7
7
7
7
J_
7
1 3
-2. >!..=/¦— П«+«.
3 1
2 1
= -3,
13 2
О 3
7
Упражнения
Найти матрицу, обратную к данной матрице:
1) /2 1 0\ 2) /3 2 3
122 Ю12
\3 1 2/ 3 2 4 1
\0 1 0 \t
Рассмотрим теперь систему п линейных алгебраиче-
алгебраических уравнений с п неизвестными:
a,A
+ ап Xi -f... -f ain xn = bu
Xi -j-... + ain xn — b%,
F)
... -f ann xn = bn,
или в матричной фр
Предположим, что определитесь матрицы А отличен
от нуля, т. е.
ап ап ... а1п
Тогда имеет место следующая теорема.
106
Теорема Крамера. Решение системы F) линейных
алгебраических уравнений выражается следующими фор-
формулами:
д, д,
д » *a — X'
Xj:
дп
¦ > xn = X
где Д/ — определитель системы F), в котором j-й столбец
заменен столбцом свободных членов:
д/-=
/-й столбец
. bi ... ац,
¦ bi ... Ofo
а<л
• ¦•ft»
и решение это единственно.
Доказательство. Умножим левую и правую части
системы уравнений, АХ = В слева на матрицу А'1 (она
существует, так как Д^О):
Но А 1А = Е. Следовательно, используя ассоциатиВ'
ное свойство умножения матриц, получим:
Х\ \
Xj
\"/
Х — А 1В, или
IAn Asl Anl \
X" Т "' ~Т
л л л
д д •" д
dii дм ... jV,
Д Д Д
А ^ А • • •
д д .
G)
Полученное X и является решением системы F). Для
того чтобы убедиться в этом, достаточно подставить его
в систему F): А • А'1В = В, т. е. система удовлетворена.
107
• Из G) непосредственно вытекает, что
^*/ (у = 1, 2, .... п).
(8)
Итак, если Д ф О, то решение системы F) существует
единственно и выражается формулами (8).
Пример. Решить систему
=0,
ЗДесь Д-
CSS
2
1
— 1
1
0
0
2
1
— 1
3
0
1
2
— 1
2
=—1
3
0
1
Д3 =
=,-1, Д1 =
_ Д,
Отсюда Xi=-^-=
1. 2 3
0—10
0 2 1
2 1
— 1 О
2 О
3L __ 1
А.
Упражнения
Выписать матрицу системы алгебраических уравнений, найти
А, решить систему:
Л"з ==: 1 •
§ 6. РАНГ МАТРИЦЫ
ТЕОРЕМА КРОНЕКЕРА-КАПЕШ1И
В этом параграфе мы дадим ряд полезных-допол-
полезных-дополнительных сведений о векторах, матрицах и системах
линейных алгебраических уравнений.
Пусть имеется т n-мерных векторов. Обозначим их,
например, так: *1 = (хи, хп хы), х3 — (хп, х&, ...,
108
xm = (xmU xm> .... xmn). Здесь первый индекс
у компоненты вектора указывает на номер вектора, а вто-
второй на номер компоненты этого вектора. Говорят, что
система векторов Хи xit ..., хт линейно зависима, если
существуют такие коэффициенты аи <х.г, ..., ат, не все
одновременно равные нулю, что выполняется равенство
= 0, ^ (9)
которое в соответствии с общим определением сложения
матриц надо понимать как следующую систему равенств:
+ «3*
33
(tt равенств по т слагаемых).
Если же равенство (9) выполняется только при всех
п,- = 0 (/=1, 2, ..., т), то система векторов называется
линейно независимой.
Предположим, что не равен нулю t-й коэффициент a,-.
Тогда из равенства (9) имеем:
т. е. если векторы линейно зависимы, то хотя бы один из
них является линейной комбинацией других векторов
(см. стр. 100). Верно и обратное: если хотя бы один из
векторов системы векторов есть линейная комбинация
остальных, то эта система векторов линейно зависима.
Действительно, пусть Х{ = <з.хХ\А-а8х8-\- ... -j-а,-_Л_1 -f~
-f- <*»+Л+1 -f~ • • • -f" я-т^т- Тогда ajjfi -j- a3jc3 -j-...' -j- <*;_i-?«_i —
— 1 • Xt -j- a,-+1xi+i -f-... -f- a.mxm = 0, т. е. получили равен-
равенство типа (9). Значит, система векторов линейно зави-
зависима .
/ап ап ... ain\
В матрице Л=| "" 22 '" *" I каждую строку можно
"лЗ • • ¦ ипп!
рассматривать как n-мерный вектор.
109
Определение. Рангом матрицы А называется макси-
максимальное число линейно независимых строк этой матрицы.
Определение. Минором к-го порядка матрицы А
называется определитель, составленный из fea элементов
матрицы, лежащих на пересечении некоторых ее k строк
и k столбцов.
Порядок элементов при записи строк и столбцов опре-
определителя -сохраняется тот же, что и в матрице.
Пример. Выпишем миноры 2-го порядка матрицы
/1 О ЗХ
О 2 1 .
V 4 3/
1) На пересечении- 1-й и 2-й строк с 1-м и 2-м столбцами
1 О
О 2 '
2) На пересечении 2-й и 3-й строк с 1-м и 3-м столбцами
О 1
3) На пересечении 1-й и
1 3
3-й строк с 1-м и 2-м столбцами
1 &
1 4
Теорема о ранге матрицы (без доказательства).
Ранг матрицы А равен наивысшему порядку отличных от
нуля миноров этой матрицы.
Для того чтобы вычислить ранг матрицы, вычисляют
сначала миноры меньших порядков. Если нашли минор
i-ro порядка, отличный от нуля, то вычисляют миноры
(i —|— 1)-го порядка, окаймляющие этот минор. Если все
миноры (i-j-l)-ro порядка уже равны нулю, то ранг
матрицы равен i.
Пример. Л =
1
1
1
2
0
1
0
1
1
0
1
1
0
0
1
1
Берем сначала мииор 2-го по-
порядка, стоящий в верхнем левом углу
отличен от нуля, то берем окаймляющий его минор 3-го порядка:
О
= 1^0. Так как он
1
1
1
0
1
0
1
0
1
= 0.
по
1
1
1
0
1
0
0
0
1
Этот минор 3-го порядка равен нулю, поэтому берем следующий
на пересечении 1-го, 2-го и 4-го столбцов и 1-й, 2-й и 3-й строк:
= 1.
Мы нашли отличный от нуля минор 3-го порядка. Поэтому вычис-
вычисляем минор 4-го порядка. Он уже совпадает с определителем мат-
матрицы:
10 10
110 0
10 11
2 111
= 1 .
1
0
1
0
1
1
0
1
1
+1-
1
1
2
1
0
1
0
1
1
= 0.
Итак, минор 4-го порядка равен 0, т. е. наивысший порядок
отличных от нуля миноров третий. Следовательно, ранг матрицы
равен трем.
Применим теперь это понятие к исследованию систем п
алгебраических уравнений с п неизвестными в том слу-
случае, когда определитель Д матрицы А, составленной из
коэффициентов при неизвестных, равен нулю:
. + alnxn =
. + аыхп —
A0)
= bn
ИЛИ
АХ^В.
Наряду с матрицей А рассмотрим еще одну матрицу:
которую называют расширенной матрицей системы A0).
Мы уже говорили ранее, что система называется сов-
совместной, если она имеет хотя бы одно решение. Возни-
Возникает вопрос, какие условия (при Д = 0) нужно наложить
на коэффициенты системы A0), чтобы она была совмесг-
ной. На этот вопрос отвечает следующая теорема.
Ш
Теорема Кронекера — Капелли (без доказа-
доказательства). Система A0) совместна тогда и только тогда,
когда ранг матрицы А равен рангу расширенной мат-
матрицы /4,.
Значит, для того чтобы выяснить» имеет ли система A0)
хотя бы одно решение, достаточно вычислить ранги мат-
матриц А и Av Если они равны, то решение существует,
если не равны, то не существует. Из теоремы Кронекера—
Капелли, в частности, следует, что если для данной
системы уравнений Д = 0 и хотя бы один из определи-
определителей Д,- Ф 0 (см. стр. 107), то система будет несовместна,
так как в этом случае ранг расширенной матрицы больше,
чем ранг матрицы А.
Особенно'наглядно можно проиллюстрировать примене-
применение этой теоремы в случае системы двух линейных алге-
алгебраических уравнений с двумя неизвестными:
anxi -f апхъ =
(И)
Если определитель Д системы A1) не равен нулю, то
решение и притом единственное можно получить, восполь-
воспользовавшись теоремой Крамера:
м —
ч
*2
Oil
о81
«is
о22
< v — Л' —
«1Г
Osi
Oil
*s
«is
O2j
Пусть теперь в системе A1) a.n = kan, an — kan и
хотя бы один из элементов aiit a^ не равен нулю (напри-
(например, апФ0)
Тогда Д =
= 0, и теорему Кра-
мера применять нельзя.
Возможны два случая:
а) Ьц — kb^'B этом случае ранг матрицы А равен еди-
единице и ранг матрицы Ах тоже равен единице, так как
все миноры второго порядка равны нулю. Следователь-
Следовательно, по теореме Кронекера—Капелли система A1) со-
совместна.
112
В данном простом случае в сущегвовании решения
можно убедиться и непосредственно, 63 теоремы Кроне-
кера—Капелли. Действительно, систем A1) приняла вид:
| aii*i+ anXi— b,
\kanXi -\- kaiiXq, = kb
Какое бы ха мы ни взяли, напримо jc2 =
чим из 1-го уравнения системы:
мы полу-
полух _.
1
«11
Легко проверить, что xv= ' g"'8 хг = 1 есть реше-
решение системы, а так как / мы взяли прозвольное, то реше-
решений бесконечное множество. Таким обрзом, мы не только
установили факт существования решени, но и знаем их вид.
б) 62 Ф kbu В этом случае по-прежему ранг матрицы
А равен единице, но зато ранг матрцы Ai равен здесь
двум. В самом деле, вычислим, напрмер, определитель
bi
ап
kan
Ь,
= k
= kan [Ц—
к
И так как по предположению пц Ф 0 к63 Ф kbu то Д2 ^0.
Следовательно, по теореме Кронекера—.апелли система A1)
оказалась несовместной.
Опять-таки, как и в случае а) в несовместности
системы можно убедиться и без примеения этой теоремы.
В самом деле, предположим, что каки-либо числа Xi = li
и *j = /4 удовлетворяют 1-му уравненю системы: аи^-)-
-\-аК1ч = Ьи
Если мы теперь подставим эти жечисла во 2-е урав-
уравнение, то получим: k(auli-\-ank) = i>i ф bit т. е. урав-
уравнение не удовлетворилось. Очевидно и любое решение
2-го уравнения не будет удовлетвоять 1-му. Таким
образом, система несовместна. ¦
Примеры. Исследоаать системы лнгйных алгебраических
уравнений:
1) ( а-, -\-хъ = \,
\ xt-i-x, =0,
из
1 ° l\ 1
Ранг матрицы I 1 1 0 равен двум. Действительно,
\2 1 1/ 1
Ранг расширенной матрицы А тоже равен двум, так как
1
1
2
0
1
1
1
0
1
1
1
2
0
1
1
1
0
1
= 0
0
1
1
1
0
1
1
0
1
= 0.
Следовательно, ранги матриц А и At совпадают, т. е. система
имеет решение.
Решением, например, будет набор чисел xl = k, л:, = — А,
ха — 1 — k при произвольном числе к, т. е. решений существует
бесчисленное множество.
•2)
Их,
I xt
—
1
2
1
At= 2
\1
— 1
Вычисляем ранг матрицы А: минор 2-го порядка
1 2 —1
1
1 2
2 0.
2
2 0
= -4^:0;
1
2
1
не
2
0
— 2
равен
1
2
0
рангу
минор 3-го порядка 2 О 1 =0.
1 —2 2
Итак, ранг матрицы Л равен двум.
Вычисляем ранг матрицы At: минор 3-го порядка
= 4^0.
Таким образом, ранг расширенной матрицы At
матрицы А. Следовательно, система несовместна.
Упражнения
Установить, существует ли решение системы уравнений:
\\ , х х х = 1 2)
3)
— Xi + л-2 — 2ха — х* = 3,
2x1—xt—
114
§ 7. МЕТОД ИСКЛЮЧЕНИЯ ДЛЯ РЕШЕНИЯ
СИСТЕМ ЛИНЕЙНЫХ АЛГЕБРАИЧЕСКИХ
УРАВНЕНИЙ (МЕТОД ГАУССА)
А. Простейшая схема
Рассмотрим систему двух линейных уравнений
с двумя неизвестными:
Предположим, что Д Ф 0. .
Будем решать эту систему следующим образом: прежде
всего разделим 1-е уравнение на коэффициент при неиз-
неизвестном *i (считаем его отличным от нуля, иначе неиз-
неизвестные можно перенумеровать), оставляя 2-е уравнение
пока без изменений:
.u"-V A2)
Затем умножим 1-е уравнение системы на коэффициент ац
и вычтем это уравнение из 2-го уравнения системы A2).
Получим систему вида:
О i [„ вн-ац\х __ ft bj ¦ g21
Второе уравнение системы A3) содержит уже только
одно неизвестное — хг. Поэтому из него легко полу-
получается х%:
X __
Подставив полученное значение х2 в 1-е уравнение, по-
получим:
X _ &1°32 — bjOn
°11 ' flSS °12 - а21
Описанный выше метод решения носит название метода
исключения или метода Гаусса. Его легко распространить
115
на случай решения систем п линейных алгебраических
уравнений с п неизвестными (Д Ф 0):
¦¦¦¦ + а1пхп = Ьи
niXi + aniXi -(-... + annxn = bn.
Идея метода заключается в том, чтобы, оставляя 1-е
уравнение системы A4) неизменным, так преобразовать
остальные уравнения, чтобы они ,уже не содержали неиз-
неизвестного jfj. Затем, не изменяя 1-го и уже получившегося
2-го уравнения, исключаем из остальных уравнений 2-е
неизвестное, затем 3-е и т. д., до тех пор, пока получим,
что n-е уравнение содержит лишь одно неизвестное. Тогда
разрешаем это уравнение относительно хп. Подставляем
найденное хп в предыдущее уравнение, содержащее два
неизвестных — хп и *„_,. Находим из него лс„_1 и переходим
к предшествующему уравнению, из которого теперь можем
найти х„_3 и т. д. Наконец, из 1-го уравнения найдем хи
так как к этому моменту все остальные неизвестные уже
найдены. Более подробно ход вычислений следующий.
Предположим, что решение системы A4) существует
(т. е. Д Ф 0) и апф-0.A=1, 2, ..., п). Делим 1-е урав-
уравнение на пц, остальные оставляем пока без изменения:
• • • + аыхп = bit
'
п\Х\ + апгхг -\- апЪх3 +... + аппхп — Ьп.
Перепишем систему A5) следующим образом: 1-е урав-
уравнение новой системы то же самое, что и в A5), 2-е урав-
уравнение получим вычитанием из 2-го уравнения системы A5)
1-го уравнения системы A5), умноженного на ап, таким
образом, 2-е уравнение уже не будет содержать неиз-
неизвестного Xi. Точно так же из 3-го уравнения системы A5)
вычтем 1-е уравнение, умноженное уже на a3i. Значит, и
3-е уравнение новой системы не будет содержать xt и т. д.
Для того чтобы последнее уравнение не содержало Х\,
надо вычесть из n-го уравнения системы A5) 1-е уравне-'
ние, умноженное на ап1:
116
Итак, мы получим систему:
0ц
«и '
п
Oil
а*,"—
-т-
Теперь, не трогая больше 1-е уравше, с остальными
(п — 1)-м уравнениями поступаем точнсак же, т. е. 2-е
уравнение делим на коэффициент при хг затем оставляем
его без изменений. Из 3-го уравнен вычитаем 2-е,
умноженное на [а^—°81'а"). Тогда -3-м уравнении
исключится х^. Из 4-го уравнения опягаки вычтем 2-е,
умноженное уже на (аы— .a*i'a"\ т. э 4-м уравнении
не будет неизвестного хг и т. д. Из /г-гуравнения вычи-
вычитаем 2-е, умноженное на(ая2— а"''а'8 )Геперь все урав-
- \ ач I
нения, кроме 1-го и 2-го, не содерж х^ и х%. Затем
3-е уравнение полученной системы дел на коэффициент
при х3 и в остальных уравнениях исючаем хъ и т. д.
Наконец, мы получим систему следщего вида:
1 + a'nXi + а'пх3 + • • • + а'\пг= Ь'и
\
A6)
117
Можно доказать, что система A6) эквивалентна систе-
системе A4). Из последнего уравнения мы знаем хп. Подставив
его в предпоследнее уравнение, найдем jcra_1 и т. д. Из
1-го уравнения найдем Xi. Таким образом система будет
решена.
Такой метод решения систем алгебраических уравне-
уравнений применяется значительно чаще, чем метод Крамера,
так как в методе исключения операций умножения и
деления много меньше, чем в методе Крамера.
Пример. Решить методом исключения систему уравнений:
— Xi — 3ats — лг8 + х4 = —8,
Будем постепенно преобразовывать систему
х8 + лг4 = 6,
t — 3xt = — 9,
+ 2 2
\-2xs — <
4 = —2,
.= 5.
,,. — u> Xt —
— 3-2 = 3,
Отсюда *4 = 2, *„= — — -
^ = 6 —2 + 2-0 —3 = 1. '"
Если у нас есть несколько систем, отличающихся друг
от друга только правыми частями, то нам вовсе не нужно
применять метод' исключения к каждой из них отдельно.
Действительно, все преобразования, которые мы проводили
над левыми частями системы уравнений A4), совершенно
не зависели от значений правых частей системы. Поэтому
левые части всех систем будут преобразовываться одина-
одинаково, поскольку они одинаковые, а правые части для
всех систем можно считать параллельно. Подробнее раз-,
берем это на следующем примере.,
Решить две системы линейных уравнений:
2Xl хг л:8 = 4; 1,
xt +4ха — 2л:8 = 11; о',
^—2*8+4*8 = 11; 0.
118
Здесь для одной системы столбец правых частей 111), а для дру-
/1\ VII/
гой @ .
\0/
Преобразования над системами есть фактически преобразова-
преобразования над коэффициентами при неизвестных и правыми частями.
Поэтому мы не будем выписывать систем, а напишем матрицу
коэффициентов й правые части и над ними будем совершать раз-
различные операции.
правые части
2
3
3
—1
4
—2
¦ —1
—2
4
4
11
И
1
0
0
Делим первую строку на 2 (т. е. 1-е уравнение делим на коэффи-
коэффициент при Xi), а затем вычитаем ее, умноженную на 3, из 2-й и
3-й строк
1
0
0
'
2
4
1
Т
1
2
1
2
4'
2
5
5
1
. 2
3
- 2
3
2
• 1
Теперь, оставляя без изменений 1-ю строку, делим 2-ю на 5-г-
п вычитаем ее, умноженную на
у), из 3-й
1
0
0
1
2
1
0
1
2
1
11
60
ТТ
2"
10
11
60
11
- 1
2
3
ТТ
18
11
Эта таблица дает две системы уравнений с одинаковыми левыми
частями и с двумя различными правыми:
1
1
¦— 11
60
11
Xs
Xs
Ха
= 2;
10
11»
60.
— 11'
1
2
3
11»
18
11*
Для 1-го столбца правых частей решение будет: л:1=3) л:2 = 1,
Для 2-го столбца Xi — 0,2, хг——0,3, ха =— 0,3. ,-
119
Б. Схема с выбором главного элемента
Обычно, чтобы уменьшить вычислительную по-
погрешность, используют несколько видоизмененный метод
исключения, так называемый метод Гаусса с выбором
главного элемента.
Когда мы решали методом исключения систему урав-
уравнений, то мы 1-е уравнение делили на ап (всегда можно
предположить, что ап ^ь 0, в противном случае можно
перенумеровать неизвестные, ведь среди них обязательно
есть такое, при котором коэффициент отличен от нуля).
Затем мы избавлялись в остальных уравнениях от х^
и т. д.
В методе Гаусса выбирают сначала уравнение, в кото-
котором содержится наибольший по абсолютной величине коэф-
коэффициент системы (главный элемент), и делят уравнение
на этот коэффициент. После этого так же, как. и в обыч-
обычном методе исключения, исключают из остальных уравне-
уравнений то неизвестное, при котором был наибольший коэф-
коэффициент в выбранном уравнении. Далее, не трогая урав-
уравнение, где был главный элемент, ищут наибольший по
абсолютной величине коэффициент в остальных уравнениях,
(новый главный элемент), делят на него уравнение,
в котором он находится, и исключают из остальных
уравнений соответствующее неизвестное и т. д., пока не
останется одно уравнение с одним неизвестным. Остальное
все так же, как в методе исключения. Решаем одно урав-
уравнение с одним неизвестным, подставляем результат в урав-
уравнение, где другое неизвестное выражается через*только
что найденное. Затем эти два результата подставляем
в 3-е уравнение. Находим третий компонент решения
и т. д., пока не найдем все решение системы.
Преимущество этого метода по сравнению с обычным
методом исключения заключается в уменьшении погреш-
погрешности вычислений.
Пример. Решить систему:
2*! 4- 2х3 — лта — xt — 1,
2х1-\-4хг+хг — xt = \,
xxJrx\2x = 2 •
Чтобы упростить запись, все операции будем проводить над
расширенной матрицей системы. Мы каждый раз будем подчер-
120
кивать главный элемент, а правую часть отделяь вертикальной
чертой..
2
2
-1
1
2
4
—1
1
—1
1
1
—2
—1
—1
2
—1
1
1
2
1
Делим 2-ю строку на главный элемент и ставим е наверх:
1
т
2
—1
1
1
1
)
2
—1
1
1
4
—1
1
—2
1
4 -
—1
2
—1
1
4
1
2
1
Вычитаем 1-ю строку, умноженную на 2, из 2-й; умноженную на
(—1)из 3-й и вычитаем ее из 4-й. В результге будем иметь:
1
т
3
2
5
4
9
4
Л
т
1
- 2
7
4
3
4-
1
4
1
2
9
3
1
о
о
о
Делим 4-ю строку на ( —Т") и вычитаем ее, умножшуго на
из 2-й строки и, умноженную на -г-, из 3-й. Затем швим 4-ю строку
на место 2-й. Получаем:
/ 3 \
(—^-L
1
2
2
9
2
3
13
8
1
1
0
0
0
1
4
1
0
0
1
4
1
3
0
4
т .
1
4
__ 1
0
8
3
121
Дальше исключать ничего не нужно, так как 3-я строка уже дает
одно уравнение с одним неизвестным. Итак, пришли к системе
уравнений:
2_
13
2
1 1 _ 1
1 ~Г xt ~Г -J- хз ~?Х* — ";
_ 8
' """"
= 0.
Отсюда ^=0, лг4 = 2, л:3=—1, л:3=1.
Упражнения
1) Решить методом исключения систему уравнений:
Xi — xs — 2 у i .
4xt -f- 2x3 — x3 — 2xt = 0,
2) Решить методом Гаусса с выбором главного элемента систе-
систему уравнений:
! + лг, — л:, +.6л-4 = 18,
2xt — ха 4- 2х» — xt = — 5,
\j4+ \
§ 8. ИТЕРАЦИОННЫЕ МЕТОДЫ РЕШЕНИЯ СИСТЕМ
ЛИНЕЙНЫХ АЛГЕБРАИЧЕСКИХ УРАВНЕНИЙ
Мы уже изучили два метода решения систем
линейных алгебраических уравнений: в одном решение
находят с помощью определителей, по теореме Крамера,
в другом — методом исключений. Оба эти метода после
конечного числа арифметических операций давали точное
решение системы (разумеется, если не было никаких вы-
вычислительных погрешностей).
Теперь мы расскажем о других методах решения си-
систем, называемых итерационными. Эти методы могут дать
точное решение системы уравнений лишь после бесконеч-
бесконечного числа шагов, т. е. после бесконечного числа повто-
122
рений однотипных математических операций, и на каждом
этапе эти операции используют в качестве своих аргумен-
аргументов результаты предыдущих шагов. Естественно, мы не
можем продолжать вычисления бесконечно долго. Поэтому
мы вынуждены их оборвать на каком-то шаге вычислений.
Результаты этого шага берут как окончательные резуль-
результаты вычислений, т. е. принимают их за приближенное
решение системы уравнений. В этом случае, конечно,
нужно уметь оценивать разность между точным решением
и приближенным. Кроме того, может случиться, что для
данной системы уравнений итерационный процесс вообще
неприменим, потому что с каждым шагом мы не прибли-
приближаемся* к точному решению, а либо удаляемся от него,
либо процесс как-то колеблется (говорят, что процесс рас-
расходится). Поэтому, прежде чем применять этот процесс
к системе уравнений, необходимо исследовать, будет ли
он сходиться к точному решению в применении к данной
системе.
А. Простая итерация
Будем решать систему п линейных алгебраических
уравнений с п неизвестными (Д Ф 0):
A7)
апх1 -f- апх^ +... + alnxn = bu
OuXi -j- anXi +. • • + cknXn = h,
... + annxn — bn.
Предположим, что все ап Ф 0.
Перепишем эту систему, выделив в г-м уравнении неиз-
неизвестное Xi (t = 1, 2,..., п):
__ __ Ois у __ ^Шу 4- —
1 ou 2 "'" eu ""Гви'
A8)
Y
xn —
Од,я-1
¦——
ann
ann
ИЛИ
123
Здесь В — матрица коэффициентов при неизвестных
в правой части системы A8), р — столбец свободных чле-
членов, х — столбец неизвестных.
Метод простой итерации для решения системы A8)
заключается в следующем. Берем некоторый произвольный
набор чисел x'f, хТ,..., х'п в качестве нулевого прибли-
приближения к решению системы A8) и' подставляем в правую'
часть этой системы. Для простоты записи будем исполь-
использовать матринную запись системы:
Получили новый набор чисел: Ха> = (х[1', x'f',..., хЧ').
Этот новый набор снова подставляем в правую часть A8).
Получаем:
хB) снова подставляем в A8) и т. д. Продолжая дальше,
получим:
JC(*> = BJC*—« -f- p.
Описанный процесс называется простой итерацией
системы A8).
Оказывается, что при некоторых условиях будет вы-
выполнено соотношение lim*f) = *f (t=l, 2, ...п), где х\,
k-юо
х%,..., х% — точное решение системы A8) (а следователь-
следовательно, и A7)). В этом случае говорят, что простая итерация
для системы A8) сходится, понимая под этим, что процесс
простой итерации в пределе дает точное решение системы.
Дадим теперь достаточное условие ее сходимости.
Пусть коэффициенты системы A8) удовлетворяют сле-
следующим условиям: (
/=«
/-=1
у ал
п—1
124
Тогда простая итерация для этой системы будет сходиться,
т. е. имеет место следующая теорема.
Теорема (о достаточном условии сходимости простой
итерации). Для сходимости простой итерации для систе-
системы A8) при любом выборе чисел х[0', х%' х„' доста-
достаточно, чтобы
max
п
У
' П
или, что то же самое, для всех i:
A9)
Доказательство. Чтобы не усложнять доказатель-
доказательство громоздкими записями, мы проведем его на примере
двух уравнений с двумя неизвестными.
Итак, дана система:
1 + аи^ = Й! B0)
Перепишем ее в виде системы A8), т. е.
Введем обозначения:
«и '" «** га вц— " «м "
Тогда система B1) примет вид:
_l Q
B2)
По условию теоремы <х<4, следовательно, и
| <xj | <Ч. Берем теперь произвольное нулевое приближение
к решению х[0', х'^' и подставляем его в правую часть
системы B2). Получим первое приближение:
125
Если точное решение системы B0), а значит и системы B1),
есть х*, х\, то оно должно удовлетворять системе B2):
А =
Вычитая из 1-го равенства системы B4) 1-е уравнение
системы B3), получаем: х* — x[v = — at (x% — х?'). И так как
Ы<а, то
|*f — 4u|^al4 — 4- B5)
Точно так же, вычитая из 2-го равенства системы B4)
2-е уравнение системы B3), получаем:
B6)
Итак,
|xf-xl»KaT, |4-4"!^^. B7)
где T = max(|*J —Xj"|, I** —*i°'l)- Так мы оценили от-
отклонение точного решения от 1-го приближения. Дока-
Докажем теперь, что отклонение n-го приближения от точного
решения можно оценить по формулам:
„* ¦ „Ml ^- _ПТ I v* л/") 1 - пПТ /OQ\
Xi Aj | ^г Л 1 , I Aj Aj I ^щ O.'l . \bO)
Воспользуемся методом математической индукции. Как
следует из B7), для л= 1 оценка доказана. Предположим,
что она верна для n = k, и докажем ее для n = k-\-l.
По самому определению итерации имеем:
Х —аЛ -f-ft,
Из B4) и B9) получим:
Но по предположению индукции для n = k имеет
место оценка B8). Поэтому \х* — х[к +1]\ «sa | л;* — х{гк) \ ^
^a.akT = ak+lT И \xt - x[k+U\^a\xt-х[к) \^а ¦ а"Т^
Таким образом, оценка типа B8) справедлива и для
n = k-\-\. Следовательно, она справедлива для любого п.
126
Эта оценка позволяет нам утверждать, что процесс про-
простой итерации сходится к точному решению в том смысле,
который был указан выше. Действительно, Т — величина
постоянная, а<4, поэтому аТ-*0. Тем самым х{"]->х\,
П-»0О И-ИЭО
Л") . у*.
X<i —*¦ Хг-
п —* оо
Посмотрим, сколько нужно сделать итераций, чтобы
отклонение п-го приближения от точного решения не пре-
превышало заданного числа е. Очевидно, и должно для этого
удовлетворять неравенству -
*"T<s, C1)
или (логарифмируем по основанию а<4) п 5== log,, 4-.
Наименьшее целое число, удовлетворяющее этому нера-
неравенству, есть:
[f] l C2)
(квадратные скобки означают целую часть числа). Это и
есть достаточное для достижения требуемой точности число
итераций. Как мы видим, в правую часть C2) входит
число Т, для вычисления которого необходимо знание
точного решения системы B0), нам, вообще говоря, не-
неизвестного. Однако можно дать простую оценку вели-
величины Т.
Предположим сначала, что
I v* ~^>. I v* I
1*1 =3=1 Xt !• '
Из 1 -го равенства системы. B4) вытекает:
Это неравенство можно усилить, используя C3): ] х* |
<<x|xf| + |pi|. Отсюда
C4)
Из 2-го равенства системы B4) имеем: |||
Воспользовавшись неравенством C4), получаем:
1 Pi | | а |
127
Пусть теперь p = max {j p,], '|{Ц|}. Тогда
^ Таким образом, при | л:* | Ss | х\ | имеет место оценки
точного решения:
1*?1^т^»- 1^1<гЬ- C5)
Предположим теперь, что
М. C6)
чаем:
Из 2-го равенства системы B4) следует: | х% | sg а [ х\ j^
—I— I Pa! - Из" этого неравенства и неравенства C6) полу*|
|. т- е- 141 ^у~^^]^-Следов
вательно, |tf |«?/х|д + т^§Г1%
Итак, в случае | xf | <[ | х$ | тоже имеет место оценка C5):
Осталось оценить величину Т: - - 5
ma (I! j |, \
о
Но К - xT\ <! x\ | -f | *{»' | ^^5- +14»' | и i j? -
l. -т. e.
где i/= max{| atJ"'!, |^20)|)- Исследование полностью за-
закончено.
Итак, прежде чем решать систему B0) методом про*
стой итерации, необходимо проделать следующее. Сначала
приводим систему B0) к виду B1). Затем вычисляем коэф-
коэффициенты аь oj, рь р8. По ним находим значения аир.
Если а- оказалось меньше единицы, то процесс итерации
сойдется к точному решению. Оценку для этого точного
решения мы можем получить из формул C5). Затем выби-
выбираем какое-то начальное приближение, *}°!, х'?''. По фор-
формуле C7) находим Тис помощью формулы C2) опреде-
определяем количество итераций п, достаточное для получения
заданной точности решения. После этого можно непосред-
непосредственно приступить к выполнению итераций.
128
Следует заметить, что все оценки, которые нами по-
получены, как правило, сильно завышены. Но все-таки они
бывают весьма полезны.
Пример. Исследовать и решить методом простой итерации
систему
Зх,— лг, = 1,
2xi — Axs = 3.
Сначала приводим ее к виду
_ 1 ,1
i , <»
111 3
Здесь 04 =—,-g-f аз=у » &в"з~» Ps = — -j-• Следовзтель-
13
но, а=~, р = ~. Так как ое<1, то процесс будет сходиться.
Выбираем нулевое приближение: лг(,о'=О, лГз°'=0. Тогда по
_3_
формулам C7) находим: T^YZZ—h 0 = T==~!l'
Если мы хотим получить решение с точностью до 0,01, т. е.
\xf—jci"'| <0,01 и \xf—л4л) | <0,01, то должны выполнить п
итераций, где п определяется по формуле C2): л= log0E -гг| +
4-1=8. Значит, если сделать 8 итераций, то заданная точность
заведомо будет достигнута.
Приступим непосредственно к процессу итерации.
Мы взяли в качестве нулевого приближения: x'f = х1^' — 0.
Подставляем его в C8). Получаем 1-е приближение решения:
л:1!11 = 0,3333, л:'211= — 0,75. Теперь подставляем его в C8): xl?> =
= 0,0833, *</> = — 0,9167. Затем получим: х[*' = 0,0278, xg' — —0,7917,
л:;41 = 0,0694, х^'= — 0,7639 и т. д.
Уже после 4-й итерации отклонение от точного решения л:? =
= 0,0714, лг| = — 0,7857 довольно мало: | л:? — х[*> | < 0,002, | л:| —
— ^4||< 0,023. Продолжая итерацию, мы будем все ближе подхо-
подходить к точному решению системы.
Если какое-либо ait = 0, то систему B0) (A7)) невоз-
невозможно записать в виде B1) (A8)). Однако легко пока-
показать, что систему B0) (а также A7)) можно всегда запи-
записать в эквивалентном виде:
hi,
б А. В. Бакушинский 129
Процесс итераций применяют тогда к этой системе
следующим образом. Точно так же, как и раньше, берут
нулевое приближение, подставляют его в правую часть
системы и получают 1-е приближение:
lei A
и
Затем 1-е приближение подставляют в правую часть
системы — получают 2-е приближение и т. д. Описанный
процесс также называется простой итерацией.
Достаточное условие сходимости процесс'а к точному
решению есть выполнение следующих неравенств:
I<l, D1)
Коротко поясним этот факт.
Точное решение должно удовлетворять системе C9):
Из D2) и D0) вытекает: | х*у — х[1] | ^ | а„ 11 х\ — х[т \ +
+ |«н||*? —*i"|. Но |xf-xi"|<r и |4-«1"|<Г.-
Следовательно, | х% — x[v | ^ Т (| <х„ | +1 ац I)ч^ *Т, где a =
= max((|anl + l^l), (|<4,| + |«ta|)).
Аналогично | х% — х?>\ ^ Т (| а„ | +1 сц21) ^ аТ.
Методом математической индукции лег-ко показать, что
для /z-го приближения справедлива оценка
И так как Т — постоянная величина, <х<[1, то &пТ ->0,
т. е. xf>-*¦ х* (i = l, 2), и значит, процесс итерации схо-
сходится (приводит) к точному решению.
Б. Метод Зейделя
Рассмотренный нами метод простой итерации исполь-
использует для нахождения &-го приближения неизвестного де-
делишь (k—1)-е приближение всех неизвестных. Теперь
130
мы изучим другой итерационный метод решения систем
линейных алгебраических уравнений — метод Зейделя.
Здесь в отличие от простой итерации для нахождения
&-го приближения неизвестного х{ будет использовано
тоже k-e приближение неизвестных хи xit ... xt_i и
(k—1)-е приближение остальных неизвестных.
Итак, решаем систему линейных алгебраических урав-
уравнений вида:
Ах=Ъ.
Пусть каким-либо способом ее записали в виде:
D3)
*«=
Берем произвольный набор чисел х[т, х§\ ..., хТ и
проводим последовательные итерации по формулам Зей-
Зейделя:
/¦=1
131
Оказывается, что при некоторых условиях
A-.-OD
независимо от выбора чисел xf (i=l, 2, ..., п). Про-
Простым достаточным условием для этого является следующее:
a=max j]|«y|<l. D4)
Докажем это опять на примере системы двух уравнений
с двумя неизвестными, т. е. докажем, что метод итера-
итерации Зейделя будет сходиться для системы уравнений (т. е.
в пределе дает точное решение системы):
если выполнено условие:
я|)]=^а<1. D6)
Пусть xf, x* — точное решение, a jtf", х'^' — нулевое
приближение. Тогда
D7)
D8)
-I I) 1 „ „!UJ 1 Z.
Из D7) и D8) получаем:
„111 „ „@)
¦f |аи|.Т<^. . D9)
Для оценки | х\ — 4" | используем, кроме D7), D8) и D6),
еще и D9): |х?-411|^|?м|.|*?-*11 + ||ГЫ
132 '
X о-Т 4- I <*м I • Т < | ^,,1 • Г+1 «за ] • 71 ^ «7*. Докажем теперь,
что для и-го приближения справедлива оценка
| х* — л:<«» | ==s а" • Г,
Г E0)
Доказывать будем методом математической индукции.
Для n=t оценка уже проверена. Пусть она справедлива
для n — k. Докажем, что она верна и для л = ?4-1.
(k-{-l)-e приближение удовлетворяет системе уравне-
уравнений:
( v<*+ и „(*> г п v(*> J_ h
Из D7), E1) и предположения индукции заключаем:
что в свою очередь позволяет оценить \х\ — X
I «и I
Таким образом, оценка типа E0) справедлива и для
п = k -j- I, значит, она справедлива и для любого п.
Из этой оценки следует, что х[п) -> #i, x{"] -*¦ х\, так
И—VOO П—VOD
как Г — постоянная величина и а<4.
Следствие. Систему A7) можно решать методом
Зейделя, если выполнены условия A9).
Действительно, перепишем систему A7) в виде A8).
Это есть частный случай системы вида D3), где
I 0, » = /.
В силу доказанной теоремы для сходимости метода
п
итераций Зейделя достаточно, чтобы a = max2l°4/l <C !•
133
Но в нашем случае а = тах У y-f , и условие D4) экви-
эквивалентно условию A9).
Пример. Решим методом Зейделя ту же систему уравнений,
которую мы решали методом простой итерации:
( 3xt — xt = 1,
Опять приводим ее к виду D5):
=— + —
Условие A9) выполнено для системы. Следовательно, метод
итерации Зейделя должен сходиться. Величины о и Г те же, что
и для метода простой итерации.
Опять в качестве нулевого приближения возьмем л:'10) = 0,
л^0| = 0. Подставляя его в E2), найдем 1-е приближение^11 =0,3333
для неизвестного xv Это же 1-е приближение дг^11 используем для
нахождения 1-го приближения 2-го неизвестного л^11:
*i« =- -g-jci"—1- = — 0,9167.
Найдем следующие приближения решения:
= -0,7639;
х? = у х? + у = 0,0787,
л:;81=— -i-A-i81 —-|- = — 0,7894
и т. д.
С увеличением числа итераций приближенное решение будет
становиться все более близким к точному решению: х? =0,0714,
л-*= — 0,7857.
134
Упражнения
Исследовать сжодимость и решить методом простой итерации
и методом Зейделя системы уравнений (решение найти с точностью
001)
Г 1,7*,—0,2*! = 1, f3*,— *2 = 1,
I 0,5*, + 1,5*, = 1; ' \ 2*, + 4лг2 == — 3;
f 4*,+ *2 = 1, г 1,
I *, + 3*2 = 7; ' I 0,
13*,
Глава VI
ТЕОРИЯ ИНТЕРПОЛИРОВАНИЯ
§ 1. ПОНЯТИЕ ОБ ИНТЕРПОЛИРОВАНИИ.
ОСНОВНАЯ ТЕОРЕМА
ОБ ИНТЕРПОЛИРОВАНИИ МНОГОЧЛЕНАМИ
Представим себе, что нам нужно посчитать значе-
значение функции f(x), определенной на отрезке [а, Ь], в неко-
некоторой точке х этого отрезка, но сама функция f(x) нам
в виде формулы не задана, а имеется лишь таблица ее
значений для некоторого конечного числа отличных друг
от друга значений аргумента
Xq, Х\, Х%, ... ; Хт
(Xi?[a, b], i = О, 1, 2, ..., т). С такой задачей мы стал-
сталкиваемся, например, при отыскании логарифма от аргу-
аргумента, не указанного в таблице логарифмов, а находящегося
между двумя соседними значениями табличных аргументов.
Разумеется, если точка х совпадает с какой-либо из
указанных точек xt (i = 0, 1, 2, ..., т), то для получения
необходимого нам результата достаточно воспользоваться
таблицей. Проблема возникает тогда, когда х находится
в промежутке между какими-либо из этих точек. Довольно
естественно попытаться найти f(x) следующим образам:
подобрать такую функцию 9 (*), значение которой мы можем
вычислить в любой точке отрезка [хв, хт], и такую, что
<p(*j) —/(**) (i = 0, 1, 2, ..., т). Тогда можно считать,
что при удачном выборе функции 9 (%) будет <р (х) <=ы f (X).
Есть много причин, по которым у(х) целесообразно
выбирать в виде некоторого многочлена (одной из них
является сравнительная простота вычисления значений
многочлена). Еще сузим проблему и будем искать <?(х)
в виде многочлена степени не выше, чем т. Задача построе-
построения такого многочлена называется задачей интерполиро-
интерполирования (многочленами), а сам многочлен — интерполяцион-
интерполяционным. Интерполирование применяют и в том случае, когда
функция f(x) имеет представление в виде формулы, но
136 . -
слишком сложное. И если нужно получить значения функ-
функции для большого количества значений аргумента, то это
будет весьма трудоемкой работой. Поэтому вычисляют зна-
значения функции f(x) в некотором количестве точек и по
полученной таблице строят интерполяционный многочлен,
которым и заменяют приближенно функцию f(x).
Итак, пусть задана таблица значений функции f(x)
в точках х„, хи хг, ..., хт (эти точки называются узлами
интерполяции):
f С*.)
/(*,) ... f{xm)
Требуется найти многочлен Рт (х) степени не выше, чем т,
который бы совпадал с функцией f(x) в узлах интерполи-
интерполирования, т. е. Pm(xi) = f(xi) (t = 0, I, 2, .... т). Такой
многочлен называют интерполяционным многочленом для
функции f(х) по узлам х0, хи ..., хт. Но возникает воп-
вопрос, всегда ли можно построить интерполяционный мно-
многочлен, а если можно* то сколько таких многочленов.
На этот вопрос дает ответ основная теорема об интерполи-
интерполировании многочленами.
Теорема. Существует один и только один много-
многочлен Рт (х) степени не выше, чем т, который решает задачу
интерполирования, т. е. удовлетворяет условиям: Рт(Х{) =
= f(xt) (i = 0, I, 2, ..., от).
Доказательство. Имеем т -f-1 точку, х0, хи хъ ...,
хт — узлы интерполирования и нужно построить интерпо-
интерполяционный, многочлен
Рт (х) = айхт
(*)
который бы в узлах интерполирования совпадал с функ-
функцией f(x), т. е. Pm(x,) = f(xt) (t = 0, I, 2, ..., от). Коэф-
Коэффициенты at должны, очевидно, удовлетворять следующей
системе уравнений:
A)
137
Узлы интерполирования х0, хи хь ..., хт и значения
функции f(x0), f(xr), f(xi), ..., f(xm) заданы.
По теореме Крамера система A) будет иметь решение
и притом единственное, если определитель системы отличен
от нуля.
Вычислим этот определитель:
С
J-l
т-Ч
xm~2
xl
xf x?
m m — \ m—2
¦• xm 1
B)
и докажем, что Д(т) ф 0 при любом т.
Будем преобразовывать определитель B) следующим
образом: из 1-го столбца вычтем 2-й, умноженный на х0,
из 2-го — 5-й, умноженный на х0, и т. д. — из т-го вычтем
(т-|-1)-й столбец, умноженный на х0. От этих преобра-
преобразований значение определителя не изменится, а сам он
примет вид:
О
О
О
1
Х1 ¦
¦ Х0Х1
,т-\
.m-2
Vя*
— \ т-\
»—2
C)
Разложим определитель C) по 1-й строке:
д(я») = (_
m-\ m-\ т
Xj X()Xj
=.(- 1)"
vm v у"»—1 у"»—1 v v"»—2 v „
yn г Xm~l Xm~l-
Ym~l lY Y\ Ym~2 IV
Xl VI— 0/ xl \Xl'
m-2
хг №—хо)
i—*о) • • • xi—х0
г—хо) • • • ^4—хо
хт (хт—#
хт (Хт—Х
Хт—Хо
138
Из каждой строки вынесем общий множитель:
дС) =
Х\ Х± ¦ * ¦ Х\ 1
Я1—1 „"» — 2 1
V 1
• • • лт 1
= (- \)т (*, -
Преобразуя подобным образом ДС"), получим:
Д(т) = (х, — xt) (х0 — хг)... (х0 - хт) ¦_(* - х,) X
Окончательно
Д(т' = (х0 — xi) (х0
¦¦¦(Xi— Хт)
... (х0
хт) (xi —
Xm).
Коротко это записывается с применением знака произ-
произведения П:
.Д(»>= П (Xi—Xj).
Так как xt Ф xh то Д<т> Ф 0.
Из теоремы Крамера мы можем заключить, что систе-
система A) имеет решение и притом единственное. Этим реше-
решением являются коэффициенты а0, аи ..., ат интерполяцион-
интерполяционного многочлена. Тем самым мы доказали существование
и единственность многочлена степени не выше, чем т,
построенного по (т4-1)~мУ узлу интерполяции.
Слова „не выше" означают, что некоторые коэффици-
коэффициенты многочлена, в том числе и при старших степенях х,
могут оказаться нулевыми. Тогда степень многочлена пони-
понизится.
§ 2. ИНТЕРПОЛЯЦИОННЫЙ МНОГОЧЛЕН
ЛАГРАНЖА
Перейдем теперь к непосредственному построению
интерполяционного многочлена. Его можно искать в виде (*).
Тогда для нахождения коэффициентов at придется решать
систему A). Однако на практике удобнее использовать
интерполяционный многочлен, полученный в другом виде.
139
Пусть задана таблица значений функции f(x) в узлах
интерполирования х0, хи х$ хт:
хт
Построим такой многочлен 9о (х) степени т, который при-
принимает значение 1 в узле х9 и значение 0 в остальных
узлах. Таким многочленом будет многочлен
<р0 (х) = а0 (х,— xt) (х — x<i)... (х — х,„).
Действительно, <ро(*<) = ° (t = l. 2, ..., m), а для того,
чтобы выполнялось условие <ро(*о) = 1, достаточно положить
ао = ( _ и ' . —.
Точно так же строим многочлен <pi (x), который равен 1
в узле хх и обращается в Нуль в остальных узлах:
9i (х) = а% (х — Xq) (х — х^... (л; — хт).
В самом деле, <pi (*«¦) = 0 (t = 0, 2, 3,..., т) и <pt (xt) = 1,
если
а _ 1
Аналогично строим функции у{(х) — аг(х—х0) (х — х,)...
... (х — x,_i)(х—x{+i)... (х—х„), которые обращаются в нуль
во всех узлах, кроме xt. Коэффициент щ выражается
формулой
- 1
-Теперь функции spt (x) можно записать следующим образом:
K ' (* -1 X() (X{ —Xt)... (Xt — Xi_i) (Xi—Xi+l)... (X{ — Xm)
(i=*0, \, 2, .... m).
Если мы рассмотрим произведение <р,- (х) • f (xt) (i==0, 1,
2, ..., т), то убедимся, что во всех узлах интерполиро-
интерполирования оно обращается в нуль, кроме узла х{, где оно
равно f (Xj). Просуммируем эти произведения по всем узлам
интерполирования:
'?(*) = То (х) ¦ f (*о) + ъ (х) ¦ /(х.) +... + Тот (х) ¦ / (хт).
140
Получим функцию, которая является многочленом степени
не выше т, так как каждое слагаемое есть многочлен сте-
степени не выше т. Многочлен этот в каждом узле xt при-
принимает значение / (*,), так как слагаемое ср,- (х,) ¦ f(xi)=f(xi),
а остальные слагаемые обращаются в нуль при x — xt:
при iФ /. Многочлен ср (х) называют интерполяционным
многочленом Лагранжа. Его окончательный вид:
p iY\
) -*l) (^0 '
- Хо) (X ДГ]
2)... (л:„ —хт)
¦¦¦(x—Xm-i)
— ^l) • • • \xm Xm_i
i/(*m)-
D)
В частности, если tn = 2, т. е. имеется всего два узла
интерполирования, то интерполирование называется линей-
линейным, так как интерполяционный многочлен является мно-
многочленом 1-й степени; в случае т = 3 интерполирование
носит название квадратичного, так как получается интер-
интерполяционный многочлен 2-й степени.
Примеры. Построить интерполяционный многочлен Лагранжа
по следующей таблице:
X;
1)
0
0,5 1
-5,1
6
7,3
_(лг—Д5){лг—
@-0,5) @-1)
+ A — 0) A—0,5
(*-°) (*-0
@,5-0)@,5-1)
2)
Xt
f (*l)
1
1
2
2
3
3
2 W~
(х-2)(х-3)
(I—2)A —3)
1 +
(лг— 1)(лг-3)
B—1) B — 3)
(х~\)(х-2)
C— 1)C — 2) х'
2 +
Результат примера 2) иллюстрирует замечание, сделан-
сделанное в конце § 1 —интерполяционный многочлен, построен-'
ный по (т-(-1)-й точке, может иметь степень и более низ-
141
кую, чем т. В данном случае интерполяционный много-
многочлен, построенный по трем точкам, имеет первую степень.
В заключение параграфа коротко остановимся на задаче;
обратной задаче интерполирования, которая так и назы-
называется обратным интерполированием.
Пусть имеется таблица значений некоторой функции
хй
Vi
Ун
Ут
Если мы примем значения функции за значения аргумен-
аргументов, а значения аргументов за значения функции, то мы
можем написать многочлен Лагранжа, в котором узлами
интерполирования будут у0, уи • • •, ут:
PnitA^T-. rt ГГ. тЧ: Хп -(-> . . -+-
Т" С»_ _ I
Уд — (У — Ут-i)
•m-VJtim-VJ ••• (Ут-Ут-J ^ ^
Такой прием используется, когда нужно найти значе-
значение аргумента, соответствующего значению функции, за-
заключенному между двумя табличными значениями.
Упражнения
Построить многочлен Лагранжа, используя таблицу значений
функции:
xt — 1 0 0,5 1 2
1)
2)
3>
/ (Xi) | 1 ¦ 1 1,375 3
§ 3. ИНТЕРПОЛЯЦИОННЫЕ МНОГОЧЛЕНЫ
ДЛЯ РАВНООТСТОЯЩИХ УЗЛОВ
До сих пор при выводе интерполяционной фор-
формулы мы не налагали никаких ограничений на взаимное
расположение узлов интерполирования. Теперь предполо-
142
f
f
(*i)
xt
(Xl)
xt
0
— 2
5
— 1
0,5 2
^1,5
3,25
0 0,5
3 2,5
— 0,5 1
1,25 2
1
t
2
5
жим, что все узлы равноудалены друг от друга и распо-
расположены в следующем порядке:
Хо, лг^ == дгд —j— Л, Xj = Xi -j- h=#o -(- 2ft, x$ = x% -j- ft =
(Л называется шагом таблицы).
Значения функции в этих узлах обозначим соответственно
= yu .... f(xm) = ym.
Находим разности значений функции в соседних узлах
У\ — У», Уч — Уи Уг—Уч, ¦¦-, Ут — Ут-1-
Эти разности называются конечными разностями 1-го по-
порядка. Для них вводится специальное обозначение:
ук+1 — ук=~Ьук (к = 0, 1, 2 т— 1).
Из разностей 1-го порядка образуем конечные разно-
разности 2-го порядка и запишем их обозначения:
Ay««-A*/« = AV«, т. е.
д \ = Укш ~ Ук+1 ~ (Ук+1 — У к) = Ук+2 — 2У«+1 + Ук-
Точно так же можно образовать разности 3-го по-
порядка из разностей 2-го порядка:
-ДЧ = дзУ«, т. е.
к+1 — (Ук+* — 2&
1 — Ук-
Полученные конечные разности записываем в таблицу
(т = 5):
X
Хо
Ха
X,
х4
Xi
У
У»
Уа
Уз
У к
Уъ
Д«/а
Д</4
д^
Д2«/з
Д'г/!
Да</2
А«„
Д4Уо
д.,
143
Эту же таблицу можно записать иначе:
п>
*>¦
¦*1
Xt
¦*s
¦*«
V»
VI
Vi
Уг
Vi
Vi
Л*
У1—Уо
tli—Vl
Vi~V%
Уь-Ук
Ь?у
Vi—^У1~\~Уо
ya—tyl+yi
yi—2ys+yi
Уэ^-2у&-\-у 3
ыц
Уг—3*3+3*i— ya
•5f/4+'0*3—
#5—54/4+10*3
—lOys+byi—
Если мы сложим все разности какого-либо порядка,
например, Ду0 -f ДУ1 + Ай + А№ + % = Hi ~ Уо + Уг —
— yi.+ ya — y*-\-yi — ya + ye~yi = ya — y(>, то увидим,
что эта сумма равна разности крайних элементов преды-
предыдущего столбца. Это свойство может служить хорошим
контролем при вычислении таблицы разностей.
Пример. Записать таблицу конечных разностей для функ-
функции, заданной таблично:
*i I —110 1112 13
f(Xi)\ 6 |5|0|3|2
Xi
—1
0
1
2
3
6
5
0
3
2
j
-5
3
—1
b?y
—4
8
-4
12
—12
A*y
—24
Если здесь сложим разности, например 2-го порядка, то полу-
получим —4-|— 8 — 4 = 0. Тот же результат дает вычитание крайних в
таблице разностей 1-го порядка —1—(—1) = 0. Значит, при вычис-
вычислении разностей 2-го порядка, вероятно, ошибок не было.
Приведем некоторые основные свойства конечных раз-
разностей (возможность доказать их мы предоставляем чита-
читателю).
144
1. Конечная разность любого порядка суммы двух функ-
функций ср (х) = f (x) -)- g (x) равна сумме конечных разностей
того же порядка слагаемых.
2. Конечная разность любого порядка от произведения
функции f (x) на число k равна произведению этого числа
на конечную разность того же порядка функции f(x).
3. Конечная разность т-го порядки от многочлена
степени т есть постоянная величина, а все разности
более высокого порядка равны нулю.
Вот как выглядит, например, таблица разностей для многочлена
Рз(лг) = лга + лг* — лг+1;
X
—1
+1
3
5
7
9
У
2
2
34
146
386
802
0
32
112
240
416
32
80
128
176
Да</
48
48
48
А*у
0
0
Так как здесь третьи разности постоянны, то мы можем про-
продолжить таблицу следующим образом: к 176 прибавляем 48 и по-
получаем 224, затем, прибавляя 224 к 416,' получаем 640 и, наконец,
прибавляя 640 к 802, получаем 1442. Это есть значение функции,
соответствующее аргументу лг=11 (в этом легко убедиться непо-
непосредственной подстановкой лг= 11 вР, (лг)). Мы можем продолжать
таблицу сколько угодно, периодически проверяя правильность вы-
вычислений непосредственной подстановкой аргументов в Рг (лг).
Если функция f(x) достаточно хорошо приближается
многочленом степени т, то ее разности т-ro порядка на
основании последнего свойства должны быть близки к
постоянным. Для таких функций, следовательно, можно
контролировать правильность составления таблиц этих
функций: если конечные разности некоторого порядка
почти постоянны, то таблица составлена верно, если же
разности начинают вести себя, как говорят, „нерегулярно",
т. е. сильно колеблясь, то где-то при оставлении табли-
таблицы функций была допущена ошибка (имеется в виду, что
145
разности вычислялись верно и их счет контролировался
указанным выше способом).
Посмотрим, как же влияют ошибки в таблице значе-
значений функции на величины конечных разностей. Предпо-
Предположим, что ошибка возникла лишь при вычислении од-
одного значения функции / (х) в точке xt и пусть величина
этой ошибки равна е. Составим таблицу конечных раз-
разностей:
X
Xi-l
¦*«-!
xt
z
У
Vi-t
У1-1
У1+!
Уы
l/i+4
A*
:::;
Ay i — e
дУ'+2
A*y
ДЧ-+*
A»y
-^м
А*и_, —3t
Д8у. j_ 3e
A*y
Мы видим, что ошибка распространяется на разности все
более высоких порядков и наибольшая ошибка получается
в той же строке разностей, что и ошибка в таблице зна-
значений функции.
Таким образом, если из таблицы разностей видно, что
от всех других значений разностей данного порядка на-
наиболее сильно отличается разность в ?-й строке, то в этой
строке содержится ошибка в таблице значений функ-
функции.
Если же таких ошибок нет, то при составлении таб-
таблицы разностей нужно прекращать вычисления на тех
разностях, которые мало меняются.
Приступим теперь к нашей основной задаче — построе-
построению интерполяционных многочленов для равноотстоящих
узлов.
146
Пусть' дана таблица значений функции y = f(x):
X ¦ 1 Хо
У,
ха
Ут
причем xt = ха-f-ih (i = l, 2, ..., /и).
Будем искать интерполяционный многочлен степени т
в следующем виде:
(*)¦= ьо + &i (дс — хй) + Ь2 (х — х0) (л; —
+ Ь3(х — ха)(х — хх)(х —
— x1)...(x — xm_i). F)
^Многочлен Nm(x) должен удовлетворять условиям:
= Уо, Nm (xt) =yu .... Nm (xm) = ут. G)
Подставляем в F) х = ха и, учитывая G), получим:
Nm(xf>) = y() = bu, или Ь„ = у0. Точно так же подставляя
в F) поочередно х = хи х^ хт и принимая во вни-
внимание условие G), будем иметь:
откуда
Ht. — У о Л«/о.
откуда
Уг =
4~ 2Лг ~~ 2Л11 '
(х3 ~ х0) {х3 —
147
откуда
и __Уг — Зу2 + 3yt — у0 _ A3j>0.
¦3~
6Ла ~3!Л
3'
°ъ ~ 5! Л5' * • • '
6» = -
Таким образом, коэффициенты многочлена F) найдены,
и его можно представить в виде:
-х1)...(х-хт.1). (8)
Эта форма записи интерполяционного многочлена но-
носит название интерполяционного многочлена Ньютона для
интерполирования вперед.
Введем новое обозначение: ~7 " =t, или х = х9-\-
-\-th. Тогда
x — xi х — (xa-H) _ x—x-Q _ . . _ .
Л — . А ~ h l~~l li
¦* , v
х — (х„ 4- 2ft) лг — х„ „ , „
—,. _ — _ z,— ( ^}
А ~": Л А
и формулу (8) можно окончательно записать в виде:
Nm (х) = Nm (x0 + th) = 'J^
Она использует разности, которые расположены в
таблице по диагонали 'сверху вниз (в таблице на стр. 143
они подчеркнуты).
148
Построим интерполяционный многочлен Ньютона для
интерполирования вперед для таблицы конечных разно-
разностей, приведенной на стр. 144.
@ = 6 +1 (- 1) + *Jtz2L(_ 4) -f 1?=2№=Ъ_ 12 +
—2) —*(*—1)(/ —2>(f —3).
Рассмотрим еще одну интерполяционную формулу, по-
построенную по равноотстоящим узлам. Будем искать ее в
виде:
Nm(x) = Со + С,(х~хт) + С,(х-хт) (х~хпьл) +
+ С3 (х — хт) (х — xm_0 (х — xm_2) -}- • • • +
+ Ст (х - хт) (х - *„,_,) ...(х — Xl). (9)
Это многочлен степени т, и так как мы хотим, чтобы
он интерполировал заданную функцию y=f(x), то он
должен удовлетворять следующим требованиям:
= ya. A0)
Подставляем поочередно в формулу (9) х=хт, xm_i, ...,
х0 и, учитывая условия A0), получаем: ут — С0, или
Со = Ут\ Ут-1 = Со 4-,С1 (*т-1 — хт) = Ут "f Cl (~ Л)
р Ут — Ут-i АУст-1 .
т-9 = Со 4" Cl (*m-8 — хт
= Ут+Ут~ьУт-1 {-2h)-\-C1{~2h){-h), откуда С,=
__ Ут — 2г/я»-1 + У>Я-2 _ ^Ут-г
~~ 2fts ~~ 2Ла •
г m г г
3~3!Ла ' *~4! hl ' •••' ^m
Подставляем найденные коэффициенты в формулу (9):
(х) = ym + ^f*r (x-хт) +%=-2 (х-xj (*-xffl_04-
^т^ ^ "^~ Хт~1' \Х Xm-V 4"' • • 4*
-хя)(х-хт_1)...(х-хд.. A1)
149
Г7
Введем обозначение
х
=/, или х = хт -j- fh. Тогда
-^ot-i ¦* \хт — ») ¦*
~ ~~
И формула A1) примет окончательный вид:
Nm(x) = Nm(xm + th) = y..
5/na форма записи интерполяционного многочлена но-
носит название интерполяционного многочлена Ньютона для
интерполирования назад. Для него строится таблица ко-
конечных разностей, в которой используются разности, рас-
расположенные по диагонали снизу вверх.
X
хв
х,
X,
ха
У
Уй
Vt
Ун
Уз
А»
Д3Уо
Д?У!
—
*у
vy
дч
(т = 4)
Пример. Построить интерполяционный многочлен Ньютона
для интерполирования назад по следующей таблице значений
функции.
X
У
0
1
2
3
4
2
6
5
150
Строим таблицу конечных разностей
X
0
2
4
6
У
1
3
2
5
2
— 1
3
Д2(/
з
4
—
7
~
Подчеркнутые числа подставляем в формулу A2):
Если нам нужно вычислить значение интерполяционного мно-
, . х — хт 5 — 6 1
гочлена в точке л: = 5, то тогда t= —j—?* =—=— = —^- и
tl t* it
\ V 2 2 , „13
6 48*
При помощи интерполяционных многочленов можно
решать задачу сгущения таблиц (субтабулирование).
Однако в этом случае нужно учесть, с какой погреш-
погрешностью мы хотим получить новые табличные значения, и
в соответствии с этим оценить порядок интерполяцион-
интерполяционного многочлена, с помощью которого будем находить
эти значения. Для этого нужно знать, как оценивается
погрешность, с которой приближается функция f(x) ин-
интерполяционным многочленом. Об этом мы расскажем в
главе VIII. Обычно сгущение проводят до тех пор, пока
не получат таблицу с шагом h, при котором любое про-
промежуточное значение функции можно получить из таб-
табличных значений при помощи линейной интерполяции,
причем точность результата должна быть в пределах точ-
точности таблицы. В этом случае можно пользоваться интер-
интерполяционным многочленом 1-го порядка, построенным по
двум соседним узлам. При этом говорят, -что таблица
151
допускает линейную интерполяцию у = Уо-\-1&Уп- Обычно
все публикуемые таблицы функции (таблицы логарифмов,
тригонометрических функций и т. д.) допускают линей-
линейную интерполяцию. Причем для облегчения нахождения
поправок /Дг/о часто в таблицах приводятся поправки в
готовом виде (например, таблицы квадратов чисел, сину-
синусов и косинусов в четырехзначных таблицах Брадиса).
Иногда в таблицах помещают таблички пропорциональ-
пропорциональных частей, в которых указываются доли различных чи-
чисел.
Например:
1
2
3
4
5
6
7
8
9
11
1.1
2.2
3.3
4.4
5.5
6.6
7.7
8.8
9.9
12
1.2
2.4
3.6
4.8
6.0
7.2
8.4
9.6
10.8
В крайнем левом столбце таблицы
указывается, сколько десятых долей чисел
11 и 12 содержится в числе, находящемся
на пересечении строки, указывающей коли-
количество десятых долей и столбца числа, доли
которого приведены в таблице.
При работе с таблицами нужно выбирать таблицы,
которые содержат достаточное для данной задачи коли-
количество знаков. Если знаков будет мало, то нельзя решить
задачу с нужной точностью, если же знаков неоправданно
много, то будет проделана лишняя вычислительная
работа.
Итак, в настоящей главе мы познакомились с интер-
интерполяционным многочленом Лагранжа и интерполяцион-
интерполяционными многочленами Ньютона для интерполирования впе-
вперед и назад. Еще раз подчеркиваем, что все эти много-
многочлены, построенные по одной и той же таблице значений
функции, после раскрытия всех скобок и приведения по-
подобных членов дадут одно и то же выражение. Это выте-
вытекает из теоремы единственности интерполяционного много-
многочлена. Однако не следует забывать, что многочлены
Ньютона мы строили по равноотстоящим узлам, а много-
многочлен Лагранжа свободен от этого ограничения. Если же
мы имеем таблицу функции с равноотстоящими узлами и
построим по ней многочлены Лагранжа и Ньютона, а за-
152
тем добавим еще один узел, то для многочлена Лагранжа
всю вычислительную работу придется проделать заново,
а для многочленов Ньютона достаточно будет достроить
еще одну диагональ в таблице конечных разностей и при-
прибавить еще один член в интерполяционной формуле.
Все рассмотренные многочлены называются интерпо-
интерполяционными потому, что с их помощью обычно вычисляют
значение функции внутри отрезка [лг0, хт]. Но иногда
необходимо получить значение функции за пределами
данной таблицы значений. В этом случае тоже можно
воспользоваться интерполяционными формулами, но делать
это можно лишь тогда, когда аргумент искомого значе-
значения функции достаточно близок к отрезку [ха, хт], а сама
функция меняется плавно. В этом случае говорят, что
происходит экстраполяция функции.
Глава VII
ПРОИЗВОДНАЯ ФУНКЦИИ
ОДНОЙ ПЕРЕМЕННОЙ
§ 1. ЗАДАЧИ, ПРИВОДЯЩИЕ К ПОНЯТИЮ
ПРОИЗВОДНОЙ
Известно, что тело, двигаясь равномерно и пря-
прямолинейно со скоростью v, проходит путь, пропорцио-
пропорциональный времени движения, т. е. путь, скорость и время
связаны формулой:
s = v-t. A)
И если мы знаем, что за промежуток времени от мо-
момента t\ до момента t2 тело прошло расстояние, равное
s (/а) — s (^i), то скорость движения на всем пути равно-
равномерного движения равна:
Пусть теперь тело движется неравномерно. Тогда
формула A) уже не имеет места/ потому что скорость,
вообще говоря, в каждый момент разная. Если мы опять
засечем путь, пройденный телом за время ti — tu т. е.
путь, равный s(/3) — s(tt), (s(t) — путь, пройденный телом
за время /), то, разделив этот путь на затраченное время,
мы найдем так называемую среднюю скорость, с которой
двигалось тело в этот промежуток времени:
vcP(h, h) =—r-—i :• К1)
Определим, например, среднюю скорость тела, дви-
движущегося равноускоренно, за промежуток времени (t^ — ti).
Путь, пройденный телом в равноускоренном движе-
движении, определяется формулой:
s==^!=sW. ' C)
154
Поэтому средняя скорость движения (с учетом C)) будет
равна: «а«а
Зафиксируем теперь момент времени tx и будем нео-
неограниченно уменьшать промежуток времени {t% — ^1), на
котором определяем среднюю скорость движения, т. е.
устремим t% к tr. В этом случае, очевидно vcp -*- gti%
Это, как известно из физики, есть мгновенная скорость
равноускоренного движения. Дадим теперь общее
Определение. Мгновенной скоростью движения, вко~
тором путь есть функция времени, s = s (t), в момент вре-
времени tu называется величина
или
v(ti)= lim vcp(tit ty),
tt->tt
т. е. предел отношения пути, пройденного за промежу*
ток времени М = 4 — tx к этому промежутку времени,,
если последний устремить к нулю.
Перепишем несколько иначе B):
,. it / ч —s (*j) -s ft) _ s (<i + AQ - а (Ь) _ As (<,)
vcp(tu h) — tt_ti — д? ~W
Тогда '
Рассмотрим теперь еще одну задачу — задачу о нахож-
нахождении касательной к кривой в данной точке. Возьмем
систему координат на плоскости и изобразим в этих коор-
координатах кривую y — f(x). Пусть точка Л1 (дс0, г/0) лежит
на кривой, т. е. ?/o = f (*<>)¦ В окрестности точки М берем
вторую точку на кривой N (хи yt) и проводим через эти
две точки прямую (секущую) (рис. 36).
Будем неограниченно приближать точку TV к точке М
вдоль кривой y = f(x).
Определение. Прямая, проходящая через точку М
кривой y = f{x) и образующая с осью абсцисс угол, вели-
величина которого равна пределу величин углов секущих, про-
проходящих через точки М и N на кривой с осью абсцисс
155
при N -*• М, называется касательной к кривой y = f(x)
в точке М.
Пусть Ax = JCi — х0 — приращение аргумента, а Дг/=Ц
= У1 — Уо— приращение функции, отношение же их равно
т..е. тангенсу угла наклона секущей.
Рис. 36
Если мы теперь устремим к нулю приращение Але, то
точка /V устремится к точке М. При этом /, NMP будет
стремиться к ?. RMP = o., равному углу наклона каса-
касательной к оси абсцисс, и так как tg2 есть функция не-
непрерывная при |2|^" и 2<^ie (можно доказать), то
XgNMP- -*¦ tga, т. е.
Ах-*0
tga= litn
xt — ха
fix,)-f{x,) _ Hm Ду _
Таким образом, тангенс угла наклона касательной
к кривой, заданной уравнением y = f(x), в точке х = х$
определяется равенством:
= tga= lim
D)
Уравнение касательной, т. е. прямой с угловым коэф-
коэффициентом k, определяемым выражением D), проходящей
через точку (лг„, у9), будет
156
Приме р ы. Найти тангенс угла наклона касательной в точ-
точке х0 к кривой:
1) _у = л2. По формуле D) имеем:
tgo= lim -pL= lim iizi?i== lim (xt + x0) = 2xa.
A0&X 'Xi — XB xt ~» xa
Уравнение касательной в точке хв будет у = 2х0 (х — хо)-\-уо-
2) v = —- tga= limv^-= lira
!0 it
=. lim Х°~~.Л'1 = lim ( — W —. Уравнение
Xi-*xu i-0X1-(xl — XS) Jt!-*o \ -«o-^i/ -«o
касательной будет ^= — —f(x — xo)-\-yo:
x0
Итак, мы рассмотрели две различные задачи — задачу
об отыскании мгновенной скорости неравномерного дви-
движения и задачу, о нахождении тангенса угла наклона
касательной к кривой в данной точке. Обе задачи реша-
решались в сущности одинаковым способом: мы искали пре-
предел отношения приращения некоторой функции к соот-
соответствующему приращению аргумента, когда приращение
аргумента стремилось к нулю.
Мы вплотную подошли к важному понятию — поня-
понятию производной.
Пусть y = f(x) — произвольная функция одной пере-
переменной, определенная на отрезке [а, Ь]. Возьмем точку х0
на этом отрезке.
Определение. Производной функции f(x) в точке х0
называется предел отношения приращения функции к при-
приращению аргумента, когда последнее стремится к нулю,
если этот предел существует.
Обозначается производная следующим образом: f {х0),
или ~
dx
. Таким образом,
x=x0
-ха
Если у функции существует производная в данной
точке, то она называется дифференцируемой в этой
точке.
Если производная функции существует в каждой точке
отрезка, то она называется дифференцируемой на от-
отрезке.
157
Функцию <?(*), значение которой в каждой точке сов-
совпадает со значением производной функции f (x), называют
производной функцией, а иногда и просто — производной:
<Р(*) = П*).
Процесс отыскания производной носит название диф-
дифференцирования.
Оказывается, дифференцируемые функции обладают
важным свойством.
Теорема. Функция, дифференцируемая в данной
точке, непрерывна в той же точке.
Доказательство. Так как функция дифференци-
f /х\ , fix) ¦
руема, то существует предел отношения J-5—-—(Л-М при
X Xq
х->х0. Здесь знаменатель стремится к нулю, и чтобы
существовал предел отношения, необходимо, чтобы и чи-
числитель стремился к нулю, т. е. f(x) — f(xo)->O, или
дс-».*о
f(x)->f(Xf,) при x->Xf,, что и означает непрерывность
функции f(x) в точке х0.
Однако, обратное утверждение неверно, т. е. не всякая
непрерывная функция дифференцируема. Например, функ-
функция f(x) = \x\ всюду непрерывна (рис. 9), а в точкелс = 0
она не имеет производной.
В самом деле, если Ддс">0, то lim л ==
а при
т. е. предела отношения приращения функции к Длс при
Длс->0 не существует и, значит, функция f(x)=\x\
в точке лс = О не имеет производной.
§ 2. ПРОИЗВОДНАЯ СУММЫ, ПРОИЗВЕДЕНИЯ,
ЧАСТНОГО
Теорема 1. Производная произведения функции
на число равна произведению производной этой функции
на то оке число, если производная функции существует
(f()y f'()
158
Доказательство. По определению производной
{cf(x))'=\imo
=с- lim
В этой цепочке равенств мы два раза воспользовались
определением производной jj один раз свойством преде-
пределов: предел произведения функции на число равен про-
произведению этого числа на предел данной функции.
Теорема 2. Производная суммы двух функций равна
сумме производных этих функций, если последние суще-
существуют.
Доказательство. Пусть <?(x) = f{x)-\-g(x). Рас-
смотрим lim ?<* + уТ*<*>.
Длг-,0 Д*
Докажем, что этот предел существует и найдем его
выражение. Так как <р (лс) = f (х) -{- g (x) и <р +д)
f({^){( + ^), то
Ах Дл:
)—f(x) .
~ Дл: "Г Да:
Устремим Л* к нулю. Пределы слагаемых в правой
части существуют и равны соответственно f (x) и g' (x),
так как по условию теоремы производные f (x) и g' (x)
существуют. Следовательно, существует и lim ? (*+ X)—«t(X)
и равен f{x) + g(x).
¦ Итак, cp'(x) = f (x)-fg'(x).
Следствие. Производная суммы любого конечного
числа функций равна сумме производных этих функций.
Доказать это утверждение можно, пользуясь методом
математической индукции.
Теорема 3. Пусть <?(x) = f(x)-g(x). Тогда произ-
производная ср'(х) существует и выражается формулой:
если производные f (x) и g" (x) существуют.
Доказательство. Дадим аргументу х прираще-
приращение Дх и рассмотрим приращение функции <р(х).
159
В правой части равенства прибавим, и вычтем вели-
величину f (х) ¦ g (X-+Ах):
<р (х+Дх) - 7 (х) = f (х + Дх) -g (х + Дх) - f (х) -g (x + Ах
+ f(x)-g(x+Ax)-f(x).g(x) = g(x + Ax)X
. [g (x + Ax) -g (x)].
Если поделить левую и правую части на Дх и устремить
Дх к нулю, то, используя правила предельного перехода
и определение производной, получим:
Х Ит /(х + Ах)-/(х)
= g(x)-f(x)-i-f(x).g'(x).
Следствие 1. Из теоремы 3 непосредственно вы-
вытекает теорема I.
Действительно, пусть ср(х) = с/(х) (т. е. g(x) = c).
Тогда <p'(*) = c7(x) + cf (*)•
Но производная постоянной величины равна нулю
(так как какое бы приращение аргументу мы ни давали,
приращение функции, т. е. постоянной величины, будет
нулевым), поэтому ср'(х)=с/'(х).
Следствие 2. Если срА(х) = fx (х)• fa(x) ... fk(x), то
<\-U(x)U(x) ... f*(x).
Это утверждение легко доказать с помощью метода
математической индукции.
Теорема 4. Пусть <р(х)= |^ (g (х) ф 0). Гогйа
ср'(х) = f'(x)s(x)-f(x)g'(x) ^ еслц производные f (x) ы
g' (x) существуют.
Доказательство. Как обычно, даем аргументу х
приращение Дх и рассматриваем выражение:
<p(x) —
-«р (х) -
Jc)g(x)—flx)g(x + bx)
g(x)-g(x+bx)
160
Добавим и вычтем в числителе правой части равенства
произведение функций f(x)-g(x), после чего разделим
левую и правую части равенства на Дд; и устремим Ад;
к нулю. Получим:
_ . / (х + Ах) g (x) -^/ (x)g(x) + / (x)g(x) -/(x) g (х -Ь А*)
д™0 ? g(x)-g(x+Ax).Ax .
Ax ~/(X) • Ax
Используя правила предельного перехода и определе-
определение производной, имеем:
g(x+Ax)-g(x)
Ах
lim -g(x + Ax)
Д0
lim
— g(x)
lim
/(x) a,->o Ax
g(x)" lim . g(x+Ax) g(x) g*(x)
Д.К-.0
§ 3. ПРОИЗВОДНЫЕ ЭЛЕМЕНТАРНЫХ ФУНКЦИЙ
Элементарными функциями называют функции,
заданные формулами, составленными из многочленов,
частного двух многочленов, тригонометрических, показа-
показательных и логарифмических функций, соединенных зна-
знаками четырех арифметических операций (но лишь конеч-
конечное число раз), а также сложные функции, образованные
из вышеперечисленных.
Элементарной функцией, например, является
Y
6 А. Б, Бакушинсккй 161
Пример "неЗлементарной функции — функция, которую
мы рассматривали в § 1 главы II: у = [х] (целая часть
от х).
В настоящем параграфе мы будем дифференцировать
лишь наиболее простые из элементарных функций. Когда
мы научимся это делать, то с помощью производных от
простейших элементарных функций и с помощью теорем
§ 2 мы сможем дифференцировать элементарные функции
более сложной структуры.
1. Производная степени с натуральным показателем.
Прежде всего заметим, что производная от функции у = х
равна единице, т. е. (х)' = ^— х=\.
Действительно,
*= пт = lim ^ lm
АХ _ 0 ах Д* -. О алг • ' Ля -. О
Вычислим производную функции у = хг. По теореме 3
из § 2 имеем:
(г*)' = (х- х)' = х1 ¦ х-\- х ¦ х1 = 1 • х + х ¦ 1 =2х.
Теперь найдем производную функции у = хт (т — лю-
любое натуральное число). Воспользовавшись следствием 2
теоремы 3 § 2, получим:
{хт)' =
= 1 • {х-х- ... • х)-f-1 • (*•*•-...• х) +... + 1 (х-х- ...-х) =
т — \ - от —1 т — \
т
= т-хт'К E)
2. Производная многочлена. Используя результаты п. 1,
мы можем легко продифференцировать любой многочлен.
Пусть
f (х) = а,хт + а^-1 + • • • + Om-i* + ат-
С помощью теорем § 2 и результатов п. 1 имеем:
f (х) = а.тх'14- oi (m - 1) ^ 4- • • + «m-i
(здесь мы применили теоремы 1, 2 из § 2 и свойство E)
из п. 1).
162
Если же / (х) = (ах-\-Ь)т, то из следствия 2 теоремы 3
§ 2 вытекает, что
/' (Х) = (ах + ЬУ • (ах + Ь)т ~» +
= т (ах-+ Ь)' • (ах + Ь)т ~у =та (ах + Ъ)т ~1-
Пример. Найти производную функции A — х)т (здесь
а = ~\, Ь=\),
= — m{\ —х)т-*.
[A —х)т]' = т(— 1) A —х)т~л =
3. Производная степени с целым отрицательным по-
показателем. Нужно найти производную функции у = х-т,
где т — целое положительное число, а х Ф 0.
Так как х~т = — , то можно воспользоваться теоре-
теоремой 4 о производной частного и формулой E) из п. 1:
(у-ту — [ j —Q)'-Xm-
0 — т-хт~1
т
тх
-т-\
4. Производная синуса. Пусть y=sinx и
Нарисуем круг единичного радиуса. Из рисунка 37 видно,
что аргумент синуса равен дуге MR, т. е. RM
МР МР
smx
m
В прямоугольном треугольнике MRP сторона MR
й MP^MR^M, т. е.
у у
является гипотенузой, поэтому
sinx<^x. Для х, заключенного в
пределах — ^ ^ х =s? j, как легко ви-
видеть, будем иметь:
|sin*|<|*|. F)
Докажем, что y = sinx — непрерыв-
непрерывная функция, т. е.
lim Ay=lim[sin(#-f-
Д*-* 0 Дж-» 0
4- Д*) — sin х] == 0.
Рис. 37
6?
J63
Действительно,
Отсюда
cos
^)|^1, a
sin ~\<
(см. F)).
Следовательно, какое бы е ^> 0 мы ни взяли, как только
будет выполнено неравенство |Дх|<Ч, получим:
Дх
2
Зто и означает, что ПтЛу = 0, т. е. y = s'\nx — не-
прерывная функция.
В дальнейшем мы докажем одно замечательное равен-
равенство:
,. sin х ,
hm-—-=l.
G)
Сейчас же мы примем его без доказательства и восполь-
воспользуемся им для того, чтобы вычислить производную функ-
функции y = sinx.
По определению производной и из формулы для раз-
разности синусов имеем:
(sinx)' = lir
Длг
Дх / -, Дх\
2sm-y coslx-l- -j)
lim т-^ :
Дх .
. Дх
sm -х-
Дл:
Ш
Первый сомножитель в силу равенства G) равен еди-
единице; функция cosx непрерывна, так как cosx =
164
= sin(S- — x\ — сложная функция, составленная из непре-
непрерывных функций. Следовательно, lim cos (x-\--j-) =
sin T / Дх\
Таким образом, (sin*)'=lim—r—---JimcoslA:-]—~-)=
0 ^?
2
или
5. Производная косинуса. Для y = cosx имеем:
_ . / , Дх\ . х—х—Дл:
2 Sin X + -тг Г 31П
\ 2/
... 2 Sin X + -тг Г 31П —: fr
, ,. cos (x + Ax)—cosx ,. \ 2/ 2
Дл-*0 Х Дл-*о Л
= limsin bcf^)lim \
д*-»о в r
Ho sin x — нечетная функция. Поэтому sin f—jf
= —sin-^ и, принимая во внимание равенство G), имеем:
. ( Дх\ . Да; . Ддг
sm( у) ~ яп " SU1 Y
_
2
В п. 4 мы показали, что функция у = sin я непрерывна.
Следовательно, limsin(x-)--Tr):=sinx. Окончательно по-
лучаем:
(cosx)'= — sinx.
6. Производные тангенса, котангенса, косеканса, се-
секанса. Зная производные синуса и косинуса, легко полу-
получить производные остальных тригонометрических функций.
Так, используя теорему 4, § 2, получим:
, ., /sinxV '_ (sin x)' • cos x — sin x (cos x)'
(tg х) — ^^-^. j — — ^|— —
163
cos x ¦ cos x — sin x • (~ sin x) __ 1
cos2 x cos3x*
Далее,
у /cosxY (cos лг)' • sin x — cos x (sin x)'
) — \{SinxJ sin3* ; ~
— sm8 лг -г- cos8 x
sinax sin2x'
smx/ sin2 x sin8x'
(sec *У — f-i—V — — (cos-*)' — !E?-
1 > ~ \cos x / ~ cos2 л: ~~ cos2 x'
Приведем теперь, основываясь.на понятии производной,
вывод формулы бинома Ньютона. Рассмотрим тождество
(относительно х):
1х + Ьп, (8)
ba, bu.. Ьп пока неизвестны.
Для того чтобы найти коэффициенты разложения, по-
положим сначала х — 0. Тогда (О-\-а)а — Ьп, т. е. последний
коэффициент разложения найден: Ьп — ап.
Продифференцируем тождество (8):
п {х -\- а)" ~ * = nboxn -1 4-(«-1)^~Ч-4
+ 2Ья-9х + Ь,,-1. (9)'
Если мы в (9) положим х=0, то получим nan~1 = 6n_1,
т. е. мы нашли предпоследний коэффициент в разложе-
разложении (8).
Дифференцируем теперь тождество (9):
п (м— \)(х-\-а)п-1 — п {п — 1 )&„*»-«-{-
При д; = 0 имеем: п (п — 1)ап-г = 2Ьп-г, т. е. 6л-4 =
_я<я —1) „_9
~, 2 а
Продифференцировав k раз, получим:
п (п — 1) (л — 2)... (я — k + 1) {х -f- a)" - * =
= &,/!(n —1)...(л —
что при лс = О дает:
Ол - к — ;
где un
166
В частности, при k = n, имеем:
Итак, (л:И-а)" = х?-\-пхп-*-11+"^ 1<>хп-
\-Cknxn-kak-\-...-{-
Упражнения
1) Написать уравнение касательной к кривой у — х3 в точке
2) Вычислить производную функции:
а) t/ = Bх — 1 )Н в) у = (sin x + cosxJ;
б) у = sin х • cos х; г) t/ = х3 — 2х — tg х.
§ 4. ЗАМЕЧАТЕЛЬНЫЕ ПРЕДЕЛЫ
I. При выводе формул для производных тригоно-
тригонометрических функций мы использовали принятое без
доказательства равенство:
Теперь мы его докажем. Так как ^-^ — четная функция,
то достаточно рассмотреть случай положительного х.
Рассмотрим круг единичного радиуса (рис. 38). От-
Отложим на нем по обе стороны от некоторой точки Q дуги
fn ^ ^я \ х + NP МР
длины x@<x^2"j. Тогда, очевидно, tgx=^ = ^, и
так как NO = MO=l, то. tgx =
того, NM=NR-}-RM=sinx-^
)
Очевидно, что длина дуги
NQM больше стягивающего ее
отрезка NM и меньше длины
ломаной NPM:
NM
т. е.
NQM < NP + PM,
= MP. Кроме
Рис. 38
167
или
A0)
Дуга х находится в 1-й четверти, поэтому ^
Разделим все члены неравенств A0) на sin*. От этого
знаки неравенств не изменятся (sin,x>0):
1<<
^ sin л: ^ cos х '
Возьмем обратные величины:
1>*15>СО8Ж.
Устремим теперь х к нулю. Тогда непрерывная функция
cos л; устремится к единице.
Мы получили, что величина ^2_? ограничена величи-
величинами, одна из которых равна единице, а другая стремится
/-. sinx
к единице. Следовательно, стремится к единице при
х, стремящемся к нулю, т. е.
lim
II. Выведем еще одно исключительно важное предель-
предельное соотношение:
где п пробегает натуральные значения, а е — некоторое
число, являющееся пределом данного выражения. Если
подставлять различные конкретные значения п, то будем,
получать:
/t II - 2 3 4 10 100
2 2,25 2,37 2,44 2,59 2,705
/ 1 \"
Из таблицы видно, что значения выражения A+-)
постепенно растут с ростом п. Для того чтобы строго
доказать, что последовательность имеет предел, достаточно
показать, что она монотонно возрастает и ограничена сверху.
Тогда по теореме Вейерштрасса будет существовать предел
этой последовательности.
168
Введем обозначение
Раскроем скобки, используя фррмулу бинома Ньютона:
+ 1 + НН +
. i
n(n — l).Y.(n — я + 1) 1
п! и""
Отсюда видно, что а„^>2 при любом «.
Продолжим преобразования:
_
¦ i
Точно так же
+Ц \ я + 1/ ,
¦ у п + 1/\ Й^Т; , \ Я.+ 1/Д п;+\
Мы видим,- что каждое слагаемое в выражении для
an + i больше соответствующего слагаемого в ап (так как
1 < 1 i—j для любого i>0) и слагаемых в art + t
на одно больше, чем в а„.
Следовательно,
169
т. е. последовательность {а„} монотонно возрастающая.
Покажем, что она ограничена. Если мы в разложении A1)
отбросим в каждой скобке вычитаемое, то от этого каждое
слагаемое только увеличится, и мы получим:
«<1 + 1+ + 1Р + + +
Но k\ = \ •2-....fe>l-2-2-...-2=2fe-i, поэтому
?j-<^-?ir7. Заменяем каждое слагаемое в A2) на большую
величину, при этом неравенство усилится:
Суммируя полученную геометрическую прогрессию, по-
получим:
9« 1
Итак, получили, что при всех п выполнены неравенства:
2<ал<3,
т. е. последовательность {ап) монотонно возрастает и
ограничена. Следовательно, по теореме Вейерштрасса она
имеет предел, который и обозначается буквой е:
lim 1
Вот несколько десятичных знаков этого числа: е =
= 2,7182818284590...
j^
III. Рассмотрим fenepb функцию f(x) = {\ -\-x)x.
Оказывается, имеет место предельное соотношение
lim A+*)*=:*>. A3)
* — о
В самом деле, для любого заданного х^>0 обозначим
через п наибольшее целое число, не превосходящее —.
Тогда
n<jO + l. A4)
170
или для обратных величин:
Прибавим ко всем частям неравенств по единице:
^^ A5)
Используя A4), усилим неравенство A5), возведя его
части в соответствующие степени:
или, что то же самое
Теперь покажем, что для любого е^>0 можно найти
такое 8>0, что как только х<&, так |/() |
т. е. докажем предельное соотношение A3).
Введем обозначения:
, 1 \» + 1 ,
Функция —, очевидно, величина бесконечно большая
при х-*-0, а, следовательно, в силу неравенства A4)
число п неограниченно возрастает при х-+0.
Но НШ(н4)" = в и Ит (Г
я»оо люо
Кроме того,
lira fl 4--Wl и lim fl -4—U=l.
Таким образом, а(п)->-е и $(ri)-*-e. Это означает, что
л-»со п-*со
для любого е^>0 найдется такое натуральное число Nu
что для всех п^Ых будет выполнено неравенство •
|а(л)~-е|<в. A6)
Точно так же найдется число N% такое, что для всех
будет иметь место
\Ип)~е\<г. A7)
171
Оба последних неравенства будут, очевидно, выполнены
для всех n^N, если iV = max{A''I, Ni\.
Итак, при n — N, а следовательно, при х, заключен-
заключенном в полуоткрытом интервале w ._ <^*^ ¦», будет
A8)
в силу неравенств A6), A7) и неравенства
Если же х? [щ^-, ЩИ"]' то неРавенства A6). A7)
и A9) остаются в силе, а потому имеет место и неравен-
неравенство A8). И вообще, какое бы малое х мы ни взяли
(ж^дД всегда найдется такое натуральное число М,
что хG\m_l 1' ЛГ ' и так как M~^>N, то в силу не-
неравенств A6), A7) и A9) выполняется неравенство A8).
Таким обра:ом, мы нашли такое 8 = -^, что при всех
^ имеем \Цх) — е|<е, т- е- предельное соотношение
A3) доказано.
Пусть теперь х<0. Положим у= — х. Тогда
-- 1+1
1 I—У
1-0
— у,
У
Обозначим уз~ ^ ^ (^ !> 0). Очевидно, / -+¦ 0 при у ->- 0.
1
Поэтому из A3) следует: lim(l-J-/)'—е и, кроме того,
ПгпA -{-/)= 1. Отсюда
A \J:
1-Ь —) =е. В самом деле,
введя обозначение г/=—, получим: Нт A—|—} =НтA-{-.
172
1 I
у, так как у-^-0 при х->оо. Но lim (
силу равенства A3). Следовательно,
IV. Докажем еще одно предельное соотношение:
Нш ¦'<*•<;+*> в 1^ е. B0)
х-*0 л
Действительно, lim >&»<*+*> = Iimf4r • loga A + x)\ =
x-*0 x x-*0\x 1
= lim loga(l +л;)*. Но в силу соотношения A3) имеем:
{\-\-х)х-+е при x-vO. А так как функция logax непре-
t
рывнапри х^> 0 (это можно показать), то lim loga (I -}-jc)* ^
= logee, или
hm 5aVy^ ; = logae.
При а — е имеем:
l
lim lo
Обычно логарифмы по основанию е обозначают спе-
специальным символом: lnx = logex. Поэтому:
= 1. B1)
V. Наконец, последнее соотношение, которое мы по-
получим в настоящем параграфе:
lim ~ =\па (а^>0). B2)
Чтобы убедиться в его справедливости, введем обо-
обозначение ах — \=у, или а* = у-\-1. Тогда хЛпа —
= 1п(у-|-1) и х = ' I • Теперь имеем:
173
Но у^->0 при х ->¦ 0 (можно показать, что функция а*
непрерывна и а*-*1 при х-*0; отсюда у = ах—1-*0
при х-+0). Следовательно, используя соотношение B1),
получим:
lim = lim , , у, .. • In a = In a.
§5. ПРОИЗВОДНЫЕ ПОКАЗАТЕЛЬНОЙ ФУНКЦИИ,
ЛОГАРИФМА И ГИПЕРБОЛИЧЕСКИХ ФУНКЦИЙ
.Найдем производную показательной функции
у=ах. Дадим х приращение ДХ и рассмотрим выражение:
Дл: Ал:
Устремим Дх к нулю. Принимая во внимание соотно-
соотношение B2), получим значение производной показатель-
показательной функции:
lim a <a ~1>=ах\\т
Итак, '-^у = о*1па. B3)
В частности, при а = е имеем:
(ex)' = ex\ne = ex. B4)
Так же легко можно вычислить производную логариф-
логарифмической функции. Пусть y = \ogaX. Снова дадим х при-
приращение Дх и рассмотрим выражение:
х^\- Дл: /, ', Дл:\
X
Дл: Дл: Дд:
1
л: ' Д?
Теперь.'чтобы найти производную логарифма, устремим
Дх к нулю и воспользуемся соотношением B0). Получим:
¦*(¦+?)
1 , 1 1пе 1
: — logse= — -;— ==—г-
дг 1п а х In a *
174
Окончательно будем иметь:
B5)
При а = е формула B5) дает:
Составим некоторые "комбинации из функций е* и е х.
Мы получим так называемые гиперболические функции:
sh х = 7) синус гиперболический от аргумента х,
ch x =
,, shjc
ТП 1* ^—
111 Л- *
— косинус
е* — е~х
: ех + е~х
X,
= ih^==^e-^ ~котангенс
Графики гиперболического синуса (косинуса) легко по-
получить, вычитая (складывая) графики функций -у е* и у е~х.
Так, shx будет иметь вид, указанный на рисунке 39,
a chx на рисунке 40.
Рис. 39
175
Вычислим производные гиперболических функций. Это,
легко сделать с помощью равенства B4) и теорем о про-
производных:
_е*_+ег*_ h
— е~*) (ех — е~*) _
__esx + 2 -f- e~r* — е8* + 2 — е"8* 4 ,1
_ (g* — c-*) (e* -^ c-*) — (<* + e~*) (g*+e~*) _
(ex
*x — eix—2 — e~ix
§ 6. ПРОИЗВОДНЫЕ СЛОЖНЫХ ФУНКЦИЙ
Теорема. Производная сложной функции равна
произведению производной данной функции по промежу-
промежуточному аргументу на производную этого аргумента по
независимой переменной, если обе эти производные суще-
существуют, т. е. если y = f(<?(x)), то %=¦%'% -(z ==?(*)),
что обозначают еще таким образом: y'x = f'z-z'x, где ин-
индекс внизу указывает, по какой переменной ведется диф-
дифференцирование.
Доказательство. Мы проведем его в предполо-
предположении*, что ни при каком достаточно малом Дя^О ве-
величина Дг не обращается в 0.
Дадим х некоторое приращение Дх. Тогда функция
у (х) тоже подучит некоторое приращение Дг = <р (х + Дх) —
* Теорема справедлива и без этого предположения, которое
делается лишь для упрощения доказательства.
176
— <?(х). В свою очередь функция /(?(*)) получит прира-
приращение Дг/.
Наша задача состоит в отыскании производной ~х,
., Аи тл Аи
которая по определению есть hm —¦. Но отношение ~
а*-» оах ,х
можно представить следующим произведением (если Дг Ф 0):
Д</ Ау Дг
Ах Дг Ах'
Переходя к пределу при Ддс-+-0 и используя теорему о
пределе произведения функций, получаем:
Теорема будет полностью доказана, если мы покажем
что.
Игл %=%
ибо тогда из равенства B6) будем иметь:
dy d у dz
dx dz dx'
По условию теоремы функция f(z) дифференцируема
по z = <f(x), т. е. для любого е^> 0 всегда найдется такое
8 > 0, что, как только будет | Дг | = | ср (х -\- Дд?) — <р (х) | [
так будет выполнено неравенство:
Но функция z = <p'x) в свою очередь дифференциру-
дифференцируема по независимой переменной х, т. е. для любого 8, ^5> 0
всегда найдется такое 8>0, что будет выполнено нера-
неравенство:
^{х + Их)-!?^)]^ при |Ах|<8.
Итак, для любого е^>0 существует такое 8]>0, что,
как только |Дх|<^8, так
177
Иначе говоря,
( + Ах) — <f(x) Дд.^0 Дг
= lira ^ = fz(z),
i. Аи du
т. e. hm д^ = —-.
Примеры. 1) Продифференцировать функцию у = ха, где
a — любое действительное, не обязательно целое число (раньше
мы брали только а целое).
Представим нашу функцию в другом виде: у = х* = ел1ах.
Продифференцируем по правилу дифференцирования сложной
функции:
(/' = (еа 1п *)' = еа 1п * • (а.1п х)' = еа Ых ¦ а Aп х)' =
. а 1
X
Окончательно (ха)' — ах*г~х,-т. е. формула та же самая, что и для
а целого.
2) Вычислить производную функции у = \пх*.
1 2
у' = Aп л:2)' = -^ • 2х = —.
3) Вычислить производную функции i/ = lnchjc»
у' = (In ch л:)' = —г— • sh х = th л:.
4) Вычислить производную функции 1/ = {лга-[-1IA0.
Пусть теперь в сложной функции ^=/ (ср (х)) перемен-
переменная х не является независимой переменной, а сама зави-
зависит от некоторого аргумента и: x = ty(u). Тогда у —
= /(?№(«))),. или У = /B). г = <р(дс), х = ф(«).
Найдем уд. Согласно теореме имеем:
, _dy dz
Уа — ёг Та-
Здесь j| — производная от функции z по независимой
переменной и. Но из этой же теоремы следует:
dz dz dx
du dx'du'
178
dz
Поэтому, подставляя -^ в B7), получаем:
dy dy dz dx
du dz ' dx du'
ИЛИ
Точно так же можно провести рассуждения для лю-
любого конечного числа промежуточных аргументов. Общее
правило будет таково: производная сложной функции
равна произведению производной по первому промежуточ-
промежуточному аргументу на производную от первого аргумента
по второму на производную второго аргумента по треть-
третьему на производную третьего по четвертому и т. д.
Пример. Вычислить производную функции у — In tg к-. ч
Yj
' tgj cos2-2" 2 sin g--cosg-
Упражнения
Вычислить производиые следующих функций:
; 2) у= skifj+^; 3) y =
§ 7. ПРОИЗВОДНЫЕ ОБРАТНЫХ ФУНКЦИЙ
Пусть на некотором отрезке [а, Ь] задана функ-
функция y = f(x) (рис. 41).
Каждому х соответствует некоторое определенное зна-
значение у. Возьмем теперь произвольное значение у* и
попробуем найти то значение х*, при котором y*=f(x*).
Может случиться, что такого х* вообще нет, а может
быть их окажется несколько или даже бесконечно много.
Например, для функции y=sinx (рис. 42) значению
у = 2 не соответствует никакое значение х, а значению
у=1 соответствует бесконечно много значений х:
xh = % + 2k« (k = 0, ±1, ±2, ...).
Определение. Функция x = f~1(y) называется обрат-
обратной по отношению к функции y=f{x), если для любой
179
Рис. 41
пары значений х и у,
удовлетворяющих соот-
соотношению x = f'1(y), бу-
будет y = f(x).
Например, дляфунк-•?
ции у —ах обратной яв- i
ляется функция х = J
= 1па у. Действительно, i
если какие-то х* и у* ".
удовлетворяют равенст-
—^ ву х* — 1пау*, то, оче-
очевидно, иг/* = ах*.
Обратная функция
не обязательно одна, их
может быть несколько
или бесконечно много.
Например, для функ-
функции у=?=х° можно указать две обратные функции:
х = -\-\гу и х = — Уу, так как из обоих равенств сле-
следует, нто х* — у: Функция y=s\nx имеет бесконечно
много обратных функций. В самом деле, пусть у*—лю-
у*—любое число, удовлетворяющее неравенству |y*|=s?l. Тогда -
существует бесконечно много значений х, для которых
sinx — y*. Одно из этих значений х?\ — |-, ^- мы обо-
обозначим x* = arcsin у*.
Функция A: = arcsiny, очевидно, обратная по отноше-
отношению к функции y=sinx, так как если x* = arcsint/*,
то sinx* =у*, или sin (arcsiny*)==y*, т. е. arcsinyecTb
дуга, или угол, синус которого равен у. То же самое
значение у* мы получим, если в качестве аргумента х
функции sin х возьмем число (arcsiny* -\-2kn), где k —
любое целое число (см. рис. 42). Область определения
всех этих функций — отрезок [ — 1, 1], так как |sin;t|<; 1.
Рис. 42
¦;!от
180
Следовательно, любая
функция вида х —
= arcsin у ~j- 2feu есть
обратная функция по от-
отношению к функции
у= sinx..
Остальные тригоно-
тригонометрические функции
также имеют бесконечно
много обратных функ-
функций. Так, для у = cosx
обратной является функ-
функция x = arccos у, оп-
определенная на отрезке
[ — 1, 1] (так как
| cos х | =s^ 1), и все функ-
функции вида х = arccos. у -f-
-\-2Ы (jfe = 0, ±l,±2.
... ), ибо cos (arccos у -(-
+ 2к)
У ;
fPl\
с
0
а >
/\
1
г
Ь х
Рис. 43
Для функций y = tgx и г/ = ctg л; обратные функции
соответственно х = arctg у -\-Ы и х = arcctg y-\-kn (k = 0,
ztl, ±2, ...), которые определены уже на всей числовой
оси, так как tgx и ctgx изменяются от (— оо) до (-f-oo).
Итак, мы привели примеры функций, у которых об-
обратная функция не единственна.
Оказывается, на функцию y = f (x) можно наложить
такие ограничения, что у нее будет существовать единст-
единственная обратная функция.
Теорема. Пусть функция y = f(x) строго монотонна
и непрерывна на отрезке [а, Ь] (рис. 43). Тогда у нее су-
существует единственная обратная функция х = 1~*(у),
определенная на отрезке [/(a), f(b)], также строго моно-
монотонная и непрерывная.
Доказательство. Докажем сначала, что обратная
функция х = f'1 (у) определена на отрезке [/(а), /(&)].
Возьмем произвольное число C?[f(a), f(b)], т. е.
6)
)(
По условию теоремы функция y^=f (x) непрерывна
на [а, Ь]. Поэтому по следствию из теоремы Коши (гл. 4 § 4)
она принимает все лромежуточные между / (а) и f (b) зна-
значения, в .частности, значение С, т. е. существует такая
точка хс, что f(xc) = C и, следовательно, f~1(C) = xc.
181
Так как число С любое из отрезка [f(a), f (b)], то любой
точке из [f (a), f (b)] соответствует точка из [а, Ь]. Таким
образом, функция х — 1~*(у) определена на отрезке [/(а),
/(о)]. Докажем, что она единственна. Предположим про-
противное, т. е. предположим, что существует такое значение
С?; [/(а), /(&)] и такие два значения xcv и х'с' из [а,Ь\,
что }-1(С) = хсц и f-1 (С) = х'с2', или
f(x'cl') = f(x'c2') = C, B8)
и пусть, например, xcl'<ixT-
Пусть для определенности функция y=f(x) возрас-
возрастающая (если бы она убывала, то доказательство не из-
изменилось бы). Тогда для точек х'" и х'с' по определению
возрастающей функции должно выполняться неравенство:
/D")<С/(х'с") (так как Xcv<^x'c'),
но это противоречит нашему предположению. Следова-
Следовательно, равенство B8) невозможно, т. е. функция x=f~l (у)
однозначна.
Пусть теперь у^Уи или f (Xi)^>f (хх). Тогда утверж-
утверждаем, что x^^Xi, или }~* {уъ)^>1~* (f/i). Если бы это было
не так, т. е. было бы хг<^хъ то и f{xt)<if(xi) в силу
строгой монотонности функции y = f(x). Но это противо-
противоречит условию. Следовательно, f~l (й)^>/~а {У\) при у<ц^>У\.
Это доказывает, что обратная функция x=f~1(y) строго
монотонна.
Докажем, наконец, что функция x = f'l(y) непрерывна
в точке С, т. е. для любого е^>0 можно найти такое-
8^>0, что, как толь-
только будет выполнено
условие \у — С(<Л
будет иметь место не-
неравенство:
хс-е хсхс*?
Рис. М
Точке С соответствует
на оси абсцисс точка
f-1 (С) = хс, точке
(хе-|-е) соответствует
точка на оси орди-
ординат— (С -j-8i) и точ-
точке (хс — г) — точка
(С— 88) (рис. 44). Ес-
ля у удовлетворяет
182
неравенствам С — 8а <^ t/ <^ С -|- Sj, то соответствующее ему
значение обратной функции f~l (у) в силу строгой монотон-
монотонности удовлетворяет неравенствам:
Тем более удовлетворятся эти неравенства, если у
будет заключено в интервале (С — 8, С-[-8), где 8 =
= min(8,, 8-»).
Таким образом, для любого значения С из отрезка
[/(a), f(b)] можно по заданному е найти такое 8, что при
\у — С К 8 будет выполнено неравенство \х — f~l (С) | <^ в,
т. е. функция x — f~l(y) непрерывна на всем отрезке.
Перейдем теперь к нахождению производной обратной
функции. Напишем следующее тождество, вытекающее
из определения обратной функции:
(предполагаем, что производная этой обратной функции
существует).'
Дифференцируя его по х как сложную функцию, по-
получим:
1 = (П)И*.
или
(Пу = 1, B9)
если f'x^0.
Эта формула дает значение производной обратной
функции в точке y = f(x).
Пример. Пусть у = х2. Вычислим производную обратной
функции х = угу:
• 1 1 1
Х
Правило дифференцирования обратных функций можно
применить для нахождения производных обратных три-
тригонометрических функций.
1) x = aTcs'my, т. е. y=s'mx (—g-s^jesgg-J. Приме-
Применяем формулу B9):
гр; Ху~Ух~ (sinx)' =Шх'
183
Ho cosx=yi — sin9лг = "|/^ 1 — w9. Поэтому .? = -7=^=^,
J/l —у2
или если введем обозначение y = arcsin^, то получим:
(arcsin x)' =
1 —j
2) x = arccosz/, или y = cosx@^x^w). По фор-
формуле B9):
_ _ 1
х ~ (cos х)' ~ sin х ~ у\ cos2x ~ /1
, _ 1 _ 1 1
Ху ~ У'х ~ (cos х)' ~ sin х
Для i/ = arccosx имеем:
3) x = arctgi/, или y = tgx.
, _ 1 _ 1 ^ 1 1 1
* »' 1 sin8 x 4- cos2 x tga;t+l #2+l*
COS2 X COS* Д?
Получили формулу:
4) jf=arcctgy, или y = ctgx. $*
1 1 ' 1 1
" и' trta тг\'
Ух (ctg-^)' .1 Si^X^C088^
sin2 x sin2 a:
— I 1 >
—-l-j-ctg»* —
Формула для производной функции ?/ = arcctgx имеет вид:
(arcctg x)' — —'¦' yj~г-
Пример. Вычислить производную функции у = arccos |/^1 — л-3.
1
184
Упражнения
1) Вычислить производные обратных функций к функциям:
а) г/ = лг8; 6) у = \пх.
2) Вычислить производные функций: a) i/=arctg(thx);
б) у = arcsin (cos дг).
Таблица производных элементарных функций
Функция
с
X* '
I
X
п,—
ех
а* ¦
In*
logo*
sin a:
tg*
Производная
о
ал:11-1
I "
л;2
1
ех
axln a
1
X
1
л: In а
cos л:
1
cos2*
Функция
CtgAT
sec X
cosec x
arcsin x'
arctg *
arcctg x
sh a:
ch*
ih _*•
cth*
Производная
' 1
sin2 x
sin a:
coss*
cos *
sin8 x
I
1
1
1+a:2.
Г-
1 + *2
ch*
sh x
1
1
sh2*
§ 8. ПРОИЗВОДНЫЕ ВЫСШИХ ПОРЯДКОВ.
ФОРМУЛА ЛЕЙБНИЦА
Если функция y = f(x) дифференцируема на не-
некотором интервале, то после дифференцирования мы полу-
получим функцию /' (х) той же независимой переменной х.
185
К этой функции вновь применим операцию дифференци-
дифференцирования:
(Г(Х)у= и
Если этот предел существует, то его называют произ-
производной второго порядка от функции / (х) и обозначают f" (х).
Взяв производную от /"(х), если эта производная су-
существует, получим производную третьего порядка от функ-
функции /(*): f"{x).
Определение. Производной {п-\-\)-го порядка, или
(n-j-l)-u производной от функции f(x), называется про-
производная от производной п-го порядка от функции f (x),
т. е.
х) = (Р> (х)У = Urn
Да:
Для общности определения производную f (х) назы-
называют производной первого порядка. Функцию, которая
имеет производную п-го порядка, называют часто п раз
дифференци руемой.
Таким образом, отыскание производных высших по-
порядков от какой-либо функции сводится к ее последова-
последовательному дифференцированию.
Приведем ряд примеров на отыскание производных
высших порядков.
1) Найти производную и-го порядка от функции f(x) = xm.
(хт)' — тхт-\ {хт)" = т'Лт — 1) хт~а,
(хтуа)=т(т — 1) ... (от — п +1)хт~я.
Выписанные формулы справедливы для любого т. Если же
т—целое положительное число, то
(хт)ш> = т(т — \)(т— 2) ... (т — т+\) = т\,
т. е. т-я производная от хт есть постоянная величина. Поэтому
(хт)ШН) —0.
Очевидно, и все последующие производные тоже равны нулю:
гхтут+и> _ гхтут+д> — ... = о, т. е. если т и и целые и т < и, то
(хт)(п> — 0.
Будем теперь дифференцировать многочлен степени т:
Рт (х) = ааХ™ + а,**-» + а,*** + ... + ат. ""««
186
Если мы его продифференцируем т раз, то производные от-го по-
порядка от всех слагаемых, кроме первого, будут равны нулю и
Производные же более высокого порядка будут равны нулю,
т. е. Р%+1) (х) = P(m+2(Ar) =... = 0.
Рассмотрим частный "случай многочлена, например у=2х*—
— 3*4-1-
Продифференцировав этот многочлен последовательно три
раза, получим:
у' = 4* —3,
• Начиная с третьей производной, все производные от много-
многочлена второй степени оказались равиыми нулю.
2) у=ех. Эта функция имеет производную любого порядка:
j/' = e-*, y"=iex, у"' = ех, ... , уш> (х) = ех, ... , т. е., сколько бы
раз мы ни дифференцировали функцию у = ех, мы всегда получим
ту же функцию е*.
3) у=-ах. Эта функция также имеет производные любого по-
порядка. В самом деле, как известно, у' = ах 1п а. Дифференцируем
дальше:
у" = ах In a • In a = ах 1па а,
у1" = ах In2 а • In й — ах In8 a,
4) y=.smx. Производя последовательное дифференцирование
и используя известные из тригонометрии формулы приведения,
будем иметь:
у1. — (sin x)' = cos Ar = sin (ЛГ4-
y"=(cos дг)'= — sin ^ = sin(A:4-*'t)>
C \
АГ4--2-"),
> = (sin x)in> = sin (x 4- ^j .
Последнюю формулу легко доказать с помощью метода мате-
математической индукции.
187
5) у = cos х. Так же, как для функции y = $iax, последовав
тельно получаем:
у' = (cos х)' == — sin х = cos (x + 2 ),
j/" = (cos x)" = — cos л: = cos (л: -f-')»
y'" — (cos x)'" — sin л: = cos (x -f-у I.
i/<n> — (cos xyn) = cos fx + y- j.
6) i/ = shx. Из §5 нам известно, что производная от sh не-
неравна ch х, а производная от ch x есть sh x. Поэтому
у1 = (sh л:)' == ch л:,
i/" = (sh.x)" = shx,
j/'" = (sh x)'" = ch x,
т. е. и-я производная от функции shx равна shx при п четном и
chx при п нечетном.
7) Аналогично производным от y=s\\x можно вычислить
производные от функции y = zhx:
i/" = ch л:,
i/'" = sh *,
На этот раз при п четном п-я производная будет равна ch x,
а при и нечетном — sh x.
Для производных п-го порядка остаются в силе не-
некоторые теоремы § 2, доказанные там для производньщ:
первого (порядка. Так, п-я производная суммы любого;
конечного числа слагаемых функций равна сумме п-х про-
производных этих функций, т. е. если
то
Рп) (х) = f w (*)¦+ Пп) (*)-+-•
Точно так же верна теорема: п-я производная от произ-
произведения функции на число равна произведению п-й произ-
производной этой функции на заданное число:
.188
Эти формулы доказываются последовательным примене-
применением соответствующих теорем § 2 этой главы. Подробнее
мы остановимся на формуле для вычисления производных
высших порядков от произведения двух функций.
Пусть и—и(х) и v = v(x). Тогда, как мы знаем, 1-я
производная от их произведения равна (uv)' = u'v-\-uvr.
Вычислим последовательно вторую и третью производные:
(uv)" = u"v -f u'v' + u'v' + uv" = u"v + 2wV -j- uv",
{uv)'" = u'"v -f u"v' + 2«V + 2u'v" -j- u'v" + uv'" = ¦
= u'"v-\- 3u"v' + 3u'v" + uv'".
Мы видим, что коэффициенты в правых частях для
второй и третьей производных те же самые, что и коэф-
коэффициенты в формуле бинома 2-й и 3-й степени. Естест-
Естественно предположить, что это правило соблюдается и для
производных п-го порядка от произведения двух функ-
функций, т. е.
и V + п(п~1)
иу + ... + .
И- nw'yc-^+uoc-'^qw'') j+cy-j V-f q«(»-s) v",-\-... 4-
4-CJ-'u1"-*4-1^1*' + C*u(n-ft)y(ft) 4-....4-Cln uv(n). C0)
Докажем справедливость этой формулы с помощью
метода математической индукции. Для п = 1, 2,3 фор-
формулу C0) мы уже доказали.
Предположим, что она верна и для некоторого п.
Убедимся в ее справедливости и для п-\-\. Продифферен-
Продифференцируем выражение C0):
1' = ulB+% 4- и'")у' + nuWv' + nu^-^v" 4-
и' 4-. ^^"и'"-1^" 4-
+... 4- «у(я+1) == «(п+!)и 4- С1+ i«'")y' 4-.с>(л") V 4-
) C1)
Нам надо доказать, что формула C1) имеет такой же
вид, как и формула C0). В самом деле, в формуле C1)
189
при приведении подобных членов коэффициент при члене
u(n-b+t)vw получается в виде суммы:
Пользуясь определением С*, имеем:
Гк-у | г"— я(я—1)(я — 2) ...(я — fe + 2)
W i~W — (ft—1I
я(я-1)(я-2)...(я —fe+1) _
* я(я—1)(я —2)...(» —* + 2) /i i n—k+\\ .,
¦= (й-1I I1"! ft j—
(я + 1)я(я—1)(я —2)...(я —ft + 2) t
т. е. коэффициенты в формуле C1) имеют тот же вид,
что и коэффициенты в формуле C0). Значит, формула
верна для п -\- 1, а следовательно, и для произвольного
п.
Формула C0) называется формулой Лейбница.
Примеры. 1) Вычислить и-ю производную от функции _у =
х
Остальные слагаемые мы не выписывали, так как все они равны
нулю, потому что в них входят сомножителями производные от
постоянных величин.
2) Вычислить я-ю производную от функции y=s,mx-(xa-\-\).
Используем значения производных высших порядков от smx и
многочленов:
у(п) = sin [х + f) • (х* + 1) + С' sin {x+ (гс~1)я
Здесь, как и в предыдущем примере, остальные слагаемые обра-
обратились в нуль.
Упражнения
Вычислить я-ю производную от функции:
1) у = хп cos х; 2) I/ = sh x • cos x.
190
§ 9. ДИФФЕРЕНЦИАЛ ФУНКЦИИ
Пусть функция y — f(x) имеет производную в
некоторой точке хв, т. е. существует предел
lim -^
Из определения предела следует, что для любого
сколь угодно малого положительного числа г можно
найтн такое положительное 8, что, "как только будет
| Дх | <С 8, так будет иметь место неравенство:
или, обозначив приращение функции
/ (х0 + Дх) - / (х0) = Д/ (х0,
получим: " '
|Д/(х0, Ьх)-Г(х9)-Ьх\<г.\Ах\,
или
Д/(х„ Дх) = /'(х«)Дх + а(Дх), C2)
где |а(Дх)|<е1А^|.
Запишем это равенство приближенно:
(мы отбросили бесконечно малую величину высшего по-
порядка, чем Дх). Значение производной /' (х0) есть неко-
некоторое число и оно не зависит от Дх. Поэтому произве-
произведение /'(хо)Дх прямо пропорционально Дх — приращению
независимой переменной.
Определение. Произведение f^x^kx называется диф-
дифференциалом функции /(х) в точке х0 и обозначается:
) = f'(xo)Ax. C3)
Если мы подставим C3) в формулу C2), то получим:
Д/(х0, Дх) = #(хо) + а(Дх),
где ^~—- ->0 при Дх->0, т. е. полное приращение функ-
функции /(х) в точке х0 складывается из дифференциала
функции в этой точке и величины а(Дх), которая при
Дх-*0 обладает свойством: ° . ¦ -»0.
191
Найдем дифференциал функции у = х:
Но (*)'=1. Поэтому ее дифференциал совпадает с при-
приращением независимой переменной: dx = &x. Следова-
Следовательно, равенство C3) можно записать в виде:
C4)
Из предшествующих рассуждений непосредственно выте-
вытекает, что если функция f (x) имеет производную в точке
ха и, следовательно, справедлива формула C2), то эта
функция имеет и дифференциал C4) в этой же точке.
Верно и обратное утверждение: если приращение
функции y — f(x) в точке х0 может быть представлено
в виде:
(\х), C5)
где а не зависит от Дх, а а (Ах) — бесконечно малая ве-
величина более высокого порядка, чем Дх, то функция
y = f(x) имеет производную в этой же точке и f (хо) — а.
Действительно, разделим равенство C5) на Дх и перей-
перейдем к пределу при Дд:-*-0:
д/(лг„ Их) _,
lim
Дл:
Но это и значит, что f (xo) = a.
Дифференциал rf/ (х) функции / (я) в точке х0 имеет
простой геометрический смысл.
В самом деле, производная /' (х) в точке х0 равна
тангенсу угла наклона касательной к кривой y = f(x)
в точке с координатами
(*о. /(*о)) (рис 45):
й у Поэтому
Рис. 45
И если Д/(х0) означает пол-
полное приращение функции f (x)
х на отрезке [ха, х0-\-Ах],то
df(xa) имеет смысл прираще-
192
ния ординаты касательной, проведенной к кривой y=f(x)
в точке (х0, ,/(х0)). Разность между Д/(х0) и df(x0) есть
величина более высокого порядка малости, чем Дх.
Поэтому, зная значение функции f.(x) в точке х0, мы
можем приближенно вычислить значение этой функции в
точке (хо-\-кх) (если, конечно, Дх достаточно мало),
прибавив к f (х0) значение дифференциала df (x0). Дейст-
Действительно, из формулы C2) следует:
Д/(х0, Дх)=
или
f (*0 + Дх) - / (х0) = Г (х„) Дх + а (Дх). - у
Отсюда
/ (х, + Дх) = / (х0) + f (xt) Дх + а (Дх).
Отбрасываем величину а(Дх) и получаем приближенную
формулу, справедливую при малых Дх:
f(x, + bx)**f (х0) + /' (х„) Дх=/ (xfl) + df (x0). C6)
Эта формула находит широкое практическое применение
в приближенных вычислениях.
Пусть нам нужно, например, вычислить значение функции
\пх в точке l-f-г при очень малом г. Тогда по формуле C6)
имеем:
1
л X-l
Найдем еще sin г для малых значений г:
sin г= sin @-)-г) =» sin О-)- (sin г)' |г_а •2 = cosO-«=z.
Вычислим arctg 1,05.
Применяем формулу C6):
arctg 1,05 я» arctg I + (arctg х)' \x_t • 0,05 =
• 0,05 = 4 + 0,025 «а 0,785+0,025 = 0,81.
1+л:>
-4-
Вследствие существования простой связи между диффе-
дифференциалами и производными легко получить свойства диф-
дифференциалов, аналогичные свойствам производных.
Так, если U (x) = t/(x)-f-z(x), то dU — dy-{-dz,
ибо dU = U' (x)dx = [t/(x)-\-z'(x)]dx = y' (x) dx +
'd \d
7 А. Б, Вакушинскнй - 193
Если y = u-v, то dy = vdu-\-udv, ибо
dy = y'dx = (uv)' dx = (u'v -f- му') dx = v (u'dx) -f- «(u'rfx) =
Так же легко получить таблицу дифференциалов
простейших элементарных функций. Она получается из
таблицы производных умножением соответствующих
производных на дифференциал dx, например, dxn =
n1dx (так как (^у^^1
Глава VIII
ОСНОВНЫЕ ТЕОРЕМЫ
ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ
§ 1. ТЕОРЕМА ФЕРМА
Определение. Говорят, что функция f(x) до-
стигает локального*^ максимума в точке х0, если сущест-
существует такое положительное число Ь, что на интервале
(х9— 8, хо-{-8) выполняется неравенство f(xo)^>f(x) для
всех значений хфх0 из этого интервала (рис. 46). Если
же во всех точках интервала, кроме х = х<,, имеет место
неравенство f(xo)<if(x)> m0 функция f(x) достигает в
точке х0 локального минимума (рис. 47).
На всей области определения функция может иметь
несколько или даже бесконечно много локальных макси-
максимумов и минимумов. Например, функция y=sinx имеет
бесконечно много локальных максимумов xk = -|- -f-
-\-2kic(k = Q, ± 1, ±2,...) и локальных минимумов хл =
= --J + 2ft*(* = 0, ±1. ±2,...).
Определение. Абсолютным максимумом (минимумом)
функции f(x) называют наибольшее (наименьшее) значение
функции на всей ее области определения.
Теорема (Ферма). Если функция f (x) имеет в точке
Хо локальный максимум или минимум и дифференцируема
в этой точке, то производная функции f (х) в точкг х0
равна нулю: /'(хо) = О.
Доказательство. Пусть для определенности функ-
функция }(х), имеет в точке х0 локальный максимум (рис. 46).
Рассмотрим выражение ¦— . По условию
теоремы f(x)<^f(x0) в окрестности точки х0. Поэтому для
всех х, принадлежащих этой окрестности и удовлетворяю-
*) Локальный (лат. localis) — местный, свойственный дан-
данному месту.
Т 1S5
ttXg)
щих условию
имеем:
о
Рис. 46
Так как fr(x0) существует, то
X Xq
Точно так же для
всех х из этой окрест-
окрестности, удовлетворяю-
удовлетворяющих условию х^>х0,-
будет:
/(*)-/(*») <0> B)
X —~ Xq
JC->JC0
ЛГ — Хл
= lim ¦
x-+Xf)—0
X
Но в силу A) и B) имеем (см. замечание к теореме 3 из
§ 3 гл. IV):
Нш '(*>-/<*¦>^о, a Urn
At—jc0—0 * X
¦*
•*• — xo
Вследствие первого неравенства f(xo)^O, а вследствие
второго f'(xo)^O. Отсюда заключаем, что f (xa) — 0.
Совершенно аналогично доказывается теорема в том
случае, когда функция f(x) в точке х0 имеет локальный
минимум (рис. 47).
У I
Рис. 47
Рис. 48
196
Замечание. Условие обращения производной в нуль яв-
является необходимым признаком максимума (минимума) дифферен-
дифференцируемой функции, но не достаточным.- Например, производная
функции у = хг (рис. 48) в точке д: = 0 обращается в нуль
(_у' = 3л:2), но сама функция не достигает в этой точке ни макси-
максимума, ни минимума.
§ 2. ТЕОРЕМА РОЛЛЯ
Теорема (Ролля). Если функция f(x) непре-
непрерывна на отрезке [а, Ь], дифференцируема на интервале
(а, Ъ) и выполнено условие f (a) = f(b), то внутри отрезка
найдется такая точка с, в которой f (c) = 0 (рис. 49).
Доказательство. Обозначим /(а) = f(b) = a.
Если функция f (х) на всем отрезке [а, Ь] постоянна,
то /(х) = а и f'(x) — O в каждой точке отрезка [а, Ь].
Таким образом, в этом случае теорема доказана.
Пусть теперь функция f (х) не является постоянной
величиной на отрезке [а, Ь]. Тогда найдутся точки, в
которых она либо больше, чем а, либо меньше (возможно,
что будут и те и другие). Для определенности предполо-
предположим, что есть такие точки на отрезке [а, Ь], в которых
функция / (х) больше, чем а.
Так как по условию теоремы функция f(x) непре-
непрерывна, то на основании теоремы 1 из § 4 гл. IV заклю-
заключаем, что / (х) достигает своего наибольшего значения М
на отрезке [a, b] (max f(x) — M). Но это наибольшее
[о. *]
значение не может достигаться на концах отрезка, по-
потому что на концах отрезка f(a) = f (b) = а, а мы пред-
предположили, что на отрезке [а, Ь] есть точки х, где / (х)~^>а;
следовательно, тем более М > а и точка с (или точки),
где f(c) = M, находится
внутри отрезка [а, Ь], т. е.
на интервале (а, Ь).
Теперь осталось только
сослаться на теорему Фер-
Ферма. Действительно, функ-
функция / (х) непрерывна на от-
отрезке [а, Ь], дифференци-
дифференцируема в каждой его внут-
внутренней точке, в частности,
в той точке с, где / (с) = М.
Следовательно, по теореме
Ферма /'(с) = 0. Рис. 49
у,
а
0
1
fia)\
а
Ш1 \
1 !
! '»!
1 ! ^
с i х
197
Совершенно очевидно, что доказательство ничуть не
изменилось бы, если бы мы предположили вначале, что
функция f(x) имеет точки, в которых она меньше, чем а.
Только в этом случае мы бы доказали, что наименьшее
значение функции f (х) расположено на интервале (а, Ь)
и снова сослались бы на теорему Ферма.
Замечание 1. Теорема Ролля и ее доказательство не ука-
указывают пути для фактического нахождения точки с. Они лишь
утверждают ее существование.
Замечание 2. Геометрически теорема Ролля означает, что
если функция непрерывна на отрезке [а, Ь] и дифференцируема
на интервале (а, Ь), причем f(a) = f(b), то найдется такая точка с,
принадлежащая интервалу (а, Ъ), что касательная в точке (с, f (с))
к кривой y = f{x) будет параллельна оси абсцисс (рис. 49).
§ 3. ТЕОРЕМА ЛАГРАНЖА
Теорема (Лагранжа). Если функция f (x) непре-
непрерывна на отрезке [а, Ь] и дифференцируема в интервале
(а, Ь), то найдется такая точка с, принадлежащая ин-
интервалу (а, Ь), что в ней будет выполнено соотношение:
и&-. C)
Эта теорема называется также теоремой о конечном
приращении.
Д о'к азательство. Построим вспомогательную
функцию
fiblfa(a) С-а).
Функция <р(х) на концах отрезка [с, Ь] принимает
наковые значения. В самом деле,
Кроме того, функция <р(я), представленная алгебраиче-
алгебраической суммой функций, непрерывных на отрезке [а, Ь] и
дифференцируемых в интервале (с, Ь), непрерывна на
[а, Ь] и дифференцируема. в (а, Ь) (теоремы из § 3 гл. IV
и из § 2 гл. VII). Следовательно, на основании теоремы
198
Ролля на интервале (а, Ь) найдется такая точка с, в ко-
которой <р'(с) = О, т. е.
4 (с) = Г (с)-"8» -',">= О,
откуда
fct
,
Следова-
Следоваи ха — произвольные
Требуемое соотношение C) получено.
Следствие. Если f(x) = 0 на отрез/се [а, Ь], то
f(x) = const на этом отрезке.
Доказательство. Для любых точек xt и xt из
отрезка [а, Ь] найдется точка х* ? (хи х2), такая, что
f(xi) — f(xl) = f(x*)(xi — x1). Но f (*•) = () С
тельно, / (^i) = / (х2) и так как
точки отрезка [а, Ь],
то f(x) = const.
Замечание 1.
Как и теорема Ролля,
теорема Лагранжа лишь
утверждает, что сущест-
существует точка с из интер-
интервала (в, Ъ), в которой
выполняется соотноше-
соотношение C). Как найти эту
точку, теорема не ука-
указывает.
Замечание 2.
Величина
ас b x
Рис. 50
Ь — а
есть тангенс угла на-
наклона хорды, соединяющей точки (a, f{a)) и (Ь, f(b)) кривой
y = f(x) (рис. 50) к оси абсцисс.
Теорема Лагранжа, следовательно, утверждает, что найдется
такая точка с из интервала (а, Ь), что касательная к кривой
y = f(x) в точке (с, f (с)) будет иметь тот же тангенс угла на-
наклона f' (c)=tg а, что и хорда, соединяющая точки (a, f (а)) и (b, f ф)).
Очень часто соотношение C) записывают несколько иначе:
f(b)-f(a) = r(c)-(b-a). D)
Если в качестве точки а взять некоторую точку х, а
в качестве точки Ь точку (x-j-Дх), то равенство D) при-
примет вид:
-f(x) = r(c)bc, E)
199
•где с?(х, jf-f- Длг). Очевидно, с можно представить в
виде: с = х + Qt • Ах, где 8,— некоторое неизвестное нам
число, заключенное между 0 и 1. Тогда соотношение E)
запишется следующим образом:
или
/ (ж + Дх) - / (х) = Г (х) Ах + [f (х + 6,Дх) - /' (х)] Ах F)
(мы прибавили и вычли f(x)Ax).
Если функция f (х) непрерывна на отрезке [х, лг —f- 0jДлс]
и дифференцируема в интервале (х, x + Sj-Дх), то мы
можем и к ней применить теорему Лагранжа:
Г (х+е,д*) - /' (х)=г (х+е, • в, • Дх) • в, • ах @<е,<1). G)
Подставив G) в F), получим:
f (Х_j_ Дх) - / (х) = Г (х). Дх+ Г (х + б2 • в, • Дх) в,Дх • Дх. (8)
Из предыдущей главы мы знаем, что полное приращение
А/(х, Дх) функции /(х) в точке х представляется диффе-
дифференциалом этой функции в данной точке плюс бесконечно
малая величина высшего порядка малости, чем Дх:
Д/(х, Дх) = /(х + Дх)-/(х) = Г(х)Дх + а(Дх). (9)
Из (8). и (9) заключаем, что а(Дх), если существует
/" (х), может быть представлено в виде:
1(ДхJ @<е„
Если обозначим Ма = тах |/"(х) |, то получим оценку
[а, Ь]
разности между приращением функции и дифференциалом:
Fi мы заменили на единицу — от этого неравенство только
усилилось).
Используя формулу (9), для функции sin* можем написать
приближенное равенство:
sin (х + Ах) я» sin х + (sin x)' • Дл\
Поэтому, например, sin C0°+ Г) s» sin30° + cos30° -0,0175 = -g- +
+ ^-- 0,0175 s» 0,5151 (Г «=0,0175 радиан).
200
Оценим погрешность вычислений: | а (Дл-) | ^ Ма (Дл-)9 =
= max | (sin х)'|-0,01759 = 0,01759< 0,0004. Таким образом, мы на-
нашли sin 31°, совершив ошибку не более чем на 0,0004.
Пользуясь результатами настоящей главы, мы можем
оценить погрешность, с которой приближается функция
f (х) интерполяционным многочленом.
Рассмотрим для простоты случай линейной интерпо-
интерполяции, т. е. случай, когда функция f(x) приближается
интерполяционным многочленом первой степени Pi (я),
построенным по узлам х0 ил,,
Будем считать, что f(x) имеет 1-ю и 2-ю производные.
Строим вспомогательную функцию
<р (X) =/ (X) — Pi (X) — k(x — ДС0) (X — Xi).
Очевидно, <р (л;) обращается в нуль в узлах интерпо-
интерполяции хй и хи Кроме того, мы можем так выбрать по-
постоянную k, чтобы <р (л;) обратилось в нуль в той точке %
отрезка [х0, Xi], где мы оцениваем погрешность прибли-
приближения. Для этого достаточно положить
(знаменатель здесь не равен нулю, так как X не совпа-
совпадает с узлами интерполяции, в противном случае погреш-
погрешность просто равнялась бы нулю).
Итак, функция у(х) дифференцируема и обращается
в нуль в точках х0, Xi и х. Следовательно, на основании
теоремы Ролля производная у'(х) обращается в нуль по
крайней мере в двух точках — у0 и yt (уо^(хй, х),
z/i(^(jS, Xi)). В свою очередь функция у'(х) дифференци-
дифференцируема и удовлетворяет условиям теоремы Ролля, обра-
обращаясь в нуль в точках у0 и уи Следовательно, существует
по крайней мере одна точка z0, в которой у' (zQ) = 0.
Но
?' (х) = f (х) - Р[ (х)-[k (х-*ь) (x-Xi)}' = Г (х) - 2k.
Подставляя в последнем равенстве x = z0, получаем:
т'(г0) = 0 = /'(г,)-2*,
откуда
— 2 ' v11/
где г0 ^ (дс0, Xi).
201
Теперь, используя A0) и A1), можно написать иско-
искомую погрешность
/ (х) - Р, (х) = ^- (X - х0) (х - х,).
И если наибольшее значение абсолютной величины функ-
функции f" (х) на отрезке [х0, xt] равно Mit то оценка при-
примет вид:
\f(x)-Pl(x)\<:^\(x-x0)(x-x1)\.
Совершенно аналогично можно получить оценки и в
случае, когда число узлов больше двух.
Пример. С какой погрешностью можно вычислить In 10,3,
с помощью интерполяционного многочлена, если известны значения
1а 10 и In И?
Здесь f(x) = \nx, лго = 10, л-, = 11, X = 10,3. /' (х) = г и,
. следовательно, Ма == ТпГ == Тпп• Таким образом, | In 10,3 —
|A0310)A0311)| 0307 000105' ТаК0"
2О
ва будет погрешность результата в данной точке X = 10,3, если
мы заменим функцию In jc интерполяционным многочленом Р, (х),
построенным по узлам лго=1О и л:1 = 11.
Глава IX
ИССЛЕДОВАНИЕ ФУНКЦИЙ
ПРИ ПОМОЩИ ПРОИЗВОДНЫХ.
ФОРМУЛА ТЕЙЛОРА.
ФУНКЦИОНАЛЬНЫЕ РЯДЫ
§ 1. ВОЗРАСТАНИЕ И УБЫВАНИЕ ФУНКЦИИ,
ТОЧКИ МАКСИМУМА И МИНИМУМА
В этой главе мы увидим, что, чем больше поря-
порядок производных, которые имеет функция y=f(x) на
некотором отрезке [а, Ь], тем полнее удается исследовать
характер этой функциональной зависимости. Предположим
сначала, что функция y=f(x) имеет всюду на отрезке
[а, Ь] первую производную /'(я). Основой для нашего
исследования послужит простая лемма, доказательство
которой опирается на теорему Лагранжа.
Лемма. Если f(x)<^0 всюду на отрезке [а, Ь\, то
функция f(x) убывает на [а, Ь]. Если f (х)^>0, то f(x)
возрастает на [а, Ь] (отрезок может быть заменен ин-
интервалом или полуоткрытым интервалом).
Доказательство. Пусть, например, f'(x)<^0.
Тогда по теореме Лагранжа для любых двух точек xt
и х% таких, что хи х% (? [а, Ь] и Xi<^x<i будет выполняться
равенство:
>0
так как x1 — xi<^0 и f (c)<0. Следовательно, /()>
^>f(Xi) при x1<^xi. Но это и означает, что f(x) убывает
(см. гл. II).
Вторая часть леммы доказывается аналогично.
Пример. Исследовать поведение функции </ = лг8 на интер-
интервале @, 1). Имеем: ^' = Зд:9>0 на @, 1). Следовательно, у = х*
возрастает на интервале @, 1).
Рассмотрим теперь общий случай, когда производная
f (х) может менять знак на отрезке [а, Ь]. Предварительно
находим точки [а, Ь], в которых f (х) обращается в 0.
По теореме Ферма мы знаем, что f (x) обязательно обра-
обращается в 0 в точках максимума или минимума функ-
203
ции f (x) (если эти точки находятся строго внутри отрез-
отрезка). Исследование знаков f (х) в окрестности такой точки
позволяет выяснить, является данная точка точкой макси-
максимума (минимума) или нет.
Пусть х0 ? (а, Ь) и f (х„) = 0. Если f (x) ^> 0 на не-
некотором полуоткрытом интервале [с, х0), лежащем левее
точки х0, и f (x) <^ 0 на некотором полуоткрытом интер-
интервале (х0, d], лежащем правее точки х0, то точка х0 яв-
является точкой максимума функции y = f(x). Действи-
Действительно, по лемме как на полуоткрытом интервале [с, х0),
так и на (х0, d] будет справедливо неравенство / (х) <С / (*о)>
т. е. точка х0 есть точка максимума функции f(x).
Совершенно аналогично можно показать, что если
f'(x)<^0 на [с, х0) и f (х)^>0 на (хо, d], то точка х0
является точкой минимума функции f(x).
Если при переходе через точку ха f (x) не меняет знака,
то в этой точке нет ни максимума, ни минимума.
Замечание. При исследовании функции бывает по-
полезно исследовать ее поведение вблиаи тех точек, где /' (я)
не существует. Часто эти точки также оказываются точ-
точками максимума или минимума.
Например, функция у= — \х\ при х=0 не имеет
производной. Однако в этой точке у достигает макси-
максимального значения.
Итак, зная производную данной функции y = f(x), мы
можем находить участки возрастания (убывания) функции,
точки максимума и минимума, а значит, исследовать функ-
функциональную зависимость и изображать ее на графике
гораздо подробнее, чем это мы могли делать до сих
пор.
2Х
Пример. Исследовать функцию У = -Гл1—I (°бласть определе-
\ а 1s
\ ^
ния — оо < л: < со), у'= 2 , „8 . Решая уравнение
найдем точки экстремума: xt =—I, xs = \.
При —со<лг<—1 у'<0 (функция убывает).
При —1<л-<1 #'>0 (функция возрастает).
При 1<лг<оо </'<0 (функция убывает).
Следовательно, точка Xt=—1—точка минимума, а л:9= 1 —
2х
точка максимума. Учитывая, что y = YZi—а — Функция нечетная,
2.x
у@) =0 и lim -———j = 0, мы можем построить примерный гра-
ж-*нноо 1 -г X3
фик нашей функции (рис. 51).
204
Рис. 51
Упражнения у
Найти точки максимума и минимума, выяснить их характер,
определить участки возрастания и убывания функции, построить
графики следующих функций:
О I „ у2 О\ *,
е~х, 5) y—Vx'~l-
= exsmx, 6) Найти прямоугольник дан-
данного периметра 2р, имеющий
наибольшую площадь.
§ 2. АНАЛИТИЧЕСКИЕ ПРИЗНАКИ МАКСИМУМА
И МИНИМУМА. ВЫПУКЛОСТЬ И ВОГНУТОСТЬ
КРИВОЙ, ТОЧКИ ПЕРЕГИБА
В этом параграфе мы еще более детально иссле-
исследуем функцию y = f(x), предполагая существование у нее
второй производной f"(x). Прежде всего покажем, как,
зная вторую производную функции у = f(x), распознавать
точки максимума (минимума) функции. Пусть точка ха
есть точка, в которой f'(xo) = O. Пусть, кроме того, в
окрестности точки х6 существует вторая производная f (х).
Если х — точка, лежащая в достаточно малой окре-
окрестности *„, то, пользуясь теоремой Лагранжа и приемом,
примененным в § 3 главы VIII, можем написать:
(с) - Г (*„)] (х - *„).
Учитывая, что /' (с) — f (х0) = f (с,) [с — xo]nf (xo)=O,
окончательно получим:
/(*)-/ (х,) = Г (с,) (х - хй) (с - х,). A)
Если л:г^л:0, то и с^хв, соответственно, если х^х0, то
и с^х0, поэтому (х — хв)(с — xo)SsO при любом х, взятом
справа или слева от точки х0. Итак, если в некоторой
205
окрестности х<у выполнено неравенство f" (х) ^> О, то
f(x)^>f(x0) и точка х0 будет точкой минимума. Если,
наоборот, f"(x)<^0, то f(x)<^f(x<,) и хо будет точкой
максимума. Можно сделать этот критерий более удобным
для применения. Пусть /" (я) непрерывна в окрестности
точки х0. Будем исследовать знак f" (х) т о л ь к о в точ-
точке х0. Пусть /" (ха) у> 0. Тогда в силу непрерывности f" (x)
и в некоторой окрестности точки х0 будет /" (х) ^> О
(см. § 3 гл. IV). И, следовательно, точка хй есть точка
минимума. Если f"(xo)<^O, то и в некоторой окрестно-
окрестности ха будет f (х) < Q и точка х0 будет точкой максимума.
Наконец, возможен случай f"(xo) = O. Тогда необходимо
исследовать первую производную в окрестности точки х9
или знак второй производной в окрестности хй (если
/"(х)>0(л;^л:0), то х — минимум, если /"(*)<0, .то
ха — максимум, если /" (я) меняет знак в точке х0, нет ни
максимума, ни минимума).
Пример. Исследуем этим способом функцию у = 3х—х".
Имеем: у' = 3 — Зл:9 = 3A — Xs); у' = 0 при лг, = 1, л:8=— 1. у" =
= — 6х, у" A) = —6 (#"<0; следовательно, лг=1 — точка макси-
максимума)../^— 1) = 6(/'>0; следовательно, х = —1 — точка мини-
минимума).
Эти выводы легко подтвердить, рассмотрев знаки первой про-
производной. График функ-
функции представлен на ри-
рисунке 52.
Исследуем теперь
такое свойство функ-
функции y = f(x), как вы-
выпуклость. Мы дадим
сначала геометриче^
ское определение это-
этого понятия.
Определение.
Функция y = f(x) на-
называется выпуклой
вверх (вниз) на отрез-
отрезке [а, Ь], если ее
график на этом от-
отрезке лежит ниже
(выше) любой каса-
касательной на этом от-,
резке (рис. 53).
Рис. 52
206
Сами точки касания в расчет при этом не принима-
принимаются. Можно дать и аналитическое определение.
Так, функция y = f(x) называется выпуклой вверх на
[а, Ь] (рис. 53 а), если f(х) — f(х0)-f (*„)(х — хо)<О
(х=?х0 и х, ха ? [а, Ь]). Если же это выражение больше
нуля, то функция выпукла вниз (рис. 53 б)).
б)
Эта формулировка есть просто перевод предыдущего
определения на язык символов.
Пользуясь тем же приемом, что и при выводе равен-
равенства A), получаем:
/(*)-/ (*•) - Г (*б) (х - *о) = Г Ы (х ~ я,) (с - х0),
где d и с лежат между л;0 и х. Так как всегда (* — х0) X
X (с — ^о) 5г 0, то знак левой части полностью опреде-
определяется знаком /" (ci).
Окончательно, если f"(x)^>0, то функция выпукла
вниз на этом отрезке; если f (x)<^0, то она выпукла вверх.
Особое внимание нужно обращать на точки, в кото-
которых f'(x) = 0. Если f" (х) при переходе через эти точки
меняет знак, то они отделяют области выпуклости в одну
сторону от выпуклости в другую. Точки, которые отде-
отделяют области выпуклости в одну сторону от выпуклости
в другую, называются точками перегиба. Если же при
переходе через эту точку знак f" (x) не меняется, то f(x)
сохраняет направление выпуклости.
В заключение этого параграфа мы приведем пример-
примерную последовательность действий при построении графика
функции и ее исследовании, которой целесообразно при-
придерживаться.
207
1) Находим область определения функции, точки,
в которых она обращается в 0 (нули функции), исследуем
ее четность, периодичность.
2) Определяем точки разрыва функции.
3) Определяем поведение функции на концах областей
определения (в частности, при jc->--f-oo и при л;-> — оо)
и находим асимптоты (если они есть).
4) Строим примерный эскиз графика.
5) Находим f (х), точки в которых /'(*) = О, области
возрастания и убывания функции, точки максимума и
минимума.
6) Находим f" (х), точки в которых /"(*) = О, области
выпуклости, точки перегиба (при этом желательно иссле-
исследовать точки, в которых f" (х) не существует. Они могут
также оказаться точками перегиба).
7) Уточняем примерный график функций.
Пример. Исследуем функцию у = х-\ . Область опреде-
определения вся числовая прямая, кроме точки ^=.0. f(x) = — f(— х),
т. е. функция нечетная. Уравнение х-\-^— = 0 не имеет корней.
Рис. 54
208
Следовательно, функция не имеет нулей. Функция непрерывна
всюду, кроме точки х = 0. Мы уже знаем (см. § 1 гл. IV), что
асимптотой этой функции является прямая у = х (при х — -\-со
и при х—-—оо). Находим теперь f(x) = \ g-, Таккакфунк-
ция f (х) нечетная, то достаточно ее исследовать только при л:>0.
Находим точки, в которых р(лг) = О: 1 г = О,дг1 = 1, f(l) = 2;
при х > 1 f (х) ;> 0 (функция возрастает), при 0 < х < 1 f (x) < О
(функция убывает). Следовательно, х=^=1—точка минимума.
2
Находим f"(x) = —j-. /"(лг)>0 при лг>0. Следовательно,
функция выпукла вниз при лг>-0. Окончательно график этой функ-
функции имеет вид, показанный на рисунке 54 (при лг<0 ветвь графика
получена симметрией относительно начала координат).
Упражнения
Провести исследование (используя f (х) и f (л:)) и построить
графики следующих функций:
1) у = х-ех; 4) j/=-i?; 6) y = \n(cosx);
Ух
2) у=(х+\){х — 2)8; 5) {/ = x + arctgx; 7) {/=sin
\
3) У = *\
(можно без использова-
использования
§ 3. ШОРМУЛА ТЕЙЛОРА ДЛЯ МНОГОЧЛЕНОВ
И ПРОИЗВОЛЬНЫХ ФУНКЦИЙ
В этом параграфе мы получим важное обобщение
уже известной нам формулы (§ 9 гл. VII):
(h), B)
полученное Тейлором. Вид этого обобщения подсказы-
подсказывается следующей точной формулой, называемой форму-
формулой Тейлора для многочленов.
Пусть имеется произвольный многочлен f(x) = atxn-{-
+ fli^ + •. • -j- an. Оказывается, что при любых х и h
имеет место следующая формула:
Это и есть формула Тейлора для многочленов.
209
Доказательство. В многочлене f(x-\-h) раскроем
все скобки и расположим члены по степеням к:
f(x-\-h) = bn(x)-\-bn_i(x)h + ... + bl>{x)hn. C)
Найдем теперь коэффициенты Ь„_ь(х). Полагая /z = 0, по-
получаем bn(x) = f(x). Продифференцируем тождество C)
по h:
f (х + h) = b^ (x) + 26„_2 (х) ¦ h+... + nb0 (x) hn~K
Полагая здесь /z = 0, получаем: ->
Дифференцируя еще раз и снова полагая h = 0, полу-
получим:
Поступая далее подобным образом, получим:
°n-k (X) — ?j .
Таким образом, действительно
f!7J) (x\
... + i-pA'.
1 n\
Формула Тейлора для многочленов доказана.
Пусть теперь/(л;) — произвольная функция, заданная
на отрезке [а, Ь] и имеющая на нем п производных, а х
и x-\~h принадлежат отрезку [а, Ь]. Составим выражение
вида:
Ь„(х, h) = f
Только что доказанная нами формула Тейлора для
многочленов приводит к мысли об использовании написан-
написанного выражения в качестве приближенного значения для
l(x-\-h). Действительно, очевидно, что
lira {f(x + h)-Ln(x, Л)} = 0.
Л-+0
210
Поэтому при достаточно малых h можно написать:
*La(x, h), D)
и это приближенное равенство выполнено тем точнее, чем
меньше п. Для строгой оценки точности приближенного
равенства D) нужно оценить величину разности f(x-\-h)~
— Ln(x, h) = rn(x, h) в зависимости от п, х, п. Это мы
сделаем в следующем параграфе.
Используя гп(х, К), можно написать:
. + -^^h» + rn(x, h).
Эта формула и называется формулой Тейлора для функ-
функции f(x) или разложением функции f[x) no формуле Тей-
Тейлора в окрестности точки х. Эту формулу часто пишут
в виде:
+ Л|(*о, h) (x — xo = h). E)
Пусть точка лго = О принадлежит рассматриваемому
отрезку. Разложение Тейлора E), записанное в точке
хо = О, называется формулой Маклорена:
Примеры. 1) Рассмотрим функцию у = ех. Она имеет про-
производные любого порядка при —сю^лг^сю. Напишем для нее
разложение Маклорена, учитывая, что (ех)х_0=\, (еЛ)^_о= 1,....
.-., (е*)"=0=1, имеем:
+ ? + ? + :..+?
Если бы мы имели оценки для остаточного члена гп @, х), то
этой формулой можно было бы пользоваться для составления таб-
таблиц функции ех и вообще вычисления ее значений в произвольной
точке.
Посмотрим, к каким результатам приводит формальное пользо-
пользование этой формулой. Вычислим например, е0>5, пользуясь прибли-
Х Х'
женной формулой: е*«*1+-* + 9Г + оГ- Имеем: ео>5«з 1-f-0,5 -f-
= 1,6458. Из таблиц ех имеем: е»-* = 1,6487. Совпа-
211
4^lf^
2л о!
дение достаточно хорошее
2) Рассмотрим функцию у = \пх и будем разлагать ее по фор-
формуле E) в окрестности точки л;0=1.
—1(л:-
/ 1 \7J-1
гяA,-г).
3) Рассмотрим функцию у = sin х. Разложим ее по формуле
Маклорена, учитывая, что (sin*)"" = sin [лг-f-^ ):
0, x).
4) Функция у — (I-\-x)a, где а — положительное, не целое чис-
число уш = а (а—1) ... (о — я+ О A -\-х)*-п. Напишем для этой
функции формулу Маклорена:
a(*l) Х*+ ... +
Эта формула есть непосредственное обобщение формулы бинома
Ньютона. Действительно, при а = я г„ @, х) = 0, и обе формулы
совпадают
совпадают.
Упражнения
1) Разложить по формуле Маклорена с я членами функции:
а) у = sin2 л:; б) у = л;е*. _
2) Написать разложение Тейлора функции у = Ух в точке
лго=1, считая я = 5.
§ 4. ОСТАТОЧНЫЙ ЧЛЕН ШОРМУЛЫ ТЕЙЛОРА
Чтобы пользоваться формулой Тейлора не фор-
ально, нам необходима эффективная оценка остаточного
члена, которой мы и займемся.
Предварительно докажем лемму.
12
Лемма. Если две функции <р (х) и ф (х) на некотором
отрезке [а, Ь] имеют л+1 производную и в некоторой
точке х0 ? [а, Ь] справедливы соотношения:
<р(п+1)(л:M5ф(л+1)(л:) при
/тго
<р (х) Ss ф (х) лрн х > *о-
Доказательство. Докажем, что <р(п)(х)^ф(п) (х)
при x^x0.
Обозначим ф(п) (х) — ф(п)(д;) = Чг (х). По условиям тео-
теоремы *Р(д:о) = О. Используя теорему Лагранжа, получим:
W (х) = W (х) — W (Xl>) = W (с) (х — *о) =
— ф(л+1) (с)) (х — хй)^0 при
Итак, ф(п) (х) ^ ф(л) (х) при х^д;0.
Точно так же докажем, что ср1"") (д:) ^ ф1") (х) при
Наконец, у(х)^^{х) при
Переходим к оценке остаточного члена г„ (х, К) фор-
формулы Тейлора.
rn(x, h) = f( ^{fi
Будем предполагать, что у f(x) существует п-\-1 непре-
непрерывная производная на отрезке [а, Ь]. Сначала рассмот-
рассмотрим случай h^>0.
Введем вспомогательную функцию:
... М ¦ hn+1
где
Дифференцируя <?(h) n-\-l раз по h, получим:
213
Зафиксируем величину х. Тогда, дифференцируя rn(x, h)
по Л и полагая ft = 0, получим:
гп(х, 0) = <р@) = 0,
г'п(х, 0) = ?'@) = 0,
г%+1Цх, А) = /<•"> (ж + ft).
Из последнего равенства и определения величины М
заключаем:
— <р<»+»(А) ==? /•<,"+>>(*, h) =s? ф(я+»{h)
при Л^>0. Отсюда по лемме:
Переходим к случаю отрицательных ft. Введем поло-
положительное число hi = — А. Очевидно,
г»(*, h) = rn(x, -h,), F)
?(*) = ? (-fti).
Рассмотрим теперь эти функции аргумента hi. Диф-
Дифференцируя п-\-\ раз по Ль получим:
гя(х, 0) = (р@),
— ft,) = ( — 1)ж+ » Л*.
В случае, когда п -f-1 четно, будет:
_ft,)
Пользуясь леммой и учитывая F), получим:
— <р(А)^г„(х, ft) < «р (ft). (**)
Кроме того, в этом случае будет <р(й)>0.
214
Наконец, когда п -f- 1 нечетно, <р (h) < 0 и выполнено
неравенство срС+Ч (— fci) =s?г^Н-1» (*, — /i^ss — <p<"+i>( — h{)
при fti>0, откуда по лемме будем иметь:
x, — hi)^ — cp( — ft,). (*•*)
Итак, мы получили три неравенства, оценивающие в
разных случаях остаточный член гп(х, к). Эти три нера-
неравенства эквивалентны одному, именно:
при любом положительном или отрицательном h. Дей-
Действительно, при h^>0 это неравенство эквивалентно (*),
при ft<^0 это неравенство эквивалентно (**) при п-\-1
четном и (***) при n-f-'l нечетном.
Окончательно получаем оценку остаточного члена гп (х, К)
при любых х и x-\-h, принадлежащих [а, Ь]\
max \fin+11(x)\-\k\n+l
Ых, h)\^ а^\ (я + 1), . G)
Пользуясь этой оценкой, можно определить, какую мы
делаем ошибку, вычисляя f(x-\~h) по формуле Тейлора
с заданным числом членов п. Перепишем оценку G) при-
применительно к формуле E):
Пользуясь ею, оценим, например, величину разности:
п
gX 'V X_ __ r /Q х\
ma|/(x)| (
io,*i { 1 х<0. Тогда
?9 (8)
Следовательно, так как lim ¦¦ х. ... =0 (§2 гл. III),
ошибка формулы Маклорена для функции ех стремится
к 0 с ростом п.
215
При х=1 получаем замечательную формулу:
п
Li k\ • '
Ошибка этого равенства не превышает -г. Из нашей
оценки так же следует, что
Действительно, ряд в правой части сходится, и его сумма
в силу оценки (8) равна е. Точно так же могут быть по-,
лучены оценки остаточных членов остальных разложений
элементарных функций, рассмотренных в предыдущем
параграфе (см. упражнения к этому параграфу).
Из оценки остаточного члена G) следует, что
А-0
Значит, формулу Тейлора можно написать и таким обра-
образом:
t I'v I U\ \^ uk I УХ1 ! „ (Un\ /Q\
I \X -j— n) = у ч г; p v** / > ' /
* = 0
где
lim a , „ = 0.
а—о n
Пусть каким-либо образом нам удалось представить
f{x-\-h) в виде:
где функция р (И") обладает свойством lim .я = 0. До-
Л0 "
Л-.0
л
кажем, что многочлен ^ Bthn~l—обязательно многочлен
Тейлора. Для этого сравним его с истинным разложением
Тейлора (9), вычитая одно из другого:
216
Устремляя h к нулю в этом тождестве относительно /г,
получим: 0 = В„ — f(x), т. е. Bn — f(x). Далее, деля на Л
R(fl>t\ a(hn)
и учитывая, что lim ——'—г—-—' = 0, получим при h ->- 0:
а*о "
г-Г(х) = 0, т. е. В^ =
Аналогично Bk= .^ при k = 0, ... п. Кроме того,
) $(). Это значит, что'наше разложение обяза-
обязательно совпадает с разложением Тейлора. Доказанное
свойство единственности разложения f(x-\-h) по степеням
h позволяет иногда упростить вычисления многочлена
Тейлора с заданным порядком остаточного члена.
Разложим, например, функцию е~х' по формуле Маклорена.
Для этого поступим следующим образом. Мы знаем из § 3, что
Положив t = —xs, получим:
. lim i!?!!)=o.
*-о х1п
Согласно доказанному свойству единственности это есть формула
Маклорена для функции е~х". Прямое получение такого разложе-
разложения по формуле E) сопряжено с большими трудностями, связан-
связанными со счетом (е~*')"".
Используя разложение Тейлора, можно легко раскры-
0
вать неопределенности выражении вида -д-, т. е. в случае,
когда пределы числителя и знаменателя равны нулю.
Пусть /(*,) =/>(*,)==... = ;<*>(*,) = 0, /<*+1>(х0)^0
и g(x,) = g(xt) = ... = glHx%), g('+1) (*о) 9* 0. Нужно най-
найти предел вида lim f-^.
217
Разлагая числитель и знаменатель по формуле Тей-
Тейлора в точке Хо до порядков k -j-1 и /-f-1 соответственно*
получим:
О при
не существует при
rr и ^ .1 — COS X
Пример. Найти lim =— .
Разлагая по формуле Маклорена A—cos*) в точке х = 0,
получим:
1—
lim1
Xs ж-Го *2 — 2 *
Упражнения
1) Оценить остаточный член формулы Маклорена иа отрезке
[О, 1] для следующих функций: y = sinx; y — cosx; y = ln(\-{-x)
(на отрезке [0,5; 1]).
2) Разложить до членов я-го порядка в точке х = 0 по фор-
формуле Маклорена: а) г/ = 1п.-^—; б) i/=; a"
3) Найти пределы: a) lim eXsiax~* (!+*) . б) lim(* —
*-»0 ,Х л-юо
/ 1 \\
— л;2 -1
§ Б. ФУНКЦИОНАЛЬНЫЕ РЯДЫ.
РЯДЫ ТЕЙЛОРА
Предположим, что функция y = f(x) имеет про-
производные любого порядка в окрестности данной точки х0
(например, функция у = ех). В этом случае можно напи-
написать формулу Тейлора (или Маклорена) любого порядка,
и даже написать формально следующее выражение:
оо
Z—п\—{х~Хй) ' ¦
k=0
Это так называемый ряд Тейлора (функциональный
ряд, каждый член которого есть функция от х). Вообще,
218
пусть имеется последовательность функций fk(x) (k = 0,
1, 2, ...), определенных на некотором числовом множе-
множестве D, например на отрезке [а, Ь].
Определение. Функциональным рядом называется вы-
со
ражение ^ fk (*)•
fc = 0
Определение. Функциональный ряд называется схо-
сходящимся в точке Хц, если все его члены определены в этой
со
точке и сходится числовой ряд 2 /* (*<>)•
Функциональный ряд, сходящийся в каждой точке мно-
множества D, называется сходящимся на множестве D.
со
Определение. Ряд ^ fh(x) называется сходящимся
fc = 0
на множестве D к функции <р (я), если при любом х0 ?
оо
числовой ряд 2 fk(x<>) сходится к числу <?(х0):
ft=0
В таком случае ср (х) называется суммой функционального
ряда на множестве D.
Из этого определения непосредственно следует, что
оо
для того, чтобы ряд 2 fk (х) сходился к ср (я), необходимо
и достаточно, чтобы:
lim rN(x) = lim (ср (х) - 2 U (*)) = 0 A0)
JV-»co ЛГ-»оо А = 0
при всех
оо
Определение. Ряд ^ /а (*) называется абсолютно схо*
k = 0
со ,
дящимся, если сходится ряд 2 I/*(#)!• Заметим, что аб-
солютную сходимость функционального ряда в точке
можно установить, пользуясь, например, признаком Да-
219
ламбера (гл. Ill, § 5). Область D его абсолютной схо-
f ix)
димости можно найти так. Пусть lim ¦ ?+/ V
Область D значений х, для которых ф (х) <^ 1, будет об-
областью абсолютной сходимости данного ряда. Область
тех х, для которых ф(х)^>1, будет той областью, где
ряд расходится. В тех точках, где ф (х) = 1, требуется
дополнительная проверка.
Пример. Исследуем область абсолютной сходимости следу-
ющего функционального ряда: ^] х-(\
л=0
ф (л:) = lim
п-юэ
fn+l (X)
fn(x)
= lim
Л-ЮО
х)п. Имеем:
хA-ху
х{\— х)п'
= 11—л;!.
Очевидно, ф (х) < 1 при 0<л:<2. Значит, в этом интервале ряд
сходится абсолютно. При х = 0 ряд, очевидно, сходится, так как
все его члены обращаются в 0. При л: = 2 и при лг<0 и х>2
ряд расходится.
Вернемся теперь к ряду Тейлора, построенному при
помощи данной функции/(х). После формального его на-
написания возникает вопрос о его сходимости. Особенно
важен случай, когда ряд
k\
сходится на данном множестве к функции f(x), при по-
помощи которой он образован. Согласно A0) это будет
тогда и только тогда, когда
lim rN(x<>, x — Xo)= lim
N JV
N
2/'*' О
—w
(х0)
= 0.
Другими словами, когда остаточный член формулы
Тейлора стремится к 0. Для произвольной функции f(x),
для которой формально можно написать ряд Тейлора,
изучение остаточного члена весьма сложно. Однако для
некоторых элементарных функций, имеющих удобно ис-
исследуемые /(ft) (xo)i можно пользоваться оценкой вида G),
полученной в предыдущем параграфе.
220
Проведем это исследование для функций е, sin* и In (I -rf-л:).
00
1) Функция у = ех. Напишем для нее ряд [аклорена: У, ~Ш'
Для остаточного члена г „(О, *) имеем оценку S):
Так как lim' 5—= 0, то НтГдДО, *) = 0 ги всех — оо<^<
<оо. Итак, -*
оо
е* = 7 -ГГ- при — оо < * < о.
2) Функция г/ = sin лг. Ряд Маклорена для ie будет:
оо
2
Sin -к- «
2 ¦**.
Ш
Оценим остаточный член:
и max 17+1' (х) \ = 1
Согласно G) имеем: 1^@, х) |< „ . ...-. 1ы видим, что, как
и в предыдущем случае, lim | г„ @, л:) | = 0 пр —оо<л:<оо и,
N—*со
следовательно,
Эта формула широко используется при оставлении тригоно-
тригонометрических таблиц.
3) Функция у = 1п 11 -\-х |. Ряд Маклорен.для нее, ках это
следует из результата § 3, будет:
221
Учитывая, что /^лг+1'(л-)= ' L, получим:
0+*)
1 )xN+l\
I rN @, х) КтгЛл • ,, , -Д-
"]
Докажем, что при 0 =g х =S 1 lim г„ @, л:) = 0.
Действительно, в этом случае min {\^-x)N=\ и |г„@, л:) |
[0, л^)
+ +
Отсюда вытекает требуемое утверждение. Мы доказали, что
со
=2 —~т~^при
Замечание, более аккуратные оценки '"„(О, х) показывают,
что это разложение справедливо и при — 1 < х ^ 0.
Упражнения
1) Используя признак Даламбера, найти области абсолютной
со
. V (— 1)"/ 1 —Л"
сходимости функциональных рядов: а) У —I . , I ;
'со. • • ¦
Li Л
п=1 '
2) Используя оценку остаточного члена формулы Тейлора,
доказать, что е* = ехо > -i—v - ¦ ¦ (х„ — произвольное число).
3) Написать разложение Маклорена для функции y — sin'x.
Исследовать остаточный член и доказать, что это разложение при
любом х сходится к sin2*.
Глава X
функции многих пере1у:нных
§ 1. ОПРЕДЕЛЕНИЕ ФУНКЦИИ
НЕСКОЛЬКИХ ПЕРЕМЕННЫ)
В этой главе мы будем изучгь более общие
функциональные зависимости, чем те, ксорые изучались
в предыдущих главах. До сих пор мы изучали зависи-
зависимость одной величины от другой (одной Однако часто
случается, что некоторая величина зансит от многих
независимых величин, и важно учитыватюлияние каждой
из них. Например, сопротивление провдника электри-
электрическому току зависит от длины проводнка, площади его
сечения, температуры, материала, из Koiporo он сделан,
и т. д. Другой пример: скорость ракетьнависит от силы
тяги, силы сопротивления воздуха, силь земного притя-
притяжения и многих других причин. В предцущей главе мы
видели, что величина остаточного члена ормулы Тейлора
для данной функции зависит от точки х, в которой про-
произведено разложение, от числа п, взгых в формуле
членов, от величины разности х — х0. Кличество подоб-
подобных примеров неограниченно. В матема*ке такие зави-
зависимости объединяются понятием функции ескольких пере-
переменных.
Дадим определение функции п перемшых.
Определение. Пусть имеется некоорое множество
наборов из п чисел (аргументов) (хи хгх3, ... хп). Каж-
Каждый элемент этого множества есть фиксированных
чисел. Если каждому элементу из мнжества наборов
аргументов поставлено в соответствие нсоторое число г,
то говорят, что задана функция п 'ременных: z =
= f(xu хг,... х„). Множество таких набоэв (хи х.г,..., х„)
называется областью определения функии. Множество
чисел z называется областью значений фшции (сравните
эти определения с теми, которые даныв главе II для
функции одной переменной).
223
Рис. 55
Все примеры, приве-
приведенные в начале парагра-
параграфа, соответствуют этому
определению. Действитель-
Действительно, сопротивление провод-
проводника R есть функция по
крайней мере четырех пе-
переменных, т. е. набора /
(длины), S (площади по-
поперечного сечения), Т
(температуры), р (удель-
~ ного сопротивления, за-
зависящего от материала
проводника): R = f(l, S,
Т, р).
Аналогично остаточный член формулы Тейлора есть
функция трех переменных и зависит от х, п, х0, т. е.
R = f(x, n, хв).
Чтобы избежать излишних усложнений записи, будем
все дальнейшие рассуждения проводить для функций двух
переменных. Теория функций большего числа переменных
принципиально не отличается от теории функций двух
переменных. Кроме того, в случае п = 2 рассуждениям
часто удается придать наглядный геометрический смысл.
Это делается следующим образом. Проведем в простран-
пространстве из некоторой точки О три взаимно перпендикулярные
прямые (Ox, Oy, Oz). Выберем на этих прямых положи-
положительные направления отсчета (например, так, как это
показано на рисунке 55 стрелками) и масштаб. При
помощи этих трех прямых изобразим функциональную
зависимость z = f(x, у). Из множества наборов (х, у)
возьмем некоторый элемент (хв, г/0). Этому элементу одно-
однозначно соответствует точка на плоскости хоу с коорди-
координатами (д;0, у0). Из этой точки восставим перпендикуляр
к плоскости хоу и отложим на нем отрезок (с учетом
знака) величины zo = f(xo, г/0) (см. рис. 55). Аналогично
поступим с каждым элементом из области определения
функции z = f(x, у). Тогда области определения функции
f(x, у) (множеству допустимых наборов) будет соответ-
соответствовать некоторая область D на плоскости хоу, а концы
перпендикуляров, проведенных из точек этой области и
равных по длине z — f{x, у), опишут некоторую поверх-
поверхность в пространстве. Эта поверхность будет графиком
224
функциональной зависимости z = f(, у). Посмотрим
тепер"ь, как фактически может быт задана функция
нескольких переменных. Это можно с;лать многими спо-
способами. Например, при помощи таблцы с несколькими
входами, когда набору входных даных соответствует
некоторое число в таблице. В этом случае множество
наборов входных данных будет обласуо определения, а
сами табличные данные областью начений функции,
заданной этой таблицей. Для матемачческого изучения
более удобен способ задания функцийпри помощи неко-
некоторой формулы. Для того чтобы получть число 2, нужно
проделать, над набором аргументов тедействия, которые
предписывает формула.
Областью определения такой функии мы будем счи-
считать то множество наборов аргумегов, для которого
действия по заданной формуле можв выполнить одно-
однозначно. Областью значений будет мнаество чисел, кото-
которое получается в результате примененя данной формулы
ко. всем элементам области определени.
В дальнейшем мы будем иметь в иду именно такой
слособ .задания функции.
Примеры. 1) г = ах-\-Ьу-\-с (а, Ь, <— постоянные числа).
Этой формулой задается функция двух перевнных х и у. Область
определения этой функции — множество пар tr, у), где —оо<л:<оо
и —oo<t/<co, или, исходя из геометричесого смысла функцио-
функциональной зависимости, вся плоскость. Облагь значений есть вся
числовая прямая — оо<г<оо.
2) .г = —". Областью определения гакй функции будет вся
ху
плоскость хоу, за исключением двух коррднатных осей л:=0 и
0 = 0.
Щ-г==уху. Для того чтобы правая »сть формулы имела
смысл, нужно, чтобы ху 3=0. Область опредегния такой функции —
1 и III квадрант (четверть) координатной плскости.
4) г -=У\ —,х2 — у2. Очевидно, в облась определения войдут
все точки координатной плоскости, для kotojx jc!-}-j/! ^: 1. Точки
с такими координатами заполняют круг с циром в надале коор-
координат и радиусом 1. Область значений этой^ункции есть отрезок
оси г, 0г?гг=: 1.
Посмотрим график этой функциональой зависимости. Для
этого перепишем ее уравнение в виде х2 - у2 -|~ г2 = 1. Заметим
еще, что расстояние точки, лежащей на гр{>ике функциональной
зависимости, от начала координат есть Ух2-у1-{-г2 (рис. 56); для
нашей функции это, расстояние всегда рано 1. Следовательно,
график нашей функции есть часть (верхняя сферы радиуса еди-
единица с центром в начале координат.
8 А. Б, Бакушинский 225
Рис. 56
Упражнения
Найти области определения следующих функций двух пере-
переменных: 1) 2 = —j—; 2) г = In л: + In к 3) z — e^x+l/; 4) z=
х~гУ
= In ху.
§ 2. НЕПРЕРЫВНЫЕ ФУНКЦИИ НЕСКОЛЬКИХ
ПЕРЕМЕННЫХ
Определение. Функция z — f(x, у) называется
ограниченной на множестве D (входящем в область опре-
определения функции), если существуют числа С и В такие,
что C^f(x, y)^B при всех х, у, принадлежащих D.
Легко видеть, что функция z = f(x, у) ограничена
тогда и. только тогда, когда существует такое положи-
положительное число М, что \f(x, y)\^M при всех х, y?D.
Например, функция 2 = л;2 4- г/2 определена и ограничена
рр фу
в любом круге вида: х*-\-у
4г/
у ^
причем М =
Напротив, функция 2 = не ограничена в области
[— 1^дг<;0, 0<|г/^1] B сколь угодно велико при х
или у, достаточно близких к 0).
Предположим, что функция z = f(x, у) определена
в некотором круге с центром в точке (л;0, у0), исключая,
может быть, саму эту точку.
Определение. Число А называется пределом функции
z = f(x, у) в точке (х0, г/0),^ если по любому числу е]>0
V
226
можно всегда найти число 8^>0 такое, что | / (х, у) — А |
как только О < "|/(д; — д;0)а -f- (у — i/0)a =s? 8.
Геометрически это означает, что по любому ^
можно всегда найти такое 8, что для всех точек (х, у),
попавших в круг радиуса 8 с центром в точке (дг0, г/0)»
исключая саму эту точку, будет |/(x, у) — Л|^е.
Коротко, это записывается так:
Нт/(л:, у) —А. ,
(х. у) -+ (х„, у0).
Совершенно так же, как и для функции одной пере-
переменной, доказывается, что предел суммы двух функций
равен сумме пределов, если пределы слагаемых существуют.
Предел произведения равен произведению пределов, если
пределы сомножителей существуют. Предел частного
¦ '*' j равен отношению пределов, если пределы числи-
числителя и знаменателя существуют и предел знаменателя не
равен 0. Эти свойства можно использовать для доказа-
доказательства существования того или иного предела. Если
хотят доказать, что в данной точке (д;0, у0) предела функ-
функции z=f(x, у) не существует, то бывает полезна следую-
следующая теорема.
Теорема 1. Если найдется число k^>0 такое,
что при любом сколь угодно малом 8]>0 в круге
У(х — xj* -\- {у — yj* ^ S существуют по крайней мере
две точки (xt(b), #i(§)) и (дг2(8), «/а (8))> такие, что
1/(*ь й)-/(*», й)|2**, A)
то предела функции z=f(x, у) в точке (х0, у0) не суще-
существует.
Доказательство. Покажем, что никакое число А
не может быть пределом f(x, у) в точке (дг0, у0).
Доказательство поведем от противного.
Пусть limf(x, у) —А.
(х, у) -> (*о. Уо)
Возьмем s = ^-- Тогда найдется такое 8]>0, что
|/(х, у) - А |< А при V(x.-xf + (у-у0)*<8, в част-
частности, 1/(^(8), ^E)) —ЛК-J-h |/(дс,(8), й(8))-Л|<А.
8» . 227
Но тогда \f(xu yi) — f(xit y*)Y==\f(xu yt) — A —
(/( ^A)[[f( )А\ + \(( Л
k k k
!^T"i"T==T* то пР0ТИВ0Речит неравенству A), дан-
данному в условии теоремы.
Рассмотрим теперь простые примеры нахождения пре-
пределов.
1) г = ху. Предел в точке (х0, у0)' Нт ху = хоуо. Это следует,
(*. У) —¦ (хо. И о)
например, из теоремы о пределе произведения.
lim xy
= i- / «I ' g\ == ~7г; б) несколько сложнее обстоит дело с точ-
точит (х -f-У ) 2 '
ной хо = уо — О. В этом случае теорему, о пределе дроби приме-
применять нельзя (предел знаменателя равен 0). Докажем, пользуясь
теоремой 1 этого параграфа, что у этой функции нет предела
к точке хо = уо==О. Для этого перепишем ее в следующем виде:
ху 1
Х_,У_
ух
На прямой у = х' будет г = -_-, а на прямой у — — х соответ-
соответственно г = —g". Возьмем две пары точек (xlt y.t) и (х2, t/2),
причем xu ylt х2, у2 по абсолютной величине как угодно малы,
но *! = {/„ а х2=— «/,." Тогда | f (^, j/t) — f (л:2) j/g) | = !, незави-
независимо от абсолютных злачений величин xu yu xs, y2, т. е. по тео-
теореме 1 предела этой функции при xo = t/o = O не существует.
Отметим одно важное обстоятельство. Вычислим
lim f lim 2 |_ а] (повторный предел).
Для его вычисления нужно сначала зафиксировать у и вычис-
вычислить внутренний предел, затем перейти к пределу по у. Проделав
эти операции, получим:
lim (lim
Следовательно, равенство lim ( lim f(x, ?/))= Hm f(x, у),
У-+У0 X-+Xo (X, й)-»(ЛО'Уо)
вообще говоря, не верно. Однако еели пределы в его левой и пра-
правой частях существуют, то они обязательно равны.
228
< x2y
{г — х2 + у2- -
y,
3) < x2y Исследуем, существует ли предел этой
функции при (х, у) -*¦ (О, 0). Докажем, что О является пределом г при
(X, у) -*¦ (О, 0). Действительно, используя неравенство '
имеем:
х2у
1*1
х у
как только У х2 -f- У2 < 2е.
В этом примере фактически использован следующий
общий прием, полезный и в других случаях: если
lim f{x, у) —0 и функция z = g(x, у) ограничена
(•*¦ У)-* (*о. У о)
в некотором круге с центром в точке (#0, г/0), то
lim (g(:c, y)-f(x, у)) = 0. Действительно, пусть
(х, у)-*(х0, у о)
\g(x, y)\<M при Vix-XoY + iy-y^^R. Тогда
\g(x, y)-f(x, y)\^M-\f(x, у)\
при V(x — дго)а+(г/— yof^R. И так как lim f(x,y)=
(X. У)-+(Х0, Уо)
= 0, то по любому е^>0 можно найти такое
что -|/(дс, г/)|^е, как только V(x—хо)*-\-(у~
Возьмем число -^. По нему можно найти \ такое, что если
то \f(x, y)|<^. Но тогда
|g(. y)f(, У)К при 1/(*^л:в) + (
= min(8b 7?). Наше утверждение доказано.
Определив понятие, предела функции многих перемен-
переменных, мы теперь можем дать определение непрерывности
функции.
Определение. Функция z — f(x, у), определенная в не-
некотором круге с центром в точке (л;0, г/о), называется
непрерывной в точке (л:0, г/0), если
lim f(x, y) = f(x0, y0).
(х, у)-+{х0, уо)
(Сравните это определение с определением непрерывной
функции одной переменной (см. гл. IV).)
Функция, непрерывная в каждой точке (х, у) некоторой
области D, называется непрерывной в области D.
229
Так же, как и для функции рдной переменной, для
непрерывных функций нескольких переменных справедливы
следующие утверждения: сумма двух непрерывных функ-
функций есть функция непрерывная (соответственно в данной
точке или в области); произведение двух непрерывных
функций есть функция непрерывная; частное двух непре-
непрерывных функций — непрерывная функция, если знамена-
знаменатель не обращается в 0 (соответственно в точке или в области).
Эти свойства являются непосредственными следствиями
соответствующих свойств пределов.
'Выясним теперь, какие из функций примеров 1) — 3)
непрерывны и в каких областях. Функция примера 1),
очевидно, непрерывна при —оо<^л:<^оо, —оо<^г/<^оо.
Функция примера 2) непрерывна всюду, за исключением
точки хо = уо = О. Наконец, функция примера 3) непре-
непрерывна при всех —оо<^*<^оо, —^^
Упражнения
4
1) Доказать, что функция г= 2 . —j ограничена и непрерывна
в области 2sS.Vx2 +y2=s5. ' .
>¦ ~ х ti
2) Доказать, что не существует lim '
(х,У)М0. 0)
3) Доказать, что lim вш*у ^
(*. у)-@. 0) ху
4) Доказать, что lim ^з=0.
(х, г/)-@, 0) х
§ 3. ЧАСТНЫЕ ПРОИЗВОДНЫЕ
Пусть дана функция z = f(x, у). Зафиксируем
у=у0 и рассмотрим функцию одного переменного z=f(x, y0).
Определение. Частной производной функции г=/ (л;, у)
по х в точке (д;0, г/0) называется производная функции f (x, г/0)
в точке х0.
Она обозначается ^f(x, у) |(,0> Уо), или f'x |(Ло, Уо). Если
мы, наоборот, зафиксируем х и будем дифференцировать
f(x, у) по у, то получим частную производную функ-
функции f(x, у) по у:
df (> У)
Оу > или
230
Примеры. 1) Найти частные празводные по х и у от
функции 2==ху. Имеем: ~ = у и jr=x-
2) Рассмотрим теперь функцию z- .8"*? :,. Найдем z*
х -\~!г
и г,,:
А ( Xi> \—
*} ~
А (. \—
дх \х* +.у*} ~ (Xs - ysf '
}—{x*-fY;
Так как частные производные фукции по х и по у
сами есть функции двух переменных если менять точки,
в которых берутся производные), v можно аналогично
определить и высшие частные призводные функции
z = f(x, у). Так,
ОХ ОХ у(/Х
дЧ д Id
- У))-
Примеры. 1) z = xyt z'x — y, г—х,
г* =2* =1. Заметим, что в данном случг г" =г" .
2) г = 4 + З2^2^
z'
zxx=
m
гху=\2ху,
y
И в этом случае мы видим, что г"ух = гху.
Можно дальше продолжать нахождени! производных:
-^-5- = —,48$и т. д.
Равенство z"yx = z"xy, подмеченное !ами в частных р
мерах, имеет общий характер. Справдлива теорема: если
ZyX и z"xy непрерывны в данной точк (х, у), то они равны
между собой в этой точке.
231
Упражнения
1) Найти г'х и г'у следующих функций: z =» Xs + Зх2!/ — н8;
х х — у
2) Найти вторые частные производные и проверить выполнение
равенства г"ху = г"ух: a) 2 = arctg-|; б) г = Ы(х — 2у).
3) Найти 2^. и г' следующей функции: z = x-tp(—), где у —
произвольная дифференцируемая функция. Доказать, что х ^- -{-•
Глава XI
ПРИБЛИЖЕННОЕ РЕШЕНИЕ
АЛГЕБРАИЧЕСКИХ
И ТРАНСЦЕНДЕНТНЫХ УРАВНЕНИЙ
§ 1. ВВЕДЕНИЕ
В этой главе мы опишем простейшие методы при-
приближенного вычисления действительных корней уравнения
вида f.(x) — O, где f{x)— заданная функция. Действитель-
Действительным корнем такого уравнения называют действительное
число х, которому соответствует число 0 в области значе-
значений / (х). Найти точные значения корней уравнения можно
только в исключительных случаях, обычно когда есть
какая-либо простая формула для корней, выражающая их
через известные величины. Однако даже для алгебраиче-
алгебраических уравнений (т. е. уравнений, в которых f{x) является
алгебраическим многочленом степени п) корни могут быть
найдены через коэффициенты многочлена с помощью конеч-
конечных формул только в случае, когда степень многочлена
не превосходит четырех. При этом формулы для вычисле-
вычисления корней уравнений третьей и четвертой степени весьма
сложны. Поэтому большое значение имеют методы при-
приближенного вычисления действительных корней уравнения
f(x) = 0. Будем предполагать, что уже заранее нам изве-
известны интервалы, в которых заключены корни уравнения,
при этом в каждом интервале имеется только один корень
(как говорят, корни отделены). В практически важных
случаях отделение корней можно выполнить графически.
Графически корни уравнения f(x) = 0 — это точки пере-
пересечения графика функции y = f(x) с осью абсцисс. Если
мы построим график этой функции, то сможем указать
примерно корни уравнения и, во всяком случае, достаточно
малые интервалы, в каждом из которых содержится один
корень уравнения. Дальнейшая задача заключается в вычис-
вычислении нужного нам корня с необходимой точностью. Опи-
Описанные ниже методы и предназначаются для решения этой
задачи.
233
§ 2. МЕТОД ПОСЛЕДОВАТЕЛЬНОГО ДЕЛЕНИЯ
ОТРЕЗКА ПОПОЛАМ
Пусть f(x)— Непрерывная функция на отрезке [а, Ь]
и известно, что уравнение /(д:) = 0 имеет на этом отрезке
единственный корень х0, который нам пока неизвестен.
Наша задача состоит в достаточно точном нахождении
значения х0.
Предположим, что f (х) монотонна на отрезке [а, Ь\
(например, возрастает) и f(a)<^0, /(&)^>0 (рис. 57). Для
нахождения корня поступаем так: делим отрезок [а, Ь]
пополам. Пусть точка деления будет сг. Вычисляем V (cj).
Может случиться, что/(ci) = 0, тогда х„=с1. Если f (cJ^O,
то нужно смотреть знак /(ci). Пусть f(ci)<^0. В этом
случае корень #0 обязательно должен лежать на отрезке
[си Ь], так как на концах этого отрезка f(x) принимает
разные знаки и, следовательно, в силу своей непрерывно-
непрерывности обязательно обращается в 0 в некоторой промежуточ-
промежуточной точке \ отрезка [си Ь] (см. гл. IV, § 4). Но корень
уравнения f (x) = 0 единственный на отрезке [а, Ь]. Поэтому
обязательно xo = S. Далее, делим пополам отрезок [clt b].
Пусть точка деления — с3. В зависимости от того, какие
знаки f(x) принимает на концах отрезка [сь с2] и [са, Ь],
определяем, в каком из них находится корень д;0. В слу-
случае, изображенном на рисунке 57, он будет на отрезке
[Си са]. Делим пополам отрезок [си сг\, получаем точку с3
и поступаем подобно предыдущему. Пррдолжая этот про-
процесс, мы получим последовательность точек {ct}.
Легко видеть, что \сп — хй\^ »„ ¦,поэтомуlimcn=X(,.
Рис. 57
234
Описанный метод нахождения коря благодаря своей
простоте находит широкое применение ля численного реше-
решения уравнений.
§ 3. ИТЕРАЦИОННЫЕ МЕТОД1
ПРИБЛИЖЕННОГО РЕШНИЯ УРАВНЕНИЙ
I. Простая итерация
Запишем уравнение, котороенам нужно решить,
в виде:
*=?(*)• A)
Это можно сделать очень многими сгсобами. Например,
уравнение 5х3— 6x3-j-7x-j-4 = 0 можв привести к виду A)
так: *=у(—й^ + бх» —4) или *=м» —6*i + 8y + 4 и
ещ~е множеством способов. Нужно тоько следить, чтобы
при таком приведении получались урвнения, эквивалент-
эквивалентные первоначальным. Итак, пусть нае уравнение запи-
записано в виде A). Основой для дальнйшего служит сле-
следующая теорема.
Теорема. Пусть уравнение х=э(х) имеет корень %
внутри некоторого отрезка [а, Ь]. Коме того, функция
ср (х) дифференцируема на [а, Ь] и <р' (х) | <; р <[ 1 при
х ? [а, Ь]. В этом случае корень ; единственный на
отрезке [а, Ь] и суьиествует такая крестность [% — Д,
E-f-Д] корня %, что если взять _Хь* [S—.Д, l-j-Д], то
последовательность х„, xt = <р (д:0), х?= <р (х{), х3 = f (*»),
...., хпt= tp(*n_i), ... сходится к \.
Доказательство. Докажем сачала, что корень \
единственный на [а, Ь]. Предполозим,- что существует
еще один корень ?i Ф %.. Тогда S = ф) и ^ = <р(^). По
теореме Лагранжа 15 — S, | = | <р {%— <р (lv) | = | tp' (с) | X
X | S — Si |, где$<с«=??ь с?[0, &]. Ь' условию | у'(с)|<
^р<1. Следовательно, |Е — ^1*рE—ii|<|? — ^|.
Полученное противоречие доказывает наше утверждение.
Обозначим теперь
Д=гшп(& — а, .Ь-Ь) ' B)
и докажем, что окрестность |S — Д, 6-J— Л | точки & будет
искомой (см. рис. 58). Для доказателства нам понадобит-
понадобится следующее утверждение: если Д ыбрано по формуле
235
B) и х?[? — A, 6 + AJ, то-.«р(Jt) ^ [? — Д, S + Д] (как
говорят, «функция <р (л:) отображает некоторый отрезок
области своего определения в себя»).
Рис. 58
Действительно, пусть х ? [S — Д, 5 -j- А], т. е. | х — S | ^
_Д. Докажем, что и |<р(я) — Е|^А. Так как Е — корень,
то ? = <р(Е) и по теореме Лагранжа:
Итак, пусть Д выбрана по формуле B). Образуем по-
последовательность: *о ? [* — Д, I -j- А], <р (#о) = ^ь <Р (Jti) =
= хь ..., Jt« = <p(^«_i), ...Применяя доказанное утверж-
утверждение л раз, получим, что хп ^ [\ — Д,- Е —j— Д] и тем бо-
более хп^[а, Ь].
Осталось доказать, что если \ — корень уравнения
x = tf(x), то limxn = S. Действительно, в силу определе-
я-*оэ
ния последовательности хп и теоремы Лагранжа имеем:
16 - хп | = | ? E) - «р (х„_,) I = I ?' (Сд) | ¦ 16 - jc. j |.
По доказанному, хп_г ^ [а, 6]. И так как на этом от-
отрезке |<р'(*Iг^Р<О> то
16-*«Kp|S-jc»j|. . •. C)
Аналогично | % — х^ \ = | <р (Е) — <р (*я_3) | = | <р' (c«j) | X
Подставляя это неравенство в C), получаем:
*-*,^|. D)
Точно так ..же | \ — х„_а j ^ р | \ — хп _з |. Подставляя в
D), получим: \Ь — ^И|^Р8|^ — хп^\. Поступая далее по-
подобным образом,^ получим окончательно:
\t-xn\^9n\t-x6\^f(b-a). E)
236
Так как р<4, то неравенство E) доказывает наше
утверждение. Действительно, при любом е^>0 для п^>
>N== j-lns-ln^-fl)j + j будет ^ _Хя ! ^ е> Следова.
тельно, lim xn = %. Неравенство E) дает, кроме того, и
оценку скорости сходимости последовательности {хп\. Эта
скорость тем выше, чем меньше р.
6 xs
Пример. Дано уравнение х= щ = ф (х). Исследуем
о
возможность применения к нему нашей теоремы. Этр уравнение
имеет корень (| = —2) на отрезке [—2,4; —1,5]. Найдем (р' (х).
2
<р' (х)= — ~х, | <?' (х) | «?0,96 < 1 при х ? [—2,4; —1,5].
В данном случае A = min E — а, Ъ — 5) =0,4, следовательно,
на отрезке [? — А; ?-(-Д]==[—2,4; —1,5] будут выполнены все ус-
условия теоремы. ЕслЕГ за начальную точку итерационного процесса х0
взять, например, хо=—2,2, то последовательность х0, .*i = <p(x0),
..., хп = ср(xn_i), ... должна сходиться к корню (т. е. к | = —2).
Вычислим несколько членов итерационной последовательности:
xl = 4(-2fi)-=-2,m,
х8 = ? (—2,168) = —2,140,
),,
4 Р(8) = — 2,095,
л:6 = ер (дг^ = --2,078.
Сходимость этой последовательности отиосятельно медленная
из-за,того, что р близко к 1.
Мы уже отмечали, что уравнение, которое нужно ре-
решать, можно привести к виду A) многими способами.
Очень широкий класс уравнений можно привести к экви-
эквивалентным уравнениям вида A) так, чтобы были выпол-
выполнены условия основной теоремы. Более того, для этого
существуют даже стандартные способы. Они основаны на
следующих соображениях: пусть уравнение, корень I ко-
которого нужно найти, записано в виде /(#) = 0. Функцию
/ (х) будем считать достаточное число раз дифференцируе-
дифференцируемой на некотором отрезке [а, Ь], содержащем I. Пусть
некоторая функция ф(ж)^0 на [а, Ь] и. достаточное число
раз дифференцируема на этом отрезке. Тогда уравнение
ф (х) ¦ f (х) = 0 эквивалентно первоначальному на отрезке
[а, Ь]. Последнее уравнение запишем так:
x=x-$(x)-f(x) = 9(x). F)
237
Наша задача — подобрать <р (х) так, чтобы для функции
<р (х) выполнялись требования теоремы о сходимости ите-
итераций. Два наиболее употребительных метода подбора <р (х)
мы сейчас рассмотрим.
1) Метод Ньютона. Пусть известно, что корень \
уравнения f(x) = 0 лежит на отрезке [а, Ь] и на этом
отрезке f (х) Ф (L Выберем 4 (х) = р-т-т. Уравнение F)
• г (х)
запишется в виде:
Найдем
fix)
f(x)-f{x)i"(x)
[f(x)f
Если х—l, то f(&) = 0 и <р'(|) = 0. В силу этого и
в силу непрерывности <р' (х) существует такая окрестность ?-,
в которой заведомо |<р'(х)|<^1. Следовательно, по основ-
основной теореме последовательность вида
f(x»)
Г(х„)
G)
сходится к корню, если начальная точка х9 (начальное
приближение) выбрана достаточно близко к корню. Полу-
Получение корня по итерационным формулам G) называется
методом Ньютона решения уравнения /(д:) = 0.
- Рис. 59
Метод Ньютона имеет очень простой геометрический
смысл 1 Пусть график y = f (x) имеет в окрестности корня
вид, показанный на рисунке 59. Возьмем произвольную
238
точку x0 вблизи корня. Проведем в точке (х0, f (х„)) каса-
касательную к графику функции y = f(x). Уравнение этой
касательной:
Найдем точку Ху пересечения этой прямой с осью
Она находится из уравнения
Отсюда
Найдя точку хи проведем касательную к графику f(x)
в точке (хи f(xi)) и найдем точку ее пересечения с осью
абсцисс — х^. Так же, как в предыдущем случае, получим:
После rt-кратного выполнения этой операции имеем:
v
я Г(х„)'
Последовательность точек пересечения касательных с
осью х совпадает с итерационной последовательностью
метода Ньютона G). Это значит, что метод Ньютона, экви-
эквивалентен процедуре последовательного проведения каса-
касательных и нахождения точек пересечения их с осью
абсцисс. Заметим, что если начальное приближение х0
выбрано достаточно далеко от корня (на рис. 59 — точка а),
то процесс проведения касательных (а значит, и G)),
вообще говоря, не сходится. Вообще, выбор начального при-
приближения в методе Ньютона — дело далеко не простое, так
как доказанная нами_ теорема гарантирует только суще-
существование такого подходящего начального приближения,
но ничего не говорит о том, как его найти. На практике
часто поступают следующим образом. Выбирают началь-
начальное приближение, пользуясь таблицей функции f(x) или
ее графиком. Задаются некоторым малым числом е^>0,
характеризующим точность вычислений. Если -при неко-
некотором п будет | #я+1 — хп | ^ е, то считают, что начальное
239
приближение выбрано достаточно хорошо и хп — хорошее
приближение к корню. Если в процессе счета разности
1*л+1 — Хп\ остаются большими, то ищут другое началь-
начальное приближение.
Пример. Пусть f(x) = xs— 6х + 5=0. Найдем методом Нью-
Ньютона один нз корней этого квадратного уравнения. График функции
у=7(дг) представлен на рисунке 60. Имеем: f@) = 5, fB) = —3.
Следовательно, на отрезке [0; 2] обязательно имеется корень этого
уравнения. Легко видеть, что f'(x)=-2x— 6^?0 на [0,2]. Значит,
итерации G) сходятся при выборе х„ достаточно близко к корню.
Возьмем л-„ = 0. Получим:
"+1 " 2х„-6 •
лг„ = О, *! = 0,833..., лг2 = 0,994..., хь — 0,999.... Последователь-
Последовательность сходится к корню 5=1.
Рис. 60
240
2) Метод хорд. Сделаем теперь иой, чем в методе
Ньютона, выбор функции ty(x) в F). Тусть снова f(x)
имеет корень 6 на отрезке [a, b], f (х) Ф da [a, Ь]. Возьмем
х — л:*
ФМ — f{x) —f{x*) ' ' .
где л:* — некоторая фиксированная точк отрезка [а, Ь].
Очевидно,
f(x)-f (x*) = V (о) • (x-x*)^ fW^ °
на [a, b]. Следовательно, первоначально наше уравнение
эквивалентно на отрезке [а, Ь\ следукншу:
Образуем итерационную последоватеьность вида:
Преобразуя правую часть, получим:
х _x*f(xn) — xnf(x*) _ • g
Итерационный процесс (8) для нахожения корня урав-
уравнения / (х) = 0 называется методом хорд iли методом секу-
секущих. Для доказательства сходимости пследовательности
(8) воспользуемся основной теоремой, кеем: . .
lf(x)-f(x*)]-(x~xf(x) .
Вычислим <?'(%). Учитывая, что Д) = 0, получим:
- X* — f (^
t5"
241
Разлагая f(x) по формуле Тейлора (гл. IX § 3, 4)
в точке I и учитывая /(Е) = 0, получим:
где \Д)^^($— х*)\ Мг = тях.\Г(х)\. Подставляя это
разложение в выражение для <р' E), будем иметь:
R
Отсюда
У.
Г
(?)
(х
R
•-9+/?'
Г
\х*-
(?) +
—
Я
• !
( —5
. (9)
Рис. 61
Так как f A)^0 и lim-щ—ё = 0 (в силу оценки R),
то из (9) видно, что если х* выбрать достаточно близко
к ?, то | <р' (S) I <С 1 ив силу непрерывности <р' (х) найдется
окрестность i, в которой | <р' (л:) | <^ 1. Таким образом, по
основной теореме последовательность (8) сходится, если
начальное приближение х0 и точку х* выбрать достаточно
близко к корню. Относительно выбора х0 и х* справед-
справедливо все сказанное нами о выборе начального приближе-
приближения для метода Ньютона. Заметим, что метод хорд так же,
как и метод Ньютона, имеет наглядный геометрический
смысл.
242
Пусть график y=,f(x) в окрестности корня имеет вид,
показанный на рисунке 61, Выберем х* и х0, как это
показано на чертеже. Проведем хорду, соединяющую
точки графика с абсциссами х0 и х*, и найдем точку xt
ее пересечения с осью абсцисс. Из подобия треугольников
Ax0Xi и Вх*хг находим:
Х± — Xq - X Л^1
Отсюда
Затем проводим хорду через точки С (точка графика с
абсциссой a'i) и В, находим точку ее пересечения с осью х.
Как и выше,
Поступая далее подобным образом,' видим, что га-j-1-я
хорда пересекает ось х в точке xnJri:
_x*f(xn)— xnf(x*)
Формула A0) совпадает с (8). Следовательно, метод
хорд геометрически эквивалентен проведению последова-
последовательности хорд, которые все проходят через точку (х*,
f(x*)). Точки их пересечения с осью х образуют после-
последовательность, сходящуюся к корню уравнения f(x) = G
и совпадающую с последовательностью (8). Заметим, что
как метод Ньютона, так и метод хорд дает приближение
к корню ?, как правило, либо все время с недостатком,
либо все время с избытком. Причем если метод Ньютона
дает приближение с избытком, то метод хорд в этом
случае обычно дает приближения с недостатком и наобо-
наоборот. Поэтому, применяя метод хорд совместно с методом
Ньютона, можно получить двухстороннее приближение
к корню (см. рис. 61).
Пример. Пусть опять имеем уравнение f(x) = xs — блг-f-
_j-5=0. Будем методом хорд искать корень этого квадратного
уравнения на отрезке [0, 2]. Возьмем л:* = 0, хо = 2. Тогда хпп =
=•?—-— и хо = 2, *! = 1,250, л:8 = 1,053, jc3 = 1,011, л:4 = 1,002,
о — хп
хъ = 1,000. Сравнивая эту последовательность с последователь-
последовательностью, полученной по методу Ньютона (стр. 237), мы видим, что
метод Ньютона дает приближение с недостатком, а метод хорд,
наоборот, с избытком.
243
Упражнения
1) Используя метод хорд и касательных, найти корень уравне-
уравнения л:2-|—5= 10х с точностью 0,01. Начальное приближение и д;*
найти при помощи графика.
2) Используя метод Ньютона, найти корень уравнения л: — е~х =
= 0. Вычисления вести до тех пор, пока \xn+i— л:„|< 0,001.
3) Предполагая, что р (д) ф о в окрестности корня уравнения
/(х)==0, исследовать сходимость итерационной последовательности
хп+1—хп — mf(xn) к корню уравнения /(л:)=0 {т — постоянное
число).
4) Доказать, что последовательность хп+1 =-=- (х„ -j ) (а > 0)
сходится к числу YH, если х0 достаточно близко к }/<Г.
Глава XII
НЕОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ
§ 1. ПЕРВООБРАЗНАЯ ФУНКЦИЯ
И НЕОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ
Из предыдущих глав нам известно, что при не-
некоторых условиях для функции f(x), заданной на'некотором
отрезке [а, Ь], можно найти ее производную f'(x). Возни-
Возникает и обратная задача: по заданной на отрезке [а, Ь]
функции f(x) определить функцию F(x), производная ко-
которой совпадает с f(x), т. е.- Fr(x) = f(x).
Определение. Функция F (х), для которой выполнено
равенство F'(x) = f(x), называется первообразной для функ-
функции f{x).
Прежде всего заметим, что задача нахождения перво-
первообразной не имеет единственного решения. Действительно,
для функции f(x) = x функция F(x) = y является перво-
fxs\'
образной, так как (у) =х..Но первообразной для f(x) =
= х будет и любая функция вида Ф (х) = у + С, где С —
произвольное постоянное число, так как
Мы видим, что целое семейство функций вида Ф(х) =
= у-|-С будет первообразными для х. Могут ли быть еще
первообразные для функции f(x) = x, кроме функций
этого семейства? Отрицательный ответ на этот вопрос
дает следующая теорема.
Теорема. Если F(х) —.первообразная функции f(x)
на [а, Ь], то и Fi(x)=fF(x)-\-C, где С — произвольная
постоянная, также является первообразной. Обратно, если
F (х) и Fi{x) — какие-либо две первообразные f(x), то их
245
разность F (х) — Ft (x) равна некоторой постоянной на
[а, Ь] величине.
Доказательство. Если {F (x))' = f(x), то и (F(x)-\-
-\-Q' = F'(x) = f(x), и первая часть теоремы доказана."
Пусть F'(x) = f(x) и* F\(x)=f(x). Рассмотрим функцию
(b(x) = F (х) — Fi(x). Производная функции Ф(х) тождест-
тождественно равна нулю на отрезке [а, Ь], так как
Ф' D= F (х) - F\ (х) = f(x)-f (x) = 0.
Но мы видели (гл. VIII § 3), что если производная
функции тождественно равна нулю, то функция постоянна,
т. е. <b(x) = F(x) — Fr(x) = C на отрезке [а, Ь]. Теорема
доказана.
Определение. Совокупность всех первообразных для
данной функции на данном отрезке называют неопределен-
неопределенным интегралом шпой функции и обозначают ^f(x)dx.
По доказанной теореме неопределенный интеграл — это
семейство функций, отличающихся друг от друга постоян-
постоянным слагаемым. Геометрически (рис. 62) это означает, что
все первообразные данной функции могут быть получены
Рис. 62
246
из какой-либо одной сдвигом в направляии оси у. Услов-
Условно пишут:
\f{x)dx = F{x) + C,
где F (х) — некоторая первообразная, С — произвольная
постоянная.
Задача нахождения неопределенногоинтеграла от дан-
данной- функции значительно сложнее .зцдчи нахождения
производной. Прежде всего возникает Dnpoc: существует
ли для данной функции первообразнаяРПока этот вопрос
мы оставим в стороне. Позднее мы докжем одну теорему,
которая даст положительный ответ лапоставленный во-
вопрос для широкого класса функций. Бэтой главе, поль-
пользуясь определением интеграла и прогыми свойствами,
вытекающими из его определения, мы рссмотрим приемы
отыскания неопределенных интегралов > простейших слу-
случаях.
§ 2. ПРОСТЕЙШИЕ ПРИЕМЫ ИНТЕГРИРОВАНИЯ
Установим некоторые свойств неопределенного
интеграла:
1) Постоянную величину можно вынсйть за знак ин-
интеграла*) .
\cf{x)dx = c \f(x)dx A)
так как [cf(x)]' = cf'(x).
2) Если у функций I (х) и g(x), опркленных на [а, Ь],
существуют интегралы, то существуег интеграл суммы
этих функций, который может быть виислен по формуле
\[f{x)^-g(x)]dx=\f{x)dx-\-g{x)dx. B)
Действительно, продифференцировз правую часть
(используя правило дифференцировани суммы), мы по-
получим подынтегральное выражение левй части.
3) Если f(x) и g (х)'дифференцируем на [а, Ь] и для
функций f{x)-g(x) и f (x)g(x) существрт неопределенные
интегралы, то
\f{x)-gr(x)dx=f(x)-g{x)-\fK).g{x)dx. C)
формулу C) называют формулой интеграования по частям.
Для ее доказательства нужно провергь, что семейство
функций, стоящих в правой части этого равенства,
*) Равенство A), как и вообще равенстварвязывающие неопре-
неопределенные интегралы, условное. Оно не потряет своего смысла,
если мы прибавим в правую и левую часть егоостоянные слагаемые.
247
является семейством первообразных для функции f(x)g'(x).
Используя формулу дифференцирования произведения, по-
получаем:
[/ (*) -g(x)~l fix) g (х) dx]' = (f (x) g (x)Y -
~[\f(x)g(x)dx]' = f(x)g(x)-{-g> (x)f(x)-f{x)g{x) =
= f(x).g'(x).
Формула (З) доказана.
Таблица интегралов
Пользуясь этими свойствами, а также таблицей произ-
производных элементарных функций (см. стр. 185), составим
таблицу простейших неопределенных интегралов.
\ ^
—Р-4-С =хп.
п-\-1 I
2) \exdx = es-\-Ct так как
4) \.smxdx = — cos x -j- С, так как (—cosx-\-C)r
i
= sin x.
5) \tosxdx= sin x-\-C, потому что (sin x-\-Cy =
6) { — = ln*-f С при х>0 и
^. = 1п(— х)+С при л:<0,
^ = ln|*|-fC при хфЪ, ибо
прих>0 Aп^ + С)' = 1;
при д:<0 (ln(-*) + C)'=JL.
. f == — ctgx-\-C {хфпк), так как
SHT X ь I. V -г- I >
при х ф-<г-\-пп (tgx-f-C)==—2— и
1
248
8) 5 Tqrp = a'rctg X + C, так как (arcg x+'C)'=
) 5 Tqrp rcg X + , а как (rg x+)j^ •
Используя эту таблицу, можно выислять интегралы
более сложных функций.
Примеры. Вычислить интегралы:
С С cos8x+l С
Воспользуемся формулой интегрирования о частям и таблицей
интегралов. Будем иметь:
1)
у
\xs\nxdx— 1 х(—cos'x)'dx = —дгсл: + > cos xdx =
+ i j С
= — х cos x + sin x -j- С.
С cos3a:-j-1
4) ^ xexdx=
= хел:— f e*rf^= лге* — ex.+ С
В заключение этого параграфа мы рассмотрим один
широко применяемый прием интегриронния, называемый
методом подстановки или методом змены переменной
интегрирования. Этот прием является обащением правила
дифференцирования сложной функции (я. VII § 6).
Пусть функция Ф(х) определена на >трезке с s?x«?d,
а функция <р (t) определена, монотонна щифференцируема
на отрезке [а, Ь] и ее область значний принадлежит
отрезку [с, d]. Кроме того, пусть на [с, d], существует
\Ф{х)йх. Возьмем какую-либо первооразную функции
Ф(х) на отрезке [с, d]. Пусть это будет (х). Тогда.функ-
Тогда.функция F (cp (t)) будет первообразной фуннии Ф (<р (t)) ¦ <р' (t)
на отрезке a^t^b. Действительно, о правилу диф-
дифференцирования сложной функции .' (tp (/)) = F'x- y't =
Ф(())р'(^). Это можно записать таим образом:
где после интегрирования в правой часи нужно подста-
подставить вместо t его выражение через х. 5ти рассуждения
и лежат в основе метода подстановки для вычисления
неопределенных интегралов. Пусть неободимо вычислить
^dx на некотором отрезке [а, Ь]. $ведем некоторое
249
новое вспомогательное переменное t, положив x=f(t),
где ср (t) — монотонная дифференцируемая функция. Как
мы виделиг
(«равенство» это понимается в том же смысле, что и пре-
предыдущее). Может оказаться, что при удачно подобранной
замене x=y(t) интеграл в праврй части берется. проще,
чем первоначальный. Проинтегрировав функцию Ф (<р@)?'@
и заменив в результате интегрирования t его выражением,
через х, мы получим § Ф (х) dx. Это и есть метод подста-
подстановки.
Примеры. 1) Найти V —-г-—. Сделаем замену х-\-а=и,
, * х ' а
тогда х = а— а и л,= 1.
2) Найти \ sin— • —j-. Положим — = ^. Тогда *==— и
J X X X С
sin L.\dx = — \ sin—
= cos
3) Найти С ^rfJ? . Полагаем Vx~=t, x = ts, x't = 2t.
J ]/хA+дг)
Тогда
= 2arctg
4) Найти ^ arctg л: dx. Этот интеграл можно найти, применяя
формулу интегрирования по частям и метод подстановки:
I arctg -у dx = x arctg x — \
Положим теперь х2 = ?. Тогда
}
250
Окончательно \ atctgx dx = x atctgxt--^ln(l-}-x*)~{-C.
Замечание. Так как пока мы не можем сказать по виду
подынтегральной функции, существует ту нее первообразная и
если существует, то на каком отрезке (ы не доказали теорему
существования неопределенного интеграла! то, строго говоря, мы
всегда должны проверять, будет ли найденая нами функция иметь
производную, равную подынтегральной фущии, и на каких отрез-
отрезках будет выполнено это равенство.
Упражнения
С помощью таблицы простейших игегралов и подходящих
подстановок найти интегралы:
1) $ хе~* dx; ' 5) § ^~dx; 8) J -**_;
2) $ tgjc dx; 6) J (УХ~1) r, 9) $ 1%* x
dx
3) \eslnxcosxdx; 7) [ cos2 4c dx; 10) [ ,
J J ¦* J ya
4) j e~ x3 xs dx;
§ 3. ИНТЕГРИРОВАНИЕ РАЦИНАЛЬНЫХ ФУНКЦИЙ
Мы рассмотрели простейшш примеры отыскания
неопределенных интегралов. Можно >ыло бы привести и
более сложные примеры. Но нужн иметь в виду, что
далеко не для всех элементарных фикций можно найти
их неопределенный интеграл в ви,з элементарной же
функции. Существуют очень просты по виду элементар-
элементарные функции, первообразные от котрых не выражаются
через конечную комбинацию элементрных функций. При-
Примерами таких функций являются фукции:
Но имеются классы элементарных фикций, для которых
можно найти неопределенные интегалы тоже в элемен-
элементарных функциях. Важнейшим такм классом является
класс рациональных функций.
Определение. Рациональной фикцией называется
функция вида:
где т ип — целые положительные чела.
•251
Оказывается, что $ Ф (х) dx всегда выражается в эле-
элементарных функциях.
Предварительно заметим, что без ограничения общно*?
сти можно считать m ==s n — 1. Действительно, если т^п,
то многочлен Рт(х) можно разделить на многочлен Qn(x):
причем остаток D(x) имеет степень sgn — 1, и Ф(х) мо-
может быть представлена в виде:
гдеСт_„(х) — многочлен, а-- п , .— рациональная функ-
ция, у которой степень числителя меньше степени знаме-
знаменателя. Если мы сможем проинтегрировать - у'~ то смо-
Wn (x)
жем найти и § Ф (х) dx, так как
Ф(х)dx= J Cm_n{x)dx-\-
а многочлен Ст_п (х) интегрируется просто.
Поэтому в дальнейшем, мы будем считать rns^n—1.
Далее мы всегда можем предварительно вынести за знак
интеграла число ^ и считать, что коэффициенты при
старших степенях многочленов числителя и знаменателя
равны 1.
Рассмотрим три случая.
а) Все корни Qn (x) действительные и различные. Пусть
корни Qn (х) равны а,, аа, ..., а„. По теореме Безу
Qn\x) = (х — а,) (х — <ц) ¦ • ¦ (х — ая).
Можно доказать, что функция Ф (л;) представима в виде
(разложение на простые дроби):
>(*)=г^+г=?=;+-'+^. D)
252
где А\, А.и ..., Ап — некоторые постояные. Их можно
найти следующим способом, который нзывают способом
неопределенных коэффициентов. Формално пишется раз-
разложение D) с неопределенными коэффицичтами Alt..., Ап.
После^ этого правая часть приводится кобщему знамена-
знаменателю. *" В результате получается рациоальная функция
с числителем
А1 (х — og)... (х — <х„) -f А2 (х — &i) (х — а3. .(х — а„)
п(х — а,)...(х — а».; " E)
и знаменателем Qn(x).
Так как мы хотим, чтобы равенстве D) выполнялось
тождественно для всех х из области аределения Ф (х),
то нужно, чтобы многочлен числителя гвой части (хт-|-
-j-CiX7" -{-•••+ от) тождественно был 'авен многочлену
E), т. е.
Из основной теоремы алгебры легко следует, что это
может быть тогда и только тогда, когд равны коэффи-
коэффициенты при одинаковых степенях х правой и левой
части. Это требование дает нам системупинеиных уравне-
уравнений для нахождения неизвестных коэффииентов Аи..., Ап.
Можно показать, что эта система всегд имеет единствен-
единственное решение. После того Как коэффициеты в D) найдены,
\ Ф (х) dx вычисляется легко, так как
xdx
Пример. Вычислить \
X
Пишем разложение -—tin/ _lo\<- —ч\'а пР°стые дроби с
неопределенными коэффициентами:
л- At , Aj . Л8
253
Записываем тождество.
x = At (х + 2) (* —3) + А2 (*+ I) {х—ЗХ + Л, (х+1)
Приведя в правой части подобные члены, получим:
Приравнивая коэффициенты при одинаковых степенях х, по-
получим систему;
_ А1-2Л8
I
1 2 3
Ее решение: J41=-j-; .Д2 = <—щ-; А3-=-^--. Окончательно:
х _ 1 1 2 1 3 1
' 5 * х-\-2 + 20 ' дг-^3
xdx
i" J л:+1 5 J
б) Пусть теперь Qn(x) имеет действительные корни,
но среди них есть кратные. В таком случае разложение
Qn(x) на множители имеет вид:
Qn (*) = *" + б!*-1 + .
Pi+ Р.+ ...+?/ = я.
В этом случае существует следующее разложение Ф (я) на
простые дроби:
Рт(х)_ А, - Л „ t ^Pl , Д1 ,
?>n
254
Разложение G) является обобщением D) и переходит
в последнее, еели все р,=Л. Для фактического отыска-
отыскания Аи ..., Dfjj также может быть использован метод не-
неопределенных коэффициентов. Общая схема этого метода
такая же, как и в случае а). Пишется разложение G)
с неопределенными коэффициентами. Затем правая часть
приводится к общему знаменателю и в числителе дроби
приводятся подобные члены. _ Полученный в числителе
многочлен (степени «go—1) должен быть тождественно
равен Рт(х). Приравнивая коэффициенты при одинаковых
степенях этих двух многочленов, получим систему линей-
линейных уравнений для отыскания чисел Alt ..., D$.. После
того как разложение G) получено, J Ф (ж) dx вычисляется
легко.
Пример. Вычислить \ -,—г . .Г*~ — dx.
J {x+\f(x— \)
- Разложение подынтегральной функции на простые дроби со-
согласно G) нужно искать в виде:
где At, As, By — неизвестные коэффициенты. Приведя правую часть
к общему знаменателю, потребуем,. чтобы числители левой и пра-
правой части были тождественно равны:
или после приведения подобных членов:
х* +1 =н (Л + Вх) х* + (А, + 2Bt) х + (- А, - Ла + Bt).
Для выполнения тождества нужно, чтобы Ах, Bit A3 удовлетворяли
системе уравнений:
Решив
-At- A,+ Bt=l.
1 , ,. n 1
ее, получим: At = -^-; Аа = —1; 5, =-^-. Окончательно:
f ., .. 1 f dx
У(х) dx= -2 i 3F+T-
_j L__l_L i
ЛГ+1 (л;4-1)*+ 2 ' x—l*
' dx , 1 f dx
= |in|x4-i|4-7i-r+yinU-i[+C-
255
в) Наконец, рассмотрим общий случай, когда Qn(x)
имеет как действительные, так и комплексные корни, при-
причем будем считать, что все комплексные корни Qn (х) про-
простые. Разложение Qn (x) на множители имеет вид:
Каждый квадратный трехчлен в разложении соответствует
одной паре комплексно сопряженных корней. В этом об-
общем случае разложение Ф (я) на простые дроби выглядит
следующим образом:
Рт<х)_ N^
A, A,
Часть разложения, соответствующая действительным кор-
корням знаменателя, полностью повторяет разложение вида G).
Коэффициенты правой части (8) и в этом случае нахо-
находятся методом неопределенных коэффициентов. Для вы-
вычисления J Ф (я) dx необходимо проинтегрировать каждую
простую дробь. Затруднение представляет только вычи-
вычисление интеграла от простой дроби, соответствующей
комплексному корню, т. е. интеграла вида:
Mx+N dx
Приведем трехчлен хг -\- рх -\- q к виду л:3-}-Р* ~Ь <7 =
^\х | Т/ ~г9~х> причем в нашем случае q —
(так как корни комплексные). Можно записать:
256
Mx + N dx M С
Произведем в этих интегралах замену переменных х-^
-f--|f =* и, учитывая, что V—, * s = — arctg^, полу-
получим:
Используя (9), легко довести до конца интегрирова-
интегрирование Ф(х).
С dx
Пример. Вычислить V —
J ж(
Р
Разложим подынтегральную функцию на простые дроби:
1 At . As , Мх -|- N
.-._. ... . . . -—-f- -f--
Приведем правую часть к общему знаменателю. Получим:
1 = А, (л- + 1) (л:2 + х + 1) + Asx (xs + х + 1) + (Afjc + N) x (x + 1),
или
1 s (Д, +¦ Д, + М) лс» + BД! + Ла + М + АО Xs + BД,
Приравнивая коэффициенты при одинаковых степенях в правой
и левой частях, получим:
Решение этой системы: Д,= 1; Д2=—1; М = 0; ЛГ=—1.
Отсюда
dx
f ^?_ f J^ { „ dx .
9 А. Б. Бакушииский 257
Последний интеграл можно найти, пользуясь прямо формулой (9)-
Однако лучше не запоминать ее, а в каждом конкретном случае
вычислять интеграл заново, пользуясь идеями, положенными в ос-
основу вывода формулы (9).
Делая очевидные преобразования и замены, имеем:
dx f dx 2 x± 2 ¦
j t
Окончательно:
dx 2 •*~Ь*
lkllk+llt
Умение интегрировать рациональные функции часто
бывает очень полезно и при вычислении других типов
интегралов, которые (после Подходящей подстановки) мо-
могут быть сведены к интегралам от рациональных функций.
Рассмотрим несколько типичных примеров.
1) Вычислить I " к *•¦ ' fix.
Сделаем замену: уТ+х = Могда х = ts — 2, х\ — 3tK
' — 2)t-3t*dt
=3
P-
Теперь надо вычислить интеграл \ —8 . —д— dt от раци-
рациональной функции, стоящей под интегралом. Степень числителя
больше степени знаменателя, поэтому прежде всего нужно разде-
разделить числитель на знаменатель:
г, t* — 2t e
Рациональную функцию ¦ —^" разложим на простые дроби:
f — 1),
258
или
t* — It = (A + M) ts + (A +. — M) t + BЛ — Л0-
Получается система уравнений для AM и N:
¦ ( A + M=l,
{ A + N— М--— 2,
\ 2A—N = 0.
Отсюда A=—-r, M=—, Л/=—=-.
4 4 ?
Итак,
Делаем обратную замену: I — ¦ —dx
J У2+
: I — ¦
J Х-У2+Х
_larctgl^±
4/Г V'
2) Вычислить \ cos5 xdx. Сделаемзамену sinx = t.
Тогда dt = cos лг^л: и $ cos5 л: ^л; = jA - i2J dt — jA —It1 4- ^4) Л =
=i! _ 2. ^s 4.1. ^ -j-x: = siax - -|- sin8 x 4- ^^ 4- С
3) Вычислить \ -jr—: '-гт-Г Сделаем следующую под-
j 2 sin л; —cos x 4>
станов ку:
*=tg4 (Ю)
9* 259
По известным формулам тригонометрии имеем:
х
2 \cs ——
sm х = —
cos х =.
Тогда , ,
J_ J 2
2 2г 1—g» ' 1+г!
Зг+1
С *
J 2 sin л; —
dz
i
=?Tarctg
?Tarctg /r
Замечание. Подстановка A0) может быть применена и при
вычислении общих интегралов вида ^ ./? (cos x, sin Л") d*, где Д —
произвольная рациональная функция от cos x, sin.*. Исходный ин-
интеграл сводится при этом к интегралу от обычной рациональной
функции аргумента 2.
4) Вычислить \ т—:—~dx. ¦ ~
J 1-4-е*
Применим подстановку ex = t. Тогда
= < — 1п 11 +11 + С — ех— 1п A + еЛ) 4- С.
Упражнения
Проинтегрировать следующие рациональные функции:
Vl°—^dx; 3) ?
260
Вычислить следующие интегралы:
1) \ /L , 4 * ,.—¦ (заменить ^
4)
5 5) $cos*cos2xX
X cos Зх dx;
; С
1 -(- 2sin л:
dx.
Глава XIII
ОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ
§ 1. ПОНЯТИЕ ОПРЕДЕЛЕННОГО ИНТЕГРАЛА.
ПРОСТЕЙШИЕ СВОЙСТВА
. ОПРЕДЕЛЕННОГО ИНТЕГРАЛА
В этой главе мы определим одну предельную
операцию и изучим ее свойства. Это изучение приведет
нас к понятию определенного интеграла и установлению
очень важной и неожиданной на первый взгляд связи
между определенным и неопределенным интегралом. Пре-
Прежде чем давать строгие определения, разберем некоторые
примеры. Рассмотрим фигуру а АВ Ь, представленную на
рисунке 63. Это часть плоскости, ограниченная осью аб-
абсцисс, двумя прямыми х — а, х = Ь (а<^Ь) и графиком
некоторой функции y—f (x)^>0. Назовем эту фигуру
криволинейной трапецией.
Введем понятие площади фигуры аАВЬ.
Разделим промежуток [а, Ь] на части точками деления^:
Если отрезок [xt_lt х{\ достаточно мал, то на нем функ-
функцию f(x) можно приближенно считать постоянной и рав-
равной своему значению в некоторой точке S,- отрезка
[*<-ь Xi]. Ошибка этого приближения, конечно, зависит
от величины отрезка и от выбора точки ^ внутри него.
Восставим из точек |г перпендикуляры до пересечения
с графиком функции y=f(x). Вся фигура аАВЬ разобь-
разобьется на полоски («криволинейные трапеции»), причем каж-
каждую такую полоску можно приближенно считать прямо-
прямоугольником с основанием xt — xt_i и высотой / (?,). Пло-
Площадь каждого такого прямоугольника равна /(^)(*,- — *,-_i).
Совокупность всех таких прямоугольников образует сту-
ступенчатую фигуру, площадь которой равна:
262
Если теперь увеличивать число точек деления отрезка
[а, Ь] и рассматривать все возможные ступенчатые фигу-
фигуры, которые получаются при различных разбиениях и
тТП
7\
Ъ=х„ х
Рис. 63
различном выборе точек ?,-, то геометрически почти оче-
очевидно, что если максимальный по величине отрезок раз-
разбиения достаточно мал, то 'все ступенчатые фигуры, по-
построенные при помощи этого разбиения при различном
выборе точек ?,-, будут очень похожи на криволинейную
трапецию аАВЬ. Площадь любой ступенчатой фигуры
легко определить по формуле A). Естественно поэтому
дать такое определение площади аАВЬ.
Определение. Площадью S криволинейной трапеции
а А В b называется предел сумм вида A) при стремлении
max (xt — xi_i) к 0, где точка ^ — произвольная точка от-
отрезка [Xi_u Х4].
Коротко это записывается так:
B)
Суммы вида A) и их пределы типа B) встречаются и
в других геометрических и физических задачах, например
в задаче определения работы переменной силы.
Представим себе, что переменная сила F (х) направле-
направлена вдоль прямолинейного отрезка [а, Ь\ от точки а к
263
шах Д xi -»0 ,•
точке b. Нас будет интересовать вопрос, можно ли опре-
определить работу этой силы на пути [а, Ь]. Будем исходить
из того, что если сила постоянна, то
работа силы = сила X путь.
Разобьем весь путь [а, Ь] на маленькие отрезки точками
деления *,¦:
.<*„ = b.
На каждом из отрезков [х{_и xt] силу F(x) можно при-
приближенно считать постоянной и равной ее значению в про-
произвольной точке этого отрезка ?г:
Тогда естественно считать, что на отрезке [xt_i, xt] ра-
работа силы F(x) приближенно равна F(%l)(xi — х^), а на
всем отрезке [а, Ь] работа силы F(x) приближенно равна
2^&м*1-*м). (О
Мы снова пришли к сумме вида A).
Если мы будем увеличивать число точек деления п
так, чтобы максимальный по величине отрезок разбиения
стремился к 0, то можно ожидать, что эти суммы будут
близки друг к другу независимо от выбора точек Е,- и не-
независимо от разбиения отрезка [а, Ь] на части и, кроме
того, будут стремиться к некоторому числу А.
Определение. Работой силы F (х), направленной вдоль
отрезка [а, Ь], на этом отрезке называется предел сумм
вида (Г) при стремлении тах(х;—x,_i) к нулю, где точ-
i
ка \г — произвольная точка отрезка [xt_u x{\, т. е.
А= lim j^&) (*,-*,_,)
max Д*г-»(),•_ 1
Как видим, эта задача также" естественно приводит
к нахождению пределов вида B).
Число задач, при решении которых нужно вычислять
пределы сумм вида A), можно легко увеличить. Поэтому
целесообразно попытаться выяснить общие свойства этого
264
нового для нас типа предельного перехода. Прежде всего
необходимы строгие определения.
Пусть имеется функция y — f(x), определенная на от-
отрезке [а, Ь]. Разделим отрезок [а, Ь] на конечное число
отрезков точками деления xt:
Любую конечную совокупность точек вида (*) назовем
разбиением отрезка [а, Ь] на части. В каждом частичном
отрезке [х1Л, х{] выберем некоторую точку it {xt_i ==s ^ ^xt)
и образуем сумму:
2/&)(*!-*,_,). C)
Сумма C) называется интегральной суммой функции
f(x) на отрезке [а, Ь]. Для ее полного определения нужно
задать разбиение (*) и точки \г. Будем теперь увеличи-
увеличивать число точек разбиения (*) и образовывать всевоз-
всевозможные интегральные суммы.
Определение. Число 1 называется пределом интег-
интегральных сумм C), если для любого е ]> 0 можно подобрать
такое §^>0, что независимо от выбора точек lt внутри
соответствующих отрезков будет иметь место неравенство
| / — 2 f fit) (xt ~ xt-i) I ^ e ^ЛЯ любого разбиения вида (*)
лишь бы только max (xt — xt_t) = max Дхг <^ 8.
Коротко это обозначают так:
/= lim 2 f(h)(xi-xtj). D)
Д0
Предел D), если он существует, называется определен-
определенным интегралом функции f(x) на отрезке [а,Ь] и обозна-
ь
чается \ f (x) их.
а
Его величина полностью определяется числами а, Ь и
значениями функции /(*), принимаемыми ею на отрезке
[а, Ь\. Функция f (х) в этом случае называется интегри-
интегрируемой на отрезке [а, Ь], а числа а и Ь называются:соот-
265
еетственно нижним и - верхним пределами интегрирова-
интегрирования *К
Это обозначение напоминает обозначение неопределен-
неопределенного интеграла. Как мы увидим дальше, между неопре-
неопределенным и определенным интегралами функции имеется
глубокая связь. Проверка существования интеграла от
функции f(x) на отрезке [а, Ь] на основе его определения
представляет весьма сложную задачу. В следующем пара-
параграфе мы докажем существование определенного интег-
интеграла у достаточно широкого класса функций. Сейчас же
мы установим несколько простых свойств определенного
интеграла, которые следуют непосредственно из его опре-
определения. Можно доказать, ,что функция / (х), неограни-
неограниченная на [а, Ь], не интегрируема на этом отрезке. По-
Поэтому в дальнейшем мы будем рассматривать только огра-
ограниченные функции.
Докажем простейшие свойства определенного интеграла.
1) Если функция f(x) постоянна на отрезке [а, Ь] и
b
равна С, то \)Сйх = Сф — а).
а
Доказательство. В этом случае при любом раз-
га п
биении 2 / ft) (*i — ям) = Е с (*<¦ — х'-д = С(хп — х№)=
ii ii
= С (Ь — а), т. е. все интегральные суммы равны С ф — а),
а поэтому и предел их также равен Сф — а).
2) Если f (х) и g(x) — функции, интегрируемые на
[а, Ь], то и функция f(x)±g(x) интегрируема на [а, Ь] и
J [/(х)±g(x))dx=lf (х)dx+ \g(х) их.
а а а
Доказательство. Образуем какую-либо интеграль-
интегральную сумму функции f(x)±g(x):
=i; / в) (xt - *m)± e g ft) (x, - y.
i i
b
*' Определение интеграла \ f (x) dx, приведенное ,здесь, при-
a
надлежит Риману, и функция f (х), интегрируемая на [а, Ь] в смысле
этого определения, называется интегрируемой по Риману.
266
Если теперь устремить max b.xt к нулю, то пределы
i
обеих сумм, стоящих в правой части, существуют и равны
ь ь
соответственно \f(x)dx и ^g(x)dx. Следовательно, Су-
ai а
ществует предел и левой части, а с ним интеграл
\ (/(x)±g(x))dx = \ f (х) dx±\g(x) dx.
a a a
3) Если функция f (x) интегрируема на [a, b] и С —
любое постоянное число, то и Cf (x) интегрируема на
[а, Ь] и
ь ь
\Cf{x)dx=C\f{x)dx.
а а
Доказательство. Это свойство следует из равенства
2 Cf ft) (xt - *w) = С ^ /
И так как предел суммы справа существует, то сущест-
существует и предел суммы, стоящей слева, и имеет место дока-
доказываемое равенство. Гойорят, что постоянный множитель
можно выносить за знак интеграла.
4) Если функция f (x) интегрируема на отрезках [а, с]
и [с, b] (a^c^b), то она интегрируема на всем о/п-
резке [а, Ь) и
\f{x)dx=\f{x)dx + \f(x)dx.
а а с
Доказательство. Разделим отрезок [а, Ь] на неко-
некоторое число частей п разбиением вида (*). Точка с при
этом разбиении попадает в некоторый отрезок, например
отрезок [xk_u xk] (см. рис. 64). Запишем произвольную
интегральную сумму для f(x) на [а, Ь], соответствующую
хк-1с *к Ь=хп х
Рис. 64
267
данному разбиению, и проделаем над ней очевидные тож-
тождественные преобразования:
= { Ё1 / ft) (* - *i-
+ / ft) (** - **_,) - / (с) (с - **_,) - / (с) (дс* - с).
Заметим теперь, что выражение, стоящее в первых
фигурных скобках, есть некоторая интегральная сумма
для функции f(x) на [а, с], а во вторых скобках стоит
интегральная сумма для f(x) на [с, Ь]. Будем теперь уве-
увеличивать число точек деления так, чтобы Д0
i
В этом случае выражение в первой скобке будет стре-
с Ь
миться к \if{x)dx., выражение во второй скобке к ^ f(x)dx,
а с
остальные три члена в правой части. будут стремиться
к нулю, так как f(x) ограничена, a xk — xk_i-*-0,
с — *ft_i->0 и xk — С-+-0. Таким образом, существует
предел интегральных сумм функции / (х) на [а, Ь] и этот
с Ь
предел равен ^f(x)dx-\-^f(x)dx, т. е.
lf(x)dx=lf(x)dx+lf(x)dx.
а а с
5) Если функция y = f(x) неотрицательна и интегри-
ь
руема на [а, Ь], то ^f(x)dx^0.
а
Доказательство. Любая интегральная сумма f(x)
п
на [а, Ь] неотрицательна. Действительно, ^ fft)(*< —
H, так как любое слагаемое в этой сумме неот-
неотрицательно. Отсюда непосредственно следует наше ут-
утверждение.
268
b
Аналогично доказывается, что \ f(x)dx^ О, если на
а
[а, Ь] функция у = /(х) ==?().
6) Если f(x) и g(x) интегрируемы на [а, Ь] и /(х)г*
ъ ъ
^g(x), той § / (х) dx S* § g (x) dx.
а а
Доказательство. Образуем функцию z(x) = f (x) —
— g(x)^0. Эта функция интегрируема в силу свойства
2) и § г (х) dx S* 0 в силу свойства 5). Следовательно,
а
Ъ Ъ Ъ
\f{x)dx-\g(x)dx = \[f{x)-g(x)]dx^O, ч. т. д.
а а а
s
7) Теорема о среднем. Пусть функция f(x) не-
непрерывна и интегрируема на отрезке [а, Ь]. Тогда най-
найдется такая точка -ц ? [а;Ь], что
dx = f(t\)(b — a).
Доказательство. Так как f(x) непрерывна на
[а, Ь], то найдутся такие числа т и М (наименьшее и
наибольшее значения /(х) на [а, Ь]), что >
Согласно свойству 6) будем иметь:
Ь
Учитывая, что \dx = b — а, получим:
а
Ь-
т(Ь — а)<$/(х) dx^M (b — a),•
а
или после деления на положительное число Ь — а:
269
о
Положим [J. = ь__а \ f (x)dx. Но непрерывная функция
а
f(x) принимает все значения между т и М (см. гл. IV § 4),
в частности', и значение р.. Пусть это значение прини-
принимается в некоторой точке т\. Тогда / (тц) = ^ = , X
X \ f (х) dx, или \ f (х) dx = f (*7j) (b - a).
a a
a
Определение. Интегралом §/(x)dx, где b^>a, назо-
ь
вем предел интегральных сумм вида:
где b = xn^>xn_ly> ... >д:0 = а, *i<5iO,-+i при
max Дхг -> 0.
Ь а
8) Если существует ^ f (x) dx, то существует \f(x) dx
Ь
\f(x)dx = -\f(x)dx.
b a
Доказательство. Действительно, перепишем ин-
интегральную сумму для интеграла, стоящего в левой части
доказываемого равенства, в таком виде:
п
2 / <Sn-l) (Хп-4 — Xn_i+1) =
В правой части этого равенства стоит интегральная
ь
сумма для § / (х) dx (с точностью до нумерации членов).
о
Ь
Если существует § / (х) dx, то, переходя к пределу при
а
270
max &х{ -> 0 в обеих частях этого раенства, мы получим
i
требуемое утверждение.
Рассмотрим пример вычисления нтеграла непосред-
непосредственно с помощью определения и указанных свойств.
Пусть мы хотим вычислить
V
/W*. где
По свойству 4) достаточно вычелить § f (х) dx и
-1
1 0 1
\f{x)dx. По свойству 1) \ f(x)dx=—\; \f{x)dx фор-
0 —10
мально нельзя вычислить по п. 1), ак как f(x) не яв-
является постоянной на отрезке [0,] (f(x) = —1 при
х = 0, f(x) = l при хфО). Составш какую-либо интег-
интегральную сумму. Эти суммы могут бнъ двух видов в за-
зависимости от выбора точки Sx.
п
Если Si Ф 0, то любая сумма^ рава ^ {xt — хг_х) = 1.
i = i
¦ Если 5i = 0, то в этом случае штегральная сумма
будет иметь вид:
Если теперь тахДл;г->0, то сммы первого вида
будут оставаться постоянными и рвными 1, а суммы
второго вида стремятся к Г (так кк лг4 —>- 0)- Следова-
Следовательно, ^f (x) dx= 1 и окончательно:
о
\ f(x)dx=l f(x)d {
-1 -1 0
Непосредственное вычисление инеграла как предела
интегральных сумм для большинств; функций сопряжено
с очень большими трудностями. Поэому интересно найти
другой нуть вычисления интеграле. Это мы сделаем
в следующих параграфах.
271
Упражнения
Доказать, что функция, заданная на [0, 1] условием
0, если х—Иррациональное число,
1, если х—
неинтегрируема на отрезке [0, 1].
i 1, если х—рациональное число,
§ 2. ИНТЕГРИРУЕМОСТЬ
КУСОЧНО-МОНОТОННОЙ ФУНКЦИИ
В этом параграфе будет доказана теорема о су-
существовании интеграла у достаточно широкого класса
функций. С ее помощью мы затем дадим очень удобный
способ вычисления определенного интеграла.
Теорема 1. Функция f(x), монотонная на отрезке
[а, Ь], интегрируема на этом отрезке.
Доказательство. Для определенности функцию
f{x) будем считать неубывающей (f(xi)^f(x1), если
xi^>xt). Разобьем отрезок [а, Ь) произвольными точками
деления на части:
a=*o<*i< ,.- <Схп^= Ь. E)
Среди всех возможных интегральных сумм, отвечающих
этому разбиению, выберем две (см. рис. 65):
п
S = 2 / (Xi-i) (Xi — Xi-l) (НИЖНЯЯ СуММа),
/=1
л
S = Y / (хд (xi — xi-\) (верхняя сумма).
В силу того, что f(xi^)^f(li)^f(xi), любая интег-
интегральная сумма, отвечающая разбиению E), удовлетво-
удовлетворяет следующему неравенству: .
s^s^S, F)
л
где а—У
Установим необходимые нам свойства верхних и ниж-
нижних сумм.
Свойство 1. При добавлении новых точек деления
в разбиении E) нижняя сумма может только возрасти,
а верхняя может только уменьшиться.
272
Для доказательства этого свойства, очевидно, доста-
достаточно рассмотреть случай, когда добавляется лишь одна
точка в разбиении E). Пусть это будет точка х1 и х,<^
^"^1. Рассмотрим новое разбиение отрезка [а, Ь]:
хп = Ь. E')
Рис. 65
i
Соответствующие этому разбиению нижняя и верхняя
суммы могут быть записаны следующим образом:
1
Поэтому, вспоминая определение s и 5 для исходного
разбиения E), будем иметь:
if - s = f (xj) {х1 - х}) + / (У) (а;/+1 - хО -
5' - 5 =
i)) (х- - xj) < 0.
Тем самым свойство 1) доказано.
273
Для одного и того же разбиения, очевидно, имеет
место неравенство s==sS. Это свойство поддается обоб-
обобщению.
Свойство 2. Любая верхняя сумма не меньше любой
нижней суммы, если даже они определяются для различи
ных разбиений промежутка.
Пусть 5i и Sj — нижняя и верхняя суммы, отвечающие
разбиению A°), ss, Ss— суммы, отвечающие некоторому
другому разбиению B°). Пусть C°) — новое разбиение,
которое получается объединением разбиений A°) и B°)
в одно новое разбиение, s3, 53~его нижняя и верхняя
суммы. Разбиение C°) получилось добавлением к точкам
разбиения A°) новых точек деления из разбиения B°).
Поэтому по свойству 1)
S3^s3^Sl. G)
С другой стороны, разбиение C°) получилось добавле-
добавлением к точкам разбиения B°) точек разбиения A°).
Поэтому из свойства 1) вытекает, что
S3SsS3. (8)
Объединяя G) и (8), получим:
Свойство 3. Если f (х)— неубывающая на [а, Ь]
функция, a s и S — нижняя и верхняя суммы, соответст-
соответствующие одному и тому же разбиению, то
lim E — s) = 0. (9)
max Дл^-¦ О
n
Действительно, S — s = ^ [f (xt) — f (x,_i)] (x, — x,_t).
Так как / (xt) — / (#,_,) ^ 0, то, заменив xt — хг_х наиболь-
наибольшим значением тахДх,-, мы можем только увеличить каж-
i
дое слагаемое, т. е.
0 ^ 5 - s < {J] (/ (Xl) - f (*_,))} max Axt =
= If (b)-f (a)] max bxt.
Таким образом, для любого е^>0, как только
max &х{ ^ fibV—t (а) ' так ^Удем иметь неравенство 0^
seS — s^e, т. е. предельное соотношение (9) доказано.
274
Возьмем теперь разбиение E) и будем добавлять в него
точки деления так, чтобы max Д#,- -»- 0. Тогда соответст-
i
вующие этой последовательности разбиений нижние суммы
будут йе убывать (свойство 1) и оставаться ограничен-
ограниченными (например, любой верхней суммой (свойство 2)).
По теореме Вейерштрасса (гл. III, § 3) эта последова-
последовательность нижних сумм имеет предел, который обозна-
обозначим через /.' По свойству 3) последовательность верхних
сумм для той же последовательности разбиений также
имеет предел /. Пусть теперь s n S — произвольные верх-
верхняя и нижняя суммы, отвечающие, может быть, разным
разбиениям. Докажем, что
s=sc/s?S. A0)
Это немедленно следует из свойства 2). Действительно,
s меньше или равно любой верхней сумме, следовательно,
меньше и любой из верхних сумм последовательности,
сходящейся к /, а следовательно, и их предела. Анало-
Аналогично доказывается вторая часть неравенства A0).
Теперь мы можем доказать, что при любом выборе lt
и любой последовательности разбиений существует предел
lim ? /&)(х, —хм) = /,
max Дх.-» 0 i = l
I
и тем самым доказать теорему. Другими словами, нам
нужно доказать, что для любого е ^> 0 можно найти такое
8>0, что
как только maxAx,-=s?& при любых Е4 ? Дл:?.
п i
Положим 2 f(bi)&Xi — e. Пусть sa и Sa — нижняя и
верхняя суммы, соответствующие этому разбиению. Тогда
Sa^as^S,, н одновременно
^/<Sa . A2)
в силу A0).
Но из неравенств A2) следует, что
- |/-e|<.S,-5e A3)
275
при любом разбиении отрезка и при любом выборе точек ?,-.
Используем свойство 3) и ро данному е^>0 выберем
Ь = f(j,\^_f(a\ • Тогда | / — о | ==? е, как только max | Дх,-1 <
<^8 при любых Zi ? Дхг. Теорема доказана.
Определение. Функция f (х), определенная на отрезке
[а, Ь], называется кусочно-монотонной на [а, Ь], если
отрезок [а, Ь) может быть представлен в виде конечной
суммы отрезков, на каждом из которых f (x) моно-
монотонна.
Например, функция у = х* убывает на [—1,0] и воз-
возрастает на [0, 1]. .Следовательно, она кусочно-монотонна
на [-1,1].
Следствие. Кусочно-монотонная функция, опреде-
определенная на отрезке [а, Ь], интегрируема на этом от-
отрезке.
Действительно, пусть функция f (x) возрастает на
отрезке [а, с] (а-^c^b) и убывает на [с, Ь]. Тогда
в силу доказанной теоремы она интегрируема на [а, с]
и [с, Ь]. Следовательно, по свойству интегрируемых функ-
функций (см. § 1) она интегрируема на [а, Ь].
Очень широким классом интегрируемых функций
является класс всех непрерывных функций. Имеет место
теорема.
Теорема 2. Функция, непрерывная на отрезке [а, Ь]„
интегрируема на этом отрезке.
Это утверждение не является следствием предыдущего,
так как существуют непрерывные функции немонотонные
ни на каком отрезке. Доказательство этой теоремы похоже
на приведенное, только сложнее в деталях, и мы приводить
его не будем.
§ 3. ИНТЕГРАЛ С ПЕРЕМЕННЫМ ВЕРХНИМ
ПРЕДЕЛОМ. СУЩЕСТВОВАНИЕ
НЕОПРЕДЕЛЕННОГО ИНТЕГРАЛА
Пусть y = f (x) — непрерывная функция на
[а, Ь]. При любом х из [а, Ь] по теореме 2 предыдуще-
предыдущего параграфа существует
\dt = <b(x), A4)
а
276 ~
т. е. формула A4) определяет нам функцию Ф (д:) на отрезке
la, b]. Докажем сейчас, что функция Ф(л:) дифференци-
дифференцируема на [а, Ь] и
V(x) = f(x). A5)
Действительно, используя свойство 4) из § 1, получим:
«Г (*) = ШпФ(*+*> "*<*> =
x + h
(J \\\ f(t)dt. По тео-
+
реме о среднем § f(t)dt = h-f (?Л), где ?л лежит между
X
точками х и jc-j-ft. Таким образом, так как %h—>x при
й-Ои функция /(*) непрерывная, то Пт^- § f(t)dt =
h -* о Л
= Пт/(^Л) = /(л:). Равенство A5) означает, что Ф(л;)
является первообразной для f{x). Таким образом, доказана
теорема: всякая непрерывная функция имеет первообразную.
Пусть F (х) — какая-либо первообразная функция / (д;)
на отрезке [а, Ь] и Ф(х) = ^(х)йх(а^х^Ь). Двеперво-
а
образные одной и той же функции могут отличаться лишь
на постоянное слагаемое (см. гл. XII § 1), поэтому
где С — некоторая постоянная.
При л; = 6 имеем:
F ф) = Ф F) + С.
При х-=а:
F(a)~C(TaK как Ф(а) =
Отсюда
ь
Разность F (Ь) — F (а) иногда обозначают через F (х) I , т. е.
а
\dx = F(b)-F(a)=F(x)\. A6)
а
277
Итак, доказана теорема. Определенный интеграл
в пределах от а до b непрерывной на отрезке [а, Ь] функ-
функции равен разности значений любой ее первообразной
в концах этого отрезка.
Это знаменитая теорема Ньютона—Лейбница, с по-
помощью которой мы можем вычислять определенные инте-
интегралы через неопределенные.
Выведем, несколько полезных формул преобразования
определенных интегралов. Они будут непосредственно
следовать из соответствующих формул предыдущей главы
и теоремы Ньютона—Лейбница.
1) Формула интегрирования по частям.
Если f (х) и ср (х) имеют производные на отрезке [а, Ь]
и функции f (х) ¦ ср' (х) и f (х) ¦ ср (я) непрерывны на [а, Ь], то
- I f (х) ср' (х) dx= f(xyv (х) | - ([ ср (x) f (х) dx.
а а а
Для доказательства рассмотрим формулу интегрирования
по частям для неопределенных интегралов: § / (х) ср' (х) dx=
— / (*) • <Р (х) — \ f (х) 9 (х) ^х. Пусть F (х) — некоторая
первообразная для функции ?(х)у(х). Тогда функция
^i (x) =zf(x)i? (х) — F (х) будет первообразной для функции
f(x)-9'(x). В рилу A6)
а
И
Ь Ь
F(x)\=lf'(x).<?(x)dx.
а а
Отсюда и получаем требуемую формулу.
2) Замена переменной в определенном
интеграле. Пусть функция f(x) непрерывна на [а, Ь].
Положим х = <? (t). Если ср (t) обладает следующими свойст-
свойствами:
1°. ср(?) определена на некотором отрезке [а, [3] и при
а ^ / sg p значения ср (t) не выходят за пределы отрезка
[а, Ь];
2°. ср'(^) существует;
3°. / (? @) • ?'@ непрерывна на [а,
4°. <р(а) = а, р 6
278
тогда
В самом деле, пусть F (х)— первообразная для f(x).
Тогда Q)(t)=P((p(t)) — первообразная на [а, р] для
/ (? @)" ?' (*)• Эт° проверяется дифференцированием Ф (t).
По теореме Ньютона—Лейбница
$ / (<Р @) ?' (t) dt = Ф @ |=^((р (ft)-F (<p (a))=F F) - F (a).
По той же теореме
\f (x)dx = F(b)-F (а).
а ¦- ¦
Сравнивая эти два равенства,- получаем требуемое
утверждение.
§ 4. НЕКОТОРЫЕ ГЕОМЕТРИЧЕСКИЕ
И ФИЗИЧЕСКИЕ ПРИЛОЖЕНИЯ
ОПРЕДЕЛЕННОГО ИНТЕГРАЛА
Пусть функция y = f(x)^0 и интегрируема на
отрезке [а, Ь]. Рассмотрим криволинейную трапецию,
образованную осью х снизу, двумя прямыми х = а и
х = Ь с боков и кривой y = f(x) сверху (см. рис. 63).
Мы уже определили площадь этой «трапеции» как предел
сумм вида B). Теперь мы знаем, что этот предел равен
b
^f{x)dx. Таким образом, если подынтегральная функция
a
Ь
неотрицательна, то § / (х) dx имеет наглядный геометри-
а
ческий смысл площади криволинейной трапеции. Пусть
теперь подынтегральная функция / (х) меняет знак на
отрезке интегрирования (например, она имеет такой вид,
как это изображено на рисунке 66). Из свойств опреде-
определенного интеграла следует:
$ / (х) dx = ff (x) dx + [f (x) dx + lf (x) dx.
a .- a xi хз
279
В силу вышесказанного первый и третий интегралы
правой части равенства равна площадям криволинейных
трапеций I и III. Второй интеграл, очевидно, равен
площади трапеции II, но взятой со знаком «—». Таким
ь
образом, § f (х) dx равен алгебраической сумме площадей,
Рис. 66
заключенных между графиком функции y = f(x) и осью*,
причем площади, лежащие над осью х, входят в сумму
со знаком «-)-», а лежащие под осью х — со знаком
«—». Поставим вопрос об определении площади произволь-
произвольной плоской фигуры. Если эта фигура криволинейная
трапеция, то, как мы выяснили, ее площадь может быть
определена через интеграл. Часто удается разбить данную
фигуру на несколько криволинейных трапеций, площади
которых можно определить интегрированием. Поясним,
как это может быть сделано, на примерах.
1) Найдем площадь, заключенную между прямой у = — л:,.пара-
л:,.параболой у = 2х-^-х2. Это параболический сегмент, изображенный на
рисунке 67. Как это видно из чертежа, площадь S равна площади
параболического сегмента Sx и площади треугольника ОВС без
площади S2:
,? х** 4
1 g I a ^t
9 ~ а
9
= 2
S2 = — f Bлг — x2)dx=^(xa —
'9 9
Окончательно
,280
4 9 4
= o--r-T ^ = 4,5,
2) Найдем этим методом площадь круга радиуса а. Если мы
расположим начало координат в центре круга, то уравнение окруж-
окружности будет xs -j- ys = as. Заметим, что уравнение верхней полу-
полуокружности будет у=Уав—Xs. Очевидно, что площадь круга
равна удвоенной площади верхнего полукруга; но верхний полукруг
У i
Рис. 67
представляет собой криволинейную трапецию и его площадь S
а
выражается в виде S = J У а3 — х3 dx. Этот интеграл вычисляется
— а
при помощи замены переменной x=asint. Точкам х = ±а
а
соответствуют значения < = ± -к. Поэтому S=J У а3— х* dx—
— а
i 2
= Щ-ч Следовательно, площадь всего круга S —
?
281
К вычислению определенных интегралов может быть
сведена и другая важная геометрическая задача ~ нахожде-
нахождение объёмов тел. Достаточно просто такое сведение может
быть сделано для тел некоторого специального вида — тел
вращения.
Предположим, что нам, дана криволинейная трапеция,
образованная кривой y~f(x)^>0, отрезками прямых
х — а, х = Ь и осью х. Фигуру аАВЬ повернем на 360°
вокруг оси'*. В процессе поворота трапеция аАВЬ опишет
некоторое пространственное тело. Зто тело и называется
телом вращения. Нужно определить его объем. Разобьем
промежуток [а, Ь] на части точками делениями=x{l<^xi<C ¦ ¦ •
• • • <С xi <С • • ¦ <С хп — b, проведем прямые аАВЬ и образуем -
ступенчатую фигуру, вписанную в трапецию аАВЬ (см.
черт. 65). Образуем тела вращения'соответствующей трапе-
трапеции аАВЬ и ступенчатой фигуры. Тело вращения, полу-
полученное от вращения ломаной, очевидно, состоит из ряда
прямых круговых цилиндров. Объем этого тела легко
подсчитать.
Объем t-ro цилиндра выразится формулой:
у<=*1/to)]9 •(**—¦*-!).
Объем всего тела, очевидно, равен:
я
V ступ. 2j ' it Т. С
i = I
V ступ* ~ "* ^ ^^ \/ \^i)) \^i ^i —- i)• \ ^ /
Сумма A7) является интегральной суммой для функции
Определение. Объемом V тела вращения, образован-
образованного вращением криволинейной трапеции аАВЬ, называется
предел сумм A7) при тахДх,-^0.
Этот предел существует, если функция /2 (х) интегри-
ь
руема, и равен V = ir§ f (x) а[х.
а
Примеры. 1) Найдем, пользуясь полученной формулой, выра-
выражение объема прямого кругового усеченного конуса с радиусом
нижнего основания а, верхнего Ь и высотой Л.
282
Как это ясно из рисунка 68, такой конус является телом, образо-
образованным вращением трапеции (OBCD) вокруг оси х. Уравнение
прямой, ограничивающей трапецию сверху, можно записать в виде:
Рис. 68
(/=—т-^лг+а. Тогда объем конуса V будет равен: У=
. J
4-
dx.
После несложных преобразований выражение для V может быть
приведено к виду: V = -=-h (а*-\-аЬ-\-Ь2).
2) Найдем теперь объем тела, полученного от вращения полу-
полуволны синусоиды (/=simr вокруг оси х. По общей формуле
тс и
V==n \ sin2 xdx = я \
1 — cos 2x
dX:
Многие физические величины выражаются в виде определенных
интегралов. В § 1 этой главы мы определили работу переменной
283
силы F(x), действующей вдоль отрезка [в, ft], в виде предела
некоторых сумм. Сопоставляя это определение с определением
д
определенного интеграла, получим, что работа А равна: A—\F(x)dx.
а
Задача 1. Пусть два точечных тела массы М и 1 находятся
все время на одной прямой, причем тело с массой М неподвижно.
Найдем, какую нужно совершить работу, чтобы переместить тело
(М)
9-ifS
О а
Рис. 69
массы 1 из точки а в точку Ь (рис. 69). Согласно закону тяготения,
когда тело с массой 1 находится в положении х, на него дейст-
действует сила
(Y — гравитационная постоянная). Следовательно, искомая работа
равна: .
. „ f dx .. I 1 1 \
' J xa l\a bp
Задача 2. Вычислим работу, которую нужно затр'атить на выка-
выкачивание воды из котла, имеющего форму полушара с радиусом ./?.
В этом примере искомую величину также можно получить ин-
интегрированием. Разобьем объем полушара на п слоев. Расстояние
«-й полоски от верхнего уровня равно *;. Высота «-й полоски
равна Х{ — дг,-_! (рис. 70). Каждый такой слой можно считать ци-
цилиндром высоты Х{ — Xi_tYi ра-
радиусом основания j//?3 — A'f.
Считая удельный вес воды 1,
получим, что вес этой полоски
равен п (R* — х\) (Xi — x,-_j).
Выкачивание объема воды
с таким весом равнозначно его
подъему на высоту x-v Работа
этого подъема равна iur; (R2—
5)()
Рис. 70
284
я
Образуем сумму п 2*г (R2—xf) (xt—X{_i). Естественно счи-
считать работой выкачивания воды из котла предел этих сумм при
^0 Так как эти суммы — интегральные суммы функции
— x2) на отрезке [О, R], то А — п \ х (R* — х2) их == -^-..
Упражнения
П Найти площадь сегмента, отсекаемого прямой х-\-у = 2 от
параболы у-=х2.
2) Найти площадь эллипса —-}~ fr = 1-
3) Найти объем тела, полученного от вращения криволинейной
4) Котел имеет форму параболоида вращения глубиной /f= 0,5 м
и радиусом основания ./? = 0,4 м. Определить работу, которую нуж-
нужно затратить на выкачивание воды из наполненного котла.
Глава XIV
ПРИБЛИЖЕННОЕ ВЫЧИСЛЕНИЕ
ОПРЕДЕЛЕННЫХ ИНТЕГРАЛОВ
§ 1. ПРИБЛИЖЕННЫЕ ФОРМУЛЫ
ДЛЯ ВЫЧИСЛЕНИЯ ОПРЕДЕЛЕННЫХ
ИНТЕГРАЛОВ
В предыдущей главе мы доказали формулу Нью-
Ньютона — Лейбница, позволяющую вычислять определенный
ъ
интеграл ^f(x)dx, если известна какая-либо первообраз- .
а
ная для функции y = f(x). Однако на практике часто
встречаются случаи, когда первообразная функции / (х) или
не выражается через элементарные функции (например,
\ е~ *2 dx, \ -2-^- dx), или ее выражение настолько слож-
ное, что пользование • им весьма затруднительно. В этих
случаях для вычисления определенных интегралов поль-
пользуются не формулой Ньютона — Лейбница, а некоторыми
формулами, позволяющими вычислить интеграл прибли-
приближенно, с нужной степенью точности. Эти приближенные
формулы называются квадратурными формулами*).
а) Формула прямоугольников. Простейшие квад-
квадратурные формулы получаются непосредственно из опре-
ь
деления § / (х) dx как предела интегральных сумм.
а
Разобьем отрезок [а, Ь] точками деления xt:
a = *0Oi <...<>„ = &.
Тогда
Ь л-1
lf(x)dx= lim 2
а шах Д*г-»0 i=0
*) Квадратурные формулы позволяют приближенно находить
интегралы и таких функций, численные Значения которых нам из-
известны не во' всех точках отрезка интегрирования, а только в не-
некоторых, например из таблицы.
286
Таким образом, при достаточно мелком разбиении от-
отрезка [а, Ь] будем иметь:
^^xl. A)
1=0
Выражение, стоящее в правой части A), и будет про-
простейшей квадратурной формулой.
Рассмотрим частный случай формулы A), который
получается,' если длины интервалов Дх,- равны и ii = xi.
Так как все интервалы равны между собой, то Дхг =
= а . Окончательно формула A) переписывается в
этом случае так:
л-1
B)
(=0
Формула B) носит название квадратурной формулы
прямоугольников. Это название дано из следующих гео-
геометрических соображений (рис. 71). Левая часть формулы
B) выражает площадь криволинейной трапеции acdb. Пра-
Правая часть есть площадь фигуры, состоящей из прямоуголь-
прямоугольников (заштрихована на чертеже). При увеличении числа
п эти площади все меньше и меньше отличаются друг от
друга. Следует,- однако, иметь в виду, что формула B) часто
бывает неудобна, так как для получения удовлетворитель-
удовлетворительной точности приходится брать число п очень большим.
Более точные значения интеграла при меньшей вычисли-
вычислительной работе дают квадратурные формулы, которые мы
сейчас рассмотрим.
б) Формула трапеций. Разобьем промежуток ин-
интегрирования на п равных частей длины ~а и из точек
Рис. 71
287
Pi*,
деления xt проведем
прямые, перпендику-
перпендикулярные оси Ох. Точки
пересечения этих пря-
прямых с кривой y = f(x)
обозначим через сг и
последовательно их
соединим, проведя
хорды ch ci+i. Мы по-
получим фигуру, состоя-
щую из п трапеций,
площадь этой фигуры,
очевидно, близка к
площади криволиней-
криволинейной трапеции (acdb). Найдем площадь фигуры, состоящей из
трапеций (она заштрихована на рис. 72). Площадь трапеции
XiCiCi+1xi+1 равна высоте трапеции (———), умноженной на
среднюю линию f {Xi) \f {JCi+l).
Рис. 72
(?щП
п L 2
Площадь всей заштрихованной фигуры равна
_b-a\f
n L
_b-a\f jxa),+.f (xn)
2
Вспоминая, что xn = b, xo = a, можно написать:
, . Ь~а
где xi = a-\-t———.
Формула C) носит название квадратурной формулы
трапеций.
в) Формула Симпсона. Опять разбиваем проме-
промежуток [а, Ь] на п равных частей длины точками
деления хг^=а-\-г
288
i ~~ °
Между парами точек xh xi+1
возьмем еще по одной точке х
Xj
(рис. 73).
Восставим перпендикуляры из всех точек хи х i, xi+i.
2
Они пересекут кривую y = f(x) в точках с{, с и см
соответственно. Проведем параболу через три точки ct,
с. 1. ct+i (всего будет п различных парабол). Площадь
каждой криволинейной трапеции (xh cu ct+u
У
С/*
можно
Рис. 73
считать приближенно равной площади соответствующей
параболической трапеции (xit ct, e. \, си х1+1). Найдем
площадь параболической трапеции. Каждая такая
парабола будет интерполяционным многочленом Лагран-
жа, построенным по точкам: (xit f(xt))t (x \, f(x, \)),
{хии f(xt i)). Уравнение такого многочлена будет (см.
гл. VI):
)
\х xi) \x xt+l)
(х X-Xi)
10 А. Б. Бакушинский
289
Или
Ц (*) = {b-af V(Xi) (X — X. + О С* — *i+i) -
2
2
- 2/ (* 1) (* — х,) (х — *|+1) + / (*|+1) (* — *, , j)
'+2 "*" 2
так как х^~х.+ 1=
+ 1_=~^, xi+l—xi=-~^-, *i + l_
_ b — a
~xi— la •
Площадь параболической трапеции будет равна:
i) J \x-x.+1)(x~xi+l)dx~
'+т
у хт
— <ь/(# 1/ \ (-^ — xi) (X — XijA)UX~\-J (Xi,\) \ (X — X i
Т ^ ^ '+
X(jf-Jfi)d*]. D)
Вычисляем каждый из стоящих в квадратных скобках
интегралов:
2
(так как
— xt) (х — *,+1) dx = — у
,
— ^) dx=-jj (xM — хгK =
Подставляя эти значения в D), получим:
^Li(x)dx = ^-lf(Xi)-\-4f(x
290
Площадь фигуры, состоящей из п параболических тра-
трапеций, приближенно равна значению определенного ин-
интеграла:
Ь ' п-1
6п к Xt Х{+?
Эта формула носит название квадратурной формулы
Симпсона.
Все полученные формулы B), C), E) верны лишь при-
приближенно. Чтобы эти приближенные равенства преврати-
превратились в точные, необходимо добавить к правой части всех
формул некоторые выражения, называемые остаточными
членами квадратурных формул. Можно предположить
(см. черт. 71, 72, 73), что эти остаточные члены стре-
стремятся к нулю при неограниченно увеличивающемся п.
Для формулы прямоугольников это непосредственно сле-
следует из интегрируемости функции f{x). Рассмотрением
остаточных членов формул мы займемся позднее, а этот
параграф закончим одним примером вычисления интеграла
при помощи выведенных формул.
Пример. Пусть необходимо вычислить j sin х dx. Его точное
о
значение легко получить по формуле Ньютона — Лейбница:
п
'2
\ sin xdx= 1. Вычислим теперь его приближенно по формулам прямо-
р
угольников, трапеций и Симпсона. Для определенности возьмем для
формул прямоугольников и трапеций я = 6 (все вычисления ведем
по четырехзначным таблицам).
а) Формула прямоугольников—^—=xfi = — =0,2618. Запи-
ч ft YZ
шем формулу B) в этом случае, пользуясь таблицей значений функ-
функции sin л::
~2
[ sin л:с?лгя»0,2618 • (sin0 -f sin ~ + sin ~ + sin ~ -f
-f sin —¦ + sin —-\ = 0,2618 • @ -f 0,2588 -f 0,5000 + 0,7071 -(-
-f 0,8660 -)- 0,9659) = 0,8634.
10» 291
б) Формула трапеций. По формуле C):
к /
1 -s- 5
\ sin xdxa*0,2618^ g h У sin Ц-у = 0,2618-@,5 +
+ 0,2588 + 0,5000 + 0,7071 +0,8660+0,9659) = 0,9943.
в) Формула Симпсона (я = 3). По формуле E):
ТЕ
С . . п 17 л . 2я\ . / . 2я , я , Зя ,
\ sin х dx = то sin 0 + 4 sin -го + sin то + Isul To -f- 4 sin --n г
J '^1.\ 1^ 1^У \ I-* 1^
о
= ^[@ + 0,2588.
+ 0,5000) +@,5000 + 4 • 0,7071 +0,8660) + @,8660 + 4 • 0,9659+1) =
==0,9998.
Мы видим, что формула Симпсона при том же объеме вычисле-
вычислений дает наиболее точный результат.
Упражнения
1) Вычислить по формуле Симпсона сп=4 величину \у~хйх.
Полученный результат сравнить с точным.
2) Вычислить у — пр. формуле трапеций с я = 8.
'о
§ 2. ОСТАТОЧНЫЕ ЧЛЕНЫ
КВАДРАТУРНЫХ ФОРМУЛ
По определению под остаточным членом квадра-
ъ
турной формулы понимается величина R = $ / (x)dx — F, где
а
F — число, полученное в качестве приближенного значе-
значения интеграла по исследуемой квадратурной формуле.
Однако практически в таком виде эта формула беспо-
бесполезна, так как в нее входит неизвестная нам величина
интеграла. Все же часто удается оценить величину R так,
что в оценку будут входить только известные величины.
В качестве примера проведем оценку остаточного члена
292
формулы прямоугольников. Цредположим, что y = f(x)
имеет на отрезке [а, Ь] производную f (x) и |/'()|М
на [а, Ь].
* я-1
Тогда /?пр= J f(x) dx-^- 2/W =
в i = 0
= 2 f/w^-~ 2 /(*) ^е **
Каждый интеграл вида § f(x)dx можно преобразовать,
xi
используя теорему о среднем
Тогда выражение для R можно записать в виде:
я-1
Но по теореме Лагранжа
/ (У -
Учитывая, что |/'Ы1<^1 и 0 < I, — *,- < ^2, полу-
получаем:
Ai, F — «)'
~" я
Окончательно
Примечание. Более тонкими рассуждениями для величины
Пр можно получить оценку | /?пр | < —' ^ ~а' .
293
Для остаточных 'членов формул трапеций и Симпсона
могут быть получены следующие оценки.
Остаточный член формулы трапеций /?тр. Если обоз-
обозначить Л43 = тах \f"(x) |, то для остаточного члена имеет
[а, Щ
место оценка \R М%аУ
Остаточный член формулы Симпсона Rc. Если Л44 =
= max |/IV (я)|, то для остаточного члена справедлива
Из сравнения приведенных трех формул остаточных
членов мы можем заключить, что с' ростом п Rc наибо-
наиболее быстро стремится к 0. Поэтому если f(x) имеет ог-
ограниченную /Iv (x) на [а,Ь], то формула Симпсона при
данной величине п (достаточно большой) даст, как пра-
правило, более точные результаты, чем формула прямоуголь-
прямоугольников и трапеций.
В качестве примера оценим ошибку, которую мы сделали, вы-
числив в § 1 \ sin х dx по формуле прямоугольников с шагом JL,
Имеем;
Mt = щах | cos x
Истинная ошибка, конечно, меньше этой величины (она равна
~0,15). Сравнительно большое расхождение объясняется тем, что
наша оценка сильно завышена.
Знание оценок остаточных членов иногда позволяет
заранее выбрать число узлов.га, нужное для достижения
заданной точности.
Оценим, например, какое число узлов нужно для вычисления
f dx
по формуле трапеций V —г—: с точностью до 0,001. Для этого
нужно решить неравенство:
294
В данном случае
Ма = max | f" (х) | = max ———— = 2,
Ю,1] [о, l](\+x)'
Ь — e = l,
и, следовательно, нужно найти такие п, для которых
^0,001.
Легко проверить, что «^13.
Для остаточных 'членов формул трапеций и Симпсона
могут быть получены следующие оценки.
Остаточный член формулы трапеций /?тр. Если обоз-
обозначить Л43 = тах \f"(x) |, то для остаточного члена имеет
[а, Щ
место оценка \R М%аУ
Остаточный член формулы Симпсона Rc. Если Л44 =
= max |/IV (я)|, то для остаточного члена справедлива
Из сравнения приведенных трех формул остаточных
членов мы можем заключить, что с' ростом п Rc наибо-
наиболее быстро стремится к 0. Поэтому если f(x) имеет ог-
ограниченную /Iv (x) на [а,Ь], то формула Симпсона при
данной величине п (достаточно большой) даст, как пра-
правило, более точные результаты, чем формула прямоуголь-
прямоугольников и трапеций.
В качестве примера оценим ошибку, которую мы сделали, вы-
числив в § 1 \ sin х dx по формуле прямоугольников с шагом JL,
Имеем;
Mt = щах | cos x
Истинная ошибка, конечно, меньше этой величины (она равна
~0,15). Сравнительно большое расхождение объясняется тем, что
наша оценка сильно завышена.
Знание оценок остаточных членов иногда позволяет
заранее выбрать число узлов.га, нужное для достижения
заданной точности.
Оценим, например, какое число узлов нужно для вычисления
f dx
по формуле трапеций V —г—: с точностью до 0,001. Для этого
нужно решить неравенство:
294
Определение. Уравнение, связывающее аргумент,
неизвестную функцию и ее производные до некоторого по-
порядка, называется дифференциальным уравнением.
Наивысший порядок производной, входящей в дифферен-
дифференциальное уравнение, называется порядком этого уравнения.
Так, уравнения A) и B) являются дифференциальными
уравнениями первого порядка, а уравнение C) — по-
порядка п.
Любая функция у(х) (х меняется на некотором от-
отрезке), обращающая соотношения A)—C) в тождества,
называется решением соответствующего дифференциаль-
дифференциального уравнения.
Займемся сначала более детальным исследованием урав-
уравнений первого порядка.
Чаще всего встречаются дифференциальные уравнения
первого порядка вида:
!/ = f(x, У). D)
Эти уравнения называются разрешенными относительно
производной. Только такие уравнения первого порядка
мы и будем дальше рассматривать.
Обратимся снова к уже достаточно нам знакомому
уравнению A). Мы знаем, что его решение у(х) опреде-
определяется неоднозначно. Именно, решением уравнения A)
может быть любая первообразная функция f (x) на отрез-
отрезке [а, Ь], т. е. к любому решению дифференциального
уравнения A) можно прибавить произвольную постоян-
постоянную и снова получится решение. Оказывается, что и
уравнение общего вида D) имеет на отрезке [а, Ь], вообще
говоря, бесчисленное множество решений. Чтобы выделить
из этого множества функций одну, нужно поставить еще
дополнительные условия. .Чаще всего дополнительное ус-
условие таково: выделить из всей совокупности решений
уравнения D) некоторое решение, принимающее заданное
значение уй в заданной точке х$(^[а, Ь). Эти дополни-
дополнительные данные часто называют начальными условиями.
Итак, задача ставится следующим образом. Найти
функцию у (х), удовлетворяющую уравнению t/ = !(x,y)
при х ? [а, Ь] и начальным условиям у(хл) = уа (лг0, Уо —
заданные числа н.хо?[а, Ь}).
Задачу нахождения такой функции мы будем в даль-
дальнейшем для краткости называть задачей Коши. При неко-
некоторых предположениях относительно f (х, у) и точки (х0,
297
у0) эта задача имеет уже единственное решение. Соответ-
Соответствующая теорема сформулирована в § 2.
Пример. Найти решение уравнения у'*=х* на отрезке [—2,01
такое, что у(—1) = 1 (•*:<)——1, уо—\)- Из результатов главы XII
следует, что вся совокупность решений дифференциального уравне-
жяу' = х4 описывается формулой у (х) = I х* dx = -=-4~ С, где
С »-^ произвольная постоянная. Любая из этих функций определена
при —2^лг^0- Подберем С так, чтобы были удовлетворены и
дополнительные условия. Для С имеем уравнение:
Таким образом, решением поставленной задачи будет функция
Xs 6
у (х) = -=- -|- -х-. Это решение единственно.
. Выясним теперь наглядный геометрический смысл
дифференциального уравнения D) и любого его решения.
Введем на плоскости декартову систему координат хоу.
Пусть у=ср(х) — некоторое решение уравнения D). Кри-
Кривая на плоскости хоу, определяемая уравнением у = <р(х),
называется интегральной кривой дифференциального урав-
уравнения.
Пусть функция двух переменных / (х, у) определена
в некоторой области и на плоскости. Проведем из каж-
каждой точки х, у этой области вектор под углом arctgf(x,y)
к оси х. Совокупность этих векторов называется полем
направлений данного дифференциального уравнения. Поле
направлений целиком определяется видом дифференциаль-
дифференциального уравнения и, наоборот, задание поля направлений
определяет дифференциальное уравнение (вида D)). Так
как тангенс угла наклона касательной к интегральной
кривой в любой ее точке, в силу уравнения D), равен
значению функции f(x, у) в этой точке, то это значит,
что интегральная кривая в каждой своей точке имеет
направление касательной, совпадающее с направлением
поля направлений. Очевидно, верно и обратное утверж-
утверждение: если направление касательной в каждой точке
кривой у = ср (х) совпадает с направлением поля направ-
направлений в этой точке для некоторого дифференциального
уравнения, то эта кривая является интегральной кривой.
Приближенное графическое построение поля направ-
направлений дифференциального уравнения бывает полезно,
298
если мы хотим представить
себе общее поведение интег-
интегральных кривых.
Примеры. 1) Рассмотрим диффе-
дифференциальное уравнение (/' = дг2-|-(/2.
В этом случае функция f(x, y) =
= х*-\-у* определена при всех х, у
и поле направлений можно построить
во всей плоскости. Легко видеть, что
все решения этого уравнения явля-
являются монотонными (неубывающими)
функциями. Действительно, произ-
производная любого решения у'ж=х3-{-
Рис. 74
Нарисуем теперь поле направлений (рис. 74). Предварительно
бывает полезно определить те линии, на которых наклон поля
одинаков. Эти линии называются изоклинами. В данном случае,
например, ^' = 0 только в точке дг = О, (/ = 0; «^«l всюду на ок-
окружности лг2 —f— t/a = 1; (/' = 2 на окружности х*-\-у*-=2 и т. д.
Направление поля в данной точке' будем изображать вектором,
проведенным из дайной точки под углом arctg {xi-\-yi). Зная поле
направлений, можно приближенно иачертить интегральную кривую,
проходящую через некоторую точку (хй, у0) (на рис. 74 изобра-
изображены интегральные кривые, проходящие через точки @, 0) и
2) Рассмотрим уравнение г/' = </2— 1. Правая часть этого урав-
уравнения f(x, у)~у* — 1 определена на всей плоскости. Сначала
найдем корни уравнения f(y)==O, у* — 1=0, yl = \, «/а =—1.
При | у | > 1 у1 — 1 > 0 и при | у | < 1 у* — 1 < 0. Вся плоскость
хоу может быть разбита иа три области: верхняя полуплоскости
— oo<jf<co, у > 1; полоса —оэ<лг<оо, — 1 <(/< 1 и ниж-
нижняя полуплоскость —оэ<*<оэ, у< — 1. Отдельно выделим две
прямые (/=1 и (/== —1. Заметим, что эти прямые являются ин-
интегральными кривыми нашего уравнения и одновременно изокли-
изоклинами с нулевым наклоном. Действительно, иа иих y' — f(± l) = 0.
Все интегральные кривые, проходящие в верхней и нижней
полуплоскости, имеют положительный наклон касательной (соответ-
(соответствующие решения возрастают). Все интегральные кривые, ле-
лежащие в полосе между этими полуплоскостями, имеют отрицатель-
отрицательный наклон касательной. Так как функция у2—1 определяет наклон
поля в каждой точке совершенно однозначно, то никакие две ин-
интегральные кривые не могут пересекаться (из теоремы следующего
параграфа следует, что они не могут даже касаться). Значит, не
существует интегральных кривых этого уравнения, пересекающих
или касающихся интегральных кривых (/ = —1 и у—1- Другими
словами, интегральные кривые или целиком лежат в полосе — оэ <
< х < оо,—¦ 1 < у <;1, или целиком в полуплоскостях выше или
ниже этой полосы. Изоклинами этого уравнения будут прямые, па-
параллельные оси абсцисс. При этом, чем ближе изоклина проходит
к прямой (/=1 или (/ = —1, тем ближе к нулю наклон поля на-
направлений. Отсюда возникает предположение, что прямые у = 1 и
299
j/ = —1 являются асимптотами интегральных кривых, идущих из
полосы и полуплоскостей. Оказывается, что это предположение
действительно справедливо (см. упр. 1 к § 3, п. а)). Поле направ-
направлений и приближенный ход интегральных кривых атого уравнения
изображены на рисунке 75.
X
-1
Рис. 75
Упражнения
\) Для уравнения у' = х-\-у построить изоклины, поле направ-
направлений, приближенно начертить интегральные кривые, проходящие
через точки: а) @, 0); б) (— 1, 0).
2) Для уравнения у' = (у — 3)(у-\-2) начертить поле направ-
направлений, показать на чертеже общий ход интегральных кривых.
§ 2. ТЕОРЕМА СУЩЕСТВОВАНИЯ
И ЕДИНСТВЕННОСТИ РЕШЕНИЯ ЗАДАЧИ
КОШИ ДЛЯ УРАВНЕНИЯ y' = f(x, у)
Нас будет интересовать вопрос, можно ли для
данного дифференциального уравнения у' = / (х, у) и дан-
данных дополнительных условий у(хо) = у0 решить задачу
300
Коши на каком-либо интервале, содержащем лг0. Ответ
дает следующая теорема.
Теорема. Пусть существуют такие положительные
числа cud, что в прямоугольнике х0— с sS х ^ х0 -f- с,
yo — d^y^yo-{-d с центром в точке (х0, у0) функции
f(x,y)uJ- непрерывны. Тогда существует число h^>0,
зависящее от х0, у0, /, такое, что на отрезке (х0 — h,
хй -\- h) существует единственное решение уравнения у" =
= f(x, у), удовлетворяющее условию у(хо) = уо.
Доказательство этой теоремы, мы ввиду его сложности
опускаем. Особо отметим, что эта теорема не гарантирует
существование каких-либо простых формул, выражающих
решение данной задачи Коши, например, через элемен-
элементарные функции.
Пример. Рассмотрим уравнение у' = х* -\- у'. Для него су-
существует решение задачи Коши цри любых х0, у0 (функции х*-\-уг
и 2у непрерывны в любой точке плоскости). Однако это решение
не выражается при помощи конечной комбинации элементарных
функций или интегралов от них.
§ 3. УРАВНЕНИЯ ПЕРВОГО ПОРЯДКА,
ИНТЕГРИРУЕМЫЕ В КВАДРАТУРАХ
Иногда все-таки удается записать всю совокуп-
совокупность решений дифференциального уравнения или ее часть
в виде формулы, связывающей решения и известные
функции и не содержащей производных и интегралов от
неизвестных функций. Такая формула обычно содержит
некоторые произвольные постоянные (см. пример стр. 298).
Если придавать этим произвольным - постоянным опреде-
определенные значения, то можно получать решения различных
конкретных задач Коши. Подобную формулу мы будем
называть общим решением дифференциального уравнения,
если из нее можно получить решение задачи Коши с
любыми начальными условиями из некоторой области.
Каждое конкретное решение, получаемое из общего ре-
решения, называется частным решением дифференциального
уравнения. Этим же термином мы будем обозначать в
дальнейшем вообще любую функцию, удовлетворяющую
уравнению.
Если общее решение данного дифференциального урав-
уравнения можно получить, выполнив конечное число интег-
301
рирований известных функций, то это уравнение мы
будем называть интегрируемым в квадратурах. Примером
такого уравнения является уравнение A). Некоторые
более сложные типы уравнений первого порядка, интег-
интегрирующиеся в квадратурах, мы и рассмотрим ниже.
а) Уравнения с разделяющимися
переменными
Дифференциальные уравнения, приводящиеся к виду
y' = fi(x)-h(y), E)
называются уравнениями с разделяющимися переменными.
К этому классу относятся, например, уравнения t/ = y,
у1 = х3 In у, у' = ху и т. д. Общее решение таких уравне-
уравнений получается следующим образом. Пусть у(х) является
решением уравнения E) на некотором отрезке оси абсцисс.
Будем считать, что в интересующей нас области /2 (у) Ф 0.
Подставим у(х) в E) и перепишем его в следующем виде!
Беря первообразную от правой и левой части, получим:
или
Обозначая одну из первообразных для функций -г-т-г
/2 \У)
через Ф2 (у), а одну из первообразных для функции Д (х)
через <Di (x), получим из F):
Ф1(х)-Ф,(у) = С, G)
где С — произвольная постоянная.
Мы доказали, что если у(х) есть решение уравнения
E), то при всех значениях независимого переменного вы-
выполняется G). Обратно, если мы найдем некоторую диф-
дифференцируемую функцию у(х), которая при всех х удов-
удовлетворяет соотношению G), то эта функция будет удов-
302
летворять дифференциальному уравнению E). Действитель-
Действительно, пусть имеет место соотношение:
Ф1(х)-Ф*(у(х)) = С.
Дифференцируя это равенство и вспоминая наши обоз-
обозначения, получим:
или
Разрешая уравнение G) относительно у (если это воз-
возможно), мы получим набор решений уравнения E), зави-
зависящий от произвольной постоянной С. Можно доказать,
что этот набор при некоторых ограничениях на Д (л;) и
h (У) будет общим решением E). (Сюда могут не войти
некоторые «особые» решения.)
Примеры. 1) Найти общее решение уравнения у' = у.
Равенства F), G) в этом случае примут вид:
ал
у '
После интегрирования имеем: х — \п\у\=С. Решая это урав-
уравнение относительно у, получим: \ у\ = ех~с. Это решение можно за-
записать и так: у = С1-ех (С1 = ±е~с), где Ci — произвольное дей-
действительное число. В данном случае все решения определены при
— оо<ж<оо. Решение задачи Коши с начальными условиями
у(хо) = уо дается формулой у=у„ех~х<>.
х
2) Найти общее решение уравнения у' = ?.
У
Применяя описанную процедуру, получим:
2 2
В данном случае получаются два семейства решений, каждое из
которых имеет свою область определения на оси абсцисс.
Если мы будем решать при помощи найденной формулы зада-
задачу Коши при ?/(лг0) = г/0, то получим, что y = ±.V'x$-\-yl— х*.
Знак корня нужно выбирать таким же, что и знак у0. Таким обра-
образом, полученная формула позволит однозначно решить задачу Коши
для данного уравнения.
Упражнения
В указанных ниже примерах найти общее решение и решение
задачи Коши (там, где это требуется).
303
1) у' = у*— 1. Доказать, что прямые у= 1, </ = —1 — асимпто-
асимптоты интегральных кривых.
4) у' = х
б) Однородные уравнения
Дифференциальные уравнения, приводящиеся к виду
(8)
X
называются однородными.
Примеры таких уравнений:
Покажем, что общее решение уравнения (8) может
быть получено в квадратурах. Введем новую неизвестную
функцию г(х)=?±У-, Если искать общее решение (8) при
х Ф 0, то, зная функцию г (х), мы однозначно определим
у(х) = х-г(х).
Из (8) получаем:
(z(x).x)' = f(z(x)),
или
*X + Z = f{2).
Деля на х (х Ф 0), получим:
В этом уравнении переменные разделены, и оно может
быть решено по формулам F) и G) п.а). Найдя его общее
решение, мы по формуле y~z-x найдем общее решение
первоначального уравнения.
Vs
Примеры. 1) Найти общее решение уравнения у' = ~—2.
Положим z = —. Тогда г'х-\-г = га — 2, илиг'=' ,
X X
Решаем это уравнение с разделяющимися переменными:
Ьа-г-2~ J а: '
304
Легко проверить, что
J
1 1
dz
i г — 2 3 z+1
1 f dz
Отсюда
z*—z — 2"
_ dz
7^2~"IJ z — J
— ln|z — 2 | — i-ln|2+l|— In I л: I = С
о О
, тогда
Будем произвольные постоянные, появляющиеся при алгебраи-
алгебраических преобразованиях, обозначать всегда через С. Тогда получим:
In I
г —2
1 1
RT.
= С, т. е.
г —2
Следовательно, , . =C\x |3, где С — произвольная постоянная
любого знака. Решая это уравнение относительно г, получим:
0 „_
' Отсюда у-
Примечание. Функция г/ = — х, как это легко непосред-
непосредственно проверить, удовлетворяет дифференциальному уравнению,
но она не входит в общее решение. Это так называемое особое
решение. Интересно заметить, что в данном случае оно может быть
формально получено нз общего решения предельным переходом
при С—>со.
v I it
2) Найти решение уравнения у' = —-*-Д.
Перепишем его в виде у' = —. Обозначим z = — тогда г'х +
1—1. х
, 1+2 , \+2г ^
+ z=-j—'— и г=— ' ¦ i. . Отсюда
1— z)dz
После интегрирования получаем:
arctg г —2"In I M
Подставляем г = —:
х
или
arctg — —
11 А. Б, Бакушинскнй
305
Такой вид общего решения не позво-
позволяет выразить у в виде какой-либо
элементарной функции от х. Однако
мы можем графически представить
себе эту зависимость. Положим, на-
например, С = 0 и перепишем наше
соотношение в виде:
arctg |
(*)
Геометрически это равенство озна-
означает, что если точка с координатами
(х, у) лежит на нашей кривой, то
ее расстояние до начала координат
равно ef, где<р—угол между радиус-
вектором точки (а:, у) и осью абсцисс.
Обратно, если мы на всех лучах, иду-
р ™ щИХ из начала координат под углами
O^tp^n, отложим отрезки длины
ef и соединим их концы, то полу-
получится кривая, уравнение которой есть (*). Кривая, обладающая тем
свойством, что для нее г = е?, называется логарифмической спи-
спиралью (здесь уже считается, что —оо =g; <р г?Г оо).
Таким образом, интегральные кривые нашего однородного урав-
уравнения есть куски логарифмических спиралей (рис. 76).
Упражнения
Найти общие решения следующих уравнений:
2ху
''х* — у*>
ти кривую, все касательные к которой проходят через данную
точку (ха, у0).
Указание. Искать кривую в виде у = у(х) и составить для
этой функции дифференциальное уравнение.
в) Линейные уравнения
Так называются дифференциальные уравнения, приво-
приводящиеся к виду
y = f(x). ¦ (9)
Этот тип уравнений также интегрируется в квадрату-
квадратурах. Для определенности будем считать, что функции у(х)
и / (х) таковы, что решение 'уравнения (9) существует при
— оо<[л:<!оо.
Будем различать два случая: 1) f(x) = O; 2) Цх)фО.
306
1) f(x) = O. В этом случае уравнение называют линей-
линейным однородным уравнением первого порядка. Оно имеет
вид:
Переменные в нем разделяются, и его общее решение мо-
может быть найдено так же, как в п. а):
Проинтегрировав левую часть равенства, получим: у =
х
—I v № <«
= Се ° ' .
2) 1(х)фО. Предварительно докажем лемму.
Лемма. Пусть у — А(х) — некоторая функция,- удов-
удовлетворяющая уравнению (9). Тогда
X
-J 9 (<) Л
г/ = С<? ° -\-А{х)
есть общее решение уравнения (9).
Другими словами, общее -решение линейного уравнения
есть сумма некоторого его частного решения и общего
решения однородного уравнения.
Доказательство. Непосредственно из условия сле-
следует, что у при любом С является решением уравнения (§).
Покажем, что, подобрав соответствующую постоянную С
в этой формуле, можно найти решение любой задачи Коши.
Пусть нужно решить задачу Коши с начальным условием
у(х6) = у(). Полагая х = х0 а учитывая, что у(хо) = уц, бу-
будем иметь:
-J 9 V)
откуда
С=(у,-А(хй))е
Лемма доказана.
Вопрос,теперь состоит в том, как найти функцию А (х).
Это можно сделать следующим приемом, называемым ме-
методом вариации произвольной постоянной.
11» " 307
j у № <Я
Будем искать А (х) в виде:
X
А(х) = С(х)е
где С(х) — неизвестная пока функция от х. Подставляя
А (х) в уравнение (9), получим:
X
- J f> (i) «И -J v (J) Л
С(*)е ° — С(*)е ° "¦?(*) +
--J 9 № <Я
+ T(x)C(x)e ° =f(x),
или
J 9 О <«
Беря одну из первообразных правой части, мы получим
одну из возможных функций С(х) и, следовательно, А(х).
По лемме общее решение (9) выражается формулой:
XXX
— J<p(f)rf' —J <p If) rff J <p (f) rff
y=Ce ° +e ° \f(x)e° dx.
При фактическом решении линейных уравнений нет
необходимости помнить приведенную формулу, проще для
каждого уравнения повторить рассуждения, использован*
ные для ее вывода.
Пример. Решить уравнение
t/-\-2y=4x.
Сначала находим общее решение однородного уравне-
уравнения: t/-{-2y=0. —^„J/—^^ —^\n\y\ = x-j-Cu от-
откуда y=Ce'iX (C = ±e'ici). Затем ищем А (х) в виде
А (х) = С (х) e~ix. Подставляя эту функцию в уравнение,
получаем:
, С (х) е~*х — 2С (х) егх + 2С (х) e'iX_= 4x,
т ^ \^ (зс\' " 4 л* • й
308
Берем какую-либо первообразную функции 4xeix, например
е**Bх— 1). Тогда А(х) = 2х—1, и общее решение на-
нашего уравнения:
С
Упражнения
Найти общие решения следующих уравнений:
1) у'-\-2ху = хе~хК, 2) y'-\-y = cosx; 3) y'Jray = emx (a, m —
постоянные числа).
§ 4. ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ
В ШИЗИКЕ
Из всех разделов математики теория дифферен-
дифференциальных уравнений наиболее тесно связана с другими
естественными науками (физикой, химией и т. д.). Это
происходит потому, что природные процессы, изучаемые
этими науками, могут быть в очень большом числе слу-
случаев переведены на математический язык именно в виде
дифференциальных уравнений (как говорят, смоделиро-
смоделированы при помощи дифференциальных уравнений). Если
мы сможем решить или исследовать полученное дифферен-
дифференциальное уравнение, то тем самым мы сможем предугадать
течение процесса и управлять им. Сейчас мы рассмотрим
некоторые физические процессы, которые описываются
дифференциальными уравнениями, изученными в § 3.
1) Процесс распада радиоактивного ве-
вещества. Пусть в момент времени / = 0 имелось г/0 граммов
радиоактивного вещества. Как известно, с течением вре-
времени происходит изменение (убывание) массы данного ве-
вещества, так как оно превращается в процессе распада
в другие вещества. Экспериментально доказано, что мгно-
мгновенная скорость распада пропорциональна количеству
вещества в данный момент. Необходимо изучить закон
изменения массы вещества со временем.
Пусть у (t) — масса данного вещества в момент вре-
времени /. Тогда
Здесь р — положительная " постоянная, определяемая из
опыта, знак «—» появляется в силу того, что масса ве-
вещества должна убывать со временем. Таким образом, мы
видим, что закон убывания массы можно найти, решая
дифференциальное уравнение. Это уравнение относится
309
к типу уравнений с разделяющимися переменными. На-
Находя его общее решение по правилам п. а) и решая затем
задачу Коши, получаем:
Такой закон изменения массы с большой точностью под-
подтверждается опытом. Используя его, легко узнать важную
характеристику процесса распада, так называемый период
полураспада, или то время, в течение которого распада-
распадается половина первоначально данного количества вещества.
Обозначим период полураспада через Т. Тогда
и, следовательно, T = -g-ln2.
2) Дана электрическая цепь, изображенная на рисун-
рисунке 77 (сопротивление R, индуктивность L и постоянная
Э. Д. С. Е). Пусть в момент времени / = 0 мы замыкаем
контакт К. Известно из физики, что по прошествии
достаточно большого времени после включения в контуре
установится ток 1 = ~б (закон Ома). Однако очевидно,
что в первые моменты после замыкания К ток / будет
изменяться со временем и существенную роль будет
играть индуктивность L. Нас будет интересовать закон
изменения тока со временем / = /(/). Будем считать, что
провода цепи не обладают сопротивлением и индуктив-
индуктивностью. Тогда в каждый момент времени t сумма падений
напряжений на всех участках цепи равна действующей
активной Э. Д. С. (закон Кирхгофа). В момент времени /
падение напряжения на сопротивлении равно / (t) • R, на
индуктивности Ь -зт. Таким образом, ток / (t) в цепи под-
J
Рис. 77
310
чиняется дифференциальному уравнению RI -{-L-^-t = E
и начальному условию / @) = 0. Это линейное дифферен-
дифференциальное уравнение. Найдем его решение по схеме п. в):
Отсюда
-*<
I = Ce L .
Непосредственной проверкой убеждаемся, что постдян-
Е
ная -н является одним из частных решении неоднородного
уравнения. (Ее можно найти и методом /вариации произ-
произвольной постоянной.). По лемме общее решение нашего
уравнения будет:
R F I
I = Ce L +д.
Постоянную С находим из условия / @) = 0:
Г— Е
Окончательно зависимость тока от времени для нашей
цепи следующая:
График этой функции изображен на рисунке 77а. Из
.графика видно, что по прошествии достаточного большого
времени после включения ток в цепи с очень большой
точностью удовлетворяет закону Ома (/ = -^1. Однако
в начальные моменты после включения закон Ома для
этой цепи не справедлив. Время практического установ-
Е
ления в цепи тока величины -я зависит от ее параметров
*\
п
и тем больше, чем. меньше отношение -р.
Упражнения
1) Исследовать процесс выключения электрической цепи, изоб-
изображенной на рисунке 77 (однородное уравнение Rl-\-L — =0 и
Е\
@)=-р)- Найти I (t) и нарисовать график.
311
2) Скорость роста количества бактерий пропорциональна их
наличному количеству. Найти закон изменения количества бактерий,
если в начале отсчета (t = 0) их количество было равно 1.
3) Исследовать прбцесс включения электрической цепи, изоб-
изображенной на рисунке 77, если вместо постоянной, Э. Д. С. в иее
включить переменную ? = ?'osinu>?. Найти I (t) и нарисовать
график.
§ 5. ЛИНЕЙНЫЕ ДИФФЕРЕНЦИАЛЬНЫЕ
УРАВНЕНИЯ ВТОРОГО ПОРЯДКА
С ПОСТОЯННЫМИ КОЭФФИЦИЕНТАМИ
В этом параграфе на примере линейного диффе-
дифференциального уравнения второго порядка с постоянными
коэффициентами мы познакомимся с исследованием урав-
уравнений порядка выше первого.
Линейным дифференциальным уравнением второго по-
порядка с постоянными коэффициентами называется уравнение
вида:
f(x), A0)
где А Ф 0, А, В, С — постоянные числа, f(x)— некоторая
функция, которую мы будем считать непрерывной при
— оо<^х<^.оо.
Так же, как и уравнение t/ = f(x, у), уравнение A0)
имеет бесчисленное множество решений, и, чтобы выделить
какое-либо одно из них, нужно ставить еще дополнитель-
дополнительные условия. В случае уравнения первого порядка было
достаточно потребовать, чтобы искомое решение у = у(х)
в некоторой точке х„ принимало заданное значение у9.
Этим условием решение выделялось однозначно (см. § 2).
В случае уравнения второго порядка требования у(х9) = у<)
недостаточно для выделения одного решения. Действи-
Действительно, рассмотрим, например, при —оо<^д;<^оо урав-
уравнение
у'=о. • (И)
Непосредственной подстановкой убеждаемся, что се-
семейство функций у = С1Х<-\-Съ где Ct иС3 — не зависящие
друг от друга произвольные постоянные, удовлетворяет
уравнению A1). Пусть мы хотим найти решение уравне-
уравнения A1) при условии у@)=\. Очевидно, для этого
должно выполняться условие Са= 1. Любая функция вида
y=CiX-\-l удовлетворяет уравнению A1) и дополнитель-
дополнительному условию. Для определения Сх нужно еще одно
312
условие. Таким условием может быть, например, у' @) = 1.
Дифференцируя решение A1) и подставляя наши данные,
получим: Ci = 1. Мы выделили одну функцию у = х-\-\,
которая удовлетворяет уравнению A1) и условиям у @) = 1,
г/'@)=1. Аналогично обстоит дело с уравнением A0) и,"
вообще, любым уравнением второго порядка. Для выде-
выделения единственного решения уравнения A0) (и даже
более общего уравнения второго порядка (см. § 1)) тре-
требуют, чтобы решение и его производная принимали в не-
некоторой точке заданные значения. Задача нахождения
решения уравнения второго порядка, удовлетворяющего
условиям у (х9) = г/0) t/(xQ) = yu где х0, у«, У\ — заданные
числа, называется задачей Коши.
Задача Коши для уравнения A0) всегда имеет и притом
единственное решение.
Понятия «общее решение» и «частное" решение» уравне-
уравнения A0) совершенно аналогичны соответствующим поня-
понятиям для уравнения первого порядка (см. § 3).
Покажем, как найти общее решение произвольного
уравнения типа A0). Построение общего решения основано
на двух леммах.
Определение. Уравнение A0) называется однородным,
если f(x) = O.
Лемма 1. Если ух (л;), у% (х) — два решения однородного
уравнения A0), то любая функция вида:
у (х) = См (х)
где Cj и С2 — произвольные числа, также является реше~
нием этого уравнения.
Если, кроме того,
~ У'Лх) у',(х)
во всех точках некоторого отрезка, то формула у(х) =
= См (х) ~\- Cjj/j (л;) определяет общее решение однородного
уравнения A0).
Доказательство. Рассмотрим См (х) ~\~ ^з№ (х),
где у\.(х) и уъ(х) — решения однородного уравнения A0).
Тогда
А (См (х) + С,уг (X))' + В (См (х) + С,у, (х))' +
1 (х) + Сф (х)) = Cl[Ayl-\- Bt/l + Су, ] +
313
так как по условию ух (х) и г/.2 (х) — решения уравнения, т. е.
и А
Первая часть леммы доказана.
Пусть Д(д;O^0 на некотором отрезке а^х^Ь. По-
Покажем, что в этом случае подбором постоянных в форму-
формуле у (х) = С1у1 (х) -j- С2г/2 (х) можно получить решение за-
задачи Коши с начальными условиями г/(*о) = г/о, У" (Хо) = Уи
если х0 ?5 [а, Ь], а у„ и yv — произвольные числа. Действи-
Действительно, подберем постоянные Ct и С2 в этой формуле такидо
образом, чтобы удовлетворялись условия Коши. Для этого
Cj и С2 должны удовлетворять следующей системе урав-
уравнений:
+ Счу* (х„) = г/о,
4СИ)
Определитель этой системы есть как раз А(х0). Он
не равен нулю по условию. Следовательно, эта система
имеет единственное решение (см. главу V) и наша фор-
формула действительно позволяет решить любую задачу Коши.
Лемма доказана.
Лемма 2. Пусть имеем три функции — Ух(х), у$(х),
Уз(х), причем yi(x) и уг{х) являются решениями однород-
однородного уравнения A0), а уъ(х) является решением уравне-
уравнения A0) с правой частью f(x) на отрезке [а, Ь]. Тогда если
У\ (х) Уъ (х)
У'Лх) у'9(х)
при х ^ [а, Ь], то формула
дает общее решение неоднородного уравнения A0).
Док азательств-о. При любых Ct и С3 функция
у(х) является решением уравнения A0). Действительно,
А {Сууу (х) + С,у, (х) + г/, (х))' + В (dj& (x) +
х) + г/, (*))' + С (С,г/, (*) + С,у, (х) + у, (х)) - / (х) =
= d [А г/Г + Бг/i + Q/i] + d 1^й' + By',
+ [Ayl + By, + Сг/а - / (*)] = 0,
так как по условию каждая квадратная скобка тождест-
тождественно равна нулю на отрезке [а, Ь].
Пусть необходимо найти решение задачи Коши с началь-
начальными условиями у (хв) = у9, г/ (х9) = уьх<> (~ [а, Ь]. Покажем,
314
что у (х) можно найти из нашей общей формулы (*), подобрав
соответствующим образом-Cj и С2. Для этого должно быть:
() + У (хо) = У« — Уз (х0),
f'i (х0) + съУъ (хо) = У\—' ()
По условию леммы определитель этой системы А (х0) Ф О
и Ct и С2 определяются единственным образом. Таким
образом, используя нашу формулу (*), мы можем одно-
однозначно решить задачу Коши. Утверждение леммы доказано.
Задача решения уравнения A0) свелась, таким образом,
к нахождению трех функций, удовлетворяющих условиям
леммы 2.
Займемся сначала нахождением решений однородного
уравнения
Aif-\-B]/-\-Cy=0.
Его решения yt (х) и yt (x), нужные для построения
общего решения, попытаемся искать в виде еХх, и число X
попробуем подобрать так, чтобы эта функция удовлетво-
удовлетворяла дифференциальному уравнению. Подставляя еХх в
левую часть однородного уравнения, будем иметь:
А XVх + В1еХх + Сеи = (А л* -f B\ + С) еЧ
Чтобы это выражение тождественно равнялось нулю,
нужно, чтобы число X было корнем квадратного уравнения
А\*-{-В\-{-С = 0, A2)
которое называют характеристическим уравнением для
дифференциального уравнения
Ay'-\-Bt/-\-Cy = 0. A2')
Возможны три случая.
1) Б2 — 4ЛС^>0. В этом случае характеристическое
уравнение A2) имеет два действительных различных
корня X]. и V Этим корням соответствуют два решения
дифференциального уравнения: ух = ех^х и yi = eK<*x.
Так как
815
при —оо<^л;<^оо и Xi Ф ~къ то по лемме 1
A3)
есть общее решение уравнения A2).
2) Ва— 4АС = 0. В этом случае уравнение A2) имеет
кратный корень Х1 = Х3 = Х, и существует только одно
решение вида еХх = у1(х). Однако функция г/а (х) = хёКХ в
этом случае тоже будет решением однородного уравнения
A0). В самом деле,-
А {хе1х)" + В (хе1х)' + Схех* = (А X4 -\- ВХ + С)хе1х +'
так как каждая скобка равна нулю, ибо X — корень ха-
. в
рактеристического уравнения и Х = ^- в силу усло-
условия В2 — 4АС = 0.
Далее,
' ХР
Отсюда по лемме 1 формула
y = C1elx-\-CixeXx A4)
дает общее решение нашего уравнения в рассматриваемом
случае.
3) В2 — 4ЛС<^0. В этом случае A2) имеет два комп-
комплексно сопряженных корня Xb, = o±ix.
Покажем, что решениями однородного уравнения A0)
являются функции t/j (х) = е°х sin xx и yt(x) = e°xcosix,
и общее решение записывается в виде:
у (х) = С^х sin xx -f- Сф°х cos xx. A5)
Из условия следует, что
А (о ± iif + В (о ± ix) + С = 0.
Отделяя действительную и мнимую части, получим:
12Лат + Вт = 0 ' A6)
316
Проверим теперь, что функция е"х sin zx удовлетво-
ряет однородному дифференциальному уравнению A0).
Подставляя ё*х sin x в левую часть уравнения, получим:
А (е°х sin zx)' -j- В (е°х sin zxf -f- Ce°x sin xx=
= A (e'eM sin xx-f- 2<3ze"x cos zx — xV* sin zx) -|-
-f В {ае°х sin xx-f xe" cos xjk) -f- Се°х sin xjc =
= (Лo2 — Лх2 -f Bo -+- C) e" sin zx -f-
+ BЛ ox -j- Bx) e°* cos xx = 0,
так как величины, стоящие в скобках, равны нулю в
силу A6).
Аналогично
А {е°х cos zx)' + В (е°х cos zx)' + Се" cos zx=
= Л (oV* cos xx — 2ахе°* sin xjk — xV* cos xjc) -f-
-j- В (oeeJf cos xx — ze°x sin xx) -j- Ce"x cos xx=
= (Ло2 — Лха -j- Bo -j- С) е°х cos xx —
— BЛох -j- Вт) e°x sin zx = 0.
Составим теперь определитель А(х):
Д(х) =
e"x sin xx
ae°x sin xx -j- xe"* cos zx
— — eiaxz (sin2 xx -4- cos
e°x
COS XX
ae°x COS z.
I x
t) = —
с —теа
ze*°x 9
*sin
6 0.
XX
Таким образом, формула A5) действительно дает в
этом случае общее решение однородного уравнения.
Примеры. 1) Решить уравнение у" — bt/-j-6 = 0.
Характеристическое уравнение A2): X2 — 5X-j-6 = 0:
Xj = 2, Xj = 3.
Общее решение выписывается по формуле A3):
{) С^х\С^
у{) ^\^
2) Решить уравнение у' — 2tf-{-y = 0.
Характеристическое уравнение: X2 — 2Х -f-1 = 0; Xt =
= Ха = 1.
Общее решение выписывается по формуле A4):
) = Clex-\-Cixex.
3) Решить уравнение у" -\-у = 0.
Характеристическое уравнение: Х2-[-1 = 0, \Ui = ±i.
Общее решение выписывается по формуле A5):
у (х) = Ci sin x + Ci cos x.
817
Переходим теперь к решению неоднородного уравне-
уравнения с произвольной правой частью / (х). Общее ре-
решение этого уравнения согласно лемме 2 рредставимо в
виде суммы любого решения г/3 (*) неоднородного уравнения
A0) и общего решения соответствующего однородного уравне-
ния. Находить общее решение однородного уравнения мы
уже умеем, остается найти какое-либо решение неоднород-
неоднородного уравнения Уз(х). Существует общий метод нахождения
функции г/з (х), называемый методом вариации произволь-
произвольных постоянных. Этот .метод является обобщением метода
решения линейных дифференциальных уравнений первого
порядка (см. § 3 этой главы) и состоит в следующем.
Пусть необходимо найти какое-либо решение уг(х) урав-
уравнения
у (х) = С,у, (х) -\- СъУъ (х) и Ад;=
Сначала находим общее решение однородного уравнения
Ay'-\-Btf~\-Cy = 0,
как это описано выше. Пусть это общее решение имеет
вид:
Ух (х) У* (*)
t/i(x)y',(x)
Будем искать ул (х) в виде:
уг(х)^С1(х)у1(х)-\-С
где Cj (x) и С2 (х) — пока еще неизвестные функции,
связанные только одним условием
А*1' (v\ ti /v\ _ I.. t ( y\ 1 f (v*i ¦~^— О (\r7\
Дифференцируя у3(х) и используя A7), получим:
t/3(x) = Cl(x)t/1(x)-\-Ci(x)y'i{x),
у; (х) = С[ (х) у[ (х) + С; (*) • у, (х) + С, (х) у", (х) + • :
+с»(*)л'(*)-
Подставляем у3 (¦)';). Уъ (*)> Уз (*) в Дифференциальное
уравнение:
л (с; (*) у\ (х)+с; (х) У: w+с, (х) у; (*)+с3 (*) /2 (*) >+
+ В (С, (х) у; (дс) + С2 (*) у2 (*)) + С (d (*) у, (х) +
318
Учитывая, что у\ (х) и уг (х) — решения однородного
уравнения, будем иметь:
с;
с;
Присоединяя сюда A7), получим систему уравнений для
нахождения С[(х), С'3(х):
1СЛх)у'Лх) + С',(х)у*(х) = 0,
А
Отсюда (так как
У'Лх).у',(х)
Окончательно
Беря какие-либо первообразные Сг (х) и С2 (л), по-
получим требуемую функцию у3 (х), а с ней по лемме 2 и
общее решение уравнения A0).
Несмотря на большую общность этого приема, поль-
пользоваться им часто бывает неудобно из-за громоздкости
выкладок. Поэтому, если f(x) имеет специальный вид,
удобнее находить у3(х) более простыми способами. Оста-
Остановимся подробнее на двух случаях.
1) f(x) = D-elve. Необходимо найти одно решение
уравнения Ay" -\- By" -f- Су=De^x.
, а) Если ц, не является корнем характеристического
уравнения A2), то Уз(х) ищем в виде:
где М — неизвестная постоянная. Подставляя у3 (х) в
уравнение, будем иметь:
-j- AM? -j- CM) e*x =
ЗШ
б) Если ц. — простой корень характеристического
уравнения, т. е. Лц,а -|- Вц, -\- С =? О и 2Лц, -[- В Ф О, то
t/з (х) ищем в виде:
где постоянная М неизвестна.
Снова подставим у3 (х) в уравнение:
или
По условию . первое слагаемое равно нулю, т. е.
P*BA[!. + B) = Dt*>* и
М- D
Итак,
в) Если ц, — кратный корень характеристического уравне-
уравнения A2), то ^V-j-B^-fC^0 и 2Ар-\-В = 0. Тогда
Уъ(х) ищем в виде:
Постоянную М подберем так, чтобы эта функция удовлет-
удовлетворяла дифференциальному уравнению A0) с нашей пра-
правой частью, т. е.
AM (*V*)' + ВМ (
или
AM
Перепишем последнее равенство иначе:
Выражения в скобках обращаются в нуль (по условию),
поэтому
320
Окончательно
2) Другой часто встречающийся случай:
/ (х) = Di sin u>x + Сз cos шлг.
При такой правой части решение уь (х) можно найти так:
а) Если ±("> не являются корнями характеристического
уравнения A2), то — А<*>* ± iBu>-{-С Ф 0. Следовательно,
по крайней мере или Вш ф О, или С — Аи>*фО. Будем
искать Уг (х) в таком виде:
уъ (х) = Mt sin «Я -f-.Mg COS «>*,
где Mi, M2 — постоянные, которые нужно определить.
Подставим это выражение в дифференциальное уравнение:
A (Mi sin их -f- Ма cos <ojc)* -j- В (^i sin шл: + Afa cos <njf)' -j-
-j- С (M2 sin «л; + М^ cos «я) = Л (— M^4 sin ш* —
— M,«)a cos ®x) -f- В (M^ cos шл- — M2«> sin ®x) -f-
-j- С (Mi sin <»* -f- -Ma cos uuc) = D2 sin юл; -f- D4 cos u>jc.
Чтобы это равенство выполнялось тождественно для всех
х, нужно, чтобы Mi, Мч удовлетворяли следующей си-
системе уравнений:
| — Дш'М, — BoMj + СМЛ = ?)„
\ — Л о>Ш
или
ас — л
\BcoM, + (С — Л
Определитель этой системы Д = (С — Лша)а -)- Ваюа. По
условию хотя бы одно из этих слагаемых отлично от нуля.
Поэтому Д Ф 0, и из этой системы однозначно находятся
Mi и Мъ а с ними и Уз(х).
б) Если ±»<о являются корнями характеристического
уравнения A2), то
(С — Лша=:0,
(
и уз (х) ищем в виде:
уг (х) = л; (Mi sin шл: -j- M2 cos u>x).
321
Как и раньше, подстановкой в дифференциальное
уравнение определяем Мх и М2:
sin ш* -f Mi cos u>*) = [Mt (С — Л соа) -f
л: sin шлг-f [Afa (С — Лев3) -j-A^Bco] л: cos шлг-f
+ BЛМ2ш + BMi) cos ш* + (— 2ЛМаш + BMj) sin сил: =
= Dt sin мл;-j- D2 cos «л;.
По условию выражения, стоящие в квадратных скобках,
обращаются в 0. Для того чтобы полученное равенство
выполнялось тождественно для всех л;, должны быть
выполнены условия:
Определитель этой системы Д = — В2 — 4Л2«а -ф 0. По-
Поэтому Мх и Mi однозначно определяются из этой системы.
Приме р ы. 1) Найти общее решение уравнения 2у" -\- у' — у =
= 2е* и решение, удовлетворяк)щее условиям г/@) = 0 г/'@) = 1.
Правая часть у этого уравнения вида De^31, D = 2; (i=l.
Составляем характеристическое уравнение:
Его корни Х4 =—1; Х2 = 2-.Поэтому г/! (х) = е *, г/2 (х) = еа в дан-
данется корнем хара
в виде уг (х) =
+ Йех — Me* ==
ном случае (л=1 не является корнем характеристического уравне-
уравнения. Поэтому у3(х) ищем в виде уг (х) = Мех. Тогда
Отсюда Л1 = 1 и г/з (•*) = е*-
. Окончательно общее решение примет вид:
Теперь с помощью этого общего решения найдем решение за-
задачи Коши:
1 2
Решая эту систему, получаем: d= — g-, C2 = — ^-.
322
Таким образом, решение задачи Коши дается формулой:
у (х) = — д- е~ х — ^ ё* -f ex.
2) Найти общее решение уравнения у" -\-у= sin x.
Правая часть вида
Dt sin » x-f- D2 cos <&x; Dj = l; <o = l; D2=0.
Составляем характеристическое уравнение: X3 —J— 1 = 0, откуда
Xj g = ± i. В данном случае комплексное число ±i<o = ±i как раз
является корнем характеристического уравнения. Следовательно,
уп {х) ищем в виде:
уа (х) = х (Мх sin лг-f- Мj cos x).
Подставив у3 (х) в уравнение и приведя, подобные члены, получим:
— 2М2 sinx-\-2Mi cosAr = sinAr.
Для выполнения этого равенства в каждой точке х нужно, чтобы
X
Окончательно уг (лг) = — s- cos x, и общее решение будет:
х
у (х) = Cj sin x -\- C2 cos х — к- cos л:.
8) Линейная колебательная цепь. Рассмотрим элек-
электрическую цепь, изображенную на рисунке 78. (Эта цепь отличается
от уже изучавшейся нами в § 4 наличием конденсатора емкости С.)
Нас будет интересовать закон изменения тока I(t), текущего
в такой цепи. Пользуясь законом Кирхгофа, составим для / (t)
дифференциальное урав-
уравнение.
В каждый момент
времени падение напря-
напряжения на сопротивлении
Л есть RI @, на индук-
тивности L L -тт, на кон-
а)
Рис. 78
323
денсаторе С равно его полному заряду, деленному на емкость С.
Пусть цепь включена в момент времени ta. Тогда к моменту t на
конденсаторе накопится заряд Q = ^I (%)d% и напряжение на нем
будет -ftJ /(t) dt. Сумма падений напряжений на всех участках цепи
равна действующей в цепи э. д. с.^Отсюда
J /(*)*:=?„ sin «rf. A9)
in
Мы получили интегро-дифференциальное уравнение для тока в цепи.
Его легко превратить в дифференциальное уравнение. Продиффе-
Продифференцировав один раз равенство A9), получим, что ток I (t) в цепи
удовлетворяет дифференциальному уравнению:
L^+RdT+-uI=Eoa>cosa>t- B0>
Это есть линейное дифференциальное уравнение с постоянными
коэффициентами типа A0), и его общее решение нетрудно получить
вышеописанными методами. '
Электрические процессы в контуре зависят от значений пара-
параметров R, L, С, и (заметим, что все эти параметры неотрицательны).
Разберем несколько характерных частных случаев. Будем рассматри-
рассматривать только «идеальный контур», для которого /? = 0 (практически
очень малое сопротивление присутствует всегда).
а) ??0=0. Цепь состоит только из индуктивности и емкости,
и нас интересует, например, вопрос, какой ток возникает в этой
цепи, если первоначально заряженная емкость начнет разряжаться.
Уравнение B0) для тока в этом случае следующее:
Характеристическое уравнение
и X , = ± {¦—=г — его решения.
Общее решение дифференциального уравнения:
CSkl+CC0S
Приведя это выражение к виду, удобному для логарифмирова-
логарифмироваполучим: '
р
ния, получим
324
Q
где 9 = arctg -^ . Это значит, что в таком контуре ток—периоди-
ческая функция времени (синусоида) с фиксированным периодом
Т = 1ъ }^LC. Амплитуда и фаза его могут быть произвольны и
зависят лишь от начальных условий (начального заряда на конден-
конденсаторе и начального тока).
б) R = 0, Е0^?0. Уравнение B0) в этом случае примет вид:
Ll"'-\-yr /"= Е0(л cos u>t.
Корни характеристического уравнения мы уже нашли: У-1 а = ± _л.
Общее решение записывается по-разному в случае
1 1 ""
г= И @=——=:.
Если «>=? - , то общее решение /(f) можно записать в виде:
+Cc +/ (О,
где /3 (<) нужно искать в виде /3 (t) == Mj sin и^ -f- Ms cos и^.
Тем же путем, что и на странице 313, получаем для Mt и Ms
уравнения:
\с
Решая эту систему, найдем:
Таким образом, I3(t) =-j—° 1П 2 cos w^, и общее решение имеет
вид:
/ @ = С, sin -L, +Ca COS-^ + | E°1r a COS Ы. B1)
К^с yic i—LCa>
Пусть начальные условия подобраны так, что в цепи идет ток
/8 (t). Исследуем зависимость амплитуды А этого тока от частоты.
График этой зависимости представлен на рисунке 78 а). Из этого
графика видно, что при увеличении частоты генератора от 0 до
амплитуда тока возрастает и при w—*-——= будет бесконечно боль-
большой величиной. При дальнейшем увеличении частоты амплитуда
начинает уменьшаться и при и—»-оо стремится к 0. Частота и =
325
1 *
= . играет особую роль для данного контура и называется его
резонансной частотой. Если параметры L и С контура или частота
генератора подобраны так, что <* очень мало отличается от .¦,
то в контуре возникают колебания очень большой амплитуды
(практически, конечно, всегда ограниченной из-за наличия малого
сопротивления Я). Это свойство контура широко используется
в радиотехнике.
Если ю=—— (так называемый резонансный случай), то ток
в контуре уже не описывается формулой B1) и /3 (t) нужно искать
в виде:
/8 (t) = t (Mt sin u>t -f- Ma cos <*>t).
Производя такие же выкладки, как на стр. 314, получим уравнения
для Mi и Ма:
2La>Ml = ?ou, ¦>
— 2?<оЛ1а=0. /
Из этой системы уравнений находим: Mj = 2j , М2 = 0. Оконча-
Е t
тельно /,(() = =у- tsanwt, а общее решение /(<)== С4 sin —^=г -f-
+ Cs cos -|- of ' sin и^ В этом случае любой ток, возникающий
у LC iL
в контуре, неограничен при t—>-oo.
Упражнения
1) Найти общее решение и там, где требуется, решить задачу
Коши для следующих уравнений: а) у" — 4г/ = 0, у\х—1= 1, У11^=! =
= 0; б) 4(/" —8/+5(/ = 0; в) y"-\-9y=zO; г) 2г/"+5г/' = 29
Д) y"-ly' + 6y = smx; е) г/" + в^ = ^, 1/U=O=U Я* = „
2) Найти общее решение уравнения B0) в случае, когда
(реальный контур).' ¦
3) Шарик массы т подвешен на пружине. Сила сопротивления
пружины пропорциональна ее растяжению (коэффициент пропор-
пропорциональности К). В" момент времени f = 0 пружину растянули на
величину /.Найти зависимость от времени расстояния г (() шарика от
точки подвеса пружины. Массой пружины и силой тяжести можно пре-
пренебречь.
§ 6. ЧИСЛЕННЫЕ МЕТОДЫ РЕШЕНИЯ
ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ
К численным методам решения дифференциальных
уравнений (численному интегрированию) прибегают тогда,
когда общее решение невозможно найти или когда оно
слишком сложно для исследования. Методы, которые мы
сейчас опишем, позволяют, по крайней мере теоретически,
326
с какой угодно точностью получать решение любой задачи
Коши на всем отрезке, где это решение существует. Первый,
наиболее простой метод, который мы рассмотрим, принад-
принадлежит Эйлеру и состоит в следующем. Пусть необходимо
решить задачу Коши для уравнения t/ — f(x, у) при
условии */(*о) = г/о на отрезке [ха, х].
Пусть точное решение этой задачи будет у = у(х).
Нам пока известно только одно значение этой функции
г/(*0) = г/0. Попытаемся получить значение функции у(х)
в точке х0, близкой к х0.
Положим Xi =-хй -f- h, где h — малое число. Пусть точное
значение функции у(х) в точке хх есть уи т. е. y{x^)^=yi.
По формуле Лагранжа имеем:
У(Ъ)-У (*о) = Я («) А. *о ^ 6 < х, + А. ,B2)
Из этого равенства можно было бы найти y(xt), если бы
было известно у'(Ч). Так как отрезок [хй, xt] мал, а Е
принадлежит этому отрезку, то можно считать, что \^хй
и, следовательно, у' (?)?=& у' (хй). Однако из самого диф-
дифференциального уравнения у1 (х0) = f (x0, уй). Таким образом,
точное равенство B2) можем заменить приближенным:
y(xi) — y(xt)f^f(xt, ye)h,
y(xi)**yt + hf(x0, уо) = ~уг. B3)
Вычислив правую часть B3), можно считать полученное
число приближенным значением решения дифференциаль-
дифференциального уравнения в точке хх.
Поставленная нами задача выполнена — мы по извест-
известному значению у0 решения в точке хй получили, правда
приближенно, значение решения в близкой точке Х\ = хй -j- h.
Далее тем же самым приемом из полученного значения
Ух можно получить приближенное значение у(х) в точке
где ~у\ — приближенное значение решения в точке хи
полученное на предыдущем шаге. Вычислив правую часть
этого приближенного равенства, принимаем полученное
число у*, за приближенное решение уравнения в точке *s
и т. д. Рассуждая подобным образом, мы можем получить
приближенные значения решения во всех точках xt — хй -j-
+ ih (i = l,2,...).
Итак, метод Эйлера нахождения приближенного реше-
решения дифференциального уравнения на отрезке [х0, х] состоит
321
с какой угодно точностью получать решение любой задачи
Коши на всем отрезке, где это решение существует. Первый,
наиболее простой метод, который мы рассмотрим, принад-
принадлежит Эйлеру и состоит в следующем. Пусть необходимо
решить задачу Коши для уравнения t/ = f(x, у) при
условии у(хо) = уо на отрезке [х№, х].
Пусть точное решение этой задачи будет у~у(х).
Нам пока известно только одно значение этой функции
у{хй) = уй. Попытаемся получить значение функции у{х)
в точке *о, близкой к хг
Положим Xi =л0 -f- h, где h — малое число. Пусть точное
значение функции у(х) в точке х1 есть уи т. е. y(*i) = t/i.
По формуле Лагранжа имеем:
у (*,) - у (х0) = t/(l)h, *, < 6 *? *, + A. ,B2)
Из этого равенства можно было бы найти y(Xi), если бы
было известно у'(Ч). Так как отрезок [хй, хх\ мал, а \
принадлежит этому отрезку, то можно считать, что 1^х0
и, следовательно, f/'C^^J/'W- Однако из самого диф-
дифференциального уравнения у" (х0) = / (*0, уй). Таким образом,
точное равенство B2) можем заменить приближенным:
y(x,)^f(xu, yo)h,
или
y(Xi)^y9 + hf(x0, y9) = ~yi. B3)
Вычислив правую часть B3), можно считать полученное
число приближенным значением решения дифференциаль-
дифференциального уравнения в точке xt.
Поставленная нами задача выполнена — мы по извест-
известному значению уй решения в точке х0 получили, правда
приближенно, значение решения в близкой точке хх = х0 -\~ к.
Далее тем же самым приемом из полученного значения
Ух можно получить приближенное значение у(х) в точке
леа = Jti -f- A:
где у\ — приближенное значение решения в точке хи
полученное на предыдущем шаге. Вычислив правую часть
этого приближенного равенства, принимаем полученное
число у*, за приближенное решение уравнения в точке х$
и т. д. Рассуждая подобным образом, мы можем получить
приближенные значения решения во всех точках xt = хй -j-
h( l2
( )
Итак, метод Эйлера нахождения приближенного реше-
решения дифференциального уравнения на отрезке [х0, х] состоит
327
в получении значений приближенного решения в точках
Xi = хй -j- ih последовательно по формулам:
0| = #-1 + й/(*|-1, У1-1), B4)
где г/0 задано.
В произвольной точке л: отрезка [xi-lt х{\ приближен-
приближенное решение получается по формулам линейной интер-
интерполяции:
Разница между приближенным решением, полученным
по формулам B4), и точным решением в данной точке х
зависит от величины «шага» h и от числа шагов от данной
точки до точки хй. Чем меньше А, тем меньшую ошибку
мы делаем на каждом шаге, заменяя точные равенства
типа B2) приближенными B3). Однако с уменьшением
h число шагов, требуемых для достижения данной точки
х, увеличивается и стремление к 0 суммарной ошибки
совершенно не очевидно. Можно доказать, что при h—>0
для любой точки х отрезка [х9, х] точное значение реше-
решения у(х) и значение, полученное с помощью B4), будут
сколь угодно близки. Убедимся в справедливости этого
утверждения на простом примере. Дано:
Требуется по методу Эйлера найти приближенное решение
этого уравнения на отрезке [0,1] (точное решение есть
У = ех). t ,
Возьмем h—— (п — произвольное натуральное число).
Применим формулы B4):
Приближенное значение уA) дается числом уп^уA), т. е.
Легко видеть, что точное значение
328
t/(l) = e. Устремим п к оо. В этом случае для получения
приближенного решения в точке х=\. нужно делать все
больше и больше шагов по формулам B5). Однако
(см. гл. VII) Уп = [ 1+ —) -*-е, т. е. полученное прибли-
приближенное решение стремится к точному в точке *=1. Ана-
Аналогично можно показать сходимость и в остальных точ-
точках отрезка [0, 1].
Метод Эйлера B4) имеет простой геометрический смысл
(см. рис. 79). Сплошная жирная линия — график точного
решения. Отложим на оси ОХ точки х0, *ь • • •, xt = *o + ih.
Через эти точки проведем прямые, параллельные оси 0Y.
У
Рис. 79
Для приближенного вычисления значения y(xi) проведем
касательную к интегральной кривой в точке *0 (это можно
сделать, так как ее угловой коэффициент у1 (х0) = f (Хй, уа)
известен) и продолжим ее до пересечения с прямой, про-
проведенной через хх параллельно OY. Ордината точки пере-
пересечения— уи как это видно из чертежа, будет близка к
величине y(*i). Но f/i —Уо + й/(*о, Уо), т. е. как раз равна
числу, вычисленному первым шагом процесса B4). Для
получения значения у(х%) проводим прямую через полу-
полученную точку (хи уг) с угловым коэффициентом f(xu yx)
до пересечения с вертикальной прямой х — х^. Ордината
этой точки пересечения уа приближенно дает значение
решения у (х) в точке х^.
Таким образом, мы видим, что геометрически про-
процесс B4) эквивалентен построению некоторой ломаной,
ординаты узлов которой дают приближенные значения
решения дифференциального уравнения в соответствующих
329
точках, а сама ломаная, следовательно, приближенно
представляет собой интегральную кривую.
Кроме метода Эйлера, существует много других спосо-
способов построения приближающей ломаной. Каждый такой
метод соответствует некоторому методу приближенного
решения дифференциального уравнения. Одним из наиболее
употребительных в настоящее время является метод Рунге —
Кутта. По этому методу за начальное звено ломаной
берется не касательная к интегральной кривой (метод
Эйлера), а прямая с угловым коэффициентом ku где
Здесь
Таким образом, y1 = y<, -j- kth. Вообще, yi==yi.iJrkih, где
kt = д . Bb)
kf=f
k?\=f
h_
h
1,D) t /v
«« —/ Щ-
B остальных точках решение находится интерполиро-
интерполированием между полученными узловыми значениями. Фор-
Формулы B6) называются формулами Рунге — Кутта численного
решения дифференциальных уравнений. Они дают значи-
значительно меньшую, чем метод Эйлера, ошибку на- каждом
шаге, и для получения достаточной .точности в точке х
можно идти в эту точку с гораздо более крупным шагом.
Заметим еще, что в процессе вычислений и в методе
Эйлера, и в методе Рунге — Кутта можно менять величину
шага h. При этом используются те же самые формулы B4)
или B6), но h может зависеть от номера i (соответственно
xi=xi_1-\-h1).
Мы закончим этот параграф одним простым примером
получения приближенного решения уравнения типа D).
330
Будем искать решение уравнения tf = y на отрезке [0,1]
с начальным условием уф) — 1. Шаг h возьмем равным 0,1
"(А = 0,1).
Формула Эйлера в данном случае имеет вид:
Формула Рунге — Кутта:
yn+i = Уп +0,1
ft + 2
Заметим еще, что точное решение нашей задачи в
данном случае нам известно (см. §3). Это — функция у=е*.
Поэтому мы имеем возможность сравнить приближенное
и точное решения. Окончательные результаты вычислений
сведены в таблицу:
V
\
л
V
V Я
"I
о <и
Н ft
IS
Метод
Рунге—
Кутта
0
1,00000
.
1,00000
1,00000
од
1,10517
1,10000
1,10517
0.2
1,22140
1,21000
1,22140
-
0,3
1,34986
1,33100
1,34986
0,4
1,49182
1,46410
1,49183
0,5
1,64872
1,61051
1,64873
0,6
¦„
1,82212
1,77156
1,82213
0,7
2,01375
1,94872
2,01377
0,6
2,22554
2,14359
2,22556
0.9
2,45960
2,35795
2,45962
1
2,71828
2,59374
2,71830
Из этой таблицы наглядно видно, что метод Рунге —
Кутта дает при одном и том же шаге значительно боль-
большую точность, чем метод Эйлера. Правда, он требует
примерно в 4 раза большего объема вычислений- для по-
получения каждого значения уп.
ПРИЛОЖЕНИЕ
МЕТОД ПОЛНОЙ МАТЕМАТИЧЕСКОЙ ИНДУКЦИИ
Индукцией называется переход от частных утверждений
к общим. В математике метод полной индукции является одним из
наиболее общих методов доказательства.Юн применяется для реше-
решения задач следующего вида: требуется доказать, что некоторое
утверждение, зависящее от натурального числа п, верно для всех
натуральных п > я0. Часто бывает возможно проверить справедли-
справедливость утверждения для конкретных я(я —я0, п0 —{— 1, ...). Но, чтобы
проверить утверждение для всех п^п0, нужно сделать, очевидно,
бесконечно мног.о проверок, что практически невозможно. Поэтому
вместо непосредственной проверки поступают следующим образом.
Г. Проверяют утверждение для п — па.
2°. Предполагают, что утверждение справедливо для некоторого
n — k, и из этого предположения выводят его справедливость и для
и = й —[— 1, где k — произвольное натуральное число, большее п0.
Если проверка п. 1° дала положительные результаты и доказан п. 2°,
то можно считать утверждение справедливым для всех п Э= я0-
Действительно, для п — п0 утверждение доказано (п. 1°). В силу
п. 2° оно справедливо и для п = па-\-1. Но тогда в силу п. 2° оно
справедливо и для п — по-\-1 -\-\ =яо-|-2 и т. д., т. е., действи-
действительно, утверждение справедливо для всех я^я0. Этот метод
доказательства называется методом математической индукции.
Рассмотрим некоторые простейшие примеры. 1-4-л
1. Требуется доказать, что Sn = l+2 + 3 +••• + «==—у—«
для всех я> 1.
Здесь утверждение, зависящее от п, есть
„ /„ _ п
Проведем доказательство по методу математической индукции.
Г. S1 = l = i—^t——, т. е. предполагаемая формула для п —
щ = 1 справедлива. п\ j
2°. Предположим, что Sn = —3— п. Докажем, что Sra+1 =
. Действительно, Vl^Sn
332
Доказательство по методу математической шдукции подтвердило
„ (я-М)га
наше предположение о том, что Ьп — '¦
2. Докажем теперь при помощи метода М1тематический индук-
индукции формулу суммы членов арифметической пркрессии. Именно, что
— га
1°. Для я = 1 утверждение, очевидно, справедливо, так как
Sj = a; и то же значение мы получаем по доказываемой формуле.
2°. Пусть для некоторого п формула зерна. Докажем, что
Sn+l = (n-}-\)a ' ^/~П , т. е. ее справедливость для п-\-\.
Действительно,
аА-[а-\-(п—\)d] .
5 = и°—Цр '—±-\-
3. Так же просто при помощи метода индукции доказывается,
что Sn=a-\-aq-\-aq2-\-...-\-aqn~1=a,j—-2-
(формула суммы членов геометрической профессии).
Действительно, при п = 1 формула, очевидно, справедлива^! = а.
Пусть она справедлива для некоторого натурального п. Докажем,
1 яЛ+1
что она справедлива и для n+l, т. е. Sn^^a—г—2—.В самом
1 П 1 ПХ
деле, Sn+1 = Sn + aq" = aT:J--}-aq» = a Ч J_Zq " =
_а__—2
\ — q
4. Легко доказать, что последовательность {хп}, обладающая
свойством лг„+1 = Зл:я—2лг„_1 и л:0 = 0, л:, = 1, имеет вид: лгп =
= 2"—1. Это утверждение также доказываечся методом математи-
математической индукции. В самом деле, N
Г. лго = 2° — 1=0, л:1 = 21 — 1 = 1, т. е. доказываемая формула
дала в этом случае правильный результат.
2°. Предположим, что *?_, = 2*"* — 1 и xj = 2ft—1. Докажем,
что A:ft+1=2ft+1—1. Действительно, xkJrl=3xk — 2лгй_, = 3-2* —
— 3 —2Bft —1) = 2*+1—1. Очевидно, из 1° и 2° следует, что
хп = 2" — 1 при любом п.
В примере 4 мы имеем некоторую разношдность метода мате-
математической индукции. Здесь в п. 2° мы воспользовались справед-
справедливостью утверждения не только для n = k— 1, но и для n = k.
Поэтому и в п. 1" мы проверяли утверждение для я = 0 и ~и = 1.
При пользовании методом математической индукции нужно
обязательно проводить как первый, так и второй этап рассуждения.
333
Если не проверить п. 1° или 2°, то можно получить совершенно невер-
нне" выводы. «Докажем», например, следующую «теорему»: все
натуральные числа равны между собой. «Доказательство» проведем
по методу математической индукции. Предположим, что для неко-
некоторого п теорема верна, т. е. и = га-|-1. Но тогда, прибавив к обеим
частям равенства по 1, снова получим верное равенство п~\-\ =
= п—|— 1 —|— 1, т. е. га-|-1=га-|-2. Таким образом, переход от п к
п-\-\ проверен. Теорема «доказана». Ошибка в доказательстве
заключается в том, что рассуждение по методу математической
индукции проведено не полностью. Опущен первый этап доказа-
доказательства (не доказано, что теорема верна для га*=1). Проведя этот
этап, мы сразу убедимся в том, что теорема не верна. Действительно,
при га=1 нужно проверить утверждение 1=2, которое, очевидно,
не справедливо.
Точно так же нельзя игнорировать доказательство п. 2°, огра-
ограничившись проверкой п. 1°, так как из справедливости утвержде-
утверждения для некоторых конкретных ti(n — nB, no-f-l, ...) не следует
справедливость этого утверждения для всех п>п0. Например, из
того, что 1 < 10, 2<10, 3 < 10 не следует, что любое натуральное
число будет меньше 10.
Упражнения
1) Доказать, что Sn = 6
2) Пусть о» = 2, v,=3, »„,,=3оя — 2о„.. Доказать, что vn =
я + 1
3) Доказать, что Sa =
4) Доказать, что при любом п~^>0 число хя=11п+2-\-122п*1
делится на 133.
Анатолий Борисович Бакушинский,
Виктор Константинович. Власов
Элементы высшей математики
и численных методов
Редактор В. Г. Долгополое
Переплет художника Л. М. Чернышева
Художественный редактор В. С. Эрденко.
Технический редактор В. И. Корнеева
Корректор Т. А. Кузнецова
Сдано в набор 26/V 1967 г. Подписано к печа-
печати 2/IX 1968 г. А03979. 84X1081/зз- Бумага
тип. № 2. Печ. л. 17,64' A0,5). Уч.-изд. л. 15,93.
Тираж 40 000 вкз. (Тем. план 1967 г. № 344.)
Заказ № 63.
Издательство <Просвещение> Комитета по
печати при Совете Министров РСФСР.
Москва, 3-й проезд Марьиной рощи, 41.
Ордена Трудового Красного Знамени Ленин-
Ленинградская типография № 1 «Печатный Двор>
имени А. М. Горького Главполиграфпрома
Комитета по печати прн Совете Министров
СССР, г. Ленинград, Гатчинская ул., 26.
Цена без переплета 40 коп. Переплет 10 коп.
В 1968 году
в издательстве «Просвещение»
будут изданы следующие учебники
и пособия для студентов педагогических
институтов:
Бахвалов С. В. и др., Аналитическая гео-
геометрия;
Владимирский Г. А., Сборник задач по на-
начертательной геометрии;
Геронимус Ю. В., Вычислительные машины
и программирование;
Макаров И. П., Дополнительные главы ма-
математического анализа;
Новиков П. С, Основы математической ло-
логики;
Четверухии Н. Ф., Проективная геометрия;
Буравцев Н. В., Черчение и начертательная
геометрия;
Дембннский С. И. и Кузьменко В. И., Ме-
Методика преподавания черчения в вось-
восьмилетней школе.