Текст
                    МАТЕМАТИКА
В ТЕХНИЧЕСКОМ УНИВЕРСИТЕТЕ
д л;
Е.Е. Иванова
ДИФФЕРЕНЦИАЛЬНОЕ
ИСЧИСЛЕНИЕ
ФУНКЦИИ ОДНОГО
ПЕРЕМЕННОГО
Издательство МГХУ имени Н.Э.Баумана


Комплекс учебников из 20 выпусков Под редакцией В. С. Зарубина и А. П. Крищенко I. Введение в анализ И. Дифференциальное исчисление функций одного переменного III. Аналитическая геометрия IV. Линейная алгебра V. Дифференциальное исчисление функций многих переменных VI. Интегральное исчисление функций одного переменного VII. Кратные и криволинейные интегралы. Элементы теории поля VIII. Дифференциальные уравнения IX. Ряды X. Теория функций комплексного переменного XI. Интегральные преобразования и операционное исчисление XII. Дифференциальные уравнения математической физики XIII. Приближенные методы математической физики XIV. Методы оптимизации XV. Вариационное исчисление и оптимальное управление XVI. Теория вероятностей XVII. Математическая статистика XVIII. Случайные процессы XIX. Дискретная математика XX. Исследование операций
Е.Е. Иванова ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ ФУНКЦИЙ ОДНОГО ПЕРЕМЕННОГО Под редакцией д-ра техн. наук., профессора B.C. Зарубина и д-ра физ.-мат. наук, профессора А.П. Крищенко Рекомендовано Министерством общего и профессионального образования Российской Федерации в качестве учебника дм студентов высших технических учебных заведений Москва Издательство МГТУ им. Н. Э. Баумана 1998
УДК 517.2.221 ББК 22.161.1 И20 Рецензенты: доц. Л.Н. Каролинская, доц. Н.В. Копченова И20 Иванова Б.Б. Дифференциальное исчисление функций одного переменного: Учеб. для вузов / Под ред. В.С.Зарубина, А.П.Крищенко.-М.: Изд-воМГТУим. Н.Э. Баумана, 1998.-408 с. (Сер. Математика в техническом университете; Вып. II). ISBN 5-7038-1271-2 (Вып. II) ISBN 5-7038-1270-4 Книга является вторым выпуском комплекса учебников „Математика в техническом университете". Знакомит читателя с понятиями производной и дифференциала, с их использованием при исследовании функций одного переменного. Большое внимание уделено геометрическим приложениям дифференциального исчисления и его применению к решению нелинейных уравнений, интерполированию и численному дифференцированию функций. Приведены примеры и задачи физического, механического и технического содержания. Содержание учебника соответствует курсу лекций, который автор читает в МГТУ им. Н.Э. Баумана. Для студентов технических вузов. Может быть полезна преподавателям и аспирантам. Ил. 95. Табл. 3. Библиогр. 48 назв. Выпуск книги финансировал Московский государственный технический университет им. Н. Э. Баумана ББК 22.161.1 ISBN 5-7038-1271-2 (Вып. II) ISBN 5-7038-1270-4 © Б.Б. Иванова, 1998 © Московский государственный технический университет им. Н.Э. Баумана, 1998 © Издательство МГТУ им. Н.Э. Баумана, 1998
ПРЕДИСЛОВИЕ Дифференциальное исчисление является одним из основных разделов математического анализа и служит инструментом исследования функций. В этой книге (втором выпуске комплекса учебников „Математика в техническом университете") предметом исследования будут лишь функции одного действительного переменного, что и определяет ее название. Решающие шаги в создании дифференциального исчисления функций одного переменного сделали в XVII в. И. Ньютон и Г. Лейбниц. В современном представлении теоретическую основу дифференциального исчисления (и вообще математического анализа) составляет теория пределов. Используемые в этой книге сведения из теории пределов можно найти в изданном в 1996 г. и названном „Введение в анализ" первом выпуске упомянутого комплекса учебников. В тексте книги имеются ссылки на другие выпуски комплекса учебников. Такой ссылкой служит номер выпуска. Например, [I, 7.5] означает, что имеется в виду пятый параграф седьмой главы в первом выпуске. Ссылки без римских цифр относятся только к этому, второму, выпуску. Так, (см. 1.2) отсылает читателя ко второму параграфу первой главы, а (см. Д.4.1) — к первому дополнению четвертой главы этой книги. Ссылки на номера формул и рисунков набраны обычным шрифтом (например, (2.1) — первая формула в главе 2, (рис. 1.5) — пятый рисунок в главе 1). Большинство используемых в этой книге обозначений введено в [I]. Они помещены в следующем за предисловием перечне основных обозначений, где наряду с их краткой расшифровкой указаны глава и параграф, в которых можно найти более подробное объяснение по каждому из обозначений. После этого перечня приведены написание и русское произношение входящих в формулы букв латинского и греческого алфавитов.
ПРЕДИСЛОВИЕ В конце книги помещены список рекомендуемой литературы и предметный указатель, включающий в алфавитном порядке (по существительному в именительном падеже) термины, значения которых необходимо знать читателю для понимания излагаемого материала. За каждым термином следует страница, на которой он строго определен или описан и выделен в тексте полужирным курсивом. Бели термин введен в другом выпуске, то дана ссылка на этот выпуск (например, III означает ссылку на третий выпуск, а 1-312 — на страницу 312 первого выпуска), а также указана курсивом страница предлагаемой книги, на которой имеются некоторые пояснения к этому термину. Ключевые слова, важные для понимания содержания, при первом упоминании в каждом параграфе выделены светлым курсивом. Значение этих слов читатель может уточнить при помощи предметного указателя. Перед чтением этой книги нужно в целях самоконтроля выполнить следующие несложные задания. При возникновении затруднений все необходимые сведения можно найти в [I]. Значения терминов, выделенных в тексте этих заданий прямым полужирным шрифтом, далее будем считать известными (в основном тексте книги эти термины не выделены и не входят в предметный указатель). Задания для самопроверки 1. Какие числа принадлежат множествам N, Z, Q, R и R \ Q ? Что такое абсолютное значение (модуль) числа ? 2. Каков ход доказательства по методу математической индукции ? 3. Запишите обозначения промежутков числовой прямой: интервала, отрезка, полуинтервала, бесконечных интервала и полуинтервала. 4. Изобразите на числовой прямой окрестности конечной и бесконечной точек расширенной числовой пря-
мой. В чем отличие этих окрестностей от проколотых окрестностей и полуокрестностей. 5. Укажите области определения (существования) и значений и постройте графики однозначных ветвей многозначной функции у2 = \/х. 6. Охарактеризуйте явный и неявный аналитические, параметрический, графический, табличный, алгоритмический и словесный способы задания функции. Приведите примеры составной, четной, нечетной и периодической функций. 7. Какими свойствами обладают сходящиеся последовательности? Сформулируйте признак Вейерштрасса сходимости последовательности. 8. Сформулируйте и запишите в символическом виде определения (по Гейне и по Коши) конечного предела функции в точке а € R. 9. Выполните задание 8, когда аргумент функции стремится к бесконечной точке расширенной числовой прямой. 10. Приведите пример функции, ограниченной в некоторой проколотой окрестности точки а, но не имеющей предела в этой точке. 11. Сформулируйте теорему о связи предела функции в точке с односторонними пределами функции в этой точке. 12. Определена ли функция 2z2/sina; в точке х = 0? Существует ли в этой точке предел рассматриваемой функции? 13. При каком изменении аргумента функции sins, \/x являются бесконечно малыми, а функции х2, ctgz — бесконечно большими? 14. Какова связь между бесконечно малой и бесконечно большой функциями ? При каких условиях произведение двух функций является бесконечно малой функцией ? 15. Сформулируйте теорему о связи функции, ее предела и бесконечно малой функции. 16. Запишите выражения для первого и второго замечательных пределов.
8 ПРЕДИСЛОВИЕ 17. Какова связь между приращением функции и приращением ее аргумента для функции, непрерывной в точке и непрерывной в этой точке только слева ? 18. При выполнении каких условий сложная функция (суперпозиция функций) непрерывна в точке ? 19. Приведите примеры функций, имеющих точки: а) разрыва первого рода; б) устранимого разрыва; в) разрыва второго рода. 20. Приведите примеры функций, непрерывных в интервале (а, 6), но не являющихся непрерывными на отрезке [а, 6]. Сформулируйте свойства функции, непрерывной на отрезке [а, 6]. Сохраняет ли эти свойства функция, непрерывная лишь в интервале (а, 6)? 21. Перечислите основные элементарные функции. Какие из этих функций определены и непрерывны на всем множестве действительных чисел? Какие функции относят к классу элементарных функций ? Входят ли в этот класс гиперболические тангенс и котангенс? 22. В чем различие между монотонной и строго монотонной в некотором промежутке функциями ? Каковы условия существования в нем непрерывной и строго монотонной функции, обратной заданной функции? Изобразите графики возрастающей, убывающей, невозрастающей и неубывающей в промежутке функций. 23. Приведите примеры бесконечно малых при х -> а функций: а) одного порядка; б) более высокого порядка малости; в) первого порядка малости; г) несравнимых; д) эквивалентных. Сформулируйте свойства эквивалентных бесконечно малых функций. 24. Каков смысл символов „о малое" и „О большое"? 25. Запишите в виде степенной функции главную часть функции, бесконечно малой при х —> а. 26. Приведите примеры функций, графики которых имеют вертикальную, односторонние и двусторонние горизонтальные и наклонные асимптоты.
ОСНОВНЫЕ ОБОЗНАЧЕНИЯ 4 и ► — начало и окончание доказательства # — окончание примера, замечания а € Л, А Э а — элемент а принадлежит множеству А (множество А содержит элемент а) 1,1.1 А = {а, 6, с} — множество А состоит из элементов а, 6, с I, 1.1 А С Б, В D А — подмножество А включено в множество В (В включает А) I,1.2 А С Б, В Э А — подмножество А включено в множество В или совпадает с ним 1,1.2 N — множество натуральных чисел 1,1.3 Z — множество целых чисел 1,1.3 Q — множество рациональных чисел 1,1.3 R — множество действительных чисел 1,1.3 [а, 6] — отрезок с концами в точках а и b 1,1.3 (а, 6) — интервал с концами в точках а и 6 1,1.3 [а, 6), (а, Ь] — полуинтервалы с концами в точках а и Ь 1,1.3 |х| — абсолютное значение числа х 1,1.3 +оо, —оо — бесконечные точки расширенной (пополненной) числовой прямой 1,1.3 оо — объединение бесконечных точек +оо и -оо 1,1.3 (-oo,-foo), (-оо,а), (Ь,+оо) — бесконечные интервалы 1,1.3 (-оо, а], [6, +оо) — бесконечные полуинтервалы 1,1.3 U(z0) — окрестность точки х0 1,1.3,1, 5.2 U(го, s) — е-окрестность точки хо 1,1.3,1, 5.2 А=> В — из высказывания А следует В (А — достаточное условие Б, а Б — необходимое условие А) 1,1.5
П)ОСНОВНЫЕ ОБОЗНАЧЕНИЯ Л «=> В — высказывания А и В равносильны 1,1.5 :<^ — утверждение справедливо по определению 1,1.5 Зх :... — существует такое ж, что ... 1,1.5 3\х :... — существует единственное я, такое, что ... 1,1.5 $х:... ■— не существует ж, такого, что ... 1,1.5 Vx — для любого х 1,1.5 /: X —> Y — отображение / множества X в (или на) множество Y 1,2.1; 10.1 у = f(x) — переменное у — функция переменного х I, 2.1 /(а) = f(x)\x=a — значение функции f(x) в точке а I, 2.1 x = f~l(y) — функция, обратная к функции у = f(x) 1,2.3; 11.1 Л/(х, у) — точка М плоскости с координатами х (абсцисса) и у (ордината) 1,2.5 п — сумма п слагаемых а], ..., а*, ..., ап 1,2.6 к=\ n П 0-т — произведение п сомножителей oi, ..., am, ..., an m==1 1,2.6 A: = 1, n — число А; принимает последовательно все значения из множества N от 1 до п включительно I, 2.6 о U (a) — проколотая окрестность точки а I, 7 о U (а, 8) — проколотая (^-окрестность точки а I, 7 х -> а — переменное х стремится к точке а I, 7.1 lim f(x) — предел функции f(x) в точке а (при х -> а) I, 7.1 х—¥а о U-(а) и U+(a) — проколотые левая и правая полуокрестности точки а I, 7.2 /(а + 0) — предел справа функции f(x) в точке а I, 7.2 f(a - 0) — предел слева функции f(x) в точке а I, 7.2 и Ду = Д/(х) — приращения аргумента х и функции у = = f(x) 1,9.1; 1.2
и /(я) = О(д(х)) — функция f(x) одного порядка по сравнению с функцией д(х) при х -> а I, 10.1 f{x) = о(д(х)) — функция f(x) более высокого порядка малости относительно функции д(х) при х -> а 1,10.1 f(x) ~ д(х) — функции f(x) и д(х) являются эквивалент- x—ta ■ ными при х -* а I,10.2 /'(а) = /'(ж)| _ — производная функции f(x) в точке а 1.3 у'(х), у'х, dy/dX) у' — производная функции у = f(x) 1.3 /+(а) и /!(а) — односторонние производные функции /(ж) в точке а справа (х-+ а + 0) и слева (х —f a - 0) 1.6 и ch/ = rf/(a;)|x=a — дифференциалы аргумента х и функции у = f(x) в точке а 3.1 //(a) = ///(z)|x=a и ////(а) = /"/(а:)|х=а — производные второго и третьего порядков функции f(x) в точке а 4.1 /(n)(a) =/^nUa:)| _ — производная n-го порядка (п-я произ- водная) функции /(х) в точке а 4.1 Сп(Е) — множество всех функций, п раз непрерывно дифференцируемых в промежутке Е 4.1 dxn и dny = dnf(x) — дифференциалы n-го порядка аргумента х и функции у = f(x) 4.5 г (£) — вектор-функция скалярного аргумента t 9.1 |а| — длина (модуль) вектора а 9.1 *i j\ & — орты (единичные векторы) ортонормированного базиса {г, j, к} 9.1 г;(£0) = г'($)| — производная вектор-функции r(t) в точке to 9*1 р и <р — полярные координаты (радиус и угол) точки на плоскости I, 4.3; 9.3 sgnx — функция знака числа х I, 3.2 г — мнимая единица (г2 = -1) 1,4.3; 11.3
12 ОСНОВНЫЕ ОБОЗНА НЕНИЯ Буквы латинского алфавита Начертание А а В Ь С с D d Е е F f G g Н h I i J j К k L I M m A a В b С с D d E e F f G g H h I i J 3 К к L I M m Произношение a бэ ЦЭ ДЭ e эф же аш и йот ка эль эм Начертание N п 0 о Р Р Q q R г S s Т t U u V v W w X х Y у Z z N О Р Q R S т и V W X У Z п О V Я г S t и V W X У Z Произношение эн о пэ ку эр эс тэ У вэ дубль- вэ икс игрек зэт Представлен наиболее употребительный (но не единственный) вариант произношения (в частности, вместо „йот" иногда говорят „жи"). Буквы греческого алфавита Начертание А В Г Д Е Z Н 0 /3 У S 6 с #0 Произношение альфа бета гамма дельта эпсилон дзета эта тэта Начертание I К Л М N ~ 0 п 1 X А V 0 7Г Произношение йота каппа ламбда ми ни кси омикрон пи Начертание Р Е Т Т Ф X ф п р а т V <р X Произношение ро сигма тау ипсилон фи хи пси омега Наряду с указанным произношением также говорят „лямбда", „мю" и „ню(
1. ПРОИЗВОДНАЯ ФУНКЦИИ 1.1. Вводные замечания В выпуске [I] основной способ исследования функции f(x) состоял в изучении ее поведения в окрестности некоторой точки х = а. Он сводился, как правило, к установлению существования предела функции в данной точке и вычислению его значения. В том случае, если функция определена в точке х = а и имеет в ней предел, то совпадение ее значения f(a) со значением предела, т.е. равенство /(в) = Urn fix), (1.1) Х-+О, означает, что функция непрерывна в этой точке [I, 9.1]. Теория пределов позволяет по информации о поведении функции в окрестности фиксированной точки сделать заключение о некоторых свойствах функции в этой точке. И наоборот, если существует предел функции в точке х = а, то возможен качественный анализ ее поведения в некоторой проколотой о окрестности U(a) этой точки. В частности, известно [I, 7.4], что если существует конечный предел lim f(x) = Ь, х—Уа то у точки а найдется такая проколотая 6-о крести ость о U (a; 8) (6 > 0), в которой функция f(x) ограничена и ее значения сохраняют знак предела 6 (при 6^0). Этот анализ опирается на теорему 7.3 [I] о связи функции, ее предела и бесконечно малой (б.м.) функции в виде зависимости /(*)= lim/(*) + <*(*), (1.2)
14 I. ПРОИЗВОДНАЯ ФУНКЦИИ где а(х) — функция, б.м. при х -* о, т.е. lim а(х) = 0. (1.3) Ясно, что при составлении количественного прогноза поведения функции на основе (1.2) нужно конкретизировать б.м. функцию а(х). В некоторых частных случаях эту задачу можно решить путем сравнения б.м. функций и установления их эквивалентности. Напомним, что, по определению 10.5 [I], б.м. функции у>(х) и ф(х) эквивалентны при х —> а, если предел их отношения при х -> а равен единице, т.е. (1.4) Для функции /(х), непрерывной в точке х = а, из (1.1) и (1.2) следует равенство = /(«)+<*(*). (1-5) Отметим, что для использования (1.5) и при значении х = а бесконечно малую функцию а(х) необходимо доопределить по непрерывности в точке х = а, положив с учетом (1.3) а(а) = 0. Графики зависимостей f(x) и а(х) от х могут иметь вид, показанный на рис. 1.1. Построение функции а(х) исходя из свойств функции f(x) только в одной фиксированной точке х = а составляет одну из главных проблем дифференциального исчисления. Решение этой проблемы имеет большое теоретическое и прикладное значение во многих областях науки Рис. 1.1 и техники, в частности, при
1.2. Разностное отношение 15> прогнозе движения и создании систем управления движущимися объектами. Например, по координатам, скорости и ускорению баллистической ракеты в фиксированный момент времени to можно спрогнозировать ее полет на некоторый последующий период времени и получить количественное представление о законе ее движения на предшествующем этапе. Если требуется уточнить прогноз или распространить его на больший промежуток времени, то в момент времени *о нужно знать еще и скорость изменения ускорения, а также и другие кинематические характеристики полета ракеты. В основе дифференциального исчисления лежат фундаментальные понятия производной и дифференциала функции в точке. Термин „производная" был введен Ж. Лагранжем в 1797 г., тогда как термин „дифференциал" Г. Лейбниц использовал уже начиная с 1675 г. Но прежде чем говорить о производной и дифференциале, целесообразно предварительно рассмотреть отношение приращения функции к приращению ее аргумента. 1.2. Разностное отношение Если функция у = f(x) определена в некоторой 6-окре- стности U (а; 5) (8 > 0) точки х = а, то о поведении этой функции в указанной окрестности удобно судить по изменению приращения Ду = Д/(а) = /(*) - /(а) = /(а + Ах) - /(а) функции, вызванного приращением Дх = х - а аргумента х. График зависимости Ду от Ах в фиксированной точке а совпадает с графиком а(х) на рис. 1.1, если отсчет приращений вести от точки а на оси абсцисс, или же с графиком /(х), если начало отсчета перенести в точку М. Пример 1.1. Предположим, что функция f(x) описывает работу некоторого устройства по преобразованию входного
16 1. ПРОИЗВОДНАЯ ФУНКЦИИ сигнала х в выходной сигнал у (рис. 1.2), причем номинальному значению х = о сигнала на входе соответствует номинальное значение у = f(a) на выходе. При отклонении на Ах входного сигнала от номинального значения на выходе возникает отклонение Ду, которое можно считать характеристикой абсолютной чувствительности данного устройства. Р+др Рис. 1.2 Рис. 1.3 Один из простейших примеров такого устройства — пружина (рис. 1.3), один конец которой закреплен, а к другому приложена растягивающая сила Р (входной сигнал), вызывающая его перемещение и (выходной сигнал). Другой пример — резистор (рис. 1.4), через который протекает электрический ток силой / (входной сигнал) и вызывает падение напряжения V (выходной сигнал). Эти устройства объединяет то, что преобразование сигналов в них можно рассматривать как линейное, т.е. можно считать отклонения входного и выходного сигналов от их номинальных значений пропорциональными: /+Д1 V V+AV Рис. 1.4 Аи/АР = 5, AV/AI = Я. Податливость 5 пружины (величина, обратная ее жесткости) и сопротивление R резистора характеризуют относительную чувствительность преобразовательного устройства.
1.2. Разностное отношение 17 В общем случае для произвольной функции у = f(x) с помощью отношения приращений Ay = A/(o)^/(q + Aa)-/(g) Ax Ax Ax (1.6) называемого разностным отношением, можно получить полезную информацию о поведении этой функции в окрестности точки х = а. В фиксированной точке а оно является функцией ¥>(Аж), зависящей только от Ах и определенной в о проколотой окрестности U(0) точки Ах = 0. При Ах —► 0 разностное отношение представляет собой неопределенность вида [0/0]. Для раскрытия этой неопределенности необходимо использовать теорию пределов. В связи с этим рассмотрим механическую и геометрическую интерпретацию разностного отношения. Пример 1.2. Пусть функция, s = f(t) описывает зависимость от времени t расстояния 5, пройденного точкой М (рис. 1.5), причем в момент времени to точка занимает положение Мо, а пройденное к этому моменту расстояние «о = = /(to). Через промежуток времени At = ti — to точка окажется в положении Mi, а пройденное расстояние будет s\ = f(t\) = = /(to -Ь At). В данном случае разностное отношение Рис. 1.5 As _ 5i - sp _ f(to-\-At)- f(t0) _ At t\ -to At cp (1.7) равно средней скорости v^, с которой должна была бы равномерно двигаться точка в течение промежутка времени At, чтобы пройти расстояние As. При неравномерном движении значение v^, зависит как от to, так и от выбора At, но это 2-544
18 1. ПРОИЗВОДНАЯ ФУНКЦИИ значение будет одинаково для любых зависимостей, графики которых проходят через точки Mq и М\ (см. рис. 1.5, сплошная, штриховая и штрихпунктирные кривые). Чтобы получить более точное представление о скорости точки М в момент времени to, следует уменьшать промежуток времени At и в пределе устремить его к нулю (At— Тогда предел (если, конечно, он существует) /(t0 + At) - /(t0) At естественно назвать мгновенной скоростью точки М в момент времени to- Ясно, что при равномерном движении мгновенная скорость в любой момент времени совпадает со средней скоростью (v = Vcp). # v = lim -г— = hm At д«-*о У /(а) Ах Рис. 1.6 Теперь рассмотрим задачу определения углового коэффициента касательной к кривой. Пусть график функции у = /(х) в окрестности точки а имеет вид, показанный на рис. 1.6. Проведем через точки Mi (а + Да:, /(а + Дж)) и М(ау f(a)) прямую, называемую секущей. При перемещении точки Mi по кривой меняется и положение секущей. Определение 1.1. Бели существует предельное положение секущей ММь когда точка Mi, перемещаясь вдоль кривой графика, стремится к точке М, то это положение секущей называют касательной к графику функции у — f(x) в точке М. Найдем угловой коэффициент касательной к графику у = = f(x) в точке М(а, /(а)). Из рис. 1.6 следует, что угловой
1.3. Понятие производной 19 коэффициент секущей ММ\ совпадает с разностным отношением, т.е. tg/3 = Ay/Ax. Для получения углового коэффициента касательной нужно перейти к пределу в этом разностном отношении при Ах —> 0. Так как при этом угол /3 —► а (см. рис. 1.6), в силу непрерывности функции tgz угловой коэффициент касательной k = tga = lim tg/? = lim & Даг-Ю & Д ИЛИ k= lim /(«+**)-/<«) Ах Таким образом, переход в разностном отношении (1.6) к пределу при стремлении приращения аргумента к нулю позволяет получить новую характеристику рассматриваемой функции в точке, уже не зависящую от выбора значения этого приращения. 1.3. Понятие производной Пусть функция у = f(x) определена в точке х = а и некоторой ее окрестности. Определение 1.2. Производной f'(a) функции f(x) в фиксированной точке х = а называют предел при Ах -> 0 разностного отношения (1.6) (при условии, что этот предел существует), т.е. Ах Предел в (1.8) может быть конечным или бесконечным. В связи с этим можно говорить о конечной или бесконечной производной. Пока ограничимся случаем, когда предел конечен. Штрих у символа функции обозначает операцию вычисления производной по аргументу данной функции, называемую
20 1. ПРОИЗВОДНАЯ ФУНКЦИИ дифференцированием, в скобках указано фиксированное значение аргумента, при котором вычислена производная. Производную функции у = /(х) также обозначают у'{х), у£, dy/dx или просто у'. Пример 1.3. Производная произведения функции имеющей в точке х = а производную, и постоянной С, согласно (1.8), равна «. о-ч Следвательно, константу С можно выносить за символ д ифференци рования. Найдем производные в точке х = о функции f(x) = х2 при а=1 и а = 0 и функций д(х) = х2/3 и Л(х) = |х| при а = 0. Функция f(x) = х2 определена на всем множестве R действительных чисел. Поэтому в некоторой проколотой окрестности точки а имеет смысл разностное отношение вида (1.6) Af{a) (а + Ах)2-а? а2 + 2аДх +(Дх)2-а2 ft A —а— = а = 1 = 2а -}- Дх, Ах Ах Ах для которого Urn Ц£ = 2а, До Ах т.е. в силу определения 1.2 производной /'(а) = 2а. Из полученного результата следует, что функция /(х) = х2 имеет конечную производную в любой точке а € R. При а = 1 /'(1) = = 2, а при а = 0 /'(0) = 0. Функция #(х) = х2/3 тоже определена для всех х £ R и в точке а = 0 Ах = х-а = х, д(0) = 0 и Ар(0) = (Ах)2/3. При Ах -» 0 разностное отношение Ду(0)/Дх = 1/(Ах)х/3 -► оо, т.е. в точке а = 0 функция имеет бесконечную производную.
1.4. Механический и геометрический смысл производной 21 Для функции h(x) = \х\} х 6 R в точке a = О имеем разностное отношение Ah(0)/Ax = |Ax|/Ax, но для него при Дх -» 0 не существует ни конечного, ни бесконечного предела. Таким образом, в указанной точке у данной функции не существует производной. Отсюда следует, что функция не обязательно в каждой точке своей области определения имеет производную. 1.4. Механический и геометрический смысл производной. Касательная и нормаль к плоской кривой Механический смысл производной еще до введения ее определения был выявлен, по существу, в примере 1.2. Теперь можно констатировать, что механический смысл производной функции $ = /(£), описывающей движение точки М в зависимости от времени t (см. рис. 1.5), состоит в том, что значение производной /'(to) равно мгновенной скорости точки в момент времени t0. Отметим, что в механике дифференцирование по времени обычно обозначают точкой над символом функции, т.е. вместо s' пишут s (эта традиция восходит к И. Ньютону, который такое обозначение ввел в 1692 г.). Термин „скорость" в связи с понятием производной можно воспринимать не только в механическом смысле, но и более широко — как скорость изменения значения функции при изменении ее аргумента или как коэффициент влияния изменения аргумента на изменение функции. С геометрической точки зрения значение производной /'(а) в данной точке х = о равно угловому коэффициенту касательной к графику функции у = f(x) в точке М(а, f(a)). Зная геометрический смысл производной, нетрудно написать уравнение касательной к плоской кривой у = f(x) в точке М(а, /(а)), если касательная не параллельна оси Оу. Из аналитической геометрии известно [III], что уравнение прямой с
22 1. ПРОИЗВОДНАЯ ФУНКЦИИ заданным угловым коэффициентом к и проходящей через точку М(а} /(а)) имеет вид у- f(a) = k(x-a). Для касательной к = /'(а). Поэтому искомым уравнением будет у-/(а) = /'(а)(*-а). (1.10) Прямую, проходящую через точку М (см. рис. 1.6, линия MN) перпендикулярно касательной, называют нормалью к графику функции у = f(x) в точке М, Если /'(а) ф 0, то уравение нормали имеет вид y-f(a) = -(x-a)/f'(a). (1.11) В случае /'(а) = 0 нормаль вертикальна, т.е. ее уравением будет х = а. В прямоугольном треугольнике MNqTq (см. рис. 1.6) катет ТоМ называют отрезком касательной, катет N$M — отрезком нормали, а их проекции Т0М0 и NqMo на ось абсцисс — отрезками подкасательной и подиорлсали соответственно. Приведем еще два примера, выявляющих физический смысл понятия производной. Пример 1.4. Пусть количество электричества, проходящего в определенном направлении через фиксированное поперечное сечение проводника, задано зависимостью q = q(t) от времени t. Тогда за промежуток At через это сечение пройдет количество электричества Ag = q(t -f At) - q(t). Разностное отношение Aq/At определяет среднюю за этот промежуток времени силу тока, а q'{t) = lim ^f v ' д*ю Д* является мгновенным (в момент времени t) значением силы тока в фиксированном поперечном сечении проводника.
1.5. Производные основных элементарных функции 23 Известно, что заряд q конденсатора емкостью С связан с падением напряжения и на конденсаторе зависимостью q = Си. Если считать емкость конденсатора постоянной (С = = const), то при изменении напряжения сила тока, проходящего через конденсатор, / = dq/dt — Cdu/dt, поскольку постоянный коэффициент можно, согласно (1.9), вынести за символ дифференцирования. Пример 1.5. Затрачиваемое на нагрев тела количество теплоты Q = Q(T) зависит от температуры Т этого тела. При изменении температуры на AT приращение затрачиваемого количества теплоты составит AQ = Q(T + AT) - Q(T). Разностное отношение AQ/AT характеризует среднее значение теплоемкости тела в пределах интервала температур от Т до Т + АТ. Тогда соответствует значению теплоемкости тела при текущей температуре Т. 1.5. Производные основных элементарных функций Выведем формулы для производных некоторых основных элементарных функций, непрерывных во всей своей области определения [I, 9.5]. При выводе используем эквивалентности бесконечно малых при Ах -> 0 функций [I, 10.2] а 1 (1+AzV 1 tg Да; ; ~ln(l+Az)~-^-!: '- . (1.12) ma s Пример 1.6. а. Бели у = С = const, то Ау = 0 при любом Ах. Поэтому ' = С'= lim ^ Дх-+о Да;
24 i. ПРОИЗВОДНАЯ ФУНКЦИИ б. Пусть у = хп, где п — натуральное число (n G N). Тогда Ах (х + Дх) - х При Ах —у 0 предел разностного отношения Ay/Ах существует и равен пх71"1, т.е. у'= (хп)'= пхп-1 (1.13) в любой точке х G R. В частности, при п = 1 имеем у' = х' = 1. в. Рассмотрим степенную функцию у = х5, где 5 — любое отличное от нуля действительное число (s€R\{0}). Напомним, что область определения D(y) этой функции зависит от значения s, а именно [I, 3.5]: если s — иррациональное число, то D(y) = (0, +оо), а если s — рациональное число (s € Q), то его можно представить отношением s = к/п, где п € N, а к — отличное от нуля целое число (к € Z\{0}), и тогда можно записать: а) D(y) = R, если п нечетное и к > 0; б) D(y) = R\{0}, если п нечетное и к < 0; в) D(y) = {х 6 R: х ^ 0}, если п четное и к > 0; г) D(y) = {х €R: х > 0}, если п четное и fc < 0. При х ф0 имеем Ау (х + Дх)5-х Дх Дх Дх/х Из (1.12) следует существование при Дх -> 0 предела разностного отношения Ay/Ах и равенство = ю-1. (1.14) В частности, если 5 = —1 при х^0, т.е. у = х~х = 1/х то у; = -1/х2 (х т^О), а если при х>0 5=1/2, т.е. у =
1.5. Производные основных элементарных функции 25 Пример 1.7. Пусть у = sinx. Тогда в произвольной точке Ay _ sin(x + Дх) -sinx _ 2sin(Ax/2) -cos(x + Ax/2) Ax Ax ~~ Ax sin (Ax/2) Ах/2 cos(x +Ах/2). Воспользовавшись непрерывностью функции cosx, с учетом (1.12) получим , ,. Ау .. sin(Ax/2) . . /ЛЧ у = hm -т— = lim —;—^-^cosfx-f Дх/2) = cosx. ДгюДх Дх^о Дх/2 v ' } Итак, функция y = sinx имеет конечную производную в каждой точке х 6 R. Аналогичо можно найти производную функции у = cosx, равную у' = (cosx)' = -sinx Vx £ R. Пример 1.8. Для показательной функции у = ах (а > О, -ах _ х Ах Ах Ах Согласно (1.12), аАх — 1 ~ Ах In а при Ах —>• 0. Поэтому предел разностного отношения Ay/Ах существует и равен y/=(aa:)/ = aa:lna Vx G R. В частности, при а = е имеем у' = (е*)' = ех. Отсюда видно, что скорость возрастания показательной функции (при а > 1) пропорциональна значению самой функции, т.е. чем большего значения функция уже достигла, тем быстрее это значение будет расти при возрастании аргумента. Для логарифмической функции у = logax (a > 0, а ф 1, = + Ах) - logax _ loga(l -f Ax/x) Ах Ах Ах
26 I. ПРОИЗВОДНАЯ ФУНКЦИИ Из (1.12) следует, что \oga(\+Ax/x) ~ Ах/(х\па) при Да: Следовательно, предел разностного отношения Ay/Ах существует и равен у'= (logaz)'= 1/(я1па). Для натурального логарифма (а = е) имеем у' = (Inж)' = 1/х. Итак, при а>\ скорость возрастания логарифмической функции обратно пропорциональна значению аргумента х и, оставаясь положительной, стремится к нулю при неограниченном возрастании аргумента. 1.6. Односторонние конечные и бесконечные производные Пусть точка х — а является одним из концов того промежутка, на котором определена функция у = f(x). Тогда при вычислении предела разностного отношения Ay/Ах приходится ограничиться приближением х к нулю только справа, если точка а является левым концом этого промежутка, или только слева, если она является его правым концом. При существовании таких односторонних пределов говорят об односторонней производной в точке а справа /+(а) или слева fL{a) соответственно. В такой точке график функции имеет одностороннюю касательную (рис. 1.7, аи б). У| /(а) О У /(о) О \ i 1 1 i а х Рис. 1.7 Может оказаться, что в некоторой внутренней точке х = а того промежутка, в котором определена и непрерывна функция
1.6. Односторонние конечные н бесконечные производные 27 у = /(х), существуют не равные между собой односторонние пределы разностного отношения Ay/Ах. Их тоже называют односторонними производными функции в точке а. В этом случае в соответствующей точке графика функции будут существовать односторонние касательные, образующие, вообще говоря, некоторый угол (рис. 1.8). Точку М(а, f(a)) при этом называют угловой точкой (или точкой излома) графика функции. Так, для функции h(x) = \x\ из примера 1.3 угловой точкой ее графика является начало координат (рис. 1.9). Рис. 1.8 Рис. 1.9 Один или оба односторонних предела разностного отношения Ay/Ах в точке а могут быть бесконечными. Тогда говорят о бесконечной односторонней производной функции у = f(x) слева или справа (или и слева и справа) в точке а (в отличие от рассмотренных выше случаев конечной односторонней производной). Для непрерывной функции бесконечная односторонняя производная может быть только определенного знака (либо -foo, либо -оо). Если знаки бесконечных односторонних производных функции и слева и справа в некоторой точке а совпадают, то в этой точке данная функция имеет бесконечную производную определенного знака (положительную на рис. 1.10, а и отрицательную на рис. 1.10,5). В этом случае касательная к графику функции в соответствующей точке существует и является вертикальной. Если же знаки бесконечных односторонних производных различны, то соответствующая точка графика функции является точкой заострения (точкой возврата) (рис. 1.10, в и г).
28 1. ПРОИЗВОДНАЯ ФУНКЦИИ f(a) — /(а) О а в Рис. 1.10 Пример 1.9. а. Пусть /(х) = я1/3. При я ^ 0 /'(х) = = х~2/3/3. В точке ж = 0 производную вычислим согласно определению 1.2. Для этого составим разностное отношение Ду = Д0 + Ах) - /(0) _ (Дх)1/3 Дх 1 Ах Ах (Дх)2/3' из которого ясно, что Ау/Ах —► +оо как при Дх —► так и при Дх -*• -0, т.е. в точке х = 0 данная функция имеет бесконечные односторонние производные одного знака, и поэтому /'(0) = +оо. График рассматриваемой функции показан на рис. 1.11, а. б. Функция у = у/х определена при х>0 (рис. 1.11,6). В точке х = 0 разностное отношение Ау/Ах — (Дх)"1/2 и. поскольку можно рассматривать только Дх > 0, существует лишь бесконечная производная справа Д (0) = +оо. в. Для функции /(х) = х2/3 в точке х = 0 разностное отношение Ду = /(0 + Дх) - /(0) = (Дх)2/3 Дх 1 Дх Дх (Дх)1/3 Отсюда /i(0)= lim x^= lim . + Дх-++оДх Дг-н-о(Дх)1/3 1 /1(0)= Kin ^= lim Дх->-0 Дх Дг-f-O (Дх)1/3 = +оо, = -оо.
1.6. Односторонние конечные и бесконечные производные 29 Таким образом, эта функция в точке х = О имеет бесконечные односторонние производные разных знаков, а ее график — точку заострения (рис. 1.11, в). О а б Рис. 1.11 в Пример 1.10. Рассмотрим функцию 0, Она непрерывна в любой точке х 6 R, но не имеет в точке х — О даже односторонних производных. Действительно, разностное отношение в этой точке ДО + Ах)-ДО) ДАх) . 1 Дя Ах Ах не стремится ни к какому пределу при Ах -t 0. Секущая О Mi (рис. 1.12), исходящая из начала координат, не имеет предельного положения при стремлении точки Mi к точке О, так что в начале координат не существует к кривой касательной (хотя б односторонней).
30 1. ПРОИЗВОДНАЯ ФУНКЦИИ Рис. 1.12 1.7. Дифференцируемость функции. Непрерывность дифференцируемой функции Пусть функция у = f(x) определена в некотором интервале £\ содержащем точку х = а. Возьмем такое приращение Ах аргумента х, чтобы точка а + Ах не вышла из этого интервала, т.е. а 4- Дх € Е. Определение 1.3. Функцию у = /(х) называют дифференцируемой в точке а, если отвечающее приращению Ах приращение Ау этой функции в окрестности точки а может быть представлено в виде Ау = ААх + Р(Ах)Ах, (Ы5) где А — некоторое число, не зависящее от Дх, а 0(Ах) — функция, бесконечно малая (б.м.) при Дх —> 0. Ясно, что в (1.15) /3(Дх)Дх при Дх->0 как произведение бесконечно малых функций есть б.м. функция более высокого
1.7. Дифференцируемость функции 31 порядка по сравнению с Ах. Поэтому (1.15) можно переписать в виде Ау = ААх + о{Ах). (1.16) Пример 1.11. Выразим приращение функции у = х2 в произвольной точке а € R через приращение Да; аргумента х и проверим, является ли эта функция дифференцируемой в такой точке. В точке а приращение Ау = (а + Ах)2 — а2 = = 2аАх + (Ах)2 функции у = х2 соответствует представлению (1.15), если положить А = 2а и fi(Ax) = Ах. Следовательно, согласно определению 1.3, эта функция дифференцируема в любой точке a G R. # Равносильность дифференцируемости функции в точке и существования в этой точке конечной производной данной функции устанавливает следующая теорема. Теорема 1.1. Для дифференцируемости функции у = f(x) в точке а необходимо и достаточно, чтобы она имела в этой точке конечную производную. 4 Необходимость. Если функция дифференцируема в точке а, т.е. справедливо (1.15), то при Ах ф 0 получим Ау/Ах = А + @(Ах). Отсюда следует, что существует конечный предел lim —— = А. ю Ах т.е. существует конечная производная f'(a) и A = f'(a). Достаточность. Пусть функция у = f(x) имеет в точке а конечную производую /'(а), т.е. существует конечный предел Hm теореме 7.3 [I] о связи функции, ее предела и б.м. функ- , согласно (1.2), можно написать Ay/Ax = f'(a) + (3(Ах),
32 i. ПРОИЗВОДНАЯ ФУНКЦИИ где /?(Дх) — функция, б.м. при Да; -»• 0. Отсюда Ау = = ААх + /?(Дх)Дх, что в силу определения 1.3 означает диф- ференцируемость функции у= f(x) в точке а. ► В ходе доказательства теоремы 1.1 установлено, что для дифференцируемой в точке а функции у = }(х) выполнено равенство А = f'(a). Поэтому (1.15) можно представить в виде Ay = f'(a)Ax + /?(Дх)Дх. (1.17) Замечание 1.1. Полагая /3(Ах) -> 0 при Ах —» 0, обычно считают, что Ах не принимает нулевого значения, а изменяется в некоторой проколотой окрестности точки Дх = 0. Чтобы использовать (1.17) и при Ах = 0, примем, что /3(0) =0. Теперь запись Дх -> 0 можно понимать в более широком смысле, не исключая для Дх при стремлении к нулю возможности принимать среди прочих и нулевое значение. # Теорему 1.1 называют необходимым и достаточным условием дифференцируемости функции одного переменного. Она позволяет дать еще одно определение дифференцируемости такой функции: функцию y = f(x) называют дифференцируемой в точке а, если в этой точке существует конечная производная /'(а). Необходимое условие дифференцируемости функции в точке устанавливает следующая теорема. Теорема 1.2. Бели функция y = f(x) дифференцируема в точке х = а, то она непрерывна в этой точке. < Так как функция у = /(х) дифференцируема в точке а, ее приращение представимо в виде (1.16) Ау = ААх + о(Ах). Отсюда сразу следует lim Ay = 0, >0 что равносильно (1.1) и означает непрерывность функции у- = /(х) в точке а. ►
Вопросы и задачи 33 Замечание 1.2. Утверждение, обратное утверждению этой теоремы, неверно, т.е. из непрерывности функции в точке не следует ее дифференцируемость в этой точке. Так, функции <7(x)=z2/3 и h(x) = |х| из примера 1.3 непрерывны в точке х = = 0, но не имеют в этой точке конечной производной и поэтому недифференцируемы в точке х = 0. # В заключение дадим определение. Определение 1.4. Функцию, дифференцируемую в каждой точке открытого множества XCR, называют дифференцируемой на множестве X. Например, функция у = х2 дифференцируема в любой точке множества R действительных чисел, т.е. дифференцируема на всем множестве R. В частном случае, если X = (а, 6), то говорят, что функция дифференцируема в интервале (а, 6). Если функция дифференцируема в каждой точке своей области определения, то ее называют просто дифференцируемой. Вопросы и задачи 1.1. Пользуясь определением 1.2 производной, найти произ- водые функций /(х) = cos ах и д(х) = 5х2 — 2х. 1.2. Определить среднюю скорость точки при движении ее в соответствии с законом s = t2 — bt + 2 в промежутке времени от t\ = 5 до ti = 15. 1.3. Показать, что следующие фукции не имеют конечных производных в указанных точках: а) у = х3/5 в точке х ='0; б) у=(х-1)1/3 в точке х=1; в) ?/ = 3|x|-fl в точке х = 0. 1.4. Убедиться, что производная функции sin(l/x) при *7 _ ( x2sh 0 при х = 0 3-544
34 1. ПРОИЗВОДНАЯ ФУНКЦИИ существует при любом х € R, но в точке х = О она терпит разрыв второго рода. 1.5. Исследовать дифференцируемость функций в указанных точках: а) у = х5, s € R в точке х = 0; б) у = х|х| в точке х = 0; в) у = |1пх| в точке х = 1; г) y = |cosx| в точках х = тг/2 + птг (n(=N); д) у = 2|/(х)|, если 3/'(х) Vx G R; е) у = |х - а|^г(х) в точке х = а, если в этой точке функция д(х) непрерывна. 1.6* Привести пример непрерывной функции, не имеющей производной: а) в точке a£R; б) в п точках ai,a2,... ,an G R. 1.7. Верны ли утверждения: а) производная дифференцируемой четной функции является функцией нечетной; б) производная дифференцируемой нечетной функции есть функция четная; в) производная дифференцируемой периодической функции является функцией периодической с тем же периодом ? 1.8. Известно значение производной /'(а) 6 R. Найти при п -+ оо пределы последовательностей б) {n(f(a)-f(a-2/п))}; и отношения (am/(x) - xm/(a))/(x -a), mGN при х-* a. 1.9. Найти предел отношения (f(x)g(a) - f(a)g(x))/(x - a), если известны значения /'(о) и д'(а).
Вопросы и задачи 35 1.10. При каком условии касательные к графикам дифференцируемых функций f(x) и д(х) в точке пересечения графиков будут взаимно перпендикулярны? 1.11. Выразить через значения /(а) и /;(а) дифференцируемой в точке х = а функции f(x) длины отрезков касательной к графику функции в точке М(а\ /(а)), нормали, под касательной и поднормали (см. рис. 1.6). 1.12. Доказать, что лучи, исходящие из точки (0; 1/2), после зеркального отражения от графика функции у = х2 параллельны оси ординат. 1.13. Сравнить на промежутке времени 0 < t < 1 средние и мгновенные скорости двух тел, прямолинейное движение которых задано уравнениями s\ = t2 и S2 = 2t — t2. 1.14. Для тела с постоянной массой ш, прямолинейное движение которого задано уравнением s — t2 + t + 1, найти зависимость от времени t кинетической энергии тела. 1.15. Доказать, что существование конечных односторонних производных в точке влечет непрерывность функции в данной точке. 1.16. Подобрать такие значения с\ и cq для функции '■{ х2 при х < а; х + со при х > а, чтобы она была дифференцируема в точке х = а. Дать геометрическую интерпретацию.
2. ПРАВИЛА ДИФФЕРЕНЦИРОВАНИЯ ФУНКЦИЙ Рассмотренные выше понятия и свойства производной позволяют установить правила дифференцирования суммы, разности и произведения функций, частного от деления одной функции на другую, а также получить выражения для производных сложной и обратной функций. Все эти правила составляют основу для практического применения дифференциального исчисления. 2.1. Дифференцирование и арифметические операции Теорема 2.1. Пусть функции и(х) и v(x) дифференцируемы в точке х. Тогда в этой точке дифференцируемы их сумма (разность), произведение и частное (последнее при условии v(x) ф 0), причем (опуская в обозначениях аргумент х) справедливы равенства: 2) (uv)1 = u'v + tit/; /u\' _ u'v- uv' \v) ~" V2 < При доказательстве используем определение 1.2 производной и правила предельного перехода для суммы, произведения и частного двух функций [I, 7.4]. 1. Пусть у(х) = u(x)±v(x). Дадим аргументу х приращение Ах. Тогда функции и, и и у получат соответственно приращения Аи = и(х + Ах) - и(х), Av = v(x 4- Ах) - v(x) и Ay = у(х + Ах) -у(х) = ((и + Au)±(v + Av)) - (u±v) = Au±Av.
2.1. Дифференцирование и арифметические операции 37 Отсюда при Дх ф О Дх Дх Дх' Так как функции и и v дифференцируемы в точке х, в этой точке существуют конечные пределы lim ^ = u'(x) и ton ^ = t/(x). (2.2) Д*-юДх v Дх-юДх Переходя в (2.1) к пределу при Дх —» 0, с учетом (2.2) и правила предельного перехода для суммы функций получаем, что существует конечный предел правой части (2.1), равный u'(x) ± v'(x). Но тогда существует равный ему конечный предел и левой части (2.1), причем Ьш = у(х). Дх-ю Да; Таким образом, в точке х существует конечная производная функции у(х) = и(х) ± v(x)y равная у'{х) = (и(х) ± v(x))' = и'(х) ± v\x). (2.3) 2. Пусть теперь у(х) = u(x)v(x), а приращению Дх соответствуют приращения Аи, Av и Ay = (u + Au)(v + Av) - -uv = vAu + uAv + AuAv. Отсюда при Дх ф О Ay Аи Av Аи . /Л J4 Дх Дх Дх Дх Согласно теореме 1.2, из дифференцируемости функции t; в точке х следует ее непрерывность в этой точке, т.е. lim Ду = 0. (2.5) В силу (2.2), (2.4), (2.5) и правил предельного перехода для суммы и произведения функций существует конечный предел Hm -JL= Ит (v--^ + u--^ + --^Av) =uf(x)v(x) + u(x)v'(x), г^о Дж д*ю\ Дх Дх Дх J v ^ v ; ■ v / v л
38 2. ПРАВИЛА ДИФФЕРЕНЦИРОВАНИЯ ФУНКЦИЙ т.е. в точке х существует конечная производная функции у(х) = u(x)v(x), равная у1 = (uv)f = u'v + uvf. (2.6) 3. Если в точке х выполнено условие v(x) ф О, то в этой точке определена функция у(х) = u(x)/v(x). Приращению Ах соответствуют приращения Аи, Av и __ и + Аи и vAu - ttAv y~~v ~v~ v(v + Av) ' Отсюда при Ах ф О Аи Av Ax v(v + Av) Согласно (2.2), (2.5), (2.7) и правилам предельного перехода для суммы и частного функций, заключаем, что существует конечный предел Ay u'v - ш/ lim —— = г—» Дх-Ю Ах V2 т.е. в точке х существует конечная производная функции у(х) = u(x)/v(x), равная /и\' u'vuv' /Л ЛЧ ) (2-8) Таким образом, все три утверждения теоремы доказаны. ► Правило дифференцирования суммы двух дифференцируемых функций нетрудно распространить на любое конечное число дифференцируемых слагаемых. Бели функции и, v к w дифференцируемы в точке х, то (uvw)' = ((ttv)w) = (uv)'w + (uv)wf = = (u'v + uv')w -|- uvw' = u'vw 4- uv'w
2.1. Дифференцирование и арифметические операции 39 Такая процедура справедлива для любого конечного числа дифференцируемых сомножителей: (uvw-'-s)' = u'vw---s + uv'w---s + ... + uvw---s'. (2.9) Для доказательства (2.9) достаточно воспользоваться методом математической индукции. Бели в точке х каждый из п дифференцируемых сомножителей Д(ж) (fc = l,n) отличен от нуля, то производную произведения этих сомножителей можно записать в виде Ш (2Л0) =iJky ' Как следствие из теоремы 2.1 вытекает установленное в примере 1.3 правило дифференцирования функции у = Сиу где С = = const, u — дифференцируемая функция: у = (Си)1 = Си + + Си' = Си', поскольку, согласно примеру 1.6, производная постоянной величины равна нулю (С' = 0). Используя (2.8), можно найти производную функции у = C/v (С = const): , (С\ Cv-Cv' „у1 У =[ — ) = о = ~^"~2 * (2Л1) \У J У2 У2 Из утверждений теоремы 2.1 вытекает правило дифференцирования линейной комбинации конечного числа т дифференцируемых функций Л(х), fc=l,m при cjfc = m k=l т.е. дифференцирование является линейной операцией. Пример, а. Используя правило (2.8) дифференцирования дроби и результаты примера 1.7, найдем производную функции
40 2. ПРАВИЛА ДИФФЕРЕНЦИРОВАНИЯ ФУНКЦИЙ тангенса (tgx)' /sinx\ \cosx/ (sin X)' cosx — COS sin 2x x • (cosx)' cos2x + cos2 sin2 ж X 1 cos2 ж при условии, что cosx ф 0. Аналогично для функции котангенса можно получить (ctgx)' = -l/sin2x при условии, что sin ж ф 0. Таким образом, функции тангенса и котангенса дифференцируемы в каждой точке своей области определения. б. Продифференцируем функцию 2x2 + x3-cosx у=— Преобразуем сначала эту функцию к виду у = -х5/3+ -х8/3 - -x"1/<3cosx. По правилам дифференцирования суммы и произведения с учетом (1.14) и результатов примера 1.7 получим ' = 2-{х*1*У+ \(X*I3)'- i(x->/3cosx)' = I ■ |*»/з i о 21 в. На кривой у = х3 - Зх 4- 5 найдем точки, в которых касательная параллельна прямой у=-2х. Известно (см. 1.4), что угловой коэффициент касательной к кривой у = /(х) в точке а равен значению Г (а) производной функции /(х) в этой точке. В нашем случае f'(a) = За2 - 3. Из условия параллельности прямой с угловым коэффициентом к = -2 и
2.1. Дифференцирование и арифметические операции 41 касательной имеем /'(а) = к или За2 — 3 = —2. Отсюда о2 = = 1/3, т.е. п\ = -1/\/3 и О2 = 1/\/3. При этом /(см) = = 5 + 8\/3/9 и /(аг) = 5 — 8\/3/9. Итак, искомыми являются точки Mi(->/3/3, 5 + 8^3/9) и М2(>/3/3, 5-8^/9). г. Рассмотрим функцию в форме определителя D(x) = = det(utJ(x)) .матрицы (ut<7-(ж)), элементы Uij(x) (i,j = l,n) которой являются дифференцируемыми функциями аргумента х. Для вычисления производной D'(x) используем разложение определителя по элементам i-й строки, опустив обозначение аргумента я, п где i4tJ — алгебраическое дополнение к элементу, стоящему в i-й строке и j-м столбце, в которое не входят элементы этих строки и столбца. Таким образом, от каждого из элементов и^ определитель зависит линейно. Поэтому в силу линейности операции дифференцирования производная определителя должна быть линейной комбинацией производных всех его элементов, а коэффициентами этой линейной комбинации будут алгебраические дополнения к элементам. Тогда с учетом суммирования по номерам строк найдем Эта формула симметрична относительно индексов i и j, т.е. производную D' можно представить либо как сумму по i из п определителей, каждый из которых отличается от исходного заменой элементов Uij г-й строки производными uj , либо как сумму по j из п определителей, отличие которых от исходного состоит в замене элементов j-ro столбца их производными. Например, для определителя третьего порядка
42 2. ПРАВИЛА ДИФФЕРЕНЦИРОВАНИЯ ФУНКЦИЙ получим D' = или D1 = «'п «21 «31 «11 «21 «31 «12 «22 «32 «12 «22 «32 «13 «23 «33 + «И «21 «31 «13 «23 «33 + «11 «21 «31 «12 «22 «32 «12 «22 «32 «13 «23 «33 + «11 «21 «31 «13 «23 «33 + «11 «21 «31 «12 «22 «32 «12 «22 «32 «13 «23 «33 «13 «23 «33 • Ясно, что формула для D' не изменится, если воспользоваться разложением D по элементам j-ro столбца, поскольку определитель сохраняет свое значение при транспонировании матрицы [III]. 2.2. Производная сложной функции Пусть в некоторой окрестности точки х = а определена функция и = д(х)> а в окрестности точки 6 = д(а) — функция {(и). Тогда существует окрестность точки а, в которой определена сложная функция (суперпозиция функций) [I, 3.3] F(x) = f(g{x)) = (fog)(x). На рис. 2.1 показана связь между функциями д(х), f(u) и F(x) и их приращениями. Теорема 2.2. Пусть функция и = д(х) дифференцируема в некоторой точке а, а функция у = f(u) дифференцируема в соответствующей точке b = g(a). Тогда сложная функция F(x) = f(g(x)) дифференцируема в указанной точке а и (2.13) х—а 4 Пусть приращению Да: аргумена х в точке а соответствует приращение Аи функции и = р(х), а Аи, в свою очередь.
2.2. Производная сложной функции 43 и, ЯЪ)+Дш/(Ь) О о+Дх х Рис. 2.1 вызывает приращение Ду функции y = f(u). Так как функции у = f(u) и w = ^(ж) дифференцируемы в точках 6 и а соответственно, то их приращения, согласно (1.17), можно записать в виде Ду = /'(&)Аи + а(Ди)Ди и Аи = g'(a)Ax + /3(Дж)Дх, где a(Au) и /3(Дя) — функции, бесконечно малые (б.м.) при Аи40 и Дх -> 0 соответственно. Отсюда Ду = (/'(&) + в(Ди)) (*'(а) + /?(Дх)) Дх = = f'(b)g'(a) Ах + у Ах = AF. (2.14) Здесь AF — приращение сложной функции F(x) = f(g(x)), вызванное приращением Дх ее аргумента х, а у = f'(b)j3(Ax) + Так как Дад —► 0 при Дх ->• 0, то у является функцией, б.м. при Дх —> 0. Тогда (2.14) соответствует условию (1.15) определения 1.3 дифференцируемой функции. Таким образом, сложная функция F(x) = f[g(x)) дифференцируема в точке а,
44 2. ПРАВИЛА ДИФФЕРЕНЦИРОВАНИЯ ФУНКЦИЙ а из сопоставления (1.17) и (2.14) следует, что ее производная определяется формулой (2.13). ► Из доказанной теоремы следует правило дифференцирования сложной функции: производная сложной функции F(x) = у(и(х)) по независимому переменному х равна произведению производной функции у (и) по промежуточному аргументу и и производной промежуточного аргумента- и(х) по ж, т.е. | (2-15) Пример 2.1. Пользуясь правилом (2.15) дифференцирования сложной функции, найдем производные следующих функций. а. F(x) = s\n3x. Пусть у = и3 и и = sin ж, причем обе эти функции дифференцируемы. Согласно примерам 1.6 и 1.7 у'и = Зи2 и и'х = cosз. Производная у'и должна быть взята при u = sin ж, поэтому в итоге получим F'(x) = (sin3x)' = = 3(sinx)2cosx = 3sin2x -cosz. б. F(x) = 1п|ж|. Из примера 1.8 следует, что при х>0 функция In я имеет производную (In x)' = 1/х. Таким образом, при х > 0 F'(x) = 1/ж. Покажем, что эта формула верна и при х < 0. Для этого обозначим и = -х и у = In и. Тогда у'и = 1/и, и'х = -1 и, согласно (2.15), F'(z) = (1/(-ж))(-1)= 1/х. Итак, (1п|ж|)'=1/г при хфО. в. F(x) = 5cosa;. Функции у = 5й и и = cosx дифференцируемы, причем в силу примеров 1.7 и 1.8 у' = 5и\п5 и и'х = -sinz. В итоге, согласно (2.15), F'(x) = (5cosr)' = = (5cosxln5)(-sinx) = -5cosxsinx -In5. # Если сложная функция получена в результате нескольких суперпозиций, то ее производную следует искать последовательным применением правила дифференцирования сложной функции (его в связи с этим иногда называют цепным правилом). Это правило обычно применяют, не вводя в явном виде промежуточные аргументы.
2.2. Производная сложной функции 45 Пример, а. Пусть у = In2(я4 - 3~х). Тогда б. Для функции у = sin23x + cos7(x/5) - tg\/x2 +1 произ водная Лх / х\' у' = 2sin3x • (sin3a:)47cos6- • (cos-) - 5 V 5/ cos2\/a:2 + 1 COS^ V X1 + 1 о . а 7 • Х 6х х — 3sinox - -sin- -cos - - 5 5 5 v/i2TTcos2Vx2TT Разумеется, при некотором навыке отпадает необходимость в столь подробных выкладках, если, последовательно применяя цепное правило, промежуточные аргументы представлять мысленно. в. Пусть у = ух + \Jx-\-\fx. В этом случае г. Покажем, что функция у = хе~х I2 удовлетворяет уравнению ху' = (1 — х2)у (его называют обыкновенным дифференциальным уравнением первого порядка [VIII]). Сначала найдем производную заданной функции: = е-2/2
46 2. ПРАВИЛА ДИФФЕРЕНЦИРОВАНИЯ ФУНКЦИЙ Отсюда ху' = (1 — х2)хе~х /2 = (1 — х2)у} т.е. указанная функция обращает заданное уравнение в тождество. Пример 2.2. С помощью правила (2.15) дифференцирования сложной функции нетрудно найти производные гиперболических функций [I, 7.8] ех — е~х . ех + е~х shx chz h tha: = ——, cthz = h' =, chz =, tha: = , cthz = . 2 2 chz' shz С использованием результатов примера 1.8 получим (shx)' = = chx и а затем с учетом правила (2.8) дифференцирования частного двух функций и свойства гиперболических функций ch2x - — sh2£ = 1 найдем chx-chx — shx -shs 1 shx-shx — chx-chx 1 Пример 2.З. Рассмотрим показательно-степенную функцию [I, 9.5] y = uv (м>0),где и и v являются дифференцируемыми функциями аргумента х. После логарифмирования \пу = v\nu (2.16) и последующего потенцирования эту функцию можно представить в виде y = ev{nu. (2.17) Так как функции и и v дифференцируемы, в силу теоремы 2.2 сложная функция (2.17) также дифференцируема в тех точках я, для которых и > 0 и одновременно определена функция v. Продифференцируем обе части (2.16) по х: —у — v inu + v—u . У и
2.2. Производная сложной функции 47 Отсюда у' = y(u'v/u + t/ In tx), или после подстановки выражения для у получим U Впервые эту формулу вывел И. Бернулли. # Производную от натурального логарифма заданной функции называют логарифмической производной этой функции. Вычисление такой производной, называемое логариф' мическим дифференцированием, полезно использовать при нахождении производных произведения и частного, степенной, показательной и показательно-степенной функций. Пример. Применяя логарифмическое дифференцирование, найдем производные следующих функций. а. Пусть у = zsmx. Тогда In у = sin х • In x и далее у'/у = = cosx • lnx + (sinx)/x. В итоге (sin х \ bcosz-lna; ] = xsmr"1sinx-|-xsin;rcosa; -lnx. х ) б. Если у — (y/tgx)**1, то In у = (x + \)\ny/tgx или 21пу = (х + 1) In tgar. Отсюда -у =lntgz-f у tgrr cos^z и, наконец, У = - о \sin2x в. Пусть з/~о 1 - Ж . з 2 у = у/х1 rSin Ж -COS Ж. 1 + X2
48 2. ПРАВИЛА ДИФФЕРЕНЦИРОВАНИЯ ФУНКЦИЙ Используем замену z = ln|t/|. Тогда после логарифмирования получим z = ln|y| = (2/3)1п|х| + 1п|1 - х\ - 1п(1 + х2) + + 31п |sinx| + 21n|cosx|. С учетом примера 2.1,6 при условии, что уф О, найдем у1 У Окончательно ,/ (2 1 2 За: - О. 1 X 1 — X 1 Л х Лсовх sinx -2——2+3- 2 \+xl sinx cosx 1-fx2 sin3x • cos2x. 2.3. Производная обратной функции Теорема 2.3. Пусть функция у = }{х) в точке х = а имеет конечную и отличную от нуля производную f'(a) и пусть, кроме того, для нее существует однозначная обратная функция х = д(у), непрерывная в соответствующей точке у = = 6, где b = f(a). Тогда существует производная д'(Ь) и она равна < Дадим значению у = b приращение Ау. Тогда функция х = 9(у) тоже получит соответствующее приращение Ах. При Ау ф 0 в силу однозначности функции у = /(х) будет отлично от нуля и Ах. Поэтому допустимо рассматривать отношения 1 (2 Если теперь Ау -> 0, то и Ах -¥ 0 ввиду непрерывности функции х = д(у). Но тогда знаменатель в правой части (2.19) стремится к пределу f'(a) ф 0, т.е. существует конечный предел правой части (2.19), равный 1//'(а). Следовательно, существует конечный предел и левой части (2.19), в силу определения 1.2
2.3. Производная обратной функции 49 являющийся производной g'(b). Таким образом, обратная функция х = д(у) дифференцируема в точке 6 и ее производная в этой точке определяется формулой (2.18). ► Какова геометрическая интерпретация формулы (2.18)? Графики рассмотренных в этой теореме функций у = f(x) и х = д[у) в координатной плоскости хОу совпадают (рис. 2.2). Поэтому для углов а и ft наклона к осям координат касательной, проведенной к кривой графика в точке М(а; 6), справедливо равенство а + /3 = тг/2, и, согласно геометрическому смыслу производной (см. 1.4), У b ^ о /x=g(y) M a y=№ X Рис. 2.2 Пример 2.4. Используем (2.18) для нахождения производных обратных тригонометрических функций. а. Функция у = arcsinz (х е [-1,1], у € [—7г/2, тг/2]) является обратной к функции х = sin у, имеющей производную х' — cosy > 0 для всех у £ (•—тг/2, тг/2). В таком случае для всех а? € (-1, 1), согласно теореме 2.3, существует производная у', причем у = (arcsinx) = —- = = . = x1 cosy y/l-s\n2y 1 4-544
50 2. ПРАВИЛА ДИФФЕРЕНЦИРОВАНИЯ ФУНКЦИЙ Точки х = ±1, принадлежащие области определения функции у, исключены из рассмотрения, поскольку в соответствующих им точках у = ±7г/2 области значений этой функции х' = = cosy = 0. 6. Функция y = arctgz (z€R, у € (-*/% тг/2)) является обратной к функции х = tgy, которая для всех у € (-п/2, я"/2) имеет производную х' = l/cos2y > 0. Следовательно, для всех х € R в силу теоремы 2.3 существует производная у;, причем у' = (arctgx)' = I = cos'y = тт^ = ^5. Аналогично можно получить (arccosx)' = - Vx € (-1, 1), Vl -x2 (arcctgs)' = - т Vz e R. 1 + X* X* Пример, а. Найдем производную у'х функции у = arcsin(2x/(l + x X2 при \х\ < 1, 2 При |х| > 1. При \х\ = 1 производная не существует. б. Производная функции у = arcsin2\/l - х2 у' = 2arcsin \/\ - х2 — — ■==(-2х) = v/1 - (1 - х2) 2/П^ ; 2а: arcsin VW (x # 0, |х| ф 1)
2.4. Производная функции, заданной параметрически в. Для функции у = arctg(lnz) +In (arctgz) производная , 1 \_ 1 1 l + ln2z x arctgz 1+z2 г. Производная функции у = ln3arctg(z/7) (z > 0) , ftl о (х\ 1 1 1 211n2arctg(z/7) У arciS\,7; arctg(z/7) l+(a/7)2 7"(49+x2)arctg(z/7)' 2.4. Производная функции, заданной параметрически Пусть зависимость между х и у задана соотношениями z = : е (2.20) У = 2/(0 На координатной плоскости хОу любому значению ра £ из промежутка Т соответствует точка с координатами (х; у). При изменении t точка описывает некоторую кривую, а (2.20) являются параметрическими уравнениями этой кривой. Если функция х = x(t) имеет при t € Т обратную функцию t = t(x), то у можно представить как сложную функцию от х: у = f(x) = y(t(x)). Тогда говорят, что (2.20) задают функцию у = f(x) параметрическим способом [I, 3.2], и ее в таком случае называют параметрически заданной функцией. От явного аналитического способа задания функции в виде у = /(ж) к параметрическому способу можно перейти всегда, и не единственным образом. Например, для функции у = = ioge (х3 + 5) — 2 (х > — v/б) можно указать два эквивалентных варианта: » = 108 -2,
52 2. ПРАВИЛА ДИФФЕРЕНЦИРОВАНИЯ ФУНКЦИЙ Однако переход от параметрического способа задания функции к явному аналитическому не всегда возможен в классе элементарных функций. Например, в случае не удается исключить параметр t или выразить его в классе элементарных функций явно через х или у. Пусть в (2.20) функции x(t) и y(t) дифференцируемы в промежутке Т, причем x'(t) ^ 0 V£ € Т, и функция x(t) строго монотонна в этом промежутке, т.е. имеет обратную функцию t = £(z), определенную и дифференцируемую в промежутке X = х(Т). Тогда в промежутке X определена сложная функция у = f(x) = y(t(x)) = (yot)(x), которая удовлетворяет условиям теоремы 2.2 о производной сложной функции. Используя эту теорему вместе с теоремой 2.3 о производной обратной функции, получаем у'х = y'{t)t'{x) = y'(t)/x'{t) \ft € Т. Итак, производная параметрически заданной функции является, в свою очередь, функцией, параметрически заданной соотношениями ' teT. (2.21) Если в промежутке Т строго монотонна функция y(t) и y'[t) ф 0, то можно считать х функцией аргумента у и тогда t ет. Пример, а. Пусть заданы соотношения х = а[г- у = о(1 -cost), Функция x(t) является возрастающей на всем множестве R действительных чисел и имеет обратную функцию с областью
2.4. Производная функции, заданной параметрически 53 значений R. Поэтому на R определена функция у(х). Для нахождения ее производной сначала вычислим производные x'(t) = а(1 — cost) и y'(t) = asmt дифференцируемых на R функций x(t) и y(t). Тогда, согласно (2.21), *x x'(t) a(l-cos*) Поскольку x'(t) = 0 при t = 2ктг (к 6 Z), сложная функция y(t(x)) недифференцируема по х в точках х = 2акп. В итоге t х = a(t — б. Соотношения задают параметрически функцию у = /(я), определенную при а; > 0. Так как x'(t) = cect и y'(t) = —ce~cf, ее производная Ух = y'(t)/«'(O = -ce"c7(c6ct) = -€'2ct. Итак, / = -e~2ct ix — с » х = ect, в. Найдем угловой коэффициент касательной к параметрически заданной кривой fc в точке М(2; —1). Прежде всего определим значение £о параметра i, соответствующее заданной точке касания. Это значение должно одновременно удовлетворять двум уравнениям
54 2. ПРАВИЛА ДИФФЕРЕНЦИРОВАНИЯ ФУНКЦИЙ Корни первого уравнения t\ = 2, t2 = -5, а второго — t\ = = 2, £2 = — 1- Следовательно, заданной точке М кривой соответствует значение to — 2. Теперь найдем угловой коэффициент касательной в точке Л/, равный значению производной у'х сложной функции y(t(x)) при х = 2: Ух\х=2 = X'(t) At -2 t=2 t=2 6 7 г. Уравнение /о(<р) = a^/cos2v? (y> £ [-я"/4, ^/4]) в полярных координатах задает кривую, называемую лемнискатой. Докажем, что касательная к лемнискате в точке, соответствующей значению <р = тг/6, параллельна оси Ох. Для этого перепишем уравнение лемнискаты в параметрическом виде х(<р) = pcos<p = ay/cos2<p cos<p, e [-т/4, 7Г/4]. = ay/cos2<p sin Отсюда x'((p) = a ( (- sin 2(p) cosy? + v/cos2<^(-sinv?) 1 = \ycos2^? / = —a , = —a '{чр) = a( . \ \/co os 2(p —sin2y?)sin<,o-h y/cos2^p cosip) = ) cos 2(p -cosy?- sin 2</?- sin (p cos3y> = a , = a- Значению <p = л*/6 соответствуют значения х(тг/6) = ау/Е/4, у(п/6) = ау/2/4 и ж/(тг/6) = -а%/2^0, у^тг/б) = 0. Действительно, касательная к лемнискате в точке (о\/б/4; ау/2/4) параллельна оси Ох, поскольку, согласно (2.21), производная
2.5. Дифференцирование неявных функции 55 2.5. Дифференцирование неявных функций Пусть значения двух переменных а: и у связаны уравнением F(«, у) = 0. (2.22) Если функция у = /(я), определенная в некотором промежутке, такова, что подстановка ее в (2.22) вместо у обращает (2.22) относительно х в тождество, то говорят, что (2.22) задает функцию у = f(x) неявным аналитическим способом [I, 3.2]. Такую функцию называют неявной. Этот термин отражает не характер зависимости у от х, а лишь способ ее задания. Для вычисления производной неявно заданной дифференцируемой функции следует продифференцировать обе части (2.22) по ж, используя правило (2.15) дифференцирования сложной функции, и затем решить полученное уравнение F'x{x, f(x)) = 0 относительно y' = f'(x). Пример, а. Уравнение х2 + у2 = R2 (2.23) неявным способом задает две элементарные функции fx(х) = y/R2 - х2 и которые при у ^ 0 и у ^ 0 соответствуют двум полуокружностям радиуса R. Дифференцируя (2.23) по ж с учетом правила дифференцирования сложной функции, получаем 2х + 2уу' = 0. Отсюда при у ф 0 найдем у' = —х/у. Таким образом, в данном случае удалось найти производную у', не устанавливая явной зависимости у от х. 6. Пусть функция у = }(х) задана неявно уравнением In х + е~у1х = С, С = const.
56 2. ПРАВИЛА ДИФФЕРЕНЦИРОВАНИЯ ФУНКЦИЙ Продифференцируем его по ж, считая у функцией х: I _ е-»/.. K^fM = о. X X1 Отсюда х - у'хе~у1х 4- уе~у/х = 0, или у' = еу/х + у/х. в. Дифференцированием уравнения ж2/3 4- у2^3 = а2/3 (а = = const), задающего неявным способом функцию у = /(ж), найдем Отсюда искомая производная у' =-(у/ж)1/3 при условии г. Точка М(1; 1) лежит на кривой, заданной уравнением ж2 + 5ху + у2 — 2х 4- у — 6 = 0. Найдем угловой коэффициент касательной к кривой в этой точке. Для этого продифференцируем уравнение по х: 2х + Ъу + 5ху' 4- 2уу' - 2 + у' = 0. Полагая х = 1 и у = 1, найдем значение производной в заданной точке г/'|(1; 1) = —5/8, равное искомому угловому коэффициенту касательной. д. Найдем уравнения касательной и нормали к кривой, заданной уравнением 4х3 - Зху2 -f 6х2 - 5ху - 8у2 + 9х + 14 = 0, в точках с абсциссой х = -2. Сначала определим ординаты возможных точек касания на кривой, для чего подставим значение ж =-2 в уравнение: -32 + 6у2 + 24 + 10у-8у2- 18 + 4-14 = 0, или у2 - 5у 4- 6 = 0. Корнями квадратного уравнения будут ординаты у\ = 2 и уг = 3. Итак, имеем две точки Mi (-2; 2) и М2(-2; 3). Теперь продифференцируем уравнение кривой по х: 12х2 - Зу2 - бхуу' + 12х - 5у - 5ху' - 16уу;4-9 = 0. Отсюда производная неявно заданной функции , _ 12х2 - Зу2 4- 12х - 5у + 9 6ху4-5х4-16у Значения производной в точках М\ и М2 равны у[ = —11/2 и у2 = -9/2 соответственно. Согласно (1.10) и (1.11), получим уравнения касательной и нормали в этих точках, а именно: в
2.6. Основные правила и формулы дифференцирования функции 57 точке Mi(-2; 2): для касательной 11 или для нормали или у2 а в точке М2(-2; 3): для касательной или для нормали 2 у-3 = -(х + 2), или 2я-9у-31 = 0. 9 е. Точка движется по кубической параболе 12у = х3. Какая из ее координат изменяется быстрее? Дифференцируя обе части заданного уравнения по времени t, получим соотношение между скоростями у[ и х\ ординаты у и абсциссы х движущейся точки: 12y{ = 3x2xJ, или у[/х[ = х2/4. Таким образом, при х — ±2 отношение y't/x't = 1, т.е. в точках (2; 2/3) и (—2; —2/3) кубической параболы скорости изменения координат движущейся по ней точки равны. Между этими точками (при -2 < х < 2) 0 ^ y't/z't < 1, т.е. скорость изменения ординаты меньше скорости изменения абсциссы, а вне этих точек (при |х| > 2) у[/х\ > 1, т.е. ордината движущейся точки меняется быстрее ее абсциссы. 2.6. Основные правила и формулы дифференцирования функций Пусть и(х) и v(x) — функции, дифференцируемые в точке х, а /(и) — функция, дифференцируемая в точке и. Далее обозначение аргументов у функций почти везде опустим.
2. ПРАВИЛА ДИФФЕРЕНЦИРОВАНИЯ ФУНКЦИЙ Основные правила дифференцирования у = Си y = u±v y = uv »=/(«). (С = const) »*0) и = u(x) у' = Си'. y' = u'± у' = u'v H u'u- У у' = /' ttJ v'. Vuv'. -uv' )2 »=/(*), X = /">(») 4 t = x(t) Производные элементарных функций 1. (C)' = 0 (С = const). 2. при 5=1/2 (^^.^. при s= -1 ( - I = --о-и'. 3. (a^J^a^lna-w' (a > 0, аф\), = eu • u1. 4. (loga u)' = -r— -u' (a > 0, о # 1) ulna (In t*V = i • w'. и
Вопросы и задачи 59 5. (sinu)' = cosu-u'. 11. (arctgu)' = 6. (cosu)'=—smu-u'. 12. (arcctgu)' = — ; 1 + w 7. (tzu)' = —=-•*'. 13. 8. (ctgtt)' = =— -u'. 14. (chit)' = sh u-u'. sin z и 9. (arcsin u)f = . =-u. 15. (thtt)' = Vl ~vr 10. (arccostt)'=— -u'. 16. Вопросы и задачи 2.1. Пользуясь правилами дифференцирования, найти производные следующих функций: a) t/ = 2*3 + 3s-5; б) у = у/х + 1/{2у/ 10 в) 2/=(2х2+х+1)/(ж2-х+1); г) у=(ж д) у = (cosx-|-sina;)/(l — cosx); e) t/ = ex ж) у = 2ех + \пх; з) у = 2xln(2x + \/4х2 4-1) - \/4а;2 + 1; и) у = tgx + ctgx-5r; к) у— ^/xarccosx-f21og2x-fex/x2; л) у = Incos(arctgsh2x); м) у = In ^ у = (1+ xz)/(vx4sin x); о) у = (ex-|-sinx)/(xex); п) у = In sin x; p) у = arctg\/e^— \/e^ 4-er arcsin 2.2. Составить уравнения касательной и нормали к кривой: а) у = х3 - Зх + 2 в точке (2; 4); б) у = х4 + Зх2 - 16 в точке пересечения кривой с параболой у = 3х2. 2.3. На кривой у = х3-Зх + 5 найти точки, в которых касательная: а) перпендикулярна прямой у = — х/9; б) образует с положительным направлением оси Ох угол 45°.
60 2. ПРАВИЛА ДИФФЕРЕНЦИРОВАНИЯ ФУНКЦИЙ 2.4. Выяснить, в какой из точек х скорость изменения значения функции f(x) = Зх5 - 15x3-f5x — 7 наименьшая. 2.5. Тело массой га движется прямолинейно в соответствии с законом s = — \+\n(t + l) + (£+ I)3. Вычислить кинетическую энергию тела в момент времени t = 1. 2.6. Написать уравнение нормали к параболе у = х2 + 4х + 1. перпендикулярной к прямой, соединяющей начало координат с вершиной параболы. 2.7. Под каким углом кривая у = ех пересекает ось Оу ? 2.8. Найти производные функций: а) у = ch5x-sh(x/3); б) у = cth(tgx) - th(ctgx); в) у = arccos(thx); г) у = sh2a:34-ch3x2; д) у= \/l+sh24z; е) у = es^ax/(shbx -chbx); ж) t/ = lnchar; з) у = arcsin(thar); и) у = 2\/спх - 1; к) г/ = In cos \/arcsin 3~2ar (x>0); л) у = yarctg s/cosln3z. 2.9. При помощи логарифмического дифференцирования найти производные функций: а)у = (совх)""*; б)у={/-=^Ц в) у= "^ 1-sinx 2.10. Показать, что /(тг/4) - 3/;(тг/4) = 3, если /(х) = = (cos2x)/(l -hsin2x). 2 2.11. Показать, что функция у = (х - е х )/(2х2) удовле- творяет уравнению ху' + 2г/ = е~х + 1/(2х). 2.12. Плот подтягивают к берегу озера при помощи каната, наматываемого на ворот со скоростью 3 м/мин. Ворот расположен на берегу выше поверхности воды на 4 м. Найти скорость движения плота в тот момент, когда его расстояние от берега будет 25 м.
Вопросы и задачи 61 2.13. Искусственный спутник Земли движется вокруг нее по эллиптической орбите. Уравнение этой орбиты в полярных координатах с полюсом в центре Земли имеет вид г(у>) = s= а(1 + е)/(1 + ecos<^), где a — наименьшее расстояние спутника от центра Земли, е — эксцентриситет орбиты. Найти скорость г изменения расстояния г спутника от центра Земли при значениях полярного угла <р = 7г/2 и 37г/2, учитывая закон Кеплера о постоянстве секториальной скорости тела, движущегося в центральном поле тяготения, т.е. считая в равенстве г2ф = С константу С заданной. 2.14. Может ли существовать производная у'х функции у = f(g(x)) в точке х = а, если в этой точке и соответственно в точке b = g(a): а) обе функции z = g(x) и f(z) недифференцируемы; б) д(х) дифференцируема, a f(z) недифференцируема; в) д(х) недифференцируема, a f(z) дифференцируема? 2.15. Построить пример функции г/ = /(х), для которой в точке х = а не существуют у' и (у2)', но существует (у3)7. 2.16. Показать, что в окрестности точки х = 0 функция t/ = /(x) = z3 + 3z имеет обратную функцию х = f ~1 (у) = (р(у), и найти производную ^ 2.17. Что можно сказать о производной f'(b) функции f(y), обратной функции у = х3 - Зах2 + Ъа2х - а3 + Ь ? 2.18. Вычислить в точке х = 0 производную функции - 1000). 2.19. Можно ли утверждать, что функции f(x) = u(x) + -fu(z) и д(х) = u(x)v(x) не имеют в точке а производных, если в этой точке: а) и(х) дифференцируема, a v(x) недифференцируема; б) обе функции и(х) и v(x) недифференцируемы? 2.20. Выведите формулы (2.10) и (2.12).
62 2. ПРАВИЛА ДИФФЕРЕНЦИРОВАНИЯ ФУНКЦИЙ 2.21. Какие условия теоремы 2.3 о производной обратной функции не выполнены на концах отрезка [-1, 1] при вычислении производных функций arcsinx и arccosx? 2.22. При каком значении параметра а парабола у = ах2 касается логарифмической кривой у = In x ? 2.23. Бели и(х) и v(x) — дифферецируемые функции и и(х) > и(х), то верно ли неравенство и'(х) > v'(x) ? Справедливо ли обратное? 2.24. Исследовать дифференцируемость функций: arcsin(cosx), л/sinx2, ^/(Ц-е1/1), yl-e""x2, |ln|x||. 2.25. Вывести формулы для сумм S\ = 1 + 2х + Зх2 + ... -f + пхп-х и 52= l+4x + 9x2 + ...-f п2хп"1. 2.26. Доказать, что два семейства парабол у2 = 4а(а - х), а > 0, и у2 = 46(64-х), 6 > 0, образуют ортогональную сетку, т.е. кривые из этих семейств пересекаются под прямыми углами.
3, ДИФФЕРЕНЦИАЛ 3.1. Определение дифференциала и его геометрический смысл Пусть функция у = /(х) определена в некоторой окрестности точки а и дифференцируема в этой точке. Тогда, согласно определению 1.3 дифференцируемости функции, ее приращение, вызванное приращением Дх = х — а в этой окрестности аргумента х, можно представить в виде Ду = f(x) - f(a) = ААх + /3(Дх)Дх, (3.1) где А — некоторое число, не зависящее от Дх, а /3(Дх) — функция, бесконечно малая (б.м.) при Ах —► 0. Если А ф 0, то при Ах -> 0 величина ААх является б.м. первого порядка относительно Дх, а (З(Ах)Ах — б.м. более высокого порядка по сравнению с Ах [I, 10.1]. Тогда ААх в (3.1) будет главной частью [I, 10.3] Ду, причем линейной относительно Дх, т.е. пропорциональной приращению аргумента. Определение 3.1. Дифференциалом функции у = /(х) в точке а, соответствующим приращению Дх аргумента х, называют главную (линейную относительно Дх) часть приращения Ду этой функции. Обозначают дифференциал dy или rf/(a), т.е. с учетом (3.1) dy = df(a) = ААх. В силу теоремы 1.1 о необходимом и достаточном условии дифференцируемости функции А = f'(a). Поэтому дифференциал в точке а dy = f(a)Ax. (3.2) Если /'(а) = 0, то f'(a)Ax не является главной частью приращения Ау, поскольку /3(Дх)Дх в (3.1), вообще говоря,
64 3. ДИФФЕРЕНЦИАЛ отлична от нуля. В этом случае полагают dy = 0 и (3.2) сохраняет силу при любом конечном значении производной Пример, а. Площадь 5 = 7гг2 круга радиуса г при увеличении радиуса на Дг увеличится на площадь кольца, заключенного между концентрическими окружностями радиусов г и г + Аг. Из выражения для приращения площади круга AS = тг((г + Аг)2 - г2) = 2тггДг + 7г(Дг)2 следует, что главной частью приращения AS при А г —> О будет 2лтДг. Это и есть дифференциал dS площади круга. Геометрически он соответствует площади прямоугольника с основанием, равным длине окружности 2тгг, и высотой Аг. 6. При свободном падении материальной точки по закону s = gt2/2 (g — ускорение земного тяготения) за промежуток времени At между моментами времени t и t + At она пройдет путь As = g(t + At)2/2 - gt2/2 = gtAt + g{At)2/2. При Ay -> 0 главной частью As будет дифференциал пути ds = gtAt. Таким образом, в данном случае дифференциал пути ds, приближенно заменяющий приращение пути As, равен расстоянию, пройденному точкой за промежуток времени At, двигающейся равномерно с постоянной скоростью v = gt. Для иллюстрации геометрического смысла дифференциала dy и его связи с приращением At/ функции у = f(x) вернемся к рис. 1.6. Из прямоугольного треугольника МКК\ находим A'A'i = МК • tge* = f'(a)Ax = dy. Итак, дифференциал функции в точке а, соответствующий приращению Ах аргумента х, равен приращению ординаты касательной к кривой графика функции у = f(a) в точке
К F N С D X ш Лх g 3.1. Определение дифференциала и его геометрический смысл 65 М(а; /(а)) при переходе от точки М к точке К\. Сопоставляя (3.1) и (3.2), видим, что М\К\ = Ay — dy = /?(Дх)Дж. Различие между величинами Ду и dy можно наглядно показать на примере функции у = х2, которая определяет площадь квадрата ABCD со стороной х (рис. 3.1). Придав х приращение Ах, получим квадрат AEFG со стороной х + Ах и площа- дью (х + Дж)2. Тогда приращение Ду = (я + Ах)2- х2 = 2а;Аж + -f (Ах)2 функции геометрически представляет собой сумму площадей прямоугольных полосок BEFN и DCNG. Дифференциал dy = 2хАх функции у = х2 в точке х соответствует площади полосок ВСКЕ и DCNG, а разность Ау - dy = (Ах)2 — площади заштрихованного на рис. 3.1 квадрата CKFN. Из рис. 1.6 и 3.1 следует, что чем меньше Ах, тем меньше различие между величинами Ау и dy. Для аргумента х дифференциал отождествляют с его приращением Ах, т.е. полагают dx = Ах. Так, для функции у = х с учетом (3.2) имеем dy = у^Ах = 1 • Ах = Ах и, поскольку у = х, получим dx = Ах. Учитывая это соотношение, вместо (3.2) запишем dy = /'(a)dx, а для произвольной точки х — Рис. 3.1 dy = f'(x) dx = y'dx. (3.3) Отсюда следует /'(х) = у' = dy/dx. Выражение в правой насти этого равенства теперь можно трактовать не как единый символ производной, а как отношение двух дифференциалов. Поскольку дифференциал dy функции у = /(х) отличается от производной у' лишь сомножителем rfx, для вычисления дифференциалов можно использовать правила дифференцирования и формулы производных элементарных функций 5-544
66 3. ДИФФЕРЕНЦИАЛ (см. 2.6). Так, первым четырем строчкам таблицы правил дифференцирования будут соответствовать правила вычисления дифференциала: 1. 2. 3. л t±. У У У Л а У = Си = и± = UV и V (С = const) [v ^ и; dy = Cdu. dy= du±dv. dy = udv + vdu. . vdu —udv ay — 7 vl Действительно, например, для дифференциала произведения дифференцируемых функций и(х) и v(x): d(uv) = (uv)'dx=: = (u'v + uv')dx = vu'dx + uv'dx = vdu + udv. 3.2. Дифференциал сложной функции. Инвариантность формы записи дифференциала Правило дифференцирования сложной функции позволяет получить одно весьма важное свойство дифференциала. Пусть у = у(х) — дифференцируемая функция независимого аргумента х. Тогда, согласно (3.3), дифференциал этой функции в точке х dy = yf(x)dx. Пусть теперь у = f(u) — дифференцируемая функция аргумента иу который, в свою очередь, является дифференцируемой функцией аргумента ж, т.е. и = и(х). Тогда сложная функция у(х) = f(u(x)) будет дифференцируемой функцией аргумента х. Для дифференцируемых функций у(х) и и(х) как функций независимого аргумента х можно записать dy = y'(x) dx и du = u'(x) dx. (3.4) Но по правилу (2.15) дифференцирования сложной функции у'(х) = ff(u)u'(x). Подставив это выражение в первую формулу (3.4), с учетом второй формулы (3.4) получим = f'{u)u'(x)dx = f'(u)du при
3.2. Дифференциал сложной функции 67 те. в итоге пришли к первоначальной форме записи вида (3.3) 1 но теперь для случая, когда аргумент и не является независимым. Иначе говоря, форма записи дифференциала не зависит от того, является ли аргумент функции независимым йли же дифференцируемой функцией другого аргумента. В этом и состоит свойство инвариантности (неизменности) формы записи дифференциала. Из этого свойства следует, что производная ух всегда может быть выражена отношением дифференциалов dy и dx вне зависимости от того, является ли х независимым аргументом или функцией другого аргумента. Важно лишь, чтобы оба эти дифференциала были вычислены по одному и тому же переменному, принятому за независимое. Благодаря этому нетрудно получить правило (2.21) дифференцирования функции, заданной параметрическим способом. Действительно, пусть функции x = x(t) и y = y(t) дифференцируемы в точке t. Тогда dy = y'(t)dt и dx = x'(t) dt. Если x'(t) ф О, то в некоторой окрестности точки t соотношения (2.20) задают дифференцируемую функцию y = f(x). Соответствующее точке t значение производной ух = dy/dx = y'{t)/x'{t) этой функции отвечает значению х = x(t) в той же точке t. Таким образом, производная ух является функцией а;, заданной параметрически соотношениями Ух x'(t)' х = x(t), Нто согласуется с (2.21). Пример. В развитие примера 1.5 предположим, что при вагреве тела фиксируются зависимости от времени t температуры T(t) этого тела и затрачиваемого на нагрев количества теплоты Qf(t). По физическому смыслу эти зависимости 5»
68 3. ДИФФЕРЕНЦИАЛ являются непрерывными и при некоторых определенных условиях — дифференцируемыми функциями. Тогда теплоемкость тела при некотором заданном знамении температуры может быть найдена как производная Qj — Q'(t)/T'{t)^ вычисленная в тот момент времени fc, когда температура тела достигает этого заданного значения. 3.3. Использование дифференциала в приближенных вычислениях Из определения 3.1 дифференциала следует, что дифференциал функции у = f(x) в точке а является при Да; —V О бесконечно малой функцией, эквивалентной приращению Ау этой функции (при условии, что /'(а) ф 0). Это позволяет полагать Ау « dy с тем большей точностью, чем меньше приращение Ах аргумента ж, или подробнее Ау = Д/(о) = /(а + Да) - f(a) « /'(а)Да? (3.6) с погрешностью /3(Ах)Ах = о(Ах). Удобство замены приращения Ау функции ее дифференциалом dy состоит в том, что dy зависит от Ах линейно, тогда как Ау представляет собой обычно более сложную функцию от Ах. Если положить х = а + Ах и Ах = х - а, то из (3.6) следует Дх)«/(а) + /'(а)(х-а). (3.7) Таким образом, для значений я, близких к ,а, функция f(x) в (3.7) заменена линейной функцией. Геометрически это соответствует замене участка кривой графика у = f(x) около точки (а; /(а)) отрезком касательной к кривой в этой точке (уравнение касательной у = f(a) + f'{a)(x — а)). В этом случае говорят, что функцил у = }{х) линеаризована относительно точки (а; /(а)) (или линеаризована в окрестности точки а).
Д.3.1. Оценка погрешности приближенных вычислении 69 В частном случае a = 0 (3.7) переходит в приближенную формулу Подставляя сюда вместо f(x) различные элементарные функции, можно получить ряд приближенных формул для близких к нулю значений х: + x)«x, « l+sx (в частности, \Л + х« 1 + х/2), (3.8) согласующихся по форме с соотношениями для эквивалентных при х —¥ 0 бесконечно малых функций. Пример. Вычислим приближенно значения е0'1, In 1,25 и v/ТбД Согласно (3.8), для функции ех при х = 0,1 имеем е0'1 « 1,1, а для функции 1п(1+х) при х = 0,25 получим In 1,25 «0,25. В третьем случае сначала преобразуем ^/16,3 = 4-^/1 + 0,3/16 = = 4-у/1 + 0,01875, а затем используем приближенную формулу (3.8) для функции у/1 + х при х = 0,01875: 4^/1 + 0,01875» «4(1+0,01875/2) = 4,0375. Дополнение 3.1. Оценка погрешности приближенных вычислений В прикладных задачах аргумент х функции /(ж) известен приближенно. Обозначим через а приближенное значение аргумента, а через Ах — его наибольшую абсолютную погрешность. Положим z = a + dz, причем \dx\ < Ах. Тогда абсолютную погрешность замены значения дифференцируемой в точке а функции f(x) ее приближенным значением f(a) можно оценить с учетом (3.6), пренебрегая бесконечно малой более высокого порядка по сравнению с dx при dx —> 0, по формуле \f(x) - f(a)\« \f'(a)dx\ = |/'(a)| • |*r| < \f'(a)\A x,
70 3. ДИФФЕРЕНЦИАЛ если производная ff{a) / 0. Примем в качестве приближенной оценки наибольшей абсолютной погрешности такой замены Д, = тах|/(х) - /(о)|« |/'(а)|Дх. (3.9) Тогда, учитывая выражение для логарифмической производной, получим приближенную оценку наибольшей относительной погрешности значения функции f(x) в точке а (при условии, что /(а)фО) ^ ~- (ЗЛ0) Пример, а. Табличное значение экспоненциальной функции f(x) = ех при х = а = 2,29 с четырьмя знаками после запятой еа = е2'29 = 9,8749. Однако если значение а известно с точностью, характеризуемой наибольшей абсолютной погрешностью Дг = 0,01, то, согласно (3.9), Д/ « |/'(а)|Дх = еаАх = = 9,8749 • 0,01« 0,1 ив значении еа нецелесообразно удерживать более одного знака после запятой, т.е. следует в данном случае написать еа « 9,9. 6. Если нужно найти объем V куба с относительной погрешностью не более 6/ = 0,0\у то из (3.10) следует, что длину его ребра нужно измерить с абсолютной погрешностью не более Д*«*//|(1п|/(я)|)'|х=в. Поскольку V = f(x) = х3 и при х-а (1п|/(ж)|)/ = 3а2/а3 = 3/а, имеем Дх«0,01/(3/а)» « 0,0033а, а относительная погрешность при измерении длины ребра куба должна быть не более 8Х = Дх/а = S//3 « 0,0033. # Для показательно-степенной функции f(x) = (u(x))vW (см. пример 2.3) при и(х) > 0 df v . /. ч . --- = -du+ (\nu)dv и при условии v(x) ф 0 оценка наибольшей относительной погрешности f du и dv V (3.11)
Д.3.1. Оценка погрешности приближенных вычислении 71 где Su и Sv — наибольшие относительные погрешности вычисления функций и(х) и v(x) соответственно. В частном случае задания точного значения v(x) = s = const ^ = 0 и для функции /(ж) = (и(х))а, согласно (1.14), 6/ = \s\6u. При и(х) = х для степенной функции f(x) = х8 Su = 6Х ^ и 5 . (3.12) Например, наибольшие относительные погрешности квадрата х2 и квадратного корня у/х вдвое больше и вдвое меньше соответственно, чем у числа ж, а наибольшие относительные погрешности .числа х ф 0 и обратного ему числа 1/х совпадают. Бели задано точное значение u(x) = a = const ^ 0, то в (3.11) 5U = 0 и для функции f(x) = av(x) получим = \v\ • llna^t, = Av|Ina|. При v(x) — x придем к показательной функции f(x) = а1, для которой = Ax|lna|, а в частном случае экспоненциальной функции (а = е и In a = = 1) = Ax. (3.13) Поскольку логарифмическая функция д(х) = \пх является обратной по отношению к экспоненциальной, получим Ад — 8Х. Пусть функция f(x) является линейной комбинацией дифференцируемых функций fk(х) при к = 1, т, т.е. m причем коэффициенты с* считаем заданными точно. Тогда, согласно (2.12), в силу того, что дифференцирование является
72 3. ДИФФЕРЕНЦИАЛ линейной операцией, т к=\ и в качестве оценки Д/ наибольшей абсолютной погрешности вычисления функции /(х) можно принять с учетом |</Д(х)| ^ т (3.14) где Ak — наибольшая абсолютная погрешность вычисления функции Д(ж). Если абсолютная погрешность вычисления функции f(x) ограничена заданным значением Ду, то наиболее жесткие требования по точности следует предъявить к значению Д(х) той функции, которой соответствует наибольшее значение |cjt|, и наоборот. В том случае, если труднее всего обеспечить точность измерения или вычисления значения /п(я), а значения остальных функций Д (х), кфп, можно найти со сравнительно высокой точностью, т.е. их наибольшая абсолютная погрешность достаточно мала, требования к наибольшей абсолютной погрешности Дп функции /п(я) следует подчинить условию Дп ^ Ду/|сп|. Если же нет жестких ограничений на точность нахождения значений любой из функций Д(х), к = 1, ш, то целесообразно использовать принцип равных влияний, полагая в правой части (3.14) все слагаемые одинаковыми. Тогда Л (3.15) т\ск\ В силу (3.14) наибольшая абсолютная погрешность алгебраической суммы равна сумме наибольших абсолютных погрешностей слагаемых и не может быть меньше, чем наибольшая абсолютная погрешность наименее точного из слагаемых алгебраической суммы. Поэтому для упрощения вычислений более точные слагаемые следует округлять, сохраняя в них один
Д.3.1. Оценка погрешности приближенных вычислении 73 лишний (запасной) десятичный знак по отношению к последнему верному знаку в наименее точном слагаемом, а затем полученную алгебраическую сумму округлить еще на один знак. Пусть теперь при Uk(x) > О, к = 1, п, л В этом случае f(x) > 0 и после логарифмирования п A:=l согласно (3.14), получим п Здесь Ajt — наибольшая абсолютная погрешность вычисления значения функции \пиь(х). Поскольку наибольшая абсолютная погрешность логарифмической функции равна наибольшей относительной погрешности аргумента этой функции, т.е. А\п/ = 8/ и Д* = £*, где 6к — наибольшая относительная погрешность вычисления значения функции и*(я), в итоге можно написать п (3.16) Jt=l Таким образом, с учетом (3.12) наибольшая относительная погрешность произведения равна сумме наибольших относительных погрешностей сомножителей и не может быть меньше, чем наибольшая относительная погрешность наименее точного из сомножителей. Поэтому для упрощения вычислений более точные сомножители следует округлять, сохраняя в них одну лишнюю (запасную) значащую цифру по сравнению с количеством верных значащих цифр в наименее точном сомножителе,
74 3. ДИФФЕРЕНЦИАЛ а затем в полученном произведении сохранить такое же количество значащих цифр, как и в наименее точном сомножителе. Пример. Даны приближенные числа х\ = 0,348; х2 = = 345,40; х3 = 235,2; х4 = 2,2849; хъ = 0,00354. Пусть все десятичные знаки в этих числах верные, т.е. абсолютная погрешность каждого числа не превышает половины единицы младшего разряда. Наибольшая абсолютная погрешность Аз = 0,05 у числа а?з, а наименьшая As = 0,000005 — у числа а?5, тогда как наибольшая относительная погрешность #1 = 0,0005/0,348 = 0,00144 у числа xi, а наименьшая 62 = = 0,005/345,40 = 0,0000145 — у числа х2. При сложении заданных чисел (с учетом одного запасного знака) их следует округлить до 0,01 и после вычисления суммы S = 0,35+ 345,40+ 235,2+ 2,28+ 0,00 = 583,23 округлить ее до 0,1, записав S = 583,2. Для оценки наибольшей абсолютной погрешности As полученного результата к наибольшей из абсолютных погрешностей складываемых чисел (Аз = 0,05) следует добавить погрешность округления суммы 0,03, т.е. As = 0,08, что, строго говоря, заставляет считать сомнительным последний знак числа 5 = 583,2. Отметим, что наибольшая относительная погрешность 8s = As/S = 0,08/583,2 = 0,000137 близка к относительной погрешности 8^ = 0,05/235,2 = 0,000213 слагаемого х3 с наибольшей абсолютной погрешностью. При небольшом числе слагаемых (до десяти) непосредственная оценка наибольшей абсолютной погрешности по (3.14) при с* = 1 обычно незначительно отличается от полученной выше: А5 = 0,0005 + 0,005 + 0,05 + 0,00005 + 0,000005 = 0,055555. При перемножении заданных чисел их следует округлить до четырех значащих цифр, сохранив одну запасную по сравнению с наименее точным сомножителем х\ — 0,348, и после вычисления произведения Я = 0,348 • 345,4 • 235,2 • 2,285 • 0,00354 = 228,68008 округлить его до трех значащих цифр: П = 229.
Д.3.1. Оценка погрешности приближенных вычислений 75 Поскольку относительные погрешности сомножителей х\ = = 0,348 (<$! = 0,00144) и хъ = 0,00354 (^ = 0,000005/0,00354 = = 0,00141) заметно превосходят относительные погрешности остальных сомножителей, наибольшую относительную погрешность произведения можно оценить как сумму dU — 0,00144 -f + 0,00141 = 0,00285, что даст оценку для наибольшей абсолютной погрешности произведения Ля = \п\6п = 229 • 0,00285 = 0,65, значение которой оправдывает округление полученного результата до трех значащих цифр. Учет относительных погрешностей остальных сомножителей в соответствии с (3.16) при Sk = 1 лишь незначительно влияет на оценку наибольшей относительной погрешности произведения (при числе сомножителей не более десяти): 5П = 0,00144 + 0,0000145 + 0,000213 + + 0,00005/2,2849 +0,00141 = 0,0031. # Ясно, что (3.16) можно применить и для частного функций. Например, функцию f(x) = ex/xs при х > 0, sGR можно представить в виде f(x) = (u\(x))Sl (u2(z))S2, где щ(х) = ех, Si = 1; U2(x) = ж, «2 = s. Тогда, согласно (3.16), с учетом (3.13) получим ?/ = *! + М*2 = \х\*х + \8\6Х = (1 + \S/X\) Д*. Если относительная погрешность вычисления функции f(x) ограничена заданным значением <$/, то при определении допустимой относительной погрешности сомножителей можно руководствоваться теми же соображениями, что и при нахождении допустимой абсолютной погрешности слагаемых алгебраической суммы. Пример. При определении вместимости V = чтЯ?И цилиндрического сосуда, радиус R и высота Н которого могут
76 3. ДИФФЕРЕНЦИАЛ быть измерены с достаточно высокой точностью, можно воспользоваться принципом равных влияний. Тогда при условии, что число тг можно взять практически с любым количеством верных значащих цифр (т.е. приняв Sv = 0), согласно (3.16) получим наибольшую относительную погрешность вычисления вместимости сосуда 8у =26ц + 6ц и по аналогии с (3.15) при тп = 2 найдем 8R = 8v/(2 -2) = 8у/4 и 8Н = 8у/(2 • 1) = 8v/2. Однако внутренний радиус цилиндрического сосуда обычно удается измерить с меньшей точностью (с большей относительной погрешностью), чем его глубину от кромки боковой стенки до дна. Пусть 8r = 28ц- Тогда 8у = 28ц + 8н = 5<$#, 8ц = 8у /5 и 8ц = 28у/Ъ. Выбор количества верных знаков в числе 7Г зависит от заданного значения 8у. При <5v =0,01 трех верных знаков (7г = 3,14) будет недостаточно, поскольку тогда относительная погрешность А^/тт = 0,0016/3,14 = 0,00051 сопоставима с Sfj = 0,002 и 8ц = 0,004. Но при четырех верных знаках относительной погрешностью Л7Г/7Г = 0,0004/3,142 = 0,00013 можно уже пренебречь по сравнению с 8и и 8r. Вопросы и задачи 3.1. В какой точке дифференциал dy и приращение Ау функции у = я2-f я +1 не являются эквивалентными бесконечно малыми при Ах -> 0 ? Какой порядок в этой точке имеет при Ах —> 0 бесконечно малая Ay-dy? Дать геометрическую интерпретацию. Для функции f(x) = х2 найти А/(2) и df(2) в точке х = 2 и сравнить их, если Ах = 1; Ах = 0,1 и = 0,01. 3.2. Для функции f(x) = х3 - 2х + 1 сравнить значения Д/(1) и df(l) при: а) Д* = 1; б) Да: = 0,1; в) Ах = 0,01. 3.3. Найти дифференциалы следующих функций : а) хех\ б) ех + \пх; в) у/х + 2\/х + у/х\ г) arccose*; д) х~ ,х
Вопросы и задачи 77 е) In (>/1 + 2sinх + V2sinx - 1); ж) 5sh7(x/35) + 7sh5(z/35). 3.4. Какой порядок при Ах —> 0 имеет бесконечно малая функция Ау — dy, если у = я3 - Зж ? 3.5. Выразить через du и du дифференциалы следующих функций: a) u2v; б) u2/v\ в) euv; г) wv/(tt2 +и2); д) lntg(u/u); e) %/^2 + ^2; ж) uv. 3.6. Доказать, что при \х\ <С а верна приближенная формула па/ Вычислить приближенно при помощи этой формулы: а) \/б40; б) ^200; в) ^243,45; г) 3.7. Найти d(sina;)/d(cosx) и d(tgx)/d(ctgx). 3.8. Доказать, что углы по таблице тангенсов можно найти точнее, чем по таблице синусов с тем же числом десятичных знаков. 3.9. С какой относительной погрешностью можно вычислить объем и поверхность шара, если его радиус измерен с точностью 1%? 3.10. Круговой сектор имеет радиус R = 1 и центральный угол <р = тг/3. Вычислить точно и оценить приближенно (при помощи дифференциала) изменение площади сектора, если: а) радиус увеличить на AR = 0,1; б) угол уменьшить на Ду?=0,1. Чем объяснить, что во втором случае применение дифференциала дало точный результат ? 3.11. Вычислить значение функции у= (u + v2)/w при и = = 3,28; t; = 0,932; w= 1,132 и найти Ду и 6У, считая все знаки исходных данных верными.
4. ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ ВЫСШИХ ПОРЯДКОВ 4.1. Производные высших порядков Пусть функция f(x) дифференцируема на некотором промежутке Еу т.е. 3/'(х) Vx £ Е. Тогда производная f'(x) является тоже функцией аргумента х с областью определения Е. Бели эта новая функция f'(x) дифференцируема, то можно найти ее производную, называемую второй производной исходной функции /(я), или производной второго порядка, и обозначаемую f"(x). В связи с этим f'(x) для определенности называют первой производной, или производной первого порядка. Геометрически значение второй производной соответствует угловому коэффициенту касательной к графику зависимости первой производной от аргумента х. С точки зрения механики вторая производная функции s = /(£), описывающей закон прямолинейного движения точки во времени t, — это скорость изменения скорости v = f'(t) точки, т.е. ускорение w = t/ = = (f'(t)) = f"(t) = s'\ или (как принято в механике), обозначая дифференцирование по времени точкой над символом функции, w = v = s. Ясно, что если f"(x) в свою очередь является дифференцируемой функцией аргумента х, то последующее дифференцирование f"(x) даст третью производную f"'(x) = (f"(x)) . или производную третьего порядка, и так далее. Определение 4.1. Производной п-го порядка функции f(x) называют производную от производной (п - 1)-го
4.1. Производные высших порядков 79 порядка этой функции, т.е. ', n€N, (4.1) причем порядок производной в верхнем индексе берут в скобки, чтобы отличить его от показателя степени. Производные четвертого и более высоких порядков иногда обозначают римскими цифрами, например, fv(x) = (fIV(x)) . По отношению к производным высших порядков (как и для производной первого порядка) применимо понятие односторонней производной. Для производной n-го порядка нетрудно получить правило дифференцирования функции у = Си(х), где С = const, a именно (Си(х)){п) = ЫпЦх). (4.2) Для суммы у = и(х) + v(x) те раз дифференцируемых функций и(х) и и (ж), опуская обозначение аргумента я, последовательно запишем у' = и' + г/; у" = и" + v"\ у"' = и1" +1/". Согласно методу математической индукции, справедливо соотношение у<») = «<*)+ »<">, (4.3) поскольку его можно получить дифференцированием аналогичного выражения для производной порядка п—\. В силу теоремы 1.2 функция, имеющая конечную производную в точке х = а, непрерывна в этой точке. Отсюда следует, что если функция у = f(x) имеет в точке а конечную производную те-го порядка, то эта функция и все ее производные до (те- 1)-го порядка включительно определены в некоторой окрестности данной точки и непрерывны в указанной точке. В этом случае говорят, что функция у = f(x) те - 1 раз непрерывно дифференцируема в точке а. Ясно, что все сказанное относится и к конечным односторонним производным в точке а, и к соответствующим полуокрестностям этой точки.
80 4. ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ Функцию }(х) называют п раз непрерывно дифференцируемой в некотором промежутке Е, если во всех точках этого промежутка она имеет непрерывные производные до порядка п включительно. При этом используют обозначение }(х) € Сп(Е)у где Сп(Е) — множество всех функций, п раз непрерывно дифференцируемых при Vx € Е. Правомерна также запись fln\x) G С(Е), где С(Е) — множество всех непрерывных при Vx € £ функций. Если граничная точка принадлежит промежутку Е (например, граничная точка отрезка или полуинтервала), то в этой точке должна быть непрерывна соответствующая односторонняя производная n-го порядка. Основные элементарные функции (за небольшими исключениями) непрерывно дифференцируемы в своей области определения, причем неограниченное число раз. Исключения относятся к степенной функции Xs (см. пример 1.5) при s $ N в точке х = 0 и обратным тригонометрическим функциям arcsin x и arccosx (см. пример 2.4) в точках х = ±1. Пример 4.1. Найдем вторые производные следующих функций. а. у = In (ж -f л/1 + х2). Последовательным дифференцированием получим *2)3/2' б. у = arcsin \Л -ех. Последовательно вычисляем У У ~ 2(1 -ех) " 4(1 -
4.1. Производные высших порядков 81 Пример 4.2. Получим общее выражение для n-й производной некоторых основных элементарных функций. а. Для функции у = 1/ж последовательно найдем Из полученных выражений видно, что Правильность .(4.4) можно доказать методом математической индукции. б. Поскольку для логарифмической функции у = In x у' = = 1/ж, имеем y(n> = (lnz)<n) = (\/x)^n"l\ Используя (4.4), получаем ^Д (4.5) X в. Для показательной функции у = ах у' = (ах)' = a* In а, у" = (ах In а)' = а* In2*, ... Нетрудно сообразить, что Ы \ппа. (4.6) г. При каждом дифференцировании функции у = sinx приращение аргумента х составляет 7г/2. Действительно, у1 = (sinar)' = у" = (sin(x + 7г/2))' = cos(x И- тг/2) = sin (х + 2тг/2), ... Этсюда следует, что (sin x)W = sin(x 4- птг/2). (4.7) 6-544
82 4. ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ Аналогично для функции у = cosx получим (cosz)(n) = cos(x + П7Г/2). (4.8) Пример 4.3. Для многочлена n-й степени Рп(я) = сох71 + + с\хп~х + ... + cn_i£ -f с„ (со Ф 0) с постоянными коэффициентами qGR, k = 0, п как линейной колсбинации степенных функций последовательно получим п-1 + (П - Рп'(х) = 0 при т> п. В точке * = 0 имеем Рп(0) = сп, Р^(0) = сп_ь Р^(0) = 2сп_2, РЛ0) = 3!сп_3, ..., Pin"1}(0) = (n-l)!cb P,!n)(0) = тг!со и Рп (0) = 0 при m > п. Это позволяет записать Рп(х) = Рп(0) + 1 + д = ^ n! ^ к\ приняв в качестве обозначений при к = 0 к\ = 1 и Р„ (г) = Но тот же многочлен можно представить (или, как говорят, разложить) по степеням разности х — а относительно произвольной точки а € R: П, Нетрудно проверить, что в точке х = а Рп(а) = 6 = &„_,, f*(a) = 26n_2, P^"(o)=3!6n^,...,Pin-1)(a) = (n-!)!&,.
4.2. Примеры интерпретации производной второго порядка 83 Pn (a) — n*bo и Рп(а) = 0 при тп> п. Отсюда можно найти коэффициенты 6^, k = 0, п, и написать Fn(x) = Рп(а) + Р'М(х - а) = уурМ(ау ,, ' , (4.9) Jfc=o Пример 4.4. Легко видеть, что уравнение х4 - 2х3 + -1 = 0 имеет корень х\ — 1. Чему равна его кратность? Для ответа на этот вопрос найдем представление многочлена Р4(х) = х4-2х3 + 2х-1 в виде (4.9) при а = 1, предварительно вычислив его производные в точке х = 1: PJ '(1) = 0, = (24z-12)|x=1 = 12 и P4/V'(l) = 24. Тогда iX) — Г4 I Таким образом, заданное уравнение имеет корень х\ = 1 кратности три и корень Х2 = -1 кратности единица. Пример 4.5. Найдем производные Рп (0) (А; = 0, п) в точке х = 0 многочлена Рп(х) = (b + x)n (n£N): Pn(0) = 6n, P^(0) = nbn-\ P^(O) = n(n - 1)6-2, ..., Pin-1) Pn(0) = n!. Тогда, согласно (4.9), при а = 0 + п&*»-Ч*п = ]ГС*&"-/сД Cnfc = —^--, (4.10) т.е. получим формулу бинома Ньютона, в которой биномиальные коэффициенты С* — это число сочетаний из п элементов по к.
84 4. ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ 4.2. Примеры механической и физической интерпретаций производной второго порядка Пример 4.6. Докажем, что если скорость v прямолинейного движения тела с неизменной массой га пропорциональна квадратному корню из пройденного пути s, то тело движется под действием постоянной силы. Обозначая дифференцирование по времени точкой над символом функции (см. 4.1), для ускорения тела запишем а = v = s. Но по условию v = s = ky/s, где к = const — коэффициент пропорциональности. Отсюда ускорение \k к2 а = i) = к-г—т=5 = —-=k\fs = -— = const. 2/s 2y/s v 2 Согласно закону Ньютона, действующая на тело сила F = та. В данном случае, действительно, F = тк2/2 = const. Пример 4.7. Пусть материальная точка массой m при прямолинейном движении совершает колебания относительно некоторого среднего положения по закону s = где s — расстояние точки от ее среднего положения; Л, и и а — постоянные амплитуда, частота и начальная фаза колебаний соответственно; t — время, причем А > 0 и и > 0. Такой закон колебаний называют гармоническим, а сами колебания — гармоническими. Скорость движения материальной точки v = s = Aucos(ut + Of) в моменты времени t\ = (кп - а)/и (к € Z) равна ±Аи, т.е. является наибольшей по абсолютному значению. В эти моменты времени s = 0 и материальная точка проходит через среднее положение. Наоборот, в моменты времени
4.2. Примеры интерпретации производной второго порядка 85 когда s = ±Д, т.е. удаление материальной точки от среднего положения наибольшее, имеем г = 0. Ускорение материальной точки a = v = s = — Au2sm(ujt + a) обращается в нуль в моменты времени t\, а в моменты времени ti является наибольшим по абсолютному значению (|о| = Аи2). Ускорение можно записать в виде a = — u;2s, а силу, действующую на материальную точку при гармонических колебаниях, с учетом закона Ньютона — в виде F = —mw2s. Таким образом, эта сила пропорциональна отклонению материальной точки от среднего положения и всегда направлена к этому положению. Движение материальной точки, происходящее по закону s= Ae~bt sm{ut + a) (6>0), называют затухающими колебаниями, поскольку со временем точка стремится к состоянию покоя в среднем положении, т.е. lim 5 = 0. В этом случае последовательным дифференцированием s no t получим v = s = Ae~bt (v cos(ut + a) — 6si а = v = - Ae~bt ((о;2 - b2)s\n{ut + а) + 2ubcos(ut -fa)). Добавив ±Ae~btb2s\n(u>t + ck) в правую часть последнего выражения, с учетом соотношений для s и v запишем а = v = -Ae~bt(uj2 + b2)s\n(wt + a) - - 2Abe~bt (Ljcos(ut -fa)- bs\n(ut + a)) = -(J1 + b2)s - 2bv. Таким образом, сила F = ma = — m(u2 -f 62)s — 2mbv1 вызывающая в данном случае затухающие колебания, складывается
86 4. ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ из двух составляющих: из силы, пропорциональной удалению точки от среднего положения и направленной (как и при гармонических колебаниях) к этому положению, и из силы сопротивления, пропорциональной скорости и направленные^ противоположно скорости материальной точки. Пример 4.8. Известно, что при протекании меняющегося во времени t электрического тока I(t) через катушку с индуктивностью L на ней возникает падение напряжения = Ldl/dt. Пусть катушка включена в колебательный контур последовательно с резистором сопротивлением R и конденсатором емкостью С (рис. 4.1). Конденсатор предварительно (ключ в положении 1) заряжен до напря- Рис. 4.1 жения uq. После перевода ключа в положение 2 колебательный контур замыкается и в нем возникает электрический ток, при котором сумма падений напряжений в контуре равна нулю. Приняв направление тока в контуре по часовой стрелке за положительное, напишем uL + u'R-u = 0, (4.11) где в силу закона Ома падение напряжения на резисторе ur = = /Я, а и = q/C — падение напряжения на конденсаторе (см. пример 1.4), q — электрический заряд конденсатора. Пусть функции /(£), q(t) и u(t) дифференцируемы по / необходимое число раз. В данном случае / = -dq/dt = -q'. поскольку при / > 0 заряд конденсатора убывает. Тогда \dljdt — —q" и вместо (4.11) получим 0, (4.12) или с учетом равенства q = Си " ' = 0. (4.13)
4.2. Примеры интерпретации производной второго порядка 87 Уравнения (4.12) и (4.13), в которые входят вторые производные искомых функций, называют обыкновенными дифференциальными уравнениями второго порядка [VIII]. В данном случае они описывают изменение во времени заряда конденсатора и падения напряжения на нем. Чтобы получить уравнение для силы тока, следует один раз продифференцировать (4.12) по t: Lq"' + Rq" + q'/C = 0 и учесть, что g' = -/, q" = -I' и q'" =-/". Тогда получим LCI" + RCI' + I = 0. (4.14) Отметим, что уравнения (4.12)—(4.14) аналогичны по виду. Не рассматривая способов их решения (см. [VIII]), приведем обращающую (4.12) в тождество зависимость q = Сще (4.15) где р = R/(2L) и и = y/l/(LC) -р2 при условии, что р2 < < 1/(LC), или R2 < 4L/C. Зависимость u = q/C от t следует из (4.15). При t = 0 (момент перевода ключа в положение 2) из (4.15) получим начальный заряд конденсатора qo = Сщ при начальном напряжении щ. Ясно, что графики зависимостей q/qo и u/uq от t совпадают (на рис. 4.2 они изображены сплошной линией). Штрихпунктирными кривыми показаны графики q/qo;u/tiO; _e-pt Рис. 4.2
88 4. ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ функций ±e~pt. Эти кривые ограничивают размах затухающих колебаний величин q/qo и и/и0 относительно их нулевого значения. Амплитуда этих колебаний монотонно уменьшается во времени. Бели в колебательном контуре (см. рис. 4.1) резистор отсутствует (R = 0), то р = 0 и колебания будут гармоническими, причем их частота и>о = l/y/LC > и. Зависимость I от t получим дифференцированием (4.15): / = — q' = — Cuoe~pt(—u>sinu;t + (p/oj)ucosu>t) -f ~pt (cosut + (p/u)s\nut), или / = /me"~pt sin u;t, (4.16) где Im = Cuq(v + p2/w). График зависимости I/Im от / показан на рис. 4.2 штриховой линией. Убедимся, что (4.16) удовлетворяет уравнению (4.14). Для этого, продифференцировав (4.16), вычислим /' = Ime~ptucosLjt - plme~ptsmut, /" = -u2lme~ptsmu;t + p2lme~ptsmut - 2pulme~pt cosut. Действительно, после подставновки (4.16) и этих соотношений в (4.14), получим тождество. 4.3. Формула Лейбница Выведем формулу для вычисления n-й производной произведения п раз дифференцируемых функций и(х) и v(x). Опустив обозначение аргумента я, последовательно запишем (uv)' = u'v + uv'y (uv)" = u"v + 2uV + uv", (uv)"' = u"'v + 3u'V + 3u V + uv'".
4.3. Формула Лейбница 89 В построении этих формул можно уловить закономерность, характерную для формулы (4.10) бинома Ньютона, написав для n-й производной **-1 V + C* n (4.17) где С„ = n\/(k\(n — k)\) — число сочетаний из n элементов по /г элементов. Убедимся в справедливости (4.17) методом индукции. Легко проверить, что из (4.17) при п = 1, 2 и 3 следуют записанные выше формулы для первых трех производных. Считая (4.17) верной для произвольного п, проверим ее справедливость при замене в ней п на п+1. Для этого продифференцируем (4.17), полагая, что и^п+1^ и i>(n+1) существуют: Для /; ^ п п! n (*-l)!(n-Jfc+l)! Jk!(n-fc)! (n Щп + \-к)\ Тогда предпоследнее равенство принимает форму = tt<n+1>t; которая соответствует (4.17) при замене п на п+1. Итак, доказана справедливость соотношения (4.17), называемого фор мулой Лейбница.
90 4. ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ Пример 4.9. Найдем уМ функции у = х2 sin х, положив v(x) = х2 и и(х) = sin я. Имеем i/ = 2х, v" = 2 и vW = 0 при fc > 2. В примере 4.2 было установлено, что и^ = (sinx)W = = sin(x -f kn/2) Vk € N. Учитывая все это, получим, что в (4.17) будут отличны от нуля лишь последние три слагаемых, содержащие и, и' и и". В итоге с учетом С2 = п(п - 1)/2 и £ = п получим у{п) = (x2sin x)(n) = z2sin(s -f птг/2) + + 2nzsin(x 4- (п - 1)тг/2) + ^(n - l)sin(x + (n - 2)7г/2) = = (я2 - п(п - 1))sin(x + птг/2) + 2nxsin(a; + (n- 1)тг/2). Пример 4.10. Для функции y = arcsinx (\х\ ^ 1) имеем yr=l/y/T^xs (\х\<1) (см. пример 2.4.а) и у" = х/у/(\ -х2)3, т.е. Применим (4.17) к каждой части этого равенства: = у<п+2>(1 - x или с учетом С\ = п и С2 = те(п- 1)/2 получим рекуррентное соотношение Поскольку для п = 1 уже известны у1 и у", из этой формулы последовательно можно вычислить производные порядка п > 2. При х = 0 имеем т/п+2)(0) = пУп)(0). Для те = 0 у<°)(0) = = у(0) = 0, а для те = 1 у'(0) = 1. Поэтому все производные четного порядка у(2тп)(0) = 0 Vm 6 N, а производные нечетного порядка тп у(2т+1)(0) = JJ(2A: - I)2 = ((2т - I)!!)2.
4.4. Производные параметрически и неявно заданных функций 91 Символ двойного факториала означает, что сомножителями являются лишь нечетные числа. Пример 4.11. Производная функции y = arctgz> согласно примеру 2.4.6, t/' = 1/(1+ж2), или (1 + ж2)у' = 1. Поскольку при и(х) = 1 + х2 и1 = 2х и и" = 2, то, используя (4.17), находим ((1 + x2)y'){n) = n(n - lJyC»-1) + 2nzy(n> + (1 + х2)у<п+1> = О, или Полученная рекуррентная формула позволяет начиная с п = — 1, для которого известны у(°) = у и у', последовательно найти у", у';/ вплоть до y(n+1) Vn G N. При х = 0 имеем y(n+i) _ _п(п _ i)^(n~1). Но так как в этой точке у(0) = у = О, все производные четного порядка при х — 0 равны нулю. Для производных нечетного порядка у'(0) = 1, у"/(0) = -2!, yv(0) = 4!,T.e. при х = 0 y(2m+1) = (-l)m(2m)! Vm € N. 4.4. Производные высших порядков параметрически и неявно заданных функций Пусть функция у = f(x) задана параметрически уравнени ями (2.20) и функции x(t) и у(£) достаточное число раз дифференцируемы в любой точке 16 Т множества Т, причем z'(£) ^0 V£ 6 Т. Согласно (2.21), производную у'х функции y = f(x) определяют тоже как параметрически заданную функцию уравнениями •* •
92 4. ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ Эту новую параметрически заданную функцию можно снова дифференцировать по я, используя прежнее правило: x = #(£), у x = x(t), В частности, для производной второго порядка получим ' f€T. (4.18) х = (£) Пример 4.12. а. Найдем производную второго порядка функции у = /(я), заданной параметрически соотношениями x(t) = acos3£, «G [0, ir/2]. y(t) =°i Для этого вычислим t/{ = 3asin2£ -cost, x{ = — 3acos2£ -sint и представим первую производную у'х этой функции также в параметрическом виде: .. з, t€ [0T тг/2). x(t) = acos^i, Затем найдем y{J = 6asin£-cos2£ — 3asin3^, ж{'« = 6acos^-sin2^ — 3a cos31 и VtWt ~ х'иУ[ = - 18a2 sin21 • cos4 * + 9a2 sin41 • cos21 - — 18a2sin41 •cos<+9a2sin2^-cos4i = -9a2sin21 -cos2t. Наконец, согласно (4.18), запишем при t 6 (0, 7г/2) // /.ч = Uttx't ~ xtWt _ -9a2sin2^cos2^ = хЛ ] ~ (')3 " -27a3cos6t-sin3* " x(t) = acos3£.
4.4. Производные параметрически и неявно заданных функции 93 Отметим, что в данном случае при вычислении y"x(t) проще непосредственно дифференцировать по t выражение для y'x(t), т.е. t 1 = = х\ (acos3t)'t -3acos2tsint 3asintcos4f б. Пусть функция у = f(x) задана параметрически соотношениями x(t) = e'cosf, y[t) = e*sint, t € [-тг/4, яг/4]. Для вычисления производной второго порядка предварительно найдем у[ = ег sin t + е* cosi и s{ = е* cosi - е* sin t. Тогда I4W = cosi — sini' -ff/4, тг/4). x(t) = e'cost, Непосредственным дифференцированием y'x(t) получим (—sin t+cos ^) (cost — sin t) — (cost-\-s\nt)(-s\nt —cost) (cost — sin t)2 (cost- sin t)2 и в итоге _ Ш*)У, = —17— х{ (cost — sin t)3 x(t) = efcost, в. Для заданной соотношениями x(t) = a(cost -f tsin £), = a(sinf — tcost), -7r/4, тг/4). G [-7Г/2, ir/2]
94 4. ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ функции у = f(x) сначала найдем у[ = a(cost — cost -f isin t) = atsint, x\ = a(— sin t-\- sin t + t cos t) = at cost и y'x(t) =tgt, te (-7Г/2, tt/2) и с учетом того, что (y'x{t))t = (tg*)' = l/cos2t, в итоге запишем в параметрической форме вторую производную заданной функции: t е (-тг/2, тг/2). Пример 4.13. а. Найдем производную второго порядка функции у = /(х), заданной неявно уравнением у = х -f arctgy. Дифференцируя обе части этого уравнения по ее, получаем у1 = 1 + у'/(1 + у2), откуда у' = 1 + 1/у2. Дифференцируя последнее равенство еще раз и учитывая выражение для первой производной, записываем б. Пусть функция у = f(x) задана неявно уравнением х2 + бжу Н- у2 - 2х + у - б = 0. Найдем вторую производную этой функции в точке (1; 1). Дифференцирование обеих частей уравнения по х дает 2х + 5y + 5zy' + 2yy' — 2-f-y' = 0. Отсюда , _ 2 - 2ж - 5у У " 1 + 2у + 5г и значение первой производной в точке (1; 1) y'l^ji) = -5/8. Дифференцируя равенство для первой производной еще раз, получаем + 2y+5s)-(2-2:g-5y)(2y45) У (1+
4.5. Дифференциалы высших порядков 95 Подставляя сюда значения ж = 1, у = 1 и у' = -5/8, находим у"|(1;1) = 111/256. 4.5. Дифференциалы высших порядков Подобно производным высших порядков дифференциалы высших порядков также определим по индукции. В связи с этим дифференциал dy функции у = }(х) в некоторой точке х (см. определение 3.1) там, где это необходимо для определенности, будем называть первым дифференциалом {дифференциалом первого порлдка) функции в данной точке. Вторым дифференциалом (дифференциалом второго порлдка) функции y = f(x) в некоторой точке называют дифференциал в этой точке (если он существует) от дифференциала первого порядка в данной точке и обозначают d2y (или d2f(x)). Итак, d2y = d(dy). (4.19) Очевидно, третьим дифференциалом (дифференциалом третьего порядка) называют дифференциал (если, конечно, он существует) от дифференциала второго порядка, т.е. d3y = d(d2y), (4.20) и так далее. Вообще, п-м дифференциалом (дифференциалом п-го порлдка) функции у = f(x) в некоторой точке называют дифференциал в этой точке (если он существует) от дифференциала (п — 1)-го порядка в указанной точке и обозначают dny (или dnf(x)), т.е. dny = d(dn~ly). (4.21) Если х — независимое переменное, то dx является произвольным независящим от х числом, которое при дифференцировании по х следует считать постоянным множителем.
96 4. ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ В таком случае с учетом (3.3), (4.19) и (4.20) для произвольной точки х d2y = d(dy) = d(f'(x)dx) = df'{x)dx = f/f(x)dxdx = f"(x)dx2, d3y = d(d2y) = d(f"(x) dx2) = df"(x) dx2 = f"'(x) dx3. Предположим, что для дифференциала (тг— l)-ro порядка справедлива формула dn~1y = f^n~1^(x)dxn~1. Найдем dny = d(dn~xy) = x) dxn~l = /^n) (x) dxn. Таким образом, методом математической индукции доказана справедливость формулы n. (4.22) Отсюда следует выражение для та-й производной у{п)=£ так что символ в правой части (4.23) теперь можно рассматривать как отношение дифференциала тг-го порядка функции к 71-й степени дифференциала независимого переменного. Итак, для существования дифференциала га-го порядка функции у = f(x) в точке х необходимо, чтобы эта функция была п раз дифференцируема в данной точке. Ясно, что если существуют дифференциалы га-го порядка функций и(х) и v(x) в точке х и С = const, то справедливы свойства dn(Cu) = Camu и dn(u±v) = dnu±dnv. (4.24) Формула Лейбница, установленная им именно для дифференциалов, приобретает вид (4.25)
ДАЛ. Толкование дифференциала второго порядка 97 где С* — число сочетаний из п элементов по к элементов. Дифференциалы более высоких, чем первый, порядков, вообще говоря, не обладают свойством инвариантности формы записи. Действительно, если y = f(z) и z — g(ж), то с учетом теоремы 2.2 о производной сложной функции получаем = ff(z)g'(x)dx = f'(z)dz. (4.26) Подчеркнем, что dz = g'(x)dx и z = g(x) нельзя считать в данном случае независимыми. Поэтому дифференциал от dy следует искать как дифференциал произведения d2y = d(dy) = d(f'(z) dz) = d(f'(z)) dz + f(z) d(dz) = (4.27) т.е. уже в выражении для дифференциала второго порядка сложной функции y = f(g{x)) появляется дополнительное слагаемое f'(z)d2z. Лишь в частном случае линейной функции z = g(x) = cqx + c\ имеем dz = c^dx и d2z = d3z = ... = dn2r = 0, т.е. dny = /<n> (z) dzn = /<n> (z) {codx)n. Дополнение 4.1. Геометрическое и механическое толкование дифференциала второго порядка Можно ли усмотреть геометрический смысл дифференциала второго порядка d2y функции у f(x) ? На рис. 4.3 вертикальной штриховкой отмечены криволинейные „клинья , которые возникают между графиком функ- да) ции и касательной МТ. Уравнение y = f(a) + f'(a)(x — а) касательной линеаризует зависимость у = /(ж) в окрестности точки а. Ординаты R\(x) = О Рис. 4.3 7-544
98 4. ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ = f(x) - /(о) - f'(a)(x - а) этих „клиньев" характеризуют погрешность приближенной формулы вида (3.7) /(*) к /(а) + /'(а)(х - о) = /(а) + df(a) (4.28) и могут быстро возрастать по мере удаления от точки а. Дифференциал второго порядка функции у = f(x) в точке а d2y = d2f(a) = f"{a)dx2 = /»(Дх)2 = f"{a)(x - а)2 приводит к уравнению параболы д(х) = ftf(a)(x - а)2, график которой показан на рис. 4.3 штрихпунктирной линией. Графики функций Ri{x) и д(х) прилегают один к другому в окрестности точки а, поскольку оба они касаются в этой точке оси абсцисс. Поэтому заманчива попытка хотя бы частично скомпенсировать погрешность формулы (4.28), добавив для уточнения в ее правую часть еще одно слагаемое: }{х) % « /(а) + df(a) + К d2f(a), или /(*) « /(а) + Г(а) (х - а) + Kf"(a) (x - а)2. Коэффициент К следует подобрать так, чтобы в точке а вторые производные левой и правой частей последней формулы (соответственно {"{а) и 2Kf"(a)) были одинаковыми. Отсюда К = 1/2 и f(x) « f(a) + f'(a)(x - а) + /»(* - а)2/2. (4.29) Возникает естественное подозрение, что эту формулу можно улучшать и дальше, если учитывать дифференциалы третьего и более высоких порядков (по крайней мере, дифференциал d3y = d3f(a) = f"'(a)(x - а)3 важно учитывать в ситуации, когда ветви графика функции у = f(x) лежат по разные стороны касательной, проведенной к графику в точке М, как показано на рис. 4.4). Далее будет возможность строго доказать (см. 7.2), что так оно и есть, а пока ограничимся высказанны-
Д.4.1. Толкование дифференциала второго порядка 99 Рис. 4.4 ми интуитивными соображениями о том, что дифференциалы выше первого порядка характеризуют отличие графика функции от касательной, а дифференциалы выше второго порядка — отличие этого графика от квадратной параболы, описываемой правой частью (4.29). Дифференциалам выше первого порядка можно дать и механическое толкование. Пусть, как и ранее (см. пример 1.2), функция 5 = f(t) описывает зависимость от времени t пройденного расстояния s при прямолинейном движении материальной точки М массой тп, причем в момент времени t = = а скорость точки М v(a) = f'(a). Если при t>a равнодействующая F приложенных к точке М сил равна нулю (F = 0), то материальная точка продолжает движение по инерции с постоянной скоростью v(a) и s = s(a) + v(a)(t — а), или f(t) = /(а) + f'{o)(t — а), а формула (4.28) становится точной. Если же вектор равнодействующей коллинеарен вектору скорости и сохраняет постоянное ненулевое значение, движение будет равнопеременным (равноускоренным или равнозамедлен- ным) с постоянным ускорением w = F/m. Известно, что в этом случае пройденное расстояние описывает уравнение s = = s(a) + v(a)(t-a) + w{t-a)2/2, или f(t) = f(a) + f'(a)(t-a) + + f"(a)(t - a)2/2, где f"(a) = w = F/m. Теперь точной становится формула (4.29), а дифференциал второго порядка d2s — = d2f(a) = f"(a)(t-a)2 будет равен удвоенной разности пройденного расстояния при равнопеременном и равномерном движениях материальной точки. Если же равнодействующая F = F(t) зависит от времени, то ускорение w = F(t)/m также будет меняться, а дифференциалы третьего d3s — d3f(a) и более высоких порядков будут характеризовать разность пройденных расстояний при реальном законе движения и равнопеременном движении с постоянным ускорением /"(a) = w(a) = F(a)/m.
100 4. ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ Чем выше порядок п последнего из учитываемых дифференциалов dns = d^f(a) = f(nHa)(t ~~ a)ni тем точнее удается спрогнозировать закон движения материальной точки, располагая лишь информацией о производных до /^пЦа) включительно только в одной точке t = a. Бели время t рассматривать как параметр, то зависимость между z и у, параметрически заданная уравнениями вида (2.20) У = будет описывать на координатной плоскости хОу (рис. 4.5) траекторию движения точки М(х\у) с текущими координатами ж и у. Пусть функции x(t) и y(t) дважды дифференцируемы V£ £ Т. По проекциям У о У(х)/ ctg(/'/g') X vx = x[ и vy = y{ вектора скорости точки М на оси координат можно найти модуль скорости v = у/{х[)2 + [у[)2 и ее направление, которое совпадает с направлением касательной Рис. 4.5 к траектории, поскольку угловой коэффициент касательной, согласно (2.21), yfx = y't/x't = = vy/vx (при vx = 0 касательная параллельна оси Оу). Направление действующей на движущуюся точку силы совпадает с направлением ускорения ги, т.е. параллельно прямой с угловым коэффициентом wy/wx, где wx = vx = x"t и wy = vy = y"t — проекции вектора ускорения на оси координат (при wx = 0 сила параллельна оси Оу). Если в некоторый момент времени ухх = 0, то в силу (4.1) Уих\ ~~ Угхи = 0 и Wy/wx = Уи1х'и = У[/Хг — vy/vxi T-e- направления скорости точки и действующей на нее силы совпадают. Это следует и из выражения вида (4.27) для второго дифференциала + y'xd2x, (4.30)
Д.4.1. Толкование дифференциала второго порядка 101 поскольку в данном случае d2y(t) = y"tdt2 и d2x(t) = x"tdt2, a также и из механических соображений: точка под действием силы, совпадающей по направлению со скоростью этой точки, должна двигаться по некоторой прямой с уравнением у = cqx + + с\, для которого у"х = 0. В случае ухх Ф 0 второй дифференциал d2y(x) = yxxdx2 (если считать х независимым переменным) характеризует в текущий момент времени отличие траектории движения точки от прямолинейного по касательной к траектории. Если же считать независимым переменным t и в (4.30) подставить d2y(t) — y"tdt2 = Wydt2, d2x — x"tdt2 = wxdt2, dx = x'tdt = vxdt и Ух — vylvx, то получим соотношение w У х It У w v (4.31) устанавливающее связь угловых коэффициентов касательной и прямой (wy/wx), вдоль которой направлена действующая сила. Например, при движении точки М по окружности радиуса R (рис. 4.6), заданной параметрически соотношениями x(t) = Rcost, y(t) = Rsint, te скорость направлена по касательной МТ с угловым коэффициен- f^^^\ \М *ЙЛ / 91 ^^™ Ъ i / О* ^^^ ^^в ^^Т £f ж О X Lllvl Uy I Х/д; ^~ iff / JL f ^— ^^ СI/сц & « Л = —Яcost и, согласно (4.31), ttfy -1 -/2sint)2 -/2 cost /?sin3t -ctg« = 1 sint -cost т.е. действующая на материальную точку сила направлена к центру окружности.
102 4. ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ Вопросы и задачи 4.1. Показать, что если материальная точка движется прямолинейно по закону s = ael + be~l, то ее ускорение численно равно пройденному пути. 4.2. Какого порядка производные имеет функция у = |х|3 в точке х — 0 ? 4.3. Найти производные у"(х) и у'"(х) от сложной функции у = f(g(ж)), если функции z = д(х) и f(z) достаточное число раз дифференцируемы. 4.4. Выразить дифференциал d2y функции y = umvn через дифференциалы функций и(х) и v(x). 4.5. Функция имеет в точке а производную n-го порядка. Что можно сказать о существовании производных меньшего порядка в этой точке и ее некоторой окрестности ? 4.6. Многочлен Рь{х) = 1 + х + х2+ х3+ х4+ хъ обращается в нуль в точке х = — 1. Убедитесь, что кратность этого нуля данного многочлена (корня уравнения Р$(х) = 0) равна единице. Что можно сказать о кратности нуля х = 1 многочлена Р4(х) = х4 - х3 - Зх2 + 5х - 2 ? 4.7. Определить, какого порядка производные имеют в точке х = 0 функции У = 1 -cosz Vx < 0, VO0; У = = < shz-z Vx < 0, x — sinx Vx ^ 0; shx Vx < 0, У= { sinx-chx Vx > 0. 4.8. Показать, что функция j/ = xn(Cicos(lnx)+C2sin(lnx)) удовлетворяет уравнению x2y"-f (1 — 2п)х2/-|-(1 + га2)у = 0 при произвольных значениях постоянных Ci, Сг € R и п £ N.
Вопросы и задачи 103 4.9. Доказать, что при прямолинейном движении точки по закону s = \А+ 1» t > 0, ее ускорение пропорционально кубу ее скорости. 4.10. Две точки движутся прямолинейно по законам s\ = = t3 +12/2 + t + l/2 и s2 = 2t3/3 + 3t2 - 5t. Каково отношение их ускорений, когда совпадают абсолютные значения их скоростей? 4.11. Найти n-ю производную функций (ах + Ь)/(сх + d), sin2x, sinaa; «sinftx, sin2 ax cos6x, sin4z + cos4z, chaz-sin&x, 4.12. С каким коэффициентом следует добавить в правую часть (4.29) дифференциал третьего порядка функции /(х), чтобы совпали в точке х = а третьи производные от обеих частей этой формулы ? 4.13. Найти второй дифференциал функций у(х) = uv, у(х) = uv при и > 0, у(х) = arctg(w/v) при t; ф 0, у(х) = = loguv при и>0, иф\ и и>0, где и и v — дважды дифференцируемые функции независимого переменного х. 4.14. Доказать, что для трижды дифференцируемой функции f(z) при z = ex d3f(ex)/dx3 = exf'(z) + 3e2x/"(*) + e3xf"\z). 4.15. Подобрать коэффициенты со, с\ и сг из условия существования второй производной функции {/(х) Vx < a, со(х -a)2-f-ci(x-a) + c2 Vx > a, где /(х) — дважды дифференцируемая функция во всей своей области определения. 4.16. Доказать, что [d3f/dt3) dgb = d3fdg2 - 3d2fd2gdg + 3df(d2g)2 - dfd3gdg, если f(x) и x = g(t) — трижды дифференцируемые функции.
104 4. ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ 4.17. Вывести аналог формулы Лейбница для n-й производной частного двух п раз дифференцируемых функций. 4.18. Найти первые две производные функции у (я), заданной неявно уравнением 2arctg(y/x) = ln(x2 + у2). 4.19. Доказать, что любой луч, исходящий из одного фокуса эллипса, заданного уравнением (х/а)2 + (у/Ь)2 = 1, и лежащий в плоскости эллипса, после зеркального отражения от его а х контура приходит в другой фокус (при а > b > 0 фокусы расположены на оси Ох в точках с абсциссами с = ±\/а2 - Ь2) (рис. 4.7). 4.20. Для параметрически заданной функции teR -а вычислить у'х в точке х = 0. 4.21. Доказать, что трактриса y(t)=smt, te (0, тг), а>0 имеет отрезок касательной постоянной длины. 4.22. Доказать, что если трижды дифференцируемая функция f(x) имеет обратную функцию х = /-1(у) и f'(x) ф О, то Г/Л 2 _ fl fill
Вопросы и задачи 105 4.23. Определитель W(x), составленный последовательно по столбцам из п функций щ(х), i = l,n, и их производных до (п - 1)-го порядка, называют вронскианом по имени польского математика Ю. Вроньского (1776-1853). Найти W'(x) при условии существования n-й производной функций щ(х). 4.24. Доказать, что для параметрически заданной функции x(t) = /'I I »(0 = tf'(t) - №, где f(t) — трижды дифференцируемая функция, справедливо выражение x=f. 4.25. Доказать справедливость равенства Зп(п - \)ах + п(п - 1)(п - 2))а п"3еах 4.26. Доказать, что k=0 где Рт(х) — многочлен степени т; С„ — число сочетаний из п элементов по к элементов, a q = m\n{m;n}.
5. ОСНОВНЫЕ ТЕОРЕМЫ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ Эти теоремы играют важную роль в математическом анализе при исследовании функций. Их иногда называют теоремами о среднем значении (в смысле значения производной в некоторой внутренней точке рассматриваемого отрезка) и связывают с именами французских математиков П. Ферма (1601-1665), М. Ролля (1652-1719), Ж. Лагранжа (1736-1813) и О. Кошй (1789-1857). 5.1. Теоремы о нулях производных Теорема 5.1 (Ферма). Пусть функция y = f(x) определена в некотором промежутке Е и во внутренней точке с этого промежутка принимает наибольшее или наименьшее значение. Если в этой точке существует конечная производная f'(c) данной функции, то /'(с) = 0. < Пусть для определенности f(x) принимает в точке с наибольшее значение. Тогда Vx € Е f(x) ^ /(с). Положив х = = с4-Ах, получим f(c+Ax) ^ /(с). Согласно определению 1.2 производной и условию теоремы, существует конечный предел Иш Ах Если Ах > 0, то (/(с + Дя) -f(c))Ax ^ 0 и из правил предельного перехода в неравенствах [1, 7.4] следует, что lim /(C + Ax)-/(C) = х*+о Ах *
5.2. Теоремы о нулях производных 107 Если же Дх < 0, то (/(с + Дх) - f(c))/Ax ^ 0 и в силу тех же правил Н. Лс + Ах)-/(с) = /1(с)^0 Да:-*—О Дх В силу теоремы 7.1 [I] о связи конечного предела в точке с односторонними пределами в этой точке с учетом трех последних соотношений имеем Дж-Ю Дх Дя-Ц-0 Дх = Вш Дх-f-O Дх т.е. f'(c) = 0. Доказательство для случая наименьшего значения данной функции в точке с аналогично. ► Обращение в нуль производной /'(с) означает, что касательная к кривой графика функции /(х) в точке М(с; /(с)) параллельна оси Ох (рис. 5.1). При доказательстве теоремы Ферма существенно использование того, что с является внутренней точкой промежутка. Это позволило рассматривать точки х, лежащие как справа, так и слева от точки с. Без этого предположения утверждение теоремы может оказаться неверным. В самом деле, если функция достигает наибольшего значения в граничной точке на одном из концов (а или 6) промежутка, то производная в такой точке (при условии, что производная существует) может и не быть равной нулю (рис. 5.2). У 1 1 1 а О М < г 1 ) X Рис. 5.1 Рис. 5.2
108 5. ОСНОВНЫЕ ТЕОРЕМЫ Рассмотрим теперь простую, но весьма важную теорему, связываемую с именем французского математика М. Ролля, хотя он доказал ее только применительно к многочленам. Теорема 5.2 (Ролля). Если функция y = f(x) 1) непрерывна на отрезке [а, 6]; 2) дифференцируема в интервале (а, 6); 3) на концах отрезка принимает равные значения (/(а) = то между точками а и Ь найдется, по крайней мере, одна точка с (а < с < 6), в которой /'(с) = 0. < Так как функция у = }(х) непрерывна на отрезке [а, 6], она, согласно теореме 9.5 (второй теореме Вейерштрасса) [I], достигает на этом отрезке своих наибольшего М и наименьшего т значений. Рассмотрим два случая. 1. М = га. Функция f(x) в интервале (а, Ь) сохраняет постоянное значение, и поэтому }'{х) = 0 Vx € (а, 6), т.е. в качестве с можно взять любую точку из интервала (а, 6). 2. М > т. Поскольку, согласно условию теоремы, f(a) = — f{b), одного из значений М или т функция достигает во внутренней точке с интервала (а, 6). Тогда из теоремы 5.1 Ферма следует, что в этой точке f'(c) = 0. ► В частном случае f(a) = f(b) = 0 справедливо следствие. Следствие 5.1. Между двумя нулями дифференцируемой функции всегда лежит хотя бы один нуль ее производной. Теорема Ролля имеет следующее геометрическое толкование: если ординаты непрерывной кривой на концах отрезка [а, 6] равны между собой и кривая в каждой внутренней точке этого отрезка имеет невертикальную касательную, то на кривой найдется хотя бы одна точка, в которой касательная параллельна оси Ох (рис. 5.3, точки М\ и Мг, соответствующие точкам с\ и С2 интервала (а, 6)).
5.1. Теоремы о нулях производных 109 [S а 0 Ла)=/(Ь) /^ \/ \ 1 1 i I 1 в- ? b х Рис. 5.3 Рис. 5.4 Заметим, что все условия теоремы 5.2 существенны для справедливости ее утверждения. Например, функция у = \х\ непрерывна на отрезке [— 1,1], принимает на его концах равные значения, но не имеет конечной двусторонней производной в точке х = 0, внутренней для этого отрезка. Так как у' = +1 Vx € (0, 1) и у' = -1 Уж € (-1, 0), в интервале (-1,1) нет ни одной точки, в которой бы производная у' обращалась в нуль. Однако теорема Ролля носит лишь достаточный характер, т.е. если все условия теоремы выполнены, то ее утверждение верно, но если нарушено хотя бы одно ее условие, то нельзя сказать что-либо определенное о существовании точки, в которой производная рассматриваемой функции обращалась бы в нуль. На рис. 5.4 видно, что функция f(x) непрерывна на отрезке [а, 6], на концах отрезка имеет равные значения, но не является дифференцируемой во внутренней точке хо этого отрезка. Тем не менее существует точка х = с, в которой /'(с) = 0 (касательная в соответствующей точке кривой графика этой функции параллельна оси Ох). Если функция s = f(t) задает зависимость от времени t координаты s точки при ее непрерывном прямолинейном движении, то условие f(a) = f(b) означает, что эта точка после начала движения в момент времени а через промежуток времени Ь — а должна вернуться в исходное положение. Но для этого хотя бы в один из промежуточных моментов времени £о € (л, Ь) ее скорость движения /'(*о) должна стать равной нулю. Такова механическая интерпретация теоремы Ролля.
по 5. ОСНОВНЫЕ ТЕОРЕМЫ Пример 5.1. Проверим, удовлетворяют ли условиям теоремы Ролля функции: a) f(x) = х2 - Зх + 2 на отрезке [0,3]; б) f(x) = 1 - \/х^ на отрезке [—1, 1]? Если удовлетворяют, то найдем точку с, в которой /'(с) = 0. а. Функция f(x) = х2 — Зх + 2 непрерывна на отрезке [0,3] как сумма непрерывных слагаемых. Поскольку ее производная f'(x) = 2х — 3, функция дифференцируема в интервале (0, 3). Значения функции /(0) = /(3) = 2 на концах отрезка равны между собой. Таким образом, рассматриваемая функция удовлетворяет всем условиям теоремы Ролля, и поэтому в интервале существует точка, в которой производная f'(x) = 2х — 3 = 0. Отсюда 2с-3 = 0 и с = 3/2. В найденной точке с значение функции /(с) = -1/4. Следовательно, касательная к кривой графика этой функции в точке (3/2; -1/4) параллельна оси Ох (рис. 5.5, а). б. Функция f(x) = 1 — \fx* непрерывна на отрезке [-1, 1], ее значения /(—1) = /(1) = 0 на концах этого отрезка равны между собой, а ее производная f'(x) = —2/(Ъу/х) конечна во всех точках интервала (-1, 1), кроме точки х = 0. Таким образом, одно из условий теоремы Ролля не выполнено, и эта теорема не применима к данной функции (рис. 5.5, б). о-0 с-3/2 /ь=з а а—1 Рис. 5.5 Ь-1 х Пример 5.2. Функции f(x) и д(х) непрерывны на отрезке [а, 6] и дифференцируемы в интервале (а, 6), причем
5.1. Теоремы о нулях производных 111 f(a) = f(b) = 0. Докажем, что уравнение f(x)g'(x) + f'(x) = 0 имеет хотя бы один корень в интервале (а, Ь). 4 Рассмотрим функцию F(x) = f(x)e9^ и ее производную F'(x) = f'(x = {/(x)g'(x) Поскольку F(x) удовлетворяет на отрезке [а, 6] всем условиям теоремы Ролля, существует такая точка с€(а, 6), в которой F'(c) = {/(c)g'(c) 4- J'(c))e^ = 0. Но так как e^^ ф 0, то f(c)g'(c) + f'(c) = 0, т.е. с является корнем заданного уравнения. ► Пример 5.3. На отрезке [0, /] функция w(x) непрерывна и трижды дифференцируема. Докажем утверждение: если ш(0) = w(l) = u/(0) = w"(l) = 0, то существует точка xq 6 (0, /), в которой w'"(xo) = 0. < Для функции w(x) на отрезке [0, /] выполнены все условия теоремы Ролля. Поэтому существует точка с 6 (0, /), в которой w'(c) = 0. Теперь можно применить теорему Ролля на отрезке [0, с] к функции w'(x) и заключить, что существует такая точка d € (0, с), в которой w"(d) = 0. Но тогда на отрезке [rf, /] будут выполнены все условия теоремы Ролля для функции w"(x), а значит, существует точка xq 6 (d, /) С (0, /), в которой w'"{xo) = 0. ► Функцию w(x) в данном случае можно рассматривать как зависимость от продольной координаты х прогиба w упругой балки при ее изгибе под действием распределенной поперечной нагрузки q(x) (рис. 5.6). Левый конец (х = 0) балки защемлен, т.е. он не может смещаться вертикально (w(0) = 0), а его по- q(x) гтЛШ,
112 5. ОСНОВНЫЕ ТЕОРЕМЫ перечное сечение — поворачиваться. Поэтому касательная к линии прогиба балки при х = О остается горизонтальной и ги'(О) = 0. Шарнирная опора на правом конце (х = /) балки препятствует вертикальному смещению (tu(/) = 0), но позволяет поперечному сечению балки свободно поворачиваться, так что ее ненагруженный участок при х > I остается прямолинейным, т.е. w"(x) = 0 при х > I. Поскольку функция w(x) трижды дифференцируема в точке х = /, в этой точке непрерывна вторая производная ги"(я), и поэтому w"(l) = 0. Допустимая условиями закрепления балки линия прогиба изображена на рис. 5.6 штрихпунктиром. Применение теоремы Ролля позволяет установить на линии прогиба наличие характерных точек с нулевыми значениями первых трех производных функции прогиба, что необходимо для анализа работоспособности балки под действием нагрузки. Качественный характер зависимостей w'(x)t w"(x) и wm(x) показан на рис. 5.6. 5.2. Теорема Лагранжа и формула конечных приращений Теорема 5.3 (Лагранжа). Пусть функция y = f(x) 1) непрерывна на отрезке [а, 6], 2) дифференцируема в интервале (а, Ь). Тогда между точками а и 6 найдется хотя бы одна такая точка с (а<с<Ь), для которой справедливо равенство f(b)-f(a) = f'(c)(b-a). (5.1) < Введем вспомогательную функцию F(x) = /(*) - Да) - /(^ Z fa(a) (x - а). Эта функция удовлетворяет всем условиям теоремы Ролля. Действительно, она непрерывна на отрезке [а, 6] как сумма
5.2. Теорема Лагранжа и формула конечных приращении 113 непрерывных функций и в интервале (а, 6) имеет конечную производную и, наконец, непосредственной подстановкой легко убедиться, что F(a) = F(b) = 0. Итак, в интервале (а, 6) существует точка х = с, в которой производная а отсюда следует (5.1). ► Для выяснения геометрического смысла теоремы Лагранжа заметим, что отношение 6- a AC является угловым коэффициентом хорды АВ (рис. 5.7), а /'(с) — угловым коэффициентом касательной к графику функции y = f(x) в точке с абсциссой х = с. Таким образом, утверждение теоремы Лагранжа равносильно следующему: на непрерывной дуге АВ, имеющей в каждой точке невертикальную касательную, всегда найдется по крайней мере одна точка М, в которой касательная параллельна хорде АВ (на рис. 5.7 таких точек две — М\ и У •Г/1Л ДО) /(а) О м; -Ж—л 1 i а с У=Ях) \ j 1 С, ' 1 ._ /"• b х Рис. 5.7 Если х — время, a f(x) — координата точки при прямолинейном движении, то отношение (/(6) - f(a))/(b - а) определяет среднюю скорость точки за период времени b — а (см. пример 1.2). Тогда утверждению теоремы Лагранжа можно дать такую механическую интерпретацию: в промежутке (о, 6) 8-544
114 5. ОСНОВНЫЕ ТЕОРЕМЫ есть хотя бы один момент времени с, для которого мгновенная скорость /'(с) совпадает со средней скоростью точки. Теорема Ролля — частный случай теоремы Лагранжа, так как при /(а) = /(6) хорда АВ параллельна оси Ох. Как и теорема Ролля, теорема Лагранжа носит лишь достаточный характер. Это видно на рис. 5.8, где изображены графики функций, непрерывных на отрезке [а, 6], но не дифференцируемых в его внутренней точке a?o- График на рис. 5.8, а не имеет точки, в которой касательная параллельна хорде Л Б, а у графика на рис. 5.8, б такая точка М существует. а О а О Ь х Рис. 5.8 Доказанную в теореме 5.3 формулу (5.1) называют формулой Лагранжа. Возьмем произвольную точку х0 6 [а, 6] и придадим аргументу х функции y = f(x) приращение Даг^О, не выводящее точку х + Да; за пределы отрезка [а, 6]. Запишем (5.1) для отрезка [х0, хо +Дж], если Ах > 0, или для отрезка [хо И- Дх, xq]} если Да: < 0. При этом число с, заключенное между xq и аго + Да;, можно представить в виде с = zo + вДж, где число 9 6 (0, 1). Тогда вместо (5.1) получим f(xo + Ах) -/(жо) = /;(а:о + вДа;)Дж, или с учетом обозначения Ay=f(xo + Ax)-f(xo) (5.2) Это равенство называют формулой конечных приращений. Она позволяет найти точное значение приращения функции
5.2. Теорема Лагранжа и формула конечных приращении 115 у = f(x) при любом конечном приращении Ах аргумента ж в отличие от приближенной формулы вида (3.6) Ау«/'(жо)Аж, (5.3) погрешность которой стремится к нулю лишь при Дж -> 0. В противоположность (5.2) часто (5.3) называют формулой бесконечно малых приращений, поскольку она верна с точностью до бесконечно малой при Ах —> 0 функции о(Ах) более высокого порядка, чем приращение Ах аргумента ж. Пример 5.4. а. Проверим, удовлетворяет ли функция у = In ж условиям теоремы Лагранжа на отрезке [1, е], и если удовлетворяет, то найдем точку с, фигурирующую в этой теореме. Функция у = In ж непрерывна на отрезке [1, е] [I, 9.5], а ее производная у' = 1/ж конечна при любом ж £ (1, е). Поэтому, согласно формуле (5.1) Лагранжа, lne — lnl = (1/с)(с—1) и отсюда с = е - 1. б. Докажем неравенство где Ж2 > Ж1 ^ 0. Для этого запишем формулу (5.1) Лагранжа для функции у = аг^ж на отрезке [жх, х{\ с учетом того, что (ж2 - ж^, с G (жь ж2). 1 ~р С Поскольку 0 < 1/(14- с2) < 1, доказываемое неравенство верно. В частности, при х\ = 0, ж2 = ж > 0 получим ап^ж < ж. # Из теоремы Лагранжа вытекает следствие. Следствие 5.2. Если функция /(ж) непрерывна на отрезке [а, Ь] и во всех его внутренних точках имеет равную нулю производную, то эта функция постоянна на указанном отрезке. 8*
116 5. ОСНОВНЫЕ ТЕОРЕМЫ < Выберем на отрезке [а, Ь] произвольную точку х\. Функция /(ж) удовлетворяет условиям теоремы Лагранжа на отрезке [а, х\] С [а, Ь]. Тогда, согласно (5.1), f(xi) - /(а) = f'(c)(xi - о), с 6 (а, хг). Но по условию /'(с) = 0 Vc G (а, х\) С (о, 6), и поэтому /(&i) = = /(а), т.е. значение функции в произвольной точке на отрезке [а, Ь] совпадает с ее значением в фиксированной точке а. Следовательно, функция f(x) постоянна на всем отрезке. ► Замечание 5.1. Если f'(x) = 0 Уж 6 R, то f(x) = = const Уж 6 R, поскольку на любом отрезке числовой оси будут выполнены условия следствия 5.2. Следствие 5.3. Бели для дифференцируемых при х > а функций f(x) и д(х) f'(x)>g'(x) и /(а) = д(а), то f(x) > > д(х) при х > а. -* Функция h(x) = f{x) — g(x) на отрезке [а, ж] удовлетворяет условиям теоремы Лагранжа. Так как h(a) = 0, то из (5.1) следует, что Цх) = h'(c)(x - о) = (/'(с) - </'(с))(х - о), с 6 (о, г). Функция h(x) > 0, т.е. /(ж) > #(ж) при ж > о, поскольку правая часть последнего равенства положительна. ► Пример 5.5. Сравним функции /(ж) = ех и д(х) = 1 + х + + ж2/2 при ж G R. Эти функции равны при ж = 0: /(0)=^(0) = = 1. Найдем f(x) = ex и д'{х) = 1 + ж, причем /'(0) =р'(0) = 1. Первым рассмотрим случай ж > 0. Чтобы воспользоваться следствием 5.3, нужно сначала сравнить функции f'(x) и ^'(ж) при ж > 0. Для этого вычислим f"(x) = ех и «/"(з) = 1. Поскольку при ж > 0 ех > 1, т.е. /"(х) > ^//(ж)) согласно следствию 5.3, f(x) > у'(ж), т.е. ех > 1 -f ж, а значит, и /(ж) > , или €х> 1 + х + ж2/2 Уж>0.
5.3. Теорема Коши 117 В случае х < О положим х = -и, и > О и запишем f(x) = = h(u) = e"u, Л'(и) = -е-*, Л"(и) = е""; д(х) = s{u) = 1 - и + + t*2/2, s'(u) = -l + u, s"(u) = l. Поскольку s"(u) > /i"(ti) Vu> > 0, a s'(0) = Л'(0), в силу следствия 5.3 при и > 0 s'(u) > h'(u)y т.е. —1 -h г* > —е tt, или е и > 1 - а, а значит, и ех > 1 + х Vx < 0. Но в силу того же следствия при ^(и) > h'(u) для и > 0 и 5(0) = Л(0) справедливо неравенство s(u) > h(u) Vw > 0, или 1 - и-\-и2/2 > е~и, а значит, и ех<1 + х + х2/2 Vx < 0, или ех — 1-х < х2/2 Vx < 0. Графики функций /(х), ^(х) и = 1 + х представлены на рис. 5.9. У4 /(*)-е*// I1+х+х2/2-д(х) Рис. 5.9 5.3. Теорема Коши Теорему Лагранжа обобщает следующая теорема. Теорема 5.4 (Коши). Пусть функции f(x) и <?(х): 1) непрерывны на отрезке [а, 6]; 2) дифференцируемы в интервале (а, 6); 3) производная д'(х) не обращается в нуль в интервале (а, Ь). Тогда между точками а и 6 найдется хотя бы одна такая
118 5. ОСНОВНЫЕ ТЕОРЕМЫ точка с (а< с<Ь), для которой /(6) - /(а) /'(с) (5.4) ^ Покажем, прежде всего, что д(Ь) ф д(а), т.е. левая часть (5.4) имеет смысл. Действительно, если бы д(Ь) = д(а)у то для функции д(х) на отрезке [а, Ь] были выполнены все условия теоремы Ролля, а значит, существовала бы такая точка с\ € (а, 6), в которой д'{с\) = 0, что противоречит третьему условию данной теоремы. Теперь рассмотрим вспомогательную функцию Эта функция непрерывна на отрезке [а, 6] и дифференцируема в интервале (а, Ь) как линейная комбинация непрерывных и дифференцируемых функций на соответствующих промежутках. Кроме того, F(a) = F(b) = 0. Таким образом, функция F(x) удовлетворяет всем условиям теоремы Ролля, а значит, существует такая точка с € (а, 6), в которой F'(c) = 0, т.е. откуда следует (5.4). ► Здесь необходимо предостеречь от соблазна „элементарно" доказать теорему Коши путем двукратного применения к функциям f(x) и д(х) формулы Лагранжа (5.1) в виде f(b)-f(a) = f'(c)(b-a) и д(Ь)-д(а)=д'(с){Ь-а) с последующим делением соответствующих частей этих равенств и сокращением на 6 - а ф 0. Дело в том, что, действительно, для каждой из функций f(x) и д(х) существует хотя
5.3. Теорема Копт 119 бы одна, но своя точка с £ (а, 6), для которой справедлива формула Лагранжа, но совсем не обязательно, чтобы эти точки совпадали для разных функций. Замечание 5.2. Бели в теореме Коши опустить третье условие, то утверждение теоремы будет верно не для (5.4), а для формулы . (/(*) - /(а)У(с) = (д(Ъ) - g(a))f'(c). (5.5) Для доказательства (5.5) достаточно рассмотреть вспомогательную функцию F(x) = (/(6) - f(a))g(x) - (д(Ь) - g(a))f(x) и применить к ней теорему Ролля. # Рассмотрим геометрическую интерпретацию теоремы Коши. Бели функция д(х) строго монотонна на отрезке [а, 6], то соотношения У = /(*). . ., х е [о, ь] задают параметрически функцию y(z) с областью определения д([а, Ь]) (см. 2.4), а х играет роль параметра, изменяющегося на отрезке [а, 6]. На рис. 5.10 изображен график функции у(z) для случая д(а) < д(Ь). Производная yf(z) этой функции в точке zq = flf(c), с € (а, 6), определяющая угловой коэффициент касательной к графику в точке M(zq\ y{zo)), согласно (2.21), равна f'(c)/g'(c), что совпадает с правой частью (5.4). Поэтому геометрический смысл соотношения (5.4), обычно называемого формулой Коши конечных приращений, состоит в том, что на произвольной дуге графика дифференцируемой функции, заданной параметрически, между концами
120 5. ОСНОВНЫЕ ТЕОРЕМЫ А(д(а); /(о)) и B(g(b); f(b)) этой дуги всегда можно найти хотя бы одну точку М (на рис. 5.10 таких точек две — М\ и М2), в которой касательная к графику параллельна стягивающей концы дуги хорде АВ с угловым коэффициентом У № /(а) О 9(а) д(с2) д(Ъ) Рис. 5.10 Теореме Коши можно дать и механическое толкование. Пусть функции z = д(х) и у = /(ж) задают изменение во времени х координат точки при ее движении в плоскости zOy, а график зависимости y(z) является траекторией этой точки. Тогда направленный по касательной к траектории вектор скорости точки с проекциями д'{х) и f'(x) соответственно на оси Оъ и Оу в некоторый промежуточный момент времени с £ (а, Ь) будет коллинеарен вектору перемещения точки за промежуток времени 6 —а, имеющему проекции д(Ь) — д(а) и /(6) - /(о) соответственно на оси Ог и Оу. Возможна и иная механическая интерпретация (5.4): при одновременном в течение некоторого периода времени b — а прямолинейном движении двух точек хотя бы в один из промежуточных моментов времени с € (а, Ь) отношение мгновенных скоростей этих точек совпадает с отношением их средних скоростей за этот период, если мгновенная скорость одной из них не обращается в нуль в интервале (а, Ь).
5.3. Теорема Коши 121 Замечание 5.3. При доказательстве теорем Лагранжа и Коши была использована теорема Ролля. В то же время при д(х) = х имеем д'{х) =д'(с) = 1, g(b) - g(a) = b - а йот (5.5) приходим к утверждению теоремы Лагранжа в виде (5.1), а добавление условия f(a) = f(b) приводит к утверждению теоремы Ролля. # Утверждения трех этих теорем могут быть представлены следующим образом. Рассмотрим функции /(ж), д(х) и h(x), непрерывные на отрезке [а, Ь] и дифференцируемые в интервале (а, 6), и составим определитель F(x) = f(x) g(x) h(x) f(a) g(a) h(a) f(b) g(b) k(b) который представляет собой линейную комбинацию этих функций, также непрерывную на отрезке [а, Ь] и дифференцируемую в интервале (а, 6). При х = а или х = b из равенства нулю определителя с двумя одинаковыми строками следует F(a) = F(b) = 0, т.е. для функции F(x) выполнены все условия теоремы Ролля и поэтому существует такая точка с G (а, 6), в которой /'(с) g'(c) h'(c) F'(c) = /(а) д(а) h(a) f(b) g(b) h(b) = 0. (5.6) Если положить h(x) = 1, то из (5.6) следует (5.5), а при h(x) = 1 и д(х) = х получим формулу Лагранжа (5.1). Замечание 5.4. Теорема Коши (как и теоремы Ролля и Лагранжа) носит лишь достаточный характер. Пример 5.6. Трамвай проехал расстояние S между двумя остановками за промежуток времени Г. Убедимся, что при движении ускорение трамвая по абсолютному значению в некоторый момент времени было не меньше 45/Т2.
122 5. ОСНОВНЫЕ ТЕОРЕМЫ Зависимость s(t) пройденного пути от времени t непрерывна на отрезке [О, Т]. Скорость sf(t) трамвая также считаем непрерывной на этом отрезке и дифференцируемой в интервале (О, Т) функцией времени t (в противном случае при скачкообразном изменении скорости ускорение по абсолютному значению бесконечно велико, что требует приложения бесконечно больших сил). Проведем сравнение функции s(t) с составной функцией ult) _ / «72 vt e [о, г/2], W~\ (T-t)2/2 У«€[Г/2, Т], которая описывает равноускоренное движение некоторого тела за первую половину промежутка времени Т и равнозамедлен- ное — за вторую половину этого промежутка. Для этого применим (5.4) на отрезке [О, Т/2] к функциям s(t) и u(t) = t2/2: s{T/2) - s(0) _ s{T/2) - 5(0) _ ЦТ/2) - Ц0) - Т2/8 _ s'jtj) _ s'(h) U'(t\) t\ а на отрезке [Т/2, Т] — к функциям s(t) и u(t) = (Т - t)2/2: s(T)-s(T/2) _s(T)-s(T/2)_ и(Т) - и(Т/2) -Т2/8 = s'(t2) = s'{t2) u'(t2) , t2e(T/2,T). (5.8) После почленного вычитания (5.8) из (5.7), учитывая, что s(T) - s(0) = 5, получим в(Т)-8(0) 85 ту» ~
Д. 5.1. О непрерывности производных 123 Поскольку на остановках трамвая s'(0) = sf(T) = 0, с помощью формулы Лагранжа (5.1) запишем правую часть (5.9) в виде = s"(t3)-s"(t4)} t\ T-t2 где tz € (0, ti) и Ц 6 (*2, Т). Используя последнее равенство в (5.9) и переходя к абсолютным значениям, найдем 85/Т2 = \s"(t3) - s"(t4)\ < \s'%)\ + \s'%)\. Таким образом, даже для случая равенства абсолютных значений ускорения в моменты времени *з и t\ (|«"($з)| = 15//(*4)|) существует такой момент времени *о € (О, Т), что абсолютное значение ускорения |s"(*o)| ^ 45/T2. Итак, при поездках на трамвае перегрузка (отношение ускорения трамвая к ускорению g = 9,81 м/с2 свободного падения) не менее 4S/(gT2) неизбежна. Дополнение 5.1. О непрерывности производных Для существования в точке х = а второй производной /"(а) функции f(x) необходимо, чтобы была непрерывной в этой точке первая производная /'(х), т.е., согласно (1.1), /() /() (5.10) х—fa Это непосредственно следует из теоремы 1.2 о непрерывности дифференцируемой функции. Однако дифференцируемость функции }{х) в некоторой окрестности точки х = а, что равносильно по теореме 1.1 существованию в этой окрестности производной /'(я), еще не гарантирует выполнения условия (5.10). В этом можно убедиться на следующем примере.
124 5. ОСНОВНЫЕ ТЕОРЕМЫ Пример. Функция _ f x2sin(l/z), х ф 0; I 0, х = О дифференцируема на всей числовой прямой. Действительно, для любого хфО имеем f'(x)=2xsm(l/x)—cos(l/x)} а в точке d lim A = hm Ax sin ■— = 0, Дг-Ю Ах Дх-Ю Ах т.е. /'(0) = 0. Но f'{x) при х —► 0 не имеет ни конечного, ни бесконечного предела. Это означает, что в точке х = 0 функция }'{х) терпит разрыв, а вторая производная функции f(x) не существует. График этой функции показан на рис. 5.11. \ Рис. 5.11 Рассмотрим более общий случай, когда /(0) = 0 и }{х) = = xmsin(l/z) при m£N и х ф 0. Тогда для любого х ф 0 имеем /'(ж) = ma;™'1 sin(1 /х) - хт~2соъ(\/х) и условие (5.10) выполнимо в точке х = 0 при m ^ 3. Однако вторая производная /"(0) существует лишь при т ^ 4, поскольку г hm Дх-Ю = lim Ах-уО sin-: (Аж) Аж т-З COS AaJ
Д.5.1. О непрерывности производных 125 существует и равен нулю, если га ^ 4. Методом математической индукции можно показать, что n-л производная f^n\x) существует в точке х = 0 при га ^ 2га, а непрерывна, если (при п = 0 сама функция /(ж) непрерывна, если # Итак, дифференцируемая во всех точках некоторого промежутка функция f(x) может иметь в этом промежутке точки разрыва производной }'{х). Покажем, что такими точками для функции f'(x) могут быть лишь точки разрыва второго рода. Для этого предварительно докажем следующее утверждение. Теорема 5.5. Бели функция f(x) непрерывна в точке а, дифференцируема в некоторой проколотой окрестности этой точки и f'(x) —>■ А при х —»• а, то данная функция дифференцируема в точке а, а ее производная f'(x) непрерывна в этой точке. < По условию теоремы существует такое 6 > 0, что функ- о ция f(x) дифференцируема в проколотой окрестности U(a, 8). о Возьмем произвольное 3i€U(a, 5). Функция f(x) непрерывна на отрезке [а, х\] (или на [zi,a] при х\ < а) и дифференцируема в интервале (а, х\) (в (a?i, а) при х\ < а). Поэтому в силу теоремы 5.3 Лагранжа /(*!) - f(a) = f'(a + O(£i - а)) (хх - a), 0 < в < 1, или Правая часть (5.11) имеет предел при х\ —> а, равный А. Следовательно, и левая часть (5.11) имеет тот же предел при х\ —► а, который, согласно определению 1.2, представляет собой производную f'(a) функции /(ж) в точке х = а. Таким образом, функция f(x) дифференцируема в точке а, а функция f'(x) непрерывна в этой точке. ►
126 5. ОСНОВНЫЕ ТЕОРЕМЫ Замечание 5.1. Доказанную теорему нетрудно перенести на односторонние пределы и односторонние производные. А именно, если функция f(x) непрерывна в точке х = а справа, дифференцируема в интервале (а,а + 6) и существует lim /'(*) =/'(а+ 0) 6 R, Кх+О то данная функция имеет в точке х = а непрерывную правую производную Д (о) = /'(а + 0). Для доказательства достаточно в (5.11) перейти к пределу при х\ -* а + 0. Аналогично можно показать, что из существования левого предела /;(a-0)€R производной }'{х) в точке х = а следует существование в этой точке непрерывной левой производной !(a) = /'(a-0). # Предположим теперь, что х = а является точкой разрыва первого рода для производной }'{х) дифференцируемой в этой точкефункции f(x). Тогда, согласно определению 9.6 [I] точки разрыва первого рода, 3 lim /'(*) = /'(а + 0)ЛЗ lim f'(x) = Да-0). xm+O г-ю-0 Если /'(а И- 0) = /'(а - 0) = А (точка устранимого разрыва), то, согласно теореме 7.1 [I] о связи односторонних пределов функции в точке с двусторонним пределом этой функции в той же точке, существует предел функции f'(x) в точке х = а и он равен Л, т.е. 3/'(а) = А и функция f(x) непрерывна в этой точке, что противоречит сделанному предположению. Если же f'(a + 0) ф/'(а-0), то в силу замечания 5.1 /'(а + 0) = = Д(а) и /'(а-0) = /1(а), а тогда Д (a) ^/l(a), т.е. функция f(x) недифференцируема в точке х — а (см. 1.6), что также противоречит сделанному предположению. Итак, если функция дифференцируема в окрестности некоторой точки, то ее производная в этой точке либо непрерывна, либо имеет точку разрыва второго рода.
Д.5.1. О непрерывности производных 127 Если в точке х = a 3/'(а) ф О, то в силу (1.2) и определения 1.2 производной в некоторой окрестности этой точки разностное отношение (f(x) - f(a))/(x — а) сохраняет знак f'(a). Это означает, что 36 > О : Уж 6 U(a; S) f(x) > /(о) в случае f'(a)(x - а) > О и f(x) < f(a) в случае f'(a)(x - а) < 0. Если, кроме того, производная f'(x) в точке х — а непрерывна, то существует окрестность этой точки, в которой f'(x) сохраняет знак производной /'(а). Тогда 3^i > 0 : Vxi; Х2 6 U(a; 8i) при xi < х2 f{x2) > f(xi), если /'(a) > 0, и f(x2) < f(xx), если /'(a) < 0, т.е. в этой окрестности непрерывная функция у = f[x) строго монотонна и имеет непрерывную и строго монотонную обратную функцию х = /~! (у) (см. теорему 9.6 [ I ]). Таким образом, в условии теоремы 2.3 о производной обратной функции достаточно было потребовать существования у функции у = f(x) в точке х = а непрерывной производной f'(a) ф 0, или с учетом /(а) = Ь 3 lim /'(x) = /'(о) / 0 =* 3(Г' x—ta Аналогично можно видоизменить условие существования производной функции, заданной параметрически. Еще раз подчеркнем, что непрерывность f'(x) в точке х = а является лишь необходимым условием существования /"(а), а для существования /М(а) необходима непрерывность в этой точке f(n~l)(x). Из существования /^(а), согласно определению 1.2 производной, следуют существование f(n~l)(x) в некоторой окрестности точки а и непрерывность f(n~l>(x) в этой точке. В свою очередь, в этой окрестности, согласно теореме 1.2 о непрерывности дифференцируемой функции, будет непрерывна производная f(n~2)(x) и все производные меньшего порядка вплоть до п — О, т.е. непрерывна и сама функция f(x). Ясно, что все сказанное относится и к односторонним производным в точке а, и к соответствующим полуокрестностям этой точки.
128 5. ОСНОВНЫЕ ТЕОРЕМЫ Рис. 5.12 Вопросы и задачи 5.1. Какие условия теоремы Ролля нарушены для функций, графики которых изображены на рис. 5.12? 5.2. Доказать, что Vp 6 R уравнение pf(x) + f'(x) = 0 имеет хотя бы один корень в интервале (а, 6), если f(x) ф О, х f(a) = f(b) и функция f(x) дифференцируема на отрезке [а, 6]. 5.3. Доказать, что существует такая точка с € (а, 6), в которой с/'(с) = /(с), если функция f(x) удовлетворяет условиям теоремы Лагранжа на отрезке [а, 6], а > О и, кроме того, bf(a) = af(b). 5.4. Доказать, что существует такая точка с 6 (а, 6), в которой f'(c)/f(c) = д'(с)/д(с), если функции f(x) и д(х) удовлетворяют условиям теоремы Коши на отрезке [а, Ь] и, кроме того, f(a)g(b) = f(b)g(a) и f{x)g(x) ф О Vx e [а, 6]. 5.5. Доказать, что уравнение }'(x)f(x) = x имеет хотя бы один корень в интервале (о, 6), если функция f(x) удовлетворяет условиям теоремы Лагранжа на отрезке [а, 6] и, кроме того, f(b)-f(a) Ь + а b — a №-W 5.6. Доказать, что уравнение 3х + 4* = 5* имеет на R единственное решение х = 2. 5.7. Сколько нулей может иметь функция /(ж) в интервале (а, 6), если она дважды дифференцируема в этом интервале и Ухе {а, 6)?
Вопросы и задачи 129 5.8. Определить значение с в формуле Лагранжа (5.1) на отрезке [0, 2] для составной функции = \ (3 - х2)/2 V* € [0, 1], \ 1/ж VxG (1,2]. 5.9. Доказать неравенства: а) | sin х — sin у| < |а; — у| Уж,у€К; б) | arctgz - arctgy| ^ |ж - у\ Уж, у € R; в) (х-у)/х<\п(х/у)<(х-у)/у при 0<у<ж; г) 2tga:>shx Уж € (0, 7г/2); д) ж-ж2/2<1п(1 + ж)<ж Уж>0; е) tgж + 2sinж>3ж Уж € (0, тг/2); ж) tgж > ж + ж3/3 Уж G (0, 7г/2); з) 1п(1 + созж) <1п2-ж2/4 Уж€(0, 7г); и) tgж/tgy>ж/2/ при 0<у<ж<7г/2; к) ж2созж < в1п2ж Уж € (0, тг/2). 5.10. Что можно сказать о функции, если ее n-л производная является линейной функцией, определенной на всей числовой прямой ? 5.11. Доказать, что существует такая точка с G (0, 2), в которой /;/(с) = 0, если функция /(ж) непрерывна на отрезке [О, 2], дважды дифференцируема в интервале (0, 2) и /(0) = 0, /(1) = 1, /(2) = 2. 5.12. Определить вид функции /(ж), удовлетворяющей условиям теоремы Лагранжа на отрезке [а, 6] и уравнению pf(x) = f'(x) Уж€ (a, 6),'p€R. 5.13. Доказать справедливость неравенств при ж > 1: а) 2ж3 + Зж2 - 12ж + 7 > 0; б) Зж4 + 8ж3 -6ж2 -4ж + 19> 0; в) ж3 + 3ж + 6ж1пж + 2>6ж2; г) ж4 + 8ж + 12ж21пж > 8ж3 + 1; д) 2>/ж>3-1/ж; е) е*"1 +1пж -2ж + 1 > 0. 9-544
130 5. ОСНОВНЫЕ ТЕОРЕМЫ 5.14. Доказать неравенства при х > 0: а) x-x3/3!<sinx<x-x3/3! + x5/5!; б) l-x2/2<cosx<l-x2/2 + x4/4!; в) *«> г) е*<(1+х)1+*; д) х2 > xarctgx > ln(l + x2); е) ех > {ех - 1)/х > ех/2; ж) х + ж2/2 > (х +1) 1п(х +1) > х + z2/2 - х3/3!; з) 1-х2 3 и) 1/\/хтТх'>1п(1 + 1/х)>2/(2ж 5.15. Доказать, что существует такая точка с 6 (а, 6), в которой 6/(а) - а/(6) = (/(с) - с/'(с))(6 - о), если функция /(х) удовлетворяет условиям теоремы Лагранжа на отрезке [о, 6], а > 0. 5.16. Найти зависимость параметра 6 в (5.2) от х и Ах для функций х3 и ех. Доказать, что для обеих функций 9 -> 1/2 при Дх -> 0. 5.17. Найти значение параметра 9 в (5.2) для функции arctgx на отрезке [0, 1] и функции lnx на отрезке [1, 6], 61
6. РАСКРЫТИЕ НЕОПРЕДЕЛЕННОСТЕЙ Применим понятие производной и доказанные в гл. 5 теоремы для раскрытия неопределенностей прежде всего вида [0/0] и [оо/оо]. Правило раскрытия этих неопределенностей связывают с именами швейцарского математика И. Бернулли (1667-1748), сформулировавшего это правило, и французского математика Г. Лопиталя (1661-1704), который опубликовал его в первом печатном руководстве по дифференциальному исчислению. 6.1. Раскрытие неопределенности вида [0/0] Исследуем вначале вопрос о пределе отношения двух бесконечно малых (б.м.) при я-» а функций f(x) и д(х). Теорема 6.1. Пусть 1) функции f(x) и д(х) определены и дифференцируемы в о некоторой проколотой окрестности U (о) точки а, 2) lim fix) = 0 и Hm g(x) = О, х-¥а х-*а 3) д'(х) ф 0 во всех точках указанной окрестности и, наконец, 4) существует (конечный или бесконечный) предел отношения производных д'(х) Тогда существует и предел отношения самих функций и lim 44 = Km 4гт = L. (6.1) х¥а д[х) х-¥а д'[х) 9*
132 6. РАСКРЫТИЕ НЕОПРЕДЕЛЕННОСТЕЙ < Доопределим функции f(x) и д(х) в точке х = а, положив /(о) = д(а) = 0. Тогда эти функции будут определены и непрерывны в окрестности U(a) точки а, включая точку а, так как в точке а их значения совпадают (согласно второму условию теоремы) с их пределами при х —> а, а в прочих точках этой окрестности непрерывность вытекает из первого условия о дифференцируемости данных функций. Таким образом, с учетом третьего условия теоремы к рассматриваемым функциям теперь применима теорема 5.4 Кошщ так что в силу формулы (5.4) Коши конечных приращений запишем Дх) _ Дх) - f(a) f (с) д(х) д(х)-д(а) д О Здесь х — некоторая точка из окрестности U(a), а с=а + + 6(я - а), причем 0 < в < 1. Если х -> а, то, очевидно, и с-¥а. Поэтому из условия lim (/'(ж)/0;(х)) = ^ следует, что и Hm (/'(c)/y'(c)) = £> т.е. существует конечный или бесконечный предел правой части (6.2). Но тогда существует и предел (конечный или бесконечный) левой части (6.2) и справедливо (6.1). ► Итак, доказанная теорема сводит предел отношения б.м. функций к пределу отношения их производных (если, конечно, последний предел существует). Это правило раскрытия неопределенности вида [0/0] называют правилом Вернулли — Лопиталл. Нередко предел отношения производных заданных функций удается найти путем элементарных преобразований. Например, для б.м. при х->0 функций tgz-ж и ж-sins отношение их производных несложно упростить: _ l/cos2a;-l _ l-cos2x 1-fcosx (x — sin ж)' 1 —cosx (1—cos ж) cos2 ж cos2
6.1. Раскрытие неопределенности вида [О/О] 133 Отсюда следует, что предел отношения производных при х -> О существует, причем (tgx-x)' 1+cosx lim -г :—г: = hm ъ— = 2- аг-40 (Ж — Sin Ху х->0 COS1 X Заданные функции tgx-x и x-sinx удовлетворяют условиям теоремы 6.1, и поэтому, согласно (6.1), tgx-x (tgx-x)' hm ——:— = hm -г-2—:—'— = 2. - sin a; a?-*o (x — sins)' В этом примере отношение производных, в свою очередь, являлось неопределенностью вида [0/0], но ее удалось раскрыть, выполнив элементарные преобразования. Однако в других случаях может понадобиться применить теорему 6.1 повторно, а именно, если б.м. при х -t a функции f'(x) и д'(х) удовлетворяют всем условиям теоремы 6.1, включая существование при x-ta предела отношения f"(x)/g"(x), то, применяя правило Бернулли — Лопиталя к отношению f'(x)/g'(x), в итоге получаем м=ы m=lim m=L. дух) х-** д \х) x-*a g (х) Пример 6.1. Найдем предел отношения б.м. при х —t 0 функций f(x) = 1п(1+ж2) и д(х) = cos3x - ех . Производные f'(x) = 2ж/(1 -|- х2) и д'(х) — -3sin3x ~ 2xex этих функций сами являются функциями, б.м. при х -► 0, но нетрудно установить существование предела при х -> 0 отношения вторых производных f'(x) = 2(l-x2)/(l-fx2)2 д"{х) -9cos3x - 2е*2 - 4х2е*2'
134 в. РАСКРЫТИЕ НЕОПРЕДЕЛЕННОСТЕЙ равного —2/11. Следовательно, согласно (6.3), .. ln(l + a) hm — -~ = urn *-+o cos Зх - ех *-ю -3 sin Зх - 2хех 2 3~ И' l j т.е. искомый предел равен —2/11. Замечание 6.1. При нахождении предела отношения функций по правилу Бернулли — Лопиталя обычно используют такую запись, как в (6.4), а в существовании нужных производных и пределов убеждаются непосредственно в ходе вычислений. Поэтому в дальнейшем будем приводить лишь запись необходимых преобразований. Замечание 6.2. Бели все условия теоремы 6.1 выполнены только в правой (или только в левой) полуокрестности точки а, то эта теорема верна в отношении только правостороннего при х -* а + 0 (или только левостороннего при а; —>• а - 0) предела отношения f(x)/g(x) функций в этой точке. В случае бесконечного одностороннего предела будем иметь либо +оо, либо —оо. Пример. Из функций f(x) = y/x и ^(ж) = sinx первая определена лишь в правой полуокрестности точки х = 0, так что для этих функций три первых условия теоремы 6.1 выполнены только в правой полуокрестности точки х = 0, а именно при 0 < х < 7г/2. В этой точке существует правосторонний предел отношения производных указанных функций: hm .; ' = hm , . \, = hm = hm —7= = +00. х-*+од'(х) x-H-o(sinx)' х-++о cosx х-ц-о 2 ух cos х Следовательно, согласно теореме 6.1 и замечанию 6.2, в точке х = 0 существует бесконечный правосторонний предел +оо отношения самих функций. #
6.1. Раскрытие неопределенности вида [О/О] 135 Теорему 6.1 нетрудно распространить на случай, когда аргумент х стремится к бесконечному пределу, т.е. к оо, +оо или —оо. Теорема 6.2. Пусть 1) функции f(x) и д(х) определены и дифференцируемы в окрестности бесконечно удаленной точки, т.е. при |х| > 6 > О, 2) lim fix) = 0 и lim д(х) = О, 3) д'{х) ф 0 во всех точках указанной окрестности, 4) существует (конечный или бесконечный) д (х Тогда существует и lim (f(x)/g(x)), причем lim Щ = lim Щ = L. (6.5) х-юо д[х) х-юо д'\х) < Преобразуем переменное х по формуле х = l/t} или t = 1/х. Тогда если х -> оо, то t -» 0, и наоборот. По второму условию теоремы lim/(l/£) = 0 и \\mg(l/t) = 0, а в силу четвертого условия \\m (f'x(l/t)/g'x(l/t)) = L. К функциям f(l/t) и g{\/t) можно применить теорему 6.1, согласно которой .im !Ш - Но так как существует предел в правой части этого равенства, то существует равный ему предел в левой части (6.5), что доказывает справедливость (6.5), в том числе и для случаев х А ±оо, которым соответствует t —>• ±0. ► Замечание 6.2 применительно к теореме 6.2 означает, что если ее условия выполнены либо только при х -> -f оо, либо только при х -> —оо, то эта теорема верна в отношении
136 6. РАСКРЫТИЕ НЕОПРЕДЕЛЕННОСТЕЙ лишь соответствующего одностороннего предела отношения функций. В случае бесконечного одностороннего предела он будет иметь определенный знак. Пример. Из функций f(x) = l/y/х и д(х) = tg(l/a:) - — sin(l/x) первая определена лишь при х > О, а первые три условия теоремы 6.2 выполнены для них при х > 2/я\ Поэтому теорема 6.2 применима к вычислению предела отношения f(x)/g(x) при х —> +00, причем с учетом замечания 6.1 = lim — lim —т- . ч s-Ц-оо tg(l/x) —SI = lim (tg(l/x) - sin (1/COS2(1/X) -COS(1/X))(-1/X2) cos2(l/g) = hm =+oo. # 2 l-COS3(l/x) Геометрический смысл (6.1) можно пояснить следующим образом. Бесконечно малые при х —¥ а функции у = f(x) и z — g(ж), доопределенные в точке а, удовлетворяют условиям теоремы Коши и задают параметрически функцию y(z) (см. 5.3), график которой в координатной плоскости zOy проходит через начало координат (рис. 6.1). При этом отношение f{x)/g{x) = tgfi VxG U (а) характеризует наклон секущей Рис. 6.1 ОМ, проходящей через начало координат и точку M(g(x), f(x)). При х ->- а и 2->0, и ?/—^0, а точка М приближается к началу координат. Поэтому предельное положение секущей совпадает с положением касательной ОТ к графику в точке О, причем tga = L. Ясно, что при L = oo касательная будет параллельна оси Оу. Если f(x) и д(х) являются б.м. функциями при х -f оо (или я то тот же геометрический смысл будет иметь и (6.5).
6.2. Неопределенность вида [оо/оо] 137 Итак, общая схема применения правила Бернулли — Ло- питаля раскрытия неопределенности вида [0/0] для отношения функций f(x)/g(x) состоит из трех этапов: 1) проверка выполнения условий теоремы 6.1 (или теоремы 6.2) по отношению к функциям f(x) и д(х) по отдельности; 2) проверка существования предела отношения }'{х)/д'{х) производных этих функций, и если он существует, то его вычисление, и тогда 3) применение (6.1) (или (6.5)). 6.2. Неопределенность вида [оо/оо] Исследуем теперь вопрос о пределе отношения двух функций, бесконечно больших (б.б.) при х -t a. В этом случае справедлива теорема, аналогичная теореме 6.1. Теорема 6.3. Пусть 1) функции f(x) и д(х) определены и дифференцируемы в о некоторой проколотой ^-окрестности U(a, S) точки а, 2) lim f(x) — оо и lim (/(ж) = оо, х—ьа х—fa 3) g'{x) ф 0 во всех точках указанной окрестности и, наконец, 4) существует (конечный или бесконечный) предел отношения производных x-fa g' Тогда существует и предел отношения самих функций и Um = lim Щ х-+ад(х) х-+ад'{х) (6.6) < Рассмотрим сначала случай конечного L. Из первого условия о дифференцируемости функций вытекает их непрерывность в указанной окрестности. Непрерывная
138 6. РАСКРЫТИЕ НЕОПРЕДЕЛЕННОСТЕЙ в некоторой проколотой окрестности точки а функция может иметь в этой точке бесконечные односторонние пределы лишь определенного знака. Поэтому всегда у точки а существует такая полуокрестность, в которой функция не обращается в нуль и сохраняет знак бесконечного одностороннего предела, возрастая по абсолютному значению по мере приближения х к а. Зададим произвольное е > 0 и найдем такое т) (0 < rj < 5), о о что в проколотой 77-окрестности U(a, г/) С U(a, S) точки а д(х) ф О и, кроме того, -L e 2 Vz € U (a, 77) (6.7) (это возможно в силу первого и четвертого условий теоремы). о Выберем значение х € U(a, 77) и рассмотрим отрезок [ж, жо], жо < a -f 77, если ж > а, или отрезок [жо, ж], жо > а — 77, если ж < а. На любом из этих отрезков функции /(ж) и д(х) удовлетворяют условиям теоремы 5.4 Коши. Поэтому, согласно (5.4), /(г) ~ /Ы /;(с) /й йч (6.8) Тогда из (6.7) и д(х)-д(х0) где точка с лежит между точками х и (6.8) получим /(*) - /Ы 4 д(х)-д(х0) Учитывая, что на любом из рассматриваемых отрезков д(х) Ф 0, запишем тождество (6.9) и перейдем в нем с учетом неравенства (1.2) [I] треугольника к абсолютным значениям /(£) - Ьд(х0) 1- № - /Ы
6.2. Неопределенность вида [оо/оо] 139 Зафиксируем xq, оставляя х переменным. Тогда д(х) —> оо при х —> а+0 (или при х —» о — 0) и первое слагаемое в правой части неравенства будет стремиться к нулю, т.е. найдется такое 7 (0 < у < г} < 6), что это слагаемое станет меньше е/2 при о любом х 6 U (о, 7)- В этом случае второе слагаемое согласно (6.9) также будет меньше г/2, поскольку 0 < |1 -д(хо)/д(х)\ < < 1 в силу знакопостоянства и возрастания по абсолютному значению функции д{х) как при х -+ а+0, так и при х-*а-0. Таким образом, №_ Ф) что означает в силу произвольного выбора е > 0 существование предела отношения f(x)/g(x) заданных функций и справедливость (6.6). Если в четвертом условии теоремы L = оо, то у точки а существует проколотая окрестность, в которой f'(x) ф 0, и тогда получим lim [д1 {х)/J'(х)) = 0. Отсюда, согласно <е Vz€U(a, 7), только что доказанному утверждению, при х ->• а существует предел отношения g(x)/f(x) и этот предел равен нулю, т.е. lim (f(x)/g{x)) = оо. X—т(Х Итак, утверждение теоремы доказано полностью. ► Теорему 6.3 (как и теорему 6.1) нетрудно распространить на случай, когда аргумент х стремится к бесконечному пределу, т.е. к оо, +оо или —оо. Теорема 6.4. Пусть 1) функции f(x) и д(х) определены и дифференцируемы при |z| > 6>0, 2) lim fix) = оо и lim o(x) = oo, 3) д'(х)фО при 4) существует (конечный или бесконечный) предел отношения производных в. 4М д'ух
140 6. РАСКРЫТИЕ НЕОПРЕДЕЛЕННОСТЕЙ Тогда существует и предел отношения самих функций и hm ±-j-^- — lim ; ' = L. хчоо д{х) х-Чоо д (x) (6.10) После введения нового переменного t = l/х доказательство этой теоремы проводится аналогично доказательству теоремы 6.2. Таким образом, правило раскрытия неопределенности вида [оо/оо] (его также называют правилом Бернулли — Лопиталя), при соблюдении условий теорем 6.3 и 6.4 связано с использованием формул (6.6) и (6.10), совпадающих с (6.1) и (6.5) соответственно. При этом остаются справедливыми по своему смыслу замечания 6.1 и 6.2. Геометрический смысл (6.6) и (6.10) при L € R заключается в том, что график параметрически заданой уравнениями 1/ = /(х) и z = g(x) функции y(z) в координатной плоскости zOy имеет асимптоту ATq (рис. 6.2) и по мере удаления точки M(g(x); f(x)) от начала координат углы наклона /5 и а соответственно прямой ОМ и касательной МТ сближаются между собой и стремятся к углу с*о наклона асимптоты, причем tgao = L. Отметим, что на рис. 6.2 график соответствует случаю z = g(x) —>+оо и y = f(x) —Ц-оо при х—¥ а или х —> оо (х —►zhoo). Ясно, что в случае L = оо а0 = 7г/2 и график не будет иметь асимптоты. У 0 А *~ У X /y(z) ] а(х) г Рис. 6.2
6.2. Неопределенность вида [оо/оо] 141 Одна или обе б.б. функции f(x) и д(х) могут быть определены лишь в одной из проколотых полуокрестностей либо конечной точки а, либо бесконечной точки расширенной числовой прямой. Тогда можно говорить либо об одностороннем пределе отношения f(x)/g(x) в точке а, либо о пределе этого отношения только при х —> Н-оо или только при х —t —оо. Если в упомянутой полуокрестности выполнены все условия теоремы 6.3 или теоремы 6.4, то правило Бернулли — Лопиталя применимо для вычисления соответствующего одностороннего предела. В случае бесконечного одностороннего предела отношения f'(x)/gf(x) производных он будет иметь определенный знак. Следовательно, этот же знак будет иметь бесконечный односторонний предел отношения f(x)/g(x) функций. Пример. Функции f(x).= ctgx и д(х) = \пх при х —> +0 являются 6.6., но функция lnx определена лишь в правой проколотой полуокрестности точки х = 0. В этой полуокрестности обе функции удовлетворяют первым трем условиям теоремы 6.3. Кроме того, существует бесконечный правосторонний предел определенного знака для отношения их производных .. /'(*) .. (ctgx)' -l/sin2a -x hm ,. . = hm ——— = lim —— = hm . 0 = —oo. x-»+o g'[x) x-*+o (In ж)' x-h-o l/x Следовательно, существует бесконечный правосторонний предел того же знака для отношения самих функций. Пример 6.2. Сравним поведение при х —> +оо б.б. функций: показательной ах (а> 1); степенной xs (s > 0) и логарифмической logax (a > 1). Эти функции удовлетворяют условиям теоремы 6.3, и, согласно (6.6), с учетом замечания 6.1 logax (loga*)' r l/(zlna) 1/lna hm = lim , " / = lim -^—-r-2- = lim — = 0; + s H \XS) x->+oo SXs~l x-f+oo SXS hm — = hm / 4< = hm —:— = 0. 1 (axy xl
142 б. РАСКРЫТИЕ НЕОПРЕДЕЛЕННОСТЕЙ Поскольку Xs/ах = (ж/а*/*)* = (ж/6х)3, где Ь = а1/5 > 1, и в силу непрерывности степенной функции Xs .. /ху ( х\* um -- = hm I —) = I hm тг I = 0. Рис. 6.3 Итак, при х —у +оо показательная функция (при а > 1) является б.б. более высокого порядка (растет быстрее), чем степенная с любым положительным показателем s, которая, в свою очередь, является б.б. более высокого порядка, чем логарифмическая функция при a > 1 (рис. 6.3). 6.3. Особенности применения правила Бернулли — Лопиталя При использовании правила Бернулли — Лопиталя для раскрытия неопределенности вида [0/0] или [оо/оо] производные f'(x) и д'{х) исходных функций f(x) и д(х) сами могут быть бесконечно малыми (б.м.) или бесконечно большими (б.б.) функциями при х —> Л, где А — конечная или бесконечно удаленная точка числовой прямой. Если для функций f'(x) и д'(х) выполнены условия одной из теорем 6.1-6.4, в том числе существует равный L предел отношения производных этих функций, то правило Бернулли — Лопиталя можно применить повторно, используя (6.3) в виде Hm 9{x) д'(х) д"{х)
6.3. Особенности применения правила Бернулли — Лопиталя 143 В том случае, когда вторые и более высокого порядка производные исходных функций удовлетворяют указанным выше условиям, правило Бернулли — Лопиталя можно применять последовательно и далее, если есть надежда получить в конце концов отношение производных такого порядка, для которого легко установить существование предела и вычислить его. Тогда будут существовать и совпадать с ним пределы всех отношений производных более низких порядков и предел отношения исходных функций. Отметим, что перед каждым последующим применением правила Бернулли — Лопиталя полученное на предыдущем этапе отношение б.м. или б.б. функций может быть преобразовано к более удобному виду. Пример 6.3. Отношение f(x)/g(x)= (\n\P(x)\)/\n\Q(x)\, где Р(х) = х4-х3-Зх2+Ьх-2, a Q(x) = х4- 2ж3 + 2х - 1, при х -> 1 является неопределенностью вида [оо/оо], поскольку Р(1) = Q(l) = 0. Отношение первых производных представим как произведение двух дробно-рациональных функций и Q(x)/P(x): f'{x) _ Р1{х)/Р{х) _ 4х3 - За:2 - 6а + 5 х* д'{х) " Q'(x)/Q(x) ~ 4х3 - 6х2 + 2 ' х4 - х3 - За:2 + Ъх - 2' Каждая из этих функций при х —► 1 дает неопределенность вида [0/0]. Бели существует конечный или бесконечный предел . Р'(х) . 4х3 - За:2 - 6а: + 5 L = lim -., . = lim ——-=—-—=—-—, s-nQ'(i) r-и 4ж3-6а;2 + 2 ' то, согласно правилу Бернулли — Лопиталя, должен существовать при х -> 1 тот же предел и отношения P(x)/Q(x). Для нахождения L следует рассмотреть отношение P"(x)/Q"(x) = = (12ж2-6х~6)/(12а:2-12ж). Однако при х -¥ 1 оно также является неопределенностью вида [0/0]. Лишь отношение третьих производных P"'(x)/Q'"{x) = (24а: - 6)/(24ж - 12) при ж -И позволяет вычислить L = 3/2. Поскольку L ф 0 и конечно,
1446. РАСКРЫТИЕ НЕОПРЕДЕЛЕННОСТЕЙ запишем x-nQ'(x) Р(х) r-4i Q'(ai) *-и P(x) L Таким образом, согласно правилу Бернулли — Лопиталя, предел отношения f(x)/g(x) исходных функций существует и также равен 1. # При раскрытии неопределенностей использование правила Вернулли — Лопиталя целесообразно сочетать (если это возможно) с выделением главной части б.м. или б.б. функций или с заменой их эквивалентными им более простыми функциями. Пример 6.4. В случае отношения функций f(x)/g(x) — = (Зх- 2sinx - tgx)/x5 при х -¥ 0 стремление пятикратным дифференцированием избавиться от нуля в знаменателе приведет к громоздкому выражению для производной пятого порядка от tgx. Убедимся, что предел этого отношения при х -> О можно вычислить более экономным путем. Дифференцируя последовательно, найдем /'(х) _ 3 — 2cosx - l/cos2x _ 3cos2x - 2cos3x - 1 _ p(x) ~ 5x4 ~ 5x4cos2x ~" p'(x) -6 cos x • sin x + 6 cos2 x -sin x -3(1-cosx)sina; q'(x) 20x3cos2a; - 10a;4cosa;-sins 5(2x3cosx —x4sinx)' причем в последнем отношении проведено сокращение на 2cosx, поскольку в окрестности точки х = 0 cosz ф 0. Так как 1 - cosa; = 2sin2(x/2), sinx ~ x и главная часть знаменателя х-*0 2x3cosx -x4sinx при х -> 0 эквивалентна б.м. функции 2ж3, то .. j/(x) 3.. 2(х/2)2х 3 2х3 20 Итак, согласно правилу Бернулли — Лопиталя, при х —► 0 существует предел отношения f(x)/g(x) = (Зх - 2sinx - tgx)/x5 и он равен -3/20. #
6.3. Особенности применения правила Бернулли — Лопитаяя 145 Из теорем 6.1-6.4 следует, что предел отношения функций существует при условии существования предела отношения их производных. Однако обратное неверно, т.е. если не существует предел отношения производных, то это еще не означает, что не существует предел отношения самих функций. Например, ясно, что существует предел ж + вшж .. Л . sinx\ hm = lim [И 1 = 1) х-Ц-оо x х-Ц-оо \ X / но предел отношения производных (х + sin x)f/ (x)' = 1 + cos ж при х -»• +oo не существует. Следовательно, правило Бернулли — Ло пи тал я раскрытия неопределенностей вида [0/0] и [оо/оо] носит только достаточный характер. Для применения правила Бернулли — Лопиталя существенно выполнение всех условий соответствующей теоремы. Например, для функций f(x) = x+s\nx и g(x) = x-smx при ж-юо оно не применимо ввиду того, что производная д'(х) = 1 — cos ж бесконечное число раз обращается в нуль и не удается указать окрестность бесконечно удаленной точки, в которой бы д'(х) ф 0, т.е. было бы выполнено третье условие теоремы 6.2 (при замене переменного ж = \/t не существует окрестности точки t = 0, в которой g'x(l/t) = 1 - cos(l/*) ф 0). Это приводит к тому, что при ж —у оо не существует предел отношения производных ff(x)/g'(x) = (1+созж)/(1-со8ж) =ctg2^/2). Вместе с тем существует предел /(ж) ж + sin ж l + (sinz)/a: * hm ^7—7= hm :—= hm )^ = 1 ( 77= hm := hm ).^ = 1. g(X) ar-*oo Ж — Sin Ж *-Юо 1 — (51ПЖ)/Ж Возможны случаи, когда правило Бернулли — Лопиталя формально применимо, но практически бесполезно. Функции /(ж) = 2сЬж и д(х) = ех дифференцируемы неограниченное число раз, но при ж —¥ с» отношения этих функций и их производных любого порядка являются неопределенностью вида 10-544
146 6. РАСКРЫТИЕ НЕОПРЕДЕЛЕННОСТЕЙ [оо/оо], хотя с учетом равенства chx = (ex + е~х)/2 нетрудно сразу вычислить /(*) 2ch* е* + е-* hm —7—- = lim = lim = 1. х-юо <ДХ) а?-юо с* аг-Юо ех Для функций f(x) = ж5sin(1 /х) и «/(ж) = а; при х —> +О возможны различные ситуации в зависимости от значения 5 6 R. Нетрудно установить, что предел отношения 7т~г = I sx sin х cos — 1 = ж I sa; sin cos — 1 '(x) \ x x) \ x x) при x —I +0 существует и равен нулю, если 5 > 2, поскольку под знаком предела будет произведение б.м. функции и ограниченной. В этом случае, согласно правилу Бернулли — Лопиталя, существует равный нулю предел отношения заданных функций, что можно проверить и непосредственно: Г f(X) I- 5-1 • * lim ^-гт = lim x *sin-. д(х) х-»+0 х Этот предел существует и равен нулю при s > 1, хотя предел отношения производных существует лишь при s > 2. Оба предела не существуют при s ^ 1. 6.4. Другие виды неопределенностей Помимо рассмотренных неопределенностей вида [0/0] и [со/со] возникает необходимость в раскрытии неопределенностей других видов, в частности [0-со], [со - со], [0°], [со0] и Неопределенность вида [0 • со] можно свести к уже рассмотренным алгебраическими преобразованиями. Пусть Hm f(x) = 0 и lim g(x) = со, +А +А
6.4. Другие виды неопределенностей 147 причем под А будем понимать как конечную, так и бесконечную точку расширенной числовой прямой. В соответствии с теоремой 7.5 [I] о связи между бесконечно большой (б.б.) и бесконечно малой (б.м.) функциями l/g(x) будет при х —> А б.м. функцией, а 1//(х) — б.б. (при условии, что f(x) отлична от нуля в некоторой проколотой окрестности точки А). Тогда из неопределенности вида [0 • оо] преобразованием - gix) получим неопределенность вида [0/0] или [оо/оо] (выбор между ними зависит от удобства проведения последующих вычислений). Например, для функций f(x) — х3 (s > 0) и д(х) = \пх при х —> + 0 вариант [0/0] вообще не приводит к цели, поскольку для отношения производных Пх) (»')' _ «-' , Шх))' (1/lnx)' (-l/ln2x)/x предел вычислить не проще, чем для произведения ха\пх заданных функций. Для варианта [оо/оо] g'(x) (In г)' 1/х Xs предел при х —> +0 и s > 0 равен нулю и, согласно правилу Бернулли — Лопитпаля, lim xs\nx= lim -@т= lim 1//() Для функций f(x) = In ((2/7r)arctga:) и д(х) = х в случае х —> -|-оо удобнее использовать вариант [0/0]. Тогда для отношения производных f'(x) = (ln(2/7r)4-lnarctgx)/_
148 6. РАСКРЫТИЕ НЕОПРЕДЕЛЕННОСТЕЙ 1 l/z2)arctgg при ж -> +оо существует предел, равный -2/п. Поэтому 2 . \ r f(x) f'(x) 2 arctgx 1 = hm = hm = г , /2 . \ r f(x) hm ж In ( — arctgx 1 = hm , , , ч = hm -f+oo \7Г / s-H-oo 1/<7(ж) x-++ ( g , ч 7 ar-f+oo \7Г / s-H-oo 1/<7(ж) x-++oo П/д(х)) 7Г Пусть теперь lim f(x) = 00 и Hm g(x) = 00, ьА х+А где А опять считаем конечной или бесконечной точкой расширенной числовой прямой. Обе функции f(x) и д(х) являются при х -> А бесконечно большими. Тогда в силу теоремы 7.5 [I] о связи между б.б. и б.м. функциями 1//(ж) и 1/д(х) будут при х —> А б.м. функциями и неопределенность вида [оо - оо] преобразованием JL 1_ ~ f(x) х можно свести к неопределенности вида [0/0]. Часто, впрочем, того же результата удается достигнуть проще. Пример в.5. Функции f(x) = l/x2 и ctg2x являются б.б. при х —> 0. Для нахождения предела их разности преобразуем ее к виду 1 2 sin2х — х2 cos2x sinar + zcosx sinx —arcosa; -r - ctg' x = —-5 = : T-. . xl x2siira? sin ж arsmg Предел первого сомножителя в правой части можно найти почленным делением на sinx: sin ж + х cosх ,. Л , * \ о hm : = hm 11 + ——cosx) =2, x-+0 Sin X x-40 \ Sin Ж /
6.4. Другие виды неопределенностей 149 а предел второго сомножителя найдем, применяя правило Бернулли — Лопиталя, предварительно заменив в знаменателе sinx эквивалентной ей при х —> О б.м. функцией х: .. sins — xcosx ,. sin ж — xcosx lim г-: = hm 5 x-*0 X^SHIX x-¥0 X* ,. (sinx — xcosx)' _. xsinx 1 = hm j-r- = hm 2 = - (x3)' *-ю 3x2 3 В итоге /1 2 \ sinx+ hm I -r - ctg x I = hm : x-+O\X^ / x-*0 Sin -...x+xcosx sinx-xcosx 1 2 hm I -rr-ctg^xl =hm : hm =-: = 2-- = -. x2 sin x 3 3 Пример 6.6. Исследуем, дифференцируема ли в точке х О функция = < — при x > — 1, x 1/2 при х = 0. Сначала убедимся в непрерывности у(х) в точке х = 0, т.е. проверим, согласно (1.1), что при х —»0 у(х) —> у(0) = 1/2. С этой целью, раскрыв неопределенность вида [ее — со] для б.б. при х —> 0 функций 1/1п(1 + #) и 1/х, найдем lim у(х) = lim ( — г — ] = lim х-*0 аг-Ю\ 1П (1+Х) X/ х-Ю xln(l+x) т^т;= hm^г=Ьтг= (x2)' a?-fo 2x *->о2(1+х) 2 (при использовании правила Бернулли — Лопиталя для упрощения дифференцирования принята во внимание эквивалентность при х -> 0 б.м. функций xln(l + x) и х2). Таким образом, заданная функция у(х) непрерывна в точке х = 0.
150 6. РАСКРЫТИЕ НЕОПРЕДЕЛЕННОСТЕЙ Отметим, что полезным побочным результатом проведенных вычислений является установление эквивалентности х — 1пП А-т\ ~ г2/2 ffi 121 поскольку оказалось, что lim yj- = 1. х2/2 Теперь исходя из определения 1.2 производной запишем 1 _!_! о Чп\ г У(ж)" У(0) ,. у (0) = hm ^—-—^—- = hm .. 2х - 21п(1 + х) - xln(l + х) = hm л О1—— ^ • х->о 2а:21п(1+ж) Отсюда, используя эквивалентность при х -> 0 б.м. функций £21п(1 + я) и х3 и дважды применяя правило Бернулли — Лопиталя, получаем (г(1 + х)1п(1 + х)) = ит -7 = nm —г (2 )) 6(2 43) 12 Поскольку в точке х = 0 существует конечная производная г/(0) = -1/12, функция у(х) дифференцируема в этой точке. Наконец, выясним, непрерывна ли производная у'(х) в точке х = 0. Для этого при х ф 0 вычислим У(«) =
6.4. Другие виды неопределенностей 151 и с учетом (6.12) и эквивалентности функций ж2(1 + ж)1п2(1 + и х4 при х —> 0, дважды используя правило Бернулли — Ло питал я, получаем lim у'{х) = lim ( - х-Ю (*4)' = lim (4ж3)' = lim \±х а;2/2 ~ 12* Поскольку lim у'(я) = у'(0) = -1/12, производная заданной функции у(ж), согласно (1.1), непрерывна в точке х = 0. # Неопределенные выражения вида [I00], [0°] и [с»0] полезно предварительно прологарифмировать. Представим эти выражения в форме показательно-степенной функции у(х) = (/(х))'<->. (6.13) При lim f(x) = 1 и lim</(a;) = oo (6.13) соответствует неопре- деленности вида [1°°], а в' случаях, если при х —> А функция д(х) является б.м., а функция f(x) — б.м. или б.б., имеем неопределенности вида [0°] или [оо°]. После логарифмирования (6.13) получим \ny(x)=g(x)\nf(x). (6.14) Теперь это выражение во всех трех случаях соответствует уже рассмотренной неопределенности вида [О-оо].
152 6. РАСКРЫТИЕ НЕОПРЕДЕЛЕННОСТЕЙ Допустим, что в точке А (конечной или бесконечной) существует Нт 1пт/(ж) и он равен fc€R, +oo или -оо. Тогда х-*А в силу непрерывности логарифмической функции существует Нт у (ж) и он равен еь, +оо или нулю соответственно. *А Пример в.7. Вычислим предел функции ■( SinZ\ 1-cosx Ж при ж -¥ О, т.е. раскроем неопределенность вида [1°°]. Здесь в соответствии с (6.13) /(ж) = (sins)/:c и д(х) = 1/(1 -cosz). Эти функции четные, поэтому можно рассматривать лишь х > 0. Тогда, согласно (6.14), 1 . sinx In sin a;-In z In In. 1 - cosa; x 1 - cosx Используя дважды правило Бернулли — Лопиталя и заменяя в процессе вычислений б.м. при х -» 0 функцию sin ж эквивалентной ей при ж -> 0 функцией ж, находим .. , . s .. In sin ж-In ж ,. (In sin ж - In ж)' hm 1пу(ж)= lim = hm ^= f+O r++0 1СОБЖ >+ hm 1пу(ж)= lim = hm r x-f+O r-++0 1—СОБЖ x->+0 (1 — COS Ж 1 i. Ч1пт т ,. ж cos ж —sin ж = hm ^4—-= Hm 5 Sin Ж ^ .. (жсобж -sinж)' ,. -isini 1 = hm —г- = hm ——-z— = --. (ж3)' x-^+o Зж2 3 Отсюда hm y{x) = hm = e 1/J = x-+o v x-+o\ x )
6.4. Другие виды неопределенностей 153 Пример в.8. Функция у(х) = (arcctgx)V'na: при х-*+оо приводит к неопределенности вида [0°]. Дважды применяя правило Бернулли — Лопиталя, получаем .. , , ч .. lnarcctgx .. (lnarcctgx)' lim lnt/(x) = hm —: — = hm -—-—^—^ = x-»-+oo a?-»+oo ШХ х-Ц-оо (lna?)' = lim = - lim 1-х- = - lim a? = lim Следовательно, lim у (ж) = lim x-v+oo x->-|-oo -\/(\-\-x2) x-H-oo 1 + x2 11* = e"1 = 1/e. Пример 6.9. Функция у(х) = (За:2 + ЪХ)Х1Х при ж -► +оо приводит к неопределеному выражению вида [оо°]. Используя правило Бернулли — Лопиталя, вычисляем hm \ъу(х)= hm х-++оо х-»-+оо X = hm hm x-V+oo = hm х-++оо Поскольку при х -> Н-оо показательная функция 3х является б.б. более высокого порядка, чем степенная (см. пример 6.1), последнее отношение при х —> +оо стремится к 1пЗ, т.е. lim \ny(x) = 1пЗ. Тогда lim y(x)= lim >Ьоо х++
154 6. РАСКРЫТИЕ НЕОПРЕДЕЛЕННОСТЕЙ Вопросы и задачи 6.1. Показать, что . х3-4х2 + 4х 1 . .. а) 1ш1_.-ч , ,о- , ,g = o; б) Ь 3' ; *-*x>7r-2arctgx2 2' . .. 1п(х10-Юх + 9) , ... 1/ 1 1 \ 2 z—tl 1П (X — OX ~r 4) x—foo X > tilX »gX / о 6.2. Как можно изменить способ решения примера 6.3 в случае L = 0 ? 6.3. Можно ли использовать для нахождения предела при х -» оо следующих выражений: x2+cosx I -f-x + sinx-cosx e~"2r(cosx+2sinx)+e~x sin2x a:2—cos г' (ж+sina:-cosxje81"1' e~z(cosx4-sino:) правило Бернулли — Лопиталя? 6.4. Установить эквивалентность функций 1 — cosx — x2/2 и х4/24 при х —> 0. 6.5. Доказать, что для дважды дифференцируемой функции /оо f (x)=fc 6.6. Исследовать дифференцируемость в точке х = 0 функций !/(*) = xarctgx х2' ' /(х) = 1/3 х = 0, 1 X €х - 1 , хфО; 1/2 х = 0. 6.7. Найти предел при х —► 0 отношения у/х, если касательная, проведенная в начале координат к графику функции у = /(х), составляет угол а с осью абсцисс.
Вопросы и задачи 155 6.8. Показать, что при х -> О функция 1/х - \/(ех- 1) 1/2. Можно ли отсюда установить, какой бесконечно малой при х —¥ О эквивалентна функция ех — х — 1 ? 6.9. Доказать, что ж - arctgz ~ я3/3 и arcsina; - х ~ х3/6 при х —> 0. 6.10. Показать, что a) lim *2/(1+Inx> = е2 и б) lim xW'V = e. ar-f-fO a;f+O Изменятся ли значения этих пределов, если х 6.11. Показать, что при х -> 7г/4 (tgx)tg^x -> 1/е. Изменится ли значение этого предела, если х —► +0 или х -> 7г/2 - 0 ? 6.12. Доказать, что при ж—>+оо (1-f ех)1/х-^е. К какому пределу стремится эта функция при х —> -оо? 6.13. Показать, что a) lim (lnx)1/x = l; б) lim х2^2^ = е; в) lim cosr(l/x) = 1; 1 a:4+oov ' *>l агfoo v ' ' г) lim (ctg2x)1/lnx = l/e; д) lim(cosx)1/j;2 = \ i. / «b* 1 3/~" \ l» e) lim = ye; ж) lim x-tO V X J x-+C sin* ж 2x2 12
7. ФОРМУЛА ТЕЙЛОРА Формула Тейлора является одной из жемчужин математического анализа и широко используется как в теоретических исследованиях, так и в вычислительной практике. Она позволяет функцию, заданную сложным аналитическим выражением, заменить удобным для анализа многочленом. 7.1. Линейное и квадратичное приближения функции Приближенная формула (3.7) в виде }(х) » /(а) + df(a) = f(a) + /'(а) dx = /(а) + f'(a)(x - a) (7.1) позволяет для дифференцируемой в точке х = а функции }(х) найти ее приближенное значение в окрестности этой точки, не прибегая к непосредственному вычислению f(x). По существу, (7.1) дает возможность прогнозировать поведение функции f(x) в окрестности точки а, располагая лишь значениями f(a) и f (а). Однако такой прогноз точен только для линейной функции в виде многочлена первой степени f(x) = Р\(х) = = co + ci(x - а), так как f(a) = Pi(a) = со и /'(а) = Р[{а) = с\. Поскольку правая часть (7.1) является линейной функцией относительно аргумента z, (7.1) называют линейным приближением функции f(x) в окрестности точки а. Погрешность приближенной формулы (7.1) Ri{x) = Af(a)-df{a) = f(x)-f(a)-f'(a)(x-a) = о(х-а) (7.2) вызвана заменой приращения Д/(а) = f(x) - /(а) функции ее дифференциалом df(a) = f'(a)(x - а) и для дифференцируемой функции является при х -> а бесконечно малой (б.м.) более
7.1. Линейное и квадратичное приближения функции 157 высокого порядка, чем дифференциал аргумента dx = х — a (см. 3.1). Установленные ранее соотношения эквивалентности ряда элементарных функций аргументу х при х —У О (см. (1.12)), можно рассматривать как частные случаи (7.1). Геометрически они отражают близость касательной к графику функции в окрестности точки касания. Но при этом между касательной, уравнение которой соответствует правой части (7.1), и графиком f(x) остаются отмеченные на рис. 4.3 вертикальной штриховкой криволинейные „клинья", ординаты R\(x) которых могут быстро расти с удалением от точки касания. Естествен вопрос: нельзя ли уточнить (7.1), выразив R\(x) через характеристики функции /(я) в точке а? Для ответа на этот вопрос выделим главную часть в степенной форме б.м. при х—> а функции Ri(я), т.е. найдем такие константы А и т, чтобы Ri(x) = А(х - а)т + о((х - а)т). Для нахождения этих констант воспользуемся условием эквивалентности функций Ri(x) и А(х — а)т, т.е. равенством lim --,— \ = 1. А[Х -п)т Если функция f(x) дважды дифференцируема в некоторой окрестности точки а и /"(а) ^0, то, воспользовавшись дважды правилом Бернулли — Лопиталя, с учетом (7.2) запишем =limy; = А(х - а)т х^а А(х - а)т = lim /'(*)-/», = lim л.) Ат(х - а)171"1 *-ю Ат(т- 1)(ж-а)т~2' Последний предел равен 1 при т = 2 и А = /;/(а)/2. Тогда вместо (7.2) получим £^. (7.3)
158 7. ФОРМУЛА ТЕЙЛОРА В итоге из (7.2) и (7.3) найдем более точную, чем (7.1), формулу f(x) « f(a) + f'(a)(x -a) + ^(x- a)2 (7.4) с погрешностью Щх) = /(*)-/(а)-/'(а)(г-а)-^(*-а)2 = о((х-а)2) (7.5) более высокого порядка, чем (х-а)2 при х —>а. Поэтому правую часть в (7.4) называют квадратичным приближением функции f(x) в окрестности точки а. При /"(а) ф О оно отлично от линейного приближения (7.1), и в этом случае на рис. 4.3 ему соответствует штриховая линия, более близко, чем касательная, прилегающая к графику функции f(x). Формула (7.4) точна, если f(x) является многочленом степени ^ 2. Действительно, для /(ж) = Рг(^) =co + ci(x-a) + C2(x-a)2 имеем /(a) = ft(a) = cb, /'(a) =/?(а) = ci и /"(а) = Р^а) = 2с2, и поэтому погрешность R2(x) = f{x) - /(а) - /'(а)(* - о) - ^(х - а)2 = 0. Пример. Построим квадратичное приближение для функции f(x) = 1/(1 + х2) в окрестности точки а = 0. Поскольку 2х и И в точке a = 0 получим /(0) = 1, /'(0) = 0 и /"(0) = -2. Тогда квадратичное приближение этой функции в окрестности данной точки, согласно (7.4), будет На рис. 7.1 построены графики функции f(x) = 1/(1 + х2) и многочлена Рг(^) = 1 - х2, имеющие в точке а = 0 равные
7.2. Многочлен Тейлора и формула Тейлора 159 значения /(0) = Рг(0) = 1 и значения первой и второй производных /'(0) = Р^(0) = 0 и /"(0) = Р£'(0) = "2. # Р2(х)-1-х2 Рис. 7.1 Далее рассмотрим, как построить многочлен любой степени п, являющийся приближением функции f(x) в окрестности заданной точки о, и оценить погрешность такого приближения. 7.2. Многочлен Тейлора и формула Тейлора Пусть функция f(x) дифференцируема п раз в точке а. Это значит, что функция определена и имеет конечные производные всех порядков до (п - 1)-го включительно в некоторой окрестности точки а и, кроме того, имеет конечную производную п-го порядка fln\a) в самой точке а. Построим многочлен n-й степени -а)\ (7.6) Ясно, что этот многочлен и его производные до п-и включительно в точке а имеют те же значения, что и функция f(x)
160 7. ФОРМУЛА ТЕЙЛОРА и ее производные. Действительно, Р»(а) = /(в), ) и вообще для к = 0уп Здесь и далее принято, что при к = 0 /^(ж) = f(x) и 0! = 1. Многочлен (7.6) называют многочленом Тейлора, а его коэффициенты — коэффициентами Тейлора по имени английского математика Б. Тейлора (1685-1731). Приближенные формулы (7.1) и (7.4), очевидно, являются представлениями функции }(х) в виде многочлена Тейлора при п = 1 и п = 2 соответственно. Многочлен Тейлора дает некоторое приближение к функции f(x) в окрестности точки х = а, т.е. 7». Погрешность этого приближенного представления, т.е. разность f(x) - Pn(x), обозначим Rn(x). Тогда получим формулу (7.7) называемую формулой Тейлора n-го порядка для функции f(x). При этом погрешность #n(s), называемая остаточным членом формулы Тейлора, при х —У а является бесконечно малой более высокого порядка по сравнению с (х - а)Л. Это утверждает следующая теорема.
7.2. Многочлен Тейлора и формула Тейлора 161 Теорема 7.1. Если функция f(x) n раз дифференцируема в точке а, то при х -> а (7.8) Для доказательства достаточно показать, что — п)п х-Ьа \х — п Отношение под знаком предела представляет собой неопределенность вида [0/0]. Условие теоремы и то, что Рп (а) = (fc = 0, п-1), позволяют для ее раскрытия последовательно (п- 1) раз применить правило Берну лап — Лопиталя: ы Щ = щ y х-*а [х — О)" 1-»а п\(Х — п) _ 1 .. — ~т" пгп ! пгп п! х-+о ж — а п! Но по условию теоремы в точке а существует производная /М(а), т.е. в силу определения 1.2 производной существует предел lim i i^—i ^ = /<n)(o). ar>a Ж a — a Поэтому правая часть предыдущего равенства равна нулю, откуда следует справедливость (7.8). ► Покажем, что многочлен Тейлора является единственным многочленом степени п, который в окрестности точки а представляет п раз дифференцируемую в этой точке функцию f(x) с погрешностью более высокого порядка малости при х -> а, чем любое из слагаемых данного многочлена. Теорема 7.2. Если функция /(ж), п раз дифференцируемая в точке а, представима с погрешностью о((х — а)п) при х —у а многочленом по степеням разности х — а вплоть до п-й 11-544
162 7. ФОРМУЛА ТЕЙЛОРА степени, то коэффициенты этого многочлена являются коэффициентами Тейлора, а сам многочлен — многочленом Тейлора степени п. < Пусть функция f(x) представлена многочленом по степеням х - а в виде п к=о Напомним, что функцию о((х — а)п) при х —> а можно представить в виде fi(x)(x -а)п, где /z(z) — функция, бесконечно малая (б.м.) при х -+ а. Приравняем указанное представление функции f(x) и ее представление в виде (7.7) с учетом (7.8): где /3(х) и у(х) — б.м. при х -> а функции (в общем случае различные). При переходе к пределу при х —> а все слагаемые, кроме первых в левой и правой частях записанного равенства, обратятся в нуль. Отсюда cq = /(а). Отбрасывая равные между собой первые слагаемые и сокращая обе части равенства на х - а, получим п - а)к~1 + ${х)[х - а)*-1 = к=1 Переход к пределу при х —¥ а в этом равенстве даст ci = /'(a). Последовательно продолжая описанную процедуру, получаем с* = f(k\a)/k\ при к — 0, п, т.е. при сделанных предположениях п Ck являются коэффициентами Тейлора, а £ ск(х — а)к — к=0 многочленом Тейлора функции f(x). ►
7.2. Многочлен Тейлора и формула Тейлора 163 Таким образом, приближения функции f(x) многочлена- п ми вида 52 ск(х - а)к с коэффициентами с*, отличными от f(k)(a)/kl при к = 0, п, задают f(x) в окрестности точки а с погрешностью, которая будет при х -¥ а б.м. функцией более низкого порядка, чем при приближении многочленом Тейлора. В этом смысле многочлен Тейлора называют многочленом наилучшего приближения среди всех многочленов той же степени. Пример. Функцию f(x) = 1/(1 - х) можно рассматривать как сумму бесконечно убывающей геометрической прогрессии со знаменателем х при |х| < 1 и первым членом, равным 1, т.е. f(x) = - = l + z + :r2 + ... + sn + #n(z), (7.9) причем Rn(x) = xn+1 +zn+2 + ... = xn+l/(l - x) = o(xn) при x —> 0. Таким образом, в силу теоремы 7.2 многочлен гс-й степени в правой части (7.9) является наилучшим приближением этой функции в окрестности точки х = 0, а его коэффициенты должны быть коэффициентами Тейлора. Действительно, и /<*)(0)/*!=1 при А: = 0,п. # Формулу (7.7) Тейлора часто записывают в приращениях, обозначив х-а = Дх и f(x)-f(a) = f(a + Ax) -/(о) = А/(а): Из (7.10) в частных случаях при п=1 и та = 2 получим формулы для приращения в точке а дифференцируемой и дважды дифференцируемой в этой точке функции f(x) соответственно IV
164 7. ФОРМУЛА ТЕЙЛОРА и + о((Дх)2) Здесь удержаны один (линейный относительно Ах) и два (линейный и квадратичный относительно Ах) слагаемых в приращении А/(а) функции f(x) в точке а. Эти формулы соответствуют линейному (7.1) и квадратичному (7.4) приближениям этой функции в окрестности указанной точки. Произведение f(k)(a)(Ax)k в (7.10) является дифференциалом к-го порядка dkf(a) функции }(х) в точке а. Поэтому (7.10) можно переписать в виде (7.11) Такой вид записи называют формулой Тейлора п-го порядка в дифференциалах. Она дает представление в окрестности точки а приращения п раз дифференцируемой функции f(x) через ее дифференциалы в этой точке до п-го порядка включительно. 7.3. Различные представления остаточного члена формулы Тейлора Остаточный член в виде (7.8) формулы Тейлора п-го порядка (7.7) называют остаточным членом в форме Пеано (Д. Пеано (1858-1932) — итальянский математик). Объединяя (7.7) и (7.8), получаем формулу Тейлора п-го порядка с остаточным членом в форме Пеано *=о Однако эта форма остаточного члена не позволяет вычислить погрешность представления функции f(x) многочленом Тей-
7.3. Различные представления остаточного члена 165 лора Рп(х) при заданном значении х из окрестности точки а, не дает возможности установить размеры такой окрестности, в которой многочлен воспроизводил бы эту функцию с наперед заданной точностью, а также ничего не говорит о том, как можно влиять на погрешность за счет роста степени п многочлена. Если в дополнение к условию теоремы 7.2 потребовать существования в точке о еще и конечной производной /(п+1)(а) функции /(ж), то в силу этой теоремы можно установить, что Rn(x) = f(x) - Рп(х) = ^ffi (x - a)"+1 +«((*- a)"*1), и получить иное представление остаточного члена в форме Пеано: где (ясно, что а(х) — функция, бесконечно малая при i->a). Такое представление остаточного члена в некоторых случаях более удобно для анализа поведения функции f(x) в окрестности точки а. Удобство состоит в том, что при конечном значении /(n+1)(a)^0 вполне определен порядок малости при х —у а остаточного члена по сравнению с разностью х — а, тогда как об остаточном члене в виде (7.8) можно сказать лишь то, что он более высокого порядка малости, чем (х — а)п при х —у а. В частном случае может оказаться, что /(n+1)(a) = 0, и тогда остаточный член в (7.13) будет при х —> а более высокого порядка малости, чем (х - a)n+1. Однако желательным является такое представление остаточного члена Rn(x), которое допускает возможность его непосредственной количественной оценки при конкретных значениях х и п. Пусть функция f(x) определена и п раз непрерывно дифференцируема на отрезке [a, a + /i] (h > 0) и,
166 7. ФОРМУЛА ТЕЙЛОРА кроме того, по крайней мере в интервале (a, a + h) существует и конечна производная /(п+1Цх) (рассуждения в случае отрезка [о —Л, а] аналогичны). Рассмотрим остаточный член = /(.)- /(.) - /»(* - а) - Зафиксируем теперь произвольное х € (a, a + h) и, заменив в (7.14) постоянное число а переменным г, составим вспомогательную функцию причем будем считать, что z меняется на отрезке [а, х]. На этом отрезке функция <р непрерывна как алгебраическая сумма непрерывных функций и на концах отрезка принимает значения (р(а) = Rn{x) и (р(х) = 0. Кроме того, в интервале (а, х) существует производная n! Возьмем произвольную функцию Tp(z), непрерывную на отрезке [а, х] и имеющую не равную нулю производную ф'(г) по крайней мере в интервале (а, х). К функциям <p(z) и ф(г) применим на отрезке [а, х] формулу (5.4) Коти конечных приращений <р(х) - <р(а) _ < ф(х)-ф(а)~ф'(сУ где с — точка, лежащая между точками а и х. Поскольку ¥>(*) = 0, ?(а) = Rn(x) и у>'(с) = -/(•+0(с)(в - с)»/п\, из (7.15)
7.3. Различные представления остаточного члена 167 получим Если теперь вместо ф(г) подставить в (7.15) любые, но удовлетворяющие указанным выше условиям функции, то получим различные формы записи остаточного члена Rn(x) формулы Тейлора. Пусть ip(z) = (х - z)p (р> 0). Эта функция непрерывна на отрезке [а, х], и ее производная ф'(г) = -р(х - 2)р~г ф 0 € (о, ж).. Тогда из (7.16) следует Rn(x) = 1Ж п) • I ^-(х - c)n = -p(x-c)P-1 n\ nip Так как с = а+#(ж-а) при 0<$<1,то х-с = х-а-&(х-а) = = (1 — #)(х — а) и окончательно Rn(x)J (a+^*fl)) (^^п-и-р^.^п-н о<^<1. (7.17) Это выражение называют остаточным членом в форме Шлёми- льха — Роша (О. Шлёмильх (1823-1901) — немецкий математик, Э. Рош (1820-1883) — французский математик и астроном), или остаточным членом в общей форме. Ясно, что (7.17) применимо и в случае х < а. В частном случае р = п+1 из (7.17) получим остаточный член в форме Лагранжа 0<9<1, (7.18) который похож на последнее слагаемое многочлена Тейлора Pn+i(x). Отличие же состоит в том, что производная /(п+1Цх) вычислена не в точке а, а в некоторой точке с = а + В(х - а)
168 7, ФОРМУЛА ТЕЙЛОРА между точками а и х. Объединяя (7.7) и (7.18), приходим к формуле Тейлора п-го порядка с остаточным членом в форме Лагранжа (при 0 < 0 < 1) которую благодаря простоте формы остаточного члена наиболее широко используют на практике. Бели в (7.19) перенести /(а) в левую часть и положить п = 0, то получим формулу конечных приращений вида (5.2). При р= 1 из (7.17) следует остаточный член в форме Кохии Rn(x) = J- LJLJ JZ(i _ в)п(х - a)n+1, 0 < в < 1. n! Отметим, что значения 0, fl в (7.17) и в в (7.18) различны для одной и той же функции f(x) даже при фиксированных точках а и ж, поскольку зависят от значения р. Ясно, что если /(я) является многочленом степени п, т.е. f(x) = а0 + а\х + а2х 2 то /(п+1)(ж) = 0, из (7.18) Rn(x) = 0 и для произвольных ж, а £ R из (7.7) следует = Рп(х) = £ £^(х - а)*, (7.20) Jk=O причем в силу теоремы 7.2 это представление единственно. Пример. Многочлен f(x) = xs-2x4 + х3-х2+2х — 1 обращается в нуль в точке х = 1. Установим кратность этого нуля многочлена (или кратность корня соответствующего алгебраического уравнения пятой степени хъ - 2х4 + х3 - х2 + 2х - 1 = = 0). Для этого, согласно (7.20), представим f(x) многочленом Тейлора Р$(х) по степеням х - 1, вычислив предварительно
7.3. Различные представления остаточного члена 169 коэффициеты Тейлора с* = /М(1)/&! при к = 0, 5: /"(1) _ 20х3 - 24х2 + 6х - 2 х=\ 2! 2 /'"(1)_60х2-48х — 3; С4 = 3! 6 120х - 48 х=1 4! 24 Таким образом, согласно (7.20), получим 5 Г(1) _ 120 5! ~ 120 = 1, к=0 т.е. рассматриваемый многочлен имеет в точке х = 1 нуль кратности 3, а соответствующее многочлену уравнение пятой степени — корень х = 1 также кратности 3. # Для произвольной (но не являющейся многочленом степени т ^ те) те + 1 раз дифференцируемой функции f(x) остаточный член (7.18) в форме Лагранжа отличен от нуля. Оценим его по абсолютному значению сверху. Пусть для функции f(x) существует такое действительное число Mn+i > 0, что при всех значениях аргумента х из рассматриваемой окрестности точки а справедливо неравенство |/(n+1)(z)l ^ Afn+i- Тогда с учетом (7.18) получим Обратим внимание на то, что н» 4^ - о. ( + 1)' В самом деле, для последовательности {хп} = {|х - а|п/те!} \х-а\ Хп те + 1 '
170 7. ФОРМУЛА ТЕЙЛОРА При п> \x-a\-l эта последовательность монотонно убывает. Все ее элементы положительны, т.е. она ограничена снизу (например, нулем), а, согласно признаку Вейерштрасса, ограниченная монотонная последовательность сходится к конечному пределу. Обозначим этот предел L. Поскольку элемент zn+i при п -* оо пробегает ту же последовательность значений, что и элемент хп (кроме значения хх), после перехода в последнем равенстве к пределу при п —► оо получим L = L • 0, а это возможно лишь в случае, если L = 0. Таким образом, если функция f(x) бесконечно дифференцируема в некоторой окрестности точки а и все ее производные в этой окрестности ограничены по абсолютному значению общей константой М > О, то, выбирая достаточно большое п, можно сделать правую часть (7.21) сколь угодно малой. Это позволяет применять формулу Тейлора для нахождения приближенного значения функций, обладающих указанным свойством, с любой наперед заданной точностью. Например, все производные функции ех ограничены в окрестности (а - Л, а + h) (Л > 0) точки а числом М = еа+Л, а для функциий sinx и cosz, согласно (4.7) и (4.8), имеем и т.е. все их производные при любых х € R ограничены по абсолютному значению числом М = 1. 7.4. Формула Маклорена Частный случай формулы Тейлора (7.7) при о = О = /(о)+/'(0)* 71. *=0
7.4. Формула Маклорена 171 принято называть формулой Маклорена по имени шотландского математика К. Маклорена (1698-1746). Остаточный член в (7.22) имеет вид: в форме Пеано или fln(s)=/|rc(e)y(a)s"+1, (7.23) где 0(х) — функция, бесконечно малая при х -> 0; в форме Лагранжа Rn(x) = ^^У*"*'. 0 < в < 1; (7.24) в форме Коши n\ (7.25) Таким образом, формула Маклорена (7.22) дает представление функции /(ж) в окрестности точки х = 0. Используем эту формулу для представления некоторых основных элементарных функций. Пример 7.1. Для экспоненциальной функции f(x) = ех имеем f^{x) = ех) и поэтому /^(0) = 1 при к = 0, n, a /(п+1)(0я) = ее*. Тогда формула Маклорена (7.22) с остаточным членом в форме Лагранжа (7.24) для экспоненциальной функции будет иметь вид х2 xn ^1+ e^1+I+ + ... + + iJn(l) = g + I. На рис. 5.9 показаны графики функции ех и ее представления одним, двумя и тремя первыми слагаемыми (7.26).
172 7. ФОРМУЛА ТЕЙЛОРА Пример 7.2. Если f(x) = ln(l -f-ar), x > -1, то в соответствии с (4.5) /(А?)(х) = (—lJ^-^Ar — 1)!/(1 Н-а:)^. Тогда при х = 0 получим /(0) = 0, /^)(0) = (-l)fc-l(A:-l)! V*=T7n и /(»+1)(ег) = (-1)п71!/(1+еж)п+1. В итоге из (7.22) и (7.24) следует представление логарифмической функции k=l ж-ж2/2+х3/3 Рис. 7.2 На рис. 7.2 приведены графики функции 1п(1 Н- х) и ее представления одним, двумя и тремя слагаемыми (7.27). Пример 7.3. Для функции /(x) = sinx при Аг = О,п+1, согласно (4.7), /<*>(*) = sin(a; + кп/2), т.е. /<*>(0) = sin(Ar7r/2). Таким образом, в точке х = 0 /(0) = 0, все производные четного порядка также равны нулю, а все производные нечетного
7,4. Формула Маклорена 173 порядка k = 2i—\ (г 6 N) Кроме того, /(п+1)(6х) = sin (0x + (п + 1)тт/2). Тогда в соответствии с (7.22) и (7.24) запишем представление данной функции формулой Маклорена n-го порядка с остаточным членом в форме Лагранжа в виде п дп+1 Так как все производные четного порядка функции sinx в точке х = 0 равны нулю, то в последнем представлении можно выбрать п четным, т.е. n = 2ra (m€N). В итоге получим 2i-l T2m+1 prijijs^i)! (7'28) Аналогично для функции /(х) = cosx при к = 0, п+1, согласно (4.8), fW(x) = cos(x +for/2), т.е. /W(0) = cos(for/2). Следовательно, в точке х = 0 /(0) = 1, все производные нечетного порядка равны нулю, а все производные четного порядка к = 2г (г 6 N) /(2l)(0) = cosztt = (—I)1. Кроме того, /<n+1)(ex) = cos(0x+(n+ 1)тг/2). Поэтому из (7.22) и (7.24) следует, что х2 х4 x2t l + + (!). + + ...+ (!) + . ХП 7Г Xn+1
174 7. ФОРМУЛА ТЕЙЛОРА Выбирая п нечетным, т.е. n = 2m—I (га 6 N), получаем 2i i2m+2 (7.29) На рис. 7.3, а и б даны графики функций sinx и cosx и их представлений соответственно одним, двумя и тремя слагаемыми (7.28) и (7.29). -тг/2 -1 yi 1 О x-xV6+x5/120 sinx х-хЗ/6 тг/2 1-х2/2+х4/24 (х) - oosx б Рис. 7.3
7.4. Формула Маклорена 175 Пример 7.4. Для функции f(x) = (1 -f я)5, х > -1, s £ R 5-1, f"(x) = s{s - 1)(1 + х)*~2 и при Тогда в соответствии с (7.22) и (7.24) получим х2 -l) — + ...+ п п ^ В частности, для 5=1/2 из (7.30) найдем представление формулой Маклорена функции хх2 1/1 \ /1 \хп 71+ +(1)и1) + )(Sin- (731) При s=-l из (7.30) следует 1 гп+1 _ = l-^-...+(-l)V+(-ir»Ics;Fil (7.32) что после замены х на -х согласуется с (7.9). В случае sGN функция (1 + z)5 является многочленом и (7.30) переходит с учетом п — s в известную формулу бинома Ньютона Ь=0
176 7. ФОРМУЛА ТЕЙЛОРА Эта формула является точной, что подтверждает исчезновение в данном случае слагаемого, соответствующего остаточному члену. # Обратим внимание на то, что в построенных в этих примерах представлениях основных элементарных функций формулой Маклорена нетрудно усмотреть согласующиеся с (1.12) эквивалентности 1/1,ч • (1 + *)1 е -1 ~ In(l -hx) ~ sins ~ ~ х, х»0 х*0 х+0 S х*0 а также 1-cosx ~ х212. Для формулы Маклорена как частного случая формулы Тейлора справедлива оценка (7.21) сверху остаточного члена в виде п+1 L (7.34) Здесь Mn+i — наибольшее абсолютное значение производной /(п+1)(я) функции f(x) в рассматриваемой окрестности точки х = 0. При помощи (7.34) (как, впрочем, и в более общем случае при помощи (7.21)) можно решить три задачи: 1) найти оценку сверху для погрешности, вызванной заменой функции f(x) в окрестности точки х = 0 многочленом Тейлора n-й степени; 2) найти степень многочлена Тейлора, для которого погрешность такой замены в данной окрестности не превысит заданного значения е; 3) найти окрестность точки х = 0, в которой погрешность указанной замены не превысит заданного значения е. Пример, а. Оценим погрешность приближенной формулы 1п(1 + х) » х - х2/2 + я3/3 при \х\ ^ 0,2. Используя (7.27), получаем +
7.4. Формула Маклорена 177 При 1*1^0,2 найдем |/23(a:)| ^ (0,2)4/4 = 0,0004. б. Найдем с точностью до £ = 0,01 приближенное значение . Представим y/Z в виде 1/2 Для представления функции f(x) = (I -f ж)1/2 в окрестности точки х = 0 используем (7.31). В данном случае необходимо подобрать п такое, чтобы при х = —1/4 остаточный член в (7.31) л /л \ /1 \ / i /^\пД>1 -l/2-n по абсолютному значению не превышал £ = 0,01. Поскольку 3/4 < 1-в/4< 1, при п=1 имеем И/4) и 1/128 < |#!(-1/4)| < 1/48\/3 « 0,01203, т.е. представление этой функции многочленом Тейлора первой степени может не обеспечить заданной точности при вычислении значения у/3. Действительно, вычисляя первые два слагаемых в (7.31) при х = -1/4, получаем 1 + (-1/4)/2 = 0,875 и >/3«2-0,875 = 1,75, что отличается от хорошо известного значения у/3 = 1,732 с тремя верными десятичными знаками более чем на 0,01. При п = 2 получим -1/4)3 - 0/4)5/2 и 1/1024 < |#2(-1/4)| < 1/288\/5« 0,00200, т.е. при использовании многочлена Тейлора второй степени погрешность вычисления \/3 не превысит Д = 2 • 0,002 = 0,004 < е. В самом 12-544
178 7. ФОРМУЛА ТЕЙЛОРА деле, сумма первых трех слагаемых в (7.31) при х = —1/4 равна 1 + (-1/4)/2-(-1/4)2/8= 111/128 и \/3« 2-111/128 = = 1,734375, что отличается от значения у/3 = 1,732 с тремя верными десятичными знаками менее чем на А. в. Выясним, для каких значений х справедлива с точностью до 10~"3 приближенная формула cosx«l-x2/2. Согласно (7.29), при т = 1 запишем cosx = 1 - х2/2 + #i(x), где А 4Т x) = (-l^cosOx, 0 < в < 1. Поскольку |/2i(x)| ^ £4/4!, заданная точность будет гарантирована при условии х4/4\ < 10~3, или при |х| < 0,3935. Для трехчленной формулы cosx« 1 — х2/2 + х4/4\ из (7.29) при т = 2 получим х 3 х R2(x) = (-1)3—cosOx, 0 < 9 < 1, о! или |#2(я)| ^ ^6/б!, т.е. трехчленная формула обеспечивает ту же точность 10~3 вычисления значений функции cosx при условии х6/6! < 10"3, или при |х| < 0,702. # Из рассмотренных примеров видно, что с увеличением степени многочлена Тейлора он все с большей точностью и в более широком интервале значений аргумента воспроизводит заданную функцию. Построенные в примерах 7.1-7.4 представления функций ех, 1п(1 + я), sinx, cosx и (14-х)* формулой Маклорена являются основными. Комбинируя эти представления, можно рассматривать более сложные функции. При этом остаточный член Rn(x) в (7.22) полезно записывать при помощи символа „О большое", т.е. указывая определенный порядок малости #п(х) относительно переменного х при х -> 0. Пример. Представим функцию tgx формулой Маклорена с точностью до бесконечно малой седьмого порядка О(х7) при
7.4. Формула Маклорена 179 х -> 0. Знаменатель в функции tgx = (sinx)/cosx запишем в виде cos а; = \/l —sin2 а; и используем (7.30) при 5 = —1/2 в виде В нашем случае z — — sin2я. Поэтому 1 3 (l-sin2x)-1/2 = l + -sin2x + -sin4x + O(sin6x) при х -> 0. 2 8 Но тогда при х -> 0 1 Я tgx = (1 — sin2 x)"1'2 sin х = sinx + -sin3x + -sin5x + O(sin7x) 2 8 Используя представление (7.28) в виде sin х = х — х3/3! + хъ/Ъ\ + О(х7) при х —► 0, получаем 2 5 , 15 Итак, при х —> О 1 _ 9 _ (7.35) Отсюда следует, что tgx ~ х при х ->• 0. # Пусть для функции /(х), дифференцируемой в точке х = 0 необходимое число раз, известно представление ее производной при х -> 0 12
180 7. ФОРМУЛА ТЕЙЛОРА формулой Маклорена. Для этой формулы (как для частного случая формулы Тейлора) справедлива теорема 7.2 о единственности такого представления. Следовательно, коэффициенты с*, к = 0, п, являются коэффициентами Тейлора, т.е. k\ck = (/'(s))(A:)U=o, или /(*+1)(0) = k\ck. Тогда для самой функции f(x) коэффициентами Тейлора будут /(^+1)(0)/(A: -f-1)! = = Ck/(k+1), а ее представление формулой Маклорена при х —> 0 примет вид /W = /(0) + c0H^2 + ^3 + -..+ —^n + O(xn+I). (7.36) Пример. Найдем представление функции f(x) = arctgz формулой Маклорена. Поскольку f'(x) = (arctg£)' = 1/(1 +ж2), учитывая (7.32), получим ?{х) = 1 - х2 + х4 - ... + (-l)nz2n + + O(s2n+2) при я-+0,т.е. со = 1, с2 = -1, с2п = (~1)П. Тогда, принимая во внимание, что /(0) = 0, в силу (7.36) можно написать при х -> 0 /(*) = arctgx = х-т+-- ...+(-1)"^т+О(х2"+3). (7.37) Отсюда следует, что arctgx~z при х 7.5. Вычисление пределов при помощи формулы Тейлора Формулу Тейлора (в частном случае — формулу Маклорена) с остаточным членом в форме Пеано удобно использовать для раскрытия неопределенности вида [0/0] путем выделения главной части бесконечно малых (б.м.) функций. Пусть требуется найти предел при х -> а отношения f(x)/g(x), в котором функции f(x) и д(х) являются б.м. при х —¥ а. Если для этих функций выполнены условия теоремы 7.1, то при х —> а можно построить представления вида и д(х) = В(х-а)т + о({х -а
7.5. Вычисление пределов при помощи формулы Тейлора 181 где А,В € R\ {0}, m,n6N, ограничившись в них лишь первыми не равными нулю слагаемыми. Тогда L = limМ = Нп В(х - а)т + о((х - а)т) = |'^х-°)п"т <7-38> и в зависимости от соотношения между пит возможны три характерные ситуации: 1) L = 0 при п > т; 2) L = А)ВЛ если п = т; 3) L = оо при п < т. Другие виды неопределенностей могут быть сведены к неопределенности вида [О/О] (см. 6.4). Если а ф 0, то для удобства представления функций f(x) и д(х) целесообразно ввести новое переменное t = х — о. Это позволяет воспользоваться более простой формулой Маклорена. Случай х —у оо заменой переменного х = l/t также сводится к случаю t -> 0. Пример, а. Вычислим г .. sinx — arctgx Li = lim — x3 Так как в знаменателе выражения под знаком предела стоит б.м. при х —> 0 функция х3, то представление функций в числителе этого выражения следует проводить до членов, содержащих х3 включительно, т.е. с учетом (7.28) и (7.37) sinx = х -х3/3! + о(х3) и arctgx = х-х3/3 + о(х3) при х-»0. Тогда .. х - х3/3! + о{х3) - х + г3/3 + о(х3) L\ = lim х3 х3 = lim — Ж3 —t. = lim + Q(x) = Здесь через а(х) обозначена б.м. при х —> 0 величина о(х3)/х3.
182 7. ФОРМУЛА ТЕЙЛОРА 6. Найдем _ .. cos а: - е~х I2 Ь2 = lim *o xJtgx Исходя из вида знаменателя с учетом tgx ~ х при х -> 0, можно предположить, что определяющую роль при вычислении этого предела должны играть члены четвертого порядка малости по сравнению с х, которые возникнут после представления стоящих в числителе четных функций. Поэтому, используя (7.26), (7.29) и (7.35), запишем при х -^ 0 ez = 1 + z + z2/2 + o(z2), cosx = 1 -x2/2! + x4/4! + o(x4) и tgx = x + o(x). В данном случае z = -x2/2, т.е. e-x2/2==l-x2/2 + x4/8 + o(x4) при х-»0. Тогда 1/2 = НГП ю 4 + (4) 1+() 12 где /3(а?) = o(s4)/s4 -^ 0 и 7(a?) = o(x4)/x4 -> 0 при х -> 0. в. Вычислим Z/з = lim о Поскольку в знаменателе x tga;2 = x3 -f o(x3) при x -» 0, представление функций в числителе необходимо проводить до членов, содержащих х3 включительно. Используя (7.26), (7.32) и (7.37), запишем при х -+ 0 ег = l + z + z2/2\ 3 3 1/(1-а:) = 1-Ьх + х2-|-х3-Ьо(х3) и z = Поэтому при х —)• 0
Д. 7.1. Формула Тейлора в приближенных вычислениях 183 Тогда х->0 .. -7*3/6+о(*3) .. -7/б+т(«) 7 hmlim р7r ^ х-ю аг*+о(ог) а?-ю 1-|-'у(х) 6 где 7(ж) = о(х3)/х3 —fO при ж—»0. г. Найдем 2 / Обозначим выражение под знаком предела через у и прологарифмируем его, учитывая, что cosz + ж2/2 > 0 при малых х: Поскольку из (7.29) и (7.35) cosz = 1 - х2/2\ + х4/4\ + о(х4) и tgx = ж + z3/3 4-о(ж3) при х —у 0, вычислим lim In у = lim +o ю .. ln(l + a:/4!fo(a;)) = lim —; — —г- г = lim ( 3/3 (3) ;гг = lim г.. АК = х(х + х3/3 + о(х3) - х) *-ю хА/Ъ + о(х4) 8 (здесь в силу (7.27) принято In (l+x4/4\ + o(x4)) =x*/24 + o(x4) при х —> 0). После потенцирования в итоге получим U = Hm (cosx 4- J) "(tgx-x) = lim у = е1'8. 0 V 2 / fO Дополнение 7.1. Использование формулы Тейлора в приближенных вычислениях Формулу Тейлора можно использовать для построения достаточно простых и удобных в расчетной практике приближенных формул, которые с приемлемой погрешностью могут заменить точные, но громоздкие соотношения.
184 7. ФОРМУЛА ТЕЙЛОРА Примеры, а. Площадь 5 кругового сегмента, заштрихованного на рис. 7.4, можно выразить через основание 6=|ЛС| и высоту h = \BD\ сегмента, даже не зная значений радиуса круга R — \ОА\ и центрального полуугла а. Действительно, из равенств R2 = (6/2)2 + + (R-h)2 и sma = b/(2R) можно найти bh . Л_ч и а = arcsm ——гт-г- (7.39) h2+62/4 (при условии, что h < 6/2). Тогда с учетом (7.39) получим достаточно громоздкую формулу 2 h Ь2 bh arcsin (7.40) Зависимость 5 от а представим по формуле Маклорена 5 (7.41) Сначала построим при достаточно малых значениях а простую приближенную формулу для площади кругового сегмента, представив его как часть прямоугольника ACQP (см. рис. 7.4), т.е. приняв при к < 1 5 и kbh. (7.42) Для определения коэффициента к подставим в (7.42) 6 = = 2Rsma = 2#a+O(a3) и /i = fl(l-cosa) = Ra2/2+O(a4) и запишем 5 « к R2 a3 -|- О (а5), а затем приравняем fc#2 коэффициенту 2Д2/3 при а3 в (7.41). Тогда получим к = 2/3. Геометрически этот результат соответствует приближенной
Д.7.1. Формула Тейлора в приближенных вычислениях 185 замене круговой границы сегмента дугой квадратной параболы, проведенной через три точки Л, D и С (см. рис. 7.4). Попытаемся построить более точную по сравнению с (7.42) формулу в виде S ~ (га& + nc)h, (7-43) где c = 2#sin(a/2) — длина хорды AD. Коэффициенты га и п подберем способом, аналогичным предыдущему случаю. После подстановки 6 = 2Яа-Яа3/3+О(а5), с-Rot-Яа3/24+О(а5) и h = #а2/2 - Яа4/24 + 0(а6) в (7.43) запишем о 12га+ 3n 48 \ 7 Приравнивая коэффициенты при одинаковых степенях а в этом выражении и в (7.41), найдем 1/3 = т/2 + п/4 и 1/15 = = m/8 + n/32. Отсюда т = б/15 и п = 8/15, и в итоге вместо (7.43) получим 5 « 2^±i£ft. (7.44) 1о Для (7.44) погрешность имеет седьмой порядок малости по сравнению с а при а -> 0, а для (7.42) при значении к = 2/3 — пятый порядок малости. б. Подберем коэффициенты А и В так, чтобы при х —у О \ + Ах2 Умножением этого равенства на (x + jBa:3)sins получим (х + Вх3) cosx = (14- Ля2) sin x + О(х7) и, воспользовавшись (7.28) и (7.29), найдем 2 ~4 2!*+ 4!" + °^ ^ = д.3 Ж5
186 7. ФОРМУЛА ТЕЙЛОРА Отсюда 7*3 ~5 л. 5 Приравнивая коэффициенты при одинаковых степенях х, получим систему двух линейных алгебраических уравнений ~2+ =~6+ И 24~2 ~"120"~6 ' решением которой будет А = —2/5 и В = —1/15. В итоге при 1 - 2х2/5 Дополнение 7.2. Обобщенная теорема о среднем значении Формулу Тейлора с остаточным членом в форме Лагранжа можно получить как следствие обобщенной теоремы о среднем значении. Теорема 7.3. Если функции }{х) и д(х) определены в некоторой окрестности U(a) точки о и имеют в U(a) производные до (п 4- 1)-го порядка включительно, причем <^п+1)(х) ф 0 Vx € U(а), то между точками а и х £ U(a) найдется хотя бы одна такая промежуточная точка с = а + + 6(х - а), 0 е (0, 1), для которой (/(*) *=о
Д.7.2. Обобщенная теорема о среднем значении 187 <4 Построим для любых ж, £ £ U(a) вспомогательную функцию )p. (7.46) Значение р выберем так, чтобы при фиксированном ж h(a) = = 0. Так как из (7.46) следует, что h(x) = 0, то для функции h(t) на отрезке с концами в точках а и х выполнены все условия теоремы Ролла, т.е. существует хотя бы одна такая точка с, для которой /i{(c) = 0. Дифференцированием (7.46) по t найдем к=\ /k=0 fc=0 После взаимного уничтожения слагаемых в квадратных скобках получим п\ Из условия h't(c) = Q следует, что р — /(п+1)(с)/р^п+1^(с). Подставляя р в (7.46) и принимая во внимание, что h(a) = 0, приходим к утверждению теоремы в виде (7.45). ► В частном случае д(х) = (х - a)n+1 из (7.45) следует формула (7.19) Тейлора с остаточным членом в форме Лагранжа. При п = 0 из (7.45) получим формулы вида (5.5) или (при условии д'{х) ф 0 Уж € U (а)) вида (5.4), вытекающие из утверждения теоремы 5.4 Коши с учетом замечания 5.2. Наконец, при п = 0 и д(х) = х — а из (7.45) следует формула (5.1) Лагранжа. Конкретное значение 0, определяющее положение точки с между точками а и ж, зависит от вида функции /(ж) и при фиксированном значении а является функцией ж, т.е. 0 = О(ж).
188 7. ФОРМУЛА ТЕЙЛОРА Но если существует конечная производная /(п+2)(а) ф 0, то мож но найти предельное значение 0 при х-ла в (7.19). Почленным вычитанием из (7.19) равенства ыо 4 (n-h2)! являющегося, согласно (7.7), формулой Тейлора (те + 1)-го порядка с остаточным членом (7.13) в форме Пеано, получим (а (n+1)! (х-а)п+1 = где а(х) —> 0 при а; -> а. Последнее равенство, введя обозначение Да; = 0(х)(х - а), можно записать в виде Ах При х -> а Дх —> 0. Поэтому Нт 9(х) = те+ 2 Для формулы (5.1) Лагранжа (те = 0) предельное значение 9=1/2. Вопросы и задачи 7.1. Пользуясь формулой Тейлора, построить в окрестности точки а = 1 квадратичные приближения следующих функций: а) tg(x+x2); б) х2е~2х; в) (sinx)slru?; г) xarctgx; д) х~1/21пх. Оценить погрешность этих приближений на отрезке [1/2, 3/2].
Вопросы и задачи 189 7.2. Представить формулой Маклорена до члена о(хп) функции: а) (Зж+4)"1/2; б) (l-*)In(l+s) - (1+*)1п(1-а); в) 1п(2+е*). 7.3. Представить формулой Маклорена до о(х2п) функции: a) xsin22x; б) sinx-cos2x; в) хсЬЗх; г) sin3xcosx; д) x3ch2x. 7.4. Представить формулой Маклорена до o(x2n+1) функции: a) sinx-sin3x; б) chx-ch3x; в) In ((2 + х2)/(х4 - Зх2 + 2))1/3. 7.5. Представить формулой Маклорена до о(ж3п) функции: а) 1/(2х6-10х3+12); б) (5х6-11)/(х6-х3-2); в) 1/(1+х+х2). 7.6. Представить формулой Маклорена до o(x3n+1) функции: а) х/(1 + х3)2; б) 1п((е-х3)/(1-ех3))1/2; в) (5х3 + 28)/(14 + 5х5-х6). 7.7. Представить формулой Тейлора до о((х—1)п) функции: а)1п(2 + х-х2); б) sin(2x-3); в) (х2 + 3х)/(х +1). 7.8. Представить формулой Тейлора до о((ж+1)2п) функции: а)ех2+2х-1; б) (x+l)3(x2+2x-f2)-1/2; в) (ж+1)1п(х2+8х+11). 7.9. Представить формулой Тейлора до о((х - l/2)2n+1) функции: а) (х-2)(х2-4х + 5)"1/3; б) (2х2-8х + 5)/(х2-4х-|-3). 7.10. Представить формулой Тейлора функции: а) (4/х-1)"1/2-(4/х-1)1/2 до о((х-2)2п+2); б) 2Х*-Зх2+Зх до о((х-1)3п); в) (х-2)((х-4)(х2-2х + 4))"1/3 до о((х-2)3n+1); г) sin(3x2 + 6x + 4) до o((x-hl)4n); д) xsin(x2 + 2x + 2)-cos(x2 + 2x) до о((х + 1)4п+3). 7.11. Для каждого из представлений в задачах 7.2-7.10 записать остаточный член в форме Лагранжа и оценить значение остаточного члена при |х — а\ < 0,1.
190 7. ФОРМУЛА ТЕЙЛОРА 7.12. Можно ли представить формулой Маклорена до о(х4) функции: а) ж5/2; б) е1+1пх; в) у/х? 7.13. Представить формулой Маклорена до о(хп) с наибольшим значением п функции: a) x3|x|+cos2x; б) sinlxp + e27; в) |х|2*+1. 7.14. Представить формулой Маклорена до слагаемого, содержащего хп, функции: a) (sinx3)1/3, n=13; б) sin(sinx), п = 3; в) lncosx, n = 6; г) {x = 2t + smt, y = tet}1 n = 3; д) у7 + у-х = 0, п = 6. 7.15. Функцию shx представить формулой Маклорена и оценить по абсолютному значению остаточный член. 7.16. Сколько раз (по крайней мере) дифференцируема в точке а функция /(х), если ее вторая производная предста- вима формулой Тейлора с остаточным членом о((х - а)п) ? 7.17. Представить функцию /(х) в виде многочлена по степеням х - а, если: а) /(х) = х3, о=1; б) /(х) = х4+8х3+24х2+32х+17, а=-2; в) /(х) = 1 + х + х2 + х3, о = -1; г) /(х) = (х3-8)2, а = 2. 7.18. Для дважды дифференцируемой на отрезке [0, 1] функции /(х) /(0) = /(1) = 0, причем существует такое число М > 0, что Vx е (0, 1) /"(х) < М. Доказать, что |/'(х)| < М/2 Vx € [0, 1]. 7.19. Доказать, что для дважды дифференцируемой на R функции f(x) М\ ^ 2М0М2, где Mk — max|/^(x)|, к = 0,2. 7.20. Подобрать коэффициенты А, В и С так, чтобы при х -> 0 были справедливы с наибольшей точностью асимптотические равенства: a) 3 б) в) (1 + х)х = (1 + Ах + Вх2)/(\ +Сх) +О(хп).
Вопросы и задачи 191 7.21. Найти числа 6 € R и n £ N, такие, чтобы существовал конечный lim (еЬхП — cosx2)/x8. 7.22. Вычислить пределы: а) lim (ln(x + \/Ц- х2 - х + х3/6)/(х - thx); б) lim (-^/l + 2tgx — ex-f £2)/(arcsinx — sinx); в) lim (cosx - e~x /2)/x4; r) lim x->oo д) lim (cos(xex) — ln(l -x) -x)' 7.23. Подбором коэффициентов а и 6 в выражении х = = asinx-f 6tgx обеспечить возможно более высокий порядок п погрешности О(хп) при представлении длины малой дуги окружности единичного радиуса (при „спрямлении" дуги окружности) линейной комбинацией длин отрезков AD и ВС (рис. 7.5). Каково будет п, если использовать выражение x = asinx + 6tgx + + 2csin(x/2), соответствующее линейной комбинации длин отрезков AD, ВС и АС? 7.24. Оценить погрешность формулы Чебышева, согласно которой длина дуги окружности приближенно равна сумме боковых сторон равнобедренного треугольника, построенного на хорде этой дуги и имеющего высоту, равную у/^/Ъ высоты сегмента, образованного этой дугой и ее хордой.
8. ИССЛЕДОВАНИЕ ФУНКЦИИ 8.1. Условия возрастания и убывания функций При изучении поведения функции необходимо знать условия, при которых она сохраняет в данном промежутке постоянное значение или изменяется монотонно. Ранее (см. следствие 5.2) было показано, что если функция у = f(x) непрерывна на отрезке [а, 6] и ее производная ff(x) = О Уж € (а, 6), то эта функция постоянна на указанном отрезке. Заметим, что аналогичное утверждение верно и для функции /(ж), непрерывной и дифференцируемой в интервале. Из этого утверждения вытекает важное в дальнейшем следствие. Следствие 8.1. Бели функции f(x) и д(х) непрерывны и дифференцируемы в интервале (а, 6), причем f'(x) = g'(x) Vx 6 (а, 6), то эти функции в указанном интервале могут различаться лишь на постоянную, т.е. }(х) = д(х) + с (с = const) Vx € (а, 6). Для доказательства достаточно рассмотреть разность <р(х) — = f(x) -д(х). Так как производная (р'(х) = f'(x)-g'(x) = 0 для всех х 6 (а, 6), то у>{х) =const, иначе говоря, f(x) — д(х) = с, или f(x) =g(x) + c. Примеры, а. Пусть х f(x) = arctgz и д(х) = arcsin
8.1. Условия возрастания и убывания функции 193 Обе функции определены на всей числовой прямой R. Найдем производные этих функций: aw- Так как производные этих функций совпадают на всей числовой прямой R, то сами функции различаются на постоянную, т.е. arctg s = arcsin . + с. у/Т+х2 Для определения постоянной достаточно в этом равенстве положить х = 0. Так как arcsin 0 = arctgO = 0, то и с = 0. Итак, доказано тождество arctgx = arcsin . Уж 6 R, VI + х2 которое можно получить и с учетом элементарных соображений. б. Аналогично можно доказать, что X arcsin ж = arctg—■== Vs 6 (-1, 1). Vl -x2 в. Пусть теперь 1 2х и д{х) = - arctg 1 X Найдем производные этих функций: 4х2 (1-х2)2 13-544
194 8. ИССЛЕДОВАНИЕ ФУНКЦИЙ Производные совпадают при всех значениях х, кроме х = ±1, где не определена вторая функция. Поэтому тождество 1 2х arctgx = - arctg —^ + с может быть установлено лишь для каждого из промежутков (-оо, —1), (—1,1) и (1, +оо) в отдельности. Оказывается, что и константы с для этих промежутков будут различны: для (—1, 1) при х = 0 получим с = 0, а устремив х к -оо и +оо, соответственно найдем с=-тг/2 для (-оо, -1) и с = тг/2 для (1, +оо). # Выясним теперь, как по производной функции можно судить о возрастании (или убывании) самой функции на промежутке. Напомним [I, 3.4], что функцию f(x) называют возрастающей (убывающей) в интервале (а, 6), если большему значению ее аргумента х в этом интервале соответствует большее (меньшее) значение функции, т.е. при х2 > х\ (хи х2 € (а, Ь)) f(x2) > f(xi) (f(x2) < f{xi)). Функцию называют неубывающей (невозрастающей) в интервале (а, 6), если большему значению аргумента в этом интервале соответствует не меньшее (не большее) значение функции: при х2 > х\ (хи х2 е (а, 6)) f(x2) > f(xi) (f(x2) < f(xi)). При этом в первом случае функцию именуют строго монотонной, а во втором — монотонной. Теорема 8.1 (необходимое условие строгой монотонности функции). Бели дифференцируемая в интервале (а, 6) функция f(x) возрастает (убывает) в этом интервале, то /'(ж) ^ 0 (f(x) ^ 0) для всех х € (а, Ь). •4 Докажем теорему для случая возрастания функции (для убывающей функции доказательство аналогично). Согласно условию теоремы, функция f(x) возрастает в интервале (а, Ь). Это означает, что для произвольного х G € (а, Ь) и любого Ах > 0, такого, что х + Да: G (а, 6), будет
8.1. Условия возрастания и убывания функции 195 f(x + Ax) > f(x). Следовательно, разностное отношение Ах и, согласно свойству предела знакопостоянной функции [I, 7.3], если предел разностного отношения существует, то он не отрицателен. Для дифференцируемой функции f(x) такой предел существует и равен ее производной (см. определения 1.2 и 1.3). Таким образом, lim Л* + ДЛ*)/(*) > О V* 6 (а, 6), д*-ю Ах т.е. }'(х) ^ 0 для всех х £ (о, 6). ► Рассмотрим теперь достаточное условие строгой монотонности функции. Теорема 8.2. Если для дифференцируемой в интервале (а, 6) функции f(x) выполнены условия: 1) /'(*)> 0 (/'(*)< 0) Vs<E(a, 6); 2) /'(ж) не обращается тождественно в нуль ни в каком промежутке ЕС (а, 6), то /(ж) возрастает (убывает) в этом интервале. Ч Возьмем любые zi, x<i в интервале (а, 6), такие, что х\ < < х2. Для функции f(x) на отрезке [zi, £2] выполнены все условия теоремы 5.3 Лагранжа, поэтому = f'{c)(x2 - *i), с € Так как по условию теоремы /'(ж) ^ 0 Vx G (a, 6), то и f(x2) - /(^l) ^ 0. Следовательно, функция f(x) не убывает в интервале (а, 6). А тогда будет не только f(xi) ^ /(а^), но и 13
196 8. ИССЛЕДОВАНИЕ ФУНКЦИЙ Покажем, что в последнем соотношении хотя бы одно из неравенств на самом деле является строгим. Действительно, если предположить, что f(x\) = /(^2), то получим V* € («,, *2), /Ы = т.е. функция является постоянной в интервале («i, £2), а тогда f'{x) = 0 для всех х 6 (жь хт) (см. следствие 5.2), что невозможно в силу условия 2 теоремы. Поэтому }(х{) < f(x2) при xi < Ж2, т.е. функция /(ж) возрастает в интервале (а, 6). Итак, доказано достаточное условие возрастания функции. Доказательство достаточного условия убывания функции аналогично. ► Доказанные теоремы имеют следующий геометрический смысл: если в интервале (а, Ь) функция f(x) возрастает, то касательная к кривой у = f(x) для всех х € (а, Ь) образует острый угол с осью Ох (в конечном числе точек касательная может быть горизонтальна). > например, функция f(x) = х3 возрастает на всей числовой пря- мо£ (рИС. 8,1)^ но ее производная f'(x) = За;2 равна нулю при х = 0. Если же функция f(x) убывает в интервале (о, 6), то касательная к кривой у = }(х) для всех х G (а, Ь) образует тупой угол с осью Ох (в конечном числе точек касательная может быть горизонтальна). Из теорем 8.1 и 8.2 вытекают необходимое и достаточное условия не убывания (не возрастания) функции в интервале. Теорема 8.3. Дифференцируемая в интервале (а, 6) функция f(x) не убывает (не возрастает) в этом интервале тогда и только тогда, когда для всех х 6 (а, Ь) f'(x) > 0 (f'{x) ^ 0). Рис. 8.1
8.2. Экстремум функции 197 Рассмотренные теоремы верны для непрерывной в интервале функции, недифференцируемой в конечном числе точек этого интервала. Это непосредственно следует из хода доказательства теорем, если его применять последовательно ко всем интервалам, на которые разбивают область определения непрерывной функции указанные точки. Итак, знакопостоянство производной }'{х) в интервале (при условии, что она обращается в нуль только в конечном числе точек этого интервала) достаточно для строгой монотонности функции }{х) в данном интервале. Пример. Найдем интервалы возрастания и убывания функции у = ж3 - 9ж2/2 + 6х. Эта функция определена для всех х € R. Ее производная у1 = Зж2 - -9я + 6 = 3(х- 1)(ж-2) поло- жительна в интервалах (-оо, 1) и (2, +оо) и отрицательна в интервале (1, 2) между нулями квадратного трехчлена Зх2 — - 9ж+6. Следовательно, в силу теоремы 8.2 данная функция в интервалах (-оо, 1) и (2, +оо) возрастает, а в интервале (1,2) убывает (рис. 8.2). Рис. 8.2 8.2. Экстремум функции. Необходимые условия существования экстремума Пусть функция f(x) определена в интервале (а, 6). Определение 8.1. Значение /(хо) в точке xq 6 (а, Ь) называют локальным максимумом (локальным минимумом) функции /(ж), если существует такая проколотая о окрестность U(xq) С (а, Ь) точки жо, что (f(x)>f(x0)). (8.1)
198 8. ИССЛЕДОВАНИЕ ФУНКЦИЙ Локальный максимум и локальный минимум объединяют общим термином локальный экстремум, а точку х0 называют точкой локального экстремума (максимума или минимума) функции. При этом говорят, что в точке х0 функция f(x) достигает локального экстремума (максимума или минимума). На рис. 8.3 сплошной линией изображен график функции /(ж), определенной на отрезке [а, Ь]. В данном случае точки ж*, d и Х\ — точки локального максимума, с и хг — точки локального минимума, все х 6 (с, d) — точки локального экстремума (локальных максимума и минимума одновременно). Функция не определена в полной окрестности концов отрезка [а, 6] и поэтому точки а и 6 не являются точками локального экстремума. Рис. 8.3 Замечание 8.1. Бели в (8.1) выполнены строгие неравенства, то хо называют точкой строгого локального максимума (минимума), объединяя эти понятия общим термином точка строгого локального экстремума. На рис. 8.3
8.2. Экстремум функции199 х», d и х\ — точки строгого локального максимума, Х2 — точка строгого локального минимума. Далее слова „строгий" и „локальный" будем опускать. При этом точку хо будем называть точкой экстремума (максимума или минимума), а значение f{x0) функции — экс- тремалъным (максимальным или минимальным). Бели в точке хо функция /(х) достигает максимума или минимума, то будем писать соответственно f(x0) = /max или /(хо) = /mm- Таким образом, на рис. 8.3 х«, </, xi и Хг — точки экстремума функции /(ж) (аи, d и х\ — точки максимума и хч — точка минимума). Следует заметить, что максимальное значение функции /(х) в интервале (а, Ь) не обязано быть больше любого минимального значения этой функции в данном интервале. Например, максимальное значение /(#*) функции /(х), график которой изображен на рис. 8.3, меньше ее минимального значения Теорема 8.4 (необходимое условие существования экстремума дифференцируемой функции). Бели функция /(х) дифференцируема в точке хо и имеет в этой точке экстремум, то /'(хо) = 0. < Пусть для определенности хо — точка максимума. Из определения 8.2 максимума функции /(х) в точке хо следует, что у этой точки существует некоторая окрестность U(xo), в которой данная функция принимает наибольшее значение. Тогда в этой окрестности для дифференцируемой в точке хо функции выполнены все условия теоремы 5.1 Ферма, из кото- рой сразу следует, что /'(хо) — 0. Доказательство для случая строгого локального минимума в точке хо аналогично. ► Теорема 8.4 имеет простой геометрический смысл: касательная к кривой у = /(х) в точке (хо, /(яо))> соответствующей точке хо экстремума дифференцируемой в ней функции /(х), обязательно параллельна оси Ох (например, точка х\ на рис. 8.3).
200 8. ИССЛЕДОВАНИЕ ФУНКЦИЙ Определение 8.2. Точки, в которых производная функции f(x) равна нулю, называют стационарными точками этой функции. На рис. 8.3 стационарными точками являются xi, x3 и все х € [с, d). Из теоремы 8.4 следует, что дифференцируемая функция может достигать экстремума только в своих стационарных точках. Однако не во всякой стационарной точке функция имеет экстремум. Так, на рис. 8.3 экстремума (максимума) функция достигает лишь в одной из своих стационарных точек — в точке х\. Пример функции f(x) = х3 (см. рис. 8.1) также показывает, что ее производная f(x) = Зж2 равна нулю при х = 0, т.е. х = 0 является стационарной точкой этой функции, но экстремума в этой точке у данной функции нет. Рассмотрим теперь функции, производные которых в отдельных точках бесконечны или не существуют. Например, функция f(x) = 1 - \Гх* (см. пример 5.1. б) имеет максимум в точке х — 0, тогда как ее производная в этой точке бесконечна (см. рис. 5.5,6), а функция у = |х - 3| (гбК) имеет минимум в точке х = 3 (рис. 8.4), хотя ее производная в указан- [ ной точке не существует. Следовательно, точки, в которых производная функции бесконечна или не существует, также могут быть точками экстремума этой функции. Но, разумеется, и в этом случае одно лишь отсутствие производной или же обращение ее в бесконечность не гарантирует наличие экстремума. Примером может служить функция д(х) = ж1/3 (х 6 R), которая имеет бесконечную производную при х = 0, однако у данной функции экстремума в этой точке нет, поскольку в любой ее окрестности эта функция принимает как положительные, так и отрицательные значения (см. рис. 8.1). У 3 0 Рис. 8.4
8.3. Достаточные условия существования экстремума функции 201 Итак, необходимое условие существования экстремума в общем случае может быть сформулировано следующим образом: если функция f(x) имеет экстремум в точке xq} to либо она дифференцируема в этой точке и ее производная f'(xo) = 0, либо функция недифференцируема в точке х0. Определение 8.3. Точки, в которых производная функции f(x) равна нулю, бесконечна или не существует вовсе, называют критическими точками функции (иногда — точками, подозрительными на экстремум). На рис. 8.3 критическими будут точки а?з, я*, все х 6 [с, d\, х4, х\, Х2 и х$. Бели экстремум функции достигается в точке, где производная бесконечна или не существует, то его часто называют острым экстремумом (см. рис. 8.4) в отличие от гладкого экстремума, который достигается в стационарной точке функции (точка х\ на рис. 8.3). Пример 8.1. Найдем критические точки функции f(x) = = \/(\ — х)(х — 2)2. Эта функция определена на всей числовой оси. Бе производная обращается в нуль при х0 = 4/3 и бесконечна при х\ = 1 и Х2 — 2. Таким образом, данная функция имеет три критические точки: хо = 4/3, Х\ = 1 и Х2 = 2. 8.3. Достаточные условия существования экстремума функции Теорема 8.5. Пусть функция у — f(x) непрерывна в некоторой окрестности U (жо) критической точки хо и дифференцируема во всех точках этой окрестности (кроме, быть может, самой точки хо). Если при переходе аргумента х слева направо через эту точку производная }'{х) меняет знак, то в точке
202 8. ИССЛЕДОВАНИЕ ФУНКЦИЙ х0 функция f(x) имеет экстремум, причем если производная меняет знак с минуса на плюс, то f{x0) = /mjn, если же с плюса на минус, то f(x0) = /г < Выберем произвольные х\, х2 € U(xo) так, чтобы х\ < < х0 < х2. Функция f(x) непрерывна на отрезках [х\, х0] и [а:о, х2] и дифференцируема в интервалах (х\, хо) и (хо, х2), т.е. удовлетворяет условиям теоремы 5.3 Лагранжа. Поэтому, согласно формуле (5.1) Лагранжа, - f(xo) = f'(c2)(x2 - хо), с2 € (х0, х2). Отсюда, если /'(сг) < 0, а /'(с2) > 0, то f(xx) > f(x0), f(x2) > о > f(xo). Поэтому f(x) > f(xo) Vx € U(a?o) и, согласно определению 8.1, f{xo) = /min- Если же f(ci) > 0, a f'(c2) < 0, то f(x)<f(x0) Va?€U(xo),T.e. max< Пример, а. Найдем интервалы монотонности и экстремумы функции у(х) = х2(х - I)3. Функция определена на всей числовой прямой. Бе производная у'(х) = 2х(х - 1)3 + Ъх2{х - I)2 = х(х - 1)2(5х - 2), т.е. функция имеет три стационарные точки х\ = 0, х2 = = 2/5 = 0,4 и хз = 1. Они выделяют на числовой оси четыре интервала (-оо, 0), (0, 0,4), (0,4, 1) и (1, +оо), на каждом из которых производная сохраняет знак, т.е. в силу теоремы 8.2 функция строго монотонна, а именно: в интервале (-оо, 0) у7 > 0 — функция возрастает; в интервале (0, 0,4) у' < 0 — функция убывает; в интервалах (0,4, 1) и (1, +оо) у' > 0 — функция возрастает. Согласно теореме 8.5, в точке х\ = 0 функция имеет максимум, причем у(0) = 0, в точке х2 = 0,4 у{х2) = ymin, причем
8.3. Достаточные условия существования экстремума функции 203 у(0,4) =-108/3125 =-0,03456. В точке ж3 = 1 экстремума нет, так как при переходе аргумента х через эту точку производная у'(х) не меняет знак, хотя у'(1) = 0. График функции приведен на рис. 8.5, а. Рис. 8.5 б. Для составной функции производная / \ i -я при х < О, yW~^ 2a; 4-3 при а: > О при х < О, при ж > О существует во всех точках, кроме х = 0, и меняет знак с минуса на плюс при переходе аргумента через точку х = 0, но у этой функции (рис. 8.5, б) нет экстремума (у(0) = 3 > f(x) при —3 < х < 0 и у(0) = 3 < f(x) при х > 0). Отсутствие экстремума связано с нарушением одного из условий теоремы 8.5, а именно условия непрерывности функции в ее критической точке (в данном случае — в точке х = 0). в. У составной функции У ( ч Г Зж24-2 при хфО * I А Т1¥ЧТЖ Л» -^ II при х = 0
204 8. ИССЛЕДОВАНИЕ ФУНКЦИЙ производная у' = 6х существует во всех точках, кроме х = 0, и меняет знак с минуса на плюс при переходе через точку х = 0. Тем не менее эта функция имеет в точке х = 0 не минимум, а максимум, что нетрудно проверить непосредственно (рис. 8.5, в). Дело в том, что теорема 8.5 не применима и в данном случае, так как функция терпит разрыв в точке х = 0. # Таким образом, установленное в теореме 8.5 достаточное условие существования экстремума нельзя использовать, если функция не является непрерывной в критической точке. Оно не применимо и тогда, когда любая проколотая окрестность рассматриваемой критической точки функции содержит бесконечное множество других ее критических точек, а производная этой функции не сохраняет определенного знака в любой полуокрестности рассматриваемой точки. Характерным примером такого рода является составная функция «нв* Т x2sin- при х ф О, х 0 при х = 0, график которой представлен на рис. 4.6. Составим для этой функции разностное отношение в точке х = 0: Ах Ах Ах Поскольку при Ах —у О Д/(0)/Ах —у О, из определения 1.2 производной следует, что /'(О) = 0. Однако в любой сколь угодно малой полуокрестности стационарной точки х = 0 производная fix) = 2xsin cos - х х рассматриваемой функции бесконечное число раз меняет знак. Поэтому в данном случае теорему 8.5 нельзя использовать. По той же причине не применима теорема 8.5 и к функции ( 2/ . 1\ х)= i \ х) F т 0 при х = 0.
8.3. Достаточные условия существования экстремума функции 205 Различие между этими функциями состоит в том, что для второй из них существует проколотая окрестность точки х = 0, в которой /(0) = 0 < /(ж), и, согласно определению 8.1, в этой точке она имеет минимум, а для первой из них нельзя указать такой проколотой окрестности, в которой было бы либо /(0) = 0 < /(ж), либо /(0) = 0 > /(ж), т.е. первая из функций экстремума в точке х = 0 не имеет. Теорема 8.в. Пусть функция f(x) n раз дифференцируема в точке жо, причем все ее производные до (п — 1)-го порядка включительно в этой точке равны нулю: /'(жо) = f"(xo) = • • • = — /(п"1)(ж0) = 0, a f^(xo) ф0. Тогда, если п четное, то в точке хо функция имеет экстремум, причем при /^(хо) < 0 /Ы =/шах, а При /<n>(*o)>0 /(xO) = /min. < Представим функцию f(x) в окрестности Ui(xo) точки xq формулой Тейлора порядка п — 1 с остаточным членом в форме (7.13) Пеано: /(*) = /Ы + /'Ы(ж - х0) +... + ♦ где а(х) — функция, бесконечно малая при х -> жо. Поскольку по условию теоремы /'(жо) = ... = /^п~гЦхо) = 0, формулу Тейлора можно переписать в виде +^) (8.2) #•• о При п четном в (S.2) сомножитель (ж - жо)п > 0 Уж € 1Ыжо). Так как а(х) -> 0 при ж ->• Жо, то /(")(хо) _ п! п! и в силу знакопостоянства функции, имеющей ненулевой конечный предел [I, 7.4], у точки жо существует окрестность
206 8. ИССЛЕДОВАНИЕ ФУНКЦИЙ U2(xo), в которой функция /М(хо) + а(х) сохраняет знак значения /(л)(хо). А тогда из (8.2) следует, что у точки 0 0 0 существует проколотая окрестность U(xo) = Ui(xo) в которой знак разности /(х) - /(хо) совпадает со знаком значения /^(хо), а именно: при /^пЦхо) < 0 /(х) < /(хо) о Vx € U(x0) и, по определению 8.1, /(х0) = /max; при /W(xo) > О о Дх) > fixo) Vx G U(xo) и, по определению 8.1, /(х0) = /min- ► тп-2 Из хода доказательства теоремы 8.6 видно, что для нечетного п сомножитель (х - хо)п в (8.2) меняет знак при переходе аргумента х через значение х0, и поэтому точка хо не будет точкой экстремума функции /(х). Таким образом, четность п является не только достаточным, но и необходимым условием существования в точке хо экстремума функции /(х), для которой существует и конечна не равная нулю производная a /W(xo) = 0 при Пример. Для функции /(х) = xm (me N) все производные до порядка т - 1 включительно в точке х = 0 равны нулю, a /(w)(0) = m! > 0. При т четном х = 0 — точка минимума этой функции, а при т нечетном функция /(х) = хт в точке х = 0 не имеет экстремума (рис. 8.6). т-3 Рис. 8.6
8.4. Условия выпуклости функции 207 Следствие 8.2. Бели хо является стационарной точкой функции /(ж), т.е. /'(жо) = 0, a f"(xo) существует, конечна и не равна нулю, то при f"(x0) < 0 /(х0) = /max> а, при f"(x0) > >0 8.4. Условия выпуклости функции Определение 8.4. Функцию }{х), определенную в интервале (а, 6), называют выпуклой вверх (вниз) в этом интервале, если Va?i, х2 € (а, 6) и Vg £ (0, 1) f(qxx + (1 - q)x2) > qf(xx) - q)f(x2)). (8.3) Бели в (8.3) при xi ^ x2 выполнены строгие неравенства, то /(х) строго выпукла вверх (вниз) в интервале (а, 6). Бели о функции говорят, что она выпуклая (или строго выпуклая) и не указывают направление выпуклости, обычно имеют в виду выпуклость (или строгую выпуклость) вниз. Покажем, что любая дуга графика строго выпуклой вверх (вниз) функции f(x) лежит выше (ниже) стягивающей эту дугу хорды (рис. 8.7, а и б). Рассмотрим любые точки х\ < из интервала (а, 6). Ясно, что х = qxi + (1 - q)x2 € (хи х2) Vg 6 (0, 1), У\ х2Ь х2 Ь а Рис. 8.7
208 8. ИССЛЕДОВАНИЕ ФУНКЦИЙ а уравнение хорды, проведенной через точки (х\у f(x\)) и (z2, /(*2)), имеет вид Подставим в это уравнение предыдущее равенство и получим, что абсциссе х будет соответствовать ордината хорды В силу (8.3) ордината f(qx\ + (1 — <?)ж2) точки, лежащей на дуге графика выпуклой вверх (вниз) функции /(я), для той же абсциссы х = qx\ + (1 — д)ж2 больше (меньше) ординаты точки, лежащей на хорде, что и требовалось показать. Ограничимся далее рассмотрением функций, выпуклых вверх и строго выпуклых вверх (полученные результаты легко перенести на функции, выпуклые вниз и строго выпуклые вниз). Возьмем любые точки х\ и я2 из (а, 6), такие, что х\<Х2- Обозначим qx\ + (l-q)x2 = x, где tf€(0, 1). Тогда х 6 (:ri,a:2), q = (x2 — х)/(х2 - х\) и для выпуклой вверх функции из (8.3) следует MzliSU > /(-WE), (8.4) X — Х\ Х2 — X т.е. угловой коэффициент хорды AM на рис. 8.7, а не меньше (а для строго выпуклой вверх функции — больше) углового коэффициента хорды ВЫ. Теорема 8.7. Дифференцируемая в интервале (а, 6) функция f(x) выпукла (строго выпукла) вверх в (а, Ь) тогда и только тогда, когда ее производная f'(x) не возрастает (убывает) в этом интервале. < Сначала докажем необходимость. Переходя в (8.4) к пределу сперва при х —> х\, а затем при х —у х2 и учитывая правило
8.4. Условия выпуклости функции 209 предельного перехода в неравенстве [I, 7.4] и определение 1.2 производной, получаем (*1) < 6, т.е. для выпуклой вверх и дифференцируемой в интервале (а, 6) функции необходимо, чтобы ее производная не возрастала в (а, 6). Для строго выпуклой вверх функции /(х) вместо (8.4) справедливо /(«) - /Ы . /(«а) ~ /(«) Применяя к разностям f{x)-f{x\) и f(x2)-f(x) формулу (5.1) Лагранжа, приходим к выводу, что существуют такие точки ci и Сг (ж 1 < ci < х < сг < а?2), для которых /ы=/(*)-/(*.)>/ы - я*)=/,(С2), X-Xi X2-X Так как производная /'(х) не возрастает в интервале (а, 6), то /'(«О £ f'(ci) и /;(с2) ^ /'(х2), а тогда }'(хх) > f'(x2), т.е. для строго выпуклой вверх функции производная /;(х) убывает в (а, 6). Докажем теперь, что условие невозрастания (убывания) производной f'(x) достаточно для выпуклости (строгой выпуклости) вверх функции f(x). Так как функция f(x) дифференцируема в интервале (а, 6), то она непрерывна на любом отрезке [xi, X2] С (а, 6) и, согласно теореме 5.3 Лагранжа, при а < xi < ci < х < С2 < Х2 < Ь /(*) - /(«0 _ х_х, - «I/ Ar J Отсюда при f'{c\) ^ /'(сг) (производная не возрастает) следует (8.4), т.е. выпуклость вверх функции /(х), а при f'{c\) > > /'(С2) (производная убывает) в (8.4) получим строгое неравенство, соответствующее строгой выпуклости вверх этой функции. ►
210 8. ИССЛЕДОВАНИЕ ФУНКЦИЙ Теорема 8.8. Дифференцируемая в интервале (а, 6) функция /(х) выпукла вверх в нем тогда и только тогда, когда все точки графика функции лежат не выше любой касательной к нему в этом интервале (в случае строгой выпуклости вверх все точки графика функции, кроме точки касания, лежат ниже любой касательной к нему в этом интервале). < Начнем с доказательства необходимости. Запишем уравнение вида (1.10) касательной к графику функции f(x) в точке (хо, /(хо)), где £ (а, 6). Согласно формуле (5.1) Лагранжа, где точка с лежит между х и xq. После вычитания последнего равенства из предыдущего получим Для строго выпуклой вверх функции, согласно теореме 8.7, производная убывает. Поэтому знак разности /'(хо) - /'(с) совпадает со знаком разности х - х0 и, следовательно, у — - /(х) > 0 Vx £ (о, 6) \ {хо}. Для выпуклой вверх функции, согласно теореме 8.7, производная не возрастает в (а, 6) и поэтому у - }{х) ^ О Vx 6 (а, 6) \ {хо}. Тем самым необходимость условия данной теоремы доказана. Теперь докажем достаточность условия теоремы, по которому точки графика функции /(х) лежат не выше любой касательной к нему в интервале (а, 6), т.е. у - /(х) = /(х0) + /'(хо)(х - х0) - Дх) > 0 Vx, хо € (а, 6), или * (8-5) х-х0
8.4. Условия выпуклости функции 211 Таким образом, /Ы-Лхо) и V«a€(«,,6), (8.6) что соответствует условию (8.4) выпуклости вверх функции f(x) в интервале (а, Ь). Строгое неравенство в (8.5) приводит к строгому неравенству и в (8.6), а это соответствует условию строгой выпуклости вверх функции f(x) в интервале (а, 6). ► Итак, дуга графика выпуклой вверх и дифференцируемой в интервале функции лежит не ниже стягивающей эту дугу хорды и не выше касательной, проведенной в любой точке данной дуги (см. рис. 8.7). Докажем еще одно часто используемое на практике достаточное условие строгой выпуклости функции. Теорема 8.9. Бели функция f(x) дважды дифференцируема в интервале (а, 6) и f"(x) < О (/"(я) > 0) Vs € (а, Ь), то функция строго выпукла вверх (вниз) в этом интервале. < Возьмем в интервале (а, 6) произвольную точку х0 и проведем касательную к графику функции в точке (а?о, Согласно (1.10), уравнение касательной имеет вид Для доказательства теоремы достаточно показать, что все точки графика функции Ъ интервале (а, 6), кроме точки касания, лежат ниже (выше) касательной. Представим функцию }(х) формулой (7.19) Тейлора порядка п=1 с остаточным членом в форме Лагранжа: /(«) = /(«„) + /'Ы(х - го) + ^(х - so)2, где точка с лежит между х и% Вычитая из этого равенства предыдущее, получаем ЛА*
212 8. ИССЛЕДОВАНИЕ ФУНКЦИЙ Отсюда видно, что знак разности f(x) — у совпадает со знаком /"(с). Если /"(с) < 0, то f(x) < у, т.е. все точки графика функции, кроме точки касания, лежат ниже проведенной к нему касательной, что в силу теоремы 8.8 означает строгую выпуклость вверх функции /(х) в (а, 6). Если же /"(с) > О, то f(x) > у. Согласно теореме, аналогичной теореме 8.8, но для функции, строго выпуклой вниз, *» это означает строгую выпуклость х вниз функции f(x) в интервале /(*)—х4 (а, Ь). ► То, что теорема 8.9 устанавливает лишь достаточное условие строгой выпуклости вверх (вниз), видно из простого примера для функции f(x) = -х4, которая строго выпукла вверх Vx € R, хотя Рис. 8.8 ///(x)U=o=-12x2U=0 = 0 (рис. 8.8). Пример, а. Найдем интервалы выпуклости функции /(х) = arctgx. Эта функция определена и бесконечно дифференцируема Vx 6 R. Вычислим последовательно (arete*)' = f+^a и (arctgs)"=-(1+*2)2. Ясно, что при х < 0 (arctgx)" > 0, т.е. функция строго выпукла вниз в интервале (-оо, 0), а при х > 0 (arctgx)" < < 0, т.е. функция строго выпукла вверх в интервале (0, +оо) (рис. 8.9). б. Докажем неравенство Для функции /(х) = ех /"(х) = ех > О Vx € R, т.е. функция строго выпукла вниз на всей числовой оси и поэтому удовлетворяет условию (8.3) при строгом неравенстве. Полагая в (8.3) q = 1/2, получим неравенство, которое требуется доказать. #
8.5. Точки перегиба 213 У к/2 arctgx О -7Г/2 Рис. 8.9 Следствием теоремы 8.9 и свойства знакопостоянства функции, имеющей ненулевой конечный предел, является следующее утверждение. Утверждение 8.1. Если вторая производная f"(x) функции f(x) непрерывна и отрицательна (положительна) в точке Жо, то у этой точки существует окрестность U(z0), в пределах которой функция f(x) строго выпукла вверх (вниз). £.5. Точки перегиба Определение 8.5. Пусть функция f(x) определена и непрерывна в некоторой окрестности точки xq. Если при переходе аргумента х через точку хо меняется направление строгой выпуклости функции /(я), то хо называют точкой перегиба этой функции, а точку (хо\ /(яо)) — точкой перегиба графика функции }{х). Если в точке перегиба функция имеет конечную или бесконечную производную, то это означает, что существует касательная к графику функции в этой точке. В силу теоремы 8.8
214 8. ИССЛЕДОВАНИЕ ФУНКЦИЙ и ее аналога для функции, строго выпуклой вниз, график функции переходит в точке перегиба с одной стороны касательной на другую (см. рис. 8.9, точка (0;0)). Пример, а. На рис. 8.1 приведены графики функции }(х) = х3 и обратной ей функции д(х) = х1/3, причем для функции д(х) производная в точке х0 = 0 бесконечна. Точка хо = 0 для этих функций является точкой перегиба. Действительно, f"(x) = 6а < О при х < О и f"(x) > О при х > О, д"{х) = = -2ж"5/3/9 > 0 при х < О и д"(х) < О при х > О, что, если учесть теорему 8.9, означает смену направления строгой выпуклости обеими функциями при переходе аргумента х через точку xq = 0, т.е. точка xq = 0 удовлетворяет определению 8.6 точки перегиба. б. Функция ■{ 0 при а при x = в точке а: = 0 имеет бесконечную производную (рис. 8.10) и при переходе аргумента х через эту точку меняет направление строгой выпуклости, поскольку f"(x) = 2/х3 < 0 при х < 0 и f"(x) > 0 при х > 0. Однако в точке х = 0 эта функция разрывна и поэтому х = 0 не является для нее точкой перегиба. Я*)-1/х Рис. 8.10 Рис. 8.11
8.5. Точки перегиба 215 в. Для функции f(x)=x2/3 (рис. 8.11) точка ж = 0 не является точкой перегиба, так как при переходе аргумента х через эту точку функция не меняет направления выпуклости. В самом деле, f"(x) = -2z~4/3/9 < 0 как при х < О, так и при х > 0. График функции не „перегибается" через касательную в точке (0, 0), а как бы „возвращается назад". В таком случае говорят о точке возврата (иногда — о точке заострения) графика функции. г. Функция /(*) ■{ 1п(1-ж) при х < 0, shz при 0 при переходе аргумента х через точку х — 0 изменяет направление строгой выпуклости (рис. 8.12), поскольку при х<0 /"(г) =-1/(1-г)2 < 0 и /"(z) = shz >0 при х > 0. Следовательно, х = 0 является точкой перегиба данной функции, хотя она и не имеет в этой точке производной (ни У конечной, ни бесконечной), так как /1(0) = -1 ^ Д<0) = = 1. Напомним, что если касательные к ветвям графика непрерывной функции в некоторой точке образуют угол, отличный от 0 или тг (см. рис. 8.12), то говорят об угловой точке графика функции. # shx Рис. 8.12 Необходимым условием существования точки перегиба хо функции f{x), дважды дифференцируемой в некоторой окрестности этой точки, будет /;/(хо) = 0. В противном случае при /"(яо) ^0 у точки xq существует окрестность, в которой f"(x) сохраняет знак /;/(жо)> т.е. в силу теоремы 8.9 функция }(х) строго выпукла в одном из направлений,
216 8. ИССЛЕДОВАНИЕ ФУНКЦИЙ что противоречит определению 8.5 точки перегиба. Условия определения 8.5 можно также выполнить, если функция имеет бесконечную вторую производную в точке хо или вовсе не имеет в этой точке второй производной. Итак, подобно тому как необходимым условием существования экстремума функции является наличие у нее хотя бы одной критической точки (стационарной точки или точки, в которой она недифференцируема), так для существования точки перегиба непрерывной функции /(х) необходимо наличие хотя бы одной критической точки х0 .у ее производной /'(ж), в которой либо f"(xo) = 0, либо J"(xq) бесконечна или не существует. Достаточные у словил существования точки перегиба функции устанавливает следующая теорема. Теорема 8.10. Бели функция /(х) непрерывна в точке хо, дважды дифференцируема по крайней мере в проколотой о окрестности U(xo) этой точки и вторая производная f"(x) этой функции меняет знак при переходе аргумента х через значение хо, то хо является точкой перегиба функции f(x). < По условию теоремы существует проколотая окрестность о о 1Цжо) £ U(a?o)j B которой /"(х) имеет разные знаки по разные стороны от точки xq. В силу теоремы 8.9 точка хо является о границей содержащихся в U*(xo) интервалов с различными направлениями строгой выпуклости функции /(х), что отвечает определению 8.5 точки перегиба. ► Пример. Найдем точки перегиба и интервалы выпуклости функции /(х) = ev*. Вычислим ее первую и вторую производные и Функция /(х) непрерывна на всей числовой оси R и в точке = 0 имеет бесконечную производную, а вторая производная
8.5. Точки перегиба 217 в этой точке не существует. Кроме того, в точке х\ = 8 }"(х\) = 0. Таким образом, точки перегиба этой функции могут быть лишь в точках хо и х\. При переходе аргумента х через значения xq = 0 и х\ = 8 f"(x) меняет знак, т.е. в силу теоремы 8.10 х0 и х\ являются точками перегиба функции /(ж), а точки (0; 1) и (8; е2) — точками перегиба графика функции. Теорема 8.11. Бели функция f(x) дифференцируема в точке хо по крайней мере п раз (п > 2) и f"{xo) = ... = = /(n~1)(io) = 0, a /(n)(zo) ф 0, то хо является точкой перегиба функции f(x) тогда и только тогда, когда п нечетно. 4 Из условия теоремы следует, что функция f(x) по крайней мере дважды дифференцируема в некоторой окрестности Ui(a;o) точки хо. Представим функцию f"(x) в этой окрестности формулой Тейлора порядка п - 3 с остаточным членом в форме (7.13) Пеано: x=xq 2 (n-2)! где а(х) — функция, бесконечно малая при х -> xq. В силу того, что Jim «(ж) = 0, Jim (/(п)Ы + а(ж)) = /(n)(x0) ^ 0 и свойства знакопостоянства функции, имеющей ненулевой конечный предел [I, 7.4], существует такая окрестность U2(20)1
2188. ИССЛЕДОВАНИЕ ФУНКЦИЙ в которой /(пЦхо) + а(х) принимает знак f^(xo). Тогда у точки жо существует окрестность Щжо) = Ui^ojfllbfco), в которой при п нечетном вторая производная /"(ж) вместе с сомножителем (х - хо)п~2 меняет знак при переходе аргумента х через значение х0. В этом случае из теоремы 8.10 следует, что жо — точка перегиба функции /(ж). Необходимость нечетности п следует из того, что при п четном вторая производная f"(x) Уж 6 и(жо) сохраняет знак производной fln4xo)i что противоречит необходимому условию существования в хо точки перегиба функции /(ж). ► Следствие 8.3. Бели функция f(x) в точке х0 дифференцируема по крайней мере трижды, причем /"(жо) = 0 и /"'(ж0) ф 0, то хо является точкой перегиба этой функции. Пример. Для функции f(x) = хт (т € N\ {1; 2}) первые т— 1 производные в точке xq = 0 равны нулю, a /^(xq) = = m! > 0. В силу теоремы 8.11, если т нечетное, то xq = = 0 — точка перегиба этой функции (на рис. 8.6 графики для т = 3 и 5), а при т четном жо = 0 не является точкой перегиба, хотя в ней и выполнено необходимое условие /"(жо) = = т(т- 1)хт~2\х=о = 0 (на рис. 8.6 график для т = 4). 8.6. Наибольшее и наименьшее значения функции в промежутке Пусть функция /(ж) непрерывна на отрезке [а, 6]. Тогда, согласно теореме 9.2 [I], она достигает на этом отрезке своих наибольшего М и наименьшего т значений. Бели этот отрезок не содержит критических точек функции /(ж) и она дифференцируема в интервале (о, 6), то ее производная /'(ж) знакопостоянна в этом интервале. Следовательно, функция /(ж) строго монотонна на [о, 6] и М равно большему, am — меньшему из значений f(a) и /(6). Если же функция /(ж) на отрезке [а, Ь] имеет конечное число критических точек, то как наибольшего М, так и наименьшего т значения она может
8.6. Наибольшее и наименьшее значения функции в промежутке 219 достигать либо на концах этого отрезка, либо внутри него. В последнем случае эти значения будут одним из максимумов или минимумов функции }{х). Итак, для нахождения наибольшего и наименьшего значений функции /(ж), непрерывной на отрезке [а, 6], необходимо: 1) найти все критические точки функции, попадающие на отрезок [а, 6]; 2) вычислить значения функции во всех указанных критических точках; 3) вычислить значения f(a) и /(6) функции на концах отрезка; 4) из всех полученных значений функции выбрать наибольшее и наименьшее. Бели дифференцируемая в интервале (а, Ь) функция строго выпукла вверх (или вниз), то в (а, 6) она имеет не более одной точки максимума (или минимума), значение функции в которой и будет совпадать с М (или cm). В самом деле, для дифференцируемой функции f(x) необходимым условием существования экстремума в точке xq 6 (а, Ь) в силу теоремы 5.1 Ферма будет /'(xq) = 0. Но для строго выпуклой в интервале (а, 6) функции ее производная, согласно теореме 8.7, строго монотонна и не может в нем более одного раза принимать нулевое значение. Найденные указанным путем значения Мит называют иногда абсолютным (или глобальным) соответственно максимумом и минимумом функции f(x) на отрезке [а, 6]. Понятия абсолютного (или глобального) максимума и минимума объединяют термином абсолютный (или глобальный) экстремум, применимым к любому множеству, на котором определена функция. Как уже было отмечено, непрерывная на отрезке функция обязательно достигает на нем своих наибольшего и наименьшего значений. Однако абсолютный экстремум для функции, непрерывной в интервале (а, Ь) или имеющей точки разрыва
220 8. ИССЛЕДОВАНИЕ ФУНКЦИЙ на отрезке [а, 6], может и не существовать. Например, для непрерывной на отрезке [а, 6] функции /(х), график которой приведен на рис. 8.13, абсолютный минимум m = f(d), а абсолютный максимум М = /(6), тогда как в интервале (а, 6) абсолютный минимум т! = f(d), а абсолютный максимум не существует. у! № /(а) Рис. 8.13 Примеры* а. Найдем наибольшее М и наименьшее т значения функции f(x) = 2х3 - Зх2 - 36а: - 8, непрерывной на отрезке [-3, 6]. Сначала вычислим производную f'(x) = 6х2 - бх - 36 = б(ж + 2)(ж - 3). Обе стационарные точки х = -2 и х = 3 этой функции принадлежат заданному отрезку. Значения функции в стационарных точках и на концах отрезка: /(-3) = 19, /(-2) = 36, /(3) = -89, /(6) = 100. Отсюда видно, что наибольшего значения функция достигает на одном из концов отрезка, т.е. М = /(6) = 100, а наименьшего
8.6. Наибольшее и наименьшее значения функции в промежутке 221 значения m = /(3) = —89 — в одной из стационарных точек, которая, очевидно, является точкой минимума данной функции. б. Найдем наибольшее и наименьшее значения функции }(х) = Х2/Зе~х, непрерывной на отрезке [—1,1]. Вычислим производную Критические точки функции х\ = 2/3 и i2 = 0 принадлежат указанному отрезку. Значения функции в критических точках и на концах отрезка: /(-1) = е « 2,72, /(0) = 0, /(2/3) = = (2/3)2/3е~2/3 « 0,39, /(1) = 1/е « 0,37. Итак, на отрезке [—1, 1] функция имеет абсолютный максимум М = /(—1) = = е « 2,72 и абсолютный минимум га = /(0) = 0. в. Покажем, что составная функция /оо= ' 2х + 1 при - 1 < х < 0, 2х при х = 0, [ 2х-1 при 0<х< 1, определенная и ограниченная на отрезке [-1, 1], не имеет на этом отрезке ни абсолютного максимума, ни абсолютного минимума (рис. 8.14). Действительно, на полуинтервале [-1, 0) значения функции возрастают от 3/2 до 2, на полуинтервале (0, 1] они возрастают от 0 до 1, но при этом функция не принимает ни значения 2, ни значения 0. Поэтому функция ограничена на отрезке [—1, 1], но вследствие разрыва в точке х = 0 не достигает на указанном отрезке своих наибольшего и наименьшего значений. Рис. 8.14 fix) -1 У — 4 2 3/2 1 / 0 A i 1 x
222 8. ИССЛЕДОВАНИЕ ФУНКЦИЙ 8.7. Асимптоты графика функции В выпуске [I] введено понятие асимптоты графика функции. Напомним, что различают три вида асимптот: вертикальные, горизонтальные и наклонные, которые могут быть как односторонними, так и двусторонними. Прямая х = а является вертикальной асимптотой графика функции t/ = /(a;), если хотя бы один из пределов lim f(x) х-*а—О или lim f(x) бесконечен. Отсюда следует, что вертикальные асимптоты у графика функции /(ж) могут быть только при наличии граничных точек области определения функции или точек разрыва. Пример, а. Найдем вертикальные асимптоты графика 1 функции у = ех~2. Ясно, что эта функция определена во всех точках числовой оси R, кроме точки х = 2. Вычислим пределы 1 lim ех~2 = О И 1 lim ex~2 = +оо. Х-+2+0 Следовательно, прямая х = 2 р g 15 является односторонней вертикальной асимптотой графика рассматриваемой функции при х—»2 + 0 (рис. 8.15). б. Выясним, существуют ли вертикальные асимптоты у графика функции у = 1/х. Эта функция определена на множестве R\{0}, причем lim - = -оо и lim - = -f-oo. х->-0 X аг-»+О X Итак, прямая х = 0 является двусторонней вертикальной асимптотой графика функции у= 1/х (см. рис. 8.10).
8.7. Асимптоты графика функции 223 Если существует конечный предел lim f(x) = 61, то пря- хf+oo мая у = bi является правосторонней горизонтальной асимптотой графика функции /(я), а если существует lim fix) = = &2 € R, то прямая у = Ь2 будет левосторонней горизонтальной асимптотой графика этой функции. При 6i = b2 график функции f(x) имеет двустороннюю горизонтальную асимптоту (на рис. 8.15 прямая у = 1 и на рис. 8.10 прямая у = 0). Прямую y = kx + b {кфО) называют правосторонней (левосторонней) наклонной асимптотой графика функции /(х), если эту функцию можно представить в виде f(x) = кх + b + •f a(i), где a(x) — бесконечно малая функция при х —> +оо (при х —> —с»). Из теоремы 10.6 [I] следует: чтобы график функции }(х) имел правостороннюю наклонную асимптоту y = k\x + b\t необходимо существование двух конечных пределов lim ^ = кх ф 0 и lim (fix) - кхх) = 6j r-4+oo X Х-++00 v v ' и достаточно существования второго из них. Аналогично, чтобы график этой функции имел левостороннюю наклонную асимптоту у = А^ж-Ь&г» необходимо существование двух конечных пределов lim £& = к2ф0 и lim (f(x) - к2х) = Ь2 x-f-oo X х-¥—оо и достаточно существования второго из них. Если при этом ki = к2 = к и Ь\ = Ь2 = 6, то график данной функции имеет двустороннюю наклонную асимптоту у = кх-\-Ь. В этом случае . , /(*) , /(*) , f{x) к = lim =-^—- = hm ±-^-L = lim ±-^-- х-*+оо X x-f-oo X х-*оо X И 6= lim (f(x)-kx)=: lim (/(x)-A;x)= lim (f(x) - кх). x-V+oo v v ; ' x-f-oo V V У ' x->oo V^ V ' '
224 8. ИССЛЕДОВАНИЕ ФУНКЦИЙ Ясно, что горизонтальные асимптоты являются частным случаем наклонных при к — О. Пример, а. Найдем асимптоты графика функции /(*) = х2 - Зх + 1 Функция определена при Va; G R\{0}. Вычислим пределы lim -О х2-Зх X с» и lim х2-Зх X = +оо. Следовательно, прямая х = 0 — двусторонняя вертикальная асимптота графика рассматриваемой функции. Для нахождения наклонных асимптот графика представим эту функцию в виде f(x) = х2-Зх о 1 = х - 3 + -. X у-х-3 Так как 1/х —> О при х —У оо, то из определения наклонной асимптоты следует, что прямая у = х - 3 является двусторонней наклонной асимптотой графика указанной функции. Поскольку 1/х > 0 при х > О и 1/х < 0 при х < 0, кривая графика лежит выше асимптоты при х -¥ +оо и ниже ее при х-> — оо (рис. 8.16). б. Найдем асимптоты графика функции f(x) = ех. Так как эта функция непрерывна на всей числовой прямой, то вертикальных асимптот ее график не имеет. Исследуем поведение функции Рис. 8.16 при х —» ±оо. Поскольку
8.7. Асимптоты графика функции 225 lim ex = +оо, a lim ex = О, X—►+«> X—f —ОО прямая у = О является левосторонней горизонтальной асимптотой графика функции f(x) = ex (см. рис. 5.9). Так как при х -> —оо ех/х —> 0, а при ж -> +оо ех/ж —¥ +оо, то наклонных асимптот эта функция не имеет. Пример. Проверим, есть ли наклонные асимптоты у графика функции Функция определена при х > 0. Поэтому у графика этой функции может быть лишь правосторонняя асимптота с уравнением у = kx + b при условии, что существуют пределы к = lim ^ и Ь= lim (f(x)-kx). r-H-oo X x-f+oo v ' 7 Подставляя в последнее равенство выражение для f(x) и учитывая второй замечательный предел, получаем Xх*1 1 1 к = lim —. г— = lim г-^— = -, (Ц)аг (1 |- l/x)x e (lf )г е/ х-++оо е В правой части последнего равенства первый сомножитель х/е при х -ь -f оо стремится к +оо, а второй — к нулю, поскольку показатель степени \ - х\ъ(1 + I/х) при х -* +оо стремится к нулю, так что имеем неопределенность вида [оо-0]. Так как при х -> +оо е1-*1^14"1/*) - 1 - 1 - xln(l + 1/ж), а в силу (6.12) i то Ь= lim £ е ,. «2 Л 1 / 1\\ яг2 1 1 = lim — I 1п(1Ч— I 1 = Hm — -т-г = т-. x-f+oo e \x \ xJ) x->+oo e 2ar 2e Итак, уравнение асимптоты имеет вид у = х/е+ 1/(2е).
226 8. ИССЛЕДОВАНИЕ ФУНКЦИЙ 8.8. Общая схема исследования функции и построение ее графика Наиболее наглядное представление о поведении функции дает ее график. Построению графика функции (точнее, его эскиза) обычно предшествует исследование функции методами теории пределов и дифференциального исчисления, включающее в себя следующие этапы: 1) установление области определения функции, свойств четности (нечетности) и периодичности функции; 2) поиск точек разрыва функции и их классификация, нахождение вертикальных асимптот графика функции и промежутков ее непрерывности; 3) нахождение точек пересечения графика функции }(х) с осями координат, т.е. значения /(0) и корней уравнения /(») = 0; 4) поиск критических точек функции, выделение из них ее точек экстремума, вычисление значений функции в критических точках, установление интервалов монотонности функции; 5) поиск точек перегиба и значений функции в этих точках, установление интервалов выпуклости функции; 6) исследование поведения функции при х -> ±оо, т.е. нахождение наклонных или горизонтальных асимптот графика функции. Результаты перечисленных этапов исследования функции позволяют построить эскиз ее графика, достаточно полно характеризующий поведение функции в ее области определения. Эти результаты для упрощения построения эскиза графика целесообразно заносить в сводную таблицу, первая колонка которой содержит значения аргумента х, соответствующие: а) границам промежутков области определения функции f(x) и точкам разрыва этой функции; б) критическим точкам функции f(x) и возможным ее точкам перегиба, т.е. точкам, в которых переел f'{x) а вторая
8.8. Общая схема исследования функции и построение ее графика 227 /"(а:) производные обращаются в нуль или бесконечность либо 0е существуют; в) точкам пересечения графика функции с осью абсцисс, в которых f(x) = 0, а также точке х = О (если она входит в область определения функции), для которой обычно нетрудно вычислить значение /(0) и установить знаки /'(0) и /"(0). Кроме того, в первой колонке сводной таблицы указывают все интервалы области определения функции между отмеченными точками. Вторая колонка содержит значения функции f(x) в отмеченных точках и сведения о направлении ее изменения в указанных интервалах. В третью и четвертую колонки заносят значения или знаки f'(x) и {"(х) в выделенных точках и интервалах. Пятая колонка содержит краткую характеристику поведения функции и особенностей ее графика, а шестая — фрагменты графика в окрестности отмеченных точек и в указанных интервалах, что облегчает окончательное построение эскиза графика во всей области определения функции. Полезно также строить (пусть весьма приближенно) графики производных f'(x) и f"(x) исследуемой функции. Пример. Рассмотрим последовательность выполнения указанных этапов и заполнения сводной таблицы при исследовании функции и построении ее графика и графиков ее первой и второй производных. 1. Функция определена на всей числовой оси и не является четной, нечетной или периодической (это функция общего вида). 2. Функция не имеет точек разрыва (а следовательно, и вертикальных асимптот) и непрерывна на всей числовой оси. 3. График функции проходит через начало координат, так как /(0) = 0; кроме того, /(1) = 0. 15*
228 8. ИССЛЕДОВАНИЕ ФУНКЦИЙ 4. Производная функции f(x) Зж-1 /'(*) = существует на всей числовой оси, причем в точке xq — 1/3 она равна нулю [стационарная точка функции /(ж)), а в точках х\ = 0 и Х2 = 1 — бесконечна. Исследуем поведение производной /'(я) в окрестности этих критических точек функции /(ж). При переходе аргумента х через значение Ж1 = 0 производная не меняет знак, оставаясь положительной, т.е. при х\ = О не выполняются достаточные условия существования экстремума (см. теорему 8.5). Точка х\ = 0 не является точкой экстремума, так как f(x) = 0, а при переходе через эту точку функция /(ж) меняет знак. В силу /'(0) = + оо касательная к графику функции при х\ = 0 вертикальна. Перейдем к критической точке х^ — 1. Поскольку lim /'(ж) = lim —, : = -оо, +XoJ хцо z*/2{ -1) lim fix) = lim —, = +oo, в малой окрестности точки а?2 = 1 при а; < 1 f'(x) < 0, а при ж > 1 /'(ж) > 0, т.е. при переходе аргумента ж через значение Ж2 = 1 производная /;(ж) меняет знак с минуса на плюс и, согласно тереме 8.5, жг = 1 является точкой экстремума функции /(ж), а именно точкой минимума, причем минимальное значение функции /(жг) = /(1) = 0. На графике функции /(ж) значению Ж2 = 1 соответствует точка возврата (заострения), а касательная к графику в этой точке вертикальна. При жо = 1/3 производная /;(ж) обращается в нуль, а касательная к графику горизонтальна. При переходе аргумента ж через значение жо = 1/3 производная меняет знак с
8.8. Общая схема исследования функции и построение ее графика 229 плюса на минус и в силу теоремы 8.5 xq является точкой экстремума, а именно точкой максимума функции /(я), причем f(xo) = /(1/3) = ^4/3 «0,53. Итак, при х 6 (-оо, 1/3) f'(x) > 0 и в силу теоремы 8.2 функция f(x) возрастает, при х £ (1/3, 1) f'(x) < 0 и функция убывает, а при х € (1, +оо) опять /'(я) > 0 и функция снова возрастает. Во второй колонке табл. 8.1 (как и в табл. 8.2 и 8.3) возрастание и убывание функции отмечены наклонными стрелками. Таблица 8.1 л*) л*) Краткая характеристика поведения функции Фрагмент графика (-оо, 0) Возрастание, выпуклость вниз О +оо Точка перегиба с вертикальной касательной (О, 1/3) Возрастание, выпуклость вверх х0 = 1/3 «0,53 О Максимум с горизонтальной касательной (1/3, 1) \ Убывание, выпуклость вверх О 00 Минимум с вертикальной касательной (точка возврата) (1, +оо) /■ Возрастание, выпуклость вверх
230 3. ИССЛЕДОВАНИЕ ФУНКЦИЙ 5. Вторая производная функции /(х) ни в одной точке не обращается в нуль, а в точках х\ = О и Х2 = 1 не существует. При переходе аргумента х через значение xi = 0 вторая производная меняет знак с плюса на минус, т.е. в силу теоремы 8.10 Х\ является точкой перегиба функции /(х). Поскольку f(x\) = /(0) = 0, начало координат является точкой перегиба графика этой функции. При переходе через точку Хг = 1 вторая производная не изменяет знак, оставаясь отрицательной, и x-i не является точкой перегиба функции /(х). Таким образом, при х € (—оо, 0) /"(х) > 0 и функция /(х) строго выпукла вниз, а ее производная /'(х) возрастает, при х € (0, 1) и х € (1, +оо) /"(х) < 0 и функция выпукла вверх, а ее производная в каждом из этих интервалов убывает. 6. Так как пределы f(x) з/ f П2 / i\2/3 к = hm ^-^ = hm ——i — = hm I 1 =1 х-Юо x x-4oo x ar-4oo V х) и 6= lim (/(x)-fo)= lim (Ух(х- l)2-x] = у-Ю существуют, график функции /(х) имеет двустороннюю наклонную асимптоту с уравнением у = кх + Ь> или у = х- 2/3. С использованием сводной таблицы 8.1 на рис. 8.17 построен график исследуемой функции, а также графики ее первой и второй производных.
Д.8.1. Исследование функции, заданных параметрически 231 -«-2/3 Рис. 8.17 Дополнение 8.1. Особенности исследования функций, заданных параметрически Пусть зависимость у от х задана параметрически в виде где Т — множество значений параметра t, для которых определены функции x(t) и y(t). Области определения и значений функции у = f(x) совпадают с областями значений соответственно функций x = x(t) и y = y(t), t£T. При этом функция f(x) в общем случае может и не быть однозначной, т.е. ее график не обязательно будет иметь единственную однозначную ветвь, если не потребовать строгой монотонности функции x = x(t) на всем множестве Т. Перед исследованием функции f(x) и построением ее графика полезно построить графики функций x(t) и y(t). Точки пересечения графика функции /(я) с осями координат Ох и Оу связаны с нулями функций x(t) и y(t). Если t/(i0) = О, to £ Т, то график у = f(x) пересекает ось абсцисс Ох в точке Хо = x(to)y а при a;(to) = 0, to£ Г, точка пересечения графика у = /(ж) с осью Оу имеет ординату уо = у (to).
232 8. ИССЛЕДОВАНИЕ ФУНКЦИЙ Для нахождения критических точек и точек перегиба функции f(x) необходимо исследовать поведение ее производных f'(x) и f"{x) при изменении параметра £, выразив их через производные z'(t), y'(t) и x"(t), y"(t) функций x(t) и y(t) по формулам вида (2.21) и (4.18) (с учетом того, что х = я teT): График функции f(x) имеет асимптоты, если существуют такие значения tm € Г, что при t -> t* или t —> оо либо одна из функций x(t), у(£), либо они вместе стремятся к бесконечности. В последнем случае можно ожидать существования наклонных асимптот графика /(я), что должно быть установлено дополнительным исследованием. В первом случае, если x(t) -¥ оо при t -> £«,, то имеем горизонтальную асимптоту с уравнением у = у(£*), а если y(t) -юо при t ->- £#, то получаем вертикальную асимптоту с уравнением х = z(t*). Пример 8.2. Пусть зависимость у от х задана в виде 1У t€R\{-l}. Исследуем сначала функции x(t) и y(i), которые определены на всей числовой оси, кроме точки tm = — 1 (в этой точке обе функции имеют точку разрыва второго рода, а их графики — вертикальную асимптоту). При этом lim x(t)= lim -—r- = +oo, lim x(t)= lim -—- = -oo; t->u-o w tfio 1ft3 *n+o w t^i+ol+t3 t2 lim y(t)= lim т-тт = -оо, lim y(t) = Hm Кроме того, при to = 0 x(to) = y(M = 0 и при t-too x(t)-*O и y(t) -> 0, т.е. графики функций x(t) и y(t) проходят через начало координат, а ось абсцисс Ot является их двусторонней горизонтальной асимптотой.
Д.8.1. Исследование функции, заданных параметрически 233 Найдем производные 1 -2t3 (8>9) Смысл общей для функций ж(£) и t/(t) критической точки t+ = — 1 уже выяснен. У функции z(t), согласно (8.7), есть еще одна критическая точка t\ = l/v^2«0,79, в которой x'{t\) = = 0. Она является точкой максимума (x(ti) = с = ^4/3 « 0,53) функции z(£), так как в силу (8.9) x"(t\) = --^Тб/З < 0 (см. следствие 8.2). У функции y(t) помимо t+ = — 1 являются критическими еще две точки to = 0 и ^2 = v^2~ 1,26, в которых, согласно (8.8), производная y'{t) обращается в нуль. Из (8.10) y"(t0) = 2 > 0 и 2/"(*2) = -2/3 < 0, т.е. в силу следствия 8.2 *о является точкой минимума (y(to) = 0), а $2 — точкой максимума (у(^) = с) функции y(J). Из (8.9) при t0 = 0 и *2 = v^«l,26 z"(£) = 0, но t0 не является точкой перегиба функции аг(£), так как x"(t) не меняет знак при переходе аргумента t через значение *о>тогДа как <2 есть точка перегиба этой функции, поскольку x"(t) меняет знак с минуса на плюс при переходе через точку ^2 (см- теорему 8.10). Числитель (8.10) представим в виде f - It3 +1 = (t3 - t3)(t3 - гДе <з,4 — действительные корни уравнения t6 - It2 + 1 = 0. При переходе аргумента t через значение £4 ~ 0,53 вторая производная y"{t) меняет знак с плюса на минус, а через значение 13 « 1,90 — с минуса на плюс. Поэтому, согласно теореме 8.10, Ьз и t\ являются точками перегиба функции y(t).
234 8. ИССЛЕДОВАНИЕ ФУНКЦИЙ Итоги исследования поведения функций x(t) и y(t) сведены в табл. 8.2 и 8.3 соответственно, а на рис. 8.18, а и 6 представлены графики этих функций и их первых и вторых производных. Теперь приступим к построению графика функции f(x). Так как нет таких значений £* € Т, что при t—¥tm порознь или y'(t)
Д.8.1. Исследование функций, заданных параметрически 235 Таблица 8.2 «to x'(t) x"(t) Краткая характеристика поведения функции Фрагмент графика (-00, -1) Возраставие, выпуклость вниз U = -\ Точка разрыва второго рода, вертикальная асимптота -1, 0) Возрастание, выпуклость вверх *о=0 О График проходит через начало координат О (О, Возрастание, выпуклость вверх « 0,79 «0,53 О Максимум с горизонтальной касательной \ Убывание, выпуклость вверх w 1,26 «0,42 О Точка перегиба с наклонной касательной , +оо) \ Убывание, выпуклость вниз
236 8. ИССЛЕДОВАНИЕ ФУНКЦИЙ Таблица 8.3 Краткая характеристика поведения функции Фрагмент графика (-оо, -1) \ Убывание, выпуклость вверх Точка разрыва второго рода, вертикальная асимптота (-1. 0) \ Убывание, выпуклость вниз О О Минимум в начале координат, горизонтальная касательная I (О, U) Возрастание, выпуклость вниз « 0,53 О Точка перегиба с наклонной касательной («4, Возрастание, выпуклость вверх «1,26 «0,53 О Максимум с горизонтальной касательной \ Убывание, выпуклость вверх О Точка перегиба с наклонной касательной , +оо) \ Убывание, выпуклость вниз
Д.8.1. Исследование функции, заданных параметрически 237 оо или у(£) —► с», то у графика функции /(х) отсутствуют горизонтальные и вертикальные асимптоты. Проверим, соответствует ли точка tm = — 1 наклонной асимптоте в системе координат хОу. Поскольку пределы (с учетом замены переменных) *V tllll IIД|Д уъ Я Л т щ М х-Юо X t-H» X[t) t-+-l И b = lim (f{x) — kx) = lim (y(t) — существуют, график функции f(x) имеет наклонную двустороннюю асимптоту с уравнением у = kx -f 6, или у = —х — 1/3. С учетом (8.7)—(8.10) первые две производных функции f(x) равны: У'(О t(2<3) (8Л1) x'(t)y»(t) - x"(t)y'(t) (x) = 1-2*3' y'(t) {l + fi)* (8Л2) « Из рис. 8.18, о ясно, что при t € (—1, *i], где t\ = 0,79, функция х(£) возрастает. Поэтому ей соответствует однозначная обратная функция [I, 9.4] t — x~l{x) с областью определения (—оо, с], где c = x{t\) = v^4/3wO,53. Таким образом, с учетом однозначности функции у(£), t £ (—1, *i), в промежутке (—оо, с] определена сложная функция у[х~1(х)) = = fi(x), которая является одной из однозначных ветвей многозначной функции f(x). Областью значений функции /i(x), согласно рис. 8.18, б, будет промежуток [0, +сх>). Из (8.11) следует, что в интервале (—1, t\) производная f{(x) при to = 0 (х = 0) обращается в нуль, Vt € (—1, 0)
238 8. ИССЛЕДОВАНИЕ ФУНКЦИЙ (Vcc 6 (-оо, 0)) отрицательна и V£ € (0, t\) (Va? € (0, с)) положительна, т.е. меняет знак с минуса на плюс при переходе аргумента х через значение х = 0. Поэтому х = 0 является для функции f\(x) точкой минимума (см. теорему 8.5), причем у—х- а б Рис. 8.19
Д.8.1. Исследование функций, заданных параметрически 239 Согласно теореме 8.2, функция Д(ж) убывает в интервале (-оо, 0) и возрастает в интервале (0, с). Из (8.12) f['(x) > 0 it 6 (-оо, *i) ив силу теоремы 8.9 для случая положительности второй производной функция fi(x) Vx€(—oo, с) выпукла вниз. В точке ж = с, соответствующей значению t = t\ = 1/>/2, имеем d = f\(c) = y(*i) = ^2/3 « 0,42, но функция /i(x) не- дифференцируема (производная /{(с) бесконечна, а касательная к графику функции fi(x) в точке (с, d) вертикальна). При ж -► -oo f\(x) —> +оо и график /i(s), изображенный на рис. 8.19, а сплошной линией, приближается к наклонной асимптоте у = — х - 1/3. Промежутку [*i, Н-оо) убывания x(t) (см. рис. 8.18, о) соответствует однозначная ветвь /г (ж) многозначной функции f(x). Областью определения /г (х) будет область значений (0, с] функции x(t) при t 6 [*ь Н-оо). Согласно (8.11) производная f2(х) обращается в нуль при *з = л/2 (х(£з) = = у/2/3 = d » 0,42), V* € (*i, «2) (Vz € (rf, с)) отрицательна и Vt 6 (£2, +°°) (Vx € (0, d)) положительна, т.е. меняет знак с плюса на минус при переходе аргумента х через значение х = d. В силу теоремы 8.5 х = d является точкой максимума функции /г(я), причем /г(^) = у(^) = с. Касательная к графику функции /г (ж) в точке (d\ с) горизонтальна. Согласно теореме 8.2, функция /2 (ж) возрастает в интервале (0, d) и убывает в интервале (dy с). Из (8.12) /^(ж) < 0 Vi € (t2, +00) и в силу теоремы 8.9 функция /г(ж) выпукла вверх в интервале (О, с). В точке х = с (t = t\) функция /г(ж) (как и функция fi(x)) недифференцируема, производная f2(ж) бесконечна, а график функции /г(ж), показанный на рис. 8.19, а штриховой линией, имеет в точке (с, d) вертикальную касательную. Наконец, интервалу (-оо, -1) возрастания функции ж(£) (см. рис. 8.18, а) соответствует однозначная ветвь /з(ж) многозначной функции /(ж). Областью определения /з(ж) является область значений (0,-foo) функции ж(£) при £ € (-оо, -1). Из (8.11) и (8.12) /з» < 0 и /з*'(ж) > О V* б (-оо, -1), т.е. функция /з(ж) в интервале (0, +оо) убывает и выпукла вниз.
240 8. ИССЛЕДОВАНИЕ ФУНКЦИЙ При х -> +оо /з(я) —>■ —с» и график функции /з(#), изображенный на рис. 8.19, а штрихпунктирнои линией, приближается к наклонной асимптоте у = — х — 1/3. Графики функций fi(x) и /г (ж) на рис. 8.19,а имеют общую точку (с; d), которая является границей дуг с различными направлениями выпуклости. Однако считать эту точку точкой перегиба графика функции было бы неправомерно. Дело в том, что определение 8.6 точки перегиба как границы интервалов строгой выпуклости непрерывной функции относится к однозначной функции, а в данном случае функция f(x) многозначна и в одном и том же интервале изменения аргумента х различные направления выпуклости имеют ее разные однозначные ветви. Кроме того, дуга графика лежит по одну сторону от вертикальной касательной к графику в точке (с; d). Отметим также, что точка перегиба графика функции характерна для него и сохраняется при повороте системы координат (в отличие от экстремальных точек графика, связанных лишь с определенной системой координат, в которой задана рассматриваемая функция). Ясно, что точка (с; d) графика, приведенного на рис. 8.19, а, станет ничем не примечательной при повороте осей координат на некоторый острый угол против часовой стрелки или по часовой стрелке. Отметим, что функции /2(2) и /з(я) не определены в точке х = 0. Если доопределить функции x(t) и y(t) значениями ж(оо) = у(оо) = 0, то графики функций /2(х) и /з(х) будут иметь общую точку (0; 0) с вертикальной касательной, совпадающей с осью Оу. Хотя эта точка тоже разграничивает дуги с различными направлениями выпуклости, по указанным выше причинам ее нельзя считать точкой перегиба графика функции f(x). В этой точке кривая графика функции f(x) пересекает себя под прямым углом, поскольку касательные в данной точке к различным ветвям кривой совпадают с осями координат. Такую точку иногда называют точкой самопересечения графика, или его узловой точкой, и ее может иметь только график многозначной функции.
Вопросы и задачи 241 На рис. 8.19, б приведен график функции f(x) с учетом проведенного доопределения функций x(t) и y(t). Кривую этого графика называют декартовым листом в честь родоначальника аналитической геометрии французского математика Р. Декарта. В 1638 г. в письме к П.Ферма он определил эту кривую как геометрическое место точек, для каждой из которых сумма кубов абсциссы и ординаты пропорциональна произведению абсциссы и ординаты. Действительно, исключив параметр t из системы функций {s(t), у(£)}, получим неявную форму задания функции f(x) х3 + у3-ху = 0. (8.13) Поскольку (8.13) симметрично относительно абсциссы х и ординаты у у декартов лист симметричен относительно биссектрисы у = х первого квадранта (см. рис. 8.19, б). Из симметрии следует, что наиболее удаленная от начала координат точка А петли декартова листа имеет координаты (1/2; 1/2). Сначала математики считали, что определенная Р. Декартом кривая состоит только из петли („лепестка"), но И. Бернул- ли и голландский математик и механик X. Гюйгенс (1629-1695) в 1692 г. установили полную форму кривой и наличие у нее наклонной асимптоты. Вопросы и задачи 8.1. Найти интервалы возрастания и убывания функций: а) х3 - ЗОя2 + 225ж + 1; б) cos(ж/х); в) arctgz — In ж; г) (1 + \/х)х. 8.2. При каких значениях а возрастают на R функции: а) ж3-а; б) (а2 - 1)а:3/3 + (а- \)х2 + 2х; в) (8a-7)z-asin6z -sin5x. 8.3. Доказать, что дифференцируемая на интервале (a, b) функция f(x) возрастает на этом интервале тогда и только
242 8. ИССЛЕДОВАНИЕ ФУНКЦИЙ тогда, когда при любых х\, Х2, таких, что а < х\ < х^ < 6, существует точка с £ (а, 6), в которой f'(c) > 0. 8.4. Исследовать на экстремум функции: а) 2х3-15х2 + 36а;-14; б) (х + 3)3/(ж +1)2; в) chx + cosx; г) Л1'*; д) xm(l-x)n, m,neN. 8.5. Найти многочлен }(х) наименьшей степени, имеющий максимум /(1) = 6 и минимум /(3) = 2. 8.6. Найти интервалы выпуклости и точки перегиба функций: а) х4-6*2-6х + 1; б) х2/(х-1)3; в) |а: — 1|а:~3/2; г) х + sin х] д) ellx. 8.7. Является ли х = 0 точкой перегиба функции f(x) = = х3/2 — tgx + sin x ? 8.8. При каких значениях о функция /(я) = ех + аж3 имеет точки перегиба? 8.9. Показать, что у графика функции f(x)=(x+l)/(x2+l) все точки перегиба лежат на одной прямой, а у графика функции д(х) = zsinx — на кривой с уравнением у2(4 + ж2) = = 4х2. 8.10. Может ли точка перегиба функции быть ее точкой экстремума? 8.11. Доказать, что у любой дважды дифференцируемой функции между двумя точками экстремума лежит хотя бы одна точка перегиба, а между точками перегиба может и не быть точек экстремума. 8.12. Доказать, что каждый многочлен степени 2т + 1, т £ N, имеет хотя бы одну точку перегиба, а степени 2т с положительными коэффициентами не имеет точек перегиба. 8.13. Доказать, что дважды дифференцируемая в полуинтервале [а, + оо) функция f(x) имеет в (а, +оо) единственный нуль, если /(а)>0, /'(а)<0 и /"(z)<0 Vx € [а, +оо).
Вопросы и задачи 243 8.14. Найти наибольшее и наименьшее значения функций: а) х4-8х2 + 3, х€[-1,2]; б) (х4 + 1)/(х2 +1), х€[-1, 1]; в) x-21nx, i 6 [3/2, е]; г) 2arctgx+ arcsin (2х/(х2+1)), х е R; д) хх, х € (0, 1]. 8.15. Найти номер п наибольшего члена последовательностей: а) {105п+ 3п2-п3}; б) {h2/(n3 + 200)}; в) {п12е-п}; г) {п1/*}. 8.16. Доказать неравенства: а) ех^1+аг; б) ха^1 + а1пх при х>0 и a > 0; в) \п(1 + х)> х/(1 + х), х>0; г) arctgx ^ х, х ^ 0. 8.17. Найти наибольшее абсолютное значение многочлена х(х-1)2(х + 2) на отрезке [-2,1]. 8.18. При каком значении а наибольшее значение функции |х2 + а| на отрезке [—1, 1] минимально? 8.19. Найти радиус основания цилиндра наибольшего объема, вписанного в сферу радиуса R. 8.20. Найти наибольшую полную поверхность цилиндра, вписанного в сферу радиуса R. 8.21. Найти наибольшую площадь трапеции, вписанной в полуокружность радиуса R так, что основанием трапеции служит диаметр полуокружности. 8.22. Имеет ли график функции у(х) — х(1 + 1/х)х асимптоту ? 8.23. Провести полное исследование и построить графики функций: а) х3/(2 - х)2; б) у/(х3 - 2х2)/(х -3); в) (х2 4- 2х - Ъ)ех1х/х. 8.24. Провести полное исследование и построить график функции, заданной параметрически:
9. ГЕОМЕТРИЧЕСКИЕ ПРИЛОЖЕНИЯ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ 9.1. Векторная функция скалярного аргумента Определение 9.1. Если каждому значению независимого переменного t 6 Г С R, называемого далее скалярным аргументом, поставить в соответствие единственный вектор r(t), то r(t) называют вектор-функцией (векторной функцией) скалярного аргумента. Вектор r(t) с началом в фиксированной точке О называют радиус-вектором. Пусть в геометрическом (трехмерном) пространстве задана прямоугольная декартова система координат Oxyz с орто- нормированным базисом г, j, к. Тогда представление r(t)=x{t)i + y(t)j + z(t)k (9.1) является разложением радиус-вектора r(t) в этом базисе, причем ж(£), y(t) и z(t) — действительные функции одного действительного переменного t с общей областью определения Т С R, называемые координатными функциями вектор- функции r(t). Если z(t) = 0 Vt € Г, то вектор-функцию называют двумерной в отличие от общего случая трехмерной вектор-функции. Итак, задание одной трехмерной вектор-функции r(t) скалярного аргумента равносильно заданию трех действительных (скалярных) функций я(£), y(t) и z(t) этого же аргумента. Определение 9.2. Пределом вектор-функции r(t) при t—¥to называют вектор а и обозначают \\т r(t) =а или t—¥t(i
9.1. Векторная функция скалярного аргумента 245 r(t) —* о при t —> to, если длина (модуль) \r(t) — a\ вектора r(t) - а стремится к нулю при t -> to, т.е. lim \r(t) - a\ = 0. (9.2) Теорема 9.1. Вектор-функция r(t) = x(t)i + y(t)j + z(t)k имеет своим пределом при t —у to вектор a = a\i + a2j + <*з& тогда и только тогда, когда lim x(t) = ai, lim y(t) = 02, lim z(t) = 03. (9.3) ^ Для доказательства необходимости представим \r(t) — a\ в виде [III] \r(t) - a| = y/{x(t) - ax)2 + (y(t) - a2)2 + (z(t) - a3)2. (9.4) Поскольку |r(t) — a\ ^ |a;(t) — ai|, переход в этом неравенстве к пределу при t -> to и учет (9.2) повлечет lim \x(t) - ai| = О, что соответствует первому равенству в (9.3). Аналогично переходом к пределу при t —>• to в неравенствах |r(t) — а\ ^ ^ |t/(t) — a2| и |r(t) — а\ ^ |>zr(t) — аз| можно доказать с учетом (9.2) справедливость второго и третьего равенств в (9.3). Достаточность утверждения теоремы следует из предельного перехода в (9.4) к пределу при t —у to с учетом (9.3). ► При помощи неравенства ||г| — |а|| < \г — а\ [1,1.3] нетрудно установить, что если lim r(t) = а, то lim |r(t)| = |a|, но обрат- t—¥tQ t—¥tQ ное неверно. Используя представление вектор-функции в виде (9.1), теорему 9.1 и свойства пределов действительных функций действительного переменного [I, 7.4], можно доказать, что lim (ri(t) +r2(t)) = lim r\(t) + lim r2(t), lim/(t)r(t)= (lim/(t)) lim r(t), t—►to t—►to t—ttn f(\ r\ im ri(t)) lim r2(t). lim ri(t) x r2(t) = (lim r\(t)) x lim r2(t) t—tto t-ttQ t-+to
246 9. ГЕОМЕТРИЧЕСКИЕ ПРИЛОЖЕНИЯ при условии существования пределов, входящих в правые масти этих равенств (/(t) — скалярная функция). Определение 9.3. Вектор-функцию r(t) называют непрерывной в точке to, если lim r(t) = r(to). t—Ио Из теоремы 9.1 в силу эквивалентности условий (9.2) и (9.3) следует, что для непрерывности в точке to вектор-функции r(t) при ее представлении в виде (9.1) необходимо и достаточно непрерывности в этой точке функций x(t), y(t) и z(t). Согласно свойствам пределов вектор-функций их сумма, скалярное и векторное произведения, а также произведение скалярной функции на вектор-функцию непрерывны в некоторой точке, если в этой точке непрерывны соответственно все слагаемые и сомножители. Определение 9.4. Бели существует предел rft + A«)-rft) д«-ю At то его называют производной вектор-функции r(t) в точке to и обозначают г'(to). С учетом представления (9.1) и теоремы 9.1 r'(to) = z'(to)i + y'('o)j+ *%)*• (9.6) Определение 9.5. Вектор-функцию r(t) называют дифференцируемой в точке to, если приращение А г = = **(*о + At) ~ г (*о) = Дя* + Ayj + Azk в этой точке представи- мо в виде Дг = a At + e{At)At, (9.7) где а — вектор-функция, не зависящая от At, a e(At) — вектор-функция, бесконечно малая при At —► 0, т.е. При этом линейно зависящую от приращения At аргумента t вектор-функцию a At называют дифференциалом вектор-
9.1. Векторная функция скалярного аргумента 247 функции r(t) в точке to и обозначают dr = a At. Тогда = dr + e(At)At. (9.8) Так как для дифференцируемой в точке to вектор-функции из (9.7) следует, что lim |г(*о + Д*)-г(*о)|= Km |Дг| = lim \aAt + e(At)At\ = 0, то r(t) непрерывна в этой точке. Из дифференцируемости вектор-функции в точке следует существование в этой точке производной и равенство ее вектору а. Действительно, из (9.7) получим Аг lim —- = lim (a + e(At)} =a д«>о At Д«юк v n и, согласно определению 9.4, г'(to) = а. Наоборот, из существования производной г'(to) = lim (Ar/At) следует (если учесть теорему 7.3 [I] о связи соотношением вида (1.2) функции, ее предела и бесконечно малой функции, определение 1.2 производной и (9.6)), что r%) = s'(to)i + y'(to)j + *'(to)* = _ Axi + Ayj + Azk ~ At где lim |a(A£)' д*-ю' Поскольку Axi + Ayj + Azk = Ar, обозначая e(At) = a(At)i + P(At)j + y(At)k, получаем r '(to) = Ar/At - e(At), откуда Ar = r'(to)At + e(At)At,
248 9. ГЕОМЕТРИЧЕСКИЕ ПРИЛОЖЕНИЯ что соответствует представлениям (9.7) и (9.8), причем dr = = r'(to)At. Полагая At = dt и опуская значение аргумента £0, записываем dr = r'dt и г1 — drjdt. Бели существуют производные r[, г2 и /' вектор-функций ri(£), r2(t) и скалярной функции /(£), то X Г 2 Доказательство этих формул дифференцирования аналогично доказательству свойств пределов. Кроме того, для сложной функции г(/(«)) (г(/))' = г)}'. Производная r'(t) дифференцируемой вектор-функции r(t) сама является вектор-функцией скалярного аргумента t, и если существует производная (r'(t)) , то ее обозначают r"(t) и называют второй производной вектор-функции r(t) в точке t. При представлении r(t) в виде (9.1) Аналогично вводят производные вектор-функции более высоких порядков. Вектор-функцию r(t) называют п раз непрерывно дифференцируемой на множестве Т, если она п раз дифференцируема в каждой точке t € Т и ее п-я производная r(n)(t) непрерывна на множестве Т. Если в некоторой окрестности \J(t) точки t существует (п + 1)-я производная вектор-функции r(t), то векторная сумма представлений координатных функций этой вектор- функции, согласно формуле Тейлора с остаточным членом б форме Лагранжа, имеет вид (9.9) где при условии 0 < 0, < 1, i = 1, 2, 3, остаточный член
9.2. Понятие кривой 249 Отметим, что при п — 1 из (9.9) нельзя получить формулу, аналогичную формуле (5.2) конечных приращений, так как значения Bt в общем случае различны для разных значений г. Покажем, что аналогом (5.2) при h > 0 будет формула -r(t)\ <g h\r'(t + eh)\, 0 < 0 < 1. (9.10) Пусть е — единичный вектор, причем векторы r(t + h) —r(i) и е — коллинеарные сонаправленные, a f(t) = r(t)e — скалярная функция аргумента t. Тогда с учетом (5.2) и неравенства для скалярного произведения векторов [ III ] \r(t + h) - r(t)\ = (r(t + h) - r(t))e = r(t + h)e - r(t)e = Отсюда в силу |е| = 1 получим (9.10). 9.2. Понятие кривой Термин „кривая" уже использовался при графическом представлении функции. Его строгое определение связано с понятием вектор-функции r(t), которую будем считать непрерывной на отрезке [а, 6]. Пусть в трехмерном пространстве R3 задана прямоугольная декартова система координат Oxyz с орто- нормированным базисом {г, j, k}. Определение 9.6. Множество Г С R3 точек, заданных радиус-вектором r(t) = x(t)i -f y(t)j + z(t)k, t £ [a, 6], соответствующим непрерывной на отрезке [a, b] вектор-функции r(l), называют непрерывной кривой, или просто кривой, а аргумент t — параметром кривой. При фиксированном значении t = to € [а, Ь] параметра значения x(to), у (to), z(to) являются координатами точки кривой. Поэтому одна и та же кривая может иметь как вектор-
250 9. ГЕОМЕТРИЧЕСКИЕ ПРИЛОЖЕНИЯ ное, так и координатное представление соответственно Г = {гбК3: r = r(t), te[a, 6]}, r={(x;y;z)eR3: x = x(t), y = y(t), z = z(t), t€[a,6]}. Заданную таким образом кривую называют годографом (от греческих слов обоС, — путь и ура<ри — пишу) вектор-функции r(t), поскольку именно такую кривую описывает в пространстве конец М радиус-вектора r(t) (рис. 9.1) при изменении параметра t (если t — время, то говорят о траектории движущейся точки М). Рис. 9.1 Кривую можно также представить как линию пересечения двух поверхностей с уравнениями F\ (x, t/, z) = 0, /^(я, у, z) = 0. Выбрав за параметр одну из координат (например, х), можно через него попытаться выразить из этой системы уравнений остальные координаты. Если это удастся сделать, то можно будет записать €R3: x = x, у = y(t), z = z(t)t а? € [с,
9.2. Понятие кривой 251 0дной и той же точке кривой могут соответствовать различные значения параметра t. Такие точки кривой называют ее кратными точками. Начальной и конечной точками кривой именуют точки с радиус-векторами г (а) и г (6) соответственно. Если конечная точка кривой совпадает с ее начальной точкой, то кривую называют замкнутой (замкнутым контуром). Замкнутую кривую, не имеющую кратных точек при t 6 (а, Ь), называют простым замкнутым контуром. Кривую называют непрерывно дифференцируемой, если задающая ее вектор-функция r(t) непрерывно дифференцируема на отрезке [а, 6]. Точку кривой, в которой |г'(£)| ф О, называют неособой (или обыкновенной), а при \r'(t)\ = 0 — особой. Непрерывно дифференцируемую кривую без особых точек называют гладкой, а непрерывную кривую, состоящую /ИЗ конечного числа гладких участков, — кусочно-гладкой. Пусть Mq и Mi — различные точки гладкой кривой Г (см. рис. 9.1), задаваемые радиус-векторами r(t0) и r(to + At) (Д£>0) соответственно. Прямая МОМЬ называемая секущей кривой Г, параллельна вектору Дг = r(t0 + At) - г (to), а при At ф 0 — и вектору Ar/At. При At —> 0 точка М\ стремится к точке Mq, а секущая MqM\ — к некоторому предельному положению, т.е. к прямой, проходящей через точку Mq и параллельной вектору At поскольку этот предел существует для любой точки гладкой кривой. Указанную прямую называют касательной к кривой Г в точке Mq. Таким образом, если начало вектора г'(^о) поместить в точку Mq, to он будет направлен по касательной в сторону возрастания параметра t. В случае, когда t имеет смысл времени, r'(to) является вектором мгновенной скорости движения точки по траектории, совпадающей с кривой Г. Для произвольной
252 9. ГЕОМЕТРИЧЕСКИЕ ПРИЛОЖЕНИЯ точки касательной с радиус-вектором г = хг + yj + zk имеем + r'(to)T, r6R. (9.11) Это векторная запись уравнения касательной к кривой Г в точке со значением параметра *о- Значение т = О соответствует в (9.11) общей точке кривой и касательной, называемой точкой касания. Координатная запись (9.11) после исключения переменного г принимает вид х -x(t0) _у-y(t0) _z- z(t0) (9.12) Пример. Если гладкая кривая Г={гбК3: r=r(t), лежит на сфере радиуса Я, а начало координат совпадает с центром сферы, то \r(t)\ = Я, или r2(t) = R2 = const. Тогда Равенство нулю скалярного произведения векторов означает их ортогональность. Таким образом, касательная к любой точке кривой, лежащей на сфере, ортогональна радиус-вектору этой точки. # На отрезке [а, 6] выделим п + 1 точку $,-, i = 0, п, так, чтобы < t\ < ... < £t_i < t{ < ... < £n_i < tn = 6. Пусть А= max(£t- —tt-_i). Значениям U соответствуют точ- ки М{ кривой Г = {r G R3 : r = r(t), t £ [a, 6]}, задаваемые векторами r(U) (рис. 9.2). Длина ломаной с вершинами в точках п п = ][>(«,)-г(<,-,)|. (9.13) 1=1
9.2. Понятие кривой 253 м r(to)-r(a) Рис. 9.2 Определение 9.7. Длиной sr кривой Г называют предел, к которому стремится длина sn ломаной при Д —► О, если этот предел существует и не зависит от выбора вершин ломаной, т.е. = Hm sn. до Если этот предел конечен (sr < +оо), то кривую Г называют спрямляемой. Модуль \r(t)\ производной непрерывно дифференцируемой на отрезке [а, Ь] вектор-функции r(t) непрерывен на [а, 6] и, согласно теореме 9.5 [I], достигает на [а, 6] наибольшего значения М— max Теорема 9.2. Если вектор-функция r(t) непрерывно дифференцируема на [а, Ь] и кривая Г = {г G R3: г = r(i), t € [а, Ь]} спрямляема, то ее длина sr удовлетворяет неравенству |г(6) - r(a)\ ^ sr ^ М{Ь - а). (9.14) < Учитывая (9.10), разбиение отрезка [а, 6] на п участков и неравенство треугольника, имеем t=l n n t=l t=l
2549. ГЕОМЕТРИЧЕСКИЕ ПРИЛОЖЕНИЯ гДе & € (U-i, *i)i * = li я, причем |г'(&)| ^ М. Отсюда с учетом (9.13) п -«<-0 = М(Ь-а). Переходя в этом неравенстве к пределу при А -* 0, согласно определению 9.7, получаем (9.14). ► Замечание. В дальнейшем [VI] будет показано, что если вектор-функция r(t) непрерывно дифференцируема на отрезке [а, 6], то кривая Г = {г 6 R3 : г = r(t), t € [а, 6]} спрямляема. # Механический смысл (9.14) состоит в том, что длина пути sr по дуге кривой не меньше, чем длина |г(Ь) -г(а)| ее хорды, и не больше расстояния, которое за время Ь - а проходит точка, двигающаяся прямолинейно со скоростью М. Применим неравенство (9.14) к части гладкой кривой Г длиной As, соответствующей отрезку [*о, to + At] С [а, 6] при At>0: \r(to + At) Здесь М Отсюда -r(to)\^Ai i^MAt = |r' — наибольшее значение к(t0+до - At r(to)\< As At ^ («oH \r * \r ьед*)|д*. tf(t)\ на f(tn + &At) [to,* 1 0 + ^ 1. At]. После перехода в этом неравенстве к пределу при At —> 0 в левой (с учетом определения 9.4) и правой частях получим |г'(£о)|, а в средней части — производную s'(to) > 0 возрастающей на отрезке [а, 6] функции s(£), которая соответствует переменной длине дуги кривой, отсчитываемой от ее начальной точки. Тогда, учитывая (9.6) и правила предельного перехода в неравенствах [I, 7.4], получим s'(t0) = |г'(«о)| = ^/И*о))2+(у'(*о))2 + (*'('о))2. (9.15)
9.2. Понятие кривой 255 Всякую гладкую кривую Г = {г 6 R3 : г = r(t), t 6 [a, b]} можно представить в виде Г = {г е R3 : г = r(s)y s € [О, sr]}, т.е. от параметра t перейти к параметру s кривой, называемому натуральным и равному текущей длине ее дуги. Действительно, в силу возрастания на отрезке [а, 6] функции s(i) существует обратная ей функция t(s), возрастающая на отрезке [0, sr] и имеющая на нем производную dt/ds > 0. Поэтому уравнение г = r(t(s)), s 6 [0, sr] определяет ту же кривую Г. Так как \dr/dt\ = ds/dt, при замене t на s получим \dr/ds\ = 1. Геометрически это означает, что при стягивании дуги длиной As в точку отношение As и длины |Аг| стягивающей эту дугу хорды (рис. 9.3) стремится к 1, поскольку Аг hm —— Д5-Ю As dr ds Для окружности радиуса R этот вывод сразу следует из первого замечательного предела Hm (sina)/a = 1, так как для дуги с центральным углом 2а ее длина 2Да, а длина хорды 2#sina. Пример 9.1. Винтовую линию Г (рис. 9.4) задают соотношения x = Rcost, y = Rs\nt, z = Ht, *e[0, Г] (9.16) при условии, что Я и Я одновременно не равны нулю (это Условие можно записать неравенством R2 -Ь И2 > 0). Она является бесконечно дифференцируемой кривой, причем H2 > 0
256 9. ГЕОМЕТРИЧЕСКИЕ ПРИЛОЖЕНИЯ и, согласно (9.15), ds/dt = \r'(to)\ = \/R2 + Я2 = const > 0. Таким образом, винтовая линия является гладкой кривой и переменную длину 5 ее дуги можно принять за параметр. Постоянную положительную производную имеет линейно возрастающая функция s(t) = ty/R2 + Я2, у которой при t = 0 значение 5(0) = 0. Тогда координатное представление винтовой линии через натуральный параметр ,s можно получить из (9.16), если в уравнения для координат подставить t = s/y/R2 + Я2 при 5 € [0, ТУЯ2 + Я2]. Один виток винтовой линии соответствует приращению параметра t на 2тг (см. рис. 9.4). Поэтому длина дуги одного витка 5i = 2ny/R2 + Я2. Приращение за один виток координаты z точки М, движущейся по этой дуге, называемое шагом винтовой линиии, равно В = 27гЯ. Поскольку цилиндрическая поверхность, на которой лежит винтовая линия, является Рис. 9.4 , развертываемой, после развертки дуга винтовой линии, соответствующая одному шагу, будет гипотенузой прямоугольного треугольника с катетами длиной В и 2nR. Действительно, координата z = Ht точки при движении по винтовой линии линейно зависит от длины Rt дуги окружности, описываемой проекцией этой точки в плоскости хОу (см. рис. 9.4). Поэтому виток винтовой линии после развертки цилиндрической поверхности на плоскость станет прямолинейным и перейдет в ги-
9.3. Плоские кривые 257 потенузу указанного треугольника. Нетрудно проверить, что длина такой гипотенузы будет s\. Если перенести начало координат в точку (0; 0; Я/3) и повернуть оси Ох и Оу вокруг оси Оъ на угол /3, то тогда в новой системе координат Oxiyxzi (см. рис. 9.4) (9.16) переходит в = Ht\, t\ € [0, Г], где *i = t - /?, т.е. точки винтовой линии при ее повороте вокруг оси Оъ движутся по этой же винтовой линии. Можно сказать, что винтовая линия при повороте вокруг своей оси „скользит" вдоль себя. В технике это свойство используют в резьбовых соединениях. 9.3. Плоские кривые Кривую, лежащую в некоторой плоскости, называют плоской. Бели эта плоскость выбрана за координатную плоскость хОу, то координатное представление плоской кривой Г имеет вид T={(x;y;z)eR3: x = x(t)} y = y(t)) z = 0y t € [a, 6]}, причем равенство z = 0 обычно опускают и пишут *€[a, 6]}. (9.17) График непрерывной на отрезке [с, d] функции f(x) является плоской кривой с координатным представлением Г = {{х;у)еК2: x = x,y = f(x); xe[c,d\}. (9.18) В этом случае роль параметра выполняет аргумент ж.
258 9. ГЕОМЕТРИЧЕСКИЕ ПРИЛОЖЕНИЯ Плоская кривая является годографом радиус-вектора r(t) = x(t)i + y(t)j или г(х) = х% + f(x)j для представлений (9.17) и (9.18) соответственно. Для непрерывно дифференцируемой плоской кривой при представлении (9.18) вместо (9.15) получим ^ = |г'(х)| = >/l+ (/»(«)) V 0, (9.19) т.е. особые точки отсутствуют и плоская кривая является гладкой. Из (9.19) при dx > 0 для дифференциала длины дуги плоской кривой получим ds = y/dx2 + dy2 > О, или rfs2 = dx2 + dy2, (9.20) где dy = f(x)dx. Из рис. 9.5 следует, что ds равен длине отрезка MqK касательной к графику функции f(x) в точке Mq с абсциссой х. Если в качестве параметра выбрать длину s дуги кривой, то, как и в 9.2, получим, что dr/ds является единичным вектором, направленным по касательной в сторону возрастания параметра 5. В этом случае dr dx. dy . _ т~ = -r*+-rJ = tcosa + jcos/?, as ds ds т.е. dx/ds = cosa и заны на рис. 9.5. Углы a и /З покаx+dx Рис. 9.5
9.3. Плоские кривые 259 При представлении непрерывно дифференцируемой плоской кривой в виде (9.17) из (9.15) следует r'(t)\ = Поэтому условием существования особых точек будет обращение в нуль производных x'(t) и y'(t) при одинаковых значениях параметра t. В противном случае |r'(t)|^0 и кривая будет гладкой. Тогда (9.20) верно при условии, что dx = x'{t)dt и dy = y'(t)dt. Для касательной к кривой в точке со значением параметра to уравнение в виде (9.11) сохраняет силу, а в цепочке равенств (9.12) следует опустить правую часть. Бели для гладкой кривой в точке to x'(to) Ф 0, то у этой точки существует окрестность U(to), в которой производная x'(t) знакопостоянна и не обращается в нуль, а функция ж^) строго монотонна. Тогда у точки жо = ж (to) существует такая окрестность Ui^o) = ж(и(^)), в которой определена строго монотонная непрерывно дифференцируемая функция £(х), и эта кривая является графиком непрерывно дифференцируемой сложной функции /(ж) = у^(ж)), ж € и^жо). Помимо (9.17) и (9.18) плоскую кривую можно представить в виде Г = {(ж;у)еК2: F(x,y) = 0; ж € [а, 6]} или при помощи уравнения F(x, у) = 0, неявно задающего зависимость у от ж или ж от у [I, 3.2]. Пусть в плоскости кривой Г задана полярная система координат (рис. 9.6) с полюсом в начале прямоугольной декартовой системы координат и полярной осью, направленной по оси абсцисс Ох. Тогда значения полярных угла <р и радиуса Р однозначно задают точку (у?; р) этой плоскости, а плоскую кривую Г можно представить зависимостью (9.21) Т7*
260 9. ГЕОМЕТРИЧЕСКИЕ ПРИЛОЖЕНИЯ где р(<р) — непрерывная неотрицательная функция, определен- ная на отрезке [а, /3] и связанная с декартовыми координатами соотношениями х = p(ip)cos<p и у = р(<р) sirup. У Рис. 9.6 (9.22) Переход от (9.17) к (9.21) возможен при помощи соотношении р = у/х2 + у2 и ф = arctg —h Агтг, (9.23) где к = 0, если ж > 0, а при х < 0 А; = 1, если у>0, и & = -1, если у < 0; при ж = 0 <р = (7r/2)sgny. Так как dx = — p(<p) sinip) dip и sin (p + p(y) cosy?)
9.3. Плоские кривые 261 вместо (9.20) имеем 0ЛИ (9.24) Отрезки MD, МР, OD и ОР на рис. 9.6 называют соответственно отрезками полярных касательной, нормали, подкасателъной и поднормали при условии, что прямая PD перпендикулярна полярному радиусу ОМ, а прямая МР — касательной MD. Пример. Рассмотренная в примере 8.2 плоская кривая, называемая декартовым листом, может быть задана при помощи уравнения х3 + у3 - ху = 0, (9.25) а также в виде (9.21) функцией о • cosy? € (-1Г/4, 3JT/4). sin3 у? 4-cos3 у?' Представление этой кривой в виде (9.18) возможно лишь по трем отдельным однозначным ветвям j\(x), h{x) и /з(я) (см. рис. 8.19, а). # Плоские кривые делят на алгебраические и трансцендентные в зависимости от того, какие функции входят в уравнение кривой, записанное в прямоугольной декартовой системе координат. Определение 9.8. Плоскую кривую называют алгебраической, если ее уравнение можно записать в прямоугольных
262 9. ГЕОМЕТРИЧЕСКИЕ ПРИЛОЖЕНИЯ декартовых координатах в виде 1 ... + Апуп + Boxn~l + Lox + Lxy + М = О, где коэффициенты Ло» --ч М — действительные числа и Aq +... 4- A% ф 0. Среди таких уравнений, задающих одну и ту же кривую, есть уравнение с наименьшим значением п, называемым порядком алгебраической кривой. Бели левую часть уравнения F(s, у) = 0 кривой можно представить произведением конечного числа сомножителей F\(x, у), F2(xy у),... , то кривую называют распадающейся (или приводимой) и ей соответствует система кривых с уравнениями Fi(z, у) = 0, F2(x, у) = 0,... . Например, из (9.25) видно, что декартов лист является нераспадающейся алгебраической кривой третьего порядка. Некоторые плоские кривые рассмотрены также в Д.9.2. 9.4. Кривизна плоской кривой Одной из характеристик формы кривой является степень ее искривленности, которая нуждается в количественном выражении. Такую характеристику можно ввести следующим образом. Пусть задана плоская гладкая (а следовательно, спрямляемая) кривая с натуральным уравнением r = r(s), где $ — натуральный параметр, равный текущей длине ее дуги. Обозначим через a(s) угол между касательной к кривой в точке с радиус- вектором r(s) и осью Ох (рис. 9.7). При переходе от точки Мо к М приращение этого угла, т.е. острый угол между касательными к кривой в точках Мо и М = a(s) - a
9.4. Кривизна плоской кривой 263 Это приращение называют углом смежности дуги MqM, a отношение As где As = 5 - so — длина дуги МоЛ/, — средней кривизной этой дуги. Рис. 9.7 Определение 9.9. Кривизной плоской кривой в точке r(so) называют предел (если он существует) средней кривизны дуги кривой, когда дуга стягивается в эту точку, т.е. с учетом определения 1.2 производной k(sn) = lim da (9.26) а величину R(sq) = l/fc(so)? обратную кривизне, называют радиусом кривизны плоской кривой в данной точке. Если k(so) = 0, то радиус R(so) кривизны кривой полагают равным +00.
264 9. ГЕОМЕТРИЧЕСКИЕ ПРИЛОЖЕНИЯ Определение 9.10. Прямую MqN} проходящую через точку Mq кривой перпендикулярно касательной к кривой в этой точке, называют нормалью к кривой в данной точке (см. рис. 9.7), а точку Со нормали на расстоянии радиуса кривизны от Mq в сторону вогнутости кривой — центром кривизны плоской кривой в точке Мо. Для любой дуги окружности радиуса R углу смежности Да этой дуги соответствует ее длина Я Да. Следовательно, кривизна окружности одинакова во всех ее точках и равна 1//?, а радиус кривизны окружности равен ее радиусу. Нормаль в любой точке окружности проходит по радиусу, проведенному из центра окружности в эту точку. Поэтому для любой точки окружности центр ее кривизны совпадает с ее центром. Ясно, что кривизна прямой равна нулю, радиус кривизны бесконечен, а центр кривизны бесконечно удален от прямой. Пусть кривая Г задана представлением вида (9.18), т.е. является графиком непрерывной на отрезке [с, d\ функции у = /(х), и эта функция дважды непрерывно дифференцируема на [с, d]. Тогда угол между касательной к кривой и осью Ох а(х) = arctg/'(x) Vx G [с, d] и, согласно (9.26), с учетом (9.19) и правила дифференцирования сложной функции a(x(s)) получим к(х) = dx ds ds I/"WI (9.27) Согласно (1.11), уравнение нормали к кривой в точке (см. рис. 9.7) с координатами хо и уо при /'(х0) Ф 0, х0 € [с, имеет вид
9.4. Кривизна плоской кривой 265 где хн и ун — координаты произвольной точки нормали. Поскольку центр Со кривизны лежит на нормали, то его координаты £ и т) тоже должны удовлетворять этому уравнению, т.е. (9.28) В силу определения 9.10 расстояние между точками Мо(хо; у) и Со(£; т)) равно радиусу кривизны R(xq) в точке Мо. Поэтому при k(xo) ф О 1 (9.29) Из (9.28) следует £ - хо = -(*? - уо)/'(хо). Подставляя это выражение и (9.27) в (9.29), находим ~ Уо)2/'Ы Отсюда (i + (/'Ы)2) 3/2 1/"Ы1 * Если /"(х0) > 0, то в соответствии с теоремой 8.9 функция /(х) строго выпукла вниз. В этом случае rj > уо (см. рис. 9.7) и поскольку |/"(хо)| = /"(хо)|, то Итак, при /"(хо) > 0 формулы для координат центра кривизны имеют вид
266 9. ГЕОМЕТРИЧЕСКИЕ ПРИЛОЖЕНИЯ Нетрудно проверить, что (9.30) верны и для случая /"(ж) < 0. Если в некоторой точке жо 6 [с, d] f'(xo) = 0, т.е. касательная к кривой горизонтальна, то к(хо) = |/"(жо)|> нормаль вертикальна и (9.30) остаются в силе: f = хо и г/ = f(xo) + 1//"(з0). Пример 9.2. Функция f(x) = a ch(x/a), x € R, задает цепную линию (рис. 9.8), форму которой принимает под действием силы тяжести однородная гибкая нерастяжимая тяжелая нить (цепь) с закрепленными концами. Действительно, рассмотрим дугу AM длиной s с приложенными к концам силами Ро и Р натяжения нити, направленными по касательным к кривой соответственно в точках А и М. Уравнения равновесия этой дуги в проекциях на горизонтальное и вертикальное направления будут Ро = Pcos7 и рз = Fsin 7, (9.31) где 7 — Угол между касательной в точке М и осью Ох, а р — вес единицы длины нити. Отсюда tg7 = /'(х) = Ps/Po- -2a -о Рис. 9.8
9.4. Кривизна плоской кривой 267 Дифференцируя по ж и учитывая (9.19), находим }"(х) = (p/Po)ds/dx, или J v J = = -?- = const. \Д+(/'(* Условие постоянства левой части этого равенства выполняется при подстановке f(x) = асЬ(я/а), если принять а = Ро/р. Тогда длина дуги AM s(x) = af'(x) = a sh(x/a). Радиус кривизны цепной линии с учетом (9.27) и длина отрезка нормали MN0 i= = N = sin(7r/2 - 7) COS7 1 n (x/a) равны между собой, что позволяет легко находить центр кривизны любой точки цепной линии. Для окружности с центром в начале координат тоже R = TV, но для нее эти отрезки совпадают, а для цепной линии они расположены по разные стороны от рассматриваемой точки на кривой. В частности, центр кривизны точки А имеет координаты f = 0 и rj = 2а. Представление функции f(x) = ach(x/a) по формуле Ма- клорена а
268 9, ГЕОМЕТРИЧЕСКИЕ ПРИЛОЖЕНИЯ показывает, что при малых отношениях х/а цепная линия близка к параболе с уравнением у = а + х2/(2а). Но при произвольных х/а параболе соответствует форма провисшей нити, несущей нагрузку, равномерно распределенную не по ее длине, а по ее горизонтальной проекции. Действительно, в этом случае вместо (9.31) для дуги AM (см. рис. 9.8) будем иметь Ро = Pcosy и рх = Fsin7, или tg7 = f'(x) = px/Pq. Этому соотношению удовлетворяет функция f(x) = а + х2/(2а) (если по-прежнему принять а = Ро/р)? график которой является параболой, проходящей через точку (0;а). Примером нити, имеющей форму параболы, может служить трос или цепь висячего моста, поддерживающий его настил при помощи ряда вертикальных стержней (см. пример 3.2 и рис. 3.3 в [I]). Цепная линия является решением поставленной Л. Эйлером в 1744 г. задачи о поиске кривой, проходящей через две заданные точки и образующей наименьшую по площади поверхность вращения относительно заданной оси, пересека- щей под острым углом прямую, проведенную через заданные точки. Поверхность вращения цепной линии называют катеноидом. # Если кривая Г определена координатным представлением вида (9.17) и функции x(t) и y(t) дважды непрерывно дифференцируемы на отрезке [а, 6], то с учетом формул (2.21) и (4.18) для производных функции, заданной параметрически, в виде "х) = x'(t)' х = x(t) •ч и x'(t)y"(t) - x"(t)y'(t) _ = x(t),
9.4. Кривизна плоской кривой 269 подстановкой в (9.27) и (9.30) получим при X G [а, Ь] w (9.32) x'(t)y"(t)-x"(t)y'(ty Пример 9.3. Уравнения х = a lntg- + acost, y = asin£, t £ (0, 7г) задают кривую Г, по которой перемещается в горизонтальной плоскости хОу материальная точка М, прикрепленная к одному концу нерастяжимой нити длиной а, если другой конец этой нити перемещать по лежащей в той же плоскости прямой (на рис. 9.9, а этой прямой является ось Ох, а (0; а) соответствует начальному положению материальной точки). Эту кривую называют трактрисой (от латинского слова traho — тащить). Параметр t соответствует углу между касательной к кривой и осью Ох. В вершине трактрисы t = тг/2. При изменении t от тг/2 до нуля материальная точка перемещается по левой ветви трактрисы, а при изменении от 7г/2 до 7г — по ее правой ветви. Для вычисления радиуса кривизны и координат центра кривизны для произвольной точки трактрисы предварительно найдем .. ч a/2 . ХЛЧ = .-/./пч — s/./пч - asmt = a tg(*/2)-cos2(*/2) sin* ' 1+sin2* = -a sin^ y'[t) = acost, y"(t) = -asin t.
270 9. ГЕОМЕТРИЧЕСКИЕ ПРИЛОЖЕНИЯ I ^^s^aama^ х б Рис. 9.9 Тогда с уметом (9.32) и (9.33) t COS t CL = a In tg -, 7y(t) = y(t) + a-^- = — €(0 = Так как длина касательной к любой точке трактрисы равна а, для построения центра кривизны кривой в точке М из этой
9.4. Кривизна плоской кривой 271 точки радиусом а делаем засечку на оси Ох и из полученной точки К к оси Ох восстанавливаем перпендикуляр до пересечения с нормалью МС в точке С (см. рис. 9.9, а). Поскольку }/[С = actgt = R(t), точка С является искомым центром кривизны. Если с учетом равенства sin* = 2tg(*/2)/(l + tg2(*/2)) из выражений для £(*) и rj(t) исключить *, то получим г} = :=ach(f/a), т.е. центр кривизны в произвольной точке трактрисы лежит на цепной линии (см. пример 9.2 и рис. 9.9, а, штриховая линия). Длина отрезка нормали MNq трактрисы в точке М N(t) = atgt, а значит, R(t)N(t) — a2 = const. Таким же свойством обладает окружность с центром в начале координат, но для нее отрезок нормали и центр кривизны лежат по одну сторону от кривой, а для трактрисы — по разные стороны. При вращении окружности вокруг оси, проходящей через ее центр, получают сферу, а при вращении трактрисы вокруг оси Ох — поверхность, называемую псевдосферой (на сфере и псевдосфере реализуются неевклидовы геометрии Римана и Лобачевского соответственно). Контактные поверхности пяты (цапфы) 1 (рис. 9.9, б) и подпятника 2 опоры планшайбы 3 карусельного токарного станка являются участками псевдосферы. При вращении планшайбы вокруг оси Ох из-за трения происходит износ контактных поверхностей. Скорость износа связана с мощностью, развиваемой силами трения и зависящей от произведения скорости скольжения, коэффициента трения и контактного давления, уравновешивающего вес планшайбы и закрепленной на ней обрабатываемой детали. Локальная скорость скольжения пропорциональна у, а локальное значение контактного давления обратно пропорционально sin* (см. рис. 9.9 5). Но для произвольной точки М трактрисы у/sin* = a = const, что обеспечивает равномерный износ контактных поверхностей и долговечность опоры. #
272 9. ГЕОМЕТРИЧЕСКИЕ ПРИЛОЖЕНИЯ Пусть кривая Г задана в полярной системе координат в виде (9.21) и р(чр) — функция полярного угла у>, дважды непрерывно дифференцируемая при <р € [а, 0]. Считая ^ параметром и учитывая (9.22) в виде х(<р) =p(<p)cos(p и у(<р) - = p(<p)s\mp, производные в (9.32) заменим следующими: х"((р) = р"(<р) cosy? - 2p'{ip) sin (p - р((р) cos<p\ у'{<р)=р'(<р) sin У1'(<?) - р'\ч>)sin Тогда при (р G [а, /3] (g Для нахождения полярного угла (pi и полярного радиуса р\ центра кривизны С (см. рис. 9.6) следует в (9.33) провести замену соответствующих производных, а затем, учитывая (9.23). перейти от ( и п к полярным координатам. В итоге, опуская аргумент <р у функции />, получаем _VWp'+p'/p)2+(i-pp"/p'2)2 = ' (9.35) Пример. Логарифмическая спираль в полярной системе координат имеет уравнение р{чр) = av, где a > 0. При возрастании <р в случае a > 1 спираль.раскручивается против хода часовой стрелки (рис. 9.10), а в случае 0 < a < 1 — закручивается около полюса О. Полюс для этой кривой является асимптотической точкой. В произвольной точке
9.4. Кривизна плоской кривой 273 сдирали р'(ф) = a^ согласно (9.34), р"(ф) = avln2a и радиус кривизны, т.е. пропорционален полярному радиусу этой точки. Поскольку рр"/р'2 = 1 и sgn(p//9; + р'/р) = sgn(lna + 1/lna) = sgn(a - 1), согласно (9.35), 6(<р) = (7r/2)sgn(a- 1) и полярные координаты центра кривизны 7Г (9.36) Рис. 0.10 Логарифмическая спираль замечательна тем, что угол между касательной в любой ее точке и полярным радиусом этой точки постоянен. В самом деле, так как для любой кривой, заданной в полярных координатах уравением р = р((р)} г/) = у^{р (см. рис. 9.6), tgy = y'{<p)/x'(<p) и после подстановки производных P(V>) (9.37)
274 9. ГЕОМЕТРИЧЕСКИЕ ПРИЛОЖЕНИЯ то для логарифмической спирали tg^=l/lna= const. Это свойство используют при профилировании по логарифмической спирали режущей кромки вращающихся ножей, благодаря чему угол резания 7г/2 - ф между лезвием ножа и направлением резания остается постоянным по всей режущей кромке. В гидротехнике для уменьшения потерь напора воды изгибают по логарифмической спирали канал, подводящий поток к лопастям турбинного колеса. В биологии логарифмическую спираль связывают с законами органического роста: она угадывается, например, в форме раковин некоторых моллюсков и в расположении семечек в подсолнухе. 9.5. Эволюта и эвольвента плоской кривой Определение 9.11. Множество центров кривизны кривой называют ее эволютой. По отношению к своей эволюте кривую называют эвольвентой (иногда инволютой или разверткой). Ясно, что эволютой окружности будет ее центр. Из примера 9.3 следует, что эволютой трактрисы будет цепная линия. а эвольвентой цепной линии — трактриса. Если из (9.36) исключить полярный угол <р, то найдем уравнение эволюты логарифмической спирали при а > 1 в виде т.е. эволютой будет тоже логарифмическая спираль, но повернутая относительно исходной спирали с уравнением р(<р) = а^ на некоторый угол. Бели основание о удовлетворяет условию a~*/2lna = 1, то такая спираль будет служить сама для себя эволютой (а значит, и эвольвентой). Бели плоская гладкая кривая Г является графиком дважды непрерывно дифференцируемой на отрезке [с, d\ функции
9.5. Эволюта и эвольвента плоской кривой 275 , то (9.30) можно рассматривать как параметрическое задание с параметром х эволюты £1 этой кривой. Зависимость между координатами точек эволюты в виде функции rj = rj(£) можно получить, если удастся из (9.30) исключить х. Если же кривая Г определена координатным представлением вида (9.17) и функции x(t) и y(t) дважды непрерывно дифференцируемы на отрезке [а, 6], то координатным представлением эволюты Q кривой Г будет t€ [a, &]}, (9.38) где функции £(t) и rj(t) параметра t определены в (9.33). Если кривая Г задана в полярных координатах при помощи функции р(<р) (9.21), дважды непрерывно дифференцируемой на отрезке [а, /?], то полярные координаты <р\ = <р\{ф) и р\ — = pi((p) произвольной точки С € £2 эволюты Q этой кривой будут определенными по формулам (9.35) функциями полярного угла ip € [а, /3] точки М G Г, в которой центр кривизны кривой Г совпадает с С. Пусть гладкая кривая Г является графиком функции у = = /(а:), трижды непрерывно дифференцируемой на отрезке [с, d], причем /'(я) и f"{x) отличны от нуля на [с, d]. Тогда справедливы свойства эволюты, устанавливаемые двумя следующими теоремами. Теорема 9.3. Нормаль к кривой Г является касательной к ее эволюте Q в соответствующем центре кривизны. Ч Центр кривизны (£; т/) кривой Г в точке (х; у) £ Г лежит на нормали к кривой, являющейся графиком трижды непрерывно дифференцируемой на отрезке [с, d] функции y = f(x). Поэтому для доказательства теоремы достаточно показать, нто угловой коэффициент — 1/t/ = —l/f'(x) нормали к кривой Г в точке (х\ у) совпадает с угловым коэффициентом касательной к эволюте п в соответствующем центре кривизны
276 9. ГЕОМЕТРИЧЕСКИЕ ПРИЛОЖЕНИЯ В силу (9.30) и условий теоремы функции £(х) и т)(х) непрерывно дифференцируемы на отрезке [с, d], причем \2\л.ш У' А+(уТ„ш- l/3yV'2-(i+(y/)2)y У —У ^ 2 (9.39) Отсюда с учетом правила дифференцирования функции, заданной параметрически (см. 2.4), угловой коэффициент касательной к эволюте Q в точке (f; rj) равен drj/d( = 71'(х)/€'(х) = = —\/у', что доказывает утверждение теоремы. ► Теорема 9.4. При строго монотонном изменении радиуса R(x) кривизны кривой Г его приращение AR при перемещении центра кривизны данной кривой по дуге ее эволюты п равно по абсолютному значению длине этой дуги эволюты. Пусть точкам х = с и х = d соответствуют: М\ и Мъ — точки кривой Г; С\ и Съ — центры ее кривизны; R\ = М\С\ и #2 = М2С2 — радиусы ее кривизны, т.е. С\ и Съ являются точками эволюты п кривой Г (рис. 9.11). Если функция f(x) трижды непрерывно дифференцируема на отрезке [с, d] и f"(x) фО, то в силу (9.27) и (9.30) функции R(x) = 1/к(х), £(х) и т)(х) непрерывно дифференцируемы на [с, d\. Тогда функция s(z), описывающая зависимость длины дуги эволюты от ж, также непрерыв- Рис. 9.11 но дифференцируема на [с, d\ и м
9.5. Эволюта и эвольвента плоской кривой 277 с учетом (9.20) и (9.39) . „+Л J упч Для функции R2(x) = 1/к2(х), согласно (9.27), имеем _\ o/i i «.'2 X) = 6(1 -ту //3 Возводя левую и правую части этой цепочки равенств в квадрат и деля почленно на R2(x) = (l + y'2)3/y//2, получаем (R'(x)) Таким образом, (s'(x)) = (R'(x)) , или = ±1 Vx € [с, d]. (9.40) Поскольку функция R(x) строго монотонна на [с, rf], существуют обратная ей строго монотонная функция х (R) и сложная функция v(R) = s(x(R)). Тогда по правилу дифференцирования сложной функции (см. 2,2) с учетом (9.40) а;(Л) = s'(x)/R'(x) = ±1. Согласно формуле (5.2) конечных приращений, As = a'(R+)AR, где As = s(d) -s(c)y AR = R2- R\, a R+ заключено между значениями R\ и R2. Отсюда \As\ = |ДЯ| = |ДД|. ► Аналогично можно доказать теоремы 9.3 и 9.4 для случая, когда кривая Г и ее эволюта п заданы в параметрическом виде (9.17), (9.38) при условии, что функции x(t) и y(t) трижды непрерывно дифференцируемы при t € [а, 6]. Эти тео-
278 9. ГЕОМЕТРИЧЕСКИЕ ПРИЛОЖЕНИЯ ремы обосновывают простой механический способ построения по заданной кривой одной из ее эвольвент. Бели нерастяжимую нить, натянутую на жесткий контур, соответствующий заданной кривой с дугой С\С2 (см. рис. 9.11), сматывать с этого контура, оставляя ее натянутой, то конец нити опишет дугу М\М2 эвольвенты заданной кривой. Действительно, в произвольной точке М эвольвенты ее радиус кривизны равен отрезку МС, нормальному к эвольвенте в этой точке и лежащему на касательной к дуге С\С2 в ее точке С, а приращение М2С2 - М\С\ радиуса кривизны эвольвенты по построению в точности равно длине дуги С\С2 заданной кривой (эволюты). Ясно, что конкретный вид эвольвенты зависит от длины С\М\ свободного участка нити. На рис. 9.11 штриховой линией обозначена эвольвента для случая, когда длина свободного участка нити равна нулю. Пример 9.4. Пусть окружность радиуса R и ее эвольвента имеют общую точку Мо(Я, 0) (рис. 9.12, о). Для окружности как эволюты используем координатное представление (9.38) в виде Q ={(£;?/) 6 R2: £ = Rcost, rj = Rs\nt; t € [0, 2тт]}. Так как отрезок СМ касательной к окружности является разверткой дуги СМо (это и объясняет одно из названий эвольвенты — развертка), его длина равна Rt. Тогда координаты точки М DM = R cost + Rtsin t, у = BM = AC-DC = Rsmt - Rtcost. В итоге эвольвента Г окружности п имеет координатное представление вида (9.17): in*), y=R(s\nt-tcost);
9.5. Эволюта и эвольвента плоской кривой 279 В технике эвольвенту окружности применяют для профилирования зубчатых зацеплений. Пусть боковые поверхности зубьев двух цилиндрических зубчатых колес с параллельными осями вращения, проходящими через точки О\ и О2 (рис. 9.12,5), очерчены по эвольвентам, а линия контакта зубьев при некотором взаимном положении колес проходит через точку К. Тогда в точке К нормали К Mi и КМъ к эвольвентам Э\ и Эг будут лежать-на отрезке М\Мч общей касательной к окружностям радиусов R\ и Кг соответственно (эти окружности по отношению к эвольвентам являются эволютами). При вращении колес точка К перемещается вдоль отрезка M\M<i (новое положение эвольвент показано на рис. 9.12, б штриховыми линиями) до тех пор, пока рассматриваемая пара зубьев не выйдет из взаимного зацепления. Однако зубчатую передачу профилируют так, что к этому времени возникает
280 9. ГЕОМЕТРИЧЕСКИЕ ПРИЛОЖЕНИЯ зацепление между другой парой зубьев, и линия их контакта снова перемещается вдоль отрезка М\М2> Бели угловая скорость о>2 ведущего колеса постоянна, то постоянна и скорость LJ2R2 движения точки К по линии Mi Л/2, называемой линией зацепления. Но тогда постоянна и угловая скорость и\ = U2R2/R1 ведомого колеса. Таким образом, эвольвентное зацепление обеспечивает плавность вращения ведомого колеса и постоянство передаточного отношения ui/u2 = R2/R1 зубчатой передачи. Кроме того, некоторые изменения межосевого расстояния O\Oi (см. рис. 9.12, б), вызванные неизбежными погрешностями при установке зубчатых колес, не влияют на передаточное отношение, если эти погрешности, конечно, не столь велики, что зубья колес вообще не могут войти в зацепление. Характерно, что эвольвентное зацепление было предложено не кем иным, как математиком Л. Эйлером. Дополнение 9.1. Кривизна и кручение пространственной кривой Пусть гладкая пространственная кривая Г с длиной дуги задана при помощи натурального параметра s в виде T = {r€R3: r = r(s), «€[0, sr]}. Так как \r'(s)\ = 1 (см. 9.2), то t(s) = r'(s) является единичным вектором касательной к кривой в точке М с радиус-вектором r(s) (рис. 9.13). Если вектор-функция r(s) дважды непрерывно дифференцируема на отрезке [0, sr], то на этом отрезке вектор-функция t($) имеет непрерывную производную и определена непрерывная функция k(s) = \t'(s)\ — = |r"(s)|, называемая кривизной пространственной кривой в точке М. Величину R(s) = l/k(s) называют радиусом кривизны пространственной кривой в этой точке.
Д.9.1. Кривизна и кручение пространственной кривой 281 Ь(8) Рис. 9.13 В тех точках s 6 [0, $г], где k(s) ф О, определены единичные векторы ф) = W)t>(s) = p и b(s) = t(s) x n(s) = p^jjr'W x г», (9.41) называемые соответственно главным нормальным и бинормальным векторами кривой в точке М. Прямые, проходящие через эту точку параллельно векторам n(s) и b(s)) называют соответственно главной нормалью и бинормалью (иногда для краткости так называют и сами векторы n(s) и Точку С, лежащую на прямой, которая проходит через точку М 6 Г параллельно вектору ' n(s), так, что векторы и n(s) коллинеарные сонаправленные, а длина \МС\ = , называют центром кривизны пространственной
282 9. ГЕОМЕТРИЧЕСКИЕ ПРИЛОЖЕНИЯ кривой Г в точке М. Радиус-вектор центра кривизны С кривой Г в точке М будет w(s) = r(s) + R(s)n(s). (9.42) Вектор-функция w($), s€[0, sp], задает эволюту п кривой Г, а вектор-функция v(s) = r(s) + (sp — $)*($), s £ [0, sp], задает ту из эвольвент Л кривой Г, которая с ней имеет общую точку с радиус-вектором г($г) (см. рис. 9.13). Единичные векторы t(s), n(s) и b(s) образуют в силу (9.41) правую тройку некомпланарных векторов (правый базис), причем этот базис ортонормированный. Его называют сопутствующим репером кривой, или сопровождающим базисом Френе — по имени французского математика Ф. Френе (1816-1890). Плоскости, проходящие через точку М перпендикулярно векторам 6, t и п, называют соответственно соприкасающейся, нормальной и спрямляющей. Они образуют подвижный трехгранник, или основной триэдр, данной кривой в точке М. Если вектор-функция r(s) трижды дифференцируема на отрезке [0, sr], то b'(s) = t'(s) x n(s) + t(s) x ri(s) = k(s)n(s) x n(s) + t(s) x n;(s). Первое слагаемое в правой части равно нулевому вектору, а во втором слагаемом вектор n'(s) ортогонален n(s). Поэтому векторы b'(s) и n(s) коллинеарны и отличаются лишь на некоторый множитель, который обозначают -x(s). В итоге Величину x(s) называют кручением кривой в точке М. Поскольку векторы n(s) и b(s) определены при условии k(s) ф 0, в точках, где k(s) = 0, кручение кривой не определено.
Д.9.1. Кривизна и кручение пространственной кривой 283 Так как n(s) = b(s) х t(s), n(s) x t(s) = -6(5), b(s) xn(s) = - найдем n'(«) = 6'(s) x i(«) + b(s) x i'(s) = = -x(s)n(s) x t(s) + fc(s)6(s) x n(s) = - Соотношения n;(5) = -k(s)t{s) + x называют формулами Серре — Френе (они опубликованы французским математиком Ж. Серре (1819-1885) в 1851 г., хотя Ф. Френе получил эти формулы в 1847 г.). Бели 5 измерять в единицах времени, то при движении точки М по кривой, соответствующем возрастанию 5, формулам Серре — Френе можно придать следующий механический смысл: вращение основного триэдра как твердого тела вокруг мгновенных положений единичных векторов бинормали и касательной происходит с угловыми скоростями, равными к и х соответственно; его вращение вокруг мгновенной оси, направленной по вектору Дарбу D = xt + kb (названному по имени французского математика Ж. Дарбу (1842-1917)), происходит с угловой скоростью, равной \D\ = = yjx1 + k2 (эту величину называют полной кривизной кривой в точке М). В соответствии с формулами Серре — Френе кривая является плоской тогда и только тогда, когда ее кручение в каждой точке равно нулю, и кривая является прямой линией тогда и
284 9. ГЕОМЕТРИЧЕСКИЕ ПРИЛОЖЕНИЯ только тогда, когда ее кривизна в каждой точке равна нулю. В самом деле^ при x(s) = 0 Vs 6 [0, sr] имеем 6'(s) = О и b(s) ^ = 6о, где О и 6о — нулевой и постоянный векторы. Поэтому (r(s)bo)'= r'($)bo = t(s)bo = Q и r(s)bo = D = const. Полагая Ьо = Ai + Bj -f С к и r(s) = ix(s)+jy(s) + kz(s). получаем, что все точки кривой лежат в плоскости Ах + By -f + Cz = D. Обратно: если кривая лежит в плоскости с нормальным вектором Ьо, то r(s)bo = const и r'(s)bo = t(s)bo = О, т.е. вектор t(s) лежит в этой плоскости. Но и t'(5)6o = = k(s)n(s)bo = 0. Поэтому при условии к($) ф 0 вектор n(s) также лежит в той же плоскости. Отсюда b(s) = 6o, b'(s) = 0 и x(s) = 0. Если же k(s) = 0 Vs € [0, вг], то t'(s) = 0 и t(s) = to, где to — постоянный вектор. Тогда из t(s) = r'(s) следует, что r(s) = tos + r(0), т.е. имеем уравнение прямой, проходящей через точку с радиус-вектором г(0). Обратно: кривизна любой прямой равна нулю. Точки кривой, в которых ее кривизна равна нулю, называют точками распрямления кривой, а точки, в которых равно нулю кручение, — точками уплощения кривой. Для нахождения кручения кривой вычислим с учетом равенств г» = r'"(s)=k'{s)n(s)+k(s)n'(s) = = k'{s)n(s) - k2(s)t(s) + k(s)x{s)b(s), t(s)n(s)b(s) = 1
Д.9.1. Кривизна и кручение пространственной кривой 285 смешанное произведение векторов r'{s)r"(s)r"'(s) = k(s)t{s)n(s)(k'(s)n(s) - k2(s)t{s) + + k(s)x{s)b(s)) = k2(s)x{s)t{s)n(s)b(s) = k2(s)x(s). Таким образом, в итоге получим уравнения И "(s)r"' называемые натуральными уравнениями кривой. В координатной форме (9.43) с представлением смешанного произведения векторов определителем принимает вид и *(•) = 2* Пример. Вычислим кривизну и кручение винтовой линии, рассмотренной в примере 9.1. Подстановкой в (9.16) t = cs> ( где с = l/\/R2 + Я2, получим ее координатное представление в виде = i?sincs, z = Яс«; sG[0,T/c]} Найдем производные r"(s) = c2R(-icoscs- j sines), r /;/(s) = с3 Д(isin cs — j cos cs).
286 9. ГЕОМЕТРИЧЕСКИЕ ПРИЛОЖЕНИЯ С учетом (9.44) получим k(s) = c2Rvcos2 cs + sin2 cs = c2/? = p2 t I/2 = const и *(*) = -Д sines Я coses Я -coses -sines 0 sines -coses 0 Я cos2 cs-Ь Я sin2 cs 2rr = r-m = с Я = Таким образом, кривизна и кручение винтовой линии постоянны. Постоянна и ее полная кривизна \/Я2 4- Я2 Поскольку 11 n(s) = ТТТ^С5) = w~Tr/'(5) = ~*cosc<s — jsin C5, k(s) для радиус-вектора центра кривизны произвольной точки вин товой линии, согласно (9.42), получим R? -f Я2 / \ = iRcoses -f ji?sin cs + kHcs H — f -tcoses - jsin csJ = Я / \ = — l-iH coses -jH sines + fc#esj. Итак, эволютой винтовой линии является также винтовая линия, но лежащая на цилиндрической поверхности радиуса H2/R и повернутая относительно заданной винтовой линии на угол тг. При Я = R эволюта винтовой линии будет лежать
Д.9.1. Кривизна и кручение пространственной кривой 287 на той же цилиндрической поверхности, что и сама винтовая линия. Отметим, что при Н = О x(s) = 0 и винтовая линия переходит в плоскую кривую — окружность радиуса R с постоянной кривизной 1//?, а при R = О k(s) = 0 и имеем прямую, совпадающую с осью Ог. # Пусть вектор-функция r(s) трижды дифференцируема в точке 5 и \r"(s)\ = k(s) фО. Представим r(s) по формуле Тейлора: Учитывая выражения производных через единичные векторы t(s), n(s) и b(s)y запишем, опустив аргумент 5, Ar = r(s + As) - r(s) = f As - 6 > ~. (9.45) Введем прямоугольную систему координат O^Q с началом в точке с радиус-вектором r(s) и ортами t, n и 6. В этой системе координат Ar = ft -f rjn + £6, где с учетом (9.45) Рассматривая эти равенства попарно и исключая из них As, приходим к выводу, что проекция кривой, заданной при помо-
288 9. ГЕОМЕТРИЧЕСКИЕ ПРИЛОЖЕНИЯ щи вектор-функции r(s), в соприкасающейся плоскости близка к параболе т\ = к£2/2, в спрямляющей плоскости к кубической параболе С = кх£3/6, а в нормальной плоскости QOr} — к полу кубической параболе £ = >сц3/2у/2/к/3. Дополнение 9.2. Примеры плоских кривых Одной из плоских кривых, найденных древними греками при попытках решения задач о квадратуре круга и делении угла в заданном отношении, является квадратриса Дино- страта. Бе открытие приписывают Гиппию из Элиды (V в. до н.э.), который использовал ее для трисекции (деления на три равные части) угла. Динострат (IV в. до н.э.) применил ее для построения квадрата, равновеликого по площади кругу. Название этой кривой предложил Г. Лейбниц. Кривую можно определить как траекторию точки М пересечения прямой С К (рис. 9.14), перпендикулярной отрезку AD длиной 2/2 и движущейся от точки А к точке D с постоянной скоростью Я/Т, с исходящим из середины AD — точки О— лучом ON, который за то же время 2Г равномерно поворачивается вокруг точки О из положения О А в положение OD. Тогда в момент времени t € [О, 2Т] прямоугольные декартовы координаты точки М x = R(l-t) и y = Таким образом, координатное представление кривой имеет вид -^)ctg^{l-^); t€[0,2T]}. Исключая параметр t, получаем уравнение кривой в прямоугольной декартовой системе координат ТТЛ? —, *€[-«, Я]\{0}. (9.46)
Д.9.2. Примеры плоских кривых 289 ч> Рис. 9.14
290 9. ГЕОМЕТРИЧЕСКИЕ ПРИЛОЖЕНИЯ Так как х = R(l — 2<р/п) и, согласно (9.22), р — уравнение кривой в полярной системе координат M9) = -?-fl-2^), y>€[0, тг/2)и(7г/2,тг]. Согласно правилу Бернулли — Лопиталя (см. теорему 5.1), из (9.46) получаем тгх ,. х 2R.. 2 жх 2Я у = hm ж etc г-тг = lim —=ff = — иш cos —т; = —» 7Г x-fO Zii 7Г т.е. при x -* 0 у -^ 2Д/л- = OP (см. рис. 9.14). Для нахождения отрезка, равновеликого длине 2nR окружности радиуса R, проведем следующее построение. На дуге окружности радиуса R из точки А сделаем засечку радиуса ОР, отметив точку Q. На пересечении прямой AQ и перпендикуляра к отрезку AD в точке D получим точку Е. Из подобия треугольников AED и ADQ имеем AE/AD = AD/AQ, или с учетом AQ Итак, отрезок АЕ равновелик по длине окружности радиуса R. Площадь nR2 = 2nR - R/2 круга равна площади треугольника с высотой, равной его радиусу А, и основанием, равным длине окружности (на рис. 9.14 — площади треугольника ODE\, где DE\ = ЛЕ = 2тгД). Для построения равновеликого ему по площади квадрата на стороне DE\ отложим отрезок DG = R/2 и из точки G восстановим перпендикуляр к DE\ до пересечения его в точке Я с дугой окружности радиуса O\D = nR, построенной на DE\ как на диаметре. Тогда квадрат DHLS и будет искомым, так как из подобия треугольников DHG и DEiH имеем DH/DG = DEX/DH и (DH)2 = DEi • DG = 2nR • R/2 = nR2.
Д.9.2. Примеры плоских кривых 291 Для деления заданного угла <р в заданном отношении делим р этом отношении точкой К\ отрезок АК (см. рис. 9.14) и восстанавливаем перпендикуляр к АК до пересечения с Кривой в точке М\. Тогда луч ОМ\ разделит угол <р в заданном отношении. Бели, например, АК\ = К\Къ = то лучи ОМ\ и ОМг осуществляют трисекцию угла у Функция л*) = жх sctg— при x^2mR} 2* Ж 2R при ж = О является четной и определена не только на отрезке [-Я, Я], а всюду на числовой оси прямой R, за исключением точек х = = ±2nR, n € N (точки разрыва второго рода, в которых график функции имеет вертикальные асимптоты). При х = ±(2n — \)R эта функция обращается в нуль. Бе производная /'(*) = 7ГЖ 7ГЖ 1 7ГЖ sin" О при х ф 2mR, m G Z, при х = О обращается в нуль только в точке х = 0, где функция достигает значения /(0) = 2Я/тг. Вторая производная = п пх жх 2R 7Г при а при х = 0 обращается в нуль при значениях ж, удовлетворяющих уравнению 2Д жх и являющихся точками перегиба функции. Подстановка этих значений в (9.46) показывает, что все точки перегиба графи- Ка функции лежат на прямой y = 2R/n (рис. 9.15). Отметим,
292 9. ГЕОМЕТРИЧЕСКИЕ ПРИЛОЖЕНИЯ Рис. 9.16 Рис. 9.15 что древние греки не располагали уравнением (9.46) и строили квадратрису Динострата кинематическим путем как траекторию точки М на рис. 9.14, что соответствует определению функции f(x) лишь на отрезке [-Й, R]. В поисках решения делосской задачи об удвоении куба (по легенде, для умиротворения богов, ниспославших мор на жителей острова Делос, необходимо было удвоить в храме Аполлона объем жертвенника, сохранив его кубическую форму) была найдена кривая, названная циссоидой Диоклеса. Этой кривой принадлежит точка М на любом луче ОБ (рис. 9.16). пересекающем окружность диаметром О А и касательную АВ к этой окружности, причем ОМ = = ВС. Приняв точку О за полюс
Д.9.2. Примеры плоских кривых 293 в луч О А за полярную ось, найдем, что полярный радиус точки М p(M)=OM = OB-OC = D/cos<p-Dcos(p,rfl,e D — диаметр окружности. Отсюда получим уравнение циссоиды в полярных координатах -тг/2, 7г/2). Бе уравнение в прямоугольных декартовых координатах с учетом (9.22) имеет вид х3 - (D - х)у2 = 0, xe[0, 2R). (9.47) Если принять в качестве параметра t = tg<p, то получим координатное представление этой кривой ={(*; t,)6R2: x = Из (9.47) следует, что циссоида — алгебраическая кривая третьего порядка. Она симметрична относительно оси Ох, и ее можно представить графиками двух однозначных ветвей и которые имеют общую вертикальную асимптоту х = D, а в начале координат — общую касательную х = 0. Так как при t = 0 |г'(0)| = |х'(0)г + y'(O)j\ = 0, начало координат является особой точкой кривой (в данном случае, точкой возврата, или точкой заострения), а кривая — кусочно- гладкой. Циссоида названа так потому, что ее часть вместе с дугой окружности образует фигуру, похожую на лист плюща.
294 9. ГЕОМЕТРИЧЕСКИЕ ПРИЛОЖЕНИЯ Древнегреческий математик Диоклес (II в. до н.э.) применил циссоиду для графического решения задачи об удвоении куба. Пусть D равно ребру исходного куба; примем D = 1. И:з записи (9.47) в виде (t/\ з у X/ 1-Х следует, что отношение координат точки М\ (см. рис. 9.16) пересечения циссоиды с прямой АЕ, имеющей уравнение у = = 2(1 - ж), будет у/х = \/2. Тогда отрезок АВ\ и есть ребро того жертвенника, который должен был умиротворить богов. Для трисекции произвольного угла древнегреческим математиком Никомедом (Ш-Н вв. до н.э.) была применена плоская кривая конхоида (по-гречески — похожая на раковину). На любом луче, исходящем под углом у? из полюса О конхоиды (рис. 9.17,а), ей принадлежат точки М и М\ концов равных отрезков КМ = КМ\ = /, где К — точка пересечения луча с базисом конхоиды у = а. Тогда в полярных координатах уравнение конхоиды Никомеда Отсюда, используя (9.22) и обозначая ctg(p = t, получим координатное представление кривой Исключая параметр t, найдем уравнение 2 22-12у2 = 0, i€R (9.48) кривой в прямоугольных декартовых координатах. Таким образом, конхоида Никомеда — алгебраическая кривая четвер-
Д.9.2. Примеры плоских кривых 295 того порядка, симметричная относительно оси Оу. Запись этого уравнения в виде .(-SL)'- \y-aj У Рис. 9.17
296 9. ГЕОМЕТРИЧЕСКИЕ ПРИЛОЖЕНИЯ показывает, что базис конхоиды у = а — двусторонняя горизонтальная асимптота для обеих ее ветвей. Вид конхоиды Никомеда зависит от соотношения между а и /. При / < а (см. рис. 9.17, а) обе ветви кривой гладкие, но (9.48) удовлетворяют также координаты полюса (0; 0). Это особая точка кривой, называемая изолированной. При / = а (рис. 9.17, б) полюс кривой является точкой заострения (точкой возврата), а нижняя ветвь кривой — кусочно-гладкой. При / > а (рис. 9.17, в) на нижней ветви возникает петля, а полюс будет узловой точкой. Пусть требуется разделить на три равные части угол а < < тг/2 (рис. 9.18). Для этого на одной стороне угла отложим отрезок ОС = 2 и через точку С проведем прямую, параллельную другой стороне угла. Приняв эту прямую за базис, а вершину О угла — за полюс, строим нижнюю ветвь конхоиды (случай 1> а). Затем из точки С проводим дугу окружности радиуса / до пересечения с кривой в точке М. Тогда /3 = а/3, так как треугольники MNC и СОМ равнобедренные и каждый из углов С МО и СОМ равен 2/3. а Рис. 9.18 Базисом конхоиды может быть не только прямая, но и любая кривая, в частности окружность радиуса Л, одна из точек которой играет роль полюса ' О (рис. 9.19, а). При любом положении прямой, проходящей через полюс, на ней
Д.9.2. Примеры плоских кривых 297 от точки N ее пересечения с окружностью в обе стороны откладываем равные отрезки NM и NM\ длиной / (на рис. 9.19, a 2R < I и точки М и М\ всегда лежат вне окружности). При повороте прямой вокруг полюса множество точек М и М\ образуют конхоиду окружности, называемую а в г Рис. 9.19
298 9. ГЕОМЕТРИЧЕСКИЕ ПРИЛОЖЕНИЯ улиткой Паскаля. Бе уравнение в полярных координатах имеет вид p(<p) = 2Rcos<p + l, <^>€ [0, 2тг), (9.49) так что кривая симметрична относительно полярной оси Ох. Используя (9.22) и обозначая tgy>=£, из (9.49) получим представление этой кривой соотношениями 2R I 2Rt ± Исключая параметр t, находим уравнение кривой в прямоугольных декартовых координатах, т.е. улитка Паскаля является алгебраической кривой четвертого порядка. Координаты полюса (0; 0) также удовлетворяют этому уравнению, так что полюс при 2R < I является изолированной точкой этой кривой. Кулачок с профилем в виде улитки Паскаля (рис. 9.19,6) при равномерном вращении вокруг оси, проходящей через ее полюс, обеспечивает возвратно-поступательное движение ползуна по гармоническому закону. Направляющие ползуна при этом задают его движение по прямой, пересекающей ось вращения. Перемещение Я ползуна зависит от расстояния его контактной точки М до полюса О, т.е., согласно (9.49), Н = = l + 2Rcosu>t, где и — угловая скорость вращения кулачка и t — время. Скорость dH/dt = -~2Rujs\nut движения ползуна плавно изменяется во времени, что уменьшает износ кулачкового механизма. При 2R>1 (рис. 9.19, в) улитка Паскаля имеет внутреннюю петлю и узловую точку в полюсе. При 2R = I (рис. 9.19, г) получаем частный случай улитки Паскаля — кардиоиду (по- гречески — похожую на сердце). При этом полюс становится точкой заострения (точкой возврата). Вместе с тем кардиоида
Д.9.2. Примеры плоских кривых 299 относится к классу циклоидальных кривых, которые представляют собой траектории точки, жестко связанной с кругом, именуемым производящим и катящимся без скольжения по неподвижной окружности. Бели эта точка принадлежит окружности производящего круга и он катится по внешней стороне неподвижной окружности, то кривую называют эпициклоидой, а если катится по внутренней стороне, то — гипоциклоидой. Кардиоида является эпициклоидой в том частном случае, когда производящий круг и неподвижная окружность имеют одинаковый радиус (см. рис. 9.19, г). Отметим, что эвольвенту окружности можно рассматривать как эпициклоиду для случая, когда радиус производящего круга бесконечен. В более общем случае расстояние h жестко связанной с производящим кругом точки может быть меньше или больше его радиуса г. Тогда она вычерчивает эпитрохоиду или гипотрохоиду (при h < г — укороченные эпициклоиду или гипоциклоиду, а при h > г — удлиненные). Улитка Паскаля при 2R < I является укороченной, а при 2R > I — удлиненной эпициклоидой для случая, когда г = R (см. рис. 9.19, о и в). Если радиус неподвижной окружности R -> оо, то производящий круг катится по прямой и жестко связанная с ним точка вычерчивает при h< г укороченную циклоиду, а при h > г — удлиненную. Все эти кривые имеют общее название трохоида (от греческого слова тро\оС, — колесо). При h = r и R—> оо кривую называют просто циклоидой. Кардиоида принадлежит также и к обширному семейству синусоидальных спиралей с общим уравнением в полярных координатах pm = am cos my?. (9.50) Действительно, при тп = 1/2, а = 4Я и 2R = / (9.50) совпадает с (9.49). Кроме того, при т=1 (9.50) переходит в уравнение окружности радиуса а/2, если полюс находится на этой окружности; при т — -\ имеем уравнение прямой, проходящей на расстоянии а от полюса и перпендикулярной
300 9. ГЕОМЕТРИЧЕСКИЕ ПРИЛОЖЕНИЯ полярной оси; при т = —1/2 получим уравнение параболы р — 2а/(1 +cos</?), симметричной относительно полярной оси, с фокусом в полюсе и расстоянием а от фокуса до вершины; при т = -2 (9.50) в виде р2 = a2/cos2y> описывает две ветви равнобочной гиперболы, симметричные относительно полярной оси, с асимптотами под углами 7г/4 и -7г/4 к этой оси. В случае т = 2 из (9.50) следует уравнение р = су/2са&2фу у? € [—тг/4, тг/4] U [Зтг/4, 5я-/4] лемнискаты Бернулли, где 2с2 = а2. Она, в свою очередь, является частным случаем овалов К ас сини, названных по имени французского астронома Дж. Кассини (1625-1712), считавшего, что орбитой Земли вокруг Солнца является овал. Если зафиксировать точки — фокусы Fi(c; 0) и Рг(-с; 0) (рис. 9.20), то для каждой точки М, принадлежащей овалу Кассини, F\M • F2M = б2 = const, т.е. =62. Рис. 9.20
Д.9.2. Примеры плоских кривых 301 Отсюда следуют уравнения в прямоугольных декартовых координатах и в полярных координатах = у c2cos2(p± yb4 - c*sm22<p. Овалы Кассини симметричны относительно координатных осей, причем если b ^ с>/2, то овалы эллипсообразны, если су/2 > b > с, то они приобретают „талию", при b = с переходят в лемнискату Бернулли, а при b < с каждый из овалов состоит из двух замкнутых линий. Рассматривая (9.51) как неявную форму задания зависимости у от ж, находим производную (см. 2.5) dy х х2 + у2 - с2 da: t/ ж: Отсюда следует, что касательная к овалам Кассини горизонтальна не только в точках их пересечения с осью ординат (х = 0), но и в точках их пересечения с окружностью радиуса с (см. рис. 9.20, штриховая линия). Семейству овалов Кассини соответствуют эквипотенциальные линии абсолютного значения векторного потенциала магнитного поля, создаваемого проходящими через фокусы перпендикулярно плоскости хОу двумя проводниками, по которым течет постоянный ток-одинаковых силы и направления. Вернемся к одной из замечательных плоских кривых — циклоиде. Для построения ее координатного представления учтем, что при качении без скольжения по прямой производящего круга радиуса a OP = at (рис. 9.21, о) и, кроме того,
302 9. ГЕОМЕТРИЧЕСКИЕ ПРИЛОЖЕНИЯ SP=MD = asint и O'D = acost. Тогда Г = {(ж; у) € R2 : х = a(t -sinf), y = a(l-cos£); Исключая параметр £, находим уравнение в прямоугольных декартовых координатах х = aarccos(l - у/а) - \/2ау-у2, у 6 [0, 2а]. Н а б Рис. 9.21
Д.9.2. Примеры плоских кривых 303 Одна арка циклоиды соответствует полному обороту производящего круга, т.е. изменению параметра t на 2п. Точки сопряжения арок являются точками возврата (точками заострения) циклоиды. Поскольку dy asint t ах a — acost 2 где у = (n -t)/2 — угол наклона касательной в точке М к оси Ох, касательная проходит через высшую точку В производящего круга, а нормаль в точке М — через его низшую точку Р, причем длина нормали МР N = 2as\n(t/2). Согласно (9.32), радиус кривизны 2 т.е. равен удвоенной длине отрезка нормали. Это позволяет записать координаты центра С кривизны кривой в точке М (см. рис. 9.21, а) в виде s\nt) и т/ = у — 2Nsm - = —а(1 — cost). Параллельным переносом координат £ = xi — wa и rj = у\ — 2а получим координатное представление эволюты п циклоиды Г в форме Q= {(x\\ t/i) 6 R2: x\ =a(£-sin£), j/i = a(l -cost), * Итак, эволютой циклоиды является такая же циклоида (см. рис. 9.21, а, штриховая линия), но смещенная вниз на 2а и влево на па. При движении точки М от начала координат
304 9. ГЕОМЕТРИЧЕСКИЕ ПРИЛОЖЕНИЯ до точки Н в вершине арки циклоиды радиус кривизны R(t) изменяется от 0 до значения #(тг) = 4а, т.е. в силу теоремы 9.4 длина дуги OG эволюты равна 4а, а длина дуги арки циклоиды — 8а. Циклоида является таутохронной кривой (от греческих слов toivtoQ — тот же и ХРО1/ОС — время): время, за которое материальная точка скатывается по кривой, обращенной выпуклостью вниз, до определенного уровня, не зависит от исходного положения точки на кривой. Это свойство циклоиды было использовано в 1673 г. X. Гюйгенсом для создания маятника, период Г = Ап^/а/д (д = 9,81 м/с2 — ускорение земного тяготения) колебаний которого не зависит от амплитуды. Подвешенный на нити шарик движется по циклоиде (рис. 9.21,5, штриховая линия), которая является эвольвентой жесткого контура с профилем, выполненным также по циклоиде. В обычном маятнике шарик движется по дуге окружности и период колебаний шарика будет приближенно постоянным только при небольших амплитудах, когда дуга окружности (см. рис. 9.21,6, штрихпунктирная линия) мало отличается от дуги циклоиды. Циклоиду также называют брахистохроной (/Зрахмгто^ — по-гречески кратчайший) — кривой скорейшего спуска. Материальная точка под действием силы тяжести, находясь в покое в заданной точке, переходит из нее в другую заданную точку, не лежащую с первой на одной вертикали, быстрее всего по циклоиде, обращенной выпуклостью вниз и имеющей точку возврата в первой точке. Задача о поиске брахистохроны, поставленная И. Бернулли в 1696 г., относится к вариационному исчислению (см. [I, Краткий исторический очерк]). Рассмотренные выше кривые составляют лишь малую долю множества хорошо изученных плоских кривых, обладающих интересными и полезными свойствами, которые находят широкое применение в технике.
Вопросы и задачи 305 Вопросы и задачи 9.1. Доказать свойства (9.6) пределов векторных функций. 9.2. Доказать, что если lim r(t) = а, то lim \r(t)\ = \a Верно ли обратное утверждение ? 9.3. Найти пределы вектор-функций: A-t , .sin* . ln(l -0 , _ б, — тг it — t 9.4. Доказать, что 9.5. Если в точке to дифференцируема вектор-функция r(t), то будет ли дифференцируема в этой точке функция r(t)\ ? Верны ли в этой точке равенства |г'| = (|г|)' и гг1 = 9.6. Доказать, что во всех точках некоторого интервала векторы r(t) и r'(t) ортогональны тогда и только тогда, когда в этом интервале \r(t)\ = const. 9.7. Пусть функции ri(t), r2(t) и гз(£) дифференцируемы в точке to- Выясните, верно ли в этой точке равенство (rir2r3)' = г'хг2г3 + г ir'2r3 + rir2r 3. 9.8. Доказать, что уравнение касательной к годографу в точке с радиус-вектором г (to) в векторной записи имеет вид если |r(fc)(io)| = 0, ib = l, n-l и Ип)(«о)|#0. 20-544
306 9. ГЕОМЕТРИЧЕСКИЕ ПРИЛОЖЕНИЯ 9.9. Найти производные вектор-функций: a) ti+t2j+i?k\ б) tsini+jcost- к; в) iasin2ut+jbcos2wt + kt и написать уравнения касательной в произвольной точке их годографов. 9.10. Найти производные функций: а) г2(0; б) r(t)r'(t)r"(t); в) r(t) х r'{t) x r"{t). 9.11. Для дважды дифференцируемой на отрезке [а, 6] вектор-функции r(t) выполнены условия r{t)r'(t)r"(t) = О, |r(t) х r'(t)\ фО Vfc € [а, 6]. Доказать, что годограф этой вектор-функции лежит на некоторой плоскости. 9.12. Показать, что крив ал Вивиани, задаваемая соотношениями x = Rs\n2t, y = Rsmt-costy z = Rcost, £€[0, 2л*], является пересечением сферы с уравнением х2 + у2 + z2 = R2 и цилиндрической поверхности с уравнением х2 + у2 = Rx. Принадлежит ли кривой точка (Л; 0; 0) и какому значению параметра t она соответствует? Доказать, что проекция кривой на плоскость xOz будет дугой параболы. 9.13. Лежит ли кривая с координатным представлением еЕ3: х = ea'cost, у = eatsmt, z = eat, te на конической поверхности с уравнением х2 + у2 = z2 ? При каком значении а эта кривая пересекает все образующие конуса под углом тг/4 ?
Вопросы и задачи 307 9.14. Показать, что кривая с координатным представлением где f(t) = 1 + i2 -И4, лежит на сфере. 9.15. Доказать, что кривая, называемая локсодромией, с уравнением где 0 и (р .— широта и долгота точки на сфере, пересекает все меридианы под углом а. 9.16. Доказать, что формулы Серре — Френе можно записать в виде t'(s) = D{s) х t(s), n'(«) = D(s) x n(s), b'(s) = D(e) x b(s)y где U(5) = x(s)t(s) + fc(s)6(5) — вектор Дарбу. 9.17. Через четыре точки пространственной кривой можно провести сферу. Если они стремятся к одной точке, то при определенных условиях эта сфера стремится к некоторой предельной, называемой соприкасающейся сферой. Указать эти условия и доказать, что ее центр лежит на бинормали в направлении ее единичного вектора на расстоянии \R'(s)/x\y где R(s) их — радиус кривизны и кручение кривой в точке с радиус-вектором г ($). 9.18. Найти уравнение параболы, имеющей ось симметрии, параллельную оси ординат и соединяющей начало прямоугольных координат с точкой (1; 0), так, что дуга параболы образует вместе с нижней половиной окружности х2 + у2 = 1 кривую с непрервными касательной и кривизной. 9.19. Найти наибольшую кривизну у кривых с уравнениями: а) у = \пх; б) y = aln(l -x2/a2). ^. 20*
308 9. ГЕОМЕТРИЧЕСКИЕ ПРИЛОЖЕНИЯ 0.20. Выразить длины отрезков полярных касательной нормали, подкасательной и поднормали (см. рис. 9.6) через функцию p(ip) и ее производную. 0.21. Составить уравнение эволюты: а) параболы у = ах2; б) кубической параболы у = х3; в) синусоиды у = sin ж; г) цепной линии у = a сп(ж/а); д) у = alncos(a;/a); е) полукубической параболы Зау2 = 2ж3; ж) астроиды ж2/3 + у2/3 = а2/3; з) лемнискаты р2 = a2 cos2<^>; и) кардиоиды г=а(1+cos(p)\ к) спирали Архимеда р = а<р; л) гиперболической спирали р = а/</?; м) гиперболы {ж = achi, t/ = 6sh£, t € R}; н) эллипса (х/а)2 + (у/6)2 = 1. 0.22. Пользуясь свойствами эволюты, найти длину дуги: а) астроиды ж2/3 + у2/3 = а2/3 между точками (о; 0) и (0; а); б) кардиоиды p = a(l + cos(p) при у>€[0, 2тг]. 0.23. Доказать, что для точек спирали Архимеда р — при <р —v оо разность длин радиус-вектора и радиуса кривизны стремится к нулю, а центр кривизны перемещается по кривой, стремящейся к совпадению с окружностью /9 = 1.
10. ИНТЕРПОЛИРОВАНИЕ И ЧИСЛЕННОЕ ДИФФЕРЕНЦИРОВАНИЕ 10.1. Табличный способ задания функции Функция у = f(x) как зависимость у от х может быть задана различными способами [I, 3.2]. До сих пор мы использовали аналитический способ задания в виде формулы, а для наглядности применяли графический способ и изучали приемы построения графика функции по ее формуле. Напомним, что зависимость у от i может быть описана и словесно или задана в виде некоторой определенной последовательности действий, т.е. алгоритмически, а также в виде таблицы п пар дискретных значений ж, и соответствующих им значений у, X У хг У\ =/(si) Xi У2 = 1(Х2) » • • • • • Xi Ух = f(*i) • • • • • • Хп Уп = f(*n) Такая таблица может быть результатом вычисления значений функции по значениям аргумента (табулирования функции) или итогом многократного измерения двух связанных между собой величин при проведении научно-исследовательского эксперимента или испытания технического объекта (простейший пример — измерение времени и пройденного за это время пути). Тогда возникает обратная задача: по отдельным парам значений х, и у, = /(#t) составить более полное представление о функции y = f(x). Один из путей решения этой задачи — построить график функции f(x) no n точкам
310 10. ИНТЕРПОЛИРОВАНИЕ (рис. 10.1), координаты х, и у» которых заданы таблицей, предполагая, что ж, 6 [х\, xn] и на отрезке [xi, хп] f(x) непрерывна. Этот путь дает наглядное представление о функции /(х), но обычно не позволяет решить задачу нахождения с необходимой точностью значений у для внетабличных значений х. Решение последней задачи и составляет предмет интерполирования. В нее также входит нахождение аналитического выражения для функции у = /(г), которое бы при табличных значениях а?,- давало табличные значения у,-. п Рис. 10.1 Согласно общей классификации задач вычислительной математики, интерполирование является задачей идентификации, в которой по заданным совокупностям элементов хх б X и у,- € Y образа Y и прообраза X требуется установить правило / отображения / : X -> У, т.е. построить математическую модель объекта по результатам эксперимента или испытания. В более узком смысле вычисление значения у при каком-либо промежуточном внетабличном значении х 6 6 (я,-, &t+i) называют интерполяцией, а при х £ [xi, xn] — экстраполяцией.
10.2. интерполяция 311 10.2. Линейная интерполяция Простейшим вариантом интерполирования является линейное, когда через две точки (х\] ух) и (х2; уг) с заданными координатами (х\ ф х^) проводят прямую (рис. 10.2, а) с уравнением или y = ~ Х\ (юл) и используют его для приближенного вычисления значения X — Я»2 X "~ Х\ *** J/l ^^~^^~^~ "т" У2 "~~"^~^^~ Жх — Х2 %2~ Х1 функции у = /(ж) в точке ж = ж* между точками a?i и (10.2)
312 10. ИНТЕРПОЛИРОВАНИЕ Интерполяцию по формуле (10.2) называют линейной, или двухточечной, а концы отрезка [хь х2] (при X! < < х2) — узлами интерполяции. По этой же формуле при х £[х\, х2] можно провести линейную (или двухточечную) экстраполяцию. Разность между точным и приближенным значениями функции f(x) в произвольной точке х 6 [xi, x2] (см. рис. 10.2, а) обозначим <р(х)} т.е. x) = f(x)-yi-(y2-yi) В общем случае у?(х) ф 0 на отрезке [xi, х2]. Предположим, что существует вторая производная f"(x) и она непрерывна и ограничена в интервале (хь х2), т.е. при 0 < М2 € R 1Л*)1<Л#2 Vx€(xbx2). Тогда Vx € («1, х2) f^t /() /) и Х2 — Обозначим через хо ту точку на отрезке [xi,x2], в которой модуль \<р(х)\ функции tp(x) достигает максимума. Так как <р(х\) = у>(х2) = 0, точка хо попадает в интервал (xj, x2) и поэтому является точкой локального экстремума. Поскольку функция /(х) дважды непрерывно дифференцируема в (xi, x2), то (р'(хо) — 0. Запишем в точке хо формулу (7.19) Тейлора с остаточным членом в форме Лагранжа с учетом равенства <р'(хо) = 0 , х]. Положим сначала х = xi, а затем х = х2 и с учетом ip(x\) = 0 получим М*о)| = \<р"
10.3. Квадратичная интерполяция 313 где х\ < £ 1 < хо < £2 < Х2- Тогда, учитывая, что Л = х2 - >2min{xo-xi, х2-х0}, |y>"(£i)|^M2 и |y?"(f2)| ^ Л/2, запишем Итак, М2Л2/8 — наибольшая погрешность, которая может возникнуть при линейной интерполяции. Бели погрешность не должна превышать числа £ > О, то возникает ограничение на выбор шага h между узлами интерполяции, а именно h < < у/8е/М2. При линейной экстраполяции погрешность \<р(х)\ быстро растет с удалением точки х от концов отрезка [xi, X2] вследствие роста (х — xq)2. Точность интерполирования можно повысить, если учесть больший объем информации о поведении функции, т.е. использовать более двух узлов интерполяции. 10.3. Квадратичная интерполяция При трех узлах £Ь х2 и хз интерполяцию называют квадратичной (или трехточечной), поскольку через три точки (х\\ t/i), (x2\ t/г) и (хз; t/з)» не лежащие на одной прямой (рис. 10.2, б), проходит единственная кривая с уравнением квадратного трехчлена у(х) = ах2 + Ьх + с. (10.3) Правая часть (10.3) содержит интерполяционный многочлен второй степени, тогда как правая часть (10.1) является интерполяционным многочленом первой степени. Бели через три заданные точки проходила еще хотя бы одна кривая с уравнением у\(х) = а\х2 + &ix + ci (см. рис. 10.2,5, штриховая линия), то многочлен второй степени Р2(х) = = (а-а\)х2 + (b-bi)x + (c — c\) обращался бы в нуль в узлах xi, х2 и хз, т.е. имел бы три нуля, что невозможно в силу основной теоремы алгебры и теоремы 4.3 [I]. Поэтому Р2(х) = 0 и,
314 10. ИНТЕРПОЛИРОВАНИЕ следовательно, а\ = a, &i = b и с\ = с, т.е. действительно через три заданные точки можно провести только одну кривую с уравнением (10.3). Коэффициенты а, 6 и с в (10.3) можно найти из системы трех линейных алгебраических уравнений ах = У1 ах\ + 6x2 + с Определитель этой системы *1 Х2 1 1 1 называют степенным, или определителем Вандермон- да — по имени французского математика А.Т. Вандермонда (1735 -1796). Этот определитель отличен от нуля при х\фхъф ф жз ф XI, что обеспечивает единственность решения системы алгебраических уравнений. Бели подставить найденные по правилу Крамера [III] выражения для а, 6 и с в (10.3), то можно написать У У1 У2 Уз Т2 х\ т2 Х2 т2 Хо X Xi х2 ж3 1 1 1 1 = 0. Это выражение справедливо при любой нумерации узлов интерполяции. Если в него вместо х подставить значение х*, то можно найти приближенное значение у* = /(х*), поскольку у элемента у минор W ф 0. Это выражение нетрудно обобщить на те узлов интерполяции. Однако при больших те раскрытие определителя порядка те + 1 трудоемко. Есть более простые пути построения интерполяционного многочлена степени те - 1 при произвольном числе те узлов.
10.4. Интерполяционный многочлен Лаграыжа 315 10.4. Интерполяционный многочлен Лагранжа Рассмотрим многочлен степени п — 1 (х - х\) • -(х - st_i)(х - a?tH-i) •••{х~хп) _ ТТ x~xj (Xi - Xi-i) (Xi - Xi+i) • • • (Xi - Xn) ~~ 11 Xi - Xj Он обращается в нуль во всех узлах Xj, кроме узла хг, в котором этот многочлен равен единице. Поэтому уравнение f где п п (10.4) описывает кривую, проходящую через все п точек с координатами ж,-, у,-, i=l,n. Многочлен Ln-\(x) имеет степень п— 1. Его называют интерполяционным многочленом Лагранжа. Нумерация узлов в (10.4) произвольная. Таким образом, при интерполяции в точке х* £ (si, xn) у — J уХ ) ~ 1>п—1 \Х ). \l\J.O) В частном случае при п = 2 получим (10.2), а при п = 3 — соотношение (х*-хх){х*-хг) , .. (»*-a?i)(«'-«2) +2/2 77 ГТ7Т ГТ+2/3 При последовательно занумерованных равноотстоящих узлах с шагом h = — Xi (i = l,n- 1) знаменатель каждого слагаемого в (10.4) упрощается, поскольку все сомножители Xi — Xj будут кратными h. Пример 10.1. Построим интерполяционный многочлен Лагранжа для функции, заданной в пяти узлах (п = 5) таблицей * г х{ Ух 1 1,0 1,000 2 1,1 1,032 3 1,3 1,091 4 1,5 1,145 5 1,6 1,170
316 10. ИНТЕРПОЛИРОВАНИЕ Из (10.4) следует, что LA(x) = 111,1(ж - 1,1)(ж - 1,3)(я? - 1,5)(ж - 1,6) - - 258,0(ж - lfl)(x - 1,3)(ж - 1,5)(ж - 1,6) + + 303,1(ж - 1,0)(ж - 1,1)(ж - 1,5)(ж - 1,6) - - 286,2(ж - 1,0)(ж - 1,1)(ж - 1,3)(ж - 1,6) + + 130,0(ж - 1,0)(ж - 1,1)(ж - 1,3)(ж - 1,5). При ж* = 1,15 с учетом (10.4) и (10.5) находим у* « Z/4(l,15) = = 1,048. # Формулу (10.5) можно использовать и для экстраполяции при х* £ [»!, жп], но по мере удаления точки х* от концов отрезка [х\, хп] погрешность обычно быстро возрастает. Без учета ошибок округления погрешность обращается в нуль в узлах интерполяции. Положим <рп(х) = /(яг) - Ln-i(x) - Кип(х), х е [а, 6], (10.6) где a — min{a:i, ж*} и 6 = max{zn, ж*}, а многочлен степени п п (10.7) обращается в нуль во всех узлах интерполяции ж,, г= 1,п. Оценим погрешность интерполяции (или экстраполяции) в точке ж*, выбрав коэффициент К из условия <£>п(#*) = 0, т.е. с учетом (10.6) К = (/(ж*) - L^x*))/(ип(х*)). При таком выборе К функция у?п(ж) на отрезке [а, Ь] обращается в нуль п +1 раз. Предположим, что в интервале (а, 6) функция /(ж) дифференцируема п рази |/^(ж)|< 0 < Мп £ R. Тогда в {а,Ъ), согласно теореме 5.2 Ролля, обращается в нуль по крайней мере п раз, у?"(ж)— п — \ раз, а <Рп (х) — по крайней мере в одной точке жо £ (а, 6), т.е., согласно (10.6), с учетом (10.7) получаем
10.4. Интерполяционный многочлен Лагранжа 317 поскольку dnLn-\(x)/dxn = Oy а в ип(х) коэффициент при хп равен 1. Отсюда К = /(пЦхо)/п\. Так как <р(х*) = 0, то (10.8) Тогда погрешность в точке х* (10.9) Для равномерного расположения узлов интерполяции вид многочленов ип(х) показан на рис. 10.3. При интерполяции выгоднее использовать четное число п узлов, симметрично расположенных относительно точки х* € («i, xn). Тогда при Xi = х\ + (г — 1)Л, г = 1, тг тах|о;п(ж*)| = т.е. погрешность имеет порядок /in, или Рис. 10.3
318 10. ИНТЕРПОЛИРОВАНИЕ При заданном п можно понизить значение max|a;n(x*)|! если на отрезке [si, хп] узлы интерполяции расположить неравномерно, сгущая их к концам отрезка. Оптимальным является выбор в качестве узлов интерполяции нулей многочленов Чебышева (см. далее Д.ЮЛ). Практика показывает, что если при п = 4 или п = 6 не удается обеспечить требуемую точность интерполяции, то целесообразнее не увеличивать п, а уменьшать шаг между соседними узлами, т.е. использовать (если это возможно) таблицу значений у, = f(xt) с меньшим шагом по х. При резком изменении функции f(x) погрешность интерполяции может возрасти с увеличением п в результате роста абсолютного значения |/^(я)| п~и производной. Тогда целесообразно перейти к выравнивающим переменным rj = rf(y) и £ = £(я), чтобы график интерполируемой функции в координатах {, т/ мало отличался от прямой. Например, для функции, близкой к показательной, у = f(x) « ках (рис. 10.4, о) можно использовать преобразование 7/ = logay wx4-logafc, С = ж> что должно привести к выравниванию графика (рис. 10.4, б). а Рис. 10.4 При интерполяции по Лагранжу для вычисления значений Ln-\ (x*) требуется выполнять значительное число умножений. Это оправдано, когда в точке х* вычисляют приближенные
10.5. Интерполяционный многочлен Ньютона 319 значения нескольких функций, заданных на одном и том же наборе интерполяционных узлов. Для интерполирования одной функции в одной или нескольких точках х* удобнее использовать другие способы построения интерполяционного многочлена. 10.5. Интерполяционный многочлен Ньютона При п узлах интерполяции представим многочлен степени п — 1 в виде - С\ + С2(Х - *-a:n_i). (10.10) Коэффициенты с, (г = 1,п) найдем из условий iVn_i(a;t) = = t/j, которые приводят к системе п линейных алгебраических уравнений = Уь i{xi - хг) ••••#•••••••••■• n(xn-xi)---(xn-Xi)---{xn-xn-i) =yn с нижней треугольной матрицей. Бели обозначим 2/1-У2 щ1 У2-Уз Уп-i - Уп 2/1,2= —, У2,3= У = Xi-X2 _ 2/1,2 - 2/2,3 2/п-2,п-1 - Уп-1,п 2/1,2,3-— —» •••, Уп-2,п-1,п= " , Х\ - Х З Х __ У1,2,...,п-1 — У2,3,...,п У1,2,...,п — Х\ -Хп то получим .., Сп =
320 10. ИНТЕРПОЛИРОВАНИЕ Здесь t/i, 2/1,2, 2/1,2,...,*, 2/i,2,...,n — разделенные разности нулевого, первого, (t - 1)-го и (п - 1)-го порядков. Например, при п = 4 последовательность вычисления разделенных разностей видна из схемы х2 хА 2/1 1,2 2/2 } У1,2,: !,3 } У1,2,3,4 УЗ } У2.3.4 (10.11) Уа Такую последовательность вычислений нетрудно запрограммировать на ЭВМ. При равноотстоящих узлах с постоянным шагом h = a?j+i — xt- (i = l,n — 1) числители в выражениях У1,2 = (У2~У1)/Л, У1,2,з = (У1-2у2 + Уз)/(2/12), ... называют конечными разностями соответствующего порядка. После подстановки коэффициентов с, в (10.10) получим интерполяционный многочлен Ньютона x-zn_1). (10.12) Как и в (10.4) нумерация узлов в (10.12) может быть произвольной. Если интерполяционные узлы занумерованы так, что х\ < Х2 < -.. < хП) то говорят об интерполировании вперед, а если Xi > Х2 > ... > хп, то об интерполировании назад. Поскольку через п точек с координатами ж,-, у,-, г = 1, п, проходит единственная кривая, отвечающая многочлену степени п- 1, погрешность интерполирования по Ньютону будет такой же, как и по Лагранжу.
10.5. Интерполяционный многочлен Ньютона 321 Пример 10.2. Построим многочлен N4(x), используя схему (10.11) и данные таблицы в примере 10.1. = 1,0 х3 = 1,3 — 1,5 хъ = 1,6 2/1 = 1,000 У1,2 = 0,320 у2 = 1,032 У1,2,з =-0,083 у2,з = 0,295 У1,2|з,4 = 0,042 уз = 1,091 у2,з,4 =-0,062 У1,2,3,4,5 = "0,087 уз,4 = 0,270 у2,з,4,5 = -0,010 = 1,145 уз,4,5 = -0,067 у4,5 = 0,250 Уъ = 1Д70 Интерполяционный многочлен Ньютона для интерполирования вперед имеет вид NA(x) = 1,000 + 0,320(z -хх) - - 0,083(я - xi)(x - х2) + 0,042(х - хх){х - х2)(х - х3) - - 0,087(ж - xi){x - х2)(х - х3){х - а для интерполирования назад (с учетом перенумерации узлов) — N4(x) = 1,170 + 0,250(ж -х5) - - 0,067(ж - х5)(х - хА) - 0,010(я - хъ)(х - хА)(х - х3) - - 0,087(ж - х5)(х - хА)(х - х3)(х - х2). При х* = 1,15 оба многочлена для приближенного значения у* интерполируемой функции дают совпадающее до трех знаков после запятой число 1,048. Оно совпадает и с результатом примера 10.1. # При заданном х* для сокращения числа умножений можно при вычислении воспользоваться схемой Горнера в виде У* = ДО « Wn-l (X*) = У! + (X* - ХХ) (yi,2 + (X* - Х2) (yli2|3 + + {Х* - Ж3)(У1,2,3,4 +... 21-544
322 10. ИНТЕРПОЛИРОВАНИЕ Однако непосредственное использование (10.12) удобнее, поскольку позволяет следить при вычислениях за точностью интерполирования, оценивая ее по убыванию абсолютных значений слагаемых. Если убывание быстрое, то можно прекратить расчет на том слагаемом, абсолютное значение которого меньше допустимой погрешности. Когда нет необходимости в построении многочлена Nn_i(x), а нужно найти лишь приближенное значение у* при конкретном значении я*, достаточно в схеме вида (10.11) yt|t+i (t = l,n- 1) заменить на а значения у,',...,; (t = 1, п - 2, j = г + 2, п) — на г _ fi,...j-\(x* - xj) - fw j(x* - х-) В качестве у* принимают то значение /, которое менее всего отличается от значений / с меньшим на 1 количеством индексов. Описанный алгоритм называют схемой Эйткена по имени английского математика А.К. Эйткена (1895-1967). Пример. Используем схему Эйткена для нахождения у" по данным примера 10.2 при х* = 1,15. = 1,0 Ж4 = 1,5 yi = 1,000 У2 = 1,032 /2,3 = Уз = 1,091 /3,4 = У4 = 1,145 Л,5 = У5 = 1,170 Л,2,3 = 1,047 /2,3,4 = 1,050 /3,4,5 = 1,057 1,048 /1,2,3,4 = 1,047 /2,3,4,5 = 1,046 1,048 /1,2,3,4,5 1,048 = 1,048.
10.6. Интерполирование с кратными узлами 323 Так как /1,2,3 и fi^ совпадают с принятой точностью расчетов, вычисления можно было бы прекратить на втором этапе и принять у* « 1,048. # Бели заданная в табличной форме функция у = f(x) непрерывна и строго монотонна на отрезке [zi, xn] и имеет область значений R(f) = [уь уп] (или R(f) = [уп, уг]), то схему Эйт- кена можно применить для обратного интерполирования, т.е. для нахождения значения ж* € [а?ь zn], соответствующего заданному значению у* = f(x*) € R(f) функции f(x). В силу строгой монотонности f(x) в ее области значений определена обратная функция а: = f~l(y) (см. теорему 9.6 [I]), и задача состоит в обычном интерполировании этой обратной функции в точке у*. Для этого в приведенных выше формулах достаточно всюду а; и у поменять местами. Пример. По данным примера 10.2 найдем значение z*, соответствующее заданному значению у* = 1,100. У1 = Уз = У5 = 1,000 1,032 1,091 1,145 1,170 х4 *5 /i,2=l,312 /2,3 1,3 /з,4 1,5 Л,5 1,6 1,331 /2,3,4 1,333 /3,4,5 1,320 1,333 /l ,2,3,4 1,332 /2,3,4,5 1,332 1,332 /1,2,3,4,5= 1,332. 1,332 Если ограничиться точностью до второго знака после запятой, то можно принять ж* = f~l(y*) = f~l (1,100) « 1,33. 10.6. Интерполирование с кратными узлами В узлах интерполяции xi £ [х\) хт], / = 1, т, помимо значений у/ интерполируемой функции у = f(x) могут быть 21'
324 10. ИНТЕРПОЛИРОВАНИЕ заданы и значения ее производных у\ = /'(х,), у," = /"(*/), • • •, у\к>-1) = до порядка ki — 1 включительно, т.е. в каждом узле известно ki значений. Число ki € N называют кратностью узла интерполяции х/, а при fc/ > 1 узел интерполяции называют кратным (в отличие от простого узла при fc/ = 1). Многочлен + an степени п = fci +... + fc/ +... + km - 1, для которого l, (10.13) называют интерполдциониылс многочленолс с кратны- ми узлами, или интерподлционнылс многочленолс Эр- мита — по имени французского математика Ш. Эрмита (1822-1901). Условия (10.13) представляют собой систему п линейных алгебраических уравнений относительно п коэффициентов а0, <*ъ • • •) ап, которая имеет однозначное решение при любых правых частях, поскольку соответствующая ей однородная система имеет лишь нулевое решение, т.е. матрица этой системы невырождена. Действительно, пусть Gn(x) — многочлен степени п. Тогда условия Gn (xi) = 0, /=l,m, j = 0,fc/-l, означают, что числа х/ являются его нулями кратности, не меньшей, чем fc/. Поэтому многочлен Gn(x) имеет не менее к\ +... + к\ +... + кт = п + 1 нулей. Это возможно только тогда, когда все коэффициенты Gn(x) равны нулю, т.е. соответствующая (10.13) однородная система уравнений имеет лишь тривиальное решение. Многочлен Нп(х) можно построить, не решая систему (10.13). Для этого рассмотрим интерполяционный многочлен Ньютона Nn{x) = yi 4- yi,2(s - xi) + у\аМх - xi)(x - х2) -f + 2/1,2 i(x - Xi) • • • (X - Xt_!) + ... + + У1,2
10.6. Интерполирование с кратными узлами 325 степени п, построенный по п +1 простым (не кратным) узлам. Бели приближать узел х2 к узлу xi, то средний наклон 2/1,2 = (j/2 - У\)/(хг - ^l) графика многочлена Nn(x) между этими узлами будет стремиться к значению у[ = f'(x\) производной функции y = f(x) в точке х\. Тогда в пределе при Х2-*х\ и заданном значении у[ узел х\ станет кратным с кратностью 2, а вместо Nn(x) получим интерполяционный многочлен Эрмита где t/1,1,...,,\ — разделенная разность t/i,2,...,, (i = 3,n + l), в которой t/1,2 заменено на у{, x<i — на х\ и уъ — на у\. Если теперь и хз —► х\ при условии, что х\, t/i и yj фиксированы, то с учетом правила Бернулли — Лопиталя и определения 1.2 производной — X3 У3-У[ _ У" (23-Xi)2 Х3-УХ1 2(X3-Xi) 2 и вместо #п(х) получим - X4) ---(X - Xi-i) 4* ...+ X - Xi)3(X - X4) • • • (X - Xn), где yi,i,i,..M$ — разделенная разность yi,2,3,..,,' (i = 4, n+ 1), в которой yi,2 заменено на у(, yi,2,3 — на у'{/2, у2 и у3 — на У1, а Х2 и хз — на xi. Ясно, что, полагая поочередно x,-»xi (г = 4, п -f 1), в итоге получаем многочлен Тейлора
326 JO, ИНТЕРПОЛИРОВАНИЕ Такой предельный переход позволяет считать многочлен Тейлора степени п интерполяционным многочленом Эрмита, который в одном узле (т = 1) совпадает с интерполируемой функцией по своему значению и значениям всех производных до порядка п включительно. Применяя последовательно процедуру предельного перехода ki-1 раз к каждому фиксированному интерполяционному узлу х/ (I = 1, т), в котором заданы значения у] , j = 0, hi - 1, из интерполяционного многочлена Ньютона для (п+1)-го простого узла получим интерполяционный многочлен Эрмита степени п для т в общем случае кратных узлов. У такого многочлена Эрмита помимо узловых значений будут совпадать с интерполируемой функцией еще и значения производных во всех или в некоторых узлах. Для погрешности интерполяции справедлива оценка вида (10.9): - Нп(х)\ < МП+1Ь^|1, (10.14) где Mn+i — наибольшее абсолютное значение производной порядка п+1 функции /(х) в интервале (xi, хт) и m многочлен степени п+1 с нулями х\ (/=1, т) кратности Пример 10.3. Пусть на концах отрезка [xi, X2] заданы значения t/i, yj, t/2 и Уг Для Функции /(х), определенной на [х\у хг]. Тогда т = 2, к\ = &2 = 2 и п = к\ + &2 - 1 = 3. Построим многочлен' #з(х), удовлетворяющий условиям Яз(х1) = у1, Н'3(х1) = у'и #з(х2) = у2, Я3(х2) = у2. (10.15) Для этого используем интерполяционный многочлен Ньютона степени п = 3 для п + 1 = 4 простых узлов xi, х2, хз, х4 € ь х2]: х - х3) + x - Х3)(Х - Х2),
10.6. Интерполирование с кратными узлами 327 где j причем Уз,2 При х3 и У2, Уз хз *3 Уз *з' * -У2 Х\ И Х4 и х4 — 'Л ,О,А У3,2,4 -»х2 ■ на ; У1,з- X! - У3.2 S3 ■У3,2 -х2 ~У2,4 -Х4 следует yif3 ri и ж2, уз ■г И И У2,4 И У4 У1,3,2 ~ ХХ- У2- Ул* х2 - заменить — на yi У3,2,4 х4 ' -У4 на yj И У2 соответственно. Тогда при х2-хх=Л вместо N$(x) получим Я3(х) = У1 + у[(х - Xi) + У1,1,2(Х - Xi)2 + yi,l,2,2(« - *l)2(x - Х2), где f| _ У2 - У\ Ух _У1+У2 У2-У1 У112 - -j-— - "jj- И У1Д ,2f2 - —^ ИЗ— Многочлен Яз(х) обычно преобразовывают к виду ) + h'>Xjp (10.16) и называют кубическим интерполяционным многочленом Эрмита. По (10.16) нетрудно проверить выполнение условий (10.15). Для четырежды дифференцируемой в интервале (xi, x2) функции f(x) 'из (10.14) следует оценка для наибольшей возможной погрешности ее интерполирования на отрезке [xi, x2] многочленом #з(х): max |(x x)2(x -х2)2| = max |/(х) - Я3(х)К ~Т max |(x -xi)2(x -х2)2| = М4 ^^ 4! jri^x^a?2 oo4 где М4 — наибольшее абсолютное значение fIV(x) при х € (хь х2).
328 10. ИНТЕРПОЛИРОВАНИЕ 10.7. Численное дифференцирование Инженерные задачи нередко приводят к необходимости вычисления производных функции по ее табличным значениям (например, вычисление скорости и ускорения прямолинейного движения тела по измеренным значениям времени и пройденного пути). В этом случае говорят о численном дифференцировании функции. Формулы для вычисления производных будут приближенными, и их можно получить двумя путями. Первый из них связан с дифференцированием интерполяционного многочлена, построенного по табличным значениям функции. Бели при п узлах интерполяции многочлен степени п—1 задан при помощи определителя У У1 У2 1 1 1 Х2 1 ;2 Уп 1 X п *"1 п = 0, то последовательным дифференцированием его первой строки можно для точки х* приближенно найти производные от первой до (п— 1)-й из выражений у: У1 У2 Уп 0 1 1 1 1 XI х2 Хп (п-1) yi ' У1 У2 Уп 2х г2 г2 х2 X2 хп 0 1 1 1 * • 0 х\ х2 Хп .. (п- • • .. 0 ж2 •1/1 . • . 2 2 1)хГ2 хГ1 0 /»П-1 ^п (п-1)! «г1 Ж2 Хп-1 = 0.
10.7. Численное дифференцирование 329 Отметим, что (п- 1)-я производная не зависит от значения ж*. Аналогичным образом можно дифференцировать интерполяционные многочлены Лагранжа, Ньютона, Эрмита. В частности, из (10.12) следует y(n~l)«(n-l)!yi,2 щ где 2/i,2,...,n — разделенная разность (п — 1)-го порядка. Из (10.12) при п = 2 и п = 3 имеем И У* « ХХ-Х3 В случае равноотстоящих узлов интерполяции имеем х3 = = x\+2h и получим выражения в конечных разностях (10.17) Общая схема получения формул вида (10.17) состоит в том, что в точке ж* вычисляют значение P^Jiix») (fc=l,n—1) k-vi производной интерполяционного многочлена Рп-\(х) и принимают его в качестве приближенного значения fc-й производной fW(xm) функции f(x) в точке ж*. Однако, если значение мало по сравнению с Pn_i (ж*), то нет гарантии, что будет мало и Кип (х*) по сравнению с Р^]1(хт). Поэтому наряду с получением приближенной формулы для вычисления производной важно еще оценить погрешность этой формулы. Такую оценку можно получить с помощью формулы Тейлора, что составляет существо второго пути построения приближенных выражений для производных таблично заданных функций.
330 10. ИНТЕРПОЛИРОВАНИЕ Пусть при равноотстоящих с шагом h узлах интерполяцик Xi = х\ + (г - l)/i, г = 2, п, заданы значения у{ = /(ж,-) функ ции /(ж) и нужно вычислить производную у\ = f'(xi) в узж а;,. Предположим, что эта функция дифференцируема необходимое число раз на отрезке [х\, хп]. Тогда в соответствии с формулой Тейлора % ^^ (10.18) Отсюда Аналогично из формулы Тейлора следует, что Vi-i = Vi - y'ih+ |-ft2 - ||-Л3+ \h* + O(hb) (10.19) и затем Таким образом, погрешности представления у\ через правую (yi+\-yi)/h и левую (y% — yi-\)/h конечные разности (иногда их называют конечпылси разностями вперед и назад) пропорциональны /г, т.е. имеют первый порядок малости при h —> 0. В этом случае кратко говорят, что погрешность имеет первый порядок, а соответствующая формула численного дифференцирования — первый порядок точности. Правая и левая конечные разности соответствуют линейной интерполяции функции f(x) на отрезках [х,-, x,-+i] и [ж,_1, Х{] (рис. 10.5, а, сплошные прямые). Эти разности и образуют то разностное отношение (1.6), предел которого при
10.7. Численное дифференцирование 331 h —> 0, согласно определению 1.2, равен производной. В силу теоремы 7.3 [I] о связи функции, ее предела и бесконечно малой функции разностное отношение отличается от производной на функцию, бесконечно малую при h —> 0. Формула Тейлора позволяет установить порядок малости этой бесконечно малой функции по сравнению с h при h -> 0. xi-\ a RJ2 б Рис. 10.5
332 10. ИНТЕРПОЛИРОВАНИЕ Если из (10.18) почленно вычесть (10.19), то получим формулу численного дифференцирования с центральной конечной разностью ? У?h2 , _ У«+1 ~ Vi-\ l\h +---~2*— Эта формула имеет второй порядок точности и соответствует квадратичной интерполяции функции f(x) при х 6 [s»_i, 3i+i] (см. рис. 10.5, а, штриховая линия), но дает тот же результат для первой производной в средней точке ж» отрезка [х,_ 1, Sj+i], что и при линейной интерполяции по его двум крайним точкам xt_i и z,+i (см. рис. 10.5, а, штрихпунктир- ная линия). Отметим, что если у"' = 0, то эта формула будет иметь четвертый порядок точности, поскольку при вычитании (10.19) из (10.18) слагаемые с y\v взаимно уничтожаются. Такая особенность характерна для формул с центральными разностями. Правую и левую разности можно считать центральными, но для промежуточных точек ж|+1/2 = X{ + h/2 и «,-_i/2 = a?t - h/2 соответственно (см. рис. 10.5, а), т.е. / _ Уй-1 —У% , ^(V2\ „ ,/ _ 2/i ~Уг-\ 2/t+i/2 = ^ + О(Л ) и yt = Рассматривая вторую производную как центральную разность первых производных, получаем формулу в которой не ясен вклад в погрешность второго слагаемого в правой части. Для оценки этой погрешности почленно сложим (10.18) и (10.19) и получим
10.7. Численное дифференцирование 333 Проверим, сохраняет ли (10.20) второй порядок погрешности при вычислении у" в крайнем узле интерполяции. Положим в (10.18) t = l: |2 ^3^4 5 (10.21) и, кроме того, запишем с учетом хз = х\ + 2Л формулу Тейлора %%^. (10.22) Исключая из (10.21) и (10.22) у[, находим /, Уз-2у2-ЬУ1 ,„, Уз-2у2Ч-у1 , ^,L4 Ух = ^2 У\ h~~-= £г + O(h). Таким образом, выражение (уз — 2t/2 H-yi)/^2, согласно (10.20), при г = 2 обеспечивает погрешность второго порядка, если его использовать для вычисления у%, а при вычислении у" (а также Уз) порядок погрешности уменьшается на 1. Чтобы сохранить второй порядок погрешности при вычислении у"у следует использовать значение у+ в узле ^2 |3^45. (10.23) Исключая из (10.21)—(10.23) у[ и j/J'7, находим -У4 Ух ^ Т2 -У4 + 4у3 - 5у2 -f 2yi 4 )• Если из (10.21) и (10.22) исключить у{', то получим Th
334 10. ИНТЕРПОЛИРОВАНИЕ Формулы второго порядка точности для узла хп имеют вид 2/г Пример 10.4. Пусть значения функции f(x) = ex заданы на отрезке [0, 1] с шагом h = 0,2. Приближенные значения у' производной f'(x), вычисленные по формулам второго порядка точности, и погрешности R = f'{x) — y' = ex-yl представлены в таблице: X № у' R 0,0 1,00000 0,98445 0,01555 0,2 1,22140 1,22955 -0,00815 0,4 1,49182 1,50180 -0,00998 0,6 1,82212 1,83430 -0,01218 0,8 2,22554 2,24040 -0,01486 1,0 2,71828 2,68700 0,03128 Характерно, что использование различных формул для вычисления производных в крайних и внутренних узлах привело к разным знакам погрешности. # Главную часть погрешности формулы с порядком точности т можно представить в виде Ahm. Тогда погрешность приближенного значения C(zn h) величины z(x{) в фиксированном узле Х{ при равномерном шаге h будет Пусть в том же узле я, по той же формуле, но при равномерном шаге hi = rh вычислено значение C(*t» rh). Теперь погрешность равна *(*.-) -«.*,, гЛ) = A(rh)m + O{(rh)m+l). Принимая O((r/i)m+1) wO(/im+1) и вычитая из второго равенства первое, получаем для главной части погрешности в узле Х{
10.7. Численное дифференцирование 335 и более точную формулу для приближенного значения величины = г»<(»,-, Л) - С(».-, гЛ) w+l rm — 1 Такой подход, дающий количественную оценку главной части погрешности и уточненное значение искомой величины с более высоким порядком точности, называют методом Рунге по имени немецкого физика и математика К.Д.Т. Рунге (1856-1927). Отметим, что для формул численного дифференцирования с центральными разностями этот подход повышает порядок точности сразу на две единицы, поскольку для них следующее за главной частью погрешности слагаемое имеет порядок малости на две единицы больше по сравнению с главной частью. Пример 10.5. Из формулы y"(h) « (у;+1 - 2yt + y,_i)//i2 второго порядка точности с центральной разностью методом Рунге можно получить для второй производной приближенную формулу четвертого порядка точности, если перейти к шагу hi = 2/г: г/<'(2/г) « (у,+2 - 2у, + yt_2)/(2/i)2. Тогда, согласно (10.24), - ЗОу, + Щ ~ 22 -1 " 12/i2 * Итак, существуют пути, позволяющие получить приближенные формулы численного дифференцирования с более высоким порядком точности, в которых используются значения функции в большем числе интерполяционных узлов, а также формулы для вычисления производных выше второго порядка. Но такие формулы могут привести к большим абсолютным погрешностям, тем более что узловые значения функции вследствие погрешностей измерения или ошибок округления обычно сами обладают некоторой погрешностью. Влияние погрешности значений функции покажем на примере вычисления первой производной.
336 10. ИНТЕРПОЛИРОВАНИЕ Из формулы (7.19) Тейлора с остаточным членом в форме Лагранжа получим - к у-= h2h- Бели значения у,- и t/,+i известны с погрешностью, не превышающей по абсолютному значению Е > О, то погрешность вычисления правой конечной разности не превысит 2E/h. Пусть |/"(01 ^ М. Тогда суммарная погрешность вычисления первой производной по приближенной формуле у'х % « (yt+i-t/j)//i не превысит по абсолютному значению R = = Mh/2 + 2E/h. При уменьшении Л слагаемое Mh/2 убывает, а слагаемое 2£?/й возрастает (рис. 10.5, 5). Из условия <Ш_А£ Е _ dh " 2 Л2" найдем оптимальный шаг /i* = 2y/E/M между узлами интерполяции, которому соответствует минимальное значение Rm = = МК/2 + 2Е/К = 2у/ЁМ. Если погрешность Е связана только с округлением значений у, и у,+1 при их представлении в ЭВМ, то Е = С -2~N, где С > 0 и N — число двоичных разрядов. Тогда R+ = = 2у/СМ • 2"^/2, т.е. при численном дифференцировании с применением правых конечных разностей в лучшем случае можно сохранить только половину верных знаков. Тот же результат даст использование и левых разностей. В более общем случае при вычислении к-н производной по конечно-разностной формуле с порядком погрешности т суммарная погрешность не превысит по абсолютному значению Мт>0, Ск>0.
Д. 10.1. Минимизация погрешности интерполяции 337 Из условия ah имеем И Чтобы сохранить при численном дифференцировании не менее половины верных знаков, необходимо выбирать конечно- разностные формулы, удовлетворяющие условию m ^ к. Иначе суммарная погрешность может оказаться столь большой, что результаты вычислений потеряют практическую ценность. Дополнение 10.1. Минимизация погрешности интерполяции Из (10.9) следует, что для п раз дифференцируемой в интервале (а, Ь) функции f(x) наибольшая возможная погрешность ее интерполяции (или экстраполяции) на отрезке [а, Ь] при п узлах интерполяции Х{ £ [а, 6], i = 1, п, не превышает Mnwn/n\y где Мп= max|/(n)(s)|, wn= max \u>n(x)\. Расположение этих узлов не влияет на значение Мп, но может существенно повлиять на значение wn. Поэтому естествен вопрос: существует ли на [а, Ь] такое расположение п узлов интерполяции, при котором значение wn минимально, т.е. минимальна максимально возможная погрешность интерполяции (или экстраполяции) на [а, Ь] любой п раз дифференцируемой в (а, 6) функции? 22-544
338 JO. ИНТЕРПОЛИРОВАНИЕ Заменой х = (а + 6)/2 + (6 — a)t/2 с учетом (10.7) получим i=l i=l где узлы интерполяции ж, € [а, 6] и U; € [—1, 1] связаны соотношением ж,- = (a -f 6)/2 + (6 — a)ti/2. Будем искать такое расположение п узлов tj € [— 1, 1], при котором достижим min max fin(0- ДЛЯ этого рассмотрим функцию Tn(t) =cos(narccosi), t 6 [-1, 1], п € NU{0}. При n = 0 Го(^) = 1, при n = l Ti(t) = t, а при п>1 в силу тригонометрического тождества cosna + cos(n — 2)q = 2cosa-cos(n— l)a, если положить a = arccosl, имеем т.е. Tn(t) является многочленом степени п, причем для четных п Tn(t) будет четной функцией, а для нечетных п — нечетной (рис. 10.6, а). Функции Tn(t), называемые многочленами Чебышева, введены П.Л. Чебышевым в 1854 г., а их общепринятое обозначение происходит от французского написания его фамилии (TschebychefF). Нули tk многочлена Tn(t) при п € N удовлетворяют уравнению 2fc 1 arccostjt = ——тг, к = 1, п, а точки ^€(-1,1) его экстремумов — уравнению dTn(t'm)/dt= =0. Тогда sin^arccos^) = 0, или . 771 arCCOStm = —7Г, 771= 1,71-1. 71
Д. 10.1. Минимизация погрешности интерполяции 339 Отсюда следует, что 2к-\ a б Рис. 10.6 Г х =COS тг, fc = l,n, и 4 = cos—7Г, n причем Tn(t'm) = cos (narccos (cos —7Г JJ =cosm7r = (-l)w,
340 10. ИНТЕРПОЛИРОВАНИЕ т.е. минимумы и максимумы многочлена Чебышева при п > 1 чередуются. На концах отрезка [—1,1] Тп(1) = 1 и при n£N Тп(—1) = (—1)п. Таким образом, многочлен Чебышева Tn(t) при nGN имеет на [—1,1] п нулей и п — 1 экстремум в точках tk и t'm соответственно, причем Тп(1'т) — (—1)т, т.е. по абсолютному значению все экстремальные значения одинаковы и равны 1. Геометрически нули многочлена Чебышева и точки его экстремумов являются проекциями на отрезок [-1, 1] точек деления на 2п равных частей полуокружности, построенной на этом отрезке. На рис. 10.6, б построение отвечает случаю п = 3. Характерно, что нули и точки экстремумов, отмеченные соответственно кружками и крестиками, сгущаются к концам отрезка. Коэффициент при старшей степени t многочлена Tn(t) при п € N равен 2П~*. Среди всех многочленов Pn{t) степени п с равным 1 коэффициентом при старшей степени t многочлен 21~nTn(t) имеет наименьшее уклонение от нуля на отрезке [-1, 1], т.е. max |21-nTnW| = 21"n< max \Pn{t)\. (10.26) Покажем это. Предположим обратное и рассмотрим разность которая есть многочлен степени п- 1, поскольку при вычитании члены tn взаимно уничтожаются. В точках £/ = cos(/7r/rc), / = М, Тп(«|) = (-1)|) ипоэтому Rn.l(tl)=2l-n(-l)l-Pn(tl). Если на отрезке [-1, 1] max|Pn(fc)| < 21~п, то тогда значения #n-i (*/) с возрастанием / от 0 до п будут поочередно менять знак п раз, т.е. многочлен Rn-i(t) степени п-1 будет иметь не менее п корней, а это невозможно в силу основной теоремы алгебры и теоремы 4.3 [I], что доказывает справедливость (10.26). Бели в (10.25) принять 2г-1 . £ -—тг, г =1,п, In
Д. 10.2. Интерполирование сплайнами 341 то в силу равенства многочленов, имеющих одинаковые нули, при t € [— 1, 1] получим Un(t) = 21~nTn(t). Таким образом, выбор в качестве п узлов интерполяции нулей многочлена Чебышева Tn(t) обеспечивает наименьшее уклонение от нуля многочлена Qn(t) на отрезке [-1,1], причем min ( max Un(t) = 2l"n). В случае произвольного отрезка [а, Ь] выбор п узлов интерполяции в точках а + Ъ 6 - а 2г — 1 . -— + *, г = 1, п, обеспечивает минимизацию наибольшей возможной погрешности интерполяции (или экстраполяции) на [а, 6] п раз дифференцируемой в интервале (а, 6) функции, причем эта погрешность будет не больше Mn(b — a)n/(22n~1n!). Выбор расположения заданного числа узлов интерполяции на отрезке связан с более общей проблемой наилучшего приближения функций. Когда этот выбор приводит к минимуму максимально возможной погрешности, то говорят о чебышев- ском приближении (или о принципе минимакса). Дополнение 10.2. Интерполирование сплайнами Увеличение числа интерполяционных узлов и построение по ним интерполяционного многочлена высокой степени в общем случае не обеспечивает снижения наибольшей возможной погрешности интерполяции. При большом числе узлов на отрезке [а, 6] рациональнее строить на составляющих его отрезках многочлены сравнительно невысокой степени и стыковать эти многочлены между собой. Реализация этой идеи привела к появлению сплайн-функций (или просто сплайнов) Sm(x) — функций, непрерывных на [a, b] вместе со всеми своими производными до порядка р включительно и совпадающих на
342 10. ИНТЕРПОЛИРОВАНИЕ каждом составляющем [а, 6] частичном отрезке с некоторым многочленом степени т. Разность Am = m — p называют дефектом сплайна. Пусть заданы значения ух (t=l,n) интерполируемой функции у = /(х) в узлах а = х\ < ... < х,- < ... < хп = 6. Сплайн называют интерполяционным, если Sm(xj) = у{ для всех г = 1,п. Значение Si = S/rn(x{) именуют наклоном сплайна в точке xt. Простейший интерполяционный сплайн S\(x) — это непрерывная ломаная из отрезков прямых, проведенных через соседние точки с координатами xt, у,- и x,+i, y,+i, « = 1,п—1 (линейный сплайн). Для него m = 1, р = 0 (непрерывна лишь нулевая производная, т.е. сама функция) и Am = 1. Из интерполяционных сплайнов, непрерывных вместе со своими первыми производными, наиболее часто применяют кубические сплайны 5з(х). Бели заданы значения у,, sx, y%+\ и s,+i> то на частичном отрезке [х,-, x,+i] такой сплайн совпадает с кубическим интерполяционным многочленом Эрмита вида (10.16): ... (xt>i-x)2(xt4.1-f2x-3xt) , ^ (xt+1-x)2(x-xt) t * ^Т^Р +* + Совокупность таких многочленов, построенных на всех частичных отрезках, и образует интерполяционный сплайн 5з(х), х € [а, Ь] с дефектом Am = 2. Бели же в интерполяционных узлах я, € [а, 6] (г = 1,п) известны лишь значения у, = /(xt) интерполируемой функции /(х), то можно указать два способа построения 5з(х), х € 6 [а, Ь]. Первый из них, называемый локальным, связан с использованием формул численного дифференцирования (см. 10.7) при г = 1,п —1 У»+1 - у% У|+1 - у% /inoov 5,« -2-1- или 5l+i w ■2-z , (10.28) X - Xi Xt+i - X,-
Д. 10.2. Интерполирование сплайнами 343 которые имеют первый порядок точности. При равноотстоящих узлах с шагом h = ж»+1 — ж,-, i = 1, n — 1, целесообразно использовать формулы второго порядка точности с центральной разностью Si "w а на концах отрезка — 2Л и п Во втором способе, называемом глобальным, значения «,-,. t = 2, n-1, определяют из условия непрерывности в узлах х,- второй производной 5з(х) сплайна 5з(х), что дает Am = = 1. Именно с этим способом связано возникновение термина „сплайн" (spline), что в переводе с английского означает гибкую линейку, используемую как лекало для проведения гладкой кривой через фиксированные точки (рис. 10.7). Из курса сопротивления материалов известно, что условие непрерывности второй производной функции прогиба упругой линейки с промежуточными опорами как раз и соответствует ее равновесию. Таким образом, интерполяционный кубический сплайн с непрерывной второй производной является математической моделью гибкой линейки, проходящей через фиксированные точки. Рис. 10.7
344 10. ИНТЕРПОЛИРОВАНИЕ Используя (10.27), из условия #31-1(ж«) = * == = 2, п— 1, получаем систему п — 2 линейных алгебраических уравнений + 2st 4- Н - «i-i \ «i - «i-i «i+i - «t / «t+1 - «t ТГ-.:—То+З-г- -^, г = 2,п-1, (10.30) содержащую п неизвестных st, i = 1, п. Для однозначного определения неизвестных необходимо задать два дополнительных условия, накладываемых на сплайн на концах отрезка [а, Ь]. Рассмотрим некоторые варианты. 1. Если на концах [а, 6] известны значения /'(а) и /'(б), то, полагая в (10.30) si = /'(o) и sn = /'(6), получаем систему п — 2 линейных алгебраических уравнений с трехдиагональной матрицей, легко решаемую методом прогонки. Построенный таким образом сплайн называют фундаментальным кубическим сплайном. 2. Неизвестные s\ и sn можно определить приближенно из (10.28) или (10.29) и затем решить систему (10.30) относительно остальных неизвестных s,-, г = 2, п — 1. 3. Если }{х) — периодическая функция с периодом Ь — а, то из условий $з(а) = ^з(^) и &%(а) = ^з(^) следуют два уравнения 2 + +2 Уп-Уп-\ И 1 которые дополняют систему (10.30), но матрица итоговой системы уже не будет трехдиагональной. 4. При известных на концах отрезка [а, 6] значениях f"(a) и /"(6), полагая SJ(a) = Я£,(х,) =/"(«О ■ ЭДЬ) = = #3,n--i(«n) = ^"W» ПОЛУЧИМ с Учетом (10.27) два дополнительных уравнения 451+252 = (6(2/2 - УО " /"(а)(«2 " «l))(«2 - «l),
Д. 10.2. Интерполирование сплайнами 345 которые вместе с уравнениями (10.30) образуют систему п уравнений с трехдиагональной матрицей. 5. Если при отсутствии дополнительной информации положить в (10.31) f"(a) = /"(6) = 0, то построенный таким образом сплайн называют естественным кубическим сплайном. 6. При отсутствии дополнительной информации можно использовать на частичных отрезках [х\, х2] и [жп-ь хп] интерполяционные многочлены второй степени с постоянными значениями второй производной, равными значениям #3,2(^2) и Hgn^Xn-i) соответственно, или потребовать в узлах хг и xn_i непрерывности третьей производной, т.е. наложить условия Н™\(хг) = Нъ[г(хг) и нз!п- Каждый из этих способов даст два линейных алгебраических уравнения, дополняющих систему (10.30), но матрица итоговой системы не будет трехдиагональной. Пример. Найдем наклоны естественного кубического сплайна в узлах интерполяции для данных примера 10.1 (п = 5). Из (10.30) и (10.31) (при f"(a) = }"{Ь) = 0) получим систему линейных алгебраических уравнений + s2 = 0,960, 10si + 3052 + 55з =14,025, 552 + 2053+ 5s4 = 8,475, 553.+ 3054 + Ю55 = 11,550, 54 + 2s5= 0,750 с трехдиагональной матрицей. Решение системы методом прогонки дает 5! =0,324; 52 = 0,313; s3 = 0,282; 54 = 0,255; 55 = 0,248. При х* = 1,15 6 [х2, хз] из (10.27) для г = 2 с использованием значений у2 = 1,032, 52 = 0,313, уз = 1,091 и 53 = 0,282 найдем
346 10. ИНТЕРПОЛИРОВАНИЕ у* « #з,2(1Д5) = 1,048, что совпадает с результатом в примере 10.1. # Поведение на отрезке [а, 6] интерполяционных многочленов Лагранжа и Ньютона сильно зависит от локальных особенностей интерполируемой функции и может привести к существенной погрешности при интерполяции, поскольку ошибка в задании значения функции в каком-либо узле распространяется на весь отрезок. При интерполировании сплайнами ошибка локализуется в окрестности узла и поэтому приемлемую точность можно получить даже при сравнительно редко расположенных узлах. Эта особенность сплайнов важна при интерполяции функций, значения которых получены путем измерения с ограниченной точностью и могут содержать случайные ошибки. Вопросы и задачи 10.1. По данным примера 10.4 вычислить приближенные значения второй производной по формулам второго порядка точности и найти погрешность вычислений. 10.2. Методом Рунге вывести приближенную формулу четвертого порядка точности для первой производной. 10.3. Построить интерполяционный многочлен для функции f(x) при условиях /(-1) = /(0) = /(1) = /"(-1) = /"(0) = = 0. 10.4. Вывести приближенные формулы для третьей и четвертой производных в среднем узле, используя значения функции в пяти узлах. 10.5. Построить естественный кубический сплайн для функции f(x), заданной таблично: X 0,2 1,2214 0,24 1,2712 0,27 1,3100 0,30 1,3499 0,32 1,3771 0,38 1,4623
Вопросы и задачи 347 Найти в узлах приближенные значения f'(x) и сравнить их с вычисленными; при помощи разделенных разностей. Сравнить значения /(0,29), найденные при помощи кубического сплайна и интерполяционных многочленов Лагранжа и Ньютона. 10.6. По данным примера 10.4 методом Рунге уточнить значения производной в узлах ж = 0 и ж = 0,6. 10.7. Доказать справедливость формул численного дифференцирования: a) t/i = ~Ут + 8Vi+!~ 8У<"Х + У'-2 + O(h*); б) у;+1/2= в) , = t+i - 20yt ч ,/// _ У»+з + 6t/H2 12yt.n + 10y, 3yt_i 2 e) Vi - 2/i3 + l h
11. РЕШЕНИЕ НЕЛИНЕЙНЫХ УРАВНЕНИЙ 11.1. Постановка задачи Необходимость решения нелинейного уравнения вида = 0 (11.1) с одним неизвестным х часто возникает в научных исследованиях и технических приложениях. В частности, „подозрительные" на экстремум стационарные точки функции д(х) следует искать из условия д'(х) = f(x) = 0. В общем случае задача состоит в поиске таких значений х*, подстановка которых п (11.1) приводила бы к тождеству /(ж*) = 0. Эти значения называют корнями (или решениями) уравнения (11.1). По общей классификации задач вычислительной математики поиск корней (11.1) можо отнести к обратной задаче. В самом деле, пусть функция у = f(x) осуществляет отображение X множества X С R на множество Y С R. Тогда задача состоит в построении (если это возможно) обратной к f(x) функции x = f~l(y), которая осуществляет обратное отображение f~l : Y -* X, и нахождении образа х* = /-1(0) £ X, соответствующего его прообразу у = 0 (при условии, что Y содержит элемент у = 0). Известно, что действительная функция f(x) одного действительного переменного х в некотором промежутке своей области определения имеет обратную функцию, если она в этом промежутке строго монотонна [I, 9.4]. Если в этом случае обратная функция определена в точке у = 0 и может быть
11.1. Постановка задачи 349 задана аналитически, то говорят, что задача имеет точное аналитическое решение. Однако в общем случае возможность аналитического решения задачи отсутствует. Кроме того, числовые коэффициенты в (11.1) часто известны лишь приближенно, и поэтому поиск точного аналитического решения не всегда оправдан. В связи с этим важное значение приобретают методы приближенного численного решения (11.1) и способы оценки точности полученных результатов. Можно выделить два этапа численного решения (11.1): 1) отделение (или локализация) корней, т.е. установление возможно меньших по длине отрезков [at, bt] локализации корня, на каждом из которых лежит одно и только одно значение х* € (а,-, &,), обращающее (11.1) в тождество, причем это значение может быть как простым корнем (кратности г = 1), так и кратным корнем (кратности г > 1, г € N); 2) уточнение значений локализованных корней и оценка точности найденных значений. В силу теоремы 9.2 [I] (первой теоремы Больцано — Коши), если непрерывная на отрезке [а,-, 6,-] функция f(x) принимает на его концах значения разных знаков, то на этом отрезке существует по крайней мере один корень уравнения (11.1). Если к тому же на этом отрезке f(x) строго монотонна, то этот корень единственный. Для дифференцируемой в интервале (а,, 6,) функции f(x) условие ее строгой монотонности равносильно знакопостоянству производной }'(х) в этом интервале, причем f'(x) в (а,, &,) может обращаться в нуль лишь в конечном числе точек (см. 8.1). Искомый корень может соответствовать точке перегиба и быть нечетной кратности 2n+l, n€ N (рис. 11.1,а), если по крайней мере для 2п+1 раз дифференцируемой функции f(x) при к = О, 2п f^(x*) = О, a /(2n+1)(s*) ф 0. Помимо этого при отделении корней следует иметь в виду случаи, когда функция f(x) обращается в нуль в некоторой точке xq ее экстремума и имеет корень четной кратности 2m, m£N (тогда /М(жо)=0 при k = 0, 2m-1 и /(2m)(zo) ф 0) (рис. 11.1,5), а также случаи точек излома
350 11. РЕШЕНИЕ НЕЛИНЕЙНЫХ УРАВНЕНИЙ или заострения графика функции, если функция f(x) в точке х0 недифференцируема (рис. 11.1, в). Для выявления всех этих случаев необходимо проанализировать критические точки функции f{x). в Рис. 11.1 Таким образом, вся необходимая информация для проведения этапа отделения корней (11.1) может быть в общем случае получена при исследовании функции f{x) и построении ее графика и графиков ее первых двух производных (см. 8.8). Несколько особое место занимают случаи, когда f(x) является многочленом. 11.2. Нули многочленов Если в (11.1) функция f(x) является многочленом степени п, то говорят о нахождении нулей этого многочлена, или о решении алгебраического уравнения соответствующей степени (о нахождении его корней). Далее будем рассматривать
11.2. Нули многочленов 351 многочлены, коэффициенты которых являются действительными числами. Из основной теоремы алгебры и теоремы 4.3 [I] следует, что многочлен степени п имеет с учетом кратности п нулей в множестве комплексных чисел. Действительное число с является т-кратным нулем многочлена }(х) тогда и только тогда, когда первым ненулевым слагаемым его представления многочленом Тейлора по степеням х — с будет /(m)(c)(z-c)m/m!, т.е. когда /(с) = 0 и /W(c)=0 при k = I, m- 1, а }(т\с)фЪ. Нуль кратности т>\ многочлена является нулем кратности т — 1 его производной. Многочлен f(x) имеет кратные нули, если существует многочлен /г(х), на который без остатка можно разделить и сам многочлен f(x) и его производную f'(x). При этом h(x) называют общим делителем многочленов f(x) и f'(x). Наибольшим общим делителем (НОД) многочленов называют такой их общий делитель, который без остатка можно разделить на все другие общие делители этих многочленов. Если НОД двух многочленов имеет нулевую степень, то такие многочлены называют взаимно простыми (они не имеют общих нулей). Пусть h\(x) — многочлен выше нулевой степени и является НОД многочлена f(x) и его производной }'(х). Тогда многочлен vi(x) = f(x)/hi(x) имеет те же нули, что и /(ж), но только простые. Это позволяет найти все нули f(x) из решения уравнения v\ (x) = 0, более простого по сравнению с уравнением f(x) = 0, а затем установить их кратность. Пусть h,2{x) — НОД многочленов hi(x) и Н[(х), Лз(я) — НОД /12(2) и h'2(x) и так далее до многочлена hs(x) нулевой степени. Тогда V2(x) = h\(x)/h,2(x), vz(x) = h,2{x) / п$(х), ... вплоть до v3(x) = hs-\(x)/hs(x). Составим уравнения -0 v(x)-0 Все корни этих уравнений простые, причем корнями первого из них являются все простые нули многочлена f(x) (и только
352 И. РЕШЕНИЕ НЕЛИНЕЙНЫХ УРАВНЕНИЙ они), корнями второго— все двукратные нули /(ж), корнями последнего — все нули f(x) кратности s (нулей кратности выше s многочлен f(x) не имеет). Пример 11.1. Для многочлена /(s) = ж5 + 6s4 + 13s3 -f + 14s2 + 12s + 8 производная f'(x) = 5s4+24s3+39s2+28s+12. Для нахождения НОД f(x) и f'(x) используем алгоритм Евклида: разделим f(x) на /'(s); если остаток равен нулю, то f'(x) и является НОД; в противном случае f'(x) делим на остаток, затем первый остаток на второй и так далее до получения остатка, равного нулю — тогда последний не равный нулю остаток будет НОД; если остаток является числом (многочленом нулевой степени), то принимают НОД = 1 и исходные многочлены будут взаимно простыми. При делении любой из многочленов можно умножать на число, не равное нулю. Поэтому НОД находят с точностью до постоянного множителя и обычно записывают так, чтобы коэффициент при его старшей степени был равен 1. Итак, при делении „уголком" 5s5+30s4 + 65s3 + 70s2 + 60s + 40 5s5+24s4 + 39s3 + 28a2 + 12а: 6ж4+ 26s3+ 42s2 4- 48ar-h 40 30s4+130я3 +210z2 +240s +200 30ж4+144ж3+234з;2+168:с+ 72 - 14ж3- 24ж2+ 72ж+128 70ж4+336а;3+ 546z2+ 392s + 168 70а4+120а3- 360s2- 640s 216s3 + 906s2 4- 1032s + 168 1512s3 +6342s2+ 7224s+ 1176 1512s3-H2592s2- 7776s-13824 3750s2+15000S+15000 s2+ 4s-f 4 5s44-24s3+39s2+28s+12 s +6 14s3 + 24s2 -72s -128 5s | 108
11.3. Точные решения алгебраических уравнений 353 14ж3+24ж2- 72ж-128 14ж3+56ж2 + 56ж -32ж2-128ж-128 -32ж2-128ж-128 14* - 32 Таким образом, для /(ж) и /'(ж) НОД Мж) = Аналогично получаем для /ii(ar) и /^(ж) НОД h,2(x) а для Л2(ж) и Л'2(ж) НОД Лз(ж) = 1. Затем находим Из уравнения следует, что многочлен /(ж) имеет простые нули, являющиеся чисто мнимыми числами ±t, из отношения иг(ж)/1;з(^) = 1 что не имеет двукратных нулей, а из уравнения юз{х) = х + 2 = = 0 — что имеет трехкратный действительный нуль, равный — I. Непосредственной проверкой устанавливаем, что /(ж) = (ж2 + 1) (ж + 2)3 = ж5 + 6ж4 + 13ж3 + 14ж2 + 12ж + 8. 11.3. Точные решения алгебраических уравнений Известно, что точные решения уравнений второй,третьей и четвертой степеней могут быть выражены в виде аналитиче- ской зависимости от коэффициентов уравнении Пусть сначала в (11.1) /(ж) = Р2(х) = аох2 Ф 0, т.е. функция /(ж) — многочлен второй степени, или квадратный трехчлен. Выделяя полный квадрат 23-544
354 П. РЕШЕНИЕ НЕЛИНЕЙНЫХ УРАВНЕНИЙ и подставляя f(x) в (11.1), имеем 4о0 Отсюда следует известное из школьного курса математики решение квадратного уравнения (11.2) Квадратный трехчлен имеет экстремум в точке, где производная f'(x) = 2aox + ai =0, или x = -oi/(2ao). Из (11.2) следует, что нули квадратного трехчлена совпадают с точкой его экстремума, если Di = oj - 4aofl2 = 0 (Л2 называют дискри- минантом квадратного трехчлена). В этом случае оба корня действительные и равные, т.е. имеют кратность 2. При /)2 > 0 корни действительные и различные, а при Z?2 < 0 — комплексно сопряженные (в частном случае а\ = 0 — чисто жнилсые). Пусть теперь в (11.1) f(x) = Рз(х) = аох3 + а\х2 + п2Х + а$, uq ф 0. В этом случае уравнение (11.1) называют кубическим и оно имеет три корня. Для Рз(з) запишем разложение по степеням х — с в виде ft (ж) = М* - c)3 + &i(:r - c)2 + &2(s - с) + &з, трижды используя для нахождения коэффициентов cze.uy Гор- нера с учетом формулы =l, m, где m принимает значения 3, 2 и 1: во с Ьо = ао Ьо = ао Ьо = по ах ai+aoc ai+2aoc b\ = a\ -f*3floc a2 «2 + (ai + aoc)c Ь2 = 02 + (2ui + 30qC) С оз Ьз = оз4-(о2 + + (ai+aoc)c)c
11.3. Точные решения алгебраических уравнении 355 Из условия &i = 0 найдем с = — ai/(3oo). Тогда в разложении Рз(ж) будет отсутствовать слагаемое с квадратом разности х — с. Подставляя в (11.1) вместо f(x) разложение Рз(х) и обозначая х — с = х + п\ /(Зао) = у, после деления на получим неполное кубическое уравнение 0, (11.3) где _ Заоаг — в? _ 2a3 - 9aoai02 + 27ajjO3 Р= (За)2 ' Я~ ^5 При р = 0 корнями (11.3) являются все значения у = = y/-2q (из них одно действительное, а два — комплексно сопряженные), а при q = 0 у\ = 0 и t/2,3 = ±л/~3р- Если и р^О и д^О, то примем в (11.3) у = и-р/и и получим (it3)2 + 2qu3 - р3 = 0. Отсюда u3 = -q ± y/q2+]P и 2/= y- Избавляясь при помощи множителя у — g qp *Jq2-\-p* от иррациональности в знаменателе и учитывая, что получающиеся слагаемые симметричны относительно знаков ± и ^, запишем решение (11.3) в виде J/ (П.4) известном как формула Кардано (итальянский математик, философ и врач Дж. Кардано (1501-1576) опубликовал ее в 1545 г., упомянув об авторстве итальянского математика Н. Тартальи (1499-1557), получившего решение (11.3) в некоторых частных случаях). Стационарные точки многочлена g(y) = t/3 + 3pt/ + 2g, стоящего в левой части (11.3), удовлетворяют условию д'{у) = = Зу2 4- Зр = 0. В этих точках вторая производная д"(у) = 6у ф 0 23*
356 11. РЕШЕНИЕ НЕЛИНЕЙНЫХ УРАВНЕНИЙ при р ф 0. Поэтому точки у = ±у/^р являются точками экстремума функции д(у). Выясним условие совпадения нулей многочленов д(у) и д'(у) при и р^О и д^О, т.е. условие, при котором корни (11.3) будут кратными. Для этого найдем наибольший общий делитель (НОД) этих многочленов, используя алгоритм Евклида (см. пример 11.1). При делении „уголком" У3+ РУ У РУ' +Pd У ' РУ* +ЯУ ру+я У ру+я РУ~Р3/Я ру-р3/я 1 2ру+2я получим, что многочлен у - р2/я будет искомым НОД, если q + p*/q = 0, или D3 = q2 + р3 - 0. Тогда нуль p2/q НОД y — p2/q будет двукратным корнем (11.3), так как деление по схеме Горнера д(у) дважды на НОД при q2 + р3 = 0 с учетом соотношений 6* = а* + fyfe-ic (к = 1, 2, 3) и с* = 6& + Ck-ic ао=1 6о=ао=:1 Со=&о=1 oi=0 6|= р /Я b\—2p IQ а2=3р Ь2=3р+ р4/я2=2р с2=2р+2р4/я2=0 аз=2я Ь3=2я+ +2р3/я=0 приводит к разложению д(у) = (y-p2/q)2(y-\-2p2/q). Итак, при D3 = 0 имеем для (11.3) двукратный корень у\}2 = р2/я = — ^/р и простой корень уз = -2p2/q = 2q/p. Если D3 < 0, то все три корня (11.3) также действительные, но простые и их можно найти по формулам Ук = \/b| cos к = 1, 2, 3, где В случае D3 > 0 два корня комплексно сопряженные и один действительный: -1Г-» Уз = и + и),
11.3. Точные решения алгебраических уравнении 357 где z = л/^Т — мнимая единица, а и и w — действительные значения кубических корней в (11.4). Ясно, что если yk (k = = 1, 2, 3) — корни (11.3), то корнями уравнения Рз(я) = О будут xk = yk-ai/(Sa0). Частный случай уравнения Рз(х) = О при аз = ао и а2 = = а\ называют возвратным кубическим уравнением. Один его корень х\ = — 1, а два других — корни квадратного уравнения oqx2 + (ai - uq)x + do = 0, левая часть которого будет частным от деления многочлена aoz3-|-ai:c2-fais-bao на ж + 1. В случае аз = —ао и аг = —ai &i = 1, а два других — корни уравнения aos2 + (ai + ао)ж + а0 = 0. Если в (11.1) f(x) = Р4(х) = аох4 +а\х3+ п2Х2+ азх+ п4, а0 ф 0, то имеем алгебраическое уравнение четвертой степени с четырьмя корнями. Запишем для Р<\(х) разложение по степеням х — с в виде РА(х) = ао(х - с)4 + Ьх(х - с)3 + Ь2(х - с)2 + Ь3(х - с) + 64, четырежды применяя для нахождения коэффициентов bi = а\ + 4аос, 62 = <*2 + (3ai + 6аос)с, 63 = «з + (2а2 + (3ai + 4аос)с)с, 64 = ^4+ ^а3 + (а2 + (ai + аос)с)с\с схему Горнера (аналогично случаю с Рз(х)). Ясно, что при с=—ai/(4ao) &i = 0 и в разложении Ра(х) отсутствует слагаемое с (х-с)3. Обозначая х-с = х + а\/(4ао) = у и подставляя в (11.1) вместо f(x) разложение Р*{х), после деления на ао получаем у4 + 2ру2 + 2qy + г = 0, (11.5) где 16aoa2 — 5af _ 8а§аз — 4aoai02 -f a3 _ o2 f _ Р= Щ ' Я= г =
358 11. РЕШЕНИЕ НЕЛИНЕЙНЫХ УРАВНЕНИЙ При q = О из (11.5) получим биквадратное уравнение с корнями /V-r. (П.6) Если и «7 = 0 и р = 0, то корнями (11.5) являются все значения tf^-r. В случае г = 0 t/i = 0, а остальные три корня можно найти из решения неполного кубического уравнения у3 + 2ру + Метод решения (11.5) в общем случае был найден итальянским математиком Л. Феррари (1522-1565) и опубликован в 1545 г. его учителем Дж. Кардано. Если ввести вспомогательный параметр t, то (11.5) можно записать в виде (У2 +Р + *)2 = 21У2 - 2ЯУ + *2 + 2# + Р2 - г, (П-7) Правая часть (11.7) представляет собой квадратный трехчлен относительно у. Для преобразования его в полный квадрат параметр t следует выбрать из условия равенства нулю дискриминанта этого трехчлена, т.е. q2 - 2t(t2 + 2pt + p2 - г) = 0. Отсюда получим так называемую кубическую резольвенту 2t3 + Apt2 + (р2 - r)t - q2 = 0 уравнения (11.5), имеющую хотя бы один действительный корень. Обозначим его t\. Тогда (11.7) примет вид что дает два квадратных уравнения четыре корня которых будут корнями (11.5). Л. Эйлер выразил эти корни через все три корня ti, ti и *з кубической резольвенты: У1,2= ^ , У3,4= ^ . (11.8)
11.3. Точные решения алгебраических уравнении 359 Знаки y/ii, y/bi и >Дз выбирают так, чтобы \ft\\fhyfh = = -q/y/2. Ясно, что если у* (к = 1, 4) — корни (11.5), то корнями уравнения Ра{х) = 0 будут ж* = у* - ai/(4ao). Пример 11.2. Найдем нули многочлена Ра(х) = х4-4ж3 + + 7ж2 - 2х - 5. В этом случае с = -ai/(4ao) = 1, и, заменяя х - 1 = у, получаем для определения нулей Ра(х) уравнение вида (11.5) т.е. р = 1/2, g = 2 и г = -3. Кубическая резольвента этого уравнения имеет вид 4*3 -f it2 + Ш - 8 = 0; один из ее корней = 1/2. Тогда для квадратных уравнений у + = 0 и корнями будут V 2/1,2 = 2 и а нулями многочлена Ра{х) — „Л 3dbtyTT У+1 И Ж3,4 = 1/3,4 + 1 = Чтобы найти все корни кубической резольвенты, разделим многочлен в ее левой части на t - t\ и получим квадратное уравнение 2t2 + St + 8 = 0 с комплексно сопряжеными корнями )з= (-3±\/-55)/4. Если использовать формулу y/2{a±Vb) = \/a+ \/a2 - b± \] a - y/a2 -6, то в данном случае имеем a = -3/8 и 6 = -55/64, а = (\/5±г\/ГТ)/\/8. Для выполнения условия = -q/y/2'= -\/2 можно взять V^7= -l/\/2. Тогда из (11.8) следуют значения t/i(2 и г/з,4? совпадающие с полученными выше. #
360 11. РЕШЕНИЕ НЕЛИНЕЙНЫХ УРАВНЕНИЙ Уравнение степени выше четвертой в общем случае не разрешимо в радикалах, т.е. его корни не удается выразить через его коэффициенты при помощи действий сложения, вычитания, умножения, деления и извлечения корней [I, 4.4]. 11.4. Отделение корней алгебраических уравнений Точное решение алгебраических уравнений третьей и четвертой степеней громоздко. В прикладных задачах числовые значения коэффициентов многочленов в левой части этих уравнений известны обычно приближенно, и находить точные значения корней этих уравнений часто не целесообразно. Алгебраическое уравнение степени выше четвертой в общем случае не имеет точного аналитического решения. Поэтому на практике алгебраические уравнения третьей и выше степени решают численно. В связи с этим важным становится первый этап численного решения таких уравнений — отделение корней. Ограничимся рассмотрением действительных корней алгебраических уравнений с действительными коэффициентами, т.е. действительных нулей соответствующих многочленов. Пусть для многочлена Рп(х) = аохп + aixn~l +... + an_i x + an степени п ао/0 и ап^0. Если ап = 0, то алгебраическое уравнение = 0 (11.9) имеет корень х* = 0 и степень (11.9) можно понизить. Обозначим a = max{|a1|, |a2|,..., \an\} и 6 = max{|ao|, Тогда справедлива следующая теорема.
11.4. Отделение корней алгебраических уравнений 361 Теорема 11.1. Любой действительный корень х* (11.9) (если он вообще существует) удовлетворяет неравенству <l+ " (11.10) n| \ao\ Л При |ж| > 1 с учетом неравенства (1.4) и формулы (1.8) [I] для суммы членов геометрической прогрессии n~l + + ax + a a\x a x|n \x\-l \x\-l С учетом того же неравенства (1.4) <to|' \х\п = |aoxn| = \Рп(х) - 1 п Наличие действительного корня х* соответствует условию |Рп(х*)| = 0, или Сокращая на |х*|п и умножая на |х*| - 1, имеем |ао| • |х*| — — \uq\ — а < 0, т.е. верхняя граница для абсолютного значения действительного корня: |х*| < 1 + a/|ao|. Уравнение /1\ a0 a\ an_i рп I ~ I = — + -ггг + • • • + + «п = 0, \zj zn zn * z или anzn + an-\zn~l + ... + a\z + ao = 0, имеет корнями числа z*, обратные значениям корней (11.9). Поэтому \z*\ = 1/|х*|. Но по аналогии с доказанным выше \z*\ < Ц-6/|оп|, откуда нижняя граница для абсолютного значения действительного корня: \х*\ > |ап|/(& + |ап|). ►
362 Л. РЕШЕНИЕ НЕЛИНЕЙНЫХ УРАВНЕНИЙ Пусть А — наибольшее из абсолютных значений отрицательных коэффициентов многочлена Рп(х). Тогда верхнюю границу положительных корней (11.9) устанавливает следующая теорема. Теорема 11.2. Бели в многочлене Рп(х) по > О, а* ^ О при к = 1,111—1 и ат < О (т < п), то для любого положительного корня (11.9) < Заменим неотрицательные коэффициенты а& (к=1, т- I) многочлена нулями, а все последующие — на -А. Тогда при х > 1 с учетом формулы (1.8) [I] для суммы членов геометрической прогрессии P t*\ *> ялтп — Л(тп ~т = аохп - А ■ > аохп - А X 1 > аох А X — 1 X — 1 ) £ ( Если х > 1 + (Л/ао)1/т, то Значит, при х ^ 1 + (А/аъ)11т Рп(х) > 0, т.е. Рп{х) может обратиться в нуль лишь при х* < 1 + (А/ао)1/т. ► Ясно, что в отсутствие у многочлена Рп(х) отрицательных коэффициентов уравнение (11.9) не имеет положительных корней. Бели в (11.9) оо < 0, то следует рассмотреть уравнение —Рп(х) = 0, имеющее те же корни, что и (11.9).
11.4. Отделение корней алгебраических уравнении 363 Иногда верхнюю границу (11.11) удается улучшить, т.е. понизить путем записи многочлена в виде где у каждого многочлена Ft(x) (i = I, s) коэффициент при старшей степени положителен и в ряду коэфициентов знак изменяется не более одного раза. Бели найдено положительное число а, такое, что F,(a) > 0, i = 1, s, то /*}(х) > 0 при О <*. Действительно, если Fi(x) = а»ожП| + ацхп*~1 + ... + п{пп причем aij ^ 0 при 1 ^ j < m, и a,j < 0 при j ^ ш,- + 1, то функция монотонно возрастает и, следовательно, положительна при х > а. Поэтому Рп(я) > 0 при ж > а и любой из корней (11.9) х* < а. Более громоздок способ, предложенный Ньютоном: если Рп (/?)>0 при Р>1 и fc = 0, Ti-l, то любой из корней (11.9) х* < /3. Действительно, из представления Рп{х) многочленом Тейлора (учитывая, что при ао > 0 Рп (х) — п\ао > 0) получим, что при х^/3 Рп(ж)>0 и у (11.9) при х^0 нет действительных корней. Подбор /? проще начинать с выполнения условия Рп (Р) > 0, понижая затем порядок производной вплоть до выполнения условия Рп(Р) > 0 и увеличивая при необходимости /?. Верхняя граница положительных корней (11.9) применима для оценки их нижней границы, если взять уравнение Pn(l/z) = = 0 и учесть, что x* = l/z*. Она применима и для оценки границ отрицательных корней (11.9), если взять уравнения
364 II. РЕШЕНИЕ НЕЛИНЕЙНЫХ УРАВНЕНИЙ Рп(-<ы) = 0 и Pn(—l/v) = О и учесть, что ж* = -и* и х* = —1/и* соответственно. Пример 11.3. Пусть дан многочлен — ж4Н-4ж3-7х2 + 2z-f- + 5. Изменив знаки коэффициентов, запишем Р^х) = х4 — 4х3+ + 7х2-2х-Ь. Тогда а = 6 = 7, Л = 5, т = \ и, согласно (11.10), 5/12 < |х*| < 8, а в силу (11.11) х* <6. Найдем Р'А(х) = 4я3 - \2х2 + 14ж - 2, Р^'(х) = 12х2 - 24х + 14 и РЦ'(х) = 24а: - 24. При х > 1 все производные положительны, но Р^х) < 0. Подбором находим, что Р<|(2) = 3 > 0. Таким образом, по способу Ньютона х* < 2. Рассмотрим многочлен P^X/z), или R{z) = 5>г4 + 2^3 - — 72г2+4-г: —1. В этом случае а = 6 = 7, Л = 7 и т = 2. Согласно (11.10), 1/8 < \z*\ < 12/5, т.е. найденные выше границы для |х*| = l/|z*|. В силу (11.11) z* < 1 + ^/7/5, и, учитывая, что г* = 1/ж*, находим нижнюю границу положительных корней х* > 1/(1 -f у/Т/Ь). Вычислим Rf(z) = 20z3 + 6z2 - 14z + 4, #"(*) = 60^2 -I-12* - 14 и "' = 120^+12. При 2^1 все производные и R(z) положительны, т.е. по способу Ньютона будем иметь нижнюю границу 1 < я*. Итак, наиболее узкие границы 1 < х* < 2 для положительных корней (11.9) получены по способу Ньютона. Для оценки границ отрицательных корней (11.9) рассмотрим уравнения Р4(-^) = 0 и -l/v) = 0, которые приведем соответственно к виду -5=0 и V(t7.)=5v4-2i;3-7t72-4t;-l=0. В первом случае а = 6 = 7, А = Ь и т = 4, а во втором — а — = 6 = Л = 7 и т= 1. Ясно, что (11.10) даст для |ж*| найденные выше границы. В силу (11.11) и* <1 + у/Ъ и и* < 12/5. Учитывая, что и* = 1/и* = -х*) получаем -1 - у/Ъ < х* < -5/12.
11.4. Отделение корней алгебраических уравнений 365 Найдем U'(и) = 4и3 + Пи2 + 14и + 2, U" (и) = \2и2 + 24и + 14, U"'{и) = 24u -I-24 и K'(v) = 20v3 - 6v2 - 14и - 4, У' 2 - 12v - 14, V"» = 120v - 12. При u^l многочлен U(u) и все его производные положительны, т.е. и*<\. При Ol V"'(v)>0 и V"»>0, но К'(1)<0. При t; > 2 и V'(v) > 0 и К(и) > 0, т.е. v* < 2. Итак, наиболее узкие границы -1 < х* < -1/2 для отрицательных корней уравнения х4 - 4х3 + 7ж2 - 2х - 5 = 0 также найдены по способу Ньютона. В итоге действительные корни этого уравнения (при условии, что они существуют) х*€(-1;-0,5)П(1;2). В данном случае (см. пример 11.2) существуют два действительных корня со значениями хз,4 = (1 dh л/5)/2, или хз« 1,618 и х4« -0,618. # Кроме границ значений действительных корней алгебраического уравнения (если они существуют) важно знать число таких корней. Поскольку комплексные нули многочлена с действительными коэффициентами попарно комплексно сопряжены [I, 4.4], то число его действительных нулей (с учетом их кратности) всегда имеет ту же четность, что и его степень п. Если п нечетно, то (11.9) имеет хотя бы один действительный корень. Многочлен Рп(х) непрерывен на всей числовой прямой [I, 9.5]. Поэтому если Рп(а)Рп(Ь) < 0 при а < 6, то в силу теоремы 9.2 (первой теоремы Больцано — Коши) [I] на отрезке [а, 6] лежит хотя бы один действительный корень (11.9), a
366 П. РЕШЕНИЕ НЕЛИНЕЙНЫХ УРАВНЕНИЙ общее число корней на [а, 6], принимая во внимание их кратность, нечетно. Если Рп(а)Рп(Ь) > О, то на [а, 6] нет корней либо их четное число. Число положительных корней (с учетом их кратности) (11.9) устанавливает теорема Декарта: оно равно числу перемен знака в ряду коэффициентов многочлена Pn(s) либо на четное число меньше. Эта теорема позволяет найти точное число положительных корней, если нет перемен знака или есть лишь одна перемена знака. Бели перемен знака больше одной, то для определения точного числа положительных корней нужно, кроме того, учесть знаки многочлена в отдельных точках и особенности его графика в промежутках между установленными границами действительных корней. Число отрицательных корней (11.9) равно числу положительных корней уравнения Пример. У многочлена Ра(х) = х4 — 2я3 — 2х + 1 две перемены знака в ряду коэффициентов, т.е. уравнение Ра(х) = О имеет 2 или 0 положительных корней. Поскольку Р<|(0) = = 1 > 0 и Р<|(1) = -2 < 0, на отрезке [0, 1] лежит хотя бы один корень, т.е. число положительных корней равно 2. Многочлен Р4(-ж) = х4 + 2х3 + 2ж + 1 не имеет перемен знака. Поэтому у уравнения Р4(х) = 0 не будет отрицательных корней. # Если известно, что все корни (11.9) действительные (например, действительны все нули характеристического многочлена симметрической матрицы), то теорема Декарта имеет усиление: число положительных корней точно равно числу перемен знака в ряду коэффициентов многочлена Рп(я), а число отрицательных — числу перемен знака в ряду коэффициентов многочлена Рп(—х). Кроме того, число корней (11.9), больших числа с, равно числу перемен знака в ряду значений Рп(с), Р'п(с),..., Р^п'(с) (или на четное число меньше, если не все корни уравнения действительны). Пусть многочлены Рп(х) и Р'п(х) являются взаимно простыми. Тогда (11.9) не имеет кратных корней (см. 11.2).
11.4. Отделение корней алгебраических уравнений367 Обозначим /(з) = Рп(ж), f\(x) = /'(ж), /г(х) — остаток от деления f(x) на /i(z), взятый с обратным знаком, и так далее пока не получим в остатке число, которое также возьмем с обратным знаком, обозначив его /п (при делении многочлены можно умножать на любое положительное число). Для значений ж = а и х = 6 при условиях a<b и /(а)/(Ь)^0 составим две последовательности значений Тогда по установленному французским математиком Ш. Штурмом (1803-1855) правилу число действительных корней на отрезке [а, 6] равно разности чисел перемены знака в первой и второй последовательностях. Бели (11.9) имеет кратные корни, то предварительно следует найти наибольший общий делитель h(x) многочленов Рп(х) и Р*п(х) и применить правило Штурма сначала к уравнению Pn(x)/h(x) = 0 с простыми корнями, потом исследовать корни уравнения h(x) = 0, а затем объединить результаты. Пример 11.4. Отделим действительные корни х* кубического уравнения х3 + За;2 -1 = 0. Сначала найдем их границы. Согласно (11.10) и (11.11), 1/4 < |ж*| < 4 и хт < 2. Многочлен f(x) = х3 + Зя2 - 1 и его производные f'(x) = Зя2 + 6ж и f"(x) = 6х + 6 положительны при х > 1. Таким образом, по способу Ньютона х* < 1. Полагая х = 1/z, от f(x) перейдем к многочлену R(z) = = z3 - 3z - 1, для которого в силу (11.11) z* < 1 + \/3, т.е. х* > 1/(1 + уД). Найдем R'(z) = 3z2 - 3 и R"(z) = 6z. При х > 2 Я(г) и его производные положительны, т.е. по способу Ньютона z* < 2, или х* > 1/2. Для оценки границ отрицательных значений х* рассмотрим уравнения f{-u) = 0 и /(-1/и) = 0, которые приведем к виду U{u) = u3 - Zu2 + 1 = 0 и V(v) = v3 — 3v+1 = 0 соответственно. Согласно (11.11), и* < 4 и v* < 1 + \/3» т.е. с учетом и* = 1/v* = -ж* имеем — 4 < х* <
368 11. РЕШЕНИЕ НЕЛИНЕЙНЫХ УРАВНЕНИЙ + %/3). Найдем = 3u2-6u, U"(u) = 6u-6 и V'(v) = 3v2-3, V При it ^ 3 многочлен U(u) и его производные положительны, а при v ^ 2 положительны многочлен V(v) и его производные. Таким образом, по способу Ньютона it* < 3 и и* < 2, или -3< < ж* < 1/2. В итоге, если действительные корни ж* уравнения /(ж) = ж3 + Зж2 -1=0 существуют, то ж* е(-3;-1/2)0(1/2; 1). В ряду коэффициентов многочлена /(ж) одна перемена знака, и в силу теоремы Декарта уравнение /(ж) = 0 имеет один положительный корень ж^, причем х\ € (1/2, 1). В ряду коэффициентов многочлена [У(it) две перемены знака, т.е. уравнение /(ж) = 0 имеет либо два отрицательных корня, либо ни одного. При с— -1 в ряду значений /(-1) = 1, /'(-1) = -3, /"(-1) = 0, /;//(-1) = 6 две перемены знака, т.е. это уравнение имеет либо два действительных корня ж* > с= -1, либо ни одного. Но существование одного (и только одного) положительного корня уже установлено, поэтому имеются отрицательные корни ж5б(-1, 0) и ж5 6 (-3, -1). Итак, все корни уравнения ж3 + Зж2 -1 = 0 простые. Применим к нему правило Штурма. В данном случае /(ж) = ж3 + + Зж2 - 1, fi(x) = /'(ж) = Зж2 + бж. После умножения /'(ж) на 1/3 и деления „уголком" 2ж + 1 Жз+Зх2 -1 ж3+2ж2 <г* 1 ж2+2ж ж2Н ж Ь2ж + 1 ' ж2+2ж ж2+ ж/2 Зж/2 Зж/2+3/4 ж/2 + 3/4 -2ж-1 -3/4 запишем /2 (ж) = 2ж+ 1 и /з = 3/4. Составим таблицу перемены знака в последовательности /(ж), Л(ж), /г(ж), /з на
11.5. Численные методы уточнения значения корня 369 отрезке [—3, 1], включающем установленные границы действительных корней уравнения: X sgn/(z) sgn/i(s) sgn/2(z) sgn/3 N(x) -3 — + — + 3 -2 + 0 — + 2 -1 + — — + 2 0 — 0 + + 1 1 + + + + 0 Здесь N(x) — число перемен знака в последовательности при фиксированном значении х. Итак, согласно правилу Штурма, на отрезке [-3, 1] три действительных корня (iV(—3) - N(1) = 3), при этом на отрезке [-2, -1] нет корней, а на отрезках [-3, —2], [—1, 0] и [0,1] их по одному. С учетом установленных границ значений действительных корней имеем х\ G (1/2, 1), х\ 6 (-1, 0) и «5€(-3, -2). 11.5. Численные методы уточнения значения корня При численном решении нелинейного уравнения вида (11.1) после отделения его действительных корней следует этап последовательного (итерационного) уточнения значения каждого локализованного корня. В некоторых случаях для проведения этого этапа вместо отрезка локализации [ао, &о] корня х* достаточно найти лишь приближенное значение xq этого корня. Далее будем полагать, что функция f(x) в (11.1) непрерывно дифференцируема на [ао, &о] или в промежутке, содержащем точки х* и хо, по крайней мере m раз, если корень ж* имеет кратность т. Известные численные методы уточнения значения корня можно условно разделить на две группы. Методы первой группы основаны на построении последовательности вложенных 24-544
370 11. РЕШЕНИЕ НЕЛИНЕЙНЫХ УРАВНЕНИЙ отрезков [I, 1.3] [«о, Ьо]э[аи bi]D ...Э[оп, 6П]Э..., п € N, на которых удерживают локализованный корень, а методы второй — итерационной последовательности {хп} приближений к значению ж*. В первой группе отличие одного метода от другого состоит в том, каким образом выбирают на п-и итерации точ- КУ хп € (ап, 6га), которая станет одним из концов отрезка [on+i, 6n+i] С [ап, 6П]. К таким методам принадлежат способ деления отрезка пополам (его иногда называют методом би- секции) и метод хорд (метод пропорциональных частей или линейного интерполирования) [I, 9.6]. Бели точку хп рассматривать как приближенное значение корня £*, то исследование методов из обеих групп можно свести к анализу итерационной последовательности {хп}. Условием работоспособности любого из методов является его сходимость к искомому значению ж*, т.е. последовательность {хп} должна быть сходящейся, причем lim{a:n} = х*. Метод называют одношаговым, если хп вычисляют лишь по значению £п-ь и многошаговым — в противном случае (в частности, k-шаговым, если при вычислении хп используют к значений жп_*, жп_*+1, ..., жп_х). Ясно, что при наличии одного приближенного значения xq корня х* можно начать его уточнять лишь при помощи одношагового метода. Если в некоторой окрестности U (х*) корня х* при постоянных С > 0 и р > 1 для одношагового метода справедлива оценка , (11.12) то говорят, что метод имеет в U(x*) сходимость порядка р (число р называют порядком сходимости метода). При р=1 и 0<С<1 метод в U(х*) обладает линейной скоростью сходимости, а при р > 1 — сверхлинейной
11.5. Численные методы уточнения значения корня 371 скоростью сходимости (в частности, при р = 2 и 3 — квадратичной и кубической). Теорема 11.3. Бели одношаговыи метод обладает в некоторой окрестности U(z*) корня х* линейной сходимостью, то \xn-x*\^qn\xo-x*\ VsoeU(s*), 0<g<l. (11.13) < При п = 0 неравенство (11.13) очевидно, а при п= 1 оно верно в силу (11.12), если обозначить q = С и учесть, что р = 1. Применим метод математической индукции. Пусть (11.13) верно при п = т— 1: Тогда с учетом (11.12) \хт - х*\ < фт-1 - х*\ ^ qm\x0 - т.е. (11.13) справедливо и при п = га. ► Таким образом, линейная скорость сходимости метода приводит к уменьшению начальной погрешности \хо — х*\ по итерациям в геометрической прогрессии со знаменателем q < 1. Если в методе бисекции (методе деления отрезка пополам) принять хо = (ао + Ьо)/2 и хп = (ап + 6п)/2, то ^&п-ап Ьо-а0 1 Ьо 1 т.е. метод имеет скорость сходимости геометрической прогрессии со знаменателем q = 1/2 (например, для сокращения начального отрезка локализации в 106 раз нужно 19 итераций). Если для ^-шагового метода верно (11.12), то справедлива следующая теорема. 24*
372 U. РЕШЕНИЕ НЕЛИНЕЙНЫХ УРАВНЕНИЙ Теорема 11.4. Пусть в некоторой (^-окрестности U(z*, 5) корня х* fe-шаговый метод имеет порядок сходимости р. Тогда при С6Р~1 < 1 (С — постоянная из (11.12)) ^"^ (11.14) и итерационная последовательность {хп} не выходит за пределы U (ж*, 6). < При п = О неравенство (11.14) очевидно, а при п = 1 оно верно в силу (11.12). Применим метод математической индукции. Пусть (11.14) верно при п = т - 1: |xm-i - « Тогда с учетом (11.12) получим т.е. (11.14) справедливо и при п = т. Поскольку \xq — х*\ < S и С1/(Р-1><1/<5, из (11.14) имеем \хп-х*\<{1/8)Ул-1)&п = 6. ► Примем, что при численном решении (11.1) входными данными являются значения функции /(z), вычисляемые с некоторой абсолютной погрешностью, не превышающей А/. Эта погрешность может быть вызвана как ошибками округления, так и использованием для вычисления f(x) приближенных способов. На рис. 11.2 вычисляемые значения f(x) расположены в некотором ограниченном штриховыми линиями „коридоре" шириной 2А/ в направлении оси ординат. Ясно, что в малой окрестности искомого корня х* из-за малости \f(x)\ предельная относительная погрешность 6j = A//|/(x)| возрастает по мере приближения х к х*.
11.5. Численные методы уточнения значения корня 373 Рис. 11.2 Для непрерывной функции f(x) найдется такая е-окрест- ность U(x*, е) корня х* (см. рис. 11.2), что Vz€U(ar*, e) \f(x)\ < А/. В этой окрестности знак f(x) недостоверен и невозможно указать определенное значение ж, при котором вычисленное значение f(x) обращается в нуль. Такую окрестность называют интервалом неопределенности корня х*. Пусть х* — корень кратности га (для простого корня т = 1). Тогда, согласно формуле Тейлора, III/. откуда \f(m)( m\ т.е. радиус интервала неопределенности корня х* w ^^ Для простого корня А/ (11.15)
374 11. РЕШЕНИЕ НЕЛИНЕЙНЫХ УРАВНЕНИЙ где 1/|/'(ж*)| характеризует чувствительность решения задачи к погрешностям исходных данных, называемую обусловленностью задачи или метода ее решения. Бели эта чувствительность мала, то задачу или метод ее решения считают хорошо обусловленными, а если велика, то — плохо обусловленными. Значение 1/|/'(х*)| в (11.15) называют абсолютным числом обусловленности. При численном решении (11.1) оценить значение е не всегда возможно, но ясно, что £ не меньше абсолютной погрешности Ах вычисления значений х и представления корня х* в ЭВМ. Не имеет смысла задавать точность решения (11.1) меньше е. Более того, нельзя требовать от численного метода достоверных результатов при х 6 U(s*, e). Немонотонное изменение отношения от итерации к итерации и qn > 1 говорит обычно о попадании х в интервал неопределенности (при х £ U(s*, e) для сходящегося метода qn < 1). Правило, использующее условие qn > 1 для контроля попадания в интервал неопределенности, называют правилом Гарвика. 11.6. Метод простой итерации Если (11.1) эквивалентным преобразованием привести к виду х = <р(х), (11.16) то, начиная с нулевого приближения xq к корню х*, можно построить итерационную последовательность {хп} с элементами
11.6. Метод простои итерации 375 При существовании конечного предела х* этой последовательности и непрерывности функции <р(х) х* = (р(х*)} т.е. х* — корень (11.16), а значит, и корень (11.1). Итак, существо метода простой итерации состоит в построении сходящейся последовательности {хп} и выборе некоторого ее элемента в качестве приближенного значения искомого корня х*. Ясно, что этот метод является одношаговьш. О х» х0 х в Рис. 11.3 Геометрически корень х* является абсциссой точки пересечения графика функции <р(х) и биссектрисы у = х (рис. 11.3).
376 U. РЕШЕНИЕ НЕЛИНЕЙНЫХ УРАВНЕНИЙ Видно, что в зависимости от взаимного расположения графика и биссектрисы метод при любом выборе начального приближения хо ф ж* может как сходиться (см. рис. 11.3, а и £), так и расходиться (см. рис. 11.3, в и г). Отметим, что в первых двух случаях |у>'(з)| < 1, а в остальных — |у>'(з)| > !• Теорема 11.5. Бели в некоторой е-окрестности Щж*) корня х* функция (р(х) дифференцируема и |<р'(ж)| ^ Я (О < q < 1), то п - х*\ ^ qn\x0 - х*\ Vi0€U(z*), s» = y>(*n-i), n 6 N. < В соответствии с формулой (5.1) Лагранжа где ^о лежит между жо и ж*. Так как £о 6 U(a:*), то Отсюда следует, что и х\ 6 U(ar*). Согласно методу математической индукции, если хп„\ G U(o;*), то где $n_i лежит между жп_1 и ж*, т.е. итерационная последовательность {жп} не выходит из окрестности и(ж*). Из (11.17) следует линейная скорость сходимости итераций и утверждение теоремы верно в силу теоремы 11.3. ► Из (11.17) с учетом неравенства (1.4) [I] жп - ж*| ^ q\xn-x - хп\ + д|жп - ж*|, или |*п-**|<т 1 -
11.6. Метод простои итерации 377 Бели задана точность 8 вычисления значения х*, то из (11.18) и неравенства \хп~ х*\ < S следует, что в качестве х* можно взять значение хп при условии Но значение q не всегда легко оценить достоверно. Вместо (11.17) запишем a;n-x*=v?/(^n_i)(xn_i-x*)=v?/(Cn_1)(a:n_i-a:n+a:n-x*). (11.19) Отсюда хп - х* = К-! - *n)*{**:l) у (11-20) Кроме того, Хп ~ Хп-1 = где С лежит между хп-\ и хп_2- Для простого корня в его малой окрестности значение ц>'{х) изменяется мало и можно принять хп - xn_ Тогда вместо (11.20) получим жп — 2xn_i -+- хп_2 и условие окончания итераций будет иметь вид х _х ИЛИ
378 11. РЕШЕНИЕ НЕЛИНЕЙНЫХ УРАВНЕНИЙ Бели при выполнении условий теоремы 11.5 Vx 6 Щх*) <р'(х) > О, то из (11.19) следует т.е. последовательность {хп} строго монотонна (возрастающая при а?о < х* и убывающая при хо > х*) (см. рис. 11.3, а), а если Vx 6 U(x*) <p'(x) < 0, то -к х'~Хп *- xn_i т.е. знак разности х* -хп при итерациях чередуется, так что |хп - х*| < |хп - xn_i|/2 (см. рис. 11.3, б). Это означает, что все совпадающие у значений хп и zn-i десятичные знаки верны для значения х*. Тот же вывод справедлив и при 0<9;(х)<1/2 Vx€U(x*), что следует из (11.18) при q<\/2. Бели на какой-либо итерации допущена ошибка, которая не вывела итерационную последовательность за пределы отрезка [а, 6], то последующие итерации будут по-прежнему сходиться к искомому корню х*, а влияние допущенной ошибки будет постепенно затухать. Однако погрешности вычисления функции <р(х) и ошибки округления могут возникать на каждой итерации. Оценку их влияния проведем на основе (11.15), приняв в (11.1) /(х) = х - у>(х). Тогда для простого корня радиус интервала неопределенности так как абсолютные погрешности вычисления функций /(х) и (р(х) в данном случае одинаковы, т.е. Д/ = Д^. Если <р'(х*) « 1, то метод простой итерации плохо обусловлен, количество верных цифр корня х* будет на [—lg(l — <^'(x*))] ([z] означает целую часть — „антье" от z [I, 3.2]) меньше количества верных цифр в вычисляемых значениях <р{х), а касательная к графику
11.6. Метод простои итерации 379 функции <р(х) в точке х* почти совпадет с биссектрисой у = = х (см. рис. 11.3, о). В случае — 1 <(р'(х*) <0 (см. рис. 11.3, б) обусловленность метода улучшается и потери верных цифр не происходит. Один из несложных способов эквивалентного преобразования (11.1) к виду (11.16) состоит в подборе параметра Л в выражении ^ A/0. (11.21) При подборе необходимо учитывать условия теоремы 11.5, т.е. в некоторой ^-окрестности Щж*) искомого корня х* потребовать, чтобы Ц^ (11.22) Бели на этапе отделения корня х* установлен отрезок локализации [а, Ь] этого корня, то за нулевое приближение можно взять xq= (a + b)/2. Поскольку расположение х* на [а, 6] не известно, замена в (11.22) U(x*) на [о, 6] может привести при — 1 < у>'(х) < 0 к тому, что х\ = <р(хо) £ [а, 6], a итерационная последовательность выйдет за пределы отрезка локализации. Чтобы этого не произошло, достаточно монотонности итерационной последовательности {хп} на [а, 6], т.е. замены (11.22) на условие <^< I VzG[a, 6]. (11.23) л Пусть на отрезке [a, b] производная f'(x) непрерывна и положительна. В силу теоремы 9.5 [I] она принимает на [а, 6] наибольшее М и наименьшее т значения. Тогда из (11.23) следует условие •«•-т<'-т<'- Отсюда при А = М q = l- т/М. Однако при т/М <С 1 такой выбор Л не выгоден из-за возможной близости <р'(х*) к 1 и
380 J J. РЕШЕНИЕ НЕЛИНЕЙНЫХ УРАВНЕНИЙ связанной с этим медленной сходимости {жп} и плохой обусловленности метода. Ситуацию можно несколько улучшить, если в (11.22) вместо Щж*) взять отрезок [а,/?], где а=(3а —6)/2 и Р = (36 - а)/2, при условии, что он локализует тот же единственный корень ж*. Тогда х\ = <р(ж0) € [a, fi] и итерационная последовательность не выйдет за пределы [а, /?], а из (11.22) следует условие Здесь v и /z — наибольшее и наименьшее значения положительной производной f'(x) на отрезке [а, 0]. Отсюда Из условия |1 - i//\\ = |1 - /i/A| имеем Л = (i/ + /х)/2 и g = = (*/-/i)/(H-/i), нто обычно несколько лучше, чем q—X-m/M. Помимо (11.21) есть и другие способы эквивалентного преобразования (11.1) к виду (11.16). Среди них выделим способ, обеспечивающий <р'(х*) = 0. Тогда по мере приближения хп к х* растет скорость сходимости метода при его хорошей обусловленности. Пример 11.5. Извлечение квадратного корня из числа а > ^ 0 можно представить как решение уравнения f(x) = х2 — а = 0. Приведем его к виду (11.16) преобразованием х2 = а + х2 - ж2, или ( Э НЛ)(1L24)  На рис. 11.4 показаны графики левой и правой частей (11.24), причем <р'{у/а) = 0. При любом нулевом приближении жо > 0 последовательность {жп} с элементами ),
11.6. Метод простои итерации 381 Рис. 11.4 начиная с ij = (хо + а/жо)/2, монотонно сходится к пределу х* = у/а, так как (у/х - yfajx)2 ^ О Уж > 0. Она построена древнегреческим математиком, энциклопедистом античной прикладной математики Героном Александрийским (I в. н.э.) и носит его имя. Основанный на этой последовательности итерационный алгоритм используется в современных ЭВМ. Бели на 71-й итерации относительная погрешность 8п = |жп - ж*|/ж* «С 1, т.е. хп = (1 + 8п)х*, то с учетом 1/(14- 6П) « 1 -5* и и £п+1 = kn+i - х*\/х* « 8%/2. Отсюда следует, что число верных десятичных знаков в искомом значении х* примерно
382 П. РЕШЕНИЕ НЕЛИНЕЙНЫХ УРАВНЕНИЙ удваивается за очередную итерацию. Так, при а = 4 и хо = 1 получим х\ = 2,5000 (один верный знак); х2 = 2,0500 (два верных знака); х3 = 2,0001 (четыре верных знака) и т.д. 11.7. Метод Ньютона Естествен вопрос: можно ли ускорить процесс уточнения значения х* корня (11.1) по сравнению с методом простой итерацищ используя дополнительную информацию о функции /(я)? Если f(x) дважды непрерывно дифференцируема в некоторой окрестности U(s*) корня я*, то положительный ответ на этот вопрос дает применение метода Ньютона (или метода касательных). Линеаризуем f(x) в окрестности точки xn_i€U(x*), приближенно заменив дугу графика функции f(x) касательной к нему в точке Mn_i (рис. 11.5, а): f(x) * /(»n-i) + //(*n_1)(* - Xn-i). Приравнивая правую часть нулю, получаем следующий после xn_i элемент итерационной последовательности {хп} с номером п: J (Хп-1) равный абсциссе точки пересечения касательной с осью Ох. Отметим, что если в (11.21) выбирать параметр Л на каждой итерации из условия <р'(хп-\) = 1 - /;(xn_i)/A = 0, то получим Л = /'(xn_i) и затем (11.25), т.е. метод Ньютона является обобщением метода простой итерации, если в (11.21) принять <р(х) = х - f{x)/f'(x). Тогда (11.26) ^ (/(*))
11.7. Метод Ньютона 383 a У! f"(x)f(x)>0 Ь х в Рис. 11.5 и по мере приближения х к х* /(ж) —У f(x*) = 0, так что у>'(х) тоже стремится к нулю, дополнительно ускоряя сходимость {хп}. В силу формулы (7.19) Тейлора с остаточным членом в форме Лагранжа O = /(*n-l) + /'(*»-l)(*"-*n-l) + -x Л2 Ml 27)
384 11. РЕШЕНИЕ НЕЛИНЕЙНЫХ УРАВНЕНИЙ где х заключено между х* и xn_i, или /(*„-!) /"(X) 2 Вычитая отсюда почленно (11.25), получаем где С = max|/"(x)|/min|2/'(x)| при х € U(x*), что соответствует (11.12) при р = 2. Итак, в случае простого корня х* (f'(x*) ф 0) существует окрестность U(x*), в которой метод имеет квадратичную скорость сходимости. В силу теоремы 10.4, если радиус 6 этой окрестности удовлетворяет условию С 8 < 1, то для погрешности справедлива оценка (11.14), и итерационная последовательность {хп} не выходит из указанной окрестности. В окрестности с радиусом S/2 \хп-\ - х*\ < (5/2, и с учетом С < 1/6 и неравенства (1.4) [I] имеем 2\хп - хт\ < 2С|хп_! - х*!2 < j\xn-x - х*\2 < _i - х*\ < |жп_1 - жп| + \хп - х* Отсюда |жп-х*| < \хп-\ — хп\у т.е. у значения хп верны все совпадающие с zn_i десятичные знаки. Метод Ньютона обладает локальной сходимомостью в том смысле, что для его сходимости необходимо хорошее начальное приближение х0, попадающее в окрестность радиуса S. Однако ответ на вопрос, включает ли эта окрестность отрезок локализации корня х* или принадлежит ли ей выбранное значение хо, на практике далеко не всегда возможен. Подойдем к этому вопросу иначе. Итерационная последовательность {хп} сходится к пределу х* монотонно^ если о< f"Zn <i.
11.7. Метод Ньютона 385 С учетом (11.25) и (11.27) X* - ХП _ Ж» - ».., + f(Xn-l)/f(*n-l) _ 2 = 1- где х лежит между х* и sn_i. Условие монотонности будет выполнено, если f"{x)/f(xn-\) > О, т.е. достаточным условием монотонной сходимости метода Ньютона является совпадение знака f"(x) со знаком f(xo) в интервале между Хо И X*. Итак, для применения метода Ньютона к уточнению значения простого корня х* достаточно, чтобы на отрезке [о, Ь] его локализации был неизменен знак f"(x) (постоянно направление выпуклости графика функции), а начинать приближение к х* следует с того конца отрезка, на котором знаки f(x) и f"{x) совпадают (см. рис. 11.6, а). Пример. Нетрудно установить, что в примере 11.5 последовательность Герона является итерационной последовательностью метода Ньютона для уравнения f(x) = х2 - а. В самом деле, подстановка в (11.25) /(sn_i) = sn_i - а и /;(sn_i) = 2zn_i приводит к хп = (sn_i + a/sn_i)/2. # Если корень х* имеет кратность m ^ 2, то метод Ньютона обладает лишь линейной скоростью сходимости, так как с учетом (11.26) и представления в окрестности х* по формуле Тейлора получим знаменатель соответствующей геометрической прогрессии q = lim </(s) = m
386 U. РЕШЕНИЕ НЕЛИНЕЙНЫХ УРАВНЕНИЙ Для сохранения квадратичной скорости сходимости в случае корня кратности т следует в {хп} положить хп = zn_i - Для метода Ньютона как обобщения метода простой итерации при условии <р'{х*) ф 0 радиус интервала неопределенности е«Д^ = Д/ /\Г(х*)\ совпадает со значением е в (11.15),и в данном случае преобразование (11.1) к виду (11.16) не влияет на обусловленность метода. Если вычисление производной f'{xn-\) в (11.25) громоздко, то при выполнении достаточного условия сходимости метода Ньютона в {хп} можно принять 3 = Z' (11.28) так как при знакопостоянстве f"(x) на отрезке между х* и хп тах|/'(ж)| = |/'(xo)|i что гарантирует монотонную сходимость {хп} к х* (рис. 11.6,6). Построение {xn}i согласно (11.28), характеризует упрощенный метод Ньютона. Он имеет линейную скорость сходимости, так как совпадает с методом простой итерации при выборе в (11.21) Л = f'(xo) =const, и применим, например, для двустороннего приближения к значению корня х* четной или нечетной кратности га > 2 (рис. 11.6, в и г). 11.8. Комбинированные методы Каждый из рассмотренных методов численного решения (11.1) имеет определенные ограничения. Поэтому иногда хорошие результаты дает сочетание двух (реже трех) методов одновременно. Характерным примером является комбинация упрощенного метода Ньютона и метода секущих, который является также модификацией метода Ньютона: в (11.25) заменяют на разделенную разность первого порядка
11.8. Комбинированные методы 387 и получают Метод секущих двухшаговыи, и для построения последовательности {хп} необходимо сначала располагать двумя приближениями хо и х\ к значению х* искомого корня. Бели на отрезке [а, 6] локализации этого корня функция /(х) дважды непрерывно дифференцируема и f"(x) знакопостоянна, то целесообразно за хо принять тот конец [а, 6], на котором знаки f(x) и f"(x) совпадают, а за af(b) - bf(a) = /(6) -/(.) ~ абсциссу точки пересечения с осью Ох хорды, стягивающей дугу графика функции /(ж) на [а, Ь] (рис. 11.7, о), т.е. первую итерацию выполнить согласно методу хорд) а следующие — в соответствии с (11.29). Для оценки скорости сходимости метода секущих представим в окрестности х* с учетом f{x*) = 0 по формуле Тейлора и и подставим в (11.29). В итоге, пренебрегая бесконечно малыми более высокого порядка при хп-\-+х* и zn_2 —>х*, получаем хп-х'=с(хп.1-х')(хп.2-х'), с=Щ^- (11-31) Подставляя в (11.31) хп - х* = ce(xn_i - x*)p и приравнивая нулю степени при основаниях с и яп_2> находим sp=l и
388 11. РЕШЕНИЕ НЕЛИНЕЙНЫХ УРАВНЕНИЙ х3 х 6 Рис. 11.6
11.8. Комбинированные методы 389 р2 — р — 1 = 0. Сходящемуся процессу отвечают значения « 1,618 >0 и s = - = ^5* »0,618 (отношения золотого сечения!). Таким образом, в методе секущих погрешность жп - х* убывает медленнее, чем в методе Ньютона (р = 2), в котором на каждой итерации нужно вычислять и функцию и производную, а в методе секущих — только функцию. Поэтому при одинаковой трудоемкости вычислений метод секущих позволяет выполнить вдвое больше итераций и в итоге получить более высокую точность. Метод секущих обладает лишь локальной сходимостью, реализуемой обычно в достаточно малой окрестности корня. За пределами этой окрестности метод может расходиться (последовательность {хп} выходит за пределы отрезка локализации корня) (рис. 11.7, £) или „зацикливаться". Этот метод целесообразно сочетать с упрощенным методом Ньютона, чередуя их применение для п € N: 777—Г" И /Ы х2п-1 ~ j{x2n-l) (при п = 1 X2n-i = xi берут по (11.30)). Элементы итерационной последовательности с номерами различной четности монотонно стремятся к ж* с разных сторон (рис. 11.7, в). Поэтому все десятичные знаки, совпадающие у Х2П и будут верными для х*. В знаменателе формулы для стоит разность значений /(ж), которые сближаются при приближении х к ж*, что может привести к потере значащих цифр и точности расчета. Потеря будет только увеличиваться, если правую часть этой формулы привести к общему знаменателю. На практике итерации проводят до тех пор, пока
390 П. РЕШЕНИЕ НЕЛИНЕЙНЫХ УРАВНЕНИЙ значение |X2n+i — Х2п\ не станет меньше заданной погрешности. Возрастание этого значения является по правилу Гарвика признаком начала „разболтки" расчета: расчет прекращают и последнюю итерацию отбрасывают. Итерационные методы можно сочетать с интерполированием. Так, Через ТОЧКИ (x2n-l, f(x2n-l)), (*2n, f(x2n)) и (х2п+ь f{x2n+i)) после очередной пары итераций проводят параболу х = аоУ2 + а1У+а2 (т.е. применяют обратную квадратичную интерполяцию) и, положив у = 0, находят уточненное значение Х2П+1 = ^2» которое используют на следующей паре итераций. Такой комбинированный метод является трехшаго- вым. В методе с линейной скоростью сходимости погрешность убывает примерно по геометрической прогрессии (см. 11.5): const. Хп_1 X Хп_2 * Заменяя приближенное равенство точным, вместо х* получим уточненное значение _ хпхп-2 ~~ хп-\ Хп = х -2х 1-Кх о Последовательность {жп}, построенная по такому трехшаго- вому методу, обладает квадратичной скоростью сходимости. Дополнение 11.1. Метод Чебышева Пусть на отрезке локализации [а, Ь] = X простого корня х* уравнения (11.1) функция f(x) непрерывно дифференцируема по крайней мере р > 2 раз, причем /'(х) ^0 Vx € X. Тогда /'(х) знакопостоянна на X и функция у = /(х) на X строго монотонна (см. 8.1), а в силу теоремы 9.6 [I] имеет строго монотонную обратную функцию х = д(у) = /~х(у), областью определения которой будет отрезок с концами f(a)
Д. 11.1. Метод Чебышева 391 и /(6). Функция д(у) будет на этом отрезке непрерывно дифференцируемой также не менее р раз. Отметим, что разности х* — х = д(0) — д(у) соответствует разность аргументов 0-у=-у функции д(у). В 1838 г. П.Л. Чебышев в своей студенческой работе, удостоенной медали Московского университета, для вычисления действительных корней (ИЛ) предложил метод построения итерационной последовательности {хп}, обладающей любым порядком сходимости р€ N\{1}. В основе метода Чебышева лежит представление формулой (7.19) Тейлора с остаточным членом в форме Лагранжа разности х* - х в окрестности некоторой точки у: (И.ЗЗ) где п — точка между точками 0 и у. Производные функции д(у) по у можно найти дифференцированием по х сложной функции x = g(f(x)): </'(у)/'М = 1; 4"(у)(П*))2+дГ(у)П*) = 0; 9'Ъ) (Л*))3 + Ъ^(у)Пх)Г(х) + д'{у)Г{х) = 0; ... Отсюда последовательно можно выразить производные функции д(у) через производные функции f(x): и так далее. Остаточный член в (11.33) оценивает погрешность метода, в котором {хп} строят по формуле хп = y>(xn_i), где (11.34) k=l
392 11. РЕШЕНИЕ НЕЛИНЕЙНЫХ УРАВНЕНИЙ С учетом формулы (5.1) Лагранжа запишем у = /(«)-/(*•) = /'(0(* -*'), где £ заключено между значениями жиж*. Тогда Здесь < = $(»/), С=МрЬ»/р\, и L = max|/'(*)| Отсюда следует, что для элементов последовательности {хп} верно (11.12), т.е. {хп} обладает порядком р сходимости к пределу х*. Из (11.34) при р = 2 с учетом g'(f(x)) = l/f'(x) придем к методу Ньютона с квадратичной скоростью сходимости, а при р = 3 — к методу с кубической скоростью сходимости, в котором {хп} строят по формуле /(«.-О Можно построить методы с более высоким порядком сходимости, но их редко используют на практике в связи с тем, что их преимущество в скорости сходимости проявляется обычно в малой окрестности ж*, когда итерационный процесс почти сошелся и итерации можно прекратить вообще. Однако при необходимости очень точного вычисления корня при наличии ЭВМ с высокой разрядностью представления чисел и соответствующей достоверности информации о функции f(x) применение таких методов будет оправданным.
Вопросы и задачи 393 Вопросы и задачи 11 Л. Проанализировать влияние различных соотношений между значениями р и г на корни в (11.6). 11.2. Доказать, что число с будет т-кратным корнем уравнения /(х) = 0, где /(х) — многочлен степени n'Z т, тогда и только тогда, когда /W(c) = 0 при к = 0, т- 1, а /W(c) ф 0. 11.3. Доказать, что нуль кратности т > 1 многочлена является нулем кратности m — 1 его производной. 11.4. Установить границы положительных и отрицательных корней уравнения -2х4 - Зх3+5х2 4-6 = 0; найти значения этих корней численно и сравнить с точным решением. 11.5. Построить итерационную последовательность, аналогичную последовательности Герона в примере 10.5, для вычисления корня степени т € N из числа a > 0. 11.6. Составить условия „зацикливания" метода простой итерации. 11.7. Представить графически итерации по методу Ньютона в координатах х, у?(х) для случаев 0 < <р'{х) < 1 и -1 < < <р'(х) < 0. 11.8. Доказать, что сочетание метода с первым порядком сходимости с уточнением по (11.32) дает квадратичную скорость сходимости. 11.9. Найти порядок сходимости метода секущих (11.29) в случае кратного корня на отрезке со знакопостоянной производной f"(x). 11.10. При каких условиях метод Ньютона пзацикливается"? Проиллюстрировать ситуацию графически. 26-544
394 U. РЕШЕНИЕ НЕЛИНЕЙНЫХ УРАВНЕНИЙ 11.11. Выяснить, к какому из корней х\ = 0, х2)з = ±1 уравнения х3 - х = 0 сходится метод Ньютона при произвольном начальном приближении х0. При каких значениях х0 этот метод расходится или „зацикливается"? 11.12. Найти порядок сходимости упрощенного метода Ньютона в сочетании с методом секущих. 11.13. Найти порядок сходимости метода обратной квадратичной интерполяции. 11.14. Доказать, что х* является корнем (11.16), если функция <р(х) непрерывна в точке £*, а последовательность {хп} при xn = y>(xn-i) сходящаяся. 11.15. Составить условия „зацикливания" метода секущих (11.29). 11.16. Найти достаточные условия сходимости метода Че- бышева (11.35).
СПИСОК РЕКОМЕНДУЕМОЙ ЛИТЕРАТУРЫ Учебники и учебные пособия Амосов А.А., Дубинский Ю.А., Копченова Н.В. Вычислительные методы для инженеров. М.: Высш. шк., 1994. 544 с. Бахвалов Н.С., Жидков Н.П., Кобельков Г.М. Численные методы. М.: Наука, 1987. 600 с. Бугров Я.С, Никольский СМ. Высшая математика: Дифференциальное и интегральное исчисление. М.: Наука, 1984. 432 с. Виноградов И.М. Дифференциальное исчисление. М.: Наука, 1988. 176 с. Зорич В.А. Математический анализ: В 2 т. Т. 1. М.: Наука, 1981. 544 с. Т. 2. М.: Наука, 1984. 640 с. Ильин В.А., Познлк Э.Г. Основы математического анализа: В 2 т. Т. 1. М.: Наука, 1982. 616 с. Ильин В.А., Садовничий В.А., Сендов Бл.Х. Математический анализ: Начальный курс / Под ред. А.Н. Тихонова. М.: Изд-во МГУ, 1985. 662 с. Калиткин Н.Н. Численные методы. М.: Наука, 1978. 512 с. Карташев А.П., Рождественнский Б.Л. Математический анализ. М.: Наука, 1984. 448 с. Крылов В.И., Бобков В.В., Монастырный П.И. Вычислительные методы: В 2 т. Т. 1. М.: Наука, 1976. 304 с. Кудрявцев Л.Д. Курс математического анализа: В 3 т. Т. 1. М.: Высш. шк., 1988. 712 с. Т. 3. М.: Высш. шк., 1989. 352 с. Курант Р. Курс дифференциального и интегрального исчисления: Пер. с нем. и англ: В 2 т. Т. 1. М.: Наука, 1967. 704 с. Пискунов Н. С. Дифференциальное и интегральное исчисления: В 2 т. Т. 1. М.: Наука, 1985. 432 с. Самарский А.А., Гулин А.В. Численные методы. М.: Наука, 1989. 432 с. Турчак Л. И. Основы численных методов. М.: Наука, 1987. 320 с. Уваров В.Б. Математический анализ. М.: Высш. шк., 1984. 288 с. Фихтпенгольц Г.М. Курс дифференциального и интегрального исчисления: В 3 т. Т. 1. М.: Наука, 1966. 608 с. 26*
396 СПИСОК РЕКОМЕНДУЕМОЙ ЛИТЕРАТУРЫ Фролов СВ., Шостак Р.Я. Курс высшей математики: В 2 т. Т. 1. М.: Высш. шк., 1973. 480 с. Хинчин А.Я. Краткий курс математического анализа. М.: Гостехтео- ретиздат, 1953. 624 с. Шилов Г.Е. Математический анализ: Функции одного переменного: В 2 т. Т. 1. М.: Наука, 1969. 528 с. Справочные издания Александрова Н.В. Математические термины: Справочник. М.: Высш. шк., 1978. 190 с. Бронштейн И.Н., Семендяее К.А. Справочник по математике для инженеров и учащихся втузов. - М.: Наука, 1986. 544 с. Воднее В.Т., Наумович А.Ф., Наумович Н.Ф. Математический словарь высшей школы / Под ред. Ю.С. Богданова. Минск: Вышэйш. шк., 1984. 528 с. Герасимович A.M., Рысюк Н.А. Математический анализ: Справочное пособие для студентов втузов и инженеров: В 2 т. Т. 1. Минск: Вышэйш. шк., 1989. 288 с. Дороговцев А.Я. Математический анализ: Справочное пособие для преподавателей математики, инженерно-технических работников и студентов. Киев: Вища школа, 1985. 528 с. Математический энциклопедический словарь / Гл. ред. Ю.В. Прохоров. М.: Сов. энциклопедия, 1988. 848 с. Мишина А.П., Проскуряков И.В. Высшая алгебра: Справочная математическая библиотека. М.: Физматгиз, 1962. 300 с. *Савелов А.А. Плоские кривые: Систематика, свойства, применения. М.: Физматгиз, 1960. 293 с. Справочное пособие по приближенным методам решения задач высшей математики / JI.И. Бородин, А.И. Герасимович, Н.П. Кеда, И.Н. Мелешко. Минск: Вышэйш. шк., 1986. 190 с. Форсайт Док., Малькольм М., Моулер К. Машинные методы математических вычислений: Пер. с англ. М.: Мир, 1980. 280 с. Хемминг Р. В. Численные методы для научных работников и инженеров: Пер. с англ. М.: Наука, 1972. 400 с. Щуп Т.Е. Прикладные численные методы в физике и техике: Пер. с англ. М.: Высш. шк., 1990. 256 с.
397 Задачники Виноградова И. А., О летник С.Н., Садовничий В. А. Задачи и упражнения по математическому анализу / Под общ. ред. В.А. Садовничего. М.: Изд-во МГУ, 1988. 416 с. Данко П.Е., Попов А.Г., Кожевникова Т.Я. Высшая математика в упражнениях и задачах: В 2 т. Т. 1. М.: Высш. шк., 1986. 304 с. Демидович Б.П. Сборник задач и упражнений по математическому анализу. М.: Наука, 1977. 528 с. Дороговцев А.Я. Математический анализ: Сборник задач. Киев: Вища шк., 1987. 408 с. Задачи и упражнения по математическому анализу для втузов / Под ред. Б. П. Демидовича. М.: Наука, 1970. 472 с. Каплан И.А. Практические занятия по высшей математике. Харьков: Изд-во Харьк. ун-та, 1967. 946 с. Копченова Н.В., Марон И.А. Вычислительная математика в примерах и задачах. М.: Наука, 1972. 368 с. Марон И.А. Дифференциальное и интегральное исчисление в примерах и задачах: Функции одной переменной. М.: Наука, 1970. 400 с. Математический анализ в вопросах и задачах / Под ред. В.Ф. Бутпу- зова. М.: Высш. шк., 1984. 200 с. Михайленко В.М., Антонюк Р.А. Сборник прикладных задач по высшей математике. Киев: Выща шк., 1990. 168 с. Оселедец В.И., Каролинская JI.H. Сборник задач по высшей математике с техническим содержанием. М.: Изд-во Мин-ва обороны СССР, 1989. 148 с. Садовничий В.А., Григорьлн А.А., Конлгин СВ. Задачи студенческих математических олимпиад. М.: Изд-во МГУ, 1987. 311 с. Садовничий В.А., Подколзин А.С. Задачи студенческих олимпиад по математике. М.: Наука, 1978. 208 с. Сборник задач по математике для втузов: Линейная алгебра и основы математического анализа / Под ред. А.В. Ефимова, Б.П. Демидовича: В 3 т. Т. 1. М.: Наука, 1981. 484 с. Сборник задач по математическому анализу. Предел. Непрерывность. Дифференцируемость / Под ред. Л.Д. Кудрявцева. М.: Наука, 1984. 592 с. Сборник задач по методам вычислений / Под ред. П.И. Монастырного. М.: Физматлит, 1994. 320 с.
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ Алгоритм Евклида 352 Аргумент скалярный 244 Базис ортонормированный III, 244 - правый III, 282 - Френе сопровождающий 282 Бином Ньютона 1-86, 83 Бинормаль 281 Брахистохрона 304 .Вектор бинормальный 281 - главный нормальный 281 - Дарбу 283 - единичный III, 249 - нулевой III, 282 Вектор-функция двумерная 244 - дифференцируемая в точке 246 - непрерывно на множестве 248 - непрерывная в точке 246 - скалярного аргумента 244 - трехмерная 244 Векторы коллинеарные сонаправленные III, 249 - III, 99 - ортогональные III, 252 Вектор III, 99 Вронскиан VIII, 105 Гипотрохоида 299 Гипоциклоида 299 Годограф 250 Делитель многочленов общий 351 наибольший 351 Дефект сплайна 342 Дискриминант квадратного трехчлена 354 Дифференциал вектор-функции в точке 246 - длины дуги плоской кривой 258 - функции в точке 63 второй (второго порядка) 95 первый (первого порядка) 95 n-й (п-го порядка) 95 Дифференцирование 20 - логарифмическое 47 - численное 328 Длина кривой 253 Дополнение алгебраическое III, 41 Бдиница мнимая 1-149, 357 Задача идентификации 310 - обратная 348 Значение функции максимальное 199 - минимальное 199 -- наибольшее 1-201, 106 -- наименьшее 1-201, 106 -- экстремальное 199 Инвариантность формы записи дифференциала 67 Инволюта (эвольвента) 274 Интервал неопределенности корня 373 Интерполирование 310 - вперед (назад) 320
399 Интерполяция 310 - квадратичная (трехточечная) 313 - линейная (двухточечная) 312 Кардиоида 298 Касательная 18 - к кривой 251 - односторонняя 26 Катеноид 268 Квадратриса Динострата 288 Комбинация линейная 1-226, 39 Константа 1-215, 157 Контур замкнутый 251 -- простой 251 Конхоида 294 Координаты точки 1-46, 1-78, III, 311 Корень действительный 354 - кратный 349 - локализованный 349 - простой 349 - уравнения 1-345, 83, 348 - - алгебраического 350 Корни комплексно сопряженные 354 Коэффициент угловой III, 18 Коэффициенты биномиальные 1-86, 83 - многочлена 1-132, 82 - Тейлора 160 Кратность корня нечетная (четная) 349 - - уравнения 349 - нуля многочлена 1-159, 168 - узла интерполяции 324 Кривая алгебраическая 261 - ВивианиЗОб - гладкая 251 - дифференцируемая непрерывно 251 Кривая замкнутая 251 - кусочно-гладкая 251 - (непрерывная) 249 - плоская 257 - распадающаяся (приводимая) 262 - спрямляемая 253 - таутохронная 304 Кривизна дуги средняя 263 - кривой в точке полная 283 - плоской кривой в точке 263 - пространственной кривой в точке 280 Кривые циклоидальные 299 Круг производящий 299 Кручение кривой в точке 282 Лемниската Бернулли 300 Линия винтовая 255 - цепная 266 Лист декартов 241 Локализация (отделение) корня 349 Локсодромия 307 .Максимум функции абсолютный (глобальный) на отрезке 219 -- локальный 197 Матрица III, 41 - невырожденная III, 324 - симметрическая III, 366 - треугольная нижняя III, 319 - трехдиагональная III, 344 Метод бисекции 370 - касательных 382 - линейного интерполирования 1-348, 310 - многошаговый 370 - Ньютона (касательных) 382 - упрощенный 386 - одношаговый 370
400 ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ Метод прогонки III, 344 - пропорциональных частей 1-348, 370 - простой итерации 375 - Рунге ЗЗ5 - секущих 386 - хорд 1-348, 370 - Чебышева 391 - fc-шаговый 370 Минимум функции абсолютный (глобальный) на отрезке 219 - локальный 197 Минор III, ЗЦ Многочлен 1-132, 82 - интерполяционный 313 - Лагранжа315 -- Ньютона 320 - - с кратными узлами 324 - Эрмита324 кубический 327 - Тейлора 160 - характеристический IV, 366 Многочлены взаимно простые 351 - Чебышева 338 Модель математическая 310 Наклон сплайна 342 Начало координат 1-77, III, 136 Неопределенность 1-240, 131 Неравенство треугольника 1-152, 1-177, 138 Нормаль 22 - главная 281 - к кривой в точке 264 Нуль многочлена 1-159, 313 -- т-кратный 351 Образ множества (подмножества) при отображении 1-70, 5/ О Образ элемента при отображении 1-70, 34В Обусловленность 374 Овалы Кассини 300 Операция линейная III, 39 Определитель III, 41 - Вандермонда (степенной) III, 314 Ось абсцисс III, 98 - координат III, 100 - полярная III, 259 Отделение (локализация) корня 349 Отношение разностное 17 Отображение (функция) 1-70, 310 - обратное 1-75, 348 Отрезок, вложенный в отрезок 1-47, 369 - касательной (подкасательной) 22 полярной 261 - локализации корня 349 - нормали (поднормали) 22 полярной 261 Парабола 1-107, 98 Параметр 1-115, 51 - кривой 249 -- натуральный 255 Переменные выравнивающие 318 Плоскость координатная III, 49 - нормальная 282 - соприкасающаяся 282 - спрямляющая 282 Полюс III, 259 Порядок алгебраической кривой 262 - малости бесконечно малой функции 1-358, 330 - сходимости метода 370 Последовательность возрастающая (убывающая) 1-218, 378
401 Последовательность итерационная 1-100, 370 - монотонная (строго монотонная) 1-218 170, 378 - ограниченная 1-219, 170 Правило Бернулли — Лопиталя 132 - Гарвика 374 - дифференцирования сложной функции 44 - Крамера III, З14 - цепное 44 - Штурма 367 Предел бесконечный 1-257, 19 - вектор-функции 244 Представление кривой векторное 249 - - координатное 250 Приближение функции квадратичное 158 - линейное 156 - чебышевское 341 Принцип минимакса 341 Проекция вектора на ось III, 100 Произведение векторов векторное III, 246 -- скалярное III, 246 - - смешанное III, 285 Производная бесконечная 19 - - определенного знака 27 - вектор-функции в точке 246 вторая 248 - конечная 19 - односторонняя 26 -- бесконечная (конечная) 27 -- слева (справа) 26 - функции в точке 19 вторая (второго порядка) 78 первая (первого порядка) 78 - - логарифмическая 47 Производная n-го порядка 78 Прообраз множества (подмножества) при отображении 1-70, 310 - элемента при отображении 1-70, 348 Псевдосфера 271 Радиус-вектор 244 Радиус кривизны плоской кривой в точке 263 - - пространственной кривой в точке 280 - полярный 1-151, III, 259 Развертка 274 Разложение вектора в базисе III, 244 - определителя III, 41 Разность конечная 320 - правая и левая (вперед и назад) 330 - - центральная 332 - разделенная 320 Резольвента кубическая 358 Репер кривой сопутствующий 282 Секущая 18 - (кривой) 251 Система координат декартова прямоугольная III, 244 -- полярная III, 259 - линейных алгебраических уравнений (СЛАУ) III, 319 однородная III, 324 Скорость сходимости квадратичная 371 -- кубическая 371 -- линейная (сверхлинейная) 370 Соотношение рекуррентное 1-87, 90
402 ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ Сочетание 1-84, 83 Спираль логарифмическая 272 - синусоидальная 299 Сплайн (сплайн-функция) 341 - интерполяционный 342 - кубический 342 - - естественный 345 -- фундаментальный 344 - линейный 342 Степень многочлена 1-132, 82, 313 Сфера соприкасающаяся 307 Схема (алгоритм) Горнера 1-158, 321 - Эйткена 322 Сходимость метода 370 - - локальная 384 X абулирование функций 309 Теорема алгебры основная 1-159, 313 Точка асимптотическая 272 - возврата (заострения) графика 215 - излома графика 27 - касания 252 - кривой изолированная 296 - конечная (начальная) 251 -- кратная 251 - неособая (обыкновенная) 251 -- особая 251 - критическая функции 201 - максимума функции 199 локального 198 строгого 198 - минимума функции 199 локального 198 строгого 198 - перегиба графика функции 213 - функции 213 Точка распрямления кривой 284 - самопересечения (узловая) графика 240 - стационарная функции 200 - угловая графика 27 - уплощения кривой 284 - экстремума функции 199 локального 198 строгого 198 Траектория 250 Трактриса 269 Трехгранник подвижный 282 Трехчлен квадратный 1-132, 313 Триэдр основной 282 Тройка некомпланарных векторов правая III, 282 Трохоида 299 Угол полярный 1-151, III, 259 - смежности дуги 263 Узел интерполяции 312 - - кратный 324 Улитка Паскаля 298 Уравнение алгебраическое 350 - - четвертой степени 357 - биквадратное 358 - дифференциальное обыкновенное второго порядка VIII, 81 первого порядка VIII, 45 - квадратное 354 - кубическое 354 - - неполное 355 - нелинейное 348 - прямой с угловым коэффициентом III, 22 Уравнения кривой натуральные 285 -- параметрические 51
403 Условие существования точки перегиба достаточное 216 необходимое 215 Формула Кардано 355 - конечных приращений 114 - Коши конечных приращений 119 - Лагранжа 114 - Лейбница 89 - Маклорена 171 - Тейлора 160 - - в дифференциалах 164 - - с остаточным членом в форме Лагранжа 168 Пеано 164 Формулы Серре — Френе 283 Функции координатные вектор-функции 244 - тригонометрические обратные 1-129, 49 Функция векторная скалярного аргумента 244 - выпуклая (строго) вверх (вниз) в интервале 207 - действительная действительного переменного 1-71, 1-106, 244 -- (скалярная) 1-71, 244 - действительного переменного 1-71, 5 - дифференцируемая 33 - - в интервале 33 промежутке непрерывно п раз 80 точке 30 непрерывно п раз 79 - на множестве 33 - дробно-рациональная 1-133, 14З - линеаризованная в окрестности точки 68 Функция линеаризованная относительно точки 68 - линейная 1-132, 91 - неявная 55 - общего вида 1-124, 221 - показательно-степенная 1-344, 46 Центр кривизны плоской кривой в точке 264 - - пространственной кривой в точке 281 Циклоида 299 Циссоида Диоклеса 292 Тисло действительное 1-44, 351 - комплексное 1-149, 351 - обусловленности абсолютное 374 Член остаточный в общей форме 167 форме Коши 168 Лагранжа 167 Пеано 164 -- формулы Тейлора 160 Шаг винтовой линии 256 Эвольвента (инволюта) 274 Эволюта 274 Экстраполяция 310 - линейная (двухточечная) 312 Экстремум функции абсолютный (глобальный) 219 - - гладкий 201 -- локальный 198 - - острый 201 Элемент матрицы III, 41 Эпитрохоида 299 Эпициклоида 299
ОГЛАВЛЕНИЕ Предисловие 5 Основные обозначения 9 1. Производная функции 13 1.1. Вводные замечания 13 1.2. Разностное отношение 15 1.3. Понятие производной 19 1.4. Механический и геометрический смысл производной. Касательная и нормаль к плоской кривой 21 1.5. Производные основных элементарных функций ... 23 1.6. Односторонние конечные и бесконечные производные 26 1.7. Дифференцируемость функции. Непрерывность дифференцируемой функции 30 Вопросы и задачи 33 2. Правила дифференцирования функций 36 2.1. Дифференцирование и арифметические операции . . 36 2.2. Производная сложной функции 42 2.3. Производная обратной функции 48 2.4. Производная функции, заданной параметрически . . 51 2.5. Дифференцирование неявных функций 55 2.6. Основные правила и формулы дифференцирования функций 57 Вопросы и задачи 59 3. Дифференциал 63 3.1. Определение дифференциала и его геометрический смысл 63 3.2. Дифференциал сложной функции. Инвариантность формы записи дифференциала 66 3.3. Использование дифференциала в приближенных вычислениях 68 Д.3.1. Оценка погрешности приближенных вычислений . . 69 Вопросы и задачи 76
405 4. Производные и дифференциалы высших порядков 78 4.1. Производные высших порядков 78 4.2. Примеры механической и физической интерпретаций производной второго порядка 84 4.3. Формула Лейбница 88 4.4. Производные высших порядков параметрически и неявно заданных функций 91 4.5. Дифференциалы высших порядков 95 Д.4.1. Геометрическое и механическое толкование дифференциала второго порядка 97 Вопросы и задачи 102 5. Основные теоремы дифференциального исчисления 106 5.1. Теоремы о нулях производных 106 5.2. Теорема Лагранжа и формула конечных приращений 112 5.3. Теорема Коши 117 Д.5.1. О непрерывности производных 123 Вопросы и задачи 128 6. Раскрытие неопределенностей 131 6.1. Раскрытие неопределенности вида [0/0] 131 6.2. Неопределенность вида [оо/оо] 137 6.3. Особенности применения правила Бернулли — Лопи- таля 142 6.4. Другие виды неопределенностей 146 Вопросы и задачи 154 7. Формула Тейлора 156 7.1. Линейное и квадратичное приближения функции . . 156 7.2. Многочлен Тейлора и формула Тейлора 159 7.3. Различные представления остаточного члена формулы Тейлора 164 7.4. Формула Маклорена 170 7.5. Вычисление пределов при помощи формулы Тейлора 180 Д.7.1. Использование формулы Тейлора в приближенных вычислениях 183 Д.7.2. Обобщенная теорема о среднем значении 186 Вопросы и задачи 188
406 ОГЛАВЛЕНИЕ 8. Исследование функции 192 8.1. Условия возрастания и убывания функций 192 8.2. Экстремум функции. Необходимые условия существования экстремума 197 8.3. Достаточные условия существования экстремума функции 201 8.4. Условия выпуклости функции 207 8.5. Точки перегиба 213 8.6. Наибольшее и наименьшее значения функции в промежутке 218 8.7. Асимптоты графика функции 222 8.8. Общая схема исследования функции и построение ее графика 226 Д.8.1. Особенности исследования функций, заданных параметрически 231 Вопросы и задачи 241 9. Геометрические приложения дифференциального исчисления 244 9.1. Векторная функция скалярного аргумента 244 9.2. Понятие кривой 249 9.3. Плоские кривые 257 9.4. Кривизна плоской кривой 262 9.5. Эволюта и эвольвента плоской кривой 274 Д.9.1. Кривизна и кручение пространственной кривой . . . 280 Д.9.2. Примеры плоских кривых 288 Вопросы и задачи 305 10. Интерполирование и численное дифференцирование 309 10.1. Табличный способ задания функции 309 10.2. Линейная интерполяция 311 10.3. Квадратичная интерполяция 313 10.4. Интерполяционный многочлен Лагранжа 315 10.5. Интерполяционный многочлен Ньютона 319 10.6. Интерполирование с кратными узлами 323 10.7. Численное дифференцирование 328 Д. 10.1. Минимизация погрешности интерполяции 337 Д. 10.2. Интерполирование сплайнами 341 Вопросы и задачи 346
. 407 11. Решение нелинейных уравнении 348 11.1. Постановка задачи 348 11.2. Нули многочленов 350 11.3. Точные решения алгебраических уравнений 353 11.4. Отделение корней алгебраических уравнений .... 360 11.5. Численные методы уточнения значения корня .... 369 11.6. Метод простой итерации 374 11.7. Метод Ньютона 382 11.8. Комбинированные методы 386 Д.11.1. Метод Чебышева 390 Вопросы и задачи 393 Список рекомендуемой литературы 395 Предметный указатель 398
Учебное издание Математика в техническом университете Выпуск II Иванова Елена. Евгеньевна ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ ФУНКЦИЙ ОДНОГО ПЕРЕМЕННОГО Редактор Г.А. Нилоьа Художник С.С. Водчиц Корректор Е.В. Аоалооа Компьютерная верстка А.Н. Канатникоб Оригинал-макет подготовлен в издательстве МГТУ им. Н.Э. Баумана ЛР № 020523 от 25.04.97 Сдано в набор 30.08.97. Подписано в печать 29.01.98. Формат 60x88 1/16. Печать офсетная. Бумага офсетная № 1. Усл. печ. л. 25,5. Уч.-изд. л. 24,92. Тираж 1000 экз. Изд. N» 119. Заказ № 544 Издательство МГТУ им. Н.Э. Баумана, 107005, Москва, 2-я Бауманская, 5. Отпечатано в Производственно-издательском комбинате ВИНИТИ 140010, Люберцы, Октябрьский пр-т, 403 Тел. 554-21-86